Текст
                    Н. Н. МОИСЕЕВ

МАТЕМАТИЧЕСКИЕ
ЗАДАЧИ
СИСТЕМНОГО .
АНАЛИЗА
Допущено Министерством высшего
и среднего специального образования СССР
в качестве учебного пособия
для студентов вузов, обучающихся
по специальности ^Прикладная математика»
МОСКВА <НАУКА>
ГЛАВНАЯ РЕДАКЦИЯ
физико-математической ЛИТЕРАТУРЫ
1981

22.18 М 74 ‘ УДК 519.6 Математические задачи системного анализа. Моисе- ев Н. H.-М.: Наука. Главная редакция физико-математической литературы, 1981. — 488 с. . В основу книгй положен курс лекций, читаемый автором'в Московском государственном университете по новой дисциплине — системному анализу. В ней содержится изложение методов иссле- дования сложных систем с помощью ЭВМ; значительное внима- ние уделяется методам предварительной обработки систем урав- нений, анализу систем и, прежде всего, методам асимптотического анализа. Излагаются основы теории управления. Табл. 1, илл. 51, библ. 73 назв. (ум? 6 М ~ 053(02) Э? 13’81- 1502000000 Издательство «Наука». Главная редакция физико-математической литературы, 1981
ОГЛАВЛЕНИЕ Предисловие..........................................................5 Глава 1. Методы исследования операций в системном анализе .... 11 § 1. Вводные замечания..................-....................... И § 2. Некоторые типичные задачи исследования операций.............17 § 3. Неопределенность целей.......................................28 § 4. Другие типы неопределённостей ..............................40 § 5. Заключительный комментарий...................................55 Глава II. Управляемые системы.......................................60 § 1. Предварительные 'замечания ................................60. § 2. Понятие управляемых систем................................ 70 § 3. Стохастическая задача и двухэтапная оптимизация.............76 § 4. Методы расчета оптимальных программ, использующие принцип максимума . . ............................'..............84 § 5. Проблема быстродействия....................................102 § 6. Прямые методы расчета оптимальных программ.................106 § 7. Проблемы синтеза............,.....................* .... 114 Глава III. Кибернетические системы и имитация .....................130 §1.0 термине «системный анализ»-............................ 130 § 2. Проблемы моделирования............................... 136 | 3. Кибернетические системы.............• • ,..................147 § 4. Примеры иерархических систем........................... 162 § 5. Программный метод в нерефлексных системах..................185 § 6. Имитация и машинный эксперимент............................210 § 7. Модель назначения штрафов за загрязнение окружающей среды 219 Глава IV. Асимптотические методы в системном анализе (регулярный случай)............................;...............................226 § 1. Предварительное обсуждение................................ 226 § 2. Классическая теория Пуанкаре................................231 § 3. Некоторые примеры...........................................238 § 4. Метод Пуанкаре расчета автоколебательных и периодических ре- шений в квазилинейных системах..................................252 § 5. Метод усреднения...........................................260 § 6. Случай нескольких осциллирующих степеней свободы...........283 Глава V. Теория тихоновских систем (асимптотика сингулярного вы- рождения) ......................................................... 292 § 1. Некоторые вопросы общего характера . . 292 § 2 Линейная задача............................................302 § 3. Примеры тихоновских и квазитихоновских систем.......... -324 1»
4 ОГЛАВЛЕНИЕ Глава VI. Методы теории возмущений в задачах оптимального управ- ления ........................................................... 347 § 1. Простейшие схемы теории возмущений........................347 § 2. Методы усреднения в задачах оптимального управления .... 362 § 3. Сингулярные задачи оптимального управления................374 Глава VII. Экспертизы и неформальные процедуры....................394 § 1. Предварительные замечания.................................394 § 2. Некоторые примеры сложных экспертиз.......................400 § 3. Эвристические методы в дискретных задачах.................409 § 4. Проблемы матричного синтеза...............................426 § 5. Стохастические задачи.....................................438 Глава VIII. Некоторые проблемы автоматизации проектирования . . . 447 § 1. Некоторые общие вопросы автоматизации проектирования . . . 447 § 2. Некоторые варианты схемы проектирования...................458 Литература....................................................* . . 480 Предметный указатель........................................... . 483
ПРЕДИСЛОВИЕ Дисциплина, именуемая «системный анализ», родилась в силу возникшей необходимости вести исследования междисцип- линарного характера. Создание сложных технических систем, проектирование сложных народнохозяйственных комплексов и управление ими, анализ экологических ситуаций и многие дру- гие направления инженерной, научной и хозяйственной деятель- ности требовали организации исследований, которые носили бы нетрадиционный характер. Они требовали объединения усилий специалистов разных научных профилей, унификации и согла- сования информации, получаемой в результате исследований конкретного характера. Успешное развитие подобных междис- циплинарных или, как иногда говорят, системных или ком- плексных исследований во многом обязано тем возможностям обработки информации, использованию математических мето- дов, которые появились вместе с электронной вычислительной техникой и дали одновременно не только инструмент, но и язык высокой степени универсальности. Подчеркнем еще раз: систем- ный анализ возник в эпоху ЭВМ, и его развитие во многом определяется ее современными возможностями и перспективами. По этой причине термин «системный анализ» в этой книге мы будем понимать достаточно узко. Он будет означать совокуп- ность методов,' основанных на использовании ЭВМ и ориентиро- ванных на исследование сложных систем — технических, эконо- мических, экологических и т. д. В результате этих исследова- ний должно возникать не просто новое знание — результатом системных исследований является, как правило, выбор вполне определенной альтернативы: плана развития региона, пара- метров конструкции и т. д. Таким образом, системный анализ— это дисциплина, занимающаяся проблемами принятия решений в условиях, когда выбор альтернативы требует анализа слож- ной информации различной физической природы. Поэтому ис- токи системного анализа, его методических концепций лежат в тех дисциплинах, которые занимаются проблемами принятия решений, — теории исследования операций и общей теории управления,
6 ПРЕДИСЛОВИЕ Проблема принятия решений имела и имеет в жизни чело- века особое значение; ведь’ любая деятельность, — это, в конеч- ном итоге, цепочка принятия решений. Однако в подавляющем большинстве случаев процесс принятия решений, т. е. выбор одной из возможных альтернатив действия, не требует при- влечения каких-либо научных методов — ситуации довольно просты, и люди обходятся опытом, традиционными навыками, интуицией. «*» Но иногда ситуации оказывались такими сложными, что у человека, принимающего решение, уже не было уверенности в том, что его выбор правилен. В таких случаях возникала не- обходимость в научных методах принятия решений. Постепенно эти методы развивались и к настоящему времени сложились в отдельную дисциплину — теорию принятия решений. На совре- менном этапе ее развития, когда ее аппарат, ее инструментарий опирается на широкое использование ЭВМ, а система ее моде- лей превратилась в сложную и развитую систему, эта теория стала называться системным анализом. Трудно сказать, когда зародилась эта дисциплина. Ясно одно: ее истоки — где-то в глубине человеческой истории, они появились вместе с зачатками -военного -искусства, торговли, производства и т. п. Но до поры до времени все то, что относилось к выбору ра- циональных решений, наукой в собственном смысле слова еще не являлось. Это был лишь набор правил, который подытожи- вал человеческий опыт или отражал субъективное представле- ' ние того или иного лица. Принятие решений начало превра- щаться в научную .дисциплину лишь тогда, когда стали возни- кать специфические модели, когда появилась методическая общность анализа задач различной физической природы. Становление новой дисциплины следует датировать концом XIX и началом XX века, когда появились первые работы по теории регулирования, когда в экономике начали впервые го- ворить об оптимальных решениях, т. е. когда появились первые представления о функции цели (полезности), когда В. Парето был сформулирован первый принцип компромисса.' Развитие теории принятия решений определялось, б одной стороны, развитием математического аппарата, появлением приемов формализации, а с другой — новыми задачами, возни- кавшими в промышленности, военном деле, экономике. Особенно бурное развитие теории принятия решений нача- лось после пятидесятых годов, когда на основе теории эффектив- ности, теории игр, теории массового . обслуживания появилась синтетическая дисциплина — «исследование операций». Она за- ,тем постепенно переросла в* системный анализ, который явился синтезом исследования операций и теории управления.
ПРЕДИСЛОВИЕ 7 Современная теория принятия решений имеет обширный инструментарий, включающий в себя развитый математиче- ский аппарат и современные вычислительные системы. И все же, какие бы успехи ни делала теория принятия решений с по- мощыб новейших современных методов, опирающихся цл формализованное описание ситуаций, все еще остаются необхо- димыми, а подчас и играют решающую роль традиционные при- емы анализа, использующие опыт и интуицию, способности человека к ассоциациям и многое другое, что лежит вне матема- тики и пока еще не присуще искусственному интеллекту. Поэтому изложение методов системного анализа должно обяза- тельно включать описание используемых неформальных про- цедур, без которого любое представление о системном анализе будет не только неполным, но и искаженным. Необходимо не только описать исследуемые эвристические приемы и способы рассуждений. Очень важно показать также, как эти эвристиче- ские, неформальные методы вписываются в современную тео- рию принятия решений, как они видоизменяются под влиянием tforo инструментария, которым теперь оснащена эта теория. Сегодня системный анализ — это обширная синтетическая дисциплина, включающая в себя целый ряд разделов, носящих характер1 самостоятельных научных дисциплин. Попытка дать более или менее полное изложение вопросов, которые сегодня принято относить к системному анализу, заранее обречены на неудачу. В этой книге автору хотелось бы взглянуть на предмет в це- лом— показать его истоки, возможности его инструментария, продемонстрировать те способы сочетания формальной и не- формальной манеры мышления, которые удается объединить благодаря системам машинной имитации*). Но для реализации подобного замысла, для того чтобы по- казать, как в системном анализе сочетаются эксперименталь- ное, эвристическое и строгое математическое начала, необходи- мо быть достаточно лаконичным при описании отдельных разде- лов и методов. А это означает, что автор должен ориентиро- ваться на более или менее подготовленного читателя. Когда я обдумывал содержание этой книги и характер подачи материала, то в качестве своего читателя я видел прежде всего студента старшего' курса, специализирующегося в прикладной математике. У него за плечами университетский курс анализа "(и в том числе солидные знания в области *) В идейном, методологическом плайе данная книга близка к работе [7] и является конкретизацией ее идей в той области человеческой деятельности, которая связана с проблемами принятия решений. Знакомство с книгой [7] поможет'-изучающему системный анализ увидеть целый ряд особенностей тру- па математика в прикладных областях.
8 ПРЕДИСЛОВИЙ дифференциальных уравнений), он уже изучил численные ме- тоды, методы оптимизации, вариационное исчисление и многое другое. Ему важно увидеть, как все эти дисциплины, как все разнообразные и на первый взгляд мало связанные знания ока- зываются переплетенными в единый узел и начинают быть по- лезными для практики именно благодаря тому, что единая цель цементирует эти знания, а математик, который ими владеет, постепенно превращается в архитектора системы, превращается в одно из основных действующих лиц в процессе крупных ис- следований междисциплинарного характера. Конечно, мне хотелось дать в руки человеку, занимающемуся системными, исследованиями, определенную рецептуру, помочь ему найти свой собственный путь. Подчеркиваю — собственный, ибо для исследования любой системы, если она действительно сложная, недостаточно знать существующие рецепты. Анализ каждой сложной системы —это уникальная проблема, требу- ющая не только разносторонней культуры, но и изобрета- тельства и таланта. Любое руководство — это всего лишь по- мощник. Но для того, чтобы быть по-настоящему полезной людям, ведущим конкретные исследования, книга должна демонстри- ровать прецеденты. Поэтому последняя глава ее посвящена не- которым конкретным примерам применения системного ана- лиза— приложению общих положений, развиваемых в книге. В качестве области приложения идей и методов системного ана- лиза выбрана проблема автоматизации проектирования. Эта область является, вероятно, той сферой деятельности, в кото- рой применение вычислительной техники сулит особенно боль- шие перспективы и для которой системный анализ является естественным инструментом ее использования. Обсуждаемый предмет очень широк, и слова «автоматиза- ция проектирования» призваны его несколько сузить. И все же термин «автоматизация проектирования» сегодня охватывает очень много различных по своему содержанию понятий. Среди них есть и чисто технологические: структура банков данных, средства автоматизации графических работ, управляющие про- граммы и даже языки программирования. Все это мы обсу- ждать не будем. Центральным рассматриваемым здесь вопросом является проблема автоматизации начального этапа проектирования, так называемого аванпроектирования. В этой проблеме основное наше внимание будет сосредоточено на выборе альтернативных вариантов при завязке проекта (как иногда говорят, при форми- ровании облика изделия) или создании генеральной схемы народнохозяйственного комплекса. Эта проблема является, вероятно, не только наиболее трудной, но и узловой проблемой
ПРЕДИСЛОВИЕ 9 проектирования. В самом деле, ведь ошибка в исходных пози- циях не может быть затем исправлена ни совершенством графической техники, ни методиками обработки результатов эксперимента, ни станками с программным управлением, ни совершенством методов инженерных расчетов. Ее не может ком- пенсировать и качество используемой вычислительной системы. Аванпроекти’рование — это как раз та область, где хорошая на- учная основа, т. е. применение передовых методов анализа, мо- жет компенсировать относительную слабость вычислительной техники. Конечно, все то, о чем будет идти речь ниже, не- возможно реализовать без ЭВМ. Но тем не менее не ЭВМ здесь играет первую скрипку, а совершенство методов научного ана- лиза. . Если мы сегодня научимся помогать конструктору, проекти- ровщику или плановику не ошибаться в выборе основного, «базового» варианта будущей конструкции или проекта на- роднохозяйственного комплекса, то это и будет тем решающим вкладом теории принятия решений в автоматизацию проектиро- вания, который столь необходим в период резкого усложнения различных народнохозяйственных и' технических разработок, технологий и т. д. Я уверен, что использованиесовременного ар- сенала средств обработки информации и методов, созданных в науке, потребует такой же коренной перестройки процессов про- ектирования и планирования, а также совершенствования про- цедур принятия решений, как появление паровоза потребовало в свое время замены грунтовых дорог железными. Охватить все вопросы, которые связаны с процедурами при- нятия решений при создании проектов и технологий, в книге любых размеров, вероятно, невозможно. Поэтому автор ставит перед собой значительно более скромную задачу — написать книгу, которая призвана.показать читателю, что создание си- стемы программных процедур должно опираться на некоторые общие принципы. Есть еще одна трудность, с которой нерерывно сталки- вается автор. Лица, хорошо владеющие необходимым аппара- том, редко занимаются анализом конкретных систем, и, наоборот, исследователи конкретных систем редко владеют достаточно широким арсеналом математических средств. По- этому перед автором стоит почти непосильная задача написать книгу, которая была бы достаточно проста для исследователей конкретных систем и привлекательна для лиц, разрабатываю- щих математические методы, необходимые для системного анализа. Предлагаемая книга возникла из лекций, которые в разное время автор читал студентам МФТИ и МГУ. Особую роль в ее создании сыграл цикл лекций, который автор прочел слушате-
10 ПРЕДИСЛОВИЕ лям инженерного потока факультета вычислительной математики и кибернетики МГУ. Это были специалисты, которые сами занимаются «практическим» системным анализом. Работа с этой группой специалистов в течение двух се- местров убедила автора в. необходимости создания синтети- ческого курса «Введение в системный анализ». Этот курс должен был бы связать вместе целый ряд дисциплин, которые обычно читаются в университетах» методы оптимизации,. элементы ис- следования операций, теория оптимального управления, до- полнительные главы дифференциальных уравнений, — с эври- стическими процедурами, без которых анализ более или менее сложных систем невозможен. И объединяющим началом здесь должны быть идеи имита- ции и человеко-машинного1 диалога, организация которого вы- растает постепенно в самостоятельное научное направление. Книга состоит из четырех частей. В первой части, содержа- щей три главы, излагается методическая база системного ана- лиза. Показывается, как на основе, методов исследования операций и теории уйравления возникла общая концепция ки- бернетических систем и системного анализа. Во второй части, тоже состоящей из трех глав, излагаются методы теории возмущений. . Третья часть, состоящая из одной главы, посвящена демон- страции того, что называется «эвристическими процедурами». А последняя часть, тоже состоящая из одной главы, как уже говорилось, посвящена автоматизации проектирования. Такая компоновка материала позволяет отчетливо увидеть место математики и математика в системном анализе и связь формальных и неформальных элементов этой дисциплины. Структура книги, подбор и расположение материала и осо- бенно характер его подачи и интерпретации сложились в ре- зультате многолетней совместной работы, долгих и трудных дискуссий с моими ближайшими товарищами по работе в ВЦ АН СССР П. С. Краснощековым, ТО. Н. Павловским, А. А. Петровым и многими другими. Особенно важной для автора была помощь Ю. Г. Евтушенко, Ф. И. Ерешко, А. Ф.' Ко- ноненко и Е. М, Столяровой, которые прочли всю рукопись и внесли в ее текст много полезных улучшений. Всем им автор выражает свою искреннюю благодарность. Н. Н. Моисеев
Г л а в a I МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ В СИСТЕМНОМ АНАЛИЗЕ § 1. Вводные замечания Исследование операций, как об этом уже говорилось в пре- дисловии,-является одним из основных истоков системного ана- лиза. Можно сказать даже больше. Основные концепции, прин- ' ципы анализу сйстем являются развитием идей теории исследо- вания операций, и ее методы являются сегодня одной из основ- ных глав системного анализа. Вот почему первая глава’ этой книги посвящена изложению основных идей исследования опе- раций и такой их интерпретации, которая необходима для по- следующего анализа. Сам термин «исследование, операций» родился в послевоен- ные годы, когда стало очевидно, что задачи широкого класса, возникшие в самых различных сферах человеческой деятельно- сти, имею!, несмотря на их качественное различие, одно общее — они сводятся к выбору способа действия, варианта плана, пара- метров конструкции, т. е. к принятию решений, и этого общего достаточно для построения единой теории и единой системы методов. В этих условиях и возник термин «операция» —термин очень общий. Он означает любое целенаправленное действие. Го- воря об операцииГ’мы всегда ассоциируем с ней некоторого субъ- екта (оперирующую сторону), который формулирует цель опера- ции и в'Интересах которого последняя проводится. Цель опера- ции—обычно некоторый внешний (экзогенный) элемент —счи- тается заданной. Наряду с-субъектом, т. е. с оперирующей стороной, мы всегда имеем дело еще с исследователем операции*). Он действует в интересах оперирующей стороны; и его задача состоит в том, чтобы найти способ использования ресурса (т. е. возможностей оперирующей стороны), обеспечивающий достижение некоторой- цели. В такой общей постановке новая дисциплина отвечала по- требностям целого ряда направлений человеческой деятельности. Начиная с сороковых годов проблемам исследования операций *) В переводной литературе часто используется термин «аналист» — анг- лийский эквивалент русским терминам.«исследователь операции» или просто «исследователь».
12 ГЛ. 1. МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ посвящается все большее и большее количество работ. Среди этих работ мы видим и чисто математические, и методологиче- ские исследования, и работы, посвященные анализу конкретных операций в экономике, военном деле, сельском ’хозяйстве, про- ' ектировании и т. д. „ Исследование операций как научная дисциплина сформиро- валось в послевоенные годы, но ее основы были заложены значи- тельно ранее, причем работы, выполненные в СССР, внесли весьма весомый вклад в формирование принципов и системы ме- тодов исследования операций. Задачи, которые составили отправную позицию для становле- ния исследования операций как самостоятельной дисциплины, принадлежали самым различным направлениям человеческой деятельности. Так, например, Д. А. Вентцель и В. С. Пугачев развивали так называемую «теорию эффективности технических систем», в рамках которой возникли многие методы и принципы < выбора конструктивных параметров технических систем, наилуч- шим образом отвечающих достижению целей, ради которых со- здавались эти технические системы. Аналогичные идеи возник- ли и начали серьезно влиять и на развитие теории управления техническими системами — дисциплины, которая в предвоенные годы подошла к исследованию сложных систем управления типа автопилота. Проблема определения таких, конструктивных характеристик, которые должны были бы наилучшим образом обеспечить достижение некоторой цели, например обеспечивать устойчивый полет самолета по заданному курсу, постепенно ста- новится одной из центральных в теории управления. Возникли подобные задачи и в экономике. В конце тридца- тых годов была решена знаменитая задача об оптимальном рас- крое, была сформулирована транспортная задача и т. д. Еще в 1927 г. Ф. Рамсеем была сформулирована задача об оптимальном распределении известиций. Заметим, что задачи о наилучшем способе распределения ресурсов всегда занимали значительное место в экономике, хотя вычислительные сложно- сти появляющихся задач не давали до поры до времени возмож- ности их эффективно анализировать. Возникновение широкого фронта экономико-математических исследований еще ждало своего часа — создания и внедрения электронной вычислитель- ной техники. - А. Я. Хинчин и Б. В. Гнеденко в середине тридцатых годов начали изучать класс вероятностных задач, получивших впо- следствии название задач теории массового обслуживания. Боль- шой стимулирующий импульс это направление получило во вре- мя войны вследствие необходимости планирования боевых дей- ствий и бережного расходования имеющегося и, как правило, весьма ограниченного ресурса.
$ I. ВВОДНЫЕ ЗАМЕЧАНИЯ 13 Во время войны исследование операций получило широкое- развитие в Англии и США, благодаря чему в послевоенные годы и возник термин.«исследование операций». В послевоенные годы были созданы первые ЭВМ и неизмери- мо обогатился вычислительный арсенал математики. Это не мог- ло не сказаться на развитии всех теорий, связанных с конкрет- ными задачами практики, и, следовательно, на требованиях к проведению разнообразных и сложных расчетов. Появление ЭВМ было одним из важных факторов, стимули- рующих объединение разнообразных задач, связанных с проб- лемами принятия решений, в единую научную дисциплину, кото- рая получала название «исследование операций». Значительное место в становлении новой дисциплины в СССР принадлежит Ю. Б. Гермейеру. С его именем связано и более яс- ное понимание смысла дисциплины, ее места в общем русле раз- вития послевоенной науки (см. [4]), и широкое развитие специ- альных математических методов. Он ввел также и новый тер- мин «теория исследования операций», чтобы подчеркнуть существование концептуального начала, т. е. некоторой общей методологии в анализе задач принятия решений — задач су- щественно разной физической природы. Такое уточнение сыграло свою роль и было весьма необхо- димым, ибо в англоязычной литературе господствовал чисто прагматический подход, наложивший определенный отпечаток эклектики, — исследование операций представлялось как собра- ние различных, более или менее похожих задач, для которых могли быть использованы однотипные методы решения. Только после работ Ю. Б. Гермейера стало уместным говорить об ис- следовании операций как о единой дисциплине, изучающей опре- деленный класс моделей человеческой деятельности. В данной книге мы будем использовать термины «исследование операций» й «теория исследования операций», не различая их смысла. Вся- кий раз, используя термин «исследование операций», мы будем иметь в виду тот его более глубокий смысл, о котором мы толь- ко что говорили. Новую научную дисциплину нельзя было считать дисципли- ной чисто математической, хотя она широко использовала мате- матические методы и породила целый ряд направлений при- кладной математики. Главным же содержанием дисциплины были сложные проблемы принятия решений, при изучении кото- рых неформальные методы, представления здравого смысла и спо- собы описания — математическая формализация задач,— играли не меньшую роль, чем формальный, математический аппарат. Примечание. Даже в постановке задач, которая основывается пр^ жде всего на содержательном анализе проблемы, огромную роль играет ма- тематическая культура исследователя. Надо уметь не только ясно понять
14 ПЛ. I. МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ смысл задачи, но и сформулировать ее так, чтобы она была доступна для анализа математическими средствами. Итак, исследование операций оказалось дисциплиной синте- тической, в которой можно выделить три главных направления, причем только одно из них связано с традиционным примене- нием математики. Эти три направления соответствуют следую- щим трем этапам, которые всегда присутствуют в исследовании. а) Построение модели, т. е., формализация изучаемого процесса или я в л.е н-и я. Оно сводится к описанию процесса на языке математики. На этом этапе речь идет о построении модели процесса, а не операции. С помощью одной и той же модели могут изучаться разные операции. б) Описание операции — постановка задачи. Оперирующая сторона (субъект, ассоциированный с системой) формулирует цель операции. Цель операции всегда предпола- гается экзогенным, (внешним) фактором по отношению к опера- ции и должна быть еще формализована. Задача исследователя Операции—провести необходимый анализ неопределенностей, ограничений и сформулировать в конечном счете (совместно с субъектом, в интересах которого проводится операция) неко- торую оптимизационную задачу f(x)-> max, хе G. (1.1) Здесь х — элемент некоторого нормированного пространства Е, определяемого природой модели, G cz Е-— множество, которое может иметь сколь угодно сложную природу, определяемую структурой модели и особенностями исследуемой операции. Та- ким образом, задача исследования операции на этом этапе нами трактуется как некоторая оптимизационная проблема. В действительности задача исследователя операции несколько шире. Анализируя требования к операции, т. е. те цели, которых' предполагает достигнуть оперирующая сторона, и те неопреде- ленности, которые при этом неизбежно присутствуют, исследова- тель должен сформулировать цель операции на языке матема- тики. Язык оптимизации здесь оказывается естественным и удобным, но вовсе не единственно возможным. В главе II мы встретим такие операции, в которых выбор решения будет свя- зан с другими математическими задачами. Там будет, например, идти речь о выборе параметров автопилота, дающего возмож- ность самолету попасть в заданную точку. Мьцувидим, что при этом выбор параметров автопилота осуществляется так, чтобы гарантировать устойчивость движения самолета. Таким обра- зом, представление-цели в форме (1.1)—не единственный спо- соб формализации. Но оно удобно, поскольку методы оптимиза- ции достаточно развиты, а язык оптимизации обладает, как мы увидим, достаточно большой степенью общности. "
$ I. ВВОДНЫЕ ЗАМЕЧАНИЯ 15 в) Решение возникающей оптимизационной задачи. Строго говоря, только этот третий, заключительный этап исследования операции можно отнести собственно к мате- матике, хотя без участия математика (с его знанием языка ма- тематики и возможностей ее аппарата) успешное выполнение двух первых этапов невозмбжно. Для его‘завершения могут по- •требоваться тонкие математические методы. Довольно часто сложность (связанная, например, с размерностью вектора х или структурой множества G) не позволяет ограничиться чисто ма- тематическим исследованием задачи (1.1), и доведение до конца исследования данной операции может потребовать применения разнообразных эвристических приемов. Заметим попутно, что трудности неформального анализа подчас являются определяю- щими. В конечном счете именно формирование гипотез и харак- тер описания процесса могут стать решающими факторами эф- фективности анализа. По этому поводу уместно сделать одно замечание. Один из. крупнейших русских математиков, А. М. Ляпунов, считал не- обходимым любую, однажды поставленную физическую задачу изучать в дальнейшем как задачу «чистой математики», т. е. не использовать никаких соображений неформального харак- тера. В задачах исследования операций провести эту точку зре- ния очень трудно. Успешное завершение исследования .требует использования на всех этапах неформальных рассуждений. По- этому проверка качества решения, его соответствия исходной цели исследования превращается в важнейшую проблему теории. В исследовании операций возникли определенная термино- логиял Принципы анализа. Поскольку под операцией мы будем понимать любое целенаправленное действие, то в качестве «мо- дели операции» мы должны себе представлять некоторую сово- купность, состоящую из субъекта (оперирующей стороны), фор- мулирующего цель операции, запаса активных средств (ресур- сов) для проведения операции, набора стратегий, т. е. способов использования этих ресурсов, и критерия — способа сравнения различных стратегий, преследующих достижение цели операции. Сам критерий, точнее — стремление к максимизации или мини- мизации сто значений часто и объявляется целью операции. Такое определение иногда вызывает известные трудности. Дело в том, что выбор стратегий обычно стеснен целым рядом ограничений и часто бывает удобно одно из них (например, обеспечение потребителя товаром) объявить целью операции. Цель операции может быть достигнута не единственным обра- зом, и критерий служит для отбора наиболее экономной стра- тегии (например, способа перевозки товаров) из числа допустимых, т. е. удовлетворяющих всем ограничениям и (в том числе) обеспечивающих достижение цели управления,
16 гл. I. МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ Точно так же бывает удобно выделять в специальное поня- тие математическую «модель операции» — совокупность всех ограничений и условий. В этом случае критерий не включается в модель. Это значит, что одну и ту же стратегию, одну и ту же ~= реализацию операции можно оценивать разными способами. Та- кая терминология идет из теории управления. Она удобна, но не универсальна. Иногда мы- будем отождествлять понятия крите- рия и цели управления — в вопросах терминологии мы не будем придерживаться особой строгости. Удобство использования того или другого термина будет определять наш выбор. Говоря об ограничениях, имеет смысл разделять их на две группы — физические и критериальные. Вторые определяются требованиями к конструкции или проекту. Например, проекти- руя пассажирский лайнер, мы хотим, кроме достижения макси- мальной экономичности, чтобы его крейсерская скорость была, например, не меньше 800 км/ч; распределяя землю под посевы зерновых, нам нужно добиться урожая максимальной стоимости, но при заданной структуре конечного продукта. Эти ограничения не очень жесткие. Они находятся в распоряжении субъекта и в принципе-могут быть нарушены или изменены. Отступление от них не противоречит физике процесса, физическим законам. Иное дело — ограничения физические, которые являются следствиями законов сохранения. Например, обозначив через qi норму поли- ва-количество воды,, которое мы должны направить на ороше- ние единицы земельной площади х,. Тогда (1.2) где Q — общее количество воды, которое накоплено в водохра- нилище. Кроме того, суммарная площадь земли, которую мы можем использовать под посевы, также должна быть фиксирована, т. е. величины xi должны удовлетворять еще одному ограничению: T.Xi^X, (1.3) где X — суммарная земельная площадь. Условия (1.2) и (1.3) ни при каких обстоятельствах не могут быть нарушены, ибо (1.2) и {1.3) выражают законы сохранения. Указанное обстоятельство может вызывать трудности принципи- ального характера. Заметим, что условия (1.2) и (1.3) существенно отличаются друг от друга. Мы выбираем вполне определенные величины х,-, и в условие (1.3) входит также вполне определенная детермини- рованная величина X. Иначе обстоит дело с условием (1.2), в котором величины qi и Q — случайные. В одном .из следующих
§ 2. НЕКОТОРЫЕ ТИПИЧНЫЕ ЗАДАЧИ 17 параграфов этой главы мы еще вернемся к обсуждению подоб- ной ситуации. Важным понятием является исследователь операций. Он является частью оперирующей стороны, но не отождествляется (как правило) с ней. Он обладает иной информированностью об обстановке операции^ Все исследование операции должно про- водиться с позиции исследователя операции, исходя из его ин- формированности, но с учетом возможного обновления информа- ции, которую предоставляет ему оперирующая сторона. По мере обсуждения отдельных вопросов, возникающих при исследовании операций, мы будем конкретизировать общие принципы и терминологию. § 2. Некоторые типичные задачи исследования операций Приведем несколько примеров, демонстрирующих те классы задач, с которыми имеет дело исследователь операций. X) а) Транспортная задача. Пусть в пунктах ai, а2, ... , ап находятся склады, в которых хранятся товары в коли- чествах Х2......Хп соответственно. В пунктах Ь\, Ь2, ..., Ьт находятся потребителя, которым необходимо поставить эти то- х’вары в- количествах, не меньших чем Уь Уг...Ут соответ- ственно. Обозначим через йц стоимость перевозки единицы груза между пунктами а(- и bj. Исследуем операцию перевозки потребителям товаров в ко- личествах, достаточных для, того, чтобы удовлетворить потреб- ности потребителей. Обозначим через хц количество товара, пе- ревозимого из пункта а, в пункт Ь/. Для того чтобы удовлетво- рить запросы потребителей, необходимо, чтобы величины хц удовлетворяли неравенству 2Х^У/. (2.1) Но со склада номера i мы не можем вывезти продукт в количе- стве большем, чем там имеется. Это означает, что искомые ве- личины должны удовлетворять еще одной системе неравенств: ^хц^Х{. (2.2) Удовлетворить условиям (2.1) и (2.2), т. е. составить план перевозок, обеспечивающий запросы потребителей, можно бес- численным числом способов. Для того чтобы исследователь операций мог выбрать определенное решение, т. е. назначить определенные величины ху, должно быть сформулировано неко- торое* правило отбора, определяемое с помощью критерия, ко- торый отражает наше субъективное представление о 11ели. При этом мы получим лишь одну из возможных, оценок выбранного КРАСНОЯРСКАЯ . КРАЕВАЯ i БИБЛИОТЕКА «
18 ГЛ. I. МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИИ Проблема критерия, как уже говорилось, решается незави- симо от исследования операции — критерий должен быть задан оперирующей стороной. В данной задаче одним из возможных критериев будет стоимость перевозки. Она определяется оче- видным образом: = , (2.3) Теперь задачу о перевозках мы можем сформулировать сле- дующим образом: определить величины удовлетворяю- щие ограничениям (2.1), (2.2) и доставляющие функции (2.3) минимальное значение. Ограничение (2.2) — это условие баланса, или закон сохране- ния,' т. е. условие физического типа; условие (2.1) естественно назвать целью операции, ибо смысл операции в том и состоит, чтобы обеспечить запросы потребителей. Эти два условия со- ставляют, пр существу, модель операции. Реализация операции будет зависеть от критерия, т. е. от того, как мы будем выби- рать способ, при помощи которого будет обеспечено достижение цели операции. Такое разделение имеет определенный смысл, поскольку в одной и той же модели операции (т. е. модели целенаправлен- ных действий, имеющих одну и ту же цель) могут возникать разные критерии — разные способы оценки пути достижения цели. Таким образом, критерий может фигурировать в различ- ных ролях. Он может выступать и как способ формализации цели, и как принцип отбора (выбора) способа действий из числа допустимых, т. е. удовлетворяющих ограничениям. б) Задача распределения удобрений. Будем рассматривать задачу распределения ограниченного количества удобрений между • посева- ми п различных сельскохозяйственных культур. Предположим, что урожай- ность fi(xi) культуры номера i яв- ляется нелинейной вогнутой функцией от Xi — количества внесенных на еди- ницу площади удобрений (рис. 2.1). Тогда урожай культуры номера i будет равен Sifi(xi), где si — площадь, занятая культурой номера I. Будем считать, что сум- марная площадь фиксирована, т. е. п (2.4)
§ 2. НЕКОТОРЫЕ ТИПИЧНЫЕ ЗАДАЧИ 19 где S— заданное число. Будем также считать, что продукция должна быть получена во вполне определенном ассортименте, т. е. должны иметь место равенства sih(xi) Sift (*1) i = 2, 3, .... ft, где — заданные числа. Введем ограничение п Е StXi^X, (2.5) (2.6) где X — суммарное количество удобрений. Изменяя величины х,, si так, чтобы не нарушить условий (2.4)—(2.6), мы будем получать различные варианты плана использования площади S. Эти планы мы должны научиться сравнивать между собой. Введем критерий следующим обра- зом: обозначим через pi цену единицы продукта номера /, через q— цену единицы удобрений. Тогда суммарный доход от про- дажи продукта, за вычетом расходов на покупку удобрений, будет равен п J (X, s) = Е (piSif I (Х{) — qsiXi)f ~ (2.7) я /el X = (Xi....xj, s = (s........sn). Мы можем разыскивать такой способ распределения земель, который максимизирует функционал (2.7) при ограничениях (2.4)—(2.6). Заметим, что величину X мы также можем считать искомой. в) Задача об ирригации и складировании. Рас- смотрим теперь более сложную задачу, в условиях которой присутствуют случайные величины. Она является упрощенным вариантом задачи о распределений инвестиций на создание зон поливного земледелия и строительство складов. Задача является многошаговой задачей принятия решений (в том смысле, что мы изучаем некоторый динамический процесс, развертывающийся во времени), поскольку планирование инвестиций производится на ряд лет вперед. Случайными факторами являются погодные условия, которые определяют случайный характер урожайности. Обозначим эти случайные величины через р и q: р — урожай- ность на богарных (без искусственного орошения) землях, q — урожайность на поливных землях (q > р при одних и тех же погодных условиях). Функции распределения Рр и Fq величин р и q будем считать известными. Через S(n) и s(n) обозначим соответственно площади богарных и поливных земель в год номера п. Суммарную площадь сельскохозяйственных угодий
20 ГЛ. I. МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ S*(n) будем считать известной: S(ra)4-s(n) = S*(ra). (2.8) Потребность в зерне Ф(га) в каждый год планирования мы бу- дем также считать заданной величиной. Суммарный урожай в год номера п будет, очевидно, случай- ной величиной Ф+(га) = pS(n)+ qs(n), функцию распределения которой Гф+ (п) мы можем вычислить. Разность Ф+(га)-Ф(га) может быть как положительной, так и отрицательной. Если эта разность положительна, то избыток урожая мы можем отправить на склад (элеватор); если отрица- тельна — мы можем взять недостающий продукт со склада. Эта величина должна удовлетворять некоторым очевидным соотно- шениям. Так, на склад мы не можем отправить количество зер- на, большее тех свободных емкостей, которыми в данный мо- мент располагают склады. В свою очередь, величина этих сво- бодных (или резервных) емкостей зависит от предыстории, т. е. от того, какое количество зерна в предыдущие годы мы брали со склада или отправляли на склад. Кроме того, объем складов зависит от того, какие инвестиции мы направляли на строитель- ство складов. Точно так же количество зерна, которое мы можем взять со склада, зависит от того, сколько в элеваторах в данный год хранится зерна, т. е. зависит от предыстории процесса. Обо- значим через Q(n) количество зерна, которое мы можем по- местить на склад либо взять со склада (в первое случае-прирост количества зерна Q(ra)>0, во втором Q(n)<0). Пусть R (п — 1)— количество зерна, которое находилось на складе в году номер га —1, и пусть G(n) —суммарная емкость складов в году п. Тогда Q(ra) определяется так: л. ( min (Ф+ (га) — Ф (га), G (га) — R (п— 1)), если Ф+ (га)>Ф (га), I max (Ф+ (га) — Ф (га), — /?(«—!)), если Ф+ (га)<Ф (га). (2-9) Все величины Q, R, G, Ф (вычисляемые* в одних и тех же еди- ницах— кубометрах или тоннах) должны, очевидно, удовлетво- рять динамическим соотношениям О (га) - О (п - 1) + х(с7-> (2.Ю) R(n) — R(n~~ 1) + Q (га), (2.11) где через х(п — 1) обозначены капитальные затраты на строи- тельство элеваторов, а через Сх — стоимость единицы емкости элеватора,
§ 2, НЕКОТОРЫЕ ТИПИЧНЫЕ ЗАДАЧИ 21 Величина Ф+(п) зависит от количества поливных земель s(n), которое, в свою очередь, определяется динамическим со- отношением ?(ra) = s(n-l)+ , (2.12) где Су — затраты на единицу орошаемой площади, а у(п — 1) — капитальные затраты (инвестиции) на орошение в году п — 1. Уравнения (2.8), (2.10) — (2.12), где величина Q(n) опреде- ляется соотношениями (2.9), — это и есть математическая мо- дель изучаемого многошагового процесса. Величины х(п) и у(п) связаны общим ограничением: x(n) + y(n) = z(n), ' (2.13) где z(n) —заданная величина — суммарные средства, выделен- ные на инвестиции в строительство элеваторов и создание ир- ригационных систем. Задавая тем или иным образом величины х(п) и у(п) и начальное состояние системы, т. е. величины G(0), /?(0) и s(0), мы можем вычислить распределение дефекта —ве- личины Д(п): ' a(n) = S(n)p + s(n)?-<D(n)-Q(«) (2.14) для любого года п. Перейдем теперь к обсуждению возможных критериев эф- фективности (целевых функций). Очевидно, что чем меньше математическое ожидание абсолютной величины дефекта, тем система будет лучше. Поэтому в качестве критерия, оцениваю- щего функционирование системы за один год номера п, можно принять величину этого математического ожидания: ./(^р) = М(|Д(п)|)=ТЖ|*). Но система функционирует не один год, а много лет. Тогда, обозначив через N горизонт .(срок) планирования, мы можем в качестве1 критерия, оценивающего систему" в целом, принять /1= шах | Д(п)|. (2.15) l<n<N Вместо критерия (2.15) можно принять J*i= шах|Д(и)|. (2.15х) *) Здесь и ниже черта наверху будет означать математическое ожидание соответствующей случайной величины.
22 ГЛ. I. МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ Критерий (2.15') может оказаться более удобным для опери* рующей стороны. Заметим, что он всегда мажорирует критерий (2.15), т. е.. но вычисление Ji обычно бывает значительно проще вычисле- ния . Наряду с критерием (2.15) оценку проекта дает и критерий N ______ л=£|Д(п)|. (2.16) П-1 Положительные и отрицательные дефекты не равнозначны. Если. Д(га)>0, то это означает, что часть урожая просто пропадаег. Если Д(п)<0, то зерна для покрытия потребностей не хватает и его приходится экспортировать. Таким образом, в качестве еще одного критерия мы можем - принять величину . /з = 2ГДШ (2.17) п где усреднение проводится по отрицательным дефектам: Д(п)< <0. Итак, мы видим, что в одной и той же операции могут фигурировать самые разные критерии эффективности. А по- скольку стратегии (в данном случае распределение инвестиций) мы .будем определять из условия (2.18) i— 1, 2, 3, то каждому Л будет отвечать своя стратегия — ре- шение одной из задач (2.18); будем называть ее оптимальной стратегией. г) Задача составления расписаний. Теория распи- саний— это целое большое направление в дискретной матема- тике и теории исследования операций. Проблема составления расписания работ —выбор их очередности, выделение опреде- ленного объема ресурса, который должен расходоваться на их выполнение — занимает важное место и в планировании, и при составлении проектов сложных технических или экономических комплексов. Поясним содержание этой проблемы на одной из основных задач этого класса: найти такое распределение ресурса и такое назначение очередности работ, при которых совокупность работ, составляющих проект, будет выполнена за минимальное время. Итак, предположим, что эксперт — проектировщик, конструктор, плановик — определяет перечень работ Pi, Рг, ...» Ря, необхо- димых для завершения проекта, и требуемый ресурс для его вы- полнения. Ресурс может быть самой разнообразной природы.
§ 2. НЕКОТОРЫЕ ТИПИЧНЫЕ ЗАДАЧИ 23 Это могут быть люди (количество рабочей силы той или иной квалификации), оборудование, сырье, деньги и т. д. Таким об- разом, говоря о том, что объем требуемого ресурса задан, мы имеем в виду, некоторый векторный норматив: каждой работе поставлен в соответствие некоторый вектор, дающий перечень объемов -ресурса различной природы, которые необходимы для завершения работ. Однако выполнение работ бывает обычно стеснено многими ограничениями, которые, как правило, удается разбить на две группы. Ограничения (а): .они описывают взаимную зависимость работ.. Это ограничения логического характера. Наиболее ти- пичный пример — ограничения типа графа: выполнению работы номера i предшествует некоторая совокупность работ, без вы- полнения которых работа- номера i начаться не может. Типич- ным примером таких ограничений являются ограничения, с ко- торыми сталкивается производитель работ при строительстве здания: крыша не может быть построена до того, как построены стены, строительство стен может быть начато только после того, как построен фундамент, и т. д. Рис. 2.2. Ограничения типа (а) могут быть сформулированы на языке теории графов. Для этого условимся работы обозначать верши- нами ориентированного графа, тогда его ребра будут показы- вать, какие работы и в какой последовательности должны вы- полняться. Ограничения (а) могут иметь и более сложную, ло- гическую природу*). На рис. 2.2 представлен один из возмож- ных примеров подобного описания ограничений типа (а). *) Например, работы могут быть взаимозаменяемыми, некоторые из ра- о°т на определенном этапе должны вестись параллельно и т. ц,
24 ГЛ. I. МЕТОДЫ ИССЛЕДОВАНИЯ-ОПЕРАЦИЙ. Ограничения (§): этот тип условий связан с объемом ре- сурса, который может быть выделен на реализацию проекта. Обозначим через v(t) вектор ресурса, который может быть вы- делен на выполнение проекта в год номера t*). Через u‘(t) будем обозначать долю работы номера I, которую планируется выполнить в год номера t (0 uz(/) 1), а через — вектор ресурса, который должен быть выделен для выполнения работы «'(/). В этих условиях ограничения (0) могут быть представлены в следующей форме: («‘(0)^(0 V/, (2.19) или ей аналогичной. Условия (Р) — это типичные условия, с которыми исследо- ватель операции сталкивается при решении практически любой распределительной задачи. Итак, если векторы v(t) заданы, то план реализации проекта сводится к следующей задаче: для каждого интервала времени t должны быть указаны перечень работ и доля u‘(t) этих работ, которую необходимо выполнить- так, чтобы суммарное время осуществления проекта было минимальным. Доля u‘(t) опреде- ляется в десятичной или какой-нибудь другой шкале, a t—- дискретно. Поэтому задача построения расписания — это задача дискретного программирования. Количество допустимых альтер- натив (решений) конечно. С точки зрения «чистой» математики рассматриваемая задача не содержит каких-либб принципиаль- ных трудностей — она может быть решена простым перебором. Однако, если число работ достаточно велико, то реализация пе- ребора даже на мощной ЭВМ требует астрономического времени и практически невозможна. Можно показать, что использование простого перебора возможных вариантов для составления опти- мального по времени расписания, содержащего 1000 работ, по- требует (если использовать ЭВМ типа БЭСМ-6) времени, равного существованию нашей Галактики. А расписание; содержащее 1000 работ, является весьма ординарным, и основная трудность состоит в том, чтобы указать порядок выполнения работ, не на- рушающий ограничений типа (а). Поэтому в задачах теории расписаний, подобных той, которая описана, невозможно обой- тись без неформальных, эвристических методов. д) Обсуждение. Итак, мы рассмотрели несколько типич- ных задач, с которыми сталкивается исследователь операции. С точки зрения математика — это обычные задачи математиче- ского программирования. Первая из рассмотренных задач, так *) В этой задаче рассматривается случай дискретного времени: t =1, 2, 3, ... означает номер временного интервала, например номер года, отсчи- тываемый от начала работы. 1
§2. НЕКОТОРЫЕ ТИПИЧНЫЕ ЗАДАЧИ 25 называемая транспортная задача, является одной из простейших задач линейного программирования. Задача о распределении удобрений — это уже задача нелинейного программирования. Третья из рассмотренных задач (см. п. в)), несмотря на ее ве- роятностный характер, также сводится в конечном счете к за- даче нелинейного программирования. Наконец, задача п. г) является задачей целочисленного программирования. Каждая из этих задач относится к той или иной главе мате- матики, и для ее решения существуют разнообразные, хорошо изученные алгоритмы.’ Мы не будем излагать эти общеизвест- ные методы, которые составляют предмет курсов оптимизации факультетов прикладной математики университетов и вузов, и отошлем читателя к соответствующим учебным пособиям (см. [10]). Читателю, прослушавшему курс лекций по оптимизации, мо- жет показаться, что исследование операций, по существу, то- ждественно тем разделам математики, которые связаны с оты- сканием решений экстремальных задач при наличии специаль- ного вида ограничений. Однако такое представление было бы ошибочным. Скорее, верно обратное утверждение. Теория мате- матического программирования, т. е. теория решения экстре- мальных задач при наличии ограничений, возникла и развилась, прежде всего, благодаря потребностям исследования операций. Поэтому многие зарубежные авторы, занимающиеся приложе- ниями математики к решению инженерных или экономических проблем, рассматривают задачи линейного, нелинейного и цело- численного программирования не как разделы математики, ис- пользуемые в исследовании операций, а как составную часть этой дисциплины. Это —другой крайний взгляд на предмет. В действительности, как я думаю, все разделы, относящиеся к-математическому программированию, на самом деле являются разделами математики и их развитие невозможно без изучения задач математического программирования как предмета мате- матических исследований. Математическое программирование и другие методы реше- ния экстремальных 'задач составляют основу аппарата иссле- дования операций. Но сама теория исследования операций никак не может быть сведена к решению экстремальных задач. Более того, исследование операций не является чисто математической дисциплиной и главные сложности анализа конкретных опера- ций, как правило, состоят не в преодолении математических трудностей. Обсуждение задач, приведенных в данном параграфе, пока- зывает, что первый шаг — это формализация .операции, ее опи- сание с помощью языка математики. От той), как будет форма- лизована задача, зависит вся судьба исследования. Простое
26 ГЛ. I. МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ описание делает анализ довольно простым, но если оно' не будет в достаточной степени адекватно.реальности, то может привести к результатам сомнительной достоверности. Наоборот, пере- усложненная задача, учитывающая разнообразные детали про- цесса и с большими подробностями описывающая реальность, может привести к такой затрате машинного времени, которая окажется не оправданной высокой точностью результата. Одним словом, уже при составлении модели исследователь операции, который, как правило, является математиком, должен руковод- ствоваться как своим опытом так и способностями, умением про- никать в содержание задачи и ясностью понимания цели всего исследования. Мы видим, что этот первый этап очень далек от традиционной математики, и, тем не менее, преодолеть его трудности может лишь человек, представляющий себе возмож- ности аппарата, т. е. он должен быть не де-юре, а де-факто математиком. Примечание. В последнее время делаются попытки разделить обязан- ности программиста-исследователя и «постановщика» задач. Такое разделе- ние должно делаться с большой осторожностью. Конечно, на определенной стадии разделение обязанностей оказывается необходимым и часть програм- мистской работы может быть поручена специалистам, в области машинного программирования. В особенности если это касается* вопросов организации системы программ, управляющих программ, работ с массивами и т. д. Но что абсолютно необходимо для успехд исследования — это объединение в лице исследователя операции математика- и специалиста, в тонкостях понимающего специфику предмета. Еще более сложные проблемы возникают тогда, когда мы пытаемся формировать критерий — способ оценки качества на- ших действий, начинаем сравнивать различные варианты стра- тегий. Типичной является ситуация, когда операция оценивается несколькими показателями. В этом случае мы говорим о не- определенности целей. Преодолеть эту неопределенность фор- мальными методами невозможно. Здесь необходимы дополни- тельные исследования и гипотезы. В следующем параграфе мы познакомимся с характером этих дополнительных предположе- ний и с некоторыми способами представления информации, которые помогают в ряде случаев преодолеть эту неопределен- ность. Но есть и иные сложности при формировании критерия. Они связаны со стохастическим характером операций. Предположим, что критерий имеет вид ЦхЛ) = Ц*Л), (2.20) где £ — случайный параметр с Известным законом распределе- ния, х — вектор конструктивных характеристик- проектируемой системы. Конструктор стремится выбрать параметры .проекти-
§ 2. НЕКОТОРЫЕ ТИПИЧНЫЕ ЗАДАЧИ 27 руемого объекта так, чтобы значение критерия было по возмож- ности больше. Но операция /(х, g)-*max (2.21) X имеет смысл лишь тогда, когда мы фиксируем значение £. То- гда, решая задачу (2.21), получим функцию £(£), т. е. каждому значению g сопоставляем значение х = ^(^), являющееся реше- нием задачи (2.21). Значит, стратегия £(£)—это оптимальная стратегия в том случае, если мы знаем или будем знать в мо- мент принятия решения значение случайного фактора g. В про- тивном случае неизвестно, какой вектор конструктивных пара- метров х мы должны выбрать. Когда проектируемая конструкция должна использоваться многократно, кажется разумным выбрать такие значения кон- структивных параметров, которые максимизируют математиче- ское ожидание критерия, т. е. являются решением задачи Л (х) = f (х, |) -> max. (2.22) X Но такое утверждение не является абсолютным и могут встре- титься обстоятельства, требующие иных подходов. Например, определенную роль может играть и дисперсия критерия. И, мо- жет быть, имеет смысл иногда поступиться немного значением математического ожидания для того,“Чтобы уменьшить возмож- ный разброс результатов, т. е. уменьшить значение дисперсии /2(х) = (Нх,1)-7(хД))2. (2.23) Заметим, что математическое ожидание f(x, g) — это. некото- .рая функция от х: f(x,g) = f(x). (2.24) Ее вычисление может оказаться весьма трудоемким. Мы долж- ны сначала задать величину вектора х и лишь затем провести усреднение — операцию, которая также может требовать значи- тельных затрат машинного времени. Теперь мы можем оценить, сколь трудоемок будет процесс отысканий экстремальных зна- чений функции f*(x). В одной из последующих глав мы еще-вер- немся к. проблеме отыскания экстремальных значений функций типа (2.24). . Трудности решения задачи (2.22) часто заставляют заме- нять эту задачу другой. Заметим, что решение задачи (2.21) для фиксированного значения случайного параметра £ может быть очень простым, поэтому вместо задачи отыскания max f* (х) = f* х
28 ГЛ. I. МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИИ разыскивают решение другой задачи: maxf (х, g)==f. X Так как f > f* *), то тем самым мы получаем полезную верхнюю оценку. Могут быть приведены и другие соображения о выборе целевой функции. Таким образом, в случае, когда мы предполагаем использо- вать проектируемую конструкцию много раз, проблема выбора критёрия в виде (2.22) или (2.23) мало чем отличается от си- туаций, в которых случайные параметры отсутствуют. Дополни- тельные сложности здесь носят чисто вычислительный характер. Они связаны с более громоздким вычислением целевой функции, поскольку мы должны проводить операцию усреднения. Ситуация оказывается значительно более сложной, если речь идёт о выборе параметров конструкции или плана в случае их одноразового использования. Именно с такой ситуацией мы столкнулись при обсуждении задачи распределения инвестиций на строительство элеваторов и' ирригацию. В этом , случае ин- формация о статистических характеристиках формально не имеет никакого смысла: какова бы ни была вероятность того, что значение g будет равно 1010 или 10—10, мы ничего не можем сказать о величине функционала, и, строго говоря, выбор х (и значение функции f(x, £)) может быть произвольным. Зна- чит, мы должны постулировать справедливость некоторой гипо- тезы, вводить функцию риска, оценивать «шансы» и т. д. По существу, мы так и сделали, рассчитывая «оптимальное» рас- пределение инвестиций. Гипотеза, на которую мы опирались, могла быть сформулирована примерно в следующих терминах: функция цели выбирается так, как если бы наша система была предназначена для многократного функционирования. В данном конкретном случае в этом есть определенный смысл, так как, планируя распределение инвестиций на перспективу, мы создаем ценности, которые нам будут служить много лет. \ § 3. Неопределенность целей Исследование тех операций, которые были рассмотрены в предыдущем параграфе, сводилось к четко поставленным мате- матическим задачам оптимизации — эти задачи не содержали неопределенностей. Стохастические задачи, т. е. задачи, содер- жащие случайные величины или функции, мы не относим к чис- лу задач, содержащих неопределенные факторы: если в качестве •) Это утверждение — следствие очевидного неравенства max (fi (х) + ft (х)) < max ft (х) + max ft (х). .
§ 3. НЕОПРЕДЕЛЕННОСТЬ ЦЕЛЕЙ 29 целевой функции мы можем использовать средние значения не- которых величин, то задача отыскания оптимальной стратегии сводится к обычной задаче оптимизации, без каких-либо до- полнительных гипотез. Но задачи, не содержащие неопределенностей, являются ско- рее исключением, чем правилом, — адекватное реальности опи- сание проблемы практически всегда содержит различного типа неопределенности, отражающие то естественное положение, в котором находится исследователь: любое его знание относи- тельно и неточно. В исследовании операций принято различать три типа неоцределенностей: неопределенность целей, неопреде- ленность наших знаний об окружающей обстановке (неопреде- ленность природы) и неопределенность действий реального про- тивника или партнера. Рассмотрим последовательно эти три типа неопределенностей и попробуем понять, что необходимо ис- следователю для анализа соответствующих задач средствами математики. В предыдущем параграфе мы рассмотрели ситуации, в кото- рых выбор стратегии сводился к определению экстремальных значений функций. Но уже при обсуждении этих экстремальных задач мы обратили внимание читателя на то, что имеют смысл и другие подходы — в качестве критериев уместно использовать иные целевые функции. В самом начале этой главы отмечалось, что в исследовании операций цель, целевая функция носит экзогенный характер. В результате исследования операции выбирается способ дости- жения цели — стратегия. Тем не менее назначение самой цели, критерия, т. е. формализация цели (выбор целевой функции), всегда или почти всегда — трудная проблема. Рассмотрим снова задачу о распределении удобрений. Мы использовали критерий (см. (2.7)),- который является, по существу, комбинацией двух критериев: суммарной стоимости продукции и затрат на ее про- изводство. Естественное стремление исследователя операций — найти такую стратегию, которая максимизирует доход (суммар- ную стоимость продукции) и минимизирует затраты. Если сле- довать этому стремлению исследователя, то вместо задачи (2.7) мы получим задачу вида fW^rnax, -F(x)->max (F(x)-> min), ' гДе f(x) и F(x) —функции, характеривующие соответственно Доход и затраты. Такая задача, в отличие от задачи, рассмотренной в преды- дущем параграфе, как правило, решения уже не имеет. В самом ч ле. чем больше будут затраты F(x), тем выше будет урожай
30 ГЛ. I. МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ к и, следовательно,, тем больше будет суммарная стоимость про* дукции f(x) . Таким образом, обе цели оказываются противоречащими друг другу. Заметим, что этот факт нашел свое выражение в распространенной фразе: добиться максимума производства с минимумом затрат. Она строго научного смысла не имеет, ибо минимум затрат —нуль, а с нулевыми затратами произвести ка- кую-либо полезную работу нельзя? Но, несмотря на кажущуюся бессмысленность, эта фраза правильно отражает тенденции, ин- тересы оперирующей стороны. Рассмотренная ситуация типич- на: она показывает, что, даже зная цели (желания) оперирую- щей стороны, исследователь операции еще не может приступить к своему «основному делу» — решению оптимизационной задачи. Слова «основное дело» не случайно взяты в кавычки. Формали- зация— это не менее важная, а часто и более трудная часть проблемы. К тому же «основным делом» может оказаться не решение оптимизационной задачи, а выбор решения, удовлетво» ряющего тому или иному условию. Для того чтобы свести задачу исследования операции к стандартной задаче оптимизации, необходимо сформулировать еще дополнительные гипотезы, не вытекающие из постановки задачи. Одной из таких дополнительных гипотез в предыдущем параграфе было введение целевой функции Z = f(x)-F(x). А как сформулировать единую цель, если критериев много: fi(х)-*max, f2(x)-*max, .... fn(x)->max, а ресурс для их достижения находится только в «одних руках»? И хотя математика не может дать однозначного ответа на этот вопрос, она может помочь принять решение и сделать, правиль- ный выбор. Это и есть проблема неопределенности цели (жела- ний). Она типична для любого крупного технического и народ- нохозяйственного проекта. Например, совершенно естественно желание главного конструктора самолетов добиться того, чтобы его самолет был самым скоростным, самым высотным, самым надежным и к тому же самым дешевым. Но ведь добиться всего этого одновременно невозможно в принципе! Реальная конструк- ция всегда будет каким-то компромиссом, каким-то сочетанием требуемых качеств. Но каких — конструктор заранее не знает. В этом и заключается’ основная проблема многокритериально- сти (неопределенности целей). Итак, неопределенность целей необходимо требует привле- чения дополнительных гипотез, если мы хотим однозначно сфор- мулировать цель операции.
31 $ 3. НЕОПРЕДЕЛЕННОСТЬ ЦЕЛЕЙ Отметим, что исследование операций понемногу-начало пре- вращаться в некоторую синтетическую дисциплину, опираю- щуюся не только на обширный математический аппарат, но и на целый ряд методов преодоления неопределенностей. Проблема принятия решения в условиях неопределенности постепенно де- лается центральной проблемой, которой, собственно говоря, и обязано превращение исследования операций в самостоятель- ную теорию. В рамках этой теории изучалась, в частности, раз- личные способы преодоления неопределенностей, необходимые для этого гипотезы и свойства решений, им удовлетворяющие. Остановимся .здесь на некоторых наиболее употребительных способах преодоления неопределенности целей и обсудим тот случай, когда перед исследователем операции стоит задача вы- бора способа действия (вектора х), обеспечивающего макси- мальное значение функциям f2(x)....fn(x) одновременно. а) Линейная с-вертка. Вместо п частных критериев fi. предлагается рассматривать один критерий вида п F(x)=Zctft(x), . (3.2) i-i где Ci — некоторые положительные числа, тем или иным спосо- бом нормированные (например, 2^сг=1^. Такой способ свертки вводит, по существу, отношение экви- валентности различных критериев (целевых функций), так как величины Ci показывают, насколько изменяется целевая функ- ция F(x) при изменении критерия fi(x) на единицу: с, = dF/dfi. Коэффициенты сг —дщзультат__экспертизы; _они отражают представление оперирующей стороны о содержании компромис- са, который она вынуждена принять. Таким образом, содержа- ние компромисса состоит в ранжировании целей, которое' вместе с назначением весовых коэффициентов и является той дополни- тельной гипотезой, которая позволяет свести задачу со многими критериями к задаче с единственным критерием, определяемым формулой (3.2). Такое ранжирование, разумеется, представляет собой далеко 1 не универсальный способ преодоления неопределенности целей. б) Использование контрольных показателей. Очень часто в задачах планирования и проектирования задается некоторая система нормативов: f*, f*2, ..., f*. Это значит, на- .пример, что параметры будущей конструкции должны быть та- ковы, чтобы максимизировать функции ft(x) при условиях i = l,2..............п.
32 ' ГЛ. I. МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИИ В таких случаях целевую функцию удобно представить в виде F(x) = min —-г- .(3.3) и искать вектор х, который обеспечивает максимальное значе- ние F(x). Смысл здесь достаточно прост. При данном значении вектора х величина 'F(x) дает нам значение наихудшего из по- казателей fi(x). Значит, условие F(x)-+max означает выбор та- кой системы конструктивных параметров х, которая максими- зирует отношение 7-го реально достигнутого значения критерия к его контрольному значению. Если значения f*{ жестко не за- даны, то они могут быть определены в результате экспертного опроса. " Критерий в форме (3.2) обладает следующим важным до- стоинством. Предположим, что ограничения, наложенные на вы- s бор компонент вектора х, являются линейными: (3.4) так же как и функции f{ (х) = £ ^х*. Тогда очевидно, что за- дача выбора с использованием критерия (3.2) сведется к задаче линейного программирования: определить максимум линейной формы при линейных ограничениях (3.4). Критерий (3.3) при этих условиях обладает тем же свой- ством. Это легко показать, используя новую переменную Тогда очевидно, что к ограничениям добавятся еще и такие: ft(x)>Vft, (3.5) и мы придем к следующей задаче линейного программирования: определить максимум по х скаляра V, удовлетворяющего огра- ничениям (3.4) и (3.5). в) Простейший способ преодоления неопре- деленности целей. Предположим опять, что мы ввели не- которую систему контрольных показателей f*, относительно-ко- торых критерии fi(x) должны удовлетворять ограничениям i=l, .... га. . (3.6)
§ 3. НЕОПРЕДЕЛЕННОСТЬ ЦЕЛЕЙ 33 Предположим, что, кроме того, среди критериев fi мы вы- делили некоторый основной, например fi(x). Тогда мы снова пришли к однокритериальной задаче в fi(x)-*max при условиях (3.6). Схема подобной редукции к однокритериальной задаче яв- ляется, вероятно, сцмой простой и наиболее употребительной в инженерной практике. Задача конструктора (проектировщика) сводится только к назначению допустимых границ используе- мых показателей. г) Введение метрики в пространстве целевых функций. Рассмотрим еще одну широко используемую ги- потезу. Предположим, что мы решили систему одндкритериаль- ных задач ^(xJ-^-max, i=l, 2, ..., п, и нашли в i-й задаче вектор х = xt, доставляющий максималь- наб'значение критерию fi(x): = 1=^1, .... п. (3.7) Совокупность скалярных величин ft определяет в простран- стве критериев некоторую точку, которую назовем точкой «аб- солютного максимума». Если векторы xi различны, то не су- ществует такого выбора, который позволил бы достичь этой точки: точка (fi, /г, • •., fn) является недостижимой в простран- стве критериев. Введем теперь положительно определенную матрицу R =(rij). Тогда скалярная величина Л=^§(Л(^-Ь)г//(//(х)-Ь) .(3.8) определяет в пространстве критериев некоторое расстояние от точки, соответствующей данному вектору х, до точки «абсолют- ного максимума».. В частном случае, когда R — единичная мат- рица, ____________ А=д/Е(Ш-/г)2 (3.9) есть евклидово расстояние от точки (fi(x), f2(x), ..., fn(x)) до точки (/i, f2, ..., f„) в пространстве критериев. В качестве нового скалярного критерия мы можем принять функцию (3.8). Ее минимизация дает определенную полезную исследователю информацию: показывает наши предельные воз- можности достижения «абсолютного максимума». Введение подобных критериев также соответствует опреде- ленным гипотезам, принятие которых остается на совести ис- следователя. И эти критерии ничем не лучше рассмотренных выше, хотя они и отражают определенные свойства задачи 2 Н. Н. Моисеев
34 ГЛ. I. МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИИ исследования операций: несут информацию, полезную оперирую- щей стороне. д) Компромиссы Парето. Сталкиваясь с многокрите- риальными задачами, естественно попытаться найти способы сведения их к обычным задачам с одним критерием, поскольку для однокритериальных задач, да еще с достаточно гладкой це- левой функцией, существуют хорошо разработанные методы решения. Эти способы, разумеется, должны носить неформаль- ный характер, ибо они не могут быть получены как результат решения какой-либо математической задачи. Мы уже рассмот- рели несколько подобных способов, основанных на операции свертывания критериев. Смысл тех способов свертывания кри- териев, которые были изложены, достаточно очевиден: одну за- дачу мьд заменили другой, причем в правомочности подобной замены и состояло содержание новых гипотез. Но к анализу многокритериальных задач можно подойти и с других позиций: попытаться сократить множество исходных вариантов, т. е. исключить из неформального анализа те ва- k рианты решений, которые заведомо будут плохи. Рассмотрим один из подобных путей, предложенный итальянским экономи- стом В. Парето в 1904 г. Предположим, что мы сделали некоторый выбор. Обозначим его через х* и предположим, что существует некоторый другой выбор £ такой, что для всех критериев },(х) имеют место нера- венства (ЗЛО) причем хотя бы одно из неравенств — строгое. Очевидно, что выбор £ педпочтительнее х*. Поэтому все век- торы х*, удовлетворяющие (3.10), следует сразу исключить из рассмотрения. Имеет смысл заниматься сопоставлением, под- вергать неформальному анализу только те векторы х*, для ко- торых не существует х такого, что для всех критериев удовле- творяются неравенства (3.10). Множество всех таких значе- ний х* называют множеством Парето, а вектор х* называют неулучшаемым вектором результатов (вектором Парето), если из f»(^)>A(x*) для любого i следует fi(£) = ft(x*) (см. [5]). Предположим, что цели субъекта определяются двумя одно- значными функциями: fl(x)->max, f2(x)-+max. Тогда каждому допустимому значению переменной х отве- чает одна точка на плоскости (f\,fz) (рис. 3.1) и равенства fl~fl(x), f2 = fi(x) определяют параметрическое задание некоторой кривой abed в этой плоскости. Но к множеству Парето можно отнести далеко
§ 3. НЕОПРЕДЕЛЕННОСТЬ ЦЕЛЕН 35 не всю кривую. Так, участок Ьс, очевидно, не принадлежит мно- жеству Парето, поскольку вместе с ростом fi происходит и рост с Таким образом, на этом участке изменению переменной х отвечает одновременное увеличение обеих целевых функций, и, следовательно, такие варианты решений должны быть сразу ис- ключены из дальнейшего рассмотрения. Из тех же соображений должен быть исключен участок а'Ь, поскольку для каждой его точки е найдется точка, принадле- жащая участку cd, в которой значения обеих функций fi и fi больше, чем в точке е. Значит, претендовать на принадлежность к множеству Парето могут толь- ко участки аа! и cd, причем точ- ка а' также должна быть исклю- чена. В теории принятия решений существует термин «принцип Па- рето», заключающийся в том, что выбирать в качестве реше- ния следует только тот вектор х, который принадлежит множеству Парето. Принцип Парето не выделяет единственного решения, он только сужает множе- ство альтернатив. Окончательный выбор остается за лицоц, при- нимающим решение. Но исследователь, математик, построив множество Парето, конечно, облегчает прЪцедуру выбора ре- шения. Принцип Парето играет очень важную роль в автоматизации проектирования. Предположим, например, что речь идет о про- ектировании водохозяйственного комплекса. В результате созда- ния этого комплекса появится возможность обеспечить водой не- сколько крупных промышленных и сельскохозяйственных объек- тов и тем самым повысить их эффективность. Но одновременно возникает и целый ряд отрицательных явлений. Большая пло- щадь водохранилища, которая необходима для регулярной ра- боты гидрокомплекса, приводит к застойным явлениям, большим потерям воды на испарение и т. д. Помимо этого, уменьшение количества воды в речной системе ухудшает условия рыбовод- ства и судоходства, а строительство промышленных комплексов увеличивает загрязнение и, следовательно, ухудшает качество воды, поступающей на поля, и т. д. Одним словом, ситуация оказывается принципиально многокритериальной, цели проекти- ровщика могут быть выписаны в виде fi(-v)-*max, i— 1, ..., га. Проектировщик оказывается перед необходимостью искать омпромисс. И одним из путей отыскания этого компромисса 2*
36 ГЛ. I. МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИИ будет построение множества Парето, изучение которого дает большую информацию. Лицо, принимающее решение, видит, в частности, сколько «стоит» увеличение одного из показателей, как оно сказывается на остальных показателях, значения кото- рых непременно ухудшаются. Это множество оказывается, как правило, весьма сложной природы. Его анализ интуитивными методами вряд ли возможен. Но, помимо критериев ft(x), достаточно часто в распоряже- нии проектировщика есть еще некоторый общий критерий. F(x). Иногда он бывает формализован, записан в явном виде. Напри- мер, таким критерием может быть стоимость проекта. В этом случае- исследователю операций представляется возможность решить задачу до «конца». Для этого ему достаточно определить вектор х, который дает решение задачи: F(x)-»-max при xs sPo(h, •••, fn), где Pc(f\, .... fn) — множество Парето для функций fi, ..., fn на множестве G допустимых векторов х. Например, в случае водохозяйственного комплекса множество G определяется таким распределением воды по объектам xi, при котором ее количество не превосходит притока Q(x). Введение «общего» критерия Р(х) и максимизация его зна- чений на множестве Парето также является некоторой гипоте- зой, поскольку из совокупности критериев fi....fn, F один из критериев мы специальным образом выделяем. Примечание. В проблемах выбора решения большую роль играют методы последовательного анализа и отбраковки неконкурентоспособных вариантов, методы последовательного сжатия множества альтернатив. В си- стемном анализе они занимают едва ли не центральное место в формирова- нии процедур выбора альтернатив. В одной из следующих глав мы будем о них говорить подробнее. Принцип Парето относится к этому же кругу вопросов. е) О численных методах построения множе- ства Парето. Приближенное построение множества Парето - относится к числу очень важных и трудных задач численного анализа. С расширением круга проблем, которые изучает си- стемный анализ (например, с появлением задач автоматизации проектирования), значение методов эффективного анализа мно- жества Парето непрерывно растет. Однако до самого последнего времени этим вопросам уделялось очень мало внимания, и чис- ленные методы построения точек множества Парето в настоя- щее время только начинают развиваться. На нескольких простых примерах поясним содержание возникающих здесь проблем. Начнем с рассмотрения простейшего случая двух критериев. Пусть речь идет о задаче fi (х)-^ max, f2(x)-*max, (З.П) х е Gx.
$ 3. НЕОПРЕДЕЛЕННОСТЬ ЦЕЛЕЙ 37 Каждой точке х е Gx соотношения А = f2=f2(x) . (3.12) ставят в соответствие некоторую точку f е Gf в плоскости кри- териев (рис. 3.2). Соотношения (3.12) определяют отображение множества Gx на Gf. ' Множество Gf носит название множества достижимости или множества предельных возможностей. Изучение структуры этого множества может оказаться весьма полезным при исследовании различных задач проектирования и планирования. Поэтому в последние годы началось систематическое изучение возможно- стей построения множеств достижимости. Заметим, что множе- ство Парето представляет собой лишь часть границы множества достижимости. На рис. 3.2 множеством Парето будет-дуга АСВ. Приближенное построение множества Парето сводится к по- следовательному решению ряда задач математического про- граммирования. Опишем одну из возможных схем расчета. Фиксируем некоторые желательные значения критериев fi и f2: fi = Ci, fz — Ci. Значения Ci и С2 следует выбрать так, чтобы они принадлежали множеству достижимости. . Примечаяи.е. В общем случае проблема определения внутренней точ- ки множества достижимости может оказаться совсем не простой. Решаем теперь две оптимизационные задачи. Ь fi(x)->tnax, II:- f2(x)->max, х €= Gx, f2(x) = C2l x g= Gx, fi(x) = Ci. Решив эти задачи, мы определим точки а й b (рис,. 3.8), проведя через них прямую /, мы получим простейшую аппро- ксимацию множества Парето. ла ДЛЯ1 Уточнения аппроксимации, решив нижеследующие за- д чи III и IV,. мы находим еще две точки — с и d,—•
38 ГЛ. I. МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИИ принадлежащие этому множеству: Ш: f! (х)-> max, IV: f2(x)->max, x^Gx, f2 = Ci, X(=Gx, f! = C3. Значения C3 и Ci снова должны принадлежать множеству достижимости. Через точки а, с, d, b мы проведем ломаную 2, которая и будет следующим приближением. Очень часто подоб- ной информации о структуре множества Парето уже бывает достаточно для решения практических задач. Описанный способ можно распространить и на случай большего числа критериев. Для аппроксимаций множества Парето можно поступить и по-другому. Пусть М и Х2 —строго положительные числа такие, что Ai + A2=1. (3.13) Составим новый критерий f1 = Wi (х) -J- A,2f2 (х) и решим следующую задачу математического программирова- ния: f1 (х)-> max. ' / хе Gx Оказывается, что решение этой задачи определяет такой век- тор х, что точка f2 = f2(x) принадлежит множеству Парето. Поэтому аппроксимацию множества Парето мы можем осу- ществить следующим образом (рис. 3.4). Решаем задачу Л?/1 (х) + (х) -> max, (3.14) * * *
§ 3. НЕОПРЕДЕЛЕННОСТЬ ЦЕЛЕЙ 39 где Л? и А.® удовлетворяют условию (3.13). Задача (3.13), (3.14) определит некоторый вектор ха, который в плоскости f опреде- лит точку а с координатами Точно так же мы определим точку 0 и че0®з точки а и 0 прове- дем прямую 1. Она. будет простейшей аппроксимацией множе- ства Парето (см. рис. 3.4). Строя точки у и 8, мы можем полу- чить с их помощью ломаную 2, которая будет следующим при- ближением, и т. д. При использовании подобных построений возникает вопрос: можно ли таким способом построить любую точку множества Парето?.Другими словами, каждой ли точке множества Парето мы можем поставить в соответствие такой вектор Х=(Л1, ... ...» Ьп), удовлетворяющий условиям У*, A.z= 1,> 0, i = 1, ... ..п, что решение задачи оптимизации . (M) = ZWiW-* max х&ох определяет совокупность чисел fi, являющихся координатами данной точки множества Парето? В общем случае ответ на этот вопрос остается открытым. Он решен, притом положительно, Рис. 3.5. линей- напри- параг- только для того случая, когда множество Gx — многогран- ник, а критерии имеют вид Г = « X), т. е. являются также ными функциями (см., мер, {39]). В заключение этого рафа сделаем одно замечание о точности описанного способа аппроксимации множества Па- рето. Если множество Парето выпукло, то, увеличивая коли- чество точек, которые определяются одним из описанных выше способов, мы можем построить многогранник, аппроксимирую- щий это множество с любой степенью точности. Это иллюстри- руют примеры, изображенные на рис. 3.3 и 3.4. Но, к сожалению, практика дает примеры множеств.Парето, которые не являются выпуклыми. Тогда задача их аппроксимации резко усложняется, ’-итуация, которая здесь возникает, показана на рис. 3.5.
40 ГЛ. I. МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИИ § 4. Другие типы неопределенностей < а) Природные неопределенности. В предыдущем параграфе мы рассмотрели трудности, связанные с существова- нием неопределенности целей. Но эта неопределенность, как об этом уже было сказано, — не единственный тип неопределенно- стей, с которыми сталкивается исследователь операции. Второй тип неопределенности мы будем называть неопреде- ленностью природы. Предположим, что мы знаем нашу цель, например, мы хотим так проложить маршрут и распорядиться имеющимся запасом горючего, чтобы наш самолет как можно быстрее долетел от Москвы до Владивостока. Но время полета Г будет зависеть не только от нас, но gnje и от погоды на трассе. Эта ситуация очень типична, и для ее описания в исследовании операций принята вполне определенная формализованная схе- ма. Целевую функцию (например, время полета) записывают в виде ММ, (4.1) где аебв — некоторый параметр (или функция), который мы заранее не знаем и не можем контролировать. Выбор х — на- шего способа действий, который обеспечивает минимальное значение Т, — будет, очевидно, существенно зависеть от а. Значит, говоря о природной неопределенности при исследо- ваний операции, мы имеем в виду выбор действий в условиях, когда целевая функция задана, но задана не совсем точно — она содержит неопределенный параметр. Решая задачу f (х, а) -> шах, X мы можем определить вектор х лишь как функцию параметра а: х = х(а). (4.2) ♦ Если никакой информацией о факторе неопределенности а мы не располагаем, то и результат'оптимизации f(x, а) произволен. В реальных ситуациях информация о параметре а обычно имеет ЧРД а е Ge, где Оа —некоторое множество. ~ Но подобной информации также недостаточно для одно- значного решения задачи. Формула (4.2) определяет лишь не- которое отображение множества неопределенности природных факторов G^ на множество Gx, которое естественно назвать множеством неопределенности результата. Множество неопределенности результата Gx— это, конечно, очень важная характеристика изучаемой операции, но его по-
ч 4 4. ДРУГИЕ ТИПЫ НЕОПРЕДЕЛЕННОСТЕЙ 4i строение сопряжено с большим объемом сложных вычислений. В то же время есть еще один подход,, который дает строгую, правда, лишь одностороннюю оценку. Это так называемый принцип наилучшего гарантированного результата. Поясним его содержание. Так как для любого х mln f (х, а)< f (х, а), (4.3) «®ов то и для любого а е Оа ' f = max min f (х, а) С max f (х, а). (4.4) х а е Оа х Число f*. определенное формулой (4.4), называется гарантиро- ванной оценкой, а соответствующее х = х* — гарантирующей стратегией в том смысле, что, каково бы ни было значение па- раметра неопределенности а, выбор х = х* согласно формуле (4.4) гарантирует, что при любом а значение целевой функции будет не меньше, чем f*. Для получения гарантирующей стра- тегии необходимо решить следующие задачи оптимизации: 1) вычислить min f (х, а) для любого х\ в результате будут aeG • найдены а = а* (х) и / (х) = / (х, а* (х)); 2) вычислить max/(х, а*(х)); в результате будут определены х = х* и /* (х*) = /*. Гарантированную оценку можно значительно улучшить, если знать заранее, что в момент «действия» (или «опыта») станет известна величина параметра а. Определим значение функции х «= х(а) такое, что для любого а max f (х, а) = f \зс (а), а) = J (а). (4.5) X ч < Вычислим затем такое а = а, которое определяет - min J (а) = f (а) = min maxf (х, а); ввОа в®°а * Так.как min max f (х, а) max .min f (х, а) = Г, ае0а х t х а «<?а *то информация о том, что в момент принятия решения мы будем знать величину неопределенного фактора, например состояние погоды, позволяет получить новую гарантированную оценку, - более* «совершенную». Но в этом случае гарантирующей стра- тегией будет не вектор х = х*, а некоторая функция х = х(а).
4? ГЛ. I. МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ Выбор гарантирующей стратегии поведения —это рациональ- ный способ принятия решения. В результате использования этой стратегии мы гарантируем себя от всяких случайностей: каковы бы ни были не контролируемые нами факторы, мы обеспечим себе значение целевой функции не меньшее, чем f*. Но всегда остается возможность как-то улучшить этот результат. Для это- го надо принять решение, связанное с определенным риском, поскольку, задавшись, нйпример, каким-либо значением неопре- деленного фактора, мы можем получить не только большее, но и меньшее значение целевой функции. Рассмотрим подробнее ситуацию с риском. Здесь обычно принято различать два край- них случая: выбор производится многократно и выбор является однократной операцией. В обоих случаях предполагается, что а — случайная величина, закон распределения которой известен. Мы увидим, что разница между этими двумя случаями.не столь уж велика. Поскольку а —случайная величина, то значение функции f(x, а) будет также случайной величиной. Поэтому исходную за- дачу в тех случаях, когда речь идет о многократно повторяю- щихся операциях, естественно заменить некоторой вероятност- ной. С подобной ситуацией мы уже сталкивались в §г2. В каче- стве оценки выбранной стратегии мы можем теперь принять величину максимума математического ожидания - fi = max f (х, а). X Но замена задачи f(x, а)->шах задачей f(x, а)->тах —не единственный способ перехода к стохастической постановке. Можно поступить, как мы это видели, и иначе, приняв в каче- стве оценки величину f2 = rtiax f (х, а) = f (£ (to), а), X * где х = к (а) —наилучшая стратегия при известном а. Могут быть и другие критерии. Обозначим, например, через а среднее значение случайной величины а; ему будет отвечать некоторая функция fs = f(x, а), максимум которой мы также сможем использовать для оценки. Замена одной из этих задач любой другой является актом неформальным, ибо эти задачи — совершенно разные. И вообще, какие бы критерии мы в этой ситуации не формулировали, их выбор в любом случае не является строгой математической опе- рацией. Он будет отражать наше предположение о том, что определение параметров системы, произведенное согласно но- вому, введенному нами правилу, обеспечивает ей желаемое ка-
§4. ДРУГИЕ ТИПЫ НЕОПРЕДЕЛЕННОСТЕЙ 43 чество. Подобная ситуация — следствие того очевидного факта, что исходное требование f (х, а) -* max (4.6) эквивалентно,, по существу, бесконечно большому числу различ- ных в общем случае критериев. В самом деле, предположим, что параметр а принимает лишь дискретные значения ои, «2, ...; тогда условие. (4.6) эквивалентно максимизации множества кри- териев: дх.аО-^тах, f (х, а2)-> max, ............................. (4.7) f (х, а„)-> тах> Значит, задача.принятия решения в условиях неопределен- ности природы, когда параметр, характеризующий эту неопре- деленность, случаен, имеет' много общего с задачей принятия решения в условиях неопределенности цели. В предыдущем па- раграфе мы видели, что в этой ситуации мы должны ввести дополнительную гипотезу — произвести свертку критериев. А, свертка критериев всегда является актом неформальным, и любой из критериев ft, fz, fi, с помощью которых мы считали возможным производить выбор стратегий, будет только гипоте- зой. Это утверждение справедливо в равной степени и для мно- гократно повторяющихся операций, и для одноразовых. Только при многократно повторяющихся операциях свертка критериев, сводящаяся к переходу к стохастической постановке, вполне естественна. Сказанное означает, что, хотя этот переход отра- жает наше субъективное представление о цели операции, он имеет интуитивное обоснование (в опыте людей). Подобная формализация не противоречит поставленным целям, достаточно им адекватна в случае многократно повторяющейся операции. Другое дело, когда выбор х — однократная* операция. В этом случае информация о том, что а — случайная величина с из- вестными статистическими характеристиками, практически ни- чего не может дать. И тем не менее, как мы уже знаем из анализа примера о строительстве элеваторов, стохастическая трактовка задачи мо- жет использоваться в случае однократных операций и имеет для этого свою мотивировку— дает одну из возможных сверток критериев. Заметим, что с аналогичной ситуацией мы сталкиваемся и при анализе ограничений. В § 1 мы привели пример физических ограничений S QiXt <Q, (4.8)
44 ел. I. МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ где Q — общее количество воды в водохранилище. Поскольку значение Q зависит от погодных условий, Го оно является вели- чиной случайной. Предположим, что Q принимает лишь дис- кретные значения. Тогда условие (4.8) эквивалентно следующим неравенствам: Условие (4.8) является «физическим», нарушить его мы не можем: не можем дать земле больше воды, чем есть в нашем распоряжении. И, выбирая величины Xi, мы -не знаем заранее, каково будет значение Q. Но для принятия решения, т. е. для выбора xi, значение Q мы должны тем или иным способом фиксировать. Назначение Q или переход к стохастическому опи- санию всегда будет некоторой новой гипотезой. А как согласовать принятое решение с той реальностью, ко- торая будет иметь место после выбора величин х(? В самом деле, это не так просто, так как физическое ограничение мы нарушить не сможем. Значит, мы сталкиваемся с новой опера- цией: перераспределить воду так, чтобы в новых условиях (после получения новой информации) добиться максимального значе- ния нашей целевой функции. Но, подчеркнем еще раз, это будет уже новая задача. Приняв то или иное значение случайного параметра Q или вводя в качестве критерия стохастическую характеристику про- цесса, мы никогда не можем сказать заранее, каков будет результат данной операции. Конечно; в нашем распоряжении всегда есть гарантирующая стратегия. Обозначим, например, через Q* минимальное значение величины Q; тогда, сделав вы- бор величин Xi из предположения, что <Q», г мы заведомо обеспечим выполнение условия (4.8) и сможем иметь гарантирующую оценку, т. е. гарантировать получение минимального урожая. Во всех остальных случаях мы будем иметь дело с новыми гипотезами, т. е. с риском, принятие Которого целиком опреде- ляется решением исследователя операции7 или оперирующей стороны. б) Активный партнер. Перейдем теперь к описанию не- определенностей, связанных с существованием активных парт- неров или противников, действия которых мы не можем пол* ностью контролировать.
§ 4. ДРУГИЕ ТИПЫ НЕОПРЕДЕЛЕННОСТЕЙ 45 В теории исследования операций особое место занимает изу- чение ситуации, в которой участвует много субъектов (много оперирующих сторон), причем каждый из них стремится достичь своей цели I i (х,, х2, ..., х„) -> max xi. и имеет для этого определенные возможности, которые описы- ваются вектором Xi, Xi Gi. . Заметим, что формально такая ситуация включает в себя проблему многокритериальное.™,* требующую отыскания векто- ра х, при котором достигается максимум критериев fi(x). В са- мом* деле, если мы отождествим цель каждого из субъектов с его критерием fi(xt), а в качестве описания множества б,- примем условие • Х,=Х2 = ••• — хп, то. получим частный случай задачи со многими активными парт- нерами. Но, конечно, общий случай ситуации со многими субъ- ектами гораздо сложнее и требует для своего анализа целого ряда специфических гипотез. Поясним это на примере двух субъектов. Итак, пусть два субъекта А и Б, располагающие возмож- ностью выбора векторов х и у, стремятся к достижению своих целей,, которые мы будем записывать в виде f (х, у)->max, <p(x, «/)->max, xsX, y^Y. В частном случае может оказаться, что f = —<р; такую си- туацию мы будем называть антагонистической. . Примечание. Антагонистические ситуации были предметом множества исследований и сделались основным объектом изучения в теории игр — мате- матической дисциплине, возникшей благодаря работам француаского матема- тика Э. Бореля из задач анализа салонных игр. Чисто антагонистическая си- туация является в известном смысле вырожденной. Наиболее типичен кон- фликт, в котором интересы партнеров или противников не совпадают, но и не строго противоположны. Общий случай нетождественности интересов (целей) парт- неров (субъектов) мы будем называть конфликтом. При изу- чении конфликтных ситуаций, т. е. при изучении возможных способов выбора, удобно отождествить исследователя с одним из субъектов. Условимся, например, говорить «мы», когда речь идет о субъекте А. Это тем более имеет смысл, ибо анализ всегда проводится с позиций интересов какого-либо из субъ- ектов. В связи с тем, что исход нашего выбора зависит от выбора субъекта Б, мы должны принять ту или иную гипотезу о его поведении, которое, в свою очередь, будет зависеть от характера
46 ГЛ. I. МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ информированности субъекта Б. Здесь возможно несколько гипотез (несколько случаев). а) Каждый из субъектов не имеет никакой информации о выборе, который сделал другой субъект. В этом случае мы мо- жем найти гарантированную оценку. Для субъекта А она будет выражаться формулой f* = max mln f (x, у), (4.9) xsXgeV для субъекта Б — формулой Ф* = max min ф (х, у). (4.9') y&Yх&Х Решая задачи (4.9) и (4.9'), мы найдем векторы х* и у*, которые реализуют значения [* и ф*. Это значит, что, сделав выбор х = х*,-мы при любых условиях (любом выборе у Y) гарантируем, что значение нашей целевой функции f (х, у) будет не меньше, чем /*. В этой ситуации могут быть предложены и различные ва- рианты риска. Например, мы можем принять гипотезу о том, что другой субъект использует гарантирующую стратегию у — у*. Тогда наш выбор будет иным: f (х, У*) -*• шах. »ех Мы определим вектор х = х** и соответствующее значение функции f = /**. При этом f** f*, но если противник (парт- нер) сделает иной выбор, например у = //**, то может ока- заться, что f(x**, у**) < /*. Но риск есть риск: мы сформулиро- вали гипотезу, и если она оказалась неверной, то и результат может оказаться совсем иным. Р) Пусть в момент нашего действия (выбора х) мы, т. е. субъект А, будем знать выбранное субъектом Б значение у. Тогда нашу стратегию — выбор х — следует искать в виде функции х = х(у). Мы можем ее определить эффективно; для этого нам надо решить задачу оптимизации /(*,#)-> max. (4.10) х е X Условие (4.10) определит искомую стратегию х = й(у)'. Для этого случая мы можем также вычислить гарантирован- ный результат /; он будет отличен от /*: f — min max f (x, у), уeУx<=X и йо всех случаях /* Д
§ 4. ДРУГИЕ ТИПЫ НЕОПРЕДЕЛЕННОСТЕЙ 47 Заметим, что, выбирая свою стратегию — вектор х,— мы в этой ситуации никак не можем повлиять на выбор, который сделал другой субъект. у) Предположим теперь, что субъект Б в момент принятия своего решения будет знать наш выбор; например, мы обязаны сообщить его субъекту Б. В этом случае мы не можем оказать влияние на выбор, который сделает субъект Б. В самом* деле, если мы знаем целевую функцию субъекта Б, то естественно сделать предположение о том, что субъект Б будет делать вы- бор из условия <р(х, #)->тах. (4.11) Решая задачу (4.11), мы можем определить отклик субъек- та Б на наш выбор, который, согласно нашей гипотезе, будет оптимальной стратегией субъекта Б: У=р(х), (4.12) Теперь мы можем распорядиться выбором х. В самом деле, подставляя (4Д2) в выражение для целевой функции f(x,y), мы получим f(x,g(x)) = F(x), (4.13) и теперь свой выбор мы можем сделать из условия F(x)->max. (4.14) Итак, информация о том, что субъект Б будет знать наш выбор, и гипотеза (о том, что субъект Б выберет свою опти- мальную стратегию, позволяют нам так воздействовать на его выбор, чтобы он в максимальной степени соответствовал нашим целям. Если максимум (4.11) достигается не в одной точке, а на множестве Af(^), то гарантированный результат субъекта А вычисляется взятием минимума по этому множеству, а наилуч- ший гарантированный результат субъекта А находится затем взятием максимума по х е X, т. е. f** = max min f {х, у). х&Х у е М (х) Описанная ситуация достаточно часто встречается на прак- тике, и ей нетрудно придать ту или иную экономическую интер- претацию. Так, вектор х мы можем отождествить с ресурсом, а функцию (4.12) назвать производственной функцией, которая описывает-наивыгоднейший для субъекта Б способ использова- ния ресурса. Таким образом, субъекту Б выделялось такое
48 ГЛ. I. МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ количество ресурса, чтобы его деятельность наилучшим обра- зом соответствовала нашим целям. 6) Проблема штрафа и поощрения. В пункте 0) мы рассмотрели такую ситуацию, в которой наша стратегия носила характер синтеза: х = £(у). (4.15) Теперь предположим, что мы не только располагаем воз- можностью выбора стратегии (4.15), но и можем заранее со- общить ее субъекту Б. Оказывается, что эта информация позво- лит найти наш отклик на действия субъекта Б, наилучшим об- разом соответствующий нашим целям, и повлиять в нужном на- правлении на действия субъекта Б. В самом деле, наиболее естественной гипотезрй о поведении субъекта Б будет предположение о том, что свое знание нашей стратегии £(у) он использует для оптимизации своей целевой функции ф(х,у), которая в этом случае будет иметь вид Ч(х,у) = у(£(у),у). (4.16) Задача, которая стоит перед субъектом Б, — найти такой вы- бор у, который доставляет максимум функции ф* (*/) = Ф (ЯЯ. 0 • Решая эту задачу, мы найдем у как некоторый оператор от нашей стратегии .£(«/): У = № («/)]. (4.17) Выражение (4.17) означает, -что каждой стратегии £(у) по- ставлено в соответствие свое значение вектора у. выражение (4.17) дает отображение, множества наших стратегий на мно- жество выборов субъекта Б. Зная этот оклик субъекта Б на нашу стратегию £(у), мы можем заняться выбором нашей опти- мальной стратегии. Для этого достаточно решить задачу f (*(#). Я* (#)])-* max. (4.18) iW Это — некоторая специальная оптимизационная задача. В результате ее решения мы найдем нашу оптимальную стра- тегию х(у) и значение целевой функции, которое будет ей со- ответствовать. Если, максимизируя функцию (4.16), мы найдем не един- ственный вектор у, а множество векторов есть Л1(х), то наи- лучший гарантированный результат субъекта А будет ' ' Г“ = тах min f(&(y),y), X g= Х1 у e= M U) где £ = 2(y), причем хеXb Xi —множество всех функций со значениями в X,
5 4. ДРУГИЕ ТИПЫ НЕОПРЕДЕЛЕННОСТЕЙ 49 Рассмотренной ситуации также легко придать экономиче- скую интерпретацию. Она дает схему функционирования эконо- мических организмов, когда один из них имеет возможность воздействовать на поведение другого с помощью штрафов и по- ощрений, которые описывает функция &(у). Можно рассмотреть еще много других похожих ситуаций*). В зависимости от характера информированности ^субъектов мы будем получать различные случаи взаимодействия партнеров. Мы рассмотрели здесь ситуации, которые можно назвать идеальными. Предполагалось, что.оба партнера не только точно знают свои цели, но и полностью информированы о целях дру- гого партнера. Такие случаи встречаются довольно редко. Ти- пично другое: мы никогда точно не знаем целей наших партнеров или противников, а противники, т. е. другие субъекты системы, также не очень точно знают наши цели. Лицо, анализирующее конфликтную ситуацию, всегда должно с этим .считаться. Не- соответствие реальности тех представлений, которые имеют субъекты, — это дополнительная трудность формирования гипо- тез о поведений, без которых невозможно принять более или менее обоснованные решения. Для построения гипотез о пове- дении других субъектов мы должны обычно формулировать гипотезы об их информированности. - в) Ситуации равновесия. Анализ неопределенности, как мы это видели в предыдущем параграфе, опирался на ряд гипотез, с помощью которых' из множества альтернатив выде- лялось некоторое подмножество «претендентов». В результате подобного анализа происходит отбрасывайие, исключение заве- домо «плохих» вариантов решений, которые не могут претендо- вать на право быть оптимальными. Обсуждая проблему неопре- деленности целей, ’ мы подробно остановились на изложении принцица Парето — важнейшего из принципов отбора рацио- нальных решений. Паретовский анализ определяет условия, ко- торым необходимо должен удовлетворять разумный компро- мисс. Принцип Парето сохраняет свою силу и при анализе кон- фликтных ситуаций со многими субъектами. Одна из важных проблем, возникающих при изучении конфликтных ситуаций со многими субъектами, — это проблема' коллективных решений, коллективного формирования компромисса. Очевидно, что в этой ситуации все те решения (альтернативы выбора), которые могут быть заменены другими, обеспечивающими большие зна- чения целевых функций всех субъектов одновременно или части субъектов, но без уменьшения значений целевых функций м *2 В последние годы анализу подобных вопросов посвящено довольно а ™ и важных исследований. Читателю, желающему глубже по- 271 омиться с п°Добной проблематикой, можно рекомендовать книги [4, 5,
50 ГЛ. I. МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИИ остальных субъектов, должны быть отброшены. Одним словом, обсуждая правильность коллективных решений, следует иметь в виду только. варианты, принадлежащие множеству Парето. Эти варианты (мы будем их называть эффективными) обла- дают тем свойством, что улучшить значение целевой функции какого-либо субъекта можно только за счет других субъектов. Но при анализе ситуации со многими субъектами, кроме принципа выбора эффективных решений (принципа Парето), существуют еще другие принципы. Мы остановимся на одном из них, так называемом принципе устойчивости, или принципе рав- новесия. Он возник в классической теории игр, предмет кото- рой — анализ антагонистических конфликтов двух лиц. Рассмот- рим ситуацию с двумя субъектами и предположим, что цель субъекта А — максимизировать значение функции f(x,y) и для этого он располагает возможностью выбирать вектор х из не- которого множества X. Другими словами, цель субъекта А мы можем записать так: f шах. • (4.19) х €= X Поскольку ситуация — антагонистическая, то цель субъекта Б будет строго противоположна, т. е. он будет стремиться йе- пользовать свои возможности так, чтобы f (х, у) -* min. (4.20) . y^Y Заметим, что в этой ситуации речь идет не о локальных экстре- мумах, а о глобальных на соответ- ствующих множествах, и главная задача состоит в том, чтобы сфор- мулировать рекомендации о спосо- бах выбора одновременно для обоих субъектов. В классических поста- новках всегда речь идет о некото- ром «абсолютном» или «объектив- ной» анализе с позиций некоторого третьего субъекта, который не имеет собственных целей и которому доступна любая инфор- мация. Итак, какие же здесь могут быть рекомендации? Предположим, что на прямом произведении, множеств X и Y функция f(x,y) имеет седловую точку (рис. 4.1). В этой точке имеет место очевидное равенство, которое и является определе- нием седловой точки: / Г = max min f (х, у) = min max f (х, у). (4.21) *<gX уеГ j/еГхеХ
§ 4, ДРУГИЕ ТИПЫ НЕОПРЕДЕЛЕННОСТЕЙ 61 Обозначим через (х*, у*) координаты седловой точки. Очевидно, что никому из субъектов не имеет смысла, не выгодно выбирать в качестве своей стратегии какую-либо другую точку, кроме х* или у*. Предположим, например, что субъект Б выбрал вместо стратегии у — у* другую, у — у'. Как видно из рисунка, мини- мальное значение целевой функции, которое он может себе обес- печить при разумном поведении партнера А (т. е. в том случае, когда последний выберет х = х*), будет а' > а. В этом смысле седло является точкой устойчивого выбора. Поскольку речь идет об экстремальных значениях глобального, а не локального ха- рактера, то ситуация сохраняется и в общем случае многих сед- ловых точек. , Предпрложим, например, что функция f(x,y) имеет две’сед- ловые точки (х*, у*) и (Л, У), в которых, как это следует из (4.21), ' f«/) = f(MW. . (4.22) Заметим, что свойством (4.22) не исчерпываются все заме- чательные свойства седловых точек. Оказывается, что седло- выми точками функции f(x,y) яв- . ляются не только точки (х*,у*) и (£,У), но. и две другие точки (х*,У) । • и (%, У*), и в этих точках значения функции удовлетворяют равенству У* ~--Н" I--- /«0 = Ш,/)=Г- ! : ! Докажем это, свойство. Пусть . л ___£1______1Д__. точки А и В являются седловыми | ] точками (рис. 4.2); их координаты | , [ обозначим (х*, у*) и (х, У) соответ- -l--------1--». ственно. Рассмотрим точку С с ко- 0 х х х ординатами (х*,$) (для точки D с ' Рис. 4.2. координатами (Д у*} все рассуж- дения аналогичны). Поскольку (Д У), (х*, у*) — седловые точки, то VxeX и Vt/e У f(x,^<HX,^)<f(Ajr), (4.23) f(x,/)<f(x*,/)<f(x*,^), (4.24) откуда с помощью (4.21), (4.22) получаем цепочку неравенств Г = НЛЮ</(Л0</(М) = Г.' Отсюда следует, что Кроме того, из (4.23) и (4.24) получаем, что Н<0) = Нх*,/)<Ж^)
52 ГЛ. I. МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ И Эти соотношения в совокупности и означают, что (х*, у) — сед-* ловая точка. Итак, если у нас есть две седловые точки (А и В), то мы сразу находим еще две седловые точки (С и D), и значения функции в этих точках равны между собой. Теперь становится понятной роль седловых точек в теор.ии антагонистических конфликтов. Если седловых точек несколько, То каждый ,из субъектов может использовать любую из страте- гий у* или Q, определяющих седловую точку. Любая из этих стратегий обеспечит субъекту Б одно и то же значение целевой функции, не меньшее f*. Если другой субъект выберет также одну из стратегий х* или Д то значение целевой функции будет /♦; точно такое же значение целевой функции обеспечит себе и субъект А. Таким образом, в-том случае, когда седловая точка суще- ствует, мы действительно можем говорить об оптимальном ре- шении с точки зрения обоих субъектов, и проблема принятии решения сводится только к определению максимина. Вот по- чему основные усилия в классической теории игр, изучающей антагонистические конфликты, в течение многих лет были на- правлены на изучение таких задач, которые сводились к иссле- дованию седловых точек (либо к такому видоизменению исход- ной постановки задачи, которое приводило бы в конечном итоге к анализу ситуаций равновесия, т. е. седловых точек). Исключительное значение ситуаций равновесия и антагони- стических конфликтах заставило, естественно, сделать попытку распространить понятие равновесия на общий случай многих субъектов. Предположим, что с системой ассоциировано W субъ- ектов, каждый из которых может делать выбор своей стратегии Xi е Xi и стремится сделать этот выбор так, чтобы максимизи- ровать свою целевую функцию fi. Но значения целевой функции в общем случае будут зависеть не только от его выбора, но и от выбора, который сделают другие субъекты, т. е. fi = fi(xi, х2, .... xz_i, хь Х(+ь .... хы). Будем называть точку (выбор) x — {xi, .... xN} ситуацией рав- новесия, если для любого i имеет место условие maxfi^i, tf2, • &i-\, Xi, &i+\, .... = %i, • • #N). *l (4.25) Точки равновесия естественно называть устойчивыми точ- ками, поскольку если субъект номера i отступит от своего рав-
§ 4. ДРУГИЕ ТИПЫ НЕОПРЕДЕЛЕННОСТЕЙ 63 новесного значения, т. е. выберет свою стратегию отличной от Xi, то'яри условии, что остальные субъекты сохранят свой выбор, проиграет прежде всего он сам, так как fi(Xi, .. •> Х/_ь Xi, X/+i, .. .,Ху) (Xj, ..., X/.Xjv). (4.26) На этом основании возник так называемый принцип устойчи- вости (или принцип Нэша, по имени его автора), который сво- дится к утверждению, что выбор рациональной стратегии дол- жен производиться среди множества точек равновесия, т. е. среди точек, удовлетворяющих условию (4.25) (или (4.26)). Посмотрим, в какой степени этот принцип универсален, в ка- кой мере его можно использовать для оценки качества альтер- натив. И так ли уж очевидно, что все множество альтернатив, не удовлетворяющих. принципу Нэша, следует исключать из анализа? Прежде всего заметим, что при' существовании не- скольких субъектов, каждый из которых стремится к достиже- нию собственных целей, не совпадающих с целями других субъектов, речь всегда идет о некотором компромиссе: когда принимаются коллективные решения, каждый из субъектов дол- жен в той или иной мере поступиться частью-своих интересов. Поэтому условие устойчивости — очень важное свойство компро- мисса. . - Если все субъекты смогли условиться о том, чтобы придер- живаться выбора xi = Л/, то тот субъект, который- нарушает до- говоренность, прежде всего и пострадает: устойчивость — это известная гарантия против нарушения договоренности. Заметим, именно договоренности, т. е. коллективного решения. В этом и состоит принципиальное отличие общего случая от случая ан- тагонистического конфликта-при наличии седловой точки, кото- рый мы только что рассмотрели и где само понятие компромис- са не имеет смысла. В самом деле, в случае антагонистического конфликта двух лиц никакой договоренности для выбора оптимальной стратегии не требуется, так как иного рационального способа поведения, кроме того, чтобы принять равновесную стратегию (если она существует), нет. Совершенно иначе обстоит дело в случае многих субъектов. Рассмотрим известный пример, принадлежащий Ю. Б. Гермейе- ру. Пусть целевые функции субъектов имеют вид f/(xi, ..., xN) = xl + -xt), - (4.27) причем на «действия» субъектов — скалярные величины х,— наложены ограничения Оi=l, N. (4.28}
V S4 ГЛ. I. МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИИ Точкой равновесия будет, очевидно, *<=!, /=1, 2, ..., N, (4.29) и в этой точке значение .... = ft — 1. Это будет устой- чивая точка. В самом деле, если все субъекты, кроме субъекта номера I, будут придерживаться стратегии (4.29), а субъект но- мера i примет стратегию xt = 1 — б (в силу условия (4.28) .субъект номера i может только умень- шить величину Xi по сравнению с ее равновесным значением), то значение ,его целевой функции будет удовлетворять условию fz=l-6<L т. е. будет меньше того значения, которое ему обеспечил бы вы- бор равновесной стратегии х;=г=Д = 1. Но равновесная страте- гия в этом случае вовсе не является оптимальной. Существует бесчисленное множество стратегий, которые будут обеспечивать значения целевых функций, большие равновесного, причем всем субъектам одновременно. Полагая, например, Xi = 0, мы най- дем, что при таком выборе > . = 1 при tf>2. Но точка х,==0, i = 1, 2, ..., N, очевидно, не будет устой- чивой. В самом деле, предположим, что все субъекты, кроме субъекта номера t, придерживаются стратегии х/ = 0, а субъект номера i примет стратегию xi = l. Тогда значение его целевой функции ft будет равно N, а не N— 1. Что же касается осталь- ных субъектов, то отступление субъекта номера I от «эффек- тивной стратегии» xi = 0 приведет к уменьшению значений их целевых функций. В этом случае их «доход» будет равен , f,= W-2, Подведем некоторые итоги. Устойчивость выбора — это очень важное свойство альтернативы в том случае, когда имеет место взаимодействие многих субъектов (АГ>2). Но устойчивый вы- бор может не принадлежать к числу эффективных, т. е. к мно- жеству Парето. Поэтому, если решение принимается независимо всеми партнерами (субъектами), то трудно рассчитывать, чтобы они сделали устойчивый выбор. Таким образом, принцип устойчивости (принцип Нэша) вряд ли может считаться принципом выбора альтернативы. Иное дело, если речь идет о коллективном решении, когда оно при- нимается по договоренности всеми субъектами одновременно.
§ 5. ЗАКЛЮЧИТЕЛЬНЫЙ КОММЕНТАРИИ 55 Но и в этом случае остается" всегда элемент сомнения: не выбе- рет ли часть субъектов, по договоренности внутри этой группы, иную стратегию (например, одну из стратегий, принадлежащих множеству Парето)? Тогда эта группа добьется ббльших ре- зультатов по сравнению с остальными. По существу, единственный случай, при котором условие устойчивости может рассматриваться как принцип отбраковки неконкурентоспособных вариантов, — это случай, в котором устойчивые точки являются одновременно точками множества Парето. Такие системы встречаются очень редко, но, несмотря на это, имеют (как мы увидим) весьма большое практическое значение. Гораздо чаще мы сталкиваемся с ситуациями, в кото- рых эффективные альтернативы являются неустойчивыми, а устойчивые —не эффективными. Случаи, когда устойчивые точ- ки являются одновременно паретовскими, всегда отвечают ка- ким-либо важным практическим задачам. Поэтому одним из важных направлений теории исследования операций является изучение систем, в которых устойчивые точки принадлежат мно- жеству Парето. § 5. Заключительный комментарий Мы привели весьма беглый обзор некоторых проблей, входя- щих в исследование операций. Основное содержание этой дис- циплины схематично можно представить в следующем виде: 1) математическое описание-г создание модели операции; 2) анализ неопределенностей и формализация понятия цели (формирование целевой функции, критерия); '3) решение возникших оптимизационных и других математи- ческих зад&ч. Эта схема достаточно условна, ибо указанные разделы тесно переплетаются в процессе исследования конкретной операции. Построение модели операции, а с него начинается любое исследование, требует глубокого понимания специфики процесса и тех возможностей математического анализа, которыми распо- лагает исследователь операции. .На этом этапе речь идет о «фи- зике»- процесса. Мы еще не говорим о цели исследования, но она уже неявно присутствует: модели экономического процесса, предназначенные для выбора альтернатив развития энергетики региона или развития систем орошения того же региона, будут разными, хотя развитие энергетики нельзя отделить от развития сельскохозяйственного или какого-либо ’ другого производства. Но уровень детализации отдельных блоков будет совершенно иным. В модели, описывающей экономическое развитие региона, предназначенной для выбора альтернатив развития энерге- тики, сельское хозяйство, например, будет описано в очень
56 гл. I. МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИИ агрегированных (интегральных) показателях, но зато все осо- бенности производства энергии будут описаны со многими де- талями. В модели региона,, предназначенной для анализа разви- тия систем орошения, наоборот, сельскохозяйственное производ- ство должно быть описано очень детализированно, но зато энергетика будет входить в модель только своими агрегиро- ванными показателями. Таким образом, предназначение модели накладывает определенный отпечаток на исходные позиции ее формирования. Важный элемент исследования — изучение той информации, которая оказалась в руках исследователя. Он должен решить, в какой, степени эта информация соответствует построенной мо- дели и, может быть, видоизменить тем или иным образом мо- дель (например, ввести некоторые новые характеристики и т. п.). Примечание. Достаточно распространенной является точка зрения, что именно используемая информация является определяющим фактором при создании модели. Я категорический противник подобных взглядов. «Тради- ционная» информация, которую используют экономисты, проектировщики, формировалась на основании потребностей «традиционной» технологий анали- за, не учитывающей возможностей вычислительной техники. Поэтому этап изучения информации обычно должен завершаться формированием новых тре- бований к информации. Вместе с тем исследователь должен всегда оставаться на позициях реализма и излишняя требовательность к информации может быть только вредной. Еще один аспект в проблеме, изучения соответствия модели и информации связан с тем^ что последняя в силу обстоя- тельств, которые вне нашей компетенции, может быть неточной или недостаточно точной. В этих условиях чрезмерная детали- зация модели (стремление добиться «предельной адекватности» модели реальному процессу) будет не только ненужной, но и просто вредной. ' Следующая группа проблем —это формирование критерия и гипотез, преодолевающих неопределенность. Надо начинать с перечисления критериев (показателей}, предельных возможно- стей. Существенным элементом является изучение множества Парето для наиболее «важных» критериев. В конечном счете мы все равно придем к некоторой свёртке критериев. Поскольку возможны различные варианты свертки, то необходим их анализ и сравнение результатов. Безусловно, должны быть отброшены все те критериальные функции, у которых существует ярко вы- раженный «острый» максимум. Реальные конструкции, их свойства должны быть устойчи- выми относительно малых изменений характеристик проекта, ибо реализация проекта будет происходить с неизбежными откло- нениями от расчетного оптимального варианта, и эти отклонения .не должны существенным образом сказываться на качестве кон- струкции. Другими словами, совершенно неприемлема ситуация,
§ 5. ЗАКЛЮЧИТЕЛЬНЫЙ КОММЕНТАРИЙ 57 изображенная на рис. 5.1,6; следует всегда стремиться работать с критерием, зависимость которого, от конструктивных парамет- ров имеет вид, изображенный на рис. 5.1, а. Очень важное место в анализе занимают оценки гарантиро- ванного результата (минимаксной стратегии). Расчет мини- максной стратегии —это краеугольный камень исследования лю- бой операции, единственный объективный результат анализа, который не зависит от гипотез информированности. Примечание. Вокуг этого тезиса sвсегда возникали дискуссии, и лиц, стоящих на этой точке зрения, многие считали принципиальными против- никами любого риска. Я думаю, что подобное суждение появилось как ре- зультат известного недопонимания подобной позиции. В самом деде, использо- вание гарантированных стратегий никак не противоречит стратегиям риска. Стремление к риску присуще человеческой природе. Но что такое риск? Это, прежде всего, Система гипотез о внешней обстановке или действиях другого субъекта. Приняв эту новую систему гипотез, описывающих ситуацию риска, т. е. сузив тем или иным образом множество возможных стратегий, мь| можем в новых условиях снова сформулировать минимаксную стратегию и оценить гарантированный результат. Все сказанное выше относится к «нематематической» части исследования операций. Но, как бы ни важна была интуиция и логика обычного «здравого смысла», на этапах формирования модели и критерия огромную роль играет математический ана- лиз: определение предельных оценок,/структуры множества Па- рето и многие другие вспомогательные задачи исследования лю- бой операции. Это — непрерывный, последовательный диалог с природой, цепочка математических экспериментов. В системном анализе и исследовании операций именно математические экс- перименты заменяют исследователю физический, натурный или модельный эксперимент. Среди используемых математических методов особую роль играют методы решения оптимизационных задач. Они состав- ляют фундамент системы математического обеспечения проблем принятия решений. Сегодня эти методы — линейного, нелиней- ного, динамического, стохастического программирования, раз- личные методы дискретной оптимизации — получили достаточно
58 ГЛ. I. МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИИ глубокое развитие. Им посвящена огромная литература, они вошли в программу всех тех высших учебных заведений, кото- рые готовят специалистов по прикладной математике, экономи- ке, автоматизации проектирования и т. д. Более того, во всех развитых странах сейчас созданы или создаются пакеты про- грамм, реализующих те или другие методы оптимизации. Эти - пакеты снабжены обычно специальной управляющей програм- мой (операционной системой), которая позволяет использовать их в режиме диалога и делает доступной эксплуатацию систем оптимизации для специалистов, которые не являются профес- сионалами в области прикладной математики. Оптимизационные задачи исследования операций обладают, как правило, одной важной особенностью, которую всегда дол- жен, иметь в виду исследователь операции. Мы уже отмечали, что критерии должны быть устойчивыми по отношению к ошиб- кам практической реализации рыбранных параметров. Другими словами, в разумно поставленных оптимизационных задачах ис- следования операций типичной является ситуация, когда не тре- буется высокой точности при отыскании оптимальных значений параметров. Из приведенных рассуждений следует вывод, весьма важный для практической реализации схемы анализа операция. Имея в своем распоряжении детализированную, хорошо обоснованную - модель, т. е. записанную на языке математики систему ограни- чений и связей между ее'элементам и, и построив критерий f(x), не следует сразу пытаться решать задачу отыскания его экстре- мумов f(x)-> max. (5.1) хе Q Эта задача может оказаться очень трудной и требующей боль- шой затраты машинного времени. А так как в процессе выбора параметров подобную операцию отыскания экстремумов прихо- дится проводить многократно, то трудоемкость решения зада- чи (5.1) может оказаться решающим фактором всего исследо- вания. Поэтому имеет смысл, наряду с исходной моделью, построить некоторую близкую модель, в которой будут упрощены по срав- нению с (5.1) система ограничений и критерий. Другими сло- вами, предлагается, наряду с задачей (5.1), рассматривать не- которую другую, «близкую» задачу: ф(х)->тах. ' (5.2) X Я Эта задача может оказаться на много порядков проще задачи (5.1), а оптимальные значения показателей системы будут при этом почти совпадать. Обозначим через л* решение задачи
5 S. ЗАКЛЮЧИТЕЛЬНЫЙ КОММЕНТАРИЙ 59 (5.1), а чё^ез к — решение задачи (5.2). Если упрощенная мо- дель достаточно хороша, то значение f(x*) почти не будет отли- чаться бт значения /(х). .Построение упрощенных моделей играет важную роль в ис- следовании сложных операций. В процессе выбора параметров обычно приходится многократно возвращаться к оптимизацион- ным, задачам типа (5.1). Значит, для успеха исследования не- обходимо, чтобы операция оптимизации была достаточно «быст- рой», достаточно экономной. Таким образом, речь идет о двух классах моделей и, соот- ветственно, о двух классах алгоритмов: быстрых и поверочных. С помощью быстрых алгоритмов на упрощенных моделях мы выбираем основные параметры будущей конструкции, прини- маем основные проектные решения. Можно сказать, что с по- мощью быстрых алгоритмов мы делаем эскиз операцию фор- мируем облик (создаем аванпроект) будущей конструкции или строим генеральную схему будущего проекта. Затем с помощью более полной модели, адекватность которой не вызывает сомне-- ний, мы проверяем ход операции, количественные показатели конструкции. Если необходимо, мы с помощью полной модели проводим уточняющую коррекцию принятых решений. К сожа- лению, какой-либо универсальной процедуры упрощения моде- лей не существует. Некоторые соображения на этот счет будут изложены в главах IV—VI. Но в большинстве случаев упроще- ние модели основывается на здравом смысле. Проблема математического обоснования возможности заме-, ны полной модели моделью упрощенной, использования быст- рых алгоритмов всегда бывает трудной. А иногда такое обосно- вание даже и провести невозможно, в особенности если упро- щение связано с понижением порядка системы. Но идея двухэтапности (а в более сложных системах и многоэтапное™) процесса принятия решения, идея построения и использования быстрых алгоритмов и сочетания расчетов, проведенных с их по- мощью, с поверочными расчетами на полной модели является одной из центральных в системном анализе. Ее обсуждение пройдет красной нитью через всю книгу, а некоторые главы бу- дут. целиком посвящены именно этой проблеме и способам по- строения быстрых алгоритмов. Если в рамках исследования оптаций возникли основные методологические и методические принципы системного анали- за, то аппаратом исследования динамических задач системный анализ обязан прежде всего теории управления, которой будет посвящена следующая глава.
Г л a-в a II ' УПРАВЛЯЕМЫЕ СИСТЕМЫ § 1. Предварительные замечания Теория управления, • так же как и исследование операций, была одним из источников идей и методов, на базе которых возник современный системный анализ. Она явилась первой научной дисциплиной, целиком направленной на развитие ме- тодов принятия решений. Исследование операций и теория управления — дисциплины очень родственные между собой. Бо- . лее того, принятое ныне определение операции является столь общим, что любая задача теории управления может быть из- ложена на языке теории исследования операций. Формально теория управления—дисциплина с чрезвычайно . широким спектром собственных проблем — может быть включе- на в исследование операций. Но такое обобщение вряд ли це- лесообразно. Традиционно предмет изучения теории исследования опера- ций— это задачи статики и, в крайнем случае, многошаговые задачи принятия решений. Что же касается теории управления, то она сразу же была ориентирована на задачи динамики. Кро- ме того, в рамках теории управления столь много оригинальных и важных для приложений идей, что нерационально отождеств- лять обе дисциплины или включать одну в другую. Обратная связь, программное движение, механизм управления, оптималь- ное управление^— всеми этими понятиями мы обязаны прежде всего теории управления. Наконец, идею программного мето- да — метода, который становится сегодня методической основой научного управления общественными процессами, мы, как будет показано ниже, также можем увидеть в теории управления. Разделение процесса управления на управлёние программным движением и последующую коррекцию с помощью механизмов управления, которое является одним из краеугольных представ- лений программного метода и лежит в основе синтеза больших управляемых систем, также появилось в теории управления. Зарождение теории управления (или теории регулирования, как она называлась в течение первых ста лет своего существо- вания) обычно принято датировать сороковыми годами XIX века,
§ 1. ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ в) когда в двух разных странах независимо друг'от друга появи- лись две работы, посвященные одной и той же проблеме — про- блеме выбора параметров регулятора Уатта. Автором одной из них был английский физик Д. К. Максвелл, а другой — наш со- отечественник, инженер И. А. Вышнеградский. Обе эти работы были посвящены одной из актуальнейших технических проблем своего времени — созданию научных основ регулирования хода паровой машины: принципов, позволяющих обеспечить постоян- ство оборотов вала при изменяющейся внешней нагрузке. Актуальность проблематики, безупречная логика анализа и ясность окончательных результатов надолго определили основную тематику и методы исследования возникающей дис- циплины. В XIX веке проблемам теории регулирования посвящали свои исследования многие выдающиеся представители инженер- ной и естественнонаучной мысли: А. Стодолла в Австро-Венгрии, Э. Раус в Англии, Н. Е. Жуковский в России. Большое влияние на развитие идей и методов теории регулирования оказало по- явление • общей теории устойчивости и, прежде всего, теории устойчивости А. М. Ляпунова, язык которой в течение долгого времени был основным языком теории управления. Покажем, как связана задача теории регулирования с основ- ными проблемами теории устойчивости. Предположим, что речь идет об ^управлении, т. е. о целенаправленном изменении како- го-либо физического процесса, и влиять на течение этого фи- зического* процесса мы можем путем изменения тех или иных конструктивных параметров Пусть для определенности речь идет о проектировании конструкции автопилота — прибора, ко- торый может многократно изменять положение рулей и тем са- мым изменять характер полета самолета. Пилоту задается цель (например, место и время прибытия). Йо этой цели рассчиты- вается курс.. Пилот выводит самолет на расчетный курс и включает автомат. Движение самолета будет описываться не- которой системой дифференциальных уравнений x = (1.1) Здесь х вектор, описывающий фазовое состояние системы, т. е. координаты и скорость самолета, £ — случайный вектор’ характеризующий внешние воздействия, р — вектор конструк- тивных параметров автопилота, которые могут выбираться субъ- ектом, ответственным за то, чтобы автопилот обеспечивал до- стижение цели управления (в данном случае конструктором), бпя НаЯ РасчетнУю траекторию самолета, мы всегда можем вы- ппи птначало отсчета таким образом, чтобы этой -траектории и сутствии внешних возмущений отвечали нулевые значения
62 ГЛ. И. УПРАВЛЯЕМЫЕ СИСТЕМЫ фазовых переменных. Значит, точка х — 0 должна удовлетво- рять уравнению 7(0, t, р, 0)®0. (1.2) Предположим, далее, что "в некоторый момент / = /0.на дви- жение самолета, подействовало некоторое случайное возмущение (например, порыв ветра), в результате которого состояние си- стемы изменилось: х(/0) = х0#=О. (1.3) Каким условиям должно удовлетворять движение самолета, чтобы, несмотря на отклонение (1.3), он достиг заданной цели? Прежде всего, очевидно, что значения компонент вектор-функ- ции x(t), характеризующих положение самолета по отношению к расчетной траектории, не могут увеличиваться (по абсолют- ной величине). Так как траектория самолета должна пройти через цель управления, то необходимо, чтобы возникшее вслед- ствие каких-то причин отклонение параметрон полета самолета от расчетных значений со временем могло исчезнуть. Опыт по- казывает, что для обеспечения этих особенностей полета само- лета достаточно, чтобы движение самолета обладало асимпто- тической устойчивостью. Последнее означает, что должно вы- полняться условие limx(/) = 0. (1.4) /“>00 Примечание. Условие (1.4) не является строго необходимым или строго достаточным. В самом деле, достижение цели управления должно про- изойти за конечное время Г. В то же время условие (1.4) описывает асимрто- тические свойства движения при t -> оо Возможность такой замены конеч- ного отрезка времени бесконечным означает только од^о — характерное время полета самолета является «практически» бесконечно большим: оно гораздо больше времени, необходимого для компенсации возмущения (характерного времени затухания колебаний самолета). Таким образом, хотя возможность использования условия (1.4) является опытным фактом, она, как мы увидим ниже, открывает разнообразные пути количественного анализа. Замена боль- шого, но конечного отрезка времени бесконечным является широко распро- страненным приемом: исследование на бесконечном интервале времени иногда оказывается более простым, чем исследование поведения функций на конечном интервале. Проблема исследования устойчивости тривиального решения (х = 0) системьГ (1.1)—это и есть основная задача теории устойчивости, одной из важнейших глав теорий дифференциаль- ных уравнений. Но задача проектирования автопилота, обеспе- чивающего асимптотическую устойчивость движения самолета, не сводится только к задаче теории устойчивости. Как правило,, нам недостаточно выяснить, устойчив ли полет самолета с дан- ным автопилотом. Более того, нам приходится обычно опреде- лять допустимые интервалы изменения параметров автопилота
§ I. ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ 63 (компонейт вектора р), обеспечивающие устойчивость, т. е. ре- шать задачу, в некотором смысле обратную. Поскольку отклонения от расчетной траектории — величины xi(t) —должны быть малыми, то естественно использовать для решения рассматриваемой задачи идеи линеаризации, т. е. за-, менить уравнение (1.1) линейным. Отбрасывая члены порядка О(х2), получим х = Ах, (1.5) где А — матрица (^')х_0 Uo- Уравнение (1.5)—однородное (в силу условия (1.2)), и задача исследования свойств решений уравнения (1.5) уже гораздо проще исходной. В первый период своего развития теория регулирования изу- чала проблемы регулирования стационарных движений: поддер- жания постоянных оборотов машины, обеспечения равномерного прямолинейного полета самолета на заданной постоянной высоте и т. д. В случае стационарных движений правая часть уравне- ния (1.1) не содержит времени, а . элементы матрицы А по- стоянны. При этом проблема асимпотической-устойчивости сво- дится к чисто алгебраической задаче: найти условия, которым должны удовлетворять коэффициенты характеристического уравнения |А — ЛЕ|=0, чтобы все его корни имели отрица- тельные действительные части. Эта проблема носит название проблемы Рауса — Гурвица; ее исследование положило начало теории автоматического регулирования*). Необходимые условия асимптотической устойчивости триви- ального решения уравнения (1.5) можно получить многими спо- собами. Умножим, например, скалярно обе части уравнения (1.5) на вектор х, тогда это уравнение можно переписать в виде х) = 2(х, Ах), (1.6) где {’, •) —скалярное произведение. Если квадратичная форма (х, Ах) — £ atM, и dfl I где az/ = —о q—элементы матрицы А, положительно определена, т. е. для любого х О (х, Ах) > 0, то скалярное роизведение (х, х) растет и тривиальное решение не может ть асимптотически устойчивым. Поэтому в качестве условий ческого^«пл^Я РаУс,а — Гурвица изложены в любом курсе теории автомати- . »ото управления (см., напримёр, [12]).
64 ГЛ. II. УПРАВЛЯЕМЫЕ СИСТЕМЫ устойчивости часто' используют условия отрицательной опреде- ленности квадратичной формы (х,Ах). На основании критерия Сильвестра эти условия можно записать в следующем виде: ап < О, Яц «12 «21 >о, «и «12 ... <hn >0. (1.7) аП\ аП2 . • • аПП Поскольку значения ац зависят от конструктивных параметров регулятора, т. е. от компонент вектора р, то условия (1.7) можно рассматривать в качестве условий, определяющих выбор век- - тора р. Условия устойчивости можно представить различным обра- зом, и вопрос об их выборе носит субъективный характер. Именно соображения удобства, наглядности побуждали инже- неров искать все новые и новые формы представления условий устойчивости. Критерии Михайлова, Найквиста и многие дру- гие широко используются в инженерной практике. Условия устойчивости, записанные в той или иной форме, определяют в пространстве параметров некоторое множество G\. Выбор р s Gi гарантирует выполнение условия устойчивости (1.4), что, в свою очередь, гарантирует достижение цели управ- ления. Но условие устойчивости — не единственное, которому должны удовлетворять параметры регулятора. В основе полу- чения этого условия всегда лежит конкретная конструкторская схема — некоторая структура. Так, в работах Максвелла и Выш- неградского изучались вопросы устойчивости поддержания за- данного числа оборотов двигателя с помощью вполне конкрет- ного устройства — регулятора Уатта. Значит, изучая способы управления, некоторым процессом, мы должцы всегда решать сразу две задачи: выбор у принципиальной схемы регулятора (автопилота или какого-либо другого механизма) и затем выбор его параметров, обеспечивающих достижение целей управления. Первая задача- всегда носит характер изобретательства. Хотя существует целый ряд исследований, в процессе которых были выработаны разнообразные рекомендации о выборе структуры механизмов управления, тем не менее, в конечном итоге, вопрос о конструктивной схеме механизма остается вопросом конструк- торским, а оценка совершенства этой конструкции не сводится только к той характеристике, которая нас сейчас интересует. Простота, технологичность, надежность — не менее важные по- казатели. Таким образом, конструктивная схема накладывает на выбор параметров р вполне определенные ограничения: P^G2, (1.8) причем чаще всего условие (1.8) имеет вид (1.9)
§ t. ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ 65 где р1 — i-я координата вектора р. Значит для достижения цели управления, т. е. выполнения условий (1.4), необходимо, чтобы ре G = G!nG2. (1.10) Может оказаться, что множество G пурто. Это будет озна- чать, что выбранная конструкция регулятора (система управле- ния) не может обеспечить достижение цели управления — она должна быть заменена другой. Заметим, что по своей постановке описанная проблема вы- бора значений конструктивных параметров родственна задачам исследования операций, которые мы рассматривали в предыду- щей главе, и, более того, она может быть сформулирована на языке исследования операций. В самом деле, в этой задаче есть цель управления, которая может быть представлена в форме условия (1.4), система ограничений (1.1) и ресурс, необходимый для достижения цели, — возможность выбора параметров регу- лятора, удовлетворяющих ограничениям вида (1.8). Критерий достижения цели управления (1.4) может быть сформулирован и в терминах оптимизации. Для этого доста- точно ввести новый критерий, например: . fl, если limx(/) = 0, * I tоо ^(р) । о, если iimx(/)^=0, НЛО к /->О0 или, в эквивалентной форме (см. (1.10)), {1, если peG, 0. если р*О. О-11'’ Теперь условие (1.8) или (1.10) можно представить в виде J(p)->max, (1.12) и любое решение оптимизационной задачи (1.12)'является ре- шением исходной задачи. Переформулировка задачи, в терми- нах оптимизации, конечно, не меняет ее природу. Она показы- вает лишь генетическую близость задач исследования операций ' и задач теории управления. Условия (1.4) и (1.12) не выделяют единственного решения вадачи. По существу, они определяют целое множество пара- метров G — целый класс допустимых конструкций, обеспечи- вающих достижение цели управления. Поэтому в распоряжении инструктора еще остается возможность уточнения вектора р, виям°ЖН0СТЬ подчинить его каким-либо дополнительным усло- на м’ Что эквивалентно дополнительной оптимизации, но уже не ножестве G21 а на множестве G. ® Н. Н. Моисеев
ГЛ. И. УПРАВЛЯЕМЫЕ СИСТЕМЫ 06 Еще в предвоенные годы начали появляться работы, посвя- щенные исследойанию качества управления, т. е. выбора на множестве устойчивых управлений такого управления, которое удовлетворяло бы некоторым дополнительным требованиям. При создании автопилота, управляющего полетом пассажирского са- молета, таким дополнительным требованием могло быть требо- вание минимизации перегрузок: пассажиру важна не только устойчивость полета, обеспечивающая достижение цели, но и определенный комфорт. Если достижение цели возможно мно- гими способами, то появляется возможность обеспечить этот комфорт. Таким образом, задачу оценки качества регулирования можно сформулировать следующим образом: на множестве па- раметров р, удовлетворяющих условию р е G, найти такие значения р, которые обеспечивают выполнение условия Цр)-> min, ' (1.13) где Цр) —некоторый функционал, зависящий от траектории и характеризующий, например, допустимую величину перегрузки. Вообще, вопрос об оценке качества регулирования не так прост. Обозначим через w вектор ускорений, через Т — время полета самолета. Тогда имеет смысл рассмотреть целый ряд критериев, каждый из которых так или иначе оценивает перегрузку, т. е. комфорт пассажира, например: h(p)— max |w|, (1-14) t ® [0. T] T I2(p)=*\\w\dt, (1.15) 9 Г Zs(p) = J(w, w)dt. (1.16) 0 Качество комфорта пассажира и перегрузка связаны далеко не однозначной зависимостью, и вряд ли ее можно охарактери- зовать каким-нибудь одним числом. Критерий (1.14) —это ло-'* „ кальная характеристика, и, конечно, желательно, чтобы в про- цессе полета система управления «срезала» пиковые перегрузки. Но не менее желательно и уменьшение интегральных оценок перегрузок, которые описываются критериями (1.15). или (1.16). Таким образом, оценка качества управления — это типичная многокритериальная проблема, и при ее исследовании мы стал- киваемся со всем тем спектром неопределенностей, о котором шла речь в предыдущей главе.
_ -ft. ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ 67 В технических журналах довоенных лет можно найти целый ояД статей, посвященных обсуждению критериев качества управ- ления. Чаще всего исследовались задачи с критерием (1.16). Но я думаю, что основные аргументы для подобного выбора лежали вне сферы содержательного анализа: критерии (1.14) и (1.15) приводили к столь трудным задачам, что не было никаких на- дежд найти их аналитические решения. Таким образом, уже в тридцатые годы в теории регулирования возникали задачи, ко- торые по своей постановке были совершенно аналогичны совре- менным задачам исследования операций, хотя авторы, изучав- шие подобные задачи, были очень далеки от современных взгля- дов на их содержание. В последние годы войны и первые послевоенные годы про- изошло качественное расширение проблем, которыми занима- лась теория регулирования, расширение, которое постепенно привело к тому, что традиционный перечень ее задач оказался отодвинутым на второй план. В результате этого процесса по- степенно практически исчез и сам термин «теория регулирова- ния», и вместо него стали использовать термин «теория управ- ления». " Такое расширение круга изучаемых задач было связано прежде всего с нуждами возникшей ракетной техники. До войны теория регулирования изучала, как- правило, процессы, разви- вающиеся на большом интервале времени. Именно поэтому ме- тоды классической теории устойчивости, оперирующей с асимп- тотическими свойствами решений (при j->oo), оказались удоб- ными при исследовании реальных задач: время полета самолета было на много порядков больше времени компенсации его от- дельных колебательных движений. В теории регулирования даже возник термин «переходной процесс» — процесс возвраще- ния системы к исходному стационарному режиму после окон- чания действия случайного возмущающего фактора. Оперируя преимущественно со стационарными режимами; теория 'регулирования изучала переходные процессы главным образом в связи с изучением качества управления. Потребности же ракетной техники привели к совершенно иным задачам, по- скольку движение ракеты было, как правило, кратковременным и могло рассматриваться как единый переходной процесс. Но было и еще одно обстоятельство, которое потребовало новых постановок задач, — это стоимость горючего, необходимого для движения ракеты. Отношение затрат топлива, необходимого для доставки полезного груза, к количеству этого груза обычно етоль велико, что проблема расчета траектории, обеспечиваю- щей достижение цели управления с минимальными затратами самЛИВа’-САелаЛаСЬ УЖе в сеРадинв СОРОКОВЫХ годов одной из ЫХ актуальных задач математической теории движения 3*
68 ГЛ. II. УПРАВЛЯЕМЫЕ СИСТЕМЫ ракет. К этой проблеме было привлечено внимание большого количества математиков и инженеров. И в результате многолет- них усилий в настоящее время возникла новая научная дисцип- лина— теория оптимального управления (см. [8, 10, 11]). Среди работ, посвященных этой проблеме, необходимо выделить работу Д. Е. Охоцимского [59], в которой уже содержалась, е точ- ностью до терминологии, современная постановка задач теории оптимального управления. Задачи, возникшие в теории летательных аппаратов, снаб- женных ракетными двигателями, значительно отличались от традиционных задач теории регулирования. Как мы уже гово- рили, в сороковых годах усилия специалистов были главным образом направлены на изучение способов управления стацио- нарными движениями на бесконечном интервале времени. Что же касается задач динамики ракет, то это, прежде всего, су* щественно нестационарные задачи. Кроме того,- время протека- ния процесса управления часто бывает очень малым. Например, время горения порохового заряда наших первых боевых ракет исчислялось секундами или долями секунд, и в течение этих секунд развивался весь процесс управления. Естественно, что все традиционные постановки задач теории регулирования никак не соответствовали новой реальности. Требовалась кардинальная перестройка самого мышления специалистов, их переориентация на совершенно новые задачи. В силу этих обстоятельств про- блема динамики управляемого полета ракет в течение довольно продолжительного времени развивалась вне теории регулирова- ния. Слияние этого направления с теорией регулирования, ко- торое и привело к созданию теории управления, произошло уже позднее — в пятидесятые годы. ‘ В теории регулирования вопрос об отыскании программного управляемого движения обычно не возникал. Это движение либо было известно заранее (например, задавалось количество оборотов турбины в секунду), либо определение его было три- виальным (например, расчет параметров полета самолета на заданной высоте). В теории регулирования решалась, как мы видели, другая задача — построение оператора обратной связи, обеспечивающего заданный режим (заданное программное дви- жение). Конечно, обе эти задачи — определения программного движения и управления этим движением — тесно связаны между собой (и эту связь мы будем подробно обсуждать). Но до поры до времени теоретические основы решения обеих задач развива- лись независимо друг от друга. Расчет программных траекторий превратился в большое и развитое направление складывающей- ся теории управления. Такие задачи носили, как правило, ва- риационный характер. Упомянутая работа Д. Е. Охоцимского открыла эго направление. Несколько позднее в СССР, а затем
§ 1. ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ 69 и в США начали появляться фундаментальные исследования, посвященные этим проблемам. Работы Т. М. Энеева, Л. И. Шат- ровского в СССР, Блекуэлла, Брайсона, Лейтмана в США и многие другие составили основу нового направления. В конце сороковых и начале пятидесятых годов и в класси- ческой теории регулирования начинают возникать вариационные постановки задач. Это были прежде всего задачи на быстродей- ствие. Возникновение нового направления в теории регулирова- ния обычно связывают с именем А. А. Фельдбаума, опублико- вавшего в начале пятидесятых годов большую серию статей, посвященных проблемам быстродействия. Вариационные задачи, которые возникли в динамике ракет и теории регулирования, обладали одной важной особенностью, которая не позволяла сводить их к классическим задачам ва- риационного исчисления и применять затем развитые методы математического анализа. Как известно, классические задачи вариационного исчисления легко сформулировать в терминах теории управления. Трудность была в другом. Вариационное исчисление, если использовать язык теории управления, опери- ровало с управляющими функциями «(/), на которые либо не накладывалось никаких ограничений, либо их допустимые мно- • жества были открытыми. В ракетодинамике же и теории регу- лирования возникала качественно новая проблема: управления »(/), как правило, должны были принадлежать замкнутым мно- жествам, что отражало естественные технические требования. Так, тяга двигателя принципиально ограничена: р(0<Рп>ах V/. (1.17) Точно так же угол поворота руля и пределы изменения других управляющих органов всегда удовлетворяют условиям типа (1.17). Эта .особенность исключала возможность непосредствен- ного использования хорошо развитых методов вариационного исчисления и требовала создания некоторого специального ап- парата. Несмотря на то, что к началу пятидесятых годов целый ряд конкретных задач такого типа был уже решен, еще не был выработан единообразный подход к их анализу. Для каждой задачи, по существу, развивался собственный метод. Тем не ме- нее вполне уместно говорить о том, что уже в начале пятидеся- тых годов стала возникать новая теория, которая позднее полу- чила название теории оптимального управления. Этой теории суждено было сделаться той основой, благодаря которой воз- никла современная теория управления техническими системами, идеи и методы которой во многом определяли направление развития,системного анализа. . Выдающуюся роль в развитии теории оптимального управ^| ления сыграл Л. С. Понтрягин, который сформулировал прин-1
70 ГЛ. П. УПРАВЛЯЕМЫЕ СИСТЕМЫ цип максимума, позволяющий с помощью множителей Лагран- жа свести задачу оптимального управления к некоторой спе- циальной краевой задаче для системы обыкновенных диффе- . ренциальных уравнений (см. книгу [И]). После работ Л. С. Понтрягина и его школы в теории управ- ления произошла определенная канонизация языка и методов, и благодаря этим работам окончательно оформилась современ- ная теория управления. На базе общего языка и общего фор- мализма произошло’объединение теории регулирования с дру- гими направлениями, которые занимались изучением задач управления. В настоящее время идеи оптимизации и методы теории опти- мального управления глубоко проникли во'все исследования прикладного характера, в конструкторские разработки и оказа- ли определяющее влияние на развитие системного анализа. § 2. Понятие управляемых систем В предыдущем параграфе был дан краткий обзор истории возникновения и эволюции основных, идей теории управления. - Теперь конкретизируем некоторые понятия, которыми мы уже . пользовались, и придадим им тот смысл, который будет необ- ходим для дальнейшего изложения. Управляемые системы будут трактоваться как естественное развитие динамических систем, свойства которых считаются известными из теории дифферен- циальных уравнений. а) Управления. Мы ограничимся рассмотрением систем, которые описываются обыкновенными дифференциальными уравнениями * = /(*,«,/,£). ’ (2.1) Здесь x — n-мерный фазовый вектор, g —A-мерный (k < я), век- тор возмущений (внешних воздействий), который может быть случайным (тогда он задан своим статистическим описанием) либо неопределенным (характеризующим недостаточность на- ших знаний об изучаемом явлении). В обоих случаях вектор В(0 задается своей принадлежностью, к некоторому множеству! UOeGlW Vt (2.2) Вектор-функция u(t) размерности т^п носит название управ- ления или управляющего вектора. Это «свободная» вектор-функ- ция, находящаяся в нашем распоряжении; считается, что с си- стемой ассоциирован некоторый субъект, способный и имеющий право принимать решения, т..е. выбирать управляющую функ- цию, которая может быть функцией времени (« = «(/)), фазо-
§ 2. ПОНЯТИЕ УПРАВЛЯЕМЫХ СИСТЕМ 71 вого вектора (и = м(х)), возмущения (« = «(£)) или иметь бо- лее общий вид (м = и (/, х, £)). Напомним, что при обсуждении задач исследования опера- ций термином «субъект» мы называли оперирующую сторону или исследователя операций. В теории управления, которая имеет дело и с-техническими системами, с этим термином мы будем- связывать также и конструктора, который проектирует систему управления. Во всех тех случаях, когда вектор управления является функцией фазовых переменных и возмущений, предполагается, что эти величины известны или становятся известными субъекту к моменту принятия решения. Позднее мы увидим, что это пред- положение, в свою очередь, требует описания некоторого инфор- мационного процесса. Выбор величины и обычно -стеснен каки- ми-либо ограничениями. Мы их будем записывать в виде a(=G„ (2-3) где Gu — некоторое множество произвольного вида. На изменение фазовых координат также могут быть нало- жены ограничения, например, такие: xeG, V/. (2.4) Иногда условия (2.3) и (2.4) приходится объединяты (/, х, «) е Gxu V/ (2.5) или (/, х, и, |) е G Vt. (2.6) Условие (2.4) называется фазовым ограничением, условия (2.5) и (2.6) — смешанными ограничениями. Условия смешан- ного типа часто называются ограничениями типа узких мест. Этот термин пришел из экономики; например, выпуск продукта не может превосходить мощности предприятия, которая, в свою очередь, зависит от управляющих воздействий — использования части продукта на инвестиции. Экономико-математические ис- следования оказывают большое влияние на развитие современ- ной теории управления. Системы уравнений вида (2.1), к которым добавлены огра- ничения (множества) Gj, Gu, Gx, мы будем называть управляе- мыми системами. Позднее, рассматривая конкретные примеры, мы обсудим содержательный смысл этого понятия. Примечание. Наряду с системами (2.1) приходится рас- матривать и их разностные аналоги, например: Л»+1“*л.+</(*«, /д), (2.1)
72 ГЛ. II. УПРАВЛЯЕМЫЕ СИСТЕМЫ а также системы более общего вида: %п+1 === С^П> ^п> 5п)- (2.1 ) Дискретные уравнения типа (2.1') или (2.1") возникают не только в процессе дискретизации задачи, которая необходима для ее анализа с помощью ЭВМ. Существуют системы с дис- кретным временем, которые трудно свести к виду (2.1). К их числу относятся, например, системы, описывающие динамику популяций с неперекрывающимися поколениями, некоторые про- цессы, протекающие в сельском хозяйстве, и др. Таким образом, изучая преимущественно системы вида (2.1), будем иметь в виду, что они далеко не исчерпывают всех практически важных типов систем. б) Цель управления и критерий качества. Среди специалистов по теории управления распространено еледующее утверждение: «Если не существует цели управления, то и го- ворить об управлении не имеет смысла». Это утверждение, как мы увидим позднее, нельзя абсолютизировать, как и большин- ство подобных утверждений, связанных с конкретными задачами практики, но до поры до времени мы будем считать его аксио- мой. И говоря об управлении, мы будем иметь в виду процессы формирования целей, отыскание и реализацию сТюсобов их до- стижения. Управляемые системы создаются для достижения тех или иных целей: самолет—для того, чтобы перевозить людей или грузы из одного места в другое, ракета —для вывода косми- ческого аппарата на заданную орбиту, система управления на- родным хозяйством — для обеспечения людей товарами и т. д. Цель управления — это субъективное представление лица, от- ветственного за 'выбор управлений (по нашей терминологии субъекта системы), о тех мотивах, которыми следует руковод- ствоваться при выборе свободной функции «(•). Функция u(t, х, £) после того, как мы ее выбрали, является формализованным описанием способов достижения цели. В тео- рии управления эта функция часто называется законом управ- ления. Таким образом, одна из основных задач теории управ- ления— отыскание закона управления по заданной цели. Цель управления можно сформулировать, как мы это знаем, в терминах максимизации некоторого функционала: Ji(«)->max. (2.7) Предположим, например, что речь идет о выводе космиче- ского аппарата на некоторую круговую орбиту в заданный мо- мент времени t = Т: \\x\\^T = R, (2.8) где || х || =» V(x‘)2 + (х2)2 + (х3)2
§ 2. ПОНЯТИЕ УПРАВЛЯЕМЫХ СИСТЕМ 73 Функционал типа например, так: А(«)={о (2.7) если если можно задать многими способами; (^ + (хУ + (*Ук-Д, (х1)2 + (Х2)2 + (^)2|<жГ^Я. Но достижение максимума функции (2.7') — это не един-' ственная цель, которой стремится достичь субъект, принимаю- щий решение о запуске ракеты. Естественным является его стремление достичь этой цели с минимальными затратами. Эта цель также может быть формализована в терминах максимума некоторого функционала вида т . Jq(u) = \f(x, u)dt. ' (2.9) о Заметим, что Любые ограничения вида (2.2) —(2.6) также можно сформулировать в тех же терминах. В самом деле, опре- делим функционал /2(и), например, так: ( 1, если (/, х, и, £) eG, h («) I О, есди (f, x.f и> Q qb Q, Тогда условие (2.6) мы можем представить в виде /8 («)-* max. (2.10) Заметим, наконец, что и само уравнение (2.1) есть некото- рое ограничение, поэтому требование, чтобы эволюция системы, т. е. изменение вектора х, следовала уравнению (2.1), также может быть сформулировано в терминах оптимизации. Таким образом, процесс управления при фиксированных целях сводится к определению такого управления «(•), которое одновременно доставляет максимум совокупности функционалов /<(«)-► max, 1 = 0, 1, 2.....k. (2.11) Подобная задача имеет математический смысл только в не- которых специальных случаях. Обозначим через Q/ множество тех управлений, на которых функционалы достигают макси- мального значения, т. е. множество вектор-функЦий, которые являются решениями задач //(«)-► max. Тогда для того, чтобы задача оптимизации (2.11) имела смысл, необходимо, чтобы - к П О/ 0» (2.12) f-0 т-е. чтобы пересечение множеств управлений, соответствующих максимальным значениям функционалов, не было пустым.
74 ГЛ. II. УПРАВЛЯЕМЫЕ СИСТЕМЫ Если же условие (2.12) не выполняется, то задача управле- ния не сводится непосредственно к задаче максимизации типа (2.11), и в этом случае необходим некоторый предварительный этап неформального анализа исходной задачи (так же как и в исследовании операций). В теории управления выработаны определенные приемы, сни- мающие эту трудность. Прежде всего выделяется цель управле- ния и фиксируются ограничения. Хотя формально, как мы ви- дели, все условгия, которым должно удовлетворять искомое ре- шение, могут быть записаны единообразно с помощью операции максимизации, удобно различать цель управления (функцио- нал /1), ограничения (функционалы h....../*) и функционал качества (/о). Эти условия имеют разный физический смысл, и их разделение создает наглядность, которая позволяет инжене- ру или исследователю сформулировать задачу, в наибольшей степени соответствующую тем объективным целям, ради кото- рых создается та или иная конструкция. В теории управления техническими системами типичным яв- ляется случай, когда со— fl 0, с-1 т. е. когда можно достичь цели управления, удовлетворив всем ограничениям. Именно этот случай изучался в классической тео- рии регулирования. Поскольку множество со не пусто, то есте- ственно на этом множестве попытаться найти такое решение, которое максимизирует еще один функционал — качество /0. Таким образом, задача (2.11) обычно заменяется задачей ' Jo(w)->mAx. ' (2.18) и е со в) Пример. Рассмотрим пример, который сыграл весьма важную роль в формировании идей и методов современной тео- рии управления, — задачу о выводе на орбиту космического ап- парата. В последующем изложении мы не раз будем обращаться к этому примеру для пояснения тех или иных особенностей теории. ‘ ' Уравнение движения центра массы ракеты имеет вид m^ = mg + R + Q. (2.14) где х — фазовый вектор, m — —масса аппарата, g— век- тор напряженности сил тяжести, R — R (х, dx/dt) — Аэродина- мическая сила, действующая на аппарат, Q = qku — реактив- ная сила, —скаляр —расход массы: •$- = «. (2.15)
$ 2. ПОНЯТИЕ УПРАВЛЯЕМЫХ СИСТЕМ 75 а —единичный вектор направления реактивной силы, k — коэф- фициент, зависящий от конструктивных параметров двигателя и, прежде всего, от скорости истечения газов. Величины q и и являются управлениями, причем они должны удовлетворять ограничениям 0<«7<<7тах, (2.16) II и II2 - (и1)2 + (и2)2 + (М8)2 - 1 • (2.17) Цель управления формулируется так: в момент времени Т, ' аппарат должен выйти на круговую орбиту, т, е. фазовые' пере- менные должны удовлетворять условиям (2.18) Первое из этих условий определяет точку на орбите, в которую должен быть выведен аппарат, а второе означает, что в момент вывода его скорость должна быть подобрана так, чтобы после выключения двигателя космический аппарат вращался по за- данной круговой орбите. На фазовый вектор x(t) наложено очевидное ограничение: ||х(/)||>Яз V/>0, (2.19) где /?3 — радиус Земли. Кроме того, вывод иа орбиту должен быть реализован с ми- нимальными затратами топлива или, что то же самое в данной задаче, на орбиту должна быть выведена максимальная масса, т. е. т —mQ — \q (2.20) о Итак, задача о выводе на орбиту космического аппарата сводится к отысканию управлений q(t) и u(t), удовлетворяю- щих условиям (2.14)—(2.19) и доставляющих максимум функ- ционалу (2.20). Управление, которое удовлетворяет всем усло- виям У/ф max для i = l, 2....k, т. е. обеспечивает достиже- ние цели управления и удовлетворяет ограничениям, мы будем называть допустимым управлением. В рассматриваемом приме- ре, если время Т достаточно велико, существует бесчисленное множество допустимых управлений, образующих множество (о, на котором и рассматривается задача (2.13). Сформулированная задача о выводе космического аппарата на орбиту не имела аналогов в классической теории регулиро- вания. В результате ее решения вычислялась опорная или, как ее теперь принято называть, программная траектория. Аналогом
76 ГЛ. II. УПРАВЛЯЕМЫЕ СИСТЕМЫ программного движения в теории регулирования можно счи- тать тот стационарный режим* который должен был поддержи- вать управляющий механизм (регулятор Уатта, автопилот и т. д.). § 3. Стохастическая задача и двухэтапная оптимизация Пример, который мы рассмотрели в предыдущем параграфе, в некотором смысле является исключительным, поскольку он относится к чисто детерминированной ситуации, а таковых в ре- альных условиях практически не бывает. Если в правую часть уравнения (2.1) входит случайная век- тор-функция Е = £(0» то и процесс изменения фазового вектора х «x(t) оказывается случайным. Таким образом, общей зада- чей теории управления оказывается задача управления случай- ным (стохастическим) процессом. В своей общей постановке подобная задача оказывается чрезвычайно сложной. И в теории управления выработаны разнообразные способы ее упрощения. Обычно мы стремимся свести анализ реальных стохастических систем к последовательному исследованию ряда детерминиро- ванных задач. Конечно, эта редукция далеко не универсальна (да и не всегда возможна), но она играет очень важную роль в теории управления (и системном анализе). В этом ^параграфе мы приведем типичный пример подобного сведения стохастиче- ской задачи к детерминированной. а) О постановке задачи. Итак, рассмотрим достаточно общую стохастическую управляемую систему x = f(t, х, и,1). (3.1) Предположим, что наша цель — перевести систему за время Т из состояния х(О) = хо в состояние х(Т) = хт. Поскольку систе- ма (3.1) находится под действием случайных воздействий то, каково бы ни было управление, фазовый вектор х(/) будет также случайной функцией времени. Поэтому мы не можем фор- мулировать цель управления в детерминированной форме и условие х(Г) = хг нужно заменить каким-либо требованием, сформулированным в вероятностных терминах, например, так: Ц = (х(Т)-хт)2-*т1п (3.2). или J2 = P{||x(T)-M<e}-*max, (3.3) где Р{у < а} означает вероятность того',’ что случайная вели- чина у не превосходит детерминированной величины а*). •) Напомним, что черта наверху означает математическое ожидание со- ответствующей случайной величины.
§ 3. СТОХАСТИЧЕСКАЯ ЗАДАЧА 77 Условие (3.2) при х(Т) = хт минимизирует дисперсию, а (3.3) максимизирует вероятность того, что конечное значение фазо- вого вектора находится внутри некоторого достаточно малого интервала с центром в хт. Оба эти условия тем или иным обра- зом оценивают точность достижения желаемой цели (х(Т) = хг). Примечание. Такие вероятностные представления ноли управления вовсе не исчерпывают возможных интерпретаций точности достижения цели управления. Например, вместо функционала (3.2) можно рассмотреть и такой: /з = ((х (Т)^хг), R(x(T)^ xT))t (3.2') где # — некоторая положительно определенная матрица, коэффициенты кото- рой вводят отношение эквивалентности оценок точности выполнения условий xi(T)=X/r, 1, п. Наряду с вероятностными ограничениями вида (3.2), (3.3) в задаче могут присутствовать и детерминированные ограниче- ния*), например ограничения на фазовые переменные: х s Gx, или ограничения на управления: и €= Gu ИЛИ / . т \udt^C (3.4) °, и т. д. • Таким образом, при описании стохастических задач теории управления мы сталкиваемся с той же ситуацией существования «физических» детерминированных ограничений, с которой мы уже имели дело в исследовании операций. Функционал качества управления т . ' Jo = \f(x, u)dt (3.5) о также обычно формулируется в детерминированной форме. Выражения типа (3.4) вполне корректны: количество горю- чего в ракете всегда ограничено вполне определенной величи- ной. Но оценка качества управления в форме (3.5) уже не яв- ляется достаточно оправданной: очевидно, что качество управ- ления мы можем оценивать какой-либо средней характеристи- кой, например величиной т Гй = F (х, и) dt. _______________ о *) Под детерминированными ограничениями здесь и далее будем пони- мать ограничения, которые должны выполняться с вероятностью 1. (3.6)
78 ГЛ. II. УПРАВЛЯЕМЫЕ СИСТЕМЫ Таким образом, реальная задача управления обладает целым рядом трудных особенностей, которые позволяют свести ее к чисто оптимизационной задаче только за счет введения допол- нительных гипотез. Первая трудность подобной редукции состоит в том, что данная задача содержит и стохастические, и детер- минированные ограничения. Достаточно общей математической теории, а тем более вычислительных алгоритмов для подобных задач просто нет. Вторая, и еще большая, трудность состоит в- том, что стохастическая задача многокритериальна по суще- ству: она не сводится к задаче типа (2.13). Значит, при анализе- стохастической задачи мы необходимо должны использовать не- которые гипотезы — для формирования оптимизационных задач мы должны опираться на те или иные предположения. Теория управления изучает разнообразные постановки сто- хастических задач, отражающие те или иные особенности изу- чаемых систем, которые позволяют сформулировать упрощаю- щие гипотезы. б) Схема двухэтапной'оптимизации. Широкий класс задач управления дают те ситуации, в которых возмуще- ния считаются малыми. Тогда предположение о том, что | и О, должно давать удовлетворительное первое приближение для ре- шения задачи. При этом условии функция x(t) уже не будет случайным процессом и функционалы (3.2), (3.2') превратятся в конечные выражения. Например, функционал (3.2) примет вид . 11~(х(Т)-хтУ~(х(Т)-хту. Минимального значения этот функционал достигает при х(Т) = хт. (3.7) Таким образом, мы приходим к обычной задаче оптимального управления: определить управление и{1), удовлетворяющее де- терминированным ограничениям и переводящее систему х = /(х, и, t, 0) из состояния х(0)=»хо в состояние х(Т) = хт так, чтобы мак- симизировать некоторый функционал качества: т Jo= F(x, и) dimax. (8.8) о Траектория x(i), являющаяся решением этой задачи, назы- вается программной траекторией (или оптимальной програм- мой), а управление u(t), которое ее реализует, называется про- граммным (или оптимальным) управлением.
§3. СТОХАСТИЧЕСКАЯ ЗАДАЧА. 79 . Вернемся снова к примеру о выводе космического аппарата на орбиту. Та постановка, в какой мы описывали в предыдущем параграфе эту задачу, как раз и дает программную траекторию. С помощью этой задачи мы можем рассчитать необходимые для вывода на орбиту затраты горючего и представить себе ха- рактер траектории движения космического аппарата. Мы можем найти также и законы управления:'функцию q(f), описывающую характер использования горючего, и u(t) —изменение со време- нем наклона газовых рулей, управляющих направлением реак- тивной тяги. . Однако если мы попытаемся использовать найденный опти- мальный закон управления для решения нашей технической за- дачи, то. достичь заданного конечного состояния в заданный мо- мент времени мы не сможем. Программная траектория — это траектория, вдоль которой реальная ракета никогда не летает. В самом деле, движение ракеты (как и любой другой управляе- мой системы) определяется не только управлениями, но и дей- ствием случайных, неконтролируемых факторов. Например, в случае движения ракеты это будут флуктуации плотности воз- духа, порывы ветра, неточности в выполнении управляющих команд и т. д. В результате они сведут ракету с расчетной про- граммной траектории. Поэтому необходима дополнительная си- стема управления, задача которой — корректировать не преду- смотренные заранее случайные воздействия. Эту дополнитель- ную, корректирующую систему условимся называть автопило- том. Нетрудномубедиться в том, что принципы построения этой дополнительной (корректирующей) системы управляющих меха- низмов качественно отличаются от тех, которые лежат в основе построения программного управления. Математически это будет совсем иная задача. Рассмотрим это обстоятельство подроонее. Итак, пусть мы снова имеем систему (3.1). Полагая в ней £ = 0, получим х = f (t, х, и, 0). ~ . (3.9). Решая для этой системы задачу (3.7), (3.8), находим программ- ную траекторию и управление * = *(/), и = й(0. (3.10) Реальные траектория- и управление будут, в силу предполо- жения о малости случайных возмущений, мало отличаться от своих программных значений. На этом основании положим х = *(/) + И0, п = й(/) + о(/). .(3.11) Считая у и v величинами’того же порядка малости, что и и подставляя (3.11) в исходную систему (3.1), линеаризуем ее
80 ГЛ. II. УПРАВЛЯЕМЫЕ СИСТЕМЫ относительно у, и и 5- В результате получим линейную систему y = Ay + Bv + C%, (3.12) ГДе А = (-g-)o, В - (^-)о. С = (-g-)Q - матрицы, причем производные вычислены вдоль программной траектории, т. е. при нулевых значениях величин g, v и у. Случайный процесс g(0> не ограничивая общности, можем считать центрированным, т. е. f(0 = 0 V/. (3.13) Для рассмотрения системы (3.12) воспользуемся методом вариации произвольных постоянных. Обозначим через матрицу линейно независимых частных решений однородной си- стемы уравнений У — Ау, (3.14) согласно которой матрица У удовлетворяет матричному уравне- нию -§- = ЛУ, У(0) = £, . (3.15) где Е — единичная матрица. Решение уравнения (3.12) будем искать в виде У=Ус, где с — вектор, компоненты которого являются Неизвестными функциями времени. Подставляя это выражение в (3.12) и ис- пользуя (3.15), находим, что вектор с удовлетворяет неоднород- ному дифференциальному уравнению Yc = Bv + Cg, или t С= Jy-l(T)(Bt,4-Cg)rfT4-c*, о где с* — вектор произвольных постоянных интегрирования. ' Так как неизвестная у должна удовлетворять нулевым на- чальным условиям, то с* = 0, и мы находим t y=^G(t,x) (Bv 4- С|) dx, (3.16) о где G — так называемая матрица Грина G(t, т) = У(/)У-\(т).
§3. СТОХАСТИЧЕСКАЯ ЗАДАЧА 81 Для отыскания нового управления используем условие (3.2), которое теперь мы можем переписать в форме W), (3.17) Используя (3.16), представим (3.17) в виде Л»(y(D, - $ J.G(t, s)G(/, т){(Во(s), Во(т)) + о о + (Bo(s), Cg(T)) + (Bo(T), C&(s)) + (Cg(s), C|(T)))dT. (3.18) Предположим теперь, что мы собираемся разыскивать кор- ректирующее управление так же, как и программное управле- ние, в форме v — v(t), т. е. отыскивать некоторую детермини- рованную функцию времени, которая минимизировала бы дис- персию (3.17). Тогда v(t) уже не будет случайной величиной и, следовательно, (Во (т), Во («)) = (Во (т), Во (s)), . . (BUWcf(^j) = (Bo(s), Cg^j^O, (Во(т), Cl(s)) = (Во(т), Cgfcjj = О, и выражение (3.18) примет следующий вид: т т Л = W), y(T)) = J ( (В (S) о (з), В (т) о (т)) dx ds + о о т т (C(s}l(s), C(x)l(x))dxds. (3.19) Каждое из слагаемых, стоящих в правой части выражения (3.19), является положительной величиной. Значит, если мы хо- тим выбрать управление о(/) так, чтобы минимизировать (3.19), то мы необходимо должны принять о = 0, т. е. если мы хотели уменьшить ошибку с помощью заданной функции времени, то наилучший способ управления — вовсе не управлять системой.. Следовательно, корректирующее управление v следует вы- бирать так, чтобы оно зависело тем или иным образом от воз- мущающих факторов £(/)• Однако выбирать о как функцию § непосредственно — трудно, поскольку мы должны иметь воз- можность измерять эту величину. Но зависимость р(£) можно Учесть и косвенно, измеряя фазовые переменные или их откло- нения от программного движения, т. е. отыскивать корректи-
82 ГЛ. II. УПРАВЛЯЕМЫЕ СИСТЕМЫ рующее управление следует в форме o — v(t,x) (или v = v(t, у)). (3.20) Таким образом, задача отыскания оптимального корректи- рующего управления состоит в определении функции v — v(t,,x), доставляющей минимум функционалу (3.17) при условии (3.12). Кроме того, на управление v(t, х) еще накладываются ограничен ния «ресурсного типа», поскольку « = (й + о) е Gu. Эта задача уже качественно отличается от задачи программ* ного управления и носит название задачи синтеза или задачи проектирования оператора обратной связи. Если в задаче про- граммного управления искомое управление зависит только от начального состояния системы и цели управления, то в задаче4 синтеза оно должно быть определено для всех значений фазо- вого вектора x(t). в) Обоснование схемы двухэтапной оптими- зации. Итак, предположение о малости внешних возмущений позволило нам не только разделить задачу на две последова- тельные, менее сложные задачи, но и распределить наши воз- можности управления так, чтобы обеспечить решение двух за- дач оптимизации. На первом этапе мы выбирали программное управление. Оно позволило выбрать программную траекторию, которая обеспечивала достижение заданной цели (при условии отсутствия внешних возмущений) с минимальными затратами ресурса, а на втором этапе мы определили параметры автопи- лота (функцию v(t,x)) — механизма, обеспечивающего при за- данном ресурсе максимально возможную точность достижения цели. Эта схема решения проблемы управления часто носит на- звание двухэтапной оптимизации. Она играет важную роль не только в теории управления техническими системами, но, как мы это увидим позднее, она лежит в основе так называемого программного метода управления экономическими и другими системами, функционирование которых определяется действиями людей. Изложенная схема является, конечно, эвристическим прие- мом решения двухкритериальрой задачи, поскольку для ее решения в принципе не существует регулярной строго обоснован- ной процедуры. Но коль скоро мы црлучаем с ее помощью неко- торое вполне определенное решение, то представляется необхо- * димым оценить его, сопоставить его с решениями, полученными с помощью других способов выбора закона управления v(t, х). Изложенная процедура дает правило выбора решения в двух- критериальной задаче /о («)-*• min, Л («)-> min.
§3. СТОХАСТИЧЕСКАЯ ЗАДАЧА Предположим, что мы составили линейную свертку этих функ- ционалов в форме ц /(«) = /о(-) + ^(’). (3.21) где с — некоторая фиксированная положительная постоянная. Рассмотрим теперь задачу /(и)-* mln. Покажем, что для функционала /(и) мы всегда можем получить . двустороннюю оценку. Обозначим через й и v решения тех двух задач, о которых шла речь 'в этом параграфе. Поскольку функция и* = и -|- v является допустимым решением, то Г</(й + о), (3.22) где через /* = /(«•) обозначено минимальное значение функцио- нала (3.21), которого можно достигнуть выбором функции и = « U*. С другой стороны, нетрудно показать, что всегда Г>/о(й). (3-23) В самом деле, предположим обратное: . - /о(Й)>Л (3.24) и вычислим Г = /(«‘) = /0(«*) + с/1(и*). Так как оба функционала Jo и Л по своему смыслу положи- - тельны, то очевидно, что /• Zo(«*). Тогда на основании (3.24) Уо(й)>/о(«*). Но это неравенство противоречит предположе- нию о том, что й — оптимальное управление, доставляющее ми- нимальное значение функционалу /<>(•)• Итак, мы получили дву- стороннюю оценку /о(4)<7‘</о(й + о) + с/1(й + о). . (3.25) Оценка (3.25) показывает, что предложенный метод выбора решения на основе двухэтапной оптимизации дает удовлетвори- тельную точность для всех сверток типа (3.21),если только зна- чение функционала Ji(-) не очень велико или постоянная с, характеризующая «ценность» функционала Д (•) .для оперирую- щей стороны, также не очень велика. Схема двухэтапной опти- мизации, разделяющая процесс управления на два последова- тельных этапа — выбор программы и построение механизма реализации этой программы, — является одним из важнейших Эвристических приемов современной теории управления. Он в равной степени необходим и для управления техническими и технологическими системами, где он возник, и для управления Модальными и экономическими системами, где он сделался
84 ГЛ. II. УПРАВЛЯЕМЫЕ СИСТЕМЫ основой программного (или, как иногда говорят, программно- целевого) метода управления. Получаемая двусторонняя оценка (3.25) дает обоснование этому приему. Точнее, она позволяет изучить возможности использования идей двухэтапной оптими- зации при анализе конкретной системы управления на основе решения обеих оптимизационных задач, не решая общей задачи (оптимизации функционала (3.21)). Следующие параграфы будут посвящены численной реали- зации схемы двухэтапной оптимизации. § 4. Методы, расчета оптимальных программ, использующие принцип максимума Оптимальная программа определяется как решение. вариа- ционной задачи У (и)-* min (4.1) при условиях x = f(x, и, t), (4.2) (х, и) <= G. (4.3) Задача (4.1)—(4.3) носит название задачи оптимального управ- ления (см., например, [8, 11]). Методы решения задач отыскания экстремума функций при- нято разделять на два класса: на прямые методы и методы, использующие необходимые условия. Эта классификация 'до- вольно условна. Тем не менее она бывает удобной, поскольку методически она имеет своим истоком различие в подходах к проблеме отыскания экстремума. Проиллюстрируем это на про- стейшее примере отыскания безусловного минимума функции g(x). Прямые методы имеют своим истоком идеи спуска (напри- мер, градиентного): ' ^n+1 ~ ~ а второй класс методов связан с возможностью редукции (све- дения) задачи отыскания экстремума к решению трансцендент- ного уравнения А=0. дх Каждый из этих подходов имеет свои достоинства и недостатки и свою область применения. Методы расчета оптимальных программ также принято раз- делять на два класса. К первому относятся прямые методы, которые используют тот или иной способ редукции вариацион- ной задачи (4.1) — (4.3). к конечномерной задаче. В результате
$ 4. МЕТОДЫ РАСЧЕТА ОПТИМАЛЬНЫХ ПРОГРАММ 85 дискретизации возникает специальная задача математического программирования. Эти методы получили в последнее время особенно большое распространение. На их основе разработано много стандартных программ и создаются пакеты прикладных программ разнообразного назначения, в частности диалоговые системы оптимизации (см. [10]). Этим методам мы посвятим следующий параграф. Тем не менее прямые методы не являются универсальными, и существует немало задач, для которых они малопригодны. Поясним эту мысль на примере простейшей схемы редукции за- дачи оптимального управления к задаче математического про- граммирования. Предположим, что функционал Ци) имеет вид т J(u)=\f(x, и, f)di. (4.4) о Разобьем интервал интегрирования на N частичных отрезков длиной т и будем считать управление на этих отрезках постоян- ным. Уравнение (4.2) заменим простейшей разностной схемой (схемой Эйлера): хк+1 = xk + xf (хк, ик, tk). (4.5) To же самое проделаем с функционалом (4.4): N-1 Ци) = х^ F(xk,uk,tk). (4.6) •fe-0 Конкретизируем условие (4.3). Примем, например, что х(О) = хо, x{T) = xN, uk^Gk, k = 0.........N, (4.7) . где Gk — некоторые выпуклые множества. Задача минимизации функционала (4.6) при ограничениях (4.5) и (4.7) — это стандартная задача нелинейного програм- мирования. Трудности решения этой задачи определяются мно- гими обстоятельствами, и главные — это ее размерность, количе- ство переменных и количесгво ограничений. Размерность возникающей задачи математического программирования опре- деляется в основном двумя обстоятельствами: размерностью век- тора х и количеством интервалов N, т. е. произведением п\ N. Если N достаточно велико, то даже в тех случаях, когда размерность вектора х невелика, задача математического про- граммирования оказывается чрезвычайно трудоемкой. Число N определяется прежде всего требованиями точности. В техниче- ских'задачах очень часто мы сталкиваемся с ситуацией, когда N достигает больших величин (задачи динамики полета, задачи механики сплошной среды и многие другие). В подобных
86 ГЛ. II. УПРАВЛЯЕМЫЕ СИСТЕМЫ ситуациях необходимы качественно другие методы решения за- дач, которые малочувствительны к увеличению числа Я частич- ных интервалов. Таковыми являются методы, использующие не- обходимые условия экстремума, только, в отличие от случая оты- скания безусловного экстремума функции с помощью необходи- мых условий, задача для функционала сведется не к задаче отыскания нулей функции dg(x)/dx, а к некоторой краевой за- - даче для обыкновенных дифференциальных уравнений. Г" В теории численных методов расчета оптимальных программ I особую роль играет принцип максимума. Сформулируем прин* | цип максимума и поясним его возможности на примере функ- |.ционала вида (4.4)^ Наряду с системой (4.2) рассмотрим со- ' пряженную систему1 Ф = — = Ф (х, ф, м, 0, (4.8) где Я — функция Гамильтона: Я = (ф, f) — F(x, и, f). (4.9) Будем предполагать, что выбор управления стеснен условием a(/)eG Vt (4.Ю) Тогда справедлива следующая Теорема (принцип максимума Понтрягина). - Для того, чтобы функция u(t) доставляла минимум функциона- лу (4.4) при условиях (4.2) и (4.10), необходимо, чтобы она доставляла максимум функции Гамильтона, т, е. чтобы она была решением задачи Н(х, ф, и, /)-*тах. (4.11) иеО К условию (4.11) должны быть добавлены еще условия трансверсальности. Мы будем рассматривать главным образом такие задачи, в которых начальное состояние системы фикси- ровано: х(О) = хо. (4.12) Рассмотрим сначала тот случай, когда и конечное состояние системы фиксировано:- . х(Т) = хт. t (4.13) В этой ситуации сформулированная теорема позволяет непо- средственно свести задачу .отыскания оптимальной программы к краевой задаче для системы обыкновенных дифференциальных уравнений. В самом деле, из условия (4.11) мы можем найти управление и как функцию ф, х и t: u = u($,x,t). (4.14)
$ 4. МЕТОДЫ РАСЧЕТА ОПТИМАЛЬНЫХ ПРОГРАММ 87 Подставляя выражение (4.14) в уравнения (4.2) и (4.8), мы получим следующую систему уравнений порядка 2п (п — раз- мерность вектора х): х = X (х, -ф, /), ф = W (х, ф, 0, (4.15) -где Х(х, ф,t)=f(x, и(х, ф, /), 0» 0=ф(*. Ф» и(х, ф, 0> О- Для системы (4.15) мы имеем ровно 2п краевых условий? п скалярных условий (4.12) на левом конце траектории и п условий (4.13) на ее правом конце. Поскольку речь идет о необходимых условиях, то принцип максимума Понтрягина означает, что оптимальная программа может содержаться только среди решений краевой задачи (4.12), (4.13) для системы (4.15). . Если правый конец траектории не фиксирован и на его выбор наложено количество условий, меньшее п, то для редукции за- . дачи к краевой необходимо еще определенное количество уело* вий, которые называются условиями трансверсальности. Они накладывают определенные ограничения на концевые значения импульсов (сопряженных переменных) ф(Т). Поясним смысл условий трансверсальности на нескольких примерах. Пусть, например, на правый конец траектории вообще не наложено никаких ограничений. В этом случае оказывается, что сопряженные переменные должны удовлетворять условию Ф(Т) = 0. (4.16) Условие (4.16) замыкает задачу — мы снова имеем 2п условий? л условий (4.12) на левом конце и п условий (4.16) на правом. 'Условие (4.16)—это частный случай условий трансверсаль- ности. Подобные условия существуют для ограничений весьма общей природы; например, если траектория должна оканчи- ваться на поверхности Ф(х(Г)) = 0, (4.17) то функция ф (0 при t = T должна удовлетворять условию трансверсальности вида = (4-18) где X — некоторый скалярный множитель, который выбирается условия (4.17). Мы снова приходим к краевой задаче для -системы (4.15), причем п условий мы задаем на левом конце траектории, а п условий — на правом. Подробный вывод условий трансверсальности содержится в любом курсе вариационного исчисления или теории оптимального управления.
88 ГЛ. И. УПРАВЛЯЕМЫЕ СИСТЕМЫ Итак, с помощью необходимых условий задача определения оптимальной программы сводится к краевой задаче для си- стемы обыкновенных дифференциальных уравнений. Процедура решения этой задачи в качестве промежуточного этапа содер- жит решение вспомогательной экстремальной задачи (4.11) определения максимального значения функции Гамильтона. Эту задачу мы должны решать на каждом шаге численного инте- грирования, и ее размерность равна т — размерности управляю- щего вектора, т. е. можно сказать, что ^теорема Понтрягина осуществляет декомпозицию задачи размерности m'XN на N задач размерности т, связанных между собой процедурой чис- ленного интегрирования дифференциальных уравнений. По мере роста N использование этого подхода, по сравнению с прямыми методами, становится все более и более выгодным, так как трудности решения оптимизационных задач нелинейного про- граммирования растут экспоненциально с ростом N, а трудно- сти решения краевых задач растут линейно по AL В то же время эти методы'чувствительны к росту, размерности вектора х. Та- ким образом, прямые методы расчета оптимальных программ и методы, основанные на редукции задачи оптимального управ? ления с помощью принципа максимума к краевой задаче для системы обыкновенных дифференциальных уравнений, взаимно дополняют друг друга. Единственной задачей теории дифференциальных уравнений, для которой существуют хорошо разработанные стандартные Численные процедуры решения, является задача Кон1и (методы Эйлера, Рунге —Кутта и т. д.). Что же касается краевых задач, то для их решения подобных стандартных процедур нет, и* раз- нообразные методы численного решения краевых задач так или иначе используют идеи сведения краевых задач к решению по- следовательности задач Коши. Методы решения краевых задач, возникающих в теории опти- мального управления, условно можно разбить на три класса. а) Метод’пристрелки. Этот метод иногда называют способом подбора начальных условий. Одна из особенностей краевых задач, обсуждаемых в этом параграфе, состоит в том, что на'левом конце траектории за- даны значения фазовых координат, а значения .импульсов ф(0) неизвестны. Поэтому первое, что приходит в голову, — это по- пытаться так подобрать начальные значения импульсов ф(0), чтобы удовлетворить условиям на правом конце траектории. В качестве подобных условий рассмотрим для определенности условия (4.13). Предположим, что мы задали тем или иным образом вели- чины ф(О) = фо. Теперь начальные данные для системы (4.2), (4.8) нам известны и мы можем с помощью того или иного
§ 4. МЕТОДЫ РАСЧЕТА ОПТИМАЛЬНЫХ ПРОГРАММ 89 способа решить задачу Коши. Воспользуемся, к примеру, мето- дом Эйлера. Зададим шаг интегрирования т и положим X ((k + 1) т) == X (kx) 4- xf (х (kx), и (kx), kx), ty((k 4- 1)т) = ф(£т) 4- x<p(x(kx), u(kx), kx> ' / В частности, x (т) = x (0) 4- т/ (х (0), и (0), 0), z •ф (т) = -ф (0) 4- т<р (х (0), и (0), 0). Для определения х(т) и.ф(т) нам нужно найти управление «(0). Для этого, согласно принципу максимума, мы должны найти шах Я(ф(0), f(x(O), и(0), 0)). (4.11') и (0) €= Ол Если Go —открытое мнджество, то для решения задачи (4.11') можно использовать необходимые условия максимума функции, которые позволят свести ее к решению трансцендентного урав- нения 4^- = 0. (4.21) - ди ' ' Определив из условия (4.11') и(0), мы мол(ем затем с по- мощью формул (4.20) вычислять значения х(т), ф(т). Повторяя эуу процедуру, можно найти последовательно величины х(2т), ф(2т); х(3т), ф(3т) и т. д. В конце концов мы найдем величины х1(Т)—составляющие вектора х(Т). Поскольку мы выбрали величины ф(0) произвольным образом, то при t = T условия х*(Г) — Ху = 0, i=l, ..., п, в общем случае выполнены не бу- дут. Введем вектор рассогласования: Ф = х (Т) — хт. Очевидно, что Ф будет функцией величин компонент ф(0): Ф = Ф(ф(0)). Задача будет решена, если мы подберем такой вектор ф(0), Для которого ф(ф(0)) = 0. (4.22) Таким образом, наш метод приводит к известной задаче оты- скания нулей некоторой вектор-функции. Для ее решения можно использовать хорошо разработанные методы (например, метод Ньютона), для которых существуют многочисленные пакеты прикладных программ. Поэтому может показаться, что здесь нет никаких особых проблем, во всяком случае тогда, когда раз- мерность вектора х.,не очень велика. На самом деле все оказы- вается гораздо сложнее, и реализация изложенной схемы ре- шения может встретить подчас непреодолимые трудности.
90 ГЛ. II. УПРАВЛЯЕМЫЕ СИСТЕМЫ Функциональная зависимость Ф (-ф (.0)) реализуется с помощью решения задачи Коши. А эта задача, в силу особенностей си- стемы (4.2), (4.8), всегда оказывается неустойчивой. (Я под- черкиваю: всегда.) Продемонстрируем это обстоятельство на простом примере, когда уравнение (4.2) линейно относитель- но х: х = Ах + Л(и). (4.23) Возможны два случая: либо среди корней уравнения |А — %£| = = 0 есть хотя бы один, у которого действительная часть поло- жительна, либо все собственные числа матрицы А имеют от- рицательные действительные части. В первом случае решение уравнения (4.23) будет иметь экс- поненциально растущие слагаемые, какова бы ни была функция «(/). Это означает, что при численном решении задачи Коши мы сталкиваемся с необходимостью оперировать с большими числами — счет' будет неустойчив. - Во втором случае аналогичные трудности мы встретим при интегрировании сопряженного уравнения (4.8). Это уравнение будет иметь вид ф=-4г=—Л‘*+ <4-24> где А* означает транспонированную матрицу. Поскольку соб- ственные числа матриц А и А* однаковы, то каждому корню с отрицательной действительной частью матрицы А будет от- вечать корень с положительной действительной частью матрицы —А*. Таким образом, если решение уравнения (4.23) устойчиво, то решение уравнения (4.24) будет неустойчиво, и наоборот, т. е. на этом пути мы неизбежно встречаем вычислительные трудности, связанные с неустойчивостью решения задачи Коши-. Вычисление функции Ф(ф(0)) при этом, будет затруднено. При решении конкретных задач неустойчивость решения за- дачи Коши приводит к тому, что небольшое отклонение началь- ных значений ф (0) от тех значений, которые "должны были бы быть в окончательном решении, приводит к очень большим зна- чениям^ величины Ф(ф(0)). По этой причине реализация любых численных процедур метода пристрелки требует глубокого пред- варительного анализа, который позволили бы выбрать хорошее начальное приближение. Употребляя термин «хорошее», мы имеем в виду такое начальное приближение, для которого зна- чение рассогласования Ф (ф (0)). невелико. Тогда, применяя, на-, пример, те или иные модификации метода Ньютона, мы можем провести вычисления с большой точностью. Несмотря на описанные особенности метода пристрелки, он очень широко распространен и с его помощью было решено
$ 4. МЕТОДЫ РАСЧЕТА ОПТИМАЛЬНЫХ ПРОГРАММ 91 большое количество задач, возникающих в инженерных и эко-’ номических расчетах. б) Метод редукции к линейной задаче. Сущест- вует класс задач расчета оптимальных программ, для которых могут быть предложены эффективные регулярные способы ре- шения. Для таких задач отыскание оптимальной программы сводится к решению, задачи Коши без дополнительных про- цедур отыскания корней функции, как это было в предыдущем пункте. Это —класс линейных задач оптимального управления с квадратичным функционалом. Рассмотрим систему, изменение фазовых координат которой описывается линейным уравнением х = Ах + Ви, (4.25) где-Л и В —матрицы, элементы которых ац и Ьц — некоторые заданные функции времени. В скалярном виде система (4.25) запишется так: п т , х* — Д йцХ1 4- Д Ъци1; (4.259 . Предположим, что начальное состояние задано: х*(0) = 4 ./ = 1, .... п, . (4.26) и поставим задачу отыскания'такого управления и(t), которое переводит систему из состояния (4.26) за время Т в состояние х*(Т) = х|, г=1, ...,п, (4.27) . так, чтобы функционал - Т ' .. J = J [(х, Сх) + (х, Du) + («, £«)] dt (4.28) о принимал на траектории x(t) минимальное значение. Здесь С = ”=(£//), D=(dz/), Е = (ец) —матрицы, размеры которых оче- видным образом определяются размерностями векторов.х и и; Матрица В положительно определена. Составим выражение для функции Гамильтона: Н = (ф, Ах + Ви)— (х, Сх) — (х, Du) — (и,. Ей). .. Уравнение для импульсов будет иметь вид ф = _-^- = -Л’ф + Сх + £>и, (4.29) гдеС==С4-С*
92 ГЛ. II. УПРАВЛЯЕМЫЕ СИСТЕМЫ Поскольку на управление не накладывается никаких ограни- чений, то для того, чтобы функция Гамильтона достигала на траектории максимального значения, необходимо, чтобы = D*x — Eu — 0, (4.30) где Ё — Е-{-Е*. Если матрица Е не является особой, т. е. если Е~1 существует, то система уравнений (4.30) имеет единствен- ное решение . u = E~1(B*^-D*x). (4.31) Таким образом, в этом случае мы имеем явное выражение для управления в виде функции импульсов и фазовых переменных, причем эти функции линейны. Подставляя выражение (4.31) в систему уравнений (4.25), (4.29), мы приведем ее к виду x — MiX + ф = М2х + М2Ф> (4.32) где Mt = A- BE~lD*, Ni = BE~lB\t М2 = С - DE~lD*, N2 = =* — А* + DE~lB*. Таким образом, в самом общем случае квад- ратичного функционала задача расчета оптимальной программ.ы для линейной системы сводится к краевой задаче для системны линейных дифференциальных уравнений. Линейные дифференциальные уравнения — это единственный класс дифференциальных уравнений, для которых разработаны регулярные методы решения краевых задач. Поясним их содер- жание. Рассмотрим уравнение V — Ay^-f, (4.33) где у, f — n-мерные вектор-функции, и предположим, что ста- вится задача о нахождении решения уравнения (4.33) при уело- ВИЯХ (!i> У СО) = £ W (Q = i == 0, 1, ...., k. (4.34) Метод, который позволяет дать эффективное решение задачи (4.33), (4.34), основан на возможности переноса граничных условий вида (4.34) из одной точки в другую. Мы будем гово- рить, что условие (4.34) перенесено из точки t, в произвольную точку t, если удастся так определить (независимо от у) вектор- функцию и скалярную функцию 0(/), удовлетворяющие условиям g(li) = h, Р(О = аъ‘ (4.35) что (g(/), y(t))= Р(/) для любого момента времени t ti. Лег- ко убедиться, что для этой цели можно использовать сопряжен-
§‘4. МЕТОДЫ РАСЧЕТА ОПТИМАЛЬНЫХ ПРОГРАММ 93 ное уравнение. Этим нение термином мы условимся называть урав- g^-A'g, (4.36) где А* — транспонированная матрица. Умножим скалярно обе части уравнения (4.33) на g, а урав- нения (4.36) —на у и результаты сложим: (у, g) + (У, g) = (Ay, g) + (g, f) — (A*g, y). (4.37) Так как (Ay, g) = (A*g, у), то уравнение (4.37) можно предста- вить в виде d(y, g)!dt = (g, f), откуда ' t (g, y)t = (g> y)tt + $ (g> f) di‘ Полученное равенство доказывает следующую важную тео- рему. Теорема. Если функция g(t) удовлетворяет уравнению (4.36) и первому из условий (4.35), а функция р(/) удовлетво- ряет уравнению ^ = (g,f) - (4.38) и второму из условий (4.35), то'вектор-функция y(t) для любых t удовлетворяет условию (g(i),y(t)) = m (4.39) На основе доказанного утверждения любое линейное усло- вие вида (4.34) можно перенести из точки t, в любую другую точку. Для этого достаточно решить одну задачу Коши для сопряженной системы и еще одну — для скалярного уравне- ния (4.38). Примечание. Мы рассмотрели некоторую процедуру переноса гранич- ных условий для линейных дифференциальных уравнений. В вычислительной математике эту процедуру называют также методом прогонки, поскольку с помощью решения задачи Коши мы «перегоняем» значения функции из одной точки в другую. Термин «прогонка» мы будем использовать в дальнейшем изло- жении. Этот результат открывает путь для стандартизации методов решения линейных оптимизационных задач с квадратичным функционалом. Первый этап решения — сведение линейной зада- чи к краевой для линейной системы. (4.32). Это — совершенно стандартная процедура, сводящаяся к обращению и перемно- жению матриц. Второй этан — это перенос граничных условий, которые задаются условиями трансверсальности на концах
94 ГЛ. II. УПРАВЛЯЕМЫЕ СИСТЕМЫ траектории. Этот этап также вполне стандартен — он требует решения задач Коши. После переноса граничных условий нам остается решить стандартную задачу Коши. Таким образом, ли- нейная задача оптимального управления с квадратичным функ- ционалом сводится к решению трех задач Коши, т. с. к после- довательности стандартных процедур. Конечно, в этой задаче существуют свои «подводные кам- ни», свои трудности, и, как правило, они также связаны с не- устойчивостью. Более того, основываясь-на тех замечаниях, ко- торые мы сделали при обсуждении метода пристрелки, можно утверждать, что при переносе граничных условий мы всегда сталкиваемся с неустойчивостью. Поэтому реализовать описан- ную схему прогонки на ЭВМ в том виде, как она была здесь изложена, обычно бывает столь же трудно, как и реализовать метод пристрелки. Однако метод прогонки обладает одной замечательной осо- бенностью: он всегда может быть модифицирован таким обра- зом, чтобы процедур а, счета оказалась устойчивой. Покажем, как это можно сделать. Перенос граничных условий будем осу- ществлять с помощью аналитического продолжения величин k на/ — другими словами, мы построим такие гладкие функции g и р, которые при t = ti обращаются в Ц и ai соответственно и удовлетворяют для любого t условию (4.39). Но это продолже- ние заведомо не единственно. Поэтому вместо найденной функ- ции g(t) можно подобрать другую, £(/), причем так, чтобы ее модуль был заданной постоянной величиной. Обозначим где g(i}—вектор-функция, удовлетворяющая сопряженному уравнению (4.36) и условиям (4.35), a m(t) —некоторая функ- ция, которую нам предстоять выбрать. Составим уравнение, ко- торому должна удовлетворять функция £(/): £ = mg + mg = mg — mA*g, но g = g/m, поэтому ё=~ё~А*ё. (4.40) Выберем теперь функцию m(f) так,-чтобы модуль функции ё был постоянной величиной, например: (£,£)= 1- Для этого не- обходимо и достаточно (при условии, что (6, /<)=!), чтобы (ё, ё) = 0. Это условие дает уравнение для m (f) s . %(ё,ё)-(ё,Аё)=о. откуда rii . . (A*g, g) т (ё> й)
§ 4. МЕТОДЫ РАСЧЕТА ОПТИМАЛЬНЫХ ПРОГРАММ 95 Подставляя полученное соотношение в уравнение (4.40), на- ходим уравнение для £: | = + (4.41)* , Подчиним дополнительно функцию g(t) условию = Нам осталось только определить новую функцию 0(f)-' Положим ; • ₽(0 = (Ш^(0) и найдем &-(£ Л+ (4.42) Таким образом, перенос граничного условия совершается снова по формуле (£,#) = 0, где g(t) определена как решение задачи Коши g(ti)=li для уравнения (4.-41), а функция 0(/) определяется уравнением (4.42) и условием 0(6)= а/. Этот результат очень важен: поскольку перенос граничных условий всегда устойчив, то мы должны совершать его так, йтобы задача Коши для уравнения (4.33) также была устойчи- ва. Если, например, мы снова имеем задачу с фиксированными концами: х(0) = хо, х(Т) = хт — и решение уравнения х = Ах устойчиво, то граничные условия с правого конца траектории следует перенести на левый конец. Если решение неустойчиво, то граничные условия с левого конца следует перенести на пра- вый конец и решать задачу Коши справа налево. Таким образом, изложенный аппарат является очень гибким инструментом решения краевых задач и мы имеем возможность почти всегда избежать трудностей, связанных с неустойчивостью счета. Замечания. 1. В результате переноса краевых условий мы получаем их в форме у (/»))=₽ (о. ♦ z Для того чтобы использовать стандартные методы, нам необхо- димо еще разрешить эту систему относительно вектор-функции У (it). Но матрица этой системы может оказаться плохо обуслов- ленной. Эту трудность можно преодолеть надлежащим обобще- нием изложенного выше приема (см. [8]). 2. Использование сопряженных, уравнений для анализа си- стем линейных дифференциальных уравнений было известно еще Лежандру и Лиувиллю. Таким образом, возможность переноса граничных условий из одной точки в другую, не решая краевой задачи, была известна еще в первой трети XIX века (соответ- ствующая процедура называлась методом факторизации). Но проблема устойчивой реализации этой процедуры возникла, есте- ственно, только после появления вычислительных машин.
96 ГЛ. II. УПРАВЛЯЕМЫЕ СИСТЕМЫ Исчерпывающее решение этой проблемы было дано А. А. Абра- мовым (см. работу [16]). Изложение процедуры переноса мы провели, следуя'идеям А. А. Абрамова. Таким образом, решение линейных задач оптимального управления с квадратичным функционалом (без ограничений на управление) может быть сведено к системе регулярных проце- дур. Это обстоятельство можно использовать для построения различного типа итерационных методов. Пусть теперь уравнение управляемой системы нелинейно и имеет вид x = f(x, «), (4.43) причем снова идет речь о решении двухточечной задачи опти- мального управления: х (0) = х0, х (Т) = хт, (4.44) ' т J(u) = ^F (х, и) dt -* min. (4.45) о . Предположим также, что ограничения на управление в этой задаче отсутствуют и время Т фиксировано. Зададим некоторое управление м = м°(0. которое мы рас- сматриваем как начальное приближение к решению. Подставив это управление в уравнение (4.43) и решая для него задачу Коши х(О) = хо, находим некоторую траекторию х = х°(0- Эта траектория в общем случае не будет удовлетворять условиям на правом конце, т. е. х°(Т)=£хт. Управлению» u°(f) будет отве- чать некоторое значение функционала /о- Введем теперь новые переменные х = х° -|- у, и = и° 4- v. Предполагая у и v малыми, удержим в уравнении (4.43) члены, линейные относительно у и и. В результате мы придем к си- стеме линейных уравнений ^Ay.+ Bv, (4.46) где А, В — матрицы: ' • . в=т ' \ ' х—х° и=-и1’ и-и* функция y(f) удовлетворяет нулевым граничным условиям на левом конце. На правом подчиним ее условиям у{Т) = ут = хт-х<>(Т\ (4*47) Сделаем замену переменных также и в функционале, но удержим в его выражении не только линейные, но и квадратич-
$ 4. МЕТОДЫ РАСЧЕТА ОПТИМАЛЬНЫХ ПРОГРАММ ные слагаемые относительно у и и. В результате мы получим новый функционал <р: Ф = $ [(«, У) + (0, v) + (Су, у) + (Du, у) + (Ей, о)] dt. (4.48) Смысл введенных обозначений очевиден; а и 0 — это векторы а = dF/dx, 0 — dF/du, а С, D и Е — матрицы: i=l, ..., я; / = 1 .1 / d*F \ 2 \ ди1 ди1) I, /= 1, .,т. Все эти величины вычислены при х = х°(/)’, и = u°(f). Итак, мы пришли к задаче отыскания управления и, пере-* водящего систему (4.46) из начала координат в состояние (4.47)' за время Т и доставляющего при этих условиях минимум функционалу (4.48). Эта задача, как мы видели, сводится к краевой задаче для линейной системы, т. е. может быть решена регулярными методами. В результате мы получим новое управ- ление (4.49) «1 = и° + и и новую фазовую траекторию xf, которая будет решением за- дачи Коши для исходной системы (4.43) с управлением, рав- ным Щ. Вычислим еще новое значение функционала /i = /i(xi, и\). Если окажется, что J\ < /о, то это означает, что решение («1, *1) улучшает исходное приближение, и мы можем повто- рить процесс, полагая в качестве начального приближения Xi и «Ь~ Если окажется, что Л > /0> то надо поступать так же, как и при реализации метода Ньютона или метода наискорейшего спуска, т. е. принять и\ = и° + kv где k — некоторое положительнее число, меньшее 1. При этом функционал /1 становится функцией k. Затем мы находим та- кое k, при котором Л (Л)-* min. Сходимость подобной итерационной схемы не изучена, од- нако целый ряд решенных задач показывает ее эффективность при условии, что начальное приближение «достаточно хоро- шее». 4 Н. Н. Моисеев
<J8 ГЛ. II. УПРАВЛЯЕМЫЕ СИСТЕМЫ Примечание. В конце шестидесятых годов Р' Веллман предложил итерационный метод решения задач оптимального управления, который был им назван методом квазилинеаризации (см. [1]). Практически он идентичен изложенному выше методу линеаризации. Однако есть одно отличие. Р. Велл- ман не использует техники переноса граничных условий, гарантирующих устойчивость счета. Метод прогонки и итерационные схемы, в которых он ис- пользуется, эффективны для решения задач без ограничений на управление. Однако его применяют и в более общем случае. Метод прогонки используется'и для решения нелинейных крае- вых задач. Пусть речь идет о нелинейной системе, уравнений вида , х = ф(х), • (4.50) где х —вектор четной размерности, ф(х)—некоторая нелиней- ная вектор-функция. Предположим, что половина условий за- дана на левом, а другая половина условий — на правом конце траектории. Общая итерационная схема, использующая метод прогонки, состоит в следующем. Определяем тем или иным способом на- чальное приближение х° и представляем уравнение (4.50) в виде х — А (х°) х + L (х, х°), где £(х,х°) = <р(х)—А(х°)х. Если ф(х)—дифференцируемая функция, то оператор А — это матрица частных производных: и структура итерационной схемы очевидна: хк = А (x*_i) xk + L (xft_i, xA_j). Подобные схемы расчета носят уже чисто эвристический ха- рактер; тем не менее существует довольно много процессов, для которых они позволили получить полезные для практики ре- ' зультаты. Примечание. В этом пункте был изложен метод переноса граничных условий для линейных уравнений, который всегда приводит к устойчивым процедурам счета. Он позволяет, в частности, получить численное решение задачи Коши для уравнения вида х = Л(/)х + /(0 даже тогда, когда частные решения этого уравнения — быстро растущие функции. Предположим, что начальные условия заданы в виде х (0) == х0 (х1 (0) = I «= 1, ..k), где Xq —ья координата вектора х0. Эти условия можно переписать в виде (вр х) = 4 где ei — единичный орт f-й оси.
$ 4. МЕТОДЫ РАСЧЕТА ОПТИМАЛЬНЫХ ПРОГРАММ 99 Предположим теперь, что нам надо вычислить значение х(Т). Для этого надо решить сформулированную выше задачу Коши и проинтегрировать чис- ленно уравнение от t — 0 до t = Т. Но если среди собственных чисел матри- цы Л(0) есть такие, которые обладают большой положительной действитель- ной частью, то частные решения однородного уравнения х = 4(/)х будут быстро растущйми и любой метод численного решения будет реализовать очень трудно. Однако для вычисления х(Т) мы можем избежать решения за- дачи Коши, если она неустойчива. Вместо этого мы должны решить п устой- чивых задач Коши &(0)=е<, в результате чего найдем п соотношений (&(П, х (?))=₽, (Г). Изложенные подходы позволяют усовершенствовать целый ряд численных процедур и, в частности, усовершенствовать характер итерационных процедур в методе пристрелки. в) Методы, использующие процедуру решения задач со свободным концом. Задачи со свободным пра- вым концом обладают одним замечательным свойством: для получения точного решения задачи оптимального управления, если она линейна по фазовым переменным, достаточно решить две задачи Коши. Рассмотрим систему х = Д (/) х + <р (/, и), (4.51) где ф — произвольная нелинейная функция, а управление «(О удовлетворяет ограничениям вида и е G. (4.52) Начальное состояние системы задано: х(О) = хо, (4.53) а на-правый конец траектории никаких ограничений не нало- жено. Рассмотрим для этой систему задачу > т - I = F (x,u)dt -* min, (4.54) о где F— линейная функция от х вида F(x, и) = (с; x) + f'(u)'. Согласно изложенному в начале параграфа, для сведения этой задачи к краевой нужно составить функцию Гамильтона Н — (ф, Ах) + (ф, ф (/, й)) — (с, х) — f (и) (4.55) и уравнение для сопряженных переменных (импульсов) Ф = + (4.56) 4*
100 ГЛ. И. УПРАВЛЯЕМЫЕ СИСТЕМЫ * Так как на правый конец траектории никаких ограничений не накладывается, то согласно условию трансверсальности (4.16) : Ф(П=о. Заметим, что уравнение для импульсов в этом случае не со- держит фазовой переменной и может быть проинтегрировано не- зависимо от уравнения (4151). Так как значения импульсов на правом конце траектории известны, то, решая задачу Коши (4.16), (4.56) справа налево, мы найдем импульсы ф(/) неза- висимо от х. Точно так же независимо от х может быть определено управ- ление u(t). В самом деле, управление находится из условия Я->тах, но функция Гамильтона Н, как следует из (4.55), со- держит лишь два слагаемых, в которые входит управление,— скалярное произведение (ф,<р (/,«)) и /(«). Следовательно, управление «(/) находится из условия — /(«) + (Ф> Ф (J. «)) -* max. (4.57) usG 'Отсюда сразу находим и — поскольку ф(0> как функция времени, нами уже определена. Найдя управление, мы подстав- ляем его в уравнение (4.51) и, решая для него задачу Коши (4.53), определяем фазовую траекторию x(t). Итак, линейная по фазовой переменной задача оптимального управления со свободным концом может быть решена регуляр- ными методами, т. е. сведена к двум задачам Коши и задаче нелинейного программирования-(4.57). Это обстоятельство послужило источником создания разно- образных итерационных процедур. В СССР первая работа по- добного рода была опубликована Л. И. Шатровским [72], в США —А. Брайсоном. Оба автора предложили практически идентичные итерацион- ные процедуры, получившие название метода Шатровского — Брайсона. Содержание этих процедур опирается на следующую схему рассуждений. . , Предположим, что мы имеем общую задачу оптимального управления (4.43), (4.45), (4.52), (4.53) со свободным правым концом. Задаем некоторое начальное управление и°-и вычис- ляем траекторию х°, отвечающую этому управлению. Затем в уравнении. (4.43) -и выражении функционала (4.45) делаем за- мену переменных х = х° + у, u — u° + v и удерживаем члены, линейные по у и v. Получаем уравнение для фазовой переменной y = Ay + Bv ' (4.58)
§ 4. МЕТОДЫ РАСЧЕТА ОПТИМАЛЬНЫХ ПРОГРАММ 101 ж выражение для функционала т- „ - + V)]dt, о 4 (4.59) тде с \дх)у.о* ' Решая задачу Ji -> min при ограничениях (4.58) и при огра* яичении u°4-oeG, находим новое управление. Принимая его в качестве нового приближения, повторяем расчет и т. д. Подобная процедура линеаризации не является достаточно оправданной с точки зрения удобства реализации машинного счета. В самом деле, для численного решения задачи Коши пе- реход к линейной системе не дает никакого выигрыша. Для программирования более важно иметь компактную форму запи- си. При линеаризации же мы вычисляем производные и теряем а компактности первоначальной формы запи.си нелинейного уравнения. И. А. Крылов и Ф. Л. Черноусько [50] предложили свою модификацию метода. Содержание метода Крылова — Чер- яоусько сводится к реализации следующих процедур. 1) Задается некоторое начальное приближение.—функция «°(/), и для уравнения (4.43) решается задача Коши, в резуль- тате чего определяется значение х°(Т). 2) Поскольку значения импульсов на правом конце траекто-* рии заданы (см. (4.16)), то мы можем решить задачу Коши • ф(Г) = 0 . • для системы п -S-**0’"0)’ /==1«•••««• <4-б°) С'** Решение задачи проводится справа налево от t == Т до t = 0. 3) В процессе интегрирования системы (4.60) определяется новое управление и’ из условия • Н = (ф, f) * — F (х°, и) max. иев 4) Используя найденное управление, повторяем, процедуру. Метод Крылова — Черноусько гораздо экономнее метода Шатровскогр — Брайсона и более удобен для машинной реали- зации. В общем случае метод Крылова — Черноусько расхо- дится. Для улучшения его сходимости можно, например, про- цедуру интегрирования системы (4.43) с управлением wj заме- нить интегрированием этой системы с управлением п । «I — и0 И« = “+-Ъ!Г-’
102 ГЛ. IT. УПРАВЛЯЕМЫЕ СИСТЕМЫ где k выбирается из условия J(«i)< J(u°). Этот метод был под* вергнут разнообразным исследованиям, и его сходимость впер- вые доказана М. Ф. Бейко и И. В. Бейко [23]. В настоящее время методы расчета оптимальных программ,, использующие необходимые условия в форме принципа макси- мума Понтрягина, превратились в большую самостоятельную главу вычислительной математики. В этом параграфе мы огра- ничились схематичным изложением лишь некоторых идей, ил* люстрирующих основные направления, по которым развиваются эти методы. § 5. Проблема быстродействия • Среди задач теории управляемых систем особое место зани* мают задачи на быстродействие. Формальная постановка задач» следующая. Пусть мы имеем управляемую систему х = f (х, и, /), (5.1) начальное состояние которой фиксировано: х(О)=Хо. . (5.2) Требуется найти управление «(/), удовлетворяющее условию и (t) е Gu, (5.3) которое выводит систему на терминальное множество Gt за ми- нимальное время Т. Описание множества От может быть весьма общим. В качестве функционала в этой задаче выступает само время — длительность процесса управления Т. Задачи на быстродействие в их классической постановке встречаются, в практике проектирования систем управления не столь уже часто. В конкретных проектах более важную роль играют, как правило, другие показатели: затраты денег, мате* риалов и т. д. Но без задач на быстродействие обойтись нельзя: оценка времени реализации проекта — это также важнейший из критериев. Он часто показывает «реализуемость» проекта, прак- тическую целесообразность всего замысла. Задача на быстро- действие дает обоснование назначению предельных (или дирек- тивных) сроков для завершения, проекта (в зависимости от за* трат), вывода экономической системы на заданную траекторию развития и т. д. Практическое значение методов отыскания управлений, оптимальных по быстродействию, трудно переоце- нить, и в следующей главе мы увидим их место в общей системе процедур программного метода. Задачи на быстродействие сыграли важную роль в развитии теории управления. Именно они оказались теми первыми зада- чами, для которых был сформулирован принцип максимума. Как
§ 5. ПРОБЛЕМА БЫСТРОДЕЙСТВИЯ 103 мы увидим ниже, формально задачи на быстродействие яв- ляются частным случаем задач теории управления, и необходи- мые условия, которым должно удовлетворять управление в за- дачах на быстродействие, легко следуют из общих фактов тео- рии управляемых систем и принципа максимума, который мы сформулировали. Тем не менее с вычислительной точки зрения они имеют целый ряд особенностей, заставляющих подвергать задачи на быстродействие специальному рассмотрению. Для упрощения последующих рассуждений будем считать, что терминальное множество состоит из одной точки, т. е. ко- нечное положение системы фиксировано: х(Т) = хт. (5.4) Рассмотрим общую задачу оптимального управления с ин- тегральным функционалом: определить траекторию системы (5.1), переводящую систему из состояния (5.2).в состояние (5.4) так, чтобы вдоль траектории x(t) функционал г J(u) = ^F(x, u,f)dt (5,5) о достигал минимального значения при выполнении условия (5.3). Выпишем для этой задачи необходимое условие в форме принципа максимума. Составим для этого функцию Гамильтона Н = (ф,Л-Г(х,п,0, ' - (5J5) где импульсы ф удовлетворяют системе уравнений * = -% = -!> + ?. (5.7) Согласно принципу максимума, для того чтобы функция «(/)] €ыла оптимальным управлением в задаче (5.1) —(5.5), необхо- димо, чтобы в каждый момент времени она доставляла макси- мальное значение функции Гамильтона: Н (х, ф, и, I) -+ max. (5.8) “s0« Время Т может быть как фиксированным, так и свободным, т* е. найденным в результате решения задачи. Но если время »ам не задано, то для его определения необходимо некоторое Дополнительное условие. Заметим, что в случае фиксированного времени мы получаем краевую задачу, позволяющую определить Управление и фазовую траекторию. Меняя время Т, мы будем получать различные' управления'и различные траектории. Ваз ОлУЧИТь дополнительное условие для определения Т можно v личными сдособами. Например, оно следует из условий
104 ГЛ. II. УПРАВЛЯЕМЫЕ СИСТЕМЫ трансверсальности, которые мы сформулировали в предыдущем параграфе: если на фазовую переменную x‘(t) не наложено ни- каких ограничений в момент начала процесса t = 0 или окон- чания процесса t — Т, то соответствующая этой переменной двойственная переменная — импульс фД/)—должна обратиться в нуль йри t = 0 или при t — Т, т. е. Ф/(0) = 0 (5.9) или ф/(Г) = 0. (5.9') Введем теперь дополнительную фазовую переменную хп+у- с помощью равенства xn+l = 0 и переменную т, 0 т к Сде- лаем замену независимой переменной t = хп+1т; тогда xn+i = Т. Воспользовавшись этим, мы можем переписать задачу (5.1)— (5.5) в следующем виде. Уравнения управляемого процесса за- пишутся так: -g- = x«+* I/(x,w>x"+4),. ------------0, . (5.10) а выражение для функционала примет вид 1 J (и) = xn+l J F (х, и, xn+lx) dx. О (5.11) Для задачи (5.10), (5.11) составим условия принципа макси- мума. Введем новую функцию Гамильтона Я* для ‘системы (5.Ю): Я* = хп+1.Я + фп+1.0. . Импульсы фь ...» фп, фл+1 будут удовлетворять условиям dtyi _____________ дН* ____^.п+1 дН . dx dxi дх1 * ' dx dxn+l dt i =(5.12) „ дН Н ~ ~дГ TXn+1’ (5.13} На фазовую переменную xn+1 при t = 0 и t = T никаких огра- ничений не накладывается, поэтому условия трансверсальности имеют вид Ф»+1 (°) = Фп+i(l) = °, или, иначе, 1 ^-тхп+,]л = 0." (5.14)' 0 '
§5. ПРОБЛЕМА БЫСТРОДЕЙСТВИЯ 105 Выражение (5.14) и является тем дополнительным условием, ко- торое позволяет определить неизвестную постоянную хп+1. Задача на быстродействие является частным случаем задачи < нефиксированным временем, когда F(x, «,/) = !. При этом Н— 1 и задачу на быстродействие мы можем сформули- ровать следующим образом: найти решение системы • ^-x“+7U«,x”+4), ---(5.15) е котором управление и удовлетворяет принципу максимума Я = (ф, f)xn+i -> max, - и выполнены граничные условия х(О) = хо, х(1)=хг, (5.16) « параметр xn+l выбирается из условия $[(Ф.Л + ^ГТХй+,]^=1. .. о • * < Задача (5.15), (5.16) имеет целый ряд специфических осо- бенностей с точки зрения организации вычислительного процес- са: .наличие параметра xa+l, который должен быть определен из дополнительного условия (5.14), затрудняет реализацию числен- ного решения. В настоящее время развит целый ряд приемов, имеющих целью преодолеть эти трудности. Укажем на некото- рые из них. а) Использование методов нелинейного про- граммирования. Если интервал времени Т не очень велрк fr. е. точность задачи не требует большого числа шагов по вре- мени), то переход к разностной аппроксимации задачи и замена «е тем или иным вариантом задачи нелинейного программирова- ния позволяют использовать библиотеку стандартных программ. Задача нелинейного программирования, которая здесь воз- никает, формулируется следующим образом: определить мини- мум линейной функции х —► min при условиях. 4 х (i + 1) = X (i) + Дхй+7 (х (/), ut, xn+1T/), *(O) = xo, х(Я) = хг, Ui^Ui, Д=1/АГ, т, = /Д. б) Переход к монотонно изменяющейся коор- динате. Во многих технических задачах можно указать ка- кую-либо из координат, о которой известно, что она изменяется
106 ГЛ. II. УПРАВЛЯЕМЫЕ СИСТЕМЫ монотонно. Например, в задачах о движении искусственных спутников такой координатой всегда оказывается полярный угол ф. Тогда замена независимой переменной t на монотонную переменную ф сводит задачу с нефиксированным временем к стандартной задаче оптимального управления. в) Введение дополнительного функционала* Фиксируем переменную xn+l, причем выбираем ее значение за* ведомо меньшее, чем Tmin, и решаем задачу с фиксированным временем для минимизации функционала . Г = ((х (1) - хт), R (х (1) - хг)), (5.17> где R — некоторая положительно определенная матрица, харак* теризуюшая точность достижения цели управления. Решая последовательно ряд задач минимизации функциона* ла (5.17) для x"+1 <xf+l <x"+i, мы можем найти величины J*(xn+l). (5.18> ,Они показывают зависимость значений функционала (5.17) or хп+1. Аппроксимируя эту зависимость той или иной достаточно- простой функцией, мы находцм корень уравнения J*(xn+1) = 0, (5.18'> после чего решаем краевую задачу (5.15), (5.16) для найден* ного из (5.18') фиксированного значения х"+1. § 6. Прямые методы расчета оптимальных программ а) Два способа редукции задач оптимального управления к задачам конечномерной оптими'* з а ц и и. Переход к конечномерному (дискретному) описанию .непрерывных задач открывает перспективу для использования развитого аппарата нелинейного и динамического программи* рования. В предыдущем параграфе мы уже использовали ко* нечномерную аппроксимацию. Вернемся теперь снова к этому- вопросу. Будем изучать систему х = /(х, и) (6.1^ и функционал т J (и) — ^ F (х, u)di. (6.2> о Ограничиваясь простейшей разностной схемой, мы заменим (6.1) и (6.2) следующими выражениями: xi+i = xt 4- xf (xi( ut), (6.3> N-l J — x^F(xhUi), i = 0,l,..., N— 1, (6.4> i-0
$ 8. ПРЯМЫЕ МЕТОДЫ РАСЧЕТА 107 ti — ir, x(tt) — xh u{ti)=Ui. К уравнениям (6.3) должно быть добавлено начальное условие х (0) = х0 (6-5) я условие на правом конце, которое мы для определенности примем в виде x(T) = xT = xN, (6.6) где хн — некоторый фиксированный вектор. Кроме того, на из- менение управления и фазового вектора могут быть наложены и другие ограничения. После такой замены задача минимизации функционала (6.2) свелась к отысканию минимума функции (6.4) при ограниче- ниях (6.3), (6.5) и (6.6). Итак, мы пришли к некоторой задаче нелинейного программирования. Но характер связей (6.3) при- дает этой задаче некоторые особенности, позволяющие развить специальные методы ее исследования. Равенство (6.3) позволяет последовательно исключить фа- зовые векторы: Xt •= х0 + т/ (х0, По) — Ф1 («о), х2 = Ф( (по) + xf (Ф, (По), Hi) — Ф2 (По, U1), Хк = Ф*-1(«0. • . ., «4-2) + xf (Ф*_1 («о..ИА_2), Uk-l) = = ф*(по, ...,«4-1), Функционал (6.4) становится функцией только векторов по, ... «... иы-и N—1 / = Ео Л («о, «I, ..., «<), (6.7) где Л (wo, «ь .... ui) — xFttbi'tuo, .... u/-i)', u<). Итак, мы видим, что функционал J превратился в сумму слагаемых Ц, причем слагаемые номера i зависят только от •первых i 4-1 неизвестных переменных. Функции вида (6.7) бу- дем называть функциями с последовательным включением неиз- вестных. - Другой способ редукции задачи оптимального управления к •конечномерной задаче оптимизации связан с так называемой элементарной операцией. Предположим, что в пространстве со- стояний (х, /) мы провели плоскости I — h = in, Эти плоскости
108 ГЛ. II. УПРАВЛЯЕМЫЕ СИСТЕМЫ обозначим через Si. Траектория системы у пересекает плоско* сти S/ в точках xi. Введем теперь в рассмотрение оператор B(xt, Xi+i), который паре точек xi и xt+i ставит в соответствие управление щ, переводящее систему за время т из, состояния xt в состояние xt+i, и участок траектории yi, <+i, который соединяет эти точки. Этот факт мы будем записывать в виде (Yl.i+Ь «<) = 5(Х/( Х;+1), а оператор В(х,, х,+1) будем называть элементарной операцией.. Функционал J мы сможем представить теперь в виде N-l fi+i N-l Цх,и) = ^ 5 F <V«. 1+1. «i) dt = У ф! (xh xl+l). (6.8> i-0 tt i-0 _ Таким образом, если нам дана элементарная операция B(x/,.x/+i)r то траектория определяется конечным числом точек х/— точек пересечения этой траектории с поверхностями S/. Понятие элементарной операции может быть расширено. Мы не будем связывать построение дуги у,, i+i с отрезком фазовой траектории. Определим операцию B(xi, x;+i) как некоторую про- цедуру построения вектора Ui и отрезка - у/, ж, соединяющего, заданные точки х/и xz+i. При помощи этой операции мы можем построить аппрокси* мацию фазовой'траектории некоторой ломаной, состоящей из- Дуг у/. ж» и свести исходную задачу оптимального управления к задаче определения минимума функции конечного числа пере* менных (6.8). Кривую, составленную из этих дуг, мы будем на* зывать ломаной Эйлера. Если в качестве «длины» отрезка у,-, ж принять величину г i+i Д/= J F(y/>/+1, ut)di, то исходную задачу мы можем сформулировать еще и в сле- дующих терминах: среди ломаных Эйлера, соединяющих две- заданные точки хо и хГ, найти ломаную минимальной длины. Проблема построения элементарной операции всегда яв- ляется достаточно трудной, и стандартные приемы ее построения отсутствуют. Иногда она строится очень просто, например в про- стейшей задаче вариационного исчисления, когда уравнения (6.1) имеют вид х— и. Тогда можно положить щ = (хж — х,)/т» Если размерности векторов и и х совпадают, то построение* элементарной операции можно свести к решению трансцендент* ного уравнения *
5 6. ПРЯМЫЕ МЕТОДЫ РАСЧЕТА 109 Если размерность вектора и меньше размерности фазового вектора х (типичный случай), то построение элементарной опе- рации сильно усложняется. В этом случае удобно искать по- стоянное управление Ui, выбирая его так, чтобы точка xi+i, определяемая формулой была по возможности ближе к точке xi+l (рис. 6.1). z Примечание. Процедура выбора управления ui должна быть по- строена так, чтобы отклонение <МТ)Я“|*Ж — при т->0. б) Метод градиентного спуска. Благодаря специ- альной форме ограничений в задачах нелинейного программи- рования, возникающих при дискре- тизации задач оптимального управ- ления, стандартные методы числен- ного рещения таких .задач несколь- ко упрощаются. Продемонстрируем это обстоятельство на примере ме- тода градиентного спуска. Рассмотрим задачи минимиза- ции функции ЛГ-1 J — У, // («о, «ь .... Ui), (6.9) i-0 где ui — векторы размерности т. Каждый шаг градиентного ме- тода сводится к расчету следующего приближения по формуле Л-1 М/ = й/_и^^. = й/_%(?/> . (6.10) i-f где й/ — предыдущее приближение, х>0 называемся шагом градиентного спуска. Напомним, что dli/diij — производные скалярной функции по векторному аргументу, т. е. они векторы с компонентами dlt д!{ ди} ди]' "" .duf После замены (6.10) функционал (6.9) превратится в функ- цию скалярной величины х: / = J(x). Шаг х может быть выбран так, чтобы значение /(х) было минимальным. Этот вариант градиентного спуска называется методом наискорейшего спуска. Займемся‘вычислением векторов Gt. Для этого заметим, что Функцию Jlfi -f- v) можно представить в виде ' * ЦП + о) = J (й) + б/4- О (о2),
110 ГЛ II. управляемые системы где АГ-1 1-0 vi — приращение вектора «1. В уравнениях (6.3) положим Xi =* — xi + yt, Ui — ili + Vi. Сохраняя линейные члены, мы будем иметь У i+l = Ai+dJi + Bi+\Vit (6.11) df (х,, й.) df (х,, йЛ где Ai+i, Bi+i — матрицы:Л/+1=Е+т—В(+1 = х— Е — единичная матрица. Из уравнений (6.11) будем последовательно исключать фа- зовые переменные. Так как левый конец фазовой траектории фиксирован, то i/о = 0 и, следовательно, yi = BiVo = Di,oVo, У2 — A2B1V0 + B2V1 = Dg, о°о 4" ^2, 1^1» (6.12) Уз= Ds, о^о + Ds, jOi + ... + Ds,s_ius_i, где Ds, i — матрицы: Ds, 0 ~ AsAs_t ... A2B1, Ds, 1 — Л4Л4_1 ... A3B2, ' Ds, 4—1 “" Bs. Аналогичным образом преобразуем выражение для функ- ции 6J: N-l N-1 Ы(У, V)= £ (di, у{) + £ (gb Vi), (6.13) i-1 /-0 ГПА J ~ WPP ГГ . dF(Xl> где di — x dx , gi — т: du Подставим в равенство (6.13) выражения ys по формулам (6.12). В результате очевидных преобразований получим окон- чательно N-\ bJ=Z(G{,Vi), (6.14) i-o • где векторы Gt определяются формулами ' W-l N-1 о,- s,o:.a+so. 01=2°;.а+«,............. (6.15)
§ 6. ПРЯМЫЕ МЕТОДЫ РАСЧЕТА Ш а Ds. i — транспонированная матрица. Таким образом, производ- ные функционала определяются явными формулами (6.14), (6.15). Согласно' схеме градиентного спуска Vi = —мОг, следова- тельно, N-l i-0 Аналогично могут быть построены и другие схемы методов конечномерной оптимизации. в) Возможные схемы динамического про- граммирования. С помощью элементарной операции мы представили функционал J в форме (6.8). Функции такого рода носят название аддитивных. Они представляют собой сумму слагаемых, каждое из которых зависит только от двух пере- менных с последовательными номерами. Эта структура позво- ляет использовать разнообразные схемы последовательного ана- лиза вариантов.. Здесь мы остановимся лишь на одной из схем подобного рода. Мы уже заметили, что использование элементарной операции позволяет переформулировать задачу оптимального управления Рис. 6.2. в терминах теории графов—-она сводится к отысканию крат- чайшего пути на графе специального вида. Остановимся на этом подробнее. В пространстве (х, £) проведем гиперплоскости 2г. t = it, i=r=0, 1, 2, ..., N. Считая, что х,-е S,-, построим в каждой ги- перплоскости дискретную сетку значений (узлов) xf, где s— номер узла в гиперплоскости 2,. С помощью элементарной опе- рации соединим узлы xj, i — 0, 1..N-, s — 1, 2, .... М. В ре- зультате получим некоторый граф (рис. 6.2). Задача состоит в том, чтобы найти на этом графе ломаную кратчайшей длины, соединяющую точки Хо и Ху. Напомним, что
112 ГЛ. И. УПРАВЛЯЕМЫЕ СИСТЕМЫ длиной отрезка ломаной, соединяющей точки x*t, xj+1, мы усло- вились называть величину - Фi (xi> x?+i) = Iks $ ~ J ? (У i. i+1» uks (0) dt, где Uks(i)—управление, построенное с помощью элементарной операции по заданным узлам х®, xki+l. Примечание. Элементарная операция определяет выбор управления на участке кривой, соединяющей точки, х®, х*+1. Однако, как мы уже видели, в подавляющем большинстве случаев управление выбирается не точно, а при- близительно. Решая задачу Коши *(*/)-4 *-f(x, uks(i)) с управлением, которое мы выбрали с помощью элементарной операции, мы построим траекторию, которая не пройдет точно через выбранную точку х|+1. Таким образбм, совокупность траекторий, определенных с помощью узлов X/, вообще говоря, не будет траекторией, проходящей точно через эти узлы. Траектории с управлениями и « и (х®, х*+1) будут лишь аппрокси- мировать траекторию, проходящую через эти узлы сетки. Изложим алгоритм отыскания кратчайшего пути на графе специального вида, который изображен на рис. 6.2. Этот алгоритм, названный алгоритмом «киевский веник», был пред- ложен В. С. Мйхалевичем и Н. 3. Шором (см. [56]). Рас- смотрим точки xf1, лежащие в гиперплоскости Ть Расстояние каждой из этих точек до начальной точки х0 обозначим через WD. Рассмотрим теперь узлы сетки х£’ в гиперплоскости 22- Расстояние каждой- из этих точек до узла, лежащего в гиперпло- скости 21, будет lk,k, (2), а длина ломаной; соединяющей узел х|“ с начальной точкой х0 и проходящей через точку х^, будет равна сумме Zfc0(l)+At (2)- Определим теперь ломаную минимальной длины/*г(2), соеди- няющую начальную точку Хо с точкой xfr. Очевидно, что '»,(?)-= ™п (/„(!) + /,,,,(2)). . (6.16) Й1 Равенство (6.16) ставит в соответствие каждому из узлов, лежащцх в гиперплоскости 2а, длину кратчайшей ломаной, со- единяющей этот узел с начальной точкой Хо. Только эти ломаные и следует сохранить для последующего анализа, а остальные пути, соединяющие узел х^! с начальной точкой Хо, могут быть отброшены, так как они не могут принадлежать ломаной крат-
§в. ПРЯМЫЕ МЕТОДЫ РАСЧЕТА ИЗ I Чайшей длины, соединяющей точки хо и хц. В самом деле, на основании формулы (6.8) общую длину ломаной, соединяющей начальную и конечную точки траектории, можно представить в виде суммы /»,о(1) + (2) + ... + lks+lks (s + 1) + ... + (N), а минимальная длина ломаной будет вычисляться по формуле 7=min(.. ,(min( min(/il0(l) + 1Ы,(2)) + (ls,(3))/. ДО). Значит, в состав ломаной минимальной длины, * соединяющей •Точки Хо и Xn, может быть включена только та ломаная, кото- рая имеет длину 1к, (2). . Дальнейшая структура алгоритма очевидна. Определив ло- маные длины (2), на следующем шаге мы будем искать ло- маные минимальной длины, соединяющие узлы х^ с начальной точкой. Их длина определится формулой !,.(3) = min(!„(2) + /,A(3)), (6.17) И т. д. Изложенный алгоритм требует весьма значительных затрат времени, так как он связан с большим перебором. Оценим его трудоемкость. Число узлов в плоскостях 2/ обозначим через М;. Значит, на каждом шаге номера i 4-1 мы совершаем перебор вариантов из множества Mi возможных путей, проходящих че- рез данный фиксированный узел х***1, и из этого множества по формуле типа (6.17) выбираем один вариант и его запоми- наем. Таким образом, на каждом шаге номера i + 1 мы должны запомнить Л!,+Г чисел 4/+1 («4-1). Для определения величины Z*/+1(*4-l) требуется вычислить Mi функций 1^+1*г(«4-1). сло- жить их с величиной lkt(i), хранящейся в памяти, и сравнить между, собой полученные величины. Предположим, что на это расходуется Мр машинных операций. Следовательно, общее число Q машинных операций, необхо- димое для реализации алгоритма, оценивается формулой N-1 Q = ZMiMi+ir^M^N, М = max Mt. (6.18) Величина Mi зависит от числа п — размерности вектора х. Если через pt обозначить число узлов по -каждой координате, то Mi-p*. Таким образом, оценка (6.18) может быть записана в виде Q~p*nrN, р = тахр{. (6.19)
114 гл. и. управляемые системы Оценка (6.19) показывает, что трудоемкость изложенного варианта метода динамического программирования мало чув- ствительна к росту интервала времени (числа N, от которого она зависит линейно). В то же время она быстро возрастает с увеличением размерности вектора х. Объем вычислений, необходимый для реализации описанной схемы, привел к созданию ряда ее упрощенных вариантов (ме- тод блуждающей трубки, метод локальных вариаций и др.), ко- торые нашли широкое практическое применение (см. по этому поводу [8]). . Методы, подобные изложенному, оказываются весьма полез- ными для решения широкого круга задач планирования. Они в некотором смысле универсальны — их можно использовать при ограничениях самой общей природы, когда возможности других методов уже исчерпаны. § 7. Проблемы синтеза Как следует из общей схемы двухэтапной оптимизации, опре- деление оптимальной программы — это лишь первый шаг проек- тирования системы управления. На следующем этапе мы долж- ’ны построить механизм управления, который реализовал бы найденную программную траекторию, т. е. обеспечивал бы до- стижение цели управления с максимальной точностью при за- данном количестве ресурса управления. Эта задача, как было показано в § 3 этой главы, сводится к следующему: определить корректирующее управление у так, чтобы 7(o)->min (7.1) о при условии х = Лх + Во + |, (7.2) х(0) = 0, . (7.3) где £ = £(/)—внешние возмущения. Мы предполагаем, что £(/)—центрированный случайный процесс (т. е. |(/) = 0 для любого (), стохастическое описание которого нам полностью из- вестно.' Примечание. В общем случае условие (7.3) может быть заменено более общим условием х(0) = а, где а —некоторая центрированная случай? ная величина. Функционал /(и) определяет точность достижения цели, на- пример величину дисперсии. В задаче отыскания оптимального корректирующего управ- ления, как мы видели в § 3, управляющие функции v должны
s 7. ПРОБЛЕМЫ СИНТЕЗА 115 быть не просто функциями времени, но зависеть также и от фа- зового состояния системы, т. е. v = v (х, t). (7.4) Кроме того, корректирующее управление обычно удовлетворяет - тем или иным ограничениям; мы будем их записывать в виде v @ G. (7.5) В общем случае для решения этой задачи регулярных ме- тодов нет. Она гораздо труднее обычной задачи оптимального управления. Для нее отсутствуют также и результаты общего характера,’ например необходимые условия типа принципа мак- симума. Таким образом, нет каких-либо необходимых условий, которые могли бы служить отправной точкой для построения эффективных методов расчета. Примечание. Последнее утверждение не совсем точно. Для функцио- нала (7.1) и управления (7.4) всегда может быть составлено уравнение Велл- мана и построены процедуры его решения методами динамического програм- мирования. Но машинная реализация этих процедур возможна лишь в исклю- чительных случаях; Задача (7.1)—(7.5) носит название задачи синтеза управле- ния или задачи проектирования оператора обратной связи. Этим термином называют зависимость (7.4), поскольку она ставит в соответствие величине х, характеризующей отклонение реаль- ной траектории от расчетной — оптимальной программы, — кор- ректирующее воздействие v. Построение оператора .обратной связи— это центральная задача любого процесса управления. Мы можем ошибиться в выборе оптимальной программы. Это изменит величину функционала: например, достижение цели будет нам стоить дороже. Но если мы плохо сконструируем опе- ратор обратной связи, то весь процесс управления может раз- рушиться: наша система потеряет устойчивость, и мы вообще рискуем не достичь цели управления. Пусть программная траек- тория полета ракеты вычислена и найден самый дешевый способ вывода нашего аппарата на орбиту. Но это не решает проблему, если автопилот не гарантирует устойчивости полета ракеты и небольшие случайные возмущения способны ее опрокинуть. Ска- занное в полной мере относится также к экономическим и со- циальным системам: проблема синтеза оператора управления (проектирование механизмов управления) является центральной проблемой анализа и проектирования систем. Примечание. Несмотря на то, что построение оператора обратной связи является важнейшей главой теории управления, гто этой проблеме по- священо огромное количество исследований, др сих пор не создано общей теории синтеза. Проблема оказывается чрезвычайно сложной, и более или менее полно изучены лишь простейшие случаи линейных систем.
116 ГЛ. II. УПРАВЛЯЕМЫЕ СИСТЕМЫ В этом параграфе мы дадим. краткое описание некоторых численных методов построения оператора обратной связи, т. е. построения функции v(x, f), и укажем способ оценки функцио- нала /, который независимо от его физического смысла мы бу- дем называть мерой точности достижения цели управления. а) Линейный синтез с постоянными коэффи- рентами обратной связи. Поскольку строгие методы решения задачи оптимального синтеза (7.1) — (7.5) отсутствуют, то основные усилия исследователей направлены на развитие способов замены задачи оптимального синтеза более простыми задачами, которые позволяют определить характеристики меха- низма обратной связи, обеспечивающего «практически удовле- творительные результаты». Эти способы сводятся, как правило, к сужению класса до- пустимых функций о(х, t), т. е. к построению таких совокупно- стей v (х, /), внутри которых возможно эффективное решение за- дач синтеза. Оператор обратной связи, построенный с их по- мощью, уже не будет оптимальным в смысле исходной задачи (7.1) — (7.5). Поэтому в подобных ситуациях мы будем говорить не об оптимальном, а о возможном (допустимом, виртуальном) синтезе. Об одном из таких приемов речь уже шла в начале этой главы, когда вместо функционала (7.1) мы использовали усло- вие устойчивости, а оператор обратной связи (7.4) строили в форме линейной функции фазовых координат: o = Lx, (7.6) где L — матрица (L = (1ц)), . элементы которой — постоянные числа, называемые коэффициентами усиления. Решение, этой задачи не единственно и дает лишь систему ограничений, которым должны удовлетворять коэффициенты усиления 1ц, например систему неравенств вида /Г/ (7.7) Такая неоднозначность удобна инженерам, поскольку она дает возможность варьировать в определенных границах зна- чения конструктивных параметров и удовлетворить еще тем или иным условиям, которые оказались не формализованными и не были включены в исходную постановку задачи. Но редукция к задаче устойчивости имеет смысл лишь тогда, когда время Т функционирования системы достаточно велико. Естественным развитием этих идей при создании механизмов управления на конечном интервале времени является сведение задач синтеза к некоторым задачам нелинейного программиро- вания. Поясним схему этой редукции для того случая, когда
§ 7. ПРОБЛЕМЫ СИНТЕЗА 117- -функционал J имеет вид математического ожидания / = (х(Г),х(Т)). (7.8) Будем искать решение задачи обратной связи в форме (7.6), где L = (1ц) (так же, как и в задаче проектирования оператора обратной связи, реализующего устойчивое движение системы) будет постоянной матрицей. Обозначим через G(t,x) = (ga(t,x)) матрицу Грина уравне- ния Хт=(А +BL)x. Так как начальные условия мы считаем ну- левыми, то решение уравнения -x = (A + BL)x + $ мы можем выписать в виде t x(0=$G(/,T)|(r)dT. (7.9) О Теперь функционал (7.8) запишется следующим образом: тт J — G (t, х) G (t, s)g(т) I (s)dx ds. (7.10) 0 0 Случайный процесс мы считаем известным, и поэтому все элементы корреляционной матрицы (или матрицы ковариа- ций) К==(Л//(т, s)), где кц = Ц(&(х)У (s)) = i‘ (т)^ (з), мы должны считать заданными величинами. Что же касается эле- ментов матрицы G(t, т), то они зависят от коэффициентов уси- ления 1ц. Задав матрицу L, мы можем с помощью фбрмул (7.9), (7.10) вычислить значение функционала. Но для этого нам надо сначала вычислить матрицу Грина, т.' е. решить п задач Коши (п — размерность вектора х). Таким образом, функционал I — это некоторая функция ко- эффициентов усиления 1ц и задана эта функция через решение системы линейных дифференциальных уравнений. Но так как фазовая переменная x(t) будет зависеть от коэффициентов уси- ления 1ц нелинейно, то решение задачи синтеза сводится к за- даче нелинейного программирования. Нач.иная с конца шести- десятых годов подобный подход получил весьма широкое рас- пространение, несмотря на то, что функционал / не является в общем случае выпуклой функцией. Благодаря тому, что в задачах синтеза требования точности, как правило, не бывают высоки, решение задачи этим методом во многих случаях уда- лось практически реализовать (см. [62,63]). Изложенная схема решения задачи использует по меньшей мере два предположения. Во-первых, предполагается,-что коэф-
It 118 ГЛ. II. УПРАВЛЯЕМЫЕ СИСТЕМЫ фициенты усиления можно считать постоянными числами. Такое предположение удобно для инженера, проектирующего систему управления, поскольку оно позволяет использовать достаточно простую конструктивную схему автопилота. Но в какой степени с помощью такой системы можно обеспечить точность достиже- ния цели, близкую к оптимальной, всегда остается вопросом, ре- шение которого может быть получено лишь с помощью экспе- римента, например с помощью массовых машинных расчетов. Во-вторых, предполагается, что обратная связь 'определяет управляющие воздействия, которые зависят линейно от откло- нений фазового вектора от программной траектории. Это также предположение, которое требует обоснования. Существует много работ, в которых делаются попытки из- бавиться от этих предположений. б) Оптимальный линейный синтез. Рассмотрим снова линейную систему * = Лх + о-Н. (7.11) Управление будем разыскивать в классе линейных функций v — Lx, но элементы матрицы L = (1ц) будем считать функция- ми времени. Подчиним эти величины ограничениям вида (7.12) где Du — некоторые множества. В инженерных задачах эти ограничения имеют обычно вид (7.7). Будем считать, что случайный процесс £(/) 'задан своим каноническим разложением: m (7.13) i-t где «р/(0 — некоторая заданная система вектор-функций раз- мерности п, a ci — скалярные независимые случайные величины с известными статистическими характеристиками, причем ci = О (случайный процесс центрирован). Вектор x(t) также будем отыскивать в виде некоторой суммы m 4 х(1)»£^(0. (7.14) где %»•(/)—неизвестные вектор-функции. ’ Подставив выражения (7.13) и (7.14) в, исходное уравнение (7.11), получим m Е Ci Ь - (Л + £) X: ~Ф/] = 0. (7.15)
$ 7. ПРОБЛЕМЫ СИНТЕЗА 119 Для того чтобы это равенство было справедливо для любых реализаций ct и любых t е [О, 7], необходимо и достаточно, чтобы величина, стоящая в квадратных скобках, была равна нулю при любых t, т. е. чтобы функции х«(0 удовлетворяли системе обыкновенных дифференциальных уравнений размерно- сти пХт: + + f=l,2.........т. (7.16) Поскольку в начальный момент х(0) = 0, то вектор-функции %,(/) должны также удовлетворять нулевым начальным уело* виям: Х<(0) = 0; Рассмотрим теперь выражение для функционала (7.8). Под» ставляя в него выражение,(7.14), мы будем иметь п ______ п / т \2 /==£(х')2(Т) = Е( Ecixl). /-1 / (7.17) Так как ci — независимые случайные величины, >г. е. = “если i k, то выражение (7.17) приобретает вид пт _ ;-££ед)!- (7.18) Поскольку ci — случайные величины с известным распределен нием, то с2 — заданные числа, и функционал (7.18) —это детер* минированная функция конечных значений неизвестных функций Х{(Т). Таким образом, задачу оптимального линейного синтеза при ограничениях (7.12) мы свели к задаче оптимального управ- ления: определить функции ///(/), доставляющие минимальное значение функционалу (7.18) при условиях (7.16), (7.12). В результате решения этой задачи мы находим коэффи- циенты усиления как .некоторые функции времени. Конечно, эта задача достаточно высокой размерности, но, будучи задачей со 'свободным концом, она допускает использование эффективных методов типа метода Крылова — Черноусько. , К сожалению, данный способ реализации оператора синтеза обратной связи может быть использован лишь при ограничениях типа (7.12). На практике же чаще всего встречаются ограниче- ния другого рода, напрймер, имеющие вид (7.19) Для того чтобы развить эффективные методы решения по- добных задач, можно попытаться ввести штрафные функции. Но метод функций штрафа, широко распространенный и хорошо
120 гл. II. УПРАВЛЯЕМЫЕ СИСТЕМЫ разработанный для детерминированных задач теории оптималь- ных программ, в задачах синтеза разработан очень плохо, и его обсуждение в этой области началось совсем недавно. в) Синтез в задачах с квадратичным ф у н к • ционалом. До сих пор мы обсуждали проблемы построения оператора обратной связи в виде линейной функции фазовых ко- ординат. Предположение о линейности, естественно, сужает возможности управления; операторы обратной связи, исполь- зующие более сложные функциональные зависимости, в общем случае могут обеспечить большую точность достижения цели управления, чем наилучший из линейных. Поэтому естественным образом возникает вопрос: а существуют ли вообще системы, для которых решением задачи оптимального синтеза является линейный оператор обратной связи? И что представляют собой эти системы? Ответ дает следующая теорема *). Теорема. Пусть мы имеем, линейную систему (7.Ц.), в которой отсутствуют ограничения на управление. Тогда реше- нием задачи о минимизации квадратичного функционала яв- ляются линейная функция (7.6), где элементы 1ц суть некоторые функции времени. Уточним теперь выражение для функционала. До сих пор мы рассматривали квадратичные функционалы вида . / = (х(7'),х(Г)) - (7.20) или / = (х(Г),/?(х(Т))),. (7.20') с помощью которых мы оценивали точность достижения цели управления. Но решение задач минимизации таких функциона- лов при условии, что на управление не наложено никаких огра- ничений, совершенно тривиально. В самом деле, если считать, что выбор управлений не стеснен никакими ограничениями, то до поры до времени мы вообще можем не управлять движением системы. Мы можем подождать, пока за счет внешних возмущений §(/) накопится некоторое от- клонение от расчетного режима (от программной траектории, которая в данном случае соответствует началу координат х ss = 0), а затем приложить управляющий импульс, компенсирую- щий это отклонение. Чем позднее (т. е. чем ближе к моменту окончания процесса t = Т) мы приложим зггот импульс, тем точнее мы достигнем цели управления, т. е. точки Хг з 0. В таком виде полученный результат практического смысла не имеет, поскольку в реальных условиях управляющие импульсы всегда ограничены и импульс, больший некоторой вполне опре- ♦) Доказательство см. в книге [8].^ .
S 7. ПРОБЛЕМЫ СИНТЕЗА 121 деленной величины, реализован быть не может. Решать же за- дачу синтеза с ограничениями на управления типа неравенств в общем случае мы не умеем, а теория штрафных функций для подобных задач не разработана. Поэтому вместо функционала (7.20) обычно в инженерных задачах рассматривается функцио- нал т J = (х(Т),х(П) + $ К (0 (о(0, v (0) dt, (7.21) о Где А(/)> 0 —некоторая заданная функция. В конце предыдущего пункта мы сделали замечание о воз- можностях использования штрафных функций в задачах синтеза С ограничениями на управление. Имеет ли это отношение к рас- сматриваемому случаю? Дополнительное слагаемое в (7.21). похоже на функцию штрафа. Но ,это лишь внешняя «похожесть». Если множитель А(/) в выражении для функции штрафа стремится 'к оо, то. решение задачи с функцией штрафа стремится к решению за- дачи с ограничением, нарушение которого мы оштрафовали. т Поскольку слагаемое J А (/)(»(/), v(t))dt с видом ограничения о не связано, то подобное утверждение в данном случае спра- ведливым быть уже не может. Тем не менее интегральное слагаемое в выражении (7.21) смысл имеет. Оно ограничивает возможный рост управлений и дает результаты, приемлемые для-практики: варьируя величину А(/), как правило, можно обеспечить выполнение ограничений на управления. Мы сформулировали теорему, которая справедлива для лю- бых квадр’атичных функционалов и, в частности, для функцио- налов вида (7.21).- Проиллюстрируем схему рассуждений при выводе этого ре- зультата для случая функционала (7.21). Заменим исходное- уравнение (7.11) системой разностных уравнений • .х4+1‘=Фл + o'ft + f*, 6 = 0,1....N—l, (7.22) где N — число интервалов разбиения отрезка времени [0,7]. Если мы используем простейшую разностную схему первого по- рядка точности, то Ф* = Е4-Л(4)т, о>*==о(4)т, /* = |(4)т, где т = T/N— шаг по времени, а Е — единичная матрица. Точно так же преобразуем и функционал (7.21): N—1 _______ / = xN) +Zdk (wk, wk). (7.23) A-0
122 ГЛ. И. УПРАВЛЯЕМЫЕ СИСТЕМЫ Итак, мы пришли к задаче отыскания минимума функцией нала (7.23) при ограничениях (7.22), т. е. мы должны найти величины Wo, ..,, w^-i, удовлетворяющие условиям (7.22) и доставляющие минимальное значение функции (7.23). Решать эту задачу будем методом динамического программирования. Предположим, что система находится в состоянии xN-i, т. е. до окончания процесса остался один временной интервал. По* ставим вспомогательную задачу: определить управление доставляющее минимальное значение функционалу (7.23). По-* скольку система тем или иным образом уже оказалась в со- стоянии хц-1 и изменить это положение мы не можем, един- ственным для нас способом повлиять на окончательный резуль- тат является выбор (надлежащим образом) управления на по- следнем шаге по времени. Введем обозначение JV-1 JN = (xN, Х/f) + Z dk (wk, wk) = fc-0 • N-2 == (xN, xN) + dN_i (Wif-t, WN_1) + E dk (a»A, Wk). (7.24) n»0 Последнее слагаемое в этом выражении уже было выбрано (тем или иным образом). Подставим в (7.24) выражение для xN из (7.22). Получим dN==(^N-lxN-U Ф#-1*ЛГ-1) + + 2 (o’w-i, Фдг-iAjv-i) + 2 (fft-i, Фдг-1*#_1) + 2 (wN_\, f^-t) + N-2 r (fN-bfN-l) + dN_i(wN^i, 1Уу_1) 4- E dk(wk, Wk). n-0 Вычислим условное-математическое ожидание In-\ величи- N-2 ны J№, считая, что хц-i и £ (wk, Wg) фиксированы, и ирини- _________________________п-0 мая во внимание, что fn-i = 0: Jn-i (xn-i) — &n-i, Rn-ixn-i) + 2 (wn-i, Фдг-1*л-1) + ____________________________ N-2 + (wN.lt wN.i) + (ftf_i, fN~i) + dw-i (W-ь + E dk (wk, wk), n»0 где /?лг-1 = Фдг-]Флг-1. Минимальное значение Jy-i найдем из условия
$ ?. ПРОБЛЕМЫ СИНТЕЗА' 123 Это условие мы имеем право использовать, поскольку на выбор управлений, т. е. величин w, никаких ограничений не накла- дывается. Это условие дает уравнение для определения вели* ЧИНЫ Wn-i‘. ®N-lxN-l 4" WN-1 4" dn-lWn-l = 0» откуда =-----= Bn-ixn-1‘ (7.25) Итак, на последнем шаге нашего процесса мы должны счи* тать управляющее воздействие w^-i линейной функцией фазо* вой переменной Xn-i. Подставляя (7.25) в выражение для находим d __________ аг-2 e j 1 --(xN-li 4" (/jV-b /аг-1) 4- У, (wk, Wk). 11 -11 П-0 (7.26) Подведем теперь некоторые итоги начального этапа решения задачи синтеза методом динамического программирования. В каком бы состоянии ни оказалась система перед последним шагом нашего процесса, независимо от всей предыстории, управляющее воздействие wn-ъ наилучшее среди возможных управлений на этом шаге, мы определяем по формуле (7.25), и оно оказывается линейной функцией отклонения х'ц-i от рас* четной программной траектории. Найдя оптимальное значение Wn-\, мы одновременно полу* чили условия, которым должны удовлетворять остальные управ* ляющие воздействия о>о, • • •, а»лг-2. Они должны доставлять ми* нимум некоторому функционалу/лг-ь Этот функционал вычис* ляется по формуле (7.26). В этом функционале присутствуют терминальный член, характеризующий отклонение фазового вектора, и интегральный член, штрафующий за чрезмерно боль* шое значение управления. Функционал (7.26) отличается от ис- ходкого тем, что терминальный член определен теперь не для значения k = N, а для значения k — N — 1. Определив управ- ление на последнем интервале, мы перенесли условие, на- ложенное на окончание процесса, на один шаг к началу, т. е. в точку tk — N — 1. Задача минимизации функционала (7.26) ничем не отли- чается от рассмотренной, и мы можем применить для ее реше- ния те же самые рассуждения, которые мы только что исполь- зовали. Другими словами, мы снова должны предположить, что состояние на предыдущем шаге, т. е. вектор xN-2, нам известно, заменить в выражении (7.26) величину хя-i по формуле XN—1 — ®n-2xN-2 4- &N-2 4" f jV-2
424 ГЛ. II. УПРАВЛЯЕМЫЕ СИСТЕМЫ • и, преобразовав выражение (7.26),. решить задачу о минимиза- ции функции, квадратичной по wn-ъ В результате мы най- дем, что t»jy_2 = (7.27) т. е. управление на предпоследнем шаге процесса снова ока- жется линейной функцией отклонения хц-г, независимо от пред- шествующей истории процесса. Затем мы должны составить функционал для определения управлений а>о, wi, .,., и>я-з. Он также будет, иметь вид, ана- логичный (7.26): 7JV-2 — (^-2> Ялг-2%-2) 4 dN-\ *+^-1 + (^-1’^-1) + 1 + d~* (wk, wk), " fe-0 где матрица /?у-2 вычисляется очевидным образом, и т. д. В результате этой процедуры мы получим последовательность , управлений вида Г wt — Btxlt (7.28) являющихся линейными функциями от соответствующих фазо- вых состояний. Формула (7.28) дает исчерпывающее решение задачи. Приведенные рассуждения не являются строгим доказатель- ством теоремы. В самом деле, мы доказали утверждение лишь для случая конечноразностных уравнений. Переход к пределу при т -> О (или W -> оо) отнюдь не тривиален. И хотя сам факт оптимальности линейного оператора обратной связи в задачах с квадратичным функционалом был известен, вероятно, уже с конца сороковых годов, его строгое доказательство было дано Р. Калманом лишь в начале шестидесятых годов. Полученный результат имеет большое прикладное значение. Дело заключается даже не в том, что для данного класса задач мы можем представить в явном виде оператор обратной связи. Мы нашли класс систем, для которых оптимальным является именно линейный оператор обратной связи. Но подавляющее большинство механизмов управления, создаваемых инженерами, строится именно по этому типу. Зная класс систем, для которых эти операторы являются оптимальными, мы можем оценить сте- пень соответствия создаваемых механизмов оптимальному об- разцу управляемых систем. г) С и нт ез о п ер атор а о б р а т н о й с в я з и н а о с н о в е прогноза. Одна из основных трудностей построения механиз- ма управления состоит в том, что приходится учитывать стоха-
5 7. ПРОБЛЕМЫ СИНТЕЗА 125 стичность внешних возмущений и работать со стохастическими уравнениями. Отсутствие эффективного математического аппа- рата заставляет упрощать задачу (например, заменять ее ли- нейной), сужать классы операторов, среди которых мы пы- таемся найти оптимальный, и т. д. Но, несмотря на все эти упрощения, мы всегда в конечном итоге стремимся свести за- дачу к последовательности детерминированных задач оптими- зации. В данном пункте мы опишем один способ реализации прин- ципа обратной связи, опираясь на возможность эффективного решения задачи определения оптимальной программы без 'пред- положения о линейности исходной системы. Рассмотрим управляемую систему достаточно общего вида x = f(x,u, £,/),. (7.29) где управление подчинено условию ‘ u<=U, (7.30) а качество-управления оценивается функционалом . т Jt = F(x (7)) +. J <р (х, и ($), з) ds *), (7.31) t где F и ф — заданные скалярные функции. Начальное состояние системы для определенности будем считать фиксированным: х(О) = хо. (7.32) Разобьем отрезок [0, Г] на N частей длины т: то = 0, т№= 7, j/==jt. В момент времени т/ будем строить прогноз £♦(/) слу- чайного процесса по результатам наблюдений за внешними возмущениями на отрезке [0, т,]. Этот прогноз равен условному математическому ожиданию величины £(/) при условии, что из- мерены ее значения при t т/, т. е. он определяется формулой t (0 = О)/ё («). s < xi), t > xt. (7.33) Поскольку мы предполагаем, что статистическое’ описание процесса £(/) нам полностью известно, то определение (7.33) в принципе возможно. Однако во многих конкретных ситуациях, например при оценке погодных характеристик, вычисление по формуле (7.33) может оказаться затруднительным. Тогда при- водится использовать прогноз,, носящий экспертный характер; *) Выражение (7.31) дает оценку управления при условии, что в момент Времени t известно состояние объекта x(t). Вопрос о том, как оценивать про- цесс «в целом», мы обсудим позднее.
126 ГЛ. И. УПРАВЛЯЕМЫЕ СИСТЕМЫ во всяком случае, мы всегда будем считать, что в нашем распо* ряжении есть некоторый оператор, ставящий в соответствие на* блюдениям функции £(з) на интервале 0 < т/ функцию (0 для значений t > т<: ' (7.34). Подставляя функцию £*(/) в исходное уравнение (7.29), мы получим детерминированную систему х = /(х, и, &*(/), /), х(т/) = х/. (7.35) Построим оптимальное программное управление и/(/)' в за* даче (7.35) с функционалом /т/. Функция ui{t) будет, очевидно, зависеть от xi, xi, £*(0» т. е. = ть х{, Г(0), Полученное таким путем управление мы будем называть ку« сочно-программным управлением. Если в нашем распоряжении имеются операторы прогноза П| и экономный способ построения кусочно-программного управле- ния, то общая схема управления выглядит следующим образом. В начальный момент мы строим прогноз Г(0 = По5(0) и находим управление «о(0> которое минимизирует функционал т J0 = F(x (Г)) + ф (х, и (s), s) ds. о Это управление используется на отрезке времени [О, ti]. В мо« мент времени ti делается новый прогноз с учетом той реали- зации случайного процесса %(f), которую мы наблюдали; Г(0 = 1Шз), зе[0, Т1]. С помощью этого прогноза мы строим новое программное управление Это новое управление используется на отрезке времени [тьтг], после чего строится новый прогноз и новое управление, которое минимизирует функционал т JTl=F(x(T))4- ^ф(х, m (s),_ s)ds, Ti И т. д. Изложенный здесь метод управления иногда называют ме- тодом скользящего плана. Очевидно, что он реализует опера- тор обратной связи в каждый момент коррекции. Он позволяет
§ 7 ПРОБЛЕМЫ СИНТЕЗА 127 найти управление, зависящее от того состояния, в котором на- ходится объект вслед'ствие действия тех или иных внешних воз- мущений. Но существует одно принципиальное отличие изложенной схемы управления от тех, которые мы изучали ранее. До сих пор мы всегда ориентировались на принципы двухэтапной опти- мизации и строили оператор управления, который стремится вернуть систему на исходную программную траекторию. Способ скользящего плана не требует возвращения системы на какую- либо определенную траекторию. Обратная связь, которая с по- мощью метода скользящего плана вводится в систему, ориен- тируется сразу на конечную цель — цель управления. Процедура построения программной траектории сама реализует оператор обратной связи — задача управления не разделяется на проце- ДУРУ расчета программы и процедуру синтеза. Использование подобных принципов управления открывает разнообразные перспективы для.развития эффективных спосо- бов синтеза оператора обратной связи. Они удобны во многих сферах человеческой деятельности: в управлении процессами ир- ригации, в экономическом планировании, в управлении ресурса- ми и т. д. Но для их эффективного использования необходимо по- нять, при каких условиях изложенные методы управления яв- ляются оптимальными и какое соотношение с оптимальными методами управления они имеют в общем случае. Заметим прежде всего, что поскольку мы рассматриваем стохастическую задачу, то и функционал, оценивающий каче- ство управления, должен быть сформулирован в соответствую- щих терминах. Будем рассматривать функционалы вида г J = Го = F(x(T)) + J qp(x, u(s), s) ds. (7.36) • о Предположим, что случайный процесс £(/) есть белый Шум, т. е. гауссовский процесс с нулевым средним и корреляционной мат- рицей s) = E8(t— s), где Е— единичная матрица, а 6(t — s) —векторная дельта-функция. Предположим, далее, что процесс (7.29) линеен по фазовым координатам, управлению и возмущению. Пусть, например, он имеет вид (7.11), а функцио- нал (7.36) — квадратичный, т. е. имеет такой же .вид, как те функционалы, которые мы рассматривали в данном параграфе. Сформулированные предположения позволяют в явном виде найти оптимальное управление и значение функционала (7.36), ®сли использовать метод, изложенный в предыдущем пункте. Для этого же случая нетрудно решить задачу и предлагаемым методом кусочно-программных управлений. Благодаря этому Метод кусочно-программных управлений синтеза оператора об-
128 ГЛ. Щ УПРАВЛЯЕМЫЕ СИСТЕМЫ ратной связи можно сравнить с точным методом, дающим опта- мальное решение-. Оказывается, что (см. [43]): 1. При прогнозе возмущения в дискретные моменты времени разность между значениями функционала для кусочно-про- граммного управления, с одной стороны, и для оптимального стохастического синтеза, с другой', неотрицательна и имеет по- рядок А (А — максимальный промежуток между моментами коррекции). 2. Если прогноз возмущений корректируется непрерывно, то значение функционала, даваемое стохастическим синтезом, и значение, получаемое с помощью метода кусочно-программного управления, совпадают. Итак, в случае возмущений типа белого шума и линейных систем изложенный метод построения оператора обратной связи является методом получения оптимального решения. Никаких других результатов математического характера, относящихся к системам более обще'го вида, не известно. И получить их, на- верное, достаточно трудно, -поскольку общая теория нелинейных стохастических уравнений развита пока еще очень слабо. В об- щем случае предлагаемый метод можно рассматривать как -не- которую удобную эвристическую процедуру эффективного по- строения оператора обратной связи для нелинейных систем в условиях, когда на управление наложены ограничения общего вида. • Метод кусочно-программных управлений имеет широкую сферу применения, и, в частности, с его помощью могут быГь построены т-ак называемые диспетчерские графики, широко используемые при управлении различными народнохозяйствен- ными комплексами. К этому вопросу мы еще вернемся в пред- последней главе. д) Некоторые комментарии. Мы изложили ряд ме- тодов синтеза систем управления, ориентированных на исполь- зование электронной вычислительной техники. Мы видим, что они носят, как правило, эвристический характер:’ строгих ре- зультатов и строгих оценок почти нет. Поэтому естественнее говорить не об оптимальном хинтезе, а о возможном, допусти- мом синтезе. Но в то же время мы изложили конструктивные способы построения механизмов управления. Следовательно, у нас появляется возможность их экспериментальной проверки с помощью ЭВМ. Машинный эксперимент на основе математи- ческих моделей открывает новую страницу в развитии методов исследования управляемых систем. В самом деле, имея в рас- поряжении тот или другой механизм управления (автопилот), реализованный в форме алгоритма, мы можем с помощью ма- шинного эксперимента наблюдать результат его функциониро-
$ 7. ПРОБЛЕМЫ СИНТЕЗА 129 вания. Имея систему критериев, можем оценить его эффектив- ность и решить вопрос о его применимости. Таким образом, машинный эксперимент позволяет подклю- чить к анализу систем управления неформальные методы. Это тем более важно, что на практике при создании технических систем управления, а особенно при создании систем управления хозяйственными комплексами, любая классическая постановка ‘задачи, безупречная с точки зрения математики, является до- статочно условной схематизацией того реального процесса уп- равления, который мы исследуем. /- В' свете сказанного значение методов приближенного син- теза систем управления трудно переоценить. Но став на путь построения операторов обратной связи с помощью эвристиче- ских процедур, мы переносим многие трудности в сферу ма- шинного эксперимента. Его организация превращается в боль- шую самостоятельную проблему. О .ней мы начнем разговор уже в следующей главе. б Н. Н. Моисеев
Глава Ш КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ * §1.0 термине «системный анализ» В предисловии было дано определение термина «системный анализ» и сформулировано утверждение о том, что системный анализ — это своеобразный синтез идей и принципов теории ис- следования операций и методов теории, управления с возмож- ностями современной вычислительной техники. Можно сказать, что системный анализ — это современный этап развития этих дисциплин. Далее, в соответствии с этим тезисом были изло- жены основные идеи и концепции теории исследования операций и теорий управления. Теперь с этих позиций мы снова вернемся к обеуждению предмета системного анализа и его связи с дру- гими дисциплинами. Это тем более необходимо, что исполь- зуются три «системных» понятия: «системный анализ», «теория систем» и «системный подход». Между ними часто ставят знак тождества, что приводит к некоторой путанице. Поскольку в дальнейшем мы будем говорить о методах системного анализа, то нам сразу нужно четко определить те термины, которые мы предполагаем использовать. Слово «система» и связанные с ним термины получили' ши- рокое распространение. Это произошло потому, что на передний план все более- и, более выступает необходимость изучения сложных комплексов (систем)*). Такая необходимость‘опреде- ляется резким усложнением создаваемых технических кон- струкций, устройств, технологий и всех совокупностей хозяй- ственных связей, с которыми приходится иметь дело экономи- стам, хозяйственным руководителям и инженерам. Потребность изучения биологических объектов и проблем экологии, которые с каждым годом становятся все актуальнее, также приводит исследователя к сложнейшим системам. ♦) Понятие «система» относится к числу тех, для которых трудно дать аккуратное определение. Часто системой называют совокупность элементов, между которыми существуют те или другие связи (например, система двух притягивающихся масс). В этой книге мы не будем пытаться давать строгое определение системы. Для наших целей достаточно того интуитивного поня- тия системы, которое имеется у каждого, изучающего предмет.
§ I. О ТЕРМИНЕ «СИСТЕМНЫЙ АНАЛИЗ» 131 В ответ на потребности изучения сложных систем возникла дисциплина «системный анализ». Ее, как это уже подчеркива- лось, естественно считать дальнейшим развитием исследования операций и теории управления, поскольку одной- из центральных проблем системного анализа является проблема принятия ре- шений. В первых двух главах мы рассмотрели круг вопросов, тра- диционно относимых к исследованию операций и теории управ-» ления. В частности, были рассмотрены вопросы, связанные с проблемой неопределенности, в том числе неопределенности цели, и был указан ряд гипотез и приемов, которые помогают решить эту проблему и уточнить сами цели. Но того инстру- мента (инструмента теории исследования операций), о котором шла речь, часто оказывается недостаточно. Неопределенность цели, с котдрой мы сталкивались до сих пор, состояла в многокритериальности. Трудно было соизмерить и сопоставить между собой различные требования — трудно формализовать понятие «цель», объединить показатели. Но мо- жет оказаться, что мы либо вообще не сможем сколько-нибудь точно поставить цели, либо те цели, которые хотелось бы по- ставить, нереальны. (Примеры подобных ситуаций дает порой экономика.) В этом случае на помощь приходит системный анализ. Допустим, что речь идет о планах перспективного развития ЗаНадно-Сибирского топливно-энергетического комплекса. Как определить цели? Конечно, -мы всегда можем сформулировать требования: топлива побольше, затрат поменьше и т. д. Но для проекта плана необходимы более или менее точнее показатели и реалистические цели, которые согласуются с потребностями страны и могут быть обеспечены существующими ресурсами. Подобные проблемы уже не вписываются в стандартную схему исследования операций. В самом деле, в таких проблемах самый главный момент-г-сформулировать цели, которые должен пре- следовать проект. Цель перестает быть экзогенным фактором, как это было в теории исследования операций или теории управления, она становится самостоятельным объектом иссле- дования. Мы сталкиваемся теперь с исследованием операций, целью которых является определение цели другой операции (например, проекта развития региона). Что надо исследователю для того, чтобы установить, «правильно сформулировать» те реалистиче- ские цели, осуществление которых должны обеспечивать созда- ваемые конструкция или хозяйственный комплекс? Очевидно, что для этого необходимо, прежде всего, представить себе функционирование будущей конструкции, сопоставить ее воз- можности с теми ресурсами, ^которыми будет располагать 5*
132 ГЛ. Ш. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ субъект. Достичь этого можно лишь с помощью физических (макеты будущих конструкций) или математических моделей. Таким образом, если мы хотим использовать математику, сначала мы должны описать систему моделей и создать матема- тический аппарат, который позволит провести анализ изучае- мого процесса, увидеть последствия наших решений, оценить наши возможности при различных'альтернативах, и только на основе такого анализа мы можем сформулировать цели. Слож- ность изучаемых и проектируемых систем приводит к необхо- димости - создания специальной, качественно новой техники Исследования, использующей аппарат имитации — воспроизве- дения на ЭВМ специально организованными системами мате- матических моделей функционирования проектируемого или изучаемого комплекса. Примечание. Последнее утверждение вовсе не означает недооценки классических аналитических методов анализа. Более того, эффективное ис- пользование имитационных систем необходимо предпвлагает. предварительную обработку модели. Этим вопросам будут посвящены следующие две главы. Отметим, что исследование динамики процесса, позволяющее увидеть перспективы и наметить цели,— это лишь один из аспектов системного анализа, может быть, и самый важный, ио дтнюдь не исчерпывающий всего многообразия вопросов, на ко- торые он в состоянии дать ответ. Наконец, это всего лишь пер- вый шаг исследования. Следующая проблема состоит в том, чтобы реализовать намеченные цели, т. е. сформулировать це- почку решений, в результате выполнения которых будет обес- печено достижение этих целей (выбраны параметры создавае- мых конструкции или проекта). Среди задач, возникающих в связи с созданием соответ- ствующих проектов, большое место занимают проблемы соче- тания структурных и функциональных аспектов. Один из труд- ных вопросов, связанных с этим, относится к проблемам проек- тирования иерархической организации. Любые более или менее сложные системы всегда организованы по иерархическому прин- ципу в связи с тем, что централизованные обработка информа- ции и принятие решений часто бывают невозможны из-за боль- шого объема информации, которую следует собирать и.перера- батывать, из-за возникающих при этом задержек и искажений и т. д. Если речь идет о проектировании технических систем, то задача исследования систем (задача проектировщика) со- стоит прежде всего в разработке самой функциональной схемы, которая может быть реализована заведомо не единственным способом, и в определении частных целей. Значительно сложнее обстоит дело, когда речь идет о- на- роднохозяйственных комплексах, функционирование элементов которых зависит от того, как управляют ими люди. В отличие
$ t; О ТЕРМИНЕ «СИСТЕМНЫЙ АНАЛИЗ» 133 от машины, человек всегда имеет собственные цели и интересы, и проектировщику системы уже недостаточно только формули- ровать цели для нижних звеньев. Необходимо еще быть уве- ренным, что эти цели будут достигнуты, т. е. что нижние звенья выполнят требования верхних звеньев. А для этого, в свою очередь, должен быть спроектирован специальный «механизм»*), 'ибо одной команды, одного приказа для достижения цели бы- вает недостаточно. Вот почему возникает потребность в спе- циальной теории, которая должна развивать принципы создания иерархии в управлении й методы их анализа. Теория иерархи- ческих систем, которая изу.чает некоторые из аспектов этой про- блемы, является- одной из важнейших частей системного ана- лиза. .Таким образом, системный анализ —это дисциплина, разви- вающая методы проектирования сложных технических, народ- нохозяйственных,' экологических систем, организационных структур и т. д. Системный анализ, как дальнейшее развитие теории исследования операций и теории управления, включает в себя эти дисциплины со всем арсеналом средств, развитых в их рамках. Поскольку любой анализ сложных систем невозможен без использования ЭВМ, то, когда говорят © методах' системного анализа, имеют обычно в виду процедуры, основанные на ис- пользовании ЭВМ. Термин «системный анализ» в русском языке не имеет точ- ного аналога в иностранных языках. В начале шестидесятых годов в США появился термин «system analysis» для обозначе- ния возникавшей тогда техники анализа сложных систем, раз- вивавшей прежде всего методы исследования операций и изу- чавшей, в частности, те способы представления информации, ко- торые облегчают исследователю формулирование целей операции. Исследователь операций в зарубежной литературе обычно назывался «analyst». Для того чтобы.подчеркнуть особенность квалификации специалиста, занимающегося анализом и проек- тированием сложных систем, стали употреблять термин «system analyst». Таким образом, термин «system analysis» следовало бы перевести как «анализ систем», но его* однажды перевели как «системный анализ», так как на английский язык оба эти термина переводятся одинаково: «system analysis». В русском же языке термин «системный анализ» несет гораздо большую смысловую нагрузку: этим термином называют большую само- стоятельную дисциплину. Заметим, что и в настоящее время термин «system analysis» понимается на Западе как анализ *) В экономике социалистических стран существует специальная проблема построения народнохозяйственного механизма (хозрасчет, система поощрения и т. д.), задача которого состоит в реализации народнохозяйственных планов.
134 ГЛ. III. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ систем, как совокупность более или менее простых рецептов ис- следования конкретных систем. В СССР стала возникать син- тетическая дисциплина, включающая в себя — это необходимо подчеркнуть — не только конкретные приемы представления ин- формации, но и фундаментальные разделы теории. Наряду с термином «системный анализ» большое распро- странение получил и термин «теория систем». Несмотря на широкое использование этого термина, его единое понимание отсутствует. Точно так же (как уже указывалось) не удается определить достаточно четко и сам тертшн «система». Возникновение «теории систем» обычно связывают с именем известного биолога Л. Берталанфи (см. [21]), который в пяти- десятых годах в Канаде организовал центр системных исследо- ваний и опубликовал большое количество работ, в которых пытался найти то общее, что присуще любым достаточно слож- ным организациям материи как биологической, так и обще- стренной природы. Однако подобными вопросами начали за- ниматься задолго до Берталанфи. Наиболее фундаментальные исследования этого плана связаны с. именем нашего соотече- ственника А. А. Богданова, который еще в начале века начал создавать теорию организации*). В своей работе он вводит Понятие организации как одного из первичных понятий. Мате- ?‘ ия существует во -времени и пространстве. Она всегда имеет у или иную организацию. В то же время и организацию нельзя мыслить без ее материального носителя. Основание для построе- ния теории А. А. Богданов видит в том, что, несмотря на фан- тастическое разнообразие материала, существующего в природе, количество архитектурных или организационных форм относи- тельно невелико. Он демонстрирует это на многих примерах самой разной физической природы. А. А. Богданов изучает не только статику. Он анализирует разнообразные особенности механизмов отбора, определяющие эволюцию организации, про- слеживает ее развитие. Позднее теорией организации (синонима теории систем) ванимались выдающиеся представители отечественного естество- знания— И. И. Шмальгаузен [73], В. Н. Беклемишев и ряд других специалистов, которые внесли много оригинального в трактовку понятия организации и показали значение этого по- нятия для общего представления о развитии материального мира. ♦) Подробнее см. книгу [22]. Второе ее издание вышло в Москве в 1923 г., а последнее — в 1929 г. также в Москве, уже после смерти автора, организа* тора и первого директора Института переливания крови. Во многих новейших исследованиях отмечается, что некоторые положения тектологии предвосхи- тили идеи кибернетики. В тектологии отразились и механистические ошибки А. А. Богданова.
§ I. О ТЕРМИНЕ «СИСТЕМНЫЙ АНАЛИЗ» 138 Примечание. Я думаю, что вклад русских и-советских исследователей во многих отношениях является решающим в формировании теории организа- ции, и многочисленные апелляции к работам Берталанфи и его последователей Часто не являются достаточно оправданными, поскольку большинство разви- ваемых ныне идей так или иначе связано с работами А. А. Богданова и дру- гих советских исследователей. Таким образом, в отличие от системного анализа, дйсцип- дины .прикладной, ориентированной на решение конкретных практических задач, теория систем относится скорее к методо- логии науки. В литературе часто не делается различия в терминах «си- стемный анализ» и «теория систем». Из сказанного же следует, что путать эти два термина нельзя. Но системный анализ и теория систем еще не исчерпывают той «системной терминологии», которая возникла в последние десятилетия. Как мы уже говорили, существует еще одно понятие —«си- стемный подход», — еще более расплывчатое и неточное. Тем не менее оно отражает определенные тенденции, которые стали особенно заметны в послевоенные десятилетия. В развитии науки всегда отчетливо прослеживались две ли- нии— анализ и синтез. Мы всегда видим стремление к анали- зированию— изучению конкретных фактов, проникновению в глубь изучаемого факта, вскрытию тонкой структуры явления и т. д. Но рядом точно так же всегда существует стремление создавать синтезирующие теории, позволяющие объединить различные факты, увидеть перспективы развития того или иного процесса, его "связи с другими явлениями, учесть их взаимную обусловленность и т. д. При создании синтезирующих теорий иногда происходит и некоторая утеря информативности: не все факты удается сразу уложить в единую схему, не весь арсенал практически полевых методов можно сразу приспособить к новой системе взглядов. Например, теория Птолемея, помимо общей геоцентрической концепции, давала способы расчета положения планет на не- бесном своде. Теория Коперника содержала гелиоцентрическую концепцию, но на первых порах никакими способами, позво- ляющими предсказывать положения планет, не располагала и, значит, для практики (например, для практики мореплавания), в отличие от теории Птолемея, была непригодна. Только после работ Кеплера она получила ту аппаратную основу, которая позволила ей полностью заменить теорию Птолемея. В разные периоды времени значение обоих подходов было различным, хотя две тенденции всегда существовали парал- лельно. Большое значение имело стремление к обособлению дисциплин, к отысканию новых фактов, стремление сделать факт
136 ГЛ. III. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ единственной целью научных исследований. В то же время ро« ждались новые, пограничные области, в которых невозможно отличить одну науку от другой: химию от физики или от био- логии и т. д. В последние десятилетия роль синтезирующих построений стала особенно большой. Потребность не просто изучать яв- ление, факт, но устанавливать его связь с другими фак.тами и привела к появлению специального термина «системный под- ход». Эта потребность проявляется сейчас так ярко, что возни- кают не только новые научные направления на стыке между отдельными естественными науками, но и исследования, относя- щиеся в равной степени к -компетенции естественных и обще- ственных наук. Современный интерес к подобным синтетическим построениям связан с возросшими возможностями переработки информации. По-видимому, исследователь всегда стремился по возможности «системно» подойти к воззрению на тот или иной факт, но далеко не всегда он мог иметь в своем распоряжении необходимый инструмент. Сейчас, в век ЭВМ, эти возможности резко возросли. Отсюда, как следствие, и стремление к изуче- нию явления во- всей его полноте, в связи с другими явлениями. Системный подход "непрерывно стимулируется .потребностями практики, которая выдвигает все более и более сложные проек- ты, требующие анализа междисциплинарных проблем. Примечание. Системный подход, как мы видим, — это некоторый об- щеметодологический принцип. Его гносеологический аспект — это теория си- стем. Его рецептурная, аппаратная реализация — это системный анализ. Это деление довольно условно, и, как мы увидим ниже, чисто аппаратные вопросы далеко не всегда можно (и нужно) отделять от вопросов философских. В этой книге мы не будем касаться общих проблем методо- логии и сосредоточим внимание только на системном анализе, его методах и на самом существенном его отличии от других дисциплин — необходимости объединения формальных и нефор- мальных методов анализа, на" демонстрации того, как строгие методы, основанные на использовании современных математи- ческих средств, вписываются естественным образом в канву естественнонаучного и гуманитарного мышления. $ 2. Проблемы моделирования Любые методы системного анализа (так же как и методы исследования операций и теории управления) опираются на математическое описание тех или иных фактов, явлений, про- цессов. Наше знание всегда относительно, поэтому описание на любом языке также отражает лишь некоторые стороны явлений и никогда не является абсолютно полным.
$ 2. ПРОБЛЕМЫ МОДЕЛИРОВАНИЯ 137 В настоящее время широкое распространение получило сло- во «модель». Понятие «модель» допускает много различных трактовок, существует классификация моделей и т. д. Подроб- ный анализ этого понятия лежит за рамками данной книга. Употребляя слова «модель», «модельное описание», мы будем иметь в виду некоторое описание, отражающее именно те осо- бенности изучаемого процесса, которые и интересуют исследо- вателя. Точность, качество такого описания определяются пре- жде всего соответствием модели тем требованиям, которые предъявляются к исследованию, соответствием получаемых с помощью модели результатов наблюдаемому течению процесса. Если при описании моделей используется язык математики, то говорят о математических моделях. В дальнейшем мы будем говорить только о математических моделях. Примечание. Любая научная дисциплина всегда имеет дело только с приближенным, «модельным» описанием. Но эти модели могут использовать самые разные языки (и символы). Для того чтобы их отличить от математи- ческих моделей, часто используют термины «содержательная модель», «вер- бальная модель» и др. Изучение математической модели всегда связано с некоторой «алгеброй» — правилами действия над изучаемыми объектами, которые отражают связи между причинами и следствиями. Ко- гда подобная алгебра оказывается достаточно развитой, мы го- ворим, что в рамках данной модели возникла теория. Иногда говорят о деталвной разработке теории. Отдельные факты тео- рии— утверждения, теоремы — иногда называются законами (второй закон Ньютона, закон Стокса и т. д.). Точно так же ряд исходных положений феноменологического характера,» хо- рошо проверенных опытом, также называется законами По- этому иногда говорят, что теория (или модель) опирается на законы. Построение математических моделей является основой всего системного анализа. Это — центральный этап исследования или проектирования любой системы. От качества модели зависит судьба всего последующего анализа. Конечно, и в исследовании операций, и в теории управления построение моделей всегда занимает важное место. Но только в последнее время, с возникновением системного анализа, ко- торый оперирует с процессами, связывающими явления различ- ной физической природы, возникла практическая необходимость более глубокого изучения принципов .моделирования (матема- тического описания). Построение моделей — всегда процедура неформальная, и, конечно, оно очень сильно зависит от исследователя, его опыта, таланта, всегда опирается на определенный опытный материал, в связи с чем мы говорим, что процесс моделирования имеет
138 ГЛ. HI. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ феноменологическую основу, Модель должна достаточно пра* вильно отражать явления, однако одного этого еще мало, Она должна Рыть удобной для использования. Поэтому степень де- тализации модели, форма ее представления определяются це- лями исследования и непосредственно зависят от исследова- теля. Работая с одним и тем же опытным материалом, разные исследователи могут представлять его различным образом. Изучение и формализация опытного материала — не един- ственный способ построения математической модели. Важную роль играет получение моделей, описывающих частные явления, из моделей, описывающих явления более общие. Так, модель пограничного слоя Прандтля может быть выведена из более общей модели — уравнений Навье — Стокса. Она является, асимптотической моделью. Новый экспериментальный материал’ может привести к более совершенной модели, и тогда ранее известная модель сделается асимптотической. Такая судьба по- стигла ньютоновскую механику, которая долгое время была чи- сто феноменологической моделью. Но после создания специаль- ной теории относительности она превратилась в ее следствие и может быть выведена из нее с помощью предельного перехода о2/с2 ->• 0, где v — скорость собственного движения, с — скорость света. Подобных примеров много. Они иллюстрируют важную сторону развития естественных наук. Появление большого ко- личества «асимптотических» моделей говорит о зрелости науч- ной дисциплины, о глубоких логических связях между отдель- ными явлениями, познанными в рамках данной дисциплины. Сегодня математическое описание, построение математиче- ских моделей охватывает чрезвычайно обширные области зна- ния, и выработано немало принципов и подходов, носящих в современных условиях уже достаточно общий характер. Оста- новимся на этом подробнее. Основная задача научного анализа — выделить реальные движения *) из множества мысленно допустимых, сформулиро- вать принципы их отбора. Проблема математического модели- рования состоит в описании этих принципов отбора в тех тер- минах и переменных, которые наиболее полно характеризуют изучаемый предмет. Принципы отбора сужают множество до- пустимых движений, отбрасывая те, которые не могут быть реализованы. Чем более совершенна модель, тем уже стано- вится множество реальных движений, тем точнее оказывается прогноз. В различных областях знания принципы отбора дви- жений разные. После появления работы Ф. Энгельса «Анти-Дю- ринг» стало принятым различать три уровня организации , ма- *) Здесь и далее термин «движение» употребляется в широком смысле — изменение вообще, всякое взаимодействие материальных объектов.
$ 2. ПРОБЛЕМЫ МОДЕЛИРОВАНИЯ 139 терии: неживая материя, живая материя и самая высокая орга- низация материи — мыслящая, познающая себя материя —об- щество. Такое деление оправдано' качественно различными принципами отбора реальных движений, не сводимыми к прин- ципам нижних уровней организаций. На самом нижнем уровне — уровне неживой материи — основными принципами отбора являются законы сохранения ве- щества, импульса, энергии и т. д. Любое моделирование должно начинаться с выбора исследователем основных (или, как гово- рят, фазовых) переменных, с помощью которых он.записывает законы сохранения. Но законы сохранения не выделяют единственного движения • и не исчерпывают всех принципов отбора. Необходимо учиты- вать второй закон термодинамики, принципы минимума дисси- пации энергии, устойчивости. Очень важны всякого рода усло- вия (ограничения): граничные, начальные и др. Законы сохранения являются в некотором смысле «абсо- лютными», но их недостаточно. Они не обеспечивают однознач- ности возможных движений. Другие принципы отбора произво- дят дальнейшее сужение множества возможных движений. • Принцип минимума диссипации энергии отбирает, например, из числа возможных движений, подчиняющихся законам сохра- нения, те движения, реализация которых приводит к минималь- ному росту энтропии. Принцип устойчивости приводит к тому, что исследователь может сосредоточить свое внимание на изу- чении лишь тех форм движения, характерное время существова- ния которых достаточно большое, и т. д. Между принципами отбора существует определенная «иерар- хия». Изучение турбулентности показывает, например, что су- ществует лишь та ее форма, которая, будучи устойчива, одно- временно приводит к минимальной скорости роста энтропии. Построение модели и ее последовательная разработка опи- раются на принципы отбора и, в свою очередь, формируют новые принципы отбора, т. е. те законы, выйти за рамки которых изу- чаемый процесс не может. На уровне живой материи все прин- ципы отбора движений, справедливые в неживой материи, со- храняют свою силу*). Поэтому и здесь процесс моделирования *) Тот. факт, что законы, справедливые для неживой материи, сохраняют стою силу и для живой материи, долгое время был предметом дискуссий. Особенно много трудностей вызывал второй закон термодинамики. Этот во- Врос был решен в тридцатых годах Л. Берталанфи, который, по-видимому, Первым показал, что живые существа являются открытыми системами. Этр означает, что они не могут существовать без обмена веществом и энергией с окружающей средой (этим-то и объясняются наблюдаемые у ни-х уменьше- ния энтропии). Эти исследования составляют основной вклад Берталанфи в биологию и «теорию систем» (см. книгу [21]).
140 ГЛ. IT I КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ начинается с записи законов сохранения. Однако основные пе- ременные оказываются уже иными. Пусть, например, речь идет о какой-либо биологической макросистеме. Основное содержание происходящих в ней про- цессов— существование сообществ биологических видов. Впер- вые систематически динамику подобных' систем начал изучать итальянский математик В. Вольтерра. Наиболее характерными для таких систем являются процессы потребления пищи. Зна- чит, законы сохранения вещества и энергии должны быть вы- ражены в терминах трофических связей — кто кого ест и в каком количестве. Именно вывод этих соотношений и их- исследование составляют содержание книги [3]. Но тех принципов отбора реальных движений, которые свой- ственны неживой природе, недостаточно, чтобы объяснить со- держание процессов, .происходящих в живом мире. При функ- ционировании живых организмов происходит отбор движений (конечно, согласно законам неживой'материи), которые не яв- ляются следствием законов сохранения, определяющих течение процессов в неживой природе. Здесь дело осложняется тем, что живой материи свойственны целесообразные действия, поэтому объяснить наблюдаемое в живом мире без использования поня- тий обратной связи и информации оказывается невозможным. В дальнейшем изложении мы будем часто использовать термин «гомеостазис». Существует несколько его определений, заметно отличающихся друг от друга. Мы условимся называгь областью гомеостазиса организма (или областью стабильности) ту область внешних параметров (параметров среды), внутри которой возможно существование организма. Живой организм стремится сохранить свою стабильность — гомеостазис. Это означает, что при различных внешних условиях он должен вести себя так, чтобы его состояние не вышло из той области параметров, которая обеспечивает возможность про- должения существования организма. Любой живой организм об- ладает рецепторами (датчиками),’позволяющими ему оценить свое положение по отношению к границе гомеостазиса (век- тор х), и способностью к определенным действиям (вектор и). Таким образом, получая информацию (сигнал) об окружающем его мире, он формирует свои действия в зависимости от харак- тера этой информации. Последнее означает, что действия жи- вого организма, т. е. реальные движения, выбираются вполне определенным образом — с помощью обратной связи (2.1). организм стремится уйти от своей гомеостатической границы. Это означает, что живой организм обладает вполне определен- ным поведением: он способен изменять свое положение по от-
$ 2. ПРОБЛЕМЫ МОДЕЛИРОВАНИЯ 141 ношению к границе области гомеостазиса, он способен изме- нять в определенных границах свои внутренние характеристики, меняя тем самым структуру области гомеостазиса. В известных условиях организм может изменять и сами характеристики окружающей среды. Стремление сохранить свой гомеостазис порождает вполне определенные механизмы отбора реальных движений (поведе- ния), не выводимые из принципов, определяющих течение про- цессов в неживой природе. Вопрос о возможности объяснить явления, наблюдаемые в живом мире, с позиций физики (или химии) носит название проблемы редукционизма. Она имеет большую историю. Работы Берталанфи внесли определенный вклад в ее решение. Они, во всяком случае, показали,, что законы физики нельзя игнориро- вать при изучении процессов, происходящих в живой природе, но не больше. Проблема редукционизма до сих пор открыта. И в этих вопросах мы вынуждены следовать принципам В. И. Вер- надского, который, обсуждая проблемы развития жизни на Зем- ле' и влияние этого развития на эволюцию Земли как системы, не мог, конечно, пройти мимо проблемы возникновения жизни. И он лучше, чём, может быть, кто-то другой, понял, сколь слож- на эта проблема. Осознавая, что ее исследование вряд ли ему доступно, В. И. Вернадский предлагал считать, что эта про- блема находится за кадром той дисциплины, тех исследований, которыми он занимался. Он считал необходимым констатировать существование жизни, и только!' Только благодаря такому ис- кусственному сужению предмета исследований, благодаря вве- дению своеобразного постулата В. И. Вернадскому удалось построить одну из самых выдающихся системных конструкций современного естествознания — биогеохимию. Мы находимся примерно в таком..же положении. Мы можем только констати- ровать наличие определенных механизмов, без которых пред- ставить существование и функционирование биологических мак- росистем невозможно, а вопрос о том, как они связаны с прин- ципами отбора, с законами, найденными в физике и химии, считать находящимся за кадром системного анализа (точнее, тех его вопросов, изучением которых мы занимаемся). Итак, описать функционирование любой живой системы мы не можем без использования обратных связей. Подчеркнем еще раз, что связи вида (2.1) называются обратными связями лишь Тогда, когда они не могут быть выведены из общих законов физики. Это обстоятельство не всегда правильно понимается, и термин «обратная связь» в системном анализе часто исполь- зуют также для тех связей, которые могут быть выведены, на- пример, из законов, сохранения. Здесь й далее, когда мы гово- рим об обратных связях, мы имеем в виду только те связи,
142 ГЛ. III. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ которые носят целесообразный или целенаправленный харак- „ тер. Поэтому употреблять термин «обратная связь» для опи- сания каких-либо явлений, происходящих в мире неживой ма- терии, смысла не имеет: любой термин следует использовать лишь тогда, когда без него нельзя обойтись. Примечание. Понятие «обратная связь» родилось в технике. И здесь его использование вполне уместно, ибо технические системы — это порождение целенаправленной деятельности человека. Технические системы можно рас- сматривать как четвертый уровень организации материи — неживая материя, созданная целенаправленной деятельностью людей. Поэтому понятия инфор- мации, обратной связи вполне уместны при описании технических систем. На- пример, структура обратной связи, реализуемой автопилотом, — следствие не законов сохранения, а замысла конструктора. Биологические системы относятся к классу управляемых си- стем рефлексивного типа. Управляемых — потому что они со- держат свободные функции, находящиеся в распоряжении этих систем, и используют их для достиженйя своих целей, а реф- лексивного типа — в силу рефлексности функций поведения. Термин «рефлексивный» подчеркивает простоту зависимости управляющей функции от информации (рефлекса от возбужде- ния). Этот термин введен в науку биологами и прежде всего школой И. П. Павлова, и мы будем использовать его именно в этом исходном смысле. При описании функционирования биологических форм орга- низации материи большую роль играет понятие «организм». Организмом мы называем любую систему, обладающую соб- ственными целями и способностью (ресурсом) для их достиже- ния, т. е. целенаправленными действиями. Только организм ' способен индуцировать петли обратных связей. Отдельный индивид является организмом. Это очевидно. Определенные особенности организмов проявляют, например, и группы животных. Оказывается, что и популяцию в известных условиях можно рассматривать как организм [36]. Любая био- логическая макросистема всегда является иерархической систе- мой. При анализе легко обнаруживается, что цели более высо- кого иерархического уровня, как правило, не тождественны целям нижнего уровня. Например, интересы стада в целом (т. е. гомеостазис) не тождественны стремлению сохранить ^гомеоста- зис отдельного животного. Более высокие иерархические уровни уже нельзя считать организмами. Например, биогеоценоз (эко- система), вероятно, не является организмом," хотя и можно говорить о гомеостазисе биогеоценоза. Однако он, по-видимому, .не обладает необходимой потенцией для организации верхней петли обратной связи, т. е. целесообразного использования ре- сурсов для сохранения гомеостазиса биогеоценоза в целом. Но' это вовсе не означает, что описать динамику экосистемы можно
§ 2. ПРОБЛЕМЫ МОДЕЛИРОВАНИЯ 143 без использования понятия обратной связи, ибо экосистема со- стоит из большого количества организмов. Тот факт, что описать функционирование любой живой ор- ганизации без использования понятия «обратная связь» нельзя, стал известен достаточно давно,, по крайней мере до того, как появился сам термин «обратная связь». Во всяком случае в 1911 г. этот факт был уже известен А. А. Богданову. Принцип обратной связи в современных терминах был сформулирован в 1931 г. создателем биокибернетики П. К. Анохиным. Примечание. Таким образом, претензии Н. Винера на то, что именно он ввел принцип обратной связи в теорию биологических систем, кажутся, по меньшей мере, неосновательными. Итак, при описании биологических макросистем мы должны основываться на законах сохранения и системе обратных свя- зей, которые ча'сто называются функциями поведения. На рбщественном уровне организации материи возникает со- вершенно новое явление — трудовая деятельность. Именно по- этому для описания моделей в этой области мы должны поль- зоваться терминами трудовой деятельности людей (экономи- ческими терминами). В качестве примера рассмотрим известные балансовые соотношения производства. Обозначим через х вектор производимой продукции. Его компоненты — это количества отдельных видов произведенной продукции. Например, х1— это количество выплавленной стали, х*— цветных металлов, х3— металлорежущих станков и т. д. Через А=(а(/) обозначим матрицу прямых затрат, т._ е. вели- чина aij определяет количество продукции вида /, необходимое для производства единицы продукции вида i. Тогда очевидно следующее балансовое соотношение: х = Ах +' у, или, в координатной форме, х1 = £ацх1 + у1, I, j<=l, .... п. (2.2) Вектор у = {у1, .. •, Уп} называется вектором конечного про- дукта .(этот продукт может быть использован на инвестиции, потребление, отправлен на склад и т. д.). Соотношения (2.2) являются простейшей экономической мо- делью, так называемой моделью Леонтьева (по имени амери- канского экономиста В. В. Леонтьева, который впервые, еще в тридцатые годы, начал использовать модели подобного рода). Эта модель использует только законы сохранения (балансовые соотношения). Подобно моделям Вольтерра, балансовые мо- дели в экономике описывают потоки материи — материальных
144 ГЛ. Ill, КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ ценностей, продуктов. В настоящее-время существует обширная теория подобных (продуктовых)- моделей. Описывая процессы, протекающие на биологическом уровне организации, мы говорим о целесообразных действиях. Очевид- но, что при описании процессов, протекающих в человеческом обществе, следует говорить о действиях целенаправленных. Здесь мы также говорим об обратных связях, об информацион- ных процессах, которые при этом оказываются неизмеримо сложнее, чем в случае неживой материи. Заметим, что при описании процессов, протекающих в неживой материи,-у нас нет необходимости использовать термин «информация». Он воз- никает только тогда, когда может идти речь о целесообразных или целенаправленных действиях, т. е. только на уровне живой материи. В биологических системах мы имеем дело с очень простыми информационными процессами. Функции поведения рефлексного типа, которые описываются простыми функциональными зависи- мостями: < t реакция — f (сигнал^ по существу являются параметризацией информационных про- цессов, протекающих в биологических системах. Иное дело — процессы, протекающие в человеческом обществе. При их мо- делировании мы уже часто должны специальным образом опи- сывать процедуры обработки информации,.и не только потому, что эти, процессы могут быть достаточно длительными и слож- ными из-за объема информации, которая функционирует в си- стеме. Самое главное, наверное, состоит в другом. Человек на основе информации принимает решение, и связь сигнал — реак- ция уже не носит характера рефлекса. Она, во-первых, является сложным.оператором, и во-вторых, не однозначна. Нам прихо- дится сталкиваться с необходимостью учета субъективного фак- тора. Этими обстоятельствами трудности построения моделей, описывающих функционирование человеческих коллективов, не исчерпываются. Выше уже была отмечена роль понятия орга- низма и то, что организмом является не только каждое живое существо, но при известных условиях и группа живых существ, и даже популяция в целом. Но этими макрбсистемами практи- чески и исчерпывается «организмичность» биологического уров- ня организации. Иное дело — человеческое общество. Здесь практически любая группа людей, любой человеческий коллек- тив имеют свои цели и средства их достижения. (Особенное зна- чение приобретают сообщества, связанные с производственной деятельностью людей.) Интересы различных групп могут ока- зываться сильно отличающимися друг от друга. В предельном случае — в случае классов — эти интересы часто носят антаго-
$ 2. ПРОБЛЕМЫ МОДЕЛИРОВАНИЯ 145 нистический характер. Для того чтобы описать более или ме- нее адекватно реальности любой процесс, происходящий в об- ществе, мы необходимо должны уметь описывать сложнейшую гамму общественных интересов и противоречий. Классическая политэкономия дает блестящий пример такого-объединения чи- сто экономических и социальных начал, без которого понять суть общественных процессов и построить модель, обладающую хорошими прогностическими возможностями, видимо, нельзя. Ясно, что интересы (цели) различных групп связаны е их гомеостазисом, и поэтому здесь также уместно говорить о го- меостатических общностях. Но связи условий гомеостатической стабильности, целей, которые непосредственно влияют на ха- рактер решений принимаемых субъектами (мы отождествляем понятия организма и субъекта), с самими действиями, предпри- нимаемыми для достижения этих целей, как правило, весьма опосредовании. Ни о какой рефлексности здесь не может быть и речи. Человек обладает способностью анализировать проис- ходящие процессы,-предвидеть исходы своих действий, строить гипотезы о поведении других субъектов, предугадывать их дей- ствия и т. д. Поэтому обратные связи, которые возникают в человеческом обществе, не могут быть реализованы с помощью простейших функций поведения рефлексного типа. Математи- ческое описание этой нерефлексности — труднейшая проблема. Очень часто (скорее, как правило) мы не в состоянии форма- лизовать процессы общественной природы и должны использо- вать для их описания параметризацию в форме функций пове- дения, полученную на основе экспертных оценок. Неопределен- ности, с которыми мы сталкиваемся при описании таких процессов, приводят к необходимости создания специальной техники анализа, о которой мы уже говорили в предыдущих главах и которой, по существу, и .посвящена основная часть этой книги. . Несмотря на все трудности, математическое описание, т. в. математическое моделирование, превратилось в развитое науч- ное направление. Конечно, в разных областях человеческого знания модели играют различную роль. Если в физике и тех- нике исследование математических моделей — это один из основных методов исследования и проектирования, то в про- блемах изучения биологических и социальных макросистем математические модели служат не столько для получения точ- ных количественных характеристик, сколько для нахождения оценок, позволяющих видеть допустимые границы наших дей- ствий или возможности исследуемых процессов, тенденции их развития. Весьма велика роль математических моделей как единого языка описания, позволяющего структуризовать и ка- нонизировать усилия исследователей.'
146 ГЛ. III. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ . Подводя итог сказанному, рассмотрим сложившуюся в на- стоящее время некоторую условную классификацию математи- • ческих моделей по характеру и способу использования произ- вольных функций и параметров, которые они содержат. а) Модели без управления. Они описывают.динами-, ческие процессы (с помощью, например, дифференциальных или разностных уравнений), которые не содержат свободных пара- метров или функций, к их числу относится большинство чисто прогностических моделей, когда заданное начальное состояние определяет траекторию процесса. Модели такого рода могут быть и стохастическими, например, они могут содержать слу- чайные величины и функции: x = f(x, t, |), где g— некоторый случайный вектор с известным законом рас- пределения. В э.том случае нас будут интересовать не отдельные траектории, а их статистические свойства, например среднее значение. Модели подобного рода являются типичными для описания процессов, происходящих в неживой природе. б) Модели, которые могут быть использованы для оптимизации некоторых д^ й с т в и й. Рассмот- рим динамический процесс, модель которого описывается урав- нением вида x = f(x, t, и), (2.3) где выбор функции u(t, х) находится в распоряжении какого-то субъекта. Вектор-функция u.(t,x) называется управлением. Управление выбирается из условия достижения некоторой цели. Весьма распространенный класс задач с помощью данной мо- дели можно описать следующим образом: за время Т перевести систему из состояния х(О) = хо (2.4) в состояние 'х(Т) = хт (2.5) * так, чтобы «затраты» были минимальными, т. е. т F(x, и, /)(//-> min. (2.6) о Ограничения (2.4), (2.5) и целевую функцию (2.6) мы не включаем в понятие модели. Для одной и той же модели (2.3) могут ставиться разные задачи. Обсуждению моделей подобного рода была посвящена пре- дыдущая глава.
§ 3 КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ 147 в) Модели, которые могут использоваться для анализа конфликтных ситуаций. Предположим, что динамический процесс определяется действиями нескольких субъектов, в распоряжении которых имеются управления: и, v, w, ... Тогда . i = f(x, I, и, v, w, (2*7) причем управления будут выбираться из условий вида г и, v, w, ..., о т' и> w> •••» о каждое-из которых отражает вполне определенные интересы того или другого субъекта. Анализ подобных моделей требует создания специального аппарата. Они описывают класс систем, которые мы назовем кибернетическими. Им будет посвящен следующий параграф. Но оказывается, что описанными типами моделей еще не охватывается большое количество ситуаций, необходимость изу- чения которых и привела к появлению дисциплины, именуемой системным анализом, — это ситуации, которые не могут' быть полностью формализованы и для изучения которых необходимо включение в математическую модель функционирующего «био- логического» звена — человека (эксперта). § 3. Кибернетические системы В предыдущем параграфе мы уже ввели понятие кирберне- тических систем. Этим термином мы назвали класс систем, ко-, торые являются обобщением управляемых систем. Еслипри описании управляемой системы мы предполагали, что с систе- мой ассоциирован какой-либо один субъект (оперирующая сто- рона или исследователь), то с кибернетической системой будет уже ассоциирована целая группа субъ^стов, обладающих соб- ственными целями. Когда мы говорим об управляемой системе, то самая глав- ная ее особенность, которую мы имеем в виду, состоит в том, что в системе существуют свободные функции, которыми может распорядиться в своих интересах суоъект, ассоциированный с системой. Система может быть динамической (описываться диф- ференциальными или разностными уравнениями) или статиче- ской, но она остается управляемой по существу. Точно так же
148 гл. ПТ. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ кибернетическая система отличается прежде всего существова- нием многих субъектов, каждый из которых имеет возможность оказывать влияние на систему в целом, изменять характер ее движения в своих собственных интересах. Это главное. Говоря о кибернетических системах, мы будем чаще всего описывать их дифференциальными уравнениями или рассматривать част- ный случай статических задач. Но многое из того, что будет сказано, относится и к тому случаю, когда 'эволюция таких си- стем описывается разностными уравнениями. ' Итак, кибернетической системой мы будем называть систему (2.7): , x = f(x, I, и, v, w, ..., £), (3.1) где и, v, w, ... — управляющие функции, находящиеся в рас* поряжении различных субъектов, но в отличие от (2.7),' рас- смотрим более общий случай — правая часть (3.1) содержит еще случайную вектор-функцию £(/). При изучении управляемых систем мы всегда пользовались описанием, которое отражало уровень знаний исследователя и субъекта, т. е. всегда было субъективным. Поскольку модель может дать лишь приближенное описание, то, отождествляя ее с изучаемым процессом, мы всегда делаем известное предполо- жение— формулируем гипотезу о соответствии модели изучае- мому процессу. Следовательно, уже при изучении управляемых систем' мы пользуемся субъективным описанием, ибо гипотеза формулируется субъектом, отражает его представления, его ин- формированность. С кибернетической системой ассоциирован целый ряд субъ- ектов, каждый из которых имеет собственное представление о системе, и эти представления отнюдь не являются тождествен- ными. Следовательно, при изучении кибернетических систем тем более не может быть никакого «объективного описания», и изучение кибернетических систем может проводиться лишь с позиций определенного субъекта, основываться на его целях и его представлении о ситуации. Заметим, что в реальных системах подобного типа не су- ществует звена (элемента), где бы концентрировалась вся «объективная» информация о системе. При изучении управляемых систем мы обращали внимание на то, что субъекту приходится в условиях неопределенности принимать определенные гипотезы об’окружающей обстановке, действующих силах и т. д. При анализе кибернетических систем эти гипотезы сильно усложняются. Для того чтобы, например, сделать просчет какой-либо траектории системы, мы должны не только задаться той или иной «моделью обстановки», т. е. сфор- мулировать гипотезы о природе вектор-фулкций £(/), но и еде-
5 3. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ 140 лать какие-то предположения о величинах управляющих воз- действий, которые находятся в распоряжении других субъектов. На основании каких же посылок мы можем предугадать дей- ствия других субъектов? Мы будем исходить из того предположения, что у каждого субъекта существует некоторая объективная цель. А. если такая цель существует, то ее обычно можно сформулировать в терми- нах максимизации некоторого функционала. Для субъекта но- мера I эту цель мы будем записывать в виде /<-> max. J-io дело в том, что эту цель мы, как правило, точно не знаем. Более того, ее может не знать и сам субъект номера I (вспо- мним рассуждения о неопределенности целей). • Теперь предположим, что мы тем или иным образом сфор- мулировали гипотезу о характере целей субъектов. Этого мало. Действия субъекта, т. е. величины его управляющих воздей- ствийг- будут еще зависеть от его информированности. Кроме того, очень важно знать, что думают другие субъекты киберне- тической системы о целях тогб субъекта, с позиций которого ведется анализ, на базе какой информации они принимают ре- шения, что они знают о его информированности и т. д. Таким ' образом, в отличие от обычных управляемых систем, выбор «на- шего» управления, например u(t), будет определяться не только «нашей» целью . - Ji~*max и заданием обстановки (т. е. £(/)). Мы должны изучить усло- вия различного вида рефлексий,' их влияние на окончательный результат принятого решения *и многое другое. В настоящее время изучается уже довольно много разных типов систем, но построить теорию, которая была бы достаточно общей, наверное, пока еще не представляется возможным. По- этому особое значение приобретает выделение классов систем, для изучения которых можно использовать некоторые более •Или менее общие подходы, об общих свойствах которых можно говорить. Здесь мы опишем несколько систем, более или менее соответствующих подобным требованиям, — это системы, обла- дающие иерархической структурой, и системы гермейеровского типа. а) Причины, обусловливающие необходи- мость введения иерархических структур. Иерар- хия в системе предполагает определенное «неравноправие» — ^Подчинение одних элементов системы другим. Понятия «нерав- ноправие», «подчинение» требуют, конечно, уточнения и коммен- тариев.
150 ГЛ. III. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ Сам термин «иерархическая организация» (или «иерархиче- ская структура») употребляется при весьма различных обстоя- тельствах. Иерархические системы широко распространены в технике: например, сложная система связи, система обработки данных, система управления транспортом и многие другие всегда организованы по иерархическому принципу, который позволяет выполнять параллельно различные операции, работать с от- дельными информационными массивами и т. д. Необходимость иерархической организации в технических системах следствие их сложности, когда централизованная обработка информации либо просто невозможна, либо требует такой затраты времени (или средств), которая недопустима по техническим условиям. Термин «иерархия» употребляется в словосочетании с терми- ном «управление» — например, «иерархическая система управ- ления». Основная задача иерархической организации — распре- деление функций обработки информации и принятия решений между-отдельными элементами системы. Если объем информа- ции, необходимый для принятия решения, невелик, то нет необ- ходимости и в создании какой-либо системы распределения Обязанностей по принятию решений: они могут выполняться централизованно. Любая структура — это дополнительные ограничения, в об- щем случае сужающие множество допустимых стратегий. Обо- значим через f(x) целевую функцию системы. Тогда очевидно, что max f (х) max f (х), (3.2) хе Q' Xf=G если только G' с: G. Поэтому отказ от полностью централизованной системы управления (преднамеренное сужение множества стратегий (?) должен быть обоснован какими-то дополнительными обстоя- тельствами. Для этого, в частности, необходимо более подробно изучить структуру информационных процессов и зависимость качества информации от организационной структуры системы. Обозначим через f(«, g) целевую функцию, которую мы хо- тим максимизировать. Вектор и = {«ь ит} — это вектор управления, £ — переменная, характеризующая неопределен- ность. Пусть в условиях полной централизации и е Gu и при этом имеется некоторый уровень неопределенности £ е (?t. Сле- довательно, гарантированная оценка значения целевой функции будет иметь вид f*=max min f(u, g). • (3.3) u e Gu 5 e Предположим теперь, что мы ввели в систему иерархическую структуру управления. Это значит, что мы распределили функ-
§ 3. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ 151 ции управления по отдельным звеньям. Другими словами, от- дельные решения будут теперь приниматься по ограниченной информации, без использования всего объема сведений. Напри» мер, в системе управления транспортом мы можем представить себе полную централизацию, когда выбор решения, например составление расписания, будет проведен- с учетом состояния дел на всех дорогах, всех станциях и разъездах. В принципе мы можем провести подобные расчеты и создать «оптимальное расписание», но для его составления потребуется столько вре- мени, что в момент, когда расйисание будет готово, необхо- димость в нем уже исчезнет. Поэтому мы вынуждены состав- лять расписание для отдельных дорог или узлов, используя лишь ограниченную информацию, касающуюся только этих объектов. Следовательно, распараллеливая обработку информа- ции, распределяя ее между отдельными звеньями, мы можем принять решение, игнорируя более сложные зависимости, на- пример ситуацию на соседней дороге. Значит, мы переходим к более узкому множеству стратегий G' cz G. Но одновременно происходит и уменьшение уровня неопределенности. При де- централизованной обработке информации мы можем отдельные ее массивы обрабатывать более подробно,- т. е. можем умень- шить уровень неопределенности и повысить качество информа- ции. Значит, теперь g s G( с: G$, и мы получим уже другую гарантированную оценку! f = max min f (и, g). (3.4) При этом вопрос о том, рационально ли вводить в систему управления данную структуру или нет, решается в конечном Счете сравнением величин типа (3.3) и (3.4). Таким образом, проблема оценки иерархической организа- ции сводится к сопоставлению двух противоречивых тенденций. Переход к иерархической структуре сужает множество страте- гий, но одновременно и снижает уровень неопределенности, т. е, делает возможным получение более качественного решения. Выбор структуры системы, обладающей иерархической фор- мой организации, встречает одну трудность. Количество воз- можных архитектурных форм составляет некоторое конечное множество. И проектируя систему, мы должны одновременно выбрать и стратегию (определить значения управляющих функ- ций), и наилучшую «архитектуру» организации. Итак, вариан- тов допустимых иерархических структур обычно бывает не- сколько. Мы говорим о том, что существует некоторое дискрет- ное множество структур S. Если угодно, S — это множество проектов. Каждому проекту — элементу $ е S — отвечают свое
152 ГЛ III. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ множество стратегий use и свое множество неопределенно* стей G|. Этим множествам отвечают свои гарантированные оценки результата Г = max min f (и, |), Я употребил слова «в конечном счете», поскольку, прежде чем и задачу проектирования иерархической структуры мы можем в конечном счете сформулировать как задачу отыскания эле- мента s е S. который решает задачу fs-> max*), ' (3.5) $€8S решать задачу (3.5), мы должны еще построить само множе- ство S. И если решение задачи (3.5) носит в определенной степени формальный характер, то построение множества S — множества возможных «конструктивных схем», — как правило, носит характер некоторого изобретения и не является фор- мальный. Итак, в результате проектирования иерархической системы -управления в технических системах мы произведем распреде- ление функций принятия решения между отдельными звеньями системы. При этом вместе с описанием «заданий» мы должны сформулировать (спроектировать) определенный-алгоритм, т. е. систему правил обработки информации и правил выбора реше- ния на основе полученной информации. В результате мы полу- чим некоторую систему рефлексного типа. , Примечание. Заметим, что звеньями этой системы будут скорее всего люди, например диспетчеры. Тем не менее этим лицам в технических системах предписаны вполне определенные правила поведения, отклонения от которых можно рассматривать (без больших натяжек) как дополнительный «шум», по- вышающий уровень неопределенности. Нерефлексность «биологических» звень- ев в технических системах обычно можно-не учитывать. Следовательно, рас-. Вределив «задания» между звеньями технической системы, мы можем ожи- дать их невыполнения либо вследствие неисправности звеньев (в том числе и плохой работы операторов или диспетчеров), либо вследствие появления не- предусмотренных внешних помех. С совершенно иной ситуацией мы сталкиваемся при проек- тировании иерархических структур управления производствен- ными, народнохозяйственными или любыми другими социаль- ными системами, в которых главным объектом управления яв- ляются не машины, а люди, где в полной мере проявляется нерефлексная природа социальных систем. *) Изложенная схема оценки качества организационной структуры отно- сится к техническим (рефлексным) системам. Перенос этих рассуждений на нерефлексные системы требует, как мы увидим ниже, дополнительных гипо- тез и машинного эксперимента с помощью имитационной системы.
15» § 3. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ Причины, порождающие необходимость создания в социаль- ных системах иерархических структур управления, в принципе те же, что и в технических, — невозможность централизованной переработки информации. В результате невозможность перера-- ботать за заданное время нужным образом информацию (обо- сновать решение) приводит к тому, что решения оказываются недостаточно продуманными, что эквивалентно высокому уров- ню неопределенности. Поэтому приходится распараллеливать обработку информации и «делегировать» права принятия реше- ния нижним звеньям иерархии. Например,. директор треста , совхозов какого-нибудь боль- шого региона не может знать деталей обстановки в каждом из совхозов с той степенью подробности, как это знают директора отдельных совхрзов. И поэтому решения, которые могут при- нять эти директора, будут более обоснованными (с точки зре- ния тех целей, к которым они будут стремиться), чем решение, принятое на верхнем уровне. Отсюда и возникает необходимость, в определенной децентрализации принятия решений, т. е. де- -централизации управления. Однако вместе с децентрализацией в системе возникает и целый ряд особенностей, которые в прин- ципе снижают эффективность функцйонирования системы. Пре- жде всего, так же как и в технических системах, происходит сужение множества стратегий, связанное с тем, что нижние звенья работают толькр-х частью информации..Но, кроме того, в социальных системах возникают еще новые обстоятельства, качественно усложняющие анализ. Как только отдельной части организма «делегируются» пра- ва по принятию решений, она приобретает определенные воз- можности достижения собственных целей, которые ей объек- тивно присущи, т. е. становится самостоятельным организмом, и неизбежно возникают определенные противоречия между частью и целым. Если в технических системах мы выделяем, например, неко- торый ресурс какому-либо из звеньев системы, то одновременно мы определяем способ его использования. Этот способ при дан- ных конкретных условиях, которые станут известны в опреде- ленный момент диспетчеру (или автомату), должен обеспечить максимальную эффективность системы в целом. Наша задача как проектировщиков технической системы управления — опре- делить этот способ использования ресурса (например, составить, диспетчерский график функционирования водохранилища в за- висимости от особенностей паводка, которые станут известны к моменту начала паводка). Иное дело — социальные системы. Конечно, и здесь мы мо- жем предложить (спроектировать) те или иные рецепты ис- пользования выделенных ресурсов. Но нельзя не считаться е
164 ГЛ. III. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ тем, что нижние звенья приобрели все особенности организма й им присущи собственные цели и интересы, к которым они будут стремиться, используя приобретенные возможности. Зна- чит, и управлять этими системами надо иначе, чем техниче- скими, с учетом объективных особенностей, которыми обладают социальные системы. Вопрос о возникновении объективных целей у социальных групп и систем очень сложен. В конечном счете он так или иначе связан с гомеостазисом. Но все эти связи очень опосре- дованны, преломлены через призму традиций социальной ин- фраструктуры, и проследить их далеко не просто. Эта проблема ждет еще своего глубокого философского и социального ана- лиза. Но в тех конкретных ситуациях, с которыми имеет дело исследователь вполне определённой системы,- подчас можно из- бежать анализа этих трудных вопросов и более или менее точно назвать основные цели. При этом надо всегда помнить о су- ществовании противоречий, о том, что любая сформулирован- ная цель является- известным компромиссом. Да и создание самой иерархической структуры в социальных системах — это тоже всегда некоторый компромисс. Я подробно говорил о роли информации при создании иерар-, хических систем. Но можно привести и другой аргумент в пользу их создания. Субъекты объединяются в иерархическую структуру, потому что это им «выгодно»: ограничивая свои желания, они при этом лучше обеспечивают свою стабильность. Например, интересы (цели) какого-либо отдельного пред- приятия (организации) — это всегда результат разрешения про- тиворечий между верхним уровнем, например объединением, в которое входит предприятие, и самим предприятием. Руководствуясь подобными соображениями, во многих кон- кретных случаях уже можно с более или менее удовлетвори- тельной точностью перечислить цели изучаемого организма. Примечание. При описании кибернетических систем (особенно в про- цессе формирования гипотез поведения субъектов системы) неизбежен высо- кий уровень неопределенности. Это отсутствие четкости в постановке матема- тических задач всегда следует иметь в виду, выбирая метод исследования. б) Возможные схемы иерархических органи- заций. Простейшей схемой иерархической организации си- стемы управления является так называемая двухступенчатая веерная структура (рис. 3.1). Этот термин определяет систему, в которой существует один привилегированный субъект, кото- рый имеет возможность управлять остальными субъектами. По- ясним содержание этого термина. Некий субъект, впредь име- нуемый Ц (Центром), стремится достичь определенных целей, которые мы будем описывать так: F(xh ..., xN, yi....#y)->max. . (3.6)
« 3. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ . .155 Здесь xi — управляющие воздействия Центра на отдельные звенья П\, Пн, которые мы условимся называть Произво- дителями. Они обладают собственными целями: fi(xh yt)-* max . (3.7} Таким образом, интересы Производителей определяются вели- чинами yt, которые находятся в их собственном распоряжении, и величинами Xi, которыми распоряжается Центр. В этой про- стейшей схеме предполагается, что значение целевой функции Производителя номера i не зависит от действий других Произ- водителей*). Неравноправие субъектов проявляется в том, что именно Центр назначает правила формирования воздействий х,-, кото- рые зависят тем или иным образом от действий Производителей (от их выбора величин yi), и Производителям эти правила становятся известными в тот момент, когда они принимают ре- шения о выборе величин yi. Тем самым Центр в иерархических системах описанного типа имеет возможность (которая иногда называется правилом первого хода) направлять в нужное русло усилия нижних звеньев. Заметим, что в описанной схеме Центр передает определенную информацию нижним звеньям, — это для него может оказаться выгодным. Говоря об оптимальном управлении в иерархических систе- мах, мы имеем в виду такой выбор xi, который предполагает при данных значениях функций fr, характеризующих интересы отдельных звеньев, максимизацию целевой функции (3.6). Естественным обобщением двухступенчатой является мно- гоступенчатая иерархия. На рис. 3.2 изображена возможная схема трехступенчатой иерархической организации. Целевая функция Центра Цо будет иметь вид , F^F(xi, .... xk, yi, ук), *) Веерная иерархия является самой изученной из иерархических струн* тур. См., например, [5, 8, 44, 45].
166 ГЛ. НТ. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ где xi, ...» хк — управления, которые находятся в' распоря- жении центра До (воздействия Центра Цо на элементы Дъ Целевые функции последних будут иметь вид fi — fi(ул» •••*» Уш? zn>...2«;)> t=l, 2, ..., k, где уц — это управление Hi (Центра номера I): его воздей- ствие на Пц (Производителя номера /, подчиненного Ui). И наконец, целевые функции Производителей Пц будут = «</). k\ i=*\, .... Nt; где величины Zu характеризуют действия Производителей. Пер- вый ход в этой иерархической структуре делает Центр Цо —он сообщает правила назначения управляющих воздействий Цент- рам Hi в зависимости от их выбора (от их действий). Следую- щий ход делается Центром Hi (/ = 1, 2, .... k), который со- общает правила выбора воздействий уц. В этих схемах предполагается, что обмен информацией ндег только вдоль иерархической лестницы: звенья одного и того же уровня информацией не обмениваются. Могут быть рассмотрены и такие обобщения описанных структур, где возможен опреде- ленный уровень обмена информацией. Изучение реальной жизни сталкивает нас с самыми неожи- данными формами иерархической связанности, отражающими сложность и взаимообусловленность разнообразных процессов общественной природы, производства и многообразие интересов общественных и производственных организмов. Рассмотренные иерархические структуры отражают важные особенности отрас- левого управления: отрасль подчиняется государству и/ в свою очередь, распадается на главки, тресты, отдельные предприя- тия. Иерархия веерного типа встречается в системах управле- ния войсками (откуда, вероятно, она и -перекочевала в хозяй-
$ 3. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ 157 ственное управление). Конечно, в реальной жизни'она бывает более сложной. Мы сталкиваемся и с неизбежным обменом ин- формацией в нижних звеньях, и с передачей информации через несколько уровней иерархии. Тем не менее описанные схемы охватывают основные особенности широкого класса иерархиче-. ских форм взаимодействия субъектов в реальных кибернети- ческих системах. Поэтому их изучение в последнее десятилетие превратилось в большое самостоятельное направление приклад- ной математики и системного анализа. - ’ Но схемы веерного типа, конечно, не исчерпывают всего мно- гообразия возможных схем иерархической связанности. В по- следние годы важное значение стало приобретать изучение иерархических организаций так называемой ромбовидной струк- туры. Любое предприятие находится. в довольно сложных, конф- ликтных отношениях с другими членами иерархической органи- зации. Прежде всего, оно подчиняется отрасли — является зве- ном отраслевого управления. - Но одновременно предприятие, которое находится на территории того или иного города, райо- на, является и элементом региональной инфраструктуры. Дру- гими словами, оно входит и в иерархию региональной системы Рис. 3.3. управления. Ситуация, в которой находится предприятие, схема- тично представлена на рис. 3.3. Подобные структуры называют- ся ромбовидными. Направление стрелок показывает направле- ние, «подчиненности». Верхний уровень располагает определенными возможностя- ми влиять на действия второго уровня, т. е. отраслевого и регионального управлений. В свою очередь, отрасль может ока- зывать управляющие воздействия на деятельность Производи- теля и практически почти не способна оказать влияние на ре- шения, которые принимаются на региональном уровне. То же
158 • ГЛ. HI. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ самое можно сказать н о региональном управлении. Оно имеет разнообразные возможности влиять на характер решений, при- нимаемых на уровне предприятий, расположенных в данном регионе, и практически лишено возможности влиять на реше- ния, которые принимаются на уровне отрасли. Что касается Производителя, т. е. предприятия, то его руководство всегда должно принимать решение в условиях определенного конф- ликта: с одной стороны, его действия ограничены региональным и отраслевым управлением, а с другой стороны, оно имеет свои собственные интересы, являющиеся следствием сложившихся производственных отношений, правовых и юридических норм и многих других факторов, определяющих жизнь и развитие об-, щества. На рис. 3.3 изображена лишь самая простая из возможных схем ромбовидной иерархии. Так, например, государство может декретировать определенные условия функционирования от- дельного предприятия, т. е. непосредственно влиять на харак- _ тер решений, принимаемых на нижнем уровне, отдельные ром- бовидные структуры могут взаимодействовать и т. д. Тем не менее схема, изображенная на рис. 3.3, отражает многие важ- ные черты реальной, часто встречающейся на практике иерар- хической структуры. Сегодня теория ромбовидной иерархии уже стала объектом многих исследований .(см., например, [33]). Интерес к подобным исследованиям мотивируется реалистич- ностью постановки .задачи. Иерархия государственного управ- ления необходимо представляет собой ячеистую структуру, ка- ждая ячейка которой является ромбовидной структурой: реаль- но й отраслевое, и региональное управления. Одним из вопросов большой народнохозяйственной значимости является проблема организации управления по отраслевому или региональному принципу. Обе эти схемы не противоречат друг другу. Речь должна идти о рациональном сочетании обоих типов управле- ния, о разумном (можно при известных условиях говорить: оптимальном) распределении прав и обязанностей между раз- личными звеньями иерархии. Мы описали несколько возможных схем иерархически орга- низованных систем. Все они основаны на признании объектив- ности интересов отдельных звеньев, на противоречии -целого и .части. Это кардинальный пункт построения теории иерархиче- ских систем, и, по мнению автора, он является ключевым для понимания тех отправных позиций, которые позволят исследо- вать механизмы, определяющие развитие экономических, эколо- го-экономических и других социальных систем. . в) Системы Гермейера. До сих пор мы рассматривали кибернетические системы с иерархической организацией — их участники не были равноправны. Однако существует обширный
§ 3. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ 159 класс кибернетических систем, в которых все субъекты равно- правны и в которых какая-либо иерархия отсутствует в прин- ципе. К их числу относятся, например, все кибернетические си- стемы, которые описывают международные конфликты, эволю- цию экологических условий и многое другое. Функционирование таких систем' требует принятия коллективных решений, поэтому они не могут быть описаны с помощью иерархических схем. В первой главе мы уже начали изучение систем, требующих принятия коллективных решений, и указали трудности, которые здесь возникают. Главная проблема в теории подобных си- стем— найти разумные условия компромисса. Было показано, ЧТОэодним из основных принципов является принцип Парето: компромисс должен быть эффективным. Но принадлежности к множеству Парето' еще недостаточно для формирования ком- промисса. Мы говорили также и о принципе устойчивости Нэша. Если компромисс удовлетворяет принципу Нэша, то субъектам, принявшим компромисс, невыгодно отступать от своих обяза- ’ тельств. В этом случае еубъект, который нарушит условие ком- промисса, будет нести потери. В огромном большинстве конфликтных ситуаций, описанных в литературе, устойчивые' компромиссы не являются паретов- скими, а компромиссы, принадлежащие множеству Парето, не являются устойчивыми. Однако существуют и исключительные случаи, когда множество эффективных компромиссов содержит устойчивые выборы. Как мы увидим ниже, подобные системы имеют очень важное прикладное значение. Ю. Б. Гермейером и И. А. Вателем [30] был изучен новый •важный класс систем, которые как раз и обладают указанным свойством. Была изучена ситуация, которая в теории исследо- вания операций получила название «путешественники в одной лодке». Представим себе, что в системе имеется N равноправ- ных партнеров (субъектов), каждый из которых обладает опре- деленными собственными целями. Но помимо собственных целей все они обладают одной общей целью — доплыть до берега. Это обстоятельство требует от каждого из субъектов, чтобы он во имя достижения общей цели поступился частью своих ин- тересов. . Итак, мы рассматриваем систему, в которой имеется N субъ- ектов, целевыми функциями которых будут i==_l, .... N, где ресурс xi находится целиком в распоряжении субъекта но- мера I. Но кроме этих целевых функций имеется еще некоторая общая цель, которую мы условимся описывать функцией Р(у\, Ее значения будут зависеть уже от деятельно- сти всех партнеров: у; — ресурс, который выделяет субъект но- мера I для достижения общей цели, — его вклад в коллектив- ную цель.
160 ГЛ. III. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ Таким образом, цели каждого из субъектов описываются векторным критерием ft(x{)->max, F(yu .... z/^-^max, (3.8)_ причем Xi + yt = a,, t=l, . ..„, N, где а, — некоторый суммар- ный ресурс, который находится- в распоряжении субъекта но- мера i. Значит, каждый из субъектов должен как-то разделить свой ресурс: часть ресурса, величину Xt, он может направить на достижение своих личных, «эгоистических» целей, а другую часть ресурса, yi — — х/, он направляет на обеспечение об- щественных интересов. Примечание. Заметим, что подобная ситуация вполне типична. К ее исследованию сводятся многие проблемы, имеющие важное практическое зна- чение, например: проблема выполнения .общих обязательств, требований руко- водства, проблема выделения средств для охраны или восстановления каче- ства окружающей среды. Анализ-возможных вариантов действий суверенных государств для достижения некоторой общей цели — военной, политической, экономической — относится к тому же кругу вопросов. Как мы знаем из первой главы, анализ подобной конфликт- ной ситуации должен начаться со сведения векторного кри- терия (3.8) к некоторому скалярному критерию. Положим Л-ЧЧШ), F(yh ..., yN)), (3.9) / где ¥ — некоторый оператор свертки .критериев ft и F, на- пример: Л == min {Xif((xt); F (yit ..,, yN)} (3.9‘) или л=Л(ха+иГ(//ь.... м (3.95 где и ц — весовые коэффициенты, характеризующие степень заинтересованности субъектов в достижении общей цели. Ки- бернетические системы с критериями вида (3.9) будем назы- вать. гермейеровскими. Для кибернетических систем гермейеровского типа может быть формализовано понятие гомеостазиса.. Границей области гомеостазиса в пространстве переменных у\, уы будем на- вивать поверхность F(y\, ..., yN)=Fe, выделяющую в этом пространстве область существования всей совокупности субъ- ектов (гомеостазиса, стабильности). Условимся, что области го- меостазиса отвечает значение функционала F, превосходящее Fo. Таким образом, максимизация функции F дает формальное описание стремления субъекта находиться в возможно более стабильном состоянии. • Для статических гермейеровских систем справедлива сле- дующая
§ 3. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ 161 Теорема Гермейера —В ател я. Пусть fi, F—моно- тонно возрастающие функции своих переменных. Тогда суще- ствуют устойчивые решения, среди которых по меньшей мере одно является эффективным. Авторы этой теоремы не только установили ее справедли- вость, но и предложили эффективный способ определения си- туации равновесия. Он сводится к следующей системе процедур. Упорядочим всех субъектов по принципу 1 (а1) W2 (az) ^ ... ^ kf/ffi (ац). Тогда оказывается, что существует такое p^N, что все yi для / 5s р должны быть приняты равными нулю (т. е. субъекты, у которых kifi(ai) малы, могут все свои ресурсы расходовать на достижение своих внутренних (эгоистических) целей. А остальные величины yi будут определяться из системы урав- нений hifM = F(yu •••» УР, 0........0), /—1,2, .... р. В результате мы находим доли ресурса, выделяемые субъектами на достижение общей цели. .Заметим, что часть партнеров во- обще не принимает участия в коллективных мероприятиях. Эти субъекты либо не обладают достаточным ресурсом, либо имеют низкую технологию (ft (а/) мало), либо у них низка заинтересо- ванность в итогах коллективного решения (%/ мало) (см. по- дробнее [55]). В работе [30] рассматривались лишь статические системы, т. е. системы, не зависящие от времени. Вопрос о том, в какой степени полученные результаты переносятся на динамические системы, остается открытым. Примечания. 1. Гермейеровские системы приобрели в последнее вре- мя большое значение в связи с проблемами глобальной экологии. Дело в том, что эколого-экономические системы глобального характера необходимо ока- зываются гермейеровскими. В самом деле, нарушение равновесия биоты или необратимое изменение климата могут вывести человечество из области его гомеостазиса. Следовательно, каким бы ни был набор субъектов рассматри- ваемой кибернетической системы, среди критериев, которыми они будут ру- ководствоваться, всегда присутствует критерий стабильности, общий для всех субъектов. Но если эта система гермейеровская, то целесообразно рассматри- вать для нее проблему отыскания устойчивых коллективных решений, принад- лежащих множеству Парето. Таким образом, изложенная система рассужде- ний дает известные основания для построения теории, позволяющей исследо- вать допустимые типы решений в процессах взаимодействия производственной деятельности людей и окружающей среды. По мере своего развития такая Теория может оказаться полезной для решения многочисленных проблем Управления ресурсами и производственной деятельностью,, вызванных необхо- димостью1 сосуществования. 2. Представляется весьма интересным изучение гермейеровских систем, Обладающих определенной иерархической структурой, в которых к тому же Субъекты обладают векторными критериями более общего вида, нежели (3.8). в Н. Н. Моисеев
162 ГЛ. III. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ .§ 4. Примеры иерархических .систем В первой главе много места было уделено обсуждению осо- бенностей конфликтов, в которых субъекты не являются равно- правными. По существу, там уже были изложены схемы рас- суждений и структура гипотез, которые обычно используются при анализе и проектировании иерархических систем управления. В этом параграфе мы рассмотрим ряд примеров, иллюстрирую- щих особенности процедур принятия решений в конфликтах, где партнеры неравноправны. Кроме того, в первой главе изучались только статические системы. Динамика, развитие во времени вносит целый ряд особенностей. Некоторые из них мы рассмот- рим в этом параграфе. а) Задачи распределения ресурсов в экономи- ческой системе с иерархией. Рассмотрим объединение N промышленных предприятий (трест, синдикат), выпускающих однотипную продукцию. Будем предполагать, что это объедине- ние организовано по принципу веерной иерархии. Во главе объединения находится некоторая управленческая организа- ция — управление трестом, которое мы будем называть Цент- ром. Обозначим через Pt объем продукции, выпускаемой пред- приятием (Производителем) номера i. Для упрощения рассу- ждений величины Pi будем считать скалярами. Результат функционирования Центра определяется результатами производ- ственной деятельности Производителей — сам Центр .никакой продукции не производит. Оценки деятельности Центра могут быть самыми разными. Мы не будем останавливаться на их детализации. Для нас важно лишь одно — целевая функция Центра однозначно определяется продукцией, которую выпу- скают Производители: ' J = J(Pt, ..., PN). (4.1) Предположим еще, что Центр лишен возможности декрети- ровать объемы производства Pt'. он может влиять на величи- ны Pi лишь косвенно, учитывая интересы и цели Производите- лей. Будем считать, что объем продукта Pi, произведенного Производителем номера i, однозначно определяется объемом фондов Xi и количеством рабочей силы £,•: Pi = fdx{, Ц). (4.2) Функция fi носит название производственной функции. Примечание. Условие (4.2)—это некоторая гипотеза. Производствен- ная функция предприятия описывает предельные возможности производства. Строго говоря, равенство (4.2) должно было бы быть заменено неравенством Pi<fi(*i< Li)> (4.3)
§ 4. ПРИМЕРЫ ИЕРАРХИЧЕСКИХ СИСТЕМ 163 и объем выпускаемого продукта следовало бы рассматривать в качестве управляющего фактора, стесненного ограничением (4.3). Тем не менее мы ограничимся анализрм того случая, когда Производитель использует свои предельные возможности. * Существуют различные способы аппроксимации производ- ственной функции. В экономико-математических исследованиях широкое распространение получила функция Кобба — Дугласа ^<=[0,1], 1=1, .... N, (4.4) ' где ai и ki — некоторые характеристики предприятия. Будем считать, что доход Производителя Л равен стоимости произведенной продукции за вычетом накладных расходов. Условимся для простоты, что они сводятся только к оплате ра- бочей силы. Если мы обозначим через ©i среднюю ставку зара- ботной платы (фиксированную величину), то доход Л будет равен Ji = с iPt — &iLi, (4.5) где Ci — цена продукта. Если величина фондов фиксирована, то объем выпущенной продукции однозначно определяется количе- ством рабочей силы Lt. Величина Li является управляющим параметром, который полностью находится в распоряжении Производителя. Для того чтобы иметь возможность управлять действиями Производителя, Центр должен располагать какими-то спосо- бами воздействия на цели Производителя, которые он, разу- меется, должен знать (или считать, что он их знает). Будем предполагать, что каждый из Производителей стремится мак- симизировать собственную прибыль: Jl = ciPl — (UtLi-^max. (4.6) Примечание. Если Центр не знает целей Производителя, то он дол- жен сформулировать гипотезу типа (4.6). Одним из способов воздействия Центра на действия Про- изводителя может быть ресурс, который находится в распоря- жении Центра и должен.расходоваться на создание основных фондов Производителя. Итак, условимся, что Центр знает, что Производитель, получив в свое распоряжение ресурс щ, произ- ведет в течение планового периода следующую продукцию: ' Значит, задача Центра — задача планирования — состоит в та,- ком распределении ресурса (7: N . U (4.8) 6*
164 ГЛ. 1П. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ которое доставляет максимум функции (4.1). Однако результат распределения ресурса будет зависеть не только от того, какие величины иц стесненные условием (4.8), назначит Центр, но и от того, какое количество рабочей силы Li привлечет для ра- боты Производитель. Центру известно, что Производитель в момент своего выбора будет знать величину ui — выбор Центра. Кроме того, мы условимся считать, что Центру известна целе- вая функция Производителя (4.6). На основании информации, которой располагает Центр, он должен считать, что Произво- дитель выберет такое значение Li, которое доставит максимум величине /z“I” и^ I L[ i — G>tLt. Решение этой задачи при фиксированных xi и всегда суще- ствует, и его легко получить в явном виде из условия dh/dLi = = 0. Мы находим, что Lt — di (xt + Ui), (4.9) где [см, ' 1 v(1~4l • Используя выражение (4.9), мы можем легко свести задачу планирования к задаче математического программирования. В силу (4.9) Pi — Ci~ki*i (xt + ut)=+ уг«р т. e. результат действий Производителя является линейной функцией выделенного ресурса. Таким образом, J(Pit PN) = J(₽i + Yiui> •••> Pjv + Yw“w) = = /*(«!,..., uN), (4.10) и Мы приходим к задаче отыскания максимума функции (4.10) при линейном ограничении (4.8). * Итак, гипотеза о поведении Производителей позволила Цент-. ру рассматривать Производителей как обычные рефлексные звенья. Примечание.‘Если функция цели Центра линейна, например: N (4.Н) i то задача максимизации этой функции тривиальна: надо вычислить коэффи- циенты yt и весь ресурс передать тому из Производителей, у которого вели- чина у больше. б) Управление с помощью штрафов и поощре« н и й. В примере п. а) Производитель получал в свое распоря*
5 4. ПРИМЕРЫ ИЕРАРХИЧЕСКИХ СИСТЕМ 165 жение ресурс в строго фиксированном количестве, не зависящем ют способа его использования и результатов деятельности Про- изводителя. При таком способе воздействия на Производителя Центр не мог непосредственно влиять на его функцию цели. Теперь уместно напомнить одно утверждение, к обсуждению •которого мы еще не раз будем возвращаться: факт существова- ния собственных целей у подсистем — это некоторая объективная реальность. Если элемент системы. обладает правом само- стоятельного использования ресурса, то он неизбежно превра- щается в организм и его основная цель — сохранение собствен- ного гомеостазиса. В разных ситуациях-для разных организмов условия гомеостазиса будут разными. В самом деле, если струк- тура общественных отношений такова, что стабильность произ- водственного коллектива (организма) обеспечивается уровнем его дохода, то целевую функцию Производителя можно пред- ставить в форме (4.6). Но может оказаться, например, что основное условие, которое будет обеспечивать его стабильность, новее не доход, а требование регионального управления, свя- занное с очисткой среды. Тогда критерий Производителя будет совсем иным. Критерий Производителя прямым образом зависит ют структуры производственных отношений и правовой инфра- структуры общества. Центр не может повлиять на этот факт. Он яе может изменить общественных отношений, которые в каче- стве меры стабильности организма определяют уровень его до- хода или другие факторы. Но Центр может повлиять на вели- чину дохода Производителя, заставляя тем самым его действо- вать в направлении,- выгодном Центру. На этом принципе и юсновывается действие экономических механизмов управления. Поясним это соображение примером, когда Центр может непо- средственно влиять не на структуру, а на величину целевой функции вида (4.6); меняя ее в зависимости от тех решений, которые выбирает Производитель. Сохраним условия примера, рассмотренного в п. а), и будем считать, что деятельность Производителя' описывается произ- водственной функцией Кобба — Дугласа (4.4), причем положим для простоты, что все ki = I /2, i = 1, 2,- ..., N. Целевую функ- цию (доход) Производителя запишем в виде A(4=w!'24'’-“A+ti(p,)- <4-12> Здесь <р/(Р/)—дополнительное вознаграждение (или штраф), которое выплачивается Центром Производителю в зависимости от результатов его деятельности. Величины xi будем считать фиксированными. Это позволит представить функцию (4.12) в виде + <₽,(₽,), (4.13)
166 ГЛ. HI. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ где 6i = ciaix’/2. Гипотезу поведения Производителя оставляем старой: мы считаем, что он выбирает управление из условия максимума своего дохода, при этом, конечно, в интересах Цент- ра, чтобы Производитель в момент принятия решения зц^л усло- вия поощрения или наказания, т. е. характер функции Ф< (/’<)'. Условие максимума функции (4.13) dJ, 1 d<p. dP, ~dLT~~2^iLi i J("dPl~dTi = Q (4.14> / позволяет определять значение Lt = L*i, доставляющее макси- мум функции Ji(Li). При этом L*t будет функционалом — будет зависеть от вида функции фг(Рг): £, = £^[ф,(Рг)]. Точно так же функционалом будет и оптимальный объем продукта Р* = Р\ [ф, (Л)]- Следовательно, задача определения’ опти- мального управления Центра — это задача определения таких функций штрафа и поощрения ф((Л), которые доставляют мак- симальное значение функции цели Центра J(Pi, ...» Ря). Эгу функцию мы теперь перепишем в виде / = 7(Р! [ф1], ₽2[ф2]., Pn [флг] ). (4.15> Задача определения экстремальных значений функционала (4.15) является сложной и нестандартной задачей оптимизации,, поскольку сами функционалы PJ определяются из решения также весьма сложной оптимизационной задачи 7,->тах. Даже для того очень простого частного случая иерархической системы» который мы рассматриваем, решение задачи эффективного определения оптимального штрафа требует создания специаль- ных методов. В самом д'еле, пусть Pi, Аг, ..., Рн— объемы продукции Производителей, которые доставляют максимальное значение функции цели Центра. Тогда функции штрафа мы можем за- дать, например, в виде Ф, (Л) = (р1 - pi)2 - + ©Д, (4.16) /=1.....N, где А,— произвольные отрицательные числа. В этом случае вы- ражение целевой функции Производителя примет вид . Л-ЫЛ-АЛ Для того чтобы обеспечить максимум своего дохода, Произво- дитель вынужден так распоряжаться своими ресурсами, чтобы объем его продукции был равен Pt. Структура штрафа (4.16) делает интересы Цроизводителя совпадающими с интересами Центра.
§ 4. ПРИМЕРЫ ИЕРАРХИЧЕСКИХ СИСТЕМ 167 Легко видеть, что функций вида (4.16), которые делают ин- тересы Производителя тождественными интересам Центра, мо- жет быть построено бесчисленное множество. Однако неограни- ченный штраф или поощрение вряд ли могут представлять ка- кой-либо практический интерес. В задачах, «достаточно реаль- но» поставленных, величина штрафа либо ограничена, .т. е. удовлетворяет условиям вида <Р^СФ, (4.17) где G<p — некоторое множество, либо значение функции J за- висит от функций ф<: / = Ря, Ф1, фдг]. Основная сложность возникшей здесь задачи оптимизации — та же, что й в задачах синтеза. Необходимо отыскивать функции <р/(Р(), зависящие от фазовых координат. Для решения таких задач в настоящее время существуют два подхода. Один из них — использование традиционной для теории синтеза идеи параметризации искомой функции, а другой •связан с одной из теорем Ю. Б. Гермейера, которая утверждает эквивалентность задачи отыскания оптимального решения в не- которой иерархической игре двух лиц специальной задаче не- линейного программирования (см. [27]). Поясним содержание обоих подходов для того случая, когда имеются лишь два субъ- екта: Центр и Производитель. Предположим, что Центр распоряжается выбором элемен- та х, а Производитель — элемента у. Оба субъекта, соответ- ственно Центр и Производитель, стремятся обеспечить свои ин- тересы: F(x, y)->max, (4.18*) f(x, у)-> max. (4.18") Стратегия Центра — функция х —ф(у). Она сообщается Про- изводителю к моменту принятия им своего решения о выборе у. Предполагается, что Производитель доверяет Центру и, узнав ф(у), выбирает у из решения задачи f (Ф (У), У) -* max. (4.18'") В результате решения этой задачи определяется точечно-мно- жественный оператор у = У[ф(-)]. После этого Центру остает- ся выбрать функцию ф(-) из решения задачи sup inf Г(ф(у), у). «(•> »еТН>(-)1
168 ГЛ. III. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ В частности, если при любой ф(-) решение задачи (4.18'") единственно, получим задачу определения функции ф(«), реал и* зующей sup F (Ф (г/), У), где у — решение задачи (4.18"') при заданной ф(•). Первый подход к решению этой задачи — параметризация функции ф (£/). Он состоит в том, что мы представляем эту функ- цию в зависимости от нескольких параметров, например, так:' Ъ(у) = ау + Ьу*. (4.19) Примечание. Выбор класса функций, которому должны принадле- жать штрафы и поощрения,это специальная и трудная проблема. Дело & том, что расширение класса допустимых штрафов и поощрений может суще- ственно изменить значение целевой функции. Ю. Б. Гермейер [5] привел при* меры, показывающие, что включение в число допустимых штрафов и поощре- ний разрывных функций может сколь угодно сильно изменить окончательный результат. Используя представление (4.19) функции ф(у), мы пред* стдвим задачу (4.18") в форме Г (а, Ъ, у) —► rfiax, откуда следует, что если решение этой задачи при любых а, Ь однозначно, то у — это некоторая функция параметров а и Ьг * У = у{а, Ь), и задача (4.18") превращается в специальную задачу матема* тического программирования, аналогичную задаче, рассмотрен* ной в п. а) этого параграфа. Другой подход связан со следующим фактом. Рассмотрим задачу f(x, у) -► min. (4.20'} X Ее решением будет функция х = х*(у). Затем решим еще одну оптимизационную задачу: f (х* (у), у) -> max. (4.20"> у Значение функционала, отвечающее этой процедуре, обозначим . через и. рассмотрим еще одну задачу оптимизации, теперь уже для функции F: F(x, #)->max (4.20'") *. у при дополнительном условии - /(X, у)>Г. (4.21) Решение задачи (4.20'") при условии (4,21) определит век*
$ 4. ПРИМЕРЫ ИЕРАРХИЧЕСКИХ СИСТЕМ 169 торы и Теорема Гермейера утверждает, что оптимальной стратегией Центра будет функция х(у) *): ( х°, если у *= у°, I х* (у), если у Уа> (4.22) Здесь х° = х°, #° = #°, если f (х°, у0) > /*. Если же f (х°, у9) = /•, то Д таковы, что f(x°, и j?°, z/° с e-точностью, выбираемой Центром, реализуют решение задачи (4.20"'). Та- ким образом, если мы решили оптимизационные задачи (4.20'), (4.20") и (4.20"'), то синтезирующая функция х(у) выписывает- ся в явном виде (4.22). Этот факт трудно переоценить, так как юн открывает перспективы для эффективного построения меха- низмов управления в экономических системах. Путь, который предлагает приведенная теорема для эффек- тивного построения функций наказания и поощрения, может по- казаться отнюдь не простым. Более того, на первый взгляд он кажется даже более сложным, чем традиционный способ по- строения синтеза. В действительности же он может оказаться чрезвычайно эффективным для построения механизмов управ- ления в иерархических системах. Для того чтобы продемонстрировать его возможности, поста- раемся дать экономическую интерпретацию проведенным рас- суждениям. Рассмотрим задачу (4.20'). Мы можем трактовать ее как задачу определения таких воздействий Центра на Про- изводителя, которые ставят его в самые трудные условия. Но поскольку эти действия всегда стеснены определенными рамками и количество воздействий невелико, то задача (4.20') бывает, как правило, тривиальна. Например, если мы можем варьиро- вать цены, то мы должны их назначить самыми малыми: 'если мы назначаем функцию поощрения, то она должна быть равна кулю; штраф — максимально допустимым и т. д.. Задача (4.20")—это задача выбора Производителем своей яаилучшей стратегии в трудных для него условиях, а величина /*— его гарантированный результат. Задача (4.20"')—это задача выбора оптимальной стратегии Центра в условиях полной централизации, но с одновременным выполнением требования (4.21), которое означает, что интересы Производителя должны быть учтены — ему должен быть обес- печен результат не ниже f*. Таким образом, цепочка оптимизационных задач (4.20) ока- зывается достаточно часто не такой уж сложной и имеющей простой экономический смысл. *) Этот результат верен при условии, что замыканием множества 1*> У-У) >{*} является {х, yt f(x,y)^f*}, что обычно выполнено. Более подробно см. книгу [5J.
170 ГЛ. III. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ Кроме того, решение (х°, у°) можно рассматривать как согла* сованную программу, поскольку Производителю выгодно ее при* держиваться — в этом случае он получит максимальное поощре- ние. Отступление от этого согласованного решения немедленна приводит к наказанию: обратная связь действует автоматически» Функция (4.22) имеет вид, изображенный на рис. 4.1. Эта функция разрывна. Всюду, за исключением точки у = у°, она совпадает с функцией x*(t/) (т. е. с решением задачи (4.20'),. которое определяет наихудшие условия функционирования Производителя — максимальный штраф). Решение (4.22) не очень удобно для практического использо* вания. Но оказывается, что функцию (4.22) можно изменять- в довольно широком диапазоне. Во многих реальных ситуациях, оптимальная стратегия Центра не единственна, и мы можем, заменить разрывную функцию (4.22) сглаженной функцией так», как это изображено rfa рис. 4.2 *). После этих замечаний вернемся снова к рассматриваемому •примеру. Напомним, что Производитель стремится максимизи* ровать функцию (4.13), распоряжаясь лишь одной величиной — количеством нанимаемой рабочей силы Lt. Поскольку объем выпускаемого продукта определяется только количеством рабочей силы, то мы можем искать функ- цию <pt (P() как функцию только L\12. Обозначим Lj/2 через zr Итак, задача Производителя состоит в следующем: (zt) = aizl — c^z2 + <р< (гг) -> шах при условиях zt 0, ф/ (z,) 0. Проведем решение этой задачц обоими изложенными способами. Рассмотрим сначала первый способ. Положим <fi(zt') = cilzi + с^2. Из условия dJi/dzi—G найдем + С<1 Zi ~ 2 - сц) ’ *) Сегодня это направление теории иерархических систем продвинуто- достаточно далеко. Кроме упомянутой книги Ю. Б. Гермейера [5] см., напри- мер, работы [25, 45].
* § 4. ПРИМЕРЫ ИЕРАРХИЧЕСКИХ СИСТЕМ 171 Предположим теперь, что целевая функция Центра имеет вид /=ЕМ“Е <₽<(*/) (4.23) i = l i = l или где / Е( (с/1г/ "Ь Ci2Zi) Е Фр Ф, = (k{ С{ j) Z{ Ci2Zj. Используя выражение для г,-, получим k, — с,, , с.„(д,, + с.Л2 •Функция Ф*(сп, с/2) имеет достаточно простой вид, и задача ее максимизации не представляет трудностей. Посмотрим, что дает второй путь решения задачи. Так как <p,(z/)^0, то наихудшее значение функции поощрения будет <р< = 0. Тогда Jt (z) = а;гг — to^l и, следовательно, гарантированный результат будет следующим: J/ = й//4®/. • - Задача (4.20"'), где F имеет вид (4.23), будет такой: Ф^ = ktZi — ф/ (z) -* max яри условии, что/г ^сх|/4шг От- сюда сразу находим Ф, = 0, Z/ — 6ti/2®i. В данном случае второй подход следует предпочесть, и не потому, что мы получили окончательный результат более ко- ротко: решение задачи с помощью параметризации тоже до- статочно просто. Дело здесь в другом. В первом случае нам не удалось обнаружить очевидный результат: интересы Центра и Производителя в рассматриваемом случае совпадают — Про- изводитель будет выбирать Lt —Li (рис. 4.3). Затраты на наем рабочей силы при Li > Li не окупаются стоимостью получен- ного продукта. Но такой выбор невыгоден и Центру, поскольку -Он платит за дополнительный наем рабочей силы в виде функ- ции поощрения ту же сумму, что и Производитель. в) Целенаправленное использование экзо- генного ресурса. Рассмотрим еще одну задачу, которая
172 ГЛ. III. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ формально эквивалентна задаче, которую мы только что изу* чали. В п. а) мы рассмотрели способ управления предприятиями с помощью выделяемого им ресурса. При этом величину вы- деляемого ресурса мы непосредственно не связывали с резуль- татом его использования, т. е. с объемом произведенного про- дукта. ' ' Вернемся теперь снова к модели распределения ресурса, но условимся, что величина выделяемого ресурса — это некоторая функция производимого продукта Р,: и предположим, что ресурс, выделяемый Центром, расходуется на инвестиции — на создание новых мощностей. Гипотезу о поведении Произвсчителя мы также сохрани» старой: будем считать, что свою стратегию Производитель вы- бирает из условия максимизации своего дохода Jr. Предположим, что функция а<(Р/) задана. Поскольку никаких ограничений на величину Ц мы не накладываем, то правило выбора величины Li получим из условия (4.24> Величину производной dPi/dLi вычислим, рассматривая равен- ство как неявное задание зависимости Pt(Li), откуда - (1 -»,) (*,+«< (?,»*'=°- Из этого равенства находим 0->,)»,+ = (425> Таким образом, в рассматриваемом случае задача Центра сводится к следующей: определить неотрицательные функции Ui(Pi), доставляющие максимум функционалу /(Pi, PN) при ограничениях (4.25). Можно привести еще очень много других • примеров, иллю- стрирующих возможности управления в иерархических системах»
$ 4. ПРИМЕРЫ ИЕРАРХИЧЕСКИХ СИСТЕМ 173 ' Например, одна из возможностей, которая реально почти всегда используется в любых иерархических системах, — это ограниче- ние возможной активности нижних звеньев. Приведем один ти- пичный пример — ограничение фонда заработной платы: i — 1, .... У. (4.26) До сих пор мы считали, что производственная функция пред- приятия — зависит только от xi— фондов и Lt — количества рабочей силы. На самом деле большую роль играет также и ставка заработной платы, изменяющая условия лайма квалифицированной рабочей силы. Другими словами, Pt — ts=fi(Xi,.Li,<i>i) и ставку заработной платы естественно считать одним из управляющих факторов, находящихся в распоряжении Производителя. Но величину Qi следует тогда включать в число факторов, которыми управляет Центр. Условие (4.26) дает нам еще один способ управления. Примечание. Заметим, что формально описанный способ управления совершенно аналогичен (с чисто математической точки зрения) способу упра- вления с помощью распределения ресурса. Однако в реальных условиях все описанные способы управления имеют столько неформальных особенностей, что их следует изучать самостоятельно. Способы воздействия верхнего уровня на нижние звенья иерархии — способы воздействия на их интересы и исполь- зования их интересов для достижения определенных целей верхнего уровня, — как правило, возникают в результате неформального содержательного ана- лиза. А роль математики состоит в выяснении количественных аспектов, в на- хождении разумных соотношений управляющих параметров и состояний си- стемы. г) О рациональной степени децентрализации и эффективности децентрализованных струк- тур. Проблема рациональной степени децентрализации —это одна из важнейших народнохозяйственных проблем. Если тот или иной народнохозяйственный организм делается достаточно сложным, то, как уже говорилось выше, полная централизация ёго управления может легко приводить к ошибочным решениям из-за невозможности своевременной обработки необходимой ин- формации. Однако высокая степень децентрализации также чре-. вата отрицательными последствиями: превращаясь в самостоя-* тельные организмы, отдельные звенья начинают преследовать собственные цели. В этих условиях может оказаться, что пре- имущество децентрализованного управления, способного более полно учитывать особенности информации, будет сведено к нулю чрезмерной активностью звеньев, игнорирующих интересы си- стемы в целом.- Вот. почему .мера активности, «делегируемая» верхним звеном подчиненным ему нижним звеньям, должна быть объектом специального анализа. Ее определение — это одна из ключевых задач теорий децентрализованных систем управления. Обратим внимание на то, что постановки задач,
174 ГЛ. III. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ которые возникают в этой теории, качественно отличаются от тех, с которыми приходится иметь дело в традиционной теории антагонистических игр. Пусть в системе существуют два субъекта X и У. Интересы субъекта X описываются так: - F(x, у)-*- шах. > х е ах I Интересы субъекта У выражаются в виде F(x, У)~+ min . «sOy Представим себе, что субъект X имеет возможность изменять множество стратегий Gy субъекта У. Очевидно, что ему всегда выгодно сужать множество стратегий своего партнера (в данном случае противника, поскольку рассматриваемая ситуация анта- гонистична). Совершенно иное дело в теории иерархических систем управ- ления. Субъекты этой системы имеют свои собственные интере- сы, но они отнюдь Не антагонистичны интересам Центра. По- этому Центру может оказаться выгодным расширять права от- дельных звеньев. Но это расширение прав (т. е. множества возможных стратегий) выгодно лишь до определенной степени. Эта допустимая мера активности определяется, конечно, специ- фикой данной системы, и в каждой системе она разная. Уни- версальных рецептов здесь нет. Итак, проблема проектирования иерархической системы управления состоит, прежде всего, в построении модели функ- ционирования системы при заданной структуре. Если мы будем говорить о веерной иерархии, то структура будет определяться перечислением самостоятельных звеньев. Напомним, что каждое звено при этом становится самостоятельных организмом. Сле- довательно, второй этап проектирования состоит в выяснении целей нижних звеньев. Может быть, лучше говорить не о целях, а об интересах нижних звеньев, хотя формально эти оба поня- тия тождественны. Конечно, точно указать целевую функцию нижнего звена (Производителя), как правило, невозможно: ин- тересы Производителя всегда описываются системой критериев, и выбор свертки критериев, максимизация которой будет опре- делять действия Производителей, всегда включает в себя эле- мент субъективизма. Тем не менее, для того чтобы Центр мог назначать свои управляющие воздействия, необходима опреде- ленная гипотеза о целевых фуйкциях Производителей (гипотеза поведения). «Определив» целевые функции Производителей, мы должны выяснить способы управления, которые имеются в рас- поряжении Центра и Производителей. И наконец, на следующем
§ 4. ПРИМЕРЫ ИЕРАРХИЧЕСКИ^ СИСТЕМ 175 этапе мы можем редуцировать задачу к некоторой специальной задаче оптимизации. Эти задачи будут аналогичны тем, которые описывались в атом параграфе. Анализ таких задач позволит нам найти оптимальные'(в рамках принятых гипотез) механиз- мы функционирования: правила распределения ресурса, систему штрафов и поощрений, меру допустимой активности и т. д. Заметим, что на этом этапе анализа уже вполне уместно вве- сти понятие оптимального управления иерархической системой как управления, доставляющего максимальное значение целевой функции Центра в предположении, что управления Производи- телей определены на основании гипотез об их поведении. По- следний этап проектирования иерархической структуры как раз и состоит в'расчете оптимального управления. Когда мы проек- тируем любую новую систему, мы всегда хотим убедиться в том, что она окажется лучше старой, причем оценку эффективности мы стремимся делать на самом раннем этапе проектирования, задолго до того, как эта система начнет создаваться, а тем более функционировать. Естественно, что все сказанное в полной ме^е относится и к проектированию иерархических систем управления. Заметим, прежде всего, что в рамках рассуждений, которые использовались в этом параграфе, провести сравнение эффек- тивности различных систем управления невозможно в принципе, поскольку мы исследовали функционирование иерархической системы в условиях наличия полной информации, полной ее определенности. А в рамках подобной теории любая децентра- лизация, т. е. замена полностью централизованной системы иерархической, невыгодна. Обозначим через 7* оптимальное значение целевой функции Центра в иерархической системе управления. Предположим те- перь, что система полностью централизована, т. е. Центр может распоряжаться не только распределением экзогенного ресурса, назначением штрафов и т. д., но и количеством нанимаемых ра- бочих. Максимальное значение целевой функции в этих условиях обозначим через J**. Тогда очевидно, что всегда /** г* А = —jr—-^0, поскольку введение иерархической организации в систему — это только дополнительные ограничения, сужающие множество до- пустимых стратегий. Поэтому, для того чтобы оценить целесо- образность введения той или другой иерархической структуры, мы необходимо должны принять во внимание изменение харак- тера информации, которое происходит вместе с появлением иерархии. Смысл введения иерархии состоит, прежде всего, в уменьшении уровня неопределенности в процедурах принятия
176 гл. III. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ ' решений. Таким образом, нам необходимо вернуться к тем рас* суждениям, которые мы привели в начале предыдущего пара- графа. Повторим эти рассуждения применительно к примеру распределения экзогенного ресурса в двухступенчатой иерархи- ческой системе. Производственную функцию 'Производителя будем записы- вать в форме pi^(.ai+k)xilLlrkt> .............к. Здесь Ь— параметр, который точно известен Производителю (например, & = 0), но не известен Центру. Величина ai харак- теризует эффективность фондов, она зависит от условий данного предприятия (качество помещения, квалификация рабочей силы, уровень организации и т. д.). Поскольку Производитель точно знает свои возможности, то, приняв .решение о количестве рабочей силы, он будет точно знать объем продукта, который он предполагает выпустить. Иное дело — Центр, который располагает об этом гораздо мень- шей информацией. Пусть, например, Центру известны только пределы изменения величины 17 Предположим, что Центр принял схему полной централизации, т. е. он не .только распределяет ресурс ui по Производителям, но и имеет право назначать величины Ц. Тогда его целевая функция будет иметь вид J=J(Pb .... PN)= ' = J((a, +S,)^ + «.)** Llrkl...(aw + S#)(*„ + LHkN^ (4.27) или ~ J = Z(ui, •♦., Uff, Lj, ..., Ln, •••» Sa). Прежде чем искать максимальное значение функции (4.27), мы должны принять определенную гипотезу о величинах Si. Наиболее естественной характеристикой системы будет макси- мальный гарантированный результат = max max min /(«i, .. •> uN, Lh .... LN, Si> • • • , Sa). ’ Рассмотрим теперь тот случай, когда _в системе введена иерархическая структура принятия решений. Как оценить воз- можное значение функционала Центра? Мы можем построить гарантированную оценку. Для этого мы должны решить задачу /1 == Ji (Lt, и{, Si)-> max. (4.28)
f 4. ПРИМЕРЫ ИЕРАРХИЧЕСКИХ СИСТЕМ 177 Решение задачи (4.28) нам дает значение . - тогда функционал (4.27) может быть представлен в виде (ult ...» U/f, Si. • • •» Sw)» и, следовательно, максимальный гарантированный результат будет иметь вид Г= чпах min J(ut................. gb $N), Найденная деличина будет также важной и полезной оценкой •Иерархической структуры. , Для функционалов /*, /** мы можем снова составить вели- Теперь мы уже не можем утверждать, что всегда А 0. Но достаточно ли этой характеристики для принятия решения о це- лесообразности введения иерархии в систему управления? На- верное, в общем случае недостаточно. В реальной ситуации важную роль будут играть и другие характеристики системы, например сложность и надежность системы передачи данных, стоимость обработки информации И т. д. Для окончательного суждения о замене полностью цен- трализованной системы управления системой с иерархической Структурой имеют определенный смысл машинные эксперименты для различных значений Машинная имитация функционирования системы с исполь- зованием метода Монте-КарЛо может, быть весьма важным эле- ментом в оценке качества управления: проектировщик или бу- дущий ’ ее пользователь с помощью подобных экспериментов наглядно увидит особенности функционирования системы в раз- ных условиях информированности. Мера неопределенности во многом зависит от используемых технических средств. С ростом “быстродействия ЭВМ, качества терминальных устройств, систем передачи данных и т. д. допу- стимый уровень централизации, вероятно, будет расти. х В заключение заметим, что для исследования задачи, решае- мой Центром, нет прямой необходимости знать целевые функ- ции отдельных звеньев системы. По существу, нам (т. е. субъек- ту, представляющему Центр) достаточно знать лишь отклик, реакцию звена на действие Центра. Это обстоятельство может быть источником разнообразных упрощений.
178 - ГЛ. III. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ д) Динамика иерархических систем. Перейдем те- перь к рассмотрению кибернетических систем, состояние кото- рых изменяется во времени, ограничившись, как и ранее, обсу- ждением примеров. Рассмотрим снова систему с веерной иерархией (объедине- ние, фирму), состоящую из N Производителей (предприятий), выпускающих продукты Pi, ..., Р». Обозначим через xi основ- ные фонды t-го Производителя. Изменение фондов мы будем описывать уравнениями Xi = — ktXi + + i = 1......N, (4.29) где ki — коэффициент амортизации, м,-— инвестиции Центра (фирмы), Vi — внутренние капиталовложения («/ и Vi— потоки капиталовложений в единицу времени: щ— управляющие функ- ции Центра, vi — управляющие функции Производителя). Процесс производства будем описывать производственными функциями вида Pi = ^i(xi, Lit (ог), i=l, (4.30) Здесь Li — количество рабочей силы, ю,— ставка заработной платы. Величины Li и со, также находятся в распоряжении Про- изводителя, их выбор стеснен ограничениями вида LtLt >0, со/ >0, &iLi^Qi, /=1, ..., N. Смысл двух первых ограничений очевиден: предприятие, для того чтобы оно могло функционировать, должно иметь некото- рый минимум рабочей силы, а ставка заработной платы долж- на быть больше некоторого минимума. Последнее же неравен- ство означает, что фонд заработной платы ограничен. Величи- на Qi находится в распоряжении Центра — это одно из его управлений, а величины L~ и ©Г считаются заданными. Создав продукт, описываемый вектором Pi, Производитель реализует его: сдает на склад фирмы или продает через торго- вую сеть. Обозначим через с,- вектор цен;- тогда Производитель получит в единицу времени сумму (Ci, Pi). Из этой суммы он должен заплатить зарплату рабочим anti, сделать вложения в фонд фирмы (отчисления) ?,(Л), произвести внутреннее ин- вестирование vi и компенсировать текущие затраты Ri(Pi). Обо- значим через Ti остаток стоимости продукта после расходов» TtW = (с4, Pi) - [^iLi + Yi (Pi) + Vi + Ri (Pi)]. (4.31) Величину T,(Z) условимся называть социальным фондом пред- приятия. Эта величина находится в распоряжении Производи- теля и может расходоваться на поощрение работающих, на со- циальные нужды и т. д. По своему смыслу эта величина не- отрицательна для любого t е [О, Г].
§ 4. ПРИМЕРЫ ИЕРАРХИЧЕСКИХ СИСТЕМ 179 Будем считать, что условия гомеостазиса связаны с объемом социального фонда при дополнительных ограничениях типа Pi^PT, i = 1, • • •, N. Таким образом, если внешние инвестиции ui(t) заданы, если известна функция ?>(РгУ, которую естествен- но назвать функцией поощрения или штрафа, если известен фонд заработной платы Qt, то задача, которую должен решать Производитель, состоит в том, чтобы так распорядиться внут- ренними капиталовложениями Vi(t), ставкой заработной пла- ты ©,(/) и количеством рабочих £/(/), чтобы максимизировать в тОм или ином смысле свой социальных фонд. Этот функционал мы обозначим. = (оь L{). Он может иметь самую разнообразную природу. Например, можно принять, что Л= min Тг(0. (4.32) t е [О, Г1 Максимизация функционала (4.32) означает максимизацию минимального размера социального фонда, создаваемого в еди- ницу времени. Не менее естественно рассматривать и инте- гральные функционалы типа т • (4.33) о где Т — плановый период. Задачи с функционалами (4.32), (4.33) являются стандартными задачами оптимального управ- ления. Заметим, что величина планового периода Т — это еще одна субъективная характеристика Производителя, определяю- щаяся не только внешними факторами, но и его личными каче- ' ствами (в частности, дальновидностью). Рассмотрим теперь функционирование правления фирмы (Центра), которой подчиняется Производитель. По своему смыслу эта организация управленческая, и сама по себе ника- ких ценностей не производит. Эффективность ее деятельности оценивается по результатам работы предприятий, входящих в ее состав. Критерий, которым руководствуется фирма, имеет вид / = /(?!,..., PN, уь Yjv)- (4.34) В выражении (4.34) подчеркивается, что доход фирмы зависит от структуры функций поощрения Если критерий Центра считать не зависящим от этих функций, а фонд поощрения — не- ограниченным, то тривиальным будет следующее утверждение: всегда могут быть назначены поощрения (или штрафы) Vn_(Pn), вынуждающие Производителей выбирать
180 ГЛ. Ш. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ свои управления так, как будто управление фирмой полностью централизовано. В качестве функционала J могут выступать самые разные величины: точность соблюдения государственного плана, мак* симизация -числа комплектов оборудования, чистый доход и т. ц. Задача руководства фирмы состоит в распределении ресурса U, имеющегося в ее распоряжении: фонда заработной платы Q: '* EQ/==q. и назначении таких функций поощрения или штрафа yi(Pi) за выпуск продукции, чтобы максимизировать доход {4.34). Таким образом, фирма располагает тремя способами воз- действия на Производителей: она может распределять ресурс, вводить функции штрафа и поощрения и ограничивать- активность Производителей. Описанная ситуация приводит, по установившейся термино- логии, к некоторой дифференциальной игре N 4-1 субъектов. Какой-либо общей теории, позволяющей исследовать эту ситуа- цию более или менее единообразным способом,, не существует. Классические задачи Р. Айзекса, Л. С. Понтрягина, Н. Н. Кра- совского и др. относятся к проблемам антагонистических игр,, и полученные ими результаты малопригодны.для анализа задач, которым посвящена эта книга (см. [17], [49]). А. Ф. Кононенко удалось в случае неантагонистических диф- ференциальных игр использовать идеи Ю. Б. Гермейера и раз- вить на основе этих идей весьма общий формализм (см. [46; 47]), который позволяет надеяться на возможность создания эффективных вычислительных” процедур. Кроме того, исследова- ния А. Ф. Кононенко помогают увидеть ситуацию, которая воз- никла в теории дифференциальных игр, с новой точки зрения. Результаты, полученные в теории неантагонистических игр, не могут быть перенесены с помощью непрерывного перехода в теорию антагонистических игр. Последние являются некоторым сингулярным вырождением, и, по-видимому, им отвечает кон- струкция, весьма плохо отражающая реальность: достаточно глубокое изучение конкретных конфликтов показывает, что интересы их участников обычно не строго антагонистичны. Первым шагом в анализе любой иерархической системы должна быть гипотеза о поведении отдельных ее звеньев. Пред- положим, что мы ее сформулировали, например, в форме мак- симизации функционала (4.33). Примечание. Заметим, что, в отличие от статического случая, нам надо делать предположения не только о структуре Функций Ч'д, но и о глу-
5 4. ПРИМЕРЫ ИЕРАРХИЧЕСКИХ СИСТЕМ 181 бине прогноза, т. е. о величине временного интервала планирования Т. Для разных субъектов системы эти величины могут оказаться разными. При фиксированных внешних воздействиях Центра максими- зация целевого функционала Производителя будет некоторой задачей оптимального управления, и выбор Производителем управляющих воздействий при разных воздействиях Центра бу- дет, естественно, разным. Это значит, что задача Производи- теля является на самом деле не задачей оптимального управ- ления, а задачей синтеза: определить управления как функции или функционалы от управляющих воздействий Центра. Предположим тем не менее, что мы ее смогли решить (т. е. построить эффективно действующий алгоритм). Тогда остается последний шаг. Мы должны решить задачу Центра: выбрать функции vi(Pi)» доставляющие максимум функцио- налу (4.34). Это снова задача синтеза, только более сложная» чем та, которую нужно решать Производителю. Примечание. В самом деле, Производитель, в рамках нашей схемы, должен решать задачу значительно более простую, нежели Центр: Произво- дитель всегда знает «условия игры», т. е. функции и ограничения, которые назначены Центром, и решает задачу для конкретных значений этих величин. Центр же должен иметь для решения собственных задач весь спектр задач Производителя — для любых значений величин, находящихся в распоряжении Центра. 4 Таким образом, хотя “нам и удалось расчленить проблему анализа деятельности фирмы (объединения) .на ряд последова- тельных оптимизационных задач (что, конечно, является боль- шим шагом вперед), вряд ли можно предложить эффективные численные методы их решения. В таких задачах, по-видимому, нельзя обойтись без исполь- зования техники имитации, и § 6 этой главы будет посвящен Проблеме проектирования и использования имитационных си- стем. Здесь же мы заметим лишь следующее. Реальный анализ и проектирование динамических иерархи- ческих систем, по-видимому, будет сводиться к следующей по- следовательности неформальных, человеко-машинных процедур. 1. Эксперт (проектировщик, управляющий) предлагает схему организации — некоторый вариант иерархической структуры. 2. Эксперт с помощью исследователя операций определяет вариант управляющих воздействий Центра. 3. Исследователь операций решает задачи оптимального управления, находит, реакции Производителя, рассчитывает функционалы Центра и полученную информацию предъявляет эксперту. 4. Эксперт вместе с исследователем операций разрабатывает новую систему управляющих воздействий Центра и т, д.
182 ГЛ. III. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ На последнем этапе, разумеется, нужно иметь некоторый специальный алгоритм, поскольку количество возможных ва- риантов, даже при дискретизации задачи, .заведомо очень ве- лико. Подобные человеко-машинные процедуры хороши еще и тем, что в реальных проблемах подобного рода всегда имеется не- мало неформализуемых факторов, которые можно учесть только в условиях вмешательства эксперта в процесс расчета опти- мального решения. Описанная процедура напоминает процедуру Брауна-Робин- сон для решения задач теории игр. Наконец, существуют еще способы, использующие для целей синтеза идеи Ю. Б. Гермейера. Таким образом, пессимизм за- мечания о том, что вряд ли сегодня могут быть предложены эффективные алгоритмы для решения рассматриваемых задач, может быть, и не очень оправдан. Просто до настоящего вре- мени почти никто еще серьезно не занимался созданием эффек- тивных численных процедур в теории управления иерархиче- скими системами. е) Некоторые особенности з.адач с повторе- нием. Динамические задачи принятия решений, в отличие от статических, при условии, что с системой, ассоциировано не- сколько субъектов, обладают целым ^рядом возможностей для раскрытия неопределенностей. Представляя себе в общих чертах интересы и цели нижних звеньев, Центр может точно и не знать сначала многих конкретных особенностей функционирования Производителей. В результате наблюдений за деятельностью нижних звеньев Центр получает о них определенную информа- цию, которая при достаточном количество повторных процедур принятия решений позволит снять существующую неопределен- ность, устранить имеющуюся неполноту информации. Эта про- блема получила название проблемы адаптивного управления. Она возникла еще в пятидесятых годах, а сейчас идеи адапта- ции успешно используются в теории иерархических систем (см. работы [26, 58]). Развиваемая теория имеет большое при- кладное значение. В частности, она позволяет выявить те скры- тые резервы, которыми обладают Производители и которые, бу- дучи известными Производителям*, обычно не сообщаются верх- ним уровням иерархии. Поясним на примере некоторые из возникающих здесь осо- бенностей. Предположим, что целевая функция Производителя Имеет вид J i == CiPt — a>iLi, (4.35) где Рг = at (xt + urf1 L\~kl, i — l.N. Здесь а/ —эффектив- ность фондов, xi — объем фондов, щ— инвестиции Центра,
§ 4. ПРИМЕРЫ ИЕРАРХИЧЕСКИХ СИСТЕМ 183 (Xi + Ui). Предположим, что эффективность фондов Центру неизвестна. Задача Центра — так разместить инвестиции между Произво- дителями, чтобы максимизировать аддитивный функционал N Т (4-36) i = l t=o На первом шаге процесса Центр может распределить инвести- ции ю(1), исходя из некоторых неточных значений коэффи- циента эффективности а/, например at = а,о. Полагая, что Производитель максимизирует свой доход на каждом шаге (например, он стремится его максимизировать в течение каждого года), мы находим из условия dZ7 = (l — (•*« + ut) * ~ o, что r __Г ciai (* — ki) L‘-L— Здесь величина ui считается известной, она вычисляется, напри- мер, на основе тех или иных предположений об эффективности фондов. Зная Li, мы можем вычислить затем и величину Р,: Г с.а, (1—k.) Л(1) = а<(х< + «<(1))[ 1 l\t . (4.37) Но величина Pi станет известной Центру независимо от расче- тов: Р;(1)—это продукция Производителя, . поступающая на склад Центра. Следовательно, формула (4.37) позволит ему определить неизвестную величину а,. Итак, смысл адаптивного управления очевиден: мы делаем определенные предположения о возможном значении неизвест- ного нам параметра. В результате наблюдений за теми или иными характеристиками процесса мы получаем новую инфор- мацию, которая дает нам возможность найти точное значение неизвестного параметра. Предлагаемые рассуждения могут быть использованы и для анализа более сложных случаев. Может оказаться, например, что Центру будут неизвестны Два параметра: не только эффективность фондов, но, например, и величины Xi. Тогда равенство (4.37) будет связывать две не- известные величины: а,- и Xi. На следующем шаге мы можем вычислить г с.а, (1 - k.) -|(l~*i)/*i Pt (2) = at (xt 4- ut (2)) [-L1L—Ш j (4.38)
184 ГЛ. 111. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ и, сравнивая это значение с наблюдаемым Р<(2), получим вто* рое уравнение для определения второй неизвестной величины. Но для этого нам надо задать еще величины щ(2). Если на первом шаге мы задали величины ц<(1) на основании той или иной гипотезы о значениях неизвестных величин щ и xt, то на Следующем шаге мы можем уже использовать более тонкие рас* суждения, имея в виду аддитивный характер функционала. Величины м<(2) мы можем, например, вычислить из условия максимума к j1-1 при дополнительных условиях (4.37) и (4.38), где «/(!) счи* тается известным. В результате мы найдем щ и xi. Схему адаптивного управления можно еще больше услож* нить, отыскивая и/(1) и м/(2), максимизируя N ^cdPity + P,®] при условиях (4.37) и (4.38). • Схема адаптивного управления—> это очень гибкий меха* низм, который может быть приспособлен для анализа «весьма широкого спектре проблем принятия решений в условиях неон* ределенности. Повторение 'актов принятия решений способно обеспечить исследователя недостающей информацией. В про* цессе деятельности предприятий производственные функции мо« Гут меняться. Это значит, что в рамках той или иной аппрокси* мации будут изменяться их параметры. Расхождение величин, вычисленных заранее, с данными наблюдений как раз и будет означать, что значения параметров производственной функции Изменились. Используя рассуждения, подобные тем, которые были здесь проведены, мы можем восстановить неизвестные зна* чения этих параметров. Эффективность использования идей адаптации во многом за* висит от структуры используемых функционалов. Эти идеи позволяют относительно просто восстанавливать значения неиз- вестных параметров, если функционал Центра имеет вид суммы (4.36). Можно развить более или менее эффективные процедуры типа динамического программирования и для общего случая аддитивных функций. Что же касается целевых функций более общего вида, то реализация подобных адаптационных алго- ритмов представляется очень сложной. Насколько известно автору, для общего случая нет каких-либо эффективных алго- ритмов.
4 5. ПРОГРАММНЫЙ МЕТОД 185 § 5. Программный метод в нерефлексных системах Анализ нерефлексных систем, а тем более выработка управ* ляющих воздействий в подобных системах, представляется про* блемой столь сложной и многоплановой, что говорить о каких* либо универсальных методах очень трудно. Тем не менее в те* чение последних 10—15 лет возник некоторый общий подход к созданию принципов управления в сложных нерефлексных си- стемах. Он получил название программного (или программно- целевого) метода. Строго говоря, термин «метод» не очень под- ходит для его описания. Скорее, это совокупность рекомендаций, которые достаточно хорошо разработаны и приобретают черты метода только в некоторых специальных случаях управления экономическими системами. В этом параграфе мы опишем об- щую схему программного метода в кибернетических системах, а затем продемонстрируем ее применительно к задаче управле- ния централизованным народнохозяйственным организмом со* циалистического типа. а) Еще раз о задаче двухэтапной оптимиза- ции. В предыдущих главах мы уже изложили подходы к ана- лизу сложных, многокритериальных проблем, в частности под- черкнули необходимость сочетания формальных и неформаль- ных методов при исследовании любых более или менее трудных задач управления. Сейчас эти идеи будут конкретизированы и использованы для выработки общих подходов в проблемах вы- бора управлений в кибернетических системах. Рассмотрим снова систему с одним субъектом (управляе- мую динамическую систему) ^ = /(х, и, I, I), (5.1) где £(/) описывает случайные внешние воздействия. Для этой системы мы формулируем цель управления. Предположим, что формулировка цели — некоторый внешний акт (например, цель является доктриной). Цель управления мы можем формулиро- вать в терминах принадлежности траекторий системы некото- рому множеству, в виде условий, накладываемых на терминаль- ные значения фазовых-переменных, целью управления может быть система контрольных показателей в экономике или задан- ная орбита вывода космического аппарата. Таким образом, цель управления — это некоторые ограниче- - ния. Кроме того, мы формулируем критерии, оценивающие спо* собы достижения цели управления (например, затрату горю* чего или другого ресурса), т. е. критерии оценивают стоимость достижения цели в тех или иных терминах. Итак, первый этап процесса управления — это получение из* вне цели управления и формирование, на основе принципов
186 ГЛ. 1П. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ исследования операций, критерия оценки субъектом своих дей- ствий. Одновременно проводится изучение обстановки, т. е. изу- чается процесс |(0. Следующий шаг — это построение оптимальной программы. На основе изучения внешней обстановки формулируется опре- деленная гипотеза о природе функции |(0: £ (0 *=&>(/), • (5.2) где go(0—известная функция времени. Теперь задача опреде- ления оптимальной программы может быть сформулирована как задача оптимального управления: определить управляющие воз? действия на систему, позволяющие ей достичь цели управления с наилучшим (максимальным или минимальным — это зависит от смысла критерия) показателем качества.. Кроме того, при решении задачи расчета оптимальной про- граммы мы обычно используем вместо уравнений (5.1) некото- рое упрощенное описание: это дает нам возможность относи- тельно просто провести необходимые расчеты. Подобные упро- щения глубоко мотивированы — мы об этом уже гово'рили и еще не раз будем говорить. Следующий этап — это управление программой. В силу того, что: 1) предположение (5.2)—это лишь аппроксимация реаль- ности, 2) для описания программы мы использовали прибли- женные, упрощенные уравнения, 3) система оказалась подвер- женной дополнительным силам, которые мы не приняли. во внимание, 4) наши команды (управляющие воздействия) были реализованы недостаточно точно, реальная траектория нашей си- стемы будет отличаться от расчетной. Значит, если мы не вме- шаемся в характер движения, то система не достигнет цели управления. Поэтому мы должны проектировать систему об- ратной связи, т. е. систему механизмов, способных реагировать на отклонения от программы и формировать новые или изме- нять программные управляющие воздействия так, чтобы ошибка достижения цели управления была минимальной. Итак, программный метод управления в технических (ре- флексных) системах сводится к реализации трех этапов. 1. Предварительный анализ, изучение ситуации, в результате которого вырабатывается определенный сценарий процесса (со- вокупность сведений о внешней среде). 2. Расчет, в рамках данного сценария, программной траек- тории. 3. Разработка механизмов обратной связи. б) Общий случай кибернетических систем не- рефлексного типа. Рассмотрим теперь кибернетическую систему достаточно общего вида x=f(x, иь .... uN, I, 0; (5.3)
§ 5. ПРОГРАММНЫЙ МЕТОД 187 где управления ui......находятся в распоряжении различ- ных субъектов. Как мы уже говорили в начале главы, изучение систем вида (5.3) можно вести только с субъективных позиций. Условимся вести анализ с позиций субъекта номера 1. Значит, если в тексте говорится «мы», то это означает «субъект но- мер 1». В кибернетических системах вида (5.3) цель может уже и не быть экзогенным фактором (заданным извне). В то же время субъект, настраивающий систему управления космического ап- парата, не сам изобретает цель: она ему задается, это для него доктрина, и он не участвует в ее формировании. Примечание. Последнее утверждение, конечно, не совсем точно. Ис- следователь, анализируя возможность достижения цели управления, может информировать «высший уровень», например, о невозможности достижения цели. Другими словами, исследователь может проводить селекцию целей. Что же касается самих целей, то они возникают как некоторая метацель — дель более высокого уровня. Например, назначение орбиты, на которую дол- жен быть выведен космический аппарат, преследует цели, которые не зависят от инженера-проектировщика ракеты. Иное дело — нерефлексные системы, например экономичен ские. Как правило, цели должны быть выработаны внутри са- мой системы, поскольку верхнего уровня, задающего цель, мо- жет просто не оказаться, как в случае самостоятельной фирмы или народнохозяйственного организма страны. Но как бы ни была поставлена цель, она, начиная с некоторого момента, так- же приобретает роль доктрины. Правда, в случае нерефлексных систем эта доктрина является субъективным представлением о цели того, кто ее формирует. Я уже говорил о том, что у каждого организма существует определенная объективная цель — сохранение и упрочнение соб- ственного гомеостазиса. Но этот организм (система) функцио- нирует в условиях, которые не только непрерывно меняются, но и неизвестны субъекту. Значит, он никогда точно не знает своих, объективно ему присущих целей. Поэтому те цели, которые он назначает, отражают его субъективное представление. Напри- мер, в качестве цели в экономике очень часто назначают доход» В определенных условиях, например в рыночной экономике, максимизация дохода гарантирует стабильность. Значит, те цели, которые назначает фирма, ее руководитель, отражают его субъективные представления о тех мероприятиях, которые не- обходимы для максимизации дохода. Но эти субъективные представления могут оказаться неточ- ными (и даже неверными). Кроме того, ситуация может со вре- менем измениться. Значит, и цели также должны быть изме- нены. Поэтому процедура назначения целей в кибернетических системах нерефлексного типа представляет собой верхнюю петлю обратной связи, отслеживающей гомеостазис организма
188 ГЛ. III. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ в целом. Назначение целей в экономической системе — это своеобразный адаптационный механизм. В результате мно- гократного повторения процедуры назначения целей и на- блюдения за результатами снимается целый ряд неопределен- ностей, устанавливается более ясное понимание целей. . Но одновременно меняются и внешние условия, меняется ха- рактер гомеостазиса. В этом вечном рассогласовании субъек- тивного представления о целях с объективными потребностями организма и состоит основная трудность в разрешении конфлик- та на верхнем уровне. И эффективность функционирования ме- ханизма адаптации организма во многом зависит от характера процедур назначения целей, от того, насколько они бывают обо- снованы. В этом и состоит одно из важнейших отличий управ- ления в кибернетических системах от управления техническими системами. Формирование целей превращается в самостоятель- ную проблему и .требует создания специальной системы проце- дур, о которых мы еще будем говорить, разбирая отдельные примеры. Этот первый этап (формирование целей) предполагает еще формирование сценария. Но и здесь мы сталкиваемся с целым рядом особенностей, отличающих рефлексные системы от не- рефлекеных. В технических (рефлексных) системах мы также составляем сценарий. Но этот сценарий ограничивается описа- нием только внешней обстановки — вектор-функции £(/). В не- рефлексных системах присутствуют еще и другие субъекты. Их поведение нам неизвестно, но от него зависит и возможность достижения наших целей, и сами цели. Поэтому сценарий дол- жен включать наши предположения о действиях других субъ- ектов. Формирование сценария превращается в сложную со- циальную проблему. Некоторые особенности этой проблемы были показаны на примере систем, обладающих иерархической организацией, и на системах гермейеровского типа. После того как назначены цели и сформирован сценарий, наша система превращается в обычную рефлексную систему, и для ее анализа можно использовать те методы и принципы, которые были раз- виты для рефлексных систем. Значит, следующий (второй) этап —это формирование про- граммы. Но системы нерефлексного типа (в частности, эконо- мические) бывают настолько сложны, что этап формирования программы разбивается на два. Расчет программы производится с помощью упрощенной сй^ стемы моделей. Это —важнейший элемент наряду с процедура- ми выбора цели в организации верхней петли обратной связп. Но для устойчивости функционирования организма в целом этой петли обратной связи может оказаться мало. Поэтому в эко-' комических системах выделяют еще третий этап планирова*
$ 5. ПРОГРАММНЫЙ метод 189 вия___расчет плана на более короткий срок, но с большей де- тализацией параметров системы. Программа превращается в долгосрочный план (специальным образом организованный). Последний, четвертый этап — это этап реализации плана, т. е. проектирование механизмов, реализующих многочисленные «малые» петли обратной связи. Такова общая схема. Проиллюстрируем ее на примере функ- ционирования экономического организма страны или региона — организма с Централизованной социалистической формой произ- водственных отношений. в) Формирование целей и прогноз в экономи- ческих системах. Программный метод выступает как еди- ное начало для анализа всего комплекса проблем управления централизованной социалистической экономикой. Поэтому его детализация, разработка эффективного аппарата, создание та- кой его схемы, чтобы на каждом уровне иерархии специалист мог работать с относительно небольшим объемом информации, приобретает все большее значение для практики. Мы указали четыре этапа реализации программного метода. Конечно, подобное разделение весьма условно. И вообще, четко отделить один этап от другого не так просто. Но как бы ни была условна предложенная схема разделения на этапы, она отражает многие существующие черты программного метода. Попробуем пояснить содержание этих этапов на некоторых при- мерах. Проблемы, изучения ситуации и ее возможный прогноз удоб- но разделить на два класса. К первому мы относим изучение разнообразных внешних обстоятельств — изучение тенденций развития международных отношений, международной торговли, рынка, перспективы технического прогресса, перспективы раз- вития или истощения запасов полезных ископаемых, особенно- стей эволюции биосферы и т. д. В результате подобных иссле- дований возникает несколько вариантов сценария. Заметим, чго необходим в некотором смысле активный прогноз — мы должны изучать не только характер изменения внешних факторов, но и нашу способность влиять на их изменение. Ко второму классу мы относим все проблемы, которые связаны с изучением воз- можностей своего собственного экономического организма. В по- следние-4 5—20 лет получили большое распространение прогно- зы, основанные на различных экспертизах — на экспертных оценках. Это — важное направление деятельности, и мы ему по- святим специальную главу. Однако подчас возможности экспер- тиз переоцениваются. В действительности, чем сложнее оказы- вается проблема, тем менее надежными оказываются мнения экспертов. И основой прогностической деятельности должны быть в конечном счете математические модели. Но они должны
190 ГЛ. III. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ иметь иную природу, чем те модели, с помощью которых ве- дется управление. Прежде всего, эти модели должны быть отно- сительно просты. Прогноз никогда не выделяет единственной траектории — это не план и не программа. Напомним, что про- гностическая деятельность относится к тому этапу, когда цели еще не поставлены. Основная задача прогноза — это создание ясного понимания возможностей развития, его перспектив. Мы его трактуем как задачу построения в пространстве интересую- щих нас параметров (или критериев) множеств достижимости. Прогноз возможностей имеет своей задачей дать представле- ние .о том, какие цели могут быть реально назначены, причем обычно речь идет о конечном продукте. Но не только конечный продукт может интересовать исследователя. Очень важную роль играют различные социальные факторы. Например, любые пе- рестройки пропорций, изменение структуры производства и т.д, могут быть весьма болезненны, и субъект, изучающий ситуацию, должен также все это иметь в виду. Исследователю следует за- думываться и о будущем. Значит, он должен изучать не только предельные возможности получения конечного продукта, но н возможные мощности различных отраслей. Так или иначе, на рассматриваемом этапе возникает целый ряд показателей (кри- териев) /1, Ц, ..., Ik- Далее мы составляем некоторую упрощенную математиче- скую модель нашей кибернетической системы — описание функ- ционирования экономического организма в агрегированных по- казателях. Эта система может быть приведена к виду У = Ф (У, и, I), • (5.4) где у — фазовая переменная, и — управление. Заметим, что с этой системой ассоциирован лишь один субъект и она не со- держит никаких неопределенных факторов. Предполагается, что исследование ведется в рамках того или иного сценария, в ко- тором уже использованы все необходимые гипотезы. Это мо- дель, изучающая внутренние возможности — возможности «на- шего» управления. Задача прогноза — для разных моментов времени построить отображение множества наших управляющих возможностей Gu, ue Gu, в пространство критериев Л. В результате в простран- стве h мы получим некоторое множество й, каждая точка ко- торого отвечает определенной стратегии использования управ- * ляющих воздействий. Множество Q естественно назвать множеством экономиче- ских возможностей. Позднее мы будем заниматься оценкой программ. Каждая программа требует определенной затраты конечного продукта, т. е. определяет некоторую точку в про- странстве критериев h. Если окажется, что эта точка принад-
. § 5 ПРОГРАММНЫЙ МЕТОД 1<Ц лежит множеству Q, то экономические возможности организма допускают реализацию подобной программы. Особое значение приобретает та часть границы множества Q, которая является паретовским множеством. На рис. 5.1 паретовской частью гра- ницы является дуга АВ. По существу, нас будет интересовать лишь небольшая часть множества Q, примыкающая к паретовской границе. /г-— Цели, как уже было сказано, огра- ( Ч. жают субъективные взгляды лица, пред- \. 0 у. ставляющего данный экономический' ор- \ \ ганизм, и, как правило, формулируются X. Is не только в терминах конечного продук- -----\ та, сколько с помощью языка политики 0-------‘ или общеэкономических соображений. Трансляция этих общих установок в си- Рис. 5.1. стему понятий чисто экономических и их выражение в терминах конечного продукта, разумеется, яв- ляется компетенцией экспертов. Но деятельность этих экспер- тов должна опираться на определенный инструментарий. Его основой как раз и является служба прогнозов с использованием системы грубых оценочных моделей. г) Один условный пример. Предположим, что речь идет о развитии производительных сил региона, в котором до- бывается энергетическое топливо. Обозначим через xi основные фонды отрасли, добывающей топливо. Ее.динамика описывается следующим уравнением (все величины даются в денежном выражении): А = У\ + zi — «Л- ' (5-5) Здесь у\ — внутренние инвестиции региона, Z\ — инвестиции верхнего уровня (государства) или банковский кредит, Hi — ко- эффициент амортизации. Эта отрасль в единицу времени производит продукт Pi (из- влекает ресурс в количестве Pi), объем которого определяется формулой Pi = «!(/) Л (хь Li, Q[), (5.6) где Li — количество людей, занятых в отрасли, Qi — количество уже извлеченного ресурса, причем = (5.7) «1(0—коэффициент, характеризующий эффективность техно- логий— «экзогенный научно-технический прогресс». Он показы- вает, как при прочих равных условиях повышается эффектив- ность производства за счет усовершенствования технологий.
192 ГЛ. Ш. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ Зависимость ai(0 определяется экспертом на основе опыта — это экстраполяция опыта на будущее. Зависимость Pi от Qi, т. е. зависимость количества ресурса, извлекаемого в единицу времени, от объема уже извлеченного ресурса, представляется убывающей выпуклой функцией (рис. 5.2): по мере эксплуатации месторождения затраты труда на добычу единицы ресурса непрерывно растут. Этот факт и изображен на рис. 5.2. В данном регионе существует еще одна возможность-произ- водства ресурса (новая технология или новый бассейн). Но прежде, чем эта новая возможность начнет давать реальный продукт, необходимо в течение длитель- ного времени вкладывать туда! капитал, без отдачи в данный плановый период. Развитие этой новой отр'асли (или тех* нологии) будет описываться уравнением для ее фондов • x2 = y2 + z2, • (5.8) где у2 — внутреннее, а г2 — внешнее ин- вестирование. Всю остальную промышленность ре- гиона мы будем описывать' обычной двухсекторной моделью. Фонды первого подразделения (произ- водство средств производства) обозначим через Хя, а второго (производство средств потребления) —через х4. Их динамика описывается уравнениями хз = Уз — х3х3, х4 = у4 — х4х4, (5.9) а производственные возможности — стандартными производ- ственными функциями Рз — а3 (0 /з (*3> ^з), Pi = а4 (0 fi (х4, Li), (5.10) где аз(0 и а4(0—коэффициенты, характеризующие влияние технического прогресса на производительность труда, LjhLh количество рабочей силы, занятой в производстве этих подраз- делений. Для того чтобы создавать фонды в новой отрасли, необхо- димы определенные трудовые ресурсы. Обозначим их через L2. Очевидно, что L2 должно быть функцией суммарных инвестиций у2 + z2> Т. е. £2 = (DQ/2 + z2). • (5.11) Эта функция существенно нелинейна и имеет вид, изображен* ный на рис. 5.3. В самом деле, уже до начала освоения выде* ленных средств должен возникнуть некоторый производственный
5 5. ПРОГРАММНЫЙ метод 193 коллектив — до тех пор, пока не возникла некоторая «критиче- ская масса» коллектива, реальная производственная деятель- ность начата быть не может. Внутренние инвестиции региона у\, уг, Уз, У* определяются объемом продукции первого подразделения: Рз У\ =h Уз + Уз + Уь (5.12) «• И наконец, количество рабочей силы подчинено очевидному ограничению: Е (5.13) i-1 х где L (0 — суммарное количество рабочей силы в регионе. Для того чтобы эта модель могла изучаться количествен- -ными методами, она должна быть насыщена информацией. Структура производственных функций определяется по ста- тистическим данным. Коэффициенты а,(/)—это экспертный прогноз. Что касается величины ' ( L(f)—прогноза динамики рабочей —— силы, то это либо результат эксперт- ного прогноза, либо результат рас- _ f чета по демографической модели. У Управляющими факторами здесь являются инвестиции zi и рас-, пределение рабочей силы Li. За? _________________________ г дав эти величины как функции вре- 0 Уг*гг мени, мы получим замкнутую мо- рис 53 дель. Система уравнений и ограни- чений (5.5)—(5.13) позволит нам решить задачу Коши: по дан» ным начальным условиям определить траекторию развития ре- гиона— величины Xt (t). Опишем теперь•интересы региона. Прежде-всего, руковод- ство региона заинтересовано в обеспечении определенного уров- ня жизни жителей региона. Его можно описать различным об- разом, например в интегральной форме: т * (5.14) о где Т — срок прогнозирования. Вместо функционала (5.14) мож- но взять и функционал (5.15) характеризующий количество потребительского продукта, выра- батываемого на одного работающего, Условие Wi~>max также 7 Н. Н. Моисеев
194 ГЛ. III. КИБЕРНЕТИЧЕСКИЕ СИСТЕМЫ И ИМИТАЦИЯ определит стремление обеспечить высокий жизненный уровень населения. Далее, производство ресурса. Pi дает определенный доход, который регион может расходовать на социальные нуж- ды, на развитие региональной инфраструктуры (строительство дорог, жилья и т. д.). Если все величины, входящие в систему уравнений модели, даны в денежном выражении, то доход от ресурса добывающей отрасли будет равен т w2 = (Pi — Zi) dt, (5.16) о поскольку внешние инвестиции могут рассматриваться как долг банку.. Наконец, региональное руководство должно заботиться и о будущем. Добывать ресурсы старым способом становится все труднее и труднее. Необходимо менять технологию или на- чинать эксплуатацию нового бассейна. Значит, в интересах ре- гионального руководства такое использование управлений, ко- торое обеспечивает — х2 (Г)-> max. (5.17) Таким образом, выбор стратегии, выбор управляющих воз- действий определяется по меньшей мере тремя функционалами: Wi, w2 и Wz. Исследовать ^свойства модели мы можем с по- мощью серии задач оптимального управления. Например, может быть предложена следующая система расчетов. Положим у2 = = z2 = 0. Тогда W3 = 0. Положим еще i/i = Zi = 0 и Li=0. Тогда Л = 0 и все ресурсы направляются во второе подразде- ление. Этой стратегии отвечает абсолютный максимум функцио- нала a>i (максимальное проедание своих ресурсов). Другой крайний случай —это максимизация функционала ш2. Здесь решение тоже несложно, так как это будет задача со свободным правым концом для достаточно простой системы дифференциальных уравнений. В плоскости (wi,w2), отметим значения, соответствующие этим крайним случаям: wf и (рис. 5.4). Разумеется, оба крайних случая не являются реаль- ными— они только демонстрируют предельные возможности производственного механизма. Рассмотрим теперь функционал вида w = Yio»i + y2w2. (5.18) В плоскости (wi,w2) уравнению (-5.18) соответствует некоторая прямая (см. рис. 5.4). Решим теперь задачу й-> max. Ее решение обозначим через й>+. Соединим точки oij1', w+ и w+, w} прямыми. Получим некоторый четырехугольник, огра-
§ 5. ПРОГРАММНЫЙ метод 195 «цену» каждого из функционалов. ничейный этими прямыми и осями координат. Этот четырех- угольник дает приближенное описание множества экономиче- ских возможностей при условии, что мы не будем создавать мощностей новбй отрасли. Уже полученные результаты представляются важными: они показывают не только предельные возможности экономического организма, но и условную Мы видим, как измене- ние значений одного из функционалов меняет значение другого. Теперь • положим Щз==₽о>О, (5.19) т. е. зададим некоторое фиксированное значение объема мощностей новой отрасли в конце плано- вого периода. И снова рассмотрим те три опти- мизационные задачи, ко- торые мы изучали при а>з = 0. Эти задачи с условием риметрическими ’ задачами, а некоторая ломаная, которая на Далее мы положим (5.19) будут некбторыми изопе- условию (5.,19) будет отвечать рис. 5.4 изображена пунктиром. — Pi > Ро и нанесем точками новую ломаную и т. д. В результате мы получим достаточно ясное представление .не только о предельных возможностях экономики региона, но и о том, каковы должны быть «жертвы» в величинах функцио- налов twi и W2, обеспечивающие создание задела для будущего. Для получения более наглядных результатов можно еще про- вести серию подобных расчетов, рассматривая плоскости (a»i, аУз) и (w2, а/3). Пример, который мы рассмотрели, достаточно условен. Но он демонстрирует одну важную особенность того