/
Текст
Ю.М. Коршунов
МАТЕМАТИЧЕСКИЕ
ОСНОВЫ
КИБЕРНЕТИКИ
Ю. М. КОРШУНОВ
МАТЕМАТИЧЕСКИЕ
основы
КИБЕРНЕТИКИ
ИЗДАНИЕ ВТОРОЕ,
ПЕРЕРАБОТАННОЕ И ДОПОЛНЕННОЕ
Допущено Министерством
высшего и среднего специального
образования СССР
в качестве учебного пособия
для студентов вузов, обучающихся
по специальности «Автоматика
и телемеханика»
МОСКВА «ЭНЕРГИЯ» 1980
ББК 32.81
К 70
УДК 681.5(075.8)
Коршунов Ю. М.
К 70 Математические основы кибернетики: Учеб, по-
собие для вузов. — 2-е изд., перераб. и доп. — М.:
Энергия, 1980. — 424 с., ил.
В пер.: 1 р. 10 к.
Книга содержит систематическое изложение математического ап-
парата, используемого при исследовании кибернетических моделей
сложных систем, а также методов оптимизации таких систем, и ста-
вит целью ввести студента в круг понятий современной теории управ-
ления.
По сравнению с первым изданием (1972 г.) в книгу внесены су-
щественные изменения и добавления: полностью переработана глава
по многомерным пространствам, расширены разделы по методам оп-
тимизации, добавлены разделы по планированию эксперимента, не'
линейному программированию, поисковым алгоритмам оптимизации,
теории массового обслуживания.
Книга предназначена в качестве учебного пособия для студентов
вузов, обучающихся по специальности «Автоматика и телемеханика».
30500-247
К------------- 156-80. 1501000000
051(01)-80
ББК 32.81
6Ф0.1
© Издательство «Энергия», 1980 г.
ПРЕДИСЛОВИЕ
Вопросы кибернетики как науки об общих законов
мерностях процессов управления в системах различной
физической природы [1—5] занимают в последние годы
все больше и больше места в дисциплинах, связанных с
изучением управляемых систем. Чрезвычайно актуаль-
ными эти вопросы являются для специальности «Авто-
матика и телемеханика», в которой изучению различных
аспектов автоматического управления посвящен целый
ряд дисциплин учебного плана. В то же время чи-
таемый в технических вузах курс высшей математики с
упором на изучение непрерывных и детерминированных
процессов оказывается недостаточным для изложения
ряда общетеоретических и специальных дисциплин
учебного плана этой специальности, таких как «Теоре-
тические основы кибернетики», «Оптимальные и адап-
тивные системы», «Теория и применение управляющих
машин», «Большие системы автоматического управле-
ния», в которых упор делается на дискретное и случай-
ное. В этих дисциплинах находят широкое применение
методы оптимизации, основанные на использовании ли-
нейного, нелинейного и динамического программирова-
ния, теории игр, теории статистических решений, методы
планирования эксперимента, методы теории расписаний
и массового обслуживания. В основе всех этих методов
лежат общие математические понятия теории множеств
и отношений, теории графов, теории многомерных прост-
ранств и линейных преобразований, теории вероятностей
и математической статистики. Общность математиче-
ских основ для многочисленных методов оптимизации
позволяет изложить все эти методы весьма компактно и
с единых позиций, что в значительной степени облег-
чает изучение перечисленных дисциплин и установление
связи между ними.
После выхода в свет в 1972 г. первого издания учеб-
ного пособия автор получил ряд отзывов и пожеланий по
1
3
улучшению его содержания. На основе этого во второе
издание учебного пособия внесены существенные изме-
нения.
Полностью переработана глава по многомерным
пространствам, получившая теперь название «Элементы
линейной алгебры и выпуклые множества». В ней наря-
ду с более строгим изложением линейных пространств
рассмотрены линейные преобразования и элементы тео-
рии матриц. В главу по математической статистике вве-
ден раздел, посвященный планированию эксперимента.
Значительно расширены разделы, посвященные методам
оптимизации. Добавлены разделы, посвященные нели-
нейному программированию и поисковым алгоритмам
оптимизации. Введена новая глава, посвященная за-
дачам теории расписаний и массового обслуживания.
Хотя книга предназначена как учебное пособие по
специальности «Автоматика и телемеханика» и в ней
обобщен опыт автора по чтению ряда дисциплин именно
для этой специальности, однако она может быть исполь-
зована и как учебное пособие для других специально-
стей шестой группы, имеющих соответствующие дисцип-
лины в учебных планах.
Автор выражает признательность всем лицам, при-
славшим отзывы и пожелания после выхода в свет пер-
вого издания учебного пособия. Особую благодарность
автор выражает профессору Л. Т. Кузину, ценные сове-
ты и замечания которого способствовали улучшению со-
держания книги,
Автор
Указатель обозначений
{ , . . } — множество
С — принадлежность множеству
С — непринадлежность множеству
CZ— символ включения
С—символ строгого включения
U — объединение множеств
П — пересечение множеств
\ — разность множеств
X — прямое произведение множеств
X— дополнение множества X
X — степень множества
0 — пустое множество
/ — универсальное множество
R — множество вещественных чисел
9Л — система множеств
sup М — верхняя граница множества М
inf М — нижняя граница множества М
Пр; М — проекция множества на ось i
(aY . . . ап) — упорядоченное множество (кортеж, вектор)
Л — пустой кортеж
V — квантор общности
— эквивалентность по определению
-> — следствие, отображение
f О § — композиция функций f и g по связке О
= — символ отношения эквивалентности
< — символ отношения порядка
< — символ отношения строгого порядка
> — символ отношения доминирования
d(x, у) — расстояние между элементами множества
|| х || —норма величины х
Еп — евклидово n-мерное пространство
С^а £] —пространство непрерывных функций
Z — пространство исходов эксперимента
2 — исход эксперимента, случайная величина
о
__2 — центрированная случайная величина
i == 1,п —перечисление t= 1, п
p(z),z£Z —распределение вероятностей по пространству Z
P(S), Ps — вероятность события
Л( z\ S) — условное распределение вероятностей
р(у, z) — совместное распределение вероятностей
2, v, М (z), f(z) —среднее значение
а, (У2 — среднеквадратическое отклонение
5
R (v, co) — равномерное распределение
Af(v, о2) —нормальное распределение
w(r, п, р) — биномиальное распределение
w(r а) — распределение Пуассона
и — управление
О’ — состояние природы
х — состояние системы
Т(х, и) —преобразование состояния системы
q(x, и), Q(x, и) —целевая функция
J(u), Jn(u) — критерий качества управления
г) —смешанные стратегии
L(%, 1]) —функция потерь
А — пространство решений
а — решение, действие
а* — байесовское действие
/?*(£) — потери при байесовском действии
d(z) — решающая функция
р(0, d) — функция риска
p*(g) —байесовский риск
ГЛАВА ПЕРВАЯ
ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ МНОЖЕСТВ
1-1. КОНЕЧНЫЕ И БЕСКОНЕЧНЫЕ МНОЖЕСТВА
а) Основные определения
Понятие множества является фундаментальным не-
определяемым понятием. Интуитивно под множеством
будем понимать совокупность определенных вполне раз-
личаемых объектов, рассматриваемых как единое
целое.
Можно говорить о множестве стульев в комнате, мно-
жестве людей, живущих в г. Рязани, множестве студен-
тов в группе, множестве натуральных чисел, множестве
букв в алфавите, множестве состояний системы и т. п.
При этом о множестве можно вести речь только тогда,
когда элементы множества различимы между собой. На-
пример, нельзя говорить о множестве капель в стакане
воды, так как невозможно четко и ясно указать каждую
отдельную каплю.
Отдельные объекты, из которых состоит множество,
называются элементами множества. Так, число 3 — эле-
мент множества натуральных чисел, а буква б — эле-
мент множества букв русского алфавита.
Общим обозначением множества служит пара фигур-
ных скобок { }, внутри которых перечисляются элемен-
ты множества. Для обозначения конкретных множеств
используются различные прописные буквы Л, S, X... или
прописные буквы с индексами Alf А2... Для обозначения
элементов множества в общем виде используются раз-
личные строчные буквы a, s, х... или строчные буквы с
индексами а\, а2...
Для указания того, что некоторый элемент а являет-
ся элементом множества S, используется символ € при-
надлежности множеству. Запись а£ S означает, что эле-
мент а принадлежит множеству S, а запись S озна-
7
чает, что элемент х не принадлежит множеству S. За-
писью %1, X2,...,xnZS пользуются в качестве сокращения
для записи х\ € S, х2 £ 5,..., хп € S.
Множества бывают конечными и бесконечными. Мно-
жество называется конечным, если число его элементов
конечно, т. е. если существует натуральное число N, яв-
ляющееся числом элементов множества. Множество на-
зывается бесконечным, если оно содержит бесконечное
число элементов.
Для того, чтобы оперировать с конкретными множе-
ствами, нужно уметь задавать эти множества. Сущест-
вуют два способа задания множеств: перечисление и опи-
сание. Задание множества способом перечисления соот-
ветствует перечислению всех элементов, составляющих
множество. Так, множество отличников группы можно
задать, перечислив студентов, которые учатся на отлич-
но, например {Иванов, Петров, Сидоров}. Для сокра-
щения записи Xn={xi, х2,..., хп} иногда пишут Х={х^
или вводят множество индексов /-={1, 2,..., п} и пишут
X={xi}, i € /. Такой способ удобен при рассмотрении ко-
нечных множеств, содержащих небольшое число элемен-
тов, но иногда он может применяться и для задания бес-
конечных множеств, например {2, 4, 6, 8...}. Естественно,
что такая запись применима, если вполне ясно, что по-
нимается под многоточием.
Описательный способ задания множества состоит в
том, что указывается характерное свойство, которым об-
ладают все элементы множества. Так, если М — множе-
ство студентов группы, то множество А отличников этой
группы запишется в виде
А = {х £ М | х — отличник группы},
что читается следующим образом: множество А состоит
из элементов х множества Л4, обладающих тем свойст-
вом, что х является отличником группы.
В тех случаях, когда не вызывает сомнений, из какого
множества берутся элементы х, указание о принадлеж-
ности х множеству М можно не делать. При этом мно-
жество А запишется в виде
А = {х | х — отличник группы}.
Приведем несколько примеров задания множеств ме*
годом описания:
{х|х — четное)—множество четных чисел;
{х|х2— 1 =0} — множество (+1, —1}.
8
Пусть С — множество целых чисел. Тогда {х€С|0<
<х^7} есть множество {1, 2, 3, 4, 5, 6, 7}.
Важным понятием теории множеств является поня-
тие пустого множества. Пустым множеством называется
множество, не содержащее ни одного элемента. Пустое
множество обозначается 0. Например,
{%СС|х2 —х+1 = 0} = О,
Понятие пустого множества играет очень важную
роль при задании множеств с помощью описания. Так,
без понятия пустого множества мы не могли бы говорить
о множестве отличников группы или о множестве веще-
ственных корней квадратного уравнения, не убедившись
предварительно, есть ли воо'бще в данной группе отлич-
ники или имеет ли данное уравнение вещественные кор-
ни. Введение пустого множества позволяет совершенно
спокойно оперировать с множеством отличников группы,
не заботясь о том, есть или нет в рассматриваемой груп-
пе отличники. Пустое множество будем условно относить
к конечным множествам.
Рассмотрим теперь вопрос о равенстве множеств. Два
множества называются равными, если они состоят из од-
них и тех же элементов, т. е. представляют собой одно
и то же множество. Множества X и У не равны (Х=#У),
если либо в множестве X есть элементы, не принадлежа-
щие У, либо в множестве У есть элементы, не принадле-
жащие X. Символ равенства множеств обладает свойст-
вами:
X — X — рефлексивность;
если X=Y, то Y=X — симметричность;
если X=Y и У=2, то X=Z — транзитивность.
Из определения равенства множеств вытекает, что
порядок элементов в множестве несуществен. Так, на-
пример, множества {3, 4, 5, 6} и {4, 5, 6, 3} представля-
ют собой одно и то же множество.
Из определения множества следует, что в нем не
должно быть неразличимых элементов. Поэтому в мно-
жестве не может быть одинаковых элементов. Запись
{2, 2, 3, 5} Следует рассматривать как некорректную и
заменить ее на {2, 3, 5}. Так, множество простых дели-
телей числа 60 равно {2, 3, 5}.
9
б) Понятие подмножества
Множество X является подмножеством множества У,
если любой элемент множества X принадлежит и множе-
ству У. Пусть У — множество студентов группы, а X —
множество отличников той же группы. Так как каж-
дый отличник группы является в то же время студентом
этой группы, то множество X является подмножеством
множества У.
Многие определения теории множеств удобно давать
в виде математических выражений, содержащих некото-
рые логические символы. Для определения подмножест-
ва используем два таких символа:
у — символ, называемый квантором и означающий
«любой», «каков бы ни был», «для всех»;
--------символ следствия (импликации), означающий
«влечет за собой».
Определение подмножества, которое может быть
сформулировано в виде: для любого х утверждение «х
принадлежит X» влечет за собой утверждение «х принад-
лежит У», запишется так:
\х[х GX-+x£Y]. (1-1)
Более краткой записью выражения «X является под-
множеством У» будет запись
ХСУ, (1-2)
что читается как «У содержит X». Используемый здесь
символ С означает включение. Если желают подчерк-
нуть, что У содержит и другие элементы, кроме элемен-
тов из X, то используют символ строгого включения cz:
ХсУ. (1-3;
Связь между символами с: и С дается выражением
ХСУ^ХСУ иХ^У. (1-4)
Здесь использован символ означающий эквива-
лентность (в смысле «то же самое, что»).
Отметим некоторые свойства подмножества, выте-
кающие из его определения:
X С X (рефлексивность);
(ХСУ и VCZ]->XCZ (транзитивность).
Несколько труднее видеть, что для любого множест-
ва М
0QM. (1-5)
10
Действительно, пустое множество 0 не содержит эле-
ментов. Следовательно, добавляя к М пустое множест-
во, мы фактически ничего не добавляем. Поэтому всегда
можно считать, что любое множество М содержит в себе
пустое множество в качестве подмножества.
в) Верхняя и нижняя границы множества
Имея дело с множеством вещественных чисел, можно
сравнивать элементы этого множества по их значению и,
в частности, находить наибольший и наименьший эле-
менты множества. Для конечных множеств, заданных пе-
речислением, эта задача не представляет труда. Так, для
множества Т={4, 3, 5, 6} имеем max Т=6, min Т=3. Од-
нако если множество задано описательным способом, на-
пример указано лишь правило вычисления числовых зна-
чений его элементов, то задача определения наибольше-
го и наименьшего элементов становится весьма трудной.
Несколько более легкой задачей является нахождение
лишь области, внутри которой лежат все элементы мно-
жества. При решении этой задачи очень полезными яв-
ляются понятия верхней и нижней границ множества.
Пусть 5 — множество вещественных чисел. Верхней
границей S является число С, такое, что для любого
х CS имеет место х^С. Чисел, которые могут рассмат-
риваться в качестве верхней границы множества, может
быть бесконечно много, а может и не быть вообще. Так,
в множестве любое С^М является верхней
границей. Множество всех целых чисел не имеет верхней
границы.
Точной верхней границей или супремумом множества
S, обозначаемой sup S, называется верхняя граница, ко-
торая не превосходит любую другую верхнюю границу.
В приведенном выше примере sup S=M. Множество мо-
жет иметь только одну точную верхнюю границу, так как
если Ci и С2— две такие границы, то Ci^C2 и С2^.С\
и, следовательно, Ci=C2.
Нижней границей множества S является число с, та-
кое, что для любого х£ S имеет место х^с. Точной ниж-
ней границей или инфинумом множества S, обозначае-
мой inf 5, называется нижняя граница, не меньшая лю-
бой другой нижней границы. В приводимом примере
inf S=tn.
И
Теорема 1-1 (теорема о верхней и нижней границах
подмножества). Если В СД, то
inf В > inf Д; sup В < sup Д. (1-6)
Доказательство. Обозначим через Ь' элемент
множества В, имеющий наименьшее значение, т. е.
Ъ'£В и Z?z=inf В. Но ВСД, т. е. Ь' € Д. Пусть а' — эле-
мент множества Д, имеющий наименьшее значение, т. е.
а! £ А и а'=\п!А. При этом если Ь'=а\ то fe'=inf Д,
если Ь'=£а\ то 6'>a' = inf Д. Таким образом, fe'^inf А
или inf Вinf Д.
Вторая часть теоремы доказывается аналогично.
1-2. ОПЕРАЦИИ НАД МНОЖЕСТВАМИ
а) Предварительные замечания
Над множествами можно производить действия, ко-
торые во многом напоминают действия сложения и умно-
жения в элементарной алгебре. Чтобы лучше разобрать-
ся в действиях над множествами, необходимо вспомнить
законы, существующие в элементарной алгебре.
Пусть а и Ь — некоторые числа, а-\-Ь — их сумма и
ab — их произведение. Сумма и произведение чисел об-
ладают следующими свойствами, называемыми закона-
ми алгебры.
1. ab=ba — коммутативный или пере-
местительный закон;
2. (а+6)+с=а+(6+с); (ab)c=a(bc) —ассоциа-
тивный или сочетательный закон;
3. (a+b)c=ae+bc — дистрибутивный или распреде-
лительный закон.
Заметим, что в ассоциативном и коммутативном за-
конах можно заменить действие сложения умножением,
а действие умножения сложением. При этом получим
другой закон, который будет так же справедлив, как и
первый. Однако в дистрибутивном законе подобной сим«
метрии нет. Если в этом законе заменить сложение ум-
ножением, а умножение сложением, то придем к а б”
сурду:
(ab) + с = (а + с)(Ь + с).
Спрашивается, всегда ли это так? Не существует ли
алгебры, в которой дистрибутивный закон был бы так же
симметричен относительно сложения и умножения, как
12
коммутативный и ассоциативный законы? Оказывается,
существует алгебра, а именно алгебра множеств, в ко-
торой все три закона симметричны относительно дейст-
вий сложения и умножения.
Сходство между действиями сложения и умножения
проявляется также в существовании двух замечательных
чисел 0 и 1, таких,* что прибавление первого и умножение
на второе не меняют ни одного числа:
а + 0 = а, а-1 = а.
Заметим, что второе соотношение получается из пер-
вого заменой ( + ) на (•) и 0 на 1.
Однако и здесь сходство между действиями сложе-
ния и умножения не простирается особенно далеко. Так,
число 0 играет несколько особую роль по сравнению со
всеми другими числами, в том числе и единицей. Эта
особая роль числа 0 вытекает из соотношения а* 0=0.
Если мы в этом выражении заменим (•) на ( + ) и 0 на 1,
то приходим к соотношению а +1 = 1, которое почти ни-
когда не будет верным.
Как мы увидим далее, сходство между нулем и еди-
ницей в алгебре множеств будет значительно большим,
чем в обычной алгебре.
После этих предварительных замечаний можно при-
ступить к рассмотрению операций над множествами.
6) Объединение множеств
Объединением множеств X и У называется множе-
ство, состоящее из всех тех и только тех элементов, ко-
торые принадлежат хотя бы одному из множеств X, У,
т. е. принадлежат X или принадлежат У. Объединение
X и У обозначается через X (J У. Формальное опреде-
ление
= {х\х€Х или хСУ), (1-7)
Объединение множеств иногда называют суммой мно-
жеств и обозначают %+У. Однако свойства объедине-
ния множеств несколько отличаются от свойств суммы
при обычном арифметическом понимании. Поэтому
этим термином мы пользоваться не будем.
Пример 1-1. Если Х={1, 2, 3, 4, 5} и У={2, 4, 6, 7}, то
7={1, 2, 3, 4, 5, 6, 7}.
Пример 1-2. Если X — множество отличников в группе, а У —
множество студентов, проживающих в общежитии, то X(jy — мно-
13
жество студентов, которые или учатся на отлично или проживают
в общежитии.
Пример 1-3. Рассмотрим два круга, приведенных на рис. 1-1.
Если X — множество точек левого круга, а У — множество точек
правого круга, то ХСД представляет собой заштрихованную об-
ласть, ограниченную обоими кругами.
Понятие объединения можно распространить и на
большее число множеств. Обозначим через ЭЛ = {Хь...
X Y
X Y
Рис. 1-1. Объединение мпо- Рис. 1-2. Пересечение мно-
жеств. жесгв.
..., Хп} совокупность п множеств Xi,..., Хп, называемую
иногда системой множеств. Объединение этих множеств
ихг.= и х = ... IMn
/=1
(1-8)
представляет собой множество, состоящее из всех тех и
только тех элементов, которые принадлежат хотя бы од-
ному из множеств системы ЭЛ .
Для объединения множеств справедливы коммутатив-
вый и ассоциативный законы
= (1-9)
(X U У) U Z = X U (Y U 2) = X U У U 2, (1-Ю)
справедливость которых вытекает из того, что левая и
правая части равенств состоят из одних и тех же эле-
ментов. Далее,
хи 0 = *•
(1-11)
Это также очевидное соотношение, так как пустое
множество не содержит элементов, а значит, X и X(J0
состоят из одних и тех же элементов. Из (1-11) видно,
что пустое множество 0 играет роль нуля в алгебре мно-
жеств. Здесь имеет место аналогия с выражением а-|-0=
—а в обычной алгебре.
14
в) Пересечение множеств
Пересечением множеств X и У называется множеств
во, состоящее из всех тех и только тех элементов, кото-
рые принадлежат как множеству X, так и множеству У.
Пересечение множеств X и У обозначается через Хр|У.
Формальное определение
Xf}Y = {x\xeX и х€У}# (1-12)
Пересечение множеств иногда называют произведе-
нием множеств и обозначают XY. Однако свойства пере-
сечения множеств несколько отличаются от свойств про-
изведения в обычном арифметическом понимании. По-
этому этим термином мы пользоваться не будем.
Пример 1-4. Для множеств X и У в примере 1-1 %Г|У={2, 4}.
Пример 1-5. Для множеств X и У в примере 1-2 /Х’Г|У — мно-
жество отличников группы, проживающих в общежитии.
Пример 1-6. Рассмотрим два круга, приведенных на рис. 1-2.
Если X — множество точек левого круга, а У — множество точек
правого круга, то ХГ)У представляет собой заштрихованную об-
ласть, являющуюся общей частью обоих кругов.
Операция пересечения позволяет установить ряд со-
отношений между двумя множествами.
Множества X и У называются непересекающимися,
если они не имеют общих элементов, т. е. если
ХАК=0. (1-13)
Пример 1-7. Непересекающимися множествами являются:
1) множества {1, 2, 3} и {4, 5, 6};
2) множество отличников и множество неуспевающих студен-
тов в группе;
3) множества точек кругов X и У на рис. 1-3.
Говорят, что множества X и У находятся в общем по-
ложении, если выполняются три условия:
существует элемент множества X, не принадлежа-
щий У;
существует элемент множества' У, не принадлежа-
щий Х\
существует элемент, принадлежащий как X, так и У.
Укажем одно отличие алгебры множеств от алгебры
чисел. Если а и b — два числа, то между ними могут
быть три соотношения или три возможности:
a a = b, b<a. (1-14)
Для двух множеств X и У, однако, может не выпол-
няться ни одно из соотношений:
ХСУ, Х = У, УсХ. (1-15)
15
Так, если X — множество отличников, а У — множе-
ство студентов, проживающих в общежитии, то три ра-
нее приведенных соотношения будут означать:
ХсзУ— каждый отличник обязательно проживает в
общежитии;
X=Y — в общежитии проживают все отличники и
только они;
Л Y
Рис. 1-3. Непересекающиеся
множества.
Ус=Х — все студенты, проживающие в общежитии,
являются отличниками.
Очевидно, что эти соотношения не исчерпывают всех
возможностей. На самом деле, как вытекает из преды-
дущих определений, между двумя множествами X и У
может быть одно из пяти отношений:
Х = У; ХСУ; УСХ; ХПУ=0;
X и У находятся в общем положении.
Понятие пересечения можно распространить и на
большее, чем два, число множеств. Рассмотрим систему
множеств зл ={Х1,..., Хп}. Пересечение этих множеств
записывается в виде
п
n х=пх1. = х1п АХП (1-16)
xg ал *=1
и представляет собой множество, элементы которого
принадлежат каждому из множеств системы ЗЛ.
Нетрудно видеть, что пересечение множеств обладает
коммутативным свойством
X A Y = У QX (1-17)
и ассоциативным
(ХПГ)П2 = ХП(Г nz) = xnvnz. (1-18)
Заметим также, что имеет место соотношение
ХП0 = 0, (Ы9)
16
аналогичное соотношению а*0=0 в обычной алгебре. Со-
отношение (1-19) совместно с соотношением (1-11) по-
казывает, что пустое множество играет роль нуля в ал-
гебре множеств.
г) Разность множеств
Данная операция в отличие от операций объединения
и пересечения определяется только для двух множеств.
Разностью множеств X и Y называется множество, со-
стоящее из всех тех и только тех элементов, которые
принадлежат X и не принадлежат У. Разность множеств
X и У обозначается через Х\ У. Таким образом,
Х\У={х|х€Х их£ Y}. (1-20)
Пример 1-8. Для множеств X и У примера 1-1 Х\У={1, 3, 5},
У\Х = {6, 7}. Если А’ и У— множества из примера 1-2, то Х\У—
множество отличников, не проживающих в общежитии. Для мно-
жества X и У примера 1-3 А\У — заштрихованная фигура на
рис. 1-4.
д) Универсальное множество
Как мы видели, роль нуля в алгебре множеств играет
пустое множество. Спрашивается, не существует ли мно-
жество /, которое будет играть роль единицы, т. е. удов-
летворять условию
X(V = X, (1-21)
аналогичному условию а*\=а в обычной алгебре.
Соотношение (1-21) означает, что пересечение или
«общая часть» множества / и множества X для любого
множества X совпадает с самим этим множеством. Но
это возможно лишь в том случае, если множество / со-
держит все элементы, из которых может состоять мно-
жество X, так что любое множество X полностью содер-
жится в множестве /. Множество /, удовлетворяющее
этому условию, называется полным или универсальным.
Исходя из сказанного, можно дать следующее опре-
деление универсального множества. Если в некотором
рассмотрении участвуют только подмножества некото-
рого фиксированного множества /, то это самое большое
множество / называется универсальным множеством.
Следует отметить, что в различных конкретных рас-
смотрениях роль универсального множества могут иг-
2-142
17
Рис. 15. Дополнение
множества.
рать различные множества. Так, при рассмотрении
множеств студентов в группе (отличники; студенты, полу-
чающие стипендию; студенты, проживающие в общежи-
тии, и т. п.) роль универсального множества играет мно-
жество студентов в группе.
Универсальное множество удобно изображать гра-
фически в виде множества точек прямоугольника. От-
дельные области внутри этого пря-
моугольника будут означать раз-
личные подмножества универсально-
го множества. Изображение мно-
жества в виде областей в прямо-
угольнике, представляющем универ-
сальное множество, называется
диаграммой Эйлера — Венна,
Универсальное множество обла-
дает интересным свойством, которое
не имеет аналогии в обычной алгебре, а именно, для лю-
бого множества X справедливо соотношение
X U / = /. (1-22)
Действительно, объединение X\JI представляет со-
бой множество, в которое входят как все элементы мно-
жества X, так и все элементы множества /. Но множест-
во / уже включает в себя все элементы множества X, так
что будет состоять из тех же элементов, что и /,
т. е. представляет собой само универсальное множест-
во /.
е) Дополнение множества
Множество X, определяемое из соотношения
Х = /\Х, (1-23)
называется дополнением множества X (до универсаль-
ного множества /). На диаграмме рис. 1-5 множество X
представляет собой незаштрихованную область. Фор-
мальное определение
X = {х\х I и х £ X}.
__ Пример 1-9. Если /={1, 2, 3, 4, 5, 6, 7} и Х={3, 5, 7}, то
Х={1,2, 4, 6}. _
Из (1-23) следует, что X и X не имеют общих элемен-
тов, так что
= 0. (1-24)
18
Кроме того, не имеется элементов /, которые не при-
надлежали бы ни X, ни X, так ка_к те элементы, которые
не принадлежат X, принадлежат X. Следовательно,
X(JX = I. (1-25)
Из симметрии формулы (1-25) относительно X и X
следует не только то, что X является дополнением X, но
и что_Х является дополнением X. Но дополнение X
есть X. Таким образом, _
Х-Х. (1-26)
С помощью операции дополнения можно в удобном
виде представить разность множеств
X\y=={xjxgX и х У} = {х|х g X и х £ У),
т. е.
X^Y -X А Е (1-27)
ж) Разбиение множества
Одной из наиболее часто встречающихся операций
над множествами является операция разбиения множе-
ства на систему подмножеств. Так, система курсов дан-
ного факультета является разбиением множества студен-
тов факультета; система групп данного курса является
разбиением множества студентов курса. Если N — мно-
жество натуральных чисел, а Ао и Ai— множества чет-
ных и нечетных чисел, то система {Ло, Л1} будет разбие-
нием множества N. Множество натуральных чисел
может быть разбито иначе: на множество чисел, деля-
щихся на 3 без остатка, с остатком 1 и с остатком 2. Про-
дукция предприятия разбивается на систему множеств,
состоящих из продукции первого сорта, второго сорта и
брака. Подобные примеры можно было бы продолжать
бесконечно.
Для того, чтобы дать понятию разбиения строгое оп-
ределение, рассмотрим некоторое множество М и систе-
му множеств ЭЛ = {Xi,..., Хп}. Система множеств ЭЛ на-
зывается разбиением множества М, если она удовлетво-
ряет следующим условиям:
1) любое множество X из ЭЛ является подмножест-
вом множества М:
уХ 6 3Л1ХСМ]; (1-28)
2*
19
2) любые два множества X и У из 9Л являются непе-
ресекающимися:
vx, y €шх^у->хпу= 0h (1-29)
3) объединение всех множеств, входящих в разбие-
ние, дает множество М:
Х = М. (1-
К понятию разбиения мы вернемся при рассмотре-
нии отношения эквивалентности, с которым оно очень
тесно связано.
з) Тождества алгебры множеств
С помощью операций объединения, пересечения и до-
полнения из множеств можно составлять различные ал-
гебраические выражения. Обозначим через 21 (X, У, Z)
Рис. 1-6. Геометрическая
(*Unnz=(W)U(W)-
иллюстрация тождества
некоторое алгебраическое выражение, составленное из
множеств X, У и Z. Оно само представляет собой неко-
торое множество. Пусть 23 (X, У, Z) — другое алгебраи-
ческое выражение, составленное из тех же множеств. Ес-
ли оба алгебраических выражения представляют собой
одно и то же множество, то их можно приравнять друг к
другу, получая алгебраическое тождество вида
21(Х, У, Z) = 23(Х, У, Z). (1-31)
Такие тождества бывают очень полезны при преобра-
зованиях алгебраических выражений над множествами,
и некоторые из них мы рассмотрим в настоящем разделе.
1) На рис. 1-6 приведены диаграммы Эйлера—Вен-
на для выражений (X U У) П и (X П Z) (J (У A Z). Из
20
этих диаграмм видно, что оба выражения определяют од-
но и то же множество, так что в алгебре множеств имеет
место тождество
(X и У) П 2 = (X П 2) и (У П 2), (1-32)
аналогичное дистрибутивному закону (a-{-b)c=ac+bc в
обычной алгебре.
2. В обычной алгебре мы не можем заменить в дист-
рибутивном законе действие сложения умножением,
Рис. 1-7. Геометрическая
(xnnuz=(xuz)n(ruz).
иллюстрация тождества
а действие умножения сложением, так как это приводит
к абсурдному выражению (ab)+c=(a+c) (b+с)- Ина-
че обстоит дело в алгебре множеств.
На рис. 1-7 приведены диаграммы Эйлера—Венна для
алгебраических выражений (X Q Y) (J Z и (X U 2) Q
ri(y(J2). Оба эти выражения дают одно и то же мно-
жество, так что имеет место тождество
(X П У) и 2 = (X и 2) П (У и 2). (1-33)
3. Легко убедиться, что если УСХ, то
ХПУ = У,хиГ = Х, (1-34)
Действительно, все элементы множества У являются
в то же время и элементами множества X. Значит, пере-
сечение этих множеств, т. е. общая часть множеств X и У,
совпадает с У. В объединение множеств X и У множест-
во У не внесет ни одного элемента, который уже не вхо-
дил бы в него, будучи элементом множества X. Следова-
тельно, X (J У совпадает с X.
4. Полагая в (1-34) У=Х и учитывая, что X С X, на-
ходим
ХЛХ = Х, XU Х = Х, (1-35)
21
Установление тождеств алгебры множеств с помо-
щью диаграммы Эйлера—Венна в ряде случаев оказы-
вается неудобным. Имеется более общий способ установ-
ления тождественности двух алгебраических выражений.
Пусть, как и прежде, через 21 (X, У, Z) и 23 (X, У, Z)
обозначены два алгебраических выражения, получивших-
ся путем применения операций объединения, пересечения
и дополнения к множествам X, У и Z. Для того, чтобы
доказать, что 21=23, достаточно показать, что21ѫ и что
23 С 21 . В свою очередь, чтобы показать, что 21С 23,
нужно убедиться, что из х £ 21 следует 23. Аналогич-
но, чтобы показать, что ®С21, нужно убедиться, что из
следует х € 21. Воспользуемся этим методом, чтобы
доказать еще несколько тождеств.
5. Докажем тождество
ХЦУ-ХПУ. (1-36)
Предположим, что xCXIjV, т. е. чтоЭто
значит, что х(Х и х(У, т. е. х€Х ихСУ. Следователь-
но, x€XQy. Предположим теперь, что y(zXC\Y, т; е.
у € X, и у 6 У. Это значит, что у £ X и у £ У, т. е. что
y$.X\JY. Следовательно, у €Х|ДУ.
6. Тождество
XQT-XUy (1-37)
докажем, приведя обе его части к одинаковому виду.
Выполняя операцию дополнения над обеими частями
(1-37), получим XQ y=X|jy. Левая часть этого выраже-
ния дает ХрУ. То же самое получим, преобразовывая
правую часть по правилу (1-36).
В литературе тождества (1-36) и (1-37) обычно на-
зываются тождествами де-Моргана.
1-3. УПОРЯДОЧЕНИЕ ЭЛЕМЕНТОВ И ПРЯМОЕ ПРОИЗВЕДЕНИЕ
МНОЖЕСТВ
а) Упорядоченное множество
Наряду с понятием множества как совокупности эле-
ментов важным понятием является понятие упорядочен-
ного множества или кортежа. Кортежом называется по-
следовательность элементов, т. е. совокупность элемен-
22
тов, в которой каждый элемент занимает определенное
место. Сами элементы при этом называются компонента-
ми кортежа (первая компонента, вторая компонента
и т. д.). Примеры кортежей: множество людей, стоящих
в очереди; множество слов в фразе; числа, выражаю-
щие долготу и широту точки на местности, и т. п. Во
всех этих множествах место каждого элемента является
вполне определенным и не может быть произвольно из-
менено.
В технических задачах эта определенность часто яв-
ляется просто предметом договоренности. Так, только
договоренностью можно объяснить, почему долготу ста-
вят на первое место, а широту на второе. Состояние ки-
бернетической системы часто описывают множеством па-
раметров, принимающих числовые значения. При этом
состояние системы — просто некоторое множество чисел.
Чтобы не оговаривать каждый раз, какое число что озна-
чает, устанавливают заранее, какой параметр считать
первым, какой вторым и т. д., т. е. совокупность пара-
метров представляют в виде упорядоченного множества.
Так, если обозначить через h высоту самолета, а через
v — его скорость, то кортеж х=(/г, у) будет описывать
состояние самолета.
Число элементов кортежа называется его длиной.
Для обозначения кортежа используем круглые скобки.
Так, множество
« = («1, а2, ... , ап) (1-38)
является кортежем длины п с элементами ...,ап. Кор-
тежи длины 2 называются парами или упорядоченными
парами, кортежи длины 3 — тройками, 4 — четверками
и т. д. В общем случае кортежи длины и называются
n-ками. Частным случаем кортежа является кортеж (а)
длины 1 и пустой кортеж длины,0, обозначаемый ( )
или Л. В отличие от обычного множества в кортеже
могут быть и одинаковые элементы: два одинаковых
слова в фразе, одинаковые числовые значения долготы
и широты точки на местности и т. п.
В дальнейшем будем рассматривать упорядоченные
множества, элементами которых являются вещественные
числа. Такие упорядоченные множества называют точ-
ками пространства или векторами. Так, кортеж (а\, а2)
может рассматриваться как точка на плоскости или век-
тор, проведенный из начала координат в данную точку
23
(рис. 1-8,а). Компоненты ai и а2 будут проекциями век-
тора на оси 1 и 2
Пр1 («1, а2) = af, Пр2 (аь а2) = а2.
Кортеж (щ, аг, аз) может рассматриваться как точка
в трехмерном пространстве или как трехмерный вектор,
проведенный из начала координате эту точку (рис. 1-8,6).
Проекции вектора на оси координат
Пр(-(а1( а2, a3) = aif i= 1, 2, 3,
Рис. 1-8. Проекции двух- и трехэлементного
кортежа.
Однако в данном случае можно говорить о проекции
кортежа сразу на две оси, например 1 и 2, т. е. на коорди-
натную плоскость. Нетрудно видеть, что эта проекция
представляет собой двухэлементный кортеж
Пр12(аь а2, а3) = (а1, а2).
Обобщая эти понятия, будем рассматривать упорядо-
ченное n-элементное множество вещественных чисел
(ai,..., ап) как точку в воображаемом n-мерном прост-
ранстве, называемом иногда гиперпространством, или
как n-мерный вектор. При этом компоненты п-элемент-
ного кортежа а будем рассматривать как проекции этого
кортежа на соответствующие оси
Пр^ а = i = 1, п. (1-39)
Используемая здесь и далее запись i=l,n означает
перечисление /= 1п.
Если /, — номера осей, причем 1
то проекция кортежа а на оси i, j,..., I равна:
nP(-,/..,zа = {а1’ар ••• ’ ai)‘ (1-40)
24
б) Прямое произведение множеств
Прямым произведением множеств X и У называется
множество, обозначаемое XxY и состоящее из всех тех
и только тех упорядоченных пар, первая компонента ко-
торых принадлежит множеству X, а вторая принадлежит
множеству У. Таким образом, элементами прямого про-
изведения являются двухэлементные кортежи вида (х,
у). Формальное определение
XxY — {(х, у)\х $ X, у $Y}, (1-41)
Пример 1-10. Пусть Х={1, 2}, У={1, 3, 4}. Тогда %ХУ=-
= {(1, 1), (1, 3), (1, 4), (2, 1), (2, 3), (2, 4)}. Геометрическое пред-
ставление этого множества приведено на рис. 1-9, а.
Рис. 1-9. Геометрическая иллюстрация прямо-
го произведения множеств.
Пример 1-11. Пусть X и У — отрезки вещественной оси. Пря-
мое произведение XX У изобразится заштрихованным прямоугольни-
ком, показанным на рис. 1-9,6. Из этого рисунка следует, что свой-
ства прямого произведения отличаются от свойств обычного произ-
ведения в арифметическом смысле. В частности, прямое произведе-
ние изменяется при изменении порядка сомножителей, т. е.
XXY^YXX. (1-42)
Операция прямого произведения легко распространя-
ется и на большее число множеств. Прямым произведе-
нием множеств Xi, Х2,..., Хг называется множество, обоз-
начаемое Х1ХХ2х...Лг и состоящее из всех тех и только
тех кортежей длины г, первая компонента которых при-
надлежит Xit вторая Х2 и т. д.
Частным случаем операции прямого произведения
является понятие степеней множества. Пусть М— про-
извольное множество. Назовем s-й степенью множества
25
М и обозначим через Afs прямое произведениеs одинако-
вых множеств, равных М:
Ms = МхМх...хМ. (1-43)
s раз
Это определение пригодно для s=2,3... Его можно
расширить на любое целое неотрицательное s, если спе-
циальными определениями положить
М1 = М, 7И° = {А}. (1-44)
Если R— множество вещественных чисел, то R2—
=RXR представляет собой вещественную плоскость, а
R3=RXRxR представляет собой трехмерное веществен-
ное пространство.
в) Проекция множества
Операция проектирования множества тесно связана
с операцией проектирования кортежа и может применять-
ся лишь к таким множествам, элементами которых яв-
ляются кортежи одинаковой длины.
Пусть М — множество, состоящее из кортежей дли-
ны $. Тогда проекцией множества М будем называть
множество проекций кортежей из М.
Пример 1-12. Пусть М={(1, 2, 3, 4, 5), (2, 1, 3, 5, 5), (3, 3, 3,
3, 3), (3, 2, 3, 4, 3)}. Тогда Пр2М={2, 1, 3}; Пр2.4Л1 = {(2, 4),
(1, 5), (3, 3)}.
Легко проверить, что если М=Хх Y, то
ПР17И = Х; Пр2Л1 = У, (1-45)
а если Q СХх У, то
ПР1(?СХ; Пр2(?СУ. (1-46)
1-4. СООТВЕТСТВИЯ
а) Определение соответствия
Рассмотрим два множества X и Y. Элементы этих
двух множеств могут каким-либо образом сопоставлять-
ся друг с другом, образуя пары (х, у). Если способ тако-
го сопоставления определен, т. е. для каждого элемента
х указан элемент у € У, с которым сопоставляется
элемент х, то говорят, что между множествами X и Y
установлено соответствие [8, 11]. При этом совершенно
26
необязательно, чтобы в сопоставлении участвовали все
элементы множеств X и У.
Для того чтобы задать соответствие, необходимо ука-
зать:
1) множество X, элементы которого сопоставляются
с элементами другого множества;
2) множество У, с элементами которого сопоставля-
ются элементы первого множества;
3) множество фСХхУ, определяющее закон, в соот-
ветствии с которым осуществляется соответствие, т. е.
перечисляющее все пары (х,у), участвующие в сопостав-
лении. Таким образом, соответствие, обозначаемое у,
представляет собой тройку множеств
7 = У, Q), (1-47)
в которой фСХхУ. В этом выражении первая компонен-
та X называется областью отправления соответствия,
вторая компонента У называется областью прибытия со-
ответствия, третья компонента Q называется графиком
соответствия. Термин «график» будет более подробно
разъяснен при рассмотрении частного вида соответствия,
называемого функцией.
Кроме трех рассмотренных множеств X, У и Q, с каж-
дым соответствием неразрывно связаны еще два множе-
ства: это множество FIpiQ, называемое областью опреде-
ления соответствия, в которое входят элементы множест-
ва X, участвующие в сопоставлении, и множество FIp2Q,
называемое областью значений соответствия, в которое
входят элементы множества У, участвующие в сопо-
ставлении.
Если (х, у) € Q, то говорят, что элемент у соответст-
вует элементу х. Геометрически это удобно изображать
стрелкой, направленной от х к у.
Пример 1-13. Пусть Х={1, 2}, У = {3, 5}, так что ХХ^ =
= {(1, 3), (1, 5), (2, 3), (2, 5)}. Это множество дает возможность
получить 16 различных соответствий. Приведем некоторые из них:
Qi{(l,3)}; ПР1 = {1}; Пр2 = {3};
Q2 = {(1,3), (1,5)}; ПР1С2={1}; Пр2 Q2 = {3,5} = Y.
Пример 1-14 На предприятии имеются три автомашины: две
грузовые аир, работающие в две смены, и автобус у» использу-
емый редко. Машина Р находится в ремонте. В штате имеются три
шофера a, bt с, из которых с находится в отпуске Распределение
шоферов по машинам представляет собой соответствие. Одним из
возможных соответствий будет следующее:
<7 = ({а,Ь,с}, {«,₽,?}, {(а,а), (а,у), (Ь,а)}).
27
Геометрически это соответствие изображено на рис. 1-10, а.
В нем элемент а соответствует элементам а и Ь, а элемент у соот-
ветствует элементу а. Соответствие q определено на а и Ь, но не
определено на с, следовательно, областью определения соответствия
является множество {а, Ь]. Областью значений соответствия являет-
ся множество {а, у}.
Рис. 1-10. Геометрическое
представление прямого и
обратного соответствий.
а б с
а /3
б)
б) Обратное соответствие
Для каждого соответствия <7=(Х, У, Q), QCXxF
существует обратное соответствие, которое получается,
если данное соответствие рассматривать в обратном на-
правлении, т. е. определять элементы х€Х, с которыми
сопоставляются элементы у € У. Соответствие, обратное
соответствию q, будем обозначать
д'1 = (У, X, С”1), (1-48)
где Q-’C KxX.
Пример 1-15. Обратным соответствием для примера 1-14 будет
закрепление автомашин за шоферами
{а,Ь,с}, {(а,а), (а,*), (у,а)}),
что геометрически показано на рис. 1-10,6.
Из приведенного примера видно, что геометрическое
представление обратного соответствия получается путем
изменения направления стрелок в геометрическом пред-
ставлении прямого соответствия. Отсюда следует, что
обратным соответствием обратного соответствия будет
прямое соответствие
(9_1Г‘ = 7. (1-49)
в) Композиция соответствий
Композицией соответствий называется последователь-,
ное применение двух соответствий.
28
Композиция соответствий есть операция с тремя мно-
жествами X, Y и Z, на которых определены два соответ-
ствия
q = (X, Y, Q), QQXXY-Л 50
р = (Y, Z, Р), PQYxZ,)
причем область значений первого соответствия совпадает
с областью определения второго соответствия:
Пр23 = ПР1Л (1-51)
Первое соответствие определяет для любого х€Пр1ф
некоторый, возможно и не один, элемент у € Y. Согласно
определению операции композиции соответствий теперь
нужно для найденного yQY определить z €Z, восполь-
зовавшись вторым соответствием. Таким образом, ком-
позиция соответствий сопоставляет с каждым элементом
х из области определения первого соответствия npiQ
один или несколько элементов z из области значений вто-
рого соответствия Пр2Л
Композицию соответствий q и р будем обозначать
q(p), а график композиции соответствий — через QOP.
При этом композиция соответствий (1-50) запишется
в виде
q(p) = (X, Z, Q Q Р), QoPQXxZ. (1-52)
Пример 1-16. Если q — соответствие, определяющее распределе-
ние шоферов по автомашинам, а р — соответствие, определяющее
распределение автомашин по маршрутам, то соответствие q(p) есть
соответствие, определяющее распределение шоферов по маршрутам.
Естественно, что операцию композиции можно распро-
странить и на большее, чем два, число соответствий.
1-5. ОТОБРАЖЕНИЯ И ФУНКЦИИ
а) Отображения и их свойства
Пусть X и Y — некоторые множества и ГСХхУ, при-
чем Пр1Г=Х. Тройка множеств (X, У, Г) определяет
некоторое соответствие, обладающее, однако, тем свойст-
вом, что его область определения Пр1Г совпадает с обла-
стью отправления, т. е. X, и, следовательно, это соответ-
ствие определено всюду на X. Другими словами, для
каждого х €Х существует У, так что (х, у) € Г. Такое
всюду определенное соответствие называется отображе-
нием X в У, и записывается как
Г : Х->УЖ (1-53)
29
Под словом «отображение» часто понимают однознач-
ное отображение. Однако мы не будем придерживаться
этого правила и будем считать, что каждому элементу
X отображение Г ставит в соответствие некоторое под-
множество
ГхСУ, (1-54)
называемое образом элемента х. Закон, в соответствии с
которым осуществляется соответствие, определяется
множеством Г.
Пример 1-17. Если в примере 1-14 исключить из рассмотрения
шофера с, то получим отображение Г: в котором Х={а, b} —
кое представление отоб- во.
ражения.
множество шоферов; У={а, Р, у}—множество автомашин; Г=
= {(а, а), (а, у), (&, а)} —распределение шоферов по автомашинам.
Геометрическое представление этого отображения дано на рис. 1-11.
Обратимся теперь к рассмотрению некоторых свойств
отображения. Пусть ДсХ. Для любого А образом
х будет множество ГхСУ. Совокупность всех элементов
У, являющихся образами Гх для всех х(- Д, назовем об-
разом множества А и будем обозначать ГД. Согласно
этому определению
ГД = (J Гх. (1-55)
х£А
Если А1 и Д2 — подмножества X, то
Г(Д1иА) = ГД1иГД2. (1-56)
Однако соотношение
Г(ЛХ (1-57)
справедливо только в том случае, если отображение яв-
ляется однозначным. В общем же случае
(1-58)
30
Полученные соотношения легко обобщаются и на
большее число подмножеств Ai. Так, если Д..., Ап— под-
множества X, то
(П \ п
уЛ) = уГЛг; (1-59)
(П \ п
АД к А ГД. (1-60)
Поскольку отображение является частным случаем
соответствия, для отображения имеют место введенные
при рассмотрении соответствий понятия обратного ото-
бражения и композиции отображений.
б] Отображения, заданные на одном множестве
Важным частным случаем отображения является слу-
чай, когда множества X и Y совпадают. При этом отобра-
жение Г: Х->Х будет представлять собой отображение
множества X самого в себя и будет определяться парой
(X, Г), (1-61)
где ГСХ2. Подробным изучением таких отображений
занимается теория графов, элементы которой будут рас-
смотрены в гл. 2. Коснемся здесь лишь некоторых опера-
ций над подобными отображениями.
Пусть Г и Д— отображения множества X в X, Ком-
позицией этих отображений назовем отображение ГД, ко-
торое в соответствии с правилом, приведенным в § 1-4,
определяется следующим образом:
(ГД)х= Г(Дх). (1-62)
В частном случае, если Д=Г, получаем отображения
Г2х = Г(Гх); (1-63)
Г3х = Г(Г2х) и т. д4 (1-64)
Таким образом, в общем случае для любого s^2
Гх = Г (rs-1x). (1-65)
Специальным определением введем соотношение
Г° х = х.
(1-66)
31
Это дает возможность распространить соотношение
(1-65) и на отрицательные s. Действительно, согласно
(1-65)
Г°х = Г (Г-1 х) = ГГ-1 х = х. (1-67)
Это означает, что Г-1х представляет собой обратное
отображение. Тогда
Г~2х= х) (1-68)
и т. д.
Пример 1-18. Пусть X — множество людей. Для каждого чело-
века х£Х обозначим через Гл множество его детей. Тогда Г2х—
множество внуков х; Г3х — множество правнуков х; Г~1х — множе-
ство родителей х и т. д.
Изображая людей точками и рисуя стрелки, идущие из х в Гх,
получаем родословное или генеалогическое дерево (рис. 1-12).
Пример 1-19. Рассмотрим шахматную игру. Обозначим через
х некоторое положение (расположение фигур на доске), которое
может создаваться в процессе игры, а через X множество всевоз-
можных положений. Тогда Гх для любого х£Х будет означать мно-
жество положений, которые можно получить из х, делая один ход
при соблюдении правил игры. При этом Гх=0, если х матовое или
патовое положение; Г3х — множество положений, которые можно
получить из х тремя ходами; Г"1*— множество положений, из ко-
торых данное положение может быть получено за один ход.
Для отображений, заданных на одном множестве
часто используют некоторые другие названия, которые
у нас встретятся в дальнейшем.
Так, если элементы х£Х представляют собой состоя-
ния динамической системы, то отображение Гх может
рассматриваться как множество состояний, в которые
система может перейти из данного состояния. В этом слу-
чае удобно использовать термин преобразование состоя-
ния динамической системы. Для обозначения некоторых
специальных видов отображений, заданных на одном и
том же множестве, используется также термин отно-
шение.
в) Функция
Рассмотрим некоторое отображение
(1-69)
Это отображение называется функцией, если оно яв-
ляется однозначным, т. е. если для любых пар (xi, */i) € f
и (х2, у2) € f из x2=xi следует y2=yi.
32
Из определения отображения и из приведенных ранее
примеров следует, что элементами множеств / и У могут
быть объекты любой природы. Однако в задачах кибер-
нетики большой интерес представляют отображения, ко-
торые являются однозначными и множество значений
которых представляет собой множество вещественных
чисел R. Однозначное отображение /, определяемое
(1-69), называется функцией с вещественными значения-
ями, если У QR.
Понятие функции является чрезвычайно широким, и
изучению отдельных классов функций посвящены многие
математические дисциплины (алгебра, тригонометрия и
т. п.). Мы рассмотрим только некоторые общие наиболее
фундаментальные свойства функции, не касаясь свойств
конкретных классов функций.
Пример 1*20. Из данного города в другой можно проехать по
железной дороге, автобусом или самолетом. Стоимость билета будет
соответственно 7, 9 и 12 руб. Стоимость билета в этом примере мож-
но представить как функцию от вида транспорта. Для этого рассмот-
рим множества
X = {ж. д., авт. ? сам.}; У — {7, 9, 12}.
Функция f : Х->У, получаемая из условий примера, может быть
записана в виде множества /={(ж. д., 7), (авт., 9), (сам., 12)}.
Значение у в любой из пар (х, у) называется функ-
цией от данного х, что записывается в виде y=f(x).
Такая запись позволяет вести следующее формальное
определение функции:
f = {(x, у) $XxY\y = f(x)}, (1-70)
Таким образом, символ f используется при определе-
нии функции в двух смыслах:
1) f является множеством, элементами которого явля-
ются пары (х, у), участвующие в соответствии;
2) f(x) является обозначением для У, соответст-
вующего данному х
Формальное определение функции в виде соотноше-
ния (1-70) позволяет установить способы задания функ-
ции.
I. Перечисление всех пар (х, у), составляющих мно-
жество f, как это было сделано в примере 1-20. Такой
способ задания функции применим, если X является ко-
нечным множеством. Для большей наглядности пары
(х, У) удобно располагать в виде таблицы.
3—142
33
2. Во многих случаях как X, так и У представляют
собой множества вещественных или комплексных чисел.
В таких случаях очень часто под f(x) понимается фор-
мула, т. е. выражение, содержащее перечень математи-
ческих операций (сложение, вычитание, деление, лога-
рифмирование и т. п.), которые нужно произвести над
х€ X, чтобы получить у.
Пример 1-21. Пусть и /={(х, у) £ R2\y = x2}. Тогда
f(x)=x2.
Иногда для разных подмножеств множества X функ-
ции приходится пользоваться различными формулами.
Пусть Ап — попарно непересекающиеся подмноже-
ства X. Обозначим через /ч(х), i==l, п формулу, опреде-
ляющую у при х £Ai, Тогда функция f(x) будет опреде-
ляться выражением
h (х) при х g
f(x) = . (1-71)
, fn(x) при XG Ап.
Так, функцию у= =f(x) = |x| можно задать в виде
х при х 0;
—х при х < 0.
3. Если X и У — множества вещественных чисел, то
элементы (х, у) € f можно изобразить в виде точек на
плоскости R2. Полная совокупность таких точек будет
представлять собой график функции fx.
Если в выражении (1-69) X=UxVt то приходим к
функции от двух переменных и и V, обозначаемой через
f(u, t>), где и € U и v € V. Формальное определение функ-
ции двух вещественных переменных будет следующим:
v, y)eUxVxY\y = f(u, v)}. (1-72)
Аналогично определяются функции от трех и больше-
го числа переменных.
Свяжем с функцией еще одно понятие, называемое
сужением функции. Пусть /:Х->У— произвольная функ-
ция и А — произвольное множество. Сужением функции
f на множество А называется функция /а, содержащая
все те и только те пары (х, у) € /, в которых х € А, а зна-
чит, (х, у) АхУ. Следовательно,
/Л = /П(ЛХУ). (1-73)
34
Операцию сужения функции часто используют для
табличного задания функций с бесконечной областью
определения X. В качестве множества А берут обычно
выборку равноотносящих значений х множества X. Полу-
чаемое при этом сужение fA функции f уже легко пред-
ставить в виде таблицы. По этому принципу построены
таблицы логарифмов, тригонометрических функций и не-
которые другие.
г) Обратная функция
Понятие обратной функции применимо для такого
отображения f:X-+Y, которое, во-первых, является одно-
значным, т. е. для любых (хь yi) € f и (х2, Уъ) € J из х2=
—Xi следует У2=У1, и, во-вторых, является взаимо-
однозначным, т. е. из х2#=%1 следует y2#=//i. При выпол-
нении этих условий отображение f:X-+Y является одно-
значным, т. е. определяет функцию y=f(x). Обратное
отображение f-[:Y-+X также является однозначным и
определяет функцию x=f~1(y)i называемую обратной по
отношению к функции y=f(x).
При аналитическом задании функции f принято аргу-
мент как прямой, так и обратной функции обозначать
одной и той же буквой, например х. Поэтому для нахож-
дения обратной функции следует уравнениеу=/(х) раз-
решить относительно х и поменять обозначения, заменив
х на у и у на х. При этом обратная функция запишется в
виде y=f~1(x).
д) Функция времени
В основе понятия функции времени лежит множество
Т CZR с элементами /, называемое множеством моментов
времени. Время обладает той характерной особенностью,
что имеет направление. Это означает, что если /1, /2
и /1<72, то момент /1 предшествует моменту /2. Другими
словами, Т — упорядоченное множество.
Функция времени определяет отображение f множест-
ва моментов времени Т на множество вещественных чи-
сел
(1-74)
Элементами f будут пары (/, х), обозначаемые также
через х(/), где t£T, x€R. Каждая такая пара определя-
3*
35
ет значение функции в момент t и называется событием
или мгновенным значением функции. Полная совокуп-
ность пар (Л х), т. е. значений x(t) для всех t 6 Т, и пред-
ставляет собой функцию времени. Дальнейшее уточне-
ние функции времени связано с уточнением ее области
определения, т. е. вида множества Т.
i(t-X)
Ш -Л)
ел а)
Рис. 1-13. Единичный скачок
и импульсная функция.
»[п]
-10 12 3 4 5 5
Рис. 1-14. Функция с дис-
кретным временем.
Если T=R, т. е. t может принимать любое веществен-
ное значение от —оо до +оо, то функция x(t) называ-
ется функцией с непрерывным временем. Примером мо-
жет служить синусоидальная функция времени x(t) —
—A sin (Ы + ф), описывающая напряжение в сети пере-
менного тока.
Однако нас обычно не интересуют весьма удаленные
моменты времени как в прошлом, так и в будущем.
Поэтому производят сужение x(t) на ограниченный ин-
тервал который обычно считают полузакры-
тым интервалом и обозначают (Л, 6]. Полузакрытые
интервалы времени удобны тем, что допускают последо-
вательное сочленение друг с другом. Так, если интервал
(Л, Гг] разбить моментом f на два интервала (ti, ?] и
((', М> т0 не будет сомнений, к какому интервалу
отнести f.
Сужение функции x(f), заданной на интервале
—оо</<4-оо, на интервал (Л, называется отрезком
функции x(t) и обозначается ]. Итак, по опреде-
лению
Для осуществления операции сужения часто исполь-
зуют специальную функцию времени, называемую еди-
ничной функцией или единичным скачком:
\(t — Х) = (° прИ (1-76)
U при i > Л,
36
приведенную на рис. 1-13,а. Так, напряжение, подавае-
мое на вход прибора, подключаемого к сети в момент
/=Х, будет равно:
и (/) = 1 (t — X) х (/) = 1 (t — X) A sin (со£ + ср).
Другой широко используемой функцией времени яв-
ляется импульсная функция 6(t—X), определяемая со-
отношениями:
6(;_ Х) = ( 0 при (1-77)
(оо при i = л;
f 6(Z —X)dZ = 1, 8 >0. (1-78)
Х-е
Функцию б(/—X) можно рассматривать как предель-
ный случай приведенного на рис. 1-13,6 прямоугольного
импульса шириной Д/ и высотой 1/ДХ появляющегося
в момент t=K при А/->0.
Импульсная функция позволяет выделять мгновен-
ные значения функции x(t) для фиксированных момен-
тов времени. Так, если то
/г Я,-f-е
Jx(f)6(f — k)dt = х(Х) j 8(t — K)dt=--x(k). (1-79)
/1
Если множество T представляет собой множество на-
туральных чисел
... , — 2, — 1, О, 1, 2, , п, ... ,
то говорят о функции с дискретным временем. В этом
случае элементы множества Т обозначают через п, так
что пара (п, х), обозначаемая также х[п\ или хп, опре-
деляет значение функции в момент п. На рис. 1-14 при-
веден пример функции с дискретным временем.
е) Понятие функционала
Говоря об отображении /:Х->У как о функции с ве-
щественными значениями, мы не накладывали на харак-
тер элементов множества X каких-либо особых ограни-
чений. В простейших задачах множество X, как и мно-
жество У, представляет собой множество вещественных
чисел. В этом случае каждая пара (х, ставит в со-
ответствие одному вещественному числу х другое вещест-
венное число у. Однако важным для практики является
37
случай, когда множество X представляет собой множе-
ство функций, а множество У — множество вещественных
чисел. Этот случай приводит к понятию функционала,
подробное рассмотрение которого удобно провести на
примере.
Представим себе некоторую линию y=f(x), соединя-
ющую фиксированные точки А и В, как показано на рис.
1-15, по которой скатывается свободно движущийся ша-
рик. Обозначим через t вре-
мя, которое шарик затратит
на перемещение из точки А
в точку В. Это время зави-
сит от характера линии АВ,
т. е. от вида функции f(x).
Если обозначить через F(х)
множество различных функ-
ций, изображающих линию
АВ, а через Т множество
вещественных чисел t, опре-
деляющих время движения
Рис. 1-15. Линия наискорейше-
го спуска.
шарика, то зависимость вре-
мени движения от вида функции может быть записана
как отображение
J:F(x)->T. (1-80)
Элементами множества J будут пары (f(x), t), в ко-
торых f (х) € В(х), a t € Т. В этом случае говорят, что
вещественное число t € Т представляет собой функцио-
нал J от функции f(x)€B(x), записывают это в виде
г = <7 lf(x)] (1-81)
В задачах управления функционалы используются
как критерии качества управления. Так, в рассмотренном
примере время перемещения шарика из точки А в точку В
можно трактовать как критерий «качества» выбранной
функции f(x). При этом говорят об оптимальном управ-
лении как о таком, при котором соответствующий крите-
рий качества обращается в минимум. С этой точки зре-
ния определение «оптимального» вида функции f(x) сво-
дится к выполнению условия
min J[f(x)], (1-82)
f£F
при котором время t будет минимальным. В математике
подобная линия наискорейшего спуска получила назва-
ние брахистохроны,
38
ж) Понятие оператора
Оператором L называется отображение
Л:Х->У, (1-83)
в котором множества X и Y являются множествами
функций с элементами x(t) и y(t), так что элементами
множества L будут пары (х(0> //(О)- В этом случае го-
рне. 1-16. Представление управляющей систе-
мы в виде функционала.
££££ / Ж'
ворят, что оператор L преобразует функцию x(t) в функ-
цию y(f), и пишут:
г/(0 = Мх(01. (1-84)
Примером оператора служит оператор дифференци-
рования р, ставящий в соответствие функции f(x) другую
функцию f'(x)=df(x)/dx, что может быть записано в
виде
f' (x) = plf(x)].
В задачах управления роль оператора часто выпол-
няет сама управляющая система, преобразующая по не-
которому закону L входной сигнал %(/) в выходной сиг-
нал у(0> как это показано на рис. 1-16.
1-6. ОТНОШЕНИЯ
а) Свойства отношений
Как уже указывалось, термин «отношение» использу-
ется для обозначения некоторых видов отображений, за-
данных на одном и том же множестве. В связи с исполь-
зованием этого термина удобно ввести специальную
символику.
Пусть отображение (X, Г) является отношением.
Рассмотрим элемент у €Гх. Будем говорить, что элемент
у находится в отношении Г к элементу х, й запишем это
в виде
yVx. (1-85)
Так, символ Г в примере 1-18 означает отношение «быть детьми
данного человека».
Примечание. Используя для отображения, заданного на
одном множестве, соотношение (1-61), получаем, что отношение
3$
есть пара множества (X, Г), в которой X2. Поскольку элемента-
ми множества X2 являются упорядоченные пары, то можно сказать,
что отношение есть множество упорядоченных пар. Так как каждая
пара связывает между собой только два элемента множества X2,
то такое отношение иногда называют бинарным.
Можно ввести более общее понятие отношения, называя отно-
шением пару множества (Л, Г), где Г^Хп. Элементами множества
Х,: являются упорядоченные n-ки, что позволяет назвать данное от-
ношение п-арным. В частности, множество упорядоченных троек мо-
жет быть названо тернарным отношением. В дальнейшем, не огова-
ривая этого особо, под термином «отношение» будем иметь в виду
бинарное отношение.
Отношения делятся на различные виды в зависимости
от того, обладают или не обладают они некоторыми
свойствами.
Рассмотрим шесть основных свойств отношений. При
описании этих свойств будем считать, что х, у и z — лю-
бые элементы из множества X.
Рефлексивность: хГх — истинно; антирефлексивность:
хГх — ложно; симметричность: хГу-+уГх; антисиммет-
ричность: хГу и уГх-+х=у; несимметричность; если
хГу—истинно, то уГх— ложно; транзитивность: хГу
и уГг-^хГг.
Воспользовавшись описанными свойствами, рассмот-
рим некоторые важные виды отношений.
б) Отношение эквивалентности
Некоторые элементы множества можно рассматри-
вать как эквивалентные в том случае, когда любой из
этих элементов при некотором рассмотрении может быть
заменен другим. В этом случае говорят, что данные эле-
менты находятся в отношении эквивалентности.
Примерами отношений эквивалентности являются:
отношение «быть на одном курсе» на множестве сту-
дентов факультета;
отношение «иметь одинаковый остаток при делении
на 3» на множестве натуральных чисел;
отношение параллельности на множестве прямых
плоскости;
отношение подобия на множестве треугольников и
т. п.
Для того, чтобы дать четкую формулировку отноше-
ния эквивалентности, будем считать, что термин «отно-
шение эквивалентности» применяется только в случае,
если выполняются следующие три условия:
1) каждый элемент эквивалентен самому себе;
40
2) высказывание, что два элемента являются эквива-
лентными, не требует уточнения, какой из элементов
рассматривается первым и какой вторым;
3) два элемента, эквивалентные третьему, эквива-
лентны между собой.
Примем для обозначения эквивалентности символ = .
Тогда общее определение эквивалентности получим, за-
писав три вышеприведенных условия в виде следующих
соотношений:
1) х=х (рефлексивность);
2) х=у-+у==х (симметричность);
3) х==у и y=z->.r=z (транзитивность).
Таким образом, отношение Г называется отношением
эквивалентности, если оно рефлексивно, симметрично и
транзитивно.
Отношение эквивалентности находится в тесной свя-
зи с разбиением множества, рассмотренным в § 1-2.
Пусть X — множество, на котором'определено отношение
эквивалентности. Например, X — множество студентов
курса, а отношением эквивалентности является отно-
шение «быть в одной группе». . Подмножество эле-
ментов, эквивалентных некоторому элементу х 6 X, бу-
дем называть классом эквивалентности. Так, группа, в
которой учится студент Иванов, будет классом эквива-
лентности, эквивалентным студенту Иванову.
Пусть J —- некоторое множество индексов. Обозна-
чим через М;СХ|/€/} множество классов эквивалент-
ности для множества X. Очевидно, что все элементы од-
ного класса эквивалентности эквивалентны между собой
(свойство транзитивности) и всякий элемент X может
находиться в одном и только в одном классе. Но в таком
случае X является объединением непересекающихся мно-
жеств 4^, так что полная система классов {4j;С X | / € /}
является разбиением множества X. Таким образом, каж-
дому отношению эквивалентности на множестве X соот-
ветствует некоторое разбиение множества X на клас-
сы Aj.
Отношение эквивалентности на множестве X и разби-
ение этого множества на классы называются сопряжен-
ными, если для любых х и у из X отношение х=у выполз
няется тогда и только тогда, когда х и у принадлежат к
одному и тому же классу Aj этого разбиения. Более чет-
кому уяснению связи отношения эквивалентности с раз-
41
биением множества поможет сравнение примеров данно-
го раздела с примерами из § 1-2.
В качестве общего символа отношения эквивалент-
ности используется символ s (иногда ~). Однако для
отдельных частных отношений эквивалентности исполь-
зуются другие символы: =—для обозначения равенст-
ва, ||—для обозначения параллельности, — для обо-
значения логической эквивалентности.
в) Отношение порядка
Часто приходится сталкиваться с отношениями, кото-
рые определяют некоторый порядок расположения эле-
ментов множества. Так, мы отличаем понятия «раньше»
и «позже» в случаях, когда элементами множества яв-
ляются состояния динамической системы. Мы отличаем
понятия «больше» и «меньше» и пользуемся при этом сим-
волами > или <, если элементы множества являются
числами. Мы отличаем понятия множества и подмноже-
ства, пользуясь символамцС или CZ .
Во всех этих случаях можно расположить элементы
множества X или группы элементов в некотором порядке
или, другими словами, ввести отношение порядка на
множестве X.
Различают отношение нестрогого порядка, для кото-
рого используется символ и отношение строгого по-
рядка, для которого используется символ <. Опишем
эти отношения путем перечисления свойств, которыми
они обладают.
Отношением нестрогого порядка называется отноше-
ние, обладающее следующими тремя свойствами:
х^х— истинно (рефлексивность);
х^у и у^х-+х=у (антисимметричность);
х^.у и y^2z-+x^z (транзитивность).
Отношением строгого порядка называется отношение,
обладающее следующими тремя свойствами:
х<х — ложно (антирефлексивность);
Х<У и у<х взаимоисключаются (несимметрич-
ность) ;
х<у и (транзитивность).
Множество X называется упорядоченным, если лю-
бые два элемента х и у этого множества являются срав-
нимыми, т. е.
х<.у или х—у или y<Zxt
42
г) Отношение доминирования
В тех случаях, когда X означает множество людей
или групп людей, приходится сталкиваться с отношени-
ем, которое является отношением доминирования. Мы
будем говорить, что х доминирует у, и писать х^у, если
х в чем-то превосходит у. Так, х может быть спортсменом
или командой, победившей спортсмена или команду у,
или лицом, пользующимся авторитетом у лица у, или
свойством, которое мы предпочитаем свойству у.
Мы будем говорить, что между элементами множе-
ства X имеет место отношение доминирования, если эти
элементы обладают следующими двумя свойствами:
1) никакой индивидуум не может доминировать само-
го себя, т. е. х^х — ложно (антирефлексивность);
2) в каждой паре индивидуумов в точности один ин-
дивидуум доминирует второго, т. е. х^у и у^>х — взаи-
моисключаются (несимметричность).
В отношении доминирования свойство транзитивно-
сти не имеет места. Действительно, если в соревнованиях
команда х победила команду у, а команда у победила
команду г, то отсюда еще не следует, что командах обя-
зательно победит команду z.
ЗАДАЧИ К ГЛ. 1
1-1. Что представляет собой множество У\Х из примера 1-1?
1-2. Обозначьте штриховкой множество У\А' из примера 1-3.
1-3. Пусть R— множество вещественных чисел и
Х = {хС/?|0<х< 1}, Y = {yeR\0<y<2}.
Что представляют собой множества X|J^» Xf\Y, Х\У?
1-4. Начертите фигуры, изображающие множества
A=={(x,y)£R*\x* + y*< 1}; В={(х,г/)е/??|х2+(//-!)?< 1}.
Какие фигуры изображают множества AIJB, ДПВ, 7?2\Л?
1-5. Воспользовавшись соотношением (1-34), доказать тождест-
ва хП0 = 0; XU 0 =Х; /рХ-Х; =
1-6 Изобразить на вещественной плоскости R2 — R%R множе-
ства XX У и УХХ из задачи 1-3.
1-7. Изобразить геометрически множества A\R и /?ХА где
Д = [2, 3].
1-8. Что представляет собой перечисление множества всех пря-
моугольников с множеством всех ромбов?
1-9. Для множества М={(х, y)£R2\(x—2)2+z/2=l} найти
Пр1 М и Пр2 М.
1-10. Пусть /={хь х2, х3}—универсальное множество, а Х=
= {Х1, х2}; У={х2, хз}; 2=;{хз}—его подмножества. Определить
43
перечислением следущие множества: Х\Х] Z\Z\ XX У; УХХ; XX
ХУр)УхХ; XXVU^XX.
1-11. Пусть X, У, Z — подмножества множества R2, равные
Х={(х, у) |х>0}; У={(х, у) |z/>0}; Z={(x, у) |x+z/>l}. Предста-
вить геометрически множества_Х; У; Z; XIJF; XIJF; ХрУ; XQF}
xnz;xnz;xnynz;X(WZ.
1-12. Чему равно множество ХХУ, если X и У — подмножества
R2, причем Х={(х, у)\2х + у = 1}, У={(х, у)\х—у = 0}?
1-13. В примере 1-13 выписать все 16 соответствий. Определить
для каждого из них Пр! Q и Пр2 Q.
1-14. Для функции f примера 1-21 найти обратную функцию f"1.
1-15. Пусть f и g — функции на множестве R2, равные f =
= {(х, У)\У~х2}’ §={(У, z)\z — sin у}. Найти композицию этих
функций.
ГЛАВА ВТОРАЯ
ОСНОВЫ ТЕОРИИ ГРАФОВ
2-1. ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ТЕОРИИ ГРАФОВ
а) Теоретико-множественное определение графа
Наглядное представление о графе можно получить,
если представить себе некоторое множество точек плос-
кости X, называемых вершинами, и множество направ-
ленных отрезков <7, соединяющих все или некоторые из
вершин и называемых дугами [12—14]. Математически
граф G можно определить как пару множеств X и U:
G = (X, U). (2-1)
На рис. 2-1 изображен граф, вершинами которого яв-
ляются точки а, Ь, с, d, е, g, h, а дугами — отрезки (а,а),
(с, b), (с, d), (d, с), (d, d), (с, е), (е, d), (g, 1г). Приме-
рами графов являются отношения отцовства и материн-
ства на множестве людей (см. рис. 1-12), карта дорог на
местности, схема соединений электрических приборов,
отношения превосходства одних участников турнира над
другими и т. п.
Иногда бывает удобно дать графу другое определе-
ние. Можно считать, что множество направленных дуг
О, соединяющих элементы множества X, отображает это
множество само в себя. Поэтому можно считать граф
заданным, если даны множество его вершин X и способ
отображения Г множества X в X. Таким образом, граф G
есть пара (X, Г), состоящая из множества X и отображе-
ния Г, заданного на этом множестве;
6 = (Х, Г).
(2-2) .
44
Так, для графа, изображенного на рис. 2-1, отобра-
жение Г определяется следующим образом:
Га = а\ ГЬ = 0; Гс = {6, d, е}; Гй =
= {d, с}; Ге = d;
Tg = h; rh = 0.
Нетрудно видеть, что дан-
ное определение графа полно-
стью совпадает с определением
отношения на множестве.
Иногда удобно представ-
лять графы в виде некоторых
матриц, в частности в виде
матриц смежности и инциден-
ций. Предварительно дадйм
два определения.
Две вершины х и у являют-
ся смежными, если они различны и если существует ду-
га, идущая из х в у.
Дуга и называется инцидентной вершине х, если она
заходит в эту верщину или исходит из нее.
Обозначим через хь хп вершины графа, а через
Ui,...,um — его дуги. Введем числа:
1, если имеется дуга, соединяющая вершину
ги
i с вершиной /;
О, если такой дуги нет.
Квадратная матрица /? = [rtj] порядка пУ(п называ-
ется матрицей смежности графа.
Введем далее числа
'+ U если Uj исходит из xf;
— 1, если Uj заходит в xf;
О, если Uj не инцидентна хр
Матрица S= [s<j] порядка n><jn называется матри-
цей инциденций для дуг графа.
Матрицы инциденций в описанном виде применимы
только к графам без петель. В случае наличия в графе
нетель эту матрицу следует расчленить на две полумат-
рицы: положительную и отрицательную.
Введем некоторые понятия и определения, служащие
для описания различных видов графов,
45
Подграфом GA графа G=(X, Г) называется граф, в
который входит лишь часть вершин графа G, образую-
щих множество А вместе с дугами, соединяющими эти
вершины, как, например, очерченная пунктиром область
на рис. 2-1. Математически подграф GA определяется
следующим образом:
Од = И. Гл), (2-3)
где
ЛСХ, Глх = (Гх)П А. (2-4)
Частичным графом G& по отношению к графу G =
= (X, Г) называется граф, содержащий только часть
дуг графа G, т. е. определяемый условием
Од = (X, Л), (2-5)
где
ДхСГх. (2-6)
Так, на рис. 2-1 граф, образованный жирными дуга-
ми, является частичным графом.
Пример 2-1. Пусть G=(X, Г)—карта шоссейных дорог Совет-
ского Союза. Тогда карта шоссейных дорог Тамбовской области
представляет собой подграф, а карта главных дорог Советского
Союза — частичный граф.
Другими важными понятиями являются понятия пу-
ти и контура. Ранее было дано определение дуги как на-
правленного отрезка, соединяющего две вершины. Дуга,
соединяющая вершины а и b и направленная от а к ft,
обозначается и—(а, Ь).
Путем в графе G называется такая последователь-
ность дуг р=(иь Uk), в которой конец каждой пре-
дыдущей дуги совпадает с началом последующей. Путь
р, последовательными вершинами которого являются
вершины а, Ь,..., т, обозначается через р= (а, 6,..., т).
Длиной пути р=(иь ик) называется число /(р)=£,
равное числу дуг, составляющих путь р. Путь может
быть бесконечным и конечным. В случае бесконечного
пути полагаем /(р) = оо. Путь, в котором никакая дуга
не встречается дважды, называется простым. Путь, в ко-
тором никакая вершина не встречается дважды, называ-
ется элементарным.
Контур — это конечный путь p=(xi,..., х&), у которо-
го начальная вершина Х\ совпадает с конечной х&. При
этом контур называется элементарным, если все его вер-
46
шины различны (за исключением начальной и конечной,
которые совпадают). Контур единичной длины, образо-
ванный дугой вида (а, а), называется петлей. Так, на
рис. 2-1 (е, d, с, Ь) —путь, (с, е, d, с) —контур, (d, d) —-
петля.
Иногда граф рассматривают без учета ориентации
его дуг. В этом случае его называют неориентированным
Рис. 2-2. Примеры деревьев.
графом. Для неориентированного графа понятия дуга,
путь и контур заменяются понятиями ребро, цепь, цикл.
Ребро — это отрезок, соединяющий две вершины. Граф
на рис. 2-1 имеет восемь дуг, но семь ребер. Цепью назы-
вается последовательность ребер. Циклом называется
конечная цепь, у которой начальная и конечная вершины
совпадают.
С понятием неориентированного графа связана важ-
ная характеристика, называемая связностью графа.
Говорят, что граф связен, если любые две его вершины
можно соединить цепью. Если граф G не связен, то его
можно разбить на такие подграфы Gz, что все вершины
в каждом подграфе связны, а вершины из различных
подграфов не связны. Такие подграфы Gt- называются
компонентами связности графа G.
Для того чтобы определить связность ориентиро-
ванного графа, не нужно обращать внимание на ориента-
цию дуг. Граф, изображенный на рис. 2->1, не является
связным. Однако его подграф, состоящий из вершин &,
с, d, е, является связным. Для ориентированного графа
существует понятие сильной связности. Граф сильно свя-
зен, если для любых двух вершин х и у (х=/=у) существ
вует путь, идущий из х в у.
Важным частным случаем неориентированного графа
является дерево. Деревом называется конечный связный
47
неориентированный граф, не имеющий циклов. На
рис. 2-2 приведены примеры деревьев.
Если дано множество вершин, а, 6, с ..., то дерево
можно построить следующим образом. Одну из вершин,
например а, примем за начальную и назовем ее корнем
дерева. Из этой вершины проводим ребра в близлежа-
щие вершины б, с, d,..., из них проводим ребра в сосед-
ние с ними вершины е, f, g*, h... и т. д. Таким образом,
дерево можно построить, последовательно добавляя реб-
ра в его вершинах. Это дает возможность установить
связь между числом вершин и числом ребер дерева.
Простейшее дерево состоит из двух вершин, соеди-
ненных ребром. Каждый раз, когда мы добавляем еще
одно ребро, в конце его прибавляется также и вершина.
Следовательно, дерево с п вершинами имеет п— 1 ребро.
6) Отношение порядка и отношение эквивалентности на
графе
Как мы видели, граф дает удобное геометрическое
представление отношений на множестве. Поэтому теория
графов и теория отношений на множестве взаимно до-
полняют друг друга.
Будем считать, что на графе G=(X, Г) введено от-
ношение порядка, если для любых двух вершин х и у,
удовлетворяющих условию х^у, существует путь из х
в у. В этом случае говорят, что вершина х предшествует
вершине у или что вершина у следует за вершиной х.
Покажем, что данное определение отражает на графе
все свойства отношения порядка.
Рефлексивность. Условие
х < х — истинно (2-7)
означает эквивалентность вершины самой себе, т. е. ус-
ловие х^х. Однако при желании это условие можно рас-
сматривать как наличие пути из х в х, т. е. как петлю в
вершине х (рис. 2-3, а).
Транзитивность. Условие
х<(/, (2-8)
означает, что вершины л*, у, z последовательно встреча-
ются на одном и том же пути (рис. 2-3, б).
Антисимметричность. Покажем справедливость усло-
вия
*<У, у<х-^х = у. (2-9)
48
Левая часть этого выражения говорит о том, что су-
ществует путь из х в у, а также существует путь из у в
х. Но это означает, что в графе имеется контур, на кото-
ром лежат вершины х и у (рис. 2-3, в).
Из правой части условия (2-9) вытекает, что верши-
ны, лежащие на одном и том же контуре, являются экви-
Рис. 2-3 Иллюстрация свойств отношения порядка.
валентными. Будем рассматривать этот вывод как опре-
деление эквивалентности на графе и покажем, что такое
определение удовлетворяет всем трем условиям отноше-
ния эквивалентности. Условия рефлексивности х = х и
симметрии х=у-^у==х являются очевидными и вытека-
ют из данного выше определения эквивалентности. Усло-
вие транзитивности х=у, y = z-^x=z также является
очевидным, так как говорит о том, что если в графе име-
ется контур с вершинами х и у, а также контур с верши-
нами у и z, то имеется и контур, на котором лежат вер-
шины х и Z' (рис. 2-3, в).
Таким образом, отношение порядка совместно с от-
ношением эквивалентности определяет некоторый граф.
На графе может быть также введено отношение стро-
гого порядка. В этом случае для любых двух вершин х
и у, удовлетворяющих условию х<у, существует путь,
идущий из х в у. Условие транзитивности х<у, y<z-+
~^x<Zz означает, как и в предыдущем случае, что вер-
шины х, у и z встречаются последовательно на одном и
том же пути. Условие антирефлексивности (х<х— лож-
но) говорит об отсутствии петель на графе, а условие не-
симметрии (х<у, у<х— взаимоисключаются) говорит
об отсутствии контуров.
Таким образом, отношение строгого порядка опреде-
ляет граф без контуров.
в) Характеристики графов
Решение многих технических задач методами теории
графов сводится к определению тех или иных характери-
4—142 49
стик графов. Хотя технические приложения теории гра-
фов рассматривать в настоящей книге невозможно, зна-
комство с важнейшими характеристиками графов может
оказаться полезным при изучении других дисциплин.
Цикломатическое число. Пусть О — неориентирован-
ный граф, имеющий п вершин, m ребер и г компонент
связности. Цикломатическим числом графа G называет-
ся число
v(G) = m — п + г.
Это число имеет интересный физический смысл: оно
равно наибольшему числу независимых циклов в графе.
При расчете электрических цепей цикломатическим чис-
лом можно пользоваться для определения числа незави-
симых контуров.
Хроматическое число. Пусть р— натуральное число.
Граф G называется р-хроматическим, если его вершины
можно раскрасить р различными цветами так, чтобы
никакие две смежные вершины не были раскрашены оди-
наково. Наименьшее число р, при котором граф являет-
ся р-хроматическим, называется хроматическим числом
графа и обозначается у (G).
Если y(G)=2, то граф называется бихроматическим.
Необходимым и достаточным условием того, чтобы граф
был бихроматическим, является отсутствие в нем циклов
нечетной длины. Хроматическое число играет важную
роль при решении задачи наиболее экономичного исполь-
зования ячеек памяти при программировании. Однако
его определение, за исключением случая бихроматичес-
кого графа, представляет собой довольно трудную зада-
чу, требующую зачастую применения электронных вы-
числительных машин.
Множество внутренней устойчивости. Множество
SCX графа G=(X, Г) называется внутренне устойчи-
вым, если никакие две вершины из5 не смежны, т. е. для
любого xES имеет место Гхр\S = 0.
Множество внутренней устойчивости, содержащее
наибольшее число элементов, называется наибольшим
внутренне устойчивым множеством, а число элементов
этого множества называется числом внутренней устойчи-
вости графа G. Наибольшее внутреннее устойчивое мно-
жество играет важную роль в теории связи.
Множество внешней устойчивости. Множество ТсХ
графа G=(X, Г) называется внешне устойчивым, если
50
любая вершина? не принадлежащая Т, соединена дугами
с вершинами из Т, т. е. для любого х^Т имеет место
rx(V#=0.
Множество внешней устойчивости, содержащее наи-
меньшее число элементов, называется наименьшим
внешне устойчивым множеством, а число элементов это-
го множества называется числом внешней устойчивости
графа G.
2-2. ЗАДАЧА О КРАТЧАЙШЕМ ПУТИ
а) Постановка задачи
В практических приложениях имеет большое значе-
ние задача о нахождении кратчайшего пути между
двумя вершинами связного неориентированного графа.
К такой задаче сводятся многие задачи выбора наибо-
лее экономичного (с точки зрения расстояния или време-
ни или стоимости) маршрута на имеющейся карте до-
рог, многие задачи выбора наиболее экономичного спо-
соба перевода динамической системы из одного состоя-
ния в другое й т. п. В математике разработан ряд мето-
дов для решения подобных задач. Однако весьма часто
методы, основанные на использовании графов, оказыва-
ются наименее 'уэудоемкими.
Задача о кратчайшем пути на графе в общем виде
может быть сформулирована следующим образом. Дан
неориентированный граф G=(X, U). Каждому ребру
этого графа приписано некоторое число /(н):>0, назы-
ваемое длиной ребра. В частных случаях 1(и) может
быть расстоянием между вершинами, соединяемыми реб-
ром и, временем или стоимостью проезда по этому ребру
и т. п. При этом любая цепь ц будет характеризоваться
длиной
/(|Х) = 2 /(«). (2-10)
Требуется для двух произвольных вершин а и & гра-
фа G найти путь цаь, причем такой, чтобы его полная
длина была наименьшей.
Прежде чем найти общий метод решения этой зада-
чи, рассмотрим правило для решения задачи частного
вида, когда длина каждого ребра равна единице.
4*
51
б) Нахождение кратчайшего пути в графе с ребрами
единичной длины
Иногда приходится иметь дело с графами, ребра
которых имеют одинаковую длину, принимаемую за еди-
ницу. Вершины такого графа обычно представляют со-
бой состояния некоторой системы, в которой с некоторой
точки зрения все переходы, делаемые за один шаг, экви-
валентны. Приведем пример задачи, которая сводится
к рассмотрению графа с ребрами единичной длины.
Данная задача может служить иллюстрацией способов
построения графов для различных конкретных случаев.
Пример 2-2 (задача о ханойской башне). Доска имеет три
колышка. На первый нанизаны т дисков, диаметр которых убывает
снизу вверх. Ставится задача: перекладывая диски по одному, рас-
положить их в том же порядке на третьем колышке, используя в ка-
честве промежуточного второй колышек и соблюдая условие, чтобы
ни при каком шаге больший диск не мог оказаться выше меньшего
ни на одном из колышков. В качестве добавочного условия можно
потребовать найти решение, требующее наименьшего числа шагов.
Пронумеруем диски в порядке убывания их диаметров: т, т—1,...
..., 1. Обозначим через X, Y и Z множества дисков, надетых соот-
ветственно на первый, второй и третий колышки на любом из шагов.
При этом достаточно указать только множества X и Z, так как
множество У получается как дополнение множеств X и Z до пол-
ного числа дисков. Элементом множеств X или Z может быть одна
из следующих комбинаций дисков: 0, 1, 2, 21, 3, 31, 32, 321, 4, 41,
42, 421, 43, 431, 432, 4321 ... Эти комбинации >южно изобразить
условными точками на осях X и Z, как показано на рис. 2-4, так
что любое расположение дисков будет изображаться некоторой точ-
Рис. 2-4. Графы переходов в задаче о ханойской башне.
52
кой на плоскости (X, Z). Соединяя эти точки линиями, указываю-
щими возможные на каждом шаге перемещения дисков, получаем
неориентированный граф, на котором можно найти путь, в том чис-
ле и кратчайший, для перехода из начальной то'чки графа в ко-
нечную.
Построение графа можно произвести путем перехода от т дис-
ков к т+1. При т=\ возможные состояния будут представляться
множеством {(1, 0), (0, 0), (0, 1)}, которому соответствует граф
Рис. 2-5. Переход от m-графа к (/п-Н)-графу.
на рис. 2-4, а с указанным на нем кратчайшим переходом из на-
чального состояния (1, 0) в конечное (0, 1).
Для получения общего правила предположим, что уже построен
граф для случая т дисков, который назовем m-графом. Нетрудно
убедиться, что такой граф будет иметь вид треугольника, изобра-
женного на рис. 2-5, а, хотя внутренние связи в нем нам пока не-
известны. Каков при этом будет граф для т+1 диска?
Заметим, что диск с номером т+\ может занимать на любом
из колышков только нижнее положение. При этом остальные т
дисков могут перемещаться как угодно в соответствии с т-графом
без изменения положения (т+1)-го диска. Следовательно, граф
для т + 1 диска (рис. 2-5, б) будет состоять из трех m-графов, обоз-
наченных цифрами (в кружочках) 1, 2 и 3, означающими номер ко-
лышка, на котором находится (т+1)-й диск. Остается выяснить
только переходы от одного m-графа к другому, соответствующие
перемещению (т+1)-го диска. -
Диск (т + 1)-й может быть переложен только на свободный ко-
лышек, а это возможно лишь в том случае, когда на одном из ко-
лышков расположены все т меньших дисков. В соответствии с этим
на рис. 2-5,6 показаны возможные переходы (т+1)-го диска, обоз-
наченные цифрами /, 2 и 3, означающими номер колышка, на ко-
тором находится т меньших дисков.
53
Диаграмма, показанная на рис. 2-5, б, дает общий принцип пе-
рехода от т-граф а к (ап+1)-графу. На рис. 2-4,6 и в приведены
графы переходов для двух и трех дисков.
Перейдем к задаче нахождения в графе кратчайшего
пути, соединяющего начальную вершину с конечной.
Поскольку рассмотренные графы сравнительно просты,
то кратчайший путь нетрудно найти просто путем пере-
бора возможных путей. Однако для сложных графов
должен быть найден систематический метод.
Общее правило для нахождения кратчайшего пути
в графе состоит в том, чтобы каждой вершине xi при-
писать индекс Л/, равный длине кратчайшего пути из
данной вершины в конечную. Приписывание индексов
вершинам в случае графа с ребрами единичной длины
производится в следующем порядке:
1) конечной вершине х0 приписывается индекс 0;
2) всем вершинам, из которых идет ребро в конеч-
ную вершину, приписывается индекс 1;
3) всем вершинам, еще не имеющим индексов, из
которых идет ребро в вершину с индексом Л/, приписы-
вается индекс Л14-1. Этот процесс продолжается до тех
пор, пока не будет помечена начальная вершина. По
окончании разметки индекс у начальной вершины будет
равен длине кратчайшего пути. Сам кратчайший путь
найдем, если будем двигаться из начальной вершины
в направлени убывания индексов.
Пример разметки индексов и определения кратчай-
шего пути показан на рис. 2-4, в для т = 3.
Отметим, что описанный способ определения крат-
чайшего пути является частным случаем . нахождения
оптимального решения по методу динамического про-
граммирования. Поэтому после изучения динамическо-
го программирования полезно вернуться к рассмотрен-
ному примеру.
в) Нахождение кратчайшего пути в графе с ребрами
произвольной длины
Задача приписывания вершинам графа числовых
индексов усложняется, если ребра графа имеют произ-
вольную длину. Усложнение вызвано тем, что в сложном
графе путь, проходящий через наименьшее число вер-
шин, зачастую имеет большую длину, чем некоторые
обходные пути. Так, в графе на рис. 2-6, изображающем
54
карту дорог, прямой путь из вершины, отмеченный звез-
дочкой, в конечную вершину имеет длину /=12, тогда
как обходной путь через вершину, отмеченную треуголь-
ником, имеет длину 1=10.
Процесс приписывания индексов для такого вида
графов заключается в следующем [12, 15].
Рис. 2-6. Карта дорог.
1. Каждая вершина X/ помечается индексом X/. Пер-
воначально конечной вершине Xq приписывается индекс
Хо=О. Для остальных вершин предварительно полагаем
Х/=оо (/=/=0).
2. Ищем такую дугу (хг-, х7), для которой X/— Х/>
>/(х/, X/), и заменяем индекс X/ индексом X'.=Xi+t
+/(х/, Х/)<1/. Продолжаем этот процесс замены ин-
дексов до тех пор, пока остается хотя бы одна дуга,
для которой можно уменьшить X/.
Отметим два свойства, которыми будут обладать
приписанные вершинам индексы.
1. Пусть (хЛ, xs)—произвольное ребро. Для него
обязательно выполняется условие Xs — Хй^/(х^, xs), так
55
как если бы оно не выполнялось, индекс Xs нужно было
бы уменьшить.
2. Пусть хр — произвольная вершина. При рассмот-
ренном процессе приписывания индексов индекс Хр моно-
тонно уменьшается. Пусть xq— последняя вершина,
послужившая для его уменьшения. Тогда ХР=Л7+.
+l(xq, Хр). Следовательно, для произвольной вершины
Хр с индексом найдется вершина xq, соединенная
ребром с хр, такая, что — kq=l(xq, хр).
Эти свойства позволяют сформулировать следующее
правило для нахождения кратчайшего пути.
Пусть хп = а — начальная вершина с индексом
4Ишем вершину хР1, такую, что \п — =/(хР1,хп)«
Далее ищем вершину хР2, такую, что —кР2 =1(хР2,'
хР1), и т. д. до тех пор, пока не дойдем до конечной
вершины Xpk+i=xQ=b. Путь Цо=(Хп, *Р1,..., хРр х0),
длина которого равна Кп является наименьшей.
Для доказательства рассмотрим произвольный путь
из а в Ь: ц = (хп, х ..., х^ , %о). Его длина будет /(ц).
Согласно правилу расстановки индексов будут выпол-
няться следующие неравенства:
I )»
Ч—Ч^1 (xhj> xk2)>
(2-H)
4~ 0<Z4s’41
Складывая почленно эти неравенства, находим, что
для любого пути |i имеет место
Ч-0</(н). (2-12)
Так как для пути ц0 выполняется условие %п = /(цо),
то путь цо является кратчайшим.
Метод нахождения кратчайшего пути проиллюстри-
рован на примере карты дорог, представленной в виде
графа на рис. 2-6. Цифры у ребер указывают время про-
езда по каждой из дорог. Индексы вершин дают время
проезда от данной вершины до конечной.
г) Построение графа наименьшей длины
Большое практическое значение имеет следующая
задача, которую можно сформулировать в виде задачи
о проведении дорог. Имеется несколько городов
56
a, b, с..., которые нужно соединить между собой сетью
дорог. Для каждой пары городов (%, у) известна стои-
мость /(х, у) строительства соединяющей их дороги.
Задача состоит в том, чтобы построить самую дешевую
из возможных сетей дорог. Вместо сети дорог можно
рассматривать сеть линий электропередачи, сеть нефте-
проводов и т.п. Называя в графе, изображающем сеть
дорог, величину 1(х,у) длиной ребра (х, у), приходим
к задаче о построении графа наименьшей длины. По-
этому далее вместо стоимости дорог будем рассматри-
вать длину ребер графа.
Если имеются всего три вершины a, b, с, то доста-
точно построить одну, из соединяющих цепей abc, acb,
Ъас, причем если Ьс — самое длинное ребро, то именно
его и надо исключить, построив цепь Ьас.
Граф наименьшей длины всегда является дерейом,
так как если бы он содержал цикл, можно было бы
удалить одно из ребер этого цикла и вершины все еще
остались бы соединенными. Следовательно, для соеди-
нения п вершин нужно построить п—1 ребро.
Покажем, что граф наименьшей длины можно пост-
роить, пользуясь следующим правилом [14]. Прежде
всего соединяем две вершины с наиболее коротким со-
единяющим ребром up На каждом из следующих шагов
добавляем самое короткое из ребер и/, при присоедине-
нии которого к уже имеющимся ребрам не образуется
никакого цикла. Если имеется несколько ребер одина-
ковой длины, выбираем любое из них. Каждое дерево
Q, построенное таким образом, будем называть эконо-
мическим деревом. Его длина равна сумме длин отдель-
ных ребер:
Z(Q) = Z(u1)+,..+ Z(un-i). (2-13)
Покажем, что .никакое другое дерево, соединяющее
те же вершины, не может иметь длину, меньшую дли-
ны экономического дерева Q. Пусть Р — дерево наи-
меньшей длины, соединяющее рассматриваемые верши-
ны, a Q — любое экономическое дерево. Предположим,
что ребра Ui, и2,...»ип-\ занумерованы в том порядке,
в котором они присоединялись при построении Q, т. е.
удовлетворяют условию /(ил) ^/(ил+i). Если дерево Р
не совпадает с Q, то Q имеет по меньшей мере одно
ребро, не принадлежащее Р. Пусть щ=(а, Ь) —первое
такое ребро и пусть L(a, b) —цепь графа Р, соединяю-
57
щая вершины а и Ь, как, например, на рис. 2-7. Если
ребро и, добавить к Р, то получим цикл, а так как Q не
имеет циклой, то в этот цикл должно входить по край-
ней мере одно ребро, не принадлежащее Q. Пусть это
будет Удалив его, получим дерево Р' с тем же чис-
лом вершин, что и Р, длина которого равна:
(2-14)
Рис. 2-7. К построению дерева
наименьшей" длины.
Так как граф Р имеет наименьшую длину, то
/(И;) >/(«;.). (2-15)
Но Ui было ребром наименьшей длины, при добавле-
нии которого к ребрам «ь и2> ut-\ не получается цик-
лов. Так как при добавлении к этим ребрам также не
получается никакого цикла, то
(2-16)
и, следовательно, Р' имеет, так же как и Р, наименьшую
длину. Но Р' имеет с экономическим деревом Q на одно
общее ребро больше, чем Р. Повторяя эту операцию не-
сколько раз, получим дерево наименьшей длины, совпа-
дающее с Q. Следовательно, Q — дерево наименьшей
длины.
2-3. ТРАНСПОРТНЫЕ СЕТИ
а) Основные понятия
Транспортной сетью называется конечный граф без
петель, у которого:
1) существует одна и только одна такая вершина
х0, что Г“1Хо=0 (эта вершина называется входом сети);
53
2) существует одна и только одна такая вершина z,
что tz=0 (она называется выходом сети);
3) каждой дуге графа и отнесено целое число с (и),
называемое пропускной способностью дуги и.
С понятием транспортной сети тесно связано поня-
тие потока. Пусть х — произвольная вершина. Обозна-
чим через U~ множество дуг, заходящих в х, а через
1/+ — множество дуг, выходящих из х. Потоком по
транспортной сети называется функция <р(ц), удовле-
творяющая условиям
0<<p(u)<c(u), u£U; (2-17)
2 ф(и) = 0» *¥=х0, *=#?, (2-18)
“€ut
Функцию ф(и) можно рассматривать как количест-
во вещества, протекающего (в единицу времени) по ду-
ге ц=(х, у) от х к у. Согласно условию (2-17) это ко-
личество вещества не может превышать пропускной
способности дуги с (и). Согласно условию (2-18) в каж-
дой вершине х, отличной от входа х0 и выхода z, коли-
чество притекающего вещества равно количеству выте-
кающего. Следовательно, вещество не может накапли-
ваться ни в одной вершине транспортной сети, за
исключением входа и выхода. А это означает, что по-
ток, выходящий из входной вершины хо, в точности ра-
вен потоку, входящему в выходную вершину z:
2 ф(«)= 2 = (2’19)
Величина <p(z) называется величиной потока транс-
портной сети.
На рис. 2-8 приведен пример транспортной сети.
Цифры в разрывах дуг означают пропускную способ-
ность дуги. Стрелки указывают направление потоков,
а цифры около стрелок—величину потока. К анализу
транспортных сетей сводятся многие задачи, возникаю-
щие при планировании поставок, распределении товаров
между потребителями и т. п.
Для исследования распределения потока по транс-
портной сети удобно ввести понятие разреза транспорт-
59
ной сети. Пусть ЛС1Х — некоторое множество, удовлет-
воряющее условиям
х^А, z£A. (2-20)
Через t/j и через обозначим соответственно мно-
жество дуг, заходящих в Л и выходящих из А. Полную
совокупность дуг иА = (/7
(11/л назовем разрезом А
Рис. 2-8. Распределение потоков
в транспортнрй сети.
транспортной сети. При-
мер разреза приведен на
рис. 2-8.
Поскольку каждая ча-
стица, вещества, двигаю-
щаяся от х0 к г, обяза-
тельно пройдет- по какой-
либо дуге разреза, то об-
щий поток через разрез
будет равен величине по-
тока транспортной сети;
для любого разреза А
имеет место соотношение
(2-21)
Назовем пропускной
способностью разреза А
сумму пропускных спо-
собностей дуг, заходящих
в этот разрез:
с(л)= 2
(2-22).
Поскольку для любой дуги имеет место cp(w)^c(w),
то из (2-21) и (2-22) вытекает
<рг<с(Д),
(2-23)
б) Задача о наибольшем потоке
Задача о наибольшем потоке в транспортной сети
формулируется следующим образом. При заданной
конфигурации транспортной сети и известной пропуск-
ной способности дуг найти наибольшую величину пото-
60
ка, который может пропустить транспортная сеть, а
также распределение этого потока по дугам транспорт-
ной сети.
Лемма. Если для некоторой величины потока транс-
портной сети ф2 и некоторого разреза V имеет место
фг=с(У), то поток ф2 является наибольшим, а разрез V
имеет наименьшую пропускную способность.
Доказательство. Как было показано, величина
потока ф2 для любого разреза А должна удовлетворять
соотношению (2-23). Обозначим через V разрез с мини-
мальной пропускной способностью
c(V") = min с (Л). (2-24)
А
Так как величина потока ф2 одна и та же для любо-
го разреза транспортной сети, то увеличение величины
потока ф2 возможно лишь до тех пор, пока он не достиг-
нет значения с (У). Следовательно, величина потока
фг = с(О (2-25)
и определяет наибольший поток транспортнойчсети.
Однако данная лемма не дает еще практически
пригодного способа определения наибольшего потока.
Для формулировки такого метода введем несколько
вспомогательных определений.
Дугу и назовем насыщенной, когда ф(£/)=с(^). По-
ток ф2 называется полным, если каждый путь из xq в z
содержит, по крайней мере одну насыщенную дугу.
Полный поток для данной транспортной сети не яв-
ляется строго определенной величиной и зависит от на-
правления потоков в отдельных дугах. Так, на
рис. 2-8, а и в даны два различных распределения пото-
ка по одной и той же транспортной сети. Насыщенные
дуги обозначены жирными линиями. В обоих случаях
потоки являются полными, хотя величина их различна.
Алгоритм для нахождения наибольшего потока,
предложенный Фордом и Фалкерсоном [15], состоит в
постепенном увеличении потока ф2 до тех пор, пока он
не станет наибольшим. При этом предполагается, что
пропускные способности дуг с (и) представляют собой
целые числа, так что потоки по дугам также будут вы-
ражаться целыми числами. Нахождение наибольшего
потока производится в два этапа.
1. Нахождение полного потока. Пусть ф(^)—неко-
торое распределение потока по дугам транспортной се-
61
ти. Ищем путь р, из хо в z, все дуги которого не насы-
щены, и полагаем:
(ф(м) + 1 при U£p;
Ф W = I / \ /г (2-26)
( Ф (и) при-t/£ р.
При ЭТОМ ПОТОК фг ИЗМеНИТСЯ ДО величины ф^ =фг+
+ 1>ф2. Таким путем производим постепенное увели-
чение ф2 до тех пор, пока он не станет полным.
Пример 2-3. Найдем полный поток на транспортной сети (см.
рис. 2-8, а). Последовательно рассматриваем следующие пути, отме-
чая насыщенные дуги жирными линиями:
Pj = (х0, хь х3, г), ф (Pi) = 1 —насыщается дуга (х0, xj;
|Л2 = Хо, х2, х4, х3, г), ф(ц2) = 1 — насыщаются дуги (х4, х3) и (х3, г);
P3=(xo, х2, х4, г); для насыщения этого пути можно взять ф(рз) =
= 2 — насыщается дуга (х2, х4).
Легко видеть, что больше нет путей из Хо в z, содержащих не-
насыщенные дуги. Следовательно, полный поток
Фг = Ф (Pi) + Ф (Р2) + Ф (Из) = 4.
2. Нахождение наибольшего потока. Пусть ф2 — пол-
ный поток, а ф(х, у) —поток в дуге и=(ху у), направ-
ленный от вершины х к вершине у. Процесс увеличения
ф2 состоит в разметке вершин графа индексами, указы-
вающими путь, на котором возможно увеличение пото-
ка. Предварительно все вершины графа должны быть
перенумерованы.
Помечаем х0 индексом 0. Если X/ — уже помеченная
вершина, то помечаем индексом +/ все непомеченные
вершины, в которые идут ненасыщенные дуги из х,, т. е.
вершины у, для которых
(Xi - У) € и и Ф (Xi, у) < с (хг, у), (2-27)
и индексом — i все непомеченные вершины, из которых
идут дуги в вершину х>, т. е. вершины у, для которых
(y,x^U и ф(г/, хг)>0. (2-28)
Если в результате этого процесса окажется помечен-
ной вершина z, то между вершинами хо и z найдется
цепь, все вершины которой различны и (с точностью до
знака) помечены номерами предыдущих вершин. Поток
во всех ребрах этой цепи увеличиваем на единицу в на-
правлении от хо к г, т. е. полагаем:
ф' (и) = ср (и), если и £ р;
ф' (w) — ф (и) + 1, если и £ р
62
(2-29)
и при движении от х0 к z дуга и проходится в направле-
нии ее ориентации;
ф' (и) — ф (и) — 1, если и £ р
и при движении от %о к z дуга и проходится в направ-
лении, противоположном ее ориентации.
В результате этого процесса получим новый поток
по сети Фг=фг+1, т. е. величина потока возрастает.
Далее этот процесс повторяем.
Если некоторый поток ф° невозможно увеличить
описанным методом, т. е. если окажется невозможным
пометить вершину г, то ф° является наибольшим пото-
ком сети. Действительно, пусть V — множество непоме-
ченных вершин, включающих, конечно, и вершину г.
Следовательно, V есть разрез, причем такой, который не
имеет выходящих дуг (в противном случае некоторые
вершины этого разреза были бы помечены отрицатель-
ными индексами), а все входящие дуги насыщены:
Uy= Uv-, U$= 0;
ф (и) — с (и) ДЛЯ и £ Uy.
При этом
Ф°г = 2 Ф(«)~ 2 ф(и)= 2 c(«)-0 = c(V).(2-30)
u^uv u^uv U^UV
Согласно доказанной ранее лемме ф° есть наиболь-
ший поток, а V — разрез с наименьшей пропускной спо-
собностью.
Пример 2-4. Разметка индексов вершин транспортной сети при-
ведена на рис. 2-8, а. Вершина z оказалась помеченной индек-
сом + 4. Убывающая последовательность индексов +4, —3, +2, +0
определяет цепь pt=(x0, Хг, хз, Х4, 2), поток в которой от %о кг
следует увеличить на единицу. Это приводит к распределению потока,
показанному на рис. 2-8, б. Повторяя процесс разметки индексов
на этом рисунке, находим цепь ц=(хо, Х2, Xj, Хз, Х4, г), поток в ко-
торой также должен быть увеличен на единицу. Результирующее
распределение потока показано на рис. 2-8, в. При разметке индек-
сов на этом рисунке остаются непомеченными вершины Х4 и г.
Следовательно, полученное распределение потока обеспечивает
наибольший поток ср^ в рассмотренной транспортной сети, а мно-
жество Р={Х4, г} определяет разрез с наименьшей пропускной спо-
собностью. Значение потока найдем, определив пропускную спо-
собность разреза V:
Фг = с(х2,х4)+с(хз- *4) + с(хз> г) = 34-1+2=6.
63
Увеличить наибольший поток транспортной сети можно путем
увеличения пропускной способности какой-либо из дуг, заходящих в
разрез V.
в) Транспортная задача
Наряду с задачей отыскания наибольшего потока
большое практическое значение имеет задача наиболее
экономичного распределения потока по дугам транспорт-
ной сети, получившая название транспортной задачи.
Поскольку транспортная сеть во многих случаях пред-
ставляет собой схему организации перевозок каких-ли-
бо грузов, то решение транспортной задачи позволяет
определить наиболее рациональный план перевозок, т. е.
такое распределение маршрутов, которое обеспечивает,
например, минимальную стоимость перевозок или до-
ставку грузов к потребителю в кратчайшее время. Пер-
вая задача получила название транспортной задачи по
критерию стоимости, а вторая — транспортной задачи
по критерию времени.
Для удобства дальнейшего .изложения обозначим:
ci}=c{xi, Xj) —пропускная способность дуги (xz, х7);
dl]-=d(Xii Xj) —стоимость прохождения единицы по-
тока по дуге (х/, х/).
Транспортную задачу по критерию стоимости в тер-
минах теории графов можно сформулировать следую-
щим образом.
Даны транспортная сеть с наибольшим потоком ф^
и поток который должен быть пропущен по
этой-транспортной сети. Требуется найти такое рас-
пределение потока ф2 по дугам транспортной сети, кото-
рое обеспечивает минимальную стоимость прохождения
потока. При этом для каждой дуги должно выполняться
соотношение ф(х/, x7)^cZ7, а стоимость прохождения
потока ф(х/, х/) по дуге (х/, х7) равна б//7ф(х/, х7).
Для решения этой задачи будем рассматривать ве-
личины da как длины соответствующих дуг. В этом слу-
чае стоимость прохождения потока ф по какому-либо
пути ц от х0 до z будет равна произведению длины это-
го пути на величину потока ф и задача минимизации
стоимости прохождения потока сведется к решению рас-
смотренной ранее задачи нахождения кратчайшего
пути в графе от х0 до z. В случае, если нет ограничений
64
на пропускную способность дуг, кратчайший путь явля-
ется путем, который обеспечивает минимальную стои-
мость прохождения потока.
При наличии ограничений на пропускную способ-
ность дуг задача решается в несколько этапов путем
нахождения частичных потоков на каждом этапе. Об-
щий путь решения задачи состоит в следующем.
В графе Gi=(X, Г), изображающем транспортную
сеть с длинами дуг dij=l(xi, Xj), ищется кратчайший
путь pi от хо до г. Пусть Ci — пропускная способность
пути ць По этому пути пропускается поток
ф1 = (фг, если ф2<^;
1 съ если срг >
(2-31)
Если ф2^С1, то задача решена и путь является
наиболее экономичным для потока фг.
Если ф2>с 1, то поток ф1 рассматриваем как частич-
ный и переходим к графу G2, который получается из
графа Gi путем замены пропускных способностей дуг
Cij на с'^ из соотношения
' _ Iси~~с* для w€hi;
с,'~\ dj ДЛЯ
(2-32)
При этом дуги, у которых c'tj =0, исключаются из
рассмотрения. Поток, распределение которого ищется
в графе Сг, принимаем равным
Ф* = фг — Фр
(2-33)
Теперь возникает первоначальная задача отыскания
наиболее экономичного распределения потока но
уже по отношению к графу G2. Ее решение дает путь
р.2 с пропускной способностью с2, через который пропус-
кается частичный поток
<р2 = К если (2.34)
с2, если фг > с2.
Если ф*^с2, то задача решена и наиболее экономич-
ным распределением потоков в графе Gi будет прохож-
дение потока ф1 по пути pi и потока ф2 по пути р2.
Если ф^>с2, то следует перейти к новому графу G3
и найти новый частичный поток фз. Этот процесс повто-
ряется до тех пор, пока сумма частичных потоков не до-
5-142
65
стигнет значения <pz. Эти частичные потоки, пропущен-
ные по графу Gi, и дают наиболее экономичное распре-
деление потока ф2.
Для иллюстрации описанного метода рассмотрим
наиболее часто встречающийся вариант транспортной
задачи по критерию стоимости.
Однородный груз имеется на станциях Xi, ...,хт в ко-
личествах Его требуется доставить на станции
Уъ...,уг в количествах Предполагается, что
общее количество требуемого груза равно имеющимся
запасам:
т г
2^ = 2^ <2'35)
1=1 /=1
Стоимость перевозки единицы груза со станции хг
на станцию у}- равна dij. Требуется найти наиболее эко-
номичные маршруты ^перевозки грузов. Исходные дан-
ные удобно записывать в виде табл. 2-1.
Таблица 2-1
Транспортная задача
<4 bj
bi • . • br
ai da . . • dlr
. . . . . . . . . • . .
ат dmi . . . dmr
Транспортная сеть, соответствующая этой задаче,
строится следующим образом. Вход xq соединяется с
каждой из вершин Xi дугой с пропускной способностью
с(х0, Xi)=ai. Каждая из вершин у}- соединяется с выхо-
дом z дугой с пропускной способностью
Стоимость прохождения потока по дугам (%о, *z) и
(i//, z) считается равной нулю. Наконец, каждая верши-
на Xi соединяется с каждой вершиной г/7- дугой с беско-
нечной пропускной способностью, стоимость прохожде-
66
ния единицы потока по которой равна dij. Далее к этой
транспортной сети применяется рассмотренный метод.
Пример 2-5. Найти наиболее экономичные маршруты для транс-
портной задачи, заданной в табл. 2-2. Эта таблица соответствует
показанной на рис. 2-9 схеме дорог, связывающих заводы, изготов-
ляющие строительные детали, с потребителями этих деталей (строй-
ками). Транспортная сеть, соответствующая данным табл. 2-2, при-
ведена на рис. 2-10.
Рис. 2-9. Схема дорог.
Рис. 2-10. Решение транспортной задачи по критерию стои-
мости.
Исходные данные к транспортной задаче
Таблица 2-2
ai bi
5 10 20 15
10 8 3 5 2
15 4 1 6 7
25 1 1 1 9 1 4 3
5*
67
Таблица 2-3
Распределение частичных потоков в транспортной задаче
по критерию стоимости
k Маршрут (V */) Частичный ПОТОК dii Стоимость перевозки Wk
1 (*3. //)) 5 1 5
2 (х2, У2) 10 1 10
3 Un Уд 10 2 20
4 (*з. </«) 5 3 15
5 (*з. Уз) 15 4 60
6 (*2. Уз) 5 6 30
— 1 50 - 1 140
Применяя описанный выше метод, находим частичные потоки и
маршруты, перечисленные в табл. 2-3 в порядке их получения. Со-
ответствующий этой таблице план перевозок приведен также на схе-
ме дорог.
Нетрудно видеть, что в общем случае стоимость пе-
ревозки грузов по транспортной сети рассмотренного ви-
да определяется выражением
т г
(2-36)
i=i /=1
Следовательно, разобранный метод решения транс-
портной задачи дает по существу способ нахождения
величин частичных потоков ф(хг, z/j), минимизирующих
указанную сумму. Рассмотренный способ решения не
является единственным. С подобными задачами мы
встретимся в разделе, посвященном линейному програм-
мированию, где будут приведены другие методы решения
аналогичных задач.
Решение транспортной задачи по критерию времени
разберем на примере транспортной сети, заданной
табл. 2-2,. в которой величины dtj будем теперь тракто-
вать как время, потребное на перевозку груза из пункта
л;, в пункт и обозначать далее через ttj. С подобными
задачами можно столкнуться при транспортировке ско-
ропортящихся продуктов, при доставке средств помощи
в районы стихийных бедствий, при вывозке зерна нового
урожая в заготовительные пункты и т. п. Во всех этих
задачах стоит требование доставки всех грузов в пункты
назначения за возможно более короткий промежуток
времени.
68
Рассмотрим общий путь решения этой задачи. Пред-
положим, что каким-либо методом найдено некоторое
распределение потока q?z в графе G, изображающем рас-
сматриваемую транспортную сеть. Выделим из графа G
частичный граф G', в который включим только дуги,
участвующие в передаче потока q?z. Пусть р — некоторый
путь, ведущий из х0 в г, а время прохождения пото-
ка по этому пути.. Очевидно, что время, необходимое на
перевозку всех грузов из х0 в г, будет определяться пу-
тем, имеющим наибольшую продолжительность прохож-
дения потока, так как перевозка грузов по остальным
путям закончится раньше. Следовательно, время Г, тре-
буемое на перевозку всех грузов, будет равно:
Т = шах . (2-37)
Решение транспортной задачи по критерию времени
сводится, таким образом, к тому, чтобы выделить из гра-
фа G такой частичный граф G', который был бы спосо-
бен пропустить весь поток cpz и в котором длительность
наиболее продолжительного пути была бы минимальной
по сравнению со всеми другими подобными графами.
При этом решение, найденное по описанному ранее кри-
терию стоимости, минимизирующее величину, определя-
емую выражением (2-36), может и не быть наилучшим
с точки зрения критерия времени.
Решение поставленной задачи сводится к последова-
тельному улучшению графа G' путем удаления из него
наиболее продолжительных путей и введения более ко-
ротких, но неиспользованных ранее, и соответствующего
перераспределения потока q?z.
Обратимся к рассматриваемому примеру. В качестве первого
приближения к наилучшему решению примем решение, полученное
па основе критерия стоимости. Распределение потоков для этого слу-
чая показано на рис. 2-10. Из этого рисунка видим, что время про-
хождения потока по наиболее продолжительному маршруту (%2, уз)
равно 6. Однако оказались неиспользованными менее продолжитель-
ные маршруты (%1, t/г), (хг, t/i), (Xi, уз). Поэтому возможно, что ис-
пользование какого-либо из этих маршрутов позволит исключить
маршрут (х2, уз).
Построим частичный граф 6', в который включим только дуги
графа G, имеющие и в котором распределение потока оста-
лось тем же, что и в графе G. Граф G' показан на рис. 2-11, где для
удобства вершины у$ обозначены через хт+/ = хз-н. Поток <р2 через
этот граф равен 45 ед., т. е. меньше, чем первоначальный поток
<Pz = 50 ед. Этот поток является полным, так как в графе G' все пу-
69
ти из х0 в z содержат насыщенные дуги. Однако возможно, что он
не является наибольшим.
Если наибольший поток в графе G' равен <pz, то найдется рас-
пределение этого потока, при котором наиболее продолжительный
путь будет иметь время <6 ед. Следовательно, дальнейшее ре-
шение задачи сводится к определению наибольшего потока в гра-
фе 6Л.
На рис. 2-11 произведена разметка вершин графа G' в соответ-
ствии с правилом § 2-3. Разметка вершин указывает на существова-
Рис. 2-11. Решение транспортной задачи по критерию времени.
ние пути (хо, *2, *4, Хз, *в, -г), на котором поток в направлении от
*о к z может быть увеличен на 5 ед. Этот добавочный поток пока-
зан стрелками. Как видим наибольший поток в графе G’ равен срг =
= 50 ед. и наиболее продолжительный маршрут имеет время 4 ед.
Дальнейшего уменьшения времени прохождения потока добиться
невозможно, так как к вершине г/з(*в) не идут маршруты со време-
нем, меньшим 4 ед.
Окончательное распределение частичных потоков по маршрутам,
дающее решение транспортной задачи по критерию времени, приве-
дено в табл. 2-4.
Таблица 2-4
Распределение частичных потоков в транспортной задаче
по критерию времени
Маршрут Частичный поток Время прохождения потока
(ЛГ2, у2) 10 1
(*1> </4) 10 2
(*3> </4) 5 3
(хг, уг) 5 4
<х3, Уз) 20 4
— I <рг=50 ^макс — 4
70
ГЛАВА ТРЕТЬЯ
ЭЛЕМЕНТЫ ЛИНЕЙНОЙ АЛГЕБРЫ И ВЫПУКЛЫЕ
МНОЖЕСТВА
3-1. МЕТРИЧЕСКИЕ ПРОСТРАНСТВА И РАССТОЯНИЯ
а) Понятие о расстоянии
Проведенное в гл. 1 рассмотрение множеств как со-
вокупностей некоторых объектов имеет ограниченное
применение, так как в природе все материальные объек-
ты находятся во взаимной связи и взаимодействии. По-
этому понятие множества необходимо увязать с установ-
лением тех или иных соотношений между его элемен-
тами.
Говорят, что множество имеет структуру, если между
элементами множества установлены определенные соот-
ношения или над ними определены некоторые операции.
Множество, наделенное структурой, называется про-
странством.
Изучение пространств мы начнем с простейшего вида
пространств, называемых метрическими пространства-
ми, для определения которых необходимо ввести поня-
тие расстояния между элементами множества [16, 17].
С понятием расстояния человек сталкивается повсед-
невно, связывая это понятие с пространственным разме-
щением предметов и понимая под расстоянием меру уда-
ленности предметов друг от друга. Обычно расстояние
d(M, N) между точками М и N измеряется длиной от-
резка, соединяющего эти точки (рис. 3-1). Однако такое
определение расстояния часто оказывается недостаточ-
ным. Так, даже в обиходе расстояние между двумя горо-
дами определяется не однозначно (расстояние по желез-
ной дороге, расстояние по водному пути и т. п.). В горо-
де, разделенном на кварталы, как показано на рис. 3-2,
измерять расстояние отрезком прямой, соединяющей
точки М и N, не имеет смысла, так как двигаться можно
только по улицам.
С другой стороны, слово удаленность мы часто не
связываем с пространством в обычном понимании. Так,
близость двух клеточек на шахматной доске можно оце-
нить числом ходов, которые нужно сделать, чтобы пере-
вести шахматную фигуру с одной клеточки на другую.
При этом две соседние клеточки близки для короля, но
71
далеки для коня и являются бесконечно далекими, если
из одной в другую нужно перевести слона.
В математике часто стоит задача замены одной функ-
ции z/=/(x), которая почему-либо неудобна для рас-
смотрения, другой функцией z/=g(x). Такая замена
возможна, если функция g(x) близка к функции f(x)
Рис. 3-1. Иллюстрация
аксиомы треугольника.
Рис. 3-2. Определение
расстояния в городе,
разделенном на кварта-
лы.
(рис. 3-3, а). При этом следует договориться, как пони-
мать близость друг к другу двух функций. Если близость
оценивать по максимальному отклонению значений у в
этих функциях, то в случае на рис. 3-3, б функции уже
Рис. 3-3. Различные случаи близости двух функций.
нельзя считать близкими, а если учитывать еще и харак-
тер функции, например, кроме близости значений самых
функций потребовать близости производных, то функции
не будут близкими и в случае на рис. 3-3, в. Если же за
условие близости принять ограничиваемые функциями
площади, то во всех трех случаях функции близки друг
к другу.
Из приведенных примеров видно, что должно сущест-
вовать некоторое общее определение расстояния как ме-
72
ры удаленности объектов, а следовательно, и простран-
ства, в котором эти объекты существуют, причем в раз-
личных конкретных ситуациях эти понятия могут иметь
разное содержание. Поскольку совокупности различных
объектов представляют собой множества, то понятия
пространства и расстояния должны быть связаны с по-
нятием множества.
б) Определение метрического пространства
Пусть X — произвольное множество. Понятие рассто-
яния между элементами из X получается путем обобще-
ния фундаментальных свойств, которые можно интуитив-
но ожидать от понятия расстояния и которые легко мо-
гут быть поняты из рассмотрения рис. 3-1.
Свяжем с каждой парой элементов из X некоторое
вещественное неотрицательное число d^O. Это число
•называется расстоянием или метрикой в X, если для лю-
бых х, у, z €Х оно удовлетворяет следующим трем ус-
ловиям:
1) d(x, у)=0 тогда и только тогда, когда х=у (ак-
сиома идентичности);
2) d(x, y)=d(y, х) (аксиома симметрии);
3) для любой тройки х, у, z 6 X имеет место d(x, у)
^d(x, z)4-d(z, у) (аксиома треугольника).
Метрическим пространством называется пара (X, d),
т. е. множество X с определенной на нем метрикой d.
Элементы множества X называют точками метрического
пространства (X, d).
Из данного определения следует, что множество X
только тогда превращается в метрическое пространство,
когда в него введена соответствующая метрика d(x, у),
'Если в одном и том же множестве X ввести различные
метрики, то получатся и различные пространства. Так,
пространства, изображенные на рис. 3-1 и 3-2, имеют в
качестве элементов множества точек плоскости, но обла-
дают разными метриками.
в] Примеры метрических пространств
Пусть х, у — любые элементы из множества R ве-
щественных чисел. Множество R можно превратить в
метрическое пространство, если определить расстояние
между х и у по формуле
d(x,y} = \x — y\, (3-1)
73
Именно по этой формуле находят расстояние между
точками вещественной оси, которая является простей-
шим примером метрического пространства.
Как мы видели в § 1-3, упорядоченные «-элементные
множества удобно рассматривать как точки воображае-
мого «-мерного пространства Rn. Можно расширить
представление о таком пространстве, введя понятие
расстояния между отдельными точками, т. е. рассматри-
вая это пространство как метрическое. Обозначим через
х= хп), у= (уъ...,уп) отдельные точки простран-
ства Rn. Пространство Rn можно превратить в метриче-
ское несколькими различными способами.
Наиболее часто расстояние между точками х и у оп-
ределяют по формуле
(3-2)
В случае п = 2, 3 это определение совпадает с обыч-
ным геометрическим понятием расстояния. Свойства 1,
2 и 3 для этого расстояния очевидны из рассмотрения
рис. 3-1.
Метрика dz(x, у) называется евклидовой, а прост-
ранство Rn с такой метрикой называется евклидовым и
обозначается Еп.
Для множества Rn расстояние может быть определе-
но и другими способами, например:
di(x,y) = -г/г | (3-3)
1=1
или
doo (г,у) = max (I xt — yi | хп — уп |). (3-4)
Легко видеть, что метрики с/г, dt, d^ являются част-
ными случаями метрики
{п
^~У^
Z=1
1/р
и получаются соответственно при р=2, р=1 и р = оо.
Свойства 1 и 2 для метрик (3-3) и (3-4) очевидны.
Для доказательства свойства 3 введем в рассмотрение
74
еще одну точку z= (zit zn) € Rn. Для расстояния
di(x, у) имеем:
п п
di(x,y) = ~ + zt — yt | < 2(|хг — zj + |z, —
f=l t=l
— У11) = d (x,z) + d (z, у).
Для расстояния dx(x, у) свойство 3 проверяется сле-
дующим образом. Предположим, что |xft—yk\— самая
большая из соответствующих разностей точек х и у.
Тогда
dAx,y) = \xk — yh\ = \xk — zk + zk — yk\<.
<1*й — 2ft| + |zfe — yh).
Очевидно, что
|xft — zk К max(| Xi — Zj I,..., | xn — zn |) = dx (x, z);
Izk — Ук I <max(| zt — I,,.., | zn — yn |) = dx(z, y).
Следовательно,
(x, y) < (x, z) + doo (z, y).
4. Рассмотрим множество всевозможных функций
времени, непрерывных на интервале Пусть
х(/) и y(t) — две такие функции. Расстояние между ни-
ми можно определить из соотношения
d(x,y) = max | x(t) — y (0|, (3-5)
которое, как легко проверить, удовлетворяет всем свой-
ствам метрики. Пространство с такой метрикой обозна-
чается С[а, в].
3-2. ЛИНЕЙНЫЕ ПРОСТРАНСТВА
а) Определение линейного пространства
В начале главы пространство было определено как
множество, наделенное определенной структурой. Были
рассмотрены метрические пространства, структура ко-
торых определялась тем, что каждой паре элементов
приписывалось вещественное число, удовлетворяющее
определенным свойствам и называемое метрикой. Одна-
ко введение метрики далеко не исчерпывает всех струк-
75
турных свойств различных пространств. В частности, ес-
ли множество X состоит из вещественных или комплекс-
ных чисел, то к важным структурным свойствам отно-
сится возможность получения одних элементов множест-
ва из других путем сложения этих элементов или умно-
жения элемента на скаляр. Множества, обладающие эти-
ми свойствами, относятся к классу линейных прост-
ранств. Линейные пространства должны удовлетворять
следующим условиям:
1) каждой паре элементов х, у € X однозначно опре-
делен третий элемент z € X, называемый их суммой и
обозначаемый х+z/, причем
х-\-у=у’\‘Х (коммутативность);
х+(^+у) = (*+*/)(ассоциативность);
в X существует такой элемент 0, что х+0=х для всех
х € X (существование нуля);
для каждого х € X существует такой элемент —х, что
х'+(—*)=0 (существование противоположного элемен-
та);
2) для любого числа а и любого элемента х € X оп*
ределен элемент ах € X, причем
(а + Р) х = ах + Рх;
а(х + у) = ах + ау.
Условия 1 и 2 называются условиями аддитивности
и однородности линейного пространства.
Множества, элементы которых допускают выполне-
ние операций сложения и умножения на скаляр, весьма
разнообразны. Рассмотрим несколько примеров подоб-
ных множеств.
Множество вещественных чисел R с обычным опреде-
лением операций сложения и умножения.
Множество векторов, т. е. направленных отрезков на
плоскости или в пространстве.
Множество всех функций С [а, б] , непрерывных на
заданном сегменте [я, &], если для любых х(/), y(t) €
€ С[а ,в] под ^(t)+y(t) понимать сумму значений x(t)
и //(/), взятых при одних и тех же значениях /, а под
ax(t) понимать новую функцию, получаемую из х(/)
умножением всех ее значений на а. Нулевой функцией
будет функция х(/)=0, тождественно равная нулю на
всем интервале [я, Ь].
Множество всех многочленов степени, не превышаю-
щей натурального числа п.
76
Однако в дальнейшем мы сосредоточим свое внима-
ние на линейных пространствах, элементами которых
являются упорядоченные последовательности п вещест-
венных чисел, которые мы будем в соответствии со ска-
занным в § 1-3 называть векторами.
Отметим, что под понятие вектора можно подвести и
функцию х(/), если рассматривать ее как множество
значений x(t) при различных /, а также многочлен, ко-
торый может быть задан множеством коэффициентов
при различных степенях переменной. Поэтому термин
«вектор» часто используется для обозначения элементов
произвольного линейного пространства.
б) Действия над векторами
До сих пор, говоря о множествах, мы считали, что
элементами множеств могут быть элементы любой при-
роды. В настоящей главе мы сосредоточим внимание на
множествах, элементами которых являются векторы, т. е.
упорядоченные последовательности из п чисел х(П,х^п\
которые условно могут быть записаны в виде вектора-
столбца или в виде вектора-строки:
Г*(1П
Сами числа, составляющие вектор, называются ком-
понентами вектора.
Если один из этих векторов обозначить буквой х, то
для другого будем использовать обозначение х' и назы-
вать транспонированным вектором х. Таким образом,
операция транспонирования вектора, обозначаемая да-
лее штрихом, представляет собой переход от вектора-
столбца к вектору-строке и наоборот. В настоящем раз-
деле нам придется иметь дело в основном с векторами-
столбцами. Поэтому ниже, если не оговорено противное,
мы будем считать всякий вектор вектором-столбцом и
обозначать как
х = [?°]?= (3-6)
Число п компонент вектора называется его размер-
ностью. Сами компоненты могут быть вещественными
77
или комплексными числами, однако в дальнейшем мы
ограничимся рассмотрением лишь векторов с веществен-
ными компонентами (вещественных векторов). Вектор
размерности единица представляет собой просто вещест-
венное число, т. е. скаляр.
Свойства рассматриваемых упорядоченных последо-
вательностей чисел являются обобщением свойств век-
торов, рассматриваемых в элементарной алгебре.
Два вектора х и у называются равными, если равны
их компоненты:
х = у, если х{1} = у{1\ i = 1, п< (3-7)
Суммой х+у двух векторов х и у называется вектор,
компоненты которого являются суммой компонент сла-
гаемых:
Очевидно, что
х + у = у + х; (3-9)
х + (у + z) = (х + у)+ z. (3-10)
Разность векторов х—у представляет собой вектор
z, такой, что y4-z=x.
Умножение вектора х на скаляр а дает вектор, ком-
поненты которого получаются из компонент вектора х
умножением их на а:
В дальнейшем вектор х будем называть точкой ли-
нейного пространства.
в) Линейная зависимость и независимость векторов
Пусть X — линейное пространство. Рассмотрим неко-
торое множество точек этого пространства Xi, ..., хп. Точ-
ки Xi, ..., хп называются линейно зависимыми, если су-
78
ществуют такие числа си, .... ап, не все тождественно
равные нулю, что имеет место равенство
аох1+...+ апхп = О. (3-12)
Часто бывает удобно другое определение линейной
зависимости. Векторы Х], хп являются линейно зави-
симыми, если один из них может быть представлен в ви-
де линейной комбинации остальных. Так, если ап=/=0 и
выполняется условие линейной зависимости, то, обозна-
чая а' =—a.ilan, получаем:
xn = a'ix1+...4-a^_iXn-i. (3-13)
Пример 3-1. В пространстве упорядоченных n-ок вещественных
чисел линейно независимыми являются векторы
/1(0 = 1./2 (/) = /........=
г) Линейное подпространство
Как следует из определения линейного пространства
X для любых точек Xi, х2 € X и любых чисел аир, ве-
личина axi+px2 будет также элементом линейного про-
странства X.
Рассмотрим произвольное конечное множество точек
S={xi....xm} линейного пространства X. Покажем, что
множество
- т
L(S) = ^ai*t (3-14)
при всевозможных а/ также представляет собой линей-
ное пространство, являющееся подмножеством линейно-
го пространства X и называемое линейным подпрост-
ранством.
Доказательство. 1) Покажем, что L(S) есть
подмножество X. Это следует из определения линейного
пространства. Каждое слагаемое в сумме (3-14) есть
элемент линейного пространства X. При сложении же
79
элементов линейного пространства мы опять получаем
элементы линейного пространства X.
2) Докажем, что L(S) — линейное пространство. Для
этого достаточно показать, что для любых х', х"€ L(S)
имеет место ах'+рх" € L(S).
Возьмем две произвольные совокупности чисел а' и
а" , i= 1, т. Тогда точки
t
т т
х' = хг и х° = 2а‘ Х/
1=1 1=1
принадлежат L(S). Рассмотрим точку
х = ах' + рх" — а a'i хг + р аг х; = (аа* + х
1=1 z=i z=i
xxz = j?a;xit
t=i
где а1=аа'-|-ра''. Как видим, х определяется формулой
(3-14), а значит, принадлежит L(S). Таким образом,
L(S) — линейное пространство.
Поскольку соотношение (3-14) однозначно связывает
с множеством S линейное пространство L(S), то гово-
рят, что линейное пространство L(S) определяется мно-
жеством S.
д) Размерность линейного пространства
Если элементы множества S, определяющие линейное
пространство L(S), являются линейно зависимыми, то
некоторые из этих элементов можно представить как
линейные комбинации других элементов. Удаление этих
элементов из множества S не повлияет на определение
линейного пространства L(S). Следовательно, если из
множества 3 выделить подмножество Sn = {xi, ..., хп},
элементы которого являются линейно независимыми, то
определяемое множеством Sn линейное пространство
L(Sn) совпадает с линейным пространством L(S). Поэ-
тому число линейно независимых элементов в множест-
ве 3, т. е. число п, называется размерностью линейного
пространства L(S). При этом само линейное простран-
ство L(S) называется п-мерным.
80
3-3. ЕВКЛИДОВЫ ПРОСТРАНСТВА
а) Линейное нормированное пространство
Линейное пространство получает законченное описа-
ние лишь тогда, когда свойства аддитивности и одно-
родности дополнены возможностью измерения значений
самих элементов. Так, мы не можем сравнивать векто-
ры, если заранее не договоримся, что понимать под зна-
чением (длиной) вектора. Введение в линейное прост-
ранство численных оценок величин отдельных элементов
приводит к понятию линейного нормированного прост-
ранства, называемого иногда банаховым пространством.
Линейное пространство называется нормированным
линейным пространством, если для каждого х € X су-
ществует неотрицательное число ||х[|, называемое нормой
х, которое удовлетворяет следующим условиям:
||х||:=0 тогда и только тогда, когда х=0;
11ах|| = |а| • ||х||;
Цх+у11^||х||-]-||у11 (неравенство треугольника).
Нетрудно установить, что величина ||х—у|| обладает
всеми свойствами расстояния d(x, у) в метрическом про-
странстве. Действительно, ||х—у|| = 0, если х—у=0, т. е.
если х=у. Учитывая, что у—х=—(х—у), находим:
||у — х|| = | — 11'II х — у || == || х — у ||;
IIX — у II = ||(х — Z) + (z — у)|| < IIX — Z || + IIZ — у ||.
Следовательно, нормированное линейное пространст-
во является метрическим пространством с метрикой
d(x, у) = ||х —у||. (3-15)
Все рассмотренные ранее метрические пространства,
дополненные свойствами аддитивности и однородности,
превращаются в нормированные линейные пространства.
Для этих пространств используются специальные обоз-
начения, а именно:
1) пространство или Еп с нормой
1|Х|| =
1/2
ИЛИ II X II = I X | при п = 1.
(3-16)
Это пространство называется евклидовым пространст-
вом;
6—142
81
2) пространство С\п) с нормой
II х II = 2 kJ; (3-17)
1=1
3) пространство С(п) с нормой
||х|| = max {kJ,..,, |xn|}; (3-18)
4) пространство С[а,ь] непрерывных функций, опре-
деленных на промежутке [a, Z>], с нормой
И11 = max|f(0|.
a<i<b
(3-19)
б) Скалярное произведение векторов
Как уже указывалось, линейное пространство назы-
вается евклидовым, если норма вектора х= х(п))',
определяющая его длину, находится из соотношения
(3-16). Такое определение нормы оказывается тесно свя-
занным с понятием скалярного произведения векторов.
Пусть
хх
х2
Лз.
У =
X =
У1
У2
-Уз.
— два вектора в трехмерном пространстве. Скаляр-
ным произведением этих векторов называется скалярная
величина
х' У = *i У! + х2 у2 + х3у3. (3-20)
При этом легко видеть, что корень квадратный из
скалярного произведения вектора х на самого себя дает
норму этого вектора
(х'хГМ^+^ + ^Г-М (3-21)
Таким образом, понятия нормы вектора и скалярного
произведения векторов оказываются тесно связанными
между собой. В связи с этим представляется важным
обобщить понятие скалярного произведения на произ-
вольное линейное пространство.
Определение. Пусть X— линейное пространство. Го-
ворят, что на пространстве X определено скалярное про-
изведение, если каждой паре векторов х, уеХ поставле-
82
но в соответствие действительное число х'у, обладающее
следующими свойствами:
1) х'у=у'х (коммутативность);
2) x'(y+z)=x'y+x'z (дистрибутивность);
3) Кх'у—к (х'у), X — действительное число;
4) х'х^О, причем х'х=0, только если х=0.
Линейное пространство, в котором определено скаляр-
ное произведение, называется евклидовым простран-
ством.
Приведем примеры скалярных произведений в раз-
личных линейных пространствах.
1. Если векторами являются упорядоченные последо-
вательности вещественных чисел с обычным определени-
ем операций сложения векторов и умножения вектора на
скаляр, то скалярное произведение векторов
определится формулой
п
x'y = 2*V’ (3-22)
1=1
Это позволяет дать наглядное правило вычисления
скалярного произведения
X у = Xм)
Скалярное произведение получим, перемножая соот-
ветствующие элементы строки и столбца при движении
в направлении стрелок и суммируя полученные резуль-
таты.
2. Если в качестве векторов пространства X рассмат-
ривать непрерывные функции, заданные на интервале
[а, &], то скалярное произведение таких функций опре-
деляется как
ь
(3-23)
615
83
Легко убедиться, что соотношения (3-22) и (3-23)
удовлетворяют всем свойствам скалярного произведения.
Нормой или длиной вектора х в евклидовом прост-
ранстве называется число
||х|| = |х| = (хх)1/2. (3-24)
Покажем, что такое определение удовлетворяет всем
условиям для нормы. Первые два условия вытекают из
самого определения скалярного произведения. Для до-
казательства третьего условия (неравенство треугольни-
ка) рассмотрим предварительно одно важное неравенст-
во евклидовых пространств, называемое неравенством
Коши и выражающееся соотношением
(х'у)2<(х'х)(у'у) (3-25)
ИЛИ
х'у<|х|.|у|. (3-26)
Для доказательства неравенства Коши рассмотрим
квадрат длины вектора х+Ху:
(х + Ху)' (х + Ху) = х' х + 2Х (х' у) + X2 (у' у) > О,
Обозначая
а = х' х 0; b = х' у; с = у' у 0,
запишем это соотношение в виде
а + 2ХЬ + Х2с>0.
Дополняя выражение
а + 2Xb = а (1 + 2ХЬ/а)
до полного квадрата, получаем
а (1 + ХМ?)2 + (с — b2/a) X2 > 0,
откуда следует справедливость соотношения Ь2^ас, т. е.
справедливость неравенства (3-25).
Используя в качестве скалярного произведения выра-
жения (3-22) и (3-23), приходим к следующим важным
неравенствам, являющимся частными случаями неравен-
ства Коши:
(' п \2 I п \ I п \
<3-27>
\1=1 / \/=1 / \?=1 /
(Ь \2/Ь \ ( Ь \
< IjPMdt mg2(t)dt . (3-28)
а J \а / \а /
84
Для получения неравенства треугольника рассмотрим
выражение
(х + у)' (х + у) = х' х + 2 (х' у) + у' у.
Так как в силу неравенства Коши
2(х'у)<2(х хПу'у)'“,
ТО
(х + уУ (х + у) < х х + 2 (х'х)1/2 (у у)1/2 +
+ УУ=[(ххУ'Ч(У у)1''2]2
ИЛИ
Iх + УI < I *1 + | У |.
(3-29)
в) Угол между векторами. Ортогональные векторы
Неравенство Коши имеет простую геометрическую
интерпретацию для двумерного пространства. Пусть х=
= (*1, х2) и у =(//h у2) —два вектора на плоскости. Вы-
берем систему координат так, чтобы ось абсцисс совпа-
дала с направлением вектора х, так что %i = |x|, х2=0
(рис. 3-4). Обозначим через а угол между векторами х,
у. При этом
х'у = *1*/1 + *2*/2 = I *I-| УI cos а. (3-30)
Так как cos а^1, то отсюда очевидно неравенство
Коши.
При | х| = 1 данное соотношение определяет величину
| у | cos а, являющуюся проекцией вектора у на направле-
ние вектора х.
Поскольку неравенство Коши доказано для произ-
вольного ^-мерного евклидова пространства, то можно
считать, что в любом евклидовом пространстве справед-
ливо соотношение (3-30), так что угол между векторами
х и у определяется выражением
a=arccos ——— , (3-31)
и при |х|=1 скалярное произведение х'у определяет
проекцию вектора у на направление вектора х.
Векторы х и у называются ортогональными, если
угол между ними равен л/2, т. е. если
х'у = 0. (3-32)
85
Поскольку соотношением (3-23) понятие скалярного
произведения распространено на непрерывные функции,
то можно говорить и об ортогональных функциях. Функ-
ции f(t) и g(t) называются ортогональными, если для
них выполняется соотношение
ь
= 0,
(3-33)
Рис. 3-4. К определению
скалярного произведе-
ния.
3-4. МАТРИЦЫ И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ
а) Понятие матрицы
Матрицей А размером mXn или просто (гиХп)-мат-
рицей называется таблица, содержащая m строк и п
столбцов, элементами которой являются вещественные
или комплексные числа, и имеющая вид:
Ган...а1п "I
А = .... I = [ац].
"&mn J
Если m—n, то матрица называется квадратной.
При т—1 матрица превращается в вектор-строку
а при п=1 матрица превращается в вектор-столбец
~<h '
л
u.um J
которые, таким образом, являются частными случаями
матриц.
Две матрицы A=[atJ] и В= равны друг другу
(А —В) в том и только в том случае, если они имеют
один и тот же размер и ац — Ьц для всех i,
86
С матрицами можно производить операции, которые
вытекают из правил линейных преобразований.
б) Линейное преобразование
Преобразованием линейного n-мерного пространства
X называется оператор А, отображающий это простран-
ство в m-мерное линейное пространство У:
A-.X-+Y, (3-34)
Таким образом, преобразование А ставит в соответст-
вие каждому вектору х пространства X вектор
у = Ах (3-35)
пространства У. В частном случае может быть Y=X.
При этом преобразование А ставит в соответствие каж-
дому вектору х в пространстве X вектор Ах того же са-
мого пространства.
Преобразование А называется линейным, если выпол-
няются условия
А (хх + х2) = Ахг + Ах2, А (Хх) = X Ах. (3-36)
Условия (3-36) будут выполняться, если между ком-
понентами xW и yw векторов х и у имеется линейная за-
висимость вида
y(i) = 1' = ^'т' (3-37)
/=1
где ait — произвольные числа. Совокупность чисел
i=l,m, /=1,л образует матрицу
au...«in
= к-Д
(3-38)
которая называется матрицей линейного преобразования.
Из (3-37) следует, что линейное преобразование полно-
стью определяется его матрицей А.
Сравнивая (3-37) с (3-22), видим, что уй> представля-
ет собой скалярное произведение i-й строки матрицы А
и вектора столбца х:
(ап,,.„
i =\,т.
(3-39)
87
При этом полную совокупность соотношений (3-39)
можно записать в виде одного векторного матричного
соотношения у = Ах, на основании которого определяют
правило умножения матрицы На вектор и которое в раз-
вернутой форме имеет вид:
ние матрицы А на вектор-столбец х возможно только в
том случае, когда число столбцов матрицы А равно чис-
лу элементов в векторе-столбце х и определяет вектор-
столбец у, Лй элемент которого равен скалярному про-
изведению f-й строки матрицы А на вектор-столбец х.
Среди линейных преобразований на линейном про-
странстве X особую роль играют два преобразования:
нулевое преобразование, ставящее в соответствие
каждому вектору х нулевой вектор О:
Ох = о; (.3-41)
единичное преобразование, ставящее в соответствие
каждому вектору х тот же самый вектор:
1х = х, (3-42)
в) Операции над матрицами
Умножение матрицы на число. Пусть А — матрица
линейного преобразования Ах и а — число. Рассмотрим
линейное преобразование, которое каждому вектору х
ставит в соответствие вектор аАх. Если линейное преоб-
разование Ах описывается матрицей A=[axj], то линей-
ное преобразование а (Ах)' будет описываться матрицей
аА = [aat (3-43)
Таким образом при умножении матрицы А на число
а все ее элементы умножаются на это число.
Сумма матриц. Пусть у=Ах и v==Bx — два линей-
ных преобразования с матрицами A=[aXJ] и В=[&г;]
размера туп. Рассмотрим новое линейное преобразо-
88
вание, ставящее в соответствие каждому вектору х € X
вектор y4-v € У:
у 4- v = Ах + Вх = (А 4- В) х. (3-44)
Преобразование (А-(-В)х называется суммой линей-
ных преобразований Ах и Вх'. Для нахождения матрицы
А+В этого преобразования представим его в виде со-
отношения (3-37):
п п п
УЦ)+у<1) = 2а^х</) +5м(/) = +
i=l /=1 ;=1
i = 1, т
или
А 4- В = [а,;] 4* 4- (3-45)
При сложении двух матриц одинакового размера по-
лучается новая матрица того же размера, элементы ко-
торой равны сумме элементов складываемых матриц.
Из этого определения следует, что
А 4- В = В 4- А. (3-46)
Произведение матриц. Пусть X, Y и Z-линейные про-
странства размерности т, г, п и пусть у=Вх и z = Ay—
линейные преобразования, отображающие пространство
X в пространство У и пространство У в пространство Z,
где В = [дй;] и A=[a,ft]—матрицы размером ту^г и гХ
Х« соответственно. Произведением преобразований Ау
и Вх называется новое линейное преобразование Cz,
состоящее в последовательном выполнении сначала пре-
образования у=Вх, а затем преобразования z=Ay.
Другими словами, для любого х € X имеем:
z = Сх = А(Вх) = АВх. (3-47)
Матрица С = АВ размером тХ« называется произ-
ведением матриц А и В.
Для нахождения правила умножения матриц пред-
ставим (3-47) в ином виде. Линейные преобразования
у = Вх и z=Ay могут быть записаны в виде соотноше-
ния (3-37).как
т ____
= 2X*''* .*=Г7;
/=1
89
„(i) _ V n i — T~n
г = ?, а'^У ,l~ l’ п‘
/г=1
Подставляя во второе соотношение значение из
первого соотношения, получаем:
k=i /=1
С другой стороны, преобразование z = Cx можно за-
писать в виде
= ^cljXin (3-49)
/=1
где через обозначены элементы матрицы С. Сравни-
вая (3-48) и (3-49), находим правило получения элемен-
тов матрицы С = АВ:
г ____
Сц = 2 at.kbki, i = iTn, j = I, m, (3-50)
*=i
Согласно (3-50) элемент c/j матрицы С представляет
собой скалярное произведение i-й строки матрицы А на
/-й столбец матрицы В, так что произведение матриц АВ
Отметим, что для возможности выполнения операции
умножения матрицы должны быть согласованы между со-
бой в том отношении, что число столбцов матрицы А
должно быть равно числу строк матрицы В. Из сущест-
вования произведения АВ вовсе не следует существова-
ние произведения ВА. Более того, если даже ВА сущест-
вует, то в общем случае
АВ =/= ВА. (3-52)
Равенство в этом соотношении может иметь место
только для квадратных матриц. При этом две квадрат-
90
ные матрицы называются коммутирующими, если АВ =
= ВА.
Для произведения матриц остаются в силе следую-
щие алгебраические законы:
(А + В)С = АС + ВС; (3-53)
С (А + В) = СА + СВ; (3-54)
(АВ)С = А(ВС). (3-55)
г) Транспонированная матрица
Пусть A=[a,j] — матрица размером т\п. Матрица
А'=[а,у] размером пут, строки которой являются
столбцами матрицы А, а столбцы — строками матрицы
А, называется транспонированной к матрице А. Элемен-
ты аг{. матрицы А' определяются по элементам аг; мат-
рицы А из соотношения
оу = оц, (3-56)
Легко убедиться, что для транспонированных матриц
справедливы соотношения
(А + В)' = А' + В'; (3-57)
(АВ)' = В' А'. (3-58)
Понятие транспонированной матрицы приводит к од-
ному важному соотношению теории матриц. Пусть
А — квадратная матрица размером пХ«> с помощью кото-
рой в л-мерном линейном пространстве задано линейное
преобразование у=Ах. Рассмотрим в этом же прост-
ранстве вектор z, который с помощью матрицы А' может
быть преобразован в вектор v=A'z. Найдем скалярные
произведения
y'z = (Ах)' z и х' v = х' A' z,
которые легко приводятся к виду
(Ах)' г ;
;=1 1=1
х' A' z — ^х(/) ^?аог(|>.
/=1 1=1
Как видим,
(Ах)' z = х' A' z. (3-59)
91
Другими словами, когда речь идет о скалярном про-
изведении, то преобразование вектора х матрицей А эк-
вивалентно преобразованию вектора z матрицей А'.
3-5. КВАДРАТНЫЕ МАТРИЦЫ
а) Особенности квадратных матриц. Нулевая
и единичная матрицы
До сих пор мы рассматривали линейные преобразова-
ния, отображающие линейное пространство X в некото-
рое другое линейное пространство У и описываемые пря-
моугольными матрицами. Теперь выясним некоторые до-
бавочные свойства линейных преобразований, опреде-
ленных на одном и том же пространстве X, т. е. преобра-
зующих X в X. Такие преобразования описываются квад-
ратными матрицами, которые имеют чрезвычайно важ-
ное значение для многих технических приложений.
Изучение прямоугольных матриц наталкивается на
определенные трудности, связанные с тем, что две такие
матрицы одного и того же размера нельзя перемножать.
Более того, при умножении матрицы размера тХг на
матрицу размера гХ« получается матрица, размер кото-
рой mXn отличается от размера каждой из перемножен-
ных матриц.
Эти трудности отсутствуют при рассмотрении квад-
ратных матриц. Матрицы А и В одного размера т мож-
но перемножать в любом порядке, получая произведе-
ния АВ или ВА, которые хотя в общем случае и не рав-
ны друг другу, но имеют тот же размер т, что и
перемноженные.матрицы.
Можно умножить квадратную матрицу саму на себя,
получая АА=А2. Можно продолжить этот процесс и оп-
ределить Ап для целых положительных п. Полагая В =
=АП, можно определить В^'^А и определить, таким
образом, Аг для любого положительного рационального
показателя г. Если не требовать равенства АВ = ВА, то
над квадратными матрицами можно производить дейст-
вия, аналогичные действиям над скалярами. Например,
(А + В)2 = А2 + (АВ + ВА) + В2;
(А + В) (А — В) = А2 — В2 + (ВА — АВ).
Особую роль среди квадратных матриц играют нуле-
вая и единичная матрицы, соответствующие нулевому
92
(3-41) и единичному (3-42) преобразованиям линейного
пространства X.
Нулевой матрицей О размера m называется квадрат-
ная матрица, все элементы которой равны нулю.
Единичной матрицей I размера m называется квад-
ратная матрица, у которой элементы главной диагонали
равны единице, а остальные элементы равны нулю.
Нулевая и единичная матрицы обладают следующи-
ми свойствами:
А + О = А; (3-60)
ОА = АО = О; (3-61)
IA = AI = А. (3-62)
Для квадратных матриц справедливы многие выраже-
ния, встречающиеся в обычной алгебре. Например,
(I + А)" = I +пА+ п(п~^ А2 + ... + Ап.
Иногда приходится иметь дело с неалгебраическими
функциями от А. Так, в теории дифференциальных урав-
нений важную роль играет матричная экспонента etk ,
определяемая рядом
е*А = 1 +/А + — А2 + ...
2!
б) Определитель квадратной матрицы
Определителем квадратной матрицы A=[aZJ] назы-
вается определитель, составленный из элементов а1} этой
матрицы и обозначаемый det А.
Определитель det А обладает следующими свойства-
ми:
1) при умножении на л любого столбца матрицы А
определитель det А умножается на Z;
2) перемена местами двух соседних столбцов меняет
знак det А на противоположный;
3) если любые два столбца матрицы А равны между
собой, то det А = 0;
4) добавление к любому столбцу матрицы А любого
другого столбца, умноженного на произвольный скаляр-
ный множитель, оставляет det А неизменным;
5) если столбцы матрицы А линейно зависимы, то
det А = 0.
93
Свойства 1—4 являются обычными свойствами лю-
бых определителей. Поэтому остановимся на доказатель-
стве только свойства 5.
Представим матрицу А в виде вектора А=(А1, ...
..., Ат), где через A’=(ai,J; ..., j=l> т обозначены
столбцы матрицы А. При этом определитель det А может
быть представлен в виде
detA = D(Al, ... , Am).
Если столбцы А^‘ матрицы А линейно зависимы, то
можно найти такие числа aj, /=1, т, не все из которых
равны нулю, что
2ayAz = 0. (3-63)
/
Пусть аА=0=О. Разрешая (3-63) относительно Ай и
обозначая р; = —aj/a*, получаем:
АЛ = 2р7А'.
i-tk
Определитель det А теперь может быть представлен в
виде
detA = D(... Xk ... ) = £>(... S И/А' •••) ==
\ i+k
i+k
Определители, стоящие под знаком суммы, содержат
на месте столбца Aft столбцы А\ /=1, tn, j^k. Это зна-
чит, что каждый из них содержит по два одинаковых
столбца и в соответствии со свойством 3 равен нулю. Та-
ким образом, det А=0, если столбцы матрицы А линей-
но зависимы.
в) Обратная матрица и решение систем линейных
уравнений
Пусть у=Ах— линейное преобразование с квадрат-
ной матрицей A=[a,j], отображающее произвольный
вектор х пространства X в вектор у того же пространст-
ва. Обратным преобразованием называется преобразова-
ние х=А~’у, отображающее вектор у в первоначальный
вектор х. Матрица А-1 этого преобразования называется
обратной по отношению к матрице А.
94
Обратную матрицу удобно трактовать в терминах
решения систем линейных уравнений. Пусть дана систе-
ма п линейных уравнений с п неизвестными хи ..., хп
2 ач xi = У» 1 = С3’64)
/=1
матричная запись которой имеет вид:
Ах = у, (3-65)
По определению обратной матрицы решение этой
системы уравнений в векторно-матричной форме запи-
шется в виде
х = А"1 у. (3-66)
Для нахождения элементов обратной матрицы А-1 за-
пишем решение системы уравнений (3-64) в явном виде.
Это решение может быть найдено по формулам Краме-
ра [18] и записано как
п
(3-67)
/=1
где A = detA— определитель матрицы A; A/j — алгебра-
ическое дополнение элемента ац в определителе А. Та-
ким образом, элементами матрицы А-1 являются вели-
чины
Система уравнений (3-65) называется определенной
и имеет единственное решение, если detAy=0. Матрица
А, для которой выполнено это условие, называется не-
вырожденной. Только в том случае, когда матрица А не-
вырожденная, для нее существует обратная матрица.
Для вычисления матрицы А-1 удобно ввести следую-
щие обозначения. Обозначим через A,j алгебраическое
дополнение элемента в определителе матрицы А, а
через [Afj] матрицу с элементами Ajj. Как и раньше,
«штрихом» обозначим операцию транспонирования
матрицы. Тогда
A-^-1-tA^. (3-68)
det А
Заметим, что соотношение (3-66) можно было бы по-
лучить из (3-65) чисто формальным путем, умножая обе
части выражения (3-66) на матрицу А-1-.
А-1 Ах = А-1 у. (3-69)
95
Сравнивая (3-69) с (3-66), получаем соотношение,
связывающее прямую и обратную матрицы:
А"1 А = I. (3-70)
Обратная матрица произведения вычисляется по
правилу
(АВ)"1 = В"1 А~1. (3-71)
Чтобы доказать это, умножим В^А-1 на АВ:
В-1 А'1 АВ = В-1 (А-1 А) В = I.
Таким образом, В-'А-1 является обратной матрицей
к матрице АВ.
С обратной матрицей тесно связано понятие ранга
матрицы. Ранг определяется с помощью миноров матри-
цы, причем-минором порядка р произвольной матрицы А
размера т\п называется определитель произвольной
рХр подматрицы А.
Рангом матрицы называется максимальный порядок
отличных от нуля миноров этой матрицы. Если г — ранг
прямоугольной матрицы А размера т^п, то
^min(m, п).
Квадратная матрица размера п%п является невы-
рожденной только тогда, когда ее ранг равен ее разме-
ру, и, следовательно, только в этом случае она имеет
обратную матрицу.
г) Инвариантное подпространство. Собственные векторы
и собственные значения матриц
Пусть X—n-мерное линейное пространство и у=
= Ах —линейное преобразование на пространстве X,
Пусть XiCX является некоторым подпространством X,
обладающим, однако, тем свойством, что если х € Xi, то
и у = Ах€Хь Подпространство Хь обладающее подоб-
ным свойством, называется инвариантным относительно
линейного преобразования у = Ах.
Особенный интерес представляют собой одномерные
инвариантные пространства, представляющие собой
прямые в пространстве X, проходящие через начало ко-
ординат.
Если х — произвольная точка пространства Хна—
вещественная переменная, меняющаяся от —оо до +°°,
то ах будет представлять собой одномерное подпростран-
96
ство X, проходящее через х (при а = 1) и через начало
координат (при а=0), как показано на рис. 3-5 для
п=2. Такое одномерное подпространство будем обозна-
чать /?ь
- Предположим, что среди бесконечного множества
одномерных пространств /?1 найдутся такие, которые
будут инвариантны относительно пре-
образования у = Ах, т. е. для любого
x€/?i имеет место у = Ах€ /?г. Обозна-
чим через к отношение у к х, которое
при этом будет просто вещественным
числом, т. е. можем записать у = Хх.
Рис. 3-5. Одномерное инвариантное простран-
ство.
Таким образом, если /?1 — инвариантное подпространст-
во, то для x^i имеет место равенство
Ах = Хх. (3-72)
Вектор х=£0, удовлетворяющий соотношениям
(3-72), называется собственным вектором матрицы А, а
число к— собственным значением (характеристическим
числом) матрицы А.
Для определения характеристических чисел матрицы
перепишем соотношение (3-72) в ином виде, введя тож-
дественное преобразование х=1х. При этом получаем:
(А — ZI) х = 0. (3-73)
Соотношение (3-73) представляет собой систему ли-
нейных однородных уравнений, которая может быть за-
писана в явном виде как
(ап — л)хх + а12х2 + ... а1пхп = 0;
fl2i Xi+ (а22 — х2 + ... + а.2п хп = 0; (3-74)
ап1 *1+ ап2 х2 + ... + (апп —X) хп = 0,.
Допустим, мы задались численным значениям к и нас
интересует вопрос, имеет ли система (3-74) нетривиаль-
ное (отличное от нуля) решение, т. е. существуют ли та-
кие отличные от нуля значения ла,..., хп, которые оора-
щают уравнения (3-74) в тождества.
Рассмотрим вначале случай двух переменных, для
7-142 97
которого система (3-74) запишется в виде
(^ц А) 4“ ^12 %2 = 0» |
#21 ^14" (#22 А) %2 = 0 •)
(3-75)
Полагая, хь х2=#0, из первого уравнения находим:
Яц л
х2 =------11----
в12
*1-
Тогда второе уравнение дает:
а21-(а22-Х)2и^А
С12
х± = 0.
При Xi=#0 это выражение имеет смысл, только если
(#11 A)(CZ22 А) #12 #21 —
#Ц X 6Zj2
#21 #22 А
= 0,
т. е. если det (А—XI) =0. Это условие является необхо-
димым и достаточным условиеАм того, чтобы система
(3-75) имела решение. Если это условие выполнено, то
уравнения (3-75) дают возможность определить лишь
отношение переменных
Xj _ ^12 ____ #22 А
Х2 аП А #21
т. е. сами переменные определяются лишь с точностью до
постоянного множителя.
Аналогично обстоит дело и в общем случае системы
(3-73). Эта система имеет нетривиальное решение только
в том случае, если выполняется условие
det (А — AI) = О, (3-76)
При этом сами переменные, т. е. вектор х, определя-
ются с точностью до постоянного множителя.
Соотношение (3-76) называется характеристическим
уравнением матрицы А и представляет собой алгебраиче-
ское уравнение /г-й степени относительно А. Действи-
тельно, раскрывая определитель и группируя члены с
одинаковыми степенями А, левую часть уравнения (3-76)
можно представить в виде многочлена по степеням А:
det (А — Al) = q (А) = qQ + qx А + + qn № 4
Легко заметить, что здесь ^0=det A, qn=(— 1)п.
Таким образом, для нахождения собственных значений
98
матрицы А получаем уравнение n-й степени относитель-*
но X:
% + Qi + ••• + Яп == 0- (3-77)
Это уравнение имеет п корней, среди которых могут
быть и одинаковые, являющиеся собственными значения-
ми матрицы А. Конечно, не все собственные значения
обязательно будут действительными, но так как А — дей-
ствительная матрица, то комплексные корни будут встре-
чаться сопряженными парами.
Возьмем любое собственное значение X/ и подставим
его в исходную систему уравнений (3-73). Получим урав-
нение
(A —Xfl)x = 0,
которое имеет нетривиальное решение, так как det (А—
—ХД)=О. Это решение дает вектор х*, определяемый с
точностью до скалярного множителя. Этот вектор и на-
зывается собственным вектором матрицы А.
Так как X/ может быть комплексным числом, то х*
может содержать комплексные компоненты. Однако по-
скольку комплексные корни встречаются сопряженными
парами, то комплексные собственные векторы также бу-
дут встречаться сопряженными парами.
Согласно (3-72) собственные векторы х‘ и соответ-
ствующие им собственные значения Хг- связаны соотно-
шениями
Ахг* = Xz хг, i = 1Г7г, (3-78)
которые могут быть записаны в более компактной форме
как
AV = VA, (3-79)
где V — квадратная матрица, составленная из собствен-
ных векторов матрицы А; Л — диагональная матрица, у
которой по главной диагонали расположены числа X/, а
все остальные элементы равны нулю:
V = (х1,
(3-80)
ГХ1 0
О Х2
О”
о
|_о о •••kJ
(3-81)
7*
99
д) Диагонализация матриц
Вид квадратной матрицы А линейного преобразова-
ния у=Ах может быть изменен без изменения характе-
ристического уравнения этой матрицы путем использова-
ния преобразования подобия.
Пусть А — квадратная матрица, а С — произвольная
невырожденная квадратная матрица. Преобразованием
подобия называется преобразование
В = С-1 АС. (3-82)
Получаемая в результате преобразования подобия
матрица В удовлетворяет тому же характеристическому
уравнению, что и матрица А, а значит, имеет и те же
самые собственные значения. Действительно, легко ви-
деть, что
С-1 (А — XI) С = С-1 АС — ХС-1 IC =
= С-1 АС — ХС-1 CI = В — XI.
Учитывая легко доказываемое свойство определите-
лей матриц det AB=det A det В, получаем:
det (В — XI) = det [С-1 (А — XI) с] «
= det С-1 det (А —XI) det С.
Так как матрица С невырожденная, то из det (В—
—XI) =0 следует, что del (А—XI) =0.
Преобразование подобия позволяет приводить некото-
рые виды квадратных матриц к диагональной форме,
являющейся наиболее удобным видом матрицы. Возмож-
ность диагонализации квадратной матрицы базируется
на следующей теореме о линейной независимости собст-
венных векторов матрицы.
Теорема 3-1. Если собственные значения матрицы А
размером п занумерованы так, что первые k из них Xi,...
..., Ха различны, то соответствующие собственные векторы
х1, ..., xh линейно независимы.
Доказательство. Теорема доказывается по ин-
дукции. Для k=l утверждение очевидно. Предположим,
что утверждение справедливо для k—1 векторов, т. е.
что собственные векторы х1,..., xft_1 линейно независимы-
Докажем, что оно справедливо и для всех k векторов.
100
Предположим противное, т. е. предположим, что век-
торы х1, xft линейно зависимы, так что имеет место
х1 + а2 х2 + х* = О,
причем не все а/ равны нулю. Будем считать,, что ai=#0.
Проведем над этим выражением линейное преобразова-
ние, определяемое матрицей А. Получим
A (cti х + «2 х + х ) = О
или
х* + а2 Х2 х2 + ... + ah Kk xk = 0.
Умножая предыдущее соотношение на Kk и вычитая из
данного, получаем:
«1 (^i — Ч) х1 + а2 'Л — Ч) х2 + ...
• •• +а£--1 (4-1 Х'1~1 0*
Так как собственные значения Xi,..., различны, то
имеет место равенство ai=a2=...=afe-i=0, что проти-
воречит предположению о линейной независимости век-
торов х1,..., х^-1.
Из доказанной теоремы следует, что если все собст-
венные значения матрицы А различны, то все п ее собст-
венных векторов будут линейно независимыми. В этом
случае матрица допускает приведение к диагональной
форме.
Рассмотрим матрицу V, определяемую (3-80), столб-
цы которой являются собственными значениями матрицы
А и которая связана с матрицей А соотношением (3-79).
Если все собственные значения матрицы А различны, то
ее собственные векторы линейно независимы. Из свойст-
ва 5 определителей матриц (см. § 3-5, п.«б») следует, что
в этом случае матрица V невырожденная и существует
обратная матрица V-1. Умножая обе части (3-79) на V-1.
получаем:
V-1 AV = V-1 VA
или
V’-1 AV = Л. (3-83)
Как видим, диагонализирующей матрицей является
матрица V, составленная из собственных векторов мат-
рицы А,
101
3-6. СИММЕТРИЧЕСКИЕ МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ
а) Собственные векторы и собственные значения
вещественных симметрических матриц
Вещественная квадратная матрица А назвается сим-
метрической, если ее элементы удовлетворяют соотноше-
нию aij=a~i для всех i, /. Это означает, что симметриче-
ская матрица не меняется при транспонировании, так
что AZ=A.
Симметрические матрицы обладают двумя особыми
свойствами, которые играют важную роль во многих
технических приложениях.
1) собственные значения вещественной симметриче-
ской матрицы вещественны;
2) собственные векторы, соответствующие различным
собственным значениям вещественной симметрической
матрицы, ортогональны.
Справедливость этих свойств проверим для матрицы
размера 2X2. Собственные значения этой матрицы най-
дутся из уравнения
det (А — XI) =
«и — X
«12
«12
#22
ИЛИ
Z 2 — (#ц + Я22) + «11 «22-«12 = 0.
Отсюда
^1,2 ~ "у «п + «22 i "j/~(«п a2i}2 4 (#и а22 .
Поскольку величина
(#и + а22) — 4 (ап а-22 — «12) = (#п — #22)2 + 4а?2
неотрицательная, то Xi и Х2 являются всегда веществен-
ными числами.
Обозначим:
— собственные векторы матрицы А, соответствующие
собственным значениям Xi и Х2, которые будем считать
различными. Как мы видели ранее, компоненты векторов
удовлетворяют соотношениям:
102
^1 ^22 ,
x\ all — a12
2
^1 n12 fl?22 ^2
X2 ttll ^2 a12
Из этих соотношений можно составить следующее
отношение:
*i xi __ а22 — Zj
х\ Х22 а11 — ^2
ИЛИ
Найдем скалярное произведение собственных векто-
ров (х1)^2:
rl ^2 а11 + а22 ~ (^1 + ^2)
й22
Но А.14-Х2=аи+а22, так что (х‘)/х2 = 0, т. е. векторы
х1 и х2 ортогональны.
Доказанные свойства вещественной симметрической
матрицы легко обобщаются на случай матрицы А любого
порядка. Из этих свойств следует, что если в веществен-
ной симметрической матрице А то
(х‘Ух' = 0, (3-84)
т. е. собственные векторы хг’ и ортогональны.
Принимая во внимание, что собственные векторы оп-
ределены с точностью до постоянного множителя, этот
постоянный множитель для любого собственного вектора
х* можно выбрать так, чтобы
(х‘У х' = 1, i = Т7Л. (3-85)
Собственные векторы, удовлетворяющие этому усло-
вию, называются нормированными.
б) Диагонализация симметрических матриц
Рассмотрим вектор V, столбцы которого представля-
ют собой собственные векторы симметрической матрицы
103
А. Матрица V', получающаяся путем транспонирования
матрицы V, представляет собой матрицу, строками кото-
рой будут собственные векторы матрицы А.
Элемент (/, j} матрицы VZV будет равен скалярному
произведению i-й строки матрицы Vz на j-й столбец мат-
рицы V, т. е. величине (x‘)zx< Принимая во внимание
соотношения (3-84) и (3-85), видим, что VZV=I, так что
V' - V-1. (3-86)
Следовательно, диагонализация симметрической мат-
рицы А производится согласно соотношению
V' AV = А. (3-87)
Этот вывод опять-таки справедлив лишь для случая,
когда все собственные значения матрицы А различны.
в) Квадратичные формы
Пусть х=(х(1>,..., х(п)) —вектор в «-мерном линейном
пространстве с вещественными компонентами. Выраже-
ние вида
Q(x) = 22^?‘)x(/) (3-88)
I i
называется квадратичной формой. В этом выражении без
ограничения общности можем считать Если это
не так, то, производя преобразование
atjx x -f- Uji x x — щи ajt)x x =*
= у xW xU) + T + ав)х</> x<°’
можно привести квадратичную форму к виду, когда это
условие выполняется. Поэтому числа aij можно рассмат-
ривать как элементы квадратной матрицы А, которая
является вещественной и симметрической.
Квадратическую форму удобно записывать в вектор-
но-матричных обозначениях. Для этого перепишем выра-
жение (3-88) в виде
q (х)=2х<0 2аих</)=*(1) г<1) = х <3‘89)
i i i
где величины
z(t) = aijxU) > i = 1, n
i
104
являются компонентами вектора z, связанного с векто-
ром х линейным преобразованием:
z = Ах. (3-90)
Таким образом, квадратичная форма Q(x) может
быть записана в виде
Q(x) = x'Ax. (3-91)
Квадратичную форму Q(x) и матрицу А называют
положительно определенными, если выполняется условие
Q(x)>0. При выполнении условия Q(x)<0 говорят об
отрицательно определенной квадратичной формеQ(x) и
матрице А. Для нахождения условий положительной
(отрицательной) определенности матрицы А введем в
рассмотрение линейное преобразование x=Vy, где V —
невырожденная матрица. Тогда
Q (х) = х'Ах = у'V'AVy = Q (у),
причем матрицей квадратичной формы Q(y) является
V'AV. Возьмем в качестве V диагонализирующую матри-
цу. Тогда VZAV=A, так что
Q(x) = Q(y) = y'Ay = 2^lz/(1)]2. (3-92)
i
Как видим, необходимым и достаточным условием по-
ложительной (отрицательной) определенности матрицы
А является положительность (отрицательность) всех ее
собственных значений X,.
г) Использование квадратичных форм при отыскании
экстремумов функций многих переменных
Применение квадратичных форм проиллюстрируем на
примере задачи отыскания экстремумов функций, имею-
щей важное значение при решении многих технических
вопросов.
Пусть и=(«!..... ип)—многомерная переменная и
f (u) =j(«!,..., ип) — функция от и, определенная в обла-
сти ai^Ui^bi, i=l,п и допускающая разложение в схо-
дящийся ряд Тейлора в каждой точке с=(сь....сп) внут-
ри этой области. Это разложение имеет вид:
/ (и) = /(с) +ул + IV У/Щ л,, + ....
det 2 det дс}
i i I
(3-93)
105
где
Ды; = ы;- — сг,
df
дс[
i = 1, П\
i = 1, п;
' -- у J - X , '*'•
dctdcj dutdiij и~=с.
Как известно, экстремумы подобных функций могут
достигаться внутри области определения только в ста-
ционарных точках, т. е. в точках, в которых производные
d]/dui, i=l,n обращаются в нуль. Пусть и=с — стацио-
нарная точка. Тогда df/dCt—O, i=l,n и разложение функ-
ции f(u) в ряд Тейлора в окрестности точки и=с прини-
мает вид:
Ии)=/(с) + 4-УУ-^— Дм{Д«у + ... (3-94)
2 dCidCj
i /
Введем обозначения:
= Au? = и, — (3-95)
Тогда ряд (3-94) запишется в виде
f(u) = /(c) + Q(x) + .,., (3-97)
где
Q(X) = 22^x^ (3-98)
i i
представляет собой квадратичную форму х'Ах с вещест-
венной симметрической матрицей А. ____
Учитывая,что при u=cXj=0,1 = 1, и, из (3-97) видим,
что в стационарной точке и=с имеет место относитель-
ный минимум, если Q(x)>0, и относительный максимум,
если Q(x)<0, т. е. —Q(x)>0. В случае, если Q(x)
вблизи стационарной точки может принимать как поло-
жительные, так и отрицательные значения, имеет место
стационарная точка более сложного характера, требую-
щая дальнейшего специального исследования.
Таким образом, мы видим, что выяснение характера
стационарной точки функции многих переменных требует
выяснения того, является ли положительно (отрицатель-
но) определенной матрица А квадратичной формы Q(x).
106
3-7. ВЫПУКЛЫЕ МНОЖЕСТВА
а) Понятие гиперсферы
В многомерном пространстве Rn можно рассматри-
вать геометрические образы, аналогичные геометриче-
ским фигурам и телам в двух- и трехмерном простран-
стве. Важнейшими из них являются гиперсфера, гипер-
плоскость и прямая.
Гиперсферой называется замкнутая поверхность, все
точки которой удалены на одинаковое расстояние г от не-
которой фиксированной точки а, т. е. удовлетворяют
уравнению
d(x, а) = г. (3-99)
Множество точек, удовлетворяющих условию d(x,
а)<г и являющихся внутренними точками гиперсферы,
называется открытым шаром. Множество точек, удовлет-
воряющих условию d(x, а)^г, называется замкнутым
шаром.
Пример 3-2. В пространстве R2 уравнение гиперсферы можно
записать в виде d2(x, a)=r2. Если расстояние определять по форму-
ле (3-2), то гиперсфера превращается в окружность: (х(1)—а<1))2 +
+ (Х(2)_а(2))2 = г2>
6) Ограниченные и конечные множества
Множество X называется ограниченным, если ограни-
чено расстояние между любыми двумя точками этого
множества, т. е. если существует такое число М, что для
любых xi, х2 € X имеет место d(xi, х2)
Можно показать, что необходимым и достаточным
условием ограниченности множества X является нахож-
дение его в некоторой гиперсфере, т. е. существование
точки а и числа г, таких, что для всякого х€Х имеет
место d(x, а)^г.
Множество X называется конечным, если оно содер-
жит конечное число точек. Конечное множество всегда
ограничено.
в) Открытые и замкнутые множества
Разделение множеств на открытые и замкнутые тесно
связано с понятием окрестности точки множества. Ок-
рестностью точки х в пространстве Rn называется от-
крытый шар радиуса 8 с центром в х. Окрестность точки
обозначается Ое(х).
107
Точка х называется внутренней точкой множества X,
если существует окрестность Ое(х), все точки которой
принадлежат X,
Точка х называется граничной точкой множества X,
если любая ее окрестность 08 (х) содержит как точки,
принадлежащие X, так и точки, не принадлежащие X.
Множество всех граничных точек образует границу мно-
жества X.
Множество X называется открытым множеством, если
все его точки внутренние. Множество X называется замк-
нутым множеством, если наряду с внутренними оно со-
держит и все свои граничные точки.
Для пояснения введенных понятий рас-
смотрим в двумерном пространстве (и, v)
множество X, заданное неравенством
и2 + и2- < •
Это множество представляет собой
круг радиуса г с центром в начале коор-
динат, как показано на рис 3-6.
Для любой точки х=(и, v) этого мно-
жества можно записать либо
Рис. 3-6. Внутренняя
(/) и граничная (2)
то 1ки множества. либо
u2 + v2<r2, (1)
и2 4- и2 = г2. (2)
В первом случае можно найти такую окрестность Ое (х) точки
х=(н, v), что неравенство будет выполняться для любой точки этой
окрестности. Тогда х — внутренняя точка множества.
Если же точка x=(w, v) удовлетворяет равенству (2), то в лю-
бой окрестности Ое (х) существуют такие точки xi = («i, сч) и х2 =
= («2, иг), что «1+^1 <г2, а и 2 +f2>^ т. е. точки, как принад-
лежащие X, так и не принадлежащие X. В этом случае х—гранич-
ная точка. Само уравнение (2) определяет границу исходного мно-
жества.
Поскольку исходное множество X задано с помощью нестрогого
неравенства то граница является частью множества X. Следо-
вательно, множество X замкнуто. Если для задания множества X
использовать строгое неравенство «2 + а2<г2, то граница уже не
будет принадлежать X. В этом случае получаем открытое множество.
г) Гиперплоскости и полупространства
Гиперплоскостями в линейном пространстве Rn раз-
мерности п называются линейные подпространства раз-
мерности n—1. Так, в трехмерном пространстве 7?3 ги-
108
перплоскостями являются плоскости, а в двумерном
пространстве R2 — прямые.
Уравнение гиперплоскости L(S) можно получить, за-
давая в линейном пространстве Rn множество S, содер-
жащее п—1 линейно независимых точек xi,...,xn-i. В со-
ответствии с (3-14) любая точка гиперплоскости
х= (х(1), .... х(л))' €£(S)
запишется в виде
п—1
х=У«уХу (3-100)
/=1
или в координатной форме
п—1 ___
« = (3-101)
/=i
Уравнение (3-100) неудобно для описания гиперпло-
скости, так как в него входят произвольно выбранные
точки Xi,Xn-ь С другой стороны, можно показать, что
эти точки определяют вектор р= (р\, ...,рп), такой, что
уравнение
п
2м°=° с3-102)
1=1
представляет собой уравнение L(S). Подставляя коор-
динаты из (3-101) в (3-102), получаем:
п л—1 л—1 л
2 pi 2а/ = 2 ai 2 р‘ = °*
1=1 /=1 /=1 1=1
Поскольку aj могут принимать любые вещественные
значения, то равенство нулю будет иметь место только,
если
л ____
/ = 1. П. (3-ЮЗ)
1=1
Система однородных уравнений (3-103) позволяет
с точностью до постоянного множителя определить ком-
поненты вектора р, что и подтверждает справедливость
(3-102) в качестве уравнения гиперплоскости.
Левая часть уравнения (3-102) представляет собой
скалярное произведение векторов р и х в линейном про-
109
странстве Rn, Поэтому уравнение гиперплоскости L(S)
обычно записывают в виде
рх = 0. (3-104)
Данное уравнение определяет гиперплоскость, про-
ходящую через начала координат перпендикулярно век-
тору р.
Более общее уравнение гиперплоскости получим, ес-
ли сместим начало координат в произвольную точку х0,
что соответствует замене в (3-104) х на х—х0. Произво-
дя такую замену и обозначая рх0 = с, получаем урав-
нение
рх = с, (3-105)
представляющее собой общее уравнение гиперплоскости,
ортогональной вектору р.
Наряду с гиперплоскостью L, определяемой уравне-
нием (3-105), в линейном пространстве имеются
множества точек, определяемых условиями
L+ = [х | рх > с}; L = {x|px<c}* (3-106)
Эти два множества называются открытыми полупро-
странствами, определяемыми гиперплоскостью L.
д) Прямая и отрезок. Средневзвешенное по
элементам множества
Согласно (3-72) уравнение
x = Ux (3-107)
при фиксированном xi и переменном X представляет со-
бой одномерное линейное пространство, т. е. прямую,
проходящую через начало координат и точку Хь
Уравнение прямой, проходящей через фиксированные
точки Xi и х2, получим из (3-107), сместив начало коор-
динат в точку х2, т. е. заменив х и Xi на х—х2 и
xi—х2:
х — х2 = X (хх — х2),
что удобней записывать в виде
x = U1 + (l — Х)х2. (3-108)
Значения x=xi и х==х2 получаются соответственно
при Х=1 и Х=0.
ПО
Уравнение отрезка, соединяющего точки Xi и х2, по-
лучим из (3-108), ограничив изменение X пределами 0^
Если обозначить X=Ai, 1—Х=Х2, то уравнение
отрезка запишется в виде
х = А^х^ Х2х2, Х2 0, 4* Х2 = 1. (3-109)
Величину х, определяемую из (3-109), называют
средневзвешенным по элементам Xi и х2 с весами Xi и Х2.
Это название имеет простой физический смысл. Если в
точках Xi и х2 поместить грузы с весами Л1 и Х2, то точка
х определит центр тяжести системы.
Понятие средневзвешенного можно распространить и
на большее число точек. Будем называть средневзвешен-
ным по элементам Xi,...,xm величину х, определяемую
соотношением
т т
х=2м(. ^>°> (3-п°)
z=i (=1
Точка х, определяемая по соотношению (3-110), на-
зывается выпуклой комбинацией точек Х{. Это частный
случай линейной комбинации, получаемый по соотноше-
нию (3-110) без ограничений на величины Л.;.
е) Выпуклые множества
Пусть 5 — некоторое подмножество линейного прост-
ранства Rn. Множество^ называется выпуклым, если от-
резок, соединяющий любые две точки этого множества,
целиком принадлежит этому множеству. Другими слова-
ми, S — выпуклое множество, если для любых Xi, х2 €S
и любого 0^Х^1 справедливо
ХХ1 + (1 — X)x2€S.
На рис. 3-7 приведены примеры выпуклых (а—г) и
невыпуклых (д—з) множеств на плоскости. Примерами
выпуклых множеств в многомерном пространстве слу-
жат все линейное пространство Rn, любое его линейное
подпространство (прямая, гиперплоскость), полупрост-
ранство, выпусклые многогранники, которыми являются
выпуклые множества, все границы которых линейны
(прямые, гиперплоскости).
Гиперсфера не является выпуклым множеством. Од-
нако открытый шар и замкнутый шар являются выпук-
лыми множествами.
111
Теорема 3-2. Пересечение выпуклых множеств есть
выпуклое множество.
Доказательство. Пусть р nq—произвольные
точки, принадлежащие пересечению выпуклых множеств
Рис. 3-7. Выпуклые и невыпуклые множества.
X и У. Соединяющий их отрезок будет принадлежать
как множеству X, так и множеству У, а значит, и их пе-'
ресечению.
ж) Выпуклая оболочка конечного множества
Пусть А = {ai,а™}—конечное множество точек в
пространстве Rn, Конечное множество не является вы-
пуклым. Однако точки конечного множества А могут
быть элементами каких-либо выпуклых множеств, на-
пример Si, S2 и т. п. В этом случае А является подмно-
жеством пересечения выпуклых множеств SiQS2Q...
Выпуклой оболочкой со(Д) множества А называется
пересечение всех выпуклых множеств, подмножествами
которых является А, В частности, если XQSi и ЛС52,
то
coHjc^ns,.
Из данного определения следует, что выпуклая обо-
лочка со(Д) является наименьшим выпуклым множест-
вом, содержащим Л. Действительно, если бы нашлось
112
выпуклое множество S, такое, что 4QS и SCco(X), то
имело бы место со (A )CSQ со (Л), т. е. co(4)CS. Отсю-
да следует, что S = co(X).
Теорема 3-3. Выпуклая оболочка конечного множе-
ства А есть множество средневзвешенных по элементам
множества А.
Пусть А = {ai,..., ат} — конечное множество и Xi, i=
= 1, п — вещественные числа, такие, что
Хг>0, = b (3-111)
i
Величина
х = 2М, (3-П2)
i
называется средневзвешенным по элементам множества
А. Множество S, элементами которого являются величи-
ны х, определенные по формуле (3-112) при всевозмож-
ных Лг в пределах ограничений (3-111), представляет со-
бой множество средневзвешенных по элементам множе-
ства А. Требуется доказать, что
S = co(4). (3-113)
Доказательство. Для того, чтобы множество S
было выпуклой оболочкой множества Л, оно должно
быть, во-первых, выпуклым и, во-вторых, наименьшим
выпуклым множеством, содержащим множество А.
Докажем, что оба эти условия выполняются.
1. Возьмем две произвольные системы весов Хг и X'.,
определяющих две точки
X = аг- и х' = 2 а‘
I i
из множества S. Возьмем произвольную точку х" отрез-
ка, соединяющего х и-х7:
Х"=хх+(1 - х) х' = [ч-+(i-*) ai=2 х<- ««•’
i i
где X" = ххг + (1 — Х)х;„
Величина X'' неотрицательна, так как представляет
собой средневзвешенное двух неотрицательных чисел
8-142
ИЗ
?.i и X'. Кроме того,
i i i
Таким образом, х" есть средневзвешенное по элемен-
там множества А, т. е. х" € S. Следовательно, S — вы-
пуклое множество.
2. Пусть Т — произвольное выпуклое множество, со-
держащее А. Покажем, что оно содержит и S.
По условию все элементы а» содержатся в Т. Далее
элемент
есть средневзвешенное ai, аг € Т, так что Х2 € Т. Точно
так же получаем, что
У _ %1+%2 х I ^2„ ______
Хх + Х2 + Х3 + Х2 -г Х3
_ । Х2а2 ।Х3а3
Хг + Х2 + Х3 XL + Х2 + Х3 Xi 4- Х2 + х3
есть средневзвешенное х2, а3 € Г, так что х3 € Т. Про-
должая рассмотрение этой последовательности точек,
найдем, что точка
= Л+д-'+Лд-С х + —^2— = vX.а. £S
i
также принадлежит множеству Т. Таким образом, лю-
бое х € S принадлежит и Т, т. е. SC Т. Но Г — произ-
вольное выпуклое множество, содержащее А. Следова-
тельно, S — наименьшее выпуклое множество, содержа-
щее А.
Понятие выпуклой оболочки легко распространяется
на произвольное множество. Если X — произвольное
множество точек из Rn (не обязательно выпуклое), то
выпуклой оболочкой со(Х) множества X называется
наименьшее выпуклое множество, содержащее X,
з) Разделительная и опорная гиперплоскости
Обоснование ряда результатов линейного программи-
рования и теории игр основано на использовании поня-
тий разделительной и опорной гиперплоскостей.
Пусть S и Т — выпуклые непересекающиеся множе-
ства. В теории выпуклых множеств доказывается суще-
114
ствоваиие гиперплоскости Лр, получившей название раз-
делительной гиперплоскости, такой, что множества S и
Т лежат в разных полупространствах, определяемых
этой гиперплоскостью.
Если S — выпуклое множество, то доказывается су-
ществование гиперплоскости Lo, называемой опорной
гиперплоскостью, такой, что S лежит в одном из опреде-
ляемых ею полупространств и по крайней мере одна точ-
ка из S будет принадлежать самой гиперплоскости. На
рис. 3-8 приведена иллюстрация понятий разделительной
и опорной гиперплоскостей.
Для описания некоторых видов выпуклых множеств
используется понятие крайних точек. Точка х* называ-
ется крайней точкой выпуклого множества S, если ни
для каких Xi, х2 € S она не может быть представлена в
виде
х* = bq + (1 — X) х2, 0 < К < 1.
(3-114)
Заметим, что в этом определении X не может прини-
мать значений 0 и 1, что означает, что крайняя точка не
Рис. 3-8. Иллюстрация понятий
разделительной и опорной гипер-
плоскостей.
может лежать внутри от-
резка соединяющего лю-
бые две точки выпуклого
множества, а может быть
лишь концевой точкой
этого отрезка.
Очевидно, что край-
няя точка должна быть
граничной точкой множе-
ства. Но не все гранич-
ные точки являются край-
ними. В выпуклом мно-
гоугольнике на рис. 3-7, б точки А и В крайние, а С нет.
При искривленной границе, как, например, на рис. 3-7, а,
любая граничная точка С является крайней. На поня-
тии крайних точек основано определение выпуклого мно-
гогранника. Выпуклым многогранником называется вы-
пуклое множество, имеющее конечное число крайних
точек, являющихся вершинами многогранника.
Приведем без доказательства некоторые теоремы, ка-
сающиеся крайних точек.
Теорема 3-4. Каждая опорная гиперплоскость выпук-
лого множества S содержит его крайнюю точку.
Теорема 3-5. Выпуклое множество S является мно-
8’
115
жеством средневзвешенных его крайних точек.
Из теоремы 3-5 следует, что если S — выпуклый мно-
гогранник, то любая его точка является средневзвешен-
ным множества его вершин. Сопоставляя данное утверж-
дение с определением выпуклой оболочки конечного
множества Л, приходим к выводу, что выпуклой оболоч-
кой конечного множества А является выпуклый много-
гранник, вершинами которого являются точки множе-
ства А.
ЗАДАЧИ К ГЛ. 3
3-1. В трехмерном пространстве даны точки х= (1, 0, 2), у =
= (3, 4, 0), z=(l, 2, 3). Для этих точек проверить аксиому треуголь-
ника в пространствах С ф, Сф> С(3).
3-2. На плоскости (х, у) нарисовать окружность с центром в 0
и радиусом 1 в пространствах Сф, С(2\ С(2) .
3-3. Доказать, что открытый шар в пространстве R{n) является
выпуклым множеством.
3-4. Какие из множеств [0, 3], [5, 7], [0, 3] U [5, 7] в прост-
ранстве вещественных чисел R выпуклы, а какие нет?
ГЛАВА ЧЕТВЕРТАЯ
ЭЛЕМЕНТЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ И
МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
4-1. ПОНЯТИЕ ВЕРОЯТНОСТИ
а} События и пространство исходов эксперимента
В основе теории вероятностей лежит понятие собы-
тия, которое связано с проведением некоторого экспери-
мента. Под событием понимается всякий факт, который
в результате эксперимента может произойти или не про-
изойти.
Предположим, что при данной совокупности условий
результатами эксперимента может быть конечное число
исходов полную совокупность которых обозна-
чим через
2 = {г1( .... zm}. (4-1)
Множество Z будем называть пространством, исходов
эксперимента, а элементы z € Z — элементарными собы-
тиями в пространстве Z.
116
Однако практически наибольший интерес представ-
ляют не сами элементарные события, а некоторые их со-
вокупности, являющиеся подмножествами множества Z.
Будем называть событием в пространстве исходов экспе-
римента Z любое подмножество S множества Z:
SCZ.
(4-2)
Когда мы говорим, что происходит событие S, то под-
разумеваем, что исходом эксперимента является элемен-
тарное событие z, содержащееся в S.
Для любых событий Si и S2, принадлежащих прост-
ранству исходов, эксперимента Z, имеют место следую-
щие определения:
Объединением S\ (JS2 событий Si и S2 называется
событие, состоящее в осуществлении хотя бы одного из
событий Si и S2.
Совмещением Si QS2 событий Si и S2 называется со-
бытие, состоящее в осуществлении и Si и S2. События
Sj и S2 называются несовместными, если осуществление
одного из них исключает возможность осуществления
другого, т. е. если Si QS2 = 0.
Дополнением S события S называется событие, состо-
ящее в неосуществлении события S.
Достоверное событие состоит в осуществлении хотя
бы одного из событий пространства Z.
Невозможным событием является пустое множество
0, состоящее в гом, что не осуществляется ни одно из
событий пространства Z.
Пример 4-1. Эксперимент состоит в бро-
сании двух игральных костей, на каждой
из которых может выпасть от одного до
шести очков. Введем в рассмотрение мно-
жество /={1, 2, 6}. Исход эксперимен-
та будет упорядоченной парой z=(/, #)»
где i, причем i — результат бросания
первой кости, a k — результат бросания вто-
рой кости. Исходы эксперимента удобно
изображать точками на плоскости (Z, А?), как
показано на рис. 4-1. Как видим, простран-
ство исходов эксперимента будет состоять
из 36 точек: Z={(1,1), (1,2),..., (6,6)}. Со-
бытия здесь могут быть весьма разнообраз-
ными. Обозначим через событие, состоя-
щее в том, что выпадает j очков. Тогда S2 —
-{(1,1)}; S7={(1,6), (2,5), (3,4), (4,3),
(5, 2), (6, 1)}; Sn = {(6, 5), (5, 6)}; S12 =
= {(6, 6)} и т. п.
О 1 Z 3 4 5 6
Рис. 4-1. Простран-
ство исходов экспе-
римента при броса-
нии двух игральных
костей.
117
б) Понятие вероятности
В теории вероятностей каждый исход эксперимента
z ZZ рассматривается как случайный. Это означает, что
заранее неизвестно, какой из исходов будет иметь место
при проведении эксперимента. Однако ясно, что, во-пер-
вых, в результате каждого испытания обязательно дол-
жен иметь место какой-то исход z € Z и, во-вторых, в
результате одного испытания не может быть двух исхо-
дов.
Интуитивно под вероятностью исхода понимают чис-
ленную меру, которая характеризует объективную воз-
можность данного исхода эксперимента. Это означает,
что каждому из элементов z€Z приписывается некото-
рый вес р, т. е. положительное вещественное число, на
которое наложены некоторые ограничения, а именно:
1) р тем больше, чем больше уверенность в том, что
будет иметь место именно данный исход эксперимента
z€Z;
2) сумма весов р для всех возможных исходов экс-
перимента должна быть равна единице.
Приписывание какому-либо элементу z €Z веса р=
— Q означает, что данный исход эксперимента невозмо-
жен, т. е. представляет собой невозможное событие. Ес-
ли какому-то элементу z €Z приписан вес р=1, то дан-
ный исход представляет собой достоверное событие.
Действительно, в силу второго ограничения всем осталь-
ным элементам множества Z должны быть приписаны
веса р=0, т. е. события, соответствующие этим элемен-
там, являются невозможными. Но так как какой-то ис-
ход эксперимента обязательно должен иметь место, то
это будет именно тот, которому приписан вес р=1.
Совокупность весов, приписываемых отдельным эле-
ментам множества Z, представляет собой некоторое мно-
жество Р с элементами р, а сам процесс приписывания
весов представляет собой отображение множества Z на
множество Р, т. е. определяет вероятности р €Р как
функции исхода эксперимента z€Z, что может быть за-
писано в виде
p = p(z). (4-3)
Согласно сформулированным выше ограничениям ве-
личины р(г) представляют собой вещественные числа,
118
удовлетворяющие условиям
р(г)>0; 2p(2)=!. (4-4)
z(LZ
Совокупность весов р(г) для всех Z называется
распределением вероятностей на пространстве исходов
эксперимента Z, а каждый вес р€Р, приписываемый
элементарному исходу z € Z, называется вероятностью
данного исхода.
Если множество Z элементарных событий представ-
ляет собой множество значений некоторой (не обяза-
тельно численной) переменной г, то эта переменная
называется случайной величиной. В этом случае совокуп-
ность весов р(г) будет представлять собой распределе-
ние вероятностей случайной величины.
в) Вероятность события
Событие S мы определили как некоторое подмноже-
ство множества исходов эксперимента Z. Следовательно,
событие представляет собой множество, состоящее из ча-
сти элементов множества Z. При этом под вероятностью
события S, обозначаемой через Р& или P(S), понимают
сумму весов, составляющих это событие элементов:
2р(2)* (4“5)
Частными случаями этой формулы являются:
1) случай, когда S не содержит ни одного элемента
из Z, т. е. является пустым множеством; согласно (4-5)
вероятность пустого множества равна нулю;
2) случай, когда S совпадает с Z, т. е. содержит все
возможные исходы эксперимента: Так как не может быть
исхода эксперимента, не входящего в Z, то все простран-
ство Z можно рассматривать как универсальное множе-
ство и приписать ему вес, равный единице. Это вполне
согласуется с формулой (4-5), которая с учетом (4-4)
дает:
^=2р(2)=1. (4-6)
z(2Z
119
г) Способы приписывания вероятностей исходам
эксперимента
Имеется ряд способов приписывания весов отдель-
ным элементам г пространства Z. Какой из способов при-
менить в том или ином случае, зависит от характера про-
водимого эксперимента и от той информации, которой
мы при этом располагаем. Рассмотрим основные спо-
собы.
1. Определение вероятности через частоту. Рассмот-
рим эксперимент с пространством исходов Z={z\, ...
..., zm}, который мы можем повторять многократно в од-
них и тех же условиях. Предположим, что было проведено
N испытаний, при которых интересующий нас исход
г EZ произошел Nz раз. Относительное число случаев,
при которых данный исход z имел место, т. е. величина
q(z)^NzIN, (4-7)
называется частотой исхода z. Нетрудно убедиться, что
частоты q(z) всевозможных исходов z € Z удовлетворя-
ют условиям (4-4).
При небольшом числе экспериментов частота носит в
значительной мере случайный характер. Так, при 10 бро-
саниях монеты герб может выпасть 2 раза, а при других
10 бросаниях он может выпасть, например, 8 раз. Одна-
ко практика показывает, что при увеличении числа экс-
периментов частота отдельных исходов в значительной
мере теряет свой случайный характер и имеет тенденцию
приближаться с незначительными колебаниями к неко-
торому среднему значению, которое и может рассматри-
ваться как вероятность события. Однако это приближе-
ние частоты к вероятности при увеличении числа экспе-
риментов отличается от стремления к пределу в матема-
тическом смысле.
Так, не является невозможным, что при 10-кратном
бросании монеты герб выпадает все 10 раз. Поскольку
результат каждого бросания монеты не зависит от ре-
зультатов предыдущих бросаний, то нет ничего невоз-
можного и в том, что герб выпадет 1000 раз при 1000-
кратном бросании монеты. Однако вероятность такого
события столь мала, что его можно считать практически
неосуществимым.
Вообще при увеличении числа опытов частота при-
ближается к вероятности в том смысле, что вероятность
120
сколько-нибудь значительных отклонений частоты от ве-
роятности становится пренебрежимо малой. Следова-
тельно, если имеется возможность многократно повторять
эксперимент в одинаковых условиях, то частоты от-
дельных исходов q(z) могут быть приняты за вероятно-
сти этих исходов. Вопрос о том, какое число эксперимен-
тов считать достаточным при определении вероятности
через частоту и какова степень достоверности получен-
ных при этом результатов, будет более подробно рас-
смотрен в разделах, посвященных методом математиче-
ской статистики.
Однако трудности, связанные с многократным пов-
торением эксперимента в реальных условиях, заставля-
ют использовать другие методы определения вероятно-
сти.
2. Одним из методов, который довольно часто (но
не всегда) может быть использован, является метод, ос-
нованный на принципе равных возможностей.
Принцип равных, возможностей применяется тогда,
когда у нас нет оснований отдать предпочтение какому-
либо одному исходу эксперимента перед другими исхо-
дами. В этом случае следует считать, что имеются рав-
ные возможности для любого исхода эксперимента, и
всем им приписать одинаковые вероятности. Если при
этом пространство исходов эксперимента Z состоит из
m элементов, а событие S содержит г элементов из Z,
то вероятность этого события будет равна:
P(S) = r//n. (4-8)
3. Наиболее распространенным способом приписыва-
ния вероятностной меры является определение так назы-
ваемых априорных вероятностей. Априорные вероятно-
сти определяются на основании сбора статистических
данных об интересующем нас событии или явлении за
длительный промежуток времени.
Обычно в различных областях науки, техники и об-
щественной жизни производится сбор статистических
сведений о тех или иных событиях или явлениях, кото-
рые относятся к разряду случайных, т. е. закономерно-
сти которых не поддаются строгому математическому
описанию и появление которых не может быть с досто-
верностью предсказано. Изучение того, насколько часто
данное событие происходило в прошлом, позволяет оп-
ределить вероятность этого события и, следовательно,
121
предсказать с определенной степенью достоверности по-
явление этого события в будущем.
4. Априорные вероятности дают достоверное описа-
ние явления лишь в том случае, когда условия, при ко-
торых происходило явление в прошлом, сохраняются и в
настоящее время. Однако так бывает далеко не всегда.
Поэтому важное значение имеет уточнение действитель-
ных условий, имеющих место в настоящий момент вре-
мени, что может быть сделано путем проведения специ-
ально поставленного эксперимента. Вероятности, опреде-
ляемые как на основе прошлых статистических данных,
так и на основании специально поставленного экспери-
мента, называются апостериорными вероятностями.
д) Вычисление вероятностей сложных событий
Пусть Si и S2 — некоторые события в пространстве
исходов эксперимента Z с известными вероятностями
P(Si) и P(S2). Сложное событие может представлять
собой, например, объединение, пересечение, дополнение
простых событий. Для упрощения вычислений вероятно-
стей сложных событий рассмотрим некоторые соотноше-
ния, связывающие вероятность сложного события с ве-
роятностями составляющих его простых событий.
1. Если Si Q S2=0, то согласно (4-5)
P(SiUS2)= 2 2 Р(2) +
+ 2 P(z) = P(Sx) + P(S2). (4-9)
2 S2
2. Из условий X (J X=Z, X Q Х—0 находим;
Р(Х UX) = Р(Х) + Р(х) = 1, (4-10)
откуда _
р(х) = 1—Р(Х). (4-11)
3. Пусть X! сХ2. Тогда Х2 можно представить в ви-
де X2=XiU(X2‘xXi), причем XiQ(X2\Xi) =0. Следова-
тельно, Р(Х2) =Р(Х1)-|-Р(Х2\Х1). Поскольку X^X^Z,
а значит, Р(Х2\А'!)^0, то получаем
Р(Х2)>Р(Хх); (4-12)
Р(Х2хХх) = Р(Х2)-Р(Хх). (4-13)
122
4. Для произвольных Xi и Х2 и Z представим их объ-
единение в виде объединения двух непересекающихся
множеств
(4-14)
так что
Р и = Р CQ + Р 1Х2\(Хх п Х2)]. (4-15)
Учитывая, что Хг С}Х2С1Х2, получаем:
Р (Хх и Х2) = Р (Хх) + Р (Х2) - Р (Хх П Х2). (4-16)
Пример 4-2. Из колоды в 52 карты выбирается наугад одна
карта. Какова вероятность, что:
1) она будет червонной масти или король треф?
2) она будет червонной масти или один из королей?
Обозначим X — множество червей; У — множество королей;
V—король треф, так что Р(Х) = 1/4, Р(У) = 1/13, Р(У) = 1/52.
1. Вычисляем Р(ХиЮ- Поскольку Xf]V= 0, то
1 1 7
P(XUV) = P(X) + P(V) =-г + ^Г = _^Г-
2. Вычисляем Так как X\JY=£ 0, то P(X|JT) =
=Р(Х)+Р(У)-Р(ХПУ). Но XПТ —король червей, т. е. Р(ХПУ) =
= 1/52. Следовательно,
Р(хиг)=-|-+-^-^ = -А-.
4-2. УСЛОВНЫЕ ВЕРОЯТНОСТИ
а] Понятие условной вероятности
Рассмотрим некоторое событие Т в пространстве ис-
ходов эксперимента Z. По определению вероятность это-
го события
Р(Т)= 2pU). (4-17)
Предположим теперь, что нам известно, что произош-
ло некоторое другое событие S. Спрашивается, каким
образом знание того, что произошло событие S, повлия-
ет на вероятность события Г?
Вероятность события Т при условии, что произошло
другое событие S, называется условной вероятностью со-
бытия Т и обозначается Ps(J) или P(T|S). В отличие от
этого вероятность Р(Т) называется безусловной вероят-
ностью события Т. Перед нами стоит задача найти соот-
ношение, связывающее эти две вероятности,
123
Упростим вначале задачу. Будем считать, что множе-
ство Т состоит только из одного элемента z € Z. При оп-
ределении безусловной вероятности p(z) мы исходим из
того, что может произойти любое z€Z. Если производит-
ся достаточно большое число экспериментов, то
, v _ Число экспериментов с данным z^Z _ Nz
Общее число экспериментов /V
Если налагается условие, что произошло событие 3,
то тем самым должны быть исключены все те исходы
эксперимента, при которых событие S не происходит.
Значит, при определении р(г|3) нужно заменить N на
As—-число экспериментов, в которых произошло собы-
тие 5 и Nz, на N(Z,s) — число экспериментов, в которых
произошло как данное г, так и событие 3. Но в рассмат-
риваемом случае
(г, S) = г П S = !Z’ еСЛИ 2 V’ И'19)
(0, если г £ S.
Поэтому Таким образом,
p(z|S) = ^QL. (4-20)
Поделив числитель и знаменатель этого выражения
на общее число экспериментов А\ получим:
p(2|S)==£^5T- (4'21)
Рассмотрим теперь случай, когда Т произвольное
подмножество Z. Учитывая, что вероятность события
равна сумме вероятностей элементов, составляющих это
событие, получаем:
p(2|S) = -^T—--------, (4-22)
Рассмотрим сумму, стоящую в числителе этого выра-
жения. В нее входят только слагаемые для z <zT. Но в
ней можно не учитывать слагаемых для z £ S, так как
при этом p(zQS)=0. Следовательно, эта сумма состо-
ит из слагаемых, для которых выполняются условия
2С Т и г € S, Значит, суммирование можно вести по
г^Т f") 5. Но при z p(z Q S) =p(z).
124
Поэтому
2p(2C|S)= 2 P^ = p(TC}S), (4-23)
гег
С учетом этого получаем:
Р (ТIS) = р S) • (4-24)
что часто записывают в виде
P(T^S)==P(T\S)P(SY (4-25)
Иногда встречаются случаи, когда наше знание то-
го, что произошло событие S, не влияет на вероятность
события Т. Другими словами, вероятность события Т не
зависит от того, произошло или не произошло событие
S, так что
P(T\S) = P(TY (4-26)
В этом случае говорят, что события Т и S являются
независимыми событиями. Для независимых событий
имеет место соотношение
P(TQS)-P(T)P(S), (4-27)
которое часто называют формулой умножения вероятно-
стей.
6) Двумерные случайные величины
Очень часто в качестве результата эксперимента нас
интересует не одна, а несколько случайных величин, на-
пример две х и у. Так, при вынимании карты из колоды
нас могут интересовать ее масть х и ценность (число оч-
ков) у. При выборе деревьев в лесу для строительства
нас интересуют высота дерева х и его диаметр у. При
проверке конденсаторов на исправность нас интересуют
емкость х и пробивное напряжение у.
Во всех этих примерах приходится иметь дело с дву-
мя множествами случайных величин X={xh ..., хп} и
У={//1, ут}. Однако эти множества не являются не-
зависимыми, они определенным образом связаны между
собой. А именно, исходом одного эксперимента z являют-
ся две случайные величины х € X и у €У, так что z= (х,
у). Таким образом, множество исходов эксперимента
Z является прямым произведением множеств X и У:
Z = XxY. (4-28)
125
Рассмотрим некоторые события и их вероятности, ко-
торые могут нас интересовать при рассмотрении двумер-
ных случайных величин. Вводимые понятия будем иллю-
стрировать на примере высоты х и диаметра у деревьев
в лесу.
Пусть результатом некоторого эксперимента будут
исходы х € X и у£ Y. Например, х=30 м и у=25 см. При
этом может встретиться необходимость рассматривать
следующие вероятности:
1) р(х) —вероятность того, что высота дерева будет
30 м. В данном случае диаметр дерева нас не интересует;
2) Р(у)—вероятность того, что диаметр дерева бу-
дет 25 см. В данном случае нас не интересует высота де-
рева. Вероятности р(х) и р(у) являются безусловными
вероятностями признаков х и у и дают распределения
вероятностей соответственно на множествах X и У, удов-
летворяющие условиям (4-4);
3) Р(х» У) —вероятность того, что дерево имеет вы-
соту 30 м и диаметр 25 см. Это совместное распределе-
ние вероятностей двух признаков х и у, заданное на про-
странстве Z=XXY с элементами z— (х, у) и удовлетво-
ряющее условиям
р(х, у)>0, ^р(х, г/) = 1; (4-29)
Х,У
4) наконец, может встретиться условная вероятность
р(х!у), т. е. вероятность того, что дерево с диаметром
25 см имеет высоту 30 м. В данном случае деревья дру-
гого диаметра попросту не рассматриваются.
Для того, чтобы увязать все рассмотренные вероятно-
сти между собой, обозначим через Xi некоторый исход
х 6Х, а через z/?- некоторый исход У и рассмотрим два
события в пространстве Z=X\Y: 7\ = {(хг-, г/i), ..., (хг-,
ут)} и S, = {(хь у}), .... (Хп, Уз)}.
Событие Ti состоит в том, что произошел данный ис-
ход xt £ X и любое у €У. Так как при любом эксперимен-
те какое-то у € У всегда имеет место, то событие со-
стоит в том, что произошел исход X/. Таким образом,
Л — Хл Аналогично Sj=yj, Нетрудно также видеть, что
Ti (}Sj=(Xi, yj). По формуле (4-24) находим:
p(Xi\yj)== p(xit у}ур(у?). (4-30)
Поскольку Xi может быть любым х а у^ может
быть любым у 6 У, то, опуская индексы, получаем для
126
любых х € X и у € У:.
Р (х | у) = р (х, у)/р (у), (4-31)
что можно записать в виде
р(х, у) = р(х\у)р(у), (4-32)
Если вероятность исхода х не зависит от того, ка-
кой исход у имел место, то исходы х и у являются неза-
висимыми. Для независимых исходов справедливо соот-
ношение
Р(*| «/) = ₽(*)» (4-33)
так что формула (4-32) принимает вид:
Р(х, у) = р(х)р(у). (4-34)
Заметим далее, что при рассмотрении двумерной ве-
личины нам безразлично, какую из величин х или у при-
нять за первую и какую за вторую. Меняя в формуле
(4-32) местами х и у, получаем:
Р (х, у) = р(у\х)р (х). (4-35)
Сравнивая (4-32) и (4-35), находим:
Р {х, у) = р(х)р(у\х) = р (у) р (х | у). (4-36)
в) Формула полной вероятности
Рассмотрим некоторое пространство исходов экспе-
римента Z. Пусть TCZ — событие в пространстве Z, а
система множеств {Sb ..., представляет собой некото-
рое разбиение этого пространства, т.е. удовлетворяет
условиям
z = Si и ... U S„ St П sh = 0 при i^k. (4-37)
В ряде случаев представляет интерес выразить без-
условную вероятность события Т через условные веро-
ятности Р(7’|31), ..., P(T\Si) и безусловные вероятности
Для получения нужного соотношения представим
пространство исходов эксперимента Z в виде Z—SiUSi,
где Тогда
Р(Т) ~ p(T|Si и ) = PIT n (Si и Si)] =
~ P (Tf\ Si) + P (ТП Si). (4-38)
127
Будем рассматривать Si как новое пространство ис-
ходов эксперимента 7ьт.е. Z1=Si=S2 I I ... I JS, или
S1=S2|JS2, где S2=S3 (J ... J Si. Тогда
р(тА51)=Н7,ГШий) =
= P(TnS2) + P(rnS2), (4-39)
Следовательно,
Р (Т) = Р (Т A Sj) + Р (Т A s2) 4- Р {т П S2). (4-40)
Продолжая аналогичные преобразования и далее, по-
лучаем:
Р (Т) = 2 Р (Т А S£) = 2 р I р <4-41)
г I
Формула (4-41) получила название формулы полной
вероятности,
4-3. НЕПРЕРЫВНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ИХ
РАСПРЕДЕЛЕНИЯ
а) Понятие непрерывной случайной величины
До сих пор мы предполагали, что пространство исхо-
дов эксперимента Z представляет собой конечное мно-
жество. Однако во многих случаях исходом эксперимен-
та z может быть любое значение в некотором диапазоне
При этом z является непрерывной случайной
величиной, пространством исходов эксперимента кото-
рой будет весь диапазон ее возможных значений:
Z = {z|6z<z<b}, (4-42)
содержащий бесконечное множество точек. В этом слу-
чае уже нельзя говорить о вероятности отдельного исхо-
да, так как при бесконечно большом числе возможных
исходов вес каждого исхода будет равен нулю. Поэтому
распределение вероятностей для непрерывной случайной
величины определяется иначе, чем в дискретном случае.
При этом используются два вида распределения, назы-
ваемых функцией распределения вероятностей и плотно-
стью распределения вероятностей.
6) Функция распределения вероятностей
Пусть Z — пространство исходов эксперимента одно-
мерной случайной величины, принимающей веществен-
128
Рис. 4-2. Функция распре-
деления вероятностей для
непрерывной случайной ве-
личины. .
ные значения, a R — множество всех вещественных чи-
сел, элементы которого обозначим через х. Функция рас-
пределения вероятностей F(x) определяет вероятность
того, что значения случайной величины z не превзойдут
данного х:
F(x) — P(— оо < z<х). (4-43)
Общий характер функции F(x) можно представить,
базируясь на некоторых ее свойствах:
1) ПОСКОЛЬКУ При X2>Xt
интервал [—оо, х2] лежит це-
ликом внутри интервала!—;оо,
xj, то согласно (4-43) F(x2)^
22г F (xi). Следовательно, F (х) —
неубывающая функция.
2. F(—оо)=0, так как ис-
ход эксперимента z € (—оо, х]
становится невозможным со-
бытием при х->—оо.
3. F(4-oo)=l, так как ис-
ход эксперимента (—оо, х]
становится достоверным собы-
тием при х->—|-оо.
Общий вид функции, удовлетворяющий поставлен-
ным свойствам, приведен на рис. 4-2.
в) Плотность распределения вероятностей
Зная функцию распределения вероятностей-,- можно
подсчитать вероятность того, что значение случайной
величины будет лежать внутри малого интервала от х до
x-f-Дх. Согласно (4-43) эта вероятность равна:
F (х + Ах) — F (х) = F~^ *X}-FW кх, (4-44)
Дх
Первый сомножитель правой части этого выражения
представляет собой значение вероятности, приходящееся
на единицу длины участка Дх. Если предел этого отно-
шения при Дх->0 существует, что обычно выполняется
для большинства непрерывных случайных величин, то
он обозначается через оу(х) и называется плотностью
распределения вероятностей. Таким образом,
/ \ г F (х + Дх) — F (х) dF (х) {Л
w (х) = 11 m ——!1-------— =-----г— , (4-45)
дх->о Дх dx
9-142
129
так что
F (х + &х) — F(x) = <Дх)Ах, (4-46)
На рис. 4-3 приведен общий характер графика функ-
ции w(x).
Выясним некоторые свойства функции w(x). Пусть
а и b — произвольные точки вещественной оси, причем
ь
Ь>а. Найдем смысл интеграла f w(x)dx. Заменяя чис-
а
то формально w(x)dx на dF(x), получаем:
b F{b)
Jo>(x)dx = j dF (х) — F (b) —F (а). (4-47)
a F(a)
Однако согласно (4-43) это выражение дает вероят-
ность того, что случайная величина z принимает значе-
ние, лежащее внутри интер-
вала (а, Ь). Таким образом,
х Рис. 4-3. График плотности
---распределения вероятностей.
о г
ь
P(a<z<b)= \w(x)dx. (4-48)
а
Из этой формулы как частный случай следует соот-
ношение
J w(x)dx=l, (4-49)
—оо
показывающее, что площадь, ограниченная кривой плот-
ности распределения вероятности w(x) и осью абсцисс,
всегда равна единице.
Формула (4-48) позволяет выразить связь между
функциями F(x) и w{x) в интегральной форме. Сравни-
вая (4-43) с (4-48), находим:
F(x) = j* (4-50)
Понятия функции распределения вероятностей и плот-
ности распределения вероятностей легко распространя-
ются и на случай многомерной случайной величины [23,
25]. Не останавливаясь на этом вопросе, обратимся к
рассмотрению некоторых законов распределения непре-
рывных случайных величин.
130
г) Равномерное распределение
Если случайная величина с одинаковой вероятностью
может принимать любые значения в пределах участка
вещественной оси от а до |3 и не может принимать значе-
ний вне этого участка, т. е. имеет плотность распреде-
ления вероятностей
w(z) =
О, z < a, z > (3,
(4-51)
то ее называют равномерно распределенной в интерва-
ле [а, р].
Равномерное распределение удобно охарактеризо-
вать параметрами v=(a+p)/2 и <о = р—а, называемы-
ми средним значением и размахом распределения и обо-
значить через R(v, со). Плотность распределения вероят-
ностей w(z) легко выражается через параметры распре-
деления /?(v, <о) в виде
/\ fl/co, v — со/2 < z < v + со/2; ,л
w (z) = ’ (4-
|0, z < v — со/2, z > v + со/2.
Пример 4-3. При округлении чисел до целых значений погреш-
ности округления могут с одинаковой вероятностью принимать зна-
чения от —0,5 до 4-0,5, т. е. подчиняются распределению R (0, 1).
Пример 4-4. При отсчете по шкале с ценой деления 6 погреш-
ности отсчета будут случайными величинами с распределением R
(0, 6).
Пример 4-5. Если движение троллейбуса происходит с интер-
валом 10 мин, то время ожидания для пассажира, не знакомого с
расписанием, будет случайной величиной с распределением R (5, 10).
д) Нормальное распределение
Наиболее важным законом распределения случайной
величины является нормальный или гауссовский закон
распределения. Этот закон наиболее часто встречается
на практике. Кроме того, нормальный! закон распределе-
ния является предельным законом, к которому прибли-
жается ряд других законов распределения при весьма
часто встречающихся типовых условиях.
Нормальный закон характеризуется функцией рас-
пределения плотности вероятностей вида
w (z) =---e-(z~v)2/20‘ (4-53)
ak2n
9'
131
для —oo<z<+°°- Нормальное распределение опреде-
ляется параметрами v и а2, называемыми математичес-
ким ожиданием и дисперсией, и в дальнейшем будет обо-
значаться N(y, а2). На рис. 4-4 приведен график функ-
ции (4-53) для v=l,0 и нескольких значений о.
Весьма важной задачей теории вероятностей являет-
ся определение вероятности того, что случайная величи-
Рис. 4-4. График ш(г) для нормального рас-
пределения.
на попадет на заданный интервал вещественной оси (а,
Ь). В случае нормального распределения
ь
P(a<z<b) =---------f e-(z~v)2/2a2 dz. (4-54)
о]/2л J
а
Это выражение принимает более удобный вид, если
произвести замену переменной, обозначив (z—v)/o=t
При этом dt=dzlo и
(b—v)/a
Р (а < z < Ь) = —Г е~‘2/2 dt. (4-55)
]/*2л J
(a—v)/a
Однако интеграл вида j dt через элементарные
функции не выражается. Поэтому 'для вычисления
(4-55) пользуются таблицами специальной функции
Ф(^) = —1_ Г е~11‘2 dt,
X 2л J
(4-56)
132
называемой интегралом вероятностей, имеющимися, на-
пример, в [24]. С учетом (4-56) вероятность попадания
случайной величины на интервал (а, Ь)
Р(а<г<Ь) = ф( —~v ) — Ф ( a~v ]. (4-57)
\ а / \ а /
При вычислениях по формуле (4-57) полезно пом-
нить следующие свойства интеграла вероятностей:
Ф(0)=1/2; Ф(+оо) = 1; ф(—Х)= 1 -Ф(х). (4-58)
4-4. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН
а) Понятие о числовых характеристиках
Функция распределения или плотность распределе-
ния вероятностей являются наиболее полными характе-
ристиками случайных величин. Однако во многих зада-
чах практики оказывается трудно или даже невозможно
полностью описать функцию распределения вероятно-
стей.
В то же время для решения многих задач достаточно
знать лишь некоторые параметры, характеризующие
случайную величину с той или иной точки зрения. Наи-
более распространенными числовыми параметрами, по-
лучившими название числовых характеристик или мо-
ментов случайных величин, являются математическое
ожидание и дисперсия или среднеквадратичное отклоне-
ние. Они легко определяются из экспериментальных дан-
ных и позволяют в общих чертах судить о характере рас-
пределения случайной величины.
б) Математическое ожидание случайной величины
Во многих задачах случайная величина, рассматри-
ваемая как возможный исход некоторого эксперимента,
выражается вещественным числом. Примерами случай-
ных величин, принимающих численное значение, могут
служить:
ток, потребляемый жильцами дома;
напряжение в сети в данный момент времени;
температура воздуха в данное время суток;
число космических частиц, достигающих земной по-
верхности за единицу времени;
число очков, выбитых данным стрелком на мишени;
число покупателей в магазине в данный момент вре-
мени и т. п.
133
Для всех этих случаев важной числовой характерис-
тикой случайной величины является ее математическое
ожидание.
Предположим, что элементы пространства исходов
эксперимента Z = {21,..., zm} допускают численную оцен-
ку. Если при N испытаниях исход 21 произошел п раз,...,
исход zm произошел гт раз, так что ri-\-,..-]-rm===N, то
математическое ожидание случайной величины 2, обо-
значаемое М(2) или 2, равно:
т
М(z) = z = -1 -у • (4-59)
Если число экспериментов N было достаточно боль-
шим, то отношение rilN = pi можно рассматривать как
вероятность исхода zt. При этом, опуская индексы, фор-
мулу для определения (4-59) можно записать в виде
M(z)=z = 22Р(г)-
(4-60)
Формула (4-60) может служить для определения ма-
тематического ожидания в случае, когда пространство
исходов эксперимента Z является конечным множеством.
Если же 2 — непрерывная случайная величина с плотно-
стью распределения вероятностей w(z), то под p(z) в
формуле (4-60) можно понимать вероятность того, что
значение случайной величины лежит в пределах от 2 до
24-Д2, т. е. положить p(z) = w (2) Д2. Переходя к преде-
лу при Д2->0 и заменяя соответственно Д2 на dz, а сум-
му на интеграл, получаем:
M(z)=z = Г zw(z)dz. (4-61)
в} Математическое ожидание функции от случайной
величины
На практике часто встречаются задачи, в которых
случайная величина не выражается числом. Так, выпус-
каемая заводом продукция делится на годную и брако-
ванную. При бросании монеты исходом эксперимента
может быть «герб» или «решетка». Вынутая наугад из
колоды карта характеризуется наименованием и мастью.
131
Принятый радиолокационный сигнал несет информацию
о наличии или отсутствии цели и т. п. Во всех этих приме-
рах случайные величины имеют не количественное, а
только качественное различие. Однако обычно оказыва-
ется возможным введение количественной оценки и для
случайных величин, имеющих лишь качественное раз-
личие.
Случайную величину мы рассматриваем как резуль-
тат некоторого эксперимента, который или ставится ис-
кусственно, или является результатом естественного про-
цесса. При этом следует помнить, что любой эксперимент
требует определенных затрат, и ставится он не ради
удовлетворения нашего любопытства, а ради достиже-
ния определенной цели. Тот или иной исход экспери-
мента является желательным или нежелательным в за-
висимости от того, насколько достигается поставленная
цель. Достижение поставленной цели можно рассматри-
вать как выигрыш или выгоду, а недостижение—как
проигрыш или убыток. И выгоду и убыток можно выра-
зить числами, представляющими, например, какие-то
суммы денег в рублях.
Таким образом, каждому исходу эксперимента z^Z
можно поставить в соответствие некоторую численную
оценку, т. е. осуществить отображение f пространства
исходов эксперимента Z на множество вещественных
чисел R;
f:Z-+R. (4-62)
Это отображение дает вещественную функцию f(z),
определенную на Z, с которой мы можем оперировать
как со случайной величиной и, в частности, определять
ее математическое ожидание.
Пусть f(z)—некоторая численная функция, опреде-
ленная на множестве Z. Это означает, что элементам
Zj,...,zm множества Z соответствуют значения функции
H^i), ...,f(zm). Вероятности этих значений будут те же,
что и вероятности случайных величин zi,...,zm. Таким
образом, p(z) представляет собой распределение вероят-
ностей как для случайной величины z, так и для функ-
ции от случайной величины f(z). Следовательно, мате-
матическое ожидание функции от случайной величины
может быть найдено по формулам для математического
ожидания случайной величины путем замены z на f(z).
т. е.
135
M[f(z)]=f(z) = ^f(z)p(z) (4-63)
4Z
для дискретной случайной величины и
4-00
А/ If (г)] = f (г) = J f (г) w (г) dz (4-64)
—оо
для непрерывной случайной величины.
Отметим, что значение /(г), подсчитанное по форму-
ле (4-63), зависит от распределения вероятностей p(z).
Это означает, что если изменяется распределение веро-
ятностей p(z) на пространстве Z, то изменится и мате-
матическое, ожидание функции f(z). Чтобы подчеркнуть
это обстоятельство, будем, иногда обозначать математи-
ческое ожидание функции f(z) через j(p), считая, что
Ир) = Ш- (4-65)
Использование для обозначения математического
ожидания функций той же буквы f, что и для обозначе-
ния самой функции, в данном случае допустимо и не
может привести к недоразумениям, так как функции
f(z) и f(p) определены на разных множествах: функция
f(z) на пространстве исходов эксперимента Z, a f(p) на
пространстве всевозможных распределений вероятно-
стей р(г).
Пример 4-6. Вероятность того, что выпущенный заводом прибер
окажется бракованным, равна р. Какова средняя прибыль, приходя-
щаяся на один прибор, если а — себестоимость, а b — цена прибора?
Применяя формулу (4-63), находим:
/ (Р) = (Ь — а) (1 — р) — ар = b (1 — р) — а.
Во многих задачах математическое ожидание рассматривается
как средний выигрыш при большом числе экспериментов. В этом
случае считается, что эксперимент проводить целесообразно, если
/(z)=f(p)^O.
Другая интерпретация математического ожидания относится к
пари. Предположим, что некоторое событие может произойти с ве-
роятностью р. Заключение пари предполагает, что один из его участ-
ников согласен заплатить сумму 6, если событие не произойдет, при
условии, что другой участник заплатит ему сумму а, если событие
произойдет. Таким образом, первый учасишк получает сумму а с
вероятностью р и выплачивает сумму b с вероятностью 1—р. Его
средний выигрыш
f(p) = ар — 6(1 — р).
136
Пари считается справедливым, если средний выигрыш будет
равен нулю, т, е. при условии
Теорема 4-1 (теорема о среднем значении). Исполь-
зуя для определения f(p) выражение (4-63) и заменяя в
каждом слагаемом f(z) на minf(z), получаем соотно-
2
шение
Ир)
min/(г) Ур(г) = min/(г),
г
(4-67)
выражающее собою теорему о среднем значении.
г) Математическое ожидание функции двух
случайных величин
Во многих случаях приходится иметь дело не с од-
ним, а с несколькими случайными событиями и вводить
вещественную функцию, зависящую от исходов каждого
из этих событий. Так, например, в соревнованиях по лег-
кой атлетике результат каждого участника — случайное
событие. Место же, занимаемое командой, будет функ-
цией как результатов участников своей команды, так и
результатов участников команды противника.
Ограничимся рассмотрением двух независимых слу-
чайных величин, пространства исходов эксперимента для
которых обозначим соответственно через X и У. Обозна-
чим через р(х) и q(y) распределение вероятностей на
пространствах X и У.
Пусть f(x, у) —вещественная функция, определенная
для любых X и у С У. В этом случае говорят, что
функция f(x, у} задана на прямом произведении мно-
жеств XXУ. Математическое ожидание этой функции
будет зависеть от характера распределений вероятнос-
тей р(х) и q(y), так что можно записать:
Mlf(x,y)]=-n^) = f(p,q). (4-68)
Для определения f(p, q) зададимся каким-либо оп-
ределенным Y. При заданном у функция f (х, у) бу-
дет функцией только от х, и ее математическое ожида-
137
ние, которое будет зависеть только от р(х), может быть
обозначено fP(y) и найдется по формуле (4-63)
мх If (х, у)\ = fp (y) = ^f (х, у) р (х). (4-69)
X
Величина fP(y) от х уже не зависит, а зависит толь-
ко от у. Усреднение этой величины по у и дает f(p, q) :
f (р, q) = Му [fp (z/)| = V fp (у) q(y) = ^ f(x, y)p(x)q(y). (4-70)
У x,y
д) Условное математическое ожидание
Пусть Z — пространство исходов эксперимента, а
f(z)—некоторая числовая функция, заданная на мно-
жестве Z, математическое ожидание которой определя-
ется выражением (4-63).
Предположим теперь, что произошло событие SCZ.
Теперь уже распределение вероятностей p(z) заменяет-
ся на условное распределение вероятностей p(z\S).
Если в формулу для математического ожидания подста-
вить вместо p(z) величину р(z|S), то получим условное
математическое ожидание функции f(z):
M(f\S) = ^f(z)p(z\S) =
2^7.
У, Нг)р(г)
г £ 3
У Р(г)
г£3
(4-71)
е) Свойства математического ожидания
1. Математическое ожидание неслучайной величины
равно самой величине.
Пусть с — неслучайная, т. е. постоянная, величина.
При этом с можно рассматривать как результат экспе-
римента, при котором пространство исходов Z состоит
только из одного элемента с, так что р(с) =1. По форму-
ле (4-60) находим:
М(с) = ср(с) = с. (4-72)
138
2. Постоянный множитель можно выносить за знак
математического ожидания
Л4 (cz) = czp (г) = с V zp (г) = сМ (г). (4-73)
?£Z
3. Математическое ожидание суммы случайных ве-
личин равно сумме их математических ожиданий.
Пусть х и у — случайные величины, имеющие прост-
ранства исходов эксперимента X и Y и распределения
вероятностей на этих пространствах р(х) и q(y). Обо-
значим /(х, у)=х-\-у. По формуле (4-70) находим:
х+у = ^(х + y)p(x)q(у) = 2хр(х) У q (г/)+
х,у X у
w = 2+2yq (уУ>==х+у< ^4'74>>
у х х у
4. Математическое ожидание центрированной слу-
чайной величины равно нулю.
Пусть х — случайная величина и v — ее математиче-
ское ожидание. Случайная величина z=z—v называет-
ся центрированной случайной величиной. Для центриро-
ванной случайной величины имеем:
М (?) = М (z — v) = М (z) — v = 0, (4-75)
ж) Моменты. Дисперсия. Среднеквадратическое
отклонение
Важнейшими числовыми характеристиками случай-
ной величины являются ее моменты, которые делятся на
начальные и центральные.
Начальный момент порядка s случайной величины z
определяется по формуле
а,(г)=У^р(г) (4-76)
г
для дискретной случайной величины и
4-00
ocs (г) = J zs w (г) dz
—оо
(4-77)
для непрерывной случайной величины.
139
Нетрудно видеть, что математическое ожидание
M(z)=z, обозначаемое далее через v или vz, представ-
ляет собой начальный момент первою порядка ai(z).
Начальный момент второго порядка представляет собой
среднее значение квадрата случайной величины
а2 (г) = г2 р (г) = М (г2) = г2. (4-78)
Если в качестве случайной величины используется
о
центрированная случайная величина z=z—v, то фор-
мулы (4-76) и-(4-77) дадут выражения для центральных
моментов порядка $, обозначаемых ps(z). Как видно из
соотношения (4-75), центральный момент первого по-
рядка равен нулю.
Важнейшей числовой характеристикой случайной ве-
личины служит центральный момент второго порядка,
называемый дисперсией случайной величины z и обозна-
чаемый D(z) или Dz. Формулы для определения диспер-
сии имеют вид:
E>(z)-= р2(г) = V(z —vj2p(z) (4-79)
2
для дискретной случайной величины и
4-00
£> (г) р2 (г) = J (г — vz)2 w (г) dz « (4-80)
—оо
для непрерывной случайной величины. Дисперсия харак-
теризует отклонения отдельных значений случайной ве-
личины от математического ожидания,, т. е. является ха-
рактеристикой рассеивания случайной величины. Чем
меньше дисперсия, тем более тесно концентрируются
отдельные значения случайной величины вблизи матема-
тического ожидания.
Дисперсия оказывается в ряде случаев неудобной
для практического использования, так как имеет размер-
ность квадрата случайной величины. Поэтому в качест-
ве характеристики рассеивания случайной величины
часто используется корень квадратный из дисперсии,
получивший название среднеквадратического отклоне-
ния и обозначаемый о или о2:
(4-81)
Отметим основные свойства дисперсии:
140
1) дисперсия неслучайной величины равна нулю:
D(c) = M [(с — с)2] = М (0) = 0; (4-82)
2) неслучайную величину можно выносить за знак
дисперсии, возводя ее в квадрат',
D (сг) = М [(cz — cv)2] = с2 D (г). (4-83)
Некоторые другие свойства дисперсии будут рассмот-
рены позднее.
з) Регрессия и корреляция
В тех случаях, когда приходится иметь дело с не-
сколькими случайными величинами, например с двумя,
Рис. 4-5^ Линия ре-
грессии г/(х).
среднее значение и дисперсия могут характеризовать
каждую из этих величин в отдель-
ности. Однако в подобных случаях
очень важно знать влияние одной
величины на другую, т. е. учитывать
характер взаимосвязи между слу-
чайными-величинами. Регрессия и
корреляция как раз и служат для
количественного выражения этой
взаимосвязи.
Пусть х и у — две случайные ве-
личины, подобные тем, что рассмат-
ривались в § 4-2. Для конкретности будем предполагать,
чтох представляет собой высоту, а у — диаметр деревьев
на участке леса. Каждому дереву будет соответствовать
точка*на плоскости (х, у), а полная совокупность де-
ревьев изобразится множеством точек, показанных на
рис. 4-5. В рассматриваемом случае величины vx=x и
Vv — y дают математические ожидания высоты и диамет-
ра деревьев, а ох и оу харктеризуют рассеивание высоты
и диаметра относительно математических ожиданий.
Наряду с рассмотрением средней высоты и среднего
диаметра значительный интерес представляет изучение
изменения диаметра в зависимости от высоты дерева.
Однако для деревьев, имеющих одну и ту же высоту х,
Диаметр у является случайной величиной. Поэтому мож-
но говорить лишь о зависимости среднего значениямиа-
метра у от высоты х, т. е. определять величину у(х),
являющуюся условным математическим ожиданием
М(//|х). Используя (4-71) и обозначая через р(х, у)
111
совместную вероятность данных значений х и у, нахо-
дим:
«/)
у (х)=М (у I х) = 4--------. (4-84)
%р(х, у)
(/
Определяя у(х) при различных х, можем построить
линию, графически выражающую эту зависимость, как
показано на рис. 4-5, и называемую линией регрессии у
по х. Аналогично может быть получена зависимость
х(у) =М(х|у), называемая регрессией х по у.
Мы ограничимся рассмотрением регрессии для наи-
более простого и наиболее часто встречающегося на
практике случая линейной регрессии, когда линия ре-
грессии представляет собой прямую линию, уравнение
которой может быть записано в виде
у (%) = а + b (х — х). (4-85)
Коэффициенты а и Ь выберем так, чтобы получить
наибольшую концентрацию точек (х, у) вблизи прямой
j/(x), что может быть выражено условием
ф(а, Ь) = М {[г/— у (х)]2} = min. (4-86)
Условие (4-86) с учетом (4-85) дает следующую сис-
тему уравнений для определения а и Ь:
у — а = 0\
М{у(х-х)] — Ьо2х = 0.
(4-87)
Назовем ковариацией между хну величину
= с°У(х,у) = М[(у—у)(у — х)]. (4-88)
Легко видеть, что может быть представлена как
М[у (х — х) — у(х — х)] = Л4 [г/(х — х)1 —
— уМ(х — х) = М[у(х — х)1. (4-89)
Учитывая (4-89), из (4-87) находим значения а и Ь,
определяющие линию регресии:
а = У', Ь = (4-90)
142
Ковариация может служить мерой взаимной свя-
зи между случайными величинами х и у. Однако посколь-
ку мы ограничились рассмотрением случая, когда линия
регрессии представляет собой прямую, то и ковариация
будет характеризовать не всякую взаимную связь, а
только линейную связь, т. е. стремление одной случайной
величины возрастать или убывать в среднем по линей-
ному закону при возрастании или убывании другой
случайной величины. Для более на-
глядного представления зависимости
ковариации от характера связи ме-
жду случайными величинами полез-
но рассмотреть крайние случаи.
1. Цхг/ = 0. Это означает, что Ь —
= 0, у=а и линия регрессии гори-
зонтальна, как показано на рис. 4-6.
Как видим, в экспериментальных
точках значения у группируются во-
круг значения а независимо от зна-
чения х. Следовательно, в данном
о ° ° ° о о О 0 0//^; о О о 0
о 0 о о о о о
х
Рис. 4-6. Линия ре-
грессии для незави-
симых случайных ве-
личин.
случае у и х являются независимыми величинами.
2. Связь между х и у будет наиболее тесной, если
эти величины связаны линейной функциональной зави-
симостью. При этом все экспериментальные точки будут
лежать на линии регрессии, так что г/=г/(х). Заменяя
у{х) на у, уравнение регрессии перепишем в виде
У~У = ^(х~х). (4-91)
Найдем для этого случая дисперсию
^ = М[(у-у?]- (4-92)
°'х
откуда
Изд = Wy (4’93>
Таким образом, в зависимости от степени связи меж-
ду величинами х и у ковариация может меняться от
0 ДО ОхОу.
Оценивать тесноту связи между случайными величи-
нами х и у с помощью ковариации рху несколько не-
удобно, так как Цху зависит от дисперсий самих случай-
143
ных величин. Более удобным оказывается использование
с этой целью коэффициента корреляции
который может меняться в пределах от нуля для неза-
висимых случайных величин до единицы, если случай-
ные величины связаны линейной функциональной зави-
симостью.
Использование понятия ковариации позволяет полу-
чить простые соотношения для математического ожида-
ния произведения и дисперсии суммы двух случайных
величин. Предлагаем читателю самому проверить, что
для этих случаев имеют место соотношения
ху = ху + рху-, (4-95)
D (х + у) = D (х) + D (у) + 2рху. (4-96)
Когда случайные величины х и у независимы, то
ху = ~ху, (4-97)
D(x + y) = D(x) + D(y). (4-98)
4-5. ДИСКРЕТНЫЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ
а) Понятие о дискретных случайных процессах
Предположим, что некоторая система, находящаяся
под влиянием совокупности внешних условий, может ме-
нять случайным образом свое состояние в дискретные
моменты времени, условно обозначаемые 0, 1..., интер-
валы между которыми называются шагами. При этом в
результате n-го шага система примет состояние хп, ко-
торое мы можем рассматривать как исход некоторого
эксперимента и которое, следовательно, будет элемен-
том множества допустимых для этого шага исходов:
~~ ГО’ ••• ’ ^Ln\ •
Множество Zo считаем состоящим всего из одного
элемента представляющего собой начальное состоя-
ние системы. Последовательность принимаемых систе-
мой состояний х0, Xt... называется случайным процес-
сом [7],
141
Случайный процесс будет задан, если на каждом
шаге задано распределение вероятностей на пространст-
ве исходов, определяющее состояния, в которые может
перейти система в результате следующего шага. Это рас-
пределение вероятностей в общем случае зависит от со-
стояний, принимаемых на всех предыдущих шагах, и
для любого п определяется набором условных вероятно-
стей
Р(*я+1 = г*+,Цо...хп), 6 = 0,1,.,,,Ln, (4-99)
причем
L (4’100)
Случайный процесс будет продолжаться до бесконеч-
ности, если искусственно не оборвать его на каком-либо
шаге. Практически нам всегда приходится обрывать
процесс после определенного конечного числа шагов,
т. е. иметь дело с так называемыми конечными или мно-
гошаговыми процессами. Однако бесконечные процессы
являются полезными аппроксимациями более реальных
конечных процессов, тем более, что они зачастую оказы-
ваются проще с аналитической точки зрения.
Случайный процесс, в который мы не можем вмеши-
ваться, а значит, и влиять на распределение вероятно-
стей (4-99), называется неуправляемым.
В зависимости от вида распределения вероятностей
(4-99) случайные процессы делятся на ряд типов, наибо-
лее распространенными из которых являются процессы с
независимыми значениями, называемые также «белым
шумом», процессы независимых испытаний и марковские
цепи.
Конечный случайный процесс называется процессом
с независимыми значениями, если распределение вероят-
ностей на пространстве исходов при каждом шаге не за-
висит от результатов предыдущих шагов:
р(х«=2А|хо.--хп-1) = Р(х«==г2)- (4-101)
Это распределение вероятностей удобно обозначить
просто через Pn(z), где z£Zn, n=0, 1...
Важное свойство процесса с независимыми значения-
ми заключается в том, что любая последовательность
состояний *о, может рассматриваться как сово-
10-142
145
купность независимых исходов эксперимента. Следова-
тельно, вероятность появления такой последовательно-
сти будет равна произведению вероятностей исходов,
входящих в эту последовательность, что может быть за-
писано в виде
p(x0,xlt ..., хп) = р0(х0)рМ...рп(хп), (4-102)
xt £Zif i = 0, 1,, п.
Важным частным случаем процессов с независимы-
ми значениями являются процессы независимых испыта-
ний. Процесс независимых испытаний есть процесс с
независимыми значениями, у которого пространство исхо-
дов эксперимента Z={z0, 2i,...,2l} и распределение ве-
роятностей на этом пространстве одно и то же на каж-
дом шаге, т. е.
Pn(2) = Pm(2) = p(z) (4-103)
при любом z£Z и любых тип. Другими словами, про-
цесс независимых испытаний представляет собой много-
кратное повторение одного и того же эксперимента в
одних и тех же условиях.
Как и в случае процессов с независимыми значения-
ми, вероятность получения конкретной последовательно-
сти исходов эксперимента х0, Xj,..., хп в процессе незави-
симых испытаний равна произведению вероятностей от-
дельных исходов.
Случайный процесс называется марковской цепью,
если пространство состояний Z={z0, Zi,...,Zl} является
одним и тем же для каждого шага, а распределение ве-
роятностей исходов на каждом шаге зависит только от
исходов предшествующего шага, так что
р {Хп+1 = 2 | л'о- ••• - Хп) = Р (Хп+1 = (4’104)
Удобно ввести обозначения для вероятностей вида
(4-104). Предположим, что на n-м шаге система находи-:
лась в состоянии Zi £ Z. Тогда распределение вероятно-
стей (4-104) определит вероятность того, что на (п+1)-м
шаге система окажется в состоянии Zj^Z. В общем слу-
чае эта вероятность зависит от номера шага и может
быть обозначена через рг) (п). Таким образом, вероятно-
сти
Р,/^)-=Р(Хп+1 = г1\Хп = г1)< (4’105)
146
удовлетворяющие условиям
Pti (п) > о, 2 Ра (я) = 1, (4-106)
/=о
являются вероятностями перехода на n-м шаге из состо-
яния Zi в состояние
В том случае, когда вероятности перехода Pij(n) за-
висят от номера шага п, марковская цепь называется
нестационарной. Однако в различных приложениях иг-
рают большую роль марковские цепи, в которых вероят-
ности перехода остаются одними и теми же для любого
шага и могут быть обозначены просто через рц.
б) Процесс независимых испытаний с двумя исходами.
Биномиальное распределение вероятностей
Рассмотрим более подробно случай, когда в процессе
независимых испытаний нас интересуют только два ис-
хода каждого эксперимента, а именно, произойдет в ре-
зультате этого эксперимента некоторое событие S или
нс произойдет. Один исход будем называть успехом экс-
перимента, другой — неудачей.
Обозначим через р вероятность успеха в одном от-
дельном эксперименте, а через q=\—p — вероятность
неудачи. Зададимся вопросом, какова вероятность ш(г,
п, р) того, что при и экспериментах будет иметь место
г успехов.
Для удобства обозначим успех эксперимента через 1,
а неудачу через 0. При этом наступлению г успехов при
п экспериментах будет соответствовать последователь-
ность п исходов, состоящая из г единиц и п—г нулей.
Так как результаты отдельных успехов независимы, то
вероятность этой последовательности, равная произведе-
нию вероятностей отдельных исходов, определится вы-
ражением
pr qn~\ (4-107)
Общее число различных последовательностей из п
элементов, содержащих г единиц, равно числу сочетаний
из п элементов по г, т. е.
и!
г! (п — г)!
(4-108)
10
147
Так как все эти последовательности несовместимы
(если появилась одна из них, то появление любой дру-
гой уже исключено), то вероятность появления какой-
либо одной из них
ш(г,п,р)=^)рг «у'1-'". (4-109)
Легко проверить, что при этом суммарная вероят-
ность наступления любого числа событий от 0 до п рав-
на единице.
w(r, ю,
<7
0,300
0,260
о,гоз
0,107
0,080
I O,0Z7 0,001 0,000
J 0,006 0,000 0,000 г
0123556789 10
Рис. 4-7. Биномиальное распределение.
Распределение вероятностей, определяемое форму-
лой (4-Ю9), называется биномиальным распределени-
ем. Для наглядного представления характера биноми-
ального распределения на рис. 4-7 приведен график
зависимости ординат этого распределения от числа г
для п=10 и р = ’/5, т. е. график распределения w (г, 10,
*/5).
Очень часто бывает необходимо определить значение
г, при котором биномиальное распределение достигает
максимума. Вычислим предварительно отношение двух
соседних ординат биномиального распределения
m(r, П, р) _ (г) дП~Г _ (П-Г+1)Р । । Q)
w(r-\,n, р) (дj рГ_] 9„_г+1
Это отношение будет не меньше единицы, если
^(п+1)р. Следовательно, функция w(r, п, р) дости-
гает максимума при
г — ent(n + 1)р, (4-111)
где через entx обозначена целая часть числа х.
148
Числовыми характеристиками биномиального распре-
деления служат математическое ожидание и дисперсия,
определяемые соотношениями:
vr = пр-, о2 = прд, (4-112)
в) Распределение Пуассона
Значения w (г, п, р) очень плохо поддаются вычисле-
нию при больших п. Однако существуют приближенные
методы, которые значительно облегчают вычисление
этих вероятностей. Одним из таких методов является
замена биномиального распределения на распределение
Пуассона.
Пусть w(r, п, р) — биномиальное распределение.
Легко убедиться; что предел этого распределения при
п->-оо и р-+0 при условии np=a=const, так что р=а/п,
равен:
\imw(r,n,a/ri) = ае~- . (4-113)
г!
Распределение вида (4-113) обозначается через
а) и называется распределением Пуассона. Таким
образом,
w(r, а) = а . (4-114)
Характерной особенностью распределения Пуассона
является то, что математическое ожидание и дисперсия
лого распределения одинаковы и равны а.
Распределение Пуассона является хорошим прибли-
жением к биномиальному распределению при малых р.
Так, при р^0,01 можно заменить вычисление биноми-
ального распределения вычислением распределения Пу-
ассона, начиная с п= 10.
Хотя мы пришли к распределению Пуассона как
к предельному случаю биномиального распределения,
однако оно является распределением самостоятельного
класса случайных процессов, называемого классом ред-
ких случайных явлений.
Рассмотрим последовательность событий S, следую-
щих друг за другом через случайные промежутки време-
пп. Число таких событий, происходящих на интервале
149
длительностью т, будет случайной величиной с матема-
тическим ожиданием Хт, где X—среднее число событий
за единицу времени. Поставим задачу определить веро-
ятность того, что на интервале т произойдет ровно г со-
бытий.
События 3 будем считать редкими в том смысле, что
интервал т можно разбить на малые интервалы длитель-
ностью Дт, в каждом из которых может произойти не
более одного события 3. Общее число таких интервалов
равно п = т/Дт, а вероятность того, что событие произой-
дет в одном из интервалов Дт, равна p—kvln, так что
пр=кх. Поскольку можно считать, что событие 3 в
каждом из интервалов Дт происходит независимо от то-
го, произошло оно или нет в других интервалах, то мы
приходим к процессу независимых испытаний с распре-
делением вероятностей w(r, п, р), где пр—кг.
Однако предположение, что на интервале Дт может
произойти не более одного события 3, будет оправдано
только в том случае, если длительность этого интервала
очень мала, т. е. в пределе при Дт->0. Так как при этом
п->оо и р->0, причем np=2iT=const, то процесс редких
явлений подчиняется закону Пуассона с распределением
вероятностей
и>(г,Хт) = -(>Л)Г e~U. (4-115)
г\
г) Экспоненциальное распределение. Понятие о
надежности
Во многих задачах представляет интерес распределе-
ние вероятности для интервалов времени между случай-
ными событиями в процессе независимых испытаний. Из
формулы (4-115) при г = 0 и г=1 получаем:
е~*л—вероятность того, что на интервале длитель-
ность т не произойдет ни одного события;
лт£~Лт—вероятность того, что на интервале длитель-
ностью т произойдет ровно одно событие.
Вероятность того, что на интервале длительностью
т произойдет более одного события, равна:
1 — 4- Хте~Лт) = 1 — /[ 1—Хт + ----] —
' ||. 2! ]
— Хт 11—Хт + ----|| = 4---- (4-116)
L 2! 1) 2
150
Как видим, эта вероятность пропорциональна вели-
чине (Хт)2, что означает, что при малых Хт мы можем
пренебречь вероятностью наступления на интервале т
двух и более событий. При этом вероятность наступле-
ния на интервале т одного события будет равна:
F(X,r) = 1 — е~Кг, т> 0.
(4-Н7)
По существу выражение (4-117) определяет вероят-
ность того, что время, за которое произойдет одно собы-
тие, не превысит т. Плотность распределения для этой
вероятности, представляющую собой вероятность того,
что событие произойдет в момент т, получим, продиффе-
ренцировав (4-117) пот:
w (X, т) = ке~'л, т > 0. (4-118)
Зная плотность распределения для т, легко опреде-
лить среднее время, за которое не происходит ни одного
события:
сю
Тср = j (^Т)ЙТ = -у-,
о
(4-119)
Формулы (4-117) и (4-118) определяют экспоненци-
альное распределение, играющее важную роль в теории
надежности.
Предположим, что некоторое устройство состоит из
большого числа отдельных элементов, каждый из кото-
рых может с течением времени выйти из строя. Выход
элемента из строя называется отказом элемента. В боль-
шинстве случаев отказы отдельных элементов происхо-
дят независимо друг от друга, и их последовательность
можно’рассматривать как процесс независимых собы-
тий, в котором X определяет число отказов в единицу
времени и называется интенсивностью отказов, а вели-
чина 1Д согласно (4-119) определяет среднее время
безотказной работы.
Для характеристики надежности аппаратуры обычно
используют величину Л(т), называемую опасностью от-
каза и выражающую плотность распределения вероят-
ности отказа в момент т при условии, что до этого мо-
мента отказы не происходили.
Определим предварительно величину й(т)Ат, даю-
щую вероятность того, что отказ произойдет в интерва-
151
сивности отказов.
Рис. 4-8. Типичный вид
распределения времени
до отказа.
ле Лт при условии, что перед этим отказов не было в те-
чение времени т. По формуле условной вероятности
h (Т) Дт = w (х’ т) Дт-, (4-120)
к ’ 1 —F (к, т)
откуда находим
1гМ= . .(4-121)
Для экспоненциального распределения имеем:
/г(т) = = (4-122)
е-Хт
т. е. функция опасности есть постоянная, равная интен-
Опыт эксплуатации радиоэлек-
тронной аппаратуры показывает,
что график функции /г (т) имеет
вид кривой, изображенной на
рис. 4-8. Начальный участок этой ‘
кривой характеризуется повы-
шенной интенсивностью отказов,
объясняемой наличием в отдель-
ных элементах скрытых дефектов,
которые выявляются в началь-
ный период работы. При больших
т интенсивность отказов тоже
возрастает, что связано со старением элементов, выра-
жающимся в ухудшении свойств элементов после дли-
тельной эксплуатации. Постоянная интенсивность от-
казов, а значит, и экспоненциальное распределение
имеют место лишь на среднем участке графика /г(т).
Однако от повышенной интенсивности отказов в на-
чальный период можно избавиться, подвергая аппарату-
ру предварительной тренировке перед началом эксплуа-
тации. С другой стороны, непрерывное возрастание тре-
бований к качеству аппаратуры, являющееся следствием
технического прогресса, приводит к тому, что качество
аппаратуры со временем перестает удовлетворять новым
повышенным требованиям. Происходит моральный износ
аппаратуры, который обычно наступает раньше, чем на-
ступает заметное старение отдельных элементов. Это
дает основания во многих случаях считать зависимость
Л(т) постоянной и равной X на всем периоде эксплуата-
ции аппаратуры, т. е. пользоваться при оценке надеж-
ности экспоненциальным законом распределения.
152
д) Марковские цепи
Пусть Z = {zj, —пространство исходов экспе-
римента или пространство состояний некоторой системы,
одинаковое для каждого шага случайного процесса.
В таких случаях удобно обозначать состояния системы
просто индексами при z, понимая под / состояние zj^Z.
При этом пространство состояний будет изображаться
множеством индексов J— {1, L}.
Обозначим через лп = (л^,...»распределение ве-
роятностей на множестве J для n-го шага. При этом л^
определяет вероятность того, что на n-м шаге система
окажется в состоянии /. Как уже указывалось, случай-
ный процесс является однородной марковской цепью,
если вероятности перехода системы рц из состояния i в
состояние / зависят только от состояния i на предыду-
щем шаге и одинаковы для любого шага.
Вероятности перехода можно представить двумя раз-
личными способами. Первый способ состоит в записи
вероятностей перехода в виде таблицы, называемой
матрицей переходов и обозначаемой через Р? Для L = 3
матрица имеет вид:
Р =
Р11 Р12 Р13 Р21 Р22 Р23
_Р31 Р32 РЗЗ
(4-123)
Условие (4-106), которому обязательно должны
удовлетворять вероятности переходов, означает, что
сумма" элементов любой строки в матрице переходов
обязательно должна быть равна единице.
Второй способ представления вероятностей перехода
состоит в построении диаграммы перехода, пример кото-
рой для системы с тремя состояниями приведен на рис.
4-9, а. Диаграмма переходов представляет собой граф,
вершины которого соответствуют состояниям системы, а
направленные дуги указывают возможные переходы от
одного состояния к другому. Вероятности переходов от-
мечаются числами, приписываемыми каждой дуге. В со-
ответствии с условием (4-106) сумма вероятностей для
дуг, выходящих из любой вершины графа, должна рав-
няться единице.
К марковским цепям могут быть сведены многие про-
цессы в различных областях науки и техники. В социо-
153
логии марковские цепи помогают изучать проблемы из-
менения социальной или профессиональной структуры
населения, проблемы миграции населения и т. п. В био-
логии с помощью марковских цепей изучается характер
развития отдельных видов животных и растений. В фи-
зике марковские цепи применяются для изучения диф-
Рис. 4-9. Диаграммы переходов для марковской цепи.
фузии газов. В технике с помощью марковских цепей
описываются некоторые процессы передачи сообщений,
ряд технологических процессов, процессы контроля ра-
ботоспособности и поиска неисправностей в сложных
технических системах и т. п.
Пример 4-7. Завод выпускает телевизоры определенной марки.
В зависимости от того, находит ли данный тип телевизора спрос у
населения, завод может в конце каждого года находиться в двух
состояниях: 1—спрос есть, 2—спроса нет. С течением времени
спрос изменяется, так что имеется вероятность 4/б, что к концу года
завод останется в состоянии 1. С другой стороны, если завод ока-
зался в состоянии 2, то принимаются меры к изменению и улучше-
нию выпускаемой модели, так что с вероятностью 3/5 к концу сле-
дующего года завод перейдет в состояние 1.
В данном примере развитие производства представляется мар-
ковской цепью с матрицей переходов
р [4/5 1/51
“ L3/5 2/5]’
Диаграмма переходов приведена на рис. 4-9, б.
При изучении марковских цепей прежде всего необ-
ходимо выяснить, как будет изменяться распределение
вероятностей состояний лп, когда система делает один
шаг.' Обозначим через Т событие, состоящее в том, что
на (м4-1)“м шаге система окажется в состоянии /.
154
В соответствии с принятыми обозначениями вероят-
ность этого события будет равна Р(Т) =л^1. Обозна-
чим через событие, состоящее в том, что на n-м шаге
система находится в состоянии i, так что P(Si) =л(п‘).
При этом рц будет представлять собой вероятность того,
что система на (и-|-1)-м шаге окажется в состоянии /,
если на n-м шаге она была в состоянии i, т. е. рг} =
=p(T\Si). По формуле полной вероятности (4-41) на-
ходим:
«а “ix p,ri='..............L- <4-'24)
i=l
Формула (4-124) позволяет последовательно шаг за
шагом определять изменение распределения вероятнос-
тей системы, если известно начальное распределение ве-
роятностей.
Пример 4-8. Пусть завод из примера 4-7 в начальный момент
времени находится в состоянии 1, т. е. начальное распределение
вероятностей имеет вид л0=(1, 0). Используя формулу (4-124) и
матрицу переходов, для первого шага находим:
р +^2> р = 1 • +0- у- = 0,8;
Л<2> = р12 + л<2> р22 = 1. -L +о. JL = 0,2.
Для второго шага
пр =0,76; яр =0,24.
Продолжая эти вычисления, получаем последовательное изме-
нение распределения вероятностей, даваемое табл. 4-1 при началь-
ном состоянии (1, 0). Из этой таблицы видно, что при возрастании п
значение приближается к 0,75, а к 0,25.
Таблица 4-1
Изменение распределения вероятностей состояний
марковского процесса
п Начальное состояние ло=(1,0)
01 1 2 3 4 5 . . .
л(1> “п, 1 0,8 0,76 0,752 0,7504 0,75008 . . .
Л 0 0,2 0,24 0,248 0,2496 0,24992 . . .
155
Продолжение табл. 4-1
п Начальное состояние л0 = (0,1)
0 1 2 3 1 1 5 . . .
л(1) 0 0,6 0,72 0,744 0,7488 0,74976 . . .
л(2) п 1 0,4 0,28 0,256 0,2512 0,25024 . . .
В этой же таблице приведено распределение вероятностей на
последовательных шагах при начальном состоянии ло=(О, 1). В этом
случае при возрастании п значения и приближаются к тем
же значениям 0,75 и 0,25, что и при начальном распределении л0=
= (1, 0). Как видим, в данной марковской цепи после большого чис-
ла шагов вероятности переходов становятся независимыми от на-
чального состояния системы.
Если в марковской цепи существует предельное рас-
пределение вероятностей, соответствующее п->оо и не
зависящее от начального состояния системы, то это рас-
пределение вероятностей определяет предельный или
установившийся режим системы. В этом случае система
называется статически устойчивой, а марковский про-
цесс в такой системе — эргодическим.
Обозначим через л=(л(1\..,,ль) установившееся
распределение вероятностей эргодической марковской
цепи. Компоненты этого распределения можно найти
из уравнений (4-124), которые при п->оо принимают
вид:
L
„(7) = 2 те<0 Pj> ,L. (4-125)
Z=1
Однако не все L уравнений (4-125) являются линей-
но независимыми, так как вероятности связаны ме-
жду собой соотношением
L
J^n(/) = 1, (4-126)
/=1
поэтому для определения L неизвестных компонент
распределения вероятностей л достаточно взять любые
L—1 уравнение (4-125) и решать их совместно с урав-
нением (4-126).
156
Пример 4-9. Для матрицы переходов в примере 4-7 первое из
уравнений (4-125) имеет вид:
л/1) = рп + л/2) р21 = л(<2).
Уравнение (4-126) дает:
л/1) + л/2) = 1.
Решая совместно эти уравнения, находим:
д(1)==0,75; л(2) =0,25.
Переход эргодического марковского процесса от на-
чального состояния к установившемуся режиму называ-
ется переходным процессом. Переходный процесс опи-
сывается последовательностью распределений вероятно-
стей пп для п = 1, 2,... и при заданном начальном рас-
пределении вероятностей ло может быть получен путем
последовательного применения формулы (4-124), как
это было сделано в примере 4-8. Однако можно посту-
пить иначе.
Введем в рассмотрение величины р^}, определяющие
вероятность перехода системы из состояния i в состоя-
ние j за I шагов:
P<P = p(xn+z = /|xn = i), п = 0, 1... (4-127)
Вероятности pltl дают возможность определить рас-
пределение вероятностей щ по распределению по по
формуле, аналогичной (4-124):
я(/)=2^р(р,/=1,„„£. (4-128)
1=1
Для установления связи вероятностей перехода р(У
с вероятностями рц положим /=/1+/2 и будем рассмат-
ривать переход системы из состояния ло в состояние л/
в два этапа: переход из состояния ло в состояние л/о а
затем переход из состояния л/j в состояние л/=л/1+/а.
При этом
л{0 = л<*> р$\ (4-129)
/?=1
где
пл)==2 р** (4-130)
i=i
157
Подставляя значение л* в (4-129), получаем:
2 < = 2 2 (4’131)
*=1 1=1 1=1 k=l
Сравнивая (4-131) с (4-128), находим:
= (4-132)
k=l
Для последовательного вычисления вероятностей пе-
рехода р2.... удобно в (4-132) положить Ц — 1—1,
/2=1. При этом получаем:
р,|?-’2',»“Х- (4'133)
k=l
Полагая последовательно / = 1, 2... и учитывая, что
по определению вероятностей перехода ptj
(4-|34)
получаем:
Р^ = Рц> Pn=^PikPki- (4-135)
k=\
Выражение (4-133) может быть обобщено на случай
неоднородной марковской цепи, в которой вероятности
перехода зависят от номера шага. В этом случае под ве-
роятностью рц(п, Mi) при m<Mi будем понимать вероят-
ность того, что на шаге Mi система окажется в состоянии
/, если па шаге м она находилась в состоянии I:
Рц (/г> п1) = р К = /1ХП = »)’ п<п1* (4-136)
При этом по аналогии с (4-128) имеем:
2 Пп} Pii (п> ni)> п < п1' (4-137)
1=1
С другой стороны, рассматривая некоторое м', удов-
летворяющее условию м<м'<П1, можем л^у) предста-
вить в виде
п«? = 2 ры (п’’ "Лга*)2 р* (п> п'} =
Л=1 k=l t=l
158
L L
= ^%Р1к (n,n'}pki (n',nxy
(=1 A=1
Сравнивая (4-137) c (4-138), находим
L
Pii (П> «1) = 2 (П’ П"> Pki "О
k=l
при любых ncn'cni. Соотношение (4-139)
ся уравнением Чэпмена—Колмогорова.
(4-138)
(4-139)
называет-
4-6. ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
а) Предмет математической статистики
Развитие науки и техники требует все более и более
глубокого проникновения в сущность явлений природы.
Однако сами явления природы предстают перед нами в
виде огромного количества разнообразных фактов и на-
блюдений, которые в свою очередь являются результа-
том действия множества факторов, часть из которых
лежит в основе рассматриваемого явления, а другие яв-
ляются второстепенными, несущественными и зачастую
просто затемняют сущность явления. Нужны большие
знания и умение для того, чтобы исключить всю второ-
степенную информацию и выявить основные и сущест-
венные сведения, содержащиеся в наблюдениях.
Методы математической статистики дают возмож-
ность представить множество результатов наблюдения в
компактном, удобном для обозрения виде. Они позволя-
ют выделить существенную информацию из множества
наблюдений, представив ее в виде небольшого числа
сводных показателей. Если оказывается, что имеющихся
данных недостаточно для понимания сути явления и
требуется проведение добавочного эксперимента, то ме-
тоды математической статистики позволяют ответить на
вопрос, как такой эксперимент поставить, чтобы в мак-
симальной степени облегчить работу исследователя как
по постановке эксперимента, так и по последующей об-
работке экспериментальных данных.
Из сказанного следует, что математическая статисти-
ка представляет собой науку о методах обработки боль-
шого количества экспериментальных данных с целью по-
лучения из них правильных выводов.
159
В данном разделе невозможно охватить все задачи,
решаемые методами математической статистики, кото-
рым посвящен ряд учебников и монографий [25—28].
Поэтому мы ограничимся рассмотрением лишь наиболее
распространенных методов решения статистических за-
дач. Развитие некоторых из этих методов, проведенное
с позиций теории принятия решений, будет дано в гл. 9.
б) Понятие случайной выборки
Пусть х— одномерная случайная величина с функ-
цией распределения вероятностей /*’(%). Рассмотрим-
n-мерную случайную величину
(х(1), ... , ?п)), (4-140)
отдельные компоненты которой являются независимыми
случайными величинами с,одинаковыми функциями рас-
пределения вероятностей F(x). Функция распределения
вероятностей такой многомерной величины определится
как произведение функций распределения вероятностей
ее компонент
п
П (4-141)
/=1
Случайные величины х<г> удобно рассматривать как
результаты некоторого эксперимента. При этом много-
мерная случайная величина (4-140) может рассматри-
ваться или как результат последовательного проведения
п независимых экспериментов на одной и той же экспе-
риментальной установке или как результат проведения
п одновременных экспериментов на п однотипных экспе-
риментальных установках.
Поскольку всегда имеется возможность, хотя бы тео-
ретическая, проводить неограниченное число экспери-
ментов, то можно говорить о бесконечном наборе слу-
чайных чисел с функцией распределения вероятно-
стей F(x). Такой бесконечный набор называется беско-
нечной совокупностью с функцией распределения веро-
ятностей F(x).
Каждый конкретный результат эксперимента, а сле-
довательно, каждое из конечного выбора (4-140) мо-
жет рассматриваться как выбор одного из чисел беско-
160
нечной совокупности. Весь набор (4-140) представляет
собой последовательность п таких выборов и называет-
ся случайной выборкой.
в) Предельные теоремы теории вероятностей
В математической статистике большой интерес пред-
ставляет изучение изменения свойств случайной выбор-
ки при увеличении ее объема и, в частности, предельные
соотношения, которые получаются при п->оо. При этом
фундаментальную роль играют неравенство Чебышева и
вытекающие из него закон больших чисел и центральная
предельная теорема.
Если х— случайная величина с математическим ожи-
данием v и дисперсией о2ъ то справедливо следующее
неравенство, называемое неравенством Чебышева:
Р(|х —v|>Xo)<l/X2. (4-142)
Чтобы доказать это неравенство, разобьем вещест-
венную ось на три интервала:
I = (—оо, v — Хо]; Г = (v — Хо, v + Хо);
Г == [v + Хо, +оо).
Дисперсию величины х можно записать в виде
4-00
о2 = J (х — v)2 w (х) dx = J (х — v)2 w (х) X
—оо I
X dx + J (х — v)2 w(x)dx + [ (х — v)2 w(x) dx.
г r
Отбрасывая в выражении для о2 слагаемое, соответ-
ствующее интервалу получаем:
;>|(х— v)2w(x)dx + [ (х — vfw^xjdx.
1
Поскольку в интервале I х——Ко, а в интервале
Г' х—v^Xo, неравенство только усилится, если в обоих
интегралах заменить (х—v)2 на Х2о2. Таким образом,
о2 X2 о2 [Р (х v — Хо) -J- Р (х v + Хо)1 =
= X2 о2 Р (| х — v | >- Хо),
что эквивалентно неравенству (4-142).
11—142
161
Неравенство (4-142) определяет вероятность того,
что значение х—v выйдет за пределы интервала (—
-гло). Однако можно определить вероятность того, что
значение х—v не выйдет за пределы указанного интер-
вала. Эта вероятность
Р (| х — v | < Хо) = 1 — /’(lx — v|> Хо);
с учетом неравенства (4-142)
Р(|х — v|<Xct)>1 — 1/Х2. (4-143)
Если обозначить 2,ст через 8, то это неравенство при-
мет вид:
Р(|х —v|<e)>l—ст2/е2, (4-144)
Обратимся к рассмотрению случайной выборки (хь
.... х„) объема п. Обозначим через х среднее арифмети-
ческое этой выборки, равное
п
(4’145)
1=1
С целью упрощения подобного рода записей будем
использовать далее символ S или Sn для обозначения
суммирования по всем выборочным данным. При этом
соотношение (4-145) запишется в виде
x = -Ls(x) = ^l> (4.146)
п п
Дисперсия величины х согласно (4-83) и (4-98) бу-
дет равна:
= S[Z)(x)] = — . (4-147)
[ n J n? n
Заменяя* в (4-144) x на x и соответственно о2 на
о2/м, получаем:
/’(I——v|<e)>l----------(4-148)
t I п I J 7?82
где v — математическое ожидание х, являющееся сред-
ним значением для бесконечной совокупности, из кото-
рой взята выборка.
Из выражения (4-148) видно, что при м->оо и при
любом 8>0
(14-149)
162
что и выражает собой закон больших чисел. Из этого
закона следует, что при больших п с вероятностью,
сколь угодно близкой к единице, среднеарифметическое
совпадает с математическим ожиданием v = M(x) вели-
чины х.
Приведем без доказательства одно из важнейших
предельных соотношений теории вероятностей, получив-
шего название центральная предельная теорема. Пусть
(х'1, ..., хп) последовательность случайных величин, име-
ющих в общем случае различные функции распределе-
ния вероятностей F\(x), ..., Fn(x), математические ожи-
дания vi, vn и дисперсии aj, ..., о£. Обозначим:
х= — S(x); v = — S(v); s2 = — S (о2). (4-150)
fl п п
Центральная предельная теорема утверждает, что
если случайные величины хь ..., хп являются независи-
мыми и имеют конечные дисперсии одного порядка, то
при большом числе слагаемых закон распределения
среднего арифметического х приближается к нормаль-
ному с математическим ожиданием v и дисперсией s2/zz.
Замечая, что в этом случае величина
t _ х — V
(4-151)
будет иметь нулевое математическое ожидание и еди-
ничную дисперсию, на основании центральной предель-
ной теоремы можно утверждать, что при я->оо будет
выполняться соотношение
иг
du.
(4-152)
С задачами, когда исследуемая случайная величина
является суммой большого числа независимых случай-
ных величин, приходится сталкиваться весьма часто.
Например, ошибка сложного прибора является резуль-
татом суммарного действия разнообразных внешних ус-
ловий и ошибок в отдельных элементах этого прибора.
При этом большие по своему влиянию ошибки легко ис-
ключаются. Так, если в электрической схеме произошел
обрыв, то его легко обнаружить и устранить. Однако
причины малых по значению ошибок обнаружить труд-
11*
163
но. Следовательно, отдельные слагаемые суммарной
ошибки можно считать равномерно малыми и на осно-
вании центральной предельной теоремы утверждать, что
суммарная ошибка будет иметь распределение, близкое
к нормальному.
г) Задачи математической статистики
Основной задачей математической статистики явля-
ется определение неизвестных параметров распределе-
ния бесконечной совокупности по известной конечной
выборке. При этом речь может идти или об определе-
нии самой функции распределения F(x), или отдельных
параметров функции распределения, таких как матема-
тическое ожидание, дисперсия, наименьшее или наиболь-
шее значение случайной величины и т. п.
Поскольку элементы конечной выборки являются
случайными величинами, то случайным будет и значение
параметра, определенное с помощью этой выборки.
В частности, если мы имеем несколько выборок одного
и того же объема из одной и той же бесконечной сово-
купности, то каждая из них даст свое значение интере-
сующего нас параметра. Поэтому по конечной выборке
мы не можем точно судить о значении параметра, а мо-
жем лишь более или менее точно оценить этот параметр.
Численные значения отдельных параметров, определен-
ные из конечной выборки, называются оценками пара-
метров бесконечной совокупности.
В общем случае из одной и той же выборки можно
получить различные оценки. Пусть, например, имеется
выборка {*ь х2, ..., хп}f причем xi^x2^...^xn, и мы хо-
тим найти оценку математического ожидания. Можно
рассмотреть несколько различных оценок:
среднее среди всех наблюдений, называемое медиа-
ной:
Л/Н-1
при п нечетном;
л
X —
(4-153).
полусумма наименьшего и наибольшего значений
— 1
X = — (Х1 + *п);
(4-154)
164
среднее арифметическое из всех наблюдений
А П
(4-155)
1=1
Какая же из этих оценок является наиболее предпоч-
тительной? На этот вопрос можно ответить, если ввести
некоторые критерии, которым должна удовлетворять
оценка. Рассмотрим важнейшие из критериев.
1. Несмещенность. Оценка не должна содержать си-
стематической ошибки, преувеличивающей или пре-
уменьшающей значение параметра для всех выборок.
Это означает, что математическое ожидание оценки
должно совпадать с действительным значением пара-
метра. Если действительное значение параметра обозна-
Л
чить через а, а его оценку через а, то требование несме-
щенности запишется в виде
М (а) = а. (4-156)
2. Состоятельность. Оценка а должна приближаться
к значению параметра а по мере увеличения объема вы-
л
борки.- Ввиду того что оценка а является случайной ве-
личиной, об этом приближении можно говорить лишь в
Л
вероятностном смысле. Так, если обозначить через ап
оценку а, полученную при выборке объема и, то для со-
стоятельной оценки должно выполняться соотношение
р[ |ап — а| <е]-> 1 (4-157)
при п->оо и любом 6>0.
3. Эффективность. Из всех несмещенных и состоя-
тельных оценок следует предпочесть такую, которая
оказывается наиболее близкой к оцениваемому парамет-
ру, т. е. при которой большие отклонения при использо-
вании различных выборок встречались бы как можно
реже. Оценки, удовлетворяющие этому требованию, на-
зываются эффективными. Математически требование
эффективности означает требование минимальной дис-
персии оценки
£>(a) = min. (4-158)
165
д) Несмещенные оценки математического ожидания
и дисперсии
Пусть (xi, хп)—выборка из совокупности с ма-
тематическим ожиданием v и дисперсией о2. Обозначим
через х оценку для математического ожидания, а через
s2 оценку для дисперсии.
За оценку величины v обычно берут среднеарифме-
тическое значение выборки
п
— \\ = —3(х), (4-159)
/i п
1=1
называемое выборочным средним. Как следует из зако-
на больших чисел, такая оценка является состоятельной,
т. е. приближается к v при п->оо. _
Поскольку выборочное среднее х представляет собой
сумму случайных величин, то оно само будет случайной
величиной. Поэтому можно говорить о законе распреде-
ления выборочного среднего, его математическом ожи-
дании и дисперсии.
Математическое ожидание выборочного среднего,
равно:
М(х) = — 44[S(x)l = — S[M(x)l = v. (4-160)
п tl
Как видим, математическое ожидание выборочного
среднего совпадает со значением v, что говорит о несме-
щенности оценки (4-159). Дисперсия выборочного сред-
него согласно (4-147) равна о2/п.
Если выборка взята из совокупности с нормальным
распределением, то х как сумма нормально распреде-
ленных случайных величин будет иметь нормальное
распределение, которое с учетом (4-160) и (4-147) бу-
дет иметь вид: _
= N (v, о2/п), (4-161)
Во многих случаях вместо х бывает удобно рассмат-
ривать величину
= (4-162)
а/ у п у о2/п
имеющую нулевое математическое ожидание и единич-
ную дисперсию, плотность распределения вероятности
для которой будет равна N (0, 1).
166
Если выборка была взята из совокупности, имеющей
распределение, отличное от нормального, то закон рас-
пределения выборочного среднего также будет отличать-
ся от нормального, однако на основании центральной
предельной теоремы можно считать, что при больших
объемах выборки этот закон будет близок к закону
N (v, о2/п).
Для нахождения несмещенной оценки дисперсии s2
найдем математическое ожидание величины S(x—х)2.
Записывая эту величину в виде
S (х — х)2 = S [(х — v) — (х — v)]2 =
= S (х — v)2 — 2 (х — v) S (х — v) + п (х — v)2
и беря математическое ожидание от каждого слагае-
мого, получаем:
М [s(x — х)2] = (п — 1)о2 (4-163)
или
Л1 = а2. (4-164)
Из (4-164) следует, что несмещенной оценкой дис-
персии может служить оценка вида
s2 =—— S(x — х)2. (4-165)
Для определения закона распределения оценки дис-
персии рассмотрим предварительно один важный закон
распределения. Если yi — независимые случайные вели-
чины, подчиняющиеся нормальному распределению Af(O,
1), то случайная величина
п
f = ^y2i (4-166)
подчиняется распределению %2 (хи-квадрат) с п степе-
нями свободы. При этом число степеней свободы опре-
деляется числом независимых случайных величин в сум-
ме (4-166). Для распределения %2 составлены подроб-
ные таблицы, в которых приводятся для различных п
значения вероятности р(х2>хр, где у2—какое-либо
положительное число.
167
Примером такой таблицы является табл. 4-2, в кото-
рой приведены значения х,, удовлетворяющие условию
р(Х2>Хр =0.95 для п от 1 до 30. Более подробные таб-
лицы х£ распределения можно найти в [26].
Таблица 4-2
Значения верхнего 95-процентного предела х^ Для х2’РаспРеДеления
в зависимости от числа степеней свободы п
п 1 1 2 1 3 1 4 5 1 6 1 7 8 9 10
0,004 | 0,1031 0,352 | 0,71 1,14 | 1.631 2,17 2,73 3,32 3,94
Продолжение
п 1" 12 13 14 | 15 1 16 171 18 19 I 20
^q 1 4,6 1 5,2 5,9 | 6,6 1 7.3 | 8,0 8.7 | 9,4 ю,1 | 10,9
П родолжение
п 1 21 22 1 23 1 1 24 | 25 26 27 28 29 | 30
%q 111,6 12,3 | 13,1 |13,8| 14,6 15,4 | 16,2 16,9 17,7 | 18,5
Нетрудно видеть, что если под yi понимать величину
(Xi—х)/о, удовлетворяющую наложенным на yt услови-
ям, то величина
(и — 1) S2
о2
(4-167)
будет определять закон распределения для s2.
е) Нахождение оценок по методу максимального
правдоподобия
Многие задачи математической статистики сводятся
к тому, чтобы оценить некоторый параметр а в распре-
делении, вид которого известен. По принципу макси-
мального правдоподобия за оценку параметра а прини-
мается такое значение, которое представляется наибо-
лее вероятным на основании опытных данных.
Пусть мы имеем выборку (хь ..., хп) из совокупно-
сти с плотностью распределения вероятностей w(x, а),
168
зависящей от параметра а. Многомерная плотность рас-
пределения вероятностей для этой выборки
L = w а) (4-168)
называется функцией правдоподобия. Согласно принци-
пу максимального правдоподобия за оценку парамет-
ра а принимается значение а, при котором функция
правдоподобия L или, что то же самое, логарифм этой
функции InL достигает максимума. Значение а можно
найти из уравнения правдоподобия
dlnL __ а) = Q (4-169)
да да ’ '
/=1
которое легко приводится к виду
1 dw(xj, а) g
а) да
(4-170)-
Для случая, когда выборка взята из совокупности с
нормальным распределением AZ(v, о2), определяемым
(4-53), уравнения правдоподобия для определения па-
раметров v и о имеют вид:
(4-171)
—v) = °;
1=1
t=l
Из первого уравнения находим оценку для vi
v = = (4'172)
(=1
которая совпадает с полученной ранее несмещенной и
состоятельной оценкой (4-159). Второе уравнение прав-
доподобия с учетом (4-172) дает оценку для о2!
п
s2=-^^^-x)2, (4-173)
169
которая, однако, не является несмещенной. Поэтому на
практике пользуются обычно несмещенной оценкой
(4-165).
Получение максимально правдоподобной оценки
для экспоненциального распределения рассмотрим на
примере.
Пример 4-10. Для определения среднего срока службы выпус-
каемой заводом аппаратуры было испытано п образцов аппаратуры
в течение t часов. За время испытания т образцов проработали без
отказов в течение всего времени /, а п—т образцов отказали в мо-
менты ть Tn-m. Какова наиболее правдоподобная оценка средне-
го времени безотказной работы?
Предполагая, что время, за которое происходит отказ аппарату-
ры, подчиняется экспоненциальному закону (4-118), так что величи-
на w(X, т)=Ле“^т представляет собой вероятность выхода аппара-
туры в момент т, а величина — вероятность исправной работы
в течение времени t, получаем функцию правдоподобия в виде
п—т
L = (e~Kt Г П ИХ, tt). (4-174)
t=l
Уравнение (4-169) при этом дает:
п—т
~т/ + ^(т~т0 = ()’ (4175)
1=1
откуда
п—tn
mt + V т.
Тер = — =.... ‘°' . (4-176)
Л п — т
Аналогичным образом можно показать, что наиболее правдопо-
добная оценка вероятности события для процесса независимых испы-
таний при биномиальном распределении
л
p — xjn, (4-177)
где п — число испытаний;’ х — число успехов.
Если случайный процесс подчиняется распределению Пуассона и
в выборке за п интервалов содержится г событий, то наиболее прав-
доподобной оценкой среднего числа событий в одном интервале слу-
жит величина
л
a — r/ti' (4178)
170
ж) Оценка параметров по методу доверительных
интервалов
В предыдущих разделах были рассмотрены методы,
дающие оценку параметра в виде некоторого числа, т. е.
некоторой точки вещественной оси. Такие оценки полу-
чили название точечных. Поскольку выборка является
случайной, то во многих случаях, особенно при малых
объемах выборки, такая оценка может оказаться весьма
далекой от действительного значения параметра.
Значительно большую информацию может дать ука-
зание интервала, в котором с вероятностью, близкой к
единице, находится значение оцениваемого параметра.
Так, если значение у близко к единице, то интервал (сц,
(12), в котором с вероятностью у находится значение не-
известного параметра а
Р (ах < а < а2) = у, (4-179)
называется ЮОу-процентным доверительным интерва-
лом. На практике часто ограничиваются рассмотрением
95%-ного доверительного интервала, полагая у = 0,95.
Если найдена точечная оценка параметра а и известна
плотность распределения вероятностей для этой оценки,
то границы доверительного интервала получаются из со-
отношения
Р2 М\ Л
J w(а) d а = у. (4-180)
В ряде случаев вместо нахождения двустороннего
доверительного интервала (сц, аг) требуется найти толь-
ко нижнюю а^ или только верхнюю а'2 границу для рас-
сматриваемого параметра а. Интервалы, определяемые
соотношением
Р (а > ой) = у и Р (а < аг) = у, (4-181)
называются односторонними 100 у-процентными довери-
тельными интервалами. Границы и а'2 этих интерва-
лов определяются из выражений
I
"г00 / д \ д 2 / Л \ Д
Сица)(/а = уи ^w\a)da==yt (4-182)
171
Предположим, что выборка объема п взята из сово-
купности с нормальным распределением N{y, о2) с не-
известным v и известной дисперсией о2, так что t =
- |/7гг(х—v)/o будет иметь распределение N (0, 1). Вве-
дем также обозначение у=1—q. В этом случае 100(1 —
q)-процентный доверительный интервал определится
соотношением
Р tq < <+/gj = 1-^ (4-183)
или
P(x — te-^<v<x + ta-^-\ = \—q. (4-184)
Vn Vn )
Учитывая соотношение (4-57), это выражение можно
записать в виде
1-? = Ф(/9)-Ф(-и = 2Ф(/д), (4-185)
что приводит к следующему соотношению для определе-
ния tq:
Ф(и = у(1-<7). (4-186)
Для односторонних доверительных интервалов (/',
+<х>) и (—оо, /') соотношение (4-185) запишется в виде
1 ~ <7 = Ф (Q - Ф(-оо) = ± + ф (Q. (4-187)
Для определения граничных значений односторонних
доверительных интервалов при этом получается соотно-
шение
ф^) = Т(1~2<7)- (4‘188)
Как видим, граничные значения 100(1—(?)-процент-
ного одностороннего доверительного интервала равны
граничным значениям 100(1—2 (?)-процентного двусто-
роннего доверительного интервала.
Полагая (/=0,05 и воспользовавшись таблицами ин-
теграла вероятностей, из соотношений (4-186) и (4-188)
находим следующие границы двусторонних и односто-
ронних доверительных интервалов:
tq.= 1,96; 1,64. (4-189)
172
Таким образом, вычисленное по выборке объема п
из совокупности с нормальным распределением и изве-
стной дисперсией а2 выборочное среднее х дает возмож-
ность с вероятностью 0,95 утверждать, что математиче-
ское ожидание совокупности будет лежать в интервале
х— 1,96-4 < V <х+ 1,96-4» (4-190)
ИЛИ что
v>x—1,64-4, (4-191)
И п
или ЧТО
v<x+1,64-4- (4-192)
Уп
Полученные значения tq могут быть использованы и
для нахождения доверительных интервалов при биноми-
альном распределении w (х, и, р), поскольку биномиаль-
ное распределение при больших п приближается к нор-
мальному с математическим ожиданием v=np и диспер-
сией o2 = npq. Полагая /= (х—np)l V~npq, приходим к
выводу, что если при п независимых испытаниях собы-
тие S произошло х раз, то с вероятностью 0,95 можно
утверждать, лто математическое ожидание пр будет ле-
жать в следующих пределах:
х — X^V^npq < [пр<_х + 1,96 У npq, (4-193)
или что пр> X — 1,64)/npq, (4-194)
или что пр < X + \fi4ynpq. (4-195)
причем значение \r npq подсчитывается по наиболее
А
правдоподобному значению р = р = х!п как
<4-,96>
Пример 4-11. Из выпускаемой заводом продукции было случай-
ным образом отобрано и испытано 100 изделий, среди которых 37
оказались второго сорта. Что можно сказать о проценте изделий,
ьыпускаемых вторым сортом?
173
В данном случае /г=100, х = 37, npq = 4,84. При этом
1,96 yrnpq = 9,5, так что
х — 1,96 Vnpq = 27,5, х + 1,96 npq — 46,5.
Таким образом, имеется 5 шансов из 100, что мы ошибемся, де-
лая одно из следующих утверждений относительно количества изде-
лий, выпускаемых вторым сортом:
1) оно заключено между 27,5 и 46,5% общего количества из-
делий;
2) оно составляет не менее 29% общего количества изделий;
3) оно составляет не более 45% общего количества изделий.
Доверительные интервалы весьма часто приходится
использовать для определения оценки v при нормальном
распределении, когда дисперсия а2 неизвестна. В этом
случае вместо о2 приходится использовать оценку дис-
персии s2. Однако при этом величина
U — у)
V s2/n
(4-197)
в отличие от (4-162) уже не будет распределена по нор-
мальному закону. В действительности величина /, опре-
деляемая (4-197), будет подчиняться закону распреде-
ления Стьюдента, которому можно дать следующее оп-
ределение.
Пусть и— случайная величина, имеющая нормаль-
ное распределение N (0, 1), и v — случайная величина,
имеющая ^-распределение. Если и и v независимы,
то случайная величина
t = (4-198)
v/k V v
определяет распределение Стьюдента, в котором вели-
чина k называется числом степеней свободы.
Если теперь определить величины
(п — 1) S2
V = -----------
о2
(4-199)
то они согласно (4-162) и (4-167) будут удовлетворять
условиям, определяющим распределение Стьюдента,
а значение t, определяемое согласно (4-198), совпадает
с значением, даваемым (4-197) при k=n—1. Таким об-
разом, случайная’ величина /, определяемая соотноше-
нием (4-197), будет распределена по закону Стьюдента
с k=n—1 степенями свободы.
174
Обозначим через tqk границы двустороннего 100(1 —
—q)-процентного доверительного интервала для распре-
деления Стьюдента с k степенями свободы. Имеются
подробные таблицы (например, [26]) для определения
tqk при различных q для k от 1 до 30. При &>30 значе-
ния tqk практически совпадают с значениями tq, полу-
чаемыми для нормального распределения. Примером та-
кой таблицы является табл. 4-3, дающая значения tqk
для <7=0,05 и 0,1.
Таблица 4-3
Значения границ 100 (1— ^-процентного доверительного интервала
в зависимости от числа степеней свободы k для распределения
Стьюдента
Q k
1 2 3 4 5 6 ? 1 1 8 9 до 12
0,05 12,71 4,30 3,18 2,78 2,57 2,45 2,36 2,31 2,62 2,23 2,18
0,10 6,31 2,92 2,35 2,13 2,01 1,94 1,89 1,86 1,83 1,81 1,78
Продолжение
<7 k
14 16 1 I8 20 22 24 26 | 28 | 30 оо
0,05 2,15 2,12 2,10 2,09 2,07 2,06 2,06’ 2,05 2,04 1,96
0,10 1,76 1,75 1,73 1,72 1,72 1,71 1,71 1,70 1,70 1 ,64
Границы односторонних доверительных интервалов
t'qk могут быть найдены по значениям tqk из соотно-
шения
tqk = tlqk. (4-200)
Пример 4-12. Для уменьшения влияния помех в канале связи
каждый результат измерения некоторого параметра v передается с
борта ракеты на наземную измерительную станцию трижды. Резуль-
таты измерений равны %i=3,2; %2 = 2,9; %з = 3,1. Определить двусто-
ронний 95-процентный доверительный интервал для параметра v,
считая искажения в каждом передаваемом значении независимыми
друг от друга и распределенными по нормальному закону.
175
По измеренным данным находим:
n = 3; х = — S(x) =3,067;
п
$?= —S(x — х)2 = 0,0234.
п — 1
По табл. 4-3 для #=0,05 и k = n~ 1=2 получаем: /дл = 4,30, так
что Us//n=0,377.
Следовательно, с вероятностью 0,95 имеем 2,69 <v< 3,44.
з) Проверка статистических гипотез. Понятие о критерии
согласия
Пусть Z — пространство исходов эксперимента с
элементами z£Z. Для определения вероятности p(z) не-
которого исхода z мы проводим п экспериментов. Если
при этом исход z произошел пг раз, то вероятность этого
исхода мы оцениваем по отношению п2/п. Однако в дей-
ствительности отношение nz/n дает нам не вероятность
p(z) исхода 2, а его частоту <?(г), которая может значи-
тельно отличаться от вероятности, особенно при не очень
большом числе экспериментов. Возникает вопрос, на-
сколько мы можем судить о распределении вероятностей
исходов p(z)t если нам известны частоты этих исходов
q(г). Однако такая постановка задачи является не сов-
сем корректной.
Действительно, если в результате эксперимента по-
лучен ряд чисел, выражающих частоты отдельных исхо-
дов эксперимента ^(г), то для того, чтобы заменить их
на другие числа [вероятности р (г)], нужны какие-то ос-
нования. Что же может явиться основанием для замены
одних чисел другими?
Пусть при 10-кратном бросании монеты герб выпал
7 раз. Частота выпадения герба в данном эксперименте
равна 0,7. Есть ли у нас основания заменить это зна-
чение и принять за вероятность выпадения герба некото-
рое другое число?
Если мы ничего не знаем о монете, в частности, не
знаем, симметрична она или нет, то у нас нет и основа-
ний изменить полученное из эксперимента значение час-
тоты. Однако задачу можно поставить иначе. Мы знаем,
что если монета симметрична, то вероятность выпадения
герба равна 0,5. Мы хотим проверить, симметрична ли
монета, и с этой целью бросаем ее 10 раз. При этом герб
176
выпадает 7 раз. Спрашивается, есть ли у нас основания
утверждать, что монета симметрична?
Сформулированная таким образом задача носит на-
звание задачи на проверку гипотезы. Подобные задачи
возникают, когда имеются основания построить некото-
рую гипотезу (например, монета симметрична) о харак-
тере распределения или значении параметров распреде-
ления случайной величины. Целью эксперимента являет-
ся подтверждение или опровержение выдвинутой
гипотезы. Методы статической проверки гипотез позво-
ляют ответить на вопросы:
1) обладает ли новый образец прибора лучшими ка-
чествами по сравнению с существующими?
2) будет ли система обладать надежностью не ниже
заданной?
3) будет ли новый способ лечения эффективнее су-
ществующих? и т. п.
Для того чтобы иметь основания принять или отверг-
нуть рассматриваемую гипотезу, необходимо выработать
некоторый критерий, который называется критерием со-
гласия проверяемой гипотезы с результатами экспери-
мента.
Предположим, что на основании каких-либо сообра-
жений мы считаем, что значение некоторого параметра
а равно ао, и хотим проверить это на основании экспе-
римента. В результате эксперимента находим оценку
л
этого параметра а, которая, являясь случайной величи-
ной, вообще говоря, не совпадает с значением ао. Одна-
Л л
ко отклонение Да=а—ао оценки а от истинного значе-
ния ао не должно быть велико и, следовательно, если
это отклонение оказалось большим, то его нельзя объяс-
нить случайными причинами и следует считать, что ги-
потеза о том, что значение параметра равно ао, не под-
тверждается и должна быть отклонена. Таким образом,
выбор критерия согласия — это задание критического
значения отклонения ДаКр, выбранного так, чтобы веро-
ятность превышения этого значения была очень малой.
За критическое отклонение могут быть приняты грани-
цы 100(1—q) -процентного доверительного интервала.
При этом имеется вероятность q того, что наблюдаемое
отклонение превысит критическое, а значит, будет не-
обоснованно отклонена правильная гипотеза. Величину
12 -142
177
q, называемую уровнем статистической значимости, сле-
дует выбирать в зависимости от тех последствий, к ко-
торым может привести отклонение правильной гипотезы.
Практически в большинстве случаев считается возмож-
ным брать <7=0,05, принимая тем самым за критерий со-
гласия 95-проЦентный доверительный интервал. Однако
в тех случаях, когда последствия некорректного откло-
нения гипотезы могут быть тяжелыми, принимается q=
=0,01, а иногда и меньше.
Следует отметить, что хотя данный метод позволяет
с большой уверенностью отклонять ложные гипотезы, он
не может служить доказательством справедливости ги-
потезы. Поэтому при попадании гипотетического значе-
ния осо в пределы доверительного интервала мы прини-
маем гипотезу не как истинную, а как согласующуюся с
результатами эксперимента. Для суждения об истинно-
сти гипотезы необходимо проводить специальные иссле-
дования.
и) Оценка влияния некоторого фактора на характер
случайной величины
Весьма часто встречается задача, в которой требует-
ся ответить на вопрос: влияет или не влияет некоторый
фактор А на характер случайной величины у. К такому
типу задач относятся задачи по оценке эффективности
нового способа лечения, влияния нового способа обра-
ботки почвы на урожай, уменьшения процента брака при
изменении в технологии и т. п.
Для ответа на поставленный вопрос проводят п экс-
периментов, в каждом из которых определяют значения
у. и у", при отсутствии и при наличии действия факто-
ра Л, а также разность Хг=у. — у..
Предположим, что случайная величина у имеет нор-
мальное распределение N(y, о2) с известной дисперси-
ей о2 и мы ожидаем, что действие фактора А сводится
только к изменению математического ожидания v. Если
действие фактора А несущественно, то математические
ожидания случайных величин у' и у" будут одинаковы и
величина х=у'—у" будет иметь нормальное распреде-
ление ЛДО, о2) с нулевым математическим ожиданием и
дисперсией о2=2о2. Таким образом, ответ на поставлен-
ный вопрос сводится к проверке гипотезы о том, что ма-
178
тематическое ожидание величины х=у'—у” равно нулю.
В результате п экспериментов находится выбороч-
ное среднее
X = J- s (х) = -- s (у' - у"), (4-201)
п п
которое при справедливости сформулированной гипоте-
зы будет иметь нормальное распределение с нулевым
математическим ожиданием и дисперсией о^/я. Исполь-
зуя 95-процентный доверительный интервал, можем
утверждать, что гипотеза о несущественности влияния
фактора А не противоречит экспериментальным данным,
если выполняется соотношение
| х | < 1,96 (У2х/п или | х: Vа2/п | < 1,96. (4-202)
Однако во многих случаях дисперсия о2 бывает не-
известна. При этом дисперсию в2 приходится заменять
на ее оценку s2, вычисленную на основе тех же экспери-
ментальных данных по формуле (4-165).
Как мы видели, величина х: sxln является слу-
чайной величиной, подчиняющейся распределению
Стьюдента с п—1 степенью свободы. Поэтому гипотеза
о несущественности влияния фактора А принимается в
том случае, если выполняется соотношение
|х : /s£/n| <tq, (4-203)
где tq — граница 95-процентного доверительного интер-
вала распределения Стьюдента с п—1 степенью свобо-
ды, определяемая по табл. 4-3.
к) Проверка гипотезы о дисперсиях. Понятие о
^-распределении
Весьма часто приходится сталкиваться с задачей
проверки равенства дисперсий в двух независимых вы-
борках %1,..., хП1 и у\, ...,уп2, выборочные дисперсии ко-
торых s2 и $2 определяются по соотношению (4-165) со
степенями свободы k\—n\—1 и k2=ri2—1. Для проверки
того, взяты эти выборки из одной и той же совокупности
с дисперсией а2 или из разных совокупностей с диспер-
сиями о2 и а2, необходимо проверить гипотезу о равен-
стве дисперсий о! и о2.
12*
179
Проверка гипотезы о равенстве дисперсий произво-
дится с помощью F-критерия, для чего вычисляется от-
ношение
F = s№, (4-204)
в котором предполагается, что и принимается
гипотеза о том, что выборки взяты из различных сово-
купностей, если значения величины F превосходят неко-
торое критическое значение Fq, При этом критическим
значением Fq при данных степенях свободы k\ и k2 будет
такое, что P(F>Fq) =7/100. Как видим, значения FtJ
являются верхним ^-процентным пределом F-распреде-
ления. В [26] приведены подробные таблицы F-pacnpe-
деления для 7=5% и 7=1% при степенях свободы k\ от
1 до 500 и k2 от 1 до 1000.
4-7. РЕГРЕССИОННЫЙ АНАЛИЗ И ПЛАНИРОВАНИЕ
ЭКСПЕРИМЕНТА
а) Задача регрессионного анализа
Важное практическое значение имеет следующая за-
дача. Имеется k переменных хь...,хл и зависящая от них
величина у. Сами переменные, вообще говоря, могут и
не быть случайными и мы можем при желании задавать
их значения по своему усмотрению. Однако на величину
у влияют и другие, не поддающиеся точному контролю и
наблюдению факторы, благодаря чему величина у носит
случайный характер. Нас интересуют методы экспери-
ментального определения влияния переменных
на величину у [30].
Пример 4-13. Задачи подобного типа обычно связаны с анализом
условий протекания производственных и технологических процессов.
Примером может служить процесс получения аммиака путем выде-
ления его из отходящих газов при коксовании угля [31]. Отходящие
газы, содержащие азот N2. водород Нг и углекислый газ СОг, дол-
жны быть очищены от углекислого газа. Затем получение аммиака
происходит по схеме:
3H2 + N2 = 2NH3.
Процесс очистки газа происходит путем пропускания отходя-
щих газов через слой движущейся воды, поглощающей СОг. Под ве-
личиной у будем понимать качество очистки, характеризующееся
процентным содержанием СОг в очищенном газе. На качество очист-
ки влияет прежде всего температура отходящих газов и расход во-
ды, которые можно принять за переменные Х\ и х2. Однако на каче-
ство очистки оказывает влияние и множество случайных факторов,
180
начиная с качества угля и кончая температурой окружающего воз-
духа.
Будем считать величины Xi,..., х&, которые принято
называть факторами, входными величинами некоторого
технологического процесса, а величину у будем рассмат-
ривать как выходную величину (результат) технологи-
ческого процесса, что схематически может быть изобра-
жено структурной схемой на рис. 4-10.
Рис. 4-10. Структурная схема
технологического процесса.
^7
Входы
Техноло-
ги.чески.й
процесс
Выход
У
Величина у будет состоять из детерминированной со-
ставляющей f (xi,..., х/t), обусловленной влиянием и из-
менением факторов Xi,..., Хй, и составляющей обуслов-
ленной действием случайных факторов
«/ = /(*1..-U + S. (4-205)
Составляющую £ будем считать случайной величи-
ной, имеющей нормальное распределение с нулевым ма-
тематическим ожиданием. В этом случае детерминиро-
ванная составляющая f(xi,..., xk) будет представлять
собой условное математическое ожидание значения у
при данных значениях факторов xi, ..., Хл, т. е.
ZU1.....xh) = M(y]xt, ... ,xh) =
= y(xlt ... , хк) = у(х). (4-206)
Здесь х=(хь..., Xk) представляет собой вектор значе-
ний входных переменных, который может рассматривать-
ся как точка в А-мерном пространстве переменных хь...
..., х^ называемом далее факторным пространством.
Целью дальнейшего рассмотрения является опреде-
ление по данным эксперимента вида зависимости
(4-206), которая представляет собой некоторую поверх-
ность в факторном пространстве, называемую поверхно-
стью отклика.
Для дальнейшего анализа удобно функцию f(xj,...
...,х&) вблизи рабочей точки разложить в ряд Тейлора.
Ограничиваясь конечным числом членов разложения,
приходим к представлению функции отклика полиномом
181
конечном степени
k k k
) = Po + 2 P' xi + Z Ph x‘ + 2 ^xi x> + - <4'207)
1=1 1=1 /--1
i>y
Это выражение можно представить в более компакт-
ном виде, введя фиктивную переменную хо, которая всег-
да принимает значения Хо=1, и заменив произведение
двух п большего числа переменных на новые перемен-
ные по правилу
*1 = Х£-}-р Х:2 — Xk+V » Х1~ X2k>
Общее число переменных при этом будет равно k'=
= где k — первоначальное число переменных; d —
степень полинома, представляющего функцию z/(x).
С учетом вновь введенных обозначений уравнение по-
верхности отклика принимает вид:
*/(х) = Ро*о + Pi Х1 + •’» + fikXk +
+ P*+1 XA+1 + ... + pv xk, = 2 Pi Xt. (4-208)
1=0
В дальнейшем индекс (') будем опускать, считая,
что поверхность отклика задается уравнением вида
(4-208) с k переменными.
Уравнение вида (4-208) получило название уравнения
регрессии и входящие в него коэффициенты р, на-
зываются коэффициентами регрессии. Задача регресси-
онного анализа состоит в экспериментальном определе-
нии коэффициентов регрессии путем наблюдения за ха-
рактером изменения входных переменных Xi,..., Xk и вы-
ходной переменной у. Этой цели могут служить методы
пассивного или активного эксперимента.
Пассивный эксперимент основан на регистрации кон-
тролируемых параметров в процессе нормальной рабо-
ты объекта без внесения каких-либо преднамеренных
возмущений. Активный эксперимент основан на исполь-
зовании искусственных возмущений, вводимых в объект
по заранее спланированной программе. Каждый из этих
способов имеет свои достоинства и недостатки.
182
При активном эксперименте введение искусственных
возмущений позволяет целенаправленно и быстро вскры-
вать нужные зависимости между параметрами, нащупы-
вать области оптимального режима работы. Однако вве-
дение искусственных возмущений может привести к на-
рушению нормального хода технологического процесса.
При пассивном эксперименте вмешательства в ход
производственного процесса не происходит и экспери-
ментатор просто ожидает естественного проявления ин-
тересующих его закономерностей, что значительно удли-
няет время эксперимента. При этом математическое опи-
сание получается лишь для области, близкой к рабочей
точке объекта, которая может значительно отличаться
от оптимального режима.
При ограниченном числе экспериментов невозможно
осуществить точное определение коэффициентов регрес-
сии Pi и приходится ограничиваться определением оце-
нок $i = bi этих коэффициентов. При этом вместо (4-208)
получится уравнение регрессии вида
£ = (4-209)
1=0
определяющее не математическое ожидание у(х),
а оценку математического ожидания у(х).
б) Определение коэффициентов регрессии по данным
пассивного эксперимента
Уравнение (4-209) имеет &-Н неизвестный коэффи-.
циент регрессии. Для их определения проводится серия
экспериментов, в каждом из которых измеряются значе-
ния всех входных и выходных величин. Общее число экс-
периментов N должно быть не меньше числа неизвест-
ных коэффициентов регрессии.
Рассмотрим эксперимент с номером /. Обозначим че-
рез хц (i=0, k) и yi значения х, и у в этом эксперимен-
те. При этом измеренное значение yi будет отличаться от
значения
= (4-210)
183
найденного из соотношения (4-209) по данным экспери-
мента, на ошибку
д k __
^1 = У1 — У, = yi~^bix^l = I, N. (4-211)
4=0
Поскольку отдельные ошибки носят случайный ха-
рактер, то коэффициенты bi находят из условия, чтобы
сумма квадратов ошибок по всей совокупности экспери-
ментов была минимальна, т. е. из условия
/V N / k \2
-S=V8^y = min. (4-212)
JHM 4HM l ЛИИ /
/-=1 Z=1 \ 4-0 /
Такой подход к определению значений коэффициен-
тов регрессии получил название метода наименьших
квадратов.
Условие минимума величины S получим, приравни-
вая нулю частные производные от S по каждому из ко-
эффициентов регрессии
g =- 2 k - V bt хЛ х}1 =-- 0, j = ОД (4-213)
1 l~\ \ /
или
^ХцХц^^иУь i = k. (4-214)
4=0
Система уравнений (4-214) получила название си-
стемы нормальных уравнений. Она содержит &+1 урав-
нение, из которых можно определить &-}-1 неизвестный
коэффициент регрессии.
в) Решение системы нормальных уравнений в матричной
форме
Обозначим через В=(&0, Ьн)' вектор-столбец
неизвестных коэффициентов регрессии, а через Y=
= (# ., Ум)' вектор-столбец результатов измерений ве-
личины у. Здесь и далее штрихом обозначаётся операция
транспонирования вектора или матрицы.
184
Результаты наблюдений за переменными x\,...,xh за-
дадим в виде матрицы результатов эксперимента X:
*01 • •• хм
X =
(4-215)
Х0Х ••• XkN
Такой вид матрицы удобен для записи результатов
эксперимента, однако смысл индексов ее элементов (пер-
вый индекс — номер столбца, второй — номер строки)
отличается от общепринятого. Поэтому для элементов
матрицы X удобно ввести обозначение an=Xij, а сами
элементы рассматривать как элементы матрицы X',
получающейся путем транспонирования матрицы X..
Введем также в рассмотрение матрицу Z с элемента-
ми Zij, определяемыми суммами, стоящими в левых час-
тях уравнений (4-214):
л/ х ___
ги = 2 хн = 2 Xil ’Z Л = °- k- 0-216)
/=1 /=1
Составляя это выражение с выражением (3-50),
видим, что матрица Z определяется как произведение
матриц X' и X, т. е.
Z = X'X. (4-217)
С учетом вновь введенных обозначений система нор-
мальных уравнений (4-214) может быть записана в виде
k n ____
= j = k. (4-218)
4=0 /=1
Эта система уравнений эквивалентна одному матрич-
ному уравнению
ZB = X'Y. (4-219)
Вектор неизвестных коэффициентов регрессии В най-
дем, умножив обе части уравнения (4-219) на Z4. Учи-
тывая, что Z~1Z = I и 1В=В, получаем:
В = Z-1 х' Y (4-220)
или, принимая во внимание (4-217), имеем:
В = [х' х]-1 X Y. (4-221)
18(1
Все вычисления, связанные с преобразованием мат-
риц в соответствии с (4-221), проводятся на ЭВМ.
Поскольку определение оценок коэффициентов ре-
грессии Ьо, 61,..., bk производится по искаженным поме-
хами экспериментальным данным, то для получения
точных оценок число экспериментов W должно значи-
тельно превосходить число /?н-1 оцениваемых коэффици-
ентов регрессии. Разность между числом наблюдений
и числом неизвестных параметров, оцениваемых па ос-
новании этих наблюдений, называется числом степеней
свободы эксперимента. При регрессионном анализе это
число п'=N—(£-|-1).
Другим источником ошибок может явиться несоот-
ветствие между принятой степенью полинома d, описы-
вающего поверхность отклика, и действительным харак-
тером этой поверхности. В этом случае говорят о неадек-
ватности представления результатов эксперимента поли-
номом данной степени.
О правильности выбора степени полинома можно
судить на основании /’-критерия. Для этого определяют
сумму квадратов отклонений экспериментальных зна-
Л
чений уг отнайденных по уравнению регрессии (4-209) yv.
У\у,—
(4-222)
Разделив эту сумму на число степеней свободы эк-
сперимента n'=N—(£ + 1), определяют остаточную дис-
персию характеризующую рассеяние эксперимен-
тальных точек относительно найденного уравнения ре-
грессии,
4= (4-223)
Кроме того, вычисляют дисперсию s2y характеризую-
щую ошибку эксперимента
N
(4-224)
1=1
где у — выборочное среднее по всем результатам экспе-
римента, a N—1—число степеней свободы при опре-
делении дисперсии $2.
1ДО
Далее находят F-отношение:
r-i ‘2/2
F = SR I Sy
(4-225)
и проверяют гипотезу об адекватности представления ре-
зультатов полиномом заданной степени d путем сопо-
ставления вычисленного значения F со значением Fq,
найденным из таблиц F-распределения при заданных
степенях свободы п' и W—1.
г) Понятие о планировании эксперимента
Планирование эксперимента, ставящее своей целью
обеспечить наиболее эффективное исследование свойств
объекта управления, лежит в основе проведения актив-
ного эксперимента. Преимущества, которые может дать
планирование эксперимента, проиллюстрируем на про-
стом примере [32].
Пример 4-14. С помощью пружинных весов требуется определить
массу трех предметов А, В, С. Обозначим через X неизвестную мас-
су чашки весов.
Обычный способ, использующий четыре взвешивания — сначала
взвесить чашку, а затем по очереди каждый из предметов, пред-
ставлен в виде табл. 4-4, где знаками « + » и «—» обозначено нали-
чие или отсутствие соответствующего груза на весах. Подобную
таблицу будем называть матрицей планирования эксперимента.
Таблица 4-4
Обычный способ взвешивания трех предметов
№ взвеши- вания X А В С Результат взвешивания
1 + — — Уо
2 + ‘ + — — U1
3 + + — У2
4 + — — + Уз
При данном способе взвешивания масса каждого предмета опре-
деляется по двум взвешиваниям: взвешивание груза вместе с чашкой
и взвешивание чашки. Так, масса предмета А равна Ра—У\—Уо.
Обозначим через о2 дисперсию ошибки одного взвешивания. Тогда
дисперсия ошибки в определении массы РА о^ = сг^ + сг^ = 2сг2.
Другой способ определения массы тех же предметов с помощью
четырех взвешиваний представлен матрицей планирования в виде
табл. 4-5. Здесь в первых трех опытах последовательно взвешива-
187
Таблица 4-5
Усовершенствованный способ взвешивания
№ взвеши- вания X А в с Результат взвешивания
1 + —. . + yt
2 + + — — У2
3 + — + — Уз
4 + + + + У*
ются предметы А, В, С, в последнем опыте все три предмета взвеши-
ваются вместе. Легко видеть, что масса, например, предмета А бу-
дет определяться как
РА = У <^2 Л-У1-У1- Уз)
с дисперсией ошибки
2 1
сп = — 4о2 = о-.
А 4
Как видим, при втором способе взвешивания дисперсия ошибки
в 2 раза меньше, чем при первом, т. е. второй план эксперимента
лучше, чем первый. Объясняется это тем, что в первом способе мас-
са предмета,определяется только по двум опытам, а во втором — по
всем четырем, что обеспечивает лучшую компенсацию ошибок от-
дельных взвешиваний.
Возникает вопрос: каким же образом находить наибо-
лее эффективный план эксперимента? Ответ на этот во-
прос дает теория планирования эксперимента [33]. В ча-
стности, в регрессионном анализе эффективными метода-
ми являются полный факторный эксперимент и дробные
реплики от него.
д) Полный факторный эксперимент
Допустим, что мы имеем дело с двумя независимыми
входными переменными объекта управления (двумя фак-
торами) xi и х2 и каждую из них варьируем на двух
уровнях, условно обозначаемых +1 и —1 или короче
« + » и «—». Например, если за факторы принята темпе-
ратура xi (120 и 80°С) и давление х2 (3 и 2 МПа), то
опыт, в котором температура была 120° С, а давление
2 МПа будем условно обозначать ( + , —).
Предположим, что нас интересует уравнение регрес-
сии, в котором отражено влияние на величину у не только
188
факторов Xi и х2, но и их взаимодействие, отражаемое
произведением XiX2. Уравнение регрессии запишется в
виде
л
У = bQ х0 + /?i Xi + b2 х2 + b12 xL х2, (4-226)
где, как и раньше, хо=1.
Легко видеть, что возможные комбинации двух фак-
торов Xi, Х2, варьируемые на двух уровнях +1 и —1,
будут исчерпаны, если мы поставим четыре опыта, ука-
занные в табл. 4-6. В эту таблицу введем также столбец
х0, значение которого всегда равно +1, столбец с произ-
ведением XiX2, столбец, в котором фиксируются резуль-
таты измерения выходной величины у, и столбец с кодо-
выми обозначениями опытов, который будет объяснен
позднее. Значения Xi и х2, устанавливаемые в отдельных
опытах, и представляют собой план эксперимента.
Таблица 4-6
Планирование 22
Хо План Хз Xi^a У Кодовое обозначенне
xi
-- — — + У1 (1)
— — + — —• Уг а
— — + —— Уз b
1 + + + У1 ab
Данный эксперимент называется полным факторным
экспериментом, поскольку в нем полностью использова-
ны все возможные сочетания уровней обоих факторов.
Данному способу планирования присвоено условное
обозначение 22 — два уровня ‘планирования для двух
факторов. Если производится планирование на пг уров-
нях для п факторов, то полный факторный эксперимент,
т. е. эксперимент, исчерпывающий все возможные соче-
тания факторов, обозначается пгп. Мы в дальнейшем
ограничимся лишь рассмотрением случая /и=2, т. е.
планированием вида 2П.
Для отдельных опытов в факторном эксперименте
используются специальные кодовые обозначения. В этих
обозначениях указывается, какие из факторов в данном
опыте принимают значения верхнего уровня, т. е. +. Для
обозначения верхних уровней факторов х\ и х2 исполь-
189
зуются буквы а и Ь латинского алфавита. Если рассмат-
ривается большее число факторов, например х3, х^..., то
для обозначения их верхних уровнен используются по-
следующие буквы латинского алфавита с, d... Опыт, в
котором все факторы находятся на нижнем уровне, обо-
значается (1). С помощью этих обозначений легко напи-
сать матрицу планирования просто в виде строки
(1), a, ft, ab,
вместо того, чтобы выписывать ее в явном виде.
Обратимся теперь к задаче о взвешивании. Легко ви-
деть, что табл. 4-5 имеет в точности тот же вид, что мат-
рица планирования 22. Следовательно, эффективное
взвешивание явилось результатом использования матри-
цы планирования факторного эксперимента 22.
Остановимся на использовании результатов фактор-
ного эксперимента. В рассмотренном случае число опы-
тов (четыре) равно в точности числу неизвестных коэф-
фициентов регрессии и, следовательно, по результатам
полного факторного эксперимента можно определить все
коэффициенты регрессии. Однако при этом не остается
степеней свободы для проверки гипотезы об адекватно-
сти представления объекта выбранной моделью.
Однако если есть основания предполагать, что эф-
фект взаимодействия переменных, выражаемый членом
&i2xix2, незначителен, то можно положить bi2=0 и запи-
сать уравнение регрессии в виде
У^Ь0х9 + Ь1х1+ Ь2 х2. (4-227)
Теперь из четырех опытов нужно определить только
три коэффициента 60, Ь2 и остается одна степень сво-
боды для проверки гипотезы адекватности.
Перейдем к рассмотрению случая трех переменных xj,
х2, х3, варьируемых на двух уровнях и, следовательно,
описываемых матрицей планирования 23. Чтобы исчер-
пать все возможные комбинации, нужно поставить 8 опы-
тов, приведенных в табл. 4-7, где учтены также эффекты
взаимодействия XjX2, XiX3, x2x3r xix2x3.
Вместо того чтобы выписывать всю эту матрицу, мож-
но просто записать ее кодовое обозначение:
(1), a, b, ab, с, ас, be, abc.
х3—»—>
190
Таблица 4-7
Планирование 23
матрицы планирования 22, повторенной дважды при зна-
чениях %з соответственно на нижнем — и на верхнем +
уровнях. Если нужно включить четвертый фактор, то
аналогичным образом повторяется матрица планирова-
ния для трех факторов при значениях четвертого факто-
ра на нижнем и верхнем уровнях.
Эксперимент, проведенный по матрице планирования
23, дает возможность определить 8 коэффициентов рег-
рессии: t2, Ь3, &12, Ь1з, ^23, &123- При этом, правда,
отсутствуют степени свободы для проверки гипотезы адек-
ватности. Однако во многих случаях эффектами парных
и тройного взаимодействий пренебрегают и ограничива-
ются линейным приближением уравнения регрессии
Л
*/ = Mo + Mi + ь2 х2 + Ь3 х3. (4-228)
При этом для проверки гипотезы адекватности оста-
ются четыре степени свободы.
Для выяснения других свойств рассмотренных матриц
планирования введем новые переменные для обозначения
парных и тройных взаимодействий, как показано в табл.
4-6 и 4-7. При этом нетрудно видеть, что значения Хц
(значение Z-й’переменной в эксперименте /) обладают
следующими свойствами:
Л’ N __
2^=°>2^==jV’/ = i>yv; (4'229)
/=1 1=1
N ___
2х(7х/7 = 0, = j=bi. (4-230)
i—1
191
Свойство (4-230) называется условием ортогональ-
ности матрицы планирования: скалярное произведение
любых двух столбцов в матрице планирования равно,
нулю. С учетом отмеченных свойств система нормальных
уравнений (4-214) принимает значительно более простой
вид, а именно
w ____
/=1
(4-231)
откуда находятся простые соотношения для определения
коэффициентов регрессии:
N
&. = — > j = 0, k
i N it & Г ' ’
/=i
(4-232)
е) Понятие дробных реплик
Рассмотрим теперь более полно случай, когда прене-
брегают эффектами парных, тройных и больших взаимо-
действий,^. е. ограничиваются моделями линейного при-
ближения. В случае трех переменных моделью линейно-
го приближения является уравнение (4-228), содержа-
щее четыре неизвестных коэффициента регрессии, в то
время как полный факторный эксперимент содержит во-
семь опытов. Поэтому имеется четыре степени свободы
для проверки гипотезы адекватности.
Поскольку при линейной модели число неизвестных
коэффициентов регрессии п=£+1, а число опытов в
полном факторном эксперименте N=2\ то превышение
числа опытов над числом неизвестных резко возрастает
с увеличением k. Так, при й = 6 имеем М=64, п=1 и
число степеней свободы W—и=57. Очевидно, что в этих
случаях можно значительно уменьшить число опытов.
Однако возникает вопрос, какие из N = 2k опытов следу-
ет оставить, чтобы сохранить высокую эффективность
эксперимента? Ответ на этот вопрос дает понятие дроб-
ных реплик.
Обратимся опять к задаче с тремя переменными, в
которой линейные эффекты выражаются четырьмя ко-
эффициентами регрессии Ьо, Ь2, Ь3. Для их определе-
ния необходимо всего четыре опыта, Что же это должны
быть за опыты?
192
Четыре опыта можно получить, поставив полный
факторный эксперимент только для двух' переменных,
например Xi и х2, т. е. использовав планирование 22. Но
поскольку в каждом опыте нужно задавать еще и уров-
ни третьего фактора х3, то их можно получить, связав
х3 с Xi и х2 некоторым соотношением, например положив
х3—ххх2. При этом получится матрица планирования для
трех факторов, полностью совпадающая с матрицей пла-
нирования 22, описываемой табл. 4-6, в которой, однако
же, столбец Xi%2 выражает уровни третьего фактора.
Легко также видеть, что эта таблица представляет собой
половину табл. 4-7. Планирование эксперимента по та-
кой матрице называется планированием типа 23*1. В
этом случае планирование проводится для трех перемен-
ных, но в его основе лежит полный факторный экспери-
мент для 3—1 =2 переменных.
Особенностью табл. 4-6 является также то, что значе-
ния каждой из переменных получаются как произведе-
ние значений двух других переменных
Х^ —— %2 X3i Х2 — Х-^ Х3^ Х3 -— Х^ Х2.
Это означает невозможность, например, отличить эф-
фект от эффекта х2х3, т. е. что найденный коэффици-
ент регрессии Ьх будет служить совместной оценкой для
pi и ргз, что записывается в виде b\->pi + p23. Аналогично
Ь2->р2+Р1з, Ьз->рз+р12. Хотя оценка величин Pi2, р2з, Р1з
нас не интересует, однако, если эти величины отличают-
ся от нуля, они скажутся на точности оценки коэффици-
ентов pl, р2, рз.
Планирование 23~1 можно было бы осуществить ина-
че, а именно, спланировать полный факторный экспери-
мент 22 для двух переменных %i, х2 и положить х3 =
= —Х1%2.
При таком планировании линейные и парные эффекты
будут связаны соотношениями
xt = — х2 х3, х2 = — хг х3, х3 ~ — xt х2.
Коэффициенты регрессии fti, b2, Ь3 будут в этом слу-
чае служить оценками величин pi—р2з, р2—Р1з, Рз—Р12-
Два рассмотренных способа планирования вида 23~!
в совокупности дают полный факторный эксперимент 2\
Поэтому эти способы планирования можно рассматри-
вать как разбиение полного факторного эксперимента на
две половины, называемые поЛурепликами, Рассмотрим
13—142 193
некоторые принципы, лежащие в основе такого разбие-
ния.
Если бы у нас было не три, а, скажем, пять перемен-
ных, то для определения линейных эффектов потребова-
лось бы определить шесть коэффициентов регрессии, а
число опытов в полном факторном эксперименте равно
25=32. Полуреплика будет содержать 25~1 = 16 опытов,
что также слишком много. Очевидно, в этом случае мож-
но ограничиться одной четвертью полного факторного
эксперимента, т. е. использовать так называемую чет-
вертъреплику, обозначаемую 25-2. Аналогично вводится
понятие и более мелких дробных реплик, обозначаемых
в общем случае как 2k~l.
Рассмотрим три принципа, лежащих в основе постро-
ения дробных реплик.
1. Поскольку наиболее эффективным видом экспери-
мента является полный факторный эксперимент, то в ос-
нову построения дробной реплики 2k~l положен полный
факторный эксперимент с k—I переменными х1у xk-i.
2. Для определения того, какие значения в каждом из
опытов придавать оставшимся I переменным X/i-z+i,
эти переменные выражаются через основные с по-
мощью некоторых соотношений, называемых генерирую-
щими соотношениями. Выбор того или иного генерирую-
щего соотношения полностью определяет план экспери-
мента.
При планировании 23"1 мы могли использовать одно из генери-
рующих соотношений: хз = Х1Х2, х3 ——%i%2.
При планировании 24-1 полный факторный эксперимент строится
для переменных хь х2, х3. Число генерирующих соотношений, выра-
жающих х4 через Xi, х2, хз, здесь уже значительно больше: Х4 = Х1Х2,
Х4 = Х]Хз, Х4 = Х]Х2Хз, Х'< ——Х1Х2 и т. д.
При планировании 25~2 генерирующие соотношения выражают
переменные х4 и х5 через Xi, х2, х3. Возможные генерирующие соот-
ношения
Х4 — Xj Х2, Х5 — Х4, X3J
х4 = х4 х2, х5 = хг х2 х3;
х4 — х1 х3, х5 = х2 х3 и т. д.
3. При выборе наиболее предпочтительного генериру-
ющего соотношения следует исходить из того, что при
использовании дробных реплик мы получаем не коэффи-
циенты регрессии в-чистом виде, а лишь оценки для не-
которых совместных эффектов, как было показано в
примере планирования 23”1. План эксперимента должен
194
быть таким, чтобы в него входили лишь те совместные
эффекты, которые в наименьшей мере влияют на опре-
деляемые коэффициенты регрессии. Чтобы выбрать наи-
более подходящий план эксперимента, необходимо уметь
легко и быстро находить совместные эффекты для раз-
личных планов эксперимента.
Для быстрой оценки совместных эффектов использу-
ются определяющие контрасты. Определяющим контра-
стом называется соотношение между переменными, ко-
торое во всех опытах дает элементы первого столбца,
т. е. +1.
Способ нахождения определяющих контрастов и их использова-
ния рассмотрим для примера планирования 23”1. Обозначим вектор-
столбец элементов первого столбца через /= (1, ..., 1)'. В качестве
генерирующего соотношения возьмем хз=Х1%2. Умножая обе части
на Хз и учитывая, что х| =1, получаем определяющий контраст
1 — Х4 Х2 Х3 .
Ужножая это соотношение последовательно на хь х2 н хз, полу-
чаем совместные эффекты
Х1 = Х2 Х2 = xi хз’> хз — Х1 -V2,
которые другим путем были найдены ранее.
В качестве другого примера рассмотрим планирование 25-2.
Основные переменные хь х2, х3. В качестве генерирующих соотноше-
ний возьмем Х4 = Х1Хг, х5 = Х1Х2х3. Умножая эти соотношения на х4 и
х5> получаем определяющие контрасты / = XiX2x4, /=xix2x3x5. Если
эти определяющие контрасты попарно перемножить, то получим
третье соотношение, дающее также элементы первого столбца: / =
= Х3Х4Х5.
Чтобы полностью определить все совместные эффекты, введем
обобщающий определяющий контраст
/ — х4 х2 х4 = х4 х2 х3 х3 = х3 х4 х5.
Для получения совместных эффектов при определении коэффи-
циента регрессии bi умножим все члены полученного выражения на хо
X] — х2 х4 —• Х2 Х3 Х5 — X4 Хо Х4 Л-,
что означает
Ь1 ₽1 + Р24 + Р‘235 + Р1345 •
Обычно совместные эффекты от трех и четырех взаимодействий
весьма малы. Поэтому можно считать, что bi->pi + P24-
Аналогично находятся совместные эффекты и при определении
других коэффициентов регрессии.
ЗАДАЧИ К ГЛ. 4
4-1. Что представляют собой события Si и S15 в примере 4-1?
4-2. Показать, что если пространство исходов эксперимента
содержит п элементов, то в этом пространстве имеется 2П различных
событий.
13 ‘
195
4-3. На склад предприятия поступают предохранители с двух
заводов в отношении 1 :3. Первый завод дает 10, а второй 20%
брака. Воспользовавшись формулой полной вероятности, определить
вероятность того, что случайно взятый со склада предохранитель
окажется бракованным.
4-4. Построить график функции распределения вероятностей^ для
числа очков, выпадающих при бросании двух игральных костей, из
примера 4-1.
4-5. Определить вероятность того, что в примере 4-3 время ожи-
дания пассажира не превысит 3 мин.
4-6. Для того чтобы узнать, сколько рыб в озере, отлавливают
1000 рыб, метят их и выпускают обратно в озеро. При каком числе
рыб в озере будет наибольшей вероятность встретить среди вновь
пойманных 150 рыб 10 меченых?
ГЛАВА ПЯТАЯ
СТРУКТУРА И МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ ЗАДАЧ
ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
5-1. ОСНОВНЫЕ ЧЕРТЫ ПРОЦЕССА УПРАВЛЕНИЯ
а) Понятие об управлении
Повсюду в окружающем нас мире (природе, технике,
человеческом обществе) протекают различные процессы,
характер которых зависит от множества сопутствующих
им условий и факторов. Изменяя условия протекания
процессов, человек может влиять на их характер, изме-
нять их, приспосабливать к своим целям. Это вмеша-
тельство в естественный ход процесса, изменение естест-
венного хода процесса и представляет собой сущность
управления. Таким образом, можно сказать, что управ-
ление представляет собой такую организацию того или
иного процесса, которая обеспечивает достижение опре-
деленных целей [34].
Для луч-шёго понимания существа процесса управле-
ния рассмотрим пример собаки, преследующей зайца.
Для того чтобы настичь зайца, собака должна опреде-
ленным образом организовать свои действия, управлять
ими. Следовательно, процесс преследования является
процессом управления.
Началу преследования должно предшествовать появ-
ление зайца, т.. е. создание такой ситуации, при которой
возникает определенная цель, достижение которой явля-
196
ется или необходимым, или желательным. Однако преж-
де чем начать преследование, собака должна оценить
сложившуюся ситуацию и сопоставить ее со своими же-
ланиями и возможностями. Оценка ситуации завершает-
ся принятием решения о том, следует пытаться догнать
зайца или нет (заяц может оказаться далеко и погоня
бесполезна, собака может быть утомлена и т. п.). Толь-
ко после того, как принято решение о преследовании,
собака приступает к организации своего движения, ста-
вя при этом цель догнать зайца за кратчайшее время
или при наименьшей затрате сил.
В этом примере можно отчетливо различить четыре
этапа, характерные для любого процесса управления:
появление цели, оценка ситуации, принятие решения и
исполнение принятого решения. Однако этап появления
цели предшествует началу процесса управления и его
мы исключим из рассмотрения. Учитывая также, что при
управлении сложными процессами оценка ситуации про-
изводится на основе собранной и соответствующим об-
разом обработанной информации, приходим к следую-
щим трем этапам процесса управления:
1) сбор и обработка информации с целью оценки сло-
жившейся ситуации;
2. ) принятие решения о наиболее целесообразных
действиях;
3) исполнение принятого решения.
Иногда бывает необходим еще четвертый этап: конт-
роль исполнения решения.
Различные виды задач управления отличаются друг
от4 друга способом и последовательностью выполнения
этих операций.
б) Виды задач управления
Имеется много задач, в которых механизм сбора ин-
формации и исполнения принятого решения отработаны
настолько четко, что над ними можно совершенно не за-
думываться при осуществлении процесса управления.
В таких задачах все рассмотрение процесса управления
сводится, по существу, к рассмотрению только второго
этапа. Подобные задачи получили название одноэтап-
ных или одношаговых задач принятия решения.
Однако такой подход в большинстве случаев являет-
ся идеализацией и упрощением реального процесса уп-
равления. В действительности все. этапы процесса управ-
ления находятся в тесной взаимосвязи и этап принятия
197
решения требует более или менее детального рассмотре-
ния возможных способов реализации принятого решения.
Так, для принятия решения об отказе от преследования
зайца нужно убедиться, что преследование бесполезно,
а для этого нужно хотя бы грубо проанализировать воз-
можные способы преследования.
Иногда в подобных случаях процесс управления раз-
бивается на несколько последовательных шагов, причем
решение, принимаемое на каком-либо шаге, зависит от
результатов выполнения решения предыдущего шага.
Такие процессы называют многошаговыми процессами
принятия решения. Примером может служить процесс
управления ракетой при запуске ее с Земли на Луну.
Здесь могут быть выделены следующие шаги: вывод ра-
кеты на околоземную орбиту, организация движения ра-
кеты в направлении Луны, перевод ракеты на окололун-
ную орбиту, прилунение.
В данном примере отдельные шаги многошагового
процесса управления получились вполне естественно.
Однако во многих случаях разбиение сложного процесса
управления на шаги с четким выделением всех этапов
управления на каждом шаге оказывается весьма труд-
ной задачей. Так, в процессе преследования зайца при-
ходится иметь дело с непрерывно меняющейся ситуаци-
ей, вызванной стремлением зайца уйти от преследования.
Собака должна непрерывно оценивать эту ситуацию и
непрерывно принимать все новые и новые решения, со-
образуясь с изменяющейся ситуацией и не ожидая окон-
чательных результатов выполнения предыдущих реше-
ний. В подобных задачах мы сталкиваемся с непрерыв-
ными динамическими процессами управления.
Из приведенного рассмотрения видно, насколько
сложными и разнообразными могут быть задачи управ-
ления. Однако мы в значительной степени недооценили
бы трудность решения этих задач, если бы не учли того
обстоятельства, что процессы управления протекают,
как правило, в сложной окружающей обстановке. На
протекание процессов управления оказывают влияние
разнообразные внешние факторы, совокупность кото-
рых часто называют состоянием природы. Для того что-
бы принять правильное решение о тех или иных дейст-
виях, нужно оценить результаты этих действий, а для
этого необходимо знать характер ситуации, в которой
эти действия предпринимаются.
198
Однако типичным для задач управления является
случай, когда имеющаяся информация бывает или недо-
статочна для точной оценки ситуации, или искажена по-
сторонними факторами. Тем не менее недостаточность
информации не снимает задачи принятия решения. Осо-
бенность задач управления именно в том и состоит, что
решение должно быть обязательно принято независимо
от того, в состоянии ли мы точно оценить результаты,
к которым приведет принятое решение.
Таким образом, в процессе управления возникает
важная задача принятия решения в условиях, когда ин-
формация о сложившейся ситуации или недостаточна,
или искажена. Данная задача получила название зада-
чи принятия решения в условиях неопределенности.
5-2. ОПТИМИЗАЦИЯ ПРОЦЕССА УПРАВЛЕНИЯ
а) Критерий качества управления
Задачу управления мы будем в дальнейшем рассмат-
ривать как математическую задачу. Однако в отличие
от многих других математических задач она имеет ту
особенность, что допускает не одно решение, а множест-
во различных решений [37]. Это связано с тем, что в
задачах управления имеется, как правило, много спосо-
бов организации какого-либо процесса, которые приво-
дят к достижению поставленной цели. Так, в процессе
погони за зайцем собака может по-разному организовать
характер своего движения, при запуске ракеты на Луну
можно выбирать различные траектории для полета ра-
кеты и т. п. Поэтому задачу управления можно было бы
ставить как задачу нахождения хотя бы одного из воз-
можных способов достижения поставленной цели. Одна-
ко такая постановка вопроса обычно бывает недоста-
точна.
Если имеется множество решений какой-либо задачи,
то следует вести речь о выборе такого решения, которое
с какой-либо точки зрения является наилучшим. Можно
привести много примеров таких задач. Так, имеется мно-
го способов для склеивания коробки из листа картона
заданных размеров. Решением этой задачи следует счи-
тать получение коробки максимальной вместимости. Из
одного города в другой можно приехать, пользуясь раз-
личными видами транспорта: воздушным, водным, авто-
199
бусным, автомобильным. Решением задачи будет выбор
наиболее выгодного вида транспорта с точки зрения
времени проезда, стоимости, удобств и т. п. Аналогичное
положение имеет место в задачах управления,
В тех случаях, когда цель управления может быть
достигнута несколькими различными способами, на спо-
соб управления можно наложить добавочные требова-
ния, степень выполнения которых может служить осно-
ванием для предпочтения одного способа управления
всем другим.
Во многих случаях реализация процесса управления
требует затраты каких-либо ресурсов: затрат времени,
расхода материалов, топлива, электроэнергии. Следова-
тельно, при выборе способа управления следует говорить
не только о том, достигается ли поставленная цель, но
и том, какие ресурсы придется затратить для достиже-
ния этой цели. В этом случае задача управления состо-
ит в том, чтобы из множества решений, обеспечивающих
достижение цели, выбрать одно, которое требует наи-
меньшей затраты ресурсов.
В других случаях основанием для предпочтения од-
ного способа управления другому могут служить иные
требования, налагаемые на систему управления: стои-
мость обслуживания, надежность, степень близости по-
лучаемого состояния системы к требуемому, степень до-
стоверности знаний о состоянии природы и т. п.
Математическое выражение, дающее количественную
оценку степени выполнения наложенных на способ уп-
равления требований, называется критерием качества
управления. Наиболее предпочтительным или оптималь-
ным способом управления будет такой, при котором кри-
терий качества управления достигает минимального
(иногда максимального) значения. При выборе, напри-
мер, режима полета за критерий качества управления
можно принять или выражение для количества топлива,
расходуемого на единицу пути, или путь, проходимый за
счет единицы топлива. Наиболее экономичному, т. е. оп-
тимальному, режиму будет соответствовать или мини-
мальное (в первом случае), или максимальное (во вто-
ром случае) значение критерия качества управления.
Приведенное определение оптимального управления
будем рассматривать как предварительное. Более стро-
гое определение будет дано после рассмотрения ограни-
чений, налагаемых на процесс управления.
200
6) Ограничения, накладываемые на процесс управления
Задачу нахождения оптимального управления или
управления вообще следует считать не существенной,
т. е. не вызывающей никаких проблем, если на характер
движения системы не наложено никаких ограничений.
Так, проблемы погони за зайцем вообще не существова-
ло бы, если бы собака могла мгновенно преодолеть рас-
стояние, отделяющее ее от зайца. Следовательно, при
решении задачи управления нельзя не считаться с тем
обстоятельством, чго движение любой системы всегда
подвержено различного рода ограничениям.
Для более ясного представления о встречающихся
ограничениях рассмотрим конкретный пример управле-
ния автомобилем. Осуществляя процесс управления, во-
дитель должен считаться с тем, что автомобиль имеет
ограниченную мощность двигателя, а значит, может вес-
ти лишь ограниченный груз с ограниченной предельной
скоростью. Благодаря инерционности скорость автомо-
биля и направление движения могут изменяться лишь с
ограниченным ускорением. Это означает невозможность
мгновенной остановки или мгновенного изменения на-
правления движения в случае возникновения непредви-
денной опасной ситуации и в свою очередь ограничивает
скорость движения. При выборе маршрута водитель вы-
нужден считаться с ограниченным запасом горючего в
баке и необходимостью пополнения этого запаса в пути
1! т. п.
В общем случае имеются два вида ограничений на
выбор способа управления [38]. Ограничениями первого
вида являются сами законы природы, в соответствии с
которыми происходит движение управляемой системы.
При математической формулировке задачи управления
эти ограничения представляются обычно алгебраически-
ми, дифференциальными или разностными уравнениями
объекта управления и их часто называют уравнениями
связи. Второй вид ограничений вызван ограниченностью
ресурсов, используемых при управлении, или иных ве-
личин, которые в силу физических особенностей той или
иной системы не могут или не должны превосходить не-
которых пределов. ^Математически ограничения этого
вида выражаются обычно в виде систем алгебраических
уравнений или неравенств, связывающих переменные,
описывающие состояние системы.
201
в) Постановка задачи оптимального управления
Задачу управления можно считать сформулирован-
ной математически, если:
сформулирована цель управления, выраженная через
критерий качества управления;
определены ограничения первого вида, представляю-
щие сд<)ой системы дифференциальных или разностных
уравнений, ограничивающих возможные способы движе-
ния системы;
определены ограничения второго вида, представляю-
щие собой систему алгебраических уравнений или нера-
венств, выражающих ограниченность ресурсов или иных
величин, используемых при управлении.
Способ управления, который удовлетворяет всем по-
ставленным ограничениям и обращает в минимум (мак-
симум) критерий качества управления, называется оп-
тимальным управлением.
5-3. МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ ОБЪЕКТА УПРАВЛЕНИЯ
а) Структура объекта управления
Ту физическую систему, процессами в которой мы
управляем, будем называть объектом управления. Объ-
екты управления могут быть весьма разнообразны и
иметь самую различную физическую природу. Это могут
быть:
технические устройства: автомобиль, самолет, раке-
та, токарный станок и т. п.;
производственные предприятия: отдел, цех, завод,
отрасль промышленности;
экономические системы: экономика предприятия, эко-
номика отрасли промышленности, экономика государ-
ства;
биологические системы;
социальные системы и т. д.
То обстоятельство, что закономерности, которым под-
чиняются процессы управления, являются общими для
объектов управления любой физической природы, позво-
ляет рассмотреть общую структуру и дать общее мате-
матическое описание процесса управления.
Обозначим через х переменную, определяющую со-
стояние объекта управления. Иногда она является одно-
мерной или скалярной величиной. Это могут быть угол
202
поворота вала двигателя, скорость самолета или ракеты,
давление пара в котле паровой машины, количество
предметов на складе, количество самолетов, базирую-
щихся на аэродроме, и т. п.
Однако в большинстве случаев для описания объекта
управления требуется не одна, а несколько переменных
х(1),..., При описании механических систем величины
представляют собой координаты или скорости дви-
жущихся частей; в электрических системах величины
x{i) будут токами или напряжениями; в экономике это
могут быть производственные мощности или ресурсы от-
дельных отраслей промышленности; в биологической
системе величины х(г) могут характеризовать концентра-
цию химических веществ или лекарств в различных ор-
ганах.
В этих случаях состояние объекта будет описывать-
ся многомерной переменной х= (х<М,..., х(п)), которая
далее будет рассматриваться как точка в пространстве
Rn. Переменную х будем называть переменной или век-
тором состояния объекта управления. Величины х(0, а
значит, и вектор х, как правило, не могут принимать
любые значения. Множество допустимых значений пере-
менной х обозначают через X и называют допустимым
множеством или пространством решений, подчеркивая,
тем самым, что выбор некоторого х^Х представляет со-
бой возможное решение задачи управления.
Если величины х(0 принимают конечное множество
значений, то допустимое множество X также будет ко-
нечным, и имеет вид Х= {хь ..., хЛ }, где x&= (хр,..., xjp),
Если величины x<Z) могут изменяться непрерывно, т. е.
принимают бесконечное множество значений, то допус-
тимое множество X будет бесконечным множеством.
Однако и в этом случае значения х^ обычно не могут
быть какими угодно. На них могут накладываться огра-
ничения, которые, как уже отмечалось, обычно имеют
вид алгебраических уравнений или неравенств:
х(л))
< bi
= Ьц
> bi
i — \,m.
(5-1)
В каждом из ограничений (5-1) сохраняется только
один из знаков = или однако разные ограниче-
203
ния могут иметь и разные знаки. Величины т и п меж-
ду собой не связаны, так что т может быть больше,
меньше или равно п. В частности, пг может быть равно
нулю, так что не исключается случай, когда ограниче-
ния (5-1) отсутствуют. Часто некоторые или все пере-
менные удовлетворяют условию неотрицательности
Условие неотрицательности переменных оказывает-
ся весьма удобным при численном решении уравнений,
описывающих процесс управления. Кроме того, во мно-
гих задачах, например экономических, величины х& не
могут быть отрицательными по своему физическому
смыслу (затраты, выпуск продукции, объемы перевози-
мых товаров, размещенные различным образом суммы
денег и т.п.). Однако и задачи, в которых переменные
могут быть произвольного знака, т. е. удовлетворяют ог-
раничениям вида
х(/) i =
где произвольные числа, легко преобразуются в за-
дачи с неотрицательными переменными путем введения
новых переменных у^=х^}—аг.
Наряду с переменной х, которую мы будем далее
считать доступной измерению и контролю, состояние
объекта управления может зависеть от множества не-
контролируемых или не полностью контролируемых
факторов, определяемых совокупностью внешних усло-
вий, в которых находится объект управления. Летчик,
например, может регулировать режим самолета путем
изменения высоты и скорости полета, которые являются
в данном случае контролируемыми параметрами. Одна-
ко на расход топлива в значительной степени влияют'
внешние атмосферные условия, которые летчик может
лишь частично принимать во внимание, но на которые
он не может активно воздействовать и даже точно их
предвидеть.
Полную совокупность неконтролируемых внешних
факторов, оказывающих влияние на процесс управления,
будем называть состоянием природы и обозначать через
О. Во многих случаях путем некоторой идеализации ре-,
альных явлений удается свести все бесчисленное много-
образие внешних условий к конечному числу возмож-
ных состояний природы -0*1, ..., tlx, т. е. ввести в рассмот-
рение конечное множество ©={'0,1, Оъ}, называемой
204
далее пространством состояний природы. Элементы fit
множества 0 в общем случае являются многомерными
величинами fh = i—1, L.
Невозможность полного контроля всех внешних фак-
торов приводит к тому, что вместо точного знания со-
стояния природы # во многих случаях приходится огра-
ничиваться лишь знанием вероятностей s('O) различных
состояний природы 0. Вероятности £(4), получен-
ные тем или иным путем для всех Ф € ©доначала реше-
ния задачи управления, будем называть априорными
вероятностями состояний природы. Естественно, что ап-
риорные вероятности £($), представляющие собой рас-
пределение вероятностей на пространстве 0, должны
удовлетворять условиям (4-4).
В ряде случаев состояние природы Ф необходимо рас-
сматривать как непрерывную случайную величину, для
которой пространство состояний природы 0 представля-
ет собой бесконечное множество. В таких случаях рас-
пределение вероятностей g('O) превращается в плот-
ность распределения вероятностей.
Для описания целенаправленного воздействия на
объект управления введем переменную и, которую бу-
дем называть управляющим воздействием или просто
управлением. Таким образом, слово управление будет
в дальнейшем использоваться в двух смыслах:
1) управление как организационная деятельность,
направленная на достижение определенных целей;
2) управление в смысле управляющего воздействия,
г.е. некоторой физической величины, изменение кото-
рой производится по нашему желанию и которая воздей-
ствует на характер процессов в объекте управления, из-
меняя их в нужном направлении.
Конкретный смыс^з, в котором используется слово
^управление» в различных случаях, бывает ясен из кон-
текста.
При управлении сложными объектами обычно прихо-
дится использовать несколько управляющих воздейст-
вий и^\ ..., так что управление и представляет собой
в общем случае многомерную величину и — ...
и^У). Так, летчик может менять режим полета, исполь-
зуя управление и, состоящее из воздействия на количе-
1во расходуемого топлива и воздействия на руль
высоты (и&).
205
Управляющие воздействия в реальных системах
не могут быть взяты какими угодно, а подвержены раз-
личного рода ограничениям. Обозначим через U множе-
ство всех значений управлений и, которые удовлетворя-
ют поставленным ограничениям. При этом любое u € U
будет допустимым управлением. В дальнейшем будут
часто встречаться задачи, в которых множество допу-
стимых управлений U является конечным множеством
(/= {и,, (5-2)
Судить о том, насколько примененное управление и
обеспечивает достижение поставленных целей, можно по
значениям переменных состоя-
1 # ния х. Однако во многих слу-
--------------1------------- чаях это оказывается неудоб-
и-------------яным, так как цели управления
х могут выражаться через пере-
менные состояния достаточно
сложным образом. Поэтому
Рис. 5-1. Структура объек- наряду с переменными состоя-
та управления. ния х удобно ввести в рас-
смотрение выходные перемен-
ные q, выражающие цели управления в явном виде.
Иногда в качестве выходной переменной может быть
использована какая-либо из переменных состояния. Но
в общем случае это не так. Например, при управлении
режимом полета с целью минимизации расхода топлива
на заданном маршруте за выходную переменную удобно
взять путь, пройденный за счет единицы топлива, тогда
как переменными состояниями будут скорость и высота
самолета. Выходными переменными могут быть не толь-
ко физические величины, но п экономические показате-
ли, например к. п.д. и т.п. В частности, критерий каче-
ства управления также может рассматриваться как вы-
ходная переменная.
Выходная переменная q зависит в первую очередь
от состояния объекта управления х. Однако на нее мо-
гут оказывать‘влияние используемое управление и и
внешние неконтролируемые факторы Ф. Следовательно,
уравнение для выходной переменной в общем случае
имеет вид:
q = 7(х, и, 0).
(5-3)
206
Взаимодействие всех рассмотренных выше перемен-
ных можно наглядно представить в виде структурной
схемы объекта управления (рис. 5-1).
6} Уравнения движения объекта управления
Под действием сигналов управления и объект управ-
ления изменяет свое состояние. Характер происходящих
при этом процессов определяется скоростью изменения
переменной состояния объекта K = dxjdt, которая пред-
ставляет собой многомерную величину
где х^\ 1 = 1, п — скорости изменения компонент много-
мерной переменной х.
Для динамических систем, в которых физические
процессы протекают непрерывно во времени, скорости
х^ в какой-либо момент времени зависят от состояния
объекта управления в тот же момент времени, которое
в свою очередь определяется значениями переменной со-
стояния х, состоянием природы О и используемым уп-
равлением и. Эту зависимость можно записать в виде
системы обыкновенных дифференциальных уравнений
x(i) = gt (х, и, й), хи) (0) = сь i = 1, п, (5-5)
где величины сг, f=l, п характеризуют начальное состо-
яние объекта управления.
Иногда бывает удобно использовать векторные обо-
значения и заменить систему (5-5) одним уравнением
х = g(x, и, 0), х(0)=с, (5-6)
где с=(сь ..., с/г), а под g подразумевается векторная
функция g = (gb ..., gn).
Введение переменной 0* в качестве аргумента в урав-
нение (5-6) в ряде случаев оказывается неудобным, так
как на протяжении одного процесса управления состоя-
ние природы часто остается неизменным. Однако для
разных процессов управления состояние природы может
быть различным, что проявляется в изменении вида
уравнения движения. Эту зависимость вида уравнения
от состояния природы удобнее отмечать просто индек-
сом Ф при функции g и записывать уравнение (5-6) как
x = g#(u»x). Х(О) = С. (5-7)
207
Если состояние природы не меняется на протяже-
нии всех рассматриваемых процессов управления, то ин-
декс О можно не указывать.
5-4. КЛАССИФИКАЦИЯ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
а) Одношаговые задачи принятия решения
В одношаговых задачах обычно не рассматриваются
методы реализации принятого решения, т. е. определя-
ется не величина и характер управляющего воздействия
и, а непосредственно значение переменной состояния
системы х, которое обеспечивает наилучшее достижение
цели управления.
Одношаговая задача принятия решения считается за-
данной, если заданы пространство состояний природы 0
с распределением вероятностей §(О) для всех ОЕ 0, про-
странство решений X и критерий качества принятого ре-
шения, который для этого случая будем называть целе-
вой функцией. В литературе вместо термина «целевая
функция» используется также название «функция выиг-
рыша» или «функция потерь». Целевую функцию, выра:
жающую в явном виде цели управления, можно рассмат-
ривать как выходную величину объекта управления и
обозначить через q. Целевая функция является скаляр-
ной величиной, зависящей от состояния природы и от
состояния объекта управления х, и по аналогии с (5-3)
может быть записана в виде
<7 = <7(х,й). (5-8)
Как видим, одношаговая задача принятия решений
представляет собой тройку
G = (X,©,?), (5-9)
где q— скалярная функция, определенная на прямом
произведении множеств XX©. Решение этой задачи со-
стоит в нахождении такого х* € X, которое обращает в
минимум функцию 9, т. е. удовлетворяет условию
х* = [х£Х|<7(х, 0) = min). (5-10)
Заметим, что если стоит задача не минимизации, а
максимизации функции q, то она не приведет ни к каким
добавочным трудностям, так как если при х=х* функ-
ция ^(х, О') достигает максимума, то при том же самом
х функция —^(х, О) будет достигать минимума.
208
Существует ряд методов решения одношаговой зада-
чи принятия решения. Применимость того или иного ме-
тода зависит от способа задания множества допустимых
решений X, от имеющейся информации о состоянии при-
роды и от вида целевой функции q. Дадим краткую ха-
рактеристику основных из этих методов.
Задача называется детерминированной, если нет не-
определенности в отношении состояния природы. В де-
терминированных задачах пространство состояний при-
роды 0 состоит всего из одного элемента Фо, вероятность
которого равна единице. В этом случае целевая функ-
ция будет зависеть только от состояния объекта управ-
ления
q = q(x) = q (х(1),..., х(п)). (5-11)
Одношаговая детерминированная задача называется
классической задачей оптимизации [39], если в ней
имеют место ограничения вида (5-1), причем среди этих
ограничений нет неравенств, нет условий неотрицатель-
ности или дискретности переменных, пг<п и функции
//(хС1), ..., х(п>) и q(x) непрерывны и имеют частные про-
изводные по крайней мере второго порядка. В этом слу-
чае задача формулируется следующим образом. Даны
ограничения вида
ft (х(1),..., х(л)) = 0, i = 1, m, m < п. (5-12)
Найти значения хР\ ..., х^п\ удовлетворяющие урав-
нениям (5-12) и обращающие в минимум функцию q(xP\
х(п)).
За последние годы отмечается исключительный рост
интереса к методам решения одношаговой задачи, полу-
чившим название математического программирования.
Эти методы дают'возможность найти значения перемен-
ных х<1), ..., х(п), удовлетворяющих ограничениям типа
(5-1) как в виде равенств, так и в виде неравенств и об-
ращающих в минимум целевую функцию <?(х). На пере-
менные обычно накладываются добавочные условия не-
отрицательности их значений. Следует отметить, что ма-
тематическое программирование представляет собой не
аналитическую, а алгоритмическую форму решения за-
дачи, т. е. дает не формулу, выражающую окончательный
результат, а указывает лишь вычислительную процеду-
ру, которая приводит к решению задачи. Поэтому мето-
ды математического программирования становятся эф-
14—142
209
фективными главным образом при использовании циф-
ровых вычислительных машин.
Простейшим случаем задачи математического про-
граммирования является задача линейного программи-
рования. Она соответствует случаю, когда левые части
ограничений (5-1) и целевая функция (5-11) представ-
ляет собой линейные функции от хС1), В задаче
линейного программирования требуется найти неотрица-
тельные значения переменных х^п\ которые обра-
щают в минимум целевую функцию
q(xw,...,xw) = (5-13)
/
и удовлетворяют системе ограничений
bit (5-14)
/
Любая задача математического программирования,
отличающаяся от сформулированной, называется зада-
чей нелинейного программирования. В задачах нелиней-
ного программирования или целевая функция (5-11),
или левые части ограничений (5-1), или то и другое яв-
ляются нелинейными функциями от Однако
к задаче нелинейного программирования относится и та-
кая, в которой целевая функция и ограничения имеют
вид (5-13) и (5-14), но предполагается, например, цело-
численность переменных. Эта последняя задача получи-
ла название задачи целочисленного программирования.
Одношаговая задача принятия решений называется
стохастической, если пространство состояний природы
О состоит более чем из одного элемента, так что извест-
ным является не действительное состояние природы f>,
а распределение вероятностей gfO) на пространстве 0.
Стохастические задачи, требующие нахождения зна-
чений переменных, удовлетворяющих ограничениям
(5-1) и обращающих в минимум целевую функцию
(5-8), называются задачами стохастического програм-
мирования. Однако во многих случаях путем несколько
иного определения целевой функции задачи стохастичес-
кого программирования могут быть сведены к задачам
линейного или нелинейного программирования. Действи-
тельно. так как состояние природы $ является случайной
величиной с распределением вероятностей £(0) на про-
странстве 0, то и значение <?(х» ф) при данном х=(х<1\
210
также будет случайной величиной с тем же рас-
пределением вероятностей g('O) на пространстве 0. По-
этому в данном случае за целевую функцию целесооб-
разно принять математическое ожидание функции д(х,
Ф) на пространстве 0.
Таким образом, для случайных процессов целевая
функция согласно (4-63) может быть определена выра-
жением
<7i(x) = (5’15)
0(16
Поскольку 91 (х) является детерминированной функ-
цией от х, то задача нахождения переменных х(1),
х(п\ удовлетворяющих ограничениям (5-1) и обращаю-
щих в минимум целевую функцию (5-15), может быть
решена методами линейного или нелинейного програм-
мирования.
Важным случаем одношаговой стохастической задачи
принятия решения является случай, когда величины х,,
i=l, п могут принимать лишь конечное множество зна-
чений. Методами решения таких задач занимается раз-
дел математики, получивший название теория статисти-
ческих решений.
В настоящее время большое внимание.уделяется за-
дачам, в которых решение принимается не одним лицом,
а несколькими (например, двумя), причем интересы
этих лиц противоположны. Примером может служить
задача преследования, в которой расстояние между пре-
следователем и преследуемым зависит от решений и дей-
ствий обоих этих лиц. При этом преследователь заин-
тересован в том, чтобы предельно сократить это рассто-
яние, а преследуемый в том, чтобы сделать его по воз-
можности наибольшим. Подобные задачи получили наз-
вание конфликтных ситуаций, а методы их решения
рассматриваются в теории игр. Лица, принимающие ре-
шения, называются игроками.
Поскольку в конфликтной ситуации решения каждым
из игроков принимаются независимо от решений, прини-
маемых другим игроком, при математическом описании
конфликтной ситуации пространство решений следует
рассматривать как прямое произведение двух множеств
А'Х^, где Х={%1, ..., Хп}—пространство решений пер-
вого игрока; Y={y{l ут}—пространство решений
второго игрока.
14*
211
Элементы пространства решений X\Y будут пред-
ставлять собой пары вида (х, у), х€Х, у€ К, т.е. будут
определяться решениями, принимаемыми как первым,
так и вторым игроком. Для простоты будем считать, что
неопределенность в состоянии природы отсутствует.
Тогда целевая функция будет зависеть только от элемен-
тов пространства X%Y и будет иметь вид:
<7 = <7(х, у). (5-16)
Противоположность интересов игроков состоит в том,
что первый игрок, делающий выбор из множества X,
стремится своим выбором минимизировать целевую
функцию, в то время как второй игрок, делающий выбор
из множества У, стремится ее максимизировать. Таким
образом, сущность конфликтной ситуации состоит в том,
что каждый игрок должен принять наилучшее со своей
точки зрения решение, принимая во внимание, что его
противник сделает тоже самое.
б) Динамические задачи оптимизации управления
Среди разнообразных задач кибернетики значитель-
ное место занимают задачи, в которых объект управле-
ния находится в состоянии непрерывного движения и из-
менения под воздействием различных внешних и внут-
ренних факторов. Задачи управления такими объекта-
ми относятся к классу динамических задач управления.
Объект называется управляемым,’ если среди дейст-
вующих на него разнообразных факторов имеются та-
кие, распоряжаясь которыми, можно изменять характер
его движения. Как уже указывалось, такие целенаправ-
ленные воздействия называются управлениями и обо-
значаются и(7).
Характер движения объекта управления определяет-
ся системой дифференциальных уравнений (5-5), кото-
рую удобно сокращенно записывать в векторной форме
в виде одного дифференциального уравнения (5-7). Уп-
равление и(/) входит в уравнение (5-7), так что это
уравнение определяет не просто конкретное движение
объекта, а лишь его технические возможности, которые
могут быть реализованы путем использования того или
иного управления из пространства допустимых управле-
ний U.
2Г2
Оценить, насколько при том или ином способе управ-
ления достигаются поставленные цели, можно, как и
раньше, путем введения целевой функции типа (5-3), ко-
торую в данном случае удобно записать в виде
q = q#tx(t), u(OL (5-17)
Так, если u(t)—мгновенный расход топлива, а
x(t) —мгновенная скорость самолета, то с точки зрения
расхода топлива качество управления в любой момент
времени может быть охарактеризовано величиной
q(t) =u(t)/x(t) (мгновенный расход топлива на едини-
цу пути), которая, естественно, будет зависеть от состо-
яния природы О, т. е. от совокупности внешних факторов,
определяющих условия полета.
Целевая функция вида (5-17) используется редко,
так как она дает оценку лишь мгновенных значений уп-
равляемого процесса, тогда как в большинстве задач бы-
вает необходимо оценить процессы в объекте управления
на протяжении всего времени управления от 0 до Т.
Во многих случаях целевую функцию удается подоб-
рать так, что оценку процесса в объекте управления мо-
жно произвести путем интегрирования целевой функции
за все время управления, т. е. за критерий качества уп-
равления принять функционал
т
J(u) = p„[x(0, u(0Ut (5-18)
о
Так, если целевая функция имеет физический смысл
потерь, то выражение (5-18) определяет суммарные по-
тери за весь процесс управления.
Иногда в качестве цели управления удается задать
желаемый ход процесса z(t). При этом в качестве целе-
вой функции можно взять квадрат или абсолютное зна-
чение отклонения процесса x(t) от желаемого:
q— (х(/) —-z(013, 7=|х(0 — z(0l. (5-19)
В этих случаях критерий качества управления (5-18)
будет определять полную квадратичную или абсолют-
ную ошибку.
В динамических задачах управления наряду с огра-
ничениями вида (5-2), определяющими пространство до-
213
пустимых управлений U, приходится иметь дело с интег-
ральными ограничениями вида
т
J H# [х (/), и (/)] dt^K = const,
о
(5-20)
Весьма часто, например, приходится сталкиваться с
необходимостью ограничения пределов изменения мгно-
венного значения некоторого параметра а(х, и) в про-
цессе управления. Обозначим через а0 то значение пара-
метра а, превышение которого является нежелательным.
Если подынтегральную функцию //(х, и), называемую
в данном случае функцией штрафа, определить из соот-
ношения
Щх,»)=( ° при «<х, и) < (52])
ця(х, и) — я0]2 при а (х, и) > а0,
то интегральное ограничение (5-20) будет выражать
требование, чтобы мгновенное значение параметра а мо-
гло превышать ао лишь кратковременно и на незначитель-
ную величину. Это условие будет выполняться тем же-
стче, чем меньше К. Так, при #=0 ограничение (5-20)
вообще не будет допускать превышения а над aQ.
Ограничения вида (5-20) возникают также тогда,
когда приходится иметь дело с ограниченными ресурса-
ми: может быть ограничено находящееся в распоряже-
нии количество энергии, топлива, если речь идет о тра-
екториях, и т. п.
Приведенные соотношения позволяют дать следую-
щее определение оптимального управления в динамичес-
ких системах. Оптимальным называется управление
и*(/), выбираемое из пространства допустимых управле-
ний U, такое, которое для объекта, описываемого диф-
ференциальным уравнением (5-7), минимизирует крите-
рий качества (5-18) при заданных ограничениях на ис-
пользуемые ресурсы (5-20).
Динамические задачи управления, как и одношаго-
вые, могут быть детерминированными, если пространст-
во состояний природы 0 состоит только из одного эле-
мента 0 = Оо, и стохастическими, если пространство со-
стояний природы 0 содержит более одного элемента и
задано априорное распределение вероятностей £(Ф) на
пространстве 0.
214
Среди стохастических задач важное место занимают
задачи адаптивного управления, которое используется
в тех случаях, когда или априорных данных о состоянии
природы оказывается недостаточно для осуществления
эффективного управления, или отсутствует достаточно
точное математическое описание самого объекта управ-
ления. Адаптивное управление имеет целью уточнить
данные о состоянии природы или свойства объекта уп-
равления непосредственно в процессе управления объек-
том путем опробования различных способов управления
и поиска того из них, который в данных конкретных ус-
ловиях оказывается наиболее эффективным.
в) Управление конечным состоянием
В целом ряде случаев характер движения объекта в
процессе управления не представляет существенного ин-
тереса, а важным является только состояние, которое
примет объект в момент окончания процесса управления.
Примерами подобных задач могут служить слепая по-
садка самолета, предъявляющая жесткие требования к
скорости и положению самолета в момент касания зем-
ли, доставка груза к заданному сроку в заданный пункт
назначения, достижение к концу года заданной произво-
дительности труда и т.п. Такие задачи получили назва-
ние задач управления конечным состоянием.
Обозначим через х(Т) состояние объекта в конечный
момент времени. Целевая функция в данной задаче бу-
дет иметь вид:
(5-22)
Поскольку х(Т) зависит от характера примененного
управления и (0, то и значение q также будет зависеть-
от примененного управления. Поэтому задачу выбора
оптимального управления можно сформулировать для
этого случая следующим образом: из пространства до-
пустимых управлений U выбрать такое управление
и*(/), которое для объекта, описываемого дифференци-
альным уравнением (5-17), минимизирует целевую функ-
цию (5-22) при ограничениях (5-20) на используемые
ресурсы.
5-5. МНОГОШАГОВЫЕ ПРОЦЕССЫ УПРАВЛЕНИЯ
а) Поведение динамической системы как функция
начального состояния
Нахождение оптимального управления в динамичес-
ких системах во многих случаях существенно облегча-
ется, если процесс управления удается разбить естест-
венным или искусственным путем на отдельные шаги
или этапы. Для того чтобы вести рассмотрение в общем
виде, будем считать, что состояние объекта описывается
многомерной переменной х= (х<]).. х<п>).
Предполагая, что процесс является неуправляемым и
неопределенность в состоянии природы отсутствует,
дифференциальное уравнение, определяющее движение
объекта по аналогии с (5-7), запишем в виде
х = g (х), х (0) = с. (5-23)
Решение этого уравнения записывают обычно как
х=х(/), чем подчеркивается зависимость решения от
времени. Однако не менее важно то, что решение урав-
нения (5-23) зависит от начального состояния с. Поэто-
му более строгой является такая форма записи, которая
показывает явную зависимость решения х как от време-
ни, так и начального состояния:
х = х (с, /) —- х [х (0), Д
(5-24)
Такая форма записи позволяет рассматривать состоя-
ние системы в произвольный момент времени t как не-
которое преобразование начального состояния х(0)=с
на интервале t.
Рассмотрим движение объекта на интервале от Одо/г,
который промежуточной точкой 6 разобъем на два ин-
тервала длительностью t\ и т=/г—6, как показано на
рис. 5-2. Рассмотрим три состояния объекта управления:
начальное состояние х(о)=с;
состояние х(с, 6) в промежуточный момент
состояние х(с, /2) в конечный момент t2.
К описанию последнего состояния можно подойти
двояким образом. Это состояние можно рассматривать
или как преобразование начального состояния х(о)=с
на интервале/г—^+т
х(с, t2) — х(с, + т),
(5-25)
216
или как преобразование состояния х(с ,6) на интер-
вале т
х (с, /2) = х [х (с, /х), т]. (5-26)
Так как оба выражения описывают одно и то же со-
стояние, то, приравнивая их, получаем соотношение
х (с, + т) = х [х (с, Q, т]. (5-27)
Рис. 5-2. Разбиение интервала на
два шага.
6) Представление динамического процесса в виде
последовательности преобразований
Предположим, что динамический процесс х(с, /) на
интервале от 0 до t' может быть естественным или ис-
кусственным образом представлен как многошаговый, и
Рис. 5-3. Разбиение интервала на п шагов.
найдем подходящий способ описания такого процесса.
Для того чтобы получить многошаговый процесс, интер-
вал от 0 до t' следует разбить на п последовательных
шагов, длительности которых примем равными ti, Т2,...,
тп, как показано на рис. 5-3. Обозначим через tk(k=O,...,
п) моменты окончания £-го шага так, что /л-м+ т/г+1,
а через xft — состояние объекта в момент tk'.
xk = x (с, th). (5-28)
Рассмотрим состояние
\+; = х (с, ^+1) = х (с, t, + тА+1). (5-29)
Это выражение в соответствии с (5-27) и (5-28) мож-
но представить в виде
xA+i = X [х (с, tk), т4,н] = х (х/;, т,+1). (5-30)
217
Соотношение (5-30) представляет состояние объекта
хд+1 как результат преобразования состояния хй на
(&+ 1)-м шаге.
Введем в рассмотрение оператор Т, который будет
означать преобразование состояния . процесса за один
шаг:
т(хл) = х(х*>тН-1)’ k = Q,...,n-l. (5-31)
Тогда соотношение (5-30) запишется в виде
К.+.- W (5-32)
Полагая &=0,1, п— 1, можем описать весь дина-
мический процесс в виде последовательности преобра-
зований
х„ = с, х, = Т (х0).хя_7-(х„_,). (5-33)
в) Многошаговый процесс управления
Динамический процесс, - описываемый преобразова-
нием (5-32), является неуправляемым. Для получения
управляемого многошагового процесса необходимо иметь
возможность на каждом шаге осуществлять не одно пре-
образование Т(хй), а одно из множества преобразований
Л(хй),..., Тг(*к).
Удобно считать, что конкретный вид преобразования
будет зависеть от параметра и^, который на k-м шаге
может принимать одно из множества значений Uk- Пара-
метр u/г будем называть управлением, а множество Uk —
пространством допустимых управлений на fe-м шаге.
Преобразование, осуществляемое на k-м шаге, теперь
можно записать в виде
хА+1 = Т(х„ uft), ukeuk. (5-34)
Если в соотношении (5-34) положить последователь-
но k=0,1, ..., п—1 и учесть начальное состояние х0, то
получим описание всего управляемого многошагового
процесса:
х,+1 = т (xft, и;у ик£ик-
£=0,1,... ,п— 1; xo = x(O) = c. (5-35)
Соотношение (5-35), называемое разностным уравне-
нием объекта управления, аналогично дифференциаль-
218
ному уравнению (5-7), дающему описание непрерывного
динамического процесса.
Пример 5-1. Предположим, что переменная состояния является
двумерной величиной х= (х(’), х<2>), которая может принимать зна-
чения, определяемые геометрически узлами сетки, изображенной па
рис. 5-4, а. Переход от одного уела сетки к следующему произво-
дится путем использования на каждом шаге одного из двух воз-
можных управлений: wK = 0 — движение по горизонтали и wK=l —
движение по вертикали. Следовательно, пространство допустимых
Рис. 5-4. Многошаговый процесс с двумерной пере-
менной.
управлений одинаково для любого шага и равно UK= {0, 1}, k = 0,
1, п—1.
Рассмотрим одну из клеток данной сетки, показанную на
рис. 5-4, б, в нижнем левом узле которой система оказалась после
k-ro шага, так что xK=(«i, bi). Значение xK+i = T(xK, wK) зависит от
примененного управления. Как видно из рис. 5-4, б, имеют место сле-
дующие соотношения:
0] = (ag, &1) = х*+1;
^[(Ор 1]=(а1, &2)=х;г+1.
Конкретную траекторию движения системы можно описать, ука-
зав начальное состояние х0 и последовательность примененных уп-
равлений. Так, отмеченная жирной линией траектория на рис. 5-4, а
получается при использовании управления и=(01101001) и при на-
чальных условиях х0=(а, (3).
г) Критерий качества управления при многошаговом
процессе
Будем считать, что качество управления определяется
значением целевой функции q, численное значение ко-
торой можно рассматривать как потери, которые мы не-
сем, применяя то или иное управление. Потери за один
219
шаг.будут зависеть от состояния процесса в начале шага
и примененного на этом шаге управления, т. е.
= и*). (5'36)
За критерий качества управления можно принять
полные потери за все п шагов процесса и представить
критерий качества управления n-шагового процесса в
виде
п—\
= (5-37)
ft=0
Здесь через и обозначена последовательность управ-
лений, т. е. упорядоченное множество вида
и = (“о....Un-1)> - - Ч.-1 ^ип-г (5'38)
. Если рассматривается многошаговый процесс управ-
ления конечным значением, то потери будут зависеть
лишь от состояния объекта управления в конце процес-
са, которое в свою очередь зависит от начального состоя-
ния и примененных на каждом шаге управлений:
‘7 = <7(хп) = 9(хо> и). (5-39)
где и определяется соотношением (5-38). Скалярную ве-
личину, определяемую выражением (5-39), будем назы-
вать целевой функцией многошагового процесса управ-
ления.
Задача нахождения оптимального управления при
многошаговом процессе может быть сформулирована
следующим образом. Для динамической системы, про-
цесс в которой описывается разностным уравнением
(5-35), найти такую последовательность управлений и0,
Ui,..„ un-i, удовлетворяющих ограничениям вида uftC Uk,
£=0,1 п—1, которая обращает в минимум критерий
качества уравнения (5-37) или целевую функцию (5-39).
Поскольку многошаговые процессы управления яв-
ляются частным случаем динамических процессов уп-
равления, то среди них могут встретиться все те виды
задач, которые рассматривались в динамических задачах
управления. Так, если пространство состояний природы
0 состоит из одного элемента Оо, то многошаговая зада-
ча управления называется детерминированной. В про-
тивном случае она относится к классу стохастических
задач.
220
Отметим, что не всегда ту или иную задачу можно
однозначно отнести к классу многошаговых или одноша*
говых задач. Так, если в многошаговой задаче последо-
вательность значений переменной, принимаемую на от-
дельных шагах, рассматривать как одну многомерную
переменную, то многошаговая задача превращается в
одношаговую.
5-6. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ОПТИМИЗАЦИИ
а) Общая постановка задачи оптимизации
В общей задаче оптимизации требуется найти век-
тор х=(х<1),..., хм)' из допустимой области X, который
обращает в минимум целевую функцию <?(х), т. е. такой
вектор х* для которого выполняется условие
<?(х*) <<?(х) для всех х£Х. (5-40)
Если такой вектор х* существует, то он определяет
слабый глобальный (абсолютный) минимум q* (х) в до-
пустимой области X. Этот минимум называется слабым,
так как удовлетворяет нестрогому (слабому) неравенст-
ву. Он называется глобальным или абсолютным, потому,
что неравенство справедливо для любого х €Х. Минимум
при х=х* называется сильным, если имеет место <?(х*) <
<?(х) для х=#х*. Если поменять знаки неравенств, по-
лучим слабый и сильный максимум. Однако максимум
q(x) дает минимум — <?(х), поэтому в дальнейшем мы
рассматриваем только задачу минимизации.
Существование слабого глобального минимума до-
пускает неединственность оптимальной точки, так как
любой х, удовлетворяющий условию д(х)=(7(х*), также
является оптимальной точкой. Сильный глобальный ми-
нимум всегда единствен.
Хотя целью задачи оптимизации является получение
глобального минимума целевой функции, однако при ее
решении важное значение имеет понятие локального или
относительного минимума.
Минимум в точке х=х* называется локальным (от-
носительным), если найдется такая окрестность Ое (х*)
точки х*, что для всех х€Ое (х*) имеет место д(х*)^
^<7(х).
221
Если функция q(x) дифференцируема, то задача
отыскания локальных минимумов сводится к нахожде-
нию стационарных точек, в которых обращаются в нуль
частные производные функции <?(х):
= = (5-41)
Следует отметить, что условие (5-41) является лишь
необходимым, но не достаточным условием существова-
ния относительного минимума. Стационарная точка мо-
жет быть и точкой относительного максимума, и седло-
вой точкой, в которой не достигается ни относительный
минимум, ни относительный максимум. Как было пока-
зано в § 3-6, достаточным условием существования в ста-
ционарной точке относительного минимума является
положительная определенность квадратичной формы
(3-98).
Отметим также, что хотя абсолютный минимум яв-
ляется в то же время и относительным, но относительный
минимум не обязательно будет абсолютным. Более
того, на допустимом множестве X функция q(x) может
иметь не один, а несколько относительных минимумов.
В то же время большинство известных методов оп-
тимизации позволяет находить лишь точки относитель-
ного минимума. При этом возникает очень сложная за-
дача нахождения того из относительных минимумов, ко-
торый является абсолютным.
б) Ограничения на допустимое множество
Наиболее типичным способом определения допусти-
мого множества X является введение ограничений на пе-
ременные типа (5-1), а также требование неотрицатель-
ности всех или некоторых переменных. Если ограничений
несколько, то допустимое множество решений задачи
оптимизации является пересечением всех множеств, оп-
ределяемых ограничениями.
На рис. 5-5,« для двумерной переменной x=(w, v)
заданы два ограничения:
и2 + v2 ' г2, ии с.
Первое ограничение определяет круг радиусом г с
центром в начале координат, второе — область, отделен-
ную от начала координат двумя ветвями гиперболы.
222
В этом случае допустимое множество определяется не-
заштрихованными областями в первом и третьем квад-
рантах. Если наложено требование неотрицательности
переменных и, и^О, то остается только область в первом
квадранте. На рис. 5-5,6 показана допустимая область,
определяемая условиями
и2 + v2 <r2, и^>0, v^Q.
При некоторых видах ограничений допустимое мно-
жество может оказаться пустым. Так, если уменьшить
радиус круга на рис. 5-4, а, то не окажется точек, нахо-
множества.
дящихся внутри круга и в области, определяемой ветвя-
ми гиперболы. Ограничения называются несовместными,
если определяемое ими допустимое множество пусто.
Многие из рассмотренных далее методов оптимизации
применимы только в том случае, если допустимое мно-
жество является выпуклым. Допустимые множества,
приведенные на рис. 5-5, с учетом неотрицательности
переменных выпуклы. Однако если в ограничении, описы-
ваемом окружностью для рис. 5-5,6, поменять знак не-
равенства на обратный, то допустимое множество пре-
вратится в положительный квадрант без четверти круга
с центром в начале координат и уже не будет выпуклым.
Задача оптимизации, вообще говоря, не всегда име-
ет решение. Так, задача max (u + v) при ограничении
u^v не имеет решения, поскольку для любого u + v мож-
но найти другие и и ц, дающие большее значение суммы.
Тем не менее можно выделить широкий класс задач, для
которых существование оптимума гарантирует следую-
щая теорема.
Теорема Вейерштрасса. Непрерывная функция, опре-
деленная на непустом замкнутом ограниченном множе-
223
стве, достигает минимума (максимума) по крайней мере
в одной из точек этого множества.
Поэтому замкнутость допустимого множества являет-
ся важным условием большинства задач оптимизации.
Для обеспечения замкнутости все ограничения на до-
пустимое множество типа неравенств задаются как не-
строгие: или При этом символы <, > определя-
ют внутренние, а символ = граничные точки допустимого
множества.
Отметим, что теорема Вейерштрасса дает достаточ-
ные условия оптимума. Однако задачи, в которых усло-
вия теоремы не выполняются, также могут иметь ре-
шения.
в) Выпуклые и вогнутые функции
Как уже отмечалось, большинство известных методов
решения задачи оптимизации сводится к исследованию
характера функции q(x) в окрестности рассматриваемо-
го значения х, т. е. к выяснению того, не является ли
рассматриваемая точка х точкой относительного мини-
мума (максимума). При этом задача чрезвычайно ус-
ложняется, если целевая функция q(x) может иметь в
допустимой области значений X не один, а несколько
максимумов или минимумов. Поэтому значительный ин-
терес представляют такие задачи, в которых целевая
функция имеет всего один максимум или минимум, и в
которых, следовательно, относительный минимум явля-
ется в то же время абсолютным. Для выявления классов
таких задач фундаментальную роль играют понятия вы-
пуклости и вогнутости функций.
Пусть /(х)—некоторая функция, заданная на вы-
пуклом множестве X; хь х2 — две произвольные точки из
X, а х=ХХ1+(1-—Х)х2, x^X^l—произвольная точка
отрезка, соединяющего Xi и х2. Рассмотрим также отре-
зок z=Xf(x1) + (l—X)f(x2), соединяющий значения /(х0
и f (х2) функции f (х).
Функция f(x) называется выпуклой, если она цели-
ком лежит ниже (не выше) отрезка, .соединяющего две
ее произвольные точки, т. е. если при любых Xi и х2 и при
Л
любом значения функции в точке х будут не
больше значений z отрезка, соединяющего f(x\) и f(x2):
f [Хх, + (1 - X) х2] < Xf (х,) + (1 - X) f (х2). (5-42)
224
Функция называется вогнутой, если она целиком ле-
жит выше (не ниже) отрезка, соединяющего две ее про-
извольные точки, т. е. если
f [U3 + (1 - М х2] > Kf (х3) + (1 - М f (х2). (5-43)
На рис. 5-6 приведены примеры выпуклых и вогнутых
функций одной переменной, а также случаи, когда функ-
ция не является ни выпуклой, ни вогнутой.
Рис. 5-6. Виды функции.
« — выпуклые; б —вогнутые; в — не являющиеся ни выпуклы-
ми, ни вогнутыми.
Если в соотношениях (5-42) и (5-43) заменить знаки
нестрогих неравенств на строгие неравенства С,
>, то приходим к определению строго выпуклой и стро-
го вогнутой функций.
Теорема 5-1. Сумма выпуклых (вогнутых) функций
есть выпуклая (вогнутая) функция.
Доказательство. Рассмотрим функцию f(x) =
=Sf,(x), где Д(х)—выпуклые функции на выпуклом
множестве X. Возьмем любые хь х2^Хи любое
Тогда
f [Хх2 + (1 — X) х2] = ft [Ххх + (1 — А) х2] <
i
< 21М| (Х1)+о - ь <х2)]=х 2 ь <хх)+
i i
+ (1 —Л) 2 fi (Х2) = v (ХХ) + (!-*)/ (Х2),
15—142
225
т. е. выполняется условие выпуклости функции f(x). Для
вогнутых функций теорема доказывается аналогично.
Рассмотрим некоторые важные виды выпуклых и вог-
нутых функций.
Линейная функция z=ax является выпуклой (и вог.
нутой) на всем пространстве так как для любых Xi
и х2 и любого X
a [Xxi + (1 — а) х21 = XaXi + (1 — X) ах2.
Однако линейная функция не является ни строго вы-
пуклой, ни строго вогнутой.
Положительно (не отрицательно) определенная квад-
ратичная форма z=x'Ax является выпуклой функцией
на всем пространстве Действительно, для любых
хь х2е/?(гг) и х=Хх!Ч- (1—Х)х2 имеем:
х' А х = [%хх + (1 — X) х2Г A [bq + (1 — X) х2] =
= [х2 а (хх — х2)Г А [х2 + X (хх — х2)] =
= х2Ах2+2Х !х2 —х/)' Ах, + X2 (х1 — х2)'A (Xj — x2j*
Так как по предположению х'Ах^О и то
Zx'Ax^Vx'Ax. Следовательно,
л л
х' А х < х\ А х2 + 2к — х2)' Ах2 + X (х2 — х2)' X
X A (Xj — х2) = х2 Ах2 + к (Xj — х2)' Ах2 + X (xj — х2)' Ахр
Учитывая, что для вещественной симметрической
матрицы
xj Ах2 = (xjAx2)' = х'А' Xj = х2 Ахр
получаем:
А А
х' А х < Xxj Axj + (1 — X) xj Ах2,
что и означает, что функция х'Ах выпукла.
Аналогично доказывается, что отрицательно (не по-
ложительно) определенная квадратичная форма явля-
ется вогнутой функцией на всем Rn.
Суммы линейной функции и квадратичной формы
ах + х'Ах выпукла, если квадратичная форма является
положительно определенной, и вогнута, если квадратич-
ная форма является отрицательно определенной. Этот
вывод является следствием теоремы 5-1.
226
г) Свойства выпуклых (вогнутых) функций
Приведем без доказательства некоторые свойства
выпуклых функций, являющиеся важным для решения
задачи НЛП и проиллюстрированные примерами на
рис. 5-7.
Пусть f(x) выпуклая функция, заданная на замкну,
том выпуклом множестве X. Тогда:
Рис. 5-7. Минимумы и максимумы выпуклых функций.
maxf(x)
1) любой относительный минимум /(х) на X является
абсолютным (глобальным) минимумом Цх) на X;
2) не может быть двух и более различных относитель-
ных минимумов;
3) если абсолютный минимум достигается в двух
различных точках, то он достигается в бесконечном мно-
жестве точек;
г) глобальный максимум f(x) достигается в одной
или более крайних точках множества X.
Аналогичными свойствами по отношению к максиму-
мам функции f(x) обладают вогнутые функции.
д) Классическая задача оптимизации
Как уже отмечалось, классическая задача оптимиза-
ции состоит в нахождецди минимума целевой функции
<7 (х), где х=(х<1>, ..., х<п>)—;очка в пространстве
при наличии ограничений типа равенств
Ц (х) = 0, i = 1, т, т<_п. (5-44)
Если ограничения (5-44) имеют место, то минимум
функции <?(х) называют условным минимумом. Если ог-
раничения (5-44) отсутствуют, то говорят о безусловном
15*
227
минимуме, нахождение которого сводится к определению
и наследованию стационарных точек функции <?(х).
Классический способ решения данной задачи состоит
в том, что уравнения (5-44) используются для исключе-
ния из рассмотрения т переменных. При этом целевая
функция приводится к виду
.../“’)=?,...................(5-45)
Рис. 5-8. Геометрическая ин-
терпретация задачи на услов-
ный экстремум.
где через обозначены неисключенные пере-
менные. Задача состоит теперь в нахождении значений
z/(1),..., у^п~т\ которые обращают в минимум функцию q\
и на которые не наложено никаких ограничений, т. е. к
задаче на безусловный экстремум.
Пример 5-2. На рис. 5-8 дана геометрическая интерпретация дан-
ной задачи для двумерной переменной x=(w, v) с одним ограниче-
нием f(x) = и2—v+1 = 0 и с целевой функцией q(x) = («— l)2 + v2. На
рисунке изображены ограничение f(x)=O и линии уровня q(x)~
= const. Оптимальное решение х* получается в точке касания кри-
вых f(x)=O и #(x)=const.
Для получения аналитического решения из уравнения f(x)=O
находим и = м2+1. Подставляя в q(x)t получаем: q(x) — (u—1)2 +
4- («24-1)2. Дифференцируя это выражение по ц, приходим к урав-
нению 2«3 + 3«—1=0, которое имеет единственный вещественный ко-
рень rz* = 0,313. При этом и* = 1,098, <?(х*) = 1,678.
Заметим, что при отсутствии ограничения f(x)=O
минимум целевой функции q(x) достигается в точке х=
= (1,0) и равен нулю. Таким образом, ограничение при-
водит к увеличению значения целевой функции, т. е. к
ухудшению качества оптимума.
Если уравнения (5-44) имеют сложный вид, то исклю-
чение с их помощью т переменных из функции <7 (х)
представляет значительные трудности. В связи с этим
большое практическое значение получил метод сведения
228
задачи на условный экстремум к задаче на безусловный
экстремум, основанный на использовании функции Лаг-
ранжа.
е) Функция Лагранжа
Введем в рассмотрение вектор Х = (А,ь лт) и иссле-
дуем свойства функции
т
£(хД) = д(Х) + 2Мг(х). (5-46)
1=1
Функция Л(х, X) называется функцией Лагранжа, а
величины Хг — множителями Лагранжа. Как видим,
функция L(x, X) является функцией п + т переменных
Xb...,Xw.
Рассмотрим стационарные точки функции Л(х, X),
которые получим, приравняв нулю частные производные
по Ху, /=1, т и по x(i), i~ 1, п:
= f. (х) = О, j = (5-47)
- = 0, i =Т7п. (5-48)
дх{1) ' '
Заметим, что уравнения (4-57) совпадают с ограни-
чениями (5-44) и, как следует из (5-46), при их выполне-
нии имеет место Л(х, Х)=<?(х). Потому если в стацио-
нарной точке (х*, X*) функция L(x, X) достигает мини-
мума, то х* обеспечивает и минимум функции q(x) при
выполнении ограничений (5-44), т. е. дает решение за-
дачи.
Как видим, задача на условный минимум целевой
функции ?(х) при наличии ограничений типа равенств
сводится к задаче на определение стационарных точек
функции Лагранжа L(x, X).
Для примера 5-2 функция Лагранжа равна L(x, X) = (и—1)2 +
4- у24-Х(и2—v+ 1).
Дифференцируя эту функцию по ut v и X, получаем три урав-
нения
u(l 4- X) — 1 =0, 2v — Х = 0, W2_v+1==o,
решая которые находим интересующие нас значения м, v и X,
229
ГЛАВА ШЕСТАЯ
ЛИНЕЙНОЕ И НЕЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ
6-1. ПОСТАНОВКА ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
а) Основные определения
Как указывалось в гл. 5, термин «линейное програм-
мирование» связывается с исследованием и решением
следующей задачи [42—45].
Дана система т линейно независимых уравнений с п
неизвестными Xi,..., хп, называемая системой ограничений
задачи линейного программирования:
«1Р1Н------F«in*n = bi;
................................ (6-1)
^ml Ч~ ' " ’ Н- @тп •'"n ^т»
(6-3)
где не уменьшая общности, можно считать i=\,tn.
Характерной Особенностью данной задачи является
то, что число уравнений меньше числа неизвестных, т. е.
m<Zn. Требуется найти неотрицательные значения пере-
менных (хг^О, (=1, п), которые удовлетворяют урав-
нениям (6-1) и обращают в минимум целевую функцию
q = Ci Ъ Ч--------------------F сп хп, (6-2)
называемую линейной формой.
Более компактно задачи линейного программирова-
ния могут быть записаны в матричной форме, как
g(x) = сх = min;
Ах = b(b 0), xi>0,
где А — матрица размером тХп\ b — m-мерный вектор;
х и с — n-мерные векторы.
Сделаем несколько пояснений по поводу этой задачи.
Система уравнений (6-1) для случая, когда число урав-
нений равно числу неизвестных (m=n), рассматривает-
ся в обычной алгебре. Если при этом определитель си-
стемы не равен нулю, то система имеет одно-единствен-
ное решение, для нахождения которого имеются хорошо
разработанные приемы. Если же число уравнений мень-
ше числа неизвестных (m<n), то система уравнений
(6-1) имеет бесчисленное множество решений, т. е. име-
ется бесчисленное множество наборов переменных х^,
1=1,/г, которые удовлетворяют уравнениям (6-1). Каж-
230
дый набор переменных Xi, i=l,n, удовлетворяющий си-
стеме уравнений (6-1), будем называть решением.
Однако на переменные х; наложено добавочное огра-
ничение, состоящее в том, что эти переменные должны
быть неотрицательны (х,^0). В общем случае имеется
бесчисленное множество решений, удовлетворяющих это-
му добавочному условию. Любое решение системы (6-1)
с неотрицательными значениями переменных будем на-
зывать допустимым решением. Таким образом, суть за-
дачи линейного программирования состоит в том, чтобы
из множества допустимых решений выбрать одно, а имен-
но такое, которое обращает в минимум линейную фор-
му (6-2).
Иногда в задаче линейного программирования все
или некоторые из уравнений вида (6-1) имеют вид не-
равенств. Так, вместо уравнения ацХ1+...-\-а}Пхп^=Ь) в
систему (6-1) может входить неравенство вида
«л Н------И а,п хп < bj или аи *1 Н-F ain хп > Ъ}.
Однако такие неравенства легко превратить в урав-
нения, введя добавочную переменнуютак, чтобы
в зависимости от знака неравенства имело место одно из
двух выражений
«л *i + ---+ ajn хп + Xn+j = Ь}-
алх1Н-----Ь ат хп — Xn+i = bj.
Такое изменение приводит просто к увеличению чис-
ла переменных, что не меняет существа задачи.
Иногда стоит задача не минимизации линейной фор-
мы (6-2), а максимизации ее. Эта задача сводится к
предыдущей путем перемены знака у выражения для q.
Поскольку в дальнейшем будут встречаться задачи обо-
их типов, то условимся значение целевой функции обо-
значать через q, если требуется ее минимизировать, и че-
рез q', если она должна быть максимизирована.
Прежде чем искать решение уравнений (6-1), удов-
летворяющее наложенным требованиям Xj^O, i=l, п,
<?=min, попробуем найти какое-либо решение уравнений
(6-1). Поскольку число переменных п в этой системе
больше числа уравнений т, то одно из возможных реше-
ний можно найти, если п—т каких-либо переменных по-
ложить равными нулю. Полученную при этом систему т
уравнений с т неизвестными можно решать обычными
231
методами алгебры. Правда, для того чтобы система пг
уравнений с т неизвестными имела решение, необходи-
мо, чтобы определитель, составленный из коэффициен-
тов при неизвестных, не обращался в нуль. Если это ус-
ловие не выполняется, то можно приравнять нулю другие
п—т переменных. Полученное при этом решение называ-
ется базисным решением. Мы можем ввести теперь неко-
торую терминологию, широко употребляемую в задачах
линейного программирования.
Базисом называется любой набор т переменных, та-
ких, что определитель, составленный из коэффициентов,
при этих переменных не равен нулю. Эти т переменных
называются базисными переменными (по отношению к
данному базису). Остальные п—т переменных называ-
ются небазисными или свободными переменными. В каж-
дой конкретной системе уравнений (6-1) может сущест-
вовать несколько различных базисов с различными ба-
зисными переменными.
Если положить все свободные переменные равными
нулю и решить полученную систему т уравнений с пг
неизвестными, tq получим базисное решение. Однако
среди различных базисных решений будут такие, кото-
рые дают отрицательные значения некоторых перемен-
ных. Эти базисные решения противоречат условию зада-
чи и являются недопустимыми.
Допустимым базисным решением является такое ба-
зисное решение, которое одновременно допустимо, т. е.
которое дает неотрицательные значения базисных пере-
менных. Допустимые базисные решения являются наи-
более простыми из допустимых решений системы (6-1).
Однако на решение задачи накладывается добавочное
условие: линейная форма (6-2) должна при найденном
решении принимать минимальное значение. Решение
задачи при этом добавочном условии усложняется, одна-
ко понятие допустимого базисного решения играет очень
важную роль и при нахождении полного решения задачи.
6) Примеры задач линейного программирования
Линейное программирование возникло в связи с рас-
смотрением вопросов о нахождении наивыгоднейших ва-
риантов при решении различных планово-производст-
венных задач. В этих задачах имеются большая свобода
изменения различных параметров и ряд ограничивающих
232
условий. Требуется найти такие значения параметров,
которые с некоторой точки зрения были бы наилучшими.
К таким задачам относятся задачи нахождения наиболее
рационального способа использования сырья и материа-
лов, определения наивыгоднейших производственных ре-
жимов, повышения эффективности работы транспорта
и т. п.
Существо задач линейного программирования пояс-
ним на ряде примеров.
Пример 6-1 (задача об использовании ресурсов). Для осущест-
вления I различных технологических процессов Ti, ..., Ti заводу тре-
буется т видов ресурсов Si, ..., Sm (сырье, топливо, материалы, ин-
струмент и т. п.). Запасы ресурсов каждого вида ограничены и рав-
ны Ьи ...» Ьт. Известен расход ресурсов на единицу продукции по
каждому технологическому процессу. Требуется определить, в каком
количестве выпускать продукцию каждого вида, чтобы доход от реа-
лизации этой продукции был максимальным.
Обозначим через ац расход ресурсов вида Si на единицу про-
дукции вида Tj, а через Cj — доход от реализации единицы продук-
ции вида Tj. Все имеющиеся данные представим в виде табл. 6-1,
положив для конкретности /=3, т=4.
Таблица 6-1
Запйсь исходных данных в задаче об использовании ресурсов
Виды ресурсов Расход ресурсов на единицу продукции Запасы ресурсов
Л Т2
•$1 «11 «12 «13
s2 «21 «22 «23 ^2
«31 «32 «33 ^3
$4 «41 «42 «43
Доход от реа- лизации единицы «1 Сч с3 —
продукции
Обозначим через Xj количество единиц выпускаемой продукции
вида Tj. Ограничениями в этой задаче являются требования, чтобы
расход ресурсов вида на выпуск всех видов продукции не превы-
шал имеющихся запасов
Xj < 6., i = (6-4).
/
Эти ограничения легко превратить в уравнения, введя пере-
менные означающие неиспользованные ресурсы вида Si. При
этом вместо (6-4) получим:
2 a.j х. + xl+i =bit i = 1, m. (6-5)
/
233
Доход от реализации выпущенной продукции
?' = 2CjXj- (6’6)
/
Оптимальным планом выпуска продукции будет такое неотрица-
тельное решение системы уравнений (6-5), при котором целевая
функция (6-6) будет максимальна.
Пример 6-2 (задача о распределении выпуска продукции по
предприятиям). План отрасли предусматривает за время Т выпуск
следующих видов продукции:
в количестве 2Vf штук;
Л2 в количестве N2 штук;
Ai в количестве Ni штук.
Эти виды продукции могут выпускаться на г однородных пред-
приятиях 771, ...» 77г. Предполагаем, что ни одно предприятие не мо-
жет одновременно выпускать несколько видов продукции. Кроме то-
го, задано:
ац — количество продукции Л г, выпускаемой на предприятии 77;
в единицу времени;
btj—стоимость единицы продукции вида Лъ выпущенной на
предприятии П3;
х13— время работы предприятия 77; по выпуску продукции Лг.
Требуется найти такие значения хц, при которых стоимость вы-
пускаемой продукции будет минимальной.
Ограничения:
1) время работы каждого предприятия не должно превышать Т
j = -r; (6-7)
i
2) количество выпускаемой продукции должно соответствовать
номенклатуре
^aijxij=Ni’ i = T^- <6’8)
7
Целевая функция будет представлять собой общую стоимость
выпущенной продукции. Если принять во внимание, что величина
аг}Ь1зХгз представляет собой стоимость части продукции Ль выпу-
скаемой предприятием П3, то общая стоимость выпускаемой про-
дукции
* = 21X?oV <6-9)
7 I
Согласно условиям задачи эта величина должна быть миними-
зирована при выполнении ограничений (6-7) и (6-8).
* Пример 6-3 (транспортная задача). В пунктах Plt...,Pi имеется
однородный груз в количествах ah ..., ai, Его необходимо перевезти
в пункты Qi, ..., Qr в количествах bi, ..., br так, чтобы общая стои-
мость перевозок была минимальна. При этом предполагается, что
количество требуемого груза равно имеющимся запасам:
2а; = 2^. («-io)
i i
234
..Обозначим через количество груза, перевозимого из пункта
Рл в пункт Qj, а через сц — стоимость перевозки единицы этого гру-
за. В задаче имеются следующие ограничения:
1) количество груза, .отправляемого из пункта Рг на все пункты
назначения, должно быть равно имеющимся запасам ас
2^ . = а., I = Т77; (6-11)
/
2) количество груза, прибываемого в Qj со всех пунктов от-
правления, должно равняться потребности Ь,:
^ixl. = bj, j = Tr.' (6-12)
i
Целевая функция определяет полную стоимость перевозки всех
грузов
/ i
Формулировка задачи остается прежней, если количество име-
ющегося груза превышает потребности. При этом вводится фиктив-
ная станция назначения Qr+i, на которую отправляется излишек гру-
за /ъ+1 со стоимостью перевозок с2)Г+1 = 0, i=l, /.
Пример 6-4 (задача о выборе оптимального варианта аппарату-
ры). Требуется спроектировать специализированное цифровое вы-
числительное устройство, которое должно выполнять последователь-
но г математических операций и в соответствии с этим состоит из г
последовательных блоков. Имеется I различных вариантов выполне-
ния каждого блока: на электронных лампах, полупроводниковых
элементах, феррит-транзисторных элементах, микромодулях и т. п.
Заданы ограничения в отношении максимальной стоимости (X), га-
баритов (У) и максимального времени производства операций (Z).
Требуется выбрать вариант, наиболее выгодный с точки зрения по-
ставленных требований.
Обозначим через хг, yi и Zi соответственно стоимость, габариты
и время производства операции для t-ro блока. Тогда имеющиеся
ограничения могут быть записаны в виде
< a, ^yt < Y, 2гг<г. (6-14)
i i i
Величины Xi, yi и Zi зависят от варианта выполнения блока, а
значит, являются элементами следующих множеств:
.............хц}’ У^{Уц> ......ги\< <615)
где величины хц, уц, ztj означают соответственно стоимость, габа-
риты и время производства операции для г-го блока при /-м вариан-
те его исполнения.
Если Ci, С2, с3 — коэффициенты, характеризующие относитель-
ную ценность уменьшения стоимости, габаритов и времени производ-
ства операций, то условие оптимального варианта аппаратуры запи-
шется в виде
q = Ci ^Xi+c2^yi+c3^Zi^min. (6-16)
i i i
235
Особенностью данной задачи, отличающей ее от первоначально
сформулированной задачи линейного программирования, является то,
что хотя ограничения (6-14) и целевая функция (6-16) являются ли-
нейными, однако переменные хг, yi, хг могут принимать не любые
неотрицательные значения, а лишь значения из конечных множеств
(6-15). Поэтому обычные методы линейного программирования к
данной задаче неприменимы и ее следует решать методами целочис-
ленного (дискретного) программирования.
в) Геометрическая интерпретация задачи линейного
программирования
Для того чтобы получить более полное представле-
ние о задаче линейного программирования, дадим гео-
метрическую интерпретацию следующей задачи. Имеет-
ся система уравнений
— 2Х[ -j- т — 2*
%! — 2х2 + х^ = 2; .
+ х2 + Х5 = 5 ,
и целевая функция
q = x2 — xv
(6-17)
(6-18)
Требуется найти неотрицательные значения перемен-
ных, удовлетворяющих уравнениям (6-17) и обращаю-
щих в минимум целевую функцию (6-18). Нам будет
удобней дать правила решения задачи линейного прог-
раммирования для случая максимизации целевой функ-
ции, что легко сделать, взяв в качестве целевой функции
выражение
q' — q Ъ — х2. (6-19)
В данном примере число уравнений т = 3, а число
неизвестных /1 = 5, так что имеется т = 3 базисных пере-
менных и п—т = 2 свободных переменных. То что сво-
бодных переменных только две, дает возможность про-
иллюстрировать решение задачи геометрически в дву-
мерном пространстве, т. е. на плоскости.
Систему трех уравнений (6-17) можно разрешить от-
носительно трех переменных, например х3, и х5, выра-
зив их через Х\ и х2. При этом получим:
х.} = 2 + 2хх — х2;
х4 = 2 — Xi + 2х2;
х5 = 5 — xL — х2.
(6-20)
236
По условию задачи линейного программирования пе-
ременные могут принимать только неотрицательные зна-
чения, т. е. областью допустимых значений переменных
будет область, определяемая условиями
хг 0, i = 1,5,
(6-21)
Каждое из неравенств (6-21) определяет некоторую
полуплоскость на плоскости (Хь Хг). Так, неравенство
Рис. 6-1. Полуплос-
Рис. 6-2. Многоугопьник допу-
стимых решений
кость.
Xi^O определяет верхнюю полуплоскость, а неравенство
Хз^О определяет полуплоскость, лежащую по одну'сто-
рону от прямой 24-2X1—Х2=0, а именно ту, которая со-
держит начало координат, что легко проверяется подста-
новкой в первое из неравенств (6-20) координат точки
(0, 0). Область, соответствующая х3<0, является запре-
щенной и ее удобно отметить штриховкой, как показано
на рис. 6-1.
Подобные построения для всех х, приведены на
рис. 6-2. На этом рисунке прямые, соответствующие ус-
ловию Xi=0, i=1-7-5, отмечены цифрой (i). Запрещен-
ные области, соответствующие х,<0, отмечены штри-
ховкой. Как видно из рис. 6-2, допустимой областью зна-
чений переменных Х\ и х2 является затемненная область,
представляющая собой многоугольник Oabcd. Важно от-
метить, что многоугольник допустимых решений являет-
ся замкнутым и выпуклым, так как представляет собой
пересечение выпуклых областей, определяемых усло-
виями х,^0.
237
Проведенное построение позволяет дать геометриче-
скую интерпретацию базисному решению. Так как каж-
дая прямая на рис. 6-2 соответствует обращению в нуль
одной из переменных, то в точках пересечения двух пря-
мых будут обращаться в нуль две, т. е. п—т переменных.
Но п—т есть число свободных переменных, обращение
которых в нуль соответствует базисному решению. Та-
ким образом, точки пересечения прямых Х/=0, i=l-~5
определяют базисные решения задачи линейного про-
граммирования.
Среди базисных решений имеются такие, которые не
принадлежат области допустимых решений. Это недо-
пустимые базисные решения. Области допустимых реше-
ний принадлежат только те точки пересечения прямых
Л'/=0, которые являются вершинами многоугольника до-
пустимых решений. Следовательно, вершины многоуголь-
ника допустимых решений соответствуют допустимым
базисным решениям.
Рассмотрим теперь условие обращения в максимум
целевой функции (6-19). Геометрически при любом q'
выражение (6-19) определяет прямую, проведенную под
углом 45° к оси абсцисс, причем увеличению q' соответ-
ствует перемещение прямой в направлении стрелки, по-
казанной на рис. 6-2. Эта прямая будет совместна с до-
пустимым решением задачи только в том случае, если
она имеет общие точки с областью допустимых реше-
ний. Максимальное значение qf получится при крайнем
положении прямой, когда она обращается в опорную
прямую к области допустимых решений (пунктир на
рис. 6-2). Однако опорная прямая к выпуклому много-
угольнику обязательно проходит хотя бы через одну из
его вершин, которые, как мы видели, соответствуют до-
пустимым базисным решениям.
Таким образом, мы приходим к очень важному выво-
ду, что решение задачи линейного программирования,
обращающее в максимум целевую функцию q', обяза-
тельно лежит среди допустимых базисных решений.
Этот вывод легко обобщается на случай произволь-
ных т и п, когда п—т>2. В этом случае уравнения ви-
да (6-20) определяют гиперплоскости в (я—т)-мерном
пространстве, а условия (6-21) определяют полупро-
странства, ограниченные гиперплоскостями. При этом
допустимое множество будет представлять собой замк-
нутый выпуклый многогранник. Оно замкнуто, так как
238
условия (6-21) заданы в виде нестрогих неравенств. Оно
выпукло, так как является пересечением выпуклых мно-
жеств, какими являются ограничивающие его полупро-
странства.
Целевая функция (6-2) линейна: поэтому ее можно
считать как вогнутой, так и выпуклой. Следовательно,
оптимум в задаче линейного программирования всегда
единственный, а значит, и глобальный. Функция q(x) не
имеет стационарных точек. Следовательно, оптимум до-
стигается на границе допустимого множества.
Среди граничных точек допустимого множества су-
ществуют крайние точки, являющиеся пересечением от-
дельных граней, т. е. представляющие собой базисные
решения. Особенность крайних точек в том, что они не
могут быть представлены в виде выпуклой комбинации
других точек множества.
Допустим, что максимум сх достигается в граничной
точке х, которая не является крайней. Представим эту
точку в виде выпуклой комбинации минимального числа
крайних точек, так чтобы в это представление не вхо-
дили крайние точки с нулевыми весами. Пусть это будут
точки Xi, ..., хт. Тогда х=2ад, где ^/>0, =
i i
При этом
сх = С 2 wi = 2 Wi (СХ/)ф
i i
Пусть в точке xk значение cxk будет наибольшим из
всех крайних точек. Обозначим это значение через v.
Правая часть выражения для сх не уменьшится, если
все сх/ заменить на и. Следовательно,
СХ < V.
Если сх<и, то оптимальной точкой является не х, а
х/<. Случай же cx=v может быть только тогда, когда
оптимум достигается во всех рассмотренных крайних
точках.
Таким образом, оптимум в задаче линейного прог*
раммирования достигается либо в одной крайней точке,
либо на множестве крайних точек, а значит, и на любой
выпуклой комбинации этих точек. Это означает, что ре-
шение задачи линейного программирования обязательно
лежит среди допустимых базисных решений.
Полученный вывод позволяет наметить путь решения
задачи линейного программирования. Поскольку реше-
239
ние должно находиться среди допустимых базисных ре-
шений, число которых конечно, то можно найти все до-
пустимые базисные решения и для каждого из них вы-
числить значение q'. Окончательным решением явится
то из найденных решений, для которого значение q' бу-
дет максимально.
Такой путь решения задачи хотя и возможен, но
весьма трудоемок, так как число допустимых базисных
решений может быть весьма большим. Однако сущест-
вуют рациональные способы последовательного перебо-
ра базисных решений, которые позволяют рассматривать
не все допустимые базисные решения, а их минимальное
число. Одним из наиболее распространенных методов та-
кого перебора является так называемый симплекс-метод,
который будет рассмотрен в следующем параграфе.
6-2. РЕШЕНИЕ ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
а) Алгебра симплекс-метода
Существо симплекс-метода состоит в следующем.
Прежде всего находится какое-либо допустимое базис-
ное решение. Его можно найти, приняв какие-либо п—т
переменных за свободные, приравняв их нулю и решив
получившуюся систему уравнений (6-1). Если при этом
некоторые из базисных переменных окажутся отрица-
тельными, то нужно выбрать другие свободные перемен-
ные, т. е. перейти к новому базису.
После того как найдено допустимое базисное реше-
ние, проверяется, не достигнут ли уже максимум целе-
вой функции q'. Если нет, то ищут новое допустимое ба-
зисное решение, но не любое, а такое, которое увеличи-
вает значение целевой функции q'. Затем процедура
повторяется. Данный метод довольно быстро приводит к
цели, так как позволяет исключить из рассмотрения боль-
шое число базисных решений, заведомо не обращающих
в максимум целевую функцию.
Разберем этот метод более подробно на рассмотрен-
ном ранее примере.
Обратимся к системе уравнений (6-17), для которой
требуется найти неотрицательное решение, обращающее
вмаксимум целевую функцию (6-19). Поскольку^—т =
= 2, то в качестве свободных можно взять любые две
переменные, например и х2. Положив их равными ну-
лю, из (6-17) находим базисное решение xi=x2=0, х3=
240
=2, х4=2, х5=5, которое является допустимым и при
котором q'=xx—х2=0.
Проверку того, не достигнут ли при найденном реше-
нии максимум целевой функции, можно сделать путем
поиска нового базисного решения, при котором целевая
функция будет больше. Для перехода к новому допусти-
мому базисному решению одну из свободных переменных
Xi или х2 следует сделать базисной. При этом она будет
отличной от нуля, т. е. возрастет. Следовательно, если
какая-либо из свободных переменных входит в выраже-
ние для целевой функции со знаком «+», а значит, при
ее увеличении целевая функция увеличивается, то мак-
симум целевой функции не достигнут и данную перемен-
ную следует превратить в базисную, сделав ее отличной
от нуля.
Однако при возрастании свободной переменной неко-
торые из базисных переменных начнут уменьшаться.
Так как отрицательные значения переменных недопусти-
мы, в качестве новой свободной переменной следует
взять ту из базисных, которая раньше других обратится
при этом в нуль.
В рассматриваемом примере в выражение для целе-
вой функции (6-19) со знаком «+» входит свободная пе-
ременная Xi. Значит, максимум целевой функции не до-
стигнут и переменную Xi следует сделать базисной. Для
определения новой свободной переменной выразим ба-
зисные переменные x3f х4, х5 через свободные, приведя
уравнения (6-17) к виду (6-20). Из этих уравнений ви-
дим, что при х2=0 увеличение не приводит к умень-
шению х3, но уменьшает х4 и %5, так что при Xi = 2 полу-
чаем х4 = 0, х5=3>0. Таким образом, переменную х4
следует сделать свободной переменной, что приводит
нас к новому базису Xi, х3, х$.
Для продолжения решения разрешим систему (6-17)
относительно новых переменных, приведя ее к виду
Xi = 2 + 2х2 — *4; 1
х3 = 6 + Зх2 — 2х4; | (6-22)
хб = 3 — Зх2 + х4. )
Целевую функцию также выразим через новые сво-
бодные переменные х2 и х4:
q = 2 + х2 — х4. (6-23)
16-142
241
(6-24)
(6-25)
Повторяя проведенные ранее рассуждения, приходим
к выводу, что максимум целевой функции не достигнут
и следует свободную переменную х2 перевести в базис-
ную, а базисную переменную х5—в свободную. Новый
базис образуют при этом переменные Xi, х2, х3.
Разрешая уравнения (6-17) относительно новых ба-
зисных переменных, получаем:
. 1 2
х. = 4-----X.-----х5;
1 3 4 3 °
1 , I I
х2 = 1 Н---Хл-----
2 1 з 4 3
х3 = 9 —х4 —х5.
Целевая функция при этом принимает вид:
, о 2 1
7 — 3 —-х4 — *5*
о о
Из выражения (6-25) видим, что при увеличении сво-
бодных переменных х4 и х5 значение q' уменьшается. Сле,-
довательно, при данном базисе достигается максимум
целевой функции q' и решением рассмотренной задачи
будет следующий набор переменных:
х4 = х5 = 0, хх = 4, х2 = I, х3 = 9.
При этом q' =—9 —3.
Рассмотренный метод решения задачи линейного
программирования обладает тем недостатком, что свя-
зан с громоздкими преобразованиями системы линей-
ных уравнений из одной формы в другую. Значительного
упрощения преобразований можно добиться, если пред-
ставлять уравнения в виде таблиц, содержащих коэффи-
циенты при переменных. Переход от одной системы урав-
нений к другой при этом сводится к пересчету коэффи-
циентов в' таблицах, что осуществляется по чисто
формальным правилам, хорошо приспособленным, к тому
же, для решения на ЭВМ.
6) Табличный метод нахождения оптимального решения
При пользовании табличным методом удобцо ввести
специальную форму записи для уравнений (6-1) и целе-
вой функции (6-2). Обозначим через xit t=l, т базис-
ные переменные, а через X;, /=1, п—пг — свободные пе-
ременные. Выразив целевую функцию и базисные пере-
242
менные через свободные, сформулируем задачу линейно-
го программирования в следующем виде:
максимизировать
/ = — q = «оо — 2 а0/ Х1 (6'26)
/=1
при условиях
х\'. = а.о—2ао’х/‘; х". >0. (6-27)
/=1
При такой форме записи задача может быть пред-
ставлена следующей матрицей коэффициентов при пере-
менных:
1 ~Х1-------Хп—т
Я аоо а01 aQ(n~m)
Х1 а10 а11 а1(и-ш)
Хт Lam0 ат 1 ’ * * ат(п-т')_
(6-28)
По виду коэффициентов матрицы (6-28) легко судить,
является ли найденное базисное решение допустимым и,
если оно допустимо, то будет ли оптимальным. Действи-
тельно, замечая, что столбец коэффициентов аг0, i=/=0
представляет собой базисное решение, соответствующее
базису х', ..., х^, а строка коэффициентов а0/, /=И=0
представляет’собой взятые с обратным знаком коэффи-
циенты при свободных переменных в выражении для q',
приходим к выводу, что базисное решение, соответству-
ющее базису xj, х'т, допустимо, если а/0 ^0, /=#0.
Если, кроме того, «о^С, /=/=0, то это базисное решение
является и оптимальным. Очевидно также, что при опти-
мальном базисном решении коэффициент аоо дает зна-
чение q' = q'MQKC =— ?мпн.
Начнем решение задачи с нахождения какого-либо
допустимого базисного решения, которое в общем случае
не является оптимальным. Это базисное решение пред-
ставим таблицей коэффициентов, составленной по типу
матрицы (6-28). Конечно, при этом нет необходимости
переименовывать переменные. Под коэффициентом azj
следует понимать коэффициент, стоящий на пересечении
строки с базисной переменной хг и столбца со свобод-
16
243
ной переменной Xj. Для перехода к лучшему базисному
решению необходимо преобразовать матрицу коэффици-
ентов. Способ такого преобразования сформулируем в
виде системы правил, которые проиллюстрируем на при-
мере задачи, решенной в предыдущем параграфе. Мы не
будем давать строгое обоснование этим правилам. Отме-
тим только, что они в точности соответствуют тем
преобразованиям системы уравнений, которые осущест-
влялись в предыдущем примере и могут быть легко про-
верены путем сопоставления соответствующих преобра-
зований.
Пусть задача линейного программирования дана в
виде системы уравнений (6-17) и целевой функции
(6-19), которую надо максимизировать. Принимая Xi п
х2 за свободные переменные, приведем эту систему урав-
нений и целевую функцию к виду (6-26) и (6-27):
q' = 0 ~(~х1 + х2);
Х3 = 2 ( 2хг+ х2),
*4 = 2 — (*1 — 2^г);
х5 = 5 — + х2).
(6-29)
Матрицу коэффициентов представим в виде
табл. 6-2, а с клетками достаточно крупного размера, в
верхнем левом углу которых запишем коэффициенты
aij уравнений (6-29).
Проверим, не найдено ли уже оптимальное решение,
условием которого является aoj^O, /=#0. Поскольку aoi
(коэффициент при —х1 в выражении для q') отрицате-
лен, то оптимальное решение не найдено и переменную
Xi следует сделать базисной. Выделим столбец, соответ-
ствующий переменной хь сдвоенными линейками. Если
отрицательными окажутся коэффициенты aoj при не-
скольких свободных переменных, то в базисную можно
переводить любую из них.
Определим теперь, какую же из базисных перемен-
ных следует сделать свободной. Очевидно, ту, которая
быстрее обратится в нуль при увеличении Х\. Это будет
та базисная переменная xz, для которой коэффициент в
отмеченном столбце ап>0 и отношение azo/an наимень-
шее. Такой переменной является базисная переменная х4
с а4о=2 и a4i = l. Строку, соответствующую базисной пе-
ременной х4, также отмечаем двойными линейками.
244
Таблица 6-2
Последовательные преобразования таблиц коэффициентов
при решении задачи линейного программирования
Коэффициент а41, стоящий в левом верхнем углу
клетки па пересечении выделенных строки и столбца,
назовем генеральным коэффициентом (взят в рамку).
Обозначим через X величину, обратную генеральному ко-
эффициенту. В нашем случае Х= l/a4i = 1-
Теперь следует заполнить нижние углы каждой клет-
ки. Это делаем по следующим правилам:
1) в клетку на пересечении отмеченных строки и
столбца записываем l/a4i;
2) в клетках выделенной строки записываем верхние
коэффициенты, умноженные на Л (верхние коэффициен-
ты, за исключением генерального коэффициента, выделе-
ны жирным шрифтом);
3) в клетках выделенного столбца записываем верх-
ние коэффициенты, умноженные на —Л (нижние коэф-
фициенты, за исключением клетки с генеральным коэф-
фициентом, выделены жирным шрифтом);
4) в остальных клетках записываем произведение
выделенных жирным шрифтом коэффициентов, на пере-
сечении которых стоит данная клетка.
Затем переходим к заполнению табл. 6-2,6, которая
отличается от табл. 6-2, а тем, что отмеченная свободная
245
переменная Xi стала базисной, а отмеченная базисная
переменная х4 стала свободной. Верхние левые углы кле-
ток табл. 6-2,6 заполняются по следующим правилам:
1) строка и столбец, соответствующие новым свобод-
ной и базисной переменным, заполняются нижними ко-
эффициентами выделенных строки и столбца табл. 6-2, а;
2) в остальные клетки записываются суммы коэффи-
циентов, стоящих в соответствующих клетках
табл. 6-2, а.
Заполненная таким образогл табл. 6-2,6 соответству-
ет матрице коэффициентов (6-28) при новом базисе хь
х3, Х5. Далее вся процедура повторяется.
Поскольку в табл. 6-2,6 коэффициент аог<О, то оп-
тимальное решение не найдено. Следовательно, нужно
согласно приведенным правилам заполнить нижние ле-
вые углы табл. 6-2,6 и перейти к новой табл. 6-2, в, со-
ответствующей базису Xi, х2, х3. В этой таблице коэффи-
циенты ао;, /=#0 положительны, и она дает оптимальное
решение задачи, которое находим по столбцу свободных
членов:
х± = 4; х2 = 1; х3 = 9; х4 = х5 = 0;
д' =—д = 3: д =—3.
“макс “мин ’ “мин
в) Получение начального допустимого базисного решения
В задачах с большим числом уравнений и неизвест-
ных представляет значительные трудности получение на-
чального* допустимого базисного решения. Опишем один
из возможных способов решения этой задачи.
Общий вид системы уравнений, имеющей допустимое
базисное решение х', х^, получим из (6-27), перепи-
сав его в виде
л1—т
/-1
X/ = ato, а/0 0, i = 1, т.
(6-30)
Особенность этой системы уравнений в том, что каж-
дая переменная х', принятая за базисную, входит толь-
ко в одно из уравнений с коэффициентом +1 (или с лю-
бым положительным» коэффициентом, так как обе части
уравнения можно разделить на этот коэффициент). Ес-
ли такие переменные найдутся в каждом из уравнений
системы (6-1), то они и составят первоначальный допу-
246
стимый базис. В рассмотренном примере системы (6-17)
такими переменными оказались х3, х4, х$.
Если в некоторых уравнениях таких переменных нет,
то прибегаем к искусственному приему. Выписываем по
порядку те уравнения с переменными, которые можно
принять за базисные. Обозначим их х{, ..., х', s<_m. В
остальные т—s уравнений вводим искусственные базис-
л
ные переменные x'k, &=s-|-l, ffi, налагая на них усло-
вие x'k^Q. В результате система уравнений принимает
вид:
n—s ___
x'i + Jpaif Xj = al0, i = 1, s;
/=1
л _______
x'k + ZiVi = ^k = s+l,m.
i=i
(6-31)
Для того чтобы полученная система совпала с ис-
ходной, в окончательном решении искусственные пере-
менные должны отсутствовать, т. е. обратиться в нуль.
Для этого они вводятся в выражение для q' с достаточ-
но большими отрицательными коэффициентами.
г) Двойственная задача линейного программирования
Вернемся к задаче распределения ресурсов, рассмот-
ренной в примере 6-1, и зададимся вопросом, какова с
точки зрения предприятия ценность имеющихся в его
распоряжении ресурсов. При решении этого вопроса бу-
дем иметь в виду, что ресурсы, которые предприятие не
может полностью использовать, имеют* для него очень
низкую ценность в том смысле, что предприятие не будет
согласно нести даже небольшие расходы на увеличение
запасов этих ресурсов. Так, дорогое оборудование, не ис-
пользуемое в технологическом процессе, имеет для пред-
приятия нулевую ценность. Наибольшую ценность будут,
очевидно, иметь те ресурсы, которые в наибольшей степе-
ни ограничивают выпуск продукции, а следовательно, и
доход предприятия и на увеличение запасов которых
предприятие согласно понести значительные расходы.
Поэтому можно считать, что каждый вид ресурса об-
ладает некоторой «теневой ценой» [10], определяющей
247
ценность данного ресурса для предприятия с точки зре-
ния дохода от реализации выпускаемой продукции и за-
висящей от наличного запаса этого ресурса и потребнос-
ти в нем для выпуска продукции.
Если предприятие по каким-либо причинам ограничи-
вается одним технологическим процессом, требующий
больших затрат некоторого ресурса, запасы которого ог<
раничены, то теневая цена этого ресурса будет великан
Однако установленные в соответствии с этим технологи'
ческим процессом теневые цены не будут наилучшими,
так как введение других технологических процессов поз-
волит более рационально использовать все запасы ресур-
сов. Следовательно, существуют оптимальные теневые
цены, которые соответствуют максимальному доходу
предприятия, т. е. оптимальному распределению ресур-
сов. В связи с этим в экономической литературе [46] оп-
тимальные теневые цены называют объективно обуслов-
ленными или оптимальными оценками. Как видим, опре-
деление оптимальных теневых цен оказывается тесно
связанным с задачей оптимального распределения ресур-
сов, т. е. с задачей линейного программирования, описы-
ваемой системой уравнений (6-5) и целевой функцией
(6-6). Однако для определения оптимальных теневых
цен можно составить самостоятельную задачу линейного
программирования.
Обозначим через щ теневую цену единицы ресурса
Величины щ должны быть такими, чтобы теневая це-
на ресурсов, используемых в любом технологическом
процессе, не была меньше получаемого дохода. Восполь-
зовавшись обозначениями примера 6-1 и данными
табл. 6-1, запишем это условие в виде
m ____
V а„ и, > Cj, j = ТГ7. (6-32)
Если ввести переменные um+j^0, представляющие со-
бой превышение теневой цены единицы продукции над
доходами от ее реализации, то система неравенств
(6-32) превращается в систему уравнений
/п
2 аи ui ~ u'„+i= сг i= <6'33)
1=1
248
Оптимальными теневыми ценами будем считать та-
кие, которые минимизируют общую стоимость ресурсов,
т. е. величину
т
= (6-34)
Система ограничений (6-32) совместно с целевой
функцией (6-34) представляет собой новую задачу ли-
нейного программирования, получившую название двой-
ственной задачи по отношению к задаче в примере 6-1,
которую называют прямой или основной задачей линей-
ного программирования.
Нетрудно заметить, что прямая и двойственная зада-
чи оказываются тесно связанными между собой. Эта
связь проявляется в следующем:
если прямая задача является задачей максимизации
целевой функции, то двойственная задача является за-
дачей минимизации;
коэффициенты целевой функции в прямой задаче яв-
ляются свободными членами в ограничениях двойствен-
ной задачи;
свободные члены из ограничений прямой задачи ста-
новятся коэффициентами целевой функции в двойствен-
ной задаче;
коэффициенты при переменных в ограничениях двой-
ственной задачи представляют собой столбцы таблицы
коэффициентов прямой задачи;
знаки неравенств в ограничениях меняются на проти-
воположные.
Существует тесная связь между решениями прямой и
двойственной задач линейного программирования. Для
установления этой связи запишем уравнения прямой и
двойственной задач в иной форме.
Примем в прямой задаче переменные Xi, ..., Xi за сво-
бодные и сформулируем ее в следующем виде:
максимизировать
<7'=0-2(-<j)x, (6-35)
/=1
при условиях
*/+.=bi - 2aii Xj’1=(6’36)
/=1
249
Этой задаче соответствует матрица вида
1 —Хх ••• — х,
q' 0 — • • • с,
х/+1 ьг аи ••• аи
Xl+m _ ат1 ' ' ‘ ат! _
(6-37)
В двойственной задаче примем за свободные пере-
менные щ, .... ит и сформулируем ее в следующем виде:
минимизировать
т
q* = O + ^biUi
1=1
при условиях
т ___
um+i=-ci + ^aijui> /= !- Z-
i=i
(6-38)
(6-39)
Этой задаче соответствует матрица вида
Как видим, столбцы матрицы (6-40) являются стро-
ками матрицы (6-37). Следовательно, и прямую, и двой-
ственную задачу можем описать одной и той же матри-
цей (6-37), в которой, однако, должно быть установлено
следующее соответствие между прямыми и двойственны-
ми переменными:
X/ < >• Um-i-j, j— 1, I',
xt+t i = 1, т.
(6-41)
Следует отметить, что любое преобразование матри-
цы (6-37) по рассмотренным ранее правилам приведет к
новой матрице, которая также будет описывать как пря-
мую, так и двойственную задачу. Следовательно, и мат-
250
рица самого общего вида (6-28) может служить для опи-
сания как прямой, так и двойственной задачи линейного
программирования. Если при этом элементы первого
столбца (за исключением, может быть, аоо) положи-
тельны, то матрица соответствует допустимому базисно-
му решению прямой задачи. Если положительны элемен-
ты первой строки (за исключением, быть может, аоо), то
матрица соответствует допустимому решению двойст-
венной задачи. Если же в матрице (6-28) положительны
элементы как первого столбца, так и верхней строки (за
исключением, быть может, аоо), то матрица соответству-
ет оптимальному решению как прямой, так и двойст-
венной задачи. При этом коэффициент аоо дает значе-
ние целевой функции, которое при оптимальном решении
совпадает как для прямой, так и для двойственной за-
дачи:
9макс 9мин« (6-42)
Пример 6-5. Задача на распределение ресурсов задана табл. 6-3.
Таблица 6-3
Исходные данные
Виды ресурсов Расход ресурсов на единицу продукции Запасы ресурсов Остатки ресурсов при опти- 'мальном плане Теневые цены
т\ Л 1 Гз
Si 2 1 1 25 5,5 0
$2 1 1 1 14 0 3,0
S3 0 4 2 19 0 0,5
s4 3 0 1 24 0 1,0
Доход от реали- зации единицы продукции 6 5 5 — — —
Оптимальный план 5,5 1,0 7,5 — — —
В добавочных графах этой таблицы приведено решение прямой
и двойственной задач линейного программирования, т. е. указан оп-
тимальный план распределения ресурсов, остатки ресурсов при оп-
тимальном плане и теневые цены. Из таблицы видно, что ресурсы
вида Si, имеющиеся в избытке, имеют нулевую цепу. Наивысшую
цену имеют ресурсы S2, которые требуются для всех технологических
процессов и запасы которых невелики.
251
Отметим в заключение, что теневые цены могут в ря-
де случаев играть важную роль как инструмент управ-
ления. Так, на крупном предприятии или в отрасли про-
мышленности, где многие решения принимаются само-
стоятельно отделами и производственными группами,
бывает затруднительно информировать каждый отдел о
решениях, принимаемых другими отделами. В этом слу-
чае теневые цены могут служить каждому отделу хоро-
шим ориентиром для принятия решений, близких к оп-
тимальным с точки зрения интересов всего предприятия
в целом.
д) Понятие о целочисленном программировании
Во многих задачах линейною программирования пе-
ременные являются неделимыми на части величинами.
Так, предприятие не может выпустить 7,5 самолета, 4,8
турбины и т. п. В таких задачах к условиям (6-1) и (6-2)
добавляется требование, чтобы переменные X/ выража-
лись целыми числами или, как в примере 6-4, были эле-
ментами конечного множества. Геометрически это озна-
чает, что допустимыми решениями будет не вся область
допустимых решений, определяемая ограничениями
(6-1), а лишь отдельные дискретные точки этой области,
как показано на рис. 6-3.
Можно, конечно, попытаться решить подобную зада-
чу, не считаясь с условием целочисленности, и найти ре-
шение, определяемое на рис. 6-3 точкой У, а затем округ-
лить это решение до ближайших целых чисел, получив,
таким образом, в качестве целочисленного решения точ-
ку 2. Однако при этом может получиться решение, дале-
кое от оптимального. Так, на рис. 6-3 оптимальным це-
лочисленным решением будет служить точка 3.
Существует ряд методов решения задачи целочис-
ленного программирования, из которых наиболее рас-
пространенным является метод Гомори. Не останавли-
ваясь на вычислительной стороне метода Гомори, с ко-
торой можно познакомиться в [41 и 40], укажем лишь
общую идею этого метода.
Метод Гомори основан на применении симплекс-ме-
тода, с помощью которого ищется оптимальное решение,
не учитывающее целочисленности или дискретности пе-
ременных. Если это решение оказалось нецелочислен-
ным, то вводится добавочное ограничение, геометричес-
252
ки представляющее собой линию ab на рис. 6-3, которая
отсекает часть области допустимых решений вместе с
полученным оптимальным решением, не содержащую ни
одной целочисленной допустимой точки. При этом доба-
вочном ограничении найденное оптимальное решение
окажется вне новой области допустимых решений, т. е.
будет недопустимым. Поэтому задача решается снова
Рис. 6-3. Множество
допустимых решений
в задаче целочислен-
ного программирова-
ния.
симплекс-методом и находится оптимальное решение уже
для новой области допустимых решений. Если это новое
решение опять не является целочисленным, то процеду-
ра повторяется.
За последнее время для решения задачи целочислен-
ного программирования успешно применяются комбина-
торные методы, среди которых важнейшим является ме-
тод ветвей и границ [41].
6-3. НЕЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ
а) Постановка задачи
В задаче нелинейного программирования (НЛП) тре-
буется найти значение многомерной переменной х =
= (хР), %(п), минимизирующее целевую функцию q(x)
при условиях, когда на переменную х наложены ограни-
чения типа неравенств
/г(х)<0, i = T7m, (6-43)
а переменные т. е. компоненты вектора х, неотрица-
тельны:
х(/) > 0. (6-44)
Иногда в формулировке задачи ограничения (6-43)
имеют противоположные знаки неравенств. Учитывая,
253
однако, что если Л(х)^0, то — /\(х)<^0, всегда можно
свести задачу к неравенствам одного знака. Если неко-
торые ограничения входят в задачу со знаком равенства,
например, ф(х)=0, то их можно представить в виде па-
ры неравенств ф(х)^0, —ф(х)<^0, сохранив тем самым
типовую формулировку задачи.
При решении задач оптимизации очень важно иметь
необходимые условия, которым должна удовлетворять
точка, оптимизирующая целевую функцию и удовлетво-
ряющая всем ограничениям. Хотя такие условия обычно
не являются достаточными, но знание их существенно
облегчает поиск оптимального решения.
В классической задаче оптимизации без ограничений'
на переменные необходимыми условиями оптимума яв-
лялись условия (5-41), определяющие стационарные точ-
ки целевой функции ?(х). В задаче НЛП аналогичными
условиями являются условия Куна — Таккера. Однако
прежде чем их сформулировать, рассмотрим более про-
стой вариант задачи НЛП.
б) Ограничения типа равенств и неотрицательность
переменных
Простейшей задачей НЛП является задача миними-
зации д(х) с ограничениями типа равенств
fj (х) = 0, / = 1, т (6-45)
и с требованием неотрицательности переменных хи\ i —
= 1, /г, что в векторной форме может быть записано в
виде
х > 0. (6-46)
Данную задачу можно рассматривать как расшире-
ние рассмотренной в § 5-6, е) задачи на условный мини-
мум на случай неотрицательности переменных и для ее
анализа использовать уже знакомый математический
аппарат, а именно, функцию Лагранжа L(x, X), опреде-
ленную соотношением (5-46).
Поскольку в рассматриваемой задаче имеют место
ограничения типа равенств, то остаются справедливыми
и соотношения (5-47), из которых вытекает, что в точке
х оптимального решения выполняется соотношение
L (х, X) = 7(х).
(6-47)
254
Поэтому рассмотрение особенностей функции Лаг-
ранжа в окрестности точки оптимального решения мож-
но заменить исследованием целевой функции ?(х).
Пусть х — точка, соответствующая оптимальному ре-
шению. Она может быть или внутренней или граничной
точкой допустимой области х^О, т. е. каждая из ее ком-
понент, например х(/), будет удовлетворять либо условию
либо условию х(/)=0.
Если х<0 находится не на границе допустимой облас-
ти, т. е. х(0>0, то отклонения от точки х возможны как
в сторону увеличения, так и в сторону уменьшения х(,).
Но поскольку х — оптимальная точка, то должно быть
dq(x)/dx^=0.
Если х<0 лежит на границе допустимой области, т. е.
x<z)=0, то отклонения от оптимальной точки возможны
только в сторону увеличения и при этом q(x) должна
увеличиваться, так что dq(x)/dxW>0.
Обобщая эти случаи с учетом соотношения (6-47) и
добавляя к ним соотношений (5-48), необходимые усло-
вия того, что точка х является решением рассмотренной
задачи оптимизации, можем записать в виде
dL(x, X)
дх{1)
= 0, если х(1) > 0;
> 0, если x(i) = 0, i = 1, п\
(6-48)
?Hx.J), = 0>/ = 1)/га, (6-49)
в) Условия Куна — Танкера
Сформулируем теперь необходимые условия того,
что в точке х достигается оптимальное решение задачи
НЛП, т. е. минимизируется ^(х) при ограничениях
(6-43) и (6-44). Предварительно упростим задачу, заме-
нив каждое ограничение — неравенство типа (6-43) на
ограничение — равенство путем введения добавочных
неотрицательных переменных г,. При этом ограничения
на задачу запишутся в виде
/.(х)4-г> = 0, г7>0, х(1)>0, (6-50)
причем
z\ >0, если /Дх)<0;
= 0, если fy(x) = 0.
(6-51)
Как видим, данная задача свелась к уже рассмотрен-
ной задаче с ограничениями типа равенств, с п-\~т пере-
255
менными = п и с функцией Лагранжа,
имеющей вид
т
Цг, х, X) = ?(х) + (6-52)
/=1
Условия, которым должны удовлетворять значения
Zj и х(<) в точке оптимального решения, будут выражать-
ся соотношениями (6-48) и (6-49) применительно к фун-
кции L(z, х, X).
Условие (6-48), примененное к переменной Zj, дает:
dL(z, х, X) _ (= 0, если > 0;
1 (> 0, если z} = 0.
(6-53)
Это соотношение вводит ограничения на множители
Лагранжа X,. Из него следует, что в функцию L(z, х, X)
ограничения типа неравенств входить не будут, так как
для них Xj=O, а ограничения типа равенств, соответству-
ющие Zj=O, будут входить с Xj>0. Поэтому функция
Лагранжа L(z, х, К) фактически совпадает с функцией
Лагранжа L(x, X), определяемой соотношением (5-46).
При этом условие оптимальности (6-48) применительно
к переменным х*'* сохраняет свой вид.
Принимая также во внимание, что dL(x, X)/dXj =
и учитывая ограничения на Xj, вытекающие из
(6-53), окончательные условия, которым должна удов-
летворять точка х, являющаяся решением общей задачи
НЛП, запишем в виде
dL (х, X) /> 0, если х(0 = 0;
дхм [= 0, если х(1)> 0, i = I, п;
dL(x, X) (< 0, если Xj = 0;
дХ_,- I— 0, если К} > 0, / = 1, т.
(6-54)
(6-55)
Условия (6-54) и (6-55) называются условиями
Куна — Таккера.
Условия Куна — Таккера иногда записывают иначе.
Введем обозначения:
дЦх, X) . dL(x, X) ==_
Pi' dkj qi'
(6-56)
256
Тогда соотношения (6-54), (6-55) запишутся в виде
>0, р, > 0, х(,> р. = 0, i — 1, га; 1 ,с
‘ I (6-57)
Ху>-0, Х/<7/ = 0,/= 1, m. J
Другая интерпретация условий Куна — Таккера свя-
зана с понятием седловой точки функции Лагранжа
L(x, X). Седловой точкой функции L(x, X) называется
такая точка, в которой функция L(x, X) достигает мини-
мума по х и максимума по X, т. е. точка (х0, Хо), удовлет-
воряющая условиям
L (х0, X) < L (Хо, Хо) < L (х, Хо). (6-58)
Условия, которым должна удовлетворять седловая
точка функции L(x, X), совпадают с условиями Куна —
Таккера, Поэтому решение задачи НЛП может рассмат-
риваться как задача нахождения седловых точек функ-
ции Лагранжа.
К сожалению, для задачи НЛП общего вида не най-
дено эффективного вычислительного метода. Поэтому
мы ограничимся рассмотрением лишь одной из задач,
для которой такой метод разработан.
г) Квадратичное программирование
Задачей квадратичного программирования называет-
ся задача НЛП, в которой минимизируется сумма ли-
нейной и квадратичной форм при ограничениях вида ли-
нейных неравенств и неотрицательности переменных. В
матричной форме эта задача имеет вид:
q (х) = сх 4- х' Dx = min,
Ax<b, х>0.
(6-59)
Предполагается, что задача имеет пг ограничений и
п переменных, так что матрица А имеет размеры /пХп;
D — размеры п\п; b есть /n-мерный вектор, х и с явля-
ются «-мерными векторами. В развернутой форме эти
соотношения имеют вид:
</(х) + ^^djkx(l)xw = min;
z i *
x(,) >0, i = 1, n. (6-60)
k
17-142
257
Для данной задачи, как и вообще для задачи НЛП,
эффективный вычислительный метод можно найти толь-
ко в том случае, если целевая функция имеет единствен-
ный оптимум, который и является глобальным. Мы ог-
раничимся рассмотрением случая, когда квадратичная
форма является положительно определенной, а значит,
выпуклой. Линейная форма — также выпуклая функция.
Поэтому целевая функция будет выпуклой. В этом слу-
чае необходимые условия Куна — Таккера будут и до-
статочными условиями существования единственного
оптимума.
Для записи условий Куна — Таккера введем в рас-
смотрение функцию Лагранжа. В соответствии с (5-46)
и (6-60) получаем:
/ / k
+ (6‘61)
i \ * )
Производные от L(x, А) по х<‘) и в соответствии с
обозначениями (6-56) запишутся в виде
+ 2 dih йп = Pi’1= 1 ’
к i
—2 xW = qst 1=
к
(6-62)
Условия Куна — Таккера требуют найти решение
этих уравнений при удовлетворении требований (6-57),
которые удобно записать в виде
Pi = Q^jq. = Q. х(О>0;
Х7>0; /=1,п, / = 1,/тг. (6-63)
Система (6-62) содержит п-\-т уравнений с 2(п+^и)
переменными kj, pi, qi, из которых п-\-т являются
свободными и могут быть положены равными нулю. Ос-
тальные переменные образуют при этом базисное реше-
ние, которое является допустимым, если выполняются
условия (6-63).
Если число переменных в задаче невелико, то можно
попытаться «угадать» допустимое базисное решение, по-
ложив произвольные п-\-т переменных свободными,
приравняв их нулю и, решив систему (6-62), найти зна-
258
чения базисных переменных. Однако при этом нет ника-
кой гарантии, что полученные значения переменных бу-
дут удовлетворять условиям (6-63). Поэтому попытки
«угадать» допустимое базисное решение приходится
проводить многократно.
Если допустимое базисное решение найдено, то его
улучшение, т. е. переход к новому лучшему базису, про-
изводят на основании симплекс-метода, аналогично рас-
смотренному в задаче линейного программирования. От-
личие здесь заключается в том, что при выборе новой ба-
зисной переменной необходимо проверять выполнение
условий х^)рг = 0, = которые означают, что если в
базисе имеется х(г) или Aj, то в него не может быть вве-
дено pi или qj соответственно.
При большом числе переменных метод «угадыва-
ния» допустимого базисного решения становится чрезвы-
чайно трудоемким. В этом случае можно использовать
эффективные систематические методы получения допу-
стимого базисного решения, изложенные в [39, 48].
Если в формулировке задачи квадратичного програм-
мирования (6-59) линейные ограничения заданы в виде
равенств Ах=Ь, то условия Куна — Таккера запишутся
в виде соотношений (6-48), (6-49). Условие (6-49) озна-
чает, что в соотношениях (6-62) и (6-63) должно быть
принято <?j = 0, / = 1, т,. Это значительно упрощает ре-
шение задачи, так как применение симплекс-метода по-
требует проверки только условия x(i)p/=0.
6-4. ИТЕРАТИВНЫЕ МЕТОДЫ ПОИСКА ОПТИМУМА
а) Постановка задачи
Ограниченные возможности применения симплексно-
го метода в задачах со сложными видами ограничений и
произвольным видом целевой функции привело к широ-
кому использованию итеративных методов поиска опти-
мального решения, в основе которых лежат понятия гра-
диента целевой функции ?(х).
Градиентом функции ?(х), обозначаемым grad^(x)
или V^(x), называется вектор, величина которого опре-
деляет скорость изменения функции ?(х), а направление
совпадает с направлением наибольшего возрастания
этой функции. Вектор —V#(x), указывающий направле-
ние наибольшего убывания функции г?(х), называется
17*
259
антиградиентом функции 47 (х). Пусть х= (х<*\ х<п>).
Тогда градиент функции q(x) будет представлять собой
вектор-столбец вида
V? (х)= grad q (х) = . (6-64)
Условие того, что точка х является стационарной
точкой функции <?(х), с помощью градиента запишется в
виде
V<7 (х) = 0. (6-65)
Для обоснования итерационных алгоритмов оптими-
зации разложим функцию q(x) в ряд Тейлора в окрест-
ности точки оптимума х*, которую считаем стационар-
ной точкой. Воспользовавшись соотношением (3-94), по-
лучим:
9(х) = q(х*) 4- -у- Дх0), (6-66)
k i
где Дх=х*—х — отклонение от точки оптимума;
д =а = aW—l . (6-67)
ki 1к dxw дх{!) |х=х*
Беря частные производные от q(x) по х<’\ i=l, п,
находим составляющие градиента функции q(x) в рас-
сматриваемой точке х:
(=М. (6-68)
ft
Для градиента функции q(x) при этом получаем вы-
ражение
yq (х) = — А Д х = — А (х * — х), (6-69)
где А — квадратная симметричная матрица размером
«Х” с элементами akj, определяемыми соотношением
(6-67). Разрешая систему уравнений (6-69) относитель-
но х*, получаем:
х* = х — A-1 (х). (6-70)
Если бы разложение (6-66) было точным представле-
нием q(x) и существовали бы простые методы определе-
ния матрицы А, то значение х* можно было бы найти
непосредственно по формуле (6-70). В большинстве
практических задач эти условия обычно не выполняются.
260
Однако если заменить неизвестную матрицу А-1 на
матрицу Г с элементами уы, то можно надеяться, что
величина х—rv<?(x) при соответствующем выборе коэф-
фициентов ул, дает значение, более близкое к оптималь-
ному, чем х. При этом открывается возможность много-
шаговой процедуры поиска решения.
Обозначим через хп значение х на n-м. шаге и будем
считать, что элементы матрицы Г можно выбирать на
разных шагах по-разному. Тогда в соответствии с (6-70)
многошаговая процедура поиска оптимума функции
д(х) запишется в виде
хп+1 = Х„- Г„ V? (6-71)
Для того чтобы последовательность значений хп при-
водила к оптимальному решению, коэффициенты матри-
цы Г„ должны удовлетворять определенным условиям,
называемым условиями сходимости. При этом различ-
ные способы выбора Гп приводят к различным поиско-
вым алгоритмам оптимизации.
Иногда алгоритм оптимизации записывают в виде
Хп+1 = Хп + Ахп’ <6’72)
где
Дхп= —Гп v<?(xn)(6-73)
является вектором попра-
вок. На рис. 6-4 представ-
лена структурная схема
алгоритма поиска по вы-
ражениям (6-72) и (6-73).
Иллюстрацию рас-
сматриваемых далее ме-
тодов поиска экстремума
будем производить для
целевой функции q (х),
где х= (х*1), х<2)). Если
стоит задача минимиза-
ции, то целевая функция
может быть изображена
в виде некоторой поверх-
ности, имеющей вид кот-
ловины, изображенной на
рис. 6-5, а и называемой
Рис. 6-4. Структурная схема ал-
горитма поиска оптимума.
261
поверхностью отклика. На рис. 6-5,6 профиль этой кот-
ловины изображен на плоскости в виде линий
равных значений q, представляющих собой сечения кот-
ловины горизонтальными плоскостями. Около каждой
такой линии ставится соответствующее ей значение q.
Рис. 6-5. Поверхность отклика (а) и ее изображение в виде линий
уровня (б).
б) Градиентный метод
Наглядную интерпретацию задачи поиска оптимума
можно получить, если представить себе человека, стоя-
щего на склоне котловины, заросшей густым лесом. Че-
ловек должен опуститься на дно котловины, но не имеет
возможности осмотреть котловину целиком, а может
вести обзор лишь весьма ограниченного участка вблизи
места своего расположения. В этих условиях наиболее
естественным направлением движения является направ-
ление в сторону наибольшей крутизны спуска, т. е. в на-
правлении, противоположном направлению градиента
функции <?(х). Получаемая при этом стратегия, называе-
мая градиентным методом, будет представлять собой
последовательность шагов, каждый из которых содер-
жит две операции:
1) определение направления наибольшей крутизны
спуска, т. е. направления антиградиента функции ^(х);
2) перемещение в выбранном направлении на задан-
ное расстояние.
Характер траектории при градиентном методе приве-
ден на рис. 6-5,6. Ее особенность состоит в том, что каж-
дый шаг происходит в направлении, перпендикулярном
линии постоянного уровня.
262
Математически стратегия градиентного метода полу-
чается, если перемещение Дх(г) на каждом шаге вдоль
каждой из осей будет пропорционально составляющей
градиента dq/dx^ в направлении этой оси:
Дх(0 = - у , i = ~п. (6-74)
Это означает, что в выражении (6-73) матрица Гп
будет диагональной с элементами у на главной диаго-
нали
Гп = у1. (6-75)
При этом поправка на n-м шаге может быть пред-
ставлена в виде
Дхп =—ylv<?(xn) =—yv<?(xn). (6-76)
Стратегия, выражаемая соотношением (6-76), опре-
деляет движение с переменным шагом, так как значение
шага определяется значением градиента V^(x). По-
скольку значение градиента уменьшается на пологих
склонах и вблизи оптимума, то на некоторых участках
шаги будут мелкими, что удлиняет время поиска.
От этого недостатка можно избавиться, если исполь-
зовать градиентную стратегию с постоянным шагом,
значение которого равно у. В этом случае поправка на
каждом шаге определяется по формуле
Дхп=—yD(xn), (6-77)
получающейся из (6-76) заменой вектора градиента
V<?(x) на вектор направления градиента
D(x) = -^%, (6-78)
I WI
где
•••+ЬМГ (6'79>
представляет собой модуль градиента <?(х).
Градиентный метод обладает и рядом других недо-
статков. Для того чтобы двигаться всё время в направ-
лении градиента, шаги должны быть не очень больши-
ми. Поэтому их будет много. Но поскольку на каждом
шаге необходимо заново определять направление гради-
ента, на что требуется значительное время, процесс при-
ближения к оптимуму будет медленным.
263
Добавочные трудности возникают, если точка опти-
мума лежит в овраге или иа длинном узком гребне, как
показано на рис. 6-6. В этом случае градиентный метод
может вызвать прыжки через овраг, так что траектория
хотя и достигнет точки оптимума, но ценой многих неэф-
Рис. 6-6. Градиентный поиск вдоль оврага.
фективных шагов. От этих недостатков свободны некото-
рые другие методы.
в) Метод наискорейшего спуска (подъема)
В отличие от градиентного метода, в котором гради-
ент определяется . на каждом шаге, в методе наискорей-
шего спуска градиент определяется только в начальной
точке и движение в найденном направлении продолжа-
ется одинаковыми шагами до тех пор, пока уменьшаются
значения функции q(x). Если на каком-то шаге q(x)
возросло, то движение в данном направлении прекраща-
ется, последний шаг снимается полностью или наполови-
ну и вычисляется новый градиент функции q(x), а зна-
чит, и новое направление движения. На рис. 6-7, а пока-
зан характер траектории при использовании метода
наискорейшего спуска, а на рис. 6-7,6 приведена струк-
турная схема алгоритма этого метода.
Преимуществом метода наискорейшего спуска явля-
ется его простота, так как на большинстве шагов изме-
ряются только значения функции </(х), а не вычисляют-
ся все элементы вектора градиента. Однако шаг не
264
должен быть большим, чтобы не пропустить оптимум на
данном направлении, следовательно, общее число шагов
будет значительным.
Рис. 6-7. Характер траектории (а) и структурная схема алгоритма
(б) по методу наискорейшего спуска.
г) Алгоритм Ньютона
В тех случаях, когда поверхность отклика достаточ-
но хорошо описывается уравнением второго порядка,
резкое уменьшение числа шагов можно получить, если
воспользоваться алгоритмом Ньютона. При этом пред-
ставление q(x) в виде (6-66) будет достаточно точным
при значительном удалении от точки оптимума и в каче-
стве матрицы Гп можно взять непосредственно матрицу
А. Однако элементы ал,- матрицы А, вычисляемые в точ-
ке оптимума, заранее неизвестны. Тем не менее при до-
статочно хорошей поверхности отклика вторые производ-
ные функции q (х)
(6-80)
вычисленные в произвольной точке х=хп, будут близки
к элементам матрицы А. Обозначая через [V24?X'
Х(М] матрицу вторых производных q(x) в точке хп и
265
используя ее в качестве матрицы Гп, получаем вектор
поправок для алгоритма Ньютона:
=— lv2<7(xn)]-1W(xn)- (6’81)
Если разложение (6-66) является точным представ-
лением функции <?(х), то точка оптимума достигается за
один шаг.
д) Учет ограничений и многоэкстремальные задачи
Ограничения в задачах НЛП приводят к тому, что в
рассматриваемом пространстве появляются гиперповерх-
ности, отделяющие допустимую зону от запретной. Это
Рис. 6-8. Движение вдоль гра-
ницы допустимой области.
создает трудности в применении метода, в которых дви-
жение к точке оптимума происходит в направлении гра-
диента, так как это направление может вести в запрет-
ную зону (рис. 6-8). Однако для достижения точки
оптимума вовсе не обязательно двигаться в направлении
градиента, а можно двигаться по любому направлению,
вдоль которого значение функции <?(х) убывает. Поэто-
му если на пути движения встретилась граница допусти-
мой зоны, то далее следует двигаться вдоль этой грани-
цы, осуществляя на ней поиск оптимума одним из рас-
смотренных методов, как показано на рис. 6-8. После
определения точки оптимума на границе допустимой
зоны следует вновь определить направление градиента.
Может оказаться, что это направление укажет путь
внутрь допустимой области.
Движение вдоль границы допустимой области можно
осуществить и без изменения алгоритма поиска, если
преобразовать функцию q(x) таким образом, чтобы в
запретной зоне значения q(x) резко возрастали. Тогда
граница допустимой области будет иметь вид дна оврага
266
и, если используемый алгоритм дает возможность дви-
гаться вдоль оврага, то он приведет к движению вдоль
границы в нужном направлении.
В задачах с ограничениями возникает и другая труд-
ность, состоящая в том, что движение вдоль границы
приводит лишь к локальному минимуму. Пример подоб-
ного случая для одномерной задачи с ограничением
Рис. 6-9. Ложный опти-
мум на границе допу-
стимой области.
Рис. 6-10. Двухэкстрема-
льная целевая функция.
приведен на рис. 6-9. Если начальная точка
взята правее точки С, то любой из рассмотренных мето-
тов приведет к значению х=Ь, где q(x) достигает лишь
относительного минимума. Абсолютный же минимум по-
лучается при х=а и его можно достичь, лишь начав
движение из точек, лежащих левее точки С. Подобные
задачи получили название многоэкстремальных.
Многоэкстремальные задачи не обязательно связаны
с наличием ограничений. Ложные оптимумы могут быть
связаны со. сложным видом целевой функции <?(х), как
это показано на рис. 6-10.
Поскольку все рассмотренные методы относятся к
классу локальных методов, при которых направление и
величина следующего шага определяются путем изуче-
ния ограниченного участка поверхности q(x) вблизи
точки, являющейся результатом предыдущего шага, то
возможность получения глобального оптимума целиком
зависит от удачного выбора начальной точки. В этих
условиях целесообразным оказывается многократный
поиск экстремума из различных начальных точек. Опи-
шем один из алгоритмов, реализующих этот способ.
267
Случайным образом выбираем x=xt. и из этой точки
ведем поиск локального оптимума qt=q(x*). Значения
х* и <?1 запоминаем. Затем случайным образом выбираем
новое значение х=х2 и отыскиваем соответствующий
локальный оптимум q2=q(x*2). Если q2<qi, то q{ и х*
забываем и храним в памяти q2 и х*2. Если же <7г><7ь то
считаем выбор точки х2 неудачным и забываем резуль-
таты поиска. Затем снова производим случай-
ный выбор точки х и поиск локального оптимума и
т. д. Найденное в конце каждого этапа значение q(x*)
запоминаем, если оно лучше хранящегося в памяти.
Описанная процедура является монотонной, запоми-
наемые значения функции не могут возрастать. Посколь-
ку на каждом этапе начальная точка выбирается слу-
чайно, то можно ожидать, что по истечении достаточно
большого числа этапов удается побывать во всех локаль-
ных экстремумах и выбрать из них наилучший.
Однако практически время поиска всегда ограниче-
но, поэтому результат поиска считается хорошим, если
несколько последних попыток не привели к уменьшению
функции q(x).
Более подробное изложение различных методов поис-
ка экстремума можно найти в [49, 50].
ЗАДАЧИ К ГЛ. 6
6-1. Превратить неравенства (6-7) в уравнения. Каков физичес-
кий смысл добавляемых при этом переменных?
6-2. Определить с помощью симплекс-метода оптимальный план
распределения ресурсов по данным примера 6-5, приняв на началь-
ном этапе за свободные переменные Xi, Хг, Хз.
6-3. Решить симплекс-методом двойственную задачу по данным
примера 6-5, приняв на начальном этапе за свободные переменные
и2, «5, uq. Сравнить матрицу, соответствующую оптимальному ре-
шению, с соответствующей матрицей в задаче 6-2.
ГЛАВА СЕДЬМАЯ
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
7-1. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ КАК ВАРИАЦИОННАЯ ЗАДАЧА
а) Математическая формулировка задачи оптимального
управления
Характерной тенденцией в построении современных
систем автоматического управления является стремле-
268
ние получать системы, которые в некотором смысле яв-
ляются наилучшими. При управлении технологическими
процессами это стремление выражается в том, чтобы
получать максимальное количество продукции высокого
качества при ограниченном использовании ресурсов
(сырья, энергии и т.п.). В системах управления кораб-
лями, самолетами, ракетами стремятся минимизировать
время, по истечении которого объект выходит в задан-
ную точку или на заданную траекторию при ограниче-
нии угла отклонения рулей, количества расходуемого
топлива и т.п. В следящих и стабилизирующих системах
представляет интерес достижение максимальной точно-
сти при наличии всевозможных ограничений, наклады-
ваемых на координаты регулируемого объекта, исполни-
тельные элементы и регулятор. Во всех этих примерах
задачи управления сводятся к нахождению наилучшего
в определенном смысле слова процесса из множества
возможных процессов, т. е. относятся к классу динами-
ческих задач управления.
Как было показано в гл. 5, математическая формули-
ровка динамических задач оптимального управления
сводится к следующему. Имеется объект управления, со-
стояние которого характеризуется многомерной .пере-
менной х— (х0>( ..., . Характер процессов в объекте
управления можно изменять, используя то или иное уп-
равление и из пространства допустимых управлений U.
В общем случае управление u € U может быть также мно-
гомерной величиной «=(«(’)... ы<д)).
Характер движения объекта управления описывает-
ся системой дифференциальных уравнений
х = g (х, и), х (0) = с. (7-1)
За критерий качества управления принимается ин-
тегральная оценка вида
т
Jt(u) = jQjlx^u^ldt, (7-2)
имеющая физический смысл потерь, где Т — время про-
текания процесса управления, a Q][x(f), —
мгновенные потери в момент t при состоянии системы
x(t) и управлении «(/). Добавочными ограничениями
могут быть ограничения, накладываемые на количество
269
ресурсов или пределы изменения некоторых параметров,
выражающиеся математически соотношением
т
u(t}\dt<K, (7-3)
совпадающим с (5-20).
Как было установлено в гл. 5, оптимальным называ-
ется такое управление и из множества допустимых уп-
равлений £7, при котором для объекта, описываемого
дифференциальным уравнением (7-1), и заданных огра-
ничениях на используемые ресурсы (7-3) критерий ка-
чества управления (7-2) принимает минимальное (мак-
симальное) значение.
Сформулированная подобным образом задача опти-
мального управления относится к классу вариационных
задач, решением которых занимается раздел математи-
ки, получивший название вариационного исчисления.
Величина Л (и), определяемая соотношением (7-2), по-
лучила название функционала. В отличие от функции,
например, f(x), численные значения которой задаются
на мнбжестве значений аргумента х, численные значе-
ния функционала J\(u) задаются на множестве всевоз-
можных управлений u(t). Задача нахождения оптималь-
ного управления сводится к тому, чтобы из множества
допустимых управлений U выбрать такое, при кото-
ром функционал /Ди) принимает минимальное числен-
ное значение.
Обычно задачи, требующие минимизации функциона-
ла вида (7-2), подчиненного дифференциальному соот-
ношению (7-1), при наличии интегрального ограничения
(7-3) заменяются минимизацией нового функционала
т т
J (и) = J (х, и) dt + X С Н (х, и) di, (7-4)
о о
подчиненного только дифференциальному соотношению
(7-1). Параметр X в функционале (7-4), получивший
название множителя Лагранжа, в задачах оптимизации
управления играет роль «цены» ограниченных ресурсов.
Его значение находится из граничных условий вариаци-
онной задачи.
Возможность упрощения вариационной задачи с ин-
тегральными ограничениями посредством введения мно-
жителей Лагранжа вытекает из следующей теоремы.
270
Теорема 7-1. Если u(t)—оптимальное управление,
при котором функционал (7-4) достигает абсолютного
минимума и выполняется ограничение (7-3), тогда при
u(t) достигается абсолютный минимум функционала
(7-2), подчиненного ограничению (7-3).
Д'оказательство следует от противного. Пусть
v(t)—другое управление, отличное от u(t), причем та-
кое, что
т т
J Qi (х, v)dt < Qt (х, и) dt (7-5)
и выполнено условие
т
j Н (х, v)dt (7-6)
Тогда
т т
J Qi(x, v)dt + к f Н(х, v)dt <
о о
т т
< f Qi (х, v)dt + кК < f Qi (xt U)dt +
T T
+ f Qi(x, u)dt + k\H(x, u)dt, (7-7)
что противоречит предположению, что u(t) обращает
(7-4) в минимум.
Применение методов вариационного исчисления к за-
даче нахождения оптимального управления не получило
распространения в связи с целым рядом возникающих
при этом трудностей. Поэтому мы не будем останавли-
ваться на методах решения вариационной задачи, отсы-
лая интересующихся этим вопросом к [51]. Отметим
лишь некоторые моменты, важные для дальнейшего из-
ложения.
Важнейшим понятием вариационного исчисления яв-
ляется понятие вариации функции, которое при исследо-
вании функционалов ^играет такую же роль, как диффе-
ренциал при исследовании функций.
Пусть f(x)—функция, непрерывная на интервале
[а, Ь]. Рассмотрим внутреннюю точку х этого интерва-
271
ла и некоторое фиксированное значение дифференциала
аргумента функции Дх=йх. Разность
^(х + Дх)-/(х) = ^(х) = Г(х)Дх (7-8)
называется дифференциалом функции f(x) в точке х.
Как известно, условие df(x)=0 является необходимым
условием минимума (максимума) функции /(х) в точ-
ке х.
Для получения аналогии с вариационным исчислени-
ем удобно дифференциал df(.x) определить несколько
иначе. Рассмотрим значение функции |(х4-еДх). При
фиксированных х и Дх оно будет функцией от е. Диффе-
ренцируя эту функцию по 8 и полагая 8=0, получаем:
4- f (х + еАх) I = f (х) Дх = df (х). (7-9)
де |е=0
Рассмотрим аналогичные понятия вариационного ис-
числения. Пусть u(t) и «1(0 —два используемых управ-
ления. Разность
б«(0 = «1(0 — u(t) (7-10)
называется вариацией функции u(t), а разность
67 (ы) = 7 (ы + бы) — J (и) (7-11)
называется вариацией функционала.
Вариацию функционала можно определить иначе.
Для этого рассмотрим при фиксированных u(t) и бы(0
функционал
7 (ы 4-ебы) = ф (е), (7-12)
являющийся функцией 8. Предположим: функционал
определен для различных б; это означает, что возможны
различные управления ы(0+вы(0 вблизи фиксирован-
ного управления «(/), т.е. что u(t) является внутренней
точкой пространства допустимых управлений U. При
этом вариацию функционала можно определить по ана-
логии с дифференциалом функции, даваемым соотноше-
нием (7-9), как
67 = + еды) , (7-13)
де е=0
Если u(t) является оптимальным управлением, то
функция <р(в) будет достигать минимума при 8=0.
В этом случае
^•1 = * + -°. Р-Н)
v8 |с=О иб |В=0
272
т. е. S/(«)=0. Итак, оптимальным управлением будет
такое, при котором вариация функционала обращается
в нуль.
В вариационном исчислении условие 6/(м)=0 ис-
пользуется для получения так называемого дифферен-
циального уравнения Эйлера, среди множества решений
которого и определяется затем управление u(t), обра-
щающее в минимум функционал (7-4).
б) Трудности, связанные с решением вариационной
задачи
При отыскании оптимального управления вариаци-
онными методами приходится сталкиваться с трудностя-
ми, ряд которых носит принципиальный характер:
1. Вариационные методы дают возможность нахо-
дить только относительные максимумы и минимумы
функционала /(м), тогда как интерес представляет на-
хождение абсолютного максимума или минимума.
2. Уравнения Эйлера для многих технических задач
оказываются нелинейными, что часто не дает возможно-
сти получить решение вариационной задачи в явном
виде.
3. На значения управляющих сигналов обычно бы-
вают наложены ограничения, делающие невозможным
поиск оптимального управления вариационными мето-
дами.
Поскольку последнее обстоятельство имело решаю-
щее значение для развития новых идей в области опти-
мального управления, остановимся на нем более под-
робно.
Обычными ограничениями, накладываемыми на сиг-
налы управления, являются ограничения вида
lMOI<Mf, (7-15)
означающие необходимость ограничения по величине
сигналов, подводимых к органам управления. Так, огра-
ниченными являются предельное напряжение, подводи-
мое к якорю электродвигателя, предельный угол пово-
рота руля самолета, предельная температура в камере
сгорания реактивного двигателя и т. п. При этом полу-
чение оптимальных процессов требует, как правило,
поддержания сигналов управления на предельных зна-
чениях, что соответствует наиболее быстрому и эффек-
18—142
273
тивному протеканию процессов в объекте управления.
Типичный для этих случаев характер изменения управ-
ления «(/) при оптимальном процессе приведен на
рис. 7-1.
Однако предельные значения управления u(t) лежат
на границах области допустимых управлений V и, сле-
довательно, не являются внутренними точками этой об-
ласти, для которых только и применимы вариационные
Рис. 7-1. Характерный
вид оптимального управ-
ляющего сигнала.
методы. Правда, от ограничений вида (7-15) можно из-
бавиться путем введения новых переменных о(, связан-
ных с переменными соотношениями Ui=M{ sin v,. При
этом значениям |Ы1|=Л1{ будут соответствовать о,=
= ±л/2, являющиеся внутренними точками области но-
вых допустимых управлений. Однако такая замена пе-
ременных обычно приводит к значительному усложне-
нию получаемых уравнений.
Трудности, состоящие на пути решения задачи опти-
мизации управления, привели к интенсивному изучению
проблемы оптимальности рядом ученых в Советском Со-
юзе и в США. Советские математики Л. С. Понтрягин и
его ученики В. Г. Болтянский, Р. В. Гамкрелидзе,
Е. Ф. Мищенко создали теорию оптимального управле-
ния, в основе которой лежит сформулированный
Л. С. Понтрягиным принцип максимума. Этот принцип
позволил поставить теорию оптимального управления
на строгую математическую основу и открыл широкие
возможности для ее практического применения в обла-
сти автоматических систем управления. Однако в дан-
ной книге мы не имеем возможности развивать общую
теорию оптимального управления, основанную на прин-
ципе максимума, и ограничимся в этом отношении ссыл-
ками на литературу [52—54].
Иной подход к вычислению оптимальных процессов
получил название динамического программирования
[55—57]. Метод динамического программирования дает
в руки инженера эффективную вычислительную проце-
274
ДУРУ решения задачи оптимизации управления, хорошо
приспособленную к использованию ЭВМ. Этот метод мы
рассмотрим более подробно.
7-2. МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
а) Дискретная форма вариационной задачи
Преодоление рассмотренных трудностей решения
вариационной задачи лежит на путях использования
эффективных вычислительных методов, одним из кото-
рых является метод динамического программирования.
Этот метод дает возможность находить оптимальное уп-
равление в многошаговых задачах. Однако он может
применяться и для решения вариационных задач, если
их представить в дискретной форме.
Воспользовавшись теоремой 7-1, сформулируем ва-
риационную задачу в следующем виде: для объекта,
описываемого дифференциальным уравнением (7-1),
найти управление u(t) из области допустимых управле-
ния U, которое минимизирует функционал
т
J(u) = ^Qlx(t),u(i)](ti, (7-16)
где
Q(x, и) = Qx(x, и) + МЦх, и). (7-17)
Дискретную форму записи этой задачи получим, ес-
ли выбор управления «(/) будем производить только в
дискретные моменты t=kb, k=0, 1, .... п—1, где &=Т]п,
При этом вместо функции х(1) и u(t) будем рассматри-
вать последовательности
xh = х (О |<=дб» uk ~ и (О |<=дв’
Заменяя производную x=dx/dt в уравнении (7-1)
на отношение приращений (хмч—хл)/б, вместо диффе-
ренциального уравнения (7-1) получаем уравнение в
конечных разностях:
(MS)
О
Обычно это уравнение записывают в более удобной
форме, разрешая его относительно хд+г
хд+1 = xk + S (хк> “д) 6; k => 0, 1, ..., п — 1, х0 = с. (7-19)
18* 275
При этом интеграл (7-16) заменится суммой
п—1
Jn(u)=^Q(xk,uk)(>, (7-20)
к=0
где под и понимается последовательность используемых
управлений
w = (Uq, ..., ип—{). \7-21)
Теперь задача заключается в выборе таких управле-
ний «о. «ь «п-i, которые обеспечивают минимальное
значение суммы (7-20).
Во многих задачах управления оказывается целесо-
образным считать 6=1. В частности, это удобно делать
в тех случаях, когда процесс естественным образом раз-
бивается на отдельные шаги, причем в пределах каждо-
го шага управление «(/) остается неизменным. При этом
мы приходим к многошаговому процессу управления,
рассмотренному в гл. 5, в котором хк и ик означают со-
стояние объекта и применяемое управление в начале
каждого шага. Обозначая в этом случае
хк + g (хк, ик) = Т (хк, ик), (7-22)
уравнение (7-19) запишем в виде
x*+i = Т(хк, ик\, k = 0,1,..., п — 1; х0 = с, (7-23)
совпадающем с выражением (5-35), которое определяет
преобразование состояния объекта за один шаг в много-
шаговом процессе управления. Сумма (7-10) при 6=1
принимает вид:
п—1
Jn(u) = ^Q(xk>uk), (7-24)
ft=0
совпадающий с выражением (5-37) для критерия каче-
ства в многошаговом процессе управления.
Метод динамического программирования мы будем
далее рассматривать применительно к соотношениям
(7-23) и (7-24), т. е. применительно к многошаговому
процессу управления. Однако установленная нами связь
математических формулировок дискретной формы вари-
ационной задачи и многошагового процесса управления
позволяет распространить полученные результаты и на
решение вариационных задач.
276
б) Рекуррентное соотношение метода динамического
программирования
Оптимизация управления «-шагового процесса состо-
ит в том, чтобы найти такую последовательность управ-
лений а0> «ь ...» «n-ь при которой критерий качества
/п(н) принимаем минимальное значение. Это минималь-
ное значение критерия качества управления «-шагового
процесса будет зависеть только от начального состояния
х0 и его можно обозначать fn(x0). По определению
имеем:
fn (х0) = min min • • • min [Q (x0, u0) 4-
“• “i un—1
+ Q(x1)«1)+...+ Q(xn_p«„_l)]. (7-25)
Заметим, что первое слагаемое этого выражения
Q(x0, «о) зависит только от управления м0> тогда как ос-
тальные слагаемые зависят как от и0, так и от управле-
ний на других шагах. Так, Q(xb Ui) зависит от «ь но оно
зависит и от «о, так как Xi=T(x0,m0). Аналогично обсто-
ит дело и с остальными слагаемыми. Поэтому выраже-
ние (7-25) можно записать в виде
fn (х0) = min {Q(x0, и0) + min • • • min [Q(xb ux)+ ...
Uq Ui Un_l
-+<2h-р <7'26>
Заметим далее, что выражение
min • • • min [Q (xp -|--F Q (xn_p (7-27)
un—1
представляет собой минимальное значение критерия ка-
чества управления («—1)-шагового процесса, имеющего
начальное состояние Хь В соответствии с определением
(7-25) эту величину можем обозначить через fn-i(xi).
Таким образом, получаем:
fn (х0) = min [Q (х0, u0) + fn-i (xx)L (7-28)
«о
Эти рассуждения можно повторить, если рассмотреть
(«—1)-шаговый процесс, начинающийся с начального
состояния Хь Минимальное значение критерия качества
управления для этого случая
fn-l (*1) = min [Q (*Р «1) + fn-2 (*«)]• <7’29)
и»
277
Продолжая эти рассуждения, получаем аналогичное
выражение для (и—/)-шагового процесса, начинающе-
гося с состояния хг.
fn-t = min [Q (Xz, + fn_(Z+I) (xz+1)]. (7-30)
ul
Уравнение (7-30), называемое часто уравнением Вел-
лмана, представляет собой рекуррентное соотношение,
позволяющее последовательно определять оптимальное
управление на каждом шаге управляемого процесса.
Сама идея оптимизации управления на каждом шаге
отдельно, если трудно оптимизировать сразу весь про-
цесс в целом, не является оригинальной и широко ис-
пользуется на практике. Однако при этом часто не при-
нимают во внимание, что оптимизация каждого шага
еще не означает оптимизацию всего процесса в целом.
Так, жертва фигуры в шахматной партии никогда не бы-
вает выгодна с точки зрения отдельного хода, но она мо-
жет быть выгодна с точки зрения всей партии. Расход
средств на амортизацию может быть невыгоден с точки
зрения конъюнктуры на отдельный момент, но он выго-
ден с точки зрения работы предприятия за длительный
период.
Особенностью метода динамического программирова-
ния является то, что оно совмещает простоту решения
задачи оптимизации управления на отдельном шаге с
дальновидностью, заключающейся в учете самых отда-
ленных последствий этого шага.
В методе динамического программирования выбор
управления на отдельном шаге производится не с точки
зрения интересов данного шага, выражающихся в мини-
мизации потерь на данном шаге, т. е. величины Q(*z, Wz),
а с точки зрения интересов всего процесса в целом, вы-
ражающихся в минимизации суммарных потерь Q(xz,
i/z)+fn-(z-+-i)(xHi) на всех последующих шагах. Отсюда
следует основное свойство оптимального процесса, за-
ключающееся в том, что каковы бы ни были начальное
состояние и начальное управление, последующие управ-
ления должны быть оптимальными относительно состоя-
ния, являющегося результатом применения первого уп-
равления.
Из основного свойства оптимального управления сле-
дует, что оптимизация управления для произвольной ста-
дии многошагового процесса заключается в выборе толь-
278
ко последующих управлений. Поэтому бывает удобно
учитывать не те шаги, которые уже были пройдены, а те,
которые осталось проделать, для того чтобы привести
процесс в конечное состояние. С этой точки зрения урав-
нение (7-30) удобно записать в иной форме.
В выражении (7-30) величина п—I означает число
шагов до конца процесса. Обозначим эту величину через
k. При этом величины xi=xn-h и ui=un-k будем обозна-
чать просто через х и и. Они будут означать состояние
объекта и примененное управление за k шагов до конца
процесса. Последующее состояние, т. е. то, к которому
объект переходит из состояния х при применении управ-
ления и, обозначим через х'. Это будет xn-(i+V) в прежних
обозначениях. При этом уравнение (7-23) запишется в
виде
х' = Т(х,н), (7-31)
а рекуррентное соотношение (7-30) примет вид:
fk W = muin [Q (*’ “) + fk-1 (*')] • (7-32)
в) Вычислительные аспекты динамического
программирования
Динамическое программирование является числен-
ным методом решения задачи оптимизации управления
и поэтому связано с довольно громоздкими вычисления-
ми. Но мы не будем придавать особого значения этому
обстоятельству, предполагая, что соответствующие вы-
числения производятся на ЭВМ.
Определение оптимального управления на произволь-
ном fe-м шаге, отсчитываемом от момента окончания
процесса, находится на основании соотношений (7-31) и
(7-32), которые для удобства проведения численных рас-
четов можно записать в несколько иной форме. Обозна-
чим через Fk(x, и) критерий качества управления fe-ша-
гового процесса при оптимальном управлении на послед-
них k—1 шагах и произвольном управлении на началь-
ном шаге. Тогда соотношение (7-32) может быть запи-
сано в виде
Fk (х, u) = Q (х, и) + (%'); (7-33)
fk(x) = min Fh(x, и), (7-34)
и
где х' определяется из (7-31).
279
Переменные хны могут принимать или конечные
множества значений, или изменяться непрерывно в не-
которых диапазонах. В последнем случае прове-
дем дискретизацию этих переменных, выделив из них
конечные множества по возможности равноотстоящих
значений. Следовательно, в обоих случаях переменные
х и и могут рассматриваться как элементы конечных
множеств Х={х<1>, ..., х<т>} и U={uV\ ..., и<г)}. Значение
Q(x, и) удобно вычислить заранее и задать в виде таб-
лицы на прямом произведении множеств X%U. Эта таб-
лица должна храниться в памяти ЭВМ.
Вычисления по формулам (7-33), (7-34) производят-
ся путем заполнения табл. 7-1. В первых двух столбцах
таблицы перечислены всевозможные комбинации х € X
и «С (/.’Остальные столбцы заполняются путем вычис-
ления соответствующих величин. В последних графах
таблицы для каждого х € X выписывается минимальное
значение /ч(х, и), т.е. определяются fk(x) и оптималь-
ное управление и*.
Подобные расчеты необходимо проводить для каждо-
го шага многошагового процесса. При этом следует
учесть, что для определения fh(x) необходимо предвари-
тельно иметь таблицу для fh-i (х), так как с ее помощью
находятся значения fk-i(x') при заполнении табл. 7-1.
Следовательно, значения fh~\ (х) должны быть вычисле-
ны раньше, чем значения fk(x). Отсюда следует, что вы-
числение функций fk(x) нужно начинать с последнего
шага многошагового процесса. Замечая при этом, что
Расчетная таблица метода динамического программирования
X и х' = Т(х, и) Q(x, и)
х(1) u(D Т(х™. «<‘>) Т(х™,'и^) Q(x(1>, «<*>) QU*0", u<r>)
Х<2> Т(х™, «<*>) Т(>>, >>) Q(?2>, «<») Q(>‘, >>)
Х<3> * » . ♦ ♦ ♦ • • •
280
fo(*)eO, за начальный этап расчета следует взять k
= 1, для которого
Fi (х, и) = Q (х, и)-, (х) = min Q (х, и). (7-36)
Далее расчет проводят обычным путем для Л=2,
3,п.
После того как проведены расчеты и составлены таб-
лицы для fk(x) и и* при Л=1, п, можно приступить
к поиску оптимального управления для всего процесса
при данных начальных условиях х0. По таблице для^п(х)
находим и*, соответствующее заданному Xq, и подсчиты-
ваем х\ = Т(х0, и*). Далее по таблице для fn-i(x) нахо-
дим и*, соответствующее найденному xt, и подсчитыва-
ем x2 = 7’(xi, и*) и т. д. В результате получаем оптималь-
ное управление и*=(и*й, и*, ..., и*_х).
В случае, если и является непрерывной величиной,
/ч(х<‘>, и) будет непрерывной функцией от и. Однако
табл. 7-1 дает лишь дискретные значения и<П),
j=l, ..., г этой функции. При этом минимальное значе-
ние Fhfx*0, и) может получиться при промежуточных
значениях и. В этом случае величины ы* и следу-
ет определять, воспользовавшись интерполяционными
формулами. Применение интерполяционных формул не-
обходимо также для определения оптимального управ-
ления u'k в тех случаях, когда значения Xh=T'(xA_1, uk-i)
будут лежать между значениями х, входящими в
табл. 7-1.
Таблица 7-1
>к-1 F (x, и) k fkM tl*
u(D)j fk-i ItV1»’, «<'>)] u<’>) W") «1
/л-i [Tx<2>, u'1»] Л-i «<г))] u(1)) Fk^\ fk(x^) «2
• • • • . . . . . . . .
281
Пример 7-1 (задача о наборе высоты). Самолет летит со скоро-
стью на высоте ho. Нужно изменить его скорость до th и высоту
до hi так, чтобы расход горючего на это изменение был мини-
мальным.
Процесс изменения v и h будем изображать на плоскости (и, h).
Произведем дискретизацию переменных, разбив диапазоны изменения
v и h на четыре интервала каждый. При этом дискретные состояния
объекта управления будут представляться узлами сетки, изображен-
д ной на рис. 7-2. Считаем, что в
Рис. 7-2. Траектория в задаче
набора высоты.
каждом узле сетки возможно
применение только двух управле-
ний:
иг = 0 — изменение только ско-
рости у;
иг = 1 — изменение только вы-
соты h.
Таким образом, множеством
допустимых управлений будет
множество Z7 = {0, 1}.
На рис. 7-2 изображена одна
из возможных траекторий, соот-
ветствующая управлению и =
= (01011001). Для того чтобы
оценить эту траекторию, нужно
знать расход топлива на каждом
шаге. Это и будет целевой функ-
цией Q(x, и). Значения Q(x, и)
зададим в виде условных чисел,
которыми на рис. 7-2 отмечен каждый из возможных переходов.
Для траектории, изображенной из рис. 7-2, суммарный расход топ-
лива, представляющий собой значения критерия эффективности
управления, равен: 44-4+7+54-7 + 8+9+8 = 52.
Для того чтобы представить рассматриваемый процесс как мно-
гошаговый, введем подходящий способ описания состояний объекта
управления. Дискретные значения v отметим числами от 0 до 4,
начиная с конечного значения. Так же поступим в отношении h. Тог-
да xtJ будет означать состояние при v = i и h = j, из которого до кон-
ца процесса остается сделать i+/ шагов.
Обозначим через Xk множество состояний, из которых процесс
заканчивается за k шагов. В это множество войдут все те Xij, для
которых i+j = k. Полагая k=0, 1, 2, ..., получаем:
Хо — {*Оо)‘» — {*10, *01Ь — {*20» *11» *02} И Т’ Д’
Теперь можно приступить к решению задачи. При &=1 имеем:
х1= {*10. *01}; Л(*. «) = Q (*. «); Z1W = minF1(x> и),
и*
Эти соотношения используем для составления табл. 7-2, по-
строенной по типу табл. 7-1.
При k = 2 имеем: %2 = {^2о, *п, *02}; Гг(^, w)=Q(x, w)+fi(x');
f2(x)= minf2(*, w).
и
Эти соотношения используем для составления табл. 7-3. Анало-
гичные расчеты проводятся при &=3, 4„. (табл. 7-4 и т. д.).
282
Таблица 7-2
Расче! оптимального управления на последнем шаге
X и хв Q(x. и) Л(*)
*10 0 1 *00 9 9 0
*01 0 1 *00 8 8 1
Таблица 7-3
Расчет оптимального управления на предпоследнем шаге
X и х' Q(x, и) Г2(х, и) fM и*
*20 0 1 *10 9 1 ° 18 18 0
*11 0 1 *01 *10 9 7 8 9 17 16 16 1
*02 Расче! 0 1 ' оптим *01 ального 6 управление 8 1 за три ш; 14 ага до кон 14 Таблиц на 1 .а 7-4
X и х' Q (х, и) и) 1з(х) и*
*30 0 1 *20 6 18 24 24 0
*21 0 1 *11 *20 8 8 16 18 24 26 24 0
*12 0 1 *02 *11 9 6 14 16 23 22 22 1
*03 0 1 *02 3 14 17 17 1
283
В рассматриваемом примере данные, содержащиеся в табл. 7-2—
7-4, можно изображать непосредственно на плоскости (и, /i), ука-
зывая значения fk(x) в виде числа в соответствующем узле сетки,
а и* — стрелкой в направлении следующего узла, как показано на
рис. 7-3. После того как значения fk(x) и и* определены для всех
узлов сетки, находим оптимальную траекторию, двигаясь от началь-
ного узла в направлении стрелок. Оптимальным управлением будет
u*=(11000110), которому соответствует Jn(u*)=37.
Рассмотренный пример хо-
рошо иллюстрирует достоин-
ства метода динамического
программирования. Он, во-
первых, снимает проблему аб-
солютного и относительного
минимума, так как из самой
процедуры вычислений ясно,
что находится всегда абсолют-
ный минимум. Во-вторых, ог-
раничения вида
явившиеся серьезным препят-
ствием для применения вариа-
ционных методов, только об-
легчают процесс вычислений
по методу динамического про-
граммирования, так как сужают область допустимых
управлений U. Наконец, метод динамического програм-
мирования несравненно упрощает поиск оптимального
решения по сравнению с методом простого перебора ва-
риантов. Это можно проиллюстрировать расчетом.
Если на каждом шаге возможны г различных управ-
лений, то при прямом переборе каждое из этих управле-
ний должно рассматриваться в сочетании со всеми воз-
можными управлениями на всех остальных шагах, что
при АГ-шаговом процессе дает гп вариантов. Даже для
весьма скромной многошаговой задачи при г= 10 и п=10
при этом получается огромное число 1010 вариантов.
В методе динамического программирования при вы-
боре управления на каком-либо шаге для состояния х
рассматривают не все возможные продолжения, а только
те, которые соответствуют оптимальным продолжениям
из состояния х'=Т(х, и). Это позволяет исключить из
рассмотрения огромное количество не представляющих
интереса вариантов. Так, если на каждом шаге возможно
т состояний и для каждого состояния г управлений, то
общее число подлежащих рассмотрению вариантов бу-
284
дет гтп или г2л, если считать что r=m, т. е. что имеется
управление, переводящее каждое состояние в любое но-
вое. При г=10 и п=10 это дает всего 103 вариантов.
Однако, несмотря на большие достоинства, метод ди-
намического программирования имеет и свои неудобства.
Эти неудобства заключаются в том, что для нахождения
оптимального управления при некотором начальном со-
стоянии объекта приходится идти от конца процесса к
началу, определяя на каждом шаге оптимальные управ-
ления для всех возможных на этом шаге состояний объ-
екта, причем до самого последнего момента остается не-
известным, каково же будет оптимальное управление для
заданного начального состояния. При этом в конце кон-
цов оказывается, что большая часть вычислительной ра-
боты была проделана напрасно, так как результаты оп-
ределения оптимального управления для состояний, не
лежащих на оптимальной траектории, не используются.
В этом отношении имеет преимущества принцип макси-
мума, который открывает путь для построения одной от-
дельно взятой оптимальной траектории.
г) Управление конечным состоянием
Как указывалось в гл. 5, в ряде задач характер дви-
жения объекта в процессе управления интереса не пред-
ставляет, а существенным является только состояние хп,
в которое переходит объект по окончании процесса уп-
равления. При этом критерием качества управления бу-
дет служить значение целевой функции в конце процесса
управления, т. е. величина
(7-36)
Обозначим, как и раньше, через х и и состояние
объекта и примененное управление за k шагов до конца
процесса, а через х'=Т(х, и) —последующее состояние,
т. е. состояние за k—1 шагов до конца процесса. Состоя-
ние хп, а значит, и целевая функция q(xn) определяются
как начальным значением х, так и всеми последующими
управлениями.
Для получения рекуррентного соотношения, опреде-
ляющего оптимальное управление, обозначим через
/ч(х, и) значение целевой функции q(xn) за k шагов до
конца процесса при начальном состоянии х, произволь-
ном управлении и на начальном шаге и оптимальном уп-
равлении на остальных k—1 шагах, а через /а(х) значе-
285
ние q(xn) при оптимальном управлении на всех k шагах
до конца процесса, так что
fh (х) = min Fh (х, и). (7-37)
и
Значение Fk(x, и) можно получить наследующих со-
ображений. Под действием произвольного управления и
объект управления на начальном шаге переводится из
состояния х в состояние х'=Т(х, и). Чтобы получить
q^Xn'i—Fktx, и), необходимо на остальных k—1 шагах
применять оптимальное управление, что дает q(xn) =
=fk-i (х') =fk-i [Т (х, и) ]. Это и будет значением Fk (х, и).
Таким образом,
Fk(x, u) = fh_l[T(x, «)]. (7-38)
Подставляя значения и) в (7-37), получаем:
fh (х) = min [Т (х, и)]. (7-39)
и
Формула (7-39) по своей структуре полностью ана-
логична формуле (7-32). Применяя к ней уже описан-
ную методику вычислений и учитывая, что
Ш = <?(х), (7-40)
можно найти оптимальное управление для любого на-
чального состояния многошагового процесса.
д) Рекуррентное соотношение для марковских процессов
Применение метода динамического программирова-
ния для оптимизации случайных процессов рассмотрим
для случая, когда случайный процесс является управля-
емой марковской цепью.
Как было показано в § 4-5, марковская цепь может
быть задана в виде матрицы вероятностей переходов
Р = [р0«] порядка L\L. Для того чтобы марковская
цепь была управляемой, должна иметься возможность
изменять вероятности переходов рц путем вмешательст-
ва извне. Предположим, что имеется возможность вести
марковский процесс W различными способами, причем
А-му способу соответствует матрица вероятностей пере-
ходов Pk=[pu}]t &=1Д. Каждый способ ведения мар-
ковского процесса будем называть стратегией.
Будем далее считать, что мы имеем возможность
оценить каждый способ осуществления процесса путем
286
задания матрицы потерь или, что в данном случае удоб-
нее, матрицы доходов Rs= [г^>]. Величины rf), i, j=l,L;
k=l,N выражают доход за один шаг при переходе про-
цесса из состояния i в состояние j в случае использова-
ния /г-й стратегии.
Пример 7-2. Завод по изготовлению телевизоров из примера
4-7, находясь в состоянии 1, может увеличить спрос путем органи-
зации рекламы, но это требует добавочных затрат и уменьшает до-
ход. Если завод находится в состоянии 2, то он может ускорить пе-
реход в состояние 1 путем увеличения затрат на исследования. При
этом стратегия 1 состоит в том, чтобы не нести затрат на рекламу
и исследования, а стратегия 2 состоит в том, чтобы нести эти затра-
ты. Матрицы вероятностей переходов и матрицы доходов для этих
стратегий могут быть следующими:
Р1 = | р2 = 0,5 0,4 0,8 0,7 0,51 0,6] 0,2 0,3. ; R, = ; R2 = 9 3 4 1 3 —7]’ 4 —19
Поставим задачу найти метод выбора стратегии.
обеспечивающей получение максимального дохода за п
шагов управляемого марковского процесса.
Обозначим через fi(n) максимальный доход за п
шагов, начавшихся из состояния L Предположим, что из
состояния i сделан один шаг в состояние / с доходом
а остальные п—1 переходов сделаны оптимальным об-
разом. Полный доход за п шагов при этом будет rtf) +
+ Л(п-1).
Однако в действительности первый переход вида (i, j)
совершается с вероятностью ptf}. Поскольку первый пе-
реход случаен, то следует учесть возможность перехода
во всевозможные состояния /€ {1,..., N}. Поэтому ожи-
даемый доход
N
F((n, = + («-0] =
/=1 N
+ (7-41)
7=1
где
</<*) (7-42)
/=1
— доход за один шаг из состояния i при стратегии k.
287
В выражение (7-41) входит стратегия k, применяемая
на начальном шаге, соответствующим выбором которой
мы можем обеспечить максимальный ожидаемый доход
что приводит нас к рекуррентному соотношению
для выбора стратегии k на первом шаге л-шагового про-
цесса:
f. (л)=тах
(7-43)
/=i
Расчет по формуле (7-43) удобно проводить таблич-
ным методом, аналогичным рассмотренному в предыду-
щих параграфах. Приведем соответствующие таблицы
(табл. 7-5 и 7-6) для задачи из примера 7-2 для п=1 и
п—2.
Таблицы для п>2 составляются по типу таблицы
для п—2.
п=1
Таблица 7-5
i k р</ м ги и (1) fe*
/=1 1 | /=2 /=1_ /==2
1 1 0,5 0,5 9 3 6 с. 1
1 2 0,8 0,2 4 4 4 О 1
о 1 0,4 0,6 3 —7 —3 о 1
л» 2 0,7 0,3 1 —19 —5 —О 1
П = 2
Таблица 7-6
i k р<*> ч p(lj} lj (»> F, (2, k) fi (2) Л*
/=1 /=2 /=1 /=2
1 1 6 0,5 0,5 3,0 —1,5 7,5 Я 9 9
1 2 4 0,8 0,2 4,8 —0,6 8,2
2 1 -3 0,4 0,6 2,4 -1,8 —2,4 1 7 2
2 —5 0,7 0,3 4,2 —0,9 —1,7 i > i
288
ЗАДАЧИ К ГЛ. 7
7-1. Продолжите решение примера 7-1 и вычислите всю опти-
мальную траекторию.
7-2. Рассматривая сетку на рис. 7-3 как граф, найдите оптима ш-
ную траекторию, воспользовавшись методами нахождения кратчай-
шего пути в графе из § 2-2. Сравните это решение с решением мето-
дом динамического программирования.
7-3. Найдите оптимальное управление для следующего трехша-
гового процесса управления скалярной величиной х В начале про-
цесса х может быть любым целым числом ог —10 до 4-10. На от-
дельных шагах осуществляются преобразования вида х'—Т(х, и) =
= х + и, причем допустимые значения и определяются множествами.
{—1, 0, 4-1) на'первом шаге;
{—4, 0, 4-4} на втором шаге;
{—9, 0, 4-9} на третьем шаге.
Цель процесса — довести за три шага величину х до заданного
значения, которое принято равным нулю. Потери оцениваются квад-
ратом отклонения х от 0 в конце процесса, т. е. величиной q(x) =
= (х—0)? = х2.
ГЛАВА ВОСЬМАЯ
ТЕОРИЯ ИГР
8-1. ПРЕДМЕТ ТЕОРИИ ИГР
а] Игра как модель конфликтной ситуации
Теория игр представляет собой интенсивно развива-
ющуюся математическую дисциплину, предметом иссле-
дования которой являются методы принятия решения в
так называемых конфликтных ситуациях [58, 59]. Ситу-
ация называется конфликтной, если в ней сталкиваются
интересы нескольких (обычно двух) лиц, преследующих
противоположные цели. Каждая из сторон может про-
водить ряд мероприятий для достижения своих целей,
причем успех одной стороны означает неудачу другой.
Авторы первого фундаментного трактата по теории
игр Дж. фон Нейман и О. Моргенштерн [60] ориенти-
ровались на анализ конфликтных ситуаций в вопросах
экономики, когда при наличии свободной конкуренции в
роли борющихся сторон выступают торговые фирмы,
промышленные предприятия и т.п. Однако конфликтные
ситуации встречаются и во многих других областях.
К конфликтным ситуациям относятся почти все ситуа-
ции, возникающие при планировании военных операций,
19-142
289
выборе системы оружия, охране объектов от нападения,
преследовании и перехвате цели и т. п. Интересными
примерами конфликтных ситуаций являются спортивные
состязания, арбитражные споры, аукционы, выборы в
парламент при наличии нескольких кандидатов на одно
место.
Приведенные примеры показывают большое разнооб-
разие встречающихся на практике конфликтных ситуа-
ций. Обычно эти ситуации трудны для непосредственно-
го анализа благодаря множеству второстепенных при-
ходящих факторов. Для того чтобы сделать возможным
математический анализ конфликтной ситуации, ее не-
обходимо упростить, учтя только основные факторы.
Упрощенная формализованная модель конфликтной си-
туации называется игрой, а конфликтующие стороны —
игроками. Мы ограничимся рассмотрением игр, в кото-
рых имеются только две конфликтующие стороны. Преж-
де чем дать формальное определение игры, необходимо
разъяснить используемую терминологию, которая в ос-
новном совпадает с терминологией, встречающейся в
различных развлекательных и азартных играх (шахма-
ты, шашки, карточные игры и т.п.).
Следует различать понятие игры и понятие индиви-
дуальной партии этой игры. Игра представляет собой
совокупность правил, описывающих поведение игроков.
Каждый случай разыгрывания игры некоторым конкрет-
ным образом от начала и до конца представляет собой
партию игры. Элементами игры являются ходы. Прави-
ла игры предусматривают, какова должна быть после-
довательность ходов, и указывают характер каждого
хода.
Ходы бывают личные и случайные. Личный ход пред-
ставляет собой выбор игроком одного из заданного мно-
жества вариантов. Например, каждый ход в шахматах
является личным ходом, причем первый ход — выбор из
20 вариантов. Решение, принятое игроком при личном
ходе, называется выбором.
Случайный ход также представляет собой выбор од-
ного из множества вариантов, но здесь вариант выбира-
ется не игроком, а некоторым механизмом случайного
выбора. Примерами случайных ходов может служить
сдача карт или бросание монеты. Выбор, осуществляе-
мый при случайном ходе, называется исходом этого
хода.
290
По отношению к ходам правила имеют следующую
структуру.
Для первого хода правила указывают, будет это лич-
ный или случайный ход. Если это личный ход, то прави-
ла перечисляют имеющиеся варианты и указывают, ка-
кой игрок должен делать выбор. Если это случайный
ход, то правила перечисляют имеющиеся варианты и
обусловливают вероятности их выбора.
Для каждого следующего хода правила определяют
в зависимости от выборов и исходов предыдущих ходов:
будет этот ход личным или случайным;
если он будет случайным ходом, то представляющие-
ся варианты и вероятности их выбора;
если он будет личным ходом, то какой игрок делает
выбор, возможные варианты, из которых делается выбор
и берется информация относительно выборов и исходов
предыдущих ходов.
Наконец, правила определяют в зависимости от вы-
боров и исходов следующих друг за другом ходов (т. е.
в зависимости от хода игры), когда игра должна закон-
читься и каков выигрыш или проигрыш каждого из иг-
роков.
6) Понятие стратегии
Представим себе, что мы хотим сыграть шахматную
партию белыми, но лично присутствовать при игре не
можем. У нас есть заместитель, который должен прове-
сти партию и выполнять все наши указания. Но сам он
не умеет играть в шахматы и не способен принимать само-
стоятельные решения. Чтобы заместитель мог провести
всю партию до конца, ему должны быть даны такие ука-
зания, которые предусматривали бы любые возможные
положения на доске и для каждого положения определя-
ли бы тот ход, который должен быть сделан. Полная си-
стема таких указаний и представляет собой стратегию.
Так, стратегия белых должна указывать первый ход,
затем для каждого возможного ответа черных следую-
щий ход белых и т. д. Конечно, составление полной стра-
тегии при игре в шахматы является огромной, практи-
чески невыполнимой работой. Например, игрок белыми,
присутствующий лично, должен принять два 'решения,
чтобы сделать два первых хода. Играя же через заме-
стителя, он должен подготовить 21 решение для тех же
19:
291
двух ходов (одно решение — первый ход и 20 решений —
ответы на 20 возможных первых ходов черных). Тем не
менее во многих более простых задачах понятие страте-
гии является весьма полезным.
ТакихМ образом, стратегия игрока представляет со-
бой однозначное описание его выбора в каждой возмож-
ной ситуации, при которой он должен сделать личный
ход.
Если игра состоит только из личных ходов, то исход
игры определен, если каждый из игроков выбрал свою
стратегию. Однако если в игре имеются случайные ходы,
то игра будет носить вероятностный характер и выбор
стратегий игроков еще не определит окончательно исход
игры.
6) Формальное описание игры дзух лиц
Обозначим через X и Y множества или пространства
всевозможных стратегий, которыми могут пользоваться
участники игры, называемые далее первым и вторым иг-
роками соответственно. Величины x(z X и y€Y будут
означать конкретные стратегии первого и второго игро-
ков.
Для того чтобы ввести в рассмотрение случайные хо-
ды, удобно считать, что в игре принимает участие тре-
тий игрок, который и делает случайные ходы, пользуясь
для этого соответствующим механизмом случайного вы-
бора. Обозначим через Н пространство стратегий этого
игрока. Любая стратегия Н третьего игрока, пред-
ставляющая собой конкретную последовательность всех
случайных ходов в партии, будет происходить с некото-
рой вероятностью p(/z), которую легко подсчитать, зная
вероятности каждого случайного хода в этой последова-
тельности. Легко видеть, что р(/г) представляет собой
распределение вероятностей на пространстве Н, т. е.
удовлетворяет условиям
Р(Я)>0,2р(/1)=1. (8-1)
h£H
Обозначим через g некоторый вариант игры, т. е. од-
ну возможную партию. Этот вариант будет определен,
если выбраны стратегии игроков х и у и стратегия слу-
292
чайных ходов h. Следовательно, конкретная партия g
представляет собой тройку величин х, у и hi
g = (x,y,h). (8-2)
Результатом партии является выигрыш или проиг-
рыш каждого из игроков. Для удобства выигрыши и
проигрыши будем оценивать каким-либо числом, напри-
мер суммой денег в рублях.
Рассмотрим одну из конкретных партий g(x, у, h) и
обозначим через Lx(x, у, h) и Lv(x, у, h) проигрыши или
потери первого и второго игроков соответственно. При
этом выигрыши рассматриваем как отрицательные про-
игрыши. Общая сумма проигрышей обоих игроков равна:
Lx(x,y,h) + Ly(x,y,h). (8-3)
В дальнейшем ограничимся рассмотрением только
так называемых игр с нулевой суммой, т. е. таких игр, в
которых общая сумма проигрыша (8-3) равна нулю.
В таких играх проигрыш одного игрока равен выигрышу
другого игрока.
При рассмотрении игр с нулевой суммой нет необхо-
димости отдельно учитывать проигрыши пли выигрыши
обоих игроков, а можно ограничиться рассмотрением
только проигрыша второго игрока (выигрыша первого
игрока):
Ly (х, у, h) = — Lx (х, у, 1г) = L (х, у, 1г). (8-4)
Поскольку стратегия h является случайной, то при
выбранных стратегиях х и у потери L(x, уу h) будут слу-
чайной величиной с распределением вероятностей p(h)
на пространстве И. Поэтому оценить выбранные страте-
гии х и у можно лишь путем усреднения потерь L(xy у,
h) по всему пространству Ну т. е. введя понятие средних
потерь Л(х, у), определяемых согласно (4-63) из соот-
ношения
L (х, у) = {х, у, h) р (h). (8-5)
h£H
Игра будет определена, если перечислены все воз-
можные стратегии игроков, т. е. заданы пространства
X и У, и для любых и у С У определены потери
L(x, у). Таким образом, мы приходим к следующему
формальному определению игры.
Игра G определяется тройкой
G = (X,F,L), (8-6)
293
где X и Y представляют собой некоторые пространства,
a L — ограниченная числовая функция, определенная на
прямом произведении X\Y. Точки х£ X и y£Y называ-
ются стратегиями первого и второго игроков, а функция
L называется функцией потерь.
Игры, в которых каждый игрок имеет конечное число
стратегий (конечные игры), удобно задавать в виде так
называемой матрицы потерь. Пусть G=(X, У, L)—ко-
нечная игра, в которой X={xit ..., хт} и У={уь уп}.
Тогда матрица порядка т\п
9и
Q _ ,] _
(8-7)
_9ml * * * Ятп_
в которой qij = L(Xi, yj), называется матрицей игры G.
Для того чтобы описание игры было законченным,
необходимо указать цели, которыми руководствуются
игроки при выборе своих стратегий. Эти цели достаточ-
но просты. Первый игрок стремится обеспечить себе
наибольший выигрыш, т. е. максимизировать функцию
L(x, у), а второй игрок стремится сделать свой проиг-
рыш наименьшим, т. е. минимизировать функцию L(x,
у). Таким образом, цели игроков оказываются прямо
противоположными. Специфической трудностью при
этом является то, что ни один из игроков не контролиру-
ет полностью значение L(x, у), так как первый игрок
распоряжается только значением я, а второй — только
значением у. Преодоление этой трудности, т. е. опреде-
ление наиболее рационального способа ведения игры
каждым из игроков, и представляет собой существо тео-
рии игр.
Необходимо подчеркнуть, что приведенные рассуж-
дения справедливы только для игры двух лиц с нулевой
суммой. Если число игроков больше двух, то возникает
совершенно иная ситуация, особенность которой в том,
что некоторые из игроков могут объединять свои дейст-
вия, образуя коалиции с договорным распределением
выигрыша между участниками коалиции. Участники ко-
алиции могут более полно оценить свои возможности и
проводить согласованные действия, обеспечивая себе
тем самым большую величину выигрыша.
Другим вариантом игры является игра с ненулевой
суммой. В такой игре выигрыши одних игроков могут
получиться не только за счет проигрышей других, но и
294
за счет каких-либо платежей, поступающих извне. Эти
платежи могут рассматриваться как проигрыши некото-
рого добавочного фиктивного игрока, что позволяет све-
сти игру п лиц с ненулевой суммой к игре п+1 лиц с
нулевой суммой.
Однако теория игр с п участниками для п>2 явля-
ется довольно сложной и недостаточно разработанной.
Поэтому мы ограничимся рассмотрением только игры
двух лиц с нулевой суммой.
Пример 8-1. Для пояснения введенных понятий рассмотрим сле-
дующую игру, состоящую из четырех ходов.
Первый ход (личный): первый игрок выбирает одно из
двух целых чисел 1, 2.
Второй ход (случайный): бросается монета и, если вы-
падает герб (и только в этом случае), второму игроку сообщается
о выборе первого игрока.
Третий ход (личный): второй игрок выбирает одно из
двух целых чисел 3, 4.
Четвертый ход (случайный): выбирается случайным
образом с вероятностями 0,4; 0,2; 0,4 одно из трех целых чисел 1,2,3.
Результаты игры: числа, выбранные в первом, третьем и
четвертом ходах, складываются и полученная сумма уплачивается
вторым игроком первому игроку, если она четная, и первым игроком
второму игроку, если она нечетная.
При предварительном анализе игру удобно предста-
вить в виде дерева, на котором положения, возникаю-
щие в процессе игры, изображаются вершинами, а хо-
ды— ветвями, соединяющими одну вершину с другой.
Дерево рассматриваемой игры приведено на рис. 8-1.
Вершины, соответствующие личным ходам первого и
второго игроков, обозначены соответственно / и II. Вер-
шины, соответствующие случайным ходам, обозначены
0. Конечные вершины, определяющие отдельные вари-
анты игры, помечены цифрами, означающими проигры-
ши второго игрока.
В разных вершинах, соответствующих личным ходам,
игрок обладает определенным видом информации о пре-
дыдущих ходах. Если в нескольких вершинах игроку
доступна одна и та же информация, то эти вершины
удобно объединить. Путем такого объединения получа-
ются группы вершин S,, называемые классами информа-
ции. В рассматриваемом примере имеется четыре клас-
са информации, содержание которых следующее:
S ) — ходов еще не было, первый игрок должен сде-
лать первый ход;
S2 — первый игрок выбрал 1;
295
S3 — первый игрок выбрал 2;
S4 — неизвестно, что выбрал первый игрок.
При попадании на вершину, находящуюся в классе
S4, второй игрок не имеет информации о выборе первого
игрока. Такая игра называется игрой с неполной инфор-
мацией. Если в класс информации входит только одна
9~8 7 -8 7-6 9-8 7 ~8 7-6 ~8 7~6
Проигрыш <j> 9 р Ч ? Р <? ? ? <? ? Р ? ?
% 3 Z7 3 Z 7 3Z 7 3Z7 3Z1
7-6 5 -8 7-6 7-6 5
ИР ИР ИР
3Z7 3Z7 3Z7
Четвертый
ход
Третий
ход
второй
ход
Первый
ход
Рис 8-1. Дерево игры.
вершина, то игрок, попадающий на эту вершину, полно-
стью осведомлен о всех предыдущих ходах (эту инфор-
мацию он может получить, например, проследив по де-
реву игры путь до данной вершины), т. е. имеет полную
информацию об игре. Игры, в которых каждый класс
информации содержит только одну вершину, называют-
ся играми с полной информацией (шахматы, шашки,
домино и т. п.).
Рассмотрим пространства стратегий игроков. Про-
странство стратегий первого игрока, состоящее всего из
двух элементов, которым соответствует выбор 1 или 2,
опишем табл. 8-1, а. Стратегия второго игрока должна
указывать его ход при любом возможном варианте иг-
ры. Вариант же игры определяется классом информа-
ции игрока. Для второго игрока имеются три класса
информации: S2, S3 и S4. Следовательно, стратегия вто-
рого игрока состоит в указании, какое из двух чисел (3
или 4) он выбирает в каждом классе информации. Так,
стратегия (4, 3, 3) означает, что второй игрок выбирает
4 в классе информации $2 и 3 в классах информации S3
296
и S4. Пространство стратегий второго игрока приведено
в табл. 8-1,6.
Таблица 8-1
Пространства стратегий для игры в примере 8-1
хг х2
(1) (2)
а)
У1 У2 Уз l/i Уз Уб У? У'
(333) (334) (343) (344) (433) (434) (443) (444)
б)
h (Г. 1) (Г, 2) (Г. 3) (Р, О (Р, 2) (Р, 3)
P(h) 0,2 0,1 0,2 0,2 0,1 0,2
в)
Случайные стратегии h состоят из двух ходов: вто-
рой ход — выбор Г или Р с вероятностями 0,5, 0,5 и чет-
вертый ход — выбор числа 1, 2 или 3 с вероятностями
0,4, 0,2, 0,4. Вероятность каждой стратегии равна про-
изведению вероятностей исходов обоих ходов. Простран-
ство случайных стратегий Н и распределение вероятно-
стей p(h) даны в табл. 8-1, в.
Для составления матрицы потерь следует определить
потери ql3 = L(Xi, которые в соответствии с (8-5) бу-
дут равны:
Ч^^Ц^У^Р^Х
причем величины L(Xi, yJt h) представляют собой циф-
ры, которыми помечены конечные вершины дерева игры.
Подсчет значений величин q^ удобно производить
табличным способом по аналогии с табл. 8-2, построен-
ной для определения qu.
297
Подсчет потерь qu для игры в примере 8-1
Таблица 8-2
h р (М L (хь yit h) L (х>, У1, h) p (h)
(Г, 1) 0,2 +5 + 1,0
(Г, 2) 0,1 —6 —0,6
(Г. 3) 0,2 +7 + 1,4
(Р, 1) 0,2 +5 + 1,0
(Р> 2) 0,1 —6 —0,6
(Р> 3) 0,2 +7 + 1,4
qu — +3,6
г) Верхняя и нижняя цены игры
Для того чтобы понять принципы, которые лежат в
основе выбора каждым игроком своей стратегии, рас-
смотрим игру с матрицей, представленной табл. 8-3.
Таблица 8-3
Матрица игры с седловой точкой
У1 У2 Уз yi A (x)
*1 7 2 5 1 1
x2 2 2 3 4 2
*3 5 3 4 4 3*
3 2 1 6 1
B({/) 7 3* 5 6 1
Предположим, что первый игрок выбирает страте-
гию Xk. Выигрыш L(xk, у) будет зависеть от стратегии,
которую выберет второй игрок. Например, при страте-
гии Х[ выигрыши первого игрока могут быть 7, 2, 5, 1.
Может ли первый игрок рассчитывать на наибольший
выигрыш, равный 7? Да, если он предположит, что вто-
рой игрок выбирает стратегию у{. Однако второй игрок
может выбрать любую другую стратегию, в том числе и
z/4. А тогда выигрыш первого игрока будет равен 1. Но
уже меньше 1 он быть не может ни при какой стратегии
второго игрока. Поэтому 1, являющаяся наименьшим
элементом множества L(xh у) = {7, 2, 5, 1}, представля-
298
ет собой гарантированный выигрыш первого игрока при
стратегии х^.
Обобщая приведенные рассуждения, видим, что если
первый игрок применяет стратегию ху, то он обеспечива-
ет для себя гарантированный выигрыш А{х/<), равный
наименьшему элементу множества L(xh, у):
А(хй) = minL(x/(,0). (8-8)
У
В теории игр предполагается, что игроки действуют
достаточно осторожно, избегая необоснованного риска.
В этом случае первый игрок должен выбирать такую
стратегию которая соответствует максимальному
из чисел А(х). Обозначая гарантированный выигрыш
первого игрока через а и называя его нижней чистой це-
ной игры, получаем:
а = max А (х) = max min L (х, у). (8-9)
X X у
Значения А(х), соответствующие игре с матрицей
вида табл. 8-3, приведены в крайнем правом столбце.
Значение а отмечено в этом столбце звездочкой.
Аналогичные рассуждения можно провести в отно-
шении второго игрока. Однако в матрице игры указаны
его проигрыши, которые он стремится сделать минималь-
ными. Рассмотрим стратегию уъ. Эта стратегия может
принести ему проигрыш, не больший чем
в ы = max L (х, yh). (8-10)
Для того чтобы обеспечить себе наименьшую вели-
чину проигрыша, второй игрок должен применять такую
стратегию У, которая соответствует минимальному
из чисел В (у). Обозначая величину проигрыша, кото-
рым может ограничиться второй игрок, через р и назы-
вая его верхней чистой ценой игры, получаем:
Р = min В (у) = min max L(x,y). (8-11)
У ух
Значения В (у) для игры с матрицей вида табл. 8-3
приведены в нижней строке таблицы. Значение р отме-
чено в этой строке звездочкой.
Теорема 8-1. Если G=(X, У, L)—игра, то для лю-
бого х£Х и у € Y имеет место:
А (х)< L (х, r/Х В (у) и а < р,
299
Доказательство. По определению
А (х) = min L (х, у) < L (х, у)-,
В (у) = max L (х, y)^L (х, у),
X
Следовательно,
А (х)< L (х, у) < В (z/).
(8-12)
(8-13)
(8-14)
Так как это соотношение справедливо при любых
х£Х и z/€ У, то, выбирая в качестве х то значение, при
котором А(х)=а, а в качестве у то значение, при кото-
ром B(z/)=p, получаем:
(8-15)
Как видим, нижняя цена игры, т. е. тот выигрыш,
который может обеспечить себе первый игрок, не пре-
вышает верхней цены игры, т. е. того проигрыша, кото-
рым может ограничиться второй игрок.
8-2. ЦЕНЫ И ОПТИМАЛЬНЫЕ СТРАТЕГИИ ИГР
а) Игра с седловой точкой
Простейшим частным случаем игры является случай,
когда а = р. Обозначим эту величину через с. Именно к
этому случаю относится игра с матрицей, заданной
табл. 8-3, где ц=р = 3.
В данном случае никакой способ игры не может га-
рантировать первому игроку выигрыш больший, чем р,
так как именно величиной р второй игрок может ограни-
чить свой проигрыш. С другой стороны, никакой способ
игры не может гарантировать второму игроку проигрыш
меньший, чем а, так как первый игрок может гарантиро-
вать себе выигрыш а. Следовательно, если а=р = с, то
никакая стратегия ни одного из игроков не может га-
рантировать ему лучшего результата, чем с. В то же
время каждый игрок может гарантировать себе резуль-
тат с. Другими словами, ни первый, ни второй игрок не
имеет лучшей стратегии, чем та, которая обеспечивает
им с. В этом случае с называется чистой ценой игры, а
стратегии игроков, обеспечивающие результат с, назы-
ваются оптимальными стратегиями.
Клетка матрицы, определяющая величину с, называ-
ется седловой точкой, так как значение с является мак-
300
симумом столбца и минимумом строки, на пересечении
которых стоит эта величина. Поэтому игра, имеющая
чистую цену, называется игрой с седловой точкой.
Игра с седловой точкой называется справедливой,
если с = 0. Если с=#=0, то игра будет несправедливой. Для
того чтобы сделать ее справедливой, первый игрок дол-
жен уплатить второму игроку величину с перед нача-
лом каждой новой партии.
61 Чистые и смешанные стратегии
Если игра не имеет седловой точки, то возникают за-
труднения в определении цены игры и оптимальны?; стра-
тегий игроков. Рассмотрим, например, игру, матрица ко-
торой дается табл. 8-4. В этой игре а = 4 и р = 5. Сле-
довательно, первый игрок может гарантировать себе
выигрыш, равный 4, а второй может ограничить свой про-
игрыш величиной 5. Область между (3 и а является как
бы ничейной, и каждый игрок может попытаться улуч-
шить свой результат за счет этой области. Каковы же
должны быть в этом случае оптимальные стратегии иг-
роков?
Таблица 8-4
Матрица игры без седловой точки
У1 У2 А (х)
Х1 3 6 3
*2 5 4 4*
В (у) 5* 6
Если каждый из игроков применяет отмеченную звез-
дочкой стратегию (х2 и yi), то выигрыш первого игрока
и проигрыш второго будут равны 5. Это невыгодно вто-
рому игроку, так как первый выигрывает больше, чем он
может себе гарантировать. Однако если второй игрок
каким-либо образом раскроет замысел первого игрока
о намерении применить стратегию х2, то он может при-
менить стратегию у2 и уменьшить выигрыш первого до
4. Правда, если первый игрок раскроет замысел второго
применить стратегию у2, то, используя стратегию x*i, он
увеличит свой выигрыш до 6. Таким образом, возникает
ситуация, когда каждый игрок должен хранить в секре-
301
те ту стратегию, которую он собирается применить. Од-
нако, как это сделать? Ведь если партия играется мно-
гократно и второй игрок применяет все время стратегию
г/2, то первый игрок скоро разгадает замысел второго и,
применив стратегию xlf будет иметь добавочный выиг-
рыш. Очевидно, что второй игрок должен менять стра-
тегию в каждой новой партии, но делать э(то он должен
так, чтобы первый не догадался, какую стратегию при-
менит он в каждом случае.
Секретность можно сохранить, если каждый раз вы-
бирать стратегию случайным образом, используя для
этого какой-либо механизм случайного выбора. Напри-
мер, второй игрок может бросить монету и применить
стратегию z/i, если выпадет герб, и z/2, если выпадет ре-
шетка. Такой способ действия лишает противника вся-
кой возможности узнать наперед о действиях другой сто-
роны.
При использовании механизма случайного выбора
выигрыши и проигрыши игроков будут случайными ве-
личинами. Результат игры в этом случае можно оценить
средней величиной проигрыша второго игрока. Так, ес-
ли в игре с матрицей вида табл. 8-4 второй игрок ис-
пользует стратегии у\ и у2 случайным образом с вероят-
ностями 0,5; 0,5, то среднее значение его проигрыша при
стратегии первого игрока будет равно:
Лср = 911-0,5 + ^2-0,5 = 3-0,5 + 6-0,5 = 4,5,
а при стратегии первого игрока х2
Лср = </21-0,5 + <722-0,5 = 5-0,5 + 4-0,5 = 4,5.
Следовательно, второй игрок может ограничить свой
средний проигрыш значением 4,5 независимо от страте-
гии, применяемой первым игроком.
Таким образом, в ряде случаев оказывается целесо-
образным не намечать заранее стратегию, которая дол-
жна быть использована, а выбирать ту или иную стра-
тегию случайным образом, основанным на использовании
какого-либо механизма случайного выбора. Страте-
гию, основанную на случайном выборе, будем называть
смешанной стратегией в отличие от рассмотренных ра-
нее заранее намеченных стратегий, которые теперь бу-
дем называть чистыми стратегиями.
Дадим более строгое определение чистых и смешан-
ных стратегий.
302
Пусть G=(X, У, L) — игра. Пространства Х={хь...
...,хт} и У — {f/i,уп}> содержащие перечни всех воз-
можных стратегий игроков, называются пространствами
чистых стратегий, а элементы этих пространств х^Х и
у € У являются чистыми стратегиями игроков.
Для получения смешанной стратегии игрок должен
использовать некоторый механизм случайного выбора
(бросание монеты, бросание игральной кости и т. п.),
имеющий число исходов, равное числу чистых стратегий
игрока.
Обозначим через £(/п) вероятности отдельных
исходов механизма случайного выбора первого игрока,
а через Л(п) вероятности отдельных исходов меха-
низма случайного выбора второго игрока. Если каждому
исходу i механизма случайного выбора первого игрока
назначается чистая стратегия Xi этого игрока, а каждо-
му исходу / механизма случайного выбора второго игро-
ка назначается чистая стратегия у$ этого игрока, то упоря-
доченные множества %— ..., g(m>) и rj — (?](1),..., т](п)),
элементы которых удовлетворяют условию нормировки
(4-4), будут представлять собой распределение вероят-
ностей Цх) и г](у) на пространствах X и У. Эти распре-
деления вероятностей полностью определяют характер
игры и называются смешанными стратегиями первого и
второго игроков.
В общем случае каждый игрок может располагать не
одним, а несколькими механизмами случайного выбора,
отличающимися различными распределениями вероятно-
стей на пространствах X и У, например |i= (£Р,..., I]"0)»
П1=(П$1>... ПГ’). П2=(П2П Т)2П>).--.
При этом множества
Е = {В1, ?2. } И Н = hl, Г|2,...} (8-16)
будут представлять собой пространства смешанных
стратегий первого и второго игроков
в) Функция потерь при использовании смешанных
стратегий
Рассмотрим игру G—(X, У, L), в которой X = {xi,...
...,xm} и y={z/i, ...,уп} являются пространствами чистых
стратегий игроков, a L(x, у) представляет собой потери
второго игрока, определенные для чистых стратегий
303
X и у СУ. В дальнейшем функцию Л(х, у) будем на-
зывать функцией потерь.
Предположим теперь, что игроки применяют смешан-
ные стратегии. Это означает, что заданы множества
Е= {Hi, g2-«.} и Н= {r|i, т]2. -}, элементы которых представ-
ляют собой смешанные стратегии игроков, т. е. различ-
ные распределения вероятностей g(x) и ц(у) на прост-
ранствах X и Y. Характер игры будет определен, если
каждый игрок выбрал свою смешанную стратегию g€E
и ц €Н. Следовательно, при использовании смешанных
стратегий в определение игры вместо множеств X и Y
должны войти множества Е и Н.
При использовании смешанных стратегий изменится
и величина проигрыша второго игрока, т. е. функция по-
терь. Поскольку игра приобретает случайный характер,
то случайными будут величины выигрышей и проигры-
шей игроков. Поэтому теперь можно вести речь лишь о
средней величине выигрыша X или проигрыша У, кото-
рая определится как функцией потерь L(x, у), так и рас-
пределениями вероятностей g(x) и х](у) и может быть
найдена по формуле для среднего значения функции двух
переменных как
МВ» n) = ^L(x,y) S(x)r](r/). (8-17)
х.у
Функция потерь т)) должна войти в определение
игры при использовании смешанных стратегий.
Таким образом, при использовании смешанных стра-
тегий мы получаем вместо игры G—(X, Y, L) новую
игру Г=(Е, Н, L), которая называется усреднением игры
G. В этой игре функция потерь £(g, т]) определяется по
формуле (8-17) как среднее от L(x, у) при заданных рас-
пределениях вероятностей £(х) и и](у).
Все вышесказанное можно суммировать в виде сле-
дующих определений.
Пусть G=(X, У, L) —игра. Пусть Е и Н определяют
различные распределения вероятностей £ и г] на прост-
ранствах Хи У, а £(£, -q) представляет собой среднее
значение функции потерь. Тогда игра
Г = (Е,Н,£) (8-18)
называется усреднением игры G.
Пусть Г=(Е, Н, £) —усреднение игры G=(X, У, L).
Тогда точких€Х ny€Y называются чистыми стратегия-
304
ми в игре G, а точки Е и т] € Н — смешанными страте-
гиями в игре G.
Отметим, что чистые стратегии можно рассматривать
как частный случай смешанных стратегий. Действитель-
но, смешанная стратегия, определяемая распределением
вероятностей
|(х) = р при Х==ХЬ’ (8-19)
(О при x4=xh,
совпадает с чистой стратегией Хь, а смешанная стратегия,
определяемая распределением вероятностей
. . 11 при у — у,\ /о
W) = А н (8-20)
(0 при у=£у„
совпадает с чистой стратегией
г) Верхняя и нижняя цены игры при использовании
смешанных стратегий
Пусть G=(X, У, Л) —игра, а Г=(Е, Н, А) —усредне-
ние игры.
Предположим, что первый игрок применяет смешан-
ную стратегию £€ Е. Этого игрока интересует, каков
будет его гарантированный выигрыш, т. е. та наимень-
шая сумма выигрыша, которую он может наверняка себе
обеспечить, даже если второй игрок применяет свою наи-
лучшую смешанную стратегию т|. При этом не исключа-
ется случай применения вторым игроком какой-либо из
чистых стратегий.
Обозначим гарантированную величину выигрыша
первого игрока при стратегии g через Аг (|). Очевидно,
что это есть нижняя граница функции выигрыша т])
при данном £ и различных ц € Н, т. е.
Ar(B) = minLQ,n). (8-21)
п
Далее первого игрока будет интересовать выбор из
всех возможных стратегий | € Е такой, при которой его
гарантированный выигрыш будет максимальным, т. е.
его интересует верхняя граница функции Аг (£), обоз-
20—142
305
качаемая через осг и называемая нижней ценой игры
при смешанных стратегиях игроков:
а = max Аг (5) = max min L (Е, т]). (8-22)
г н 1 £ п
Стратегия, для которой выполняется условие (8-22),
называется минимаксной (иногда максиминной) стра-
тегией первого игрока и обозначается g0-
Предположим теперь, что второй игрок выбрал ка-
кую-либо смешанную стратегию ц € Н. Этого игрока ин-
тересует, каков будет его наибольший проигрыш при
наилучшей стратегии g € Е первого игрока, т. е. верхняя
граница функции L(g, q) при заданном г] и различных
Е, обозначаемая Br(q),
Br(n) = maxL(g,n). (8-23)
Второго игрока будет интересовать выбор такой
стратегии т]€ Н, при которой его проигрыш будет мини-
мальным, т. е. его интересует нижняя граница функции
Вг(т]), обозначаемая через 0Г и называемая верхней це-
ной игры при смешанных стратегиях игроков:
рг = min Вг (т|) = min max L (g, q). (8-24)
»i n £
Стратегия, для которой выполняется условие (8-24),
называется минимаксной стратегией второго игрока и
обозначается т]о.
Для удобства дальнейших рассуждений введем сле-
дующие обозначения для нижней и верхней пены игры
G=(X, У, L) при использовании чистых стратегий:
Ag(x)= min L(x, у)—гарантированный выигрыш пер-
У
вого игрока при стратегии
ао = тах Ag(x) — нижняя цена игры G при чистых стра-
X
тегиях игроков;
Bg(#) = max L(x, у) —наибольший проигрыш второго
х
игрока при стратегии у € У:
Pg= min BG (*/)—верхняя цена игры G при чистых
стратегиях игроков.
Целесообразность использования смешанных страте-
гий вытекает из теоремы, которую мы приводим без до-
казательства.
306
Теорема 8-2. Если имеется игра G=(X, Y, L) и Г=
= (Е, Н, L) есть усреднение игры G, то
а) Аг(£) = min L (t, у);
У
б) ае<аг;
в) Вг (т|) = max L (х, г)); (8-25)
Г) > Рг;
д) аг < рг.
В пункте а) содержится утверждение, что при выборе
первым игроком любой смешанной стратегии величина
его гарантированного выигрыша равна величине гаран-
тированного выигрыша при использовании вторым игро-
ком только чистых стратегий. Согласно пункту б) ниж-
няя цена игры при смешанных стратегиях первого игрока
не меньше нижней цены игры при чистых стратегиях, т. е.
что существует смешанная стратегия, которая во всяком
случае не хуже оптимальной чистой стратегии. Пункты
в) и г) содержат аналогичные утверждения в отношении
второго игрока. Пункт д) означает, что нижняя цена
игры ссг при использовании смешанных стратегий не
превосходит верхней цены игры, т. е. при использовании
наилучших смешанных стратегий гарантированный вы-
игрыш первого игрока не превзойдет обеспеченного про-
игрыша второго игрока.
Из сопоставления пунктов б), г) и д) находим:
аа < аг < рг < рс. (8-26)
Из (8-26) следует, что если игра G имеет чистую це-
ну, т. е. ccg=Pg=c (как мы видели, это имеет место для
игр с седловой точкой), то аг=(Зг=с, т. е. игра Г имеет
также чистую цену. Поэтому оптимальная стратегия в
игре G является оптимальной и в игре Г. В этом случае
игру Г вообще не следует рассматривать, а оптимальные
стратегии игроков можно находить методом, описанным
для игр с седловой точкой.
Однако игра Г была введена с целью анализа таких
шгр, у которых ocgCPg- Возникает вопрос, не окажется
ли для большого класса игр, что в этом случае аг=р, =
=сг и величину сг можно рассматривать как чистую
цену игры Г. В полных курсах теории игр [58—60] дока-
201
307
зывается теорема о том,-что всякая конечная игра имеет
цену и у каждого из игроков имеется по меньшей мере
одна оптимальная стратегия. Эта теорема получила наз-
вание основной теоремы теории игр. При формулировке
этой теоремы исходят из следующего определения опти-
мальной стратегии.
Пусть имеется игра G = (X, У, L) и пусть Г = (Е, И, L)
есть усреднение игры G. Есл-и игра Г имеет чистую цену
=аг =рг , то говорят, что игра G имеет цену су и лю-
бая оптимальная стратегия в игре Г, т. е. стратегия, обе-
спечивающая гарантированные значения выигрыша
первого игрока и проигрыша второго, равные сг , называ-
ется оптимальной стратегией в игре G. Нетрудно видеть,
что если аг = Pi = сг, то минимаксные стратегии игроков
£о(*) и. т]о(У) будут оптимальными стратегиями.
Таким образом, решение игры сводится к нахожде-
нию минимаксных смешанных стратегий игроков go(*) и
По(У)-
8-3. ГЕОМЕТРИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ИГРЫ
а) S-игра
Играм, в которых у первого игрока имеется конечное
число чистых стратегий, можно дать полезную геометри-
ческую интерпретацию. Пусть дана игра G=(X, Y, L)
с матрицей Q = определяемой выражением (8-7).
Свяжем с каждым у С У точку С в m-мерном пространстве,
координатами которой являются потери второго игрока
при всевозможных чистых стратегиях первого игрока:
C = [L(xvy).....L(xm, у)]. (8-27)
Учитывая, что L(xt, у}) =qu и придавая «/всевозмож-
ные значения, получим п точек
С1 = (<71П <7ml); •••; = (<71п» •••> Чтп)> (8-28)
имеющих в качестве своих координат потери, заданные
соответствующими столбцами матрицы игры. Игра, за-
данная множеством точек
{Clt .... Сп}, (8-29)
получила название S-игры. Играют в нее следующим об-
разом.
Второй игрок выбирает одну из точек С; множества
(8-29), например С3. Независимо от выбора второго иг-
рока первый игрок выбирает координату точки Сг, на-
308
пример вторую. При этом потери второго игрока будут
равны значению второй координаты точки С3, т. е. <?2з.
Как видим, S-игра эквивалентна обычной игре, по
крайней мере при использовании чистых стратегий, так
как выбор точки из множества (8-29) эквивалентен вы-
бору стратегии у£ У, а выбор координаты этой точки
эквивалентен выбору стратегии х € X.
Если число стратегий первого игрока равно двум, то
S-игра имеет наглядное геометрическое изображение,
так как точки множества (8-29) будут в этом случае точ-
ками плоскости.
Пример 8-2. Рассмотрим игру с матрицей, определяемой табл.
8-5. Эквивалентная S-игра содержит пять точек. Ci = (l, 0), Сг = (2,
3), Сз=(—1, 1), С4=(0, —1), С5= (1, 2). Геометрическое изображе-
ние этой игры приведено на рис. 8-2.
Таблица 8-5
Обозначим через S* выпуклую
оболочку конечного множества
точек {Ci,Сп} и докажем тео-
рему, из которой следует, что
S-игра эквивалентна обычной иг-
ре при использовании не только
чистых, но и смешанных страте-
гий.
Теорема 8-3. Любая смешан-
ная стратегия второго игрока мо-
жет быть представлена точкой,
принадлежащей выпуклой обо-
лочке 3\ и наоборот, любая точ-
ка SCS* может рассматривать-
Рис. 8-2. Геометриче-
ское представление
S-игры.
ся как некоторая смешанная стратегия второго игрока.
Доказательство. Рассмотрим смешанные стра-
тегии игроков £=(£(1),..., £(т)) и т]= (р(1),..., r](n)). Потери
второго игрока при использовании данных смешанных
стратегий будут равны:
(8-30)
309
где
(8-31)
k
Обозначим через S точку в m-мерном пространстве
с координатами S(1),..., S(w), где согласно (8-31)
5(1)= 911 п0) + —I- <7in п*"*;
.................................. (8-32)
5<т) = 9т1П(1) + --- + 9тпП(П)..
Учитывая, что (qu.... qmi)=Ci, выражения (8-32)
можем записать в виде одного векторного соотношения
S = Сг п(1) + • • • + Сп п(п) = 2 Сгп<0. (8-33)
i
Принимая во внимание, что величины T](i) удовлетво-
ряют соотношениям (4-4), видим, что S есть не что иное,
как средневзвешенное точек Сп с весами л(п),
а следовательно, S есть некоторая точка, принадлежа-
щая выпуклой оболочке S*. Таким образом, каждой
стратегии т]= ('П(1),---> Л(п)) второго игрока будет соответ-
ствовать некоторая точка, принадлежащая выпуклой
оболочке S*, и задание этой точки равносильно заданию
смешанной стратегии второго игрока.
Справедливо и обратное. Поскольку любая точка S,
принадлежащая выпуклой оболочке S*, может быть
представлена как средневзвешенное точек Ci,..., Сп, оп-
ределяющих выпуклую оболочку S*, т. е. представлена
в виде выражения (8-33), то для каждой точки S € S*
найдутся такие веса т](1),..., л(п)> задание которых опреде-
лит смешанную стратегию второго игрока.
Следствие. Поскольку смешанная стратегия пер-
вого игрока остается в S-игре той же самой, что и в обыч-
ной игре, из доказанной теоремы следует, что S-игра
полностью эквивалентна обычной игре, т. е. любая игра
может быть представлена в виде эквивалентной S-игры.
В дальнейшем S-игру будем обозначать Гь Для пере-
хода от игры Г=(Е, Н, L) к S-игре вместо пространства
смешанных стратегий второго игрока Н= {rji, т]2,...} не-
обходимо использовать пространство S-стратегий, т. е.
выпуклую оболочку S*. Если обозначить потери второго
310
игрока в S-игре через L\, то S-игра определится тройкой
Е, S* и Li, причем потери Lt должны быть определены на
прямом произведении EXS*. Таким образом, выражение
I\ = (Е, S*. (8-34)
определяет S-игру. Функция потерь Li(£, S) на основа-
нии (8-30) определится при этом следующим образом:
ММ) = 2^'>5<‘’ MS, (8-35)
i
где через gS обозначено скалярное произведение векто-
ров (g^,..., ^)) и s^).
б) Нижняя и верхняя цены игры в S-игре
Если первый игрок применяет в S-игре смешанную
стратегию g€E, то значение его гарантированного вы-
игрыша будет равно:
Ar (Е) = min L. (В, S) - min tS. (8-36)
s s
Обозначим через go= (g^1}»Цт)) такую стратегию
первого игрока, при которой Art (£) достигает максиму-
ма. Значение АгД£) будет равно нижней цене игры
которая в силу эквивалентности S-игры с обычной игрой
совпадает с аг. Следовательно,
аг = Аг (gJ = max Аг (g) = max min gS. (8-37)
1 v ' a 1 s s
Стратегия go, удовлетворяющая соотношению (8-37),
называется минимаксной стратегией первого игрока.
Предположим теперь, что второй игрок применяет
некоторую стратегию S€S*. Значение проигрыша, ко-
торым он при этом ограничивается, будет равно:
ВГ1 (S) = max Lt (g, S) = max gS, (8-38)
Обозначим через So= (S^,..., S^m)) такую точку вы-
пуклой оболочки S*, которая обращает в минимум вели-
чину Вг (S). Значение ВГ1 (So) будет равно верхней цене
игры [Зг , которая в силу эквивалентности S-игры с обыч-
ной игрой совпадает с |3Г. Итак,
Pi R ~ min (5) == m*n max 15, (8-39)
311
Стратегия So, удовлетворяющая соотношению (8-39),
называется минимаксной стратегией второго игрока.
Выражения для ВгД5) и рг можно представить в бо-
лее удобном виде, если воспользоваться следующей тео-
ремой.
Теорема 8-4. Если S — произвольная точка т-мерного
пространства и g=(g(1),..., g(m))—многомерная перемен-
ная, компоненты которой удовлетворяют условию (4-4),
то имеет место соотношение
max £3 = max (S(1),..., Stm)). (8-40)
Доказательство. Пусть S(ft)=max (S(1),..., S(zn)).
Рассмотрим частное значение g, соответствующее случаю
r 11 (841)
[0 при i =/= k.
В этом случае gS=S(ft). Таким образом, S(ft) является
частным значением скалярного произведения gS, а зна-
чит, подмножеством множества значений gS, получаю-
щихся при всевозможных значениях g. На основании
теоремы о верхней границе подмножества находим:
Sw = max (S(1>, ..., S(m)) < max |S. (8-42)
С другой стороны, заменяя в выражении для gS зна-
чения S(1),..., S(m) на максимальное значение полу-
чаем:
£3 = 2 V 3‘ < Sw 2 (8-43)
i i
Это выражение справедливо при любом g, удовлетво-
ряющем соотношению (4-4), в том числе и при таком,
когда gS обращается в максимум. Сопоставляя (8-42) и
(8-43), приходим к соотношению (8-40).
Воспользовавшись доказанной теоремой, выражение
для Вг (S) представим в виде
ВГ1 (3) = max S3 = max (S(I),..., S(m)). (8-44)
Из выражения (8-44) выведем несколько следствий.
(Следствие 1. Из условия рр<Вг (S) получаем:
pr<max(S(1), ...,S(m)). (8-45)
312
Любая точка S g S* имеет по крайней мере одну ко-
ординату, не меньшую (т. е. большую или равную) рг.
Следствие 2. Полагая S=So=(S,(1;’,.-., по-
лучаем:
Рг = Вг> (Su) = max (S<Sl),... , S'"'11. (8-46)
Верхняя цена игры |3t равна максимальной из коор-
динат точки So, определяющей минимаксную стратеппо
второго игрока.
в) Геометрическая иллюстрация принципа мннммакса
Рассмотрим множество Т, состоящее из всех точек
f= /(ш)), таких, что при i=0,l... m. На
рис. 8-3 показана область Т для двумерного прос.транст-
Рис. 8-3, Область Т в двумерном простран-
стве.
ва, которая в данном случае имеет вид прямоугольного
клина с вершиной, лежащей на прямой, проведенной из
начала координат под углом 45° к оси абсцисс. Выясним
некоторые свойства множества Т,
Множество Т является выпуклым. Рассмотрим две
произвольные точки t\ и t2 этого множества. Уравнение
отрезка, соединяющего эти две точки, будет иметь вид:
t = tY + w212; wly w2 0; + w2 = 1. (8-47)
Проектируя это уравнение на i-ю ось и учитывая те-
орему 8-4, получаем:
tl = /il) + w21{2} < max (б(0, /2°) < Рг. (8-48)
Следовательно, любая точка рассматриваемого от-
резка принадлежит Т и множество Т выпуклое.
Множество Т не пересекается с множеством S*. Это
следует из того, что любая точка множества S* имеет по
крайней мере одну координату, большую или равную рг
(см. следствие 1 из теоремы 8-4), а значит, Т и S* не
имеют общих точек.
313
Покажем, что точка So, определяющая минимаксную
стратегию второго игрока, является граничной точкой
области S*, причем такой, в которой область Т касается
области S*.
Как мы видели, So=(S^’S(um)) € S*, причем max
(S^ С ДРУг°й строны, Ит})£Т,
если /‘<pr, i=l, tn.
Рис. 8-4. Геометрическое определение минимаксной стратегии.
Рассмотрим точку S1' = (S<1)—е S^m>—е), где е>0.
Очевидно, что max (5<0—е,..., Sf,m)—е) <₽г. так что
—в<pr, i—1,т. Следовательно, S'0£T. Но lim S'o =
Отсюда следуют два вывода:
1) So — граничная точка области S*;
2) So — точка, в которой область Т касается обла-
сти S*.
Эти свойства позволяют легко находить геометриче-
ски минимаксную стратегию So для случая, когда первый
игрок имеет две чистые стратегии, т. е. когда эквивалент-
ная S-игра изображается множеством точек плоскости.
Для построения области Г, касательной к области S*,
314
удобно провести вспомогательную прямую из начала
координат под углом 45° к оси абсцисс, на которой лежит
вершина прямоугольного клина, образующего область Г.
На рис. 8-4 приведены различные случаи взаимного
расположения областей S* и Т и отмечены точки, опре-
деляющие минимаксную стратегию So второго игрока.
8-4. РЕШЕНИЕ ИГР
а) Доминирующие и полезные стратегии
Как мы знаем, смешанные стратегии игроков пред-
ставляют собой смесь чистых стратегий х£Х и у£ Y, ко-
торые берутся в соответствии с распределением вероят-
ностей £(х) и х](у). Однако во многих случаях очевидно,
что применение некоторых из чистых стратегий явно не-
целесообразно и при определении оптимальной смешан-
ной стратегии их просто не следует учитывать. Будем
называть те из чистых стратегий, которые входят в со-
став оптимальной смешанной стратегии, полезными
стратегиями игрока. Для облегчения выделения полез-
ных стратегий введем понятие доминирующих стратегий.
Рассмотрим две стратегии yi и ур второго игрока.
Пусть первый игрок применяет стратегию xt. Потери
второго игрока будут соответственно qLt и qip. Может
оказаться, что при любом i
Яц < 1 = М, (8-49)
т. е. в матрице игры потерн в столбце I не превосходят
соответствующих потерь в столбце р. Это означает, что
второму игроку ни при каких условиях невыгодно при-
менять стратегию ур, так как, применяя ее, он заведомо
несет большие потери, чем при стратегии у/. Поэтому
стратегия ур должна быть отброшена, т. е. вычеркнута
из матрицы игры. Стратегия уь удовлетворяющая усло-
вию (8-49), называется доминирующей по отношению к
стратегии ур.
Доминирующие стратегии второго игрока имеют на-
глядную геометрическую иллюстрацию при переходе к
эквивалентной S-игре на плоскости. В этом случае т=2
и условие (8-49) запишется в виде
Яц < Я2р- (8’5°)
315
На рис. 8-5 приведены два случая расположения то-
чек Ci и Ср, соответствующие чистым стратегиям yi и ур
второго игрока. Легко видеть, что в случае, представлен-
ном на рис. 8-5, а, стратегия Q доминирует над страте-
гией Ср, а в случае, представленном на рис. 8-5,6, ни
одна из стратегий не является доминирующей. Для того
чтобы стратегия yi доминировала над стратегией ур,
точка С/ должна лежать левее и ниже точки Ср.
Рис. 8-5. Определение доминирования в S-игре.
Аналогичным образом определяются доминирующие
стратегии первого игрока. Мы говорим, что стратегия xi
доминирует над стратегией хр, если выигрыш первого
игрока при стратегии Xi больше выигрышей при страте-
гии хр при любой стратегии у£ Y:
qu>qpi, (8-51)
т. е. если в матрице игры потери в строке Xi больше соот-
ветствующих потерь строки хр.
Пример 8-3. На рис. 8-6 S-игра задана на плоскости точками
Ci—Сб. Как видно из рисунка, над точкой С5 доминирует Сь а над
точкой С4 доминируют Ci, С2 и С6. Отбрасывая точки С5 и С4, при-
ходим к S-игре, определяемой точками G, С2, Сз, Св, среди которых
нет доминирующих.
Удаление из матрицы игры тех стратегий, над кото-
рыми доминируют другие стратегии, значительно упро-
щает игру, а следовательно, и поиск оптимальной стра-
тегии. Предположим теперь, что в рассматриваемой игре
ни одна стратегия не доминирует над другой. Спраши-
вается, все ли стратегии в этом случае являются полез-
ными, т. е. используются для получения оптимальной
смешанной стратегии.
Обратимся к игре, приведенной на рис. 8-6. После удаления то-
чек С4 и С5, над которыми доминируют другие точки, мы пришли к
игре, изображаемой точками Ci, С2, Сз, Се. Построив область Т, ви-
316
дим, что точка So, определяющая оптимальную стратегию второго
игрока, лежит на прямой, соединяющей точки С\ и С2, и может
быть представлена как средневзвешенное этих точек Таким образом,
оптимальная смешанная стратегия второго игрока представляет со-
бой смесь чистых стратегий tji и уг,' которые в данном случае и яв-
ляются полезными. Стратегии уз и уъ полезными не являются и их
использование нерационально.
Общее число полезных
стратегий каждого из игро-
ков можно определить исхо-
дя из того, что выпуклая
оболочка S* конечного мно-
жества {Ci,..., С'н) является
выпуклым многогранником
в m-мерном пространстве.
Точка So, .являющаяся гра-
ничной точкой выпуклого
многогранника 3*, будет
Рис 8-6. Пример S-игры
принадлежать обязательно к одной из его граней, вер-
шины которой и будут соответствовать полезным страте-
гиям второго игрока. Учитывая, что число вершин любой
грани выпуклого многогранника 3* не может превышать
общего числа его вершин, т. е. числа и, и не может пре-
вышать мерности пространства, в котором существует
выпуклый многогранник, т. е. числа т, приходим к вы-
воду, что число стратегий второго игрока не превышает
наименьшего из чисел т и п. Поскольку понятия первого
и второго игроков условны, аналогичный вывод справед-
лив и для первого игрока.
Таким образом, в игре с матрицей размером т\п
число полезных стратегий каждого из игроков не превы-
шает наименьшего из чисел т и п.
Теорема 8-5. Если один из игроков придерживается
своей оптимальной смешанной стратегии, то выигрыш
игроков остается неизменным и равным цене игры v не-
зависимо от того, какую смешанную (или чистую) стра-
тегию применяет другой игрок, если только он не выхо-
дит за пределы своих полезных стратегий.
Доказательство. Пусть v — цена игры, а £о =
= (с*0,..., —оптимальная смешанная стратегия пер-
вого игрока. Если первый игрок применяет свою опти-
мальную стратегию g0, то его выигрыш не может быть
меньше v.
Предположим, что второй игрок имеет k полезных
стратегий, обозначенных у\, ..., уь. Если первый игрок
317
применяет свою оптимальную стратегию а второй иг-
рок применяет полезную стратегию г/,(/=1, й), то выиг-
рыш первого игрока Vi будет не меньше v:
> v, i = 1, k. (8-52)
Рассмотрим теперь оптимальную смешанную страте-
гию второго игрока г]0.Она задается вероятностями
с которыми применяются чистые полезные стратегии.
Существенно, что не может быть т^г)—о при i= ГД, так
как в этом случае r-я стратегия не входила бы в опти-
мальную смешанную стратегию второго игрока, т. е. не
была бы полезной.
Найдем средний выигрыш первого игрока, если вто-
рой игрок применяет свою оптимальную смешанную
стратегию. Использование вторым игроком оптимальной
смешанной стратегии т]0 означает, что первый игрок бу-
дет получать выигрыши vi, ..., Vk, соответствующие чис-
тым стратегиям r/i,..., уь, с вероятностями ...,
Средний выигрыш первого игрока будет при этом равен:
Lcp = + ... + = 2 Ъ (8-53)
1=1
Заменяя Vi на v и учитывая (8-52), получаем:
/?
^сР < у 2 v- (8‘54)
i=l
Но средний выигрыш при оптимальных стратегиях
игроков и есть цена игры v, т. е.
^>ср ==:: V» (8-о5)
С другой стороны, соотношение (8-53) может перей-
ти в (8-55), только если выполняется условие
V. = v, i = 1, (8-56)
что и доказывает теорему.
Таким образом, средний выигрыш первого игрока, ес-
ли он применяет свою оптимальную смешанную страте-
гию, будет один и тот же при применении вторым игро-
ком любой из полезных стратегий, а значит, и любой
смешанной стратегии, состоящей из полезных страте-
гий.
Следует, конечно, помнить, что всегда наиболее вы-
годным является использование оптимальной смешан-
318
ной стратегии. Использование полезных, хотя и не опти-
мальных, стратегий не приносит ущерба только в том
случае, когда противник придерживается оптимальной
стратегии. Использование же оптимальной стратегии
всегда обеспечивает выигрыш, равный цене игры.
Теперь остается выяснить, как же находить полезные
и оптимальные стратегии игроков, т. е. рассмотреть воп-
рос о нахождении решения игры.
6) Нахождение оптимальных стратегий
Рассмотрим игру G=(X, У, L) с матрицей т\п. Бу-
дем считать, что в игре G отсутствует седловая точка
(в противном случае решение легко находится по прави-
лу, установленному в § 8-2) и удалены те стратегии, над
которыми имеется доминирование.
Обозначим через £о= (^1}, —, £от)) оптимальную сме-
шанную стратегию первого игрока. Некоторые могут
быть равны нулю. Это означает, что соответствующая
стратегия Xi не является полезной. Перед нами стоит за-
дача, найти значения £о1) для f=l, т.
Предположим, что второй игрок использует страте-
гию уь. Если это полезная стратегия, то выигрыш пер-
вого игрока будет равен v, если же эта стратегия не яв-
ляется полезной, то выигрыш первого игрока может
быть и больше V. Следовательно, в общем случае имеет
место:
L(?o, Ук) = ?oU qlh + ... + qmh>v. (8-57)
Такие выражения могут быть составлены для каж-
дой чистой стратегии второго игрока, т. е. для й=1, п.
Кроме того, известно, что
> о, + ... + ^"!) = 1. (8-58)
Будем считать v>0. Это будет выполняться всегда,
если все элементы матрицы игры положительны. Ес-
ли же среди элементов qth имеются отрицательные, то
их можно сделать положительными, прибавив ко всем
элементам матрицы игры некоторое число v'>0. При
этом цена игры увеличится также на величину v'.
Поделим уравнения (8-57) и (8-58) на v, обозначив
^7v = Pi. (8-59)
319
Очевидно, что р,^0. Неравенства (8-57) при k = \, п
запишутся при этом в виде
Р1<711 + .. • + Рт Рт1 1 ’
’• + Рт Ртп .
(8-60)
а соотношение (8-58) примет вид:
Pi + ... +pm= 1/v. (8-61)
В линейные неравенства (8-60) входят неизвестные
величины рь рт, определяющие смешанную страте-
гию первого игрока. Определение оптимальной смешан-
ной стратегии требует нахождения такого решения
системы (8-60), при котором значение v становится мак-
симальным, а следовательно, линейная форма (8-61) при-
нимает минимальное значение. Но это есть обычная за-
дача линейного программирования.
Для удобства в выражениях (8-60) следует перейти
от неравенств к равенствам, вычтя из правых частей по-
ложительные добавочные неизвестные г/, что дает систе-
му уравнений
Pi Qu + ••• +pmqmi — ?i = 1, i = Тп. (8-62)
В тех уравнениях (8-62), которые соответствуют по-
лезным стратегиям второго игрока, в результате реше-
ния получится zz = 0. Таким образом, решая систему
(8-62) при условии минимизации линейной формы
(8-61), мы находим смешанную стратегию первого игро-
ка, цену игры v и полезные стратегии второго игрока
i/i, №•
Для нахождения оптимальной смешанной стратегии
второго игрока т]о=(ц^\ •••, содержащей k неизвест-
ных т]*1), т]*/0, необходимо составить k уравнений. Од-
но из них
т|о1) + ... + — 1. (8-63)
Остальные k—1 уравнений получим, составив выра-
жения для средних потерь при оптимальной смешанной
стратегии второго игрока и при любых k—1 полезных
стратегиях первого игрока. Так, для полезной стратегии
xt будем иметь уравнение
По‘Ч1+ ... + = V. (8-64)
320
Составив k— 1 уравнений вида (8-64) и добавив к
ним уравнение (8-63), получим k уравнений, решая кото-
рые, легко найти значения т)^0, ..., определяющие
оптимальную смешанную стратегию т]о второго игрока.
Пример 8-4. Найти решение игры с матрицей, заданной табл.
8-6.
Таблица 8-6
Уу Уз Уз
*1 *2 х3 2 —3 4 со ю 1 1 4 —5 6
Прежде всего убеждаемся, что в игре отсутствует седловая точ-
ка и ни одна из стратегий не доминирует над другими. Дтя того что-
бы не иметь дела с отрицательными элементами матрицы игры, до-
бавляем к каждому элементу матрицы число 5. Матрица игры при-
нимает вид табл. 8-7.
Таблица 8-7
!,1
*1 7 2 9
х2 2 9 0
х3 9 0 11
Уравнения (8-62) запишутся в виде
7₽i 4- 2рг + 9pi — гг = 1;
2pt + 9р.г — г2 = 1;
9pt+ 11р3 —г3 = 1.
Решение этих уравнений должно удовлетворять условию мини-
мума линейной формы (8-61)
Р1 + Р2+ Рз = пнп.
Решая полученную задачу линейного программирования, на-
ходим:
г1 ~ г2 = <з ~ 0; Pi = 0,05; р2 = 0,1; р., = t',05
Как видим, все три стратегии у\, у? и z/з являются полезными.
Из выражения (8-61) находим:
Pi + Р2 "Г Рз
при этом
= 5р1 = 0,25; = 5р2 = 0,5; ^3) = 5р, =0,25.
21 — 142
321
Для нахождения оптимальной смешанной стратегии второго иг-
рока составляем одно уравнение вида (8-63)
По” + По2> + 'По3) = 1
и два уравнения вида (8-64) для полезных стратегий первого игро-
ка %2 и Хз:
2т]^1) 4- 9т^2) = 5;
9^1) + 11^3) = 5.
Решая совместно три полученных уравнения, находим:
= 0,25; т^2) = 0,5.
Вспоминая, что ко всем элементам матрицы игры было прибав-
лено число 5, находим цену игры v—5 = 0.
в) Геометрическая иллюстрация принципа минимакса в
игре 2Хп
В игре 2Х^ смешанная стратегия первого игрока
представляет собой упорядоченную пару g=(£, 1—£).
Если второй игрок применяет стратегию то средний
выигрыш первого игрока
L (£. Уч) = + (1 — О Я24 = Я24 + £ (Я14 — (8-65)
т. е. линейно зависит от £, как показано на рис. 8-7.
Определение оптимальной стратегии £0 рассмотрим
на примере игры с матрицей, заданной табл. 8-8. На
рис. 8-8 цифрами /, 2 и 3 обозначены линии выигрыша
для стратегий z/i, у2 и у3 соответственно. Гарантирован-
ный выигрыш первого игрока при любом убудет опреде-
ляться нижней границей приведенного графика, отмечен-
ной жирной линией. Согласно принципу минимакса оп-
тимальной стратегией £0 будет такая, при которой гаран-
тированный выигрыш максимален. Эта стратегия опре-
делится точкой М, определяемой пересечением линий
выигрыша при стратегиях у{ и у2, которые, таким обра-
зом, и будут полезными стратегиями второго игрока.
Таблица 8-8
322
Оптимальную смешанную стратегию go можно найти
из условия равенства среднего выигрыша первого игро-
ка при полезных стратегиях yi и у2 второго игрока
+ 4(1 - ?0) = 3g0 + 2(1 - Го),
что дает g0= 1/2. Таким образом, g0= (1/2, 1/2). Цена
игры теперь найдется как средний выигрыш первого иг-
Рис. 8-7. Линия выигры-
ша при стратегии yh.
Рис. 8-8. Минимаксная
стратегия в игре 2Х^.
рока при стратегии g0 и любой из полезных стратегий,
например у{, второго игрока:
v = g0 + 4 (1 — g0) = 2,5.
Оптимальная смешанная стратегия второго игрока
-q0= (tjCP, 1—0) при известной цене игры v найдет-
ся из выражения средних потерь второго игрока при лю-
бой из полезных стратегий первого игрока. Например,
при стратегии Xi получаем:
По” + 3(1 — тй”)=2,5,
что дает По” =1/4. Итак, г)о= (1/4, 3/4, 0).
ЗАДАЧИ К ГЛ. 8
8-1. Вычислите матрицу потерь для игры в примере 8-1.
8-2. Для следующей игры вычислите матрицу потерь, предва-
рительно нарисовав дерево игры.
Бросается симметричная монета, и если выпадет герб, первый
игрок выбирает одно из чисел 1, 6. Если же выпадет цифра, он вы-
бирает одно из чисел 2, 7. Затем второй игрок выбирает одно из
двух чисел 3, 9. Выбранные игроками числа складываются и дают
сумму S. Потом бросается жребий с вероятностью выпадения гер-
ба 0, 8. Если при этом бросании выпадает iep6, второй игрок плати г
первому <S руб., если выпадает цифра, то первый игрок платит вто-
рому S руб. Первому игроку известен исход первого случайного хо-
да. Второму игроку ничего не известно о предыдущих ходах.
21*
323
8-3. Удобным механизмом случайного выбора является положе-
ние секундной стрелки на циферблате в случайный момент времени.
Опишите использование этого механизма случайного выбора для по-
лучения следующих распределений вероятностей:
/_3_ _2j / 1 2 _1_\ / 1 2 _2\
\ 5 ’ 5 ; ’ \ 6 ’ 3 ’ 6 / \ 5 ’ 5 ’ 5 / ’
8-4. Опишите действия игроков в одной партии игры, матрица
которой задана табл 8-4. при использовании первым игроком чистой
стратегии лд, а вторым игроком — смешанной стратегии т| = (0,5; 0,5).
ГЛАВА ДЕВЯТАЯ
ТЕОРИЯ СТАТИСТИЧЕСКИХ РЕШЕНИЙ
(СТАТИСТИЧЕСКИЕ ИГРЫ)
9-1. СТРУКТУРА СТАТИСТИЧЕСКИХ ИГР
а) Стратегические и статистические игры
Специфическим видом игр, имеющих большое значе-
ние при анализе различных практических ситуаций, яв-
ляются так называемые статистические игры. Они имеют
ряд существенных отличий от того вида игр, которые
рассматривались до сих пор и которые могут быть на-
званы стратегическими играми.
В основе теории стратегических игр лежит предполо-
жение, что интересы двух игроков являются противопо-
ложными. Каждый из игроков стремится так выбрать
свою стратегию, чтобы получить для себя наибольшую
выгоду и свести до минимума выгоду противника. В та-
ких играх каждый игрок действует активно и стремит-
ся по возможности использовать свою оптимальную
стратегию.
Однако во многих практических ситуациях приходит-
ся сталкиваться со случаями, когда один из игроков
оказывается нейтральным, т. е. таким, который не стре-
мится извлечь для себя максимальной выгоды и, следо-
вательно, не стремится обратить в свою пользу ошибки,
совершаемые противником. К таким играм относятся
игры, в которых в качестве одного из игроков выступает
природа. Здесь в понятие «природа» мы вкладываем
всю совокупность внешних обстоятельств, в которых
приходится принимать решение.
Природу нельзя рассматривать как разумного про-
тивника, который мог бы использовать ошибки, совер-
324
шаемые человеком. Другими словами, природа не име-
ет злого умысла по отношению к человеку. Она просто
развивается и действует в соответствии со своими зако-
нами и во власти человека обратить эти законы себе на
пользу. Если бы человек совершенно точно знал законы
природы, он мог бы их использовать с максимальной для
себя выгодой. Однако во многих случаях человек или не
знает закона природы, или знает его недостаточно
полно.
Неизбежной платой за попытку получить решение в
условиях неполной информации о законе природы явля-
ется возможность принятия ошибочных решений. При
этом практически ситуации бывают таковы, что отка-
заться вообще от принятия какого-либо решения быва-
ет невозможно. К тому же решение отказаться от при-
нятия решения также есть решение, и оно может иметь
столь же нежелательные последствия, как и другие ре-
шения. Единственным выходОхМ из создавшейся ситуа-
ции является выработка человеком такой стратегии в
отношении принятия решений, которая хотя и не исклю-
чает возможность принятия неправильных решений, но
сводит к минимуму связанные с этим нежелательные по-
следствия.
Правда, у человека есть еще возможность изучать
противника, т. е. природу, посредством проведения экс-
перимента.
Теоретически путем проведения неограниченного экс-
перимента мы можем сделать свои знания о природе
сколь-угодно полными и действовать уже в условиях
полной определенности. Однако этому мешают два об-
стоятельства:
1) на проведение эксперимента требуется время, тог-
да как решение во многих случаях нужно принять бы-
стро;
2) эксперимент требует затраты средств, т. е. может
стоить дорого — дороже того выигрыша, который дают
добавочные знания, полученные в результате экспери-
мента.
Поэтому важной задачей человека в игре против
«природы» является принятие решения о том, нужно ли
проводить эксперимент, а если нужно, то какой, когда
его закончить и какие действия предпринять после окон-
чания эксперимента.
325
Игры, в которых одним противником является приро-
да, а другим — человек, получили название статистиче-
ских игр, а теория таких игр называется теорией стати-
стических решений [58, 61, 62]. Человека, который уча-
ствует в игре против природы, будем в дальнейшем
называть статистиком.
6) Пространство стратегий природы
Под стратегией природы будем понимать полную со-
вокупность внешних условий, в которых приходится при-
нимать решение. Эту совокупность внешних условий на-
зовем состоянием природы В общем случае существу-
ет некоторое множество возможных состояний природы
0={'&ь ..., От}, которое, как условились в гл. 5, будем
называть пространством состояний природы. Элементы
Of этого пространства будем называть чистыми страте-
гиями природы.
Если бы нам было известно заранее, какую из своих
чистых стратегий применяет природа в каждом конкрет-
ном случае, то мы с уверенностью принимали бы реше-
ние на основании полного знания состояния природы.
Однако обычно бывает известен только перечень чистых
стратегий природы. Кроме того, из прошлого опыта бы-
вает известно, как часто природа применяет ту или иную
из своих чистых стратегий, т. е. бывает известно априор-
ное распределение вероятностей на пространстве
состояний природы 0. Это априорное распределение ве-
роятностей g(f>) будем называть смешанной стратегией
природы.
в) Пространство стратегий статистика и функция потерь
Задача статистика состоит в том, чтобы принять ка-
кое-либо решение или выполнить какое-либо действие из
совокупности решений или действий. Обозначим воз-
можные действия статистики через аь ..., ai. Каждое из
этих действий есть чистая стратегия статистика. Множе-
ство Л = {аь ..., а} является пространством чистых стра-
тегий статистика.
Статистик должен уметь оценить каждое из своих
действий. Для этого он допускает, что, совершая дейст-
вие а, он может потерпеть убыток L (О, а), зависящий
как от выполняемого действия а, так и от неизвестного
326
ему состояния природы -ft. Функция а), называемая
функцией потерь, должна быть заранее определена для
всех возможных комбинаций а£А и ФС 0, т.е. должна
быть задана на прямом произведении множеств 0Х^.
Ее можно задавать или аналитически, или по аналогии
с (8-7) матрицей потерь вида
711 • • • 71/
Q = Ы =
(9-1)
_7ml * * * 7m/_
где = а3). Знание функции потерь позволяет
статистику предпринять действия, которые являются на-
илучшими в условиях имеющейся у него информации о
состоянии природы.
Статистику бывает обычно известна смешанная стра-
тегия природы, т.е. априорное распределение вероятно-
стей £(4) на пространстве состояний природы 0. Знание
априорного распределения вероятностей позволяет опре-
делить средние потери, которые несет статистик, выпол-
няя то или иное действие:
L (I, а) = М [L (V, а)] = (9-2)
Наилучшим для статистика действием будет так на-
зываемое байесовское действие а*, при котором потери
будут минимальны и равны:
fl*(E) = L(£, а*) = min Л (5, а). (9-3)
а£А
Статистик не обязательно должен ограничиваться ис-
пользованием только одной чистой стратегии. Он может
использовать смесь чистых стратегий в соответствии с
некоторым вероятностным законом распределения.
В этом случае будем говорить о смешанной стратегии
статистика. Для применения смешанной стратегии ста-
тистик должен задаться распределением вероятностей
-q (а) = (ф1), ..., фт>), определяющим вероятности, с кото-
рыми он будет использовать свои чистые стратегии ai,...
..., am> В общем случае статистик располагает некото-
рым набором смешанных стратегий Н== {тр (а), ...
•••» 'И'* (<2)}, называемым пространством смешанных стра-
тегий статистика.
327
Если статистик применяет смешанную стратегию
г|(а), а природа применяет смешанную стратегию £('&),
то средние потери статистика
Л(с, 4]) = ^ JL(0>a)]=2maK(0)W). (9-4)
tr,a
В этом случае задача статистика состоит в том, что-
бы выбрать такую стратегию г]*(а) € Н, при которой его
средние потери L(g, rf") будут минимальны, т. е.
L (S, 1]*) = min L (£, 1]). (9-5)
В рассмотренных случаях решалась сравнительно
простая статистическая задача — определение наилуч-
шей стратегии статистика только на основании имеющей-
ся априорной информации о состояниях природы. Здесь
статистик не делает попытки уточнить свои знания о
действительном срстоянии природы путем проведения
эксперимента. Поэтому данный тип статистической игры
может быть назван статистической игрой без экспери-
мента.
г) Примеры статистических игр
Для лучшего понимания структуры статистических
игр и методов их решения приведем несколько приме-
ров, на которых в дальнейшем будем иллюстрировать
основные положения теории статистических решений.
Пример 9-1 (задача о замене оборудования). Установленное на
предприятии сложное и дорогое оборудование после k лет работы
может оказаться в одном из трех состояний:
$1 — оборудование вполне работоспособно и требует лишь не-
большого текущего ремонта;
Ф2 — некоторые детали значительно износились и требуют серь-
езного ремонта или замены;
$з — основные детали износились настолько, что дальнейшая
эксплуатация оборудования невозможна.
Прошлый опыт эксплуатации аналогичного оборудования пока-
зывает, что в 20% случаев оно может находиться в состоянии th,
в 50%—в состоянии и в 30% случаев — в состоянии Ож
Для предприятия возможны три различных способа действия:
tzi — оставить оборудование в работе еще на год, проведя незна-
чительный ремонт своими силами;
tz2 — провести капитальный ремонт оборудования с вызывом спе-
циальной бригады ремонтников;
(23 — заменить оборудование новым.
Потери, которые несет предприятие при различных способах
действия, приведены в табл. 9-1. В потери входят стоимость ремонта
328
или замены оборудования, а также убытки, связанные с ухудшением
качества продукции и с простоями, вызванными неисправным обо-
рудованием. В этой же таблице приведены априорные вероятности
различных состояний природы, т. е. смешанная стратегия приро-
ды £($).
Таблица 9-1
Априорные вероятности состояний природы
и потери в задаче о замене оборудования
А
Л |
01 0,2 1 3 5
о2 0,5 5 2 4
«3 0,3 7 6 3
Для заданной смешанной стратегии £(0) средние потери при
различных способах действия
°1Ш^) = 1-0,2+ 5-0,5 + 7-0,3= 4,8;
О
L(E, +) = 3,4; L(g,а3) = 3,9.
Пример 9-2 (задача о технологической линии). На технологи-
ческую линию может поступать сырье с малым th и с большим Ог
количеством примесей. Известно, что в среднем поступает 60%
сырья первого вида и 40% сырья второго вида. Для использования
различных видов сырья предусмотрены три режима работы техно-
логической линии: аь а2 и а3 Априорные вероятности состояний при-
роды и потери, отражающие качество выпускаемой продукции и рас-
ходы сырья в зависимости от качества сырья и режима работы тех-
нологической линии, приведены в табл. 9-2.
Таблица 9-2
Априорные вероятности состояний природы
и потери в задаче о технологической линии
& & (0) л
ai 11,
О1 0,6 0 1 3
О2 0,4 5 3 2
Средние потери, соответствующие заданным априорным вероят-
ностям при различных режимах работы:
L(§, аг) =2,0; L (g, а2) = 1,8; L (*, а3) =2,6.
Байесовским действием будет установление режима работы аг-
329
9-2. СТАТИСТИЧЕСКИЕ ИГРЫ БЕЗ ЭКСПЕРИМЕНТА
а) Представление статистической игры без
эксперимента в виде S-игры
Статистическая игра может быть представлена в ви-
де эквивалентной S-игры совершенно таким же образом,
как это делалось в стратегических играх. Для этого с
каждой из чистых стратегий aj, j = l; I связываем точку
Cj= (f/ij,qmj) в m-мерном пространстве, координата-
ми которой будут потери статистика L($i, aj)=qij при
различных состояниях природы i=l, т. Так, в за-
даче о технологической линии чистым
стратегиям статистика й2 и а3 бу-
дут соответствовать точки плоскости
С4=(0, 5); С2=(1, 3) и С3=(3, 2),
как показано на рис. 9-1. Выпук-
лая оболочка S* множества точек
Рис. 9-1. Представление задачи о технологи
ческой линии в виде S-игры.
{Ci, С2, Сз} дает область всех возможных стратегий ста-
тистика как чистых, так и смешанных.
Мы в дальнейшем рассмотрим несколько принципов,
которыми может руководствоваться статистик при вы-
боре своей стратегии. При этом следует отметить, что
среди статистиков не существует единого мнения на то,
какой из принципов является наилучшим в статистиче-
ских играх. Другими словами, не существует универсаль-
ного правила, позволяющего выбрать определенный
образ действия независимо от сложившейся ситуации.
Однако, хотя могут иметься разногласия относительно
того, что нужно делать в данной ситуации, можно прий-
ти к полному согласию относительно того, что не нужно
делать. Это можно сделать, введя понятие допустимых
стратегий, аналогичное понятию доминирующих страте-
гий в стратегических играх.
330
6) Допустимые стратегии в статистических играх
Предположим, что мы рассматриваем смешанную
стратегию статистика т](а). Могут встретиться два
случая.
1. Нельзя найти ни одной стратегии, лучшей чем
т](а). Это означает, что не существует такой стратегии
rf (а), для которой
L(ft, г]) (9-6)
для всех {НЕ 0, хотя для некоторых О соотношение (9-6)
будет справедливо. В этом случае стратегию q(a) мож-
но назвать допустимой. Но она не обязательно является
предпочтительной, так как могут быть и другие страте-
гии, которые также имеют право на внимание.
2. Существует стратегия т]'(а), лучшая чем т](а). Это
означает, что соотношение (9-6) для стратегии т/(а) бу-
дет справедливо при всех tK 0. В этом случае стратегию
т](а) нужно исключить из рассмотрения в пользу стра-
тегии т/(а), т- е- считать ее недопустимой.
Допустимые стратегии удобно рассматривать в тер-
минах S-игры. Поскольку в S-игре стратегия статистика
определяется точкой S выпуклой оболочки S*, а потери
при различных ОС 0 определяются координатами этой
точки, то стратегия, определяемая точкой S, будет допу-
стимой, если не существует другой точки S'C S*, у кото-
рой все координаты будут меньше соответствующих
координат точки S.
Метод нахождения допустимых стратегий рассмот-
рим для случая, когда пространство состояний природы
состоит из двух элементов th и th. На рис. 9-2 показана
выпуклая область S*, соответствующая этому случаю.
Рассмотрим стратегию, определяемую точкой Si, яв-
ляющейся внутренней точкой области S*. Эта стратегия
не является допустимой, так как все точки, лежащие на
отрезке OS] внутри S*, определяют лучшие стратегии,
чем Si. Наилучшей из них является стратегия S, при-
надлежащая нижней левой границе области S*. Поэто-
му все внутренние точки можно исключить в пользу то-
чек, принадлежащих нижней левой границе области S*,
отмеченной на рис. 9-2 жирной линией.
Однако смещение точки вдоль этой границы не дает
каких-либо преимуществ, так как при этом уменьшают-
ся потери, соответствующие одному состоянию природы,
331
но увеличиваются потери, соответствующие другому
состоянию природы. Поэтому точки, принадлежащие
нижней левой границе области S*, и определяют допу-
стимые стратегии статистика.
Пример 9-3. В задаче о технологической линии (см. рис. 9-1)
левая нижняя граница области S* состоит из отрезков CiC2 и С2С3,
каждый из которых определяется смесью чистых стратегий ai, аг и
а2, а3. Пусть O^u'^1, тогда уравнение для отрезка CiC2 запишет-
ся в векторной форме следующим образом:
S —- ct’Ci + (1 — &') С2 •
Это уравнение определяет смешанную
1—w, 0). Проецируя уравнение отрезка CiC2
лучаем:
L (О1!, r|) = 0»&у + 1 -(1 —-w) = 1 — w\
L (^2> Л) = 4~ 3 (1 — со) = 3 + 2со. (9-8)
(9-7)
стратегию г)(а) = (зи,
на оси координат, по-
Рис. 9-2. Допустимые стратегии в S-игре.
О
Аналогично для уравнения отрезка С2Сз, определяющего сме-
шанную стратегию п(я) = (0, w, 1—со), можно записать:
L 1]) = 3 — 2w\ L (О’г, 1]) = 2 + w. (9-9)
в) Принципы выбора стратегий в статистических играх
Принципом выбора называется правило, позволяю-
щее определить наилучшую смешанную стратегию ста-
тистика. В различных случаях статистик может пользо-
ваться различными принципами выбора своей стратегии.
Одним из возможных принципов выбора стратегии
может быть принцип минимакса, который успешно при-
меняется в стратегических играх, когда игра ведется
против разумного противника, желающего причинить
нам наибольший ущерб. Однако в ряде случаев целесо-
образно использовать этот принцип и в статистических
играх.
Согласно принципу минимакса статистик выбирает
такую смешанною стратегию г) (а), при которой средние
потери Л (0, 7]) будут минимальны при наихудшем для
него состоянии природы 0. Наихудшим случаем будет
такое ОСЬ. кота величина L(0, ц) принимает макси-
мальное значение. Эту величину сыашеткк и должен ми-
332
нимизировать, т. е. выбирать стратегию т]*(а), которая
обеспечивает условие
L(ft, 1]*) = min max L (ft, r|). (9-10)
n v
Пример 9-4. Найдем минимаксную стратегию статистика в за-
даче о технологической линии. Так как решение должно лежать в
классе допустимых стратегий, то достаточно ограничиться рассмотре-
нием стратегий, определяемых соотношениями (9-8)^и (9-9) и соот-
Рис. 9-3. Определение оптимальной стратегии
по принципу минимакса.
(а — соответствует отрезку CiG; б — отрезку С2С3 на
рис. 9-1).
ветствующих отрезкам С1С2 и С2С3 выпуклой оболочки S* на
рис. 9-1. В соответствии с этими соотношениями и отрезками на
рис. 9-3 построены графики А(О, л) в функции от w для O = Oi и
О = О2- Значения тахЛ(ф, и) отмечены жирными линиями. Как вид-
но из рисунков, минимум этой величины на отрезке С]С2 достигается
при w = Q и равен 3, а на отрезке С2С3 определяется условием пере-
сечения двух прямых
3 — 2w = 2 + w,
т. е. достигается при w=l/3, и равен 7/3<3. Таким образом, прин-
цип минимакса дает точку на отрезке С2С3, соответствующую w =1/3,
т. е. определяет оптимальную смешанную стратегию тр=(б, 1/3, 2/3),
при которой потери статистика будут не больше 7/3 при любой стра-
тегии природы.
Иногда бывает целесообразно выбирать стратегию
исходя не из полных потерь Л (ft, а), а из так называе-
мых дополнительных потерь A'(ft, я), определяемых из
соотношений
Л' (ft, а) = L (ft, а) — min L (ft, а). (9-11)
а
Величина mini (ft, а) для каждого состояния природы
а
определяет те минимальные потери, которые статистик
несет обязательно, даже при своем наилучшем действии,
т. е. это необходимые потери. Можно считать, что необ-
333
ходимые потери тем или иным образом компенсируются
(например, путем установления соответствующих цен на
выпускаемую продукцию) и, следовательно, могут не
учитываться при выборе стратегии. В этом случае выбор
стратегии может быть осуществлен по принципу мини-
макса дополнительных потерь.
Пример 9-5. Найденные из соотношения (9-11) дополнительные
потери в задаче о технологической линии сведены в табл. 9-3. При-
меняя к данным этой таблицы принцип минимакса, в качестве опти-
мальной стратегии получаем чистую стратегию а2 с потерями 1.
Таблица 9-3
Дополнительные потери в задаче о технологической линии
0 а'- 1 аз
0 1 3
$2 3 1 0
Минимаксные принципы, исходящие из предположе-
ния, что природа действует наихудшим для статистика
образом, являются оправданными в стратегических
играх, но в играх статистических они выражают, по су-
ществу, точку зрения очень осторожного человека, ста-
рающегося получить хотя бы доступное и не гонящегося
за максимальным, чтобы не потерпеть случайно большо-
го ущерба. Недостатком минимаксных принципов следу-
ет считать также то, что они не учитывают априорной
информации о состояниях природы и тем самым ограни-
чивают тот выигрыш, который эта информация может
дать.
Поэтому минимаксные принципы можно рекомендо-
вать в тех случаях, когда отсутствует априорная инфор-
мация о состояниях природы или есть основания сомне-
ваться в достоверности этой информации.
Другим принципом выбора стратегии, учитывающим
априорное распределение вероятностей g(O), является
байесовский принцип. Согласно байесовскому принципу
оценка смешанной стратегии статистика т](а) произво-
дится путем усреднения потерь L(0, т]) по всем возмож-
ным состояниям природы ОС 0 с учетом априорного рас-
пределения вероятностей £(О), т. е. по величине
= (9-12)
334
Наилучшей стратегией г](а) при этом будет такая
стратегия, которая дает минимум величины £(£, ц). Эта
наилучшая стратегия называется байесовской страте-
гией.
Байесовский принцип, естественно, можно применять
как к полным, так и к дополнительным потерям. Однако
в дальнейших примерах мы ограничимся применением
байесовского принципа только к полным потерям.
Пример 9-6. В задаче о технологической линии при 5(01) = 0,6 и
?('0s)=0,4 для допустимых стратегий, определяемых отрезком С1С2,
имеем:
L(g, tj) = (1 — 0,6 + (3 + 2w) 0,4 = 1,8 + 2,0^,
так что min£(g, т]) = 1,8 при w = 0, что соответствует смешанной
стратегии г] = (0, 1, 0);
для отрезка С2С3
L (L Л) = 2,6 — 0,8 w,
так что min£(g, г]) = 1,8 при w=l, что соответствует той же самой
си
смешанной стратегии г|~ (0, 1, 0). Таким образом, байесовской стра-
тегией является чистая стратегия а2.
Следует отметить, что полученный результат не является слу-
чайным. Далее мы покажем, что байесовский принцип всегда дает
в качестве наилучшей стратегии одну из чистых стратегий статисти-
ка. При этом байесовское действие а* будет определяться услови-
ем (9-3).
г) Геометрическая трактовка байесовских стратегий
Рассмотрим статистическую S-игру для двух состоя-
ний природы и йд, определяемую выпуклой областью
S* на плоскости (х, у), приведенную на рис. 9-4, где
х = 1(^,1]); г/ = £(#2, ц). (9-13)
Как мы знаем, допустимые стратегии лежат на ниж-
ней левой границе области S*. Рассмотрим одну из до-
пустимых стратегий So. Построим вспомогательное мно-
жество /?, содержащее все точки, лежащие ниже и левее
точки So. Очевидно, что S* и R — выпуклые множества
и ни одна точка из S* не принадлежит /?, в том числе и
точка So.
Построим прямую, разделяющую множества S* и R.
Эта прямая должна проходить через So, т. е. должна
являться опорной прямой к множеству S* в точке So. Но
она должна быть опорной прямой и для множества R.
Следовательно, эта прямая должна иметь отрицатель-
335
ный наклон или быть вертикальной, или быть горизон-
тальной и ее уравнение может быть записано в виде
у =—kx + c, k^Q. (9-14)
Разделив обе части этого уравнения на &+1, приве-
дем его к виду
ах + by = с', (9-15)
где
Рис. 9-4. Построение
опорной линии к вы-
пуклому множеству.
(9-16)
Замечая, что а-]-Ь=1, можем положить
a = w, b — 1—w и рассматривать w и 1—w как априор-
ные вероятности состояний природы $i и th:
= £(^i), 1 — w = 1 (if}2). (9-17)
Уравнение опорной прямой в этом случае может быть
записано в виде
wx + (1 — w) у = с' (9-18)
или
А (0ь 11) с (t\) + L (^п)Ж) = У. (9-19)
Как видим, с' определяет средние потери L(£, т]) при
априорных вероятностях состояний природы g(0i)=^ и
g($2) = l—w. Нетрудно заметить также, что значение с'
для точки So является минимальным из всех возможных
значений L(g, rj), так как увеличение с' до czz>£z озна-
чает, что прямая пройдет выше и будет проходить через
точки множества S*, не являющиеся допустимыми, а
уменьшение с' невозможно, так как прямая опустится
вниз и не будет иметь с 3* общих точек. Таким образом,
с' определяет стратегию т], дающую минимум средних
потерь L(g, т]) при данном распределении =
1—w), т. е. определяет для данного априорного распре-
деления вероятностей байесовскую стратегию.
336
Поскольку So является произвольной точкой на гра-
нице допустимых стратегий, то для любой точки этой
границы можно найти такие w и 1—w, для которых эта
точка будет определять байесовскую стратегию. Отсюда
следует, что каждая допустимая стратегия является
байесовской стратегией для некоторых
априорных вероятностей w и 1—w.
Предположим теперь, что заданы
априорные вероятности состояний
Рис. 9-5. Геометрическое определение байе-
совской стратегии.
природы w и 1—w и требуется на выпуклой оболочке S*
найти точку, определяющую байесовскую стратегию для
этого случая. Построим на плоскости (х, у) прямую
wx + (1 — сс) у = с. (9-20)
При произвольном с эта прямая будет параллельна
опорной прямой в точке, соответствующей байесовской
стратегии. Для удобства построения положим с =
= ^(1 —и») и запишем уравнение (9-20) в виде
х
1 — w
У
W
- 1,
(9-21)
Представляющем собой уравнение прямой в отрезках.
Прямая, соответствующая уравнению (9-21), построена
на рис. 9-5. Теперь уже легко построить опорную пря-
мую, соответствующую заданным значениям w и 1—w,
которая определит на выпуклой оболочке S* точку, со-
ответствующую байесовской стратегии статистика.
Поскольку внешней границей выпуклой оболочки яв-
ляется многоугольник с вершинами, соответствующими
чистым стратегиям статистика, то опорная прямая обя-
закльно проходит хотя бы через одну из вершин. Следо-
вательно, для заданных априорных вероятностей w и
1—К' всегда существует хотя бы одна байесовская стра-
тегия, являющаяся чистой стратегией. Это обстоятель-
ство чрезвычайно упрощает решение статистических игр,
так как позволяет при поиске байесовского решения
ограничиться рассмотрением только конечного числа чис-
тых допустимых стратегии вместо рассмотрения беско-
22—142 337
нечного множества смешанных стратегий. Это устраи-
вает также многих скептически настроенных статистиков,
возражающих против использования смешанных страте-
гий на том основании, что при этом требуется использо-
вание механизма случайного выбора, который к сущест-
ву задачи отношения не имеет.
Разумеется, все сделанные выводы остаются справед-
ливыми и для случая, когда имеется больше двух состо-
яний природы. Однако при этом рассмотрение на плос-
кости уже невозможно, что затрудняет геометрическую
иллюстрацию этих случаев.
9-3. СТАТИСТИЧЕСКИЕ ИГРЫ С ПРОВЕДЕНИЕМ ЕДИНИЧНОГО
ЭКСПЕРИМЕНТА
а] Постановка задачи
Как уже отмечалось, особенностью статистической
игры является возможность для статистика углублять и
уточнять свои знания относительно состояния природы
путем постановки эксперимента. В принципе, если бы
была возможность неограниченного экспериментирова-
ния, статистик мог бы получить полную информацию о
состоянии природы и действовать в условиях полной
определенности. Однако постановка эксперимента всегда
связана с затратой средств и времени, потери от кото-
рых могут оказаться значительнее того выигрыша, кото-
рый могут дать результаты эксперимента.
Возможность проведения эксперимента чрезвычайно
расширяет класс стратегий статистика. Прежде всего
статистик должен принять решение о том, проводить или
не проводить эксперимент. Он должен далее решить, ка-
ков должен быть этот эксперимент, сколько следует про-
вести отдельных испытаний, прежде чем считать экспе-
римент законченным, и какие предпринять действия при
тех или иных исходах эксперимента.
Мы попытаемся дать ответы на некоторые из этих воп-
росов в последующих параграфах. В данном же парагра-
фе сосредоточим свое внимание на статистических играх
с единичным экспериментом.
Мы пока не будем включать в класс стратегий статис-
тика принятие решения о проведении эксперимента, счи-
тая, что уже принято решение о проведении единичного
эксперимента. При этом под единичным экспериментом
338
будем понимать такой эксперимент, объем и порядок
проведения которого заранее определены. Так, если нуж-
но проверить, является ли данная монета симметричной,
то можно провести единичный эксперимент, состоящий в
n-кратном бросании монеты. Исходом эксперимента при
и = 5 может быть последовательность ГРГГР. Всего су-
ществует 2п таких последовательностей, т. е. в данном
случае пространство исходов эксперимента состоит из 2п
элементов. Аналогично при проверке оружия под единич-
ным экспериментом понимают эксперимент, при котором
делается п выстрелов. Для оценки влияния какого-либо
специального вида пищи на животное может быть про-
изведен единичный эксперимент, состоящий в измерении
в течение нескольких месяцев ежедневного прибавления
в весе у п животных, и т. п. Хотя в этих примерах экс-
перимент состоит из ряда подыспытаний, но мы его на-
зываем единичным, так как число подыспытаний и ха-
рактер каждого подыспытания заранее определены.
бу Пространство выборок
Обозначим через Z пространство исходов экспери-
мента. Элементы этого пространства, т. е. отдельные ис-
ходы эксперимента, будут гь ..., 2V.
Отдельные исходы эксперимента ?6Z оказываются
связанными с состояниями природы Об 0. Эта связь со-
стоит в том, что для каждого состояния природы ОбЭ
имеется определенная вероятность p#(z) того, что исхо-
дом эксперимента будет данное zC Z. Величины T#(z),
иногда обозначаемые p(z\$), представляют собой услов-
ное распределение вероятностей на пространстве Z при
данном -О’ и удовлетворяют соотношениям
Р),(г)>0;2рДг) = 1. (9-22)
2
Совокупность трех элементов: пространства исходов
эксперимента Z, пространства состояний природы 0 и
распределения вероятностей p#(z) на пространстве Z
при заданном 0’6 0, называется пространством выборок
и обозначается
3 - (Z, 0, р). (9-23)
Пространство выборок удобно задавать в виде таб-
лицы, содержащей распределение p&(z) на прямом про-
изведении множества 0Х^.
22
339
Пример 9-7. В задаче о замене оборудования эксперимент мо*.
жет состоять в проведении проверочных испытаний оборудования
силами предприятия. При этом недостаточная квалификация персо-
нала и отсутствие необходимой измерительной аппаратуры приводят
к тому, что результаты испытаний лишь приближенно отражают со-
стояние оборудования. Предположим, что эксперимент может иметь
четыре исхода:
Z\ — оборудование исправно;
г2 —требуется текущий ремонт;
z3— требуется замена изношенных деталей;
24 — оборудование непригодно к дальнейшей эксплуатации.
Вероятности каждого из этих исходов при различных состояниях
природы приведены в табл. 9-4, представляющей собой пространство
выборок для данной задачи.
Таблица 9-4
Пространство выборок в задаче о замене оборудования
Z
Z1 ?2 । 1
О'! 1/2 1/2 0 0
О2 0 • 1/2 1/2 0
Оз 0 0 1/3 2/3
Пример 9-8. В задаче о технологической линии эксперимент мо-
жет состоять в грубом предварительном анализе содержания приме-
сей (точный лабораторный анализ невозможен, так как требует за-
траты значительного времени, а значит, простоя оборудования). Ре-
зультаты эксперимента: z\— примесей не обнаружено, 22— примеси
в небольшом количестве, 2з — примесей много. Пространство’выбо-
рок при этом может иметь вид табл. 9-5.
Таблица 9-5
Пространство выборок в задаче о технологической линии
О Z
zl г2 Z3
0,60 0,25 0,15
О2 0,20 0,30 0,50
в) Решающая функция
В задаче без эксперимента статистик должен был
принять решение из пространства решений А, основыва-
ясь на априорной информации £($) о состояниях при-
роды. В задаче с экспериментом статистик принимает
решение в зависимости от исхода эксперимента z6Z.
Чтобы формализовать эту задачу, он может заранее про-
340
анализировать все возможные исходы эксперимента и
составить правило d, определяющее, какое решение
а€ А следует принять при каждом из возможных исхо-
дов эксперимента zE Z. Это правило будет представлять
собой отображение пространства исходов эксперимента
Z на пространство решений А
d:Z-+A, (9-24)
что может быть записано в виде
d(z) = а.
Правило d(z), определяющее решение аб А, которое
должен принять статистик при любом исходе экспери-
мента г С Z, называется решающей функцией.
Поясним понятие решающей функции на следующем
примере. Предположим, что пространство решений со-
стоит из трех элементов Л = {аь а2, а3}, а пространство
исходов эксперимента — из пяти элементов Z = {zi, z2,
z3, 2’4, 25}. Решающую функцию d(z,)=a. можно задать
в виде множества пар индексов (i, /), определяющих
решение а} при исходе эксперимента гг. Решающей
функцией будет,’ например, множество {(1,1), (2,1),
(3,2), (4,2), (5,3)}, означающее, что при исходах z\ и z2
принимается решение «1, при исходах г3 и г4 принимает-
ся решение а2, а при исходе z5 принимается решение а3.
Конечно, данная решающая функция не является един-
ственно возможной. Можно было бы рассматривать так-
же решающие функции вида {(1,1), (2,2), (3,2), (4,3),
(5,3)} или {(1,3), (2,1), (3,2), (4,3), (5,2)} и т. п. В свя-
зи с этим удобно вести пространство D, содержащее
полный перечень возможных решающих функций, и на-
звать его пространством решающих функций.
Рассмотренная выше решающая функция разбивает
множество Z па непересекающпеся подмножества Sai, а
именно
Sa< = {zb z2}, = {z3, z4}, Saj = {z5}. (9-25)
В терминах теории множеств можно сказать, что лю-
бую решающую функцию с/6 D можно рассматривать
как разбиение пространства исходов эксперимента Z на
иеперс-сскаюшиеся подмножества такие, что
So = {z|d(z) = а}, а $ А. (9-26)
В частности, если пространство решений А состоит
только из двух элементов сц и а2 (двухалыернатпвная
341
задача), то решающая функция d(г) разбивает простран-
ство Z на пространство S, называемое критической обла-
стью, и его дополнение C(S)=S, определяемые из усло-
вия
если г?3 (М7)
если z £ С (S).
Понятие решающей функции позволяет более четко
сформулировать задачу статистика. Эта задача состоит
в том, чтобы из пространства решающих функций D вы-
брать такую решающую функцию d(z), которая позво-
лит принимать наиболее выгодные решения. Однако для
этого необходимо уметь оценивать различные решаю-
щие функции, что может быть сделано при помощи
функции риска.
г) Функция риска
Если статистик остановил свой выбор на некоторой
решающей функции d(z), то тем самым он определил
для каждого исхода эксперимента 26 Z решение а —
—d(z), которому при данном ft 6 Э будут соответство-
вать потери
L (ft, а) = L [ft, d (г)] - Lz (ft, d). (9-28)
Однако при заданном ft исход эксперимента z будет
случайной величиной, определимой распределением ве-
роятностей p#(z) на пространстве Z. Следовательно, с
той же вероятностью р& (г) будут иметь место и потери
Lz(ft, d) при данном г, которые, таким образом, будут
также случайной величиной.
Поскольку для оценки решающей функции d(z) при
данном состоянии природы ft необходимо учитывать все-
возможные исходы эксперимента, то необходимо вести
речь о средних потерях, определяемых на всем простран-
стве исходов эксперимента Z. Эти средние потери назы-
ваются функцией риска, обозначаются p(ft, d) и опреде-
ляются из соотношения
Р(ft, d) = Mz[Lz(#, d)] = VLz(ft, d)(г). (9-29)
2
Каждому состоянию природы ft 6 0 и каждой реша-
ющей функции d£ D будет соответствовать свое значе-
ние средних потерь, т. е. функции риска p(ft, d), кото-
342
рая, таким образом, определяется на прямом произведе-
нии множеств 0X0 совершенно аналогично тому, как
функция потерь L(t>, а) в игре без эксперимента опреде-
лялась на прямом произведении множеств Из это-
го следует, что пространство решающих функций D и
функция риска р(Ф, d) в игре с единичным эксперимен-
том играют ту же роль, что пространство решений А и
функция потерь в игре без эксперимента. Отсюда выте-
кают и аналогичные методы решения этих двух задач.
В играх с единичным экспериментом статистик мо-
жет использовать и смешанные стратегии. Для этого он
должен иметь механизм случайного выбора, задающий
распределение вероятностей rj(d) на пространстве D.
Функция риска при применении смешанной стратегии
T](d), обозначаемая в этом случае р(Ф, т]), получится пу-
тем усреднения р(Ф, d) по всем чистым стратегиям, вхо-
дящим в данную смешанную стратегию. Таким образом,
р (a, n) = Md [р («, d)] = 2 р (^> $ п (<0 (9-зо)
а
или с учетом (9-29)
= (9'31)
г, d
Естественно, что при поиске наилучшей стратегии в
игре с единичным экспериментом статистик должен ис-
ходить только из допустимых стратегий, которые опре-
деляются точно так же, как и в игре без эксперимента.
Пример 9-9. Определим функцию риска в задаче о технологичес-
кой линии. Для удобства расчетов потери статистика L(0, а) и ве-
роятности исходов эксперимента даваемые табл. 9-2 и 9-5,
сведем в одну таблицу (табл. 9-6).
Таблица 9-6
Потери и вероятности исходов эксперимента в задаче
о технологической линии
& а
1 а‘ а.
Оч 0 1 3 0,60 0,25 0,15
5 3 2 0,20 0,30 0,50
343
Поскольку пространство исходов эксперимента состоит из трех
элементов, то решающая функция будет иметь вид:
d (z) = (а., а,, а.) = d...,
х 7 V i ’ j’ k/ ijk'
где а», aj и аь означают решения, ко-
торые должен принять статистик при
исходах эксперимента zi, г2 и г3 соот-
ветственно. Так, решающая функция dm
означает, что при исходах эксперимен-
та Zi, г2 и г3 статистик принимает ре-
шения ai, а2> а2.
Значения функции риска, подсчи-
танные по формулам (9-29) для каж-
дой решающей функции, приведены в
табл. 9-7 и на рис. 9-6. Получение дан-
ных этой таблицы рассмотрим на при-
Рис. 9-6. Функция риска
в задаче о технологиче-
ской линии.
Таблица 9-7
Значения функции риска р($, d) в задаче о технологической линии
& din d112 ^113 d121 d 123 ^131 dl32 d 133
01 0,00 0,15 0,45 0,25 0,40 0,70 0,75 0,90 1,20
02 5,00 4,00 3,50 4,40 3,40 2,90 Пр< 4,10 одолже 3,10 ние та( 2,60 5л. 9-7
V d2ii <^213 J22i d222 d<123 d23i d2 82 d<233
01 0,60 0,75 1,05 0,85 1,00 1,30 1,35 1,50 1,80
02 4,60 3,60 3,10 4,00 3,00 2,50 tipi 3,70 эдолже 2,70 ние rat 2,20 5л. 9-7
$ <311 <12 ^313 d32i ^322 ^331 ^332 ^333
01 1,80 1,95 2,25 2,05 2,20 2,50 2,55 2,70 3,00
02 4,40 3,40 2,90 3,80 2,80 2,30 3,50 2,50 2,00
344
мере вычисления р(0, 6/122). Согласно (9-29) имеем:
р ($, ^122) “ ^Zl (^» ^122) (г1) “и (^’ ^122) ^#(*2)
+ М^> МЫгз)=Чд’ °1)Мг1) + Ч^’ а2)^(гг) +
+ Ч<*> о2)Р.у(гз)-
Полагая O=f>i и O'=f>2, получаем:
p(fli, d122) = 0,4; р№2, d122) = 3,4.
д] Принципы выбора стратегии в играх с единичным
экспериментом
Поскольку введение функции риска сводит игру с
единичным экспериментом к форме, аналогичной игре
без эксперимента, то все принципы выбора стратегии в
игре без эксперимента остаются справедливыми и для
данного случая с той разницей, что вместо минимизации
средних потерь теперь статистик должен минимизиро-
вать средний риск.
Принцип минимакса состоит в том, чтобы выбрать
стратегию ц (d), при которой средний риск р (Ф, т]) при
наихудшем для статистика состояния природы был бы
минимален, т.е. выбор минимаксной стратегии т|* произ-
водится из условия
р ($, т]*) == min max р ($, т]). (9-32)
Т] $
Если при определении среднего риска р(Ф, г]) исхо-
дить не из полных, а из дополнительных потерь Lf(-ft, а),
то формула (9-32) будет определять принцип минимак-
са дополнительных потерь.
Для применения байесовского принципа введем по-
нятие ожидаемого риска, под которым понимается сред-
ний риск с учетом всех возможных состояний природы
(Н 0 и априорного распределения вероятностей на про-
странстве 0. Так как при применении байесовского
принципа статистик может ограничиться использовани-
ем только чистых стратегий, то ожидаемый риск
Р(М)= Vp(OH(fl). (9-33)
&
Байесовский принцип требует применения такой ре-
шающей функции d*, при которой ожидаемый риск, на-
345
зываемый в этом случае байесовским, будет минималь-
ным:
р *(£)== Р (%, d*) = min р (Н, d). (9-34)
d
Пример 9-10. Определим минимаксную и байесовскую стратегии
в задаче о технологической линии с проведением единичного экспе-
римента. На рис. 9-6 эта задача представлена в виде S-игры. Из
проведенного геометрического построения легко установить, что ми-
нимаксная стратегия определяется точкой So с координатами (30/14,
30/14) и соответствует применению чистых стратегий б/2зз и б/ззз с ве-
роятностями 10/14 и 4/14. Байесовской стратегией будет страте-
гия 6/123.
9-4. ИСПОЛЬЗОВАНИЕ АПОСТЕРИОРНЫХ ВЕРОЯТНОСТЕЙ
а| Определение числа стратегий в играх с проведением
эксперимента
Из рассмотренных в предыдущих параграфах приме-
ров видно, что проведение эксперимента в статических
играх приводит к значительному увеличению числа чис-
тых стратегий статистика. Так, в задаче о технологичес-
кой линии при учете результатов эксперимента число
чистых стратегий возросло с 3 до 27. И если бы эту игру
нам не удалось представить в виде S-игры на плоскости,
то возникли бы серьезные трудности при ее анализе.
Обозначим через W общее число чистых стратегий
статистика в игре с единичным экспериментом. Это чис-
ло нетрудно подсчитать. Предположим, что в игре без
эксперимента у статистика имеется I возможных реше-
ний аь ..., ai, а число возможных исходов эксперимента
равно v.
При v = l получаем игру с заранее известным исхо-
дом эксперимента, что равносильно игре без эксперимен-
та, при которой N = l.
При v=2 стратегия статистика может быть записа-
на в виде d==(aiit где величинами и ai2 могут
быть любые а£ А. Следовательно, может быть I различ-
ных значений aiit каждому из которых может соответст-
вовать I различных значений ai2, так что М = /2.
При v = 3 стратегия статистика d=(ain ai2, а,). Со-
вокупность решений ail И может принимать /2 значе-
ний, каждому из которых может соответствовать / зна-
чений alt, так что А/7 — /3.
Продолжая аналогичные рассуждения, приходим к
выводу, что при произвольных I и v общее число чистых
346
стратегий статистика равно N = lv. При больших I и v
число чистых стратегий статистика может оказаться
столь значительным, что возникнут серьезные затрудне-
ния, связанные с их анализом.
В подобных случаях можно добиться значительного
упрощения при нахождении байесовских стратегий, ес-
ли вместо априорного распределения вероятностей ис-
пользовать апостериорное распределение, вычисленное
на основе результатов проведенного эксперимента. При
этом число чистых стратегий статистика в задаче с экс-
периментом останется тем же самым, что и в задаче без
эксперимента.
б) Апостериорное распределение вероятностей.
Формула Байеса
Априорное распределение вероятностей £($), полу-
чаемое на основе статистических данных и прошлого
опыта, дает полезную информацию о том, насколько ча-
сто то или иное состояние природы встречается вообще,
безотносительно к тем конкретным условиям, в которых
статистику приходится принимать решение. Целью экс-
перимента, проводимого статистиком, является получе-
ние добавочной информации о действительном состоя-
нии природы.
Предположим, что пространством исходов экспери-
мента является множество Z—(z\, ..., zv). При этом ис-
ход конкретного эксперимента будет случайным и пото-
му также не дает возможности точно судить о действи-
тельном состоянии природы. Однако неопределенность
относительно состояния природы значительно уменьша-
ется, если эксперимент поставлен правильно.
Это изменение неопределенности относительно состо-
яния природы состоит в том, что в результате экспери-
мента вместо априорного распределения д($) получает-
ся новое распределение вероятностей gz('O’), которое на-
зывается апостериорным распределением вероятностей
на пространстве О при данном конкретном исходе экспе-
римента 26 Z. Обратимся к методам вычисления апосте-
риорного распределения вероятностей.
Прежде всего заметим, что исход эксперимента, име-
ющего целью уточнить действительное состояние приро-
ды, будет зависеть от состояния природы Ф. Предвари-
тельное изучение условий, в которых проводится экспе-
347
римент, позволяет для каждого состояния природы Ф
указать распределение вероятностей на пространстве
исходов эксперимента Z, которое будет, таким образом,
представлять собой условное распределение вероятно-
стей р(г|^) =p#(z).
Для полного описания одного конкретного экспери-
мента необходимо знать исход эксперимента zEZ и со-
стояние природы 'б 6 0, при котором эксперимент был
произведен. Следовательно, результат конкретного экс-
перимента можно представить в виде упорядоченной па-
ры (г, Ф), являющейся элементом прямого произведения
множества ZX0-
Обозначим через q(z, Ф) распределение вероятностей
на множестве ZX0- В общем случае это распределение
вероятностей будет изменяться с изменением априорно-
го распределения вероятностей £($), т. е. будет функци-
ей от g. Для конкретного априорного распределения
g(6) обозначим распределение вероятностей на множе-
стве ZX0 через 7с (г, Ф).
Нам необходимо увязать между собой распределения
g(t)), p# (г), gz(ft) и 7= (г, ft). С подобной задачей мы
сталкивались при рассмотрении двумерных случайных
величин, когда исходогл эксперимента z являлась упоря-
доченная пара (х, //).
Для таких случайных величин имело место соотно-
шение (4-36), которое в применении к нашему случаю
может быть записано в виде
(г, 0) = (г) £ (ft) = Ег (С) р (г), (9-35)
откуда
t (ft) = . (9.зб)
Р(г)
В этом выражении p(z) представляет собой безуслов-
ную вероятность данного исхода эксперимента г, т. е. ве-
роятность того, что будет иметь место исход z при про-
извольном состоянии природы. Исходя из этого, веро-
ятность р(г) можно представить в виде
(9-37)
Применяя к этому выражению формулу полной ве-
роятности (4-41), получаем:
Р(г)= V^(z)5(t>), (9-38)
348
С учетом (9-38) формула для определения апостери-
орного распределения вероятностей gz(O) принимает
вид:
2Р& (г) ’
(9-39)
Эта формула в теории вероятностей получила назва-
ние формулы Байеса.
Пример 9-11. Определим апостериорное распределение вероят-
ностей в задаче о технологической линии Расчеты по формуле (9-39)
производим табличным методом. Процесс расчета приведен в
табл. 9-8. Исходными данными для расчета служит априорное рас-
пределение вероятностей £($), взятое из табл. 9-2, и условное рас-
пределение вероятностей р$ (г), взятое из табл. 9-5.
Таблица 9-8
Апостериорное распределение вероятностей
в задаче о технологической линии
(z) g (1»
h (1>)
0,25 0,15
0,30 0,50
0,36 0,15 0,09
0,08 0,12 0,20
0,818 0,555 0,310
0,182 0,445 0,690
О
0,44 0,27 0,29
Найденное значение апостериорных вероятностей показывает,
что при иоодах эксперимента Zt или z3 неопределенность отоси-
тельно состояний природы значительно уменьшается. Однако при ис-
ходе эксперимента г2 неопределенность становится даже большей,
чем до постановки эксперимента.
в) Принцип максимального правдоподобия
Знание апостериорных вероятностей позволяет про-
изводить оценку состояния природы, используя принцип
максимального правдоподобия. Согласно этому принци-
пу за оценку состояния природы принимается то состоя-
ние природы, которое представляется наиболее вероят-
ным на основании опытных данных.
Пример 9-12. Дадим оценку состояния природы О в задаче о тех-
нологическом процессе при исходе эксперимента Согласно
табл. 9-8 апостериорные вероятности состояний природы Oi и
349
при исходе эксперимента Z\ равны:
g2 (^) = 0,818, g2ip2) = 0,182.
Поскольку тах[?21 (ОД, §2г (02)] = g?i (О']), то согласно принци-
Л
пу максимального правдоподобия 0 = 0’.
Принцип максимального правдоподобия часто применяется для
выбора решения в двух альтернативной задаче. В этой задаче про-
странство состояний природы 0= {th, О2} состоит из двух элементов:
с априорным распределением вероятностей £(О) = (£, 1—£). Про-
странство решений статистика также состоит из двух элементов Л =
— {□], а2}> где а{ — решение о том, что природа находится в состоя-
нии О:; а2 — решение о том, что природа находится в состоянии О2.
Известны также условные распределения вероятностей исходов экс-
перимента р$ (г) для 0 = 0] и для О = О2. Требуется по результатам
исхода эксперимента z£Z принять решение а£ {tfi, а2}.
Пример 9-13 (задача о радиолокационной станции (PJ1C)). Сиг-
нал на экране РЛС может появиться или в результате наличия це-
ли в зоне РЛС, или в результате действия различного рода помех.
Следовательно, могут иметь место два состояния природы: О] — цель
есть, 0’2 — цели нет. По наблюдениям за экраном можно принять
два решения: ai — цель есть, а2 — цели нет. При этом могут быть
допущены ошибки двух видов:
Д1|О2 — ошибка первого рода, называемая иногда «ложной тре-
вогой»;
«2 1'0’1 — ошибка второго рода, называемая иногда «пропуском
цели».
Для принятия решения в двухальтернативной задаче часто ис-
пользуют отношение правдоподобия, определяемое соотношением
Л (г) = Нм • (9’40) •
(V2)
Говорят, что имеет место проверка по отношению правдоподо-
бия, если задано число k такое, что решение принимается согласно
следующему правилу:
принимается решение если Л(г)\>&;
принимается решение а2, если Л(г)<&;
принимается решение а{ или а2, если A(z)=k.
Значение k выбирается в зависимости от последствий, к кото-
рым может привести ошибочное решение. Так, в задаче о РЛС ошиб-
ка типа «ложная тревога» может иметь значительно большие по-
следствия, чем ошибка типа «пропуск цели». Решение а{ следует
принимать только в том случае, если мы имеем большую уверен-
ность, что цель действительно есть, т. е. если выполняется условие
b(Oi) »6z(t>2)- Это означает, что в данном случае следует брать
£>1.
г) Определение байесовского решения на основе
использования апостериорных вероятностей
Как мы видели в начале настоящей главы, основная
трудность решения задачи с проведение-м эксперимента
состояла в резком увеличении числа стратегий при уве-
350
личении числа возможных исходов эксперимента. Одна-
ко в действительности вовсе нет необходимости рассмат-
ривать все возможные исходы эксперимента. Если в ре-
зультате проведения эксперимента получен какой-то
конкретный исход г 6 Z, то для этого исхода и следует
решать задачу.
Это можно сделать, подсчитав при данном исходе
эксперимента z апостериорное распределение вероятно-
стей на пространстве состояний природы 0. При
этом будут известны пространство состояний природы
0, пространство решений А и распределение вероятно-
стей на пространстве состояний природы в кото-
ром учтен результат эксперимента. Но эта задача отли-
чается от задачи без эксперимента только тем, что здесь
используется апостериорное распределение вероятно-
стей gz(^) вместо априорного распределения £($). Сле-
довательно, и методы решения этой задачи аналогичны
тем, которые применялись в задаче без эксперимента.
При использовании апостериорных вероятностей
£г(Ф) в качестве чистых стратегий статистика использу-
ются элементы пространства решений Л = {аь ..., а,}.
При этом каждому действию а (г А будут соответство-
вать потери статистика L(^z,a)t определяемые по анало-
гии с (9-2) как
L «Я = (9-41)
или с учетом (9-39)
L(?2, а)
Байесовский принцип сводится к тому, чтобы вы-
брать такое действие а*€А, при котором величина по-
терь, определяемых согласно (9-42), будет минимальна:
R* (U = R (£г, а*) = min L (£2, а). (9-43)
а
д] Двухальтернативная задача
Проиллюстрируем изложенные принципы на приме-
ре решения двухальтернативной задачи с априорным
распределением вероятностей £($) = (£, 1—£). При пра-
вильных решениях потери считаем равными нулю. Ошнб-
------------------------ . (9-42)
<г) ? W
&
351
ка первого рода дает потери w, а ошибка второ-
го рода (01|Ф2) дает потери 1. При этом матрица потерь
имеет вид табл. 9-9.
Рассмотрим решающую функцию d(z), которая со-
гласно (9-27) делит пространство исходов эксперимента
Z на области 8 и С(8) такие, что принимается решение
Ль если z £8, и принимается решение а2, если z£C(8).
Zq "1 2
S j C(S) I
Рис. 9-7. Разбиение пространства исходов
эксперимента в двухальтернативной задаче
Таблица 9-9
Потери в двухальтернативной задаче
flj а, '& а1 <2 2
0 £ ь» 1 0
Поскольку 8 и С (8) должны быть компактными, то ре-
шение задачи сводится к тому, чтобы найти границу,
разбивающую множество Z на непересекающиеся под-
множества 8 и С(8). Элементы z£Z. составляющие эту
границу, обозначим г0. На рис. 9-7 показан вид границы
20 для одномерного и двумерного случаев.
Для нахождения уравнения, определяющего границу
20, напишем выражения для средних потерь при данном
z и решениях ах и а2. Учитывая (9-42) и данные табл. 9-9,
получаем:
L&, а,) =
Р»2 (?)(!-£)
ДХ (?) 5 (0)
(9-44)
Ц?г,а2) = -^—. (9-45)
ДХ М5(»)
352
Граница zo соответствует равенству средних потерь
при решениях ai и а2, что дает:
(1 — 0 Р»г (г0) = Р^ (г0) (9-46)
ИЛИ
*4 (го)
Y^- = c(S, ш).
(9-47)
Как видим, каждому значению £ будет соответство-
вать своя граница z0, а следовательно, и соответствую-
щие области и C\S^ ). При этом величиной £ будут
определяться и вероятности ошибочных решений а(£) и
(3(£), являющиеся вероятностями того, что при ^ = ^1
точка z попадет в область C(S* ) и будет принято реше-
ние а2, и вероятность того, что при точка z попа-
дет в область 5^ и будет принято решение Эти веро-
ятности определяются соотношениями
а (9 = Р (а2 Р,) = 2 (z); (9-48)
2€c(s£)
P(£) = P(fllp2)= 2 Р#г&- (9-49)
Для определения характера зависимости вероятности
ошибочных решений от £ определим значения а(£) и
(3(5) для крайних значений £ = 0 и £= 1.
Элементы z£Z, входящие в множество S, определя-
ются условием
ь (?г, 01) < L (£г, о2)
или
Р$г (г) tjw
р^ 1 — £
(9-50)
При £ = 0 это условие дает:
Р^ _Q>
Pfh W
что возможно только в том случае, если S£=0, C(S^) =
=z. При этом из (9-48) и (9-49) находим а(0)=1,
0(0) =0.
При £= 1 условие (9-50) дает:
P»t (z)
353
23—142
что определяет область S^=z, C(S^)=0, так что
<х(1) =0, р(1) = 1.
Таким образом, при изменении £ от 0 до 1 а(£) меня-
ется от 1 до 0, а р(£) меняется от 0 до 1.
Для того чтобы определить средние потери при все-
возможных значениях £, найдем байесовский риск р* (£)
для рассмотренной решающей функции d(z). Используя
Рис. 9-8. Кривая байесовского риска в
двухальтернативной задаче.
выражение (9-29) для решающей функции р(Ф, d) и ус-
редняя эту функцию по всем состояниям природы, нахо-
дим:
р* (£) = &« (0+ (!-£)№ (9-51)
График зависимости р*(£), построенный по этой фор-
муле с учетом найденного характера изменения а(£) и
Р(£), приведен на рис. 9-8. Из этого графика видно, что
р*(£) обращается в нуль при £=0 и при £=1 и достига-
ет максимума при некотором £=£0. Значение опреде-
ляет наихудшую для статистика стратегию природы, при
которой он, применяя байесовский принцип, имеет поте-
ри р*(£о).
На практике весьма часто встречаются случаи, когда
предварительных статистических данных недостаточно
для того, чтобы точно определить априорную вероят-
ность Поэтому представляет интерес найти значение
байесовского риска для случая, когда статистик исходит
из некоторого значения априорной вероятности и в со-
ответствии с этим определяет значения а(£') и ₽(£'),
тогда как действительное значение £ будет иным. В этом
случае байесовский риск определяется выражением
р (С, Г) = tea (Г) 4- (1 — С) Р (С')» (9-52)
354
которое является линейным относительно £ и определяет
касательную к кривой у=р*(£) в точке £=£'. Из
рис. 9-8 видно, что потери, определяемые функцией
р(£, £z)> будут больше, чем для функции р*(£), если
так что неточное знание априорного распределе-
ния вероятностей приводит к увеличению потерь. Более
того, если £ значительно отличаются от £', то потери, оп-
ределяемые функцией р(£, £'), могут превысить значение
р*(£о), соответствующее максимальному значению бай-
есовских потерь. Однако если исходить из наиболее не-
благоприятного распределения вероятностей, соответст-
вующего значению £0, то функция у=р(£, £0) будет по-
стоянна и при любом £ определяет потери, равные р*(£о).
Этот случай соответствует применению минимаксной
стратегии.
Таким образом, применение байесовского принципа
целесообразно лишь в тех случаях, когда априорное рас-
пределение вероятностей £($) известно достаточно точ-
но. Если же априорное распределение вероятностей
£($) неизвестно или известно не точно, то более выгод-
ным может оказаться применение минимаксного прин-
ципа.
9-5. СТАТИСТИЧЕСКИЕ ИГРЫ С ПОСЛЕДОВАТЕЛЬНЫМИ
ВЫБОРКАМИ
а) Предварительные замечания
При рассмотрении статистической игры с единичным
экспериментом отмечалось, что единичный эксперимент
необязательно состоит из одного единственного испыта-
ния. Он может состоять и из последовательности испыта-
ний, но объем и порядок этих испытаний должны быть
определены заранее. Так, если заранее установлено, что
решение принимается после того, как проведено N по-
следовательных испытаний, то вся эта последователь-
ность испытаний рассматривается как единичный экспе-
римент, исходом которого будет многомерная величина
г=(21, ..., zN), где Z/, 1=1, /V— исход f-го испытания. В
связи с этим игру с единичным экспериментом часто на-
зывают игрой с заданным объемом выборки, понимая
под объемом выборки число последовательно проведен-
ных экспериментов.
23
355
В играх с заданным объемом выборки статистик мо-
жет использовать только те стратегии, которые опреде-
ляют характер его действий после полного окончания
всей последовательности испытаний. Однако для статис-
тика открыт и другой путь. Так, вместо проведения всех
N испытаний он может после каждого последовательно-
го испытания решать, прекратить ли испытание и выб-
рать какое-то решение из А на основании уже имеющей-
ся информации или провести следующее испытание. Это
расширяет класс возможных стратегий статистика, так
как к выбору решения из множества А добавляется еще
выбор решения о том, прекратить или продолжить экспе-
римент. Подобные игры называются играми с последова-
тельной выборкой. При этом, если задано предельное до-
пустимое число испытаний, после проведения которых
решение из А должно быть обязательно принято, игра
называется игрой с усеченной последовательной выбор-
кой. Только такими играми мы и ограничим дальнейшее
изложение, отсылая интересующихся более детальным
рассмотрением вопроса к [58, 63, 64]. Отдельные после-
довательные результаты эксперимента будем называть
наблюдениями.
Если бы эксперимент ничего не стоил, то расширение
класса стратегий путем введения последовательных вы-
борок не имело бы смысла, так как статистик ничего бы
не терял, а мог только выиграть, проведя все N наблю-
дений. Однако во многих случаях эксперимент дорог и
требует затраты времени. При этом статистик может
получить значительный выигрыш, если на каждой стадии
эксперимента он сопоставляет стоимость продолжения
эксперимента с ожидаемым выигрышем от получения
добавочной информации.
Рассмотрим способ описания игры с усеченными по-
следовательными выборками. Обозначим через Zt мно-
жество исходов f-го испытания. Тогда полное простран-
ство исходов эксперимента Z при проведении всех N ис-
пытаний можно представить в виде
Z-Z1x...xZ/v. (9-53)
В игре с последовательными выборками мы допуска-
ем принятие решения на основе проведения йе всех N
наблюдений Zi, ..., zN, а только / первых из них: Zi, ..., Zj.
В связи с этим множество Z можно разбить на непересе-
кающиеся подмножества So, Si, ..., S1V такие, что если
356
г £ Sj, то решение принимается на основании проведе-
ния / первых наблюдений.
Множество 3= (So, Si, S1V) называется планом, по-
следовательной выборки. Множество / можно разбить
на непересекающиеся подмножества Sj несколькими
различными способами. Каждый из этих способов опре-
делит свой план последовательной выборки. Множество
всевозможных планов последовательной выборки обоз-
начим (S и назовем полным классом последовательных,
выборок.
Для возможности принятия решения должна быть за-
дана решающая функция d(z), определяющая для каж-
дой последовательности наблюдений решение из А. Ре-
шающую функцию d(z), как и в игре с единичным
экспериментом, статистик выбирает из пространства ре-
шающих функций D, в которое входят все возможные
решающие функции.
Стратегия статистика в игре с последовательными
выборками состоит, во-первых, в выборе плана последо-
вательной выборки S£(S, указывающего, когда дол-
жен быть закончен эксперимент, и, во-вторых, в выборе
решающей функции d^D, указывающей, какое решение
должно быть принято по окончании эксперимента. Таким
образом, пара (S, d) определяет стратегию статистика.
Учитывая, что пара (S, d) является элементом прямого
произведения (Г><£), приходим к выводу, что (Г><£) яв-
ляется пространством чистых стратегий статистика.
Общее число стратегий в играх с последовательны-
ми выборками получается значительно большим, чем в
играх с единичным экспериментом, что вызывает зна-
чительные трудности при составлении полного перечня
стратегий статистика и выбора наилучшей из них. Эту
работу можно значительно упростить, если на каждой
стадии эксперимента вычислять апостериорное распре-
деление вероятностей, используя для этого всю накоп-
ленную к данному моменту информацию. По мере про-
ведения последовательных наблюдений неопределен-
ность относительно действительного состояния природы
будет при этом уменьшаться, так что открывается воз-
можность выработать критерий для определения момен-
та окончания эксперимента и принятия решения из мно-
жества А.
23а—142
357
6) Использование апостериорного распределения
вероятностей для определения последовательных
байесовских правил
Будем рассматривать только такие статистические
игры, в которых результаты отдельных подыспытаний
Zi, ..., zn являются независимыми случайными величина-
ми. Обозначим через q#(Zj) распределение вероятностей
на пространстве Zj при данном состоянии природы ft.
Стоимость отдельного подыспытания будем считать по-
стоянной и равной с=1.
В качестве основы для описания плана последова-
тельных выборок примем распределение вероятностей
на пространстве состояний природы 0, причем под
распределением £($) будем понимать не только априор-
ное распределение вероятностей до начала эксперимен-
та, но и апостериорное распределение вероятностей пос-
ле проведения нескольких подыспытаний. В дальнейшем
будем обозначать через £о(Ф) априорное распределение
вероятностей, а через gj('O’)—апостериорное распределе-
ние вероятностей после проведения / подыспытаний.
Распределение вероятностей gj('O’) будет содержать
в себе всю информацию о состоянии природы которая
имелась до проведения эксперимента, а также была по-
лучена в результате проведения первых j наблюдений.
Поэтому распределение может рассматриваться
как априорное перед (/4-1 )-м наблюдением. Следова-
тельно, распределение ^+1(Ф) выражается через ^(ft) с
помощью формулы для апостериорного распределения
вероятностей. Будем рассматривать переход от априор-
ного распределения вероятностей к апостериорно-
му как некоторое преобразование Т распределе-
ния gj('O). Тогда апостериорное распределение вероят-
ностей согласно (9-39) может быть записано в виде
тц<ыж(О) =
gj W^(z/+1)
2^ 4$ (г/4-1)
(9-54)
Принцип получения плана последовательной выбор-
ки на основе использования апостериорного распределе-
ния вероятностей рассмотрим на примере двухальтерна-
тивной задачи, в которой 0={6'i, <h} и Д = {аь а2}.
Обозначим через (£, 1—£) апостериорное распределе-
ние вероятностей на пространстве 0 после проведения
358
нескольких подыспытаний. Пространство Е смешанных
стратегий природы в этой задаче определяется областью
возможных значений £, т. е. интервалом [0,1] вещест-
венной оси.
Может оказаться, что £=1. В этом случае можно
принять только решение аь Если £—0, то обязательно
принимается решение а2. Но если окажется £=0,5, то
невозможно отдать предпочтение ни одному решению и
Реш.енае о
42 Л (а2) о Л ftz/j '
Рис. 9-9. Правило принятия решения в двухальтернативной задаче.
следует продолжить эксперимент для того, чтобы уточ-
нить действительное состояние природы.
Здесь были рассмотрены крайние случаи распределе-
ния вероятностей g('O). В общем же случае можно за-
даться значениями б и у(0^б^1, б^у) та-
кими, что:
если £ лежит в диапазоне [б, 1], то принимается ре-
шение
если £ лежит в диапазоне [0, у], то принимается ре-
шение а2;
если £ лежит в диапазоне (у, б), то принимается ре-
шение о проведении следующего подыспытания.
Диапазоны Д(«1) = [б, 1] и Д(я2) =[0, у] называются
областями остановки. На рис. 9-9 сформулированное
правило принятия решения изображено графически.
Области остановки можно определить и для случая,
когда число состояний природы больше двух. Правда, в
этом случае пространство смешанных стратегий приро-
ды Е будет иметь более сложный вид. Так, в случае трех
состояний природы оно имеет вид равностороннего тре-
угольника с высотой, равной единице (см. рис. 9-11).
В общем случае областью остановки Д (а) в простран-
стве Е называется подмножество пространства Е
Д(а)СЕ, (9-55)
такое, что если после некоторого подыспытания окажет-
ся £('&) £Д(а), то эксперимент прекращается и принима-
ется решение а.
23а*
359
Поскольку каждое подыспытание имеет стоимость, то
будет небезразлично, попадет ли в область А (а) до
проведения эксперимента или после нескольких подыс-
пытаний. Это означает, что с каждым новым подыспы-
танием будут изменяться значения как £($), так и об-
ласти А (а). При этом на каждой стадии эксперимента
представляют интерес не те подыспытания, которые уже
были проведены и результаты которых уже использова-
ны, а те, которые еще осталось провести до полного
окончания эксперимента. В соответствии с этим области
остановки на той стадии эксперимента, когда проведено
j подыспытаний из N, будем обозначать А^у.Да).
Если пространство решений состоит из т элементов
ah ...» ат. то на каждой стадии эксперимента должно
быть определено т областей А (а), соответствующих
каждому а £ А. Эти области должны быть выпуклыми и
непересекающимися [58].
в) Правило последовательных выборок
Предположим, что в пространстве Е выделено т об-
ластей А (а) на каждой стадии эксперимента. Тогда пра-
вило последовательных выборок будет состоять в следу-
ющем.
Первоначально известно априорное распределение
вероятностей g0(^)- Если ПРИ каком-либо
i, то принимается решение без проведения экспе-
римента. Если £o(d) $ An(«z) ни при каком г, то произ-
водится первое подыспытание и вычисляется апостери-
орное распределение вероятностей gi(^). Затем рассмат-
риваются области AN-i (а). Если gi(O) CAn-i^) при
каком-либо г, то эксперимент прекращается и принима-
ется решение ai. Если gi(O) £ An-i(«z) ни при каком г,
то производится следующее подыспытание и т. д.
Вообще, если эксперимент не был прекращен при
первых /—1 наблюдениях, то производится дополнитель-
ное наблюдение и вычисляется Если £,($) С
£ ^N-i(a) при каком-либо i, то эксперимент заканчи-
вается и принимается решение Ог. Если выбор не был
произведен после (У—1)-го наблюдения, то делается
Л/-е наблюдение и производится окончательный выбор.
Для выполнения этого условия области Ао(а<) должны
выбираться так, чтобы
иД0(й|) = Е. (9-56)
360
Как видим, задача описания последовательных байе-
совских правил сводится к задаче определения областей
в пространстве Е для всех а(^А и для всех /
от 0 до М.
г) Функция риска при оптимальном последовательном
правиле
Функция риска при последовательных выборках дол-
жна определять на каждой стадии эксперимента (на-
пример, после / подыспытаний) минимальные средние
потери, которые будет нести статистик, принимая наи-
лучшее решение из числа возможных решений, включая
решение о том, что эксперимент должен быть продол-
жен. Поскольку принятие решения основывается на
знании апостериорного распределения вероятностей
gj(ft), то от этого распределения вероятностей будет
зависеть и функция риска. Функцию риска, получаю-
щуюся после проведения / подыспытаний, будем обозна-
чать p*(D-
Выражения, определяющие функцию риска, будем
искать последовательно, начиная с последней стадии экс-
перимента. Предположим, что проведены все N подыс-
пытаний и найдено апостериорное распределение веро-
ятностей ^’•('0'). Средние потери, которые при этом несет
статистик, принимая решение а£ А, равны:
= (9-57)
&
Минимальное значение этих потерь, соответствующее
байесовскому решению а*, определится выражением
R* (tv) = L (lN, a*) = min L (^, a}. (9-58)
a
Поскольку никакого лучшего решения, чем а*, при-
нять невозможно, то величина /?*(£а) на этой стадии
эксперимента будет совпадать с функцией риска
= (9-59)
Рассмотрим теперь произвольную стадию экспери-
мента и найдем минимальные средние потери, которые
статистик будет нести после того, как он провел j подыс-
пытаний (/=0, 1, ..., N—1). При этом статистик распо-
лагает распределением вероятностей gj(ft).
361
В данном случае статистик может поступить двоя-
ким образом.
1. Статистик может прекратить эксперимент и при-
нять решение а £ А. Минимальные средние потери, ко-
торые он при этом имеет:
R* (Н7) = min L (Ip а) = min V L (fl, a) (fl), (9-60)
a a v
2. Статистик может принять решение проводить
(/+1)-е подыспытание. При этом он будет нести, во-
первых, потери, равные стоимости испытания, которые
мы приняли за единицу, и, во-вторых, потери, которые
он несет после принятия наилучшего решения по резуль-
татам (/4-1)-го наблюдения, т. е. р* (gj+i).
Однако статистику неизвестно распределение веро-
ятностей gj+i(fl). Он знает только распределение ^(fl),
а Ь+1(А) может определить лишь по формуле (9-54) как
Tgj(fl). При этом .значение Tgj(fl) может быть найдено
для конкретных значений £ Z^x и fl £ 0, которые
статистик пока не знает, поэтому он должен вести речь
не о конкретном значении функции риска р* (gj+i), а
лишь о среднем значении Л4[р* (T%j) ], причем усредне-
ние должно быть проведено по всем возможным значе-
ниям £ Zj+i с распределением вероятностей
q& (2j+i) и по всем fl( 0 с распределением вероятностей
ЫА):
ЛПр*(П;)]= <9'61)
Таким образом, минимальные потери статистика при
решении о продолжении эксперимента равны:
1 4-Л11р*(П;)]. (9-62)
Функция риска после проведения j подыспытаний оп-
ределится минимумом средних потерь при рассмотрении
обоих способов действия статистика: прекращения экс-
перимента и продолжения эксперимента. Следователь-
но,
р*(Н7) - min {Я* (Е;), 1 + М [р* (П7)]}. (9-63)
Выражение (9-63) можно записать более компактно,
не употребляя индекса /, обозначающего номер подыс-
пытания. Будем рассматривать стадию эксперимента,
когда до полного окончания эксперимента осталось k
362
подыспытаний. Обозначим через В(Ф) апостериорное рас-
пределение вероятностей на этой стадии, а через В'('0') =
= 7'^(6')—апостериорное распределение вероятностей
после проведения еще одного подыспытания. Функцию
риска на стадии, когда до конца эксперимента осталось
k подыспытаний, обозначим через pzt(B). Тогда выраже-
ния (9-59) и (9-63) запишутся'в виде
Ро® = **©; (9-64)
р: © = min (Я* (В), 1 + М [р;_! (ТВ)]). (9-65)
Обозначим через V пространство исходов следующе-
го подыспытания, элементы которого будем обозначать
V. При этих обозначениях получим:
Я* (В) = min 2 L (ft, а) В (ft); (9-66)
м [р;_1 (ТВ) ] = 2 р;_1(0)1 % W В (0); (9-67)
Тв(ft) = S(-------- . (9-68)
SB W 9# (0
&
Формулы (9-64) и (9-65) могут быть использованы
для определения областей остановки. Однако сравни-
тельно простые результаты получаются лишь для двух-
альтернативной задачи, рассмотрением которой мы в
дальнейшем и ограничимся.
д) Определение областей остановки для
двухальтернативной задачи при усеченной
последовательной выборке
Рассмотрим случай двухальтернативной задачи с
функцией потерь, заданной матрицей
Г 0 712
L72i О
(9-69)
и с распределением вероятностей на пространстве состо-
яния природы g('0>) = (^, 1—£). Обозначим через Д/Дф)
и Д/t(а2) области остановки, соответствующие решениям
Л1 и а2, когда до окончания эксперимента осталось про-
363
вести k наблюдений. Эти области определяются значени-
ями и такими, что
Ah (Oi) = lSft < Л, ДЛ(о2) = Ю'< I< TJ. (9-70)
Определение областей остановки сводится к опреде-
лению значений у& и бд при А=0, 1, N. Это можно сде-
лать, воспользовавшись полученными выражениями для
функции риска.
Начнем определение граничных точек областей оста-
новки с k=0. Выражая g('O’) через £, из (9-64) и (9-66)
получаем:
Ро(^) = #*(£) = min [(1 -С)?21, С<712] • (9-71)
Согласно (9-56) Ao(^i) и До (^2) должны быть непе-
ресекающимися вещественными множествами, объеди-
нение которых дает замкнутый отрезок [0,1]. Следова-
тельно, эти области должны отделяться друг от друга
точкой £=70 = 60, которая определится из условия
(1 — 0 ^21 == (9-72)
Условие (9-72) является условием равенства мини-
мальных средних потерь при принятии решений ai и а2.
Из (9-72) находим:
То = бо = -^. (9-73)
<712 + ?21
При произвольном функция риска имеет вид:
Р*(С) = min {/?* '£), 1 + М [р^1 (П)]}. (9-74)
Условия получения граничных значений £ для множеств
Дь(01) и Дл (tz2) будут условиями равенства минималь-
ных средних потерь при принятии решения а} или а2 и
при принятии решения о продолжении эксперимента, что
выражается соотношением
/?*(£)=! +М[р^(ТЩ. (9-75)
Замечая, что в выражении (9-71) для /?*(£) величина
(#21 является монотонно возрастающей функцией £, об-
ращающейся в нуль при £=0, а (1—£)д12 является моно-
тонно убывающей функцией £, обращающейся в нуль
при £=1, и заменяя в граничных точках £ на yh для об-
ласти Д/t(а2) и на б/г для области Д/г(<2i), условие (9-75)
можем записать в виде
Ь<?21 = 1 + М [p*_i(7\ft)];
(i-6ft)fe = i+Af [P;_i(T6ft)].
(9-76)
(9-77)
364
Эти условия геометрически иллюстрируются на
рис. 9-10.
Полученные соотношения показывают, что задача
определения yh и б&, а также функции риска (£) сво-
дятся к вычислению величины ^[р^ДЦ)]. Формула
(9-67) дает общее выражение для этой величины при
Рис. 9-10.
остановки
задаче.
Определение областей
в двухальтернативной
произвольном 0. Для двухальтернативной задачи это
выражение принимает вид:
м [pt, (П)] = £ +
V
+ (1-029^(1-4)4^).
V
(9-78)
где
(0
п = ----------------------------,
(v) + (1 —0 qV2 (v)
т (1 - и = (1 ~9 w
(0 + (1 — С) q#2 (0
(9-79)
(9-80)
При й=1 функция pj (О, определяемая выражением
(9-71), является очень простой функцией от 0 так что ве-
личина М[Ро(4)] может быть определена из (9-78) не-
посредственно. Зная Л1[р* (Г£)], можно вычислить из
(9-74) р*(£) и, следовательно, определить Л4[р^ (Г£)] из
(9-78), а отсюда р‘ (£) из (9-74) и т. д. Хотя подобный
процесс нахождения р‘ (£) требует больших вычислений,
однако при этом не приходится производить никаких
более сложных операций, чем отыскание математичес-
ких ожиданий.
365
ЗАДАЧИ К ГЛ. 9
9-1. По данным табл. 9-3 найти стратегию, основанную на прин-
ципе минимакса дополнительных потерь в задаче о технологической
линии.
Рис. 9-11. Пространство
смешанных стратегий
для случая трех состоя-
ний природы.
шее вид треугольника с
рис. 9-11.
9-2. Воспользовавшись геометрическим построением из рис. 9-6,
произвести необходимые вычисления для определения минимаксной
и байесовской стратегий в задаче о технологической линии с еди-
ничным экспериментом.
9-3. По каналу связи передается
сигнал и, на который наложена помеха
s с гауссовским законом распределения
N(0, о2), так что на приемной стороне
измеряется величина z = u+s. Сигнал и
может принимать два значения: и = 0—
сигнала нет (th), и u = u0 = const— сиг-
нал есть (Ф2). Приемное устройство име-
ет порог zQ и выдает решение о том,
что передан сигнал ц0, если Опре-
делить порог zQ, пользуясь методами
решения двухальтернативной задачи,
положив £ = 0,25 и w — 2.
9-4. Показать, что в случае трех
состояний природы 0={'O'i, 'О'г, 'О’з} все-
возможные смешанные стратегии стати-
стика i('O') = (£ь Ь, £з) образуют про-
странство смешанных стратегий, имею-
высотой, равной единице, как показано на
ГЛАВА ДЕСЯТАЯ
ЗАДАЧИ ТЕОРИИ РАСПИСАНИИ И МАССОВОГО
ОБСЛУЖИВАНИЯ
10-1. ПРЕДМЕТ ТЕОРИИ РАСПИСАНИЙ
а) Общие сведения
Важное практическое значение имеет целая группа
задач, связанных с выполнением комплекса работ, на-
зываемых «операциями», «заявками», «требованиями»,
и т. п., при наличии ограничений на порядок их выполне-
ния, длительность каждой работы, выделяемые ресурсы
и т. п. С такими задачами приходится сталкиваться при
решении вопросов календарного планирования и опера-
тивного управления как в производстве, так и при об-
служивании населения [65].
Задачи подобного рода весьма разнообразны и их ис-
следование в зависимости от характерных признаков
366
проводится в рамках различных научных дисциплин. В
теории сетевого планирования основное внимание уделя-
ется определению порядка выполнения сложных разра-
боток, включающих большое число взаимосвязанных
работ, требующих многочисленных исполнителей и
значительных материальных затрат. В теории упорядо-
чения рассматриваются вопросы установления порядка
выполнения большого комплекса однородных работ с по-
мощью одного или нескольких специализированных уст-
ройств, машин, приборов. В теории массового обслужи-
вания рассматриваются задачи назначения приоритетов
в обслуживании поступающих заявок некоторыми уст-
ройствами, приборами и т. п. Однако определенное сход-
ство формальных моделей всех этих видов задач позво-
ляет сосредоточить их рассмотрение в одной главе.
6] Постановка задачи теории расписаний
Целенаправленную деятельность можно рассматри-
вать как некоторый протекающий во времени процесс,
заключающийся в реализации (выполнении) определен-
ной совокупности работ
S = {Рь ... , Ps}, (10-1)
называемой также программой.
Выполнение программы стеснено целым рядом огра-
ничений и условий, которые обычно удается разбить на
две группы [6].
Ограничения а. Эти ограничения описывают
взаимную зависимость выполнения работ. Каждой рабо-
те Pi £ S можно поставить в соответствие некоторое
множество Пid S непосредственно предшествующих ра-
бот, без выполнения которых нельзя начинать выполне-
ние работы Pi, а также ряд работ, не входящих в мно-
жество S, которые могут рассматриваться как внешние
факторы, необходимые для выполнения работы Pi. Так,
возведение стен строящегося здания возможно начать
лишь после того, как сделан фундамент (работа из мно-
жества S), а также при наличии кирпича и раствора, из-
готовление и транспортировка которых могут и не вхо-
дить в рассматриваемый перечень работ.
Для описания некоторых других условий, входящих в
ограничения типа а, удобно ход выполнения работ рас-
сматривать в дискретном времени, приняв некоторую ве-
367
личину А/ за единичный интервал времени. Этот интер-
вал можно назвать «условный день», «условный год»
и т. п. Однако нам будет удобно называть его шагом.
Некоторые работы могут быть выполнены целиком за
один шаг. Другие могут потребовать нескольких шагов.
В этом случае в ограничение а должно входить условие
допустимости или недопустимости прерывания работ.
Пусть t — номер рассматриваемого шага (/=1, 2...).
Обозначим через yi(t) долю работы Pi, выполняемую на
шаге с номером t, которую назовем единичной (дневной,
годовой и т. п.) порцией работы Pi. Через S(/) обозначим
перечень работ, выполняемых на шаге с номером t.
Пусть работа Pi состоит из т единичных порций yi и
прерывание этой работы недопустимо. Условие недопус-
тимости прерывания работы заключается в том, что если
эта работа начинается на шаге с номером t, то единич-
ные порции yt должны входить в перечни работ 5(0,
S(7+1), .., S(t+m— 1).
Ограничения р. Эти ограничения связаны с ог-
раниченным объемом ресурса, который может быть вы-
делен на выполнение программы S.
Обозначим через Q(/) вектор ресурса, который мо-
жет быть выделен на выполнение работ на шаге с номе-
ром t. Компонентами вектора Q(/) могут быть величины
Qi — сырье, материалы, Q2 — оборудование, Qs — рабочая
сила и т. п. Обозначим также через д[*л(7)] количество
ресурса, которое необходимо затратить для выполнения
работы yt(t). В этих обозначениях ограничение р запи-
шется в виде
s
... ,М, (10-2)
1=1
где М — общее число шагов.
В рассматриваемой задаче часто вводится предполо-
жение, что единичная порция работы yt(t) либо выпол-
няется полностью, если для нее выделен весь необходи-
мый ресурс, либо не выполняется совсем, если ресурс
выделен не полностью. Более общая, однако, и более
сложная задача получается тогда, когда доля выполнен-
ной работы зависит от количества выделенного ресурса.
368
Задача на составление расписания сводится к тому,
чтобы для каждого шага t назвать перечень работ
S(/) = {P^ , Р-^ }, которые должны выполняться в те-
чение этого шага, а также долю yt(i) каждой из этих ра-
бот с учетом всех ограничений, накладываемых на поря-
док выполнения работ и на выделяемые ресурсы.
Если количество работ велико, то количество вариан-
тов расписания может быть огромным. Выбор конкрет-
ного варианта расписания связан с понятием директив-
ного срока. Если перечень работ и ресурс на их выполне-
ние уже заданы, то наилучшим (оптимальным) вариан-
том расписания следует считать такой вариант, при
котором срок выполнения всего перечня будет минималь-
ным. Этот срок и принято называть директивным сроком.
в) Виды задач на составление расписания
Пусть имеется сложная программа работ 5 =
= {Pi, ..., Л}, в которой действуют как ограничения а,
определяющие очередность выполнения отдельных работ,
так и ограничения р на выделяемые ресурсы. На прак-
тике обычно бывает так, что ограничения а связывают
между собой не все работы, а действуют лишь внутри
некоторых независимых групп работ. Сами же такие
группы между собой жесткими ограничениями не свя-
заны.
В таких случаях программу работ S можно предста-
вить в виде некоторого разбиения 9Л = {/?i, ..., Rm},
элементы которого R 6 ЭВ представляют собой некото-
рые самостоятельные подпрограммы, обладающие тем
свойством, что между ними отсутствуют жесткие огра-
ничения очередности, так что каждая подпрограмма
RСЭЛ может выполняться почти независимо от выпол-
нения других подпрограмм. Однако внутри каждой под-
программы Ri={Pi^ , ..., Plr } порядок выполнения ра-
бот подчинен жестким ограничениям а.
Таким образом, задачу на составление расписания
можно разбить на две самостоятельные задачи.
Определение порядка выполнения работ внутри каж-
дой подпрограммы с учетом ограничений на очередность
выполнения работ и распределение ресурса по этапам
выполнения подпрограммы осуществляется следующим
образом. Поскольку жесткие ограничения а в таких за-
369
дачах в значительной степени предопределяют порядок
выполнения отдельных работ, то количество возможных
вариантов расписания здесь не очень велико. Однако
варианты всегда возможны и среди них могут найтись
такие, при которых окажется минимальным время вы-
полнения подпрограммы, наиболее рациональное рас-
пределение ресурсов и т. п. Для решения задач этого ти-
па широкое применение получили методы сетевого пла-
нирования и управления (СПУ).
В задачах второго типа ограничения на очередность
выполнения отдельных работ незначительны. Однако это
не означает, что порядок выполнения работ здесь без-
различен. От порядка выполнения работ зависит рас-
пределение ресурса по шагам. На переход от одной ра-
боты к другой тратится время, может потребоваться пе-
реквалификация персонала, переналадка или замена
оборудования и т. п. Поэтому и здесь стоит задача сос-
тавления такого расписания работ, которое в определен-
ном смысле было бы наилучшим.
Однако отсутствие ограничений в задачах этого типа
приводит к необходимости рассматривать очень большое
число различных комбинаций порядка выполнения работ
и давать оценку каждой комбинации. Поэтому такие за-
дачи получили название комбинаторных задач на сос-
тавление расписания или задач упорядочения.
10-2. СЕТЕВОЕ ПЛАНИРОВАНИЕ И УПРАВЛЕНИЕ
а) Понятие сетевого графика. Составление перечня
работ
Сетевые методы находят широкое применение для
рационального планирования крупных разработок, вклю-
чающих в себя выполнение целого комплекса взаимо-
связанных работ, например сооружение строительных
объектов, разработка новых технических систем и изде-
лий, проведение крупных ремонтов и реконструкций, из-
готовление и сборка крупных изделий (самолетов, судов,
космических кораблей) и т. п. Эти методы основаны на
наглядном представлении выполняемого комплекса ра-
бот в виде ориентированного графа, дуги которого изоб-
ражают выполняемые работы, а вершины — события,
представляющие собой завершение отдельных работ.
Последовательность дуг в таком графе определяет поря-
док, в котором выполняются работы.
370
На рис. 10-1 приведен образец сетевого графика, на
котором показаны работы, необходимые для изготовле-
ния некоторого прибора. Сетевой график дает наглядное
представление о порядке выполнения работ, что дает
возможность наиболее рационально распорядиться име-
ющимися трудовыми и материальными ресурсами.
Подготовка
чертежей
Проекти-
рование
Подготовка и описание
инструкции
Отгрузка
\Производство Контрольные
деталей испытания
<а Поставка \ /
деталей ^Сборка J
Рис. 10-1. Диаграмма по изготовлению прибора.
Первый шаг в построении сетевого графика состоит
в расчленении всего комплекса на отдельные работы или
операции. Каждая работа связана с затратами времени,
а значит, имеет свое начало и конец. Моменты начала и
окончания работы должны легко определяться. Работы,
не имеющие строго определенного начала и конца, не
должны входить в перечень и подлежат дальнейшему
уточнению.
Таблица 10-1
Исходные данные для сетевого планирования
Вид работы Длитель- ность, мес. Средства, тыс. руб. Интенсив- ность, чел/м<с. Непосредственно предшествующие работы
А 1 250 8
В 4 13,0 13 Л, С, D
С 1 5,0 20 —
D 1 5,0 20 —
Е 2 2,0 4 —
F 3 12,0 16 D, Е
G 4 5,0 5 F
Н 1 1,0 4 С
I 5 4,0 3 В, G, У
К 2 1,0 2 С
L 2 3,0 6 н
М 2 1,0 2 н
4 0,5 1 Л, D
р 2 5,0 10 F
Q 6 15,0 10 ——
R 3 5,0 7 Q
371
Перечень работ обычно составляют лица, компетент-
ные в данном конкретном проекте (эксперты). Однако
как бы ни был компетентен эксперт, он никогда не га-
рантирован от ошибок, основные из которых заключают-
ся в том, что некоторые работы могут оказаться пропу-
щенными. Поэтому перечень работ должен обязательно
согласоваться с непосредственными исполнителями, ко-
торые могут легко заметить пропущенные работы и дру-
гие недостатки перечня работ.
Одновременно с составлением перечня работ опреде-
ляются ограничительные условия на их выполнение: дли-
тельность каждой работы, средства на ее выполнение,
интенсивность, а также перечень непосредственно пред-
шествующих работ, выполнение которых является необ-
ходимым для начала данной работы. Все эти данные за-
носятся в таблицу, примером которой является табл. 10-1,
содержащая 16 работ.
6) Упорядочение (ранжировка) работ
Таблица 10-1 имеет тот недостаток, что порядок ра-
бот в ней носит до некоторой степени случайный харак-
тер. Из таблицы не ясно, какие работы являются более
важными, а следовательно, не видно, на каких работах
нужно сосредоточить основное внимание при выполне-
нии всего комплекса.
С целью устранения этого недостатка отдельным ра-
ботам удобно приписывать веса, отражающие степень
важности этих работ и в значительной степени предоп-
ределяющие порядок, в котором должны выполняться
работы. Приписывание весов представляет собой упоря-
дочение или ранжировку работ.
Известно много способов упорядочения работ. Рас-
смотрим лишь один из возможных [22].
Каждой работе приписываем вес, равный сумме чис-
ла непосредственно следующих за ней рабо' и весов
этих работ. Конечным работам, т. е. таким, Зе которыми
не следуют другие работы, приписываем относительные
веса, соответствующие важности этих работ. Мы будем
считать все конечные работы одинаково важными и всем
им припишем вес, равный единице.
Приписывание весов ведем по типу табл. 10-2. Слева
перечисляем все работы и около каждой из них указы-
372
Приписывание относительных весов
Таблица 10-2
Работы и ограничения Вес работы Работы и ограничения Вес работы
А<В, N 24-2+2=6 1 — 1
В<1 1+1=2 К- 1
с<в-, н, к 3+2+4+1 — 10 L — 1
D<B, F, N 3+2+5+2=12 М— 1
E<F 1+5=6 М</ 1 + 1=2
F<G, Р 2+2+1=5 Р — 1
G<I 1+1=2 d<R 1+1=2
H<L, M 2+1+1=4 R - 1
ваем непосредственно следующие за ней. Эти работы
находим, просматривая последний столбец табл. 10-1.
Так, из второй строки видим, что работе В непосред-
ственно предшествуют работы А, С, D, что можно запи-
сать в виде А<В, С<В, D<B. Значит, работа В явля-
Таблица 10-3
Сводные данные по расчету сетевого графика
Номер работы k \ Интенсив- ность’^ Длитель- ность т^ *k t'k Резерв времени Дт Раннее начало работы t°
D 20 1 в, N, F 1 2 1 0
С 20 1 — в, н, к 1 5 4 0
Е 4 2 — F 2 2 0 0
А 8 1 — В, W 1 5 4 0
F 16 3 D, Е G, Р 5 5 0 2
Н 4 1 С L, М 2 12 10 1
Q 10 6 — R 6 11 5 0
N 1 4 A, D I 5 9 4 1
G 5 4 F I 9 9 0 5
В 13 4 А, С, D, I 5 9 4 1
R 7 3 d — 9 14 5 6
Р 10 2 F — 7 14 7 5
М 2 2 Н — 4 14 10 2
L 6 2 Н — 4 14 10 2
К 2 2 С — 3 14 11 1
1 3 5 B,G, W — 14 14 0 9
Обозначения: т — длительность работы; со # —- непосредственно
предшествующие работы; со&—непосредственно следующие работы; tfc— наи-
более ранний срок окончания; t— наиболее поздний срок окончания.
24—142
373
ется непосредственно следующей за работами Я, С и D,
что и отмечаем в соответствующих строках табл. 10-2.
Подсчет весов ведем, просматривая левый столбец
табл. 10-2 снизу вверх. Такой просмотр приходится про-
водить несколько раз. В начале приписываем вес едини-
ца для конечных работ /?, Р, М, L, К, /. При каждом
следующем просмотре подсчитываем веса тех работ,
для которых уже известны веса непосредственно следу-
ющих за ними работ.
Упорядоченное множество работ получим, перенося
работы из табл. 10-2 в табл. 10-3 в порядке убывания их
весов. Для работ с одинаковыми весами порядок может
быть взят произвольно. Одновременно в табл. 10-3 зано-
сим данные об интенсивности работ, их длительности т,
множества о/ и со" непосредственно предшествующих и
непосредственно следующих работ, а также данные для
определения сроков начала, окончания и резервов вре-
мени для каждой работы. На определении последних ве-
личин остановимся особо.
в) Определение резервов времени
Начало некоторых работ можно варьировать в пре-
делах, называемых резервами времени, не нарушая
требуемой последовательности работ и общего срока окон-
чания всего комплекса работ. Обозначим через дли-
тельность работы с номером k, а через t'k и t"k — наибо-
лее ранний и наиболее поздний сроки ее окончания. Тог-
да резерв времени для работы k
\xk=tk—tk. (10-3)
Задача, таким образом, сводится к определению мо-
ментов t'k и /" для каждой из работ.
Определение моментов t'k. Рассмотрим работу i € со^,
т. е. одну из работ, непосредственно предшествующих
работе k. Если t’k—момент окончания работы А, то мо-
мент ее начала будет t'k—ть. Поскольку работа k не мо-
жет начаться, пока не закончены все непосредственно
предшествующие работы, то должно выполняться усло-
вие
tk — Ч> th i (10-4)
374
Знак равенства в этом соотношении определяет наи-
более ранний срок окончания работы
4 = max ( U + tJ. (Ю-5)
Как видим, для определения t'k необходимо знать
значения /' для всех непосредственно предшествующих
работ. Поэтому определение t'k следует начинать с ра-
бот, которые не имеют предшествующих, т. е. стоят в ос-
новном в начале списка, и для которых наиболее ранние
сроки окончания будут равны длительностям работ. ’
Наибольший из моментов t'k определяет время Т за-
вершения всего комплекса работ:
Т^шах^. (10-6)
k
В рассматриваемом примере 7=14 мес.
Определение моментов Q . Рассмотрим рабо-
ту / € <4 > т- е- °ДНУ из работ, непосредственно следую-
щих за работой k. Если t". —наиболее поздний срок ее
окончания, то наиболее поздний срок ее начала будет
—tj. Поскольку работа / не может начаться, пока не
закончена работа k, то должно иметь место
т/, j е (Ю-7)
откуда следует, что
tk = min [t'j — ту). (10-8)
Поскольку для определения fk необходимо знать мо-
менты окончания непосредственно следующих работ, то
рассмотрение следует начинать с работ, за которыми не
следуют никакие другие работы, т. е. с работ /, К, L, М,
Р, R. Для этих работ за наиболее поздний срок оконча-
ния принимается время Т окончания всего комплекса.
После определения моментов tk и /" для каждой из
работ определяются резервы времени по соотношению
(10-3).
Заполненная табл. 10-3 дает большую информацию о
характере комплекса работ и может оказать существен-
24* 375
ную помощь руководителю работ в организации его вы-
полнения. Из нее, в частности, следует:
1) общий срок Т выполнения комплекса работ равен
14 мес. Это так называемый директивный срок;
2) работы £, F, G, 1 имеют нулевые резервы времени
и называются критическими работами. Любая задержка
в выполнении критических работ удлинит срок выполне-
ния всего комплекса, и правильной организации этих ра-
бот необходимо уделять максимальное внимание;
3) весьма малый резерв времени у работы D
(1 мес.). Эту работу надо также взять под особый кон-
троль;
4) остальные работы имеют значительные резервы
времени и им руководитель может уделять меньше вни-
мания.
Таким образом, таблица дает возможность руково-
дителю не распыляться по многим работам, а сосредото-
чить свое внимание на тех работах, от своевременного
выполнения которых в наибольшей степени зависит вы-
полнение всего комплекса. Однако представление хода
выполнения работ в виде таблицы неудобно и ненагляд-
но. Гораздо удобнее представлять работы графически в
виде сетевого графика.
г) Построение сетевого графика
На сетевом графике каждая работа изображается в
виде дуги графа, т. е. стрелки, содержащей две верши-
ны, представляющие собой события, соответствующие
началу и окончанию работы, как показано на рис. 10-2.
Событие обозначаем кружком с крестиком наверху, в
котором указываем момент наступления данного собы-
тия. Работы (стрелки) обозначаем буквами латинского
алфавита, а вершины нумеруем. При этом каждая рабо-
та может быть обозначена или буквой, например А, или
наименованием вершин, например (/,2). Первое обозна-
чение удобней при ручных, а второе при машинных рас-
четах.
В тех случаях, когда несколько работ оканчивается
одним и тем же событием, мы имеем дело с объединени-
ем работ. Если с одного и того же события начинается
несколько работ, то это называют расчленением рабо-
ты. Объединение и расчленение работ легко обнаружить
376
по перечню ограничений. На рис. 10-3 приведены приме-
ры объединения и расчленения работ.
Последовательность работ на сетевом графике дол-
жна отражать все ограничения, приведенные в табл.
10-3. Пусть, например L</<, Л4</С, т.е. o)^={L, Л4},
и при этом Л'м < t'L. Тогда началом работы К должно
служить событие /, представляющее собой окончание
работы L с более поздним сроком окончания t'Ly как по-
Рис. 10-2. Пример изображе-
ния работ и событий.
-а
казано на рис. 10-4. Поскольку работа М заканчивается
раньше, чем работа L, то моменту ее окончания соответ-
ствует другое событие 2. Для обеспечения на сетевом
графике условия A1<L необходимо события 2 и 1 соеди-
Рис. 10-3. Примеры объединения
и расчленения работ.
Рис. 10-4. Введение фиктивной
работы, означающей резерв
времени.
нить пунктирной стрелкой, обозначающей фиктивную
работу (2, /), которая на самом деле не выполняется и
означает просто резерв времени. Таким образом, на се-
тевом графике приходится вводить ряд фиктивных ра-
бот.
Фиктивные работы могут не только означать резер-
вы времени, но и служить для разделения некоторых ра-
бот, неразличимых при цифровом обозначении. Так, на
рис. 10-5 работы А и В начинаются и окончиваются оди-
наковыми событиями 1 и 2 и в цифровом обозначении не
отличаются, что затрудняет машинные расчеты. В дан-
ном случае приходится вводить фиктивную вершину 3 и
фиктивную работу (5, 2), имеющую нулевую продолжи-
тельность.
Введение фиктивных работ и фиктивных событий
требует большого внимания и осторожности. Необходи-
377
GO
Oo
Примеры неправильного и правильного введения фиктивных работ в сетевом графике
Таблица 10-4
Случай Введение излишних ограничений Излишние фиктивные работы
©граничения АсС ВСЕ C<D, Е ACD, Е ВСЕ, F CCF VVV АсС ВсС, D, Е CcEt
Неправильно */''''7 7 27 п Л б1 " 77 Фиктивная работа не нужна гу , Ограничение ВСЕ от- ражено два раза
в Лишнее ограничение BCD Y Лишнее ограничение ACF
Правильно 1 Е D 7 \ .//? Е F С 27 А/ * 7 | 1 2Z
мо проверять, чтобы фиктивные работы не нарушали
ограничений на очередность работ и не вносили новых
ограничений, не имеющихся в исходной таблице, а так-
же чтобы не было ненужных и лишних фиктивных ра-
бот, которые лишь усложнят расчеты. Типичные приме-
ры неправильного и правильного введения фиктивных
работ приведены в табл. 10-4.
Рис. 10-5. Введение фиктивной работы для различия
работ А и В.
Сетевой график, построенный по данным табл. 10-3,
в котором каждая работа k начинается в наиболее ран-
ний срок приведен на рис. 10-6. На этом графике
двойными стрелками отмечены работы, не имеющие ре-
зервов времени. Последовательность двойных стрелок
Рис. 10-6. Первоначальный сетевой график.
379
образует критический путь, определяющий длительность
выполнения всего комплекса.
Построенный по вышеизложенным правилам сетевой
график может быть по ряду причин не совсем удовлетво-
рительным. В нем может оказаться неудачное распреде-
ление ресурсов по этапам или слишком большим срок
выполнения всего комплекса работ, или какие-либо дру-
гие недостатки. Эти недостатки можно уменьшить, про-
водя оптимизацию сетевого графика. Рассмотрим неко-
торые из применяемых при этом методов.
д) Коррекция распределения ресурсов
Если начинать все работы в наиболее ранние воз-
можные сроки, то распределение ресурсов по месяцам
(интенсивность работ в рассматриваемом случае), при-
веденное на рис. 10-7, а, получается очень неравномер-
ным и уже в первом месяце достигает 62 чел., тогда как
во втором месяце потребуется всего 32 чел.
Распределение ресурсов можно сделать значительно
более равномерным, сместив начало некоторых работ,
имеющих значительные резервы времени. Процедура
смещения начала работ представлят собой коррекцию
Рис. 10-7. Распределение ресурсов.
а — первоначальное; б — после корректировки.
380
Рис. 10-8. Скорректированный сетевой график.
сетевого графика. На рис. 10-8 приведен скорректиро-
ванный сетевой график, распределение ресурсов для ко-
торого показано на рис. 10-7, б.
е) Оптимизация срока выполнения комплекса работ
Может оказаться, что время Т выполнения комплек-
са работ чрезмерно велико и стоит задача сократить его
до величины Т'<Т. Для этого необходимо сократить
длительности некоторых работ.
Пусть Ti—первоначально запланированная длитель-
ность i-й работы. Если в эту работу вложить сумму хг-
дополнительных средств, то длительность этой работы
изменится. Если вкладываемые средства не очень вели-
ки и ограничены, например, значениями сг-, то новую
длительность работы т'. можно считать линейно зави-
сящей ОТ Хг, т. е. положить
т- =тг(1 — Ь(х(), (10-9)
где bi — известные для каждой работы коэффициенты.
381
Теперь стоит задача найти дополнительные вложения
Хг в каждую из работ, чтобы уложить весь комплекс ра-
бот в заданный срок Т'. При этом следует добиваться
такого распределения добавочных средств по работам,
при котором требуемое сокращение длительности всего
комплекса работ достигается при минимальной общей
сумме добавочных вложений. Эта задача может быть
решена методами линейного программирования.
Обозначим через v; момент начала Z-й работы, а че-
рез ti — момент ее окончания. Для рассмотренного ком-
плекса работ ограничения на последовательность вы-
полнения работ приводят к следующей системе нера-
венств:
vf>0, i = Л, ... , R. (10-10)
VE>VD’VE’ V/y>VcHT.fl. (10-11)
Условие зависимости длительности работ от вложен-
ных средств дает:
/. = v. + т. (1 — Z = Л, , R. (10-12)
Ограничения на средства, вкладываемые в отдельные
работы, имеют вид:
i= А, ... , R. (10-13)
Условие окончания всего комплекса работ в задан-
ный срок означает, что ни одна из конечных работ не
должна иметь срок окончания больший, чем Г':
/. < Г, i = /, К, L, М, Р, R. (10-14)
При выполнении всех этих условий нужно найти та-
кое распределение добавочных вложений Хг по работам,
при котором общая сумма вложений
Ь = (Ю-15)
i
будет минимальна.
Эта задача является типичной задачей линейного
программирования, в которой неизвестными являются
добавочные вложения Xi и сроки начала каждой работы
vt. Но так как число самих неизвестных и налагаемых
на них ограничений велико, решение этой задачи может
представлять значительные трудности.
Задачу можно значительно упростить, если учесть,
что общее время выполнения комплекса определяется
382
длительностью работ, лежащих на критическом пути.
Отсюда следует, что если есть основание считать, что
критический путь при новом времени выполнения ком-
плекса останется тем же самым, то все рассмотрение
нужно проводить лишь для работ £, F, G, 7, лежащих
на критическом пути.
ж) Вероятностные методы сетевого планирования
Рассмотренные методы построения сетевого графика
исходят из того, что заранее точно известны длительно-
сти %i каждой работы. На самом деле длительности ра-
бот зависят от множества различных факторов и фак-
тически являются случайными величинами. Неучет это-
го обстоятельства может привести к значительным
ошибкам в определении общего срока выполнения ком-
плекса.
Оценка времени выполнения каждой работы произ-
водится экспертами, т.е. людьми, хорошо знающими все
особенности технологии и организации проведения дан-
ной работы. При использовании вероятностных методов
от эксперта требуется выдача трех видов оценок време-
ни выполнения каждой работы:
оптимистическая оценка aiy указывающая время вы-
полнения работы при наиболее благоприятно сложив-
шихся условиях;
пессимистическая оценка дающая время выполне-
ния работы при наиболее неблагоприятно сложившихся
условиях;
наиболее вероятная продолжительность работы пц,
имеющая место при существующих условиях.
При этом предполагается, что время выполнения ра-
боты является случайной величиной, подчиняющейся за-
кону p-распределения [66].
На основании оценок аг-, bi, гпг определяется ожидае-
мое время выполнения работы
- = .^+.4^+^ (Ю-16)
и дисперсия ожидаемой оценки
Все дальнейшие расчеты ведутся так же, как и ра-
нее, только вместо заданной длительности каждой ра-
383
боты используется ожидаемое время ее выполнения. По
проведенной ранее методике определяются ожидаемые
наиболее ранний и наиболее поздний сроки выполнения
каждой работы и ожидаемые резервы времени.
Отличие заключается в том, что одновременно с оп-
ределением ожидаемых сроков окончания работ подсчи-
тываются дисперсии этих сроков. При подсчете диспер-
Рис. 10-9. Определение вероятно-
сти выполнения комплекса работ
в заданный срок То.
сий пользуются обычным правилом: дисперсия суммы
случайных величин равна сумме дисперсий слагаемых.
Таким образом, если ожидаемый срок окончания i-и ра-
боты оказывается равным ti = tj+%i, то дисперсия этого
срока будет равна о2= о?+ о2.
Знание дисперсий позволяет оценить вероятность вы-
полнения той или иной работы или всего комплекса ра-
бот в заданный срок. Предположим, что запланирован-
ное время выполнения работ равно Tq. Расчет сетевого
графика показал, что ожидаемое время выполнения ком-
плекса работ равно Т с дисперсией от . Достаточно спра-
ведливым будет предположение, что действительное вре-
мя выполнения комплекса Т будет случайной величиной,
имеющей нормальный закон распределения со средним
значением Т и дисперсией о4, как показано на рис. 10-9.
Вероятность того, что действительное время выполне-
ния комплекса работ Т не превзойдет запланированного
То, определится заштрихованной площадью под кривой
плотности распределения вероятности. Математически
эта вероятность может быть найдена в соответствии с
(4-57) из соотношения
Р(Т^Т0) = ф('^3-\ (10-18)
где Ф(х) —интеграл вероятностей.
Более подробное положение методов сетевого плани-
рования и управления можно найти в [35, 68, 67, 19].
384
10-3. КОМБИНАТОРНЫЕ ЗАДАЧИ НА СОСТАВЛЕНИЕ
РАСПИСАНИЯ
а) Понятие о комбинаторных задачах
Существо комбинаторных задач проиллюстрируем на
примере определения оптимальной последовательности
обработки деталей.
Пусть имеется два станка, например токарный и фре-
зерный, и п различных деталей, каждая из которых дол-
жна быть последовательно обработана на каждом из
этих станков. Требуется определить, в какой последова-
тельности нужно обрабатывать эти детали.
Данная задача имеет характерные признаки задач
на составление расписания с ограничениями типа а, на
последовательность операций (сначала токарная обра-
ботка, а затем фрезерование) и с ограничениями типа £
на используемые ресурсы (имеются только один токар-
ный и один фрезерный станки). Однако данные ограни-
чения не являются чрезвычайно жесткими и допускают
большую свободу выбора вариантов обработки деталей.
Начать обработку можно с любой из п деталей, второй
можно обрабатывать любую из оставшихся п—1 деталей
и т.д. Общее число вариантов п(и—1)...1=и!.
Однако, может быть, все эти варианты равноценны,
так что нет и никакой проблемы? Оказывается, что это
не так. От выбора порядка обработки деталей зависят
простои оборудования (фрезерный станок уже освобо-
дился, а токарная обработка очередной детали не за-
кончена) и перерывы в обработке деталей (закончена
токарная обработка очередной детали, но фрезерный
станок еще занят).
Очевидно, из всех возможных вариантов обработки
следует выбрать такой, который позволит закончить об-
работку всей партии деталей за кратчайшее время. По-
этому данная задача является задачей оптимизации.
Однако ее решение чрезвычайно затруднено наличием
огромного числа вариантов обработки, что и заставляет
отнести данную задачу к задачам комбинаторного типа.
Решение рассмотренной задачи мы приведем позднее.
А сейчас рассмотрим задачу с более простыми видами
ограничений, на примере которой и познакомимся с не-
которыми методами решения задач подобного типа.
385
6) Задача коммивояжера
Рассмотрим более простой вариант задачи об опре-
делении оптимальной последовательности обработки
деталей. Предположим, что п различных деталей, зану-
мерованных от 1 до и, надо обработать на одном станке.
При переходе от обработки детали i к детали k требует-
ся время dik на переналадку станка, различное при раз-
Та блица 10-5
Таблица расстояний в задаче коммивояжера
i k
1 1 2 1 1 п
1 2 X ^21 ^12 X • . . А-2П
п ^П1 ^П2 . . . ’ X ’
личных i и k. Значения dik заданы в виде табл. 10-5. Тре-
буется определить такой порядок обработки деталей,
при котором общее время на обработку будет минималь-
ным. Поскольку возможно п вариантов обработки пер-
вой детали, п—1—второй и т. д., то общее число вари-
антов обработки будет равно п\ Следовательно, эта за-
дача относится к задачам комбинаторного типа.
Поскольку время, затрачиваемое непосредственно на
обработку всех деталей, будет одним и тем же при лю-
бом порядке обработки, то минимизация общего време-
ни обработки сводится к минимизации времени на пере-
наладку станков. Данные для решения этой задачи це-
ликом содержатся в табл. 10-5.
В математике задача подобного вида получила наз-
вание задачи коммивояжера. Коммивояжер (агент, ре-
кламирующий товар своей фирмы), выходящий из како-
го-либо города, должен посетить п—1 других городов и
вернуться к исходному пункту. Известны расстояния
между городами dik, заданные в виде уже рассмотрен-
ной табл. 10-5. Требуется установить, в каком порядке
коммивояжер должен посещать города, чтобы общее
пройденное расстояние было минимальным.
Если несколько изменить формулировку задачи и не
требовать возвращения к исходному пункту, то получим
незамкнутую задачу коммивояжера. Если же не задан
386
и начальный пункт, то получаем полную аналогию с за-
дачей о выборе оптимальной последовательности обра-
ботки деталей. Впрочем, эти последние задачи без труда
сводятся к первоначальной, как будет показано далее.
в) Представление задачи коммивояжера в виде графа
Очень наглядно задачу коммивояжера можно пред-
ставить в виде графа G=(X, G), вершины которого со-
ответствуют городам, а дуги — дорогам, соединяющим
города между собой. Каждой дуге, соединяющей города
г, k, приписывается число dih, называемое длиной дуги
и равное расстоянию между городами i и k. Если из
каждого города имеется непосредственный путь в любой
другой город без захода в промежуточные города, то
каждые две вершины графа будут соединены дугами в
обоих направлениях. Получающийся при этом граф ока-
зывается полным.
В практических задачах полные графы встречаются
редко. Если граф не полный, то его можно считать пол-
ным, мысленно восстановив недостающие дуги и припи-
сав им длину d = oo. В таблице расстояний соответству-
ющие клетки удобно оставлять незаполненными.
Элементарный путь в графе, проходящий через все
вершины, называется гамильтоновым путем. Замкнутый
элементарный путь, т. е. элементарный контур, проходя-
щий через все вершины графа, называется гамильтоно-
вым контуром. Эти названия связаны с задачей Гамиль-
тона, которая будет рассмотрена позднее. Как видим,
задача коммивояжера сводится к нахождению кратчай-
шего гамильтонова контура или кратчайшего гамильто-
нова пути.
В дальнейшем основным видом задачи коммивояже-
ра будем считать замкнутый вариант, когда задана вер-
шина, в которой начинается и заканчивается маршрут
коммивояжера. Однако незамкнутые варианты легко
приводятся к замкнутым.
Пусть дан граф G=(X, U) и дана начальная точка
х0Е X, но не указана конечная точка. Заменим длины
всех дуг, заканчивающихся в х0, нулями. Тогда любой
гамильтонов контур будет содержать дугу нулевой дли-
ны, заканчивающуюся в xQ. Если найти кратчайший кон-
тур и исключить из него дугу нулевой длины, оканчива-
ющуюся в Хо, то получим кратчайший гамильтонов путь.
387
Если не указаны ни начальная, ни конечная верши-
ны графа, то вводим фиктивную вершину г, которая сое-
диняется дугами нулевой длины со всеми вершинами
графа в обоих направлениях. Эту вершину принимаем
за начальную и находим кратчайший гамильтонов кон-
тур. Исключив из него дугу нулевой длины, выходящую
из г, и дугу нулевой длины, заходящую в z, получим
кратчайший гамильтонов путь.
10-4. ПРИМЕРЫ ЗАДАЧ, СВОДЯЩИХСЯ К ЗАДАЧЕ
КОММИВОЯЖЕРА
а) Задача Гамильтона
На рис. 10-10 изображен додекаэдр, т. е. правильный много-
угольник с 12 пятиугольными гранями и 20 вершинами. Требуется,
двигаясь по ребрам додекаэдра, обойти все вершины, заходя в каж-
дую из них только один раз, и вернуться в исходную вершину.
Каждый такой путь, если он существует, называется гамильтоновым
Рис. 10-10. Додекаэдр.
циклом или гамильтоновым кон-
туром.
Для того, чтобы свести эту
задачу к задаче коммивояжера,
будем считать, что расстояние da
между двумя вершинами равно
единице, если вершины соединены
ребром, и равно бесконечности в
противоположном случае. По этим
данным можно составить таблицу
взаимных расстояний между вер-
шинами по типу табл. 10-5 и да-
лее решать получившуюся задачу
коммивояжера.
6) Транспортные задачи
Имеется огромное число задач, связанных с объездом ряда пунк-
тов и возвращением в исходный пункт: развозка почты, продуктов
питания и т. п. Аналогичный характер носят задачи соединения от-
дельных пунктов линиями электроснабжения, водопровода, газоснаб-
жения и т. п.
в) Оптимизация программирования для ЭВМ
При производстве сложных вычислений на ЭВМ приходится вы-
полнять различные операции, осуществляемые подпрограммами
Bi, ..., Вп. В машине заранее производится предварительное програм-
мирование, при котором устанавливается определенный порядок вы-
полнения операций. Однако при решении конкретных задач эти опе-
рации приходится выполнять в ином порядке.
388
В подобных случаях программирование сводится к введению ко-
манд условного перехода, нарушающих естественный ход выполне-
ния программы, так что за операцией Вг будет следовать не опера-
ция 5t+i, а некоторая другая операция Bk, как показано на рис. 10-11.
Каждая команда условного перехода требует затраты дополни-
тельного времени и усложняет как программирование, так и работу
ЭВМ. Поэтому целесообразно так составить предварительную про-
грамму, чтобы при решении заданного набора задач использовать
минимальное количество команд условного перехода.
Рис. 10-11. Введение команд услов- в ВъВ±+1... Bj ... Вк...Вп
ного перехода. । а
Пусть имеется набор из W задач, предназначенных для решения
на ЭВМ в данных конкретных условиях. Обозначим через ph веро-
ятность (частоту) решения &-й задачи. Введем также числа
I, если в k-и задаче за операцией Bj
следует операция
(10-19)
.0, в противном случае.
При этом величина
= S Pka\T< i = К п
k=l
(10-20)
будет численно выражать математическое ожидание того, что в рас-
смотренных условиях за операцией Вг будет следовать операция Bj.
Величину можно условно принять за расстояние между опера-
циями Вг и В}, а сами операции рассматривать как вершины графа.
Тогда оптимизация программы, минимизирующая среднее число ко-
манд условного перехода, сведется к нахождению кратчайшего га-
мильтонова пути в полученном графе. В соответствии с последова-
тельностью операций на этом пути и следует осуществлять предвари-
тельное программирование.
г} Определение оптимальной последовательности
обработки деталей на двух станках
Вернемся к рассмотренной выше задаче об обработке п деталей
на двух станках. Обозначим через ан и Ьь время обработки k-й де-
тали на первом и втором станках соответственно. Требуется найти
такую последовательность обработки деталей, при которой общее
время обработки всех деталей будет наименьшим.
Отметим, прежде всего, особенности работы каждого из станков.
Ясно, что первый станок может начать обрабатывать следующую де-
таль сразу же, как только закончит обработку предыдущей и про-
стоев у него не будет. Иначе обстоит дело со вторым станком. Он
может начать обработку очередной детали только в том случае, если
I) закончилась обработка этой детали на первом станке;
2) закончилась обработка предыдущей детали на втором^станке.
Рассмотрим в начале простейший случай обработки всего двух
деталей.
389
Если сначала обрабатывается первая деталь, то момент оконча-
ния ее обработки на первом станке будет аь Моменты ai + bi и ai +
+ а2 соответствуют окончанию обработки первой детали на втором
станке и второй детали на первом станке. Вторую деталь на втором
станке можно начать обрабатывать, когда обе эти операции закон-
чены, т. е. в момент
max (ах + 6Х, ах + а2) = ах + max (а2, b±).
Обработка обеих деталей закончится в момент
tf — ar + max (а2, + 62. (10-21)
Аналогично, если сначала обрабатывается вторая деталь, то мо-
мент окончания обработки обеих деталей будет равен
t" = а2 + max (alt b2) + Ьг. (10-22)
Обработку выгодней начинать с первой детали, если т. е.
«ели
ах + max (а2, Ьх) + b2 < а2 + max (ах, Ь2) + 6Х. (10-23)
Легко видеть справедливость соотношений
ах + b2 — max (ах, b2) + min (ах, &2);
а2 + &х = max (а2, bx) -f- min (а2, bx),
с учетом которых (10-23) запишется в виде
min (ох, b2) < min (а2, Ьх). (10-24)
Это и есть условие, когда обработку выгодней начинать с первой
детали.
Рассмотрение случая п деталей более сложно, но можно пока-
зать, что из двух деталей i и / раньше нужно начинать обработку
детали i, если выполняется условие
min (at, bj) < min (aj, bi). (10-25)
Если теперь поставить в соответствие каждой детали вершину
графа и считать, что расстояние dtj между вершинами i и / равно
единице, если выполняется условие (10-25) и равно бесконечности в
противном случае, то приходим к матрице расстояний, определяющей
соответствующую задачу коммивояжера. Кратчайший гамильтонов
путь, определяемый этой матрицей и дает оптимальную последова-
тельность обработки деталей.
10-5. МЕТОДЫ РЕШЕНИЯ ЗАДАМИ КОММИВОЯЖЕРА
а) Применение метода Монте-Карло
Методами Монте-Карло называют любую статисти-
ческую процедуру, включающую в себя приемы стати-
стической выборки. Не останавливаясь на общих идеях
метода Монте-Карло, рассмотрим его применение к ре-
шению задачи коммивояжера.
Вершину 1 принимают за начальную и закладывают
в урну жетоны с номерами от 2 до п, Тщательно пере-
390
мешав жетоны, вытаскивают их по одному и записыва-
ют номера, например, 1’2, ...» in- При этом получают га-
мильтонов контур 1, 1*2, in, 1. Подсчитывают длину
этого контура и запоминают ее. После этого процедуру
повторяют, и если новый маршрут окажется хуже, его
тотчас забывают, а если он оказывается лучше, то забы-
вают предыдущий, а новый запоминают. Проводя такую
процедуру многократно, можно с высокой степенью ве-
роятности рассчитывать на то, что удастся найти если и
не наилучший, то достаточно хороший маршрут.
Для проведения таких испытаний обычно используют
ЭВМ, снабженные датчиками случайных чисел, что поз-
воляет за короткое время просмотреть значительное
число маршрутов.
6} Сведение к задаче целочисленного линейного
программирования
В графе G=(X, [/), соответствующем задаче комми-
вояжера, рассмотрим некоторый гамильтонов контур 1,
/г, ..., in, 1. Совокупность дуг, входящих в гамильтонов
контур, можно описать в виде матрицы
У11---У1п
-Уп1'"Уп.П -
(10-26)
в которой
(1, если дуга (г,/) входит в рассматриваеый контура
(0 в противоположном случае. (10-27)
Так как каждая вершина встречается в Гамильтоном
контуре один и только один раз, то в каждую вершину
обязательно входит и из каждой вершины обязательно
выходит одна и только одна дуга. Это означает, что в
матрице (10-26) в каждой строке и в каждом столбце
должна стоять одна и только одна единица, что мате-
матически запишется в виде
п п
2^ = 1; (1°-28>
i=l /=1
391
С учетом (10-28) условие, чтобы все yij были равны
О или 1, можно заменить требованием, чтобы все бы-
ли неотрицательными целыми числами:
i,/'=l,n; (10-29)
Е(Уи) = уи, (Ю-ЗО)
где E(yij) означает операцию взятия целой части чис-
ла уц.
Рис. 10-12. Образование двух
несвязанных контуров.
Как видим, любой гамильтонов контур может быть
описан матрицей (10-26), элементы которой уц удовлет-
воряют соотношениям (10-28) — (10-30). Длина гамиль-
тонова контура, равная сумме длин составляющих его
дуг, найдется так:
п п
Нахождение гамильтонова контура минимальной
длины сводится, таким образом, к нахождению значений
переменных / = 1, л, удовлетворяющих линейным
уравнениям и неравенствам (10-28) и (10-29), условию
целочисленности (10-30) и обращающих в минимум ли-
нейную форму (10-31), т.е. к решению задачи целочис-
ленного линейного программирования.
Следует, однако, учесть, что условия (10-28) —
(10-30), означающие, что в каждую вершину входит и
из каждой вершины выходит только одна дуга, не обяза-
тельно определяют гамильтонов контур. Этим условиям
будет отвечать и контур, проходящий не через все вер-
шины, если в оставшихся вершинах образуются петли.
Это соответствует обращению в единицу некоторых эле-
ментов матрицы (10-26), стоящих на главной диагонали,
и может быть исключено наложением на у^ добавочных
ограничений вида
уи = 0 при' i = /, / = 1,м. (10-32)
392
Возможны также случаи, когда получается не один
гамильтонов контур, а два или более замкнутых конту-
ра, каждый из которых охватывает только часть вер-
шин, как показано, например, на рис. 10-12 для и=7.
Если получилось именно такое решение, то вводят доба-
вочное ограничение вида
У12 + Узз + Уз? + У?1 < 3,
запрещающее возникновение контура (/, 2, 3, 7, /) и ре-
шают задачу заново совместно с этим ограничением.
в) Метод ветвей и границ
Пусть U — множество вариантов решения некоторой
задачи. Если эти варианты перенумеровать от 1 до пг,
то под U можно понимать множество номеров вариан-
тов решения, т. е. положить [7 = {1, т}.
Обозначим через qt значение некоторого параметра,
характеризующего качество решения в f-м варианте. Оп-
тимальным решением будет такое, которое дает мини-
мальное значение q* критерию качества:
= min qt,
(10-33)
являющееся точной нижней границей для множества
{?ь •••, Цт} •
Введем понятие оценки снизу для множества [/, под
которым будем понимать такое значение q = q, которое
удовлетворяет соотношениям
q <?* или q<iq\ (10-34)
Если в соотношении (10-34) стоит знак нестрогого
л
неравенства то оценку q будем называть достижи-
мо it.
Метод ветвей и границ состоит в последовательном
л
улучшении оценки q и приближении ее к значению
Предположим, что мы имеем возможность получить
оценку снизу как для всего множества U, так и для его
различных подмножеств.
25-142
393
Разобьем множество U на два подмножества Я и Вс
точными нижними границами критерия качества q*A и
qB, связанными с q* очевидным соотношением
<7* = min (<?* ,<?*). (10-35)
Поскольку множества А и В имеют меньшее число
элементов, чем множество [/, то имеется возможность
Л Л
получить оценки qAi qe, более близкие к значениям qA,
qB, чем в первоначальном множестве [/, что означает,
Л Л
что оценка min (qA) qe) будет более близка к q*, чем
д
оценка q.
Имеется также большая вероятность того, что опти-
мальный вариант, т. е. вариант с наименьшим значением
q = q*, окажется среди того из подмножеств А и В, кото-
рое имеет меньшую оценку снизу. Эта вероятность бу-
дет тем больше, чем больше отличаются друг от друга
Л Л
оценки qA и qB, поэтому разбиение множества U на под-
множества А и В желательно производить так, чтобы
оценки снизу для этих подмножеств отличались возмож-
но больше.
Если оказалось, что qB<qA, то есть основания подо-
Рис. 10-13. Построение де-
рева разбиений.
зревать, что оптимальный ва-
риант входит в множество В и
это множество надо исследо-
вать детальней. Для этого раз-
биваем его в свою очередь на
два подмножества С и D так,
Л Л
чтобы оценки qc и qB разли-
чались возможно больше. Ес-
Л
ли оказалось, что qD<qc, то
подобному же разбиению под-
вергаем множество D и т. д.,
до тех пор, пока не придем к
подмножеству, состоящему
всего из одного элемената со
значением параметра ?=?о-
Всю процедуру разбиения
удобно представить в виде де-
рева разбиений, приведенного
на рис. 10-13.
394
Однако найденный элемент со значением q=qo мо-
жет лишь подозреваться как оптимальный. Необходимо
проверить, нет ли среди нерассмотренных множеств Д,
С и т. д. элемента со значением q<qo. При этом множе-
л
ства, у которых могут не рассматриваться, по-
скольку элемента с q<qo в них быть не может.
Разбиение вышеуказанных множеств или приведет к
элементу с q<qv, тогда этот элемент и должен быть при-
нят за оптимальный, или приведет к оценкам снизу
л
q>qo. В этом случае элемент со значением параметра
qQ и будет искомым вариантом решения задачи,
г) Применение метода ветвей и границ к решению
задачи коммивояжера
Будем считать, что задача коммивояжера задана в
виде матрицы расстояний по типу табл. 10-5. Для кон-
кретности зададимся численными значениями расстоя-
ний, приводимыми в табл. 10-6, а.
Для получения оценки снизу длин множества всех
гамильтоновых контуров воспользуемся тем, что в каж-
дый гамильтонов контур входит только по одному эле-
менту из каждой строки и из каждого столбца матрицы
расстояний. Поэтому если элементы любой строки или
любого столбца уменьшить на какое-либо число, то на
это же число уменьшатся длины всех гамильтоновых
контуров. На этом свойстве основан метод приведения
матрицы расстояний.
Приведение матрицы может производиться по стро-
кам и по столбцам. Приведение матрицы расстояний по
строкам заключается в том, что из элементов каждой
строки i вычитается наименьший элемент этой строки,
обозначаемый hi. При этом длины всех гамильтоновых
контуров уменьшатся на сумму вычтенных из каждой
строки чисел, т-. е. на величину 2^г, оставаясь в то же
i
время неотрицательными. Поэтому величина рав-
i
ная в рассматриваемом примере 7, дает некоторую оцен-
ку снизу длин всех гамильтоновых контуров. Получен-
ная оценка может быть улучшена путем повторного при-
ведения матрицы расстояний по столбцам. При этом из
элементов каждого столбца j приведенной по строкам
25!
395
Таблица 10-6
Преобразование таблицы расстояний в задаче коммивояжера
а) Исходная таблица б) Приведенная исходная таблица
/ Л. /
i 1 2 3 4 5 i , 1 1 1 2 1 1 3 1 4 5
1 X 7 7 2 4 2 1 X 5 4 0 2
2 6 X 2 4 1 1 2 5 X 0 3 0
3 6 1 X 9 2 1 3 5 0 X 8 1
4 2 3 8 X 5 2 4 0 1 5 X 3
5 6 1 2 5 X 1 5 5 0 0 4 X
в) Таблица для множества г) Приведенная таблица
[(4, 1)] _______ для множества [(4, 1)]
i / /
2 3 1 4 i 5 2 3 1 1 4 5
1 5 4 X 2 1 3 2 X 0
2 X 0 3 0 2 X 0 0 0
3 0 X 8 1 3 0 X 5 1
5 0 0 4 X 5 0 0 . 1 X
д) Таблица для множества
[(4, 1), (1,5)]
i 2 / 3 4
2 X 0 0
3 0 X 5
5 0 0 X
396
матрицы расстояний вычитается наименьший элемент
этого столбца, обозначаемый gj. Сумма вычтенных при
этом чисел 2^=1* Уточненная оценка снизу длин га-
/
мильтоновых контуров
q = 7 + 1 =
/ /
Получаемая после приведения матрица расстояний
дана в виде табл. 10-6,6.
Метод приведения матрицы расстояний будем приме-
нять и далее для получения оценок снизу различных
подмножеств множества гамильтоновых контуров.
Рассмотрим теперь способ разбиения множества га-
мильтоновых контуров на подмножества. Возьмем неко-
торую дугу (/, /). К первому подмножеству отнесем все
гамильтоновы контуры, в которые эта дуга входит. Обо-
значим это множество [(/, /)]. Ко второму множеству
отнесем все гамильтоновы контуры, в которые дуга (г,
/) не входит. Это множество обозначим [(г, /)].
Таблицу расстояний для множества [(/, /)] легко по-
лучить, если учесть, что включение дуги (/, /) в гамиль-
тонов контур исключает возможность включения других
дуг, стоящих в r-й строке или /-м столбце. Следователь-
но, таблица расстояний для множества [(i, /)] получа-
ется из первоначальной таблицы вычеркиванием i-й
строки и /-го столбца.
Для того чтобы получить таблицу расстояний для
множества [(г, /)], следует в первоначальной таблице
запретить движение по дуге (г, /), положив ее длину рав-
ной бесконечности. Этот запрет движения по дуге (г, /)
будем отмечать крестом в соответствующей клетке пер-
воначальной таблицы.
Теперь возникает вопрос: какую дугу положить в ос-
нову разбиения множества маршрутов на подмножест-
ва? Заметим, прежде всего, что по количеству элемен-
тов множества [(/, /)] и [ (/, /)] не одинаковы. Общее
число гамильтоновых контуров в задаче с п городами
равно (л—1)1. Если мы зафиксировали дугу (Z, /), т. е.
уже выбрали две вершины, то имеется п—2 способа вы-
брать третью, п—3 способа — четвертую и т.д. Следова-
тельно, имеется (л—2)! гамильтоновых контуров,
включающих дугу (/, /), а значит, (л—1) I — (л—2) ! =
397
*=(п—2) (n—2)! гамильтоновых контуров, не вклю-
чающих дугу (i, /). Поэтому при п>2 множество
[(i, /)] будет содержать большее число элементов, чем
множество [(i, /) ]. А поскольку множество с меньшим
числом элементов исследовать проще, то в качестве ду-
ги (i, /) следует брать такую, при которой множество
[(t, /)] имеет меньшую оценку, чем множество
[(», /)]. Из множества дуг, удовлетворяющих этому ус-
ловию, следует отдать предпочтение той, которая дает
наибольшую разницу в оценках для множеств [(i, /)] и
[О'. /)]•
Если в качестве дуги (i, /) взять такую, у которой в
приведенной таблице di,j=#O, то для группы [(i, /)]
оценка снизу возрастает на di,,, поскольку заранее изве-
стно, что эта дуга войдет во все гамильтоновы контуры.
Она может еще возрасти, если таблица при вычеркива-
нии i-й строки и /-го столбца будет допускать дальней-
шее приведение. В то же время при замене элемента
di,j на бесконечность таблица расстояний останется при-
веденной, т.е. оценка снизу для [(i, /)] не возрастет.
Следовательно, меньшее значение оценки снизу будет
для множества [ (i, /) ], что нежелательно. Поэтому в ка-
честве дуги (г, /) надо брать такую, у которой в приве-
денной таблице расстояний величина d,j=0.
Но таких дуг несколько. Какую же из них выбрать?
Очевидно, ту, для которой увеличение оценки для мно-
жества [(/, /)] будет наибольшим, так как при этом по-
лучится наибольшая разница в оценках для множеств
[(»,/)] и [(7j)]- ____
Обозначим увеличение оценки множества [ (£, /)] че-
рез Д(г, /). Значение этой величины получаем путем сло-
жения наименьших чисел в t-й строке и /-м столбце.
Обратимся вновь к рассматриваемому примеру. Для
табл. 10-6,6 значения A(i, /) получаются равными:
Д (1,4) = 2 + 3 = 5, Д(2,3) = 0, Д(2,5)=1,
Д(3,2)=1, Д(4,1) = 6, Д(5,2) = 0, Д(5,3) = 0.
Наибольшее увеличение оценки для группы [(j, j)]
получается для дуги (4, 1). Исключая четвертую строку
и первый столбец из приведенной матрицы, приходим к
398
табл. 10-6, в, представляющей собой таблицу расстояний
для множества [(4, 1)].
При получении подобных матриц нужно строго сле-
дить за тем, чтобы не могло получиться контуров, не
являющихся гамильтоновыми. Поскольку дуга (4, 1)
уже введена в намечаемый гамильтонов контур, то в
табл. 10-6,в нужно наложить запрет на дугу (1, 4), от-
метив клеточку (1, 4) крестом, так как дуга (1, 4) сов-
местно с дугой (4, 1) образует контур. В табл. 10-6, г
Рис. 10-14. Дерево разбиений в задаче коммивояжера.
дана приведенная таблица расстояний с увеличением
оценки Д<?=24-3=5.
Для табл. 10-6, г величины Д(/, /) равны
Д(1,5) = 2, Д(2,3) = 0, Д(2,4) = 1, Д(2,5) = 0,
Д(3,2)=1, Д(5,2) = 0, Д(5,3) = 0.
Наибольшее увеличение оценки для группы [(г, /)]
получается для дуги (1, 5), которую также вводим в на-
мечаемый гамильтонов контур, получая цепочку (4, 1,
5). Исключая первую строку и пятый столбец из матри-
цы табл. 10-6, г, приходим к табл. 10-6, д для множества
[(4, 1) (1, 5)], в которой необходимо наложить запрет
на дугу (5, 4), образующую контур с участком (4, 1, 5).
Полученная таблица является приведенной. Поэтому
для нее сразу же находим значения Д(г, /):
Д(2,3) = 0, Д(2,4) = 5, Д(3,2) = 5, Д(5,2) = 0,
Д (5,3) = 0.
399
Как видим, наибольшие значения A(t, /) получились
равными для дуг (2, 4) и (3, 2). Поэтому обе эти дуги
можно отнести к намечаемому гамильтонову контуру,
получая, таким образом, последовательность дуг (3/2),
(2, 4), (4, 1), (1, 5), для замыкания которой не хватает
лишь дуги (5,3). Добавляя эту дугу, получаем предпола-
гаемый оптимальный гамильтонов контур (3, 2, 4, 1, 5,
3) длиной 13.
Анализируя нерассмотренные ранее подмножества
[(4, 1)], [(4, 1), (ТГ5)], [(4, 1), (1, 5), (2Л)], убежда-
емся, что их оценки снизу больше, чем 13, так что эти
подмножества не могут содержать гамильтоновы конту-
ры, короче найденного. Следовательно, дальнейшая про-
верка не нужна и полученный гамильтонов контур явля-
ется оптимальным.
На-рис. 10-14 приведено дерево разбиений, строяще-
еся по ходу решения задачи.
Более подробные сведения о методах решения ком-
бинаторных задач содержатся в [65, 69, 70].
10-6. ЗАДАЧИ МАССОВОГО ОБСЛУЖИВАНИЯ
а) Основные понятия. Терминология
Задачи массового обслуживания возникают в тех
случаях, когда требования на выполняемые работы по-
ступают в случайные моменты времени, а выполнение
этих работ, называемое обслуживанием, осуществляется
одним или несколькими обслуживающими устройствами
(приборами). Длительность выполнения отдельных тре-
бований предполагается случайной. На рис. 10-15 при-
ведена общая структура системы массового обслужива-
ния с тремя обслуживающими приборами.
Устройство, способное в любой момент времени об-
служивать лишь одно требование, называется каналом
обслуживания. При наличии нескольких каналов, спо-
собных одновременно обслужить ряд требований, гово-
рят о многоканальной системе. Все каналы или часть их
могут выполнять один и тот же или разные виды обслу-
живания.
Характерной особенностью задач массового обслу-
живания является возникновение несоответствия между
скоростью поступления требований и скоростью обслу-
живания, в результате чего или оказываются простаива-
400
ющими обслуживаемые приборы или образуется очередь
на обслуживание. С подобными ситуациями приходится
сталкиваться постоянно: люди стоят в очередях у касс
и прилавков, подлежащее ремонту оборудование скап-
ливается в ожидании ремонтных бригад, самолеты ждут,
когда освободится взлетная полоса. Поэтому принципи-
Обслуживающие устройства
Поступающие
требования
О О ......~Q
Рис. 10-15. Модель системы массового обслуживания.
альный интерес представляют следующие характеристи-
ки системы массового обслуживания:
1) длина очереди в различные моменты времени;
2) общая продолжительность нахождения требова-
ния в системе обслуживания (ожидание в очереди и са-
мообслуживание);
3) доля времени, в течение которого обслуживаю-
щие приборы были незаняты.
Для получения математической модели системы мас-
сового обслуживания необходимо иметь:
1) описание входящего потока требований;
2) описание способа, каким выполняется обслужива-
ние;
3) описание дисциплины очереди, т. е. указание того,
каким образом требования поступают из очереди на об-
служивание: живая очередь (первым пришел — первым
обслужен), обслуживание по степени срочности, по ка-
кой-то шкале приоритетов и т. п.
При исследовании систем массового обслуживания
входящий поток требований обычно считают пауссонов-
ским (см. § 4-6), характеризующимся интенсивностью А.
Это означает, что требования поступают в случайные
моменты времени, причем вероятность появления одно-
го требования в интервале от t до /+Д/ равна АД/ и не
зависит от /, а вероятность появления в этом интервале
401
двух и более требований пренебрежимо мала. Такие
предположения являются достаточно обоснованными
для многих практических случаев.
Длительности обслуживания отдельных требований
предполагаем случайными с экспоненциальным законом
распределения и средним временем обслуживания 1/ц,
где ц— интенсивность обслуживания. Это означает, что
вероятность окончания обслуживания очередного требо-
вания в интервале от t до Z-j-Д/ не зависит от t и равна
цАЛ Такое распределение вероятностей обслуживания
не всегда хорошо отражает работу реальных приборов
обслуживания и основным мотивом в пользу его приме-
нения является упрощение математической стороны ис-
следования.
Будем также предполагать, что обслуживание про-
изводится в порядке поступления требований.
б) Дифференциальные уравнения системы массового
обслуживания
Обозначим через S, состояние системы массового об-
служивания, означающее наличие очереди из i требо-
ваний (1=0, 1, ...,), а через pi(f) вероятность того, что
система находится в состоянии S, в момент t. Найдем
изменение этой вероятности Api(Z) за малый интервал
А/, непосредственно следующий за моментом t. Обозна-
чим также через и ц., интенсивность потока требова-
ний и интенсивность обслуживания системой в состоя-
нии Si, считая, что в общем случае эти интенсивности за-
висят от длины очереди.
Рассмотрим большое число N идентичных систем
массового обслуживания. Из них Pi-i(t) N будут в мо-
мент t находиться в состоянии Si_lt pi(t) N— в состоя-
нии Si, Pi+i(t) N — в состоянии Si+i. Рассмотрим изме-
нение количества систем &Pi(t)N, находящихся в состоя-
нии Si за интервал времени от i до <+А/.
Поскольку при пауссоновском потоке требований и
экспоненциальном обслуживании за малое время А/ ни
на одну из систем не может поступить более одного тре-
бования и ни одна из систем не может закончить обслу-
живание более одного требования, то состояние каждой
из систем не может измениться более чем на единицу.
Поскольку вероятности поступления нового требования
и окончания обслуживания очередного требования в ин-
402
тервале At равны ХД/ и |лД/ соответственно, то за время
Д/ на N систем, находящихся в состоянии St,
поступят новые требования, переводя их в состояние
Si+i, и nAtpi(t)N систем закончат обслуживание оче-
редного требования и перейдут в состояние 5,-1. Кроме
того, Xi-iktpi-i(t)N систем, находящихся в состоянии
Si-t, перейдут в состояние Si, получив добавочное тре-
бование, и р,£+1Д/р<+1 (/) W систем, находящихся в состоя-
нии Si+i, перейдут в состояние S,-, закончив обслужива-
ние очередного требования. Изменение за время Д/ об-
щего числа систем &pi(t)N, находящихся в состоянии S*,
Дрг (О N =—It Mpt (О N — Д/рг (О N +
+ 1 l^tpi—x (t) N -|- p,4-i Д/р/4-i (/) N,
Поделив это уравнение на Д/ и перейдя к пределу
при Д/—>0, получим:
М =- (1. + Ц.) р. (0 + Ь_! pt_! (() + pi+l (0.
at
(10-36)
Это уравнение неприменимо при 7=0, так как в этом
случае требования не могут покидать систему и теряет
смысл вероятность pi-i{t). Поэтому данный случай сле-
дует рассмотреть особо. Поскольку при i=0 система
может изменить состояние So на Si только за счет по-
ступления нового требования, а состояние Si на So — за
счет окончания обслуживания единственного требования,
то
=-ЬоРо(0 + 1ЧР1(0. (10-37)
at
Уравнения (10-36), (10-37) обычно называют уравне-
ниями «размножения и гибели», имея в виду использо-
вание этих уравнений для изучения изменения числен-
ности популяции в биологии. В задачах массового об-
служивания эти уравнения позволяют при заданных
начальных условиях и известных интенсивностях и цг
определить изменение характера обслуживания во вре-
мени. Однако решение их для практически важных слу-
чаев связано с чрезвычайно большими трудностями.
Обычно значительный интерес представляет не пере-
ходный процесс, а стационарное состояние системы об-
служивания, называемое также статистическим равнове-
сием. В этом состоянии вероятности pi(t) не меняются
403
со временем, так что можно положить dpi(t)ldt=Q и за-
писать уравнения системы массового обслуживания в
виде
Ро Hi Pi > |(10-38)
(Хг -}- рг) р, = Хг-i р^_1 -|- p(4.i pi+i, i = 1,2.. J
Полагая во втором уравнении i=l, 2... и вычитая из
каждого уравнения предыдущее, приходим к следующей
системе уравнений для стационарного режима:
Ро = Нх Ръ
^xpi = H2P2; (Ю-39)
Рг = н<+1 рж;
Решение этой системы уравнений имеет вид:
Рх = — Ро. Р2 = Ро,-, Pi = ЛоХ1'---г--1 Ро- (Ю-40)
R Н1Н2 Hi Иг-- Hi
Естественно, что найденный стационарный режим мо-
жет реально существовать, только если
00
= L (10-4!)
1=1
Рассмотрим применение соотношений (10-40), (10-41)
для описания некоторых часто встречающихся видов
систем массового обслуживания.
в) Система массового обслуживания с отказами
Рассмотрим систему массового обслуживания с п
одинаковыми каналами, на вход которой поступает по-
ток требований с интенсивностью Л. Если в момент по-
ступления очередного требования в системе имеется сво-
бодный канал, то требование попадает на обслуживание,
если свободного канала нет, то оно покидает систему
обслуживания. Такая ситуация возникает в тех случаях,
когда требования не могут образовывать очереди, как
например, в телефонии, где просто подается сигнал заня-
тости, в ремонтных мастерских, на вокзалах, где нет
времени на ожидание в очереди и т. п.
В подобных системах обслуживания под длиной оче-
реди i будем понимать число занятых каналов обслужи-
404
вания, так что интенсивность поступающих на обслужи-
вание требований
I X, если i < п,
(О, если i>n.
(10-42)
Обозначим через ц интенсивность обслуживания од-
ним каналом. Интенсивность обслуживания при I рабо-
тающих каналах
рг- = iu,, i — 1,п. (10-43)
Вероятность одновременной работы i каналов нахо-
дим по формулам (10-40)
(1<М4)
11 |Л I •
где параметр
р = Х/ц (10-45)
представляет собой приведенную интенсивность потока.
Вероятность простоя всех каналов р0 находится из соот-
ношения (10-41):
Ро =-----—](Ю-46)
1+ Р + — Р?Р"
Работу рассматриваемой системы обычно характери-
зуют вероятностью отказа рОтк и средним числом заня-
тых каналов k. Отказ от обслуживания происходит,
когда все каналы заняты. Вероятность этого
Ротк = рп= ~ Ро- (10-47)
Иногда вместо вероятности отказа пользуются поня-
тием пропускной способности системы, определяемой как
с=(1-РоТК)Ь- (Ю-48)
Среднее число занятых каналов
(1М9>
1=1 1=1
Пример 10-1. Имеется система массового обслуживания б отка-
зами при р=Х/|1=2,
405
Если используется три канала, то
Ро =--------р--------J---=0> 16.
i+p+ -у Р2+— Р8
Вероятность отказа
Ротк = Рз = /> Р3 Ро = 0,21.
о
Среднее число занятых каналов
к = рй (р + р2 + -у Р8^ = 1.58.
Если использовать только два канала, то
Ротк = Рг = 6,4; k - 1,2.
г) Одноканальная система обслуживания с ожиданием
В рассматриваемом случае имеется один канал об-
служивания, на который поступает поток требований с
интенсивностью Л. Интенсивность обслуживания равна
р. Выражение для вероятностей pi получим из (10-40),
положив Хг=Х, р.г = ц и введя параметр р=1/р:
Рг = р‘Ро> i=l>2... (10-50)
Значение Ро найдем из соотношения (10-41), которое
в рассматриваемом случае примет вид:
Ро(1 + Р + Р2+ Р3 +...)= 1
и имеет смысл только при р<1. Используя формулу
суммы бесконечно убывающей геометрической прогрес-
сии, получаем:
р0=1-р. (10-51)
С учетом (10-51) выражения для pi принимают вид:
р. = (1— р)р£, i = 0,1,2... (10-52)
Основными характеристиками в системе являются
средняя длина очереди и среднее время ожидания обслу-
живания.
Среднее число требований, находящихся в системе
обслуживания,
k = (Pi + 2р2 + Зр3 + ...) = (1 — р)(р + 2р2 + Зр3...).
Учитывая, что [20]
р+2р‘ + Зр’+..._7г-Ь-,
406
находим:
k = . (10-53)
1 — Р
Можно также найти среднее число заявок ka, прохо-
дящих обслуживание. Поскольку число заявок, находя-
щихся на обслуживании,.равно нулю, если канал свобо-
ден, и единице во всех остальных случаях, то
К = О-Ро+ Ь(Р1 + Ра + •••)= 1 — Ро = Р- (Ю-54)
Разность между k и Ъ» дает среднюю длину очереди
--------------------------p=_pL. (Ю-55)
1—р-----------------------1—р
Учитывая, что среднее время обслуживания одной
заявки равно 1/ц, для среднего времени ожидания об-
служивания получаем выражение
= Ш (10-35)
д) Многоканальная система обслуживания с ожиданием
Если в системе обслуживания имеется п каналов, на
которые поступает поток требований с интенсивностью
А, а интенсивность обслуживания по одному каналу рав-
на ц, то
Х, = Х, i = 0,1,2,,.; (10-57)
(фПр11<<Я; (10 58)
(пц при i > п.
Как увидим далее, система сохраняет работоспособ-
ность, если В этом случае для pi получаем
выражение
р =------------= Z р i^n- (10-59)
рХ2цХ...Х(-Ц i! ™ v
=__________V________ = X =
1 рХ2рХ ...XnpX(/ip)t~n ° и. р/2/г1—л р1—п 0
= —- Ро = -^ГТ Ро> 1 > п‘ (1°-4 5°)
П\ IV1 п) п\ nL—n
При найденных значениях Pi соотношение (10-41)
принимает вид:
41+p+t+-+t£^+v(1+f+£+)]=
= 1.
407
Учитывая, что
1 + — 4- + ...= -——— = —— ,
п п? 1 — р/n п — р
получаем:
-------ё*----------------------------------• (1°'61)
1 + р+2! + ‘" + (п— 1)! (п — 1)! (п — р'
Основные параметры системы обслуживания легко
находятся с помощью рассмотренной ранее методики
[66]:
k' = = \.....<10*62)
пп\ (1 — р/п)2 (п — 1)! (п — р)3
ks = p; (10-63)
k = k' + р; (10-64)
tOm —k/рп. (10-65)
Рассмотренные примеры определения основных ха-
рактеристик систем массового обслуживания, конечно,
не могут охватить всего многообразия встречающихся
на практике случаев и имеют целью показать лишь об-
щий подход к анализу подобных систем. Более деталь-
ное рассмотрение различных видов систем массового
обслуживания можно найти в [21, 35, 36, 66, 71].
е] Статистическое моделирование систем массового
обслуживания
Аналитические методы могут оказать существенную
пользу лишь при рассмотрении сравнительно простых
систем массового обслуживания. Поэтому при анализе
реальных систем, особенно в случаях, когда характер
входящего потока требований и времени обслуживания
подчиняется иным законам распределения, чем рассмот-
ренные, приходится прибегать к статистическому моде-
лированию процесса массового обслуживания.
В основе статистического моделирования лежит ими-
тация процесса массового обслуживания, при которой
моменты поступления требований и длительности обслу-
живания получаются по таблицам случайных чисел или
от специальных датчиков случайных чисел с помощью
ЭВМ.
408
Поскольку как датчики, так и таблицы случайных
чисел имеются лишь для некоторых наиболее распрост-
раненных видов функций распределения вероятностей, то
для получения случайных чисел с произвольной функци-
ей распределения вероятностей используют специальные
методы получения случайной выборки. Рассмотрим эти
методы применительно к использованию таблицы слу-
чайных чисел с равномерным распределением вероятно-
стей, приведенной в [61].
Пусть х — случайная величина с плотностью распре-
деления вероятностей w(x) и с функцией распределения
вероятностей F(x), связанной с w(x) соотношением
w(x)dx=dF(х). Пусть далее y=F(x)—случайная ве-
личина с равномерным распределением вероятностей от
О до 1, т. е. с плотностью распределения вероятностей
p(z/) = l, У^ [0, 1]. Тогда вероятность того, что случай-
ная величина х с плотностью распределения вероятно-
стей ау(х) попадает на интервал от х до x-|-dx равна:
w(x)dx=dF(х) =dy = p(y)dy, т. е. равна вероятности
того, что случайная величина у с равномерным распре-
делением вероятностей от 0 до 1 попадает на интервал
от y=F(x) до y-\-dy, что проиллюстрировано на рис.
10-16.
Отсюда следует порядок получения случайной выбор-
ки с заданной плотностью распределения w(x):
1. Для данной плотности распределения w(x) строит-
ся график или находится аналитическое выражение
функции распределения вероятностей у = /?(х).
2. По таблице случайных чисел с равномерным рас-
пределением вероятностей от 0 до 1 находится выборка
случайных чисел величины у.
3. Для каждого числа из выборки значений у по за-
висимости y=F(x) находится соответствующее значе-
ние х. Совокупность полученных значений х дает слу-
чайную выборку с плотностью распределения вероятно-
стей &у(х).
Существо метода статистического моделирования сис-
темы массового обслуживания рассмотрим на приме-
ре [21].
Пример 10-2. На систему массового обслуживания поступает
регулярный поток требований с интервалом 2 мин. Время обслужи-
вания имеет экспоненциальный характер с плотностью распределения
вероятностей т) , Х = 0,75, для которого функция рас-
пределения вероятностей, изображенная на рис. 10-17, равна 7?(т) =
= 1—.
26—142 409
Имитация работы системы массового обслуживания приведена
в виде табл. 10-7. Время обслуживания т получено по описанной ме-
тодике для г/=^(т) в соответствии с графиком на рис. 10-17. Из таб-
лицы непосредственно видно время ожидания для каждого из тре-
бований, поступивших на обслуживание.
Рис. 10-16. Получение слу-
чайной выборки с заданной
функцией распределения.
Рис. 10-17. Определение
времени обслуживания
при экспоненциальном
распределении.
Таблица 10-7
Имитация процесса массового обслуживания
Номера требова- ний Момент поступле- ния t Выборка из равномерного распределе- ния у Время обслужи- вания т Момент окончания обслуживания Время ожидания
1 2 0,41 0,7 2,7 0
2 4 0,49 0,9 4,9 0
3 6 0,77 1,9 7,9 0
4 8 0,13 0,2 8,2 0
5 10 0,77 1,9 11,9 0
6 12 0,99 4,3 16,3 0
7 14 0,91 3,0 19,3 2,3
8 16 0,65 1,4 20,7 3,3
9 18 0,17 0,23 20,9 2,7
10 20 0,59 1,2 22,1 0,93
СПИСОК ЛИТЕРАТУРЫ
1. Винер Н. Кибернетика. — М.: Советское радио, 1968.
2. Философия естествознания. — М.: Изд-во АН СССР, 1966,
вып. 1.
3. Бир С. Кибернетика и управление производством. — М.: Физ-
матгиз, 1960.
4. Эшби У. Р. Введение в кибернетику. — М.: Изд-во иностр,
лит., 1959.
5. Кузин Л. Т. Основы кибернетики. — М.: Энергия, 1973.
6. Моисеев Н. И. Математика--управление — экономика. — М.:
Знание, 1970.
7. Камени Д., Снелл Д., Томпсон Д. Введение в конечную мате-
матику.— М.: Изд-во иностр, лит., 1963.
8. Шиханович Ю. А. Введение в современную математику. — М.:
Наука, 1965.
9. Клини С. К. Введение в математику. — М.: Изд-во иностр,
лит., 1957.
10. Карр Ч., Хоув Ч. Количественные методы принятия решений
в управлении и экономике. — М.: Мир, 1966.
11. Феликс Л. Элементарная математика в современном изложе-
нии.— М.: Просвещение, 1967.
12. Берж К. Теория графов и ее применение. — М.: Изд-во
иностр, лит., 1962.
13. Оре О. Теория графов. — М.: Наука, 1968.
14. Оре О. Графы и их применение. — М.: Мир, 1965.
15. Форд Л. Р., Фалкерсон Л. Р. Потоки в сетях. — М.: Мир,
1966.
16. Колмогоров А. Н., Фомин С. В. Элементы теории функций
и функционального анализа. — М.: Наука, 1968.
17. Шрейдер Ю. А. Что такое расстояние? — М.: Физматгиз,
1963.
18. Бронштейн И. Н., Семендяев К. А. Справочник по матема-
тике.— М.: Наука, 1964.
19. Справочник по системотехнике/Под ред. Р. Макола. — М.:
Советское радио, 1970.
20. Рыжик И. М., Гродштейн И. С. Таблицы интегралов, сумм,
рядов и произведений. — М.-Л : Гостехиздат, 1951.
21. Тренер Д. Вероятность, статистика и исследование опера-
ций.— М.: Статистика, 1976.
22. Моисеев Н. Н. Численные методы в теории оптимальных си-
стем.— М.: Наука, 1971.
23. Вентцель Е. С. Теория вероятностей. — М.: Наука, 1964.
24. Янке Е., Эмде Ф., Леш Ф. Специальные функции. — М.: Нау-
ка, 1968.
26* 411
25. Уилкс С. Математическая статистика. — М.: Наука, 1967.
26. Смирнов Н. В., Дунин-Барковский И. В. Курс теории веро-
ятностей и математической статистики. — М.: Наука, 1965.
27. Гнеденко Б. В., Беляев Ю. К., Соловьев А. Д. Математиче-
ские методы в теории надежности. — М.: Наука, 1965.
28. Леман Э. Проверка статистических гипотез. — М.: Наука,
1964.
29. Прохоров Ю. В., Розанов Ю. А. Теория вероятностей. М.:
Наука, 1967.
30. Налимов В. В., Чернова Н. А. Статистические методы пла-
нирования экстремальных экспериментов. — М.: Наука, 1965.
31. Кулик В. Т. Принципы алгоритмизации и построения управ-
ляющих машин. Киев: Гостехиздат УССР, 1963.
32. Налимов В. В. Теория эксперимента. — М.: Наука, 1971.
33. Финни Д. Введение в теорию планирования эксперимента.
М.: Наука, 1970.
34. Основы автоматического управления/Под ред. В. С. Пугаче-
ва.— М.: Физматгиз, 1963.
35. Вентцель Е. С. Исследование операций. — М.: Советское
радио, 1972.
36. Черчмен У., Акоф Р., Арнов Л. Введение в исследование
операций. — М.: Наука, 1968.
37. Болтянский В. Г. Математика и оптимальное управление. —
М.: Знание, 1968.
38. Цыпкин Я. 3. Адаптация и обучение в автоматических сис-
темах.— М.: Наука, 1968.
39. Хедли Д. Нелинейное и динамическое программирование. М.:
Мир, 1967.
40. Математические модели и методы оптимального планирова-
ния: Труды Института математики СО АН СССР. — Новосибирск:
Наука, 1966.
41. Корбут А. А., Финкельштейн Ю. Ю. Дискретное программи-
рование.— М.: Наука, 1969.
42. Барсов А. С. Что такое линейное программирование. — М.:
Физматгиз, 1959.
43. Карпелевич Ф. И., Садовский Л. Е. Элементы линейной ал-
гебры и линейного программирования. — М.: Физматгиз, 1963.
44. Юдин Д. Б., Гольштейн Е. Г. Задачи и методы линейного
программирования. — М.: Советское радио, 1964.
45. Данциг Д. Линейное программирование, его применения и
обобщения. — М.: Прогресс, 1966.
46. Математика и кибернетика в экономике. Словарь-справоч-
ник.— М.: Экономика, 1975.
47. Ланкастер К. Математическая экономика. — М.: Советское
радио, 1972.
48. Юдин Д. Б. Математические методы управления в условиях
неполной информации. М : Советское радио, 1974.
49. Уайлд Д. Дж. Методы поиска экстремума. М.: Наука, 1967.
50. Первозванский А. А. Поиск. М.: Наука, 1970.
51. Эльсгольц Л. Э. Дифференциальные уравнения и вариацион-
ное исчисление. М.: Наука, 1965.
52. Понтрягин Л. С., Болтянский Р. В., Гамкрелидзе Р. В. Ма-
тематическая теория оптимальных процессов. — М.: Физматгиз, 1961.
53. Болтянский В. Г. Математические методы оптимального уп-
равления. М.: Наука, 1966.
412
54. Розоноэр Л. И. Принцип максимума Л. С. Понтрягина в тео-
рии оптимальных систем. — Автоматика и телемеханика. 1959. т. 20,
№ 10—12.
55. Беллман Р. Динамическое программирование. — М.: Изд-во
иностр, лит., 1960.
56. Беллман Р. Процессы регулирования с адаптацией. М.: Нау-
ка, 1964.
57. Вентцель Е. С. Элементы динамического программирования.
М.: Наука, 1964.
58. Блекуэлл Д., Гиршик М. А. Теория игр и статистических ре-
шений.— М.: Изд-во иностр, лит., 1958.
59. Мак-Кинси Д. Введение в теорию игр. — М.: Физматгиз,
1960.
60. Нейман Д., Моргенштерн О. Теория игр и экономическое по-
ведение.— М.: Наука, 1970.
61. Чернов Г., Мозес Л. Элементарная теория статистических
решений. — М.: Советское радио, 1962.
62. Миддлтон Д. Введение в статистическую теорию связи. —
М.: Советское радио, 1966.
63. Вальд А. Последовательный анализ. — М.: Физматгиз, 1960.
64. Башаринов А. Е., Флейшман Б. С. Методы статистического
последовательного анализа и их приложения. — М.: Советское ра-
дио, 1962.
65. Танаев В. С., Шкурба В. В. Введение в теорию расписаний.—
М.: Наука, 1975.
66. Акоф Р., Сасиени М. Основы исследования операций. — М.:
Мир, 1971.
67. Бигель Дж. Управление производством. — М.: Мир, 1973.
68. Риггс Дж. Производственные системы. — М.: Прогресс, 1972.
69. Бурков В. Н., Ловецкий С. Е. Комбинаторика и развитие
техники. — М.: Знание, 1968.
70. Мудров В. И. Задача о коммивояжере. — М.: Знание, 1969.
71. Розенберг В. Я., Прохоров А. И. Что такое теория массового
обслуживания. — М.: Советское радио, 1962.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Анализ регрессионный 180
Антирефлексивность 40
Антисимметричность 40
Базис 232
Брахистохрона 38
Вектор 23, 77
— матрицы собственный 99
— транспонированный 77
Векторы ортогональные 85
Величина случайная 119
--- двумерная 125
--- непрерывная 128
--- центрированная 139
Вероятность 118
— апостериорная 122, 347
— априорная 121, 205
— условная (безусловная) 123
Внутренняя точка множества 108
Выборка случайная 160, 409
Выборочное среднее 166
Генерирующее соотношение 194
Гиперплоскость 108
— опорная 115
— разделительная 115
Гиперсфера 107
Градиент 259
Граница множества 11, 108
Граф 44
— бихроматический 50
— наименьшей длины 56
— неориентированный 47
— полный 387
— частичный 46
График сетевой 371, 376
— соответствия 27
— функции 34
Действие байесовское 327, 334
Дерево 47
— игры 295
Диаграмма переходов 154
— Эйлера — Венна 18
Дисперсия 139
Дополнение множества 18
— события 117
Дуга 46
— насыщенная 61
Зависимость линейная 78
Задача вариационная 270
— двухальтернативная 342, 350, 351,
363
— детерминированная 209, 214
— коммивояжера 386
— линейного программирования 230
------ двойственная 247
— на составление расписания 367
— одношаговая 197, 208
— оптимизации классическая 209
— стохастическая 210, 214
— транспортная 64, 234
Задачи комбинаторные 370, 385
— упорядоченные 370
Закон больших чисел 163
Значение матрицы собственное 99
Значимость статистическая 178
Игра 290
— с ненулевой суммой 294
Игра с полной (неполной) инфор-
мацией 296
— справедливая 301
— с седловой точкой 300
— статистическая 324
— — без эксперимента 328, 330
---с единичным экспериментом
338
— — с последовательными выбор-
ками 356
Интеграл вероятностей 133
Интенсивность отказов 151
Интервал доверительный 171
Инцидентность 45
Канал обслуживания 400
Кибернетика 3
Класс информации 295
Ковариация 142
Комбинация выпуклая 111
— линейная 111
Композиция 28, 31
Компоненты вектора 77
— связности 47
Контраст определяющий 195
Контур 46
— гамильтонов 387
Кортеж 22
Коши неравенство 84
Коэффициент корреляции 144
Коэффициенты регрессии 182
Критерий качества управления 2С0,
208, 220
— согласия 177
Линия регрессии 142, 182
Матрица 86
— единичная 93
— игры 294
— инциденций 45
— квадратная 86, 92
— коммутирующая 91
невырожденная 95
— нулевая 93
— переходов 153
— планирования эксперимента 189
— потерь 327
— симметричная 102
смежности 45
— транспонированная 91
Медиана 164
Метод ветвей и границ 393
— Гомори 252
— Монте-Карло 390
— наименьших квадратов 184
Метрика 73
Механизм случайного выбора 290
Минимум глобальный (абсолют-
ный) 221
— локальный (относительный) 221
— слабый (сильный) 221
Многогранник выпуклый 115
Множества в общем положении 16
Множество 7
— бесконечное 8
— внутренней (внешней) устойчи-
вости 50
— выпуклое 111
— замкнутое 108
414
Множество конечное 8, 107
— ограниченное 107
— открытое 108
— пустое 9
— универсальное 17
упорядоченное 23, 42
Множитель Лагранжа 229
Моменты случайной величины 139
Надежность 151
Неравенство Чебышева 181
Несимметричность 40
Норма 81
— вектора 84
Область определения (значений)
соответствия 27
— остановки 359
Оболочка выпуклая 112, 116
Образ 30
Объединение множеств 13
— событий 117
Объект управления 202, 207
Ограничения на процесс управле-
ния 201, 273
Ожидание математическое 132
Окрестность 107
Оператор 39, 218
Определитель квадратной матрицы
93
Отказ 151
Отклонение среднеквадратичное 140
Отношение 32, 39
— доминирования 43
— порядка 42, 48
— правдоподобия 350
— строгого порядка 42
— эквивалентности 40, 49
Отображение 29
Отрезок 111
Оценка 164
— несмещенная 165
— состоятельная 165
— точечная 171
— эффективная 165
Пари 136
Переменная выходная 206
— состояния 206
Переменные базисные (свободные)
232
Пересечение множеств 15
Петля 47
План последовательной выборки
357
Планирование сетевое 370
Плотность распределения вероят-
ностей 129
Поверхность отклика 181
Подграф 46
Подмножество 10
Подпространство инвариантное 96
Полный факторный эксперимент
188
Полупространство ПО
Поток 59
— наибольший 61
полный 61
Преобразование 32, 216, 218, 358
— единичное 88
— линейное 87
— нулевое 88
— обратное 94
подобия 100
Принцип байесовский 335, 345
— максимального правдоподобия
168, 349
— максимума 274
— минимакса 332, 345
— равных возможностей 121
Программа 367
Программирование динамическое
274, 278
— линейное 210, 230
— квадратичное 257
— математическое 209
— нелинейное 210, 253
— целочисленное 252
Проекция кортежа 24
— множества 26
Произведение множеств прямое 25
Пространство 71
— банахово 81
— выборок 339
— евклидово 81, 83
— исходов эксперимента 116
— линейное 76
--- нормированное 81
— метрическое 73
— решений 203, 211
— состояний природы 205, 326
— факторное 181
Процесс многошаговый 145, 198,
218, 276
— независимых испытаний 146
— случайный 144
— с независимыми значениями 145
— эргодический 156
Прямая 110
Путь 46
— гамильтонов 387
— кратчайший 51, 54
— критический 380
Работа критическая 376
— фиктивная 377
Равенство множеств 9
Равновесие статистическое 403
Разбиение множества 19
Разность множеств 17
Разрез транспортной сети 60
Ранг матрицы 96
Распределение вероятностей 119,
129
--- апостериорное 349
--- биномиальное 148
--- нормальное 131
---Пуассона 149
--- равномерное 131
--- совместное 126
---Стьюдента 174
--- условное 339
---%2 167
--- экспоненциальное 150
Расстояние 71
Ребро 47
Ре1рессия 142
Резервы времени 374
Рефлексивность 40
Решение базисное 232
Стратегия 291
— байесовская 335
— доминирующая 315
— допустимая 331
— минимаксная 306, 311, 332
— оптимальная 308
415
Стратегия полезная 315
— смешанная 302, 327
— чистая 302, 326
Структура 71
Сужение функции 34
Тождества де-Моргана 22
Точка множества крайняя 115
— стационарная 106
Транзитивность 40
Упорядочение работ 372
Управление 196, 205, 218
— адаптивное 215
— допустимое 206
— конечным состоянием 215, 285
— оптимальное 202, 214, 220, 278
Уравнение матрицы характеристи-
ческое 97
— регрессии 182
Уравнения размножения и гибели
403
Факторы 181
Форма квадратичная 104
— линейная 230
---положительно (отрицательно)
определенная 105
— допустимое 232
Риск ожидаемый 345
Связность графа 47
Сеть транспортная 58
Симметричность 40
Симплекс-метод 240
Система динамическая 207, 212
— множеств 14
— нормальных уравнений 184
Ситуация конфликтная 211, 289
Скачок единичный 36
Событие 117
События независимые 125
— несовместные 117
Соответствие 26
— обратное 28
Состояние природы 198, 204, 326
Срок директивный 369, 376
Статистик 326
Статистика математическая 159, 164
Степень множества 25
Функционал 37, 270
Функция 32
— выпуклая 224
— импульсная 37
— Лагранжа 229
— обратная 35
— потерь 294, 303, 326
— правдоподобия 169
— распределения вероятностей 129
— решающая 340
— риска 342, 361
— с дискретным временем 37
— с непрерывным временем 36
— целевая 208, 213,,. 220
— штрафа 214
Ход личный (случайный) 290
Цена игры 298, 305
— теневая 247
Цепь 47
— марковская 146, 153
Цикл 47
Частота 120
Числа матрицы характеристические
97
Число внутренней (внешней) устой-
чивости 50
— степеней свободы эксперимента
186
— хроматическое 50
— цикломатическое 50
Шар 107
Эксперимент 325, 338
— активный 182
— единичный 338
— пассивный 182
ОГЛАВЛЕНИЕ
Предисловие.......................«....»» 3
Указатель обозначений . * . ♦ ................. 5
Глава первая. Основные понятия теории множеств . 7
1-1. Конечные и бесконечные множества.................. 7
а) Основные определения 7
б) Понятие подмножества.................... Ю
в) Верхняя и нижняя границы множества . . , Н
1-2. Операции над множествами 12
а) Предварительные замечания.................* 12
б) Объединение множеств ........ 13
в) Пересечение множеств . . . . . 15
г) Разность множеств 17
д) Универсальное множество . . . . . * . 17
е) Дополнение множества........................ 18
ж) Разбиение множества..................... 19
з) Тождества алгебры множеств...................20
1-3. Упорядочение элементов и прямое произведение мно-
жеств ............................................22
а) Упорядоченное множество ....... 22
б) Прямое произведение множеств................25
в) Проекция множества ....... 26
1-4. Соответствия.................................. 26
а) Определение соответствия..............., . 26
б) Обратное соответствие . 28
в) Композиция соответствий ....... 28
1-5. Отображения и функции ........ 29
а) Отображения и их свойства...................29
б) Отображения, заданные на одном множестве , 31
в) Функция.....................................32
г) Обратная функция ..............................35
д) Функция времени ...............................35
е) Понятие функционала.........................37
ж) Понятие оператора . 39
1-6. Отношения....................................... 39
а) Свойства отношений ............................39
б) Отношение эквивалентности...................40
в) Отношение порядка . 42
г) Отношение доминирования.....................43
Задачи к гл. 1.............................................43
Глава вторая. Основы теории графов ..... 44
2-1. Основные определения теории графов .... 44
а) Теоретико-множественное определение графа . . 44
б) Отношение порядка и отношение эквивалентности
на графе........................................48
в) Характеристики графов.......................49
2-2. Задача о кратчайшем пути ....... 51
а) Постановка задачи 51
417
б) Нахождение кратчайшего пути в графе с ребрами
единичной длины.....................................62
в) Нахождение кратчайшего пути в графе с ребрами
произвольной длины..................................54
г) Построение графа наименьшей длины ... 56
2-3. Транспортные сети ......... 58
а) Основные понятия ........ « 58
б) Задача о наибольшем потоке ..»••• 60
в) Транспортная задача........................... 64
Глава третья. Элементы линейной алгебры и выпуклые
множества...................................................71
3- 1. Метрические пространства и расстояния .... 71
а) Понятие о расстоянии.......................... 71
б) Определение метрического пространства ... 73
в) Примеры метрических пространств .... 73
3-2. Линейные пространства............................ 75
а) Определение линейного пространства ... 75
б) Действия над векторами.....................77
в) Линейная зависимость и независимость векторов 78
г) Линейное подпространство...................79
д) Размерность линейного пространства .... 80
3-3. Евклидовы пространства.............................81
а) Линейное нормированное пространство ... 81
б) Скалярное произведение векторов ..... 82
в) Угол между векторами. Ортогональные векторы 85
3-4. Матрицы и линейные преобразования .... 86
а) Понятие матрицы.................................86
б) Линейное преобразование ...... 87
в) Операции над матрицами ....... 88
г) Транспонированная матрица.......................91
3-5. Квадратные матрицы.................................92
а) Особенности квадратных матриц. Нулевая и еди-
ничная матрицы............................., 92
б) Определитель квадратной матрицы .... 93
в) Обратная матрица и решение систем линейных
уравнений.........................................94
г) Инвариантное подпространство. Собственные век-
торы и собственные значения матриц .... 95
д) Диагонализация матриц..........................jqq
3-6. Симметрические матрицы и квадратичные формы . jq2
а) Собственные векторы и собственные значения ве-
щественных симметрических матриц .... 102
б) Диагонализация симметрических матриц . . . ЮЗ
в) Квадратичные формы.............................104
г) Использование квадратичных форм при отыскании
экстремумов функций многих переменных . . Ю5
3-7. Выпуклые множества................................107
а) Понятие гиперсферы.............................107
б) Ограниченные и конечные множества . . . 107
в) Открытые и замкнутые множества .... 107
г) Гиперплоскости и полупространства .... 108
д) Прямая и отрезок. Средневзвешенное по элемен-
там множества ...»................................ИО
е) Выпуклые множества . =. . . » . . . Ш
418
ж) Выпуклая оболочка конечного множества . . 112
з) Разделительная и опорная гиперплоскости . 114
Задачи к гл. 3
Глава четвертая. Элементы теории вероятностей и ма
тематической статистики ................................
4-1, Понятие вероятности..............................
а) События и пространство исходов эксперимента
б) Понятие вероятности ......................
в) Вероятность события...........................
г) Способы приписывания вероятностей исходам экс-
перимента .....................................
д) Вычисление вероятностей сложных событий
4-2. Условные вероятности...........................
а) Понятие условной вероятности . . .
б) Двумерные случайные величины .................
в) Формула полной вероятности....................
4-3. Непрерывные случайные величины и их распределения
а) Понятие непрерывной случайной величины
б) Функция распределения вероятностей ....
в) Плотность распределения вероятностей
г) Равномерное распределение.................
д) Нормальное распределение......................
4-4. Числовые характеристики случайных величин
а) Понятие о числовых характеристиках . . . .
б) Математическое ожидание случайной величины
в) Математическое ожидание функции от случайной
величины .........................................
г) Математическое ожидание функции двух случай-
ных величин ......................................
д) Условное математическое ожидание . . . .
е) Свойства математического ожидания . . . .
ж) Моменты. Дисперсия. Среднеквадратическое от-
клонение .........................................
з) Регрессия и корреляция....................
4-5. Дискретные случайные процессы...................
а) Понятие о дискретных случайных процессах
б) Процесс независимых испытаний с двумя исхода-
ми. Биномиальное распределение вероятностей
в) Распределение Пуассона.......................
г) Экспоненциальное распределение. Понятие о на-
дежности ........................................
д) Марковские цепи..............................
4-6. Элементы математической статистики .
а) Предмет математической статистики
б) Понятие случайной выборки ...................
в) Предельные теоремы теории вероятностей
г) Задачи математической статистики . . . .
д) Несмещенные оценки математического ожидания
и дисперсии .....................................
е) Нахождение оценок по методу максимального
правдоподобия ...................................
ж) Оценка параметров по методу доверительных ин-
тервалов ...........
116
116
116
116
118
119
120
122
123
123
125
127
128
128
128
129
133
133
133
134
137
138
138
139
141
144
144
147
149
150
153
159
159
160
161
164
166
168
171
419
з) Проверка статистических гипотез. Понятие о кри-
терии согласия.......................................176
и) Оценка влияния некоторого фактора на характер
случайной величины ................................. 178
к) Проверка гипотезы о дисперсиях. Понятие о
Г-распределении .................................... 179
4-7. Регрессионный анализ и планирование эксперимента 180
а) Задача регрессионного анализа....................180
б) Определение коэффициентов регрессии по данным
пассивного эксперимента..........................183
в) Решение системы нормальных уравнений в мат-
ричной форме....................................184
г) Понятие о планировании эксперимента . . . 187
д) Полный факторный эксперимент .... 188
е) Понятие дробных реплик......................192
Задачи к гл. 4.................................... 195
Глава пятая. Структура и математическое описание за-
дач оптимального управления..................................196
5-1. Основные черты процесса управления ...» 196
а) Понятие об управлении ....... 196
б) Виды задач управления.......................197
5-2. Оптимизация процесса управления . . . . , 199
а) Критерий качества управления................199
б) Ограничения, накладываемые на процесс управ-
ления ...........................................201
в) Постановка задачи оптимального управления . 202
5-3. Математическое описание объекта управления . , 202
а) Структура объекта управления ..... 202
б) Уравнения движения объекта управления . . 207
5-4. Классификация задач оптимального управления . 208
а) Одношаговые задачи принятия решения . . 208
б) Динамические задачи оптимизации управления 212
в) Управление конечным состоянием .... 215
5-5. Многошаговые процессы управления .... 216
а) Поведение динамической системы как функция
начального состояния ............................... 216
б) Представление динамического процесса в виде
последовательности преобразований .... 217
в) Многошаговый процесс управления .... 218
г) Критерий качества управления при многошаговом
процессе . ..........................219
5-6. Основные понятия теории оптимизации .... 221
а) Общая постановка задачи оптимизации , . . 221
б) Ограничения на допустимое множество . . . 222
в) Выпуклые и вогнутые функции......................224
г) Свойства выпуклых (вогнутых) функций . . 227
д) Классическая задача оптимизации .... 227
е) Функция Лагранжа..............................229
Глава шестая. Линейное и нелинейное программирование 230
6-1. Постановка задачи линейного программирования , 230
а) Основные определения..........................230
б) Примеры задач линейного программирования * 232
420
в) Геометрическая интерпретация задачи линейного
программирования ..................................236
6-2. Решение задачи линейного программирования ’ . 240
а) Алгебра симплекс-метода........................240
б) Табличный метод нахождения оптимального ре-
шения ...........................................242
в) Получение начального допустимого базисного
решения ...........................................246
г) Двойственная задача линейного программирования 247
д) Понятие о целочисленном программировании . 252
6-3. Нелинейное программирование.................253
а) Постановка задачи.........................253
б) Ограничения типа равенств и неотрицательность
переменных .............................» 254
в) Условия Куна—Таккера....................... . 255
г) Квадратичное программирование . t 257
6-4. Итеративные методы поиска оптимума .... 259
а) Постановка задачи ... .... 259
б) Градиентный метод..............................262
в) Метод наискорейшего спуска (подъема) . . 264
г) Алгоритм Ньютона . . ’....................265
д) Учет ограничений и многоэкстремальные задачи 266
Задачи к гл. 6........................................268
Глава седьмая. Динамическое программирование . в 268
7-1. Оптимальное управление как вариационная задача 268
а) Математическая формулировка задачи оптималь-
ного управления...............................268
б) Трудности, связанные с решением вариационной
задачи........................................273
7-2. Метод динамического программирования . . . 275
а) Дискретная форма вариационной задачи . . 275
б) Рекуррентное соотношение метода динамического
программирования..............................277
в) Вычислительные аспекты динамического програм-
мирования .........................................279
г) Управление конечным состоянием .... 285
д) Рекуррентное соотношение для марковских про-
цессов ............................................286
Задачи к гл. 7..................................289
Глава восьмая. Теория игр . . . 289
8-1. Предмет теории игр.........................289
а) Игра как модель конфликтной ситуации . . 289
б) Понятие стратегии..............................291
в) Формальное описание игры двух лиц . . , 292
г) Верхняя и нижняя цены игры . . . . . 298
8-2. Цены и оптимальные стратегии игр . . . » 300
а) Игра с седловой точкой....................... 300
б) Чистые и смешанные стратегии...................301
в) Функция потерь при использовании смешанных
стратегий 303
421
г) Верхняя и нижняя цены игры при использовании
смешанных стратегий.............................. 305
8-3. Геометрическое представление игры . , . 308
а) S-игра....................................... 308
б) Нижняя и верхняя цены игры в S-игре . . . 311
в) Геометрическая иллюстрация принципа минимакса 313
8-4. Решение игр......................................315
а) Доминирующие и полезные стратегии . . . 315
б) Нахождение оптимальных стратегий .... 319
в) Геометрическая иллюстрация принципа мини-
макса в игре 2Х«...................................322
Задачи к гл. 8.................................... , 323
Глава девятая. Теория статистических решений (стати-
стические игры)......................................324
9-1. Структура статистических игр................... 324
а) Стратегические и статистические игры . . . 324
б) Пространство стратегий природы................326
в) Пространство стратегий статистика и функция
потерь.............................................326
г) Примеры статистических игр....................328
9-2. Статистические игры без эксперимента .... 330
а) Представление статистической игры без экспери-
мента в виде S-игры................................330
б) Допустимые стратегии в статистических играх 331
в) Принципы выбора стратегий в статистических
играх..............................................332
г) Геометрическая трактовка байесовских стратегий 335
9-3. Статистические игры с проведением единичного экс-
перимента ............................................ 338
а) Постановка задачи..............................338
б) Пространство выборок......................... 339
в) Решающая функция...............................340
г) Функция риска..................................342
д) Принципы выбора стратегии в играх с единичным
экспериментом......................................345
9-4. Использование апостериорных вероятностей . . 346
а) Определение числа стратегий в играх с проведе-
нием эксперимента..................................346
б) Апостериорное распределение вероятностей. Фор-
мула Байеса........................................347
в) Принцип максимального правдоподобия . . . 349
г) Определение байесовского решения на основе ис-
пользования апостериорных вероятностей . . 350
д) Двухальтернативная задача......................351
9-5. Статистические игры с последовательными вы-
борками .........................................355
а) Предварительные замечания......................355
б) Использование апостериорного распределения ве-
роятностей для определения последовательных
байесовских правил............................. . 358
в) Правило последовательных выборок .... 360
г) Функция риска при оптимальном последователь-
ном правиле .... ..............361
422
д) Определение областей остановки для двухальтер-
нативной задачи при усеченной последователь-
ной выборке........................ . . . , 363
Задачи к гл. 9 .... 366
Глава десятая. Задачи теории расписаний и массового
обслуживания........................................366
10-1. Предмет теории расписаний..................... 366
а) Общие сведения...............................366
б) Постановка задачи теории расписаний . . . 367
в) Виды задач на составление расписания . . . 369
10-2. Сетевое планирование и управление ............. 370
а) Понятие сетевого графика. Составление перечня
работ.......................................370
б) Упорядочение (ранжировка) работ .... 372
в) Определение резервов времени............374
г) Построение сетевого графика . 376
д) Коррекция распределения ресурсов .... 380
е) Оптимизация срока выполнения комплекса работ 381
ж) Вероятностные методы сетевого планирования 383
10-3. Комбинаторные задачи на составление расписания 385
а) Понятие о комбинаторных задачах .... 385
б) Задача коммивояжера...........................386
в) Представление задачи коммивояжера в виде
графа.......................................387
10-4. Примеры задач, сводящихся к задаче коммивояжера 388
а) Задача Гамильтона........................388
б) Транспортные задачи.....................388
в) Оптимизация программирования для ЭВМ . . 388
г) Определение оптимальной последовательности об-
работки деталей на двух станках .... 389
10-5. Методы решения задачи коммивояжера . . . 390
а) Применение метода Монте-Карло .... 390
б) Сведение к задаче целочисленного линейного про-
граммирования ...................................391
в) Метод ветвей и границ.........................393
г) Применение метода ветвей и границ к решению
задачи коммивояжера .............................395
10-6. Задачи массового обслуживания...................400
а) Основные понятия. Терминология .... 400
б) Дифференциальные уравнения системы массового
обслуживания.....................................402
.в) Система массового обслуживания с отказами . 404
г) Одноканальная система обслуживания с ожида-
нием ............................................406
д) Многоканальная система обслуживания с ожида-
нием ........................................407
е) Статистическое моделирование систем массово-
го обслуживания..................................408
Список литературы......................................411
Предметный указатель 414
Юрий Михайлович Коршунов
МАТЕМАТИЧЕСКИЕ ОСНОВЫ КИБЕРНЕТИКИ
Редактор В. А. Горбатов
Редактор издательства Н. А. Медведева
Переплет художника Е. Н. Волкова
Технический редактор Н. М. Пушкарева
Корректор Г. А. Полонская
ИБ № 2291
Сдано в набор 21.09.79. Подписано в печать 29.04.80 Т-07200
Формат 84X108732 Бумага типографская № 3 Гарн. шрифта литературная
Печать высокая Усл. печ. л. 22,26 Уч.-изд. л. 23,06 Тираж 23000 экз.
Заказ № 142 Цена 1 р. 10 к.
Издательство «Энергия», 113114, Москва, М-114, Шлюзовая наб.,10
Владимирская типография Союзполиграфпрома при Государственном
комитете СССР по делам издательств, полиграфии и книжной торговли.
600000, г. Владимир, Октябрьский проспект, д. 7.