/
Автор: Робертс Ф.С.
Теги: регулирование и управление машинами, процессами кибернетика прикладная математика
Год: 1986
Текст
ТЕОРИЯ И МЕТОДЫ
СИСТЕМНОГО АНАЛИЗА
Ф.С. РОБЕРТС
ДИСКРЕТНЫЕ
МАТЕМАТИЧЕСКИЕ
МОДЕЛИ
С ПРИЛОЖЕНИЯМИ
К СОЦИАЛЬНЫМ
БИОЛОГИЧЕСКИМ
И ЭКОЛОГИЧЕСКИМ
ЗАДАЧАМ
Перевод с английского
AJV1. РАППОПОРТА, СИ. ТРАВКИНА
Под редакцией А.И.ТЕЙМАНА
МОСКВА "НАУКА"
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
1986
ББК 32.81
Р58
УДК 62-50
DISCRETE
MATHEMATICAL MODELS
with application to social,
biological and environmental
problems
FRED S. ROBERTS
Rutgers University
Prentice-Hall, Inc.
Englewood Cliffs, New Jersey
Роберте Ф.С. Дискретные математические модели с приложениями
к социальным, биологическим и экологическим задачам/Пер, с англ.
А.М. Раппопорта, СИ. Травкина. Под ред. А.И. Теймана. - М.: Наука.
Гл. ред. физ.-мат. лит., 1986. - 496 с.
Излагаются методы дискретной математики, используемые при
моделировании сложных систем различной природы. Представлен необходимый аппарат
теории графов и рассмотрен ряд специальных вопросов, получивших развитие
в последнее время: теория структурного баланса в знаковых графах, графы
пересечений, устойчивость динамических процессов на графах. Существенное
внимание уделяется задачам принятия решений, группового выбора и теории
измерений. Рассмотрены также и более традиционные вопросы - цепи
Маркова и теория игр.
Для специалистов в области прикладной математики, экономики, охраны
окружающей среды, теории принятия решений.
Табл. 15. Ил.231. Библиогр. 343 назв.
Редакционная коллегия серии
"Теория и методы системного анализа":
академик ДМ Гвишиани (председатель),
академик СВ. Емельянов (заместитель председателя),
член-корреспондент АН СССР С.С. Шаталин,
доктор экономических наук 2>. 3. Милънер,
доктор технических наук Ю, С Попков
© 1976 by Prentice-Hall, Inc.
Englewood Cliffs, New Jersey
©Издательство "Наука".
Главная редакция
физико-математической
1507ПППППП 1*я литературы, перевод
р *Juzuuuuuu-xott ^ ?2-86 на русский язык, предисловие
053 @2)-86 редактора перевода, 1986
ОГЛАВЛЕНИЕ
ОТ РЕДАКТОРА ПЕРЕВОДА 7
ПРЕДИСЛОВИЕ 11
СТРУКТУРЫ ГЛАВ И ИХ СОКРАЩЕННЫЕ ВАРИАНТЫ 16
ОБОЗНАЧЕНИЯ 18
ВВЕДЕНИЕ. ОБЗОР СОДЕРЖАНИЯ КНИГИ 19
Глава 1
Математические модели 24
§ 1.1. Циклическая природа математического моделирования 24
§ 1.2. Пример: планирование одностороннего движения 25
§ 1.3. Этапы процесса'математического моделирования 29
§ 1.4. Типы моделей 31
Глава 2
Графы 34
§ 2.1. Некоторые примеры 34
§ 2.2. Связность 41
2.2.1. Достижимость 41
2.2.2. Расстояние 42
2.2.3. Соединимость 44
2.2.4. Категории связности 45
2.2.5. Критерии связности 46
2.2.6. Случай графов 48
§ 2.3. Сильные компоненты и вершинная база 51
2.3.1. Вершинные базы и сети коммуникаций 51
2.3.2. Теоремы и доказательства 54
2.3.3. Несколько определений для графов 55
§ 2.4. Орграфы и матрицы 58
2.4.1. Матрица смежности 58
2.4.2. Матрица достижимости 60
2.4.3. Матрица расстояний 63
Глава 3
Приложения теории графов 67
§ 3.1. Знаковые графы и теория структурного баланса 67
3.1.1. Знаковые графы 67
3.1.2. Баланс в малых группах 67
3.1.3. Доказательство теоремы о структуре 72
§ 3.2, Турниры 80
§ 3.3. Ориентируемость и уязвимость 90
3.3.1. Планирование транспортных потоков 90
1* 3
3.3.2. Уязвимость 95
3.3.3. Транзитивная ориентируемость 96
§ 3.4. Графы пересечений 103
3.4.1. Определение графа пересечений 103
3.4.2. Графы интервалов и их применения 104
3.4.3. Свойства графов интервалов 112
3.4.4. Доказательство лемм из п. 3.4.3 118
3.4.5. Другие графы пересечений 119
3.4.6. Регулирование движения траспорта светофором 119
§ 3.5. Сеть питания 127
3.5.1. Размерность экологического фазового пространства 128
3.5.2. Трофический статус 132
§ 3.6. Уборка мусора и раскраска 140
3.6.1. Маршруты мусоровозов 140
3.6.2. Теоремы о раскраске 142
3.6.3. Проблема четырех красок 145
Глава 4
Взвешенные орграфы и импульсные процессы 152
§ 4.1. Введение. Энергетические проблемы и другие приложения 152
§ 4.2. Некоторые сведения о собственных значениях 154
§ 4.3. Использование знаковых и взвешенных орграфов в качестве
средства моделирования сложных систем 160
§ 4.4. Импульсные процессы 177
§ 4.5. Устойчивость импульсных процессов . . . 185
4.5.1. Определение устойчивости 185
4.5.2. Собственные значения и устойчивость 187
4.5.3. Структура и устойчивость. Розы 190
§ 4.6. Применение теории устойчивости 197
§ 4.7. Доказательство теорем 4.6-4.8 207
Глава 5
Марковские цепи 219
§ 5.1. Стохастические процессы и цепи Маркова 219
§ 5.2. Вероятности перехода и орграфы перехода 223
§ 5.3. Классификация цепей Маркова и их состояний 233
§ 5.4. Поглощающиеце^и 237
§ 5.5. Регулярные цепи 247
5.5.1. Определение регулярной цепи 247
5.5.2. Стационарные векторы 249
5.5.3. Среднее время первого возвращения 253
5.5.4. Доказательство теоремы 5.8 . 254
§ 5.6. Эргодическиецепи ! 260
5.6.1. Периодические свойства эргодических цепей 260
5.6.2. Обобщение свойств регулярных цепей Маркова 264
§ 5.7. Применение марковских процессов в генетике 267
5.7.1. Теория Менделя 267
5.7.2. Прогнозы на основе теории Менделя 269
§ 5.8. Потоковые модели 276
5.8.1. Модели загрязнения атмосферы * 276
5.8.2. Модели денежных потоков . 280
§ 5.9. Математические модели обучения 287
5.9.1. Линейная модель 288
5.9.2. Одноэлементная бинарная модель 289
5.9.3. Двухэлементная бинарная модель 293
5.9.4. Модель Эстеса 295
4
§ 5.10. Влияние и власть в социальных группах 302
§ 5.11. Диффузия и броуновское движение 314
Глава 6
Игры п лиц 317
§ 6.1. Игры в форме характеристической функции 317
§ 6.2. Ядро 322
6.2Л. Эффективное предпочтение 322
6.2.2. Нахождение ядра 324
§ 6.3. Устойчивые множества 331
§ 6.4. Существование непустого ядра 337
§ 6.5. Существование и единственность устойчивых множеств 341
§ 6.6. 5-эквивалентность и @,1)-нормализация 348
6.6.1. Изоморфизм и 5-эквивалентность 348
6.6.2. Геометрический подход 353
§ 6.7. Цена Шепли 356
6.7.1. Аксиомы Шепли 356
6.7.2. Примеры 358
6.7.3. Простые игры 359
6.7.4. Вероятностная интерпретация цены Шепли и ее применение в
законодательных органах 360
6.7.5. Доказательство формулы цены 364
Глава 7
Групповое принятие решений 369
§ 7.1. Функции группового выбора 369
§ 7.2. Теорема Эрроу о невозможности 376
7.2.1. Аксиомы Эрроу 376
7.2.2. Обсуждение 379
7.2.3. Доказательство теоремы Эрроу 382
§ 7.3. Совмещенные шкалы и условия однопиковоста предпочтений .. 387
§ 7.4. Расстояния между ранжировками 395
7.4.1. Аксиомы Кемени-Снелла 395
7.4.2. Вычисление расстояния 399
7.4.3. Медианы и средние 401
7.4.4. Замечания 403
Глава 8
Измерение и полезность 411
§ 8.1. Введение 411
§ 8.2. Отношения 412
8.2.1. Определение отношения 412
8.2.2. Свойства бинарных отношений 414
8.2.3. Операции 415
§ 8.3. Теория измерений 420
§ 8.4. Тип шкал и теория содержательности 426
8.4.1. Регулярные шкалы 426
8.4.2. Тип шкалы 427
8.4.3. Примеры содержательных и бессодержательных утверждений ... 430
§ 8.5. Примеры фундаментальных измерений I. Ординальные функции
полезности 438
8.5.1. Теорема представления 438
8.5.2. Гипотеза ожидаемой полезности 444
8.5.3. Теорема единственности 446
8.5.4. Замечания 447
§ 8.6. Примеры фундаментальных и?мерений II. Экстенсивное измерение 451
8.6.1. Теорема Гельдера 451
8.6.2. Единственность 455
8.6.3. Замечания 457
§ 8.7. Примеры фундаментальных измерений III. Совместное измерение 460
§ 8.8. Полупорядки 469
8.8.1. Теорема Скотта-Суппеса 469
8.8.2. Единственность 472
8.8.3. Интервальные порядки и нечисловые измерения 473
СПИСОК ЛИТЕРАТУРЫ 478
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 491
ОТ РЕДАКТОРА ПЕРЕВОДА
Предлагаемая советскрму читателю книга Фреда Робертса "Дискретные
математические модели с приложениями к социальным, биологическим и
экологическим задачам посвящена вопросам использования
математических методов для анализа и решения различных естественнонаучных,
социально-экономических и технических проблем.
Среди широкого крута используемых в настоящее время прикладных
математических методов автор избрал для систематического изложения
методы дискретной математики.
Конечно, такой выбор в известной мере объясняется тем, что Ф. Роберте
сам внес существенный вклад в разработку отдельных разделов дискретной
математики. Однако нельзя не признать, что именно дискретные
математические модели оказались весьма подходящими для описания и
исследования поведения объектов и систем, которые принято называть (впрочем, не
слишком уточняя эти понятия), "большими", "сложными": социально-
экономические, организационные, биологические, экологические, отдель
ные технические и другие.
Разработка и создание систем управления такого рода объектами,
способных решать задачи, возникающие на различных структурных уровнях,
потребовали существенного развития методологии математического
моделирования и развития математического аппарата исследования моделей.
Хотя наличие современных мощных ЭВМ позволило поставить в
достаточно полном объеме проблемы создания эффективных методов
управления сложными социально-экономическими, организационными и
техническими системами, проведенные исследования показывают, что при этом
возникают задачи, весьма специфичные как по постановке и методам
решения, так и по практическому применению полученных теоретических
результатов.
Подход, базирующийся на идеологии оптимального управления и
заключающийся в формулировании одной или комплекса оптимальных задач и
получении на их основе оптимальной программы действий, оказывается
неудовлетворительным. Именно этим объясняется, что, несмотря на
использование мощных ЭВМ для построения и анализа весьма сложных
математических моделей, практическая эффективность получаемых результатов
весьма низка.
Возникающие при исследовании сложных систем проблемы
многочисленны и зачастую неоднородны, они требуют глубокого проникновения
в суть решаемых задач, анализа и понимания существенных черт
исследуемого объекта, его внутренних и внешних связей. Эти проблемы, как
правило, с трудом поддаются математическому описанию, и их рассмотрение
потребовало использования комплексного, системного подхода.
Достаточно развитую теорию решения таких проблем еще предстоит создать, но
системный анализ уже сейчас позволил указать переход от чисто
интуитивных методов к постановке и решению задач в ситуациях, когда сама
возможность использования методологии и аппарата точны: наук казалась
весьма маловероятной.
Системый анализ вызвал в связи с этим широкий интерес к задачам
выбора, методологии принятия индивидуальных и коллективных решений,
теории и методам решения многокритериальных задач, к разработке
человеко-машинных процедур и систем управления. Эти научные направления
составляют значительную часть системного анализа, а их рабочим аппаратом
являются модели и методы дискретной математики.
В данной книге Ф. Робертса, естественно, представлено ограниченное
число дискретных математических моделей. Наибольшее внимание уделено
теоретико-графовым методам и их приложениям (гл. 2, 3, 4). Достаточно
подробно и полно излагаются основные необходимые элементы теории и
особое внимание обращено на ряд важных вопросов, получивших в
последнее время большое развитие. Среди них теория структурного баланса в
знаковых графах, используемая, например, при анализе организационных
систем, графы пересечений, находящие, в частности, применение в
биологии, устойчивость импульсных процессов на графах и др.
Значительное место в книге уделяется проблемам принятия решений
(гл. 7, 8). Рассматриваются задачи и методы принятия групповых решений,
достаточно подробно излагаются основы теории измерений и полезности.
Две главы книги посвящены более традиционной тематике -
рассматриваются дискретные вероятностные процессы (цепи Маркова) и игры п лиц
(гл. 5 и 6). Однако здесь рассмотрены примеры разнообразных приложений,
оригинальные постановки задач, что делает чтение этих разделов
интересным и содержательным не только для читателя, впервые знакомящегося
с данным предметом.
Большое внимание в книге уделяется методологии моделирования,
вопросам построения математических моделей реальных процессов,
анализу их адекватности, обсуждению их достоинств и недостатков. Часто
приводится целая последовательность все более сложных моделей,
наглядно иллюстрирующая процесс углубления в содержательную сторону
анализируемых проблем.
Выбор и построение математической модели — это в значительной мере
искусство, однако опирающееся на знания, умение, опыт. Автор постоянно
напоминает нам о необходимости нестандартного мышления и
нетривиального подхода к моделированию и показывает это, используя иногда для
8
анализа проблем математические методы, которые на первый взгляд как
будто не отвечают природе рассматриваемых задач.
Так, для описания детерминированных ситуаций используются
вероятностный подход, для анализа непрерывных процессов — дискретные
модели. Кроме того, одни и те же математические модели используются для
описания физических реалий — объектов, процессов, часто весьма далеких
друг от друга.
Возможности приведенных в книге дискретных математических моделей
и методов иллюстрируются большим числом самых разнородных примеров,
иногда достаточно нестандартных. Эти примеры порою чисто
гипотетические и носят явно показательный, учебный характер, но весьма часто за
внешне условным содержанием стоят серьезные проблемы.
В книге даются описания решенных реальных практических задач,
однако они по необходимости очень сжатые, и автор в таких случаях приводит
нужные ссылки, позволяющие заинтересованному читателю найти
обстоятельное изложение описанной проблемы.
Недостатки книги в значительной мере являются продолжениями ее
достоинств. Ограниченный объем издания при попытке широкого охвата
материала, детального описания теоретических оснований методов,
насыщенности примерами и упражнениями неизбежно привели к
неоднородности изложения, различной полноте и глубине описания отдельных вопросов.
И если главы книги, относящиеся к теории графов и теории марковских
процессов и их приложений, изложены достаточно полно и обстоятельно,
то в разделах, связанных с теорией принятия решений, явственно
ощущаются существенные пробелы: отсутствуют вероятностные модели выбора,
нет широко развиваемых в настоящее время методов экспертного
оценивания и др.
Книга рассчитана на широкий круг читателей. Специалисты-математики
найдут здесь напоминания о математических задачах, решение которых
было бы полезно для разработки прикладных методов, и это, может быть,
послужит дополнительным побуждением для занятия ими.
Математики-прикладники встретят здесь описание различных методов
и алгоритмов решения задач, обсуждение потенциальных возможностей
тех или иных подходов, найдут интересные примеры исследований
реальных практических проблем, результаты которых подчас весьма
неожиданные.
Здесь можно найти полезные указания на рациональный выбор метода
анализа прикладной проблемы, что может послужить отправным пунктом
при анализе конкретных ситуаций.
Эта книга не является учебником или учебным пособием в обычном
смысле, но наличие необходимого минимума начальных сведений,
последовательное изложение материала и большое число примеров и
упражнений позволяет использовать ее в этом качестве. В то же время она
содержит описание ряда трудных специальных вопросов, доступных лишь более
подготовленному читателю. Однако схема изложения материала такова,
9
что при первом чтении их можно опустить без ущерба для понимания
основного текста.
Особо следует остановиться на упраженениях. Они являются
существенной частью изложения, приводятся отдельно к каждому разделу и
чрезвычайно разнообразны по содержанию и уровню сложности — от простых
вопросов и задач до доказательств трудных теорем и предложений о
построении математических моделей конкретных ситуаций и их
исследования*
Такая структура книги делает ее весьма полезной для преподавателей
и учащихся — студентов и аспирантов, она может служить хорошей основой
лекционного курса,
В процессе перевода был неправлен ряд замеченных неточностей и
опечаток. Приведенный автором список литературы отражает в основном
содержание книги; дополнение до относительно полного списка
потребовало бы значительного увеличения его объема; поэтому переводчики
ограничились лишь отдельными дополнительными ссылками»
Рассчитанная на широкий круг читателей — специалистов по
прикладной математике, инженеров, экономистов — книга Ф, Робертса полезна
в первую очередь лицам, занимающимся применением математических
моделей для анализа сложных систем, и является ценным пособием по
методам дискретной математики и их приложениям.
AM Тейман
Моей семье
ПРЕДИСЛОВИЕ
Эта книга предназначается широкой аудитории, включающей
математиков, ученых в области общественных наук, биологов, научных работников,
занимающихся проблемами окружающей среды, и др. Во введении будет
обосновано наличие двух направлений взаимодействия между
математикой и прикладными исследованиями. Во-первых, математика может
непосредственно применяться в прикладных областях, во-вторых,
прикладные вопросы могут стимулировать развитие новых разделов математики.
Подобные связи между математикой и физикой наблюдаются уже в течение
длительного времени. По мере усиления взаимодействия между
математикой и новыми областями ее применения, включающими социальные науки,
биологию, проблемы окружающей среды, становится необходимым
знакомить как математиков, так и специалистов-прикладников с разделами
математики, важными для этого взаимодействия.
В распространенных книгах по "конечной математике" это делается
на элементарном уровне для некоторого типа конечной, или "дискретной"
математики ). Настоящая книга представляет собой более углубленное
пособие по методам дискретной математики, которые используются в
новых для ее приложений областях. В ней иллюстрируется как
возможность применения математики к различным прикладным дисциплинам,
так и их влияние на развитие новой математики.
Хотя книга может использоваться как справочник, она по своему
характеру ближе к учебному руководству и на ее основе можно строить
различные курсы лекций. Я несколько раз пользовался предварительным
вариантом книги в' Ратджерском университете при чтении лекций по
математическим моделям в социальных и биологических науках для студентов, начиная
со второго курса, и лекций по теории графов, теории игр и их приложениям
для студентов двух последних курсов. Около 50% слушателей
специализировались в области математики, а остальные — в разнообразных областях
социальных дисциплин и биологии. Среди посещавших лекции были и
аспиранты-нематематики. Книга также использовалась мною при чтении
для аспирантов специальных математических курсов по математическому
моделированию, прикладной теории графов, теории измерений и принятия
решений; в них в значительно большей степени уделялось внимание
доказательствам и теоретическим вопросам. Материал этой книги в письменном
виде служил основой аналогичных курсов лекций и в ряде других учебных
!) Дальнейшее обсуждение природы "дискретной математики" будет продолжено
во введении.
11
заведений. Наконец, мне удалось использовать этот материал на двух
летних курсах для преподавателей колледжей, специализирующихся в
математике и смежных областях, таких, как исследование операций,
теория управления, экология.
Односеместровый курс лекций по математическим моделям включает
сведения по общим вопросам моделирования (гл. 1),теории графов
(сокращенный1) вариант гл. 2), знаковым графам и теории баланса (§3.1),
взвешенным орграфам и импульсным процессам (сокращенный вариант
гл. 4) и цепям Маркова (сокращенный вариант гл. 5), Он заканчивается
либо теорией игр п лиц (сокращенный вариант гл. 6) и коллективного
принятия решений (сокращенный вариант гл. 7), либо теорией измерения
и полезности (сокращенный вариант гл. 8). Вообще, в лекциях,
рассчитанных на студентов последнего курса, доказательствам придается меньшее
значение, а большее внимание отводится вопросам построения и оценки
моделей.
В настоящее время в Ратджерском университете такой вариант лекций
следует за курсом "Конечная математика", включающим основы теории
множеств, элементарные вопросы линейной алгебры, методы вычислений,
начальные сведения по теории вероятностей и др. (Лекции по конечной
математике читаются после курса по математическому анализу.)
В годичном курсе по математическому моделированию в социальных
науках и биологии можно использовать материал из всех глав этой книги.
В него следовало бы полностью включить гл. 1 и 2, большую часть гл. 3
(до п. 3.5.1 включительно) и сокращенные варианты оставшихся глав.
Аналогичные семестровый или годичный курсы могут быть посвящены
проблемам окружающей среды. В лекции по теории графов и теории игр,
рассчитанные на один семестр, следует включить большую часть глав 1, 2,
3 и 6. Прикладная теория графов может быть изложена в течение одного
семестра на основе глав 1, 2, 3 и 4. Наконец, в курс лекций по теории
измерений и принятия решений следует включить главы 1, 7 и 8 книги,
материал из упражнений; кроме того, слушателям рекомендуется и чтение
дополнительной литературы.
Автор попытался свести к минимуму взаимозависимости различных
частей книги, поэтому ее можно использовать разнообразными способами.
Для глав 2—5 существенны_ следующие разделы гл. 2: §2.1, пп. 2.2.1,
2.2.4, 2.2.6, 2.3.1, 2.3.2 (без доказательств) и 2,4.1. Большую частьтлавы 6
можно читать после § 2Л и части п. 2,2.1, а гл. 7 и 8 не связаны с другими
разделами книги. Гл. 3-8 в основном независимы, хотя в них и делаются
ссылки на предыдущие главы. Если читатель будет знакомиться с основным
содержанием гл. 3, я бы ему рекомендовал предварительно прочесть всю
главу 2 (или сначала ее сокращенный вариант) и затем возвращаться к
дополнительным вопросам по мере необходимости. Взаимосвязи внутри
глав схематически показаны в конце предисловия. Там же называются
разделы, включенные в сокращенные варианты глав. Дополнительные
указания на необязательный материал содержатся в тексте.
О Подробное описание "сокращенных вариантов" соответствующих глав дано в
схемах взаимосвязей различных разделов, приведенных после предисловия.
12
Эта книга предполагает, что читатель имеет определенную
математическую подготовку. В ней широко используется язык теории множеств,
элементарные логические символы и средства. Считаются известными
такие понятия, как необходимое условие, достаточное условие, обратное
утверждение, противоположная теорема и др. Значительную роль также
играет элементарная линейная алгебра. Автор пытался сделать изложение
замкнутым и в вопросах линейной алгебры предполагается знакомство
только с матрицами и векторами (и в одном месте с определителями).
В книге также используются некоторые разделы теории вероятностей,
в основном в гл. 5 (цепи Маркова) и в меньшей степени в п. 8.5.2
(гипотеза ожидаемой полезности),
Если читателю не известна элементарная теория вероятностей,
например, на уровне пособий по конечной математике, то в этих вопросах он
будет испытывать определенные затруднения. Читатель должен знать, как
вычисляются вероятности, как пользоваться диаграммами — деревьями
л что означает нахождение условных вероятностей и математического
ожидания (среднего значения). Методы вычислений (снова на уровне
курса по конечной математике) также применяются в некоторых местах.
На протяжении всей книги используются простейшие понятия теории
функций, например область определения, множество значений, взаимно
однозначное соответствие, "отображение на" и т.д. Местами также
понадобятся простейшие сведения из математического анализа, в частности
понятие предела. Студент, не прослушавший по крайней мере семестрового
курса математического анализа, столкнется при чтении с определенными
трудностями.
Таковы основные предварительные математические сведения,
необходимые для понимания большей части этой книги. Как показывает наш
опыт, ею могут пользоваться, опустив почти все доказательства, студенты,
имеющие подготовку в объеме добротных семестровых курсов конечной
математики и математического анализа. Однако читателю будет очень
полезен годичный курс анализа и, несомненно, значительно больше пользы
для себя получат от этого материала студенты, дополнительно
прослушавшие полный курс теории вероятностей или линейной алгебры.
В некоторых разделах или доказательствах используется более
развитый математический аппарат, например теория групп и аналитические или
топологические методы. Другие разделы просто требуют достаточной
математической зрелости. Такие места выделяются звездочкой, а
доказательства переносятся в конец раздела и могут быть опущены без потери
непрерывности понимания излагаемого материала. В действительности
почти все доказательства без ущерба для изложения можно опустить.
Не так легко ответить на вопрос о нематематической подготовке,
необходимой для чтения этой книги. Мы не ожидаем, что читатель является
специалистом по социальным наукам, биологии или экологии. Материал,
изложенный в книге, использовался в лекциях для
студентов-математиков, имеющих слабую подготовку в рассматриваемых прикладных
областях. Большая часть необходимой терминологии поэтому объясняется
по мере употребления. Кроме того, часто цель изложения состоит в том,
чтобы уточнить понятия из другой области знаний, которые обычно
определяются не слишком строго. (Примерами являются баланс в социальных
13
структурах, статус в экологических цепях и тд.) Конечно, всякий студент,
желающий в будущем серьезно работать на стыке между математикой и
прикладными дисциплинами, должен в них также достигнуть некоторого
понимания.
В книге имеется много упражнений, обычно в конце каждого раздела.
Давно замечено, что наилучший способ научиться математике — это решать
задачи» и поэтому упражнения в книге играют очень важную роль. Многие
из них содержат дополнительный материал, не представленный в тексте.
Автор попытался расположить упражнения в таком порядке, чтобы они
начинались с примеров, просто повторяющих вычисления в тексте, и
заканчивались более трудными теоретическими вопросами. Самые сложные
упражнения доступны лишь для наиболее подготовленных студентов (часть
из них отмечена звездочкой).
Наконец, после ряд? разделов добавлены несколько дискуссионных
проблем и проектов. В некоторых проектах предлагаются задачи в области
математики или математического моделирования в новых или еще
неисследованных областях.
Мой интерес к приложениям математики в социальных науках,
биологии, проблемах, связанных с экологией, охраной окружающей среды
зародился в те дни, когда я был студентом-выпускником. Этот интерес
поддерживался с того периода многими людьми, и в известном смысле они
взрастили семя, из которого возникла эта книга. Я должен быть особенно
благодарен Дж. Кемени, Д. Льюсу, Р. Норману, Д. Скотт и П. Суппесу.
Мне бы также хотелось поблагодарить следующие организации и
учреждения за их финансовую и иную поддержку моих исследований до и в
процессе создания этой книги: Институт высших исследований, Ратджер-
ский университет, Фонд Слоана, программу РЭНН Национального
научного фонда, а также корпорацию РЭНД, позволившую мне использовать
материалы различных исследований, в которых я участвовал в качестве
сотрудника.
Издательство "Прентис-Холл" обеспечило поглавные технические
рецензии, которые, на мой взгляд, значительно улучшили качество книги. А. Уес-
тер, бывший математический редактор издательства, проявил к работе
интерес в самом начале, и его убежденность, что я смогу создать
оригинальную и нужную книгу, служила мне источником бодрости.
Многие лица высказали комментарии и критические замечания, и я не
в состоянии поблагодарить их всех. Но мне бы хотелось особо выделить
Д. Льюса и В. Кли, приславших подробные замечания по первоначальному
варианту рукописи, и К. Богарта, давшего подробную рецензию на
последующие варианты. У. Лукас и Л. Шепли передали мне очень полезные
замечания к гл. 6 (игры п лиц). (Б. Лукас также организовал несколько встреч
для представления материала возможным читателям). Дж. Ульман, К. Бо-
гарт, Д. Розен, Ф. Норман, П. Янг и Д. Льюс высказали подробные
замечания по другим главам.
Дж. Джонсон и Р. Лейбовитц обнаружили множество ошибок в каждом
варианте рукописи, высказали несчетное число полезных советов и
тщательно выверили все упражнения в окончательном варианте. Их
добросовестную и полную энтузиазма помощь трудно измерить.
14
Однако я один отвечаю за все ошибки, которые все же могли остаться.
Наконец, я бы хотел поблагодарить мою жену Элен. Как преподаватель
математики и статистики колледжа, а в прошлом студентка-математик,
а также благодаря участию в исследованиях проблем из области социальных
наук, биологии, экологии, она смогла помочь мне во многих специальных
вопросах. А терпение жены, ее поддержка, понимание и любовь помогли
осуществить мой замысел, я надеюсь, успешно.
Нью-Брансуик, штат Нью-Йорк Фред Роберте
СТРУКТУРЫ ГЛАВ И ИХ СОКРАЩЕННЫЕ ВАРИАНТЫ
Глава 2
/7. J. JJ
§12*
§3.4
§JJ
кроме /7.J.J.J
§3.6*
Глава 4
Глава 5
§53
-ч2|$5./0*
—*|§5./f
Сокращенный вариант: §2.1, пп. 2.2.1,
2.2.4,2.2.6,23.1,23.2,2.4.1
Сокращенный вариант: пп. 3.3.1, 33.2,
или §3.1, пп. 33.1, 33.2, или §3.1,
3.2,или §33,3.4, п. 3.5.1
*§ 3.2 связан с п. 2.2.5
** пп, 3.43, 3.4,4 частично связаны с
теоремой 3.4 §3.2
*** п. 3.5.2 не связан с п. 3,5.1 и с
большей частью гл. 3
****п. 3.63 связан с § 3.4
Сокращенный вариант: опустить §4.7
Сокращенный вариант; § 5.1-5.5, а
приложения взять из § 5.7-5.11
* Используется следствие 2 теоремы 5.12
из § 5.6
16
Глава 6
Глава 7
Глава 8
Сокращенный вариант: §6.1,6.2,6.7 или
§6.1-6.3,6.7
* Используется только п. 6.2.1
Сокращенный вариант: опустить § 7.3
или 7.4
Сокращенный вариант: §8.1—8.5; если
есть время, добавить § 8.6, 8.7 или 8.8
2- Ф.С. Роберте
17
ОБОЗНАЧЕНИЯ
Теоретико-множественные обозначения
Ас — дополнение множества А
A UB - объединение множеств А и В
А Г\ В — пересечение множеств А и В
А\В — разность между множествами Аи В, определяемая как А П Вс
A QB —А — подмножество множества5
АС В —А — собственное подмножество множества 5
А фв — А не является подмножеством множества 5
дс G В - х - элемент множества В
х^В -х не является элементом множества/?
0 — пустое множество
\А 1 — мощность множества Л (число элементов в А)
Логические обозначения
~ —отрицание
=* — влечет (если ..., то ...)
*==* — тогда и только тогда (эквивалентность)
V -для всех
3 - существует
Различные обозначения
<R — множество действительных чисел
<R+ - положительные действительные числа
<ЙЛ — и-мерное евклидово пространство, т.е. множество всех и-мерных
векторов с действительными координатами
[а, Ь] — замкнутый интервал, содержащий все действительные числа с,
для которых а<с<Ь
(а, Ь) - открытый интервал, содержащий все действительные числа с,
для которых а < с < Ь
п\
— биномиальный коэффициент, равный
= — знак конгруэнтности
18
ВВЕДЕНИЕ
ОБЗОР СОДЕРЖАНИЯ КНИГИ
Взаимосвязи между математикой и любой областью, где она находит
приложение, развиваются двумя путями. Один путь очевиден и состоит
просто в применении математики, которое может осуществляться
различными способами: от решения конкретных практических задач, до развития
обширных теорий. Второй путь, обычно не принимаемый во внимание
многими людьми, заключается в том, что прикладная область может быть
"применена к математике". Такое "применение" либо стимулирует
разработку новых разделов математики, либо помогает при решении известных
математических задач.
История многолетних связей между математикой и физикой наглядно
демонстрируют эти два способа взаимодействия. С одной стороны,
различные математические методы применялись в физике, с другой —
физические проблемы оказывались стимулом для создания новых разделов
математики, например, в области математического анализа. Более того, иногда
физические модели использовались при решении математических задач,
например, некоторых задач оптимизации. (Этот вопрос обсуждается в
книгеПойа (Ро1уа [1954,гл. 11]).)
В этой книге мы рассмотрим взаимосвязи между математикой и
прикладными проблемами из таких областей, как социология, биология,
экология. Эти взаимосвязи возникли, в основном, значительно позже тех,
которые существуют между математикой и физическими проблемами,
и затрагивают такие математические дисциплины, которые до недавних
пор не включались в математическое образование.
Мы надеемся показать, что, во-первых, математика может оказаться
полезной при решении проблем из новых прикладных областей и,
во-вторых, что эти области могут послужить стимулом для развития нового,
интересного математического аппарата.
Первая цель будет достигнута при помощи многочисленных примеров.
Некоторые из них носят реальный характер, например задача организации
движения транспорта в системе Национального парка, составление
маршрутов мусоровозов в Нью-Йорке, анализ экспериментов парных сравнений
в психологии и лабораторное исследование тонкой структуры гена. Другие
примеры используют математику при систематизации понятий и разработке
теорий. Хотя такие понятия и теории, как мы надеемся, помогут прийти
к долгосрочным решениям при исследовании проблем в области
социальных наук, биологии,экологии, охраны окружающей среды, их практическое
2* 19
значение, конечно, трудно оценить за короткое время. Для многих
прикладных проблем, рассматриваемых в этой книге, мы будем вынуждены
сделать значительные упрощающие допущения. В таких случаях наши
выводы будут не вполне убедительными, однако они будут поучительны
и укажут направления для дальнейшей работы. Автор считает, что для
большей правомерности применения математики в указанных выше
областях, требуется создание новых математических средств, достаточно
мощных, чтобы справиться со сложными математическими вопросами,
возникающими в ряде реальных задач.
Это приводит нас ко второй цели, которой бы хотелось достигнуть при
помощи этой книги, а именно: показать, что проблемы социологии,
экологии, биологии послужили или должны стать стимулом для развития новой
математики. Математика, создаваемая при этом воздействии, может быть
интересна и сама по себе. Ее применимость не обязательно является
критерием оценки, хотя, конечно,' можно надеяться, что в конечном счете она
окажется полезной. Мы должны иметь в виду, что многие разделы
математики развивались исключительно в силу внутренних причин и обнаружили
свою полезность позднее. Хороший пример - булева алгебра, которая
была использована в вычислительной технике более чем через пятьдесят лет
после своего создания. (В ней предполагается, что сложные сообщения
можно закодировать при помощи двухконтактных реле.) Другие разделы
математики нередко развивались для одной единственной цели, и лишь
позднее была обнаружена их важность для других прикладных областей.
Значительная часть теории графов имеет такую же историю. Эта наука
берет свое начало с известной задачи о кенигсбергских мостах (см. гл. 2),
затем исследования стимулировались вопросами, относящимися к
структурам химических соединений, анализу игр и головоломок, а сегодня теория
применяется для решения большого числа задач генетики, экологии,
анализа транспортных потоков, коммуникаций и т.д.
Поскольку книга была написана для иллюстрации обоих направлений
взаимодействия математики и прикладных проблем, она могла быть
построена либо по типу приложений, либо по областям математики. В
основном я придерживался второго направления. Таким образом, была
задумана математическая книга, содержание которой организовано вокруг
математических вопросов. Однако, хотя каждая тема разрабатывалась как
математическая, она и ее приложения никогда не были слишком разделены.
И действительно, некоторые главы посвящены определенному
прикладному вопросу, такому, как вопрос об энергии, о коллективном принятии
решений или измерении и полезности.
Эта книга содержит очень немного примеров "традиционной"
прикладной математики, т.е. математики, ориентированной на приложения в
физических науках. Основное внимание уделено "дискретным" разделам
математики, ибо нам кажется, что именно они наиболее уместны для решения
проблем экологии, биологии, социальных наук. Для уточнения понятия
дискретности заметим, что в рассматриваемых проблемах обычно имеют
дело с конечными множествами: альтернативные схемы скоростных
транспортных систем, мнения различных социальных групп и т.д. Иногда эти
проблемы допускают бесконечно много вариантов, которые, однако, могут
выражаться лишь целыми числами (например, число домов, число рабочих
20
и т.д.). Чтобы включить такие бесконечные множества вариантов наряду
с конечными, используется понятие дискретности. Дискретное множество
может состоять и не из целых чисел, однако обычно мы не допускаем
бесконечно малые различия между его элементами. Например, количество денег,
затраченных на данный проект, можно измерять в миллионах долларов,
сотнях долларов, даже в сотых долях доллара (т.е. в центах), но у нас
нет более мелкой единицы измерения, чем эта (хотя иногда приемлемо
допущение, что такая единица имеется). Иногда рассматриваемые
проблемы связаны с ситуациями, изменения в которых происходят или
регистрируются только в дискретные моменты времени, например, каждый час
или каждый год. Статистические данные о безработице, используемые
для многих целей, сообщаются раз в месяц. С другой стороны, обычно
считают, что скорость снаряда меняется непрерывно. Таким образом,
проблемам, с которыми мы будем иметь дело, в наибольшей степени
соответствует математика конечных, или дискретных, множеств, или* же
множеств, изменяющихся только в дискретные моменты времени. (Иногда
допускается бесконечное число градаций или непрерывные изменения при
рассмотрении некоторых аспектов изучаемой проблемы. Например, в гл. 6
будет предполагаться, что платежи в игре, по крайней мере в принципе,
бесконечно делимы. Однако число игроков в играх конечно. Аналогично
в гл. 8 возможными значениями шкалы могут быть все действительные
числа, но шкалы разрабатываются для измерения конечного множества
альтернатив.)
Задачи на небольших конечных множествах часто можно решить
перебором. Например, предположим, что каждый из четырех человек оценивается
по скорости выполнения четырех различных заданий и мы хотим
распределить между людьми эти задания таким образом, чтобы общее время их
выполнения было наименьшим. Можно опробовать все допустимые
назначения. Всего имеется 4 • 3 • 2 • 1 = 4! = 24 варианта. (Первый человек
может выполнить любое задание из четырех, второй может выполнить любое
задание из трех оставшихся и т.д.) Однако, как известно, число возможных
вариантов (так же, как и других объектов) очень быстро растет при
увеличении размера множества, и поэтому обычно нереально решать задачи
перебором даже для множеств умеренных размеров. Если имеется,
например, 10 человек и 10 заданий, то следует проверить 10! = 3 628 800
вариантов. Необходимы более эффективные методы и совершенно другой
математический аппарат; многие методы, о которых пойдет речь ниже,
разрабатывались для проблем, в которых возникает большое число вариантов. При
увеличении доступности вычислительной техники, сфера применимости
этих новых методов значительно возрастает.
Многие понятия традиционной прикладной математики, например
непрерывность, дифференцируемость, скорость изменения, уравнения для
скоростей изменения (дифференциальные уравнения) и др. имеют иногда
соответствующие аналоги и применяются при решении задач в области
социологии, биологии, экологии. Они используются, например, при анализе
проблем роста населения и межвидовой конкуренции, для которых
представление о непрерывности, а не дискретности изменений обычно является
хорошим приближением. Их применяют при исследовании экономических
показателей, которые часто оказывается полезным считать принимающими
21
все действительные значения, хотя понятие половины дома, например, и
не имеет большого смысла. Таким образом, значительное число
математических вопросов, относящихся к проблемам роста населения, межвидовой
конкуренции, экономического равновесия и др., которые могли
естественным образом оказаться включенными в эту книгу, было опущено, потому
что используемый для их решения математический аппарат существенно
отличен от избранного нами.
Наконец, даже изложение дискретных методов ни в коем случае не
является полным. Теория вероятностей в основном ограничивается главой
по цепям Маркова. Книга оказалась бы слишком затянутой, если бы
включала теорию вероятностей в значительном объеме. Кроме того, по этому
предмету имеется большое число хороших пособий с приложениями к
биологии и социальным наукам (см.; например, Dwass [1969], Feller [1950],
Goldberg [1960] mnParzen [I960]).
Книга также не содержит вопросов линейного и нелинейного
программирования и теории матричных игр (хотя менее известная теория игр п лиц
включена в нее). По этим вопросам уже имеется обширная литература
(см., например, Dantzig [1963], Owen [1968], Rapoport [1966], Spivey,
Thrall [1970] или Wagner [1969]).
Проблемы социальных наук, биологии, экологии часто оказываются
чрезвычайно сложными, они описываются большим числом трудно
определяемых переменных, взаимосвязи между которыми нелегко установить.
Нередко для возможности решения таких задач, приходится делать
довольно сильные упрощающие допущения. Если эти допущения формулируются
в математических терминах, то удается избежать многих двусмысленностей
естественного языка и воспользоваться мощью математических
рассуждений. Процедура, переводящая предположения о проблеме, ситуации или
явлении в математические выражения и затем анализирующая проблему
при помощи математических средств, называется в этой книге
математическим моделированием.
Мы опишем более подробно эту процедуру в гл. 1 и будем использовать
ее на протяжении всей книги. Математическое моделирование — это
непрерывно продолжающийся процесс, в котором простые модели заменяются
все более усложняющимися. Большинство математических моделей,
построенных в этой книге, получены в результате одного или двух циклов
моделирования, что оставляет впечатление незавершенности исследуемых
проблем. Часто это оказывается верным впечатлением. Нередко следующий
шаг не производится, потому что он включал бы слишком сложные
математические вопросы. Обычно предполагается возможность или необходимость
следующего шага или предлагается читателю продумать его. Таким
образом, рассматриваемые здесь математические модели являются всего лишь
начальными.
После обсуждения в гл. 1 понятия математического моделирования мы
обратимся к теории графов. Эта дисциплина возникла в восемнадцатом
веке и, как уже отмечалось, применялась к исследованию таких
разнообразных объектов, как социальные группы, сети коммуникаций, перевозки,
электрические схемы, химические соединения и т.д. Основной аппарат
теории графов, изложенный в § 2.1 — 2.4, составляет фундамент глав 3 — 5
и частично главы 6. Остальные темы этой книги в основном независимы
22
и могут изучаться в любом порядке. Схема зависимостей различных
разделов книги прилагается к предисловию. Гл. 3 содержит приложения теории
графов к теории баланса в социологии, сетям питания в экологии,
исследованию статуса в экосистемах, составлению маршрутов мусоровозов в
Нью-Йорке, проектированию систем транспортных потоков, управлению
сигналами светофоров, исследованию нарушений коммуникаций и др.
Гл. 4 посвящена теории взвешенных орграфов (ориентированных графов)
и импульсных процессов; в качестве основного приложения в ней
рассматривается проблема использования энергии. Однако методы этой главы
применимы также к проблемам водных ресурсов, принятия
государственных решений о финансировании науки и даже к историческому анализу.
Гл. 5 знакомит с цепями Маркова, имеющими многочисленные применения.
Отмечая только некоторые из них, назовем теорию обучения в психологии,
исследования денежных потоков, влияния в группе, циркуляции фосфора
в экосистеме.
Гл. 6 посвящена теории игр и лиц и применяется к различным ситуациям
сделок, относящихся, например, к землепользованию, созданию
угрожающего положения, проблеме очистки воды, а также кряду ситуаций
голосования, например, в правительстве Австралии и Совете Безопасности
Организации Объединенных Наций..Гл. 7 переходит от рассмотрения различных
групп, члены которых осуществляют сделку, к группам, пытающимся
прийти к совместному решению. В гл. 7 представлена знаменитая "теорема
о невозможности" Эрроу, которая выявляет трудности, возникающие в
ситуации, когда группа стремится вырабатывать согласованные решения.
В ней описана также процедура Кемени — Снелла нахождения
согласованной ранжировки в группе экспертов. В последней главе (гл. 8) "Измерение
и полезность" формализуется понятие измерения и изучаются такие
проблемы, как измерение предпочтений, громкости и т.д. В ней разрабатывается
теория о типах шкал, позволяющая формулировать содержательные
утверждения, относящиеся к определенному типу шкалы.
Автор надеется, что эти темы явятся для читателя введением в довольно
новую, но быстро расширяющуюся область исследований. В конце книги
помещен большой список литературы, который послужит читателю
ориентиром.
Глава 1
МАТЕМАТИЧЕСКИЕ МОДЕЛИ
§ 1.1. Циклическая природа математического моделирования
Значительная часть этой книги посвящена математическим моделям.
Процесс математического моделирования включает четырехзвенный
контур, который в упрощенном виде изображен на рис. 1Л1).
На первоначальном этапе происходит сбор сведений об изучаемом
явлении. Затем формулируют определенные допущения об этом явлении на
строгом языке - языке математики. Так получается математическая
модель. На точном языке, который обычно используется для описания
модели, общие допущения, законы и теории можно сформулировать таким
образом, чтобы изложить само существо дела, а не различия, возникающие
из-за употребления нечетких терминов. Более того, становится возможным
применить развитые в течение нескольких столетий точные методы
исследований к изучению явлений реального мира 2).
В любом случае формальная модель строится на математических
допущениях и следующие два блока контура предназначены для испытания
построенной модели, а в случае необходимости и для ее модификации. Для
проверки модели желательно получить некоторые выводы о реальном
явлении. Такие выводы бывают двух типов: одни относятся к ранее
наблюдавшимся ситуациям (и носят объяснительный характер), а другие относятся
к новым, ранее ненаблюдавшимся ситуациям (и используются для предска-
Матпема /ли ческая
модель
Трансляция,
индукция
Прогнозирование,
дедукция
Математические
прогнозы
информация о
реальном мире
Проверка
Интерпретация
Прогнозы для
реальных проблем
Рис. 1.1. Циклическая природа математического моделирования
') Наше рассмотрение циклической природы математического моделирования
в значительной степени основано на книге Kemeny, Snell [1962, гл. 1]. Дальнейшее
обсуждение вопросов математического моделирования можно найти в работах Freu-
dental [ 1961], Kemeny [ 1959], Maki, Thompson [1973].
2) Дальнейшее обсуждение природы математики будет продолжено в этой главе
несколько позже.
24
зания или прогноза). Оба типа выводов важны для проверки
математической модели, хотя в нашем обсуждении целесообразно относиться к ним
обоим как к прогнозам. Для получения таких прогнозов сначала при
помощи математических методов, разработанных ранее или специально для
данной математической модели, составляются математические прогнозы.
Эти математические прогнозы затем переводятся с языка модели
обратно на язык реального мира и, следовательно, могут интерпретироваться
как прогнозы или выводы для изучаемого явления.
На заключительном этапе прогнозы сверяются с реальными данными,
либо известными (в случае проверок объяснительных возможностей
модели) , либо новыми (в случае проверок ее предсказывающих возможностей).
На основе новых данных, включающих и сведения о прогнозе, рассчитанном
по модели, модель модифицируется, и процесс исследования циклически
повторяется по тому же контуру.
Таким образом, любая математическая модель признается лишь
временной. Циклический процесс продолжается все время, и новые порции данных
должны повышать объснительную или предсказывающую способность
модели. Читателю следует иметь в виду, что не всякая математическая
модель создается в описанной выше последовательности, т.е. некоторые
шаги могут пропускаться, повторяться и т.п. Но в качестве некоторой
идеализации наша четырехэтапная процедура вполне приемлема.
§ 1.2. Пример: планирование одностороннего движения
Для иллюстрации этой процедуры давайте рассмотрим проблему
организации движения транспорта. Представим себе, что в городе выделен ряд
пунктов и некоторые из них соединены улицами с двусторонним
движением. Значительный рост количества автомобилей на дорогах привел к
транспортным заторам и увеличению загрязнения воздуха, в связи с чем
поступило предложение установить на всех городских улицах
одностороннее движение. Предположительно это должно было снизить перегрузки
на транспортных магистралях. Естественно возникает вопрос: "Всегда ли
можно так сделать? А если нет, то когда это возможно?" Очевидный ответ
таков: "Конечно, такая возможность имеется всегда. Надо только
установить на каждой улице знак одностороннего движения!" Однако вполне
вероятно, что мы столкнемся с затруднениями, если произведем такое
введение знаков произвольно; например, наши маршруты могут обрывать-
Рис. 1.2. Схема одностороннего уличного
движения по городу, в котором все
путешественники скапливаются в пункте а
у
7
4
Канал /
Пункт а
25
ся в местах, в которые мы смогли бы добраться, но из которых не могли
бы выбраться (см., например, рис. 1.2; ему соответствует направление
движения на городских улицах, являющееся приемлемым лишь для
автовладельца, со стоянкой в пункте а). Нам бы хотелось на каждой улице
установить одностороннее движение таким образом, чтобы для каждой
пары пунктов хну было бы возможно (законным путем) достичь х из у
и у из х. Но всегда ли это возможно?
Для решения этой задачи предложим простую математическую модель
городской транспортной сети. Изобразим рассматриваемые пункты
точками и проведем между пунктами хну линию в том и только том случае,
J
> с
А
Ь « с П
Рис. 1.3. Рис. 1.4. Рис. 1.5. Рис. 1.6.
Рис. 1.3. Граф двустороннего движения по городу
Рис. 1.4. Выбор ориентации для графа на рис. 1.3
Рис. 1.5. Граф, представляющий несвязный город
Рис. 1.6. Линия а - мост
если х и у соединены улицей с двусторонним движением. Полученная в
результате фигура, образованная совокупностью точек и линий, является
математическим объектом, называемым графом или неориентированным
графом G. Простой пример такого графа представлен на рис. 1.3. В рамках
этой модели наша задача переформулируется следующим образом: можно
ли для каждой линии графа G ввести ориентацию или стрелку (знак
одностороннего движения) таким образом, чтобы при движении вдоль стрелок
на полученной фигуре (называемой ориентированным графом или
орграфом) из любой точки х была достижима любая точкам? Если такое
допустимо не всегда, то нужно определить, когда это возможно.
Для графа, изображенного на рис. 13, конечно, можно ввести
направление для каждой линии требуемым способом. Это сделано на рис. 1.4. Чтобы
достичь из произвольной точки любую другую достаточно просто двигаться
по часовой стрелке.
Однако не всегда можно получить нужное расположение стрелок.
Например, если наш граф состоит из двух отдельных частей, как граф,
изображенный на рис. 1.5, то не существует способа придать такое направление
линиям, чтобы из одной части графа можно было попасть в другую. Этот
математический вывод, переведенный на язык реального мира, означает,
что в ряде городов, например, в таких, для которых сети улиц с
двусторонним движением аналогичны представленной на рис. 1.5, невозможно
организовать удовлетворительное одностороннее уличное движение. Это
заключение легко поддается проверке! Возвращаясь к нашей модели,
воспользуемся этим примером, чтобы ввести некоторую терминологию по теории
графов. Мы будем говорить, что граф связен, если он состоит из
единственной части или, что эквивалентно, если для каждой пары точек* иу9
существует "цепь" из линий, соединяющих точки х и у. (В графе на рис. 1.6 а и d
соединяются следующей цепью: линия из а в Ь, затем линия из Ъ в с и,
наконец, линия из с в d. В графе на рис. 1.5 нет цепи, соединяющей точки а
26
ОС
А
I
i
I
1
a
a
J3
b
Рис. 1.7.
Рис. 1.8.
Рис. 1.9
Рис. 1.7. Линия а — мост
Рис. 1.8. Линия а - не мост
Рис. 1.9. Допустимая схема одностороннего движения для графа на рис. 1.8
и d. Уточним понятие "цепь" в гл. 2.) Для того чтобы в нашем графе можно
было ввести удовлетворительные (в нашем смысле) ориентации линий,
он должен быть, конечно, связным. Однако даже в связном графе может
не существовать допустимого выбора ориентации. Рассмотрим граф на
рис. 1.6. Он связен. Нужно выбрать ориентацию линии а. Если линия а
направлена из части / в часть //, то ни из одной точки части //нельзя достичь
какой-либо точки части /. Если же линия а направлена из // в /, то ни из
одной точки / нельзя достичь какой-либо точки //. Какими же особыми
свойствами отличается линия а? Ответ состоит в том, что это единственная
линия, соединяющая два отдельных "куска" графа. Иначе говоря, удаление
линии а (но не двух точек, которые она соединяет) приводит к несвязному
графу. Такая линия в связном графе будет называться мостом. На
рисунке 1.7 приведен другой пример моста а. Ясно, что если в графе G возможен
допустимый выбор ориентации, то граф G не только оказывается связным,
но и не должен иметь мостов.
Предположим, что на рис. 1.7 добавлен еще один мост 0 между двумя
отдельными кусками, связанными мостом а, получив при этом граф,
изображенный на рис. 1.8. Можно ли линиям нового графа придать
удовлетворяющие нас направления? Ответ на этот вопрос положителен.
Допустимый выбор показан на рис. 1.9. Но не противоречит ли это наблюдению,
сделанному ранее, а именно: если в графе G возможен допустимый
выбор ориентации, то в G нет мостов? Ответ — отрицательный. Причина
состоит в том, что мы слишком поспешно назвали 0 мостом. В рамках
нашей модели ни /3, ни а не будут мостами и для графа на рис. 1.8, Удаление
Р или а не приводит к несвязному графу. Таким образом, при создании
математических моделей использование общеупотребительной
терминологии требует осторожности.
Предположим теперь, что граф G обладает следующими свойствами:
он связен и не содержит мостов. Будут ли эти свойства достаточными,
чтобы гарантировать возможность введения направлений на линиях графа G
желаемым образом? Оказывается, что ответ на этот вопрос положительный.
Чтобы убедиться в этом потребуются несложные рассуждения с использо-
27
ванием аппарата теории графов, и поэтому мы откладываем их до § 3.3 *).
Более того, в том же параграфе мы представим алгоритм (пошаговую
процедуру), определяющий выбор ориентации линий связного графа
без мостов, удовлетворяющий установленному там критерию
достижимости.
Сформулируем теперь, наши математические заключения, как выводы
относительно реально существующей ситуации. Предположим, что
некоторый город состоит только из одного "куска", т.е. в нем каждая пара
пунктов соединяется последовательностью улиц с двусторонним движением.
Более того пусть в этом городе нет ни одной улицы с двусторонним
движением, перекрытие движения на которой сделало бы невозможным
передвижение из какого-нибудь пункта в некоторый другой. Тогда в городе
существует допустимый выбор направлений для одностороннего движения
на улицах. (Кроме того можно описать методы для нахождения нужного
выбора ориентации.) Этот вывод допускает проверку и приводит к
решению поставленной задачи.
Не всякий выбор направления движения на городских улицах
эффективен. Рассмотрим для примера схему улиц с односторонним движением,
представленную графом на рис. 1.9. Если некоторый субъект, находящийся
в пункте я, хотел бы достичь пункта Ь, то он, вероятно, попытался бы
сделать это по возможности быстро. Однако он вынужден добираться
длинным кружным путем. Короче, такой выбор ориентации удовлетворяет
установленному нами критерию, гарантирующему достижимость друг для
друга любой пары точек, но не обеспечивает эффективного разрешения
проблемы организации движения транспорта. Теперь требуется сделать
новый виток в контуре математического моделирования. Для этого следует
ввести понятие "эффективного" выбора направления одностороннего
движения и разработать алгоритмы, или процедуры, нахождения такого
выбора.
Необходимо отметить, что эффективность не всегда оказывается
основной целью при организации одностороннего движения. В системе
Национальных парков, расположенных по всей территории США, транспортные
перегрузки стали серьезной проблемой. Национальная служба парков США
приняла решение попытаться затруднить автомобильные поездки
посетителей по территории Национальных парков. Этого можно достичь
выбором очень неэффективной схемы одностороннего движения,
когда становится затруднительным добираться на автомобиле из одного
места в другое, а также путем поощрения использования других видов
передвижения, например, велосипедов или автобусов. На рис. 1.10 показана
примерная схема одностороннего движения в районе Йошемитской долины
Йошемитского национального парка, функционировавшая в течение лета
1973 г. 2) (Заметим, что в схеме предусмотрена дорога с двусторонним
*) Этот результат был впервые получен Роббинсом (Robbins [1939]) и явился
предвестником многих математических работ в области организации движения
транспорта.
2) В дополнение к организации на большинстве дорог одностороннего движения
служба парков полностью закрыла для автомобилей часть дорог.
28
Иошемитская
деревня Отель
Иошемитская Л^*00~ у> Йбани
хитина _
Зл ^^° щ Т*4^ Площадка
капитан^*^ \ ^4v_ стоянки
„Нижняя река7
Деребня
Карри
Сентинелскии
мост
К леднику р
Рис. 1.10. Схема одностороннего движения автомобильного транспорта в
Йошемитской долине летом 1973 г. По дорогам между Йошемитской деревней и
Йошемитской хижиной, Йошемитской деревней и Сентинелским мостом автобусы могут
ездить в обоих направлениях
движением; требование выбора на всех дорогах одностороннего
направления движения было бы, очевидно, слишком сильным1).)
Описанная система весьма неэффективна. Например, чтобы добраться
из Йошемитской хижины в Йошемитскую деревню, отстоящую от нее
по кратчайшей дороге на расстояние менее мили, необходимо
проделать весь объездной путь через мост, протяженностью свыше 8 миль!.
Однако новые атобусы, принадлежащие Парку, позволяют прибыть
непосредственно из Йошемитской хижины в Йошемитскую деревню. И много
людей пользуются этой возможностью!
Следующий виток в контуре математического моделирования может
потребовать определения неэффективной схемы одностороннего движения
и разработки алгоритмов, или процедур, ее нахождения.
Из приведенного примера легко видеть, что процесс математического
моделирования непрерывно ведет к последовательно усложняющимся
моделям. Это верно даже для такой развитой области науки, как физика.
(В конечном счете модели могут оказаться настолько сложными, что они
будут заменены другими более простыми моделями, позволяющими так
же или даже лучше объяснять реально происходящие явления. Одна из
причин, из-за которой Эйнштейн стремился к использованию теории
относительности вместо ньютоновской физики, была крайняя простота его
теории.) В любом случае модель всегда считается предварительной и должна
постоянно оцениваться и обосновываться.
§ 1.3. Этапы процесса математического моделирования
В представленном выше описании процесс математического
моделирования разделен на четыре этапа. Следует подчеркнуть различие между
этапом трансляции, на котором происходит переход от сведений о
реальных явлениях к математической модели (т.е. построение модели), и
этапом прогнозирования, которое состоит в следующем. Первый этап -
1) В этой ситуации вообще не существует допустимого выбора направлений, при
котором на каждой улице устанавливается одностороннее движение. Почему?
29
индуктивный: на основе ряда наблюдений угадывается общая
закономерность. Второй — дедуктивный: на основе принятых допущений и хорошо
известных правил вывода приходят к определенным заключениям. В
течение многих лет вопрос о различии между индуктивным и дедуктивным
подходами был предметом споров между философами и мы не
намереваемся возобновлять эту дискуссию. Достаточно сказать, что, как правило,
индукция не обосновывается точными законами. В лучшем случае общая
картина, полученная из наблюдений ряда частных случаев, есть нечто, что
может быть познано из опыта; в худшем случае — только то, в чем мы
никогда не можем быть полностью уверены1). Следовательно нельзя
утверждать, что существует единственная "правильная" модель. А поэтому
в некотором смысле невозможно и обучение искусству математического
моделирования. С другой стороны, по крайней мере в идеальном случае,
дедукция или дедуктивные рассуждения строятся на очень строгих
правилах вывода. Пользоваться ими можно обучить, в принципе, любого, и
усвоивший их обладает надежным методом проверки спорных аргументов.
Этой чертой дедуктивного метода объясняется основное преимущество
математического моделирования. Приняв допущения, на основе которых
неточную ситуацию можно перевести в точную, мы уже не можем
оспаривать сделанные выводы: их истинность или ложность зависят только от
этих допущений. Единственно, что можно оспаривать - это способ перехода
от неточной ситуации к модели или более конкретно: насколько правильно
были сделаны предположения. Циклическая процедура математического
моделирования и предназначена для испытания корректности принимаемых
допущений.
Из дедуктивного метода возникает еще одно преимущество
математического моделирования: в некотором смысле вся математика представляет
собой совокупность методов для дедуктивных выводов, и вся мощь
математики становится пригодной для получения всевозможных заключений
о нашей модели 2). Иногда, когда математические задачи, возникающие
при анализе модели и выработке прогчозов, слишком трудны для решения,
анализ модели может быть проведен имитационными методами с помощью
ЭВМ. Один из подходов к имитационному моделированию на ЭВМ состоит
в моделировании случайных воздействий посредством датчика случайных
чисел. Основываясь на допущениях, заложенных в модели, компьютер
производит некоторые прогнозы. В такой ситуации результаты расчетов
не обязательно приводят к дедуктивным прогнозам. Машинное
моделирование становится очень важным при анализе математических моделей,
которые не поддаются дедуктивному анализу, обычно в тех случаях, когда
1) Рассказывают историю о бедном цыпленке, который каждый день после восхода
солнца получал свой корм. Но в один день, когда взошло солнце и цыпленок
направился к кормушке, он встретил лишь фермера с топориком в руке.
2) Читатель заметит, что на протяжении короткой главы мы ссылались на
математику и как на язык, и как на совокупность методов для дедуктивных выводов. Оба
эти представления выражают обоснованный взгляд на различные роли, которые играет
математика, и на различные аспекты ее природы. В целях лучшего ознакомления
с философскими вопросами математики читатель может обратиться к книгам: Cohen,
Nagel [1934], Hempel [1953], Wilder [1952], Whitehead [1953],Camap [ 1939],Kemeny
[1959, гл. 2].
30
математические трудности слишком велики. Однако оно в такой степени
отличается от других методов, рассматриваемых нами, что это оправдывает
его отсутствие в тексте книги.
Третий этап в процессе моделирования — переход от математических
выводов к следствиям для реального мира не оказывается в той же степени
трудным, что и первый этап — процедура перевода реального явления в
модель. Если этот первый этап выполнен достаточно тщательно, то
математические заключения или прогнозы должны легко интерпретироваться
как выводы или прогнозы для реального мира.
Сравнение этих выводов с исходными данными включает решение
вопроса о степени точности прогнозов (и, следовательно, модели). Ответ
на него зависит от того, как предполагается их использовать. Так,
допустим, что некоторая модель описывает концентрацию окиси углерода в
воздухе в определенном месте. Если модель используется для принятия
решений о возможном сокращении автомобильного движения, она не
обязана быть слишком точной, однако ее справедливость сохраняется лишь
в пределах определенного региона. Если же модель применяется к
конкретному больничному помещению, где будут происходить операции на сердце
и легких, она должна быть значительно более точной.
Среди методов, используемых для проверки точности модели, основным
средством является статистика. В этой книге такие методы не описываются
и не уделяется много внимания этапу проверки адекватности модели.
В основном она посвящена развитию математического языка,
используемого при создании математических моделей, и разработке для них достаточно
мощных математических методов анализа и прогноза.
Попытки получить при помощи модели математические прогнозы часто
приводят к созданию нового математического аппарата. Ньютон, Лейбниц
и другие ученые разработали дифференциальное исчисление в процессе
занятий физикой. Многие разделы математики, рассматриваемые в этой
книге, были развиты учеными в процессе исследования социальных и
биологических проблем, вопросов охраны окружающей среды и создания
математических моделей в этих областях. В свою очередь, новые математические
методы, разработанные при моделировании, могут применяться к другим
задачам, зачастую значительно отличающимся от задач, которые их
породили. В дальнейшем мы приведем ряд подобных примеров.
§ 1.4. Типы моделей
Известно много типов математических моделей. Существует тип
моделей, служащий всего лишь для перевода неточных понятий в точные.
Процесс простроения такой модели называется экспликацией Карнапом
(Сагпар [1950]), Хемпелом (Hempel [1952]), Кемени (Kemeny [1959]) и
Другими. Теория баланса в малых группах,которая будет изложена в § 3.1,
служит примером экспликации. То же можно сказать о теории измерений,
развиваемой в гл. 8.
Некоторые математические модели являются детерминированными,
тогда как другие - вероятностными. Детерминированные модели дают
точный прогноз, вероятностные — прогноз о том, что некоторое событие
произойдет в определенный отрезок времени или с определенной вероят-
31
ностью. В этой книге в основном рассматриваются детерминированные
модели. В значительной степени такой особенностью обладают модели,
основанные на теории графов, такие, как например, модели движения
транспорта или цепей питания. С другой стороны, модели в генетике или теории
обучения, использующие цепи Маркова, по своей природе вероятностные.
Некоторые математические модели являются прескриптивными, тогда
как другие - дескриптивными. Прескриптивная модель описывает, как
некоторое лицо, группа, общество, правительственный орган должны были
бы вести себя в некоторой идеализированной ситуации. Дескриптивная
модель описывает, как они себя в действительности ведут. Таким образом,
если предпочтения или выбор исследуются на основе прескриптивного
подхода, то аксиомы главы 8, которые формулируют необходимые и
достаточные условия возможности измерения или шкалирования предпочтений,
должны интерпретироваться как условия "рациональности", причем
ожидается, что предпочтения "рациональной" личности, группы, общества,
правительственного органа будут удовлетворять правилам, заданным в этих
аксиомах. С другой стороны, если предпочтения или выбор исследуются
на основе дескриптивного подхода, то эти условия считаются
проверяемыми и они должны сравниваться с исходными данными (о том, как лицо,
группа, общество или организация осуществляет выбор). Тогда, если
аксиомы не выполняются, можно пытаться модифицировать модель
измерения или шкалирования. Первоначальная модель была в этом случае
ошибочной для описания предпочтений.Конечно, одна и та же модель может
рассматриваться лишь как прескриптивная, либо как дескриптивная. Обе
точки зрения часто плодотворны и мы используем в этой книге и ту, и
другую.
В качестве заключительного замечания отметим, что существует много
типов нематематических моделей. Например, мы нередко можем
моделировать процесс на физической модели и подвергать ее проверке. Примерами
являются уменьшенные в масштабе модели новых самолетов. Испытания
на стенде и в аэродинамической трубе моделируют проблемы, которые
могут возникнуть при разработке новых автомобилей, самолетов и других
конструкций. Часто процесс моделирования заключается в графическом
представлении объекта. Примером являются дорожные схемы. Во всех
подобных случаях модель служит средством для лучшего понимания
процесса, явления, ситуации, поведения и т.д. Математическую модель отличает
от моделей других типов то, что для ее исследования, а значит, и для
изучаемого процесса, используется мощь дедуктивного подхода математики. В
следующих главах мы представим много новейших методов математической
дедукции и применим их к анализу математических моделей социальных
и биологических явлений, моделей, связанных с экологией и проблемами
охраны окружающей среды.
Упражнения
1. Какие из графов на рис. 1.11 связны?
2. В каждом графе на рис. 1.11 найти все мосты.
3. В каждом графе на рис. 1.11 найти допустимую схему одностороннего движения,
если она существует.
4. а. Предложить строгое определение эффективности для схемы одностороннего
уличного движения.
32
be f
abed
d a
h
a—" < '
abed a i
/
1
;*;
7 *
! d
Л
e f
a b с d e f
J ,
а
I .
к I
Рис. 1.11. Графы к упражнениям гл. 1
б. В каждом графе на рис. 1.11 найти неэффективную схему одностороннего
уличного движения, если она существует.
в. В каждом графе на рис. 1.11 найти эффективную схему одностороннего
движения, если она существует.
г. Привести примеры реальных схем одностороннего уличного движения и
исследовать вопросы их эффективности, используя ваше собственное определение.
д. Есть ли другие варианты определений эффективности? (Примечание.
Дальнейшие упражнения по выбору схем одностороннего уличного движения можно найти
в § 3.3.)
3. Ф.С. Роберте
33
Глава 2
ГРАФЫ
§ 2.1. Некоторые примеры
В главе 1 мы ввели понятие математического объекта, называемого
графом, в связи с обсуждением проблем организации движения по
городской уличной сети. Теория графов — старая наука, которая в последние годы
привлекла к себе большой интерес. Ее тематика всегда была тесно связана с
приложениями. Начало этой науке было положено Эйлером (Euler [1736])
при решении известной задачи о кенигсбергских мостах (рис. 2.1) О.
Теория графов позднее применялась Кирхгофом (Kirchhoff [1847])
при исследовании электрических сетей, Кели (Cayley [1857,1874]) в
органической химии, Гамильтоном для решения головоломок и многими
математиками и нематематиками, занимающимися картографией
и'раскраской карт. В XX веке теория графов широко использовалась в социально-
экономических и биологических науках, для исследования проблем
экологии и охраны окружающей среды. Например, решение Эйлера задачи о
кенигсбергских мостах и относящиеся к нему математические теоремы
об эйлеровых "цепях" и "циклах" были недавно применены к планирова-
Чикаго
Чикаго
Спрингашьд
Рис. 2.1. Кенигсбергские мосты
Олбани
Нью-Йорк
Спрингфшьв
Майами
Рис. 2.2. Беспосадочные воздушные линии
Майами
!) Город Кенигсберг имел семь мостов, соединяющих острова на реке Преголь с
берегами и друг с другом таким образом, как показано на рис. 2.1. Жителям хотелось
узнать можно ли, выйдя из произвольной точки вернуться в нее, проходя по каждому
мосту ровно один раз. Знаменитый Математик Эйлер переформулировал этот вопрос
как задачу теории графов. Для дальнейшего обсуждения см. Eulei [1953] или Нагагу
[1969,гл.7].
34
Капитан
рис. 2.3. Сеть коммуникаций
подразделения полицейской службы
Лейтенант IS ^W Лейтенант 1
обои
полисмен 2
Постовой .
ыр полисмен 1
мо биль 2
нию движения подметальных машин в больших городах, что дало большую
экономию (Ticker, Bodin [1975]). Эти теоремы также применяются в
технике связи и криптографии (Berge [1962, р. 168] О, в генетике Hutchin-
son [1969],Hutchinson,Wilf [1975]).
Для иллюстрации применений теории графов и обоснования формальных
определений графа и ориентированного графа, которые даются ниже,
рассмотрим несколько примеров. Графы и ориентированные графы
возникают при анализе различных транспортных проблем, отличающихся от
задачи об одностороннем движении, которая обсуждалась в гл. 1. Например,
рассмотрим произвольное множество пунктов в данном районе, между
которыми желательно организовать движение автомобилей, перевозку
грузов, людей и т.д. Пунктами могут быть города, склады, уличные
перекрестки, аэродромы и т.д. Изобразим эти пункты точками, как показано
на рис. 2.2, и проведем стрелку или ориентированную линию из пункта х в
пункт у, если допустимо перемещение грузов, людей и т.п.
непосредственно из х в у. Уже встречавшаяся ситуация, когда все связи являются
двусторонними, может быть представлена более простым, способом. В этом
случае между двумя непосредственно связанными пунктами проводится
одна неориентированная линия, а не две линии со стрелками
(снова см. рис. 2.2). Дня таких транспортных сетей представляют интерес
вопросы о том, как их спроектировать, чтобы перевозки были эффективны,
как гарантировать, чтобы сеть не распадалась на отдельные части при
разрушении некоторых звеньев и т.д.
Графы применялись и при исследовании коммуникаций. Рассмотрим
комиссию, административный орган или любую аналогичную
организацию, в которой имеют место связи между ее членами. Представим каждого
плена организации точкой, как на рис. 2.3, и проведем линию со стрелкой
от участниках к участнику .у, если* может непосредственно обратиться к у.
Так, например, в полицейском подразделении, возможна структура,
изображенная на рис. 2.3; капитан может непосредственно связываться с
диспетчером, который в свою очередь может обратиться к капитану через
любого из лейтенантов 2) .Типичные вопросы о такой "сети коммуникаций"
1) В русском издании этой книги см. с. Ш. (Примеч.
' См. Kemeny, Snell [1962, гл. 8] для более подробного обсуждения
аналогичной сети коммуникаций для полицейской службы.
3* 35
аналогичны вопросам о транспортных сетях: как спроектировать такую
сеть эффективно, насколько легко разрушить связи и т.д.
Графы также возникают при исследовании сетей питания в экологии.
Рассмотрим несколько различных видов животных1), которые составляют
экосистему. Представим виды точками, как на рис. 2.4, и проведем
стрелку от вида х к виду у, если х может использовать в качестве продукта
питания вид у. Относительно таких сетей питания естественно вновь
поставить вопрос о том, насколько они становятся более уязвимыми при
удалении или добавлении новых видов. Важно было бы научиться измерять
сложность сетей, поскольку старый экологический принцип гласит, что
Птицы Лэйбер Роздал
Лисы Насекомые Трава Олени Смит Зш
Рис. 2.4. Сеть питания
Рис. 2*5. Турнир
увеличение сложности экосистемы соответствует уменьшению
уязвимости. Интересно также проанализировать вопросы о "статусе" различных
видов в сети питания и попытаться выявить "важные", или критические,
виды.
В качестве еще одного использования графов, рассмотрим круговой
турнир2) в теннисе, в котором каждый игрок должен сыграть с каждым
другим игроком ровно один раз, а ничьи не допускаются. Можно
представить игроков точками и проводить стрелку от игрока х к игроку у>
если х "побеждает" у, как на рис. 2.5. Аналогичные турниры возникают в
удивительно большом числе областей социальных и биологических наук,
в экологии и при исследовании проблем охраны окружающей среды.
Психолог проводит эксперимент по выявлению предпочтений путем парных
сравнений на заданном множестве альтернатив, обращаясь к некоторому лицу,
с тем чтобы им для каждой пары альтернатив была указана
предпочтительная. Такая процедура также определяет турнир, если в качестве "игроков"
мы будем рассматривать альтернативы, а "выигрыш" будет пониматься
как "предпочтительность". Турниры возникают и в биологии. Обнаружено,
что на птицеферме для любых двух цыплят, один "доминирует" над
другим. Это "упорядочение клевками" среди цыплят вновь определяет турнир.
В исследованиях турниров основная проблема состоит в нахождении
"победителя" и ранжировании игроков. Теория графов будет полезной и здесь.
Рассмотрим более общий случай - произвольную игру, такую, например,
как шахматы, бридж и т.д. Пусть различные позиции игры представлены
точками, как на рис. 2.6,а и от позиции х к позиции у проводится стрелка,
если некоторый допустимый ход переводит игру из позиции х в позицию .у.
1) Слово "виды" используется здесь в нестрогом смысле.
2) Его следует отличать от более привычного турнира с выбыванием.
36
(W)
Рис. 2.6. Игры. Фрагмент возможных позиций игры в крестики и нолики, в которой
первым ходом ставится крестик (я),и вектор выигрышей, первая компонента
которой соответствует выигрышу игрока 7, вторая - игрока 2 и третья - игрока 3 (б)
Изображенный орграф выражает предпочтение группы, состоящей из игроков 1 и 3
Заключительными позициями игры являются такие, из которых не выходят
стрелки, и для каждой из них правилами игры определяется победитель.
В отличие от этой ситуации, рассмотрим игру со многими игроками, число
которых обозначим через п. Пусть возможные исходы игры (распределения
выигрышей) изображены точками. Для каждой группы игроков S
построим свою диаграмму, как на рис. 2.6,5, проводя стрелку от возможного
исхода х к возможному исходу у9 если для группы S х предпочтительнее у.
(Точнее, теория игр имеет дело с "эффективным предпочтением", т.е.
предпочтением, навязанным группой.) Теория игр двух лиц занимается
вопросами оптимальных стратегий конкретных игроков. Теория игр п лиц, которая
будет рассматриваться в гл. 6, исследует процесс при определении
распределения выигрышей между игроками. Такие игры п лиц являются весьма
общими. В определенном смысле игры — все экономические рыночные
операции, процедуры принятия решений в законодательных органах,
переговоры в международных делах, например, о разоружении и др.
Все эти примеры приводят к понятиям ориентированных или
неориентированных графов. Говоря точнее, определим ориентированный граф или
орграф, D парой (V, А), где V — некоторое множество, а А — множество
упорядоченных пар элементов из V. V будет называться множеством
вершин, А — множеством дуг. (Некоторые авторы называют вершину также
узлом, точкой и т.д., а дугу — стрелкой, ориентированной линией,
ориентированны^ ребром или звеном.) Если рассматривается несколько
орграфов, мы будем обычно использовать обозначение V(D) и A (D) для
множеств вершин и дуг D соответственно. Обычно орграфы имеют простые
геометрические представления (диаграммы),такие, как на рис. 2.7,
которые указывают на большое разнообразие орграфов. На них вершины
изображаются точками, а ориентированная линия (или стрелка), ведущая
°т и к v, проводится тогда и только тогда, когда (и, и) входит в А.
Например, в орграфе Ds на рис. 2.7 множеством вершин V является множест-
во {и, у, w, х }, а множеством дуг А — множество { {и, v), (м, w), (v,w),
Если имеется дуга из вершины и к вершине и, мы будем говорить,
что и смежна с у. Таким образом, на рис. 2.7 в орграфе Ds вершина v
смежна с вершиной w, w смежна с х и т.д.
37
иииишхиишх
3°
" P. . 9
»*-g и^
ji;
t и и z
ut9 VZO
Рис. 2.7. Орграфы
Читатель должен заметить, что конкретное расположение вершин при
геометрическом представлении орграфа не принципиально. Расстояния
между вершинами не имеют значения, природа соединяющих их линий
не важна и т.д. Более того пересечение двух дуг также несущественно,
точка пересечения не обязательно является вершиной орграфа. (Одна из
38
интересных задач, которую мы обсудим в гл. 3, состоит в выработке
критерия возможности расположения орграфа без пересечения дуг в точках,
отличных от вершин.) Вся информация при геометрическом представлении
орграфа содержится в наблюдении о том, соединена или нет данная пара
вершин ориентированной линией, или дугой, и в каком направлении. Таким
образом, орграфы Ds и D6 на рис. 2.7, например, изображают один, но по-
разному нарисованный орграф.
Вполне возможно, что в некотором орграфе имеются дуги в обоих
направлениях, например, отики и от и к и, как в орграфе Ds на рис. 2.7.
Возможно, также, что имеется дуга, начинающаяся и заканчивающаяся в
одной и той же вершине (например, орграф Ds). Такая дуга называется
петлей. Не допускается, однако, наличие более одной дуги от и к и. Часто
в теории и приложениях орграфов такие кратные дуги оказываются
полезными - это справедливо, например, при изучении химических соединений,
и тогда исследуются мулыиграфы или, точнее, мультиорграфы вместо
орграфов.
Очень часто дуга от и к v существует лишь при условии наличия дуги
от и к и. В этом случае мы будем говорить, что орграф (V, А) является
графом. На рис. 2.8 приведено несколько графов. На диаграмме графа
можно отказаться от стрелок и заменить пару дуг между вершинами и и v
единственной неориентированной линией, соединяющей и и и. (В этом
случае ориентированная петля, заменяется неориентированной1).) Мы будем
такую линию в графе называть ребром и понимать под ним
неупорядоченную пару вершин {и, v} . (Вершины и и v не обязательно должны
различаться.) Геометрические представления графов, полученные из рис. 2.8
таким способом, приведены на рис. 2.9. Таким образом, граф можно
определить, как пару (V, Е), где V — множество вершин, а Е — множество
ребер, т.е. неупорядоченных пар элементов из V. Если рассматривается
несколько графов, мы будем использовать обозначения V(G) и E(G) для
множеств вершин и ребер графа G соответственно.
Целесообразно сформулировать некоторые допущения о
рассматриваемых орграфах и графах. Многие ученые, занимающиеся теорией графов,
принимают следующее допущение: в них отсутствуют кратные дуги или
ребра, иначе говоря, вершина и с вершиной v соединена не более чем одной
дугой или ребром. Для нас это предположение содержится в нашем
определении орграфа или графа. Мы примем, по крайней мере на первое время,
что орграфы и графы не имеют петель. (Почти все, что мы будем говорить
об орграфах и графах, не содержащих петли, будет справедливо и при
наличии петель.) Мы также ограничимся орграфами или графами на
конечных множествах вершин. Суммируем эти предположения следующим
образом:
Допущение: Если не оговорено противное, все орграфы и графы в этой
книге определены на конечных множествах вершин. Все орграфы и графы
в гл. 2 и 3 не имеют петель. В орграфах и графах не допускаются кратные
дуги или ребра.
) Такое определение не общеупотребительно. Так в книге Нагагу [1969] петли не
Допускаются, а мулыиграфы с петлями называются псевдоорграфами. (Примеч. пер.)
39
и и w
и и ш
ш
Рис. 2.9. Графы, приведенные на рис. 2.8, в которых дуги заменены ребрами
В гл. 1 было показано, как при помощи теории графов может решаться
задача о городских транспортных потоках. В этой и следующих главах
мы применим теорию графов к проблемам перевозок, коммуникаций,
сетей питания, турниров, генетики, археологии и к многочисленным
другим задачам. В дальнейших главах также будет использоваться теория
графов, хотя наши графы и орграфы будут иметь иную структуру. В § 3.1
на ребрах графа вводятся знаки (+ или -) и полученный знаковый граф
применяется для моделирования социологической концепции баланса в
малых группах. В гл. 4 каждой дуге орграфа мы припишем действительные
числа (веса) и используем полученные взвешенные орграфы при
исследовании такой общественно важной проблемы, как увеличивающийся спрос
на энергию. В гл. 5 веса взвешенного орграфа интерпретируются, как
вероятности, и излагаются модели для исследования экосистем, генетических
проблем, денежных потоков, процессов обучения, распространения
влияния и т.д. В гл. 6 и 8, орграфы будут представлять отношения
предпочтения среди альтернатив в многочисленных ситуациях,, включающих игры,
сделки, коллективный выбор и принятие решения.
Перед рассмотрением приложений и построением математических
моделей, необходимо познакомиться с языком, используемым в
соответствующих математических методах. На этом языке мы сконцентрируем свое
внимание в этой главе.
Упражнения
1. В орграфе на рис. 2.4 определить: а - множество вершин; б - множество дуг.
2. Повторить упражнение 1 для орграфа на рис. 2.5. -
3. Повторить упражнение 1 для орграфа /), 0 на рис. 2.7.
40
4. В каждом из графов на рис. 2.9 определить: а - множество вершин; б -
множество ребер.
5. В орграфе Dn на рис. 2.7 найти вершину, смежную с вершиной .у.
6. Нарисовать транспортную сеть между городами Нью-Йорк, Париж, Вена,
Вашингтон (округ Колумбия) и Алжир, используемыми в качестве вершин, с ребром,
соединяющим два города, если из одного в другой можно проехать по шоссе.
7. Нарисовать сеть коммуникаций для отряда по борьбе с лесными пожарами.
8. Нарисовать сеть питания для какой-либо экосистемы.
9. Нарисовать орграф, изображающий футбольный турнир между командами из
Принстона, Харварда и Йеля. Принстон побеждает команду Харварда, Харвард
побеждает команду Йеля и Йель побеждает команду Принстона.
10. Нарисовать орграф, представляющий следующую игру. Бросается монета до
I
Рис. 2.10. Острова и мосты к упражнению 11 § 2.1
тех пор, пока не выпадает дважды герб или решка. Если сначала два раза выпадает
герб, побеждает игрок 1, в противном случае побеждает игрок 2.
11. Переформулировать задачу о кенигсбергских мостах, как задачу теории
графов. {Указание, Использовать мультиграф.) Определить, если это возможно, путь
желаемого типа. Для этого вначале рассмотрите более простые ситуации, показанные
на рис. 2.10.
§ 2.2. Связность1)
2.2А. Достижимость. При рассмотрении сети коммуникаций естественно
задать вопрос о возможности передачи сообщения одним лицом другому.
Для транспортной сети аналогичным является вопрос — может ли
автомобиль попасть из пункта и в пункт vl В игре оказывается важным узнать
приводит ли данная позиция в конечном счете к выигрышной. В экологии
интересно проследить цепь хищников от одного вида к другому.
Все эти примеры сконцентрированы вокруг представления о
достижимости в орграфе D - (V, А): можем ли мы достичь вершины и, отправляясь
от вершины и, следуя в направлении стрелок?
Чтобы уточнить понятие достижимости введем несколько определений 2).
Путем в орграфе D называется последовательность
Ui,ai,U2,a2,...,Ut,at>Ut+i> A)
где t > 0, щ (/ = 1, 2, ...,/ + 1) - вершина из V nat (/ = 1,2,..., t) -
дуга (w/, w/+i) из А, Иначе говоря, дуга at соединяет щ с w/+i. Следуя по
пути A), мы перемещаемся от и\ к и2, от и2 к иъ и т.д., пока не
достигнем ttf+i.
Поскольку t может равняться 0, единственная вершина и\ также
является путем, а именно, это путь из ut в их.
1) Изложение в этом и следующих двух параграфах в основном базируется на
книге Нагагу, Norman, Cartwright [1965].
2) Отметим, что введенная здесь терминология не общепринята. Сравнить,
например, с книгой Нагагу [1969]. {Примеч. пер.)
41
Путь A) называется простым путем, если в нем ни одна вершина не
используется более одного раза 1). Например, в орграфе Dn на рис. 2.7 м, (и, у),
у > (v, w) - простой путь, а и, (w, v), и, (и, >>),у, (у, х), д:, (х, v),v, (v,w) fw -
путь не являющийся простым, поскольку вершина v встречается в нем
дважды.
Перечисление дуг, относящихся к некоторому пути, излишне, поэтому
мы просто называем A) путем щ, и2,..., ut, ut+x.
Путь A) называется замкнутым, если ut+1 = ux. Следуя по
замкнутому пути, мы возвращаемся в начальную точку. Если путь A) замкнут, а
вершины u\, и2, . . . , ut различны, то A) называется контуром (простой
замкнутый путь). (Читателю следует иметь ввиду, что, если вершины щ
различны, то и дуги должны также быть различны.)
Заметим, что путь и, u, w, х, и в орграфе Ds на рис. 2.7 является
контуром, так же как и путь и, и, и>, х,у, ив орграфе D2 о. Но замкнутый путь и,
v, yt х, v, yf х, и в орграфе D7 не будет контуром, поскольку содержит
повторяющиеся вершины. Обычно при подсчете или перечислении контуров
орграфа, мы не будем различать два контура, начинающиеся в различных
вершинах, если вершины и дуги встречаются в одинаковом порядке. Так,
в орграфе Z>2 0 на рис. 2.7 контур w, x, у, и, и, w считается совпадающим
с контуром и, v, w, х, у, и. Длиной пути, простого пути, контура и т.п.
является число дуг в них. Таким образом, путь A) имеет длину /. В орграфе Dn
на рис. 2.7 и, v, у, х, v это путь длины 4, и, v, у, z — простой путь длины 3
и и, v, y,x,v — контур длины 4.
Мы будем говорить, что вершина v достижима из вершины м, если
имеется путь из и в и. По определению отдельная вершина и считается путем,
поэтому каждая вершина и достижима сама для себя.
Теорема 2.1. Если v достижима из м, то существует простой путь из и в v.
Доказательство2). Поскольку путь из и в и существует, можно
выбрать кратчайший. Обозначим этот путь щ, и2, . . . , ut, ut+i, где и = их
и v = Wf+i. Если этот путь не простой, то найдутся такие i < /, что щ и
Uj совпадут. Тогда легко убедиться, что и\, и2>..., uit w/ + 1, w/+2> • •» Щ+1
также является путем из и в и, причем более коротким, чем
первоначальный, что приводит к противоречию. Таким образом, исходный путь был
простым."
Для сетей коммуникаций теорема 2.1 имеет следующую прозрачную
интерпретацию: если некоторое лицо имеет возможность отправить
сообщение другому лицу, то сможет сделать это так, что никто не услышит
сообщения дважды.
2.2.2. Расстояние 3). Если мии - вершины орграфа D = (К, А), то под
расстоянием от и до v будем понимать длину кратчайшего пути из и в у.
1) Одна из трудностей в изучении теории графов состоит в большем числе
терминов, с которыми вначале нужно ознакомиться. Чтобы помочь читателю в ее
преодолении, мы включили термины путь, простой путь и т.д. в словарь в конце главы.
Понятия, относящиеся к достижимости перечисляются также в табл. 2.1.
2) Повсюду в этой книге доказательства могут быть опущены без потери
непрерывности понимания излагаемого материала. Однако читателю рекомендуется проследить
по возможности наибольшее число доказательств.
3) Этот пункт можно опустть.
42
Таблица 2.1
Достижимость и соединимость
Орграф D
Щ,а1,и2,а2,
ut, att ut+1
достижимость
соединимость
ul,el,u2,e2, ut,et, ut+i
Путь
Простой путь
путь и щ различны
Замкнутый путь
Полупуть
ИЛИ (Uf+l.ty)
Прости полупуть
полупуть и щ различны
Замкнутый полупуть
Контур {простой
замкнутый путь)
путь
и,-различны, / <г
(в; различны)!)
Полуконтур (простой
замкнутый полупуть)
полупуть
щ различны,/
Д/ различны
1) Это следует из того, что щ различны, / < t.
Цепь
Простая цепь
цепь и щ различны
Замкнутая цепь
Цикл (простая
замкнутая цепь)
цепь
ut+l = «1
щ различны,/ <t
е; различны
Заметим, что из и в v может быть несколько кратчайших путей. В то же
время может оказаться, что из и в v вообще нет путей; в этом случае мы
Скажем, что расстояние не определено. (Из доказательства теоремы 2.1
следует, что кратчайший путь является простым.) Расстояние ст и до v
обычно обозначается символом d(u, v). Читатель заметит, что d(u, v) не
удовлетворяет всем обычным условиям для функции расстояния. В
частности, она не обязательно симметрична: возможно, что d(u, v) ?^d(v, и).
В качестве примера, рассмотрим орграф Д8 на рис. 2.7. Имеем d(м, v) = 1,
поскольку и, v — путь, но d(v, и) =5, поскольку кратчайшим путем из v
в и является и, w, х, у, z, w. В орграфе Д 7 d(u, у) = 2, так как кратчайший
путь из и в у есть w, z, у. Но d(y, и) = 1, поскольку у, и — путь из у ви,
В орграфе А о d (и, z) =4, так как и, н>, х, у, z это кратчайший путь из и в z.
Но d(z, и) не определено поскольку нет пути из z в и. Наконец, поскольку
одна вершина и сама является путем, мы имеем d(u,u) =0 для всех
и (табл. 2.1)
При некоторых условиях d удовлетворяет одному из традиционных
свойств функций расстояний, а именно, неравенству треугольника. Так,
имеет место следующий результат:
Теорема 2.2. Если v достижима из и и w достижима из и, тогда d(u, w) <
Доказательство. Пусть d(u, v) = s, d(vy w) =t и u,u2,u3t...
•, us, v - кратчайший путь измви,аи,у2,и3,...,иг, w - кратчайший
43
путь из v в w. Тогда и, Мг, "з, •.., Щ, v, v2, v3, ..., vt, w - путь длины
j+/h3mbw,h мы заключаем, что d(u, w) <s + 't = J(w, u) + <i(u, w). ¦
2.2.3. Соединимость. Наши представления о понятии достижимости
можно проиллюстрировать рассмотрением сетей коммуникаций. Точнее,
обратимся к организации полицейской службы и вернемся к фрагменту сети
коммуникаций полицейского подразделения, представленному орграфом
на рис. 2.3. Полисмены, находящиеся на постах, могут связаться с
капитаном, вызывая дежурного сержанта. Таким образом, капитан достижим для
каждого полисмена. Но для капитана полисмены не достижимы. Капитан
может, однако, все же связаться с полисменом, используя посредника.
Он может вызвать сержанта и затем ждать, пока полисмен не вызовет
последнего. В этом смысле и капитан, и каждый полисмен "соединимы" в
сеть коммуникаций или орграфе. Это понятие соединимости можно
уточнить, говоря, что вершины и и v в орграфе соединимы, если v можно
достичь из w, не обязательно следуя по дугам в направлении их
ориентации *).
Совсем строго, пусть t>09 тогда
B)
- полупуть, если и/ - вершина / = 1, ..., t + 1, at — дуга, и at — либо дуга
("/> Щ+1), либо дуга (щ+1, щ).
Полупуть называется простым, если в нем никогда не используется ни
одна вершина более одного раза. Он замкнут, если wl+1 = и\ 2).
Замкнутый полупуть B), в котором различны и вершины их, и2, ..., ut, и дуги
#i, а2, ..., я* называется полуконтуром 3). И наконец, длиной полупути,
простого полупути, полуконтура и т.д. называется число входящих в них
дуг. Например, в орграфе D15 на рис. 2.7 и, (и, х),х, (у, х),у, (у, у), и,
(и, x),xt (x, w),w есть полупуть. Он не является простым полупутем, так
как вершина х повторяется. В орграфе Dn и, (и, и), v9 (и, w>), w, (z, w),
z - полупуть, причем простой. Он отличается от полупути и, (и, w), v, (v ,w),
w, (z, w), z в том же орграфе: первый из них использует дугу (и, и),
последний - дугу (р, и). Кроме того, в орграфе Dn и, (и, и), и, (х, v), х, (х, м),
и есть полуконтур длины 3, но замкнутый полупуть у, (v, w) , w, (v, w), v
не будет полуконтуром, поскольку дуга аг совпадает с дугой at 4).
Формально говорят, что вершина и соединима с вершиной и, если
существует полупуть из и в v. Заметим, что если и соединима с и, то и у соединима
с и. Полупуть из и в v можно заменить на противоположный, чтобы
получить полупуть из v в и. Таким образом, мы можем называть
миисоединимыми независимо от их порядка. В сети коммуникаций полицейского
подразделения на рис. 2.3 вершины, соответствующие лейтенанту 2 и
постовому полисмену 1 соединимы, следующая последовательность являет-
1) Оставшуюся часть этого пункта можно при чтении опустить.
21 Эти понятая суммируются в табл. 2.1.
Ниже мы увидим, почему добавлено ограничение о том, что дуги различны.
4) Заметам, что в нем вершины и1, и2,..., ut различны; вот почему мы добавили
требование, что дуги ах, аг,..., at также должны различаться.
44
ся полупутем: лейтенант 2 (лейтенант 2, дежурный сержант), дежурный
сержант, (постовой полисмен i, дежурный сержант), постовой полисмен 1.
В графе, т.е. в орграфе, в котором (и, v)€A тогда и только тогда, когда
(и, и) ? А, понятия достижимости и соединимости совпадают. Другими
словами, вершина и достижима из вершины v в том и только в том случае,
если и соединима с и. Почему это так? Мы вернемся к случаю графов ниже.
2.2.4. Категории связности. Одна из причин плодотворного
использования теории графов состоит в том, что геометрическая точка зрения
позволяет нам определять различные структурные понятия. Одним из таких
понятий является связность. Степени связности, которые мы введем,
сделают более точным представление о том, что некоторые орграфы
"сцеплены" лучше других. Например, на рис. 2.7 орграф D9 не связен и
распадается на две отдельные части, одна из которых состоит из вершин и, и, w, a
другая — из вершин х, у и z. Каждая часть, по-видимому, связана неплохо.
Орграф D i о связан лучше D9, но не в такой степени как D4, в котором из
каждой вершины можно попасть в любую другую. В ?>ю, например, w не
достижима из х.
Чтобы уточнить эти различия, определим несколько понятий связности.
Орграф D = (V, А) называется сильно связным или сильным, если для
каждой пары вершин и и v вершина v достижима из и и и достижима из v.
Таким образом, орграф D4 на рис. 2.7 сильна связен, тогда как орграф D10
нет. В задаче о потоках транспорта, рассмотренной в гл. 1, мы хотели
выбрать ориентации дуг, которые приводят к сильно связному орграфу. Бели
сеть коммуникаций сильно связна, тогда каждое лицо может передать
сообщение любому другому лицу. Если игра сильно связна, то не
существует заключительных позиций, поскольку они являются позициями, из
которых не выходят дуги. Таким образом, такая игра продолжается вечно.
Сети питания, как мы увидим, также обычно не обладают свойством
сильной связности.
Орграф называется односторонне связным или односторонним, если дня
каждой пары вершин и и v хотя бы одна достижима из другой, т.е. или v
достижима из и или и достижима из v. Таким образом, орграф Dlo на
рис. 2.7 односторонне связен. Конечно, каждый сильно связный орграф и
односторонне связен. Орграф /K не односторонний, так как ни и и ни х
не достижимы друг для друга. Сеть коммуникаций является односторонне
связной, если для каждой пары ее членов и и и, по крайней мере один
может послать сообщение другому.
Орграф называется слабо связным, или слабым, если каждая пара
вершин и и v соединима. Таким образом, каждый односторонний орграф
(а потому и каждый сильный орграф) слабо связен. Орграф D3 на
рис. 2.7 слабо связен, тогда как орграф D9 нет, поскольку и и х не
соединимы.
Наконец, орграф несвязен, если он не является слабо связным.
В графе понятия сильной, односторонней и слабой связности совпадают.
Почему?
Используя эти понятия, мы можем определить степени, или категории,
связности. Орграф D имеет степень связности 0, если он не является
слабым, степень связности Л, если он слабый, но не односторонний, степень
связности 2, если он односторонний, но не сильный, и степень связности 3,
45
если он сильный. Таким образом, изображенный на рис. 2.7 орграф D9
имеет степень 0, орграф D3 — степень 1, орграф D\q —степень 2 и орграф
?>4 - степень 3. (Степень связности орграфа определяет порядковую
шкалу, если использовать терминологию, которую мы введем в гл. 8. Важен
только порядок связности, а числа 0, 1, 2, 3 не существенны сами по
себе.)
225. Критерии связности О. Проверка сильной, односторонней или
слабой связности путем непосредственного использования определений,
может окажется утомительной, поскольку в орграфе с п вершинами име-
(п \ п\ п(п -1)
1 . - пар вершин, з этом пункте мы при-
2 / 2!(л -2)! 2
ведем критерии принадлежности к каждому из трех классов орграфов:
сильных, односторонних и слабых. Следующие теоремы доказаны в книге
Харари, Нормана, Картрайта (Harary, Norman, Cartriwght [1965]) и наши
доказательства аналогичны. Читатель должен заметить, что имеются более
эффективные способы проверки сильной, односторонней и слабой
связности. Мы коротко остановимся на них в п. 3.3.1. Мы будем использовать
термины полный путь, полный полупуть и т.д., имея в виду путь (полупуть),
проходящий через все вершины.
Чтобы охарактеризовать сильную связность, заметим вначале, что
контур, такой как D4 на рис. 2.7, сильно связен. Этим свойством обладает и
любой орграф, полученный из контура добавлением дуг, например, Ds.
Таким образом, если существует контур, проходящий через все вершины,
то орграф сильно связен. Но не каждый сильдо связный орграф имеет такой
контур. (Можно ли привести пример?) Однако, как показывает следующая
теорема, он содержит замкнутый путь, проходящий через все вершины.
Теорема 2.3. Орграф сильно связен тогда и только тогда, когда в нем
имеется полный замкнутый путь.
Доказательство. Пусть «ь и2,..., ut, их — полный замкнутый
путь. Если и и v заданы, то поскольку путь полный, мы можем считать,
что и — это щ для некоторого i, a v — это щ для некоторого /. Будем
считать, что i </. Тогда иьИм-1»...,"/ -путь из и в ии«/5м/+1,...,кг,мь...
..., щ - путь из и в и. Таким образом, орграф D сильно связен.
Обратно, предположим, что D сильно связен. Пусть вершинами в D
являются Mi, и2> •.., и„. Тогда имеются пути Pi H3Wi ъи2уР2 изм2 в м3,...
..., Рп-1 из м„_ i в ип и Рп из ип в и. Полный замкнутый путь в D можно
построить объединением этих путей в следующем порядке: Р\, Р2, ...
. • • > Рп -1 > Рп • ¦
Для иллюстрации этой теоремы рассмотрим орграф D17 на рис. 2.7.
Он сильно связен, потому что последовательность и, и, z, у, и, w, x, v
образует полный замкнутый путь. Таким является и орграф D19, поскольку
P. Q>r ,s,q,t9u, v,w,u, v,t,s,q9 r, p - полный замкнутый путь.'
Чтобы использовать теорему 2.3 для проверки сильной связности
орграфа D, перенумеруем вершины их, и2, ..., ип. Затем проверим существует
ли путь из Mi в м2, из и2 в «з, ..., из мл_! в ип иизм„в«1.Такимобра-
1) Этот пункт можно опустить без серьезной потери понимания изложения. Однако
теорема 2.4 используется в дальнейшем в нескольких местах.
46
("О
зом, вместе двух проверок для каждой из I 1 пар вершин, т.е. п(п - 1)
проверок, мы нуждаемся только в п проверках. Это даст существенный
эффект даже, при п умеренной величины. Например, при и = 8, п(п - 1)
равно уже 56, что на 48 превосходит число проверок новым способом!
В терминах сетей коммуникаций теорема 2.3 утверждает, что для того,
чтобы каждое лицо могло отправить сообщение любому другому лицу
необходимо и достаточно наличия последовательности лиц со следующими
свойствами: 1) каждое из них может связаться со следующим; 2) в
последовательности представлены все участники сети и 3) последнее лицо может
связаться с первым. Теорема 2.3 может применяться при проектировании
сетей коммуникаций, например, если мы хотим, чтобы такая сеть была
сильно связной и хотим использовать наименьшее число звеньев связи
(см. упражнение 12).
Перейдем теперь к рассмотрению понятия односторонней связности.
Напомним, что орграф односторонне связен, если для каждой пары вершин
и и v существует путь из ы в у или путь из и в и.
Теорема 2.4. Орграф D односторонне связен тогда и только тогда, когда
в нем имеется полный путь.
В качестве иллюстрации этой теоремы, заметим, что орграф Dn на рис.2.7
односторонний, потому что в нем имеется полный путь xt у, u, у, у, z, и\
(Является ли этот орграф сильным?)
Для доказательства теоремы предположим, что их, и2,..., щ - полный
путь. Тогда при и Ф у, поскольку путь — полный, и совпадает с щ для
некоторого i и v совпадает с щ для некоторого /. Если / </, то м,-,м,+1,...
..., щ — путь из и в у. Если / >/, то Uj•, щ + i, ..., Uj — путь из у в м. Таким
образом, D- односторонний орграф.
Обратно, предположим, что D - односторонний орграф. Сначала
докажем предварительный результат.
Лемма. В любом подмножестве вершин одностороннего орграфа D
существует вершина, из которой достижимы (путем использования дуг D)
все другие вершины в этом множестве.
Орграф Dxo на рис. 2.7 иллюстрирует лемму. Он является
односторонним. В множестве {и, и, х) из вершины и достижимы все другие. В
множестве { л:, у } таким свойством обладает вершина я:, а в множестве {м, у, и\ х,
yt z) вершина и, и т.д. Доказательство леммы проведем индукцией по числу
вершин в произвольном множестве U, равному к. Ясно, что лемма верна
при к = 1 (почему?) Предположим, что она верна для всех множеств U с
к вершинами и выберем некоторое множество U, содержащее к + 1
вершину. Обозначим элементы U через ut, и2, ..., u* + i. По предположению
индукции в U\{vk + l} существует вершина и,-, из которой достижимы все
Vj при / < к + 1. Теперь, поскольку орграф D односторонний, либо vk+i
достижима из vt, либо у,- достижима из уаг+i. Если vk+i достижима из
У/, то из У/ достижимы все вершины в U. Если У/ достижима из vk+l, то из
»к + i достижимы все вершины в U. Это доказывает лемму.
Теперь, используя лемму, докажем теорему. Выберем вершину щ в
У = V(D), из которой достижимы все другие вершины в V. Выберем в
47
V\{ui) вершину и2, из которой достижимы все другие вершины в
V\{ui) • Выберем в V\{ui, и2) вершину и3, из которой достижимы все
вершины в V\{uu и2) и т.д. Далее, иг достижима из их путем Ри иъ
достижима из и2 путем Р2 и т.д. Объединение этих путей вместе дает
полный путь орграфа Z). ¦
Орграф Dn на рис. 2.7 иллюстрирует доказательство теоремы 2.4.
Возьмем их = у, и2 = х, и3 = и, w4 = и» = z* i*6 = w.Тогда Л = {у, х), Р2 =
= {х, и), Ръ = {и, v}9 Р4 = {vyy, z)vi Ps = {z, w}. Полный путь задается
вершинами у, х, и, и, у, z, w. (В этом орграфе существует даже полный
Рйс. 2.11. Граф к упражнениям 2 и
23 § 2.2 и упражнению 16 § 2.4
простой путь. Имеется ли такой путь для каждого одностороннего
орграфа?)
Наконец, напомним, что орграф слабо связен, если каждая пара вершин
D соединима.
Теорема 2.5. Орграф D слабо связен тогда и только тогда, когда в нем
имеется полный полупуть.
Доказательство предоставляется читателю (см. упражнение 21).
Для иллюстрации этой теоремы заметим, что орграф DiS на рис. 2.7
слабый, поскольку последовательность вершин и, u, w, х, у образует
полный полупуть (его дуги определяются однозначно, поэтому мы не называем
их). (D15 является также односторонним. Проверить.)
2.2.6. Случай графов. Предположим, что G = (V, Е) — граф. В этом
случае терминология аналогична той, которая была введена для орграфов.
Цепью в G называется последовательность
"ь eif u2fei9..., ut9 et, ut+1> C)
где t > 0, каждая щ является вершиной, а каждое ег ребром {щу ui+1}.
Цепь называется простой, если все щ различны, и замкнутой, если ut+l = их.
Замкнутая цепь C), в которой и%, и2,..., ut и ех, е2,..., et различны,
называется циклом (простой замкнутой цепью) 1).
Дайной цепи, цикла и т.п., представленных в виде C), называется число
ребер в C).
В качестве примера рассмотрим в графе на рис. 2.11 цепь
г, {г, t), t, {t, w}, w, {w, u), u, {w, t), t, {t, r}9 r,{r, s}, s, {$, u)f
ut{u,t), t,{t,w).
1) Требование отсутствия повторяющихся ребер избыточно при t > 2.(Примеч. пер.)
48
Эту цепь можно задать последовательностью г, г, w, и, г, г, 5, и, г, н>,
не указывая ребра.
Простая цепь задается вершинами г, f, w, w, x. Цикл задается вершинами
r,t,u,s,r. Наконец, последовательность р, {р, г }, r{r, p), p не считается
циклом, поскольку ei = е,. (Ребра неупорядочены, поэтому{р, г} ={г, р}.)
Назовем граф связным, если между каждой парой вершин uylv имеется
цепь. Такое понятие связности, которое мы встречали в гл. 1, совпадает с
понятием, используемым в топологии: граф состоит из одной
"компоненты". На рис. 2.9 графы Gx и G2 связаны, тогда как графы G3 и G4 нет.
Результат, аналогичный теореме 2.5, состоит в следующем: граф связен
тогда и только тогда, когда он содержит полную цепь.
Упражнения
1. Для орграфа Dx 9 на рис. 2.7 найти: а - путь, не являющийся простым
полупутем, б - полупуть, не являющийся простым полупутем, в - замкнутый путь; г -
простой путь длины 4; д - определить является ли последовательность и, {и, и), и,
(и, н>), w, (н>, «), и контуром, е - найти контур длины 3, содержащий вершину t
2. Для графа на рис. 2.11 найти: а - замкнутую цепь, не являющуюся циклом, б -
самый длинный цикл, в - цепь, не совпадающую с указанной в тексте и не
являющуюся простой; г - замкнутую цепь длины &.
3. Привести пример орграфа, имеющего путь, который отличен от простого и не
содержит повторяющихся дуг.
4. Для орграфа/J0 на рис. 2.7 вычислить </(/,/) для всех / и /.
5. Для каждого орграфа на рис. 2.7 определить: а - является ли он сильно
связным; б - односторонне связным; в - слабо связным; г - его категории связности
@,1,2 или 3).
6. Для каждого орграфа D на рис. 2.7 найти: а - полный замкнутый путь, если D
сильно связный; б - полный путь, если D односторонне связный; в - полный
полупуть, если D слабо связный.
7. Обсудить свойства достижимости и соединимости орграфа подразделения
полицейской службы на рис. 2.3. В частности, определить категории связности,
проинтерпретировать основные расхождения между достижимостью, соединимостью и т.д.
8. Проделать то же, что в упражнении 7, для транспортной сети на рис. 2.2.
9. Проделать то же, что и в упражнении 7, для игры в крестики и нолики
на рис. 2.6, а.
10. Проделать то же, что и в упражнении 7, для игры на рис. 2.6, б.
11. Орграф называется однопутным, если для всякой вершины и, достижимой
из вершины и, существует единственный путь из и в и.
а. Является ли орграф Dl 0 на рис. 2.7 однопутным?
б. Что можно сказать об орграфе Dx 4 ?
в. Нарисовать однопутный орграф без полуконтуров.
12. Какое наименьшее число дуг в сильно связном орграфе с п вершинами? Какое
наибольшее? (Заметим, что сильно связный орграф с минимальным числом дуг весьма
уязвим при разрушении. Сколько дуг необходимо разорвать, чтобы разрушить
коммуникации? Мы вернемся к понятию уязвимости в § 3.3.)
13. а. Привести пример сильно связного орграфа, не имеющего полного контура,
б. Всегда ли односторонне связный орграф содержит полный простой путь?
14. Доказать, что вершины и и и соединимы тогда и только тогда, когда существует
простой полупуть между л и и.
15. (Нагагу,Norman,Cartwright [1965].) Вспомнить определение однопутности в
Упражнении 11. Могут ли два контура в однопутном орграфе иметь общую дугу (При
вести доказательство или контрпример.)
16. (Нагагу, Norman, Cartwright [1965]). Входит ли каждая вершина сильно
связного орграфа, имеющего не менее двух вершин, в некоторый контур? (Привести
доказательство или контрпример.)
4- Ф.С. Роберте 49
17. Пусть категория связности орграфа D равна 0. Какое максимальное число дуг
в D с 4 вершинами? с п вершинами?
18. Выполнить упражнение 17 для категории связности, равной 2.
19. Выполнить упражнение 17 для категории связности, равной 1.
20. (Нагагу, Norman, Cartwright [1965]). Если D - орграф, определим
дополнительный о}?раф Dc следующим образом: V(DC) = V(D) = V и упорядоченная пара
(и, v) (и Ф и) входит в А (Dc) тогда и только тогда, когда она не входит в A(D).
Например, на рис. 2.12 изображены орграф D и соответствующий ему орграф Dc.
Привести примеры слабо, но не односторонне связных орграфов D в таких случаях:
ш
Рис. 2.12. Орграф D и его.дополнительный орграф D с
Рис. 2.13. Графы к упражнению 23 § 2.2
а - Dc сильный орграф; б - Dc односторонний, но не сильный; в - Dc слабый, ноне
односторонний.
21. Доказать теорему 2.5.
22. Граф G называется деревом, если он связен и не содержит циклов.
а. Нарисовать несколько деревьев.
б. Доказать, что, если G — дерево, то существует по меньшей мере одна вершина,
которая соединена ребром не более, чем с одной вершиной 1).
в*. Доказать, что если G - дерево, то число его вершин п на единицу больше, чем
число ребере2).
г. Доказать, что, если граф G связен и л = е + 1, то G - дерево.
23. Цепь или цикл в графе (мультиграфе) называется эйлеровой (ым), если она
(он) использует все ребра графа только один раз (сравнить с задачей о кенигсбергских
мостах).
а. Показать, что каждый граф на рис. 2.13 содержит эйлеров цикл.
б. Показать, что, если граф G имеет эйлеров цикл, то число ребер, включающих
любую вершину, четно (обратное также верно, если G связен).
в. Показать, что граф на рис. 2.11 не содержит эйлерового цикла.
24. Путь или контур в орграфе называется эйлеровым, если он использует каждую
дугу только один раз.
а. Найти эйлеров путь в орграфе Ds на рис. 2.7.
б. Показать, что Ds не имеет эйлерова контура.
в. Придумать необходимые (и достаточные) условия существования в орграфе
эйлерова контура. (Указание. См. упражнение 23, п. б.)
25. Рассмотрим городскую транспортную сеть с двусторонним уличным
движением. Некоторое число выбранных улиц должно быть подметено за определенный
период времени. Требуется определить расписание или порядок, в котором
мусороуборочные машины перемещаются с одного места на другое. Эффективно такое
расписание, при котором мусороуборочная машина никогда не оказывается на улице,
1) На самом деле найдется не менее двух таких вершин. (Примеч. пер.)
2) Звездочкой отмечаются упражнения повышенной трудности.
50
не подлежащей уборке или уже убранной ранее. При каких обстоятельствах
существует такой план? {Указание. Рассмотреть граф, ребра которого соответствуют
лишь выбранным улицам (Tucker, Bodin [1975].)
§ 2.3. Сильные компоненты и вершинная база
2.3.1. Вершинные базы и сети коммуникаций. Предположим мы хотим
передать сообщение по сети коммуникаций так, чтобы оно могло
достигнуть всех ее участников. Если сеть сильно связна, достаточно передать
сообщение одному лицу. (В действительности по теореме 2.4 достаточно
односторонней связности сети.) Однако в общем случае сообщение,
переданное одному лицу, не всегда достигает всех остальных участников.
Нам бы хотелось найти множество людей (вершин), из которых
достижимы все другие люди (вершины). Более того желательно, чтобы это
множество было по возможности наименьшим. Совокупность вершин В
орграфа D называется его вершинной базой (или базой вершин), если
каждая вершина, не входящая в В, достижима из некоторой вершины в ней
и множество В минимально. Здесь минимальность означает, что ни из
какого собственного подмножества В нельзя достичь всех оставшихся
вершин. Среди всех вершинных баз мы хотели бы отыскать базу с наименьшим
числом элементов.
В примере на рис. 2.7 в орграфе D13 вершина t не имеет входящих дуг.
Поэтому при построении вершинной базы мы должны включить вершину t
Вершинную базу можно получить добавлением к ней либо и, либо и, либо и\
Заметим, что из множества {и и, q } также можно достичь все остальные
вершины, но оно не является вершинной базой, поскольку подмножество
{t9 и } уже обладает требуемым свойством. В действительности множества
{К и}, {t, v } и {t,w} образуют все вершинные базы. Каждая из вершин и,
v и w не достижима из вершин, отличных от ut v и w. Поэтому одна из них
должна входить в любую из вершинных баз.
Читатель заметит, что все такие вершинные базы имеют одинаковое
число вершин. Оказывается, это не случайно. Таким образом, поиск
вершинной базы с наименьшим числом элементов заканчивается сразу, как только
мы найдем произвольную вершинную базу.
В этом параграфе будет приведена процедура нахождения всех
вершинных баз данного орграфа. Большинство результатов принадлежит Кенигу
(Konig [1936]). Чтобы описать процедуру Кёнига вначале введем
некоторые предварительные определения.
Подграфом орграфа D = (V, А) называется орграф (W, В), множеством '
вершин которого W является подмножество в V, а множеством дуг
которого В - подмножество в А. (Формально следовало бы говорить подор-
граф.) О Поскольку (W, В) - орграф, в определении неявно
подразумевается, что В не может быть произвольным подмножеством А, а должно
состоять из упорядоченных пар элементов W. На рис. 2.14 изображен
1) Заметим, что в общеупотребительной терминологии, в частности, принятой в
книге (Нагагу [1969]), такое образование называется частью орграфа D, а подграф
содержит все дуги из А, соединяющие вершины из W (см. далее определение
порожденного подграфа). (Примеч. пер.)
4* 51
и
в,
о
и
7х
и
о
из
и и
Л
уо > qJ
и и
л2
и и
-Si
17
W
W
0 о
Q
я* п5 л6
Рис. 2.14. Орграф D и некоторые из его подграфов
орграф и некотороные из его подграфов. Особый интерес представляют
подграфы, порожденные подмножеством W из К, а именно те подграфы,
которые содержат все дуги из A(D)9 соединяющие вершины из W.
Например, на рис. 2.14 подграфом, порожденным W = {и, у, х, у}9
служит орграф D\. Способ нахождения всех вершинных баз основан на
"склеивании" некоторых вершин и переходе к меньшему, более простому
орграфу. Тогда оказывается, что этот новый орграф D, являющийся
"конденсацией" исходного орграфа D, будет иметь легко определяемую
единственную вершинную базу В * и, более того, из нее будет легко получить все
вершинные базы орграфа D.
Для определения конденсации D* рассмотрим сильно связные
порожденные подграфы D. Такой подграф с максимальным (по включению)
множеством вершин называется сильной компонентой х). Сильные
компоненты будут определять множества вершин, которые должны быть "склеены"
для получения конденсации. (Сильные компоненты полезны и для
выявления структуры орграфа. Они используются в гл. 4 при изучении
устойчивости знакового орграфа энергетических потребностей.) На рис. 2.15
показаны сильные компоненты изображенного орграфа. Две сильные
компоненты могут состоять из различного числа элементов; вот почему в
определении мы использовали термин максимальный. Заметим, что
единственная вершина может образовывать сильную компоненту.
Теорема 2.6. В орграфе D = (F, А) каждая вершина и входит в одну и
только одну сильную компоненту.
Доказательство2). Вершина и входит по меньшей мере в одну
сильную компоненту. В самом деле, орграф, порожденный и, является силь-
1) В дальнейшем будем иногда отождествлять сильную компоненту с ее
вершинами. Максимальность (по включению)означает, что если мы добавим еще вершину, то
полученный порожденный подграф не будет сильно связным.
2) Как обычно, доказательство можно опустить без потери понимания дальнейшего
изложения.
52
ным. Будем добавлять вершины до тех пор, пока будет все еще получаться
сильно связный порожденный подграф. Такая процедура приводит к
сильной компоненте, содержащей и. Предположим теперь, что и входит в
сильные компоненты К и L. Рассмотрим подграф, порожденный вершинами из
К и L. Этот подграф сильно связен, так как, если а входит в К, з. Ь входит
в L, то из а можно попасть в Ъ через вершины из К U L, поскольку из а
можно достигнуть и через вершины К и из и можно достигнуть Ъ через
вершины L. Аналогично, из Ъ можно попасть в а через вершины, входящие
в A' U L. Из максимальности К и L имеем, что К U L =К иКУ L
=L,поэтому К-Ь.ш
Мы можем теперь по орграфу Д используя сильные компоненты,
определить новый орграф D*, являющийся конденсацией D, следующим
образом. Пусть Ки К2, ..., Кр — сильные компоненты D. Тогда V(D*) =
= {^b^2,...,^},HMbi проведем дугу от К\ к Kj тогда и только тогда,
когда гФ] и для некоторых вершин u^KfnvGKj- в D имеется дуга из и
в и. На рисунке 2.15 изображена конденсация D* орграфа D. Сам орграф
содержит шесть сильных компонент множества входящих в них вершин,
указанных на рисунке. В конденсации Z) "найдется, например, дуга из Къ
в К4, поскольку в орграфе D имеется дуга (е, /). Аналогично в D*
найдется дуга из КА в К5, поскольку в D есть дуга из g в г. Читатель заметит,
что имеется и другая дута (Л, к) из вершины в^к вершине в К5. Мы,
однако, будем рисовать одну дугу в Z)*.
j
Сильные компоненты \ {a,b,c}
к6
к2 к3 /r^ j
О ng
Вершинная база В* в D*: {ЯрЛ^^Л
Рис. 2.15. Орграф D, его сильные компоненты и его конденсация
53
Теперь найдем вершинную базу в D*. Ясно,чтоKl9K2 и К6 принадлежат
всем вершинным базам, поскольку они не имеют входящих дуг. Каждая
другая вершина в D* достижима из К{, К2 или К6. Таким образом, В* =
= {Кх, К2, К6) является единственной вершинной базов в/)*. Более того,
легко видеть, что если мы возьмем по одному элементу из каждой сильной
компоненты Кг, К2, К6 и В*, то получим вершинную базу для D.
Например, множество {a, d, I } дает такую вершинную базу. Другая вершинная
база задается множеством {a, d, m). Из В* получаются и другие
вершинные базы:
{*.<*./},
{b,dt m),
{С d, /},
{с, d, m).
Оказывается, что в D* всегда есть единственная вершинная база В*
состоящая, как в этом примере, из всех вершин, не имеющих входящих дуг.
В свою очередь каждую вершинную базу в D можно получить из базы в
D*, выбирая по одной вершине из каждой сильной компоненты в D,
входящей в В *. Таким образом, в нашем примере, вершинные базы, которые
мы получили, составляют множество всех вершинных баз.
Перед доказательством этих утверждений сделаем следующее замечание.
Факт, что сообщение, переданное лицам, входящим в вершинную базу,
может достигнуть всех членов коммуникационной сети, не означает, что это
произойдет на самом деле. Читатель помнит, что наличие дуги от и к v
означает лишь возможность прямого обращения и к и, но не означает, что в
действительности и будет непосредственно связываться с v. Если мы
рассматриваем ориентированный граф, как математическую модель
коммуникационной сети, то видим, :то эта модель (при нашей интерпретации дуги)
не адекватна в случае необходимости более глубокого анализа. Для учета
возможности не прохождения сообщения вдоль данной дуги, мы можем
пытаться приписать каждой дуге (и, v) вероятность достижимости v
сообщения из и. Тем самым был бы совершен обход контура
математического моделирования во второй раз. Используем эту идею в нескольких
упражнениях настоящей главы, а также в некоторых упражнениях гл. 5.
2.3.2. Теоремы и доказательства 1). Возвратимся теперь к
доказательствам наших утверждений о нахождении всех вершинных баз. Мы начнем с
доказательства теоремы о структуре конденсации D*.
Теорема 2.7. Конденсация ?>* орграфа D не имеет контуров.
Доказательство. Предположим, что в D* существует контур
Kix, Kf2, ..., К{ Kft, Пусть и - некоторая вершина в Ki% и v - некоторая
вершина в Кгг. Используя контур Kix, К^, . ., Kif, Kji, легко доказать,
что и достижима из у и и достижима из и. Таким образом, оказывается^
что и и v входят в одну сильную компоненту и, следовательно, К^ = Kiix
1) Читатель может опустить детали этого пункта, но он должен прочитать
формулировки теорем.
54
(такой вывод основан на теореме 2.6). Это противоречит определению
контура. ¦
Теорема 2.8. В орграфе без контуров D есть единственная вершинная
база, состоящая из всех вершин, не имеющих входящих дуг.
Доказательство. Пусть В — множество всех вершин, не
имеющих входящих дуг. Ясно, что любая вершина и из В должна
присутствовать в каждой вершинной базе. Достаточно доказать, что всякая
вершина и, не принадлежащая В, достижима из некоторой вершины
множества^. Чтобы показать это, предположим, что v$B. Пусть v = v0.
Поскольку v0 фВ, имеется входящая в v0 дуга (иьи0), причем t>i Ф и0.
Если Ui G5, все доказано. Если нет, то значит есть входящая в vx дуга
(v 2 > v 1), причем у 2 Ф v 1. Продолжая этот процесс, построим путь v ь v r_ i...,
..., i>i, Wo, не содержащий вершин из В, Все вершины этого пути различны,
поскольку, если и,- = iy, />/ и и,-, u/_i,..., ty+i различны, то viy U/_i, ¦..
..., Vj i, vj - контур, что противоречит допущению об отсутствии
контуров в орграфе D. Так как D имеет конечное число вершин, то
построение пути vt, vt_ i,..., Ui, и0 не может продолжаться бесконечно
В конце концов мы должны достичь некоторую вершину vti входящую
з ?. Таким образом, вершина у = и0 достижима из ut. ¦
Следствие. В орграфе без контуров существует вершина, в которую
не входит ни одна дуга.
Следующая теорема точно описывает способ построения всех вершинных
баз. По теореме 2.7 конденсация D* орграфа D не содержит контуров.
Таким образом, в ней по теореме2.8 имеется единственная вершинная база В*.
Теорема 2.9. Пусть В* - единственная вершинная база конденсации D*
орграфа D. Тогда вершинными базами в D, служат такие множества В,
которые содержат по одной вершине из каждой сильной компоненты D,
принадлежащей В*.
Доказательство. Предположим, что В * — единственная
вершинная база в D* и В содержит по одной вершине из каждой сильной
компоненты В *. Ясно, что каждая вершина в D достижима из В. (Почему?) Нужно
показать, что В является минимальным множеством, обладающим тем
свойством, что каждая вершина в D достижима из В. Для доказательства
минимальности достаточно показать, что не найдется вершины v E В,
достижимой из другой вершины и € В. Если бы это было возможно, то сильная
компонента, содержащая и, была бы достижима в ?>*из сильной
компоненты, содержащей и, что противоречило бы минимальности В *. Чтобы
завершить доказательство покажем, что если В служит произвольной вершинной
базой, то она содержит точно по одной вершине из каждой сильной
компоненты Z), принадлежащей 5*. Конечно, база В должна содержать по
крайней мере по одной вершине из каждой такой сильной компоненты, а также
возможно и другие вершины. Из условия минимальности следует, что
никакие другие вершины не требуются. ¦
Как следствие из теоремы 2.9, имеем следующую теорему.
Теорема 2.10. Любые две вершинные базы орграфа содержат одинаковое
число вершин.
2.3.3. Несколько определений для графов. Ряд понятий, введенных в
п. 2.3.1, имеют аналоги для графов, которые будут рассматриваться в гл. 3.
55
Рис. 2.16. Граф G и некоторые его
подграфы
Подграфом графа G = (V, Е) называется граф h = (Wy F), где W-
подмножество в V и F - подмножество в Е. Н называется порожденным
подграфом, если Я содержит все ребра из Е, которые соединяют вершины в W.
Компонентой (связной) подграфа G называется максимальный связный
порожденный подграф.
На рис. 2.16 изображен граф G и пять его подграфов. Я3, Н* иЯ5 -
порожденные подграфы, Я4 и Я5 - связные компоненты, Читатель заметит,
что каждая вершина в G принадлежит одной и только одной компоненте
связности.
Упражнения
1. Для каждого орграфа на рис. 2.17 найти: а - подграф, не являющийся
порожденным подграфом; б - подграф, порожденный вершинами 5,8 я 9; в - сильно связный
порожденный подграф, не являющийся сильной компонентой; г - все сильные
компоненты; д - его конденсацию; е - вершинную базу; ж - определить число
вершинных баз.
2. Для графа на рис. 2.18 найти: а - подграф, не являющийся порожденным
подграфом; б - связный порожденный подграф, отличный от связной компоненты, в - все
связные компоненты.
3. а. Определить сильные компоненты и вершинную базу для схемы подразделения
полицейской службы на рис. 2.3.
б. Обсудить значение полученных результатов.
в. Построить более детализированную коммуникационную сеть гипотетического
подразделения полицейской службы и найти ее вершинную базу.
4. Представляет ли какой-либо смысл понятие вершинной базы для транспортной
сети, например, изображенной на рис. 2.2?
5. Применить понятие вершинной базы к игре на рис. 2.6, б и обсудить результаты.
6. Для неориентированного графа мы можем определить вершинную базу, как
минимальное множество вершин, из которого достижимы все оставшиеся вершины.
Описать процедуру нахождения вершинной базы графа. Проиллюстрировать ее на
графе, изображенном на рис. 2.18.
7. Слабой компонентой орграфа назьюается максимальный слабо связный
порожденный подграф, т.е. слабо связный порожденный подграф, обладающий тем
свойством, что, если добавить любые вершины, то получающийся порожденный подграф не
будет слабо связным. Найти все слабо связные компоненты орграфа D9 на рис. 2.7.
Проделать то же самое дня каждого орграфа на рис. 2.17.
8. Используя определение предыдущего упражнения, показать, что каждая вершина
в D принадлежит точно одной слабой компоненте.
56
10
Рис. 2.17. Орграфы к упражнениям § 2.3, 2.4
5
31
Рис. 2.18. Графы к упражнениям 2 и б § 2.3
9. Односторонней компонентой орграфа называется максимальный односторонне
связный порожденный подграф.
а. Найти одностороннюю компоненту с пятью вершинами в орграфе рис. 2.17, б.
б. Принадлежит ли каждая вершина орграфа по меньшей мере одной
односторонней компоненте?
в. Может ли она принадлежать более, чем одной компоненте?
10. Пусть D - бесконтурный орграф, т.е. D не имеет контуров, a D * - его
конденсация. Верно ли, что D и /?г всегда имеют одинаковое число вершин? Почему?
11. Доказать, что в одностороннем орграфе, каждая вершинная база состоит из
одного элемента.
12. Орграф D\ обратный к орграфу Dt определяется следующим образом: V(D') =
= V(D) и {и, v) e A(D') тогда и только тогда, когда (и, и.) &A(D). Другими словами,
чтобы получить D\ мы должны переориентировать все дуги D. Используя понятие
обратного орграфа, показать, что бесконутрный орграф имеет вершину, из которой
не выходит ни одна дуга.
13. Множество вершин в А орграфа D называется вершинной контрабаэой, если из
каждой вершины ибЛ можно достичь некоторой вершины в А, и множество А
минимально в том смысле, что никакое собственное подмножество А не обладает этим
свойством. Найти все вершинные контрабазы орграфов на рис. 2.17, а, б. (Указание.
Окажется ли полезным здесь понятие обратного орграфа (см. упражнение 12)?)
14. Имеет ли понятие контрабазы (см. упражнение 13) какую-либо интерпретацию
для сети коммуникаций? Для перевозок? Для игр? Проинтерпретировать
использование понятия вершинной контрабазы для схемы подразделения полицейской службы
на рис. 2.3 и для игры в крестики и нолики на рис. 2.6, а.
15. Вершинной дибазой орграфа D называется множество вершин, которое
одновременно является и вершинной базой, и вершинной контра базой.
а. Привести пример орграфа, не имеющего вершинной да базы.
б. Привести пример орграфа с л вершинами, имеющего вершинную дибазу.
в. При каких условиях D имеет вершинную дибазу? {Указание. Использовать
конденсацию/?*).
16. (Нагагу, Norman, Cartwright [1965]). Предположим, что из вершины и
достижимо наибольшее число вершин орграфа. Обязательно ли и входит в некоторую
вершинную базу?
17. Вспомнить определение дерева, данное в упражнении 22 § 2.2. Назовем остов-
ным подграфом графа G такой подграф Я, что V(H) = V(G). Например, на рис. 2.19
изображены два остовных подграфа Нг и Н2 графа G. Заметим, что Нх является
деревом.
57
а. Показать, что не в любом графе имеется остовное дерево, т.е. остовный
подграф, являющийся деревом.
б. Показать, что каждый связный подграф имеет остовное дерево.
18. Построить математическую модель, которая учитывает возможность
непрохождения сообщения вдоль данной дуги сети коммуникаций. Например, ответить на
следующие вопросы:
а. Какова вероятность, что сообщение, отправленное от индивида и, пройдет данный
путь и, и2, иг,..., ut к индивиду и?
1о в2
-о2 /
Нг
5 3 4 5 3 4 5 3 А
Рис. 2.19.HxvlH% - остовные подграфы bG,H1 - остовное дерево в G
б. Если сообщение отправляется от индивида и, как вычислить (точно или
приближенно) вероятность того, что сообщение всегда будет достигать индивида и?
§ 2.4. Орграфы и матрицы
Значительную часть информации относительно орграфа D (а поэтому и
графа) можно представить в удобной форме, используя матрицы,
соответствующие орграфу D. Такие матрицы также полезны при исследовании
орграфов. Одна из них, матрица смежности, будет иметь большое значение в
нашем исследовании знаковых орграфов и их приложений к проблеме
энергетических потребностей в гл. 4.
При рассмотрении матриц, связанных с орграфами, будут использованы
некоторые операции над матрицами, которые мы хотели бы напомнить
читателю.
Пусть А = (aij) и В = (by) - две матрицы и X л. Тогда определим
следующие новые матрицы:
А +В = (ац + bl7), A XB = (aifXbif)f
где X обозначает обычное умножение, и матрицу АВ = (с,у)., где
71
с#= 2 aucbkj.
к = 1
Матрицы А ХВ и АВ различаются; первую мы назовем поэлементным
произведением матриц А и В, вторую произведением.
Транспонированной матрицей А' к матрице А является матрица (&#), в которой Ьц = я;1-.
2.4.1. Матрица смежности. Пусть D = (V,A) - орграф и иг, и2,..., ип-
список его вершин. Соответствующая орграфу D матрица смежности
A(D) = (ay) определяется следующим образом:
A, если (и/,и/) е>4,
10 в противном случае.
На рис. 2.20 изображено несколько орграфов и их матрицы смежности !).
1) Конечно, конкретная матрица, зависит от порядка, в котором мы перечисляли
вершины. Но, допуская некоторую языковую вольность, мы называем матрицей
смежности любую из этих матриц.
58
и2
12 3 4 5
0 10 0 0'
0 0 10 0
0 0 0 10
0 0 0 0 1
а о о о о
12 3 4 5
3 4 5
Рис. 2.20. Орграфы и их матрицы смежности, достижимости, расстояний (хне
определено)
59
Следующая теорема демонстрирует одно из многих применений матрицы
смежности.
Теорема 2.11. Для орграфа D с матрицей смежности А = (я/7), элемент
(/,/) в матрице А* определяет число путей длины ty ведущих из щ в щ.
Доказательство. Проведем доказательство индукцией по L Если
f = 1, результат очевиден. Считая, что утверждение справедливо для t,
докажем его для t + 1. Пусть а^+ - число путей длины t + 1 из щ в и у
Аналогично пусть akj - число путей длины t из икъ и,-.Чтобы пройти от
щ в Uj за t +1 шагов, нужно пройти из ut в некоторую вершину ик
непосредственно и затем из ик перейти в щ за t шагов. Число способов перехода
из щ в Uj за t + 1 шагов с первым шагом, приводящим в ик, равно aikakj .
Этот член равен akj , если (и*, и*) ^ ^4 и равен 0, если (м,-, wfc) ^ ^- Чтобы
получить пц +1, мы просто просуммируем члены aikakj для всех fc. Таким
образом,
По индукции akj совпадает с элементом kj матрицы А*. Поэтому^
определяется (/, /) -ым элементом матрицы АА* =At+l. ¦
На рис. 2.21 приведены матрицы А2, А3 и А4, соответствующие орграфу
D4, изображенному на рис. 2.20. Поскольку элемент 2, 1 в Л3 равен 2, в
D существует два пути длины 3 из и2 в и\. Эти пути — иг, Мь «2» W
Теорема 2.11 представляет пример результата, показывающего
возможность использования матриц для получения информации об орграфах.
В свою очередь орграфы могут использоваться для получения информации
о матрицах. В § 4.2 мы покажем, как по матрице строить орграф и
применять сильные компоненты орграфа для вычисления собственных значений
этой матрицы.
2.4.2. Матрица достижимости 2\ Второй матрицей, которую мы ставим
в соответствие орграфу D, является его матрица достижимости R(D) =
Эта матрица определяется следующим образом:
{1,
0
{, если Uj достижима из
0 в противном случае.
Заметим, что всякая вершина достижима сама для себя, так как вершина
щ сама является путем; поэтому гн = 1 для всех /. На рис. 2.20 представле-
1) Значительно более трудную задачу предствляет определение числа простых путей
длины t из ы,- и uj . Эта задача впервые рассматривалась Лью сом и Перри (Luce, Perry
[1949]). Решение было расширено Россом и Харари (Ross, Нагагу [1952]), а общий
метод найден Партасарати (Parthasarathy [1964]).
*) Этот пункт можно опустить без потери дальнейшего понимания изложения,
хотя он и является хорошим приложением для идей предыдущих параграфов.
60
12 3 4
1/0100
2 110 10
3 I 0 0 0 1
4 \1 0 0 0
А3
Рис. 2.21. Степени матрицы смежности орграфа D4 на рис. 2.20
ны матрицы достижимости для ряда орграфов. Матрица достижимости
может быть представлена при помощи матрицы смежности, если ввести
понятие булевского сложения. В булевском сложении 0 + 0 = 0, 0+1 = 1+0 = 1.
но 1 + 1 = 1 1\ Чтобы распространить его на класс всех неотрицательных
целых чисел N9 определим булеву функцию В: N -> {0, 1} следующим
образом:
0, если х = 0,
1, если х>0.
Определим В (А) для матрицы А = (а//) следующим очевидным
образом; элемент /,/ в В (А) равен ?(я//). Так, например,
Теорема 2.12. Пусть А - матрица смежности иЛ- матрица достижимости
орграфа Den вершинами. Тогда
R = ^(/ + А +Л2+...+ЛЛ-1) = ?[(/+А)"],
где В - будева функция, а / - единичная матрица
1 0 0 ...
0 1 0 ...
0 0 0 ... 1
Доказательство. По теореме 2.1 из вершины щ можно достичь
вершину щ тогда и только тогда, когда существует простой путь из щ в
и/* Поскольку в простом пути все вершины различны, его длина самое
большее равна п - \. Это доказывает первое равенство. Доказательство
второго соотношения получается использованием определения В и
оставляется читателю (см. упражнение 13). ¦
Следует отличать его от сложения по модулю 2, где 1 + 1 = 0. {Примеч. пер.)
61
Рис. 2.22. Применение матрицы достижимости для выявления сильных компонент
орграфа D
Матрица достижимости имеет ряд приложений. Первое состоит в
определении типов связности. Читатель обнаружит, что она также полезна для
доказательства следующей теоремы, предлагаемой в качестве упражнения.
Теорема 2.13 (Ross, Harary [1959]). Пусть орграф D имеет матрицу
достижимости R и матрицу смежности А, Тогда:
а) D сильно связен тогда и только тогда, когда R = /, где / матрица из
единиц.
б) D односторонне связен тогда и только тогда, если B(R + R') = /, где
В — булева функция и R' — матрица, транспонированная к R.
в)?> слабо связен тогда и только тогда, когда
B[{I + A+A')n~x] =J,
где п — число вершин в D и А* — матрица, транспонированная к А.
Второе применение матрицы достижимости, как показывается в
следующей теореме, представляет метод нахождения сильных компонент.
Теорема 2.14. Пусть орграф D имеет матрицу достижимости R = (г,,) и
R2 =(s(j). Тогда:
а)сильная компонента, содержащая вершину и,-, определяется
единичными элементами в i-й строке (или столбце) поэлементного произведения
RXR\ где R' — матрица, транспонированная кR;
б) число вершин в сильной компоненте, содержащей щ, равно s,-,-.
Доказательство, а) Вершина щ достижима из вершины щ тогда
и только тогда, когда Тц = 1. В свою очередь, щ достижима из щ тогда и
только тогда, когда Тц = L Таким образом, щ и щ взаимно достижимы в
том и только в том случае, если Гц X г/7 = 1.
п
б) Величина &ц равна Б ТцТ^ где п - число вершин. Далее, ТцГц = 1
тогда и только тогда, когда щ и щ взаимно достижимы. Таким образом,
суммирование этих чисел по всем / дает число вершин щ взаимно
достижимых для вершин и;. ¦
На рис. 2.22 приведены матрицы R9 R X R l и R 2 для изображенного
там орграфа D. Строка, соответствующая и в матрице R X Rf, определяет
сильную компоненту {и, v,w}. Элемент и, ив матрице R 2, а именно, 3 дает
число элементов в этой сильной компоненте.
2.4.3. Матрица расстояний *). Третья матрица, которая оказьюается
полезной при рассмотрении орграфов, - матрица расстояний (dy)9 где йц —
расстояние от щ до м7-, определенное в п. 2.2.2 как длина кратчайшего пути
из щ в uj. (Напомним, что величина йц не определена, если пути из щ в
Uj нет.) На рис. 2.20 приведены матрицы расстояний нескольких орграфов.
Теорема 2.15. Пусть орграф D имеет матрицу смежности А и матрицу
расстояний (dij). Тогда, если величина dy, i Ф] определена, то она равна
наименьшему к, для которого элемент i, / в В(Ак) равен 1, где В - булева
функция.
Доказательство предоставляется читателю (см. упражнение 14).
Упражнения
1. Для каждого орграфа, изображенного на рис. 2.17, найти: а) его матрицу
смежности, б) его матрицу достижимости, в) его матрицу расстояний.
2. Для орграфов D3, Ds и Dx 7 на рис. 2.7 найти число путей длины 5 из и в и,
используя матрицу смежности. Указать эти пути.
3. Для орграфов D3 и D$ на рис. 2.7: а) найти матрицу достижимости R; б) найти
В{1 +А + А2 +... +Ап-1); в) найтиВ[ (/ + А)п~1]; г) показать, что эти три матрицы
совпадают.
4. а. Применить теорему 2.15 для вычисления d(u, w) в орграфе D3 на рис, 2,7.
б) Проделать то же для d (и, *) в орграфе D5 на рис. 2.7.
5. Определим для графа G матрицу смежности A (G) = (аф очевидным образом:
элемент <*// равен 1» если имеется ребро между Uj и щ, элемент ац равен Ов
противном случае. Найти A (G) для каждого из графов на рис. 2.9.
6. Как интерпретировать элемент /, / в матрице А* графа G с матрицей смежности
Л =Л(С)?
Этот пункт можно опустить без потери непрерывности понимания изложения.
63
7. Для каждого орграфа на рис. 2.17 использовать матрицу достижимости для
нахождения сильных компонент.
8. Как интерпретировать сумму по /-му столбцу c(i) матрицы достижимости
орграфа /??
9. Как определить матрицу достижимости R (G), если G - граф?
10. Для графа G с матрицей достижимости R = R(G) (см. упражнение 9), а -
показать, что Л X Л' = R; б - проинтерпретировать элемент 1,1 в R2 ?
11. Пусть R — матрица из нулей с единицами ниже диагонали. Обязательно ли R
является матрицей достижимости некоторого орграфа? (Привести доказательство
или противоречащий пример.)
12. Объяснить, как использовать матрицу достижимости для выяснения вопроса
о существовании в орграфе единственной вершинной базы.
13. Доказать второе равенство в теореме 2.12.
14. Доказать теорему 2.15.
15. Доказать теорему 2.13.
16. Рассмотрим 8 - семейство подмножеств множества А. Определим матрицу
инциденты М - матрицу инциденций типа точки-множества - следующим образом.
Пусть ult и2, ..., ип - элементы из А и 5,, ?,,..., 5т - множества из 8. Тогда
М является п X m-матрицей, в которой элемент /, / равен 1, если м/ входит в
множество Sj , и равен 0, если и,- не входит в множество Sj.
Например, еслиЛ ={1,2, 3,4} и 8= <{1, 2},{'2, 3}, {1}),то
{1,2} {2,3} {1}
Если G - граф, то его матрицей инциденций (типа вершины-ребра) является матрица
инциденций типа точки-множества для множеств А = V(G) и Q = E(G) О. Определить
матрицу инциденций для графа G на рис. 2.11.
17. Нагагу [1969J).Пусть В - матрица инциденций графа G (см. упражнение 16)
и В' -»¦ матрица, транспонированная к В. Какой смысл элемента /,/ матрицы В*ВТ
18. (Нагагу [1969]). Матрицей циклов (цикломатической матрицей) С графа G
называется матрица инциденций типа точки-множества, где в качестве А используется
множество ребер G и 8 - семейство циклов в G. Пусть В - матрица инциденций G
(см. упражнение 16). Тогда все элементы матрицы ВС равны 0 по mod 2.
СЛОВАРЬ НАИБОЛЕЕ УПОТРЕБИТЕЛЬНЫХ ТЕРМИНОВ
I. Пути, цепи и т.д.
А. ПустьZ)= (V,A) —орграф
1. Путем в D называется последовательность вершин и дуг ии alt u2,
а2, ..., ut, at, ut + ь где t > 0, причем каждая вершинам/ принадлежит
V, а каждая дуга at принадлежит А, и я,- всегда является дугой (и/, щ + х).
Путь обычно записывается последовательностью вершин мь и2, ..., ut,
ut + l.
2. Полупутем в D называется последовательность uly ai9 u2f a2t utt at,
ut + ь где t > 0, причем каждая вершина щ принадлежит F, а каждая
дуга в/ принадлежит А, и at всегда является либо дугой (щ, щ + j), либо
дугой (и*+ ь«/).
О Обычно матрицу инциденций типа вершины-ребра называют просто матрицей
инциденций графа.(Примеч. пер.)
64
3. Полным путем или полным полупутем в D называется путь или
полупуть, проходящий через все вершины D.
4. Простым путем в D называется путь без повторяющихся вершин.
5. Простым полупутем в D называется полупуть без повторяющихся
вершин.
6. Замкнутым путем в D называется путь ult и2, ..., ut, ut + x, в
котором wf+ i =Wi ¦
7. Замкнутым полупутем в Z) называется полупуть wb alt и2, a2, ...
.. . futfattut+liB котором wr + x = W!.
8. Полным замкнутым путем в X) называется полный путь, который
замкнут.
9. Контуром в Z) называется замкнутый путь их, и2, ..., utt их, в
котором все вершины различны.
10. Полуконтуром в Z> называется замкнутый полупуть их, ах, и2,
a2,...,uttat,ux>B котором вершины их> и2, ..., ut и дуги ах, a2t..., at
различны.
11. Вершина v достижима из вершины и, если имеется путь из и в у.
12. Вершины и и у соединимы, если имеется путь из м в v.
13. Длиной пути, простого пути, контура, полупути, простого полупути,
или полуконтура в орграфе D называется число дуг, содержащихся в нем.
14. Расстояние d(u, v) от вершины и до вершины v в Z> равно длине
кратчайшего пути от ubv и оно не определено, если путь из и в v
отсутствует.
Б. Пусть G = (F, Е) - граф.
1. Цепью в ^называется последовательность вершин и дуг Mi, еь м2>
е2, ... , ut, ег, м, + х, где Г > 0, причем каждая вершина ty € F и каждое
ребро ej G Е и et всегда является ребром { щ, щ + г} . Цепь обычно
описывается как последовательность вершин их,и2 ut, ut + г.
2. Простой цепью в G называется цепь без повторяющихся вершин.
3. Замкнутой цепью в G называется цепь uXt u2t ...,ut9ut + 1, в которой
Щ + 1 = Щ.
4. Циклом в G называется замкнутая цепь иь еь w2, е2, ... , ut, et, ux,
в которой вершины ии и2,... tut и ребра еА, ^2»• • • » ^г различны.
5. Длиной цепи, простой цепи или цикла в графе G называется число
ребер, содержащихся в них.
6. Расстоянием между вершинами и и v назьюается длина кратчайшей
цепи между и и v; оно не определено, если цепь между ними отсутствует.
П. Подграфы и связность
А, Пусть D= (V, A) — орграф
1. D называется сильно связным (сильным), если для каждой пары
вершин и и и в D и достижима из у и и достижима из и.
2. D называется слабо связным (слабым), если каждая пара вершин
«ии в/)соединима (полупутем).
3. D называется одностороне связным (односторонним), если для
каждой пары вершин и и у в Х)либо и достижима из у , либо у достижима из и,
4. D имеет категорию связности 3, если D — сильный орграф.
5. D имеет категорию связности 2, если D одностороний, но не сильный
орграф.
5. Ф.с. Роберте 65
6. D имеет категорию связности 1, если D слабый, но не односторонний
орграф.
7. D имеет категорию связности О, если D не слабый орграф.
8.Подграфом в D назьюается орграф (W, В) в котором WCVиВсА.
9. Порожденным подграфом в D называется подграф (W, В), в котором
5 содержит все дуги из А, соединяющие вершины в W.
10. Сильной компонентой в Z) называется максимальный сильно связный
(порожденный) подграф.
Б. Пусть G = (F, ?) - граф.
1. Подграфом в G называется граф (W, F), в котором N С F и F СЕ.
2. Порожденным подграфом в G называется подграф (W, F), в котором
F содержит все ребра из Е, соединяющие вершины в W.
3. G называется связным, если каждая пара вершин и и v в G связана
цепью.
4. Компонентой (связности) в G называется максимальный связный
(порожденный) подграф.
Глава 3
ПРИЛОЖЕНИЯ ТЕОРИИ ГРАФОВ
§ 3.1. Знаковые графы и теория структурного баланса
3.1.1. Знаковые графы. Часто граф (орграф) оказывается подходящей
моделью для представления отношений между людьми, например,
отношения "лицо и знает лицо и". Однако нетрудно обнаружить, что такие
отношения могут иметь и иной смысл, не обязательно только означая, что и знает
или не знает и. Например, и может любить или не любить v. Поэтому мы
рассмотрим некоторые способы, позволяющие в структуре, состоящей из
вершин и ребер или вершин и дуг, вводить дополнительную информацию.
В этом параграфе рассматриваются структуры, к ребрам или дугам
которых добавлены знаки плюс (+) или минус (-). Получающиеся в результате
знаковые графы или знаковые орграфы будут применяться здесь для
исследований по теории структурного баланса в социологии и в гл. 4 для
изучения таких разнообразных проблем, как энергетический кризис и
улучшение финансирования научных исследований.
Всю терминологию гл. 2 можно использовать и для знаковых графов
или орграфов, подразумевая, что она относится к соответствующим графам
или орграфам. В то же время часть терминологии носит специфический
"знаковый" характер.
Знак пути, цепи, замкнутого пути, замкнутой цепи, контура, цикла
и т.д. определяется как произведение знаков, входящих в них дут или
Рис. 3.1. Знаковый орграф D и
знаковый граф G
- с
ребер, если знак плюс заменить на +1, а знак минус на — 1. В знаковом
орграфе D на рис. 3.1 путь и, у, w, у имеет знак плюс, контур м, и, w, x9
и имеет знак минус. В знаковом графе G на рис. 3.1 цепь а, Ь9 с, d
отрицательна. Очевидно, что путь, цепь и т.д. имеют знак минус, если число
отрицательных дуг или ребер, содержащихся в них, нечетно, в противном
случае они имеют знак плюс.
3.1.2. Баланс в малых группах. Прежде чем в любой области науки смогут
развиваться теории, пригодные для широкого применения, необходимо
Разработать точные понятия. Мы проиллюстрируем такой этап научных
исследований, взяв неточное понятие и заменив его точным. Этот процесс-
5* 67
необходимая предпосылка развития теории — иногда называется
экспликацией. В частности» мы покажем его особенности, выбрав для примера
задачу из области социологии малых групп. В качестве изучаемых малых
групп могут рассматриваться коллективы лиц, принимающих решения,
комиссии экспертов, группы национальностей, различные
социально-экономические классы и т.д. Такие группы называются "сбалансированными",
если в некотором, не очень ясном пока смысле, они демонстрируют
"отсутствие напряжения" и обладают способностью хорошо выполнять
задание, хорошо работать совместно и т.д.
Мы попытаемся заменить это неточное понятие "баланса" более точным
и в этом процессе проиллюстрируем четырехэтапный контур
математического моделирования, описанный в гл. 1. С этой точки зрения было бы
хорошо для читателя еше раз продумать смысл контура, изображенного
на рис. 1.1.
Формирование математической модели баланса начинается с
образования первичной математической модели малой группы. Люди
представляются вершинами графа, причем, если между лицами а и Ь имеется
(сильная) симпатия или антипатия, то между вершинами а и Ь проводится ребро
{ а, Ъ). Аналогичная модель возникает, если отношения "симпатии -
антипатии" заменить отношением "общаться — избегать", "соглашаться - не
соглашаться" и т.д. Как упрощение, допустим, что отношение симпатии
симметрично, а именно, если лицу а нравится лицо Ь, то и Ь
симпатизирует я. Тогда каждому ребру {а, Ъ) мы можем приписать знак плюс или
минус, сообщая тем самым, симпатизируют ли а и Ь друг другу или нет.
В результате группа представляется в этой модели знаковым графом. (Так
как мы исключили петли, случай симпатии или антипатии самому себе не
рассматривается.)
Построив такую предварительную модель малой группы, вернемся к
понятию баланса. Таким образом, мы не следуем по всему контуру
математического моделирования, изображенному на рис. 1.1, а возвращаемся
к первому шагу для привлечения новой информации, прежде чем перейти
ко второму шагу. Соответствующие сведения можно найти в работе Хей-
дера (Heider [1946]), который изучал группы из трех лиц, в частности,
группы, в которых каждый участник обладает чувством сильной симпатии
или антипатии к каждому другому члену группы. Все возможные такие
группы показаны на рис. 3.2. Хейдер заметил, что группы типов / и ///
были сбалансированы, а группы типов // и IV нет. (В группе / все охотно
работали вместе. В группе/// а и Ъ симпатизируют друг другу, и оба взаимно
не симпатизируют с. Каждый член группы будет удовлетворен, если а и Ъ
будут работать вместе, а с в одиночку. Группа охотно работает совместно.
В группе //, лицо а симпатизирует и Ь, и с и для а желательно работать с
ними обоими. Им бы также хотелось работать с а, но сами они не симпа-
тиризуют друг другу, поэтому в группе существует напряженность.
Формирование рабочих групп затруднено и группа несбалансирована. В группе
IV ее члены не симпатизируют друг другу, всякое сотрудничество
невозможно и группа несбалансированная
Используя данные Хейдера, Картрайт и Харари (Cartwright, Harary
[1956]) заметили, что группам типов / и /// соответствуют циклы с чет-
68
ным числом отрицательных знаков, а группам типов // и IV — циклы с
нечетным числом отрицательных знаков. Анализ этого и других примеров
привел их к следующей математической модели баланса. Малая группа
представляется ее знаковым графом и группа считается сбалансированной,
если каждый цикл в ее знаковом графе положителен. Знаковый граф,
соответствующий сбалансированной группе, будем также называть
сбалансированным. Для иллюстрации этого определения заметим, что знаковый
+Л А А д
1 П Ш П
Рис. 3.2. Возможные группы из трех человек, в которых каждый участник обладает
сильно выраженной симпатией или антипатией по отношению к остальным
Класс А Класс В
и х
и п
ш
х - w +
Рис, 3.3. Сбалансированный знаковый граф
Рис. 3.4. Сбалансированный знаковый граф и разбиение его вершин на два множесгва
граф на рис. 3.3 сбалансирован. В самом деле все его циклы, а именно,
и, v,w,x9u; u9v,x9u; u,v,w,x,v положительны. Переход от четырех
примеров Хейдера (и других) к этому определению не относится к
сфере математики, он иллюстрирует искусство математического
моделирования.
Следующий шаг — прогноз сбалансированности. Его задача состоит в
том, чтобы научиться выявлять какие конкретно группы являются
сбалансированными. Для этого необходимо разработать методы проверки
сбалансированности, поскольку непосредственное использование определения
может оказаться очень сложным для групп достаточно больших размеров.
Например, было бы полезно, если бы читатель попытался применить
определение баланса к графу на рис 3.4. Харари (Нагагу [1954]) предложил
следующий критерий баланса, с которым часто легче работать, чем с
определением: знаковый граф сбалансирован тогда и только тогда, когда его
вершины можно разбить на два класса, так что каждое ребро внутри класса
имеет знак плюс и каждое ребро между двумя классами имеет знак
минус.
Используя этот результат, легко ввдеть, что знаковый граф на рис. 3.4
сбалансирован, поскольку его вершины можно разбить на два класса,
как показано на рисунке. Доказательство теоремы Харари, иногда
называемой теоремой о структуре, включено в следующий пункт. Для этой
теоремы существует следующая интерпретация из области политики. Говорят,
что законодательный орган имеет идеализированную "двухпартийную
структуру", если его членов можно разделить на две группы (которые мож-
69
Стимуляция появления новых
математических
проблем
Математическая
модель
Трансляция,
индукция
Прогнозирование,
дедукция
Математические
и выводы
Информация
о реальном
мире
Проверка
Интерпретация
Выводы
и прогнозы
для реальных
проблем
Рис. 3.5. Расширенная схема процедуры математического моделировании;
включающая взаимосвязи с "чистой мат^ятакой"
но назвать "партиями") таким образом, что все отношения "симпатии —
антипатии" внутри групп положительны и все такие отношения между
группами отрицательны. Таким образом, согласно теореме, при этих условиях
законодательный орган сбалансирован тогда и только тогда, когда он имеет
двухпартийную (а не многопартийную) структуру. (Одна из партий может,
в частности, отсутствовать). КеменииСнелл (Kemeny, Snell [1962, гл. VIII])
высказали предположение, что этот результат может объяснить, почему
многопартийный французский парламент 1950-х годов был несбалансиро-
ван1).
Чтобы указать место работы Харари в нашей схеме процесса
математического моделирования, надо было бы в нее добавить пятый блок, как
показано на рис. 3.5. Таким образом, необходимость анализа математической
модели приводит к развитию новых математических средств, которые в
свою очередь применяются для прогноза поведения и свойств исследуемой
(и других) моделей.
На основе теоремы Харари можно выяснять какие графы
сбалансированы. В свою очередь эти математические результаты могут дать ответ на
вопрос о том, какие малые группы сбалансированы. Например, малая
группа, структура симпатий — антипатий которой может быть представлена
знаковым графом на рис. 3.4, должна быть сбалансирована, т.е. в ней
проявляется стремление к сотрудничеству и отсутствует напряженность.
Последний шаг, состоящий в проверке адекватности модели,
заключается в изучении групп с заданной структурой для выявления того, будут ли
*) Читателю нетрудно оценить всю условность модели и интерпретаций
результатов ее анализа. Следует отметить, что из книги, на которую ссылается автор, это
видно вполне отчетливо. См.: Кемени Дж., СнеллДж. Кибернетическое моделирование:
Некоторые приложения: Пер. с англ.-М.: Сов. радио, 1972. - 192 с. (Примеч. ред.)
70
они сбалансированными или нет. Часто отношения симпатии и антипатии
можно индуцировать среди незнакомых людей в искусственно созданной
группе в лабораторных условиях, если участникам сообщать сведения
друг о друге заблаговременно. (Информацию о лабораторных и других
проверки модели баланса, которые были довольно успешными, см. в
работах Morissette [1958],Taylor [1970])').
Необходимо подчеркнуть, что точное понятие баланса, введенное в этой
модели, не обязательно полностью совпадает с нашим неточным его
понятием. В такой ситуации новое понятие можете действительности оказаться
более полезным, чем старое, даже если они различаются, поскольку оно
может стать всеобщим, и все социологи могут прийти к согласию о его
смысле. Кроме того, для нового понятия мы можем развить точные теории,
делать, точные прогнозы и, возможно, используя его, будем в состоянии
лучше представлять поведение малой группы. Единственно, что следует,
вероятно, сделать, если новое понятие значительно отличается от старого,
это — изменить его название. Такие расхождения между моделью и
исходной ситуацией были бы не допустимы, если бы мы пытались построить,
например, строгую модель определенного типа поведения. Но они часто
оказываются приемлемыми для моделирования неточных понятий.
Прежде чем закончить это предварительное обсуждение теории баланса,
заметим, что одно и то же понятие, однажды разработанное, может
применяться к большему числу ситуаций, включая, первоначально не
рассматривавшиеся. Например, понятие баланса (в его точной форме) применялось
на достаточно предварительном уровне к изучению международных
отношений, в частности, к анализу союзных отношений среди стран, принимающих
участие в решении проблем Ближнего Востока (включая США, СССР и
т.д.). В этом случае знаковый граф строится следующим образом. Страны
являются вершинами и между ними проводится положительное ребро,
если они союзники, отрицательное, если - "враги" (Нагагу [1961а]).
Теория баланса применялась к международным отношениям также в
следующих работах: Abell, Jenkins [1967], Axelrod [1972,1973], Doreian [1969],
Dowly[1970],Hart [1974a,b],Healy, Stein [1973], Sherwin [1972].
В книге Нагагу, Norman, Cartwright [1965] высказано предположение,
что понятие баланса может применяться и к анализу литературных
произведений: если в некоторый момент отношения между персонажами
романа, пьесы, рассказа и т.п. образуют несбалансированный знаковый граф, то
предсказуемо изменение одного из знаков2). (В основе этого
предположения лежит гипотеза о стремлении авторов в конце произведения прийти к
"сбалансированной" или менее напряженной ситуации. Подразумевается
также, что напряженность создается авторами путем построения
несбалансированных ситуаций.)
') Мори сеет предлагал испытуемым гипотетические ситуации, включающие
четырехсторонние отношения, и просил их оценить степень неудовлетворенности
ситуацией. Отождествляя неудовлетворенность и напряжение, он обнаружил, что
сбалансированные ситуации наиболее приемлемы, а несбалансированные неприемлемы
Для испытуемых (технически он использовал идею локального баланса, см.
упражнение 8).
2'На самом деле, для достижения сбалансированности может потребоваться
изменение нескольких знаков. (Примеч. пер.)
71
Математическая модель баланса стимулировала исследования в области
знаковых графов, ставших объектом самостоятельного изучения. В свою
очередь математические методы, разрабатываемые для знаковых графов,
стали использоваться и при анализе других проблем. В гл. 4, применим
совершенно различные модели, основанные на знаковых графах, к
исследованию проблемы растущих потребностей в энергии, к сравнению
вариантов политики в области здравоохранения и т.д. Это иллюстрирует точку
зрения, высказанную во введении книги, а именно, что математические
методы, возникающие из конкретной задачи в области социологии,
биологии или в связи с изучением проблем окружающей среды и
разрабатываемые для собственных нужд, могут оказаться весьма уместными и в других
областях.
В модели баланса, предлагаемой для столь широких приложений,
имеется несколько слабых мест. Мы упомянем четыре. Во-первых,
предполагается, что отношения типа "симпатии" симметричны. Во-вторых, игнорируется,
что некоторые отношения симпатии сильнее других. В-третьих, не
различаются типы несбалансированности, описанные во второй и четвертой
ситуациях на рис. 3.2. И в четвертых, баланс трактуется как "черно-белое"
понятие, игнорируя возможности градации или степени
сбалансированности. В упражнениях мы обсудим, как исключить первое уязвимое место,
используя знаковые орграфы вместо знаковых графов, и четвертое, —
измеряя степень сбалансированности вместо того, чтобы говорить только
о балансе и дисбалансе. Второе уязвимое место можно было бы исключить,
применяя взвешенные графы или орграфы, которые будут рассмотрены в
гл.4.
3.1.3. Доказательство теоремы о структуре. В этом пункте приводится
доказательство теоремы Харари о балансе, называемой теоремой о
структуре1). Сначала сформулируем этот результат в наиболее полном виде.
Теорема 3.1 (Харари). Для знакового графа G={V,E) следующие
утверждения эквивалентны.
(a) Граф G сбалансирован.
(b) Каждая замкнутая цепь в G положительна.
(c) Любые две цепи между вершинами ми v имеют одинаковый знак.
(d) Множество V можно разбить на два множества А и В так, что каждое
положительное ребро соединяет вершины одного множества и каждое
отрицательное ребро соединяет вершины различных множеств.
Доказательство. Докажем последовательность импликаций2)
(а) => (Ь) => (с) => (d) => (а). Доказать, что (d) => (я), очень просто. Всякий
цикл может иметь только четное число ребер между множествами А и В,
так как каждый раз, покидая множество, он должен в него вернуться.
Отрицательными ребрами являются лишь ребра между множествами А
и В. Это завершает доказательство.
Чтобы доказать утвервдение (а) =* (Ь), предположим существование
отрицательной замкнутой цепи в G. Пусть ulfu2,... ,щ, щ — такая
1) Как обычно, доказательство может быть опущено без потери понимания
дальнейшего изложения. Однако это не касается материала, изложенного после
доказательств.
*) Импликация (а) =» @), обозначаемая стрелкой =>, означает, что из
утверждения (а) следует утверждение @). (Примеч. пер.)
72
замкнутая цепь минимальной длины. Поскольку G сбалансирован, она
не может быть циклом и поэтому найдутся такие / < /, что щ = щ. Читатель
легко проверит, что ui9ui+ь...,щ и ul9u2,... 9щ, и;+1,ц+29... ,ut,
Uy являются более короткими замкнутыми цепями, чемг^,^,... ,"*,Mi
и, что одна из них должна быть отрицательна. Это противоречит
минимальности замкнутой цепи щ, и2,..., щ, щ.
Для доказательства утверждения (Ь) => (с) предположим существование
между и и v двух цепей м, щ,..., щ, v и w, v2,..., vSi v. Тогда м, u2,...
..., щ, у, vs, Vj_ х,..., v2, u - замкнутая цепь. Если две исходные цепи
имели бы различные знаки, то полученная замкнутая цепь была бы
отрицательна, что противоречит условию.
И, наконец, для доказательства (с) =» (d) мы можем считать граф G
связным, поскольку можно доказать теорему для связной компоненты (ее
определение см. в п. 2.3.3) и затем составлять множества А и В из различных
компонент. Допуская, что G связен, выберем в V(G) произвольную
вершину и и определим А как множество, содержащее и и все вершины,
соединенные с и цепью из положительных ребер. Пусть В состоит из всех
оставшихся вершин. Если вершины х из А и у из В соединены ребром, то это
ребро отрицательно. В самом деле, вершина х соединена с и цепью из
положительных ребер и, и2, • • • у vt, х. Если ребро { х,у} положительно, тогда
вершина у также соединена с и положительной цепью и, v2>... 9vt9x^y.
Таким образом, вершина у должна была бы оказаться в А, а не в В.
Далее, предположим, что вершины х и у принадлежат А и соединены
ребром. Это ребро должно быть положительным, так как в противном случае
легко получим отрицательную цепь из и в у, добавляя это ребро к
положительной цепи из и в х. Это нарушает условие (с).
В заключение допустим, что вершины х и у находятся в В и соединены
ребром. Из связности G, следует существование цепи, соединяющей и с х.
Из определения множеств А и В и условия (с) эта цепь должна быть
отрицательной. Наконец, ребро, соединяющее х иу> должно быть
положительным, так как в противном случае мы получим цепь со знаком плюс из и
в у, добавляя это ребро к отрицательной цепи из и в х. ¦
Теорема Харари дает конструктивную процедуру для нахождения
разбиения знакового графа G на два множества, если оно существует. Мы
опишем такую процедуру для связного знакового графа.
Лемма. Если связный знаковый граф G не сбалансирован, то для
каждой вершины и найдется такая вершина v, что между и и и имеются две
простые цепи противоположных знаков.
Доказательство. Поскольку G не сбалансирован, в нем имеется
отрицательный цикл С. Если вершина и принадлежит циклу С, в качестве
вешины v возьмем любую другую вершину из С и используем цепи между
ними, составляющие С.
Если и не находится в С, связность G означает, что существует простая
цепь S из и в некоторую вершину цикла С. Возьмем такую кратчайшую
простую цепь S, соединяющую и с вершиной и>из С Пусть v — любая
другая вершина из С. Существуют простые цепи Sx и S2 из wb v
противоположного знака, следующие вдоль С в противоположных направлениях.
Тогда цепи, составленные из S и 5Ь 5 и S2 являются искомыми простыми
цепями. ¦
73
Предположим, что знаковый граф G связен. Пусть и — любая вершина G.
Для нахождения разбиения вершин на два множества поместим и в первое
множество А.
Начав с вершины и, рассмотрим простые цепи длины 1 в остальные
вершины. Пусть вершина v достижима из м. Тогда Поместим v в А, если цепь,
соединяющая v с и положительна, и поместим v во второе множество В
в противном случае. Повторим эту процедуру для простых цепей длины 2,
длины 3 и т.д. вплоть до простых цепей длины п -1, где п — число вершин
в G. Если G — сбалансированный граф, то полученные два множества Л и В
Рис. 3.6. Несбалансированной знаковый
граф
дадут желаемое разбиение. Если G не сбалансирован, то из леммы следует,
что в конце концов окажется необходимым поместить вершину в два
различных множества. В случае, когда такое противоречие встретилось, мы
делаем заключение, что граф G не сбалансирован. Продемонстриуем
использование этой процедуры на знаковом графе, изображенном на рис. 3.4.
Начнем ее, помещая вершину ив А. Поскольку и соединена с v
положительным ребром, поместим вершину v в А. Аналогично, поместим w в А. Далее,
рассматривая простые цепи длины 2, мы видим, что вершина х соединена
с и отрицательной цепью м, у, х> поэтому х поместим в В. Аналогично и
вершину у включим в В. Таким образом,it ={и, v, w)n В ={х,у) оказываются
разбиением на два множества. Рассмотрение других простых цепей длины 2,
3 и 4 не приводит ни к каким противоречиям с этим разбиением. Отсюда
заключаем, что G сбалансирован. С другой стороны, пусть G —
знаковый граф, изображенный на рис. 3.6. Тогда простые цепи из и длины 1
заставляют поместитьz, v и у в А, а простые цепи длины 2 заставляют
поместить w, sviXBAvitBB.Ho одна простая цепь длины 3 приводит к
включению w в Ву что невозможно. Таким образом, приходим к выводу, что G
не сбалансирован. В нем существует отрицательный цикл и его легко найти.
Упражнения
1. Для знаковых графов на рис. 3.7 определить знаки всех простых цепей длины 4,
начинающихся с вершины а, и знаки всех циклов.
2. Для знакового орграфа на рис. 3.8 определить знаки всех простых путей длины 4,
начинающихся в л, и знаки всех контуров.
3. Какие графы на рис. 3.9 сбалансированы? Указать для них разбиение на два
множества.
4. Матрица смежности знакового графа G имеет вид А = {аф, где
1+1, если ребро (/,/) положительно,
-1, если ребро (/,/) отрицательно,
О, если ребро (/, /) отсутствует.
74
Пусть G имеет матрицу смежности вида
1
2
3
4
5
6
1
/ °
( ~~l
-1
-1
I 1
\-l
2
-1
0
1
1
0
0
3
-1
1
0
1
0
0
4
-1
1
1
0
0
0
5
1
0
0
0
0
-1
6
л
0
0
-1 I
о/
Является ли граф G сбалансированным?
5. Знаковый граф называется N-сбалансированным, если каждый цикл длины,
не превосходящей N, положителен. Привести пример 3-сбалансированного
знакового графа G, который не является 4-сбалансированным.
ё* -
а 6*6
Рис. 3.7. Знаковые графы к упражнениям § 3.1
Рис.3.8. Знаковый граф к упражнению 2 § 3.1
Рис. 3.9. Знаковый граф к упражнению 3 § 3.1
75
6. Нарисовать знаковый граф, изображающий союзнические отношения стран,
заинтересованных в решении проблем Ближнего Востока, и обсудить какие
необходимы изменения, чтобы сбалансировать эту ситуацию.
7. Нарисовать знаковые графы, представляющие отношения симпатии - антипатии
в различных частях некоторого романа, пьесы или рассказа. (Предполагается, что
это произведение достаточно высокого уровня.) Обсудить вопросы баланса.
8. Знаковый граф называется локально сбалансированным в вершине и, если
каждый цикл, содержащий и, положителен. Показать, что знаковый граф может быть
локально сбалансированным в некоторой вершине и, не будучи сбалансированным
глобально.
9. Известна теорема (Нагагу, Norman, Cartwright [1965, p. 345 ], утверждающая,
что если связный знаковый граф G не имеет вершины, удаление которой нарушает
связность G1), то G сбалансирован тогда и только тогда, когда он локально
сбалансирован (см. упражнение 8) в некоторой вершине. Показать, что не для всех связных
знаковых графов теорема верна.
10. Доказать следующее утверждение или привести опровергающий пример. Если
связный знаковый граф несбалансирован, то для каждой пары вершин и и v
существуют две простые цепи между и и v противоположного знака.
11. (Davis [1967]). Будем говорить, что знаковый граф G соответствует
идеализированной партийной структуре, если вершины G можно разбить на классы таким
образом, что все ребра, соединяющие вершины одного класса, положительны, а все
ребра, соединяющие вершины разных классов, отрицательны3).
а. Привести пример знакового графа, который обладает таким свойством.
б. Привести пример несбалансированного знакового графа, соответствующего
идеализированной партийной структуре.
12*. (Davis [1967]).Показать,что знаковый граф соответствует
идеализированной партийной структуре тогда и только тогда, когда в нем нет циклов с
единственным отрицательным ребром.
13*. (Davis [1967]). Пусть G - полный знаковый граф, т.е. в нем между любой
парой вершин имеется ребро. Показать, что, если G соответствует идеализированной
партийной структуре, то она единстренна.
14. Упражнения 14-20 имеют дело с нашей моделью, в которой исключено
ограничение о симметричности отношения сильной симпатии или антипатии в малой
группе3). Естественное обобщение нашей модели малой группы состоит в представлении
ее вместо знакового графа знаковым орграфом с дугами и знаками, имеющими
очевидную интерпретацию. Естественное обобщение понятия баланса в этом случае
состоит в следующем: знаковый орграф сбалансирован тогда и только тогда, когда
каждый контур положителен. Однако имеется несколько случаев, не укладывающихся
в это определение. Например, знаковый орграф на рис. 3.10, а согласно определению
сбалансирован. (он вообще не имеет контуров, поэтому все положительные контуры
сбалансированы), но на практике такая группа оказывается несбалансированной.
Напряжение возникает, поскольку а симпатизирует Ъ и с и поэтому ожидается, что
и Ъ симпатизирует с. (Если читатель не удовлетворен этим примером из-за отсутствия
контуров, он может рассмотреть знаковый орграф на рис. 3.10, б.) Вторая сложность
с предложенным определением заключается в том, что при его использовании
несправедлив очевидный аналог теоремы о структуре. (Читателю будет предложено
показать это ниже.) Оказывается, что для орграфов понятие баланса лучше определять
в терминах полуконтуров, а не контуров. В частности, мы назовем знаковый орграф
сбалансированным, если в нем каждый полуконтур положителен. (Некоторые
авторы исключают полуконтуры длины 2, однако мы включаем и их.) Знаковый орграф
на рис. 3.11 сбалансирован, так как все его полуконтуры м, v,w.x, и; и, v,x, и, и
u,w,jc, v положительны. (Мы не включили в описание этих полу контуров дуги,
поскольку они определяются однозначно.) Выяснить, какие из знаковых орграфов,
изображенных на рис. 3.12, сбалансированы.
*) Такая вершина называется точкой сочленения. (Примеч. пер.)
2) Такой знаковый граф называют группируемым. (Примеч. пер.)
3) Читателю, который не прочел последнюю часть п. 2.2.3, следует пропустить
и эти упражнения.
76
А
ad » \с
Рис. 3.10. Два знаковых орграфа, все контуры которых положительны
Рис. 3.11. Сбалансированный знаковый орграф
9
к _
+
а
1/
а
Рис. 3.12. Знаковые орграфы к упражнениям § 3.1
15. Теорема Харари имеет естественный аналог для знаковых орграфов. Для
знакового орграфа D- (К, Л) следующие утверждения эквивалентны: (a) D
сбалансирован; (Ь) каждый замкнутый полупуть положителен; (с) любые два полупути
между вершинами и и v имеют одинаковый знак и (d) множество V можно разбить на
два множества А и В так,4что каждая положительная дуга соединяет вершины одного
множества и каждая отрицательная дуга соединяет вершины различных множеств.
По этой теореме знаковый орграф на рис. 3.13 сбалансирован, так как имеется
указанное на рисунке разбиение на два множества. Построить разбиение на два множества
для сбалансированных знаковых орграфов, приведенных на рис. 3.12.
16. Показать, что условия (а) и (d) теоремы Харари не эквивалентны, если
знаковый орграф считается сбалансированным, тогда и только тогда, когда каждый
контур положителен.
17. (Нагагу, Norman, Cartwright [ 1965]).Предположим, что каждая сильная
компонента знакового орграфа D сбалансирована. Будет ли каждый контур в D
положителен? (Привести доказательство или противоречащий пример.) Будет ли D
сбалансирован ?
18*. (Нагагу, Norman, Cartwright [ 1965]). Предположим, что в сильно связном
знаковом орграфе D каждый контур положителен. Является ли D сбалансированным?
(Привести доказательство или противоречащий пример.) (Указание. Преобразовать
отрицательный полуконтур м,, йх, и2, а2,..., ut, at, ut в замкнутый путь,
переориентируя дуги Of, соединяющие щ+\ с щ.)
19. (Нагагу, Norman; Cartwright [ 1965]). Пусть в подграфе Р знакового орграфа!)
множество вершин состоит из вершин всех положительных дуг орграфа Д
образующих множество дуг для Р. Доказать следующее утверждение или привести
противоречащий пример: если D слабо связен, а Р не связен, то D сбалансирован.
20. Доказать теорему из упражнения 15.
21. Упражнения 21 — 26 основаны на том, что модели баланса, описанные в тексте
главы 3 и в предыдущих упражнениях, предполагают резкое различие между
"балансом" и "дисбалансом" и не предусматривают возможность большей или меньшей
сбалансированности отдельных ситуаций. Нам бы хотелось "измерить" степень
сбалансированности, соотнося каждому знаковому графу G некоторое число b(G) соответ-
77
Класс А Класс В
и и
ш х
2 У
•+ ш
Циклы
Длина 3 Знак Длина 4 Знак Алина 5 Ьнак
¦ и,и,и/,х,и - t/ttr,ur,x,u,u -
+ и,и,х,у,и +
и,ш,х,и - a,b,z,y,a +
Рис. 3.13. Сбалансированный знаковый орграф и разбиение его вершин на два множества
Рис. 3.14. Знаковый граф и его циклы. Мера баланса в упражнении 22 § 3.1
вычисляется следующим образом: р% = О, Г,= 0,ръ- 2, Г, = 5, р4 = 2, Г4 = 3, р9 = 0, Гв =1,
Pi =f / = 0 для Г > 5. Таким образом,
1/3 • 2 + 1/4 • 2 + 1/5 • 0 70
b(G).
1/3-5 + 1/4-3 + 1/5 -1 157*
ствующееотносительному балансу G1). Конкретное значение b(G) не существенно,
нас будет интересовать лишь соотношение между величинами ft(G)n b(G') двух
графов Си С, т.е. случаи когда ft(G) больше, меньше или равно b (G'). В
литературе по социологии и теории графов описан ряд мер относительного баланса. В книге
Тейлора (Taylor [1970]) приведен обзор многих из них. Один подход состоит в
следу ющием: если р — число положительных циклов G, a t — общее число циклов, можно
измерять относительный баланс величиной b (G) -pit. Или использовать величину
b' (G) =p/w, где п - число отрицательных циклов. (Если п = 0, а р =? 0, то величина
ft' (G) подразумевается бесконечной. Если п = 0 и р = 0, то величины b (G) и 6' (G)
не определены.)
а. Вычислить b(G) и ft' (G) для каждого знакового графа, изображенного на
рис. 3.7.
б. Показать, что меры ft(G) и b' (G) по существу совпадают, т.е. для
произвольных знаковых графов Gt и G2 (для которых либо п Ф 0, либо р Ф 0) ft (G,) > ft (G2)
тогда и только тогда, когда ft' (Gf) > ft1 (Ga).
22. При измерении относительного баланса иногда желательно учитывать длину
цикла. Допуская, что циклы длины к становятся менее существенными с точки
зрения их вклада в баланс по мере роста к, мы могли бы отразить эффект влияния
длины цикла, используя коэффициент 1/к. Таким образом, если р^ - число
положительных циклов длины kytk - общее число циклов длины к и с - длина самого длинного
цикла в G, мы можем измерять относительный баланс величиной
С j
ь~4 к
к
Применение этой меры иллюстрируется рис. 3.14, где она используется для
определения степени баланса конкретных знаковых графов.
а. Вычислить ft (G) для каждого знакового графа, изображенного на рис. 3.7.
б) Вычислить ft(G) для знакового графа, полученного из графа на рис. 3.14
изменением знака ребра { а, Ъ } с плюса на минус. Является ли новый знаковый граф бо-
') Аналогичное обобщение возможно и для знаковых орграфов, если термин
цикл заменить термином пол у контур.
78
лее (или менее) сбалансированным, чем исходный граф, или они сбалансированы в
одинаковой степени?
23. а. Совпадает ли по существу (в смысле, указанном в упражении 21) мера
баланса Ь (G) из упражения 22 с любой из мер упражнения 21?
б. Показать что мера Ь (G) по существу совпадает с мерой
Е
*=з
с
Е
*=з
—
к
—
Pit
"к
где щ число отрицательных циклов длины к .
в. Совпадает ли по существу мера b (G) с мерой
/iv
It)
*=3 ¦ - -р*
b"(G) = '
с
2
(Замечание. Поскольку имеется много различных мер баланса, хотелось бы
использовать некоторый систематический метод для выбора одной из них. Одним из часто
используемых способов получения меры, когда возможны несколько подходов,
является аксиоматический метод. Для этого перечисляются определенные аксиомы
или свойства» которым искомая мера (баланса) должна была бы удовлетворять.
И затем мера считается приемлемой, если она удовлетворяет всем перечисленным
аксиомам. Мы опишем несколько таких аксиоматических подходов в этой книге.
Аксиоматический подход к измерению баланса излагается в статье Нормана и Роберт-
са (Norman, Roberts [1972a]), а применение полученной таким образом меры
баланса к теории справедливого распределения в социологии описано в другой статье тех
же авторов [ 197 2Ь ].)
24. Используя меру баланса из упражнения 22, доказать или опровергнуть
следующее социологическое утверждение: "оценить - не хуже, чем не оценить". Более
конкретно, доказать или опровергнуть следующее утверждение: если в знаковом графе
D у ребра {а,Ь} знак не определен, то выбор для него одного из знаков плюс или
минус приведет по меньшей мере к такой же величине меры баланса Ь, как и
удаление этого ребра.
25*. (Нагагу, Norman, Cartwright [1965].) Предположим, что в связном
знаковом графе G, имеющем более одного цикла, нет вершины, удаление которой делает
его несвязным. Показалось, что Ъ (G) > О, где Ъ — мера баланса из упражнения 22.
26. В этом упражнении рассматривается еще одна мера баланса, называемая
реберным индексом (Нагагу, Norman, Cartwright [1965]).
а. Пусть G - знаковый граф. Отрицание множества ребер (N-множество)
получается изменением знака каждого ребра в этом множестве. Показать, что в любом
знаковом.графе имеется (возможно, пустое) множество ребер, изменение знаков
которых приводит к балансу.
б. Множество ребер называется минимальным отрицанием (N-множеством), если
изменение знаков этих ребер приводит к балансу, тогда как изменение знаков ребер
любого его собственного подмножества к балансу не приводит. Привести пример
такого множества в знаковом графе на рис. 3.14.
в. Множество ребер называется минимальным 1>множеством, если удаление всех
его ребер приводит к балансу, тогда как удаление любого его собственного
подмножества к балансу не приводит. Привести пример минимального />множества в
знаковом графе на рис. 3.14.
г. Доказать, что каждое минимальное TV-множество ребер содержит минимальное
^-множество.
Д*. Доказать, что каждое минимальное /^множество ребер содержит
минимальное ^-множество . (Указание. Использовать теорему о структуре.)
79
е. Показать, что каждое минимальное />множество является минимальным
^множеством и наоборот.
ж. Реберным индексом \ (G) знакового графа G называется число ребер в
наименьшем минимальном />множестве (или ^множестве). Вычислите реберный индекс
знакового графа на рис. 3.14.
з. Было бы удобно, если бы реберный индекс \ (G) был связан с мерой Ь (G) из
упражнения 22 обратной зависимостью. К сожалению, ситуация здесь не настолько
проста-Привести пример, показывающий, что X (G) может быть меньше, чем \ (<Г), но
b(G) также меньше, чем b(G').
27. Исследовать с точки зрения относительного баланса знаковые графы,
представляющие союзнические отношения среди стран, вовлеченных в ситуацию на Ближнем
Востоке.
28. Исследовать с точки зрения относительного баланса знаковые графы,
представляющие отношения симпатии - антипатии на различных этапах развития действия
некоторого романа, пьесы или рассказа. Возрастает или убывает относительный
баланс на различных этапах?
§ 3.2. Турниры
Пусть в орграфе (F, А) любая пара вершин и, ыЕ V9 иФ\) соединена
одной дугой: либо (м, и) € А, либо (и, и) €-4. Такой орграф называется
турниром. На рис. ЗЛ5 изображены все турниры с двумя, тремя и
четырьмя вершинами.
Турниры возникают во многих различных ситуациях. Самый простой
пример — круговые соревнования при игре в теннис, бейсбол и т.п.1).
(В круговых состязаниях проводятся встречи для всех пар игроков
(команд), в каждой из которых определяется единственный победитель.
Считаем, что ничьи не допускаются.) Турниры также возникают в
экспериментах по парным сравнениям, в которых их участнику предъявляют
все возможные пары вариантов из некоторого множества и в каждой
паре просят указать наиболее предпочтительный, наиболее красивый,
лучший в некотором смысле и т.п. Ситуации турниров встречаются в
отношениях между животными, когда одни представители данного вида
добиваются превосходства над другими. В таких случаях в каждой паре
животных определенного вида одно и только одно из них доминирует
над другим. Отношение превосходства определяет так называемое
"упорядочение по силе" или "упорядочение клевками" среди рассматриваемых
животных2).
В этом параграфе докажем некоторые результаты о турнирах, в
частности, относящиеся к методам определения победителя в турнире. В основ-
О Читатель, конечно, отличает круговые соревнования от соревнований с
выбыванием, встречающихся более часто.
2) Для любой пары волков стаи равенство невозможно и социальный порядок
основан на "иерархии превосходства" или упорядочении по силе. Известно, что вожак
стаи, обычно самец, является "первым волком". Когда встречаются два волка, один
обычно демонстрирует свое превосходство - его хвост задран, шерсть вздыблена,
уши торчат, стойка прямая. Другой ставит себя в подчиненное положение, опуская
хвост между ног, поджимая зад и прижимая губы и уши. Подчиненный волк может
даже перекатываться на спине» иногда мочась и поскуливая (Fisher [ 1975 ]). Биологи
весьма интересуются социальной организацией животных. Эта развивающаяся область
освещена (с эволюционной точки зрения) в книге Wilson [1975] (см. также Wilson
A971]).
80
щ Т5 Т6 Т7
Рис. 3.15. Все турниры с двумя, тремя и четырьмя вершинами (с точностью до
переобозначения вершин)
ном в наших математических построениях мы следуем книге Харари и др.
(Нагагу, Norman, Cartwright [1965, гл. 1]). Читателю, заинтересованному
в более полном знакомстве с турнирами, рекомендуется книга Муна
(Moon [1968]).
Если орграф (V, А) соответствует турниру, мы можем связать с
игроком и количество набранных им очков s (и) или, иначе говоря, число иг*
роков, которых он победил. Используя язык теории графов можно сказать,
что величина s (и) — это число вершин и, для которых имеется дуга из и
в v. (В произвольном орграфе такое число часто называют полустепенью
исхода вершины и.) Будем считать, что игрою! (вершины) турнира
помечены числами 1, 2, ..., и, где п — число элементов в К и пусть s (/) —
количество очков игрока /. Последовательность (s(l), sB), ..., s(n))
будем называть последовательностью очков данного турнира.
На рис. 3.16 изображен теннисный (смешанный) турнир с шестью
игроками. Графическое задание турнира не очень удобно, легче работать с
матрицей смежности, которая также представлена на рис. 3.16. По матрице
смежности можно непосредственно определить последовательность очков
турнира: s (i) есть сумма элементов i-й строки матрицы.
Первая задача, которую мы рассмотрим, касается определения игрока
или игроков с максимальным количеством очков, Такого игрока (или
игроков) и было бы, по-видимому, целесообразно считать победителем
(победителями), В теореме, которая будет доказана ниже, говорится, что,
если и — игрок с максимальным количеством очков, то для каждого
другого игрока v либо и побеждает v9 либо и побеждает некоторого игрока,
выигравшего у и. Эта теорема была установлена Ландау (Landau [1955])
при изучении "упорядочения клевками" среди цыплят. Теорема в этом
случае утверждает, что если цыпленок и "заклевывает" наибольшее число
цыплят, то для каждого другого цыпленка v либо и "заклевывает" и,
либо и "заклевывает" цыпленка, "заклевывающего" у. В терминах
отношения предпочтения теорема означает, что если объект и предпочтительнее
наибольшего числа объектов, тогда для любого другого объекта v либо и
6. Ф.с. Роберте
81
Гулагонг
Кинг
Роздал
Коннорс
Смит
Эверт
Смит j
Коннорс
Розуол
Кинг ]
Гулагонг
Эверт
/ °
1 °
1
1
1 1
\ 1
Смит
1
0
0
1
1
1
Коннорс
0
1
0
0
0
1
Розуол
0
0
1
0
1
0
Кинг
0
0
1
0
0
1
Гулагонг
0 \
0 \
0
1
0 /
0 /
Очки
(сумма
по строке)
1
1
3
3
3
4
Рис. 3.16. Теннисный турнир с 6 игроками и его матрица смежности
предпочтительнее и, либо и предпочтительнее некоторого объекта, который
более предпочтителен, чем v. Например, в турнире, изображенном на
рис. 3.16, Гулагонг имеет наибольшее количество очков. Она выиграла
у всех, кроме Розуол, и она же победила Кинг и Коннорс, выигравших
уРозуол.
Теорема 3.2 (Landau). Если в турнире (F, А) вершина и имеет
наибольшее количество очков, то для любой другой вершины v либо (м, v) G
? А, либо для некоторой вершины w, (u9w) ЕАи (w, v) €A.
Доказательство. Пусть s = s(и) и пусть из вершины и выходят
дуги в вершины и\9 и2, . •., us. Предположим, что для некоторой
вершины v дуга (иу у) отсутствует. Тогда по определению турнира имеется
дуга из v в м. Если v "побеждает" каждую щ> то количество очков у v
по меньшей мере равно s + 1, поскольку v "выигрывает" также иум.
А это противоречит максимальности количества очков, набранных и. Таким
образом, для некоторого / вершина, v не "выигрывает" у uiy поэтому
(м, щ) €А и (м,-, и) GA. В качестве w тогда можно взять вершину щ, ¦
Условие, сформулированное в теореме 3.2, необходимо для того, чтобы
вершина и была "победителем". Однако это условие не достаточно,
поскольку имеются примеры турниров, в которых вершина и ему
удовлетворяет, но не "имеет" наибольшего количества очков. Построение такого
примера оставляется читателю (см. упражнение 11),
Иногда возникает необходимость проранжировать участников турнира,
а не только определить победителя. Такая .ситуация может встретиться,
если для участников, занявших последующие места, также имеются
награды - второй приз, третий приз и т.д. Или, например, если "игроки" -
возможные кандидаты на выполнение некоторого задания, а турнир
представляет наши предпочтения. Первый выбранный кандидат может не
согласиться и нам может понадобиться отобрать второго, третьего и т.д., что
мы и сможем сделать, упорядочив их заранее. Один из способов ранжиро-
82
вания игроков состоит в использовании последовательности очков. Однако
он может приводить к равенству рангов (дележу одного места),
Другие методы ранжирования можно предложить, исследуя связность
турниров. Турнир может, конечно, оказаться сильно связным, что впрочем
не обязательно, (Рассмотрите два турнира с тремя участниками,
изображенных на рис. 3.15.) Может ли турнир иметь категорию связности 0 или 1?
Ответ отрицателен. Для каждой пары вершин и и v имеется дуга из и в и
или из v в и и, следовательно, они соединены путем. Таким образом, всякий
турнир есть односторонний орграф, и поэтому его категория связности
равна 2 или 3.
Можно даже сказать больше. Читателю следует вспомнить, что по
теореме 2.4 в каждом одностороннем орграфе есть полный путь, т.е. путь,
проходящий через все вершины. В турнире имеется не только полный путь, но
и полный простой путь1). Этот результат, крторый мы вскоре докажем,
означает, что всех участников турнира ultu2,..., wn можно занумеровать
таким образом, что их выигрывает у и2> и2 выигрывает у м3» ••.» ^п-\
выигрывает у ип. Такая нумерация дает нам упорядочение игроков: их
имеет первый ранг, и2 — второй и т д. Для иллюстрации рассмотрим турнир
на рис. 3.16. Для него полный простой путь и определяемое им
ранжирование записывается так:
Гулагонг, Кинг, Розуол, Смит, Коннорс, Эверт.
Прежде чем выяснять, является ли такое окончательное ранжирование
игроков "хорошим", сформулируем и докажем, упомянутую выше
теорему.
Теорема 3.3 (Redei [1934]). В любом турнире (V, А) имеется полный
простой путь.
Доказательство, Проведем доказательство индукцией по числу
вершин п. Если п= 2, то турнир (F, А) является турниром 71,
изображенным на рис. 3.15, и дугаA,2) образует полный путь. Допуская, что результат
справедлив для турниров из п вершин, докажем его для турнира (К, А)
с п + 1 вершинами. Для произвольной вершины и рассмотрим подграф,
порожденный множеством V\ {и}. Легко проверить, что этот подграф
также турнир. Поэтому по индуктивному предположению он имеет полный
простой путь и\, и2,..., ип. Если из и есть дуга в и\, тогда и, их, и2 f..., ип
является полным простым путем в турнире (F, А). Если же дуги из и в их
нет, то пусть / — такой наибольший номер, что дуга из и в щ отсутствует.
Если / = п тогда, поскольку (F, А) — турнир, должна быть дуга из ип в м,
и получаем,что Ui,u2>... ,иП9иесть полный простой путь в турнире (V,A).
Если же i < я, тогда из тех же соображений должна быть дуга из м,- в и и
более того по определению / имеется дуга из и в w,-+i. Таким образом,
и\>иг> *. •, Щ9 и, щ+1, ttj+2, ..., ип есть полный простой путь в
турнире (V9A). ш
Полный простой путь Mi, u2i ,.., ип в турнире (F, А) мы можем
использовать для определения ранжировки игроков. Читатель заметит, что
в турнире на рис. 3.16 ранжировка, полученная при помощи полного прос-
') Полный простой путь в орграфе часто называется гам ил ью новым путем в честь
сэра Уильяма Рована Гамильтона, ирландского математика XIX века. Гамильтоновы
пути имеют много приложений (см., например, упражнения 19 и 20).
6* 83
того пути: Гулагонг, Кинг, Розуол, Смит, Коннорс, Эверт не совпадает
с ранжировкой, полученной при помощи последовательности очков:
Гулагонг, Кинг-Розуол-Коннорс, Смит-Эверт (черточка обозначает дележ мест).
Таким образом, два метода ранжировки приводят к различным
упорядочениям, что делает спорным выбор окончательного упорядочения игроков
(или альтернатив в случае упорядочения по предпочтению). Более того,
дело обстоит еще хуже, поскольку в турнире можно найти и другие полные
простые пути, например, Кинг, Смит, Коннорс, Розуол, Гулагонг, Эверт.
В такой ситуации имеется много возможных упорядочений игроков. Но
Рис. 3.17. Турнир.
Последовательность полученных очков B, 1, 1, 2).
Для каждой вершины а и любого
ранга г имеется некоторый полный
простой путь, согласно которому а
получает ранг г
и эта ситуация не самая худшая. В турнире на рис. 3.17 для каждой
вершины а и любого допустимого ранга г имеется некоторый полный простой
путь, согласно которому а получает ранг г1).
Вообще, если задано некоторое множество возможных упорядочений,
мы можем пытаться выбрать согласованное. Задача согласования
различных вариантов упорядочений весьма трудна и заслуживает большего
обсуждения, чем автор может позволить себе здесь. Мы вернемся к этому
вопросу в гл. 7.
Теперь попытаемся ответить на вопрос — имеются ли условия, при
которых сложности, связанные с наличием нескольких возможных
вариантов упорядочения, не возникают, т.е. когда в турнире имеется
единственный полный простой путь, или когда упорядочение при помощи полного
простого пути совпадает с упорядочением, полученным с использованием
последовательности набранных очков? Ответы на оба вопроса будут
положительны, причем эти условия совпадают. К сожалению, оказывается, что
многиз турниры им не удовлетворяют.
Для нахождения этих ответов рассмотрим турниры из двух, трех и
четырех вершин, изображенные на рис. 3.15. Турнир Т\ имеет
единственный полный простой путь. Из двух турниров с тремя вершинами только
в Т2 есть единственный полный простой путь, а из турниров с четырьмя
вершинами таким является Г4. (Искомый путь —4, 1, 3, 2.) В числе
других полных простых путей в турнире Т5 имеются полные простые пути 4,
2, 1, 3 и 4, 1, 3, 2, в турнире Т6 - 1, 3, 2, 4тл 3} 2, 7, 4, а в турнире Г7 -
4,1, 3, 2и4, 3, 2,1.
Заметим, что турниры на рис. 3.15 за исключением турниров Тх, Т2 и Т4
содержат контур длины 3. Это наблюдение приводит к теореме о том, что
полный простой путь имеется в турнире тогда и только тогда, когда в
нем нет контуров длины 3. Вскоре докажем этот результат. (Теорема
также утверждает, что в турнире существует единственный пппнш птюстой
1) Пример несколько большей сложности приведен в книге Нагагу, Norman, Cart-
wright [1965, с. 292].
84
путь тогда и только тогда, когда в нем вообще отсутствуют контуры, т.е.
турнир является бесконтурным. Оставляем доказательство этого
утверждения читателю (см. упражнение 14).)
Отметим, что и, и, и>, и будет контуром длины 3 тогда>л только тогда,
когда (м, v) ЕЛ, (и, w) GA и (w,u) EA. Если же контуров длины 3 нет,
тогда при условии, что (и, и) ЕА и (у, w) GА, дуга (н>, м) не может
принадлежать^; таким образом,
из (м,v) ЕА и (v9w)GA следует,что (u9w)GA. A)
Орграф, который удовлетворяет условию A) для всех и, и, wEA при
и Ф w, называется транзитивным 1). Таким образом, всякий турнир без
контуров длины 3, является транзитивным. Верно также и обратное, В
реальных ситуациях многие турниры оказываются нетранзитивными.
Такие случаи, конечно, возникают в спорте. Действительно, если бы все
спортивные турниры были транзитивны, соревнования были бы слишком
скучными. Даже для отношений предпочтений имеются нарушения
транзитивности, т.е. ситуации, в которых и предпочтительнее и и и
предпочтительнее w, но w предпочтительнее и. Например, предположим, что цена для вас
существеннее, чем качество, но вы выбираете за основу качество, если цены
довольно близки. Предположим также, что и и v — близки по цене,
причем и выше по качеству, так что для вас и предпочтительнее, чем и. И пусть,
более того, v и w близки по цене, причем v выше по качеству, так что для
вас v предпочтительнее, чем w. Однако и может уже иметь достаточно
высокую по сравнению с w стоимость, и поэтому для вас w
предпочтительнее м. Этот пример взят из (Krants et al. [1971]).
Мы теперь готовы сформулировать искомые условия.
Теорема 3.4. Для турнира (К, А) следующие утверждения эквивалентны:
(a) существует единственный полный простой путь;
(b) отсутствуют контуры длины 3;
(c) турнир (V9A) бесконтурный;
(d) турнир (V,A) транзитивный.
Более того, если турнир (К, А) транзитивен, то упорядочение, полученное
при помощи единственного полного простого пути, совпадает с
упорядочением, полученным при помощи последовательности очков.
Доказательство. Установим эквивалентность утверждений (я),
(Ь) и (с/), оставляя читателю доказательство их эквивалентности
утверждению (с) (см. упражнение 14). В нашем доказательстве построим последо
вательность импликаций: (а) => (Ь) =*• (d) => (а),
Мы уже показали справедливость импликации (b) => (d). Теперь уста
новим, что (d) =*(я). Предположим, что турнир (F, А) транзитивен. Тогда
легко доказать по индукции, что если вершина v достижима из вершины м,
то (м, у) ЕЛ. Допустим, что в турнире (F, А) имеется два различных
полных простых пути. Поскольку они не совпадают, то для некоторой
*) В теории отношений (см. §8.2) говорят о наличии транзитивности, если условие
A) выполнено для всех и, v, we V, Мы требуем иФ w потому, что по договоренности
пренебрегаем петлями в наших орграфах, а дуга (и, w) была бы петлей при ы = н>.
В турнирах одновременно не могут существовать дуги (м, и) и (и, и); поэтому такое
Допущение излишне. Оно также будет излишним при изучении транзитивных
ориентации в п. 3.3.3.
85
пары различных верщин и и v вершина и предшествует и в одном пути,
а и предшествует и в другом. Но тогда v достижима из и по второму пути
и и достижима из v по первому, а это означает, как отмечалось выше, что
(м, и) € А, (и, и) € Л и противоречит основному свойству турниров.
Следовательно, в турнире (V,A) имеется не более одного полного простого пути.
Но по теореме 3.3 в турнире всегда есть полный простой путь, и, значит
мы доказали, что (d) => (а).
Для доказательства импликации (а) =*• (Ь) предположим существование
в турнире (F, А) единственного полного простого пути их, и2} ,.., ип.
Докажем, что (и,-, uf) Е А тогда и только тогда, когда / < /. Это и означает
отсутствие контуров длины 3, поскольку для такого контура И/, м/, ик,
щ мы получили бы i < / < к < /. Поскольку (К, А) — турнир, достаточно
доказать, что, если /< /, то (uit uf) EA. Предположим несправедливость
этого утверждения. Тогда найдется такое наименьшее i, / < /, что (м,-, uf) ^
$А, Теперь для этого фиксированного / возьмем наибольшее возможное/.
Сначала допустим, что />1 и/<«, Тогда (w/_i, w/+i) €A вследствие
минимальности / и (ui9 m/ + i) €A вследствие максимальности /. Кроме
того, («/, щ) G А из определения турнира. Следовательно,Wj, ы2,...»"f-i,
«/+1,1//+2, .. •, и/, "j, w/+i, "/+2» •••»"«- еЩе °Дин полный простой путь.
Если w=l, мы просто исключаем начальный отрезок пути ui9 и2,..., щ~\,
если же / = п, мы исключаем конечный отрезок w/+1, w/+2, ..., ип и
сохраняются те же рассуждения. В любом случае единственность полного
простого пути нарушается. Это и доказывает, что (щ9 Uj) G А при i < / и
поэтому доказательство эквивалентности свойств (a), (b)t (d) завершается.
Наконец, из доказательства импликации (а) => (Jb) мы знаем, что если
и\, и2, ..», ип — единственный полный простой путь, то (м,-, uf) G А тогда
и только тогда, когда /< /. (Это замечание заслуживает отдельной
формулировки в виде следствия.) Таким образом, s (w,) = n — i и, значит,
упорядочения, полученные при помощи единственного полного простого пути
и последовательности очков, одинаковы. Это завершает доказательство
теоремы 3.4. ¦
Следствие. Если турнир (F, А) имеет единственный полный простой
путь и\, и2, ..., ип, то (м/, Uf) G ^4 тогда и только тогда, когда i < /. Более
того, s(щ) =n-i. Единственный полный простой путь можно
найти,выбирая вершины в порядке убывания числа очков.
Необходимо заметить, что теория орграфов может быть полезной при
анализе структуры доказательств, аналогичных вышеприведенному. Пусть
задана совокупность из п утверждений, эквивалентность которых мы
хотим установить; тогда построим орграф, в котором вершинами служат
эти утверждения, а дуга проводится от утверждения и к утверждению и,
если из и следует и. Полученный орграф называется орграфом импликаций,
п утверждений эквивалентны тогда и только тогда, когда этот орграф
сильно связный. Таким образом, наименьшее число доказательств,
необходимых для проверки эквивалентности п утверждений, определяется
сильно связным орграфом с п вершинами и минимальным числом дуг.
Таким орграфом является контур (сравнить упражнение 12 § 2.2).
Теперь остановимся на использовании теоремы 3.4 и ее следствия при
выявлении предпочтений лица, принимающего решения, или оценки им
86
СЗ
юз
Ц
юв
ев
(Седеро-босп
СЗ
/ 0
/ 0
0
¦
1 0
\ о
(Центр)О)к
ЮЗ
1
0
0
0
1
СЗ (Северо-запад)
ц
1
1
0
1
1
ЬЯ7? (Юго-бостон)
ЮВ
1
1
0
0
1
ев
1 \
0 1
0
о /
0 /
Оценка
4
2
0
1
3
Рис. 3,18. Результаты эксперимента по оценке предпочтительности географических
областей с помощью парных сравнений. Дуга из * в у означает, что х
предпочтительнее у
относительной важности альтернатив и т.д. Эти результаты иллюстрируются
данными парных сравнений, например, такими, что представлены на
рис. 3.18. В приведенном орграфе отсутствуют контуры длины 3, и поэтому
имеется единственный полный простой путь. Этим путем является:
северо-запад, северо-восток, юго-запад, юго-восток, центр.
Упорядочению, определяемому им, соответствует следующая последовательность
очков: s (северо-запад) = 4, s(северо-восток) = 3, s (юго-запад) = 2, s(юго-
восток) = 1, s (центр) = 0.
При исследовании отношений предпочтений часто оказывается
целесообразным допустить (или потребовать), чтобы предпочтения лица,
принимающего решения, определяли транзитивный турнир, т.е. такой турнир, в
котором если и предпочтительнее у, а и предпочтительнее w, то и
предпочтительнее w. Оказывается, что это эквивалентно допущению единственности
ранжировки альтернатив, о которых лицо, принимающее решение,
высказывает свои предпочтения. Пример, иллюстрирующий транзитивные
отношения предпочтений был показан на рис. 3.18.
Известны две теории выбора по предпочтениям — прескриптвная и
дескриптивная. В прескриптивной теории считается, что рациональный
человек должен вести себя вполне определенным образом. Для случая
отношений предпочтений в ней часто требуется, чтобы субъект был тран-
зитивен в своих предпочтениях и предполагается, что, если он столкнется
с нарушением тразитивности в своих суждениях, то незамедлительно
скажет: "Я должен исправить ошибку". Дескриптивная теория пытается лишь
описать поведение человека. Для отношений предпочтений эта теория
признает, что на практике они часто не транзитивны. Отложим подробное
обсуждение этого вопроса до гл. 7, в которой познакомимся с теорией
выбора по предпочтениям и узнаем, что делать в тех случаях, когда
предпочтения не транзитивны. В упражнении 16 мы введем некоторую меру
степени транзитивности турнира. Такая мера может использоваться при
87
измерении "непротиворечивости" предпочтений. Более подробно об этом
подходе можно узнать из книг (Kendall, Smith [1940], Harary, Norman,
Cartwright [1965,p. 300]).
Упражнения
1. В турнирах, изображенных на рис. 3.19, найти количество очков у каждого
участника.
2. Изобразить графически турнир с последовательностью очков C,2,1,0).
3. Существует ли турнир с последовательностью очков C, 3, 0, 0)? Как это
доказать или опровергнуть?
4. В турнирах на рис. 3.19, используя теорему Ландау, определить возможных
победителей.
5. В турнирах на рис. 3.19 найти все полные простые пути.
6. Для турнира, определяемого данными о предпочтениях, приведенными на
рис. 3.20, выполнить упражнение 4 и упражнение 5.
7. Какие турниры с числом вершин не более четырех транзитивны? {Указание.
Использовать теорему 3.4.)
8. Изобразить графически транзитивный турнир с пятью участниками.
9. Определить по данным о предпочтениях, приведенным на рис. 3.20, будет ли
соответствующий турнир транзитивным?
10. Подтурниром некоторого турнира называется всякий его подграф,
являющийся турниром. Для каждого турнира с четырьмя вершинами найти количество
транзитивных подтурниров. Для какого турнира это число наибольшее?
5 5
а б
Рис. 3.19. Графы турниров в упражнениях § 3.2
Нью-Йорк Бостон
Нью-Йорк
Бостон
Сан-Франциско
Лос-Анжелес
Хьюстон
стон
0
0
1
0
0
Сан-
Франциско
0
0
0
0
0
Лос-Анжелес
0
1
1
0
1
Хьюстон
1 \
1
1
0
0 /
о
1
3
4
1
1
Рис. 3.20. Результаты эксперимента по оценке предпочтительности городов в качестве
места для жительства с помощью парных сравнений. Элемент /, / равен 1 тогда и
только тогда, когда i предпочтительнее
88
11. Показать, что теорема, обратная теореме Ландау, неверна. Для этого построить
турнир, в котором имеется такая вершина и, что для всех v либо и побеждает и, либо и
побеждает некоторую вершину w, выигрывающую у и, но при этом количество очков
s (и) не максимально.
12. а. Доказать, что в турнире с вершинами ultu2,... ,ип
п
б. Может ли совокупность чисел D, 2, 2, 1, 0) быть последовательностью очков
некоторого турнира? Объяснить ответ.
13. Пусть Т - некоторый турнир, а Г * - его конденсация. Может ли Г* и меть более
одного полного простого пути? Объяснить ответ.
14. Показать, что в турнире (V, А) единственный полный простой путь существует
тогда и только тогда, когда турнир бесконтурный.
15. Предположим, что в некотором турнире Т s (и) =s(v). Могут ли вершины и
и v находиться в разных сильных компонентах? Объяснить ответ.
16. Если турнир нетранзитивен, может оказаться целесообразным измерить
насколько велико нарушение транзитивности. Один такой способ состоит в следующем.
Множество {и, и, и/} из трех вершин турнира T = (V, А) само определяет турнир.
Он либо транзитовен, либо нетранзитовен. Тройку {и, и, и>}в первом случае назовем
транзитивной, в последнем случае - нетранзитивной. Одной из мер степени
транзитивности является отношение
Число транзитивных троек
Число троек
Напомним, что знаменатель в B) имеет следующую величину
п\ _ п (п - 1) (п -2)
3!(я-3)! 6 '
Мы предоставляем читателю доказать, что числитель определяется по следующей
формуле:
/=1 \ 2 J /=1
* СО fr @-1)
где (s A), s B),..., s (п) ) - последовательность очков.
а. Воспользоваться этими формулами для измерения степени транзитивности
турниров, изображенных на рис. 3.15»
б. Воспользоваться этими формулами для измерения степени транзитивности
данных о предпочтениях, приведенных на рис. 3.20.
в. Обратить внимание, что в транзитивной тройке имеется только один
"победитель". Показать, что число транзитивных троек, в которых/ -победитель, равно
I S j. (Напомним, что I Г j равно 0 при г < s.) Отсюда получить формулу C).
17. Используя определения из упражнения 16, показать, что всякий турнир,
содержащий не менее четырех вершин, имеет по крайней мере одну транзитовную
тройку. (Указание: Обратить внимание, что I ** j =0 тогда и только тогда, когда
s (О < 2.) \ 2 /
18. Предположим, что вершины турнира ult u2t ..., ип перенумерованы таким
образом, что s (щ) =n-i. Следует ли отсюда, что в турнире есть единственный полный
простой путь? (Привести доказательство или опровергающий пример.)
19. Коммивояжер хочет, воспользовавшись только беспосадочными воздушными
рейсами, посетить каждый город из своего путеводителя точно один раз и вернуться
в начальный пункт. Он ищет гамильтонов контур, т.е. полный контур в
соответствующем орграфе.
89
а. Указать некоторый список городов и множество прямых авиарейсов, для
которых такой контур построить нельзя.
б. Указать некоторый список городов и множество прямых авиарейсов, для
которых не существует гамильтонова контура, но можно построить гамилътонов путь,
т.е. полный простой путь.
Замечание. Обобщение приведенной только что задачи заключается в нахождении
гамильтонова контура, минимизирующего суммарную длину маршрута. Эта задача
часто называется задачей коммивояжера. В общем случае эффективный, алгоритм
нахождения ее решения не известен (Lin [1965], Held, Carp [1970]).
20.(Beige [1962], Johson [1954], Iiu [1972]). Многие задачи теории расписаний в
исследовании операций включают нахождение оптимального порядка выполнения
ряда операций. Часто такие задачи могут решаться путем нахождения полного
простого, или, иначе говоря, гамильтонова пути. Предположим, что в работе у печатника
имеется п различных книг. И в его распоряжении две машины - печатная и
переплетная; естественно - книга должна быть сначала отпечатана и лишь затем переплетена.
Таким образом, время теряется лишь из-за простоев переплетной машины. Допустим,
что для печатания Аг-й книги требуется время р^, а для ее переплетения - время Ь&
Предположим, что для всех /и/ либо pj < bjt либо bj < pj* Показать, что в этом случае
можно определить такой порядок прохождения книг, чтобы переплетная машина не
простаивала0 {Указание: Построить орграф, в котором дуга из /-й вершины в /-ю
проводится тогда и только тогда, когда bj > ру.) (Более полное решение этой задачи
можно найти в работе Джонсона (Johson [1954]).)
21. (Camion [1959],Foulkes [I960]). Доказать, что всякий сильносвязный турнир
содержит полный (т.е. гамильтонов) контур. (Указание: Показать, что имеется контур
длины к при к = 3,4,,.,, л, где п — число вершин турнира.)
22. Применить понятия этого параграфа к каким-нибудь спортивным состязаниям
по вашему усмотрению. Обратить внимание на то, чтобы они удовлетворяли
используемому здесь формальному определению турнира.
23. Всегда ли предпочтения определяют турнир? Почему? (Что можно сказать об
орграфе на рис. 2.6,61 Является ли он турниром?)
§ 3.3. Ориентируемость и уязвимость
В этом параграфе мы возвращаемся к задаче об организации движения
транспорта, рассмотренной ранее в гл. 1. Будут даны строгие
доказательства результатов, приведенных там, и описана эффективная процедура
нахождения схемы одностороннего уличного движения. Затем рассмотрим
несколько родственных задач из теории графов, имеющих ряд интересных
приложений.
3.3.1. Планирование транспортных потоков. Задача об организации
движения транспорта состоит в следующем: для сети городских улиц с
двусторонним движением надо определить условия, при которых на каждой
улице мы можем так установить одностороннее движение, чтобы из любого
мегта можно было попасть в любое другое. Переводя эту задачу на язык
теории графов, построим граф G, используя в качестве вершин
определенные пункты города и соединяя два пункта ребром тогда и только тогда,
когда они соединены улицей с двусторонним движением. Вопрос теперь
состоит в следующем. Можно ли на каждой дуге задать направления, или
ориентации, ребер таким образом, чтобы в получающемся при этом
ориентированном графе (V, А) из каждой вершины и была достижима любая
другая вершина и?
0 Дальнейшее изложение этих вопросов можно найти, в частности, в книгах,
изданных на русском языке (Танаев, Шкурба [1975], Конвей и др. [1975]). (Примеч. пер.)
90
Назовем множество дуг А ориентацией 1) графа G. Наш вопрос
высказывается тогда и в иной форме: при каких условиях граф G имеет сильно
связную ориентацию? Чтобы получить на него ответ, введем понятие моста
в связном графе. Им является ребро {и, v) со следующим свойством:
удаление ребра {и, v) с сохранением вершин uhv приводит к несвязному
графу. Теперь мы можем дать строгую формулировку основной теоремы
о схеме одностороннего уличного движения. Доказательство будет
приведено ниже.
Теорема 3.5 (Robbins [1939]). Граф G имеет сильно связную ориента
цию тогда и только тогда, когда G связен и не содержит мостов.
Если G = (V, Е) —связный граф без мостов, то можно предложить
конструктивную процедуру нахождения сильно связной ориентации2). При
осуществлении этого построения начнем с некоторой вершины г. Пометим
ее индексом 1 и назовем корнем. Поскольку граф G связен, существует
вершина, соединенная с г ребром. Возьмем любую такую вершину,
присвоим ей индекс 2 и ориентируем ребро {1,2} от 1 к 2. Если имеется
непронумерованная вершина, соединенная с вершиной 2 ребром, пометим ее
индексом 3 и ориентируем ребро { 2, 3} от 2 к 3. Если такой вершины нет,
возьмем любую другую вершину, соединенную ребром с вершиной 1, пометим
ее индексом 3 и ориентируем ребро {1,3} от 1 к 3. Вообще, пусть
вершины 1, 2, . . . , ? уже помечена и некоторые ребра, соединяющие эти
вершины, уже ориентированы. И пусть / — наибольшее число, при котором в
графе G имеется ребро из вершины с номером / в некоторую непомеченную
вершину. Поскольку граф С связен, такая вершина / найдется. (Почему?)
Возьмем непомеченную вершину, соединенную с / ребром, присвоим ей
индекс Н 1 и ориентируем ребро {/, k + 1} от у к к + 1. Этот процесс
продолжается до тех пор, пока все вершины не будут помечены.
Ориентированный подграф в G, полученный в результате этой процедуры,
называется остовным деревом (каркасом) Т процедуры поиска глубины I3).
Эта процедура показана на рис. 3.21. Вершина а выбрана в качестве корня
и помечена индексом 1. Затем вершина Ъ помечается индексом 2 и
дуга (а, Ь) включается в остовное дерево поиска глубины один. Аналогично,
вершины с, е, d помечаются индексами 3,4,5 соответственно, а дуги (Ь, с),
(с, е), (е, d) включаются в дерево. После того, как вершина d получила
индекс 5, все вершины, соединенные с d ребрами, уже помечены. Поэтому
мы возвращаемся в вершину е с индексом 4, и продолжаем процесс
расстановки пометок из нее. После того, как для графа G было получено остовное
дерево поиска глубины 1, мы завершаем процесс получения ориентации G,
О Строго говоря, ориентация графа G представляется орграфом (К, А).
(Примеч. пер.)
2) Идея этой процедуры была предложена автору Дж.Улманом (личное
сообщение). Таран (Tarjan [1974]) описал алгоритм нахождения мостов, который можно
применять перед этой процедурой.
3) Процедура поиска глубины 1, описанная здесь, дает исключительно эффектигные
алгоритмы исследования графов (Tarjan [1972], Hopcroff, Tarjan [1973], Aho, at al.
[1974]). Строго говоря, Г - ориентированное дерево, тогда как деревом является
неориентированный граф, полученный из 7\ если не учитывать направление дуг
(сравнить упражнение 22 § 2.2, упражнение 17 § 2.3 и упражнение 20 ниже).
91
Граф G
Остовное
дерево Т
процедуры
поиска
глцбины 1
Сильно '
связная
ориентация
G
Рис. 3.21. Алгоритм для нахождения
схемы односторонней организации
движения. Номера вершин показаны
числами в квадратных скобках
графа G 0
щ
ATI
[11] [«Л
ориентируя все оставшиеся ребра из вершин с большими номерами к
вершинам с меньшими номерами. Ориентация, полученная таким путем, также
приведена на рис. 3.21. Например, ребро {/, /} ориентировано из i в /,
так как 8 больше чем 6. В этом примере, как легко видеть, ориентация
сильно связная. Ниже мы докажем, что это всегда так.
Замершие. Метод поиска глубины один обеспечивает эффективный
алгоритм, выясняющий является ли граф G связным. Поскольку, если G
несвязен, описанная процедура для нахождения остовного дерева должна
остановиться прежде, чем будут помечены все вершины G. Обратно, если G
связен, процедура помечает все вершины. Аналогичный направленный
метод поиска глубины 1 можно предложить для орграфов D. Мы будем вести
процесс расстановки пометок как и прежде, но только переходить из
данной вершины к вершинам, достижимым из нее, дугами, а не ребрами. Этот
метод можно использовать и как эффективный способ проверки сильной
связности.
Для более подробного знакомства читателю рекомендуется следующая
литература: Tarjan [1972],Hopcroft,Tarjan [1973], Aho, et al. [1974, гл.5]
(см. также упражнение 19).
Описанный здесь алгоритм может, к сожалению, порождать некоторые
весьма неэффективные схемы одностороннего уличного движения.
На рис. 1.9 приведен пример довольно неэффективной схемы. Она
получается в результате применения нашей процедуры (см. упражнение 9).
Как мы уже указывали в гл. 1, если бы человек, находящийся в пункте я,
хотел достичь пункта Ь, он использовал бы все возможности, чтобы сделать
это очень быстро, однако, он вынужден добираться кружным путем.
Короче говоря, такой выбор направлений удовлетворяет выдвинутому нами
требованию, а именно, он дает сильно связную ориентацию, но полученная
схема не эффективна. И теперь требуется осуществить новый "виток" в
процессе математического моделирования. Необходимо определить
понятие "эффективной" схемы одностороннего движения и разработать
алгоритмы, или процедуры, ее нахождения. Читатель может совершить этот
второй виток самостоятельно. (Упражнение 33 содержит некоторые
указания.)
92
Завершим этот пункт доказательством теоремы 3.5 О. Сначала
предположим, что в графе G = (V, Е) возможна ориентация А множества ребер Еу
при которой орграф (V, А) сильно связен. Тогда отсюда непосредственно
следует связность графа G = (V, Е). Покажем, теперь что в G нет мостов.
Нам понадобится следующая лемма, доказательство которой оставляется
читателю (см. упражнение 18).
Лемма 1. Если граф G связен, то ребро {и, v} является в G мостом
тогда и только тогда, когда каждая цепь из и в v содержит это ребро.
Для доказательства невозможности существования в G мостов,
предположим, что ребро {и, v) — мост. Поскольку орграф (К А) есть
ориентация, одна из дуг (и, v) или (и, и) входит в множество дуг А. Без потери
общности будем считать, что (и, v) E А. Орграф (V, А) сильно связен и,
значит, в нем найдется простой путь из и в и. По лемме 1 каждый такой
путь должен включать либо дугу (и, v), либо дугу (о, и). Так как (V, А) —
ориентация, (у, и) не входат в А, и поэтому каждый простой путь из v в и
должен включать дугу (и, и). Но такого простого пути не может быть.
Таким образом, мы пришли к противоречию, откуда заключаем, что граф с
не содержит мостов.
Теперь покажем, что для связного без мостов графа G = (V, Е)
описанная выше конструктивная процедура действительно приводит к сильно
связной ориентации (V, А) 2). Пусть 1(и) — номер, приписанный вершине и.
Как следует из вышеприведенного замечания, поскольку G связен, все
вершины перенумерованы. Пусть номер 1 получила вершина г. Мы
называли г корнем. Докажем сильную связность ориентации (V, А) графа G,
а для этого покажем, что любая вершина из V достижима из корня, а
корень достижим для всех вершин. Обозначим Т — (ориентированное)
дерево поиска глубины 1.
Лемма 2. Любая вершина х, входящая в Г, достижима в Г из корня г.
Доказательство. Проведем индукцию по величине 1(х). Если
1(х) = 1, то х есть корень г, и мы знаем, что любая вершина достижима
сама для себя. Предположим, что лемма верна для l(x) < t и пусть
теперь 1{х) = Г. Тогда в дереве Т для некоторой вершины у есть дуга (у, х).
Теперь имеем 1(у) < 1(х), поэтому по допущению индукции вершина у
достижима из г в дереве Т. Следовательно и вершина х достижима из г*. ¦
Для удобства будем назьшать дугу (и, v) из остовного дерева Т прямой,
а дугу (и, v) из А, не входящую в Т, обратной.
Лемма 3. Пусть (м, v) — обратная дуга. Тогда и достижима из и в Г,
т.е. и достижима из v путем, состоящим из прямых дуг.
Доказательство. В действительности мы докажем более сильное
утверждение: если /(tA < l(w) </(w), то w достижима из у в Г.
Доказательство ведется индукцией по /(w). Если l(w) = l(v) + 1, то, поскольку
в G имеется ребро {и, v) , для которого 1{и) > /(и), получаем, что
дуга (и, w) была добавлена в Т. Таким образом, w достижима из у в
дереве Г. Предположим, что лемма верна для вершин с номерами, меньшими Г,
и пусть l(w) = t. Найдется вершина *, для которой 1{х) < l(w) такая, что
1) Читатель может опустить оставшуюся часть этого пункта.
*) Автор признателен проф. Т.Остранду и другим лицам за помощь, приведшую к
Улучшению нижеследующего доказательства.
93
(x, w) входит в Г. Поскольку в G имеется ребро { и, у} , для которого
l(u) > /(w) > /(и), получаем, что /(*) > /(у). Теперь имеем 1(х) > /(у),
так как в противном случае (у, w) G Г и w достижима из у» Таким
образом, применяя допущение индукции к х9 мы заключаем, что х достижима
в Г из вершины и. Итак, поскольку (х, н>) входит в Т, w также
достижима из и в Т. ¦
Лемма 4. Если вершина х достижима в дереве Г из вершин а и Ь9 то в нем
либо а достижима из Ь9 либо & достижима из а.
Доказательство. Каждая вершина имеет в дереве Т только
одну входящую в нее дугу. Проведем доказательство индукцией по длине
пути в Тиза иЬ. Если (а, х) содержится в Т9 тогда, поскольку (а, х)
является в Т единственной дугой, ведущей в х9 получаем, что путь из Ъ в х
использует эту дугу. Таким образом, вершина а достижима из Ь. Проводя
индукцию, учитываем, что для некоторой вершины и> в Т имеется
дуга (w, x). Теперь получим, что оба пути издвхииз^вх должны
включать дугу (w, х). Итак, вершина w достижима в Т из а и Ь. По
предположению индукции либо а достижима из Ъ9 либо Ъ достижима из д. ¦
Из вышеприведенного доказательства и леммы 2 следует, что для
каждой вершины х из V существует единственный путь в Г из корня т в х.
Мы можем определить глубину d(x) вершины х как длину этого пути.
Лемма 5. Если d(x) > 1 и d(y) < d(x)9 то в орграфе (V, А) имеется
путь из вершины х в вершину у.
Доказательство. Поскольку d(x) > 19хФг. Поэтому в Гесть
дуга (w, x). Пусть
R = {и: и достижима в Тизх) .
Покажем, что тогда найдется обратная дуга (и, и) с вершинами «е/(и
v ф R. Допустим противоположное и покажем, что { w, x} — единственное
ребро, соединяющее вершину, не принадлежащую R9 с вершиной из R. Это
означало бы, что { w, х) — мост и противоречило бы условию. Пусть { v, и } —
некоторое ребро G9 для которого и ^ Л,ам6 R. Тогда либо (м,и), либо
(и, и) будет дугой в орграфе (V, А). По предположению дуга {и, v) не
является обратной. Но она не может быть и прямой, так как тогда
принадлежность и к R означала бы, что и v входит в R. Дуга (v, и) также не
может быть обратной, поскольку в этом случае по лемме 3 v достижима в
дереве Т из и и вершина v должна была бы принадлежать R. Наконец,
предположим, что (v, и) — прямая дуга. Тогда вершина и достижима в Т
из у и из х. Кроме того, у не достижима из х9 поскольку у не входит в R.
Таким образом, по лемме 4 х достижима в Т из у. Так как в Т имеется
единственный путь из у в и и х достижима из у, а и достижима из х9
следовательно у совпадает с w, а и с х. Таким образом, {vv, x) является
единственным ребром в G, у которого одна вершина не принадлежит R9 а
другая из R
Предположим, что (и, у) — обратная дуга, у которой и входит в R,
а у нет. По лемме 3 и достижима в Т из у. Тогда и достижима в дереве Т
из х и у. Кроме того, у не достижима в Г из х9 поскольку у не входит в R.
По лемме 4 мы заключаем, что х достижима в Г из у. Таким образом,
d(v) < d(x). Тогда и достижима в Т из х и у достижима в А из и; поэто-
94
му v достижима в А из х. Взяв в качестве у вершину и, мы завершим
доказательство леммы. ¦
Лемма 6. В орграфе (V, А) корень г достижим для каждой вершины*.
Доказательство. Проведем доказательство индукцией nod(x).
Если d(x) = 0, то х совпадает с г, а мы знаем, что вершина достижима сама
для себя. Предположим, что лемма верна для всех вершин с глубиной d (x),
меньшей t, и пусть d(x) = t. По лемме 5 существует путь из х в вершину
для которой d (у) < t. По допущению индукции г достижима из у. ¦
Леммы 2 и 6 показывают, что наша конструктивная процедура
приводит к сильно связной ориентации, завершая доказательство теоремы 3.5.
i 2 3
Степень дугобой Степень дуг обои Степень ду гобой Степень дуговой
уязбимости равна 1 уязбимости рад на 1 уязвимости равна 1 уязвимости рабна 2
Рис. 3.22. Несколько орграфов с их степенями дуговой уязвимости
3.3.2. Уязвимость. В транспортной сети мост можно считать уязвимым
звеном, его удаление или блокировка нарушают перевозки. Аналогичное
понятие имеет смысл и для сетей коммуникаций. Предположим, что сильно
связный орграф D = (V, А) представляет сеть коммуникаций. Будем
говорить, что Dуязвим по дугам, если при удалении некоторой дуги (но не ее
концевых вершин) получается орграф, не являющийся сильно связным.
Этим свойством обладает, например, контур Dx, изображенный на рис. 3.22;
орграф, полученный при удалении любой дуги из Du не будет сильно
связным. В более общем случае, если Dимеет категорию связности /, мы будем
говорить, что D уязвим по дугам, если найдется дуга при удалении
которой получается орграф с меньшей категорией связности /. Такая дуга
назьюается i,f-дугой. В упражнении 12 от читателя требуется привести
(когда это возможно) примеры /,/-дуг.
Орграфы могут быть уязвимыми в различной степени. В контуре
удаление любой дуги уменьшает связность. Иногда для этого необходимо
удалить более одной дуги. Определим степень дуговой уязвимости
орграфа, имеющего категорию связности 1, 2 или 3, как минимальное число
дуг, при удалении которых получается орграф с меньшей категорией
связности. (Читатель наверное заметит, что более высокая степень уязвимости
означает меньшую уязвимость сети, а также, что неуязвимый по дугам
орграф все же имеет некоторую степень уязвимости. Степень уязвимости
орграфа с категорией связности 0 не определена.)
На рис. 3.22 изображены четыре сильно связных орграфа. Ьх, D2 и D3
имеют степень дуговой уязвимости, равную 1, поскольку при удалении
дуги, обозначаемой буквой а, в каждом случае получается орграф, не
являющийся сильно связным. Четвертый орграф D4 на рис. 3.22 имеет степень
Дуговой уязвимости, равную 2. Существует определенная зависимость
95
между степенью дуговой уязвимости сильно связного орграфа и минималь
ной полустепенью захода вершин. {Полустепень захода вершины и опреде
ляется как число дуг, заходящих в и.)
Теорема 3.6. Если орграф D сильно связен, то степень дуговой
уязвимости D не превосходит минимальной полу степени захода вершин D1).
Доказательство. Чтобы получить орграф с меньшей категорией
связности, достаточно удалить все дуги, ведущие в вершину с минимальной
степенью захода. ¦
Следствие. Степень дуговой уязвимости сильно связного орграфа не
превосходит а/п, где л-число дуг и п - число вершин.
Доказательство. Сумма полустепеней захода вершин в D
равна а, отсюда среднее арифметическое полустепеней захода равно а/п.
Поэтому должна найтись вершина, полустепень захода которой меньше или
равна среднему арифметическому. ¦
Это следствие в некотором смысле означает, что по мере роста числа
дуг, степень дуговой уязвимости возрастает (сеть становится менее
уязвимой) . Но увеличение числа дуг может оказаться дорогостоящим,
избыточным или неэффективным, когда речь идет о коммуникациях. Таким
образом, приходится взвешивать эти факторы, выбирая между различными
уровнями уязвимости и эффективности. Данное нами определение
степени дуговой уязвимости можно рассматривать как математическую модель
уязвимости сети коммуникаций. И в качестве таковой, ее можно было бы
проверить следующим образом. При соответствующих допущениях
уязвимость сети должна быть связана с числом нарушений связи. Так, согласно
нашей модели сеть коммуникаций, изображаемая орграфом D\ на рис. 3.22,
должна выходить из строя чаще, чем сеть, изображаемая орграфом DA.
Можно определить аналогичные понятия уязвимости по вершинам для
графов и орграфов. Это будет сделано в упражнениях.
33.3. Транзитивная ориентируемость. Напомним определение из
параграфа, посвященного турнирам. Орграф (V, А) называется транзитивным
тогда и только тогда, когда для всех и, v, w, и Ф w выполнено следующее
условие2):
из (и, v) GA и (v, w)GA следует (ut w) € А. D)
На рис. 3.23 изображены шесть орграфов, из которых первые четыре
транзитивны. Орграфы Ds и D6 не транзитивны потому, что в каждом
из них отсутствует дуга (и, w).
В этом пункте мы возвращаемся к понятию ориентации графа и
рассмотрим графы, имеющие транзитивные ориентации. (Транзитивно
ориентируемый граф иногда называется графом сравнений.) На рис. 3.24 показана
транзитивная ориентация графа Z3, являющегося циклом длины 3. (В
дальнейшем будем использовать обозначение ?„для цикла длины п.) На нем
также показана транзитивная ориентация графа Z4 и транзитивные
ориентации других приведенных там графов.
*) Аналогичный результат справедлив для полустепени исхода, т.е. числа дуг,
выходящих из вершины.
2) См. сноску на с. 85.
96
и и ш
о > о » о
Рис. 3.23. Di9DitD99D4 - транзитивные орграфы, D9 и D6 - нетранзитивные
Транзитивная
ориентация
Д» А
Рис. 3.24. Примеры транзитивно ориентируемых графов и их транзитивных
ориентации
Рис. 3.25. Примеры графов, не являющихся транзитивно ориентируемыми
и и
[21
уъ—бх
уъ » бх
[5]
Рис. 3.26. Доказательство отсутствия транзитивной ориентации для графа Gx,
изображенного на рис. 3.25
7. Ф.С. Роберте
97
Рис. 3.27. Доказательство отсутствия транзитивной ориентации для графа G%,
изображенного на рис. 3.25
Если орграф транзитивен, то для всех и и у, для которых v достижима
из и, мы имеем d(u, v) = 1, где d - расстояние, определяемое длиной
кратчайшего пути из и в v (если такой путь существует). Следовательно,
транзитивные односторонние ориентации можно считать
высокоэффективными. К сожалению, единственным графом, у которого ориентация
одновременно транзитивна и сильно связна, является изолированная
вершина (см. упражнение 26). Таким образом, транзитивно ориентируемые
графы не имеют большого значения при изучении проблемы организации
одностороннего движения транспорта. Однако они играют важную роль
в следующем параграфе, где мы применим их к многочисленным задачам.
Граф G\ на рис. 3.25, являющийся циклом длины 5, не имеет
транзитивной ориентации. Доказательство этого проведем от противного.
Последовательные шаги его показаны на рис. 3.26. Предполагая, что такая
ориентация А существует, мы можем из симметрии ситуации считать, что (и, и)€Л.
Из транзитивности включение (v,w)EA означает, что (ufw)EA.
Но {и, w} $ E(Gx), поэтому (и, w) не может входить в А. Мы получаем,
что (w, и) € А. Аналогично доказьюается, что (w, х) € А, (у, х) G А и
(у, и) Е А. Но тогда, поскольку (у, и) ?Аи (w, v) €А9получаем (у, v)€A9
а значит, {у, v) € E(GX)9 что неверно. Заключаем, что граф Gx не имеет
транзитивной ориентации Л.
Читатель теперь в состоянии самостоятельно убедиться, что циклы Zn
нечетной длины более 3 не являются транзитивно ориентируемыми, тогда как
все остальные транзитивно ориентируемы.
Вообще, если граф G транзитивно ориентируем, то каждый его
порожденный подграф Я также должен быть транзитивно ориентируемым. Это
объясняется тем, что транзитивная ориентация графа G определяет и
транзитивную ориентацию в Я. Из этого замечания следует, что граф G2 на
рис. 3.25 отличен от транзитивно ориентируемого. Поскольку подграфом,
98
порожденным множеством вершин {и, v, w, х, у) является цикл Z5, то
и любая транзитивная ориентация G2 должна была бы дать транзитивную
ориентацию для Zs. Аналогичные рассуждения показывают, что всякий
транзитивно ориентируемый граф не может иметь Z5 в качестве
порожденного подграфа; более того, порожденный подграф не может быть любым
циклом нечетной длины более 3.
Мы показали, что цикл Zn при нечетном и, большем 3, не может быть
порожденным подграфом транзитивно ориентируемого графа G. Однако
этого условия недостаточно для транзитивной ориентируемости графа G.
Граф G3 на рис. 3.25 отличен от транзитивно ориентируемого, хотя он не
содержит ни одного цикла Zn в качестве порожденного подграфа при
нечетном /1, большем 3. Чтобы показать это, предположим, что имеется
некоторая транзитивная ориентация А для G3. Она должна породить
ориентацию ребра { и, х} . Из соображений симметрии мы можем предположить
наличие такой ориентации. На рис. 3.27 показаны последовательные этапы
следующего доказательства. Если (и, х) G А, то (и, и) G А, поскольку
в противном случае из транзитивности следовало бы (и,х) ? А или
{ и, х) ЕЕ- E(G3), что невозможно. Остальные дуги на рис. 3.27
добавляются поэтапно, каждый следующий шаг связан с допущением о
транзитивности. В заключение нам остается определить ориентацию ребра {х,у } .
Если (у, х) € А, то транзитивность означает, что (и, у) ? А,
откуда {v, у) ЕЕ. Получаем, что транзитивная ориентация не существует.
Аналогичные рассуждения показывают, что граф G4 на рис. 3.25 не
имеет транзитивной ориентации. Оставляем их читателю.
Подводя итоги, заметим, что мы описали два способа доказательства
отсутствия транзитивной ориентации для графа G. Следуя первому,
достаточно показать, что G содержит в качестве порожденного подграфа
известный транзитивно неориентируемый граф. Следуя второму, ориентируем
произвольно одну дугу и затем ориентируем другие в соответствии с
предположением о транзитивности, пока не получим противоречия. Более того,
таким путем часто можно найти транзитивную ориентацию. Однако в
некоторых случаях доказательства могут быть слишком сложными, и
поэтому хотелось бы иметь критерий транзитивной ориентируемости графа.
Такой критерий впервые был предложен Гуйя — Ури (Ghouila — Houri
[1962]) и Гилмором и Гоффманом (Gilmor, Hoffman [1964])
(упражнения 27 и 28). Гилмор и Гоффман также предложили алгоритм нахождения
транзитивной ориентации в случае, если она существует. В статьях Gallai
[1967], Pnueli, Lempel, Even [1971], Golumbic [1975] приведены
различные интересные результаты о транзитивной ориентируемости.
Упражнения
1. В графах, приведенных на рис. 3.28, найти все мосты.
2. В графах, приведенных на рис. 3.25, найти все мосты.
3. Для орграфов, приведенных на рис. 3.29, определить степень дуговой уязвимости.
4. Пусть G - связный граф. Точкой сочленения графа G называется вершина,
обладающая следующим свойством: при удалении ее вместе со всеми ребрами, для
которых она является концевой вершиной, получается несвязный граф. Для графов,
приведенных на рис. 3.28, найти все точки сочленения.
5. Какие из орграфов на рис. 3.29 транзитивны?
6. Привести пример орграфа D со степенью дуговой уязвимости, равной 4.
7* 99
abed a b с
a b
9 h
e n
с f
В e
Рис. 3.28. Графы к упражнениям § 3.3
с а
6 В
Рис. 3.29. Орграфы к упражнениям § 3.3
7. Для произвольного числа к привести пример орграфа D со степенью дуговой
уязвимости, равной к.
8. Применить описанную в тексте процедуру к нахождению односторонних
ориентации, если они существуют, для графов, изображенных на рис. 3.28.
9. Показать, что одностороннюю ориентацию, изображенную на рис. 1.9, можно
получить, используя алгоритм, описанный в тексте.
10. Привести пример орграфа с п вершинами, степень дуговой уязвимости
которого равна п - 1. Существует ли сильно связный орграф с п вершинами, степень
дуговой уязвимости которой равна л?
11. Определить какой из графов на рис. 3.28 транзитивно ориентируем. Для тран-
зитивно ориентируемых графов построить ориентацию, для остальных объяснить,
почему она не существует.
12. Для каждой пары (/,/), / = 0,1, 2, 3 и / =0,1, 2, 3 либо привести пример
орграфа с I,/-дугой или доказать, что он не существует.
13. Вершина и в орграфе D называется i, j-вершиной, если Dимеет категорию
связности /, a D\u - категорию связности /. (D\u - орграф, порожденный всеми
вершинами D за исключением и.) Для каждой пары /,/ с /, изменяющимся от 0 до 3, и/,
изменяющимся от 0 до 3, привести пример орграфа с /, /-вершиной или доказать,
что такого орграфа не существует.
14. Привести пример сильно связного турнира, имеющего 3,3-вершину (см.
упражнение 13).
15. Может ли турнир иметь 3,1-вершину? Объяснить ответ.
100
16. (Whitney [1932]). Если в орграфе D имеется множество вершин, при удалении
которого получается орграф с меньшей категорией связности, то можно определить
степень вершинной уязвимости, равную мощности наименьшего такого множества
вершин. В противном случае степень вершинной уязвимости не определена.
а. Показать, что если D слабо связен и найдется хотя бы одна такая пара и, и, что
ни («, и), ни (v, и) не являются дугами в Д то степень вершинной уязвимости D не
превосходит минимальной степени вершины в этом орграфе (Степень вершины х
равна сумме полустепени захода (числа входящих дуг) х и полустепени исхода (числа
выходящих дуг) х.)
б. Показать, что степень вершинной уязвимости и минимальная степень вершины
в орграфе могут различаться.
в. Почему необходимо предполагать, что найдется по крайней мере одна такая
пара и, v, что ни (и, и) ни (v, и) не являются дугами в /)?
17. Каково максимальное и минимальное число дуг в сильно связном орграфе с п
вершинами, если он уязвим относительно любой дуги?
18. Доказать лемму 1, сформулированную при доказательстве теоремы 3.5,
утверждающую, что ребро { и, v} в связном графе G является мостом тогда и только тогда,
когда каждая цепь в G из и в v содержит ребро { и, v } •
19. Верен ли следующий способ проверки сильной связности орграфа D1 Возьмем
любую вершину орграфа в качестве корня и будем осуществлять процедуру
направленного поиска глубины один (как описывалось в замечании на с. 92) до тех пор,
пока ни одну вершину больше нельзя будет занумеровать. Тогда D сильно связен
в том и только том случае, если все вершины были занумерованы. Если этот способ
не верен, как его можно исправить?
20. Напомним, что граф G называется деревом, если он связен и не имеет циклов
(см. упражнение 22 § 2.2). (Таким образом, остовное дерево поиска глубины один
в силу его определения не является деревом, в строгом смысле, поскольку оно
ориентировано; однако, оно станет деревом, если пренебречь ориентациями дуг, так как
связно и не содержит циклов.) Пусть G - связный граф и Н - его остовное дерево
(см. упражнение 17 § 2.3). Является ли некоторая ориентация Я остовным деревом
поиска глубины один в гр&фе G? (Привести доказательство или противоречащий
пример.)
21. Граф G называется лесом, если его каждая связная компонента является
деревом.
а. Сколько ребер имеет лес G, содержащий п вершин и к компонент? (Указание.
Применить упражнение 22 § 2.2).
б. Предположим, что ни в одной из связных компонент леса нет моста. Какое
максимальное число ребер в таком лесе с п вершинами? (Указание. Выяснить как
выглядит каждая компонента.)
22. Определить максимальное число точек сочленения в связном графе с пятью
вершинами; с п вершинами (см. упражнение 4, где дается определение точки
сочленения) .
23. Транзитивным замыканием орграфа D называется минимальный транзитивный
орграф D*, содержащий D с тем же множеством вершин. Найти транзитивные
замыкания орграфов, изображенных на рис. 3.29. (Указание. Добавлять дуги согласно
условию транзитивности до тех пор, пока не получится транзитивный орграф.)
24. (Нагагу,Norman,Cartwright [1965]). Доказать, что орграф/) сильно связен
тогда и только тогда, когда его транзитивное замыкание содержит все возможные дуги*).
25. Пусть D* - транзитивное замыкание орграфа Dn A (Dt) - матрица
смежности орграфа D*. Можно ли представить A (D*) через обычные матрицы, связанные с Ли
рассмотренные в § 2.4?
26. Показать, что единственным графом, имеющим сильно связную транзитивную
ориентацию, является изолированная вершина.
27. Следующие два упражнения посвящены критерию Гуйя - Ури и Гилмора -
Гоффмана транзитивной ориентируемости графов.
1) Другими словами, между любой парой вершин есть дуги в обоих
направлениях. (Примеч. пер.)
101
Пусть и,, и2, . . . , ut_i, ut, ux - замкнутая цепь в графе G. Хордой этой
замкнутой цепи называется всякое ребро { щ, и/}, i # /, 1 </,/<*, являющееся ребром
в G. Триангулятором называется такая хорда {ы/, ы/}, что / и / различаются на 2.
При подсчете отклонения i от / будем считать, что t - 1 и 1, Г и 2 различаются на 2.
Таким образом, различия по дочитываются 0 по модулю t. В графе на рис. 3.28,
сребро ( Ь, g } - хорда замкнутой цепи /, d, b, at с, е, i, h, с, h, g, /. Хордой будет и
ребро {/,Л}, которое рассматривается как ребро между 7-й и 10-й вершинами на этой
цепи. Ребро {Ь, с) - триангулятор.
а. В графе на рис. 3.28,а найти все хорды и триангуляторы в замкнутых цепях ?,/,
g, Л, I, m, /, к и Л, /, т, /, Л, с, с?, /, т, /, Л.
б. Показать, что если G — транзитивно ориентируем, то каждый цикл нечетной
длины большей, чем 3, должен иметь хорду.
в. Показать, что если G - транзитивно ориентируем, то каждый цикл нечетной
длины большей, чем 3, должен иметь триангулятор.
г. Показать, что каждый цикл графа G3 на рис. 3.25 имеет триангулятор.
(Однако G не является транзитивно ориентируемым.)
28. Замкнутую цепь ulf й7, . . . , «f_i, ut, и1 в графе G можно представлять как
замкнутый путь в орграфе D(G), полученном заменой каждого ребра {а, Ъ) в G
двумя дугами (л, Ъ) и (Ь, а). Замкнутая цепь назьюается обобщенным циклом в G, если
соответствующий замкнутый путь в D(G) не имеет повторяющихся дуг. Например,
в графе G3 на рис. 3.25 обобщенный цикл длины 5 задается вершинами и, и, x,v,zt и.
Однако замкнутая цепь и, v, x, v, z, у, х, v, z, и не является обобщенным циклом,
так как дуга (х, и) используется дважды. В работах Ghouila - Houri [1962] и Gilmore,
Hoffman [1964] доказана следующая, теорема. Граф G тогда и только тогда
транзитивно ориентируем, когда в G каждый обобщенный цикл нечетной длины большей, чем 3,
имеет триангулятор. -
а. Показать, что в графе G9 на рис. 3.25 последовательность у, w, v, и, v, x, у, х, w,
x,ztu,z,ytz,v есть обобщенный цикл длины 15 без триангуляторов.
б. Показать, что в графе G4 на рис. 3.25 последовательность х, и, v, у, v, w, z, w, ы, х
есть обобщенный цикл длины 9 без триангуляторов.
в. В транзитивно неориентируемых графах на рис. 3.28, найти обобщенные циклы
нечетной длины без триангуляторов.
29. Рассмотреть вопросы, связанные со степенью дуговой уязвимости сети
коммуникаций на рис. 2.3. Как можно было бы увеличить у нее эту характеристику?
30. Построить транспортную сеть с очень низкой степенью вершиной уязвимости,
т.е. имеющую много точек сочленения (см. упражнение 4).
31. Проект. Используя результаты упражнения 18 § 2.3, разработать теорию
уязвимости в более общих сетях коммуникаций, в которых допускается возможность
(вероятность) того, что сообщение не пройдет вдоль данной дуги.
32. Какие чрезмерные упрощения (кроме игнорирования случайности при
передаче сообщений) были сделаны при нашем рассмотрении понятия уязвимости? Как
можно было бы расширить нашу модель с учетом этих упрощений?
33. Проект. Как уже отмечалось в тексте, некоторые односторонние схемы
уличного движения могут быть очень неэффективными. Разработать теорию эффективных
схем одностороннего движения.
а. Один возможный подход состоит в измерении эффективности схем
одностороннего движения путем определения диаметра получающегося сильно связного орграфа,
т.е. max d(u, v) по всем и, и. Показать, используя это понятие эффективности на
нескольких примерах по вашему усмотрению, некоторые эффективные и
неэффективные односторонние ориентации (d (и, и) - длина кратчайшего пути от и к и).
б. Исследовать эффективность ориентации, в которой чередуются улицы с
односторонним движением, если первоначальный граф есть сеть улиц из авеню,
расположенных в направлении восток -запад, и стрит - в направлении север-юг.
в. Выяснить, является ли диаметр хорошей мерой эффективности и предложить
другие варианты.
0 При подсчете разностей |/ - /| надо учитывать, что i и / находятся на
замкнутой цепи, при ее обходе вершина их получает номер t + 1, и, следовательно,
11 - 1 - 1 |(modr) = \t - 1 - (Г + 1)| = 2. {Примеч. пер.)
102
г. Для предложенных мер эффективности разработать алгоритмы нахождения
эффективных схем одностороннего движения.
34. Как отмечалось в гл.1, некоторые схемы одностороннего движения
проектируются неэффективными преднамеренно.
а. Использовать понятие диаме* ра (см. упражнение 33) для измерения
эффективности схемы одностороннего движения в Йошемитском Национальном парке,
изображенной на рис. 1.10.
б. Построить алгоритм нахождения неэффективных схем одностороннего движения.
§ 3.4. Графы пересечений
3.4.1. Определение графа пересечений. В этом параграфе мы рассмотрим
задачу, имеющую много приложений. Пусть 5 — некоторое семейство
множеств. Определим граф пересечений G семейства Ъ следующим
образом: V(G) = ^ и, еслиS, Те ff nSФ Г, то
{S, r}G?(G)<=>5nr^0. E)
На рис. 3.30 изображен граф пересечений семейства
$ ={5ь^,...,56},где St = {1,2, 3,4}, S2 = {1,3,6},
S3 ={7,8,9},S4 ={3,8, П}, 55 ={6,7,8,9,10}, 56 = {1,5}.
Обычно нас интересует вопрос о том, является ли данный граф G графом
S5= {6,7,8,9,10} 5,
а
е о-
Рис 3.30. Граф пересечений
Рис. 3.31. G - граф пересечений
пересечения некоторого семейства множеств, обладающего определенным
свойством? Этот вопрос эквивалентен следующему: можно ли для графа
G = {V,E) определить отображение S множества V в некоторое семейство
множеств с указанным свойством так, чтобы для всех и Ф v € Кбыло
справедливо
{ м, v } е Е «=> S(u) П S(v) Ф 0. F)
Если рассматриваемое для данного графа G семейство множеств
произвольно, то ответ всегда положительный. Имеет место следующая теорема.
Теорема 3.7 (Marczewski [1945]). Всякий граф G =(V, E) является
графом пересечения некоторого семейства множеств.
Доказательство. Для каждой вершины и в графе G положим
S(u)={{u,v):{u,v}eE}.
Пусть ^ ={S(u): и ? К}. Тогда S удовлетворяет F) для всех и ФиЕ V. ¦
103
Например, для графа G, изображенного на рис. 3.31, имеем
S(c)= {{а, с), {b,c}t {c,d}} ,
Тогда, например, мы видим, что {d, е) Е? и ?(G) П 5(е) ?= 0, поскольку
{ d, e}esld)nS(e).B то же время {d, b}$E nS(d)nS(b) = <p.
(Иногда желательно, чтобы отображение S было взаимно однозначным,
т.е. чтобы множества, соответствующие вершинам, были различны. Легко
показать, что всякий граф является графом пересечений семейства
различных множеств. Для этого достаточно переопределить множество S(u) из
доказательства теоремы 3.7 и ввести новое отображение S следующим
образом:
?(«)= Ни}} U {{u,v} : {u,v)eE}.)
3.4.2. Графы интервалов и их применения *). По теореме 3.7 вопрос
о том, какие графы являются графами пересечений, тривиален — все графы
обладают этим свойством. Однако возникают весьма интересные задачи,
имеющие многочисленные приложения, если этот вопрос исследовать
в классах специальных семейств множеств.
Наиболее часто в связи с графами пересечений рассматриваются
семейства интервалов на действительной прямой (R. Мы посвятим этому семейству
три следующих пункта, а затем займемся другими семействами.
Граф G называется графом интервалов, если он является графом
пересечений некоторого семейства интервалов на прямой2). Иначе говоря, G =
= (F, Е) - граф интервалов тогда и только тогда, когда каждой вершине
мЕКможно поставить в соответствие действительный интервалам),
так что для всех и Ф v G V имеет место
{и, v} е Е <=> J(u) П J(v) Ф 0. G)
(Здесь используется буква /, вместо буквы S для более легкого
сопоставления с результами некоторых работ по теории измерений, излагаемыми
в гл. 8, где обозначение / проистекает от понятия едва заметных различий
в психологии.3)
На рис. 3.32 приведены примеры графов интервалов. Чтобы показать,
что они действительно графы интервалов, на этом рисунке даны и
соответствующие интервальные представления, удовлетворяющие условию G).
') В качестве хорошего обзора по применениям графов интервалов читателю
рекомендуется подготавливаемая к печати статья Виктора Кли.
2) Интервалы могут быть открытыми или замкнутыми, т.е. вида {а, Ь) или [а, Ь]
для а, Ь G R. Нетрудно показать, что можно считать их все либо открытыми, либо
замкнутыми.
3) Мы не требуем, чтобы соответствие J было взаимно однозначным, хотя не
трудно доказать, что для случая конечных графов, если существует некоторое /,
удовлетворяющее G), то существует и взаимно однозначное /.
104
Граф
3
Интервальное представление
JB)
JC)
J(D
JE)
\Л
JB)
JM
JC)
Jf7)
JF)
JE)
JB)
/ 2
J(f)
JC)
Рис. 3.32. Некоторые графы интервалов и их интервальные представления
J(u)
J(w)
J(x)
Рйс. 3.33. Интервальное представление для цикла Z4 не существует
Не всякий граф оказывается графом интервалов. Например, им не
является цикл Z4 длины 4, изображенный на рис. 3.33. Для доказательства
предположим существование интервального представления /,
удовлетворяющего условию G). Из этого условия следует, что интервалы / (и) и
J(v) должны перекрываться. Из соображений симметрии можно J(v)
расположить немного правее /(м). (А почему J(u) и J(v) не могут быть
вложены один в другой?) Далее J (w) должен быть правее J(v), поскольку он
перекрывается с J(v), но не перекрывается с J(u) (см. рис. 3.33).
Аналогично убедимся, что J(x) должен находиться правее J(w), как показано на
рис. 3.33. Отсюда следует, что интервалы J(x) и J(u) не перекрываются,
что противоречит условию {и, х } € Е.
Графы интервалов возникли в связи с одной проблемой,
рассматриваемой в генетике и носящей имя Бензера О. Представление хромосомы как
1) Эти вопросы более подробно рассматриваются в книге Миркина, Родина [1977].
(Примеч. пер.)
105
линейной совокупности генов стало уже классическим. Бензер (Benzer
[1959]) интересовался будет ли верен этот результат для тончайшей
структуры самого гена 0. Для исследования этой тонкой структуры, которую
нельзя наблюдать непосредственно, можно изучать мутации, приводящие
к ее изменениям. Бензер допустил, что мутации влекут изменения в
связных подструктурах гена. Собрав данные о мутациях, он получил
возможность прогнозировать будут ли две мутации (т.е. их связные
подструктуры) перекрываться. (Для этого Бензер рекомбинировал два различных
мутанта заданной первоначальной (немутантной) особи. При таких
рекомбинациях можно получить исходный немутантный тип снова при условии,
что мутации приводят к неперекрывающимся подструктурам. В противном
случае получить при рекомбинации исходный тип невозможно. Таким
образом, если он получал снова первоначальный тип, то считал мутации
неперекрывающимися. Если же в большом числе опытов с двумя типами
мутаций он никогда не получал снова исходный тип, это служило
основанием считать, что мутации перекрываются.) При наличии такой информации
о перекрываемости задача состояла в том, чтобы определить — могли ли
исследуемые мутанты (подструктуры) быть частью линейной цепи, т.е.
была ли информация о перекрываемости согласована с гипотезой о
линейности структуры гена9
Например, на рис. 3.34 приведены данные о перекрываемости шести
подструктур (мутаций). Эти ^сведения представлены @, 1)-матрицей (ее
элементы — 0 или 1)). Элемент /, / этой матрицы равен 1 тогда и только
тогда, когда наблюдение указывает, что структуры St и Sj перекрываются.
На рисунке показано также линейное расположение интервалов,
соответствующее имеющимся данным. (Это не означает, что только такое
расположение совместимо с ними; мы остановимся на вопросе о единственности
позже.) Вывод, который можно сделать, заключается в следующем:
имеющиеся данные "согласованны" с гипотезой о линейности, но не доказывают
ее. В самом деле, нами использованы некоторые предположения,
позволяющие определить наличие перекрываемости. Кроме того, были исследованы
не все подструктуры; поэтому, даже если данные подструктуры можно
"отобразить" в подструктуры линейной цепи, это не означает, что исходная
структура линейна. На рис. 3.35 приведен некоторый набор данных о
перекрываемости, который, как будет показано ниже, не согласуется с
гипотезой о линейности. В таком случае, полагая, что мы располагаем корректно
полученной информацией о перекрываемости, можно с определенностью
заключить, что эти данные опровергают гипотезу о линейной цепи.
Чтобы сформулировать проблему Бензера в терминах теории графов,
определим граф G следующим образом: вершины G составляют
исследуемые подструктуры и между двумя различными 2) подструктурами имеется
ребро тогда и только тогда, когда известно, что они перекрываются.
Поскольку линейное представление интервалов всегда можно
"расположить" на прямой, задача состоит в получении ответа на следующий вопрос —
можно ли вершины графа отобразить в множество интервалов действитель-
») Необходимые сведения по биологии имеются в работе Benzer [19621.
2) Мы не вводим ребра от подструктуры к ней самой, хотя конечно она
перекрывает сама себя.
106
ч
4
*\
А
h
1
0
0
U
s2
1
1
1
1
0
0
s3
0
1
1
1
0
0
0
1
1
1
1
0
Ss
0
0
0
1
1
1
°\
0 '
0
0
1
1
Рис. 3.34. Данные о перекрываемости и линейная цепь, согласованная с ними C/ и Sj
перекрываются тогда и только тогда, когда элемент /, / это матрицы равен 1)
Рис. 3.35. Данные о перекрываемости, не согласующиеся с гипотезой о линейности
ной прямой таким образом, чтобы два интервала пересекались тогда и
только тогда, когда соответствующие вершины соединены ребром? Иначе
говоря, в выяснении вопроса - является ли G графом интервалов? Эта
формулировка объясняет, почему данные на рис. 3.35 не согласованы с
линейной гипотезой: здесь графом G является цикл Z4.
Бензер (Benzer [1959]) получил данные о перекрываемости для
небольшой части генетической структуры одного вируса — фага Т4; они
приведены на рис. 3.36 0. Оказалось, что изображенная на нем матрица определяет
граф интервалов; доказывающие этот факт интервальное представление
также дано на рис. 33§. Таким образом, полученная эмпирическая
информация была согласована с гипотезой о линейности. (Статья Бензер а
содержит неполные 2) данные о перекрываемости для значительно большей
структуры, представляющей фаг Т4, содержащей 15 мутаций. Эти данные
также оказались согласованными с гипотезой о линейности.)
Для другого применения графов интервалов в качестве множества V
будем рассматривать совокупность альтернатив, среди которых мы делаем
выбор, - например, марочных вин - и предположим, что у нас нет полной
уверенности в стоимости (денежной) каждой альтернативы. Может быть
нам удастся сопоставить каждому элементу и из V интервал J(u),
представляющий область возможных цен для и. Тогда мы предпочли бы
альтернативу и альтернативе у, если интервал J(u) строго правее интервала Ди), т.е.
если для всех a E/(w) и 0 ?/(и), а > 0 3). И мы оказались бы в
неопределенном состоянии при выборе между и и и или, иначе говоря, в состоянии
1) Формально Бензер использовал 0 там, где у нас 1 и наоборот.
2) Не все пары мутантов скрещивали.
3) Автор предпочитает более дорогое вино. Если исходить, например, из обратного
предположения, и предпочтительнее и, если J(u) строго левее J(v). (Примеч. пер.)
107
Тип мутанта
фага Т4
д
В
с
с
с
н
184
215
221
250
341
455
459
50В
749
761
782
852
882
103
139
4
33
51
23
1
1
0
1
0
1
0
0
0
0
1
0
0
0
0
0
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
:s
0
0
1
0
1
0
1
1
1
1
1
1
1
1
1
1
1
0
1
I 20
1
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
0
1
0
1
0
0
0
0
0
i
0
0
0
0
0
0
0
1
5
1
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
t
459
Q
0
1
0
0
0
1
0
1
1
1
1
0
0
0
1
0
0
f
506
0
0
1
0
0
0
0
f
0
0
1
0
0
0
0
0
0
0
749
0
0
1
Q
0
0
1
0
i
f
f
0
0
0
1
0
0
t
761
0
0
f
0
0
0
f
0
t
f
1
1
0
0
0 i
f 1
0 i
e
f
0
f
0
1
0
1
i
i
0 0
1
1
852
0
0
f
0
0
0
f
0
i
1
i
1
0
0
0
1
0
0
1
882
0
0
1
0
0
0
0
0
0
0
i
0
1
Q
0
i
0
0
1
A 103
В139
С 4
С 33
0
0
i
0
0
0
0
0
0
0
i
0
0
1
f
0
0
0
\
0
0
i
0
0
0
0
0
0
0
1
o-
0
j
1
0
0
0
f
0
0
1
0
0
0
f
0
1
1
1
f
f
0
0
i
0
0
i
1
0
\
1
0
0
0
0
0
0
f
0
0
0
0
0
1
0
f
to
1
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
i
a:
i
f
i
1
1
1
1
1
1
1
1
j
1
1
i
i
1
Интербальное представление
Tun мутанта
<рага ТМ
Н 23
215 -
С 51 -
250
782
22i
A 103 -
В 139 —
506 —
С 4 ——
749 -
761 -
852 ~
882 -
347 -
Рис. 3.36. Данные о перекрываемо сти и интервальное представление для 19 мутантов
фагаГ4 (Benzer [1959])
безразличия, если бы их интервалы J(u) nJ{v) перекрывались. Таким
образом, граф, представляющий в этой ситуации отношение безраличия,
оказывается графом интервалов. Такое представление о предпочтениях
приводит к ориентированному графу. Вершинами этого орграфа!) = (V, А)
снова являются элементы из V и дуга измву проводится тогда и только
тогда, когда и предпочтительнее, чем v. В гл. 8 изучение вопроса об измере-
108
нии предпочтений мы начнем с этого орграфа. Затем нас будет интересовать
при каких условиях каждой вершине и можно сопоставить интервал J(u)
так, чтобы для всех миу юК
и предпочтительнее v тогда и только тогда,
когда J(u) строго правее /(у),
(8)
или, что эквивалентно,
(м, v)GA тогда и только тогда, когда/(м) строго правее J(v).
Орграф Д для которого существует представление интервалами,
удовлетворяющее условию (8), будет называться интервальным порядком.
Интервальные порядки изучаются в § 8.8. При измерении отношения
безразличия нас интересуют представления интервалами величин,
удовлетворяющие для всех и Фи из V следующему условию:
и и v для вас безразличны тогда и только тогда,
когда интервалы J(u) и /(и) перекрываются.
Такое представление можно получить тогда и только тогда, когда "безрали-
чие" определяет граф интервалов *).
Графы интервалов возникают и в археологии. Несколько типов
керамических изделий (или других предметов, изготовленных древним человеком)
было найдено в различных доисторических захоронениях. Нам бы хотелось
разместить эти изделия в надлежащей последовательности или
хронологическом порядке, относя каждый тип к определенному периоду времени.
Изучение вопросов последовательной группировки в археологии началось
с работы Петри в конце ХК века (Petrie [1899,1901]). Петри исследовал
могилы в захоронениях Нагады, Баллаша, Абади и Ху, расположенных в
районе доисторического Египта. (Применение радиоуглеродного метода
показало, что возраст захоронений варьировал между 4000 и 2500 гг.
цо н.э.) Петри использовал сведения примерно о 900 могилах, чтобы
упорядочить их и отнести некоторый период времени к каждому типу
обнаруженных керамических изделий. Его методы, обстоятельно изложенные в
работах Petrie [1920, 1921], были смесью субъективных и объективных
подходов. Здесь мы сформулируем задачу последовательной датировки или
последовательной группировки в терминах теории графов. Близкие
сведения можно найти в работах Кендалла (Kendall [1963,1969, а, Ь]).
Если говорить строго, мы хотели бы каждому типу керамических
изделий и отнести интервал времени/(и) таким образом, чтобы это
представление интервалами удовлетворяло следующим условиям.
1. Предположим, что тип изделий v строго предшествовал типу изделий
и (и строго следует после v), т.е. тип v исчез прежде, чем тип и появился.
Тогда интервал J(u) должен находиться строго правее интервала J(v), как
показано на рис. 3.37, а.
2. Предположим, что тип изделий v слабо предшествовал типу изделий и
(и слабо следует после v), т.е. тип и появился, когда тип v уже имелся и
1) Подход, аналогичный изложенному в отношении понятия "безразличия",
применяется к психологическим понятиям "сходства" или "неразличимости" (Нагагу [1964],
Roberts [1970]).
109
не исчезал до исчезновения и. Тогда интервалы J(u) и J(v) должны
перекрываться, как показано на рис. 3.37, б.
3. Предположим, что тип изделий v накрывает тип изделий и, т.е. тип и
появился, когда тип и уже использовался, и вышел из употребления до
исчезновения типа и. Тогда интервалы J(u) и J(v) должны перекрываться,
как показано на рис. 3.37, в.
Представление интервалами, удовлетворяющее условиям 1—3,
называется допустимым хронологическим упорядочением.
Если гончарные изделия типов и и v появляются вместе в какой-нибудь
могиле, можно считать, что периоды времени существования этих типов
J(u) J(u) J(u) J(u)
а 6 Ш Г1^
Рис. З.Э7. Типы хронологического упорядочения : v строго предшествует и (a), v
слабо предшествует и (б), v накрывает и (в)
изделий должны перекрываться. Наоборот, когда группа могил достаточно
обширна, следует допустить, что, если два типа изделий появлялись в
перекрывающиеся периоды времени, то они появятся в какой-то общей могиле.
Построим граф G следующим образом: множество вершин V(G) образуют
типы изделий, а ребро между типами и и v проводится тогда и только
тогда, когда и и v находятся вместе в одной могиле. Допустимое
хронологическое упорядочение соотносит всякому типу изделий и временной
интервал/(и) так что, если и и v различны, то
{м, v}e E*=> /(w)n/(i;)^0.
Таким образом, допустимого хронологического упорядочения не
существует, если G не является графом интервалов. Наоборот, если G — граф
интервалов, представление интервалами / порождает некоторое
возможное допустимое хронологическое упорядочение или, короче, —возможное
хронологическое упорядочение. Но откуда мы знаем, что оно допустимо?
В действительности, для каждого возможного хронологического
упорядочения, сопоставляющего графу интервалов G некоторое представление
интервалами /, почти всегда существует упорядочение, не согласующееся с
первоначальным в отношении строгого следования (предшествования). В
частности, если E(G) не содержит все возможные ребра, то не совпадающее с
исходным возможное хронологическое упорядочение существует всегда.
Чтобы получить такое несовпадающее возможное хронологическое
упорядочение, достаточно изменить порядок следования интервалов на
обратный (это можно понимать как введение противоположной ориентации
на действительной прямой). На рис. 3.38 изображено несколько возможных
хронологических упорядочений для графа Gx. Упорядочение B) получается
из упорядочения (i) введением обратного порядка. В A) с следует строго
после а, тогда как в B) — наоборот. Если эти два типа упорядочений —
единственно возможные хронологические упорядочения, то, как правило,
относительно легко сделать выбор между ними: следует просто определить,
какой из двух "весьма далеких" ненакрывающихся типов изделий стар-
110
Граф
Хронологические упорядочения
Vn J<a) Лс)
(?)
(л)
(ft.
12)
C) ...
Лс)
Ла)
Jib)
1 Ла)
Ла)
ЛЬ)
ЛЬ)
ЛЬ)
Ла)
Лс)
- ЛЬ)
- Лс)
Ла)
- Лс)
• ЛЬ)
- Лс)
Рис. 3.38. Возможные хронологические упорядочения
ше. Однако имеются и другие способы из одного представления
интервалами или возможного хронологического упорядочения получить новое.
В упражнении 26 читателю будет предложено показать, что для всякого
возможного хронологического упорядочения почти всегда существует еще
одно не совпадающее с ним из-за накрывающихся интервалов. На
рис. 3.38 представлено такое упорядочение C), полученное из
упорядочения A) для графа Gx< В A) а слабо предшествует Ь9 тогда как в E) Ъ
перекрывает а. Поэтому для большинства графов интервалов существует
много возможных хронологических упорядочений. Второй пример
показывает, что несовпадение упорядочений, может возникать и из-за слабо
следующих интервалов. Граф G2 на рис. 338 имеет по меньшей мере три
возможных хронологических упорядочения, изображенных там же,
которые попарно различны из-за разной последовательности слабо следующих
интервалов. Вообще определение для заданного графа интервалов числа
раличных * ) возможных хронологических упорядочений является
открытым вопросом теории графов. Используя только данные о перекрывае-
мости интервалов, по-видимому, наилучшее на что мы можем надеяться —
это получить правильными "строго предшествующие" интервалы. Только
совсем недавно было определено число возможных хронологических
упорядочений, различающихся порядком строго предшествующих
интервалов, (см. сноску на с.ИЗ) и все еще нет ответа на вопрос, какие графы
имеют только два таких упорядочения 2). Как мы уже заметили,
большинство графов содержат по меньшей мере два таких упорядочения, и, если
существуют точно два, сделать выбор между ними относительно легко.
*) Два хронологических упорядочения различны, если отличаются порядком
следования хотя бы одного типа интервалов: строго предшествующих, слабо
предшествующих или накрывающихся.
2) В дальнейшем мы более точно сформулируем эту задачу.
111
Так необходимость решения простой проблемы из области археологии
подвергла испытаниям возможности математиков 0.
Сходные вопросы возникают при изучении возрастной психологии
(Coombs, Smith [1973]). При этом исследуются различные свойства,
черты или характеристики человека. Каждой характеристике хотелось бы
сопоставить некоторый отрезок времени, отразив тем самым естественный
порядок, существующий в процессе возрастных изменений, когда эти
характеристики в нем присутствуют. Предполагается, что все дети проходят
через один и тот же естественный процесс возрастных изменений. Изучаются
различные дети и наблюдается наличие или отсутствие характеристикunv
у некоторого ребенка. Здесь характеристики соответствуют типам
керамических изделий, а дети — раскопанным могилам. Если число
наблюдавшихся детей достаточно велико, разумно считать, что периоды времени, в
которых характеристики и и v присутствуют, перекрываются тогда и только
тогда, когда они обе обнаружены вместе у некоторого ребенка. Таким
образом, граф отношения "находиться вместе у некоторого ребенка"
должен быть графом интервалов. И снова задача определения
"правильного" хронологического упорядочения не решается полностью. Она в
действительности математически эквивалентна обсуждавшейся нами выше
проблеме археологии. Всегда поражает, что в различных областях науки
возникают одинаковые проблемы. И именно мощь математического описания
выявляет идентичность этих проблем, что дает надежду на достижение
решений.
Графы интервалов возникают также в связи с перевозками, в частности
при управлении фазами включения светофора на сложных перекрестках.
Мы вернемся к этому вопросу в п. 3.4.6. Еще одно применение графов
интервалов известно в экологии при исследовании сетей питания. Этот вопрос,
в частности, будет рассмотрен в § 3.5.
3.4.3. Свойства графов интервалов. Прежде чем обсуждать другие
применения графов интервалов, предложим тест, позволяющий определить
является ли данный граф графом интервалов, и укажем метод нахождения
представления интервалами /, когда тест дает положительный ответ. Мы
уже видели, что цикл Z4 отличен от графа интервалов. Аналогичные
рассуждения показывают, что всякий цикл Zn при п > 3 не будет графом
интервалов. Поскольку каждый порожденный подграф графа интервалов сам
оказывается графом интервалов (почему?), граф интервалов не может
содержать Z4 в качестве порожденного подграфа.
Прежде чем сформулировать условия, при которых граф G будет графом
интервалов, введем еще одно понятие. Дополнительный граф Gc к графу G
определяется, как граф с множеством вершин V(GC) = V(G) = V и
множеством ребер E(GC), содержащем ребро {uf v} (при u^v)9 тогда и только
тогда, если { м, v } отсутствовало в E(G).
На рис. 3.39 изображен ряд графов и их дополнительные графы. Теперь,
если G — граф интервалов, можно ввести ориентацию А в его
дополнительном графе Gc следующим образом: (м, v)€A тогда и только тогда, когда
J(u) строго правее J(v} (сравнить с условием (8)). В результате получится
О Простота этой археологической проблемы относится скорее к ее
формулировке. (Примеч. пер.)
112
Рис. 3.39. Некоторые графы и их дополнения
А
4 1 5 2 4 15 2
G% Транзитивная ориентация
Рис. 3.40. Дополнительный граф G% для графа G%t изображенного на рис. 3.32, и
транзитивная ориентация, соответствующая приведенному там же интервальному
представлению
транзитивная ориентация. (Почему?) На рис. 3.40 показана транзитивная
ориентация графа G%, соответствующая представлению интервалами графа
G2, изображенного на рис. 3.32. Таким образом, мы показали, что, если
G — граф интервалов, тогда он не только не должен иметь в качестве
порожденного подграфа цикд Z4, но и его дополнение Gc допускает введение
транзитивной ориентации1). Эти условия; совместно не только необходимы,
но и достаточны.
Теорема 3.8 (Gilmore, Hoffman [1964]). Граф G есть граф интервалов
тогда и только тогда, когда он удовлетворяет следующим условиям:
а. Цикл Z4 не является порожденным подграфом графа G;
б. Граф Gc транзитивно ориентируем.
Проиллюстрируем эту теорему на примере графа G, изображенного на
рис. 3.41. Легко .видеть, что Z4 не будет в G порожденным подграфом.
Помимо этого выполнено и условие б, так как Gс имеет транзитивную
ориентацию (см. рис. 3.41). Отсюда заключаем, что G есть граф интервалов.
Аналогично можно показать, что Zs не является графом интервалов,
*) Как теперь видно, задача о числе возможных хронологических упорядочений
Для данного графа интервалов G, которые не совпадают в отношении строгого
следования, эквивалентна более точно поставленной задаче определения числа транзитивных
ориентации дополнительного графа Gc. Эта задача недавно была решена для всех
графов с транзитивно ориентируемым дополнением Голумбиком (Golumbic [1975]).
Ее решение для частного случая графов интервалов приведено в работе Booth, Lueker
[1975].
8. Ф.С. Роберте
113
a d в
Транзитивная
ориентация
Адля&с
а е
Gc
c,d,e)
Интервальное представление
111*
Транзитивная
ориентация
Лдляё
Рис. 3.41. Получение интервального представления
используя отсутствие транзитивной ориентации его дополнения
(совпадающего cZ5).
Другие критерии, которым удовлетворяют графы интервалов, были
предложены Фалкерсоном с Гроссом (Fulkerson, Gross [1965]) и Леккер-
керкером с Боландом (Lekkerkerker, Boland [1962]). Остановимся на них
в упражнениях 20 и 24.
Иногда самый простой способ убедиться в том, что граф является
графом интервалов, состоит в построении интервального представления.
Доказательство достаточности условий теоремы 3.8 конструктивно и
мы приведем эту процедуру получения интервального представления
для G
В качестве предварительного понятия определим полный граф, как граф
G(V, Е), в котором для всех иФиЕУ,{и,и)ЕЕ, т.е. граф G полный, если
в нем все возможные пары вершин соединены ребрами. Полный граф с п
вершинами будет обозначаться символом Кп • Къ является, конечно,
треугольником. Полный подграф произвольного графа G называется кликой.
Клика максимальна, если она не содержится в большей клике. На рис. 3.42
изображен граф G и его клики. Подграф, порожденный вершинами и и и ,
оказывается кликой. Она не максимальна, поскольку содержится в
большей клике, порожденной вершинами «,иих. Эта клика в свою очередь
также не максимальна, так как содержится в клике { м, v, x, у ], которая
максимальна. Заметим, что в отличие от сильных компонент,
максимальные клики могут пересекаться.
Теорема 3.9. Пусть G = (F, Е) является графом.
а. Если К — максимальная клика в G и вершина и G V не входит в К, то
найдется такая вершина v € К, что { и, v } 4 Е.
б. Если К и L - максимальные клики в G иКФЬ, то найдутся такие
вершины мЕА'ии е?,что{м, v) $E.
114
в. Бели {и, и}6?, то bG найдется такая максимальная клика К, что и
и у входят в А'.
Доказательство, а. Если бы такой вершины v не нашлось, то
подграф, порожденный и вместе с вершинами из К9 был бы кликой,
включающей К.
б. Поскольку К ФЬ, в (K\L) U (L\K) имеется верщина и. Пусть и
входит в К\ L. Так как ифЬ, часть а теоремы означает, что в I найдется такая
вершина и, что { и, и } ф Е,
в. Подграф, порожденный вершинами и и v, есть клика. Если она не
максимальна, будем добавлять вершины, пока не получим максимальной
клики. ¦
При описании процедуры нахождения интервального представления мы
будем предполагать, что цикл Z4 не является в G порожденным подграфом
и что для Gc имеется некоторая транзитивная ориентация А. (Для
знакомства с конструктивной процедурой нахождения А читатель отсылается к
о i K,5
о U К16
о U К„
° У
о ш
о z
Рис. 3.42. Граф G и его клики. Клики А*1Р К12, /С1Э> /С14 и Klg максимальны
8* 115
Таблица 3.1
Ориентация А графа G. приведенного на рис. 3.41
Ребро {AT,, Kj)
Ориентация
{ м, v } в А
Ориентация
а
а
а
Ь
Ь
d
с
е
с
е
е
f
{а, с)
(а,е)
(а, с)
Ф,е)
Ф,е)
id, f)
(KltK2)
К2,КА] Ъ е ф,е) (К2,К4)
работе Gilmore, Hoffman [1964]). Пусть_$ — совокупность максимальных
клик в графе G. Построим новый граф G следующим образом: V(G) = %
и, если К nL — различные максимальные клики в G, положим iKt L)€
Е E(G). Иначе говоря, G это полный граф, имеющий в качестве
вершинного множества % . Построим в G ориентацию А , используя ориентацию А в
Gc. Заметим, что если К Ф L, то по теореме 3.9 б найдется такая пара и € К,
vGL, что { и, v} G E(GC). Придадим ребру {К, L) ориентацию ребра {м, v }
в А, т.е. пусть
(K,L)GA*=>(u,v)eA.
Необходимо убедиться в корректности определения А . В самом деле,
возможно найдется еще одна такая пара и €К и i/ G L, что {и \v'} G E(GC)
и (и', м')€Л, хотя уже (м, у)ЕЛ. Тогда определение ориентации ребра
{ К, L } в А становится неясным. Мы покажем ниже (лемма 1), что таких
вершин и ', v' не существует. _
Для иллюстрации построения А снова рассмотрим граф G на рис. 3.41.
Если, например, заданы клики Кх иК2, то а€К19 с Е Кг и { а, с}ф Е.
Тогда можно использовать ориентацию ребра { а, с } в Gc для определения
ориентации ребра {Кх, К2) в G. Поскольку (а, с) ЕЛ, заключаем, что
(?ЬА^)ЕЛ. Построение ориентации А показано в табл. 3.1 и
иллюстрируется на рис. 3.41. _
В ориентированном графе ( %, А) имеется единственный полный
простой путь. (( % , А ) - транзитивный турнир, так как А - транзитивная
ориентация для Gc, Доказательство этого предоставляется читателю. По
теореме 3.4 всякий транзитивный турнир содержит единственный полный
простой путь.) Этот путь определяет некоторое упорядочение вершин.
В нашем примере единственный полный простой путь и соответствующее
упорядочение задается последовательностью#ь K2fK3iK^.
Определим теперь для и Е V(G) представления /' (и) следующим
образом:
(9)
В нашем примере
116
j'(b)={KuK2i,
J'(e)={K3,KA},
/'(/) = I «4 >.
Ниже мы установим (лемма 2), что для всехиФьВУ(G)
{и, v)eE*=*J'(u) П J\V) Фф. A0)
В итоге получим интервальное представление J(u) из представления
J'(u) следующим образом. Пусть f(K) - ранг К в упорядочении на %9
индуцированном А, т.е. f(K) * 1, если К - первая клика /(К) = 2, если К -
втораяитд.Здесь/^)^!,/^) = 2,/(К3) =Зи/(/С4) =4.
Пусть /(и) — наименьший интервал, содержащий {/(?): К EJ'(u) }.
В нашем примере
/(«)=[1,1],
Л*) =[1.2],
/(с) =[2,4],
/(«0-[1,3],
= [3,4],
Остается доказать, что / действительно является интервальным
представлением для G. Проделаем это для общего случая ниже (см. лемму 3). Для
конкретного примера, приведенного на рис. 3.41, доказательство
предоставляется читателю. (Представление интервалами показано на рисунке.)
Преаде чем закончить этот параграф упомянем другой критерий для
графов интервалов. Будем говорить, что упорядочение максимальных
клик ъ G Кх, К29 . ~., Кр последовательно, если всякий раз, когда и
входит в Kf и Kj9 i< у, и входит ив Kni< г< /. Легко видеть, что
упорядочение максимальных клик, полученное в нашей процедуре,
оказывается последовательным. Покажем это при доказательстве леммы 3 в
следующем пункте. Таким образом, в каждом графе интервалов допускается
последовательное упорядочение максимальных клик. Обратно, если для
графов имеется последовательное упорядочение максимальных клик, то Z4
не может быть порожденным подграфом в G и это упорядочение получается
из некоторой транзитивной ориентации Gc. (Доказательство этих
утверждений оставляется читателю в качестве упражнения 27.) Таким образом
имеет место следующая теорема.
Теорема 3.10 (Fulkerson, Gross [1965]). Граф G есть граф интервалов
тогда и только тогда, когда имеется последовательное упорядочение его
максимальных клик.
Теорему Фалкерсона—Гросса удобно переформулировать, используя
матрицы (см. упражнение 20). Другой критерий принадлежности графов
к классу графов интервалов, предложенный Леккеркеркером и Боландом
(Lekkerkerker, Boland [1962]), описан в упражнении 24.
117
3.4.4. Доказательство лемм из п. 3.4.3 1).
Лемма 1. Определение ориентации А корректно.
Доказательство. Предположим, что м, м' Е К, и, t/ E L,{ufv) фЕ,
{u\v'}&E9 hi, v) GA и (t/, и*) GA. Заметим сначала, что либо {u9v')$E,
либо {и ,v}pE, В противном случае G имеет в качестве порожденного
подграфа граф, изображенный на рис. 3.43. В самом деле, согласно нашему
допущению {м, ь)фЕ и{и, и'}фЕ, откуда следует, что {и, u}GE и
{и, и'} Е?, поскольку и с и 9 a v с v входят в одну клику. Порожденным
Рис. 3.43. Граф для доказательства
корректности определения А
подграфом на рис. 3.43 является цикл Z4, нарушающий условие а
теоремы 3.8.
Поскольку, как доказано, либо {м, ь)фЕ9 либо {и 9 и)фЕ9 можно
предположить справедливость первого условия. (В другом случае
доказательство идентично.) Далее либо (м, и') ЕЛ, либо (i/, и) ЕЛ. Если
(w,i/) GA, то, так как (i/, м') ЕЛ, из транзитивности ориентации А
следует (и9 и) GA. Если (и', и) €А, аналогичным путем получаем, что
(и', и) Е Л. В любом случае имеем противоречие, так как ребра { м, и) и
{и, и'} входят в Е. ¦
Лемма 2. Если /' определено условием (9), то для всех иФ\) из F(G)
имеем
(м, и} EF *=*J\u) П /'(и) # 0. A0)
Доказательство. Если {м, v}E?, то по теореме 3.9 в найдется
такая клика KG <jg9 что м и v входят в ?. Тогда KGJ* (и) П/'(у).
Обратно, предположим/'^) П /;(и) =^ 0и пусть ^Е /'(w) П /'(у). Далее м
и у входят вК9иК есть клика; поэтому {м, и) Е К. ¦
Лемма 3. Пусть /' определено условием (9) ,f(K) — ранг К в
единственном упорядочении для (*&,А ) и/(м) — наименьший интервал, содержащий
{f(K):Kej'(u)}. Тогда для всех иФие V(G) имеем
{м, v) Е Я «=» /(и) П /(и) ^ 0. G)
Доказательство. Если {м, и} Е Я, то по лемме 2 найдется К Е
Е /(м) П /'(и). Имеем f(K) Е /(и) П /(и), откуда /(w) П J(v) Ф 0.
Обратно, предположим, что J(u) П /(и) Фф.1(и) и/(и) являются интервалами,
имеющими концами целые числа между 1 и с, равному количеству
максимальных клик в G. Таким образом, в J(u) П /(у) найдется целое т между
1 и с. Число т равно /(К) для некоторой максимальной клики К.
Покажем, что и и и входят в К, а значит, и {и, v)E ?Г. Поскольку f(K) входит
в J(u), в /'(") найдутся такие Kt и Kh что /(*,) </(*) </(А». Можно
считать, что /(АГ) Ф/(К{) и /(/Г) Ф/(К1)> так как в противном случае
* = *, или. А: = А) и и входит в А. Итак, /(*,) < /(A) <f(Kf). Пусть
О Этот пункт можно опустить без потери непрерывности восприятия дальнейшего
изложения.
118
ифк. Тогда найдется такая вершина аЕК9 что {и, д}^-/[. Это следует
из теоремы 3.9а. Имеем (и, a) GA, поскольку (К{, К) G А и (а9 и) ? А,
поскольку (К, Kj) € А. Это означает, что А не является ориентацией,
откуда и Е К. Аналогично, i> E А\ ¦
Доказательство включения и?К показывает, что упорядочение
максимальных клик последовательно в смысле, используемом в теореме
Фалкерсона и Гросса (теорема 3.10).
3.4.5. Другие графы пересечений. Прежде чем завершить наше
рассмотрение графов пересечений заметим, что исследовались не только графы
пересечений семейств интервалов на прямой, но и другие графы
пересечений. Ряд работ посвящен графам пересечений интервалов единичной длины
(Roberts [1969], Wegner [1967]). Таккер [Tucker [1970a, 1971])
рассматривал графы пересечений дуг окружности. Познакомимся с ними
в следующем пункте. Пересечения кубов и прямоугольных
параллелепипедов в л-мерном пространстве изучались в работах Danzer, Grunbaum
[1967],Roberts [1969b]; мы вернемся к этим вопросам в §3.5.
Рассматривались также графы пересечений выпуклых множеств в й-мерном
пространстве (Wegner [1967], Ogden, Roberts [1970]). Обзор других
результатов о свойствах пересечений различных семейств множеств в
евклидовом л-мерном пространстве можно найти в книге Hadwiger,
Debrunner, Klee [1964].
Ряд задач, рассмотренных в этом параграфе, таких как проблема Бензера
и задача измерения предпочтений, представляют интерес не только для
интервалов, но и для других семейств множеств.
3.4.6. Регулирование движения транспорта светофором. Рассмотрим
в качестве еще одного применения графов интервалов задачу управления
фазами включения светофора для регулирования движения транспорта
на сложном перекрестке. Пусть каждому транспортному направлению
(дороге, пешеходному переходу и т.д.) соотнесен заданный интервал
времени, в течение которого горит зеленый свет. Рассмотрим лишь
простейший случай, когда свет либо зеленый, либо красный. Процесс протекает
циклически и избранное распределение времен включения фаз светофора
повторяется многократно. Теперь представим себе круглые часы и
поставим в соответствие интервалу зеленого света для транспортного
направления и дугу на окружности этих часов. Ясно, что некоторые направления
совместимы; среди них те, которые не приводят к столкновению (не
пересекаются) и те, для которых одновременное движение в обоих
направлениях не слишком рисковано и не явится причиной задержек. Например,
на транспортном пересечении, изображенном на рис. 3.44, поток
транспорта а совместим с потоком транспорта Ь, следующим в противоположном
направлении, однако он не совместим с потоком с, который столкнется
с ним. Прежде чем перейти к управлению светофорами,
инженеры-транспортники должны принять решения о совместимости различных потоков.
В любом случае, если эта информация задана и два направления транспорта
совместимы, основой всех дальнейших конструкций является утверждение:
для совместимых потоков разрешается перекрытие дуг, соответствующих
зеленому свету. Распределение дуг на окружности часов, поставленных
в соответствие транспортным направлениям, называется допустимым
соответствием (представлением) зеленых сигналов светофора, если пере-
119
a\f\
ш
Град) совместимости
од
Представление
дугами окружности
Соответствующий
граф пересечении Н
СоРис. 3.44. Транспортное пересечение
крываются лишв дуги, отнесенные к совместимым потокам. Как найти
некоторое допустимое представление? Чтобы ответить на этот вопрос,
предположим, что граф совместимости G построен следующим образок*.
Вершинами G служат направления движения транспорта и два направления
соединяются ребром тогда и только тогда, когда они совместимы. Мы
хотим таким образом поставить в соответствие дуги на окружности часов
каждому направлению, что если и и v соединены ребром, то
соответствующие дуги могут пересекаться (но не обязательно). Граф пересечений
совокупности использованных дуг определяет в графе G подграф Н с тем же
множеством вершин, что и в G. Мы назовем такой подграф остовным
(сравнить упражнение 17 § 2.3). Граф пересечений семейства дуг на окружности
называется графом дуг окружности. Так, остовный подграф Н в G есть
граф дуг окружности. На рис. 3.44 приведен граф совместимости,
соответствующий рассматриваемому уличному перекрестку. (Staffers [1968]
приводит более сложные примеры.) Граф совместимости G не является
графом дуг окружности, (Доказательство этого утверждения оставляется
читателю.) Таким образом, любое допустимое соответствие дуг
окружности вершинам этого графа G должно порождать в G собственный остовный
120
подграф Я, т.е. основный подграф Я, не совпадающий с G, На рис. 3.44
показано такое соответствие и приведен полученный граф Я.
Не всякое допустимое представление зеленых сигналов светофора
достаточно эффективно. Например, всегда имеется соответствие, которое
фактически не отводит времени для зеленого света ни одному направлению
движения. Чтобы найти "эффективное" представление зеленых сигналов
светофора сначала необходимо пояснить смысл понятия "эффективность".
Одно требование состоит в следующем: каждый зеленый интервал должен
иметь определенную минимальную величину, достаточную, чтобы водители
успели среагировать. В случае изолированного транспортного пересечения
мы, вероятно, хотели бы минимизировать общее время ожидания, т.е.
общее время для красного света в данном цикле. В случае
неизолированного транспортного пересечения требуется иное понятие эффективности,
поскольку желательно скоординироваться с другими светофорами. Стоф-
ферс говорит об "идеальных" временах включения интервалов зеленого
света, относящихся к данному транспортному направлению; они должны
определяться информацией об ожидаемом времени достижения
транспортом, двигающимся от других светофоров, данного перекрестка. Затем,
утверждает Стофферс, следует 'минимизировать время (взвешенное)
запаздываний между идеальными и реальными временами включения.
Во всяком случае достаточно удобная для использования процедура
нахождения эффективного представления зеленых сигналов светофора
состоит в следующем. Вначале для заданного графа совместимости G
найдем все остовные подграфы дуг окружности. Для каждого такого
подграфа Я найдем наиболее эффективные (в принятом нами смысле)
представления зеленых сигналов светофора. И, наконец, выберем самое
эффективное из этих представлений. Если предположить, что последний
зеленый сигнал светофора некоторого цикла кончается до начала
следующего, то каждое представление зеленых сигналов соответствует
представлению интервалами, поскольку можно развернуть эту окружность в прямую.
Граф пересечений, соответствующий представлению длительности зеленых
сигналов светофора, является тогда графом интервалов. Стофферс (S to
lifers [1968]) описывает конкретную процедуру нахождения наиболее
эффективного представления зеленых сигналов для данного остовного
подграфа Я, являющегося графом интервалов. Она связана с алгоритмом
нахождения интервального представления для графа интервалов,
описанным в п. 3.4.3. Сначала найдем в Я все максимальные клики. Затем найдем
все возможные упорядочения этих клик, порожденные транзитивными
ориентациями в Нс или являющиеся последовательными в смысле
теоремы Фалкерсона—Гросса (теорема ЗЛО), Предположим, что Ktf K2> ...
..., Кр — некоторое такое упорядочение. Сопоставим каждую
максимальную клику К( периоду, в течение которого для всех направлений движения
транспорта, составляющих Ki9 горит зеленый свет. Периоды
упорядочиваются в соответствии с последовательностью Kl9 К2, ..., Кр, Период Kt
имеет некоторую продолжительность dt, нуждающуюся еще в определении.
Нам известно, что направление транспорта и присутствует в
последовательных максимальных кликах Ki9 Aj+1, .. ., AT/. Тогда для и горит зеленый
свет, начиная с периода Kt и вплоть до периода А), Если К\ начинается
в нулевой момент времени, то Kj начнется в момент времени dx + d2 + ...
121
Таблица 3.2
Интервалы зеленого света для подграфа Я, изображенного на рис. 3.44
Направление
транспорта и
а
Ь
с
d
е
f
Все
направления
Максимальные клики,
содержащие
и
К
К
L
LyM
N
MyN
Интервалы зеленого
света для и
@,flf,)
(d19dl +d2)
{d. yd. "^d* +(?/_)
(d. + d» + /d~yd. + <cf- +
(dl+d1,d1+d2+d3+dA
Общее
время зеленого
света
d*
d л
d»
) d3 +dA
Общее
время красного
света
dx +d3+d4
d +и
d. *f* dл "^ d
d. *ь d л
+ 4d3 +4rf4
,-_ i и поэтому и имеет интервал зеленого света (dx + d2 + ... + d/ _ i,
dx + d2 + ... + djj), где сумма dx + d2 + ... + d/_i равна О при /-1 = 0.
(Мы пользуемся здесь открытыми интервалами; незначительные изменения
позволяют рассматривать и замкнутые интервалы.) Наиболее эффективное
представление для продолжительностей df при заданном упорядочении
максимальных клик получается методами линейного программирования.
В самом деле, нетрудно видеть, что dt удовлетворяют определенным
неравенствам (ограничениям) и мы хотим минимизировать величины,
выражаемые через dt.
В графе совместимости G для данного остовного подграфа, являющегося
графом интервалов, можно найти самое эффективное допустимое
представление зеленых сигналов светофора, выбирая его среди наиболее
эффективных представлений, построенных из различных упорядочений
максимальных клик остовного подграфа Н. В конечном счете, наиболее эффективное
представление для G можно выбрать, перебирая все такие возможные
подграфы Я.
Для иллюстрации этой процедуры рассмотрим граф Я, изображенный
на рис. 3.44. Максимальными кликами в Н служат К = {я, b}, L = {с, d}>
M = {dyf) и N- {е9 /}, Легко видеть, что K,L,M,N- одно из
последовательных упорядочений этих клик. Сопоставим продолжительности dXy
d2, d3 и d4 соответственно кликам K,L9MkN. Направление транспорта а
входит лишь в максимальную клику К; поэтому интервал зеленого света
для а равен @, dx). Направление d входит в L и М, поэтому интервал
зеленого света для d равен (i} dг + d2 + d3), .
Остальные интервалы зеленого света для разных направлений показаны
в табл. 3.2.
Если требуется, чтобы каждое направление транспорта имело зеленый
свет не меньше 10 с, общая длина периода цикла равнялась s = 60 с и общее
время красного сигнала было по возможности минимально, то должны
выполняться следующие условия:
122
С?! > 10 A1)
(продолжительность зеленого света для а и Ь),
d2 > 10 A2)
(продолжительность зеленого света для с),'
d2+d3> 10 A3)
(продолжительность зеленого света для d),
dA > 10 A4)
(продолжительность зеленого света для е),
d3+d4> 10 A5)
(продолжительность зеленого света для/),
dx + d2 +<*3+<*4 =60 О A6)
(общая продолжительность, зеленого света по всем периодам),
R = 4di + 4d2 + 4J3 + 4d4 минимально A7)
(общая продолжительность красного света по всем направлениям).
Нахождение величин di9 минимизирующих выражение вида R, при
ограничениях вида A1)—A6), есть стандартная задача линейного
программирования. В этом простом случае R равно 4(dt + d2 + d3 + d4), поэтому его
величина 4 • 60 = 240. Таким образом, здесь задача минимизации сводится
к нахождению произвольных db удовлетворяющих соотношениям A1)-
A6). Например, dt равные 15, удовлетворяют этим условиям. При таком
решении транспорт восточно-западных направлений а и Ъ имеет зеленый
свет в течение первых 15 с. В следующей фазе горения светофора зеленый
свет получает транспорт, движущийся в северном и южном направлениях с
и d. Через 30 с для напрвления с загорается красный свет, для
транспортного потока / поворачивающего налево — зеленый. В заключительной фазе,
начинающейся через 45 с, для направления d загорается красный, а для
транспортного потока е9 поворачивающего налево - зеленый свет. И теперь
и для е, и для / горит красный свет. Через 60 с цикл начинается вновь.
При другом выборе df получается решение, отличающееся длительностями
фаз.
Аналогичные вычисления следует повторить для каждого
последовательного упорядочения максимальных клик в Я. Затем необходимо повторить
их для каждого Я. Результатами этих расчетов будут различные множества
фаз включения светофора. Для читателя было бы поучительно проделать
несколько таких вычислений и сравнить получающиеся множества фаз.
Среди всех возможных представлений, приводящих к минимальным
значениям R при данном упорядочении максимальных клик некоторого остов-
ного подграфа Я, мы выбираем представление с наименьшим значением Л.
0 В действительности мы только требуем, чтобы d1 +d2 +d3 +d4 < 60. Но,
поскольку увеличение длительности зеленого света может лишь уменьшить общую
продолжительность красного света, можно не оставлять промежутков времени без
зеленого света. Столбец общего времени для красного сигнала в табл. 3.2 был
составлен при этом допущении.
123
Если желательно исключить допущение о том, что последний зеленый
сигнал в цикле гаснет до начала следующего цикла, необходимо
рассматривать остовные подграфы Я, являющиеся графами дуг окружности.
Будем действовать, как и раньше, но теперь придется искать "циклическое
упорядочение" клик Kt, К2, ..., Кр, Кх, которое последовательно в
смысле аналогичном, используемому в теореме Фалкерсона—Гросса (теоре
ма 3.10). В остальном эти процедуры совпадают.
Описанное здесь решение задачи об управлении сигналами светофора
предполагает наличие критериев, определяющих будет ли данный граф
графом дуг окружности (или графом интервалов). Графы дуг, как уже
отмечалось выше, были охарактеризованы Таккером (Tucker [1970a,
1971]).
Рассмотренные в этом пункте вопросы дают еще один пример
математической задачи, поставленной и решенной в расчете на определенные
приложения (проблема Бензера и теория измерений), но решение которой
позволило провести анализ прикладных проблем в других областях.
Упражнения
1. Для следующих семейств множеств & найти граф пересечений,
а. &={S1,S2,S3iS4},rne
Sl ='{atb,c,d), S2 ={x,y,z),
S3 = {a,e,i9o,u}t S4 ={a,b,c,d,... ,x,y,z}.
^='[1,10], 52=,[9,15], S3 =[15,20].
в. & ={SltS2,S3tS4tSs}9me
2. Для каждого графа Gf, изображенного на риг. 3.32, найти такое семейство
множеств &, что Gj есть граф пересечения Ж.
3. Показать (не применяя процедуру построения из п, 3.4,3), что граф G2 на
рис. 3.39 есть граф интервалов.
4. Предположим, что пересечения подструктур Slt S2 и S3 заданы следующей
матрицей
Показать, что данные о пересечениях согласуются с гипотезой о линейности.
5. Для данных из упражнения 4 найти два различных хронологических
упорядочения, которые различаются в отношении строгого следования.
6. Найдутся ли для данных из упражнения 4 два различных хронологических
упорядочения, различающихся в отношении "интервал и накрывает интервал и"?
7. Предположим, что у нас имеется четыре типа вин м, и, wn x. Наш опыт
подсказывает, что стоимость и от, 2 до 5 долларов за бутылку, стоимость и от 3 до 5 долларов,
стоимость wot 7 до 10 долларов и стоимость х от 3 до 10 долларов. Предполагая,
что перекрывания интервалов определяют отношение безразличия, построить граф,
представляющий отношение безраличия среди этих вин. Построить орграф,
представляющий отношение предпочтения, если оно определяется из соотношения (8). Имеется
ли вино, которое явно предпочтительнее всех остальных?
124
8. Найти транзитивную ориентацию для дополнения каждого графа интервалов
на рис. 3.32.
9. Какие из графов, изображенных на рис. 3.45, являются графами интервалов?
10. Для каждого из графов на рис. 3.45 найти все максимальные клики и указать
одну не максимальную клику.
11. Для каждого графа G, изображенного на рис. 3.46, найти транзитивную
ориентацию дополнительного графа Gc и применить намеченную в тексте в общих чертах
процедуру получения интервального представления для G\
12. Привести пример транзитов но ориентируемого графа интервалов.
13. Показать, что цикл Z4 является графом дуг окружности.
14. а. Показать, что граф совместимости на рис. 3.45 не является графом дуг
окружности; б. Какие графы на рис, 3,45 суть графы дуг окружности?
15. Для графа совместимости, приведенного на рис. 3.44, найти другой,
являющийся графом интервалов, остовный подграф Я'и упорядочение (последовательное)
максимальных клик в Я', возникающее из транзитивной ориентации (Я')с. Найти
допустимое представление зеленых сигналов светофора, соответствующее этому
упорядочению, .которое минимизирует общее время ожидания при красном сигнале
светофора. Рассмотреть получающиеся фазы и сравнить решение с тем, которое было
найдено в тексте для остовного подграфа Я.
16. а. Привести пример некоторого транспортного перекрестка, его графа
совместимости G и допустимое представление зеленых сигналов светофора.
б. Нарисовать соответствующий граф пересечений. Будет ли он графом
интервалов?
в. Найти остовный подграф Я в G, являющийся графом интервалов.
г. Найти транзитивную ориентацию дополнительного графа Нс и соответствующее
ей упорядочение максимальных клик в Я. Сформулировать задачу линейного
программирования, возникающую в результате минимизации общего времени ожидания
при красном сигнале светофора.
д. Решить эту. задачу линейного программирования и проанализировать фазы
движения, соответствующие полученному решению.
17. Реберным графом L (G) графа G называется граф пересечений совокупности
ребер в G. Другими словами, V (L (G)) =E(G) и его вершины е Фе' соединены в
L (G) ребром в том и только том случае, если в G они имели общую вершину. На
рис. 3.47 приведено несколько графов с соответствующими им реберными графами.
а. Построить реберные графы для графов приведенных на рис. 3.45.
б. Является ли граф КА реберным графом для некоторого графа? Ответить на
аналогичный вопрос для полного графа Кп,
в. Является ли цикл ZA реберным графом для некоторого графа? Ответить на
аналогичный вопрос для цикла Zn длины л.
г. Является ли граф на рис. 3.48 реберным графом какого-нибудь графа?
18. Графом клик K(G) графа G называется граф пересечений семейства
максимальных клик в G, Например, граф на рис. 3.49 имеет максимальные клики Кх ={l, 2),
К2 ={2, 3,4}tK3 = {3, 5 } и К4 = {4, 6}; там же приведен граф клик для К (G).
а. Построить граф клик для графа G3, изображенного на рис. 3.25.
б. Построить граф клик для полного графа Kw
в. Является ли цикл Z4 графом клик для некоторого графа?
19. (Нагагу [1969]), Пусть В - матрица инциденций вершины-ребра графа G (см.
упражнение 16 § 2.4), L (G) - реберный граф G (см. упражнение 17) и A (L (G)) -
матрица смежности L (G), Показать, что A (L (G)) = В'В - 2/, где / - единичная
матрица, а В' - транспонированная матрица для В,
20. Матрицей инциденций "вершины-максимальные клики", или просто матрицей
инциденций максимальных клик, M(G) графа G называется матрица инциденций
"точки-множества** (см, упражнение 16 §2.4) для множества А = V(G) и
множество 8 , являющегося совокупностью максимальных клик в G. Теорему Фалкерсона-
Гросса (теорема 3,10) можно переформулировать следующим образом: граф G тогда
и только тогда является графом интервалов, когда столбцы матрицы M(G)
переставляются таким образом, что все единицы располагаются последовательно. (Результаты,
относящиеся к последовательному свойству единиц можно найти в статьях Ryzer
[1969] и Tucker [1970b-1972],) Используя теорему Фалкерсона-Гросса, показать,
что графы, представленные на рис. 3.46, будут графами интервалов.
125
abed
Рис. 3.45. Графы к упражнениям § 3.4, 3.5
с с f
-о о-
лл
a b d e f a b d $ д
Рис. 3.46. Гоафы к упражнениям § 3.4
Ш)
Ъ<* ре,
ег* *>*3
Рис. 3.47
Рис. 3.47. Некоторые графы с их реберными
Рис. 3.48. Граф к упражнению 17 § 3.4
Рис. 3.48
5 3
Рис. 3.49. Граф и его граф клик
26
21. Предложить критерий принадлежности для графов дуг окружности к классу
графов интервалов, аналогичный критерию Фалкерсона-Гросса (теорема 3.10)^ _
22. Показать» что, если G не является графом интервалов, то ориентация Л" для G
в п. 3.4.3 определена некорректно.
23. a. (Roberts [1969а]). Граф называется графом единичных интервалов тогда
и только тогда, когда это граф пересечений семейства замкнутых действительных
интервалов единичной длины. Привести пример графа интервалов, не являющегося
графом интервалов единичной длины.
б. (Roberts [1969aj). Граф называется графом собственных интервалов тогда
и только тогда, когда он служит графом пересечений семейства невложенных
действительных интервалов. (Два интервала могут совпадать.) Привести пример графа
интервалов, отличного от графа собственных интервалов.
24. Тройка вершин и, v и w называется астероидалъной, если имеются такие
цепи Сх между и и и, С2 между и и и>, С3 между и и w, что нет ребра из ив С3, из и в С2
и из w в Сх. Показать, что все графы на рис. 3.45, которые не являются графами
интервалов и не содержат Zw n > 4 в качестве порожденного подграфа, имеют астерои-
дальные тройки. (В работе Lekkerkerker, Boland [1962] доказано, что какой-либо
граф есть граф интервалов тогда и только тогда, когда в нем нет астероидальных
троек и ни один цикл Zntn> 4 не оказывается порожденным подграфом.)
25*. Граф G называется жестко-циклическим графом, если цикл Zn, n > 4 не
служит его порожденным подграфом. Дирак (Dirac [1961]) показал, что в таком графе
всегд имеется симплициальная вершина и такая, что любые две вершины, соединенные
с и ребром, также соединены ребром друг с другом. {Замечание* и может иметь
степень 0 или 1.) Показать, что всякий неполный жестко-циклический граф содержит
по крайней мере две несмежные симплициальные вершины.
26. Ясно, что каждый граф интервалов - жестко-циклический (см. упражнение 25).
Использовать результат Дирака, чтобы показать, что для каждого интервального
представления графа G (имеющего более одной вершины), существует другое
интервальное представление, не совпадающее с ним по отношению "интервал и накрывает
интервал и".
27*. Пусть Klt Кгь ..., Кр - последовательное упорядочение множества
максимальных клик графа G.
а. Показать, что цикл Z4 не является порожденным подграфом G.
б. Показать, что это упорядочение максимальных клик можно получить из
упорядочения А на^ для некоторой транзитивной ориентации А графа Gc.
в. Показать непосредственно (не используя результаты пунктов а и б), что G служит
графом интервалов, построив для этого интервальное представление / из
последовательного упорядочения.
28. Продумать возможности применения понятия графов пересечений для
проблемы составления расписания использования аудиторий в университете, при условии,
что ряд груйп не может заниматься в одно время, некоторые группы слишком
велики и т.д.
29. Предположим, что перед нами стоит задача расположения произведений
какого-нибудь античного писателя в хронологическом порядке. Может ли помочь нам в
этом понятие графа пересечений?
30. Проект. Условие, что данный транспортный поток в течение каждого цикла
получает только один интервал зеленого света не обязательно. Разработать
математическую теорию для ситуации, где это ограничение исключено.
31. Какие еще упрощения допускались при изучении вопросов управления
сигналами светофора в п. 3.4.6? Как можно было бы видоизменить нашу модель, с тем чтобы
учесть их?
§ 3.5. Сеть питания
В этом параграфе мы обратимся к совершенно другой сфере применений
теории графов — к изучению сетей питания в экологии. В экологии
исследуются отношения, существующие между различными живыми
существами (включая людей) и их взаимоотношения с окружающей средой. В на-
Влажность т
I X !
~'*П
Влажность т
/ А \
/Т /Т \
tf Температура t
Экологическая
ниша
/-4^-J
Температура t
Рис. 3.50. Некоторые экологические ниши
шем первом приложении мы исследуем ряд факторов, существенных для
экологических взаимоотношений.
3.5.1. Размерность экологического фазового пространства 1). Мы можем
считать, что всякий вид животных или растений определяется некоторыми
показателями ("измерениями"), характеризующими нормальное для этого
вида состояние окружающей среды. Ими могут быть такие факторы, как
температура, влажность, давление, величина добычи, необходимое
количество питательных веществ и т.д. Область в ^-мерном евклидовом
пространстве, состоящая из всех точек, удовлетворяющих определенным
ограничениям по этим различным показателям, соответствует тогда конкретному виду
Птицы
Рис. 3.51. Пример сети питания
Лисы Насекомые ТраВа Олени
и называется экологической нишей. Обычно ограничения по данному
показателю определяют интервал возможных значений. Поэтому
экологическая ниша является ^-мерным прямоугольным параллелепипедом со
сторонами, параллельными координатным осям, где к - число показателей.
Такое тело называется (к-мерным) ящиком, (см. для примера рис. 3.50).
Евклидово пространство с осями координат, соответствующими таким
факторам, как температура, давление и т.п., назьюается экологическим
фазовым пространством. Вообще говоря, никакие два вида не имеют в эколо-
1) Первая часть этого пункта основана на неопубликованной работе Джоэля Кохена
(Joel. E. Cohen).
128
гическом фазовом пространстве одинаковых ниш. Основная идея экологии
состоит в том, что два вида конкурируют в том и только том случае, если
их экологические ниши перекрываются. (Если же они обладают
достаточным сходством, то соответствующие им виды не могут существовать
совместно. Это соображение известно под названием принципа конкурентного
исключения или принципа Гаузе (Wilson, Bossert [1971 с. 157 и далее]) .)
Основной интерес представляет следующий вопрос. Выяснить, считая
исходным понятие конкуренции, какое минимальное число измерений можно
использовать для описания экологического фазового пространства,
отражающего явление конкуренции, т.е., чтобы в этом фазовом пространстве
конкурирующие виды имели перекрывающиеся ниши, а неконкурирующие
виды нет.
Для получения ответа на этот вопрос введем понятие сети питания
экологического сообщества. Она представляется орграфом с множеством
вершин, состоящим из всех видов 2), входящих в это сообщество. От вида
и к виду v проводится дуга, если v служит добычей для и.
На рис. 3.51 изображена небольшая и весьма упрощенная сеть питания
с пятью видами (этот пример уже был показан на рис. 2.4), а на рис. 3.52
представлена сеть питания с 15 различными видами 2). Также приведена
матрица смежности этой сети питания.
Исходя из сети питания, можно определить явление конкуренции: два
вида конкурируют тогда и только тогда, когда пищей для них служит один
и тот же вид. Используя это определение, построим граф конкуренции.
Его множество вершин образуют виды, и два вида соединяются ребром
тогда и только тогда, когда существует вид, служащий для них общей
пищей. Граф конкуренции, соответствующий сети питания, приведенной на
рис. 3.51, изображен на рис. 3.53. Заметим, что птицы конкурируют с
насекомыми, поскольку оба эта вида питаются травой, лиса и насекомые не
конкурируют и т.д. На рис. 3.54 приведен граф конкуренции для сети
питания, изображенной на рис. 3.52. Поставленный нами выше вопрос можно
теперь переформулировать следующим образом. Какое наименьшее число
измерений пространства k достаточно, чтобы можно было в ^-мерном
евклидовом пространстве сопоставить каждой вершине и графа
конкуренции G = (V, Е) ящик В{и), для которого выполняется требование, что
для всех иФи€ F,
u,v ЕЕ *=>В(и)ПВ(г))Фф. A8)
Если к = 1, получаем известное условие того, что G есть граф интервалов.
В общем случае G является графом пересечений семейства ящиков в
^-мерном пространстве. Назовем интервальной размерностью графа G такое
наименьшее к, что G может рассматриваться, как граф пересечений ящиков в
^-мерном пространстве. Чтобы убедиться в корректности определения
интервальной размерности, необходимо проверить, что каждый граф является
графом пересечений ящиков в некотором ^-мерном пространстве. Оставля-
1) Слово "вид" будет использоваться здесь в довольно широком смысле.
2) Обратить внимание на предыдущую сноску - называем растение "видом".
Анализ этой сети питания проводится в работе Нагагу [1961в].
9. Ф.С Роберте 129
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1
0
0
0
0
Q
0
0
0
0
0
0
0
0
0
0
2
0
0
0
1
0
0
0
0
1
0
0
0
0
1
0
3
1
0
0
1
0
0
0
0
0
0
0
0
0
0
1
4
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
5
0
0
0
1
о
0
0
0
0
0
. — — -J
0
0
0
0
0
1 6
1 0
о
i 0
1 1
1 0
! о
1 0
1
0
- — — -
1
1
0
0
7
1
1
1
0
0
1
0
1
0
0
0
0
0
0
0
8
0
0
0
1
0
0
0
0
0
0
0
0
0
0
1
9
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
10
1
0
0
1
о
0
0
0
0
0
0
1
0
1
1
! о
0
0
1
о
0
0
0
0
0
0
0
0
0
0
12
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
13
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
14
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
15
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
б
Рис. 3.52. Сеть питания (а) и ее матрица смежности (б) (Fisher, Zim [1958], Harary
[1961]): 1 - медведь, 2 - птицы, 3 - олени, 4 - лисы, 5 - змеи, б - насекомые, 7 -
растения, Я, - кролики, 9 - еноты, 10 - грызуны, И - саламандры, 12 - скунсы,
13 - жабы, 14 - дикие кошки, 15 - волки .
ЛисьХ >i
Насекомые
о Трава
Олени
о 7
о 10
Лисы о >6 Олени 8 15 13
Рис. 3.53. Граф конкуренции для сети питания, изображенной на рис. 3.51
Рис. 3.54. Граф конкуренции для сети питания, изображенной на рис. 3.52. Звездочка
указывает, что все пары вершины в л-угольниках соединены ребрами
130
ем это в качестве упражнения (см. упражнение 18). Конечно,
интервальная размерность графа интервалов равна 11).
Нетрудно проверить, что граф конкуренции на рис. 3.53 имеет
интервальную размерность 1, т.е. является графом интервалов. В этом можно
убедиться непосредственно, получив интервальное представление, показанное
на рис. 3.55. Более удивительно, что интервальная размерность графа
конкуренции, изображенного на рис. 3.54, также равна 1. Интервальное
представление для него показано на рис. 3.56.
Это кажется достаточно странным, но знакомство с рядом сетей питания
приводит к одинаковому результату: их графы конкуренции суть графы
Рис. 3.55. Интервальное представление Птицы
для графа конкуренции, изображенного Лисы Олени Траба
на рис. 3.53 Насекомые
интервалов 2). Не известно, носит ли наблюдаемое явление характер
общего закона и в этом случае хотелось бы выяснить какую интерпретацию
можно дать единственному измерению. С точки зрения математики, интересной
задачей является нахождение 'достаточных (необходимых и достаточных)
условий того, что граф конкуренции, соответствующий сети питания, есть
граф интервалов. Этот вопрос в настоящее время еще открыт. Он останется
открытым, если даже допустить, что сети питания не содержат контуров,
что и будет сделано ниже.
Определим теперь интервальную размерность ряда других графов. Для
графа Z4, т.е. цикла длины 4, ее величина равна 2. Критерий Гилмора и
Гоффмана (теорема 3.8, условие а) означает, что Z4 не является графом
интервалов. Однако Z4 представляется графом пересечений ящиков в
двумерном пространстве, как показано на рис. 3.57. В качестве второго
примера рассмотрим граф К(пг, n2t . . . , пр), определяемый следующим
образом. Имеется пх + п2 + ... + пр вершин, разбитых на р классов. В i'-м
классе содержится щ вершин. Внутри классов ребра отсутствуют, а каждая
вершина в любом классе соединена с каждой вершиной любого другого
класса. На рис. 3.57 представлено несколько графов K{nlt п2, . . . , пр)
(кроме графа Z4, который можно рассматривать, как К B, 2). Почему?)
Эти графы обычно называются полными р-дольными графами. На рис. 3.57
также показаны представления ящиками для приведенных там полных
р-дольных графов. Таким образом, К{\, 4) имеет интервальную
размерность 1. К B, 2) и КCу 3) отличны от графов интервалов. Это легко
следует из теоремы 3.8, так как каждый из них содержит цикл Z4 в качестве
порожденного подграфа. Таким образом, представление ящиками
доказывает, что интервальная размерность этих двух графов равна 2. Можно
показать, что для К B, 2, 2) эта величина равна 3. Вообще, интервальная
размерность графа K(nlf п2, . . . , пр) равна числу величин/!/, превосходящих
1) Формально можно говорить, что полный граф, являющийся графом
интервалов) , имеет интервальную размерность 0, поскольку каждую вершину можно
отобразить в одну точку.
2) J.E. Cohen, личное сообщение.
9* 131
1
2 — Рис. 3.56. Интервальное представле-
3 ~ ние для графа конкуренции, изобра-
I —-——-——- женного на рис. 3.54
6 -
8 -
9
10 .
II
12
/3
по величине 1 *). Этот результат доказан в работе Робертса (Roberts [ 1969b])
(см. упражнение 17). Для графов, отличных от К(пи п2, . . . , пр)9
интервальная размерность в общем случае не известна и нет процедур для ее
определения по заданному графу.
Прежде чем снова удастся добиться некоторого прогресса в вопросе
о размерности экологического пространства, будет, вероятно, необходимо
решить указанные математические задачи. Габаи (Gabai [1974J) недавно
сделал существенные шаги в этом направлении (см. упражнение 19).
3.5.2. Трофический статус. В качестве второго применения сетей питания
приведем некоторые результаты из области математической социологии,
называемой теорией организаций. Ученые - специалисты в области теории
организаций, занимались анализом статуса личности в организации.
Проиллюстрируем некоторые результаты по измерению статуса в организации,
пытаясь измерить "статус" вида в сети питания 2).
В экологии статус обычно называется трофическим уровнем (Wilson,
Bossert [1971, с. 139 и далее]). Трофический уровень иногда используется
при измерении сложности или разнообразия сети питания. Сеть со
многими видами на каждом трофическом уровне весьма сложна. Принцип,
согласно которому более сложные экосистемы более устойчивы, широко признан
в экологии (мы вернемся к нему в упражнении 21).
Легко определить трофический уровень вида, если сеть питания
является простым путем (цепь питания). Это также нетрудно сделать, если сеть
питания имеет простую структуру, так что все пути от некоторого
произвольного вида к виду без выходящих дуг имеют одинаковую длину
(примеры таких сетей питания приведены на рис. 3.58). Для них трофическим
уровнем можно просто считать длину такого пути.
Вопрос об определении трофического уровня в общем случае довольно
труден. В качестве примера читателю предлагается подумать как это сделать
в сети питания, приведенной на рис. 3.52. Чтобы различать понятия уровня
в усложненной сети питания и цепи питания, мы в первом случае вместо
трофического уровня будем использовать термин трофический статус.
1) В частности, интервальная размерность графа К A,1,... 1) = Кр равна 0.
2) Идея измерения статуса видов в сетях питания аналогично измерению статуса
в организации принадлежит Харари (Нагагу [1961b]) и частично наш подход следует
ему. Структура социальной организации животных является еще одним примером из
области социобиологии, о ней упоминалось в § 3.2.
132
ВC)
B(f)
ВB)
ВD)
/(B,2)
—L.
ВC)
ВB)
у—
ВD)
-¦ ВB) ВC) В(А) ВE)
ВО)
щ
№
ВB)
1
8C)
ВC)
Рис. 3.57. Представление ящиками для некоторых графов
Рис. 3.58. Сети питания, в которых трофический уровень, или статус, можно измерить
как число уровней от "основания" (сетьд — цепь питания)
133
Предварительно сделаем несколько общих предположений о сетях
питания. Пусть наши сети бесконтурные (отсутствуют контуры), т.е. в них нет
видов их, и2, . . . ,ut таких, что и2 служит пищей для иг, иъ для и2,..., их
для ut. В частности, отсюда следует, что отношение "служить пищей"
асимметрично : если вид и питается видом и, то и не питается видом и.
Наш подход к получению меры трофического статуса будет
неоднократно использоваться в этой книге. Выпишем ниже некоторые условия,
которым должна удовлетворять разумная мера статуса. Они будут
сформулированы в виде аксиом. Мера будет считаться приемлемой тогда и только
тогда, когда она удовлетворяет аксиомам. В некотором смысле аксиомы
определяют математическую модель идеальной меры трофического статуса.
Множество аксиом может быть не слишком ограничительным с
тем, чтобы допускать несколько приемлемых мер. Позже нам
повстречаются настолько жесткие множества аксиом для некоторых
мер, что окажется только одна мера, удовлетворяющая им. Это является
идеальной ситуацией — если мы приняли все аксиомы, перед нами не
остается больше проблемы выбора. Такое множество аксиом называется
категоричным. Мы также столкнемся с ситуацией, когда все аксиомы
кажутся целесообразными, но нет ни одной меры, удовлетворяющей им всем.
Такая ситуация приводит к затруднительному положению: от какой из
принятых аксиом мы должны отказаться?
Наш аксиоматический подход следует работам (Harary [1959],Kemeny,
Snell [1962, гл. 8]), где рассматриваются вопросы, связанные со статусом
в организациях. Когда мы будем говорить, что v есть добыча
(непосредственная) и, то будем иметь в виду другое аналогичное представление,
где v является непосредственным подчиненным и, т.е. отношение,
определяющее орграф организации в статье Харари. Будем говорить, что вид v есть
косвенная добыча вида и тогда и только тогда, когда и Ф и, v не является
непосредственной добычей для и и v достижим из и. Вполне возможно,
что ни один из двух видов и и v не служит ни косвенной, ни
непосредственной добычей друг для друга.
Если v непосредственная или косвенная добыча вида и, то уровень
(трофический) v относительно и определим, как длину кратчайшего
(простого) пути из и в v. После этих вступительных замечаний мы можем
теперь ввести три аксиомы, которым должна удовлетворять мера
трофического статуса. Пусть tD(u) - мера статуса вида и в сети питания D. Для tD
требуется выполнение следующих аксиом.
Аксиома 1. Если вид и в сети питания D не имеет добычи, то t^(u) = 0.
Аксиома 2. Если сеть питания D' получается из сети питания D
добавлением новой вершины, являющейся непосредственной добычей и без каких-
либо других изменений, то tD # (и) > tD(и).
Аксиома 3. Предположим, что сеть питания D изменяется (добавлением
дуг и вершин) так, что для вида и, служащего непосредственной или
косвенной добычей, уровень относительно и увеличивается, и ни у какой
непосредственной или косвенной добычи вида и уровень относительно и
не уменьшается. Если D - новая сеть питания, то tD * (и) > tD (и).
Читателю полезно рассмотреть аналогичные аксиомы и для организации.
Аксиома 1, например, означает, что если некоторое лицо в организации не
имеет прямых подчиненных, то его статус равен 0. Аксиома 2 утверждает,
134
что если нанять дополнительного прямого подчиненного некому лицу, то
статус последнего возрастает. В аксиоме 3 требуется, чтобы статус
некоторого лица возрастал при его передвижении на несколько уровней выше.
Докажем существование меры трофического статуса для бесконтурных
сетей питания, удовлетворяющих аксиомам 1—3. В частности, одной из
таких мер является мера hD(u)9 которая предложена в (Нагагу [1959]).
Бели в сети питания ниже вида и на ком уровне имеется пк видов, то
hD(u)=Xknk. A9)
к
Для сетей питания, подобных тем, что изображены на рис. 3.58, эта мера
отличается от меры, которую мы первоначально предложили, а именно,
от меры, равной длине любого пути к виду без выходящих дуг. Здесь
учитывается общее число видов на различных уровнях ниже вида и, а не
только значение уровня вида и относительно вида, лежащего в "основании".
Следует заметить, что hD(u) всегда неотрицательное число. Бели мы
добавим это ограничение к нашим требованиям на меру трофического
статуса, то hD(u) окажется в некотором смысле минимальной мерой,
удовлетворяющей аксиомам, хотя это и не будет означать единственности.
Просуммируем результаты в следующей теореме.
Теорема ЗЛ1 (Kemeny, Snell [1962]). Мера hD(u), определенная
соотношением A9), обладает следующими свойствами:
а. Удовлетворяет аксиомам 1—3 для всех бесконтурных сетей питания Л
б. Если tD(u) — некоторая другая мера трофического статуса в*
бесконтурной сети питания, принимающая неотрицательные целочисленные
значения и удовлетворяющая аксиомам 1—3, то для всех вершин и имеем
tD{u)>hD(u).
Доказательство, а. Выполнение аксиомы 1 проверяется
непосредственно. Бели мы добавим вид, являющийся непосредственной
добычей для и, то hp(u) возрастет на 1, что подтверждает аксиому 2. Если же мы
переставим вид, служащий непосредственной или косвенной добычей и,
находящийся на уровне к ниже и, на уровень к' = к + р ниже и, не
уменьшая относительно и уровень никакого другого вида, являющегося
добычей и, то hD(u) возрастет по меньшей мере на р. Это означает
справедливость аксиомы 3.
Доказательство будет использовать следующую лемму, доказательство
которой мы оставляем читателю в качестве упражнения 11.
Лемма. В бесконтурном орграфе (V, А) для любой вершины и G V
найдется вершина v G V, достижимая из и и не имеющая выходящих дуг.
Мы проведем доказательство индукцией по т = hD (и). Если т = 0, то и
не имеет непосредственной добычи и поэтому to (и) = 0 по аксиоме 1.
Предположим, что для бесконтурной сети питания Д в которой hD(u) =m
выполнено tD(u) > hD(u). Пусть теперь в бесконтурной сети питания D
^d(w) = т + 1. Итак, для и в ^имеется, по крайней мере, один вид,
являющийся непосредственной добычей. По лемме в D найдется вершина v без
выходящих дуг и достижимая из и. Построим из D новую сеть D1
следующим образом. Если v — непосредственная добыча для и,то удалим и. Если
же v не непосредственная добыча для м, рассмотрим в D кратчайший
простой путь w, i*i, и2, . . ., ukt v из и в v и добавим дугу (м*_ 1, v). Тогда
135
уровень вида v относительно и уменьшится в D' на 1, а уровень
относительно вида и всех других видов, являющихся непосредственной или косвенной
добычей и, не изменится. Поэтому hD» (и) = т. По предположению
индукции tD(u) > m. Но по аксиоме 2 в первом случае и по аксиоме 3 во втором
случае tD(u) больше, чем tDf(u). Таким образом, поскольку t — целое,
то t?>(u) > т+ 1 =/*?>(w)."
Мера hD(u) имеет несколько недостатков. Кажется обоснованным
требовать, что, если t - некоторая мера трофического статуса и вид v
служит непосредственной или косвенной добычей и, то to(v) < tD(u). Мера Л,
и
Рис. 3.59. Бесконтурная сеть питания
Z), в которой hD(u) = 6 и hD(v) = 8.
(Haxary, Norman, Gartwright [1965,
p. 273])
к сожалению, не удовлетворяет этому свойству. На рис* 3.59 приведена
бесконтурная сеть питания, в которой hD(u) = 6 и hD(v) = 8, хотя v
служит добычей для и. (Это происходит потому, что все виды, являющиеся
непосредственной или косвенной добычей вида и> оказываются
непосредственной добычей этого вида, хотя и имеется несколько видов на два
уровня ниже у.)
Трудности, с которой мы столкнулись, удается избежать, если
видоизменить наше определение уровня v относительно уровня и. Если вид и
непосредственная или косвенная добыча для и, назовем уровнем v
относительно и длину самого длинного, а не кратчайшего простого пути из и в и.
Тогда имеем следующую теорему.
Теорема 3.12 (Kemeny,Snell [1962]). Если уровень v относительно и
определяется длиной самого длинного простого пути, то мера h из
соотношения A9), удовлетворяет аксиомам 1—3, а также следующему условию.
Аксиома 4. Если и — непосредственная или косвенная добыча и, то
tD(v)<tD(u).
Доказательство. Оставляем его читателю (см. упражнение 12).
Используя новое определение уровня и обращаясь снова к сети
питания на рис. 3.59, найдем, что hD(u) = 14 и hD(v) = 8. Тем самым показано,
что недостаток, присущий прежней мере, устранен. Было бы интересно
выяснить, найдется ли некоторая мера tD(u), удовлетворяющая
аксиомам 1—4, если придерживаться старого определения уровня О (см.
упражнение 16).
Для иллюстрации вернемся к сети питания, изображенной на рис. 3.52,
и вычислим меру трофического статуса Л, используя оба определения
уровня для всех видов. Результаты приведены в табл. 3.3. Интересно отметить,
что лисы имеют наивысший трофический статус при обоих методах вычис-
1) По сведениям автора этот вопрос остается нерешенным.
136
Таблица
Статус «идов
Виды
1. Медведи
2. Птицы
3. Олени
4. Лисы
5. Змеи
6. Насекомые
7. Растения
8. Кролики
9. Еноты
10. Грызуны
11. Саламандры
12. Скунсы
13. Жабы
3.3
в сети питания на рис. 3.52
Статус h , вычисленный
с использованием уровня,
определяемого
кратчайшим путем (Нагагу [1961b])
3
1
1
10
4
1
0
1
4
0
3
4
3
14. Дикие кошки 4
15. Волки
8
Статус Л,
вычисленный с использованием
уровня,
определяемого самым длинным
путем
4
1
1
14
6
1
0
1
4
0
3
4
3
4
9
ления статуса, тогда как растения и грызуны самый низкий. В этом примере
переход от первой меры трофического статуса ко второй уничтожает
несколько связей (совпадений уровней), как, например, происходит с
медведями и саламандрами, но не меняет нигде на противоположную
упорядоченность по относительному трофическому статусу.
Сложность с мерой /г, удовлетворяющей нашей первой системе аксиом,
указывает на ловушки аксиоматического подхода. Они были искусно
замаскированы в определении уровня, и не могли быть обнаружены при
рассмотрении "разумности" аксиом. В идеале математическая модель,
заменяющая (в частности, как в нашем случае) неточные понятия строгими,
не должна включать элементы, не имеющие прочного аксиоматического
обоснования. Конечно, на практике невозможно выполнять подобное
требование во всех случаях. Однако специалист по математическому
моделированию должен постоянно отдавать себе отчет о ловушках, которые
могут встретиться, если это требование не удовлетворяется.
В действительности, оно не выполняется и в новой системе аксиом
(использующей новое определение уровня и относительно и) даже в большей
степени, чем в первом случае, что ставит под сомнение корректность всей
модели.
Возможно, на этом этапе единственное обоснованное требование к мере
трофического статуса to(u) состоит в следующем: если вид v достижим
из и, то
tD(v)<tD(u). B0)
В упражнении 14 читателю предлагается доказать, что мера трофического
статуса tD, удовлетворяющая условию B0), существует для всех бескон-
137
турных орграфов D. Более того, если мера tDi удовлетворяющая
неравенству B0), существует для данного орграфа Д то он должен быть
бесконтурным.
Упражнения
1. Найти в каждом случае экологические ниши в двумерном евклидовом
пространстве, определяемые следующими требованиями.
а. Содержание озона составляет не менее 0,001% и не более 2,0%, температура
находится в пределах от 0 до 100° С.
б. Содержание кислорода в атмосфере составляет не менее 50% и не более 83%,
количество осадков колеблется между 12 и 45 дюймами в год
2. В сети питания на рис. 3.60 найти все виды, являющиеся косвенной добычей
для вида 8.
3. Построить граф конкуренции G, соответствующий сети питания, изображенной
на рис. 3.60.
4. Является ли граф G из упражнения 3 графом интервалов?
5. Вычислить трофический статус hpiu) по формуле A9), используя оба
определения уровня для каждого вида, представленного на рис. 3.60.
6. Привести пример сети питания, в которой все виды имеют одинаковый
трофический статус hD(u). (Проделать это для обоих определений уровня.)
7. Привести пример сети питания, в которой трофические статусы h&(u) всех видов
различны. (Проделать это для обоих определений уровня.)
8. (Kemeny, Snell [1962]). а. Пусть некоторая организация состоит из пяти членов.
Как на основе меры статуса Л/>(и) и первого определения уровня, сформировать ее
структуру так, чтобы президент организации имел наиболее высокий статус из всех
возможных? Какие понадобятся изменения, если использовать второе определение
уровня?
б. Повторить п. а, но так, чтобы президент имел по возможности наименьший статус
при допущении, что каждый член организации оказывается непосредственным или
косвенным подчиненным президента.
в. Повторить п. а и п. б в случае произвольного числа членов организации.
9. Какую интервальную размерность имеет цикл длины nZn1
10. Чему равна интервальная размерность графов, приведенных на рис. 3.45?
11. Доказать лемму, сформулированную при доказательстве теоремы 3.11.
12. Доказать теорему 3.12.
13. Привести пример (бесконтурной) сети питания (условный или реальный), граф
конкуренции которой не является интервальным. (Иначе говоря, найти бесконтурный
Рис. 3.60. Сеть питания к
упражнениям § 3.5
орграф, приводящий к не интервальному графу в случае, если конкуренция
определяется сетью питания.)
14. а. Показать, что для всех бесконтурных орграфов существует мера
трофического статуса *?>, удовлетворяющая соотношению B0).
б. Показать, что, если для орграфа D существует мера f#> удовлетворяющая B0),
то Dae содержит контуров.
15. Пусть самый длинный простой путь в бесконтурном орграфе D имеет длину к.
Показать, что существует мера трофического статуса, удовлетворяющая условию B0)
и принимающая не более к + 1 различных значений.
138
16. Если уровень определяется с использованием длины кратчайшего пути, то
величина
'?>(") = s (^?)(u): v Достижима из и},
где Л, задаваемая соотношением A9) - правдоподобная мера трофического статуса.
Показать, что для tD(u) из принятых нами аксиом выполняется лишь аксиома 4.
17. а. Показать, что, если b{G) — интервальная размерность G, то
Ь[К(п19п2,...,пр,1)] = Ь[К{пг,п2,...,пр)].
б. Показать, что, если имеется р классов, то
Ь[КB92У...,2)] = р.
в. Применить пп. а и б для доказательства того, что Ъ[К(п1, п2, ¦.., Пр)] равно
числу значений л/, превосходящих по величине 1. (Имеется в виду принятое
соглашение, что Ъ{Кр) = 0 .)
18*. Убедиться в корректности определения интервальной размерности, доказав,
что каждый граф Gen вершинами - граф пересечений семейства ящиков в л-мерном
пространстве. {Указание. Пусть JK(ujc) = [0,1] и при i Ф к имеем
1,2], если {«;,!<
Показать, что при / Ф/
{uifUj}G E{G)<=* 1к(щ)п 1к(и,)Фф для всех к.)
19. Пара ребер в графе называется независимой, если у них нет общих вершин.
Множество ребер называется независимым, если независима каждая пара ребер. Пусть
Gc - дополнительный граф к графу G. Габаи (Gabai [1974]) показал, что, если
максимальный размер множества независимых ребер Gc равен т, то b(G) < т, где b(G) -
интервальная размерность G. Более того, если (f содержит порожденный подграф,
состоящий из к независимых ребер, то Ь (G) > к.
а. Найти максимальное по мощности множество независимых ребер в Zf.
б. Найти в Zj порожденный подграф, состоящий из двух независимых ребер.
в. Применить один из результатов Габаи для доказательства того, что Ъ (Z4) < 2.
г. Применить другой результат Габаи для доказательства того, что b(Z4)> 2.
д. Применить результаты Габаи для доказательства того, что в графе G,
приведенном на рис. 3.45, b(G) < 2 nb(G) > 1. Почему из результатов Габаи не следует, что
b(G)>21
е. Применить результаты Габаи для точного вычисления b(G) в графе AT B,2,..., 2)
с р классами.
20. Один из способов определения критичности, или важности, вида s в сети
питания состоит в том, чтобы попытаться выяснить, что произойдет с сетью питания, если
этот вид удалить. Мерой важности может быть степень изменения связности сети
питания при удалении вершины, соответствующей виду s. Для этого может оказаться
полезным понятие /,/-вершины, определенной в упражнении 13 § 3.3.
а. Допуская, что в сети питания нет контуров, выяснить, какими могут быть типы
вершин при i и/ , изменяющихся от 0 до 3?
б. Можно ли предложить другие меры важности?
21. Широко распространен экологический принцип (Wilson, Bossert [1971, с. 139 и
далее]) о соответствии роста сложности экосистемы увеличению устойчивости и
уменьшению уязвимости. Бели экосистема представлена сетью питания (или графом
конкуренции), то можно предложить различные способы измерения сложности: числом
дуг или ребер, отношением числа дуг или ребер к числу вершин, средней полустепенью
исхода, средней полустепенью захода и др. Имеются также различные способы
измерения уязвимости.
а. Выяснить применимы ли понятия дуговой и вершинной уязвимости,
предложенные в п. 3.3.2 и упражнении 16 § 3.3, к сетям питания.
139
б. Для различных мер сложности и уязвимости по вашему выбору проверить
принцип, утверждающий, что сложность и уязвимость связаны обратной зависимостью
(см. упражнение 18 § 4.6).
в. Как применить понятие трофического статуса, разработанное в п. 3.5.2, к
измерению сложности сети питания?
22. Обсудить аксиомы для трофического статуса. Обоснованы ли они? Можно ли
предложить другие варианты?
23. Что является чрезмерными упрощениями в нашем изучении трофического
статуса? Как их можно было бы учесть в более сложной модели?
24. Каким образом наши результаты о трофическом статусе можно применить к
исследованию статуса в организации? Придумать примеры организаций и рассмотреть
применительно к ним меры, предложенные в этом разделе.
§ 3.6. Уборка мусора и раскраска
3.6.1. Маршруты мусоровозов. Этот параграф мы начнем с задачи выбора
маршрута, поставленной Санитарным управлением города Нью-Йорка1)
(Beltrami, Bodin [1973], Tucker [1973]). Совершенно ясно, что методы,
подобные обсуждаемым, могут применяться и к другим задачам выбора
маршрутов, например, развозки молока, воздушных линий и др.
Мусоровоз может за один день объехать ряд мест. Рейсом такой машины является
последовательность (упорядочение) пунктов, которые она посетит за
данный день, при условии, что рейс должен быть закончен в течение одного
рабочего дня.Мы хотим найти множество рейсов со следующими
свойствами.
1. Каждый пункт посещается за неделю определенное число кг раз.
2. Рейсы можно распределить среди шести дней недели (воскресенье —
нерабочий день) таким образом, чтобы (а) ни один пункт не посещался
дважды за один день 2) и (б) ни в один день число рейсов не превосходило
числа мусоровозов.
3. Общее время работы всех мусоровозов минимально.
В одном из методов, предложенном для решения этой задачи, начинают
с произвольного заданного множества рейсов и последовательно улучшают
его по критерию общего времени. (В своем настоящем виде этот метод
дает решение, близкое к минимальному по времени множеству рейсов,
однако, достигает его не всегда.) На каждом шаге для данной улучшаемой
совокупности рейсов необходимо выяснить — можно ли построить ее
разбиение, удовлетворяющее условию 2(а), т.е. распределить рейсы среди
шести дней недели так, чтобы ни один пункт не посещался дважды за день.
Таким образом, нам нужен эффективный метод проверки существования
такого разбиения, который можно было бы применять многократно.
Строгая формулировка переводит этот вопрос в задачу теории графов,
которая и будет предметом данного параграфа. (Читатель отсылается к
работам Beltrami, Bodin [1973],Tucker [1973],где рассматривается вся
задача целиком.)
Чтобы проверить существование разбиения данной совокупности рейсов,
удовлетворяющего условию 2 (а), определим граф G {граф рейсов) следую-
1) Другие интересные приложения теории графов к проблемам очистки можно
найти в работе (Tucker, Bodin [ 1975 ]).
2) Требование (а) вводится для того, чтобы мусоровоз мог объехать достаточное
число пунктов; тем самым обеспечивается вывоз большего количества мусора и не
допускается его накопление.
140
щим образом. Вершины G являются рейсами из данной совокупности и два
различных рейса соединены ребром тогда и только тогда, когда они
содержат один и тот же пункт. Тогда данная совокупность рейсов может быть
распределена между шестью днями недели так, чтобы выполнялось условие
2 (а) в том и только том случае, когда вершины V(G) можно разбить на
шесть классов, внутри которых вершины не смежны. Об этом удобно
говорить в терминах раскраски. Каждому классу разбиения сопоставляется
г 1 з G
Рис. 3.61. 3-раскрашиваемый граф
Рис. 3.62. X(G) = 3, A (G) = 4, u?(G) = 3
один из шести цветов и требуется так раскрасить вершины, чтобы никакие
две вершины одного цвета не соединялись ребром *).
В общем случае граф G называется к-раскрашиваемым, если вершины G
можно разбить на k классов, соответствующих различным цветам, таким
образом, чтобы никакие две вершины, соединенные ребром, не имели
одинакового цвета. На рис. 3.61 изображен 3-раскрашиваемый граф и
показана 3-раскраска. Он не является 2-раскрашиваемым (почему?).
Вопрос о рейсах можно теперь переформулировать следующим образом.
Является ли граф рейсов 6-раскрашиваемым?
Рассмотрим граф G. Пусть х(&) — наименьшее к такое, что граф G
&-раскрашиваем. (Всякий граф из п вершин, очевидно, А;-раскрашиваем —
для каждой вершины используется своя краска.) Число x(G) называется
хроматическим числом графа G. Разбиение совокупности рейсов,
удовлетворяющее условию 2 (а), существует тогда и только тогда, когда
хроматическое число графа рейсов меньше или равно 6. В оставшейся части этого
параграфа мы докажем ряд теорем о раскраске графов, хроматическом
числе и связанных с ними вопросах.
Вообще говоря, для применения некоторой процедуры нахождения
минимального множества рейсов, необходим алгоритм, который мог бы
быстро многократно проверять будет ли данный граф &-раскрашиваемым.
Задача о &-раскрашиваемости графа сводится к некоторой задаче из области
целочисленного программирования (Berge [1962, гл. 4]). Однако для ее
решения "хороший" алгоритм имеется не всегда. В действительности,
вообще не известно, существует ли "хороший" алгоритм определения
?-раскрашиваемости графа 2).
1) Этот подход предложен в работе Tucker [1973 ].
2) "Хороший" алгоритм (или процедура) согласно широко распространенному
взгляду, требует не более / (п) шагов, где п - размер входа (здесь п - число вершин)
141
Таким образом, задача выбора маршрута мусоровозов оказалась
сведенной к трудной математической проблеме. Однако ее постановка в точных
математических терминах выявила причины трудностей, а также
предоставила много средств для ее решения по крайней мере в специальных случаях.
Мы здесь познакомимся с рядом этих методов, рассмотрев некоторые
результаты о раскраске. Заметим, что в реальной жизненной ситуации
недостаточно сказать, что задача неразрешима или очень трудна. Представим
себе, что консультант, получающий 500 тыс. долларов, приходит к мэру
и сообщает, что после тщательного изучения он заключил, что задача о
выборе маршрутов мусоровозов очень трудна! Но маршруты ведь выбрать
необходимо. Что остается делать в такой ситуации? В ответ вы предложите
частные решения, применимые только к некоторым специальным
ситуациям, видоизмените задачу или в некоторых случаях даже "обманете".
Обманете, используя результаты, не являющиеся обязательно верными,
но которые, по-видимому, работают. Опишем их ниже.
3.6.2. Теоремы о раскраске. Первый результат о раскраске
характеризует свойства 2-раскрашиваемых графов (такие графы иногда называются
двудольными).
Теорема 3.13. (Konig [1936 с. 170]). Граф G 2-раскрашиваем тогда и
только тогда, когда он не содержит циклов нечетной длины.
Доказательство. Эта теорема следует непосредственно из
теоремы Харари, характеризующей сбалансированные знаковые графы
(теорема 3.1). Доказательство оставляется читателю (см. упражнение 21).
Теперь постараемся отыскать верхние и нижние границы для x(G). Они
будут выражены через другие численные характеристики графа. Чтобы
определить первую из них, введем обозначение 6(и) для степени вершины и,
т.е. для числа вершин, связанных с и ребром. Затем определим для графа G
величину A(G), равную максимальной из степеней 6(G) графа G.
Например, в графе G на рис. 3.62 A(G) = 4, поскольку 5 (у) = 4.
Теорема 3.14. Имеет место неравенство x(G ) < 1 + A(G ).
Доказательство. Доказательство ведется индукцией по числу
элементов в V(G), равному л. Если п = 1 результат очевиден. Пусть
вершина и в G имеет степень Д(G). Тогда Д (G - и) < Д (G), где G - и получается
из G удалением вершины и и всех ребер, содержащих и. По предположению
индукции G — и можно раскрасить в 1 + A(G) цветов. Тогда среди них
найдется один цвет, который можно использовать для м, поскольку
вершины, соединенные с м, раскрашены не более, чем в A(G) цветов.. ¦
Более сильная теорема состоит в следующем.
Теорема 3.15 (Brooks [1941]). Имеет место неравенство x(G) < 1 +
+ A(G), причем равенство достигается в том и только том случае, если G —
нечетный цикл или полный граф.
Достаточно легко убедиться, что х(^„) = 3= 1 + A(Zn) для нечетного и
= и = 1 + А(#„) для всех л. Более сложно показать, что в остальных
и /00 -¦ полином от п. Таково понятие "хорошего" алгоритма, которым мы
пользуемся. Для дальнейшего обсуждения этой идеи и, в частности, алгоритмов определения
А:-раскрашиваемости графа, читателю рекомендуется работа Кагр [1972]. (На
русский язык переведены и другие работы, например, Хопкрофт, Ульман [1979], Гэри,
Джонсон [1982]. (Примеч. пер.))
142
случаях x(G) < 1 + A(G); мы опускаем это доказательство. Теорема
Брукса (точнее ее более слабый вариант — теорема 3.14) была обобщена
следующим образом.
Теорема 3.16 (Szekeres, Wilf [1968]). Пусть функция X(G) ставит в
соответствие каждому графу G действительное число и удовлетворяет
следующим условиям:
а) если G' - порожденный подграф G, то X(G') < \(G );
6)X(G)>5(G) = min{S(w): ueV(G)} .
Тогда X(G)<1+\(G).
Доказательство. Граф Н называется критическим (по отношению
к раскраске), если х(Н-и)<х(Н) для любой вершины мвЯ. Например,
цикл Z3 является критическим графом. Бели Н — критический граф и
Х(Н) = к, то 8(и)>к - 1 для всех вершин мвЯ.В самом деле,
предположим, что б (и) < к - 1 для некоторой вершины и. Тогда Н - и
раскрашивается в к — 1 цветов, так какН — критический граф, т.е. х(Р - и) < х(Ю» Но
из (к — 1)-раскрашиваемости Н - и можно получить (к — 1)-раскраску Я,
раскрашивая и в цвет, отличный от цветов ее соседей.
Легко показать, что для всякого графа G найдется его порожденный
критический подграф Gc с тем же хроматическим числом. Пусть к = x(Gc) =
= X(G). Из наших предыдущих замечаний следует, что S(GC) > к— I.
И, наконец, используя а) и б), получаем
\(G)>\{Gc)>b(Gc)>k -1,
а значит,
Легко убедиться, что теорема 3.14 следует из теоремы 3.16. Другие
специальные случаи теоремы 3.16 рассматриваются в упражнениях 28,
а также 9 § 4.2.
Второй численной характеристикой, сопоставляемой графу, которую
мы рассмотрим, является плотность, т.е. число вершин в наибольшей
клике графа *) G, обозначаемое символом co(GJ). Для графа на рис. 3.62
co(G) = 3, поскольку наибольшая клика есть треугольник.
Теорема 3.17. Имеет место неравенство x(G ) > co(G ).
Доказательство. Каждая вершина клики должна получить свой
цвет."
На рис. 3.63 приведен граф G9 у которого хроматическое число x(G)
больше плотности со( G ) (х( G ) = 4 и cj(G ) = 3).
Графы, у которых х(^) = ^(G), называются слабо у-совершейными 3).
Если x(G') = co(G') для всех порожденных подграфов G' в G, то G называ-
1) Напомним, что кликой графа G является его подграф», в котором все вершины
соединены ребрами.
2) В оригинале "clique number" ("кликовое число"). Мы пользуемся термином
из книги Зыкова [1969]. (Примеч. пер.)
3) Символ 7 используется потому, что в литературе y(G) часто обозначает мини*
мальное число независимых множеств (вершин)/ покрывающих все вершины <7:
143
ется ^-совершенным. Для слабо 7-совершенных и ^-совершенных графов
хроматическое число можно найти путем подсчета числа вершин в
наибольшей клике. Ниже мы увидим, как это.используется при решении задачи
выбора маршрутов мусоровозов. Более подробное рассмотрение
7-совершенных графов можно найти в книге Berge [1973,гл. 16]. Как показывает
следующая теорема, с рядом у-совершенных графов, мы уже встречались
в этой главе.
Теорема 3.18 (Berge [1967]). Следующие классы графов являются
7-совершенными:
а. Двудольные графы.
б. Транзитивно ориентируемые графы *).
в. Графы интервалов.
Доказательство. Порожденный подграф графа, входящего в один
из этих классов, также принадлежит данному классу. (Почему?) Этого
достаточно, чтобы доказать, что х = <^ для самого G.
а. Применим теорему Кенига (теорему 3.13). Бели G — двудольный граф,
то либо х = 2, либо х = 1. (Один из этих классов в G может быть пуст.)
Рис. 3.63. x(G)>cj(G)
Бели х = 1, то в максимальной клике содержится один элемент.'Бсли х= 2,
то имеется ребро, соединяющее элементы разных классов, и поэтому есть
клика, состоящая из двух элементов. Большей клики быть не может.
б. Пусть А - ориентация транзитивно ориентируемого графа G(F, E).
Для любой вершины и € V обозначим через /(м) - длину самого длинного
простого пути, начинающегося в и. Число /(и) полагается равным 0, если
такого простого пути нет. Пусть тах/(м) = ? — 1ииьИ2,••.,«*- простой
путь длины к — 1 в (V, А). Из транзитивности А следует, что (и/, м/) ? А
для всех / </. Таким образом, вершины {i*i, иг,..., и* } образуют в G
клику. Отсюда заключаем, что oj(G)>k.
Раскрасим теперь G в к цветов, пронумерованных числами 0,1,2,...
..., к — 1, приписывая / (м) вершине и. Чтобы показать возможность такой
раскраски предположим, что {ut v} €E(G). Тогда из (и, v)GA следует, что
f(u)>f(v). В самом деле, если у, Vi,..., vr — самый длинный простой
путь, начинающийся в и, то и, и, vx,..., vr - более длинный простой путь,
начинающийся в и. (Это непосредственно ясно из того, что и Ф и, для всех /,
так как в противном случае из транзитивности А следует, что (и, и) ЕА и
орграф А не был бы ориентацией.) Аналогично, если (и, u) GA, то f(v) >
>f(u). Таким образом,/(м) ?=f(v). Отсюда заключаем, что x(G )<k.
множество вершин U называется независимым, если в G нет ребер, соединяющих
вершины из U. Легко доказать, что y(G) = x(G).
!) Конечно, всякий двудольный граф транзитивно ориентируем. (Почему?)
Таким образом, из п. б. следует п. а.
144
Итак, имеем что к ^ cj(G) < x(G)<k; поэтому co(G) =
в. См. упражнения 29 и 30. ¦
Было высказано предположение, что граф G 7-совершенный тогда и
только тогда, когда ни в G ни в Gc цикл Zn(n>3 нечетное) не служит
порожденным подграфом. Это предположение, подтвержденное многими
данными, известно как сильная гипотеза о совершенных графах и принадлежит
Клоду Бержу. Если считать ее правильной, то существует значительно более
совершенный способ проверки ?-раскрашиваемое™ в задаче составления
графика вывоза мусора. Чтобы определить достаточно быстро, является ли
данный граф рейсов 6-раскрашиваемым, проверим сначала содержат ли G
или Gc нечетный цикл длиной более 3. При положительном ответе
воспользуемся прежним неэффективным алгоритмом для определения 6-рас-
крашиваемости G. В противном случае применим сильную гипотезу о
совершенных графах и выясним, является ли G, 6-раскрашиваемым,
убеждаясь в существовании или отсутствии клики размером больше 6. Таккер
(Tucker [1973]) показал, что если в алгоритме для составления графика
движения мусоровозов, использовать такую проверку 6-раскрашиваемости,
он станет работать намного быстрей 1 )•
При использовании такого способа потребитель оказывается в ложном
положении — он применяет результаты, справедливость которых не
установлена. Что в этом случае является для него наихудшим? Конечно
окончательное множество рейсов, полученное в конце всей процедуры, может не
допускать разбиение на 6 дней. Однако потребитель всегда может проверить
данное условие независимо на конечном этапе процедуры лишь для этого
единственного множества рейсов, получив большую экономию во времени,
так как проверка 6-раскрашиваемости должно повторяться неоднократно.
Если конечное множество рейсов 6-раскрашиваемое, потребитель истратит
зря немного машинного времени, но в качестве "побочного продукта"
обнаружит пример, противоречащий сильной гипотезе о совершенных графах
и, значит, решит нерешенную до сих пор математическую задачу!
3.6.3. Проблема четырех красок. Понятие раскраски графа имеет
исторический интерес отчасти из-за связи со знаменитой проблемой четырех
красок. Мы обсудим эту проблему по историческим причинам, а также для
того, чтобы продемонстрировать, насколько трудными могут оказаться
вопросы раскраски графа.
Предположим у нас имеется карта, например, такая, как изображено
на рис. 3.64. Страны, обозначенные на карте, должны быть раскрашены
таким образом, чтобы две страны, имеющие общую границу (отличную от
одной точки), получили разные цвета. Раскраска карты показана на том же
*) Процедура Таккера эффективна только в том случае, если имеется хороший
алгоритм проверки существования в графе клики размером к. Вообще говоря, такого
алгоритма пока нет и неизвестно существует ли он вообще. Однако в задаче о выборе
маршрута мусоровозов проверка 6-раскрашиваемости производится последовательно
в графах, которые изменялись лишь локально, т.е. посредством изменений вблизи
данной вершины. После того, как в графе, для которого известны хроматическое
число и плотность, проведено локальное изменение, определение хроматического
числа требует проверки всего графа, тогда как для нахождения плотности этого не
надо. Таким образом, проверка раскрашиваемости с использованием плотности
становится в данном случае эффективной процедурой.
10. Ф.С. Роберте 145
Рис. 3.64. Карта стран 1-13 раскрашена в 4 цвета: красный (/?), белый (W), синий
(В) и зеленый (G)
Рис. 3.65. Граф, полученный из карты, изображенной на рис. 3.64
рисунке; используется четыре цвета. Следующий вопрос был, по-видимому,
впервые задан в 1852 г. в письме профессора Аугустуса де Моргана сэру
Уильяму Ровену Гамильтону: "Можно ли всякую карту раскрасить не
более, чем четырьмя цветами?"
Никто не доказал, что это всегда можно сделать и никто не нашел карту,
которую нельзя было бы раскрасить таким образом, если для нее
выполнены простые допущения: границы стран являются гладкими кривыми,
страны не разбиваются на отдельные части и т.д. Наиболее полное
обсуждение знаменитой задачи о четырех красках можно найти в книге Ore [1967].
Эта проблема формулируется как задача теории графов следующим
образом. Поместим по вершине в центре каждой страны и проведем между
двумя вершинами ребро в том и только в том случае, если их страны
имеют общую границу. На рис. 3.65 построен такой граф для карты,
изображенной на рис. 3.64; он сначала нарисован на карте, а затем показан
отдельно. 4-цветная раскраска карты эквивалентна 4-цветной раскраске вершин
146
этого графа, в которой смежные вершины получают различные цвета.
Таким образом, проблему четырех красок можно переформулировать
следующим образом: можно считать любой граф, возникающий из карты,
4-раскрашиваемым?
Еще один важный вопрос можно сформулировать так: какие графы
получаются из карт указанным выше построением? Мы видим, что граф,
показанный на рис. 3.65, начерчен без пересекающихся ребер (в точках,
отличных от вершин). Граф, который можно так нарисовать, называется
планарным. Например, граф ^B, 2) на рис. 3.57 пленарный, хотя он и
нарисован с пересекающимися ребрами. Его легко перерисовать так, чтобы
ребра не пересекались. Планарные графы важны в теории электрических
сетей, при проектировании печатных схем. Схема может быть нанесена на
одной стороне платы с проводниками, пересекающимися только в местах
соединения,тогда и только тогда, когда она определяет планарный граф.
Не слишком сложно показать, что для описанного способа построения
из карт получаются только планарные графы. Таким образом, задача о
четырех красках сводится к следующей проблеме теории графов: является
ли всякий планарный граф 4-раскрашиваемым? (Известно, что каждый
планарный граф раскрашивается пятью цветами. Доказательство этого
результата можно найти в книге Харари [1973, с. 155].)
Для понимания вопроса о раскраске планарных графов полезно уметь
определять, какие графы планарны. Одним замечательным непланарным
графом служит полный двудольный граф КC9 3) — граф "вода - свет -
газ" (см. рис. 3.57). Имеется три дома и три вида коммунальных услуг:
Рис. 3.66. Граф G\ получается из графа G/
подразбиением ребра е
Рйс. 3.67. Графы G и С гомеоморфны, поскольку
оба получены подразбиением из графа Н
Н
10*
147
водоснабжение, освещение, снабжение газом и задача состоит в том, чтобы
источники услуг связать с каждым домом без пересечений коммуникаций
(соединяющих ребер). Второй известный непланарный граф - полный
граф1), содержащий пять вершин - К5 (граф К4 планарен). Согласно
знаменитой теореме Куратовского (Kuratowski [1930]) только графы if C,3) и
К5 по существу являются единственными непланарными графами. Для
точной формулировки этого результата, введем новые определения. Будем
говорить, что граф G' получен из графа G подразбиением, если на некотором
ребре G добавлены вершины. (Добавленная вершина может находиться
Рис. 3.68. Граф G гомеоморфен графу Kt, а в графе G* есть подграф Я, гомеоморф-
ныйграфу/С C,3)
только на одном ребре.) На рис. 3.66 граф G't всегда образуется из графа
Gt путем подразбиения. Два графа G и G' называются гомеоморфными,
если каждый из них можно получить из одного графа Н
последовательностью подразбиений ребер. Например, гомеоморфны любые две простые
цепи. На рис. 3.67 приведены два графа G vlG\ полученные из графа Н
последовательностью подразбиений. Таким образом, графы G и G'
гомеоморфны (и, конечно, гомеоморфны графу Я).
Теорема 3.19 (Kuratowski [1930]) 2).. Граф планарен тогда и только
тогда, когда у него нет подграфов, гомеоморфных К$ и К C,3).
Читателям, интересующимся доказательством этой теоремы, мы
рекомендуем книгу Харари [1973, с. 133]. Согласно теореме Куратовского,
граф G на рис. 3.68 не планарен потому, что он гомеоморфен К5, а граф G'
не планарен потому, что его подграф Я гомеоморфен К C,3).
В итоге проблема четырех красок оказалась сведенной к вопросу о
4-раскрашиваемости всякого графа без подграфов, гомеоморфных К5 и
КC, 3). И на этот вопрос, несмотря на огромную работу, продолжающуюся
и в настоящее время, еще нет ответа 3).
1) В полном графе все пары вершин соединены реорами.
2) Обычно эту теорему называют теоремой Понтрягина - Куратовского. Л.С. Понт-
рягин доказал (но не опубликовал) критерий планарности еще в 1927 г. (Примеч. пер.)
3) Проблема четырех красок была положительно решена в 1976 г. (Appel, Haken
[1977]). (Примеч. пер.)
148
Упражнения
1. Рассмотреть следующие четыре рейса мусоровозов в Западной части города
Нью-Йорка. Рейс 1 включает пункты, расположенные на улицах с 21-й по 30-ю, рейс 2 -
с 28-й по 40-ю рейс 3 - с 35-й по 50-ю и рейс 4 - с 80-й по 110-ю. Нарисовать
соответствующий граф рейсов.
2. Можно ли в упражнении 1 спланировать каждый рейс, в понедельник или
вторник таким образом, чтобы ни один пункт не посещался дважды в один день?
3. Для каждого графа на рис. 3.69 определить является ли он 3-раскрашиваемым.
4. Для каждого графа на рис. 3.69 определить его хроматическое число x(G) •
5. В местном зоопарке хотели бы, чтобы посещение посетителей совпадало по
времени с кормлением животных и предлагают следующие маршруты экскурсий.
Экскурсия 1 - посещение львов, слонов и страусов, экскурсия 2 - посещение обезьян, птиц
и оленей, экскурсия 3 — посещение слонов, зебр и жирафов, экскурсия 4 - посещение
птиц, пресмыкающихся и медведей, экскурсия 5 - посещение кенгуру, обезьян и
тюленей. Можно ли спланировать эти экскурсии, используя лишь понедельник,
вторник и среду, если животные не должны получать пищу более одного раза в день?
6. Рассматривались (тайком от мэра) следующие рейсы мусоровозов в городе
Нью-Йорке. Рейс 1 - здания Эмпайер Стейт Билдинг, Медисон Сквер Гарден и
Пристань 42 на набережной Гудзона, рейс 2 - Гринвич Виледж, Пристань 42, Эмпайер Стейт
и Метрополитен опера, рейс 3 — стадион Шиаи Бруклинский ботанический сад, рейс4 —
статуя Свободы и Пристань 42, рейс 5 - статуя Свободы, Нью-йоркская фондовая
биржа и Эмпайер Стейт, рейс 6 — стадион Шиа, Янки-стадион и Зоопарк в Бронксе,
в г
Рис. 3.69. Графы к упражнениям § 3.6
Рис. 3-70. Карта к упражнениям § 3.6
149
рейс 7 - Нью-йоркская фондовая биржа, Колумбийский университет и зоопарк в
Бронксе. Считая, что мусоросборщик отказывается работать более д-рех дней в
неделю, можно ли предложить такое разбиение этих рейсов, чтобы ни один пункт не
посещался более одного раза в день?
7. Для каких графов G на рис. 3.69 имеет место x(G) = 1 + A (G) ?
8. Для каких графов G на рис. 3.69 имеет место \(G) = a>(G) ?
9. Показать, что, если a>(G) >ЪУ то G — не двудольный граф (не
2-раскрашиваемый).
10. Привести пример графа Gen вершинами, для которого х (G)= 2.
11. Привести пример графа Gen вершинами, для которого х (G) = п.
12. Какой из графов Glt G2, G3 на рис. 3.66 слабо т-совершенный? Какой
т-совершенный?
13. Раскрасить карту на рис. 3.70 не более, чем четырьмя цветами. Можно ли ее
раскрасить меньшим числом цветов?
14. Перевести карту на рис. 3.70 в граф G и вычислить \(G).
15. Является ли граф К D,4) планарным?
16. Можно ли полный граф К6, включающий 6 вершин, получить из карты?
17. Можно ли Кг получить из К2 подразбиением?
18. Гомеоморфны ли графы К% и Кг ?
19. Какие графы на рис. 3.69 планарны?
20. Привести пример графа G, для которого x(G) < 1 + A (G).
21. Показать, как доказать теорему Кенига, используя теорему Харари о балансе?
22. Граф G называется k-реберно-раскрашиваемым, если можно раскрасить его
ребра к цветами так, что два ребра, имеющие общую вершину, окажутся
разноцветными. Пусть x\G) - реберное хроматическое число, т.е. наименьшее к, при котором
граф G /г-реберно-раскрашиваем. Установить связь между A (G) их '(G) •
23*. Множество вершин в графе G независимог если в нем любые две вершины не
соединены ребром. Число вершинной независимости /3О(<7) равно мощности наиболь
шего независимого множества вершин. Если G имеет п вершин, показать, что
24. Граф G называется к-критическим, если \(G) =k, но x(G -и) < к для любой
вершиным€ V(G).
а. Найти все 2-критические графы.
б. Привести пример 3-критического графа.
в. Можно ли определить все 3-критические графы?
25. Граф называется однозначно к-раскрашиваемым, если любая раскраска вершин
в к цветов порождает единственное разбиение вершин на множество разных цветов.
Рис. 3.71. Граф Gj, допускающий
однозначное раскрашивание тремя красками
Например, граф на рис. 3.71 однозначно 3-раскрашиваем, потому что всякая
3-раскраска порождает разбиение {1}, { 2}, { 3}.
а. Является ли граф G2 на рис. 3.71 однозначно 3-раскрашиваемым? Почему?
б. Пусть 6(G) равно min6(w) по всем вершинам и в графе G. Если G однозначно
fc-раскрашиваемо, верно ли, что'б (G) > к - 1? (Привести доказательство или
противоречащий пример.)
26. Вспомнить определение дерева (см. упражнение 22 § 2.2). Чему равно
наибольшее возможное хроматическое число дерева?
27. Привести пример слабо 7-сов ер шейного графа, не являющегося 7-совершенным
150
28. Пусть \ (G) = max б (G'), где G' - порожденный подграф G, а б (С) = min{6 («):
а. Доказать, что x(G) < 1 +
б. Привести пример, графа G, в котором \(G) < A(G); это означает, что оценка
в п. а точнее полученной в теореме 3.14.
29. Ловатц (Lovasz [1972]) доказал так называемую слабую гипотезу о
совершенных графах: граф G 7-сов ершенный тогда и только тогда, когда Gc 7-совершенный.
Доказать, что отсюда следует теорема 3.18в.
30. Здесь приводится схема непосредственного доказательства теоремы 3.18 в.
а. Множеством сочленения связного графа G называется множество вершин,
удаление которых делает G несвязным. (Сравнить с определением точки сочленения в
упражнении 4 § 3.3.) Найти минимальное множество сочленения в графах на рис, 3.69.
б*. (Hajnal, Suranyi [1958]). Вспомнить определение жестко-циклического графа
из упражнения 25 § 3.4. Показать, что любое минимальное множество сочленения
в связном жесткочшклическом графе является кликой.
в*. Пусть U — множество сочленения в связном графе G, Kt, К2, ,.., Кг —
компоненты связности в графе G - U, т.е. подграфе, порожденном множеством вершин
V (G)\ U,&Gf- подграф, порожденный вершинами из U и Я/. Показать, что если U -
клика и каждый G/ - слабо т-совершенный граф, то и G слабо 7-совершенный граф.
г. Показать, что всякий жестко-циклический граф 7-совершенный.
д. Показать, что любой граф интервалов 7-совершенный.
31. Показать, что, если G - критический граф (см. доказательство теоремы 3.16),
то ни одно множество сочленения G не является кликой.
32. Как понятие раскрашиваемости применить к задаче составления расписания
использования аудиторий из упражнения 28 § 3.4?
Глава 4
ВЗВЕШЕННЫЕ ОРГРАФЫ И ИМПУЛЬСНЫЕ ПРОЦЕССЫ
§ 4.1. Введение. Энергетические проблемы и другие приложения
Мы видели ( § 3.1), что плодотворные приложения теории графов к
социологии малых групп возникают при введении знаковых графов или
знаковых орграфов, получающихся добавлением знака каждому ребру графа или
каждой дуге орграфа. В таком орграфе вершины соответствуют членам
группы, из вершины и в вершину v проводится дуга, если наблюдается
отчетливо выраженное отношение и к и, причем дуга (и, v) имеет знак
плюс, если и симпатизирует v и знак минус в противном случае. На рис. 4.
приведен пример знакового орграфа.
Понятие знакового орграфа имеет многочисленные приложения
различного типа, причем вершины, дуги и знаки интерпретируются несколько
Г" ftic. 4.1. Знаковый орграф
иначе, чем в § 3.1. В этой главе будет дана некоторая новая интерпретация
знаковых графов и применены полученные результаты. Конкретнее мы
сконцентрируем свое внимание на проблемах "энергетического кризиса"
и постараемся проследить возможности использования знаковых орграфов
для выявления резких скачков в спросе на энергию, дня предсказания
будущих потребностей в энергии, уровней загрязнения окружающей среды
от использования различных источников энергии и т.п. Будут рассмотрены
возможности применения знаковых графов для прогноза влияния
появления новых технологий или социальных изменений на потребление энергии,
определения общей политики и стратегии воздействия на рост
использования энергии для учета различных экологических ограничений, связанных с
растущим потреблением энергетических ресурсов. (Мы обсудим эти
применения знаковых орграфов более детально в конце § 4.3.)
Методы, аналогичные рассматриваемым в этой главе, использовались для
исследования самых разнообразных вопросов. Среди них отметим такие:
как следует тратить деньги при поездках в метрополитене г. Ванкувера
(Капе [1972]), как правительству определить уровень ассигнований на
научные исследования (Организация экономического сотрудничества и
развития [1974]), как распределять средства для развития системы
здравоохранения (Kane et al. [1972]), каким может быть влияние глубоководных
портов на использование нефтяных танкеров (Kruzic [1973a]), каков
эффект возрастающего применения каменного угля в качестве источника
энергии при внутренних водных перевозках (Antle, Johnson [1973]),
152
как принимать решения о личном составе морского флота (Kruzic [1973b])
и т.д.? (см. также Coady et al. [1973]). Мы будем касаться этих приложений
как в основном тексте, так и в упражнениях. В них также указаны
возможные применения знаковых графов для анализа простых экологических
систем.
Значительная часть теоретических вопросов развивается в рамках более
общей, чем знаковый орграф, модели. В качестве такого объекта
рассматривается взвешенный орграф, т.е. орграф, каждой дуге (м, v) которого
приписано действительное число или вес w(u, v). Вес может быть
положительным, отрицательным или нулевым. Обычно, изображая взвешенный
0,2
+1
-\
ш
Рис. 4.2. Примеры взвешенных орграфов
орграф, проводим только дуги с ненулевыми весами. Взвешенный орграф,
в котором все веса w(w, v) принимают целочисленные значения, называется
целочисленно-взвешенным. Таким образом, вякий знаковый орграф можно
представить целочисленно«взвешенным орграфом с весами w(w, и) = 1,
если (и, v) имеет знак плюс и w(w, v) = — 1, если (и, v) имеет знак минус.
На рис. 4.2 изображено несколько взвешенных орграфов. Веса написаны
около дуг. ZL служит знаковым орграфом, поскольку все его веса равны
1 или —1. Большинство понятий, введенных для орграфов в гл. 2 и 3,
применимо и к знаковым или взвешенным орграфам. Так, например,
такие понятия, связанные со свойствами достижимости и соединимости,
как путь, простой путь, контур, полупуть, простой полупуть и полуконтур
определяются, как и прежде. Понятия сильной, односторонней и слабой
связности также остается прежним. Когда мы говорим о весах в
подграфах взвешенного орграфа, то имеем в виду (если не оговорено противное)
веса исходного взвешенного орграфа. В случае знакового орграфа будем
продолжать употреблять часть новой терминологии, введенной в §3.1.
Знак пути, замкнутого пути, контура и тд. есть произведение знаков его
дуг, если в произведении знак плюс заменяется на +1, знак минус — на — 1.
Таким образом, путь, замкнутый путь, контур и тд. положительны, если
не содержат вообще или содержат четное число отрицательных ребер, и
отрицательны в противном случае. В знаковом орграфе на рис. 4.1 путь и,
и>, х, и имеет знак минус, а контур, и v, w, xy и — знак плюс. Знак
тривиального (вырожденного) пути и не определен и мы исключаем из
рассмотрения такой путь, когда говорим о знаках пути.
В этой главе будут допускаться петли, т.е. дуги, ведущие из вершины в
саму себя. Например, в орграфе D2 на рис. 4.2 дуга (м, и) является петлей.
Петля может входить в пути, контуры, полупути и т.д. В частности, петлю
можно рассматривать, как контур или полуконтур длины 1. В качестве
153
примеров приведем путь w, и, и, и и полупуть и, (м, и), и, (и, и), v в
орграфе />2 на рис. 4.2. Подграфы также могут включать петли, а порожденный
подграф и орграфа D содержит петлю (и, и) тогда и только тогда, когда
она имеется в D и и служит вершиной D'. Орграф с петлями сильно,
односторонне или слабо связен тогда и только тогда, когда этим свойством
обладает соответствующий орграф без петель. В заключение заметим, что
сильные компоненты орграфа являются порожденными подграфами и
поэтому включают петли, присутствовавшие в D.
В этой главе мы более подробно рассмотрим применения знаковых
и взвешенных орграфов к такой важной для современного общества
проблеме, как энергетический кризис. Чтобы не прерывать в дальнейшем
изложение, начнем следующий параграф некоторым математическим введением.
Упражнения
1. Определить знак путей м, v,w,xk х, щ vf w в знаковом орграфе на рис. 4.1
2. Указать путь длины 2 из ив и во взвешенном орграфе D3 на рис, 4.2.
3. Найти все сильные компоненты в каждом из взвешенных орграфов,
изображенных на рис. 4.2.
§ 4.2. Некоторые сведения о собственных значениях
В этом параграфе будут изложены некоторые результаты о собственных
векторах и собственных значениях, которые потребуются при применении
знаковых и взвешенных орграфов. Будет введено, также понятие
собственного значения взвешенного орграфа и показано как можно использовать
взвешенные орграфы при вычислении собственных значений матриц. Для
ознакомления с доказательствами известных результатов, которые мы
сформулируем, читателю рекомендуются любые учебники по линейной
алгебре (например, Мальцев [1963]).
Пусть М — квадратная (я X п) -матрица действительных чисел. Ненулевой
TV-мерный вектор-строка U называется собственным (характеристическим)
вектором, если для некоторого скалярного X выполняется соотношение
UM = \U. Число X называется собственным значением, соответствующим
вектору Uf и может принимать как действительное, так и комплексное
значение. Например, если
(оз) и ^=A,0),
то
UM= B,0) =2U
и, значит, U — собственный вектор для М с собственным значением,
равным 2. Перейдем теперь к вопросу о нахождении собственных значений.
Пусть deti4 обозначает определитель матрицы А, а / — единичная
матрица.
Теорема 4.1. X является собственным значением (п X п) -матрицы М
тогда и только тогда, когда
det(M-X/)=0.
Определитель det(Af — X7) равен сумме произведений элементов по
одному из каждой строки и каждого столбца, причем каждое слагаемое
154
входит с соответствующим знаком* В результате получается выражение,
являющееся многочленом по X. Этот многочлен называется
характеристическим многочленом матрицы М и обозначается См(X) или просто С(Х).
Поскольку СМ(Х) - многочлен, найдутся такие числа а0, ах, ,.., аПУ что
Из определения определителя легко увидеть, что единственную
возможность для получения члена, содержащего X", дает произведение
диагональных элементов (тп — X) (т22 — X) ... (тт — X) матрицы М — XL Таким
образом, коэффициент ап всегда равен ± 1, точнее (-1) п.
Из теоремы 4,1 следует, что собственные значения матрицы М в точности
совпадают с корнями, характеристического многочлена, т.е. являются
такими числами X, которые удовлетворяют уравнению
0. A)
Уравнение A) называется характеристическим уравнением матрицы М.
Если некоторое собственное значение оказывается кратным корнем для
?м(Х), что и будет встречаться в ряде наших приложений, то количество
одинаковых собственных значений совпадает с его кратностью.
Для иллюстрации изложенных сведений рассмотрим матрицу
/7 -3 0\
М=\ 11-7 D I. B)
\0 5 1/
Матрицам — X/ имеет вид
G-Х -3
11 -7 -X
О 5
Тогда получаем
CM(X) = det(M-X/) = -X3 +X2 + 16Х-16.
Этот многочлен разлагается на множители
Таким образом, собственные значения матрицы М равны 1,4, —4.
Найдем теперь собственный вектор, соответствующий собственному
значению 4. Предположим, что U= (гь г2, г3) и есть такой собственный
вектор. Имеем UM- 4U, откуда получаем три уравнения:
1гх +11г2=4г1,
-3r1-7r2+5r3=4r2,
Гъ =4г3.
Решениями этих уравнений будут все векторы, записываемые в виде
(х, -3/11х, 0). Поскольку собственный вектор по определению
ненулевой, х должен быть отличен от нуля. Таким образом, собственные векторы,
соответствующие собственному значению 4,представимыв виде всевозмож-
155
ных произведений вектора U\ = A, —3/11, 0) на числа, отличные от нуля.
Аналогично можно определить, что собственные векторы,
соответствующие собственным значениям -4 и 1, получаются путем умножения на
произвольные ненулевые числа соответственно векторов A, —1, 0) и
(-11/3,2,1).
В качестве второго примера рассмотрим матрицу
1 0 0
Характеристический многочлен матрицы М представим в виде
произведения сомножителей
Следовательно, собственными значениями матрицы М являются 1 и 2,
причем 1 имеет кратность два. (Вообще, если М - диагональная матрица,
т.е. все ее внедиагональные элементы равны 0, то собственные значения
матрицы М совпадают с диагональными элементами, как и было в этом
примере.)
В третьем примереМ = ( ). Тогда См (X) = X2 + 1 = (X + /) (X - i),
и поэтому собственные значения равны комплексным числам г и —/.
Наконец, необходимо заметить, что если М — одноэлементная матрица
М = (Г), то Qf(X) = t — X, и поэтому t единственное собственное значение
дляМ.
В дальнейшем будем интересоваться собственными числами
взвешенного орграфа D, Для большей строгости обозначим вершины орграфа D
Рис. 4.3. Взвешенный орграф, матрицей
смежности которого служит матрица
М из B)
через их, и2, ..., ип и определим матрицу смежности A (D) = (д#),
полагая ац =и>(м1-, Uj). (С этого момента мы считаем w(u, v) =0, если дуга
(м, v) отсутствует.) Будем называть собственные значения матрицы А
собственными значениями взвешенного орграфа D, Таким образом,
взвешенный орграф D изображенный на рис. 4.3, имеет собственные значения 1,
4 и —4, так как его матрица смежности совпадает с матрицей М в B).
Докажем весьма полезную теорему о собственных значениях
взвешенного орграфа, которая поможет свести вычисление его собственных
значений к аналогичной задаче для меньших орграфов. В свою очередь, эта теоре-:
ма может применяться и для нахождения собственных значений заданной
матрицы Му что осуществляется построением орграфа D, имеющего М
156
своей матрицей смежности. Вершины D соответствуют строкам М} а из
строки 1 в строку / идет дуга тогда и только тогда, когда тц Ф О, причем
вес этой дуги равен т^. D называется орграфом Коатса матрицы М (Chen
[1971]). В теореме под сильной компонентой взвешенного орграфа
понимается сильная компонента соответствующего орграфа.
Теорема 4.2. (Нагагу [1959]). Множество собственных значений
взвешенного орграфа является объединением множеств собственных значений
его сильных компонент *),
Доказательство. Мы докажем, что характеристический
многочлен матрицы смежности взвешенного орграфа есть произведение
характеристических многочленов матриц смежности его сильных компонент.
Если рассматриваемый орграф состоит из одной сильной компоненты,
то доказательства не требуется. Проведем индукцию по числу сильных
компонент. Предположим, что теорема уже доказана для всех взвешенных
орграфов, имеющих с сильных компонент, и пусть А — матрица смежности
взвешенного орграфа/), у которого есть с + 1 сильных компонент. Выберем
в D сильную компоненту Кх, которой в конденсации D* орграфа D
соответствует вершина К* без входящих дуг. (По теореме 2.7 и следствию
из теоремы 2.8 такая компонента К\ существует.) Взвешенный орграф,
порожденный вершинами орграфа D, не вошедшими в Кх, обозначим К2.
Если перенумеровать вершины орграфа D таким образом, чтобы
множеством вершин орграфов Кх и К2 были соответственно {1,2,...,/*} и {г + 1,
г + 2,..., m } , то матрицу А можно представить в виде
}г
О
где (m-r) X г-подматрица в левом нижнем углу состоит из нулей, A х -
матрица смежности К\ и А2 — матрица смежности К2, Из элементарных
свойств определителей следует, что
det {А - X/) = det {А х - X/) det (А2 - X/),
а это означает, что характеристический многочлен матрицы А равен
произведению характеристических многочленов матриц Ах пА2. Но ш
предположению индукции характеристический многочлен матрицы А2 есть
произведение характеристических многочленов матриц смежности сильных
компонент орграфа К2 9 что и завершает доказательство. ¦
Поскольку характеристический многочлен взвешенного орграфа
полностью определяется характеристическими многочленами его сильных
компонент, он не несет информации о том, как отдельные сильные
компоненты связаны друг с другом (т.е. ничего не говорит о структуре
конденсации) .
Когда существенна кратность собственных значений, теорему необходимо уточ-
, добавив, что в объединении учитывается кратность, т.е. собственное значение
выписывается число раз, равное его кратности.
157
Следствие 1. Множество собственных значений матрицы М является
объединением множеств собственных значений подматриц,
соответствующих сильным компонентам ее орграфа Коатса1).
Следствие 2. Характеристический многочлен матрицы смежности
взвешенного орграфа равен произведению характеристических многочленов
матриц смежности его сильных компонент.
Доказательство следует из доказательства теоремы.
Для иллюстрации следствия 1 рассмотрим матрицу
/01000
-30000
0 5 8 -2 0 |. C)
0 0 0 0 1
\0 0 0-1 0i
Орграф Коатса матрицы М изображен на рис. 4.4. Там же указаны сильные
8
Сильная компонента к А (К)
Рис. 4.4. Орграф Коатса матрицы М из C), его сильные компоненты и их матрицы
смежности
компоненты Ki9K2 и Къ этого орграфа вместе с их матрицами смежности.
Не составляет труда показать, что собственными значениями Ki9K2 и К3
являются соответственно { iy/J, — iy/З), (8), (f, — /}. Такий образом, М
имеет собственные значения ±i \/T, 8, *i.
Упражнения
1. Определить все собственные значения матрицы М:
СО-
2. Выписать матрицу смежности для взвешенных орграфов, изображенных на
рис. 4.2.
3. Построить взвешенный орграф с матрицей смежности
1 5 2
А = | 0 0-1
-1 0 -1
4. Для взвешенных орграфов, изображенных на рис. 4.5, определить собственные
значения.
0 Как и ранее, если существенна кратность, необходимо считать, что в
объединение множеств собственные значения входят со своими кратностями.
158
о
2
a
У U2
Рис. 4.5. Взвешенные орграфы к упражнению 4 § 4.2
5. Определить, используя теорему 4.2, собственные значения для следующих
матриц.
/1 1 0 0 0\
10 0 0
я.М-
б.М-
[1
[0 0 0 1
1о о 1 о
|о оо о
(з о о о о о о\
3 0 0 0 0 0 0
0 0 0 10 0 0
0 0 0 0 1
0 0 10 0
о о
о о
0 0 0 0 0 0
W 0 0 0 0 2
/3 О О О О О О О Д
00010000 о\
О О
о о
О 1
о о
о о
\ о о
\з о
1 О О
О 0 1
0 0 0
0 0 0
10 0 0
0 0 0 1
0 0 0 0
1 О О
0 0 0
0 0 0
0 1 О
1 О
о о
о о
•
6. Определить собственные значения и соответствующие им собственные векторы
для следующих матриц М:
/2 О 04
а.АГ=1 1 1 О J;
V 1 1 3 У
6.Af =
7. Филлипс (Phillips [1967]) предложил измерять степень баланса в малой группе
(см. упражнения 21-26 §3.1) абсолютной величиной наибольшего (по абсолютной
величине) собственного значения соответствующего знакового графа.
а. Определить эту меру баланса для знаковых графов, изображенных на рис. 3.2,
заменяя в них ребро двумя противоположно направленными дугами.
Прокомментировать результаты.
б. Исследовать эту меру на примере других знаковых графов.
159
8. Доказать, чш, если взвешенный орграф не имеет контуров, то все его
собственные значения равны 0. {Указание. Рассмотреть сильные компоненты).
{Замечание. Петля считается контуром. Обратное утверждение приводится в
упражнении 28 § 4.5.)
9. Всякая неотрицательная матрица имеет действительное собственное значение.
Пусть Хтах 04) - наибольшее действительное собственное значение неотрицательной
матрицы Л. Теория Перрона— Фробени уса утверждает, что
min S{ < ^max < maxS/,
i /
где Si - сумма элементов в Л по строке /,
Более того, если ац > Ъц для всех /, / и А > О, В > О, то \тах {А) > Хтах (#)•
Пусть А - матрица смежности графа G, т.е. матрица, элемент а$ которой равен 1
тогда и только тогда, когда между вершинами щ и му имеется ребро, и 0 в
противном случае. Уилф (Wilf [1961]) доказал, что хроматическое число x(G) графа G
удовлетворяет неравенству x{G) < 1 + *тах04), причем равенство возможно тогда
и только тогда, когда G - нечетный цикл или полный граф. Это упражнение
посвящено рассмотрению теоремы Уилфа.
а. Показать, что ^maxC4) < A(G), так что оценка Уилфа для хроматического
числа по меньшей мере, столь же хороша, что и оценка Брукса (теорема 3.15).
б. Если G=K(lt 5) - полный двудольный граф, то характеристическим
многочленом матрицы смежности А является \4(\2 - 5). Показать, что Xmax 04) < A (G),
т.е. оценка Уилфа в этом случае лучше оценки Брукса.
в. Показать, что, если G =Кп - полный граф с пвершинами, то x(G) =1 + *.max 04)
{Указание. Использовать результаты Перрона-Фробениуса.)
г. Показать, что, если G =Zn - цикл длины ли/?- нечетно, то x{G) = 1 + A.max {A);
д. Показать, используя теорему 3.16, что x{G) <l + ^maxC^) (Указание. Пусть
при заданном подграфе G' подграф G" в G не содержит ребер между вершинами,
не входящими в G', Легко показать, что А-щ^ 04) > \тах 04") = ^тах ^4').)
§ 4.3. Использование знаковых и взвешенных орграфов в качестве
средства моделирования сложных систем
Анализ многих важных для общества проблем, в частности,
энергетических, затрагивает чрезвычайно сложные системы. Такие системы содержат
большое число переменных, взаимодействующих друг с другом,
реагирующих на изменения каждой другой переменной и т.п. При
математическом моделировании сложных систем исследователь сталкивался с
необходимостью нахождения компромисса между точностью результатов
моделирования и возможностью получения подробной информации,
необходимой для построения модели. Знаковые и взвешенные орграфы
можно использовать при разработке простых математических моделей
сложных систем и при анализе результатов, получаемых на основе
минимальной информации.
Использование знакового орграфа в качестве модели сложной системы
основано на следующем представлении. Наиболее существенные для
рассматриваемой проблемы переменные считаются вершинами орграфа. От
переменной и к переменной v проводится дуга, если изменение и
оказывает непосредственное существенное воздействие на v. И, наконец, эта
дуга имеет знак плюс, если воздействие является "усилением" (при прочих
равных условиях увеличение и приводит к увеличению v и уменьшение и
приводит к уменьшению и), и знак минус, если воздействие вызывает
"торможение" (при прочих равных условиях увеличение и приводит к
уменьшению v и уменьшение и приводит к увеличению v).
160
Число жителей
б городе
Улучшение
условий
^ жизни б городе
Миграция
в город
Бактериологи^^ f * ^^*J*\ цисло очистных
ческа* заратенК I ^-Л ^й^
ность на единицу
площади »
заболеваний
.Рис. 4.6. Знаковый орграф для анализа проблемы удаления твердых отходов
(Maruyama[1963, с. 176])
Пользуясь этой интерпретацией, рассмотрим знаковый орграф,
изображенный на рис. 4.6. Этот знаковый орграф, взятый из работы Маруямы
(Maruyama [1963]), описывает существенные связи между рядом
переменных, относящихся к проблеме удаления из городов твердых отходов.
Дуга (Р, G) положительна, поскольку рост городского населения ведет
при прочих равных условиях к увеличению количества мусора. Дуга (Д Р)
отрицательна, поскольку рост заболеваемости ведет к уменьшению
населения, тогда как уменьшение заболеваемости приводит к росту
населения. Остальные знаки определяются путем аналогичных рассуждений.
(Из В в М, например, дуга вообще не проведена, поскольку
"усиливающее" или "тормозящее" воздействие бактериологической зараженности на
мероприятия по улучшению условий жизни в городе не принимается в
расчет.)
Заметим, что четыре переменные P,G,B и/)образуют контур,
противодействующий отклонению. Увеличение любой переменной в этом контуре в
конечном счете приводит через другие переменные контура к уменьшению
данной переменной и наоборот. (Чем больше в городе людей, тем больше
отходов, чем больше отходов, тем больше бактерий, чем больше бактерий,
тем больше заболеваемость; чем больше заболеваемость, тем меньше
людей и т.п.) С другой стороны, контур Р9М,С,Р служит контуром,
усиливающим отклонение. Увеличение (уменьшение) любой переменной в этом
контуре, в конечном счете, приводит к ее последующему увеличению
(уменьшению). (Чем больше городское население, тем сильнее
требования к улучшению условий жизни; чем больше мероприятий по улучшению
условий жизни проводится в городе, тем более привлекательным он
становится для поселения; чем больше миграция в город, тем больше
городское население (Coombs, Dawes, Tversky [1970, с. 82]).) Контуры в таком
знаковом орграфе соответствуют контурам обратной связи, причем,
контуры, усиливающие отклонение — контурам положительной обратной
связи, а контуры, противодействующие отклонению, - контурам
отрицательной обратной связи.
П. Ф.С. Роберте 161
Стоимость Состояние
электроэнергии окружающей
^Потребление ^Населенность
энергии I p
U Л
Число
предприятий
F
Рис. 4.7. Знаковый орграф для анализа проблемы потребления электроэнергии
(Roberts [1971))
Контуры, усиливающие отклонение, легко описать.
Утверждение (Maruyama [1963}). Контур усиливает отклонение тогда
и только тогда, когда он содержит четное число отрицательных дуг1) (в
противном случае это контур, противодействующий отклонению).
Это утверждение справедливо. В самом деле, в случае четного числа
отрицательных дуг противодействие отклонению в переменной само будет
встречать противодействие. Если число отрицательных дуг нечетно, то
последнее противодействие отклонению не встречает противодействия.
(Интересно отметить связь между понятием усиления отклонения и
понятием баланса, данным в § 3.1: контур усиливает отклонение тогда и
только тогда, когда он сбалансирован. Продолжим анализ этой связи далее в
упражнениях § 4.5.)
Если большинство контуров составляют контуры, усиливающие
отклонение, то начальные изменения могут превышать изменения в результате
их непосредственного воздействия. Таким образом, наличие многих
контуров, усиливающих отклонение, предполагает неустойчивость. (Наличие
многих контуров, противодействующих отклонению, также может
приводить к неустойчивости за счет увеличения колебаний. Теория, развиваемая
в § 4.5, более детально исследует этот вопрос. Особенно следует обратить
внимание на упражнение 27 § 4.5.)
Знаковый орграф, аналогичный изображенному на рис. 4.6, можно
построить для анализа проблем, связанных с потреблением электроэнергии
в данном районе. Для удобства рассмотрения ограничимся небольшим
числом переменных, относящихся к этой проблеме. В качестве вершин
орграфа возьмем следующие параметры: энергетические мощности,
потребление энергии, стоимость энергии (кВт • ч), населенность города, число
рабочих мест, количество предприятий и состояние (физическое)
окружающей среды. Тщательный анализ проблемы потребления энергии должен
1) Усиление отклонения происходит и при отсутствии в контуре отрицательных
дуг. {Примеч. пер.)
162
требовать либо значительно большего множества переменных, либо
использовать более тонкие методы выбора основных переменных для
изучения такой большой системы. Поскольку при этом необходимо учитывать
много различных аспектов и взглядов, наилучший подход, возможно,
состоит в привлечении группы экспертов для опроса каждого из них о его
мнении. Тогда при выборе переменных мы столкнемся с проблемой
объединения мнений экспертов. Этот вопрос мы подробно рассмотрим в гл. 7.
Конкретная задача выбора переменных при исследовании потребности в
энергии описана в работе Roberts [1973] (см. также п. 8.4.3).
Наш знаковый орграф для проблемы потребления энергии изображен
на рис. 4.7. Для удобства изложения мы включили в него лишь наиболее
важные непосредственные связи. Дуга (?/, Q) имеет знак минус потому,
что увеличение потребления энергии при прочих неизменных условиях
влечет ухудшение состояния окружающей среды, тогда как уменьшение
потребления энергии улучшает состояние окружающей среды. Дуга (J,P)
положительна, поскольку увеличение (уменьшение) числа рабочих мест
вызывает рост населения (заставляет людей уезжать). Дуга (C,F)
положительна, поскольку увеличение (уменьшение) энергетических
мощностей (числа или размера электростанций) вызывает в этом районе
появление новых предприятий (заставляет перемещать производство в другие
районы). Дуга (U,R) отрицательна, поскольку согласно существующей
структуре расценок на электричество стоимость киловатт-часа падает при
росте потребления электроэнергии. В этот знаковый орграф не включены
петли, например, по-видимому, необходимо добавить положительную
И
Рис. 4.8. Знаковый орграф для изучения внутригородских поездок на работу [ 1 ] -
протяженность поездки; [ 2] - экономия горючего; [ 3] - численность населения;
[ 4] - стоимость автомобиля; [ 5] - стоимость проездного билета; [б] - загрязнение
атмосферы; [ 7] - число несчастных случаев; [ 8] - вероятность опоздания; [ 9] -
расход горючего. Знак дуги [ 1 ]- [ 5] не определен (Roberts [1973 ])
Рис. 4.9. Знаковый орграф для системы "Наука и общество": [ /] - число рабочих
мест для научных работников; [ 2] - число слабо подготовленных исследователей;
[ 3] - "доля плохой" научной продукции или вредные последствия использования
результатов научно-технических исследований; [ 4] - внешние и внутренние угрозы
обществу, для преодоления которых требуется применение достижений науки и
техники; [ 5] - общественное мнение в пользу развития научных исследований; [ 6] -
бюджетные ограничения; [ 7] - государственный бюджет научных исследований;
t 8] - число хорошо подготовленных исследователей; [ 9] - "доля добротной"
научной продукции или положительные последствия использования достижений науки и
техники. Подготовлен автором для Организации экономического сотрудничества
и развития при анализе необходимого уровня обеспечения науки и разработке новых
методов принятия решений о финансировании научных и технических исследований
И*
163
петлю из Р в Р. Однако нетрудно выяснить какие петли следует учитывать
при последующем анализе.
Необходимо заметить, что контур U,Q,P, U противодействует
отклонению. Контуры C,R,U,C и С, F, J, P9U, С усиливают отклонение; более
того, так же действуют все контуры, содержащие вершину С. Ниже мы
остановимся на значении этого замечания.
Второй знаковый орграф, связанный с проблемой потребления энергии,
изображен на рис. 4.8. Этот ограф, представляющий потребности в горючем
при внутригородских, поездках на работу, был построен на основе
субъективных суждений экспертов. Подробности этой процедуры можно найти в
работе Roberts [1973] .Дуга ([71, [5]) помечена вопросительным знаком,
так как эксперты не смогли определить ее знак. Ниже мы проведем анализ
этого орграфа для обоих вариантов ее знака. Здесь отметим, что иногда
даже самая минимальная информация, необходимая для построения
знакового орграфа, труднодоступна.
Еще несколько знаковых орграфов приведено на рис. 4.9 — 4.14. Они
возникли в реальных исследованиях и читателю в упражнениях будут
предложены вопросы относительно некоторых из них.
Нередко знаковый орграф является наиболее детализированной
моделью сложной системы, которую удается создать. Это, в частности, верно,
если некоторые переменные не могут быть измерены, как например,
вершина "состояние окружающей среды" в орграфе на рис. 4.7. Многие
переменные, возникающие при исследовании социальных проблем, трудно
или невозможно измерить. Однако даже при помощи такой упрощенной
модели можно получать некоторые строгие выводы. Например, если
орграф на рис. 4.7 представляет точную модель знаковых воздействий в
некоторой системе потребления энергии, то каждый может выделить
подсистемы, усиливающие отклонение. Как уже говорилось,
ориентированный контур C,R9U9C соответствует такой подсистеме. В действительности,
все подсистемы, содержащие вершину С, т.е. переменную "энергетические
мощности",и соответствующие простым контурам, таким, как, например.
C,R, U, С усиливают отклонение. Большинство более коротких замкнутых
путей, содержащих С, также усиливают отклонение. Эти соображения
позволяют строго объяснить (со структурной точки зрения) почему
энергетическая система в такой степени неустойчива. Другими словами, —
начальный прирост энергетической мощности усиливается, вызывая
дальнейшее увеличение энергетических мощностей. Таким образом, знаковая
модель позволяет уточнить гипотезу о процессах в энергетических
системах, высказанную специалистами по окружающей среде. Отсюда следует,
что один из способов противодействия чрезмерному росту энергетических
мощностей состоит во введении отрицательной "начальной отдачи" в
некоторых из усиливающих отклонение контурах, содержащих С. (Этого можно
добиться введением положительной начальной добавки к стоимости
энергии R.) Или можно попытаться превратить некоторые из этих контуров в
контуры, противодействующие отклонению, изменяя знаки ряда дуг.
(Вопрос о том, как осуществить подобные изменения путем проведения
определенной государственной политики остается, конечно, весьма
трудным.)
164
ад
Рис. 4.10. Знаковый орграф для анализа проблемы очистки прибрежной зоны (Goady et al. [1973]; в этой работе исследовалось
использование возможностей города для удовлетворения растущей потребности в очистке воды):[ 1] - допустимая посещаемость пляжа; [ 2] -
действительная посещаемость пляжа; [ 3] — удовлетворение потребностей города; [4] — населенность города; [ 5] — необозначенная
граница прибрежной зоны; [б] - капиталовложения на содержание пляжей
Рис. 4.11. Знаковый орграф для выбора одного из типов перевозок в Ванкувере (личный или общественный транспорт) (Капе [1972]; в
этой работе изучалось, можно ли путем обширных ассигнований на общественный транспорт сделать его доступным для жителей): [ 1] —
стоимость автомобиля; [ 2] - использование автомобилей; [ 3] — комфорт и преимущества пользования автомобилем; [ 4] — свобода
выбора в поездке (маршрут, время и т.д.); [ 5 ] — скорость
о[7]
Рис» 4.12. Знаковый орграф для анализа системы здравоохранения в Британской Колумбии (Kane et al. [ 1972]; в этой работе
исследовались варианты политики при распределении ресурсов на медицинские нужды): [ 1 ] - влияние окружающей среды; [ 2] - возрастная
структура населения; [ 3] - численность населения; [ 4] - пособие при заболевании; [5] - выявление и исследование проблем в области
здравоохранения; [б] - доступность медицинского обслуживания; [ 7] - затраты времени врачом; [ 8] - медицинские учреждения;
[ 9] - передача медицинских обязанностей другим лицам; [ 10] - расходы
Рис. 4.13. Знаковый орграф для анализа кадровой политики в морском флоте (Kruzic [ 1973a]; в этой работе изучалось влияние
различных мер, направленных на преодоление текучести персонала): [ 1] - жалованье, рацион и пособия; [ 2] — состояние окружающей среды;
[ 3) - возможности повышения квалификации; [ 4] - удовлетворенность работой; [ 5] - степень постоянства кадров; [ 6] -
военнослужащие; [ 7] — сохранность оборудования; [ 8] — общий бюджет для личного состава
Рис. 4.14. Три знаковых орграфа для анализа пробемы потребления энергии
Соединенными Штатами (Kruzic [ 1973b]; данные этой работы получены в процессе оценки
пригодности глубоководных портов для приема нефтяных танкеров): { 1] -
потребление энергии; [2] - снабжение энергией за счет внутренних источников; [ 3] -
внутренние инвестиции для создания новых энергетических источников и резервов;
[4] - опора на традиционные энергии (в отличие от развития других их видов);
[ 5] - доверие общественности к правительству. Знаковый орграф а предназначен
для системы вплоть до 1985 г., когда потребление энергии меньше 50%
предполагаемого максимального уровня, оцениваемого как четырехкратное ее потребление в
1973 г., и внутренние источники энергии обеспечивают более 75 % энергетических
потребностей государства. Знаковый орграф б предназначен для системы после
1985 г., когда потребление энергии более 50% максимального уровня, но внутренние
источники энергии обеспечивают более 75 % потребностей государства. Знаковый
орграф в предназначен для системы после 1985 г., когда потребление энергии более
50% максимального уровня и внутренние источники обеспечивают менее 50%
энергетических потребностей
Ниже анализируются другие возможности стабилизации
энергетических систем и, таким образом, эта проблема переносится на более
формализованный уровень. Все эти наблюдения следовали непосредственно из
структурных особенностей знакового орграфа. Модель в виде знакового
орграфа лучше всего подходит для такого структурного анализа,
поскольку сами исследования по теории орграфов на протяжении многих
лет были направлены на развитие именно данного подхода.
(Действительно, одна книга по теории орграфов (Harary, Norman, Cartwright [1965])
так и называется "Структурные модели".)
Такие модели содержат в себе много упрощений. В частности,
воздействия некоторых переменных на другие могут быть разной силы. Так,
например, в орграфе на рис. 4.7 эффект роста населенности Р на
потребление энергии U более значителен, чем эффект от воздействия ухудшения сос-
167
тояния окружающей среды Q на населенность Р. Модель в виде знакового
орграфа предполагает все воздействия одинаковыми по силе, поскольку
веса на каждой дуге равной (единичной) величины. Возможно, более
обоснованно приписывать дугам (м, v) различные веса w(u, и), что
приводит к взвешенному орграфу1). Такой вес интерпретируется, как
относительная сила воздействия и может быть положительным (для "усиливаю"
щих" воздействий) или отрицательным (для "тормозящих" воздействий).
Еще более реалистичным было бы считать, что сила воздействия,
соответствующего дуге (м, и), изменяется в зависимости от уровней переменных
и и v. Эту зависимость можно промоделировать, приписывая каждой дуге
(и, v) орграфа функцию /MU(u,v) уровней u,v переменных и и v, где
fuv (u> v ) интерпретируется как сила воздействия и на у, если и принимает
значение уровня u, a v — значение уровня v. Орграф с такой функцией fm
называется функциональным знаковым орграфом2).
В функциональном знаковом орграфе для простоты мы могли бы
считать, что fuv есть функция своего первого аргумента. Эта функция может
возрастать для небольших значений и и убывать при больших значениях
или обладать другими более сложными свойствами. Такой пример
представляет функция fpM орграфа, изображенного на рис. 4.6 и
относящегося к проблеме удаления твердых отходов. Рост населения на достаточно
умеренном уровне влечет за собой появление требований модернизации
городского хозяйства, тогда как более высокий уровень роста
населения вызывает столько напряжений в городском бюджете, что
программы модернизации становятся бесполезными и умирают, едва успев
родиться. Функциональные знаковые орграфы сходны до некоторой степени с
моделями, используемыми Форрестером (Forrester [1961, 1969, 1971]),
и Медоузом (Meadows et al [1972]) для изучения проблем эволюции
городов, загрязнения окружающей среды и т.д. При сравнении моделей наши
вершины должны сопоставляться с переменными, описывающими уровни,
а наши функции fuv (u, v) — с переменными, описывающими скорости
исследуемых процессов.
Второе упрощение в знаковой (взвешенной или
функционально-знаковой) модели состоит в том, что не учитывается время запаздывания при
воздействии изменения в и на и. Например, на рис. 4.7 прирост населения Р
повлечет почти немедленно увеличение потребления энергии U, хотя на
самом деле существует сдвиг по времени между ростом числа рабочих
мест и привлечением дополнительного населения в этот район. Вообще,
количество времени, необходимое для воздействия изменения в и на и,
будет зависеть от дуги (w, v). Таким образом, в более точной модели
следует ввести на дуге второй вес, для указания запаздывания,
соответствующего воздействию, или в более общем виде функцию ?MU(u,v),
1) В такой взвешенный орграф мы могли бы включить дуги, которые не
принимались в расчет в орграфе на рис. 4.7, например, дугу (?>, U). (Эта дуга может иметь
отрицательный вес: например, ухудшение качества воздуха приводит к увеличению
использования воздушных кондиционеров и, следовательно, к большему потреблению
электроэнергии.)
2) Термин функциональный орграф более краток, но уже используется в теории
графов.
168
определяющую запаздывание при воздействии и на и, если и имеет уровень
u, a v - уровень v. Большинство дальнейшего материала допускает, вероятно,
обобщения, учитывающие запаздывания. Если запаздывания целочислен-
ны, то тривиальное решение можно получить, вставляя ряд дополнительных
вершин между двумя вершинами, соединенными дугой. Число
добавленных вершин соответствует запаздыванию. Однако это не будет практичным
решением, поскольку получающийся орграф может оказаться очень
большим.
Необходимо повторить, что существует компромисс между общностью
модели и возможностью реалистичной оценки ее параметров (веса,
запаздывания, функции и др.). Иногда трудно даже пояснить смысл весов w (u9 v),
например, если и или v трудно измерить или точно определить. Вот почему
важно исследовать выводы, получаемые только при учете знаков. Пример
такого вывода — заключение, что каждый контур, проходящий через
вершину С в знаковом орграфе, изображенном на рис. 4.7, усиливает
отклонение.
С другой стороны, различные свойства орграфа могут быть весьма
чувствительны по отношению к данным весам или запаздываниям и небольшие
отклонения значений этих параметров, могут изменить некоторые свойства
орграфов. Например, могут нарушаться свойства импульсной и абсолютной
устойчивости, рассматриваемые ниже. Таким образом, по мере
возможности желательно определять веса w(u,v), запаздывания и, даже функции
fuv fa^'guv fav) с наибольшей степенью точности и разрабатывать
методы анализа взвешенных и, быть может, функциональных знаковых
орграфов, а также орграфов с запаздываниями.
В дальнейшем будем обычно говорить о взвешенном орграфе.
Необходимо понимать, что о некоторых весах известны лишь их знаки, тогда как
другие могут заменяться функциями. Должно быть также ясно, как
производить такую замену весов во многих случаях. Запаздывания не будем
принимать во внимание.
На рис. 4.15 — 4.21 приведены примеры взвешенных орграфов,
возникающих в различных практических приложениях. Орграфы на рис. 4.15 и
рис. 4.16 были построены на основе девяти переменных, показанных на
рис. 4.8. Ниже мы проведем более детальный анализ этих взвешенных
орграфов. На рис. 4.17 — 4.21 изображены взвешенные орграфы,
соответствующие знаковым орграфам рис. 4.10—4.14. Приведенный на рис. 4.9
орграф исследовался только как знаковый и он не имеет в литературе
взвешенного аналога.
Одно из преимуществ модели в виде взвешенного орграфа состоит в
том, что она позволяет давать точные формулировки проблемам,
упомянутым нами в § 4.1: проблеме прогнозирования потребности в энергии,
проблеме предсказания влияния новых технологий на эту потребность,
проблеме определения и выбора возможных альтернативных стратегий
для удовлетворения ограничений, связанных с учетом требований по
охране окружающей среды, и т.п. Чтобы уточнить эти проблемы, допустим,
что каждая вершина щ принимает значение (или достигает уровня) vt (t)
в дискретные моменты времени t = 0, 1, 2,... При этом время может
измеряться в часах, днях, неделях, месяцах, годах и т.п. Значением пере-
169
Рис. 4.15. Взвешенный орграф для анализа проблемы потребления горючего и
поддержания чистоты воздуха в городе Сан-Диего в Калифорнии, когда перевозки
осуществляются в основном автомобилями (Roberts [1974в]): [ 1] — протяженность
поездки; [ 2] - экономия горючего автомобиля, мили на галлон; [ 3] - населенность;
[ 4] — стоимость автомобиля; [ 5] — стоимость поездки; [б] — объем выбросов в
атмосферу; [ 7] - несчастные случаи; [ 8] - средняя задержка; [ 9\ - расход
горючего
Рис. 4.16. Взвешенный орграф для анализа проблемы потребления горючего и
поддержания чистоты воздуха в городе Сан-Диего в Калифорнии для гипотетической
ситуации, когда движение личного транспорта запрещено и введена обширная и
дорогостоящая автобусная сеть (Roberts [1974b]): [7] - протяженность поездки;
[ 2] - экономия горючего автобуса, мили на галлон; [ 3] - населенность; [ 4] -
стоимость автобусной сети; [ 5] — цена билета; [б] - объем выбросов в атмосферу;
[ 7] - несчастные случаи; [ 8] - опоздание; [9] - расход горючего
Рис. 4.17. Взвешенный орграф
для анализа проблемы очистки
прибрежной зоны. В знаковом
орграфе, изображенном на
рис. 4.10, дополнительно
указаны eeca(Coadyetal.[1973]); [1] -
допустимая посещаемость пляжа;
[2] - действительная
посещаемость пляжа; [3] -
удовлетворение потребности населения
города; [4] - населенность города;
[5] - необозначенная граница
прибрежной зоны; [6] -
капиталовложения на содержание
пляжей
170
0[7]
Рис. 4.18. Взвешенный орграф для выбора одного из типов перевозок в Ванкувере
(личный или общественный транспорт). В знаковом орграфе, изображенном на
рис. 4.11t дополнительно указаны веса (Капе [1972]); [1] - стоимость автомобиля;
[2] - использование автомобиля; [3] - комфорт и преимущества пользования
автомобилем; [4]~ свобода выбора при поездках (маршрут, время и т.д.); [5] - скорость
Рис. 4.19. Взвешенный орграф для анализа системы здравоохранения в Британской
Колумбии. В знаковом орграфе, изображенном на рис. 4.12, дополнительно указаны веса
(Kane et al. [1972]); [1 ] - влияние окружающей среды; [ 2] - возрастная структура
населения; [3] — численность населения; [4] — пособие при заболевании; [5] —
выявление и исследование проблем в области здравоохранения; [6] - доступность
медицинского обслуживания; [7] — затраты времени врачом; [8] — медицинские
учреждения; [9] - передача медицинских обязанностей другим лицам; [10]-
расходы
Рис. 4.20. Взвешенный орграф
для анализа кадровой политики
в морском флоте. В знаковом
орграфе, изображенном на
рис. 4.13, дополнительно
указаны веса (Kruzic [1973a]);[l]-
жалованье, рацион, пособия;
[2] - состояние окружающей
среды; [3] - возможности
повышения квалификации; [4] —
удовлетворенность работой; [5 ] -
степень постоянства кадров; [6 ] -
военнослужащие; [7] —
сохранность оборудования; [8] .-
общий бюджет для личного состава
менной типа "населенность" служит просто ее уровень. Значение
переменной типа "состояние окружающей среды"-некоторая мера,
характеризующая ее физическое состояние. Ниже мы введем специальное правило
изменения значений импульсного процесса (для краткости "правило
импульсного процесса") устанавливающее, как отклонения значений переменных
распространяются за некоторое время по системе. Теперь сформулировать
проблему прогнозирования, можно следующим образом: предсказать
значение V{ (t) вершины щ в момент времени t или, иначе говоря, предсказать
изменение в vt (t) при заданном его исходном значении vt (исх).
В качестве простого примера рассмотрим взвешенный орграф,
изображенный на рис. 4.15, и допустим, что расход горючего уменьшается на
10% к фиксированному (начальному) моменту времени, скажем,
благодаря решению правительства. Рассмотрим период времени, равный одной
недели, и предскажем уровень выбросов в атмосферу (переменная [6])
за следующие 50 недель. На рис. 4.22 представлен этот прогноз; на нем
величина v^(t) — Uj6j(hcx) выражена в процентах к i^j (исх). Этот прогноз
был сделан с использованием правила изменения значений переменных
импульсного процесса, которое будет введено ниже. Мы видим, что начальное
изменение в потреблении горючего приводит сначала к довольно быстрому
:*>*
Рис. 4.21. Три взвешенных орграфа для анализа проблемы потребления энергии
Соединенными Штатами. В знаковых орграфах, изображенных на рис. 4.14,
дополнительно указаны веса (Kruzicjl 97 Зв]); [7] — потребление энергии; [2] — снабжение
энергией за счет внутренних источников; [3] - внутренние инвестиции для создания
новых источников и резервов; [4] — опора на традиционные источники энергии (в
отличие от развития других их видов); [5] - доверие общественности к
правительству
172
4'
I'
3
10
10
20
50
30 АО
f недели
Рис. 4.22. Влияние на объем выбросов в атмосферу сокращения на 10% потребления
горючего в транспортной системе города Сан-Диего в Калифорнии. Анализ проблемы
проводится на взвешенном орграфе, изображенном на рис. 4.15. Настоящий рисунок
был получен по данным ЭВМ .путем соединения последовательных (дискретных)
точек прямыми. Такой же метод использовался для представления всех прогнозов,
о которых пойдет речь в этой главе
падению уровня выбросов в атмосферу, который затем вновь начинает
возрастать и, согласно, прогнозу, стабилизируется на уровне примерно
на 6,5% ниже начального.
Имеется много путей для постановки задачи прогноза. Один из них
состоит в учете влияния новых технологий и других возможностей путем
изменения взвешенного орграфа в некоторый момент времени Г, когда
эта технология будет введена. Другую представляют вероятностные
прогнозы ожидаемого (среднего) значения E(Vj(t)), основанные на оценке
ожидаемой величины (среднего значения) времени Г. Здесь мы не можем
рассмотреть эти видоизменения. Однако настоятельно рекомендуем
читателю сделать это.
Можно ввести ограничения, или нормативы, связанные с требованиями
к качеству окружающей среды, а также ограничения иного
происхождения, придавая некоторой вершине границы, в пределах которых
изменяются значения соответствующего ей параметра1). Это делается путем
введения двух векторов m= (mt,m29... ,тп) и М = (Ml9M2,... ,Мп),
представляющих нижние и верхние ограничения тг и Mt для каждой вершины
W/, причем они могут варьировать от — °° до +°° соответственно. Типичные
векторы ограничений для знакового орграфа^ изображенного на рис. 4.7,
могут иметь вполне определенные компоненты тд и W/, тогда как все
остальные т/ = — °° и все Л// = +°°.
*)В тексте не делается различия между вершиной и переменной, ей
соответствующей. {Примеч. пер.)
173
Если такие ограничения заданы, мы пытаемся найти варианты стратегий,
удовлетворяющие им. Стратегией является процедура, изменяющая
систему. Если система представляется взвешенным орграфом, некоторые
возможные изменения, или стратегии, состоят в следующем.
1. Изменить в определенное время значения некоторых вершин.
2. Добавить в заданное время некоторую новую вершину (фактор) и
новые дуги к ней и от нее (отношения взаимодействия этого фактора с
уже имеющимися).
3. Изменить в определенное время знак некоторой дуги.
4. Изменить в заданное время вес некоторой дуги.
5. Добавить новую дугу между имеющимися вершинами.
6. Добавить новый контур (усиливающий или уменьшающий
отклонение).
В этой главе мы сконцентриуем свое внимание на стратегиях
изменения знака и веса. Примером такой стратегии является стратегия
изменения знака дуги (U,R) в знаковом орграфе на рис. 4.7 с минуса на плюс.
Эта все более широко обсуждаемая стратегия называется "обращением
структуры расценок" и заставляет более крупных потребителей платить
больше (за кВт-час), а не меньше, как в настоящее время, что
соответствует переходу от принципа "чем больше вы потребляете, тем дешевле
платите" к принципу "чем больше вы потребляете, тем дороже платите".
Другая интересная стратегия изменения знака соответствует изменению
знака дуги (J,P) с плюса на минус. Этого можно добиться, предоставляя
все больше рабочих мест женщинам, вынуждая их меньше времени
уделять семьям. Представляет интерес также стратегия, соответствующая
добавлению дуги, которая состоит в добавлении положительной дуги из Q
в С. Этим устанавливается связь между допустимыми энергетическими
мощностями и индексом состояния окружающей среды. Как только
фиксированное множество стратегических альтернатив определено, мы можем
уточнить проблему стратегий. Коротко говоря, она имеет несколько
версий. Одна постановка этой проблемы такова: найти оптимальную
(кратчайшую, самую дешевую и т.п.) стратегию для удовлетворения нормативам
качества окружающей среды1).
Второй вариант состоит в нахождении политики, максимизирующей
(или минимизирующей) значения некоторых вершин (например, вершины,
измеряющей качество окружающей среды) при наличии ограничений на
значения некоторых других вершин,
В этой книге мы будем интересоваться несколько отличной постановкой
проблемы стратегий. Основное внимание будет уделяться нахождению не
стратегий, удовлетворяющих ограничениям (окружающей среды), а
стратегий, не позволяющих любой переменной принимать слишком большие или
малые значения. Будем называть такие стратегии стабилизирующими.
Чтобы сделать понятие устойчивости более точным, введем специальную
модель распространения изменений в значениях переменных. Это и явится
предметом следующего параграфа.
1) Кроме нахождения оптимальной стратегии достижения целей (удовлетворения
нормативам) важно определить, как поддерживать состояние, при котором нормативы
выполнены.
174
Упражнения
1. В знаковом орграфе, изображенном на рис. 4.7, объяснить смысл знака плюс
дуги (F,U).
2. Почему в знаковом орграфе на рис. 4.7 дуга (Q,P) положительна?
3. На рис. 4.7 найти петлю, кроме, (Р,Р), которая, возможно была удалена.
4. Является ли контур [ 1 \, [ 71, [8 ], [ 1 ] на рис. 4.8 усиливающим отклонение или
1ротиводействуюшим ему? Объяснить и проинтерпретировать свой ответ.
5. Повторить упражнение 4 для контура [ 1 ], [3\, [ 2], [ 1 ] на рис. 4.10. Согласны ли
вы с выбором знаков?
6. Какова интерпретация на рис. 4.7 стратегии изменения знака дуги (С, F ) с плюса
на минус? Приемлема ли она как общественная политика?
7. Рассмотреть знаковые орграфы на рис. 4.8-4.13.
а. Найти в каждом из них контур (если он имеется), усиливающий отклонение, и
обсудить результат, б. Найти в каждом из них контур (если он имеется),
противодействующий отклонению» и обсудить результат.
8. В знаковых орграфах к упражнению 7 определить переменные, которые трудно
измерить количественно, или убедиться, что таких нет.
9. В знаковых орграфах упражнение 7 определить дугу, знак который может
измениться в зависимости от уровня рассматриваемых переменных, или показать,
что таких нет.
10. В знаковых орграфах на рис. 4.7 определить воздействия с более длинными
запаздываниями и с более короткими.
11. Имеется ли в знаковом орграфе на рис. 4.9 такая вершина и, что каждый
контур, ее содержащий, усиливает отклонение?
12. Имеется ли в знаковом орграфе на рис. 4.9 вершина, через которую проходит
много отрицательных контуров? Если имеется, то можно ли ожидать колебания в
значении этой переменной? Проанализируем этот вопрос с точки зрения вашей
интуиции или знаний о прошлом поведении значений этой переменной.
13. В знаковых орграфах к упражнению 7
а. Определить практически применимую стратегию, состоящую в изменении знака
б. Определить практически применимую стратегию, состоящую в добавлении дуги.
14. Рассмотреть три знаковых орграфа на рис. 4.14.
а. Определить некоторые новые контуры, которые возникнут в знаковом орграфе
на рис. 4.14, л за счет добавления дуги [4], [i| при переходе к знаковому орграфу на
рис. 4.14,5. Исследовать эти контуры.
б. Добавить в знаковом орграфе на рис. 4.14,6 дугу [1], [4], переходя к
знаковому орграфу на рис. 4.14, в и найти вновь полученные контуры.
15. Контуру знакового орграфа сопоставляется его знак, который можно
представить как произведение знаков его дуг. Во взвешенном орграфе контуру С
сопоставляется произведение р(С) весов его дуг. При обосновании правил изменения
величин допускается, что, чем больше абсолютное значение р(С), тем более важную
роль этот контур играет. Если контур С положителен или усиливает отклонение,
то при | р(С) | > 1 отклонения, возникающие в контуре С, постоянно усиливаются,
а при | р(С) | < 1 в конце концов прекращаются. Если С отрицателен или
противодействует отклонению, то при I р(С) | > 1 отклонения, возникающие в контуре С,
приходят в состояние растущих колебаний, а при I р(С) I < 1 колебания в конце
концов затухают.
а. В каждом из взвешенных орграфов на рис. 4.15—4.20 найти контур (если он
имеется), усиливающий отклонение, который приводит к росту усиления.
б. Для тех же взвешенных орграфов определить контур (если он имеется),
противодействующий отклонению, который приводит к увеличению колебаний.
16. Выполнить упражнение 15 для взвешенных орграфов на рис. 4.21 и сравнить
результаты. Изменили ли некоторые контуры свои свойства?
17. Знаковый орграф, изображенный на рис. 4.23, является когнитивной картой,
или переводом в знаковой орграф мнений реального лица, принимающего решения.
Аксельрод (Axelrod [1971]) заметил, что такие когнитивные карты стремятся стать
сбалансированными (упражнение 14) (см. § 3.1) и не содержат контуров. Он
считает, что отсутствие контуров характеризует тенденцию лица, принимающего
решение, пропускать важные обратные связи.
175
пворение
целей
Великобритании
Политика 6
настоящее время _^ AV
Наличие^
согласия u
обществе
Рис. 4.23. Когнитивная карта, построенная на основе обсуждений в Британском
Комитете по делам Востока в 1918 г. британской политики в Персии. Этот специальный
орграф выражает точку зрения одного из членов Комитета Марлинга. Дуги
представляют причинные связи, показывающие влияние одной понятийной переменной на
другую. Знак плюс - положительное отношение, знак минус - отрицательное, нуль -
безразличное (нет отношения), знак плюс в кружке — безразличное
или*положительное, знак минус в кружке - безразличное или отрицательное (Axelrod [1871]).
Обозначения: А А - политика, основанная на полном уходе Великобритании из
Персии; А В — отход войск из северо-западных районов; АС — вероятность серьезных
волнений в северо-западных районах; AD - степень беспорядков;' АЕ -
присутствие Бахтияри; AF - сохранение роли Англо-персидской нефтяной компании;
AG - наличие телеграфной связи; АН - вероятность участия в проблемах Персии
большевиков; AI — симпатии населения Персии к большевикам; AJ — слепень
безопасности в Персии; АК - вымогательство в торговых караванах; AL - влияние
племенных отношений; AM - устранение прогрессивных руководителей; AN-
реальная власть руководителей Персии; АО - учреждение конституции Персии; АР -
слабость шахского семейства; AQ - способность правительства Персии поддерживать
порядок; AR — отсутствие прогрессивных элементов в партиях Персии (= нет
прогрессивных элементов); AS — возможность контроля прогрессивных элементов
близкими; AT- сила прогрессивных элементов;AU- политическое примирение с Персией;
AV - отмена договора с Россией 1907 г.; AW - пересмотр таможенных тарифов;
АХ - наличие согласия в обществе; A Y - степень готовности Персии идти путем
независимого развития; AZ - степень британского вмешательства в Персию; В А -
современная политика вмешательства в дела Персии; ВВ - возможность персов непрерывно
получать небольшие субсидии; ВС — величина долга Персии Великобритании; BD —
способность Великобритании оказывать на Персию давление
а. Проверить, что изображенная когнитивная карта сбалансирована. (Напомним,
что надо проверять полуконтуры или использовать теорему о структуре (см.
упражнение 15 § 3.1).)
б. Указать дуги, которые могли быть пропущены, но при включении которых,
возникают контуры обратной связи.
(Замечание. Другие когнитивные карты эксперта по Ближнему Востокуи
губернатора Морриса, участвующего в работе законодательного комитета, можно найти в
работах Bonham, Shapiro и Ross.
176
18. Задание. Для некоторого общественно-политического вопроса, выбранного
по вашему усмотрению, построить знаковый орграф и проанализировать его так
же, как в упражнениях 7-13.
19* Для некоторого общественно-политического вопроса, выбранного по вашему
усмотрению, построить взвешенный орграф и проанализировать его так же, как в
упражнении 15.
§ 4.4. Импульсные процессы
Для более глубокого анализа модели, имеющей вид взвешенного
орграфа, необходимо принять некоторые весьма специальные допущения о
влиянии изменений значения параметра одной вершины на параметры других
вершин. Мы будем называть такие допущения правилами изменения
значений параметров вершин. Выбор определенного правила играет весьма
важную роль по отношению к нашим заключениям. Если допустить, что
основные данные (скажем, начальные значения параметров в каждой вершине
и веса) известны лишь неточно, то окончательные выводы, основанные на
определенном правиле изменения значений параметров вершин, будут
также всегда неточными. Всякий полученный результат следует рассматривать
как предварительный и он должен быть подвергнут "анализу
чувствительности". Такой анализ будет включать повторное моделирование с
измененными основными данными и, возможно, использование других правил
изменения значений параметров вершин *).
Чтобы определить правило изменения значений параметров вершин,
которое мы в дальнейшем примем, рассмотрим сначала знаковый орграф*.
Как обычно,его вершины представлены совокупностью uit u2i ..., м„.
Предполагается, что каждая вершина щ принимает значение vt{t) в
дискретные моменты времени t = 0,1,2,... 2). Будем считать сначала, что значение
щ (t+1) определяется значением vt(t) и информацией о том увеличили или
уменьшили свои значения другие вершины м/, смежные с и/, в момент
времени t.
Если дуга из щ в щ положительна (отрицательна), то изменение
в Uj в момент t учитывается со знаком плюс (со знаком минус) в щ в
момент t+1. Мы будем считать, что единичное изменение в щ влечет
единичное изменение в щ. Таким образом, если дуга (иу, щ) положительна и
Pj(t) - число, выражающее изменение в щ в момент г, то влияние на щ в
момент г+1 изменения в щ увеличивает щ на величину Pj(t). Если же дуга
("/» и/) отрицательна, то воздействие на м,- в момент г + 1 изменения в и,-
уменьшает щ на величину pj (t). Конечно, еслиру(г) — отрицательное число,
то увеличение на рДг) единиц означает уменьшение, а уменьшение нар; (/)
единиц - увеличение. Изменение р;-@> называемое импульсом, задается
разностью vj(t) - Vj(t - 1) при t > 0. Необходимо указать и начальное ус-
1' Подробнее с вопросами анализа чувствительности можно познакомиться в
работе Roberts [1974b] ив § 4.6.
2) Здесь, как и раньше, автор использует выражение "значение вершины" в смысле
"значение параметра, соответствующего данной вершине'*. (Примеч. ред.)
12. Ф.С. Роберте 177
ловие при t = 0. Подводя итоги, введем следующее обозначение:
1, если дуга (w7-, wf) положительна,
sgnfy, м,) =
- 1, если дуга (и,-, щ) отрицательна,
0, если дуга (м;-, и,) отсутствует.
Тогдадая t>0 определим
Vi(t + 1) = и,(г) + 2 sgnty, ц)р7@. D)
/ = 1
Автономный импульсный процесс в знаковом орграфе 1> определяется по
правилу D) с вектором начальных значений
и вектором
задающим внешний импульс Р7@), вводимый в каждую вершину щ в
момент времени 0. Мы будем также использовать вектор значений
и вектор импульсов
Рассматривая автономный импульсный процесс, мы следим за
распространением в системе начальных импульсов.
При анализе автономных импульсных процессов вектор начальных
значений V@) обычно определяется следующим образом. Предположим,
что известно исходное значение vf (исх) в каждой вершине и,. Тогда )
будет определяться соотношением
т.е. Vf(O) составлено из исходного значения и начального импульса
вершины I. В дальнейшем чаще будем определять автономный импульсный
процесс, задавая вектор
У(исх) = (у/(исх) , и2(исх),..., и„(исх)),
а не вектор V@).
В качестве примера использования автономного импульсного процесса
рассмотрим знаковый орграф, изображенный на рис. 4.24, и примем, что
Р@) = A, 0,0,0), а У(исх) = @, 0,0,0). Таким образом, V@) = A,0,0,0).
В этом импульсном процессе единичный начальный импульс вводится в
вершину 1. В момент t = 0 вершина и\ увеличивает значение на единицу;
поэтому в момент г= 1 вершины и2 ииз изменяются: вершинаи2
увеличивает значение на 1, вершина и3 уменьшает значение на 1. Таким образом,
V(l) = A, 1, -1, 0) и поэтому fl(l) = @, 1, -1, 0). Поскольку в момент
времени t = 1 вершина и2 достигла значения 1, это приводит к увеличению
на единицу значения вершины н4 в момент f = 2. Но вершина м3 уменьшила
на 1 свое значение в момент t = 1, что приводит (так как дуга (и3, м4)
178
отрицательна) к последующему увеличению м4 на единицу в момент
времени / = 2. Мы заключаем, что VB) = A,1, -1,2) и РО) = @,0,0, 2).
Увеличение в W4 на две единицы в момент времени 1=2 приводит в свою очередь
к увеличению на две единицы значения вершины и\ в момент времени
г = 3. Итак, VC) = C, 1, —1, 2). Этот процесс можно продолжить и. далее.
(Здесь ограничимся автономными импульсными процессами, которые
рассматривались до сих пор. В более общей ситуации импульсный процесс
может подвергаться воздействию внешних импульсов в любой момент
Рис. 4.24. Знаковый орграф
времени. В этом случае полагаем, что р° (О представляет внешний
импульс или изменение в- вершине щ в момент t. Величина pf(t) должна
добавляться к значению вершины щ в момент /. Таким образом, получаем
более общую формулу для импульсного процесса
= vt(t) + pf(t
sgn(W/, fi
E)
В качестве начальных условий следует задать значения pf(t) для всех/ и
t, т.е. необходима та же информация, что и в обычном случае. Как правило,
полагают р/)(О) = р/(О).)
Условие D) для автономного импульсного процесса в знаковом
орграфе естественным образом обобщается в правило изменения значений для
автономного импульсного процесса во взвешенном орграфе. Мы просто
полагаем
2
/ — l
F)
где, как обычно, w(u, v) = 0, если дуга (w, v) отсутствует. Теперь, если
имеется дуга из щ в щ с весом w = w(w7-, м/)'и значение вершины щ
возрастает в момент времени t на & единиц, то в результате значение
вершины щ в момент времени t + 1 возрастает на к X w единиц.
Поскольку Vi(t + 1) — Vf(t) = pt\t + 1), уравнение F) можно переписать
в следующем виде:
= 2
G)
(Это означает, что уравнения F) действительно представляют систему
конечно-разностных уравнений с параметрами w(w7, щ).) Читателю следует
12*
179
также обратить внимание, что
»,(*)« и, (исх)+ 2 Pi(s). (8)
5 = 0
Мы ввели некоторое конкретное правило (закон) изменения значений,
задаваемое уравнением F). В нем безусловно пренебрегается временными
запаздываниями и считается, что каждое воздействие происходит за
единичное время. Как мы заметили ранее, если все временные сдвиги целочислен-
ны, то их можно учесть, располагая между двумя вершинами,
соединенными некоторой дугой орграфа, ряд новых вершин, соответствующих
запаздыванию. И тогда можно анализировать импульсный процесс согласно
введенному правилу. Недостаток этого подхода состоит в том, что
получающиеся орграфы могут оказаться очень большими1).
В литературе по анализу сложных систем имеется большое разнообразие
правил изменения значений переменных. Мы исследуем два различных
правила в упражнениях 14 и 15 § 4.7. Отличное от них правило
используется в ряде статей (Ante, Johnson [1973], Coady et al. [1973], Kane etal.
[1972],Kruzic [1973 a,b]).
Завершим этот параграф доказательством нескольких простых теорем
об автономных импульсных процессах во взвешенных орграфах.
Автономный импульсный процесс, в котором вектор ЦО) имеет z-ю компоненту,
равную 1, а все остальные компоненты равны 0, назьюается простым
процессом с начальной вершиной щ. В таком процессе начальный
единичный импульс в вершине и,- распространяется за некоторое время по всей
системе. В простом импульсном процессе в знаковом орграфе с начальной
вершиной и/, величины Pj(t) и ty(O связаны "знаковым индексом путей"
Sfj(t) из щ в Uj длины t, который определяется как разность между числом
положительных путей s*tj-(t) из и/ в щ длины t и числом отрицательных
s^(t) путей из щ в щ длины t. (s#(f) = sjj(f) - sjj(t)). Более точно,
имеет место следующий результат.
Теорема 4.3. Для простого импульсного процесса в знаковом орграфе D
с начальной вершиной щ величины Pj(i) и v,(t) при t>0 определяются
следующим образом:
Pf(f) = sif(t\ uy(f) = vj(исх) + Pj(O) = 2 ty(r)
t
($ij(t) = 2 S/7(r) — "знаковый индекс путей" из щ в и, длины не более t.)
т = 0
Для иллюстрации этого результата рассмотрим знаковый орграф на
рис. 4.7 и простой импульсный процесс, начинающийся в вершине U.
Какими будут импульс в вершине Q и ее значение в различные моменты
времени? Положим «, = [/и щ = Q. Из щ в щ имеется один путь
длины 1, а именно, U, Q. Так как этот путь отрицателен, то в простом
импульсном процессе с начальной вершиной U pf(l) = -1. Путей длины 2
из U в Q нет, но есть путь длины 3, а именно, U, R, U, Q. Этот путь
отрицателен, и поэтому рЛЪ) = — 1. Путями длины 4 из U в Q являются
следующие: U, Q, P, U, Q; U, С, R,U,Q и U, С, F, U, Q. Поскольку два из
') См. также с. 169. (Примеч. ред.)
180
них отрицательны, а один положителен, р7D)= 1 -2 = —1. Знаковый
индекс путей из U в Q длины не более 4 равен ?,у(.4) = -1 + (—1) + (—1) =
= -3. Таким образом, У/D) * иДисх) +Р/@) + (-3) = иДисх) + 0 + (-3) =
= Vj (исх) — 3. Эти результаты можно интерпретировать следующим образом:
если потребление энергии возрастает на 1 единицу в момент времени t = 0 и
никаких других внешних воздействий в систему не поступает, то состояние
окружающей среды будет ухудшаться на единицу в моменты времени t=1,3
и 4 и значение (уровень) состояния окружающей среды в момент времени
t = 4 на 3 единицы хуже, чем исходное значение ^(исх).
Второе утверждение теоремы 4.3 можно представить в следующем
эквивалентном виде:
т = 0
Это новое соотношение применяется, если известна величина и/@).
Конечно, (8) также может использоваться для вычисления значений иу(О«
Доказательство теоремы 4.3. Пусть в орграфе D вершины
xo,xi,... 9xt образуют путь из ut = x0 в Uj=xt. Если импульс,
равный 1, поступает в вершину щ в момент времени t = 0, то согласно
указанному пути в вершину хх в момент t= 1 приходит импульс, равный
^), в вершину х2 в момент t = 2 импульс, равный
в вершину хъ в момент t = 3 импульс, равный
sgn(x0, *i)sgn(*lf x2)sgn(x2, х3)
и т.д.; наконец, импульс, равный 1 или -1 достигает в момент t вершины
м/, а его знак определяется знаком пути из х0 в xt. С другой стороны,
изменения в значении щ в течение t шагов, возникающие за счет
прихода единичного импульса в щ в момент t = 0, могут происходить
только при наличии некоторого пути в D из м,- в щ длины t. Это
доказывает результат для ру(О« Искомое соотношение для uy(f) следует из
уравнения (8). ¦
Обобщение этой теоремы для случая взвешенных орграфов получается
непосредственно отсюда и оставляется читателю в качестве упражнения
(см. упражнение 12). Следующая теорема связывает py-(f) и ty(r) с
элементами матрицы смежности. Она формулируется для взвешенных орграфов и,
так как всякий знаковый орграф можно считать взвешенным, применима
также и к знаковым орграфам.
Теорема 4.4. Пусть D — взвешенный орграф с матрицей смежности А.
Для простого импульсного процесса в D с начальной вершиной щ
Р/@ = (элемент /,/ матрицы А*}
и
ty(r) = иДисх) + {элемент /,/ в матрице / + Л +А2 + ... +А*)
1) Читатель должен отметить, что А* обозначает Г-ю степень матрицы А, а не
транспонированную матрицу, которая в этой книге обозначается А'.
181
Доказательство. Если D — знаковый орграф, доказательство
получается из теоремы 4.3 при помощи рассуждений, аналогичных
используемым при доказательстве теоремы 2.11. Если D — взвешенный орграф,
доказательство проводится таким же образом. Детали оставляются
читателю. ¦ '
Проиллюстрируем применение теоремы 4.4 на знаковом орграфе,
изображенном на рис. 4.24, для простого импульсного процесса с начальной
вершиной Mi, полагая V(hcx) = @,0,0, 0)! Здесь
0 1-1 0
А =
Простые вычисления показывают, что
0
1
-1
0
0
0
0
1
0
0
0
-1
2
0
0
0
1-1
\ 1
1
1
0
1
- 1
0
1
-1
2
1
- 1
1
Поскольку процесс начинается в вершине и%9 то РзB) определяется
элементом 1,3 матрицы А2, т.е. равен 0. Аналогично UiB) = Ui(hcx) +
{элемент 1,1 матрицы / + Л+Л2}=0 + 1 = 1. Эти результаты согласуются с
вычислениями, использующими определение импульсного процесса. Для
простого импульсного процесса с начальной вершиной щ можно вычислять
значения vj{t) и по другой формуле, а именно:
Vj(t) = uy(O) + { элемент /, / в матрице А + А2 + ... + А *}.
(Почему эта формула эквивалентна формуле, приведенной в теореме 4.4?)
Было бы полезно переформулировать теорему 4.4 в векторных
обозначениях. Для простого импульсного процесса с начальной вершиной и{ имеем
F@) = @, 0, ..., 0, 1, 0, ..., 0) с 1 на i'-м месте. Тогда полученный
результат можно представить следующим образом:
Это уравнение также справедливо для автономного импульсного
процесса общего вида. Таким образом, имеет место следующая теорема.
Теорема 4.5. Для автономного импульсного процесса во взвешенном
орграфе D
Теорема 4.5 следует непосредственно из уравнения G), которое было
получено из основного уравнения импульсного процесса F) для случая
взвешенных орграфов. Уравнение G) означает, что Р(/ +1) = P(t)A. Таким
образом, теорему 4.5 можно доказать непосредственно. Если это сделать,
то теорема 4.4 будет прямым следствием теоремы 4.5. Наконец,
теорему 4.3 также можно получить из теоремы 4.4.
182
Теоремы 4.4 и 4.5, по существу, дают решения проблемы прогноза.
(В некотором смысле они также дают решение для первой постановки
проблемы выбора стратегий, сформулированной в предыдущем параграфе,
если известно, что нормативы достижимы1). Приведем это решение
для случая, когда допустимой стратегией служит введение в некоторый
момент времени единичного импульса в одну из вершин. Если задано
желаемое значение (множество значений) вершины uj (множества вершин), то
просто вычисляются суммы степеней матрицы А до тех пор, пока по
крайней мере один элемент /, / (или большинство элементов) не примет (не
примут) желаемое (желаемых) значение (значений). Начальный импульс,
направленный в вершину м/, приводит к решению. Аналогично следует
вычислять решение, если допускаются более сложные стратегии, или
желательны стратегии наименьшей стоимости. Затруднение для использования
полученного выше "решения" в проблеме выбора стратегий, конечно, состоит в
том,что, достигнув однажды заданный уровень, мы можем не сохранить его.
Изложив эти предварительные результаты об импульсных процессах,
займемся в следующем параграфе вопросами их устойчивости, которым
и будут посвящены наши основные теоремы.
Упражнения
1. Примем для знакового орграфа, изображенного на рис. 4.25, что
У(исэО= @, 0, 0, 0), а Р@) = @, 0, 0, 1).
Вычислить V@), P(l), V(l), PB) и V B).
2. Для знакового орграфа, изображенного на рис. 4.25, найти
а. Знаковое число путей из и4 в и4 длины 1, 2 и 3;
б. Значение р4 C) для простого импульсного процесса с начальной вершиной и4,
используя теорему 4.3.
в. Значение v4 C) для этого импульсного процесса, используя теорему 4.3, если
У(исх)= @,1,1,1).
3. Рассмотреть импульсный процесс на взвешенном орграфе, изображенном на
рис. 4.26.
U2 8
Рис. 4.25. Знаковый орграф к упражнениям § 4.4
Рис. 4.26. Взвешенный орграф к упражнениям § 4.4
а. Пусть значение вершины и2 увеличивается на единицу в момент времени 0.
Что произойдет с вершиной и4 в момент времени t = 1?
б. Пусть значения вершин иъ и ы4 увеличиваются на единицу в момент времени 0.
Что произойдет с вершиной щъ момент времени t = 1?
') Конечно нет априорного способа узнать это; было бы полезно иметь критерии
"допустимости" нормативов.
183
4. К взвешенному орграфу, изображенному на рис. 4.26, применить теорему 4.41
для вычисления р2C) и и2 C) в простом импульсном процессе с начальной вершиной
иъ при условии, что У(исх) = @, 0, 0, 0).
5. К знаковому орграфу, изображенному на рис. 4.25, примените теорему 4.4 для
вычисления рг C) и и3 C) в простом импульсном процессе с начальной вершиной и2
при условии, что V (исх) = @,0,0,0). Проверить результат, определяя все пути из и 2 в иъ
длины 3 и не превосходящей 3 соответственно.
6. Будем считать, что для взвешенного орграфа, изображенного на рис. 4.21, я,
единицей измерения времени является один год. На сколько изменится уровень
дные
Растения^
Травоядные
Кролика
Рис. 4.27. Экосистема кролики и лисы
Рис.4.28. Экосистема растения - травоядные - плотоядные (Levins)
Рис. 4.31
Рис. 4.29. Экосистема мыши - крысы - орлы (Levins)
Рис. 4.30. Знаковый орграф к упражнениям § 4.4
Рис. 4.31. Знаковый орграф к упражнениям 14 и 15 § 4.4
внутренних инвестиций за три года, если в настоящий момент общественное доверие
увеличилось на одну единицу? Как изменится ответ, если использовать взвешенный
орграф, изображенный на рис. 4.21, б?
7. В следующих трех упражнениях использовать результаты этой главы для анализа
экосистем. Более подробные сведения об экосистеме, рассмотренной в упражнении 7,
можно найти в книге (Kemeny, Snell [1962, гл. 3]. Описания экосистем из
упражнений 8 и 9 можно найти в работе Левинса (Levins [ 1974] У ). Мы вернемся к
рассмотрению этих, а также других экосистем в упражнениях § 4.6. Представим себе
простейшую экосистему, состоящую из кроликов и лисиц. Допустим, что имеются
неограниченные запасы пищи, подходящей для кроликов, и что лисицы питаются только
кроликами. Отношения между лисицами и кроликами могут быть выражены в обобщенном
виде знаковым орграфом, представленным на рис. 4.27. (Рост числа кроликов
увеличивает число лисиц, поскольку они имеют тогда больше пиши. К тому же за счет
размножения увеличивается и число кроликов. Рост числа лисиц приводит к
уменьшению числа кроликов, так как лисы питаются кроликами, и к уменьшению затем числа
лисиц, конкурирующих между собой в поисках пищи и частично погибающих.)
х) Заметим, что в работе Левинса знак дуги (*,-,*/) понимается, как воздействие
изменения в х, на скорость изменения Xj. Автор вкладывает в знак несколько другой
смысл и просит читателя пользоваться его интерпретацией.
184
Вычислить импульсы и значения вершин за три периода времени и проследить, что
произойдет, если количество кроликов в начальный момент возрастает на единицу.
(Предположить, что V (исх) = A0,10).) Пояснить смысл полученных результатов.
8. На рис. 4.28 приведена экосистема, состоящая из трех видов: растения,
травоядные и плотоядные животные с ограниченным количеством питательных веществ для
растений. Плотоядные уничтожают травоядных, а те в свою очередь - растения. По
мере роста числа растений между ними начинается борьба за питательные вещества
и некоторые из растений гибнут. Вычислить импульсы и значения вершин за четыре
временных периода, следующих за начальным единичным увеличением количества
растений.(Предположить, что V (исх) = A0,10,10).) Пояснить смысл полученных
результатов.
9. На рис. 4.29 представлена простейшая экосистема из двух видов - мышей и
крыс, борющихся за доступные источники пиши. И те и другие являются добычей
одного хищника - орла. Проследить за импульсами и значениями вершин за четыре
временных периода, следующих за начальным единичным приростом числа мышей.
(Предположить, что V (исх) =A0,10,10)). Пояснить смысл полученных результатов.
10. Для взвешенного орграфа, изображенного на рис. 4.26, применить теорему 4.5
для вычисления Р C) в автономном импульсном процессе с Р @) = A, 0,1, 0).
11. Будем считать, что в знаковом орграфе, изображенном на рис. 4.24, единичные
начальные импульсы вводятся в вершины их и«4. Вычислить Р C).
12. Сформулировать обобщение теоремы 4.3 для взвешенных орграфов.
13. Вычислить р2 C) и v2 F) для простого импульсного процесса с начальной
вершиной их в знаковом орграфе, изображенном на рис. 4.30, если воздействие
(их, и2У длится две единицы времени, воздействие (и19 иг) - две единицы времени,
воздействие (и2, и3) - три единицы времени и воздействие (иэ> и2) - одну единицу
времени.
14*. Рассмотреть проблему выбора стратегий для знакового орграфа,
изображенного на рис. 4.31, с вектором нижних ограничений m = @, 5, 1), вектором верхних
ограничений М =A0,10,10) и V(исх) =@,0,0) (см. § 4.3 для определения m и М).
а. Определить какой начальный импульс позволяет наиболее быстро удовлетворить
этим ограничениям.
б. Если однажды ограничения были выполнены, будут ли они выполняться после
этого?
в. Найти пару векторов нижних и верхних ограничений, которые не могут быть
реализованы введением простого начального импульса.
15*. Рассмотреть знаковый орграф, изображенный на рис. 4.31. Выписать уравнения
G) для автономного импульсного процесса. Получить их точное решение в терминах
Р\ @), р2 @) и р3 @). Считая, что Р@) = <1, 0, 0), вычислить Р D), используя это
точное решение.
16. Доказать для знакового орграфа/? теорему 4.4, используя теорему 4.3.
17. Для некоторых взвешенных орграфов, изображенных на рис. 4.15 - 4.21,
определить несколько простых начальных импульсов, которые могут соответствовать
реальным стратегиям, и проследить за ними в течение нескольких временных периодов.
18. Придумать несколько различных правил изменения значений вершин, не
совпадающих с правилом импульсного процесса.
§ 4.5. Устойчивость импульсных процессов
4.5.1. Определение устойчивости. Имеется много различных определений
устойчивости импульсных процессов во взвешенных орграфах. Выделим
два основных понятия. Первое относится к значениям величин
(параметров) Vj(t), соответствующих вершинам орграфам/. Это понятие абсолютной
устойчивости и оно требует, чтобы значение ty(f) вершины щ не было
слишком большим по величине (абсолютной величине). Второе касается величин
импульсов Pj(t), прилагаемых к вершинам иг Это понятие импульсной
устойчивости и согласно ему изменение значения Vj(t) вершин м7, т.е.
импульс Pj(i), не должен быть слишком большим по абсолютной величине.
185
Экспоненциальный рост Линейный рост
Рис. 4.32. Экспоненциальный рост и/(О = а* при а > 1 импульсно и абсолютно
неустойчив. Линейный рост vj(Г) = л/ +Ь при л =? 0 импульсно устойчив, но не абсолютно
устойчив. Импульсы показаны пунктирными линиями. Сплошные кривые проведены
через дискретные точки
Более строго, вершина щ называется импульсно устойчивой в импульсном
процессе, если последовательность
(I рД01:' = 0,1,2,...)
ограничена, т.е. найдется такое положительное число В, что I Pj(t) \ <В для
всех t. Будем говорить, что вершина uj абсолютно устойчива, если
последовательность
ограничена.
Взвешенный орграф называется импульсно (абсолютно) устойчивым О
в импульсном процессе, если этим свойством обладает каждая его вершина.
Для примера положим Vj(t) = 2Г; тогда вершина щ обладает свойствами
импульсной и абсолютной неустойчивости, поскольку, если t > 0, то
-"/('--1) = 2'-
'~*= 2'-
и обе последовательности{2*} и{2г~1} не ограничены. (Аналогичные
выводы справедливы и для произвольной экспоненциально растущей
функции Vj(i) = а* при а > 1 (рис. 4.32). Однако, если Vj(t) = а*, 0 < а < 1,
в вершине и} имеет место импульсная и абсолютная устойчивость. (Что
произойдет, если Vj(t) -а1 и а <0?).) Если Vj(t) = 2t + 5, то вершина ц9
оставаясь все еще абсолютно неустойчивой, становится теперь импульсно-
устойчивой, поскольку Pj(t) - 2 при всех t> 0. Аналогичные выводы
справедливы для линейного роста в общем случае (рис. 4.32).
1) В оригинале "impulse (value) stability". Мы сочли возможным
понятия как "импульсная (абсолютная) устойчивость". (Примеч. пер.)
186
перевести эти
В любом импульсном процессе абсолютная устойчивость (в вершине и/)
означает и импульсную устойчивость (в вершине му), поскольку при t > О
1 Р/@ I = I vf(f) - vs(t - 1) К I иДО | + I vj(t - 1) |.
Таким образом, если последовательность {I Vj (г) 1} ограничена числом В9
To\Vj(t)\<BH\Vj(t— 1) | < В, а значит последовательность { I р;( t) | }
ограничена числом 22?. С другой стороны, импульсная устойчивость не влечет
абсолютной устойчивости. Рассмотрим, например, положительный 2-контур
D на рис. 4.33. В простом импульсном процессе с начальной вершиной их
+ uf
Рис. 4.33. Положительный 2-контур
Рис. 4.34. Взвешенный орграф с характеристическим многочленом
¦ \2 (\3 - 8)
импульс P\{t) всегда равен 0 или 1, но Vi(t) увеличивается на единицу
через каждые два периода времени. Это и означает импульсную
устойчивость, но не абсолютную устойчивость вершины их. Импульсная или
абсолютная неустойчивость для взвешенного орграфа предупреждают нас о том,
что в системе "что-то должно случиться". Это вынуждает изменить ее
фундаментальную структуру прежде, чем какие-либо значения вершин или
импульсы станут слишком большими.
4.5.2. Собственные значения и устойчивость. В этом и следующем
пунктах мы приведем несколько теорем относительно устойчивости взвешенных
или знаковых орграфов, находящихся под воздействием импульсных
процессов. Эти теоремы будут применяться в § 4.6 к примерам, которые
уже рассматривались ранее. Теоремы данного пункта утверждают, что
проверка устойчивости орграфа D сводится к исследованию простых вопросов
об его собственных значениях. В первой теореме говорится, что для
получения некоторых интересующих нас результатов необходимо вычислять
абсолютные величины собственных значений. (Напомним, что собственным
значением служит комплексное число а + bin его абсолютная величина
равна \Ja2 + b2. Действительное число а имеет абсолютную величину \]с? =
= \а I.)
Теорема 4.6 х). Если взвешенный орграф!) импульсно устойчив для всех
простых импульсных процессов, то каждое собственное значение D по
абсолютной величине не превосходит единицу.
Доказательство теоремы мы перенесем в § 4.7. Применяя ее, обычно
используют обратную формулировку: если взвешенный орграф D имеет
собственное значение, превосходящее по абсолютной величине единицу,
то D импульсно неустойчив для некоторого простого импульсного процесса.
1) Эта теорема была впервые сформулирована в такой форме Робертсом и
Брауном (Roberts, Brown [1975]).
187
Проиллюстрируем эту теорему на примере взвешенного орграфа,
изображенного на рис. 4.34. В данном случае простые вычисления показывают,
что С(Х) = Х2(Х3 — 8). Таким образом, X = 2 есть собственное значение.
По теореме 4.6 мы получаем* что данный взвешенный орграф импульсно-
неустойчив для некоторого простого импульсного процесса. Другими
словами, найдется такая вершина, в которую поступает начальный импульс,
что в некой (возможно, другой) вершине импульс станет сколь угодно
большим. Однако этот взвешенный орграф не является импульсно-неустой-
чивым для всех простых импульсных процессов. (Рассмотреть, например,
простой импульсный процесс с начальной вершиной и5.)
Теперь сформулируем следствие к теореме 4.6.
Следствие. Если целочисленно-взвешенный орграф/)импульсно устойчив
для любых простых импульсных процессов, то каждое ненулевое
собственное значение равно по абсолютной величине единице.
и2
Рис. 4.35
П
Рис. 4.36
Рис. 4.35. Взвешенный орграф с характеристическим многочленом
Рис. 4.36. Знаковый орграф имеет собственные значения 1,1, но импульсно неустойчив
для простого импульсного процесса с начальной вершиной и 1
Рис. 4.37. Взвешенный орграф с характеристическим многочленом
\4 - 0,512 \
Доказательство. По теореме 4.6 абсолютная величина каждого
собственного значения не больше единицы. Напомним, что собственные
значения орграфа D определяются собственными значениями его матрицы
смежности А. Пусть
С(Х)=
Z я,-У
= 1
есть характеристический многочлен матрицы А. Если / — наименьшее
целое число, для которого я,- Ф 0, то
С(Х) =
X +. . . +ап
Ненулевые собственные значения орграфа D совпадают со множеством
корней многочлена щ + я,- + г X + ... + ап \п ~1. Поскольку произведение
корней многочлена равно постоянному члену, умноженному на ± 1,
получаем, что произведение всех ненулевых собственных значений D равно ± щ.
Так как все элементы матрицы А целочисленны, то и я,- — целое. (Почему?)
А тогда, так как каждое ненулевое собственное значение не превосходит
188
по абсолютной величине единицу, получаем, что в/ = ± 1 и, следовательно,
каждое ненулевое собственное значение равно по абсолютной величине
единице. ¦
Чтобы проиллюстрировать, как применяется это следствие, заметим, что
знаковый орграф на рис. 435 имеет характеристический многочлен С(Х) =
= Х(Х3 + X + 1). Для многочлена
ДХ) = Х3+Х+1, /@)= 1 и Д-1)=-1.
Мы находим, что / имеет действительный корень строго между 0 и —1, и
поэтому существует собственное значение, по абсолютной величине
меньшее 1. (Такой тип рассуждений очень плодотворен при применении теорем
о собственных значениях.) Согласно следствию (так как все веса равны 1
или —1) этот знаковый орграф импульсно неустойчив для некоторого
простого импульсного процесса.
Заметим, что теорему 4.6 можно также применять к знаковым орграфам.
Однако следствие дает нам более сильное средство для этого специального
случая. Теорема, обратная к теореме 4.6 неверна. В качестве примера
рассмотрим знаковый (взвешенный) орграф, изображенный на рис. 4.36.
Его собственные значения равны 1, 1 (т.е. 1 имеют кратность 2), но он
импульсно неустойчив для простого импульсного процесса с начальной
вершиной Mi, поскольку здесь /?2@">о° (Почему?) Теорема, обратная
к теореме 4.6, справедлива, если ненулевые собственные значения
взвешенного или знакового орграфа различны, т.е. нет кратных собственных
значений за исключением, возможно, нулевых. Это упрощающее допущение,
выполняемое в большинстве практических ситуаций, может быть заменено
другим, что мы сделаем в § 4.7. Теперь сформулируем обратную теорему
для этого частного случая.
Теорема 4.7 *). Пусть все ненулевые собственные значения взвешенного
орграфа D различны и не превосходят по абсолютной величине единицы.
Тогда D импульсно устойчив для всех простых импульсных процессов.
Доказательство этой теоремы мы также оставляем до § 4.7.
Для иллюстрации теоремы 4.7 воспользуемся взвешенным орграфом,
изображенным на рис. 4.37. Характеристический многочлен этого
взвешенного орграфа равен
С(Х) = Х4- 0,512 Х = Х(Х3 -0,512).
Корнями С(Х) служат 0; 0,8; 0,4(-1 +/\/3) и 0,4(-1 -/\/3). Ненулевые
собственные значения различны и по абсолютной величине не превосходят
единицу. Например, абсолютная величина числа 0,4 (-1 +1 >/3) равна
\Д- 0,4J + @,4 yjbf = V0,16 + 0,48 = ч/О64 = 0,8.
Поэтому взвешенный орграф импульсно-устойчив для всех простых
импульсных процессов. Читатель не должен забывать о необходимости
проверки гипотезы о различии ненулевых собственных значений. Если
*) Эта теорема была сформулирована в таком виде для знаковых орграфов в
работе Brown, Roberts, Spencer [1972] и в более общей форме - в работе Roberts,
Brown [1975].
189
ненулевое собственное значение является кратным, то теорема не
применима. (Случай кратных собственных значений будет обсуждаться в § 4.7.)
Следующая теорема характеризует свойство абсолютной устойчивости.
Теорема 4.8 О. Взвешенный орграф D абсолютно устойчив для любого
простого импульсного процесса тогда и только тогда, когда D импульсно-
устойчив для любого простого импульсного процесса и среди собственных
значений D нет равного единице.
Как и ранее, откладываем доказательство теоремы 4.8 до § 4.7.
Согласно нашим предыдущим результатам взвешенный орграф D на
рис. 4.37 импульсно устойчив для всех простых импульсных процессов,
поскольку его собственные значения равны
0; 0,8; 0,4(-1 +iy/2); 0,4(-l -/л/5).
Так как единица не является собственным значением, мы приходим к
вьюоду, что орграф/) также абсолютно устойчив для всех простых
импульсных процессов.
4.5.3. Структура и устойчивость. Розы. Прежде чем применять
результаты этого параграфа к § 4.6, заметим, что сформулированные теоремы не
исчерпывают, всего круга интересующих нас вопросов. Эти результаты
можно использовать для проверки устойчивости знакового или
взвешенного орграфа или даже для проверки того, приведут ли некоторые изменения
в орграфе к устойчивому состоянию, но они не могут помочь выяснить
тип необходимых изменений. Более полезны теоремы, которые должны
связывать устойчивость со структурой рассматриваемого орграфа, и
помогать нам выявлять стабилизирующие стратегии, показывая, какие
структурные изменения могли бы привести к устойчивости. О том, как структура
воздействует на устойчивость, известно немного. Тем не менее, мы
приведем здесь некоторые результаты, касающиеся этого вопроса. Однако не
вызывает сомнения, что основные математические исследования еще
впереди.
Чтобы продемонстрировать примеры результатов, связывающих
устойчивость со структурой рассматриваемого орграфа, ораничимся
рассмотрением определенного класса орграфов. Хотя читателю может показаться
этот класс слишком специальным, оказывается, что в него попадают многие
орграфы, возникающие при исследовании сложных систем. Назовем орграф
розой, если он состоит из центральной вершины х и непересекающихся
контуров, выходящих из х 2). Примеры знаковых орграфов, являющихся
розами, приведены на рис. 4.38. Более общее понятие— обобщенная роза;
это сильно связный орграф Д центральная вершина х которого
принадлежит всем его контурам. Конечно, всякая роза оказывается и обобщенной.
На рис. 4.39 представлено несколько (знаковых) обобщенных роз,
отличных от роз.
Предположим, что орграф D — обобщенная знаковая роза. Пусть а%
обозначает сумму знаков контуров длины 4 если плюс считается +1, а
1) Эта теорема была впервые сформулирована в такой форме в работе Roberts,
Brown [1975].
2) В этом орграфе (в оригинале "rosette") x - единственная общая вершина всех
контуров. (Примеч. пер.)
190
+Г 1+
х
Рис. 4.38. Примеры (знаковых) роз. Центральная вершина обозначена через х
Рис. 4.39. Примеры обобщенных знаковых роз, не являющихся розами. Центральная
вершина обозначена через х
минус считается —1. И пусть s есть такое наибольшее целое, что а5 Ф 0. Если
4=0 при всех i, положим s = 0. Если s » 0, орграф /> импульсно и
абсолютно устойчив для всех простых импульсных процессов (см. упражнение 18).
Если s > 0, то свойства устойчивости орграфа D полностью определяются
лепестковой последовательностью (аи а2,... >4)«
Теорема 4.9. Если две обобщенные розы Dx nD2 имеют одинаковые
лепестковые последовательности, то орграфы Dx nD2 импульсно (абсолют
но) устойчивы для всех простых импульсных процессов одновременно.
Доказательство. См. упражнение 17.
Используя понятие лепестковой последовательности, можно получить
много результатов, относящихся к устойчивости. Следующие две теоремы
впервые появились в работах Brown, Roberts, Spencer [1972] и Roberts,
Brown [1975]. Их доказательства опущены (см. упражнение 14).
Теорема 4.10. Пусть орграф D *- обобщенная знаковая роза с
лепестковой последовательностью (аи а2>..., as), s > 0. Если D импульсно
устойчив для всех простых импульсных процессов, то:
a.e,s±l; б. 4 s (-**L-i> / = 1,2, ...,s-l.
Теорема 4.11. Пусть орграф D — обобщенная знаковая роза с
лепестковой последовательностью (а х, а2,..., as ), s > 0 и D - импульсно устойчив
Для всех простых импульсных процессов. Тогда D абсолютно устойчив для
всех простых импульсных процессов тогда и только тогда, когда
i = 1
Для иллюстрации теорем 4.10 и 4.11 рассмотрим обобщенную знаковую
розу на рис. 4.40. В этом орграфе имеется два контура длины 3, один
положительный, а другой отрицательный; поэтому а$ = 0. Имеется два
191
Рис. 4.40. Несколько обобщенных знаковых роз
контура длины 2, оба они положительны, поэтому а2 = 2. Контуры длины 1
отсутствуют. Таким образом, s = 2 и лепестковая последовательность
имеет вид @,2). Так как as Ф ± 1, теорема 4.10 означает, что D\ импульсно -
неустойчив для некоторого простого импульсного процесса. В качестве
другого примера рассмотрим обобщенную знаковую розу D2 на рис. 4.40.
Лепестковая последовательность имеет вид @, —2, 3) и по-прежнему,
так как а5Ф±1, теорема 4.10 означает, что орграф D \ импульсно
неустойчив для некоторого простого импульсного процесса. Пусть орграф D2
получен из орграфа D2i изменением знака дуги (х, а) с плюса на минус. Тогда
D2имеет лепестковую последовательность @, —2, 1), и поэтому условие
as = ± 1 удовлетворяется, поскольку ах Ф(-аъ)а2. Таким образом, D2
также остается импульсно неустойчивым для некоторого простого
импульсного процесса. (Читателю следует обратить внимание на то, что свойства
устойчивости орграфа D2yl более простой обобщенной знаковой розы D3i
изображенной на рис. 4.40, по теореме 4.9 совпадают, поскольку последняя
также имеет лепестковую последовательность @, —2, 1).
Теорема 4.10 предлагает потенциально стабилизирующую стратегию:
сделать положительным один из контуров длины 2, чтобы получить а2 = 0.
Действительно, если D2 получается из D2 изменением знака дуги (Ь, х)
с минуса на плюс, тогда D2 имеет лепестковую последовательность @,051)
Она удовлетворяет обоим условиям теоремы 4.10. Однако мы не можем
сделать заключение об импульсной устойчивости, так как теорема 4.10
дает лишь необходимые, но не достаточные условия. Свойство импульсной
устойчивости необходимо проверить, используя другие методы, например,
теорему 4.7. Это не слишком трудно сделать, если мы воспользуемся тем
(Roberts, Brown [1975]), что характеристический многочлен обобщенной
розы равен
C(X) = (-l)"X"-W- 2 щ\8~1).
i = 1
В нашем примере С(Х) = - Х4(Х3 - 1). Таким образом, мы обнаружили, что
орграф D2 действительно импульсно устойчив для всех простых
импульсных процессов. Его собственными значениями служат 0, 0, 0, 0, 1, -% +
+ / \/з/2, — Ы — iy/3/2. Ненулевые собственные значения различны и равны
по абсолютной величине единице. (Этот результат об импульсной
устойчивости также следует из другого рассуждения: свойства устойчивости D2
и единственного положительного контура длины 3 совпадают.)
192
Теперь, используя теорему 4.11, исследуем свойство абсолютной
устойчивости. Поскольку аг + аг + аъ = 1, значит, D абсолютно неустойчив
для некоего простого импульсного процесса. (Это также следует из
эквивалентности в определенном смысле орграфа D'2f положительному
контуру длины 3 или из замечания, что 1 является собственным
значением.) Бели снова вернуться теперь к орграфу D2, то, изменяя знаки дуг
(х, а) и (х, Ь) с плюса на минус, получим потенциально абсолютно
устойчивый знаковый орграф. В самом деле, лепестковая последовательность имеет
вид @, 0, —1), поэтому условия а и б теоремы 4.10 удовлетворяются так
же, как условие Ъ<цФ\ теоремы 4.11. Теорема 4.7 теперь означает, что
i = 1
эти изменения приводят к импульсной устойчивости, так как
и собственные значения равны 0, 0, 0, 0, -1, 1/2 + / \/з72, 1/2 - / V3/2. Из
теоремы тогда следует абсолютная устойчивость, поскольку ах + а2 + аъ =
= - 1. (К этим результатам также приводит совпадение свойств
устойчивости новой обобщенной розы и единственного отрицательного контура
длины 3.)
Суммируя сказанное, заметим, что теоремы 4.10 и 4.11 можно
использовать для нахождения потенциальных импульсно и абсолютно
стабилизирующих стратегий. Всякое изменение знаков, приводящее к лепестковой
последовательности, удовлетворяющей условиям а и б теоремы 4.10,
является потенциально импульсно стабилизирующим. Если к тому же для
S
полученной лепестковой последовательности 2 Я/^1, то это изменение
I « 1
также потенциально абсолютно стабилизирующее.
Упражнения
1. Пусть для импульсного процесса во взвешенном орграфе иу(Г) определяется
следующим образом:
а. и(Г) = 3'; б. u.(f) = 5f + 6; в. vAt) = 5;
г. vf (Г) = (-2)*; д. ty(О = A/2)'; е. vf (t) = (-1/2)';
ж. u7.(f) = (-l)'; з. uy(r) = (l/2)r+100;
и. yr)^ A/2)'+100; к. tyW^sinf.
Будет ли вершина us абсолютно устойчива в каждом процессе?
2. Вычислить pj(t) и выяснить, является ли вершина Uj импульсно устойчивой для
процессов из упражнения 1.
з. Ниже перечислены собственные значения взвешенного орграфа. Что» можно
сказать об импульсной устойчивости для простого импульсного процесса? Об
абсолютной устойчивости? Объясните ответ.
а. 0,1,-1,/,-/,5; 6.09i^,-iyj3; в. 1/2,/,-/;
г. 1/2,1,-1; д. 1/2,1/2,/,-/; е. 0, 0,1/2,/,-/;
ж. 0, A/2)/, (-1/2)/; 3.0,-1,1,/,-/; и. 0,6, 6,1.
4. Предположим, что при вычислении собственных значений знакового орграфа
получены числа, приведенные в упражнении 3. (Они не обязательно составляют полное
13. Ф.С. Роберте 193
а б в
Рис. 4.41. Взвешенные орграфы к упражнению 11 § 4.5
Рис. 4.42. Знаковые орграфы к упражнению 12 § 4.5
множество собственных значений.) Что можно сказать в каждом случае об
импульсной устойчивости для простого импульсного процесса? Об абсолютной устойчивости?
5. Определить лепестковые последовательности для знаковых роз, изображенных
на рис. 4.38.
6. Определить лепестковые последовательности для обобщенных знаковых роз,
изображенных на рис. 4.39.
7. Предположим, что лепестковая последовательность обобщенной знаковой розы
задается следующим образом:
а. A, 0, 2); б. (О, -1, 2, 1); в. @,1, 0, 1); г. (О, 5, -5, 0, 1).
Что можно сказать об импульсной устойчивости в каждом случае?
8. Пусть лепестковая последовательность обобщенной знаковой розы D имеет
вид @, 1, 0, -1, 1). Можно ли сделать вывод об абсолютной устойчивости ?без
дополнительной информации? Ответить на тот же вопрос в случаях лепестковой
последовательности вида @, 0, 0, 2) или @,1, 0,1) ?
9. Привести пример сильно связного орграфа, не являющегося обобщенной розой.
10. Дать словесную формулировку условия 2д/ Ф 1 в теореме 4.11.
11. Для взвешенных орграфов, изображенных на рис. 4.41, определить следующее.
а. Будут ли эти орграфы импульсно устойчивы для всех простых импульсных
процессов?
б. Будут ли они абсолютно устойчивы для всех простых импульсных процессов?
194
12. К знаковым орграфам, изображенным на рис. 4,42, применить теорию роз.
а. Будут ли эти орграфы импульсно устойчивы для всех простых импульсных
процессов?
б. Будут ли они абсолютно устойчивы для всех простых импульсных процессов?
в. Если орграф не является импульсно устойчивым, найти стратегию, состоящую
в изменении одного знака, которая оказывается потенциально импульсно
стабилизирующей в том смысле, что выполнены необходимые условия теоремы 4.10, или
доказать ее отсутствие. (Если обнаружена такая потенциальная стратегия, как
определить, что она действительно импульсно стабилизирующая?)
г. Если орграф не является абсолютно устойчивым, найти стратегию, состоящую
в изменении одного знака, которая оказывается потенциально абсолютно
стабилизирующей в том смысле, что выполнены необходимые условия теорем 4.10 и 4.11,
или доказать ее отсутствие. (Если обнаружена такая потенциальная стратегия, как
определить, что она действительно абсолютно стабилизирующая?)
13. а. Доказать, что, если среди собственных значений знакового орграфа имеется
ненулевое, то по крайней мере одно из них по абсолютной величине не меньше
единицы. (Указание. Прочитать доказательство следствия из теоремы 4.6.)
б. Для каждого множества собственных значений в-ж в упражнении 3 показать,
что это множество не может быть полным множеством собственных значений
знакового орграфа. (Указание. Снова использовать доказательство следствия из
теоремы 4.6.)
14. Мы уже замечали, что, если обобщенная знаковая роза D имеет лепестковую
последовательность (fllfa2 as), то ее характеристический многочлен С (\) имеет
вид s
/
Используя это, показать
а. Если орграф D импульсно устойчив для всех простых импульсных процессов,
то в, = ±1.
б. Если орграф D импульсно устойчив для всех простых импульсных процессов,
то D абсолютно устойчив для всех простых импульсных процессов тогда и только
s
тогда, когда 2 а* Ф 1.
/=1
15. Предположим, что некоторая сильная компонента взвешенного орграфа D
импульсно (абсолютно) устойчива для некоторого простого импульсного процесса.
Показать, что D импульсно (абсолютно) неустойчив для некоторого простого
импульсного процесса. (Указание. Если некоторый путь выходит из сильной компоненты, он
может больше в нее не вернуться.)
16*. Если каждая сильная компонента взвешенного орграфа D импульсно
устойчива для всех простых импульсных процессов, означает ли это, что и D импульсно
устойчив для всех процессов? (Привести доказательство или противоречащий прь-
мер.) Проделать то же самое для свойства абсолютной устойчивости.
17*. В упражнениях 17-26 читатель может воспользоваться теоремой 4.3. В
большинстве этих упражнений формулируются результаты работы Roberts [1974a].
Говорят, что вершина щ взвешенного орграфа D внутренне абсолютно устойчива, если
последовательность { |v/(f)|} ограничена при всех t в простом импульсном процессе
с начальной вершиной щ и щ (исх) = 0. Аналогично вершина щ внутренне импульсно
устойчива, если последовательность { |/?/(О1} ограничена в простом импульсном
процессе с начальной вершиной щ. Например, в обобщенной знаковой розе Dx
(рис. 4.40), если х = щ теорема 4.3 утверждает, что P/Bj) - 2J. Для любого
заданного пути Р длины 2s из щ в и/, использующего один из контуров длины 3, имеется
соответствующий путь противоположного знака Q длины 2s, включающий вто|юй
контур длины 3 каждый раз, когда Р использует первый контур и - первый контур,
когда Р включает второй. Кроме того, имеется 2* путей длины 2s из щ в щ,
включающих контуры длины 2. Таким образом, вершина хне является внутренне
импульсно устойчивой. Поэтому она не будет и внутренне абсолютно устойчивой.
а. Показать, что обобщенная знаковая роза абсолютно устойчива для всех простых
импульсных процессов тогда и только тогда, когда она внутренне абсолютно
устойчива в центральной вершине
13* 195
б. Проделать то же самое для свойства импульсной устойчивости.
в. Показать, что, если две обобщенные розы имеют одинаковые лепестковые
последовательности, то они имеют одинаковые свойства устойчивости (см.
теорему 4.9).
18. Пусть D — обобщенная знаковая роза и s = 0. Показать, что D — импульсно и
абсолютно устойчива для всех простых импульсных процессов. (Указание.
Использовать упражнение 17.)
19. Показать, что вершина взвешенного орграфа может быть внутренне абсолютно
устойчивой, но не абсолютно устойчивой для всех простых импульсных процессов.
Ь
Рис. 4.43. Знаковый орграф к упражнению 20 § 4.5 (Roberts [1974л])
Рис. 4.44. Знаковый орграф к упражнению 21 § 4.5 (Roberts [1974 a])
20. Воспользовавшись знаковым орграфом, изображенным на рис. 4.43, показать,
что внутренняя абсолютная устойчивость в каждой вершине не означает абсолютной
устойчивости для всех простых импульсных процессов.
21. Воспользовавшись знаковым орграфом, изображенным на рис. 4.44, показать,
что, если даже знаковый орграф сильно связен, то внутренняя абсолютная
устойчивость в каждой вершине не означает абсолютной устойчивости для любого простого
импульсного процесса. (Этот пример предложен Дж. Спенсером.)
22. Предположим, что знаковый орграф D сбалансирован в смысле упражнения 14
§ 3.1. Обязательно ли D абсолютно неустойчив для некоторого простого импульсного
процесса? (Привести доказательство или противоречащий пример.) Верно ли это, если
в D имеется контур?
23. Показать, что, если знаковый орграф D сбалансирован и имеет сильную
компоненту, содержащую более одной вершины, то D абсолютно неустойчив для некоторого
простого импульсного процесса.
24. Доказать, что если знаковый орграф D сбалансирован, то вершина х в D
абсолютно неустойчива для некоторого простого импульсного процесса тогда и только
тогда, когда х достижима из вершины у, принадлежащей контуру.
25. Будет ли верен результат упражнения 24, если предположение о том, что
каждый контур в D положителен, заменить условием сбалансированности орграфа ?>?
(Привести доказательство или противоречащий пример.)
26. Следует ли из отрицательности всех полуконтуров знакового орграфа D
абсолютная устойчивость D для всех простых импульсных процессов? (Привести
доказательство или противоречащий пример.)
27. Используя теорию обобщенных роз, объяснить почему они обычно неустойчивы,
если большинство контуров имеет одинаковый знак? (Указание. Рассмотреть
замкнутые пути из центральной вершины.)
28*. Может ли взвешенный орграф D содержать контуры, если его собственные
значения равны 0? Привести ответ.
(Замечание. Упражнения, использующие результаты этого параграфа можно найти
в §4.6.)
196
§ 4.6. Применение теории устойчивости
В этом параграфе мы применим теоремы, характеризующие свойства
устойчивости, к ряду знаковых и взвешенных орграфов, изображенных
на рис. 4.7, 4.8, 4.15 и 4.16. К полученным выводам следует относиться
лишь как к предварительным и предположительным — они зависят от
ограничительных допущений модели.
Начнем с рассмотрения знакового орграфа на рис. 4.7. Вычислением
получаем, что его характеристический многочлен С(Х) равен - Х2(Х5 -
— X — А2 — 1). Далее/(X) = Xs — X3 - X2 — 1 имеет действительный корень
строго между 1 и 2, так как/A) = -2 и/B) = 19. Таким образом, у
знакового орграфа есть собственные значения по величине, превосходящие 1.
По теореме 4.6 знаковый орграф импульсно и абсолютно неустойчив для
некоторого простого импульсного процесса. Внешний импульс в некоторой
вершине вызовет в дальнейшем все большие й большие импульсы и
значения в какой-нибудь (возможно, другой) вершине. Этот результат можно
проинтерпретировать следующим образом: если мы полагаем, что ни одна
переменная не может стать сколь угодно большой, но система, по крайней
мере в настоящем виде, приводит к произвольно большим импульсам и
значениям в какой-нибудь вершине, то структура системы должна
измениться. Было бы целесообразно попытаться минимизировать влияние этого
изменения, предвидя его и сознательно выбирая "наилучшее" из ряда
возможных изменений.
Одним из таких изменений, является "обращение структуры расценок",
заставляющее более крупных потребителей электричества платить больше
за киловатт-час, чем мелкчх. Давайте теперь рассмотрим эффект от такого
изменения. Для этого изменим знак дуги (U9 R) с минуса на плюс и
выясним будет ли устойчивым полученный знаковый орграф. Снова проводя
вычисления, находим характеристический многочлен для этого нового
знакового орграфа вида
С (К) = -Х2(Х5 + X3 - X2 - 1) = -Х2(Х - 1) (X2 + 1) (X2 + X + 1).
Поэтому собственные значения равны 0, 0, 1, /, -/, -1/2 + /\/3/2",
-1/2-/л/з72.
Поскольку все ненулевые собственные значения различны и наибольшее
по абсолютной величине равно 1, теорема 4.7 означает, что новый знаковый
орграф импульсно устойчив для всех простых импульсных процессов.
Поэтому, когда начальный импульс вводится где-либо в систему,
изменение (импульс) во всех вершинах в каждый период времени остается
ограниченным. Это, однако, не означает, что и значения вершин остаются
ограниченными. Действительно, поскольку 1 есть собственное значение, из
теоремы 4.8 следует, что знаковый орграф абсолютно неустойчив для некоторого
простого импульсного процесса. Таким образом, наша модель показывает,
что стратегия, состоящая-лишь в обращении структуры расценок, не
оказывается абсолютно стабилизирующей, значения ty(O в некоторых вершинах
будут неограниченными. Эта стратегия будет стабилизирующей лишь в том
смысле, что каждое изменение невелико, причем такое состояние может
быть временным — до тех пор пока в системе потребления энергии не будут
произведены далеко идущие изменения. В частности, обращение структуры
197
расценок замедляет экспоненциальный рост потребления энергии. Напомним
читателю, что наши выводы должны быть оценены при тех ограничительных
допущениях, которые мы сделали. Они должны проверяться с
использованием более сложных взвешенных орграфов, а также и совсем других
моделей сложных систем *).
Стратегия обращения структуры расценок становится абсолютно
стабилизирующей, если мы произведем и второе изменение - изменение знака дуги
(С, F) с плюса на минус. Это должно соответствовать проведению такой
политики, при которой создание новых электростанций непосредственно
вынуждает некоторые предприятия прекращать работу. Конечно, такую политику
нелегко осуществить! Однако она, совместно с обращением структуры
расценок, должна быть абсолютно стабилизирующей. Чтобы показать это,
рассмотрим знаковый орграф, полученный из орграфа, изображенного на
рис. 4.7, изменением знаков дуги (U, R) и (С, F) на противоположные.
Тогда характеристический многочлен принимает вид
С(Х)= -Л2(А5 +Х3 +\2 + 1) = -Х2(Х+ 1)(Х2 + 1)(Х2 -Х+ I)
и его корни равны 0, 0, -1, /, -/, 1/2 + /%/3/2, 1/2 - iy/Щ. По теореме 4.7
этрт знаковый орграф импульсно устойчив для всех простых импульсных
процессов. Из теоремы 4.8 следует тогра, что он и абсолютно устойчив.
Мы видели, что анализ собственных значений позволяет оценивать
потенциально хорошие стратегии. Однако, как определять такие стратегии,
не вычисляя собственных значений? Теоремы о розах из п. 4.5.3
оказываются для этого полезным инструментом. Заметим, что знаковый орграф D
на рис. 4.7 является обобщенной розой с центральной вершиной U.
(Поэтому легко было выписать характеристический многочлен С(Х).) В Dимеется
один контур длины 2, три длины 3 и один длины 5. Следовательно, при
любом изменении знаков в D имеем ах = 0, а2 = ± 1, аг = ± 1 или ±3, а4 = О
и as =±1. Мы имеем, что s =5 и as=±l. Чтобы обеспечить импульсную
или абсолютную устойчивость, согласно теоремам 4.10 и 4.11, at должны
равняться (-as) as_x при /= 1, 2, 3, 4 и ах + а2 +я3 + *4 + *5 *• 1. Эти
условия необходимы, но не достаточны, но они помогут нам определить
потенциальные стратегии. Первое условие всегда выполнено для / = 1 и
/ = 4, так как ах = а4 = 0. Для / = 2,3 оно означает, что а2 = — аьа3.
Поскольку а2 = ± 1 и as = ± 1, то а3 = ± 1. Таким образом, мы ищем такие значения
а2, Яз, <*5 9 Для которых
02 =±1, аг=±1, а5=±1, а2 =-а$аъ, д2+0з+05^1.
Единственными числами, удовлетворяющими этим условиям,
являются а2 =я3 =0s = — 1. Таким образом, потенциальными стратегиями для
достижения импульсной или абсолютной устойчивости оказываются лишь
те, которые приводят к этим трем величинам, возникающим при подсчете
контуров. Чтобы получить а2 = — 1, мы должны изменить знак одной из дуг:
либо (?/, R), либо (R,U). Если был изменен знак дуги (U9 R), то мы мо-
0 Например, можно воспользоваться методами Форрестера (Forrester [1971]),
методами KSIM (Капе [1972]), более традиционным экономическим анализом или
подходом, основанным на анализе импульсных процессов с другим правилом
изменения значений vj(t), в частности, одним из предлагаемых в упражнениях 14 и 15 § 4.7.
198
жем получить аъ = -1 и as = -1, изменяя также знак дуги (C,F). Никакие
другие изменения знака не приведут к этому. Если же был изменен знак
дуги (R, U), то мы можем получить аг = — 1 иа5 = — 1, лишь изменяя знак
одной из дуг: либо дуги (F, J), либо дуги (/, Р). Никакие другие
изменения знака не приведут к этому. Таким образом, мы обнаружили, что
возможными стратегиями для достижения импульсной и абсолютной
устойчивости в знаковом орграфе, изображенном на рис. 4.7, путем
изменения знаков не более чем двух дуг являются лишь следующие: изменить
знак дуг (U9 R) и (С, F); изменить знак дуг (R, U) и (F,/); изменить
знакдуг(Л,?/) и (/,/>).
Предоставляем читателю проинтерпретировать эти и найти другие
возможные стратегии, которые могут обеспечить импульсную и абсолютную
устойчивость. Между прочим, анализ собственных значений показывает,
что все эти три стратегии действительно приводят к импульсной и
абсолютной устойчивости.
Применим теперь развитую выше методологию к знаковому орграфу,
изображенному на рис. 4.8. Напомним читателю, что этот знаковый орграф
построен для анализа проблемы потребления горючего при
внутригородских поездках на работу и был получен на основе суждений экспертов,
причем эксперты не смогли прийти к согласию о знаке дуги ([i], [5]).
Рассмотрим оба случая: когда дуга ([1], №]) положительна и когда она
отрицательна. Характеристический многочлен в обоих случаях вычисляется
легче, чем в предыдущем примере. Орграф имеет шесть сильных
компонент: Кг ={2},К2 ={3}, К3 ={4}, К4 ={6}, Ks ={9} и К6 = {1, 5, 7, 8}.
Тогда, если С/(Х) — характеристический многочлен знакового орграфа,
порожденного вершинами орграфа К{, то из следствия 2 теоремы 4.2 выте-
6
кает, что характеристический многочлен С(Х) = П Q(X).
Далее, Q(X) = -Л при i^6. Для Кб легко доказать, что С6(Х) = Х(Х3 +
+ 2X + 1), если дуга ([I], [5]) положительна и Се (X) = X (X3 + 1), если она
отрицательна. Таким образом, если дуга ([1], [5]) положительна, то
С(Х) =-Х6(Х3 + 2Х+ 1). Многочлен /(X) = X3 + 2Х+ 1 имеет
действительный корень строго между 0 и -1, так как /@) = 1 и /(-1) = -2. Тогда по
следствию из теоремы 4.6 знаковый орграф импульсно, а значит, и
абсолютно, неустойчив для некоторого простого импульсного процесса, если дуга
(U]> [5]) положительна. Если дуга ([i], [5]) отрицательна, то С(Х) =
= — Хб(Х3 + 1). Ненулевые собственные значения равны —1, 1/2 + /V3/2,
1/2 — i VJ/2. По теоремам 4.7 и 4.8 знаковый орграф теперь импульсно и
абсолютно устойчив дня всех простых импульсных процессов.
Непосредственным вычислением для случая положительной дуги ([7],
[5]) можно проверить, что простые стратегии оказываются (импульсно
или абсолютно) стабилизирующими. Простыми стратегиями мы считаем
стратегии, соответствующие изменению знака одной дуги. Абсолютно
стабилизирующими стратегиями, не считая изменение знака дуги ([7],
[5]), оказываются лишь стратегии, состоящие в изменении знака дуг
( U], [8]) или ([5], [1]) (см. упражнения 1 и 4).
Поясним смысл этих выводов с учетом наших ограничительных
допущений. Предполагалось, что, если цены (средние) проездных билетов
199
устанавливаются, как функции дальности поездки с уменьшением цен
по мере увеличения дальности, то система потребления горючего во
внутригородских перевозках будет устойчива. Бели же стоимость проездных
билетов растет по мере увеличения дальности поездки, то это приводит к
неустойчивой ситуации. Тогда имеются две простые стабилизирующие
стратегии: условиться, что дальность поездки убывает по мере роста цены
билетов или, что вероятность опоздания убывает с увеличением дальности
поездки. Основной вопрос тогда состоит в допустимости этих стратегий,
т.е. в возможности их осуществления. Вторая стратегия почти наверное
недопустима. Однако первую можно реализовать, используя систему
"временных цен'9 или более общую систему цен, "учитывающую качество
обслуживания" (сервис), что обсуждалось в работе Vickrey [1968].
Основная идея состоит в том, что цены билетов не остаются неизменными,
а возрастают в часы "пик", внося, таким образом, добавку к постоянным
составляющим стоимости, и понижаются вне их для привлечения
пассажиров. Дальнейшее обсуждение вопросов допустимости стратегий можно
найти в работе Roberts [1973].
Эти результаты должны по-прежнему рассматриваться как
предварительные (и условные) и должны проверяться другими способами. Более
того, читателю следует иметь в виду, что вывод об устойчивости или
неустойчивости для простого импульсного процесса может измениться,
если вводится большее число внешних импульсов для усиления или
противодействия различным тенденциям.
В нашем изложении была выпущена одна возможность, а именно, что
на дуге ([i], [5]) знак отсутствует. Такая ситуация соответствует
допущению об отсутствии влияния дальности поездки на стоимость билета.
(Это могло бы быть, например, в случае бесплатных билетов. Подобная
система была принята в Риме по крайней мере на короткий промежуток
времени.) Анализ устойчивости системы потребления горючего для этого
случая остается читателю как упражнение (см. упражнения 1 и 5).
Обратимся теперь к взвешенному орграфу на рис. 4.15. Он
представляет ситуацию в округе Сан-Диего штата Калифорнии, когда основные
перевозки (как это и было в 1975 г.) осуществляются автомобилями.
Веса для этого орграфа оценивались группой экспертов, изучавших
проблему потребления горючего и поддержания чистоты воздуха в Сан-Диего.
(Более подробно см. в работе Roberts [1974b].)
Легко показать, что единственной сильной компонентой этого
взвешенного орграфа, содержащей более одной вершины, оказывается К-
= {1, 5, 9}. Ее собственные значения равны -0,52; 0,26 + 0,45/ и 0,26-
— 0,45/. Все остальные сильные компоненты не имеют петель, и поэтому
все остальные собственные значения равны1). Поскольку каждое
собственное значение не превосходит по абсолютной величине единицы, ненулевые
собственные значения различны и 1 не является собственным значением,
получаем, что этот орграф импульсно и абсолютно устойчив для всех
простых импульсных процессов.. Однако и потребление горючего и степень
загрязнения воздуха в Сан-Диего быстро растут. Какой же смысл имеет
0 См. упражнение 8 § 4.2. {Примеч, пер.)
200
тогда вывод об импульсной устойчивости в свете этого замечания?
Ошибочен вывод? Или неверна наша модель? Ответ состоит в том, что импульсная
устойчивость была доказана лишь для простых импульсных процессов.
Если же мы наблюдаем быстро растущие уровни потребления горючего
и загрязнения атмосферы, то наша модель приводит к заключению, что
они не могут быть объяснены только действием в системе обратных
связей. Однако рост уровней может объясняться повторяющимися внешними
импульсами, входящими в систему. И тогда анализ импульсных процессов
переводит наше внимание за пределы изучаемой системы. Какие
воздействия могли бы быть такими повторяющимися импульсами?
Обратимся теперь к взвешенному орграфу, изображенному на рис. 4.16.
Он представляет гипотетическую ситуацию в Сан-Диего, когда все
автомобильное движение в округе запрещено и введена обширная и
дорогостоящая автобусная сеть. Веса этого орграфа были предложены той же групп
экспертов, которая оценивала веса для орграфа, представленного на
рис. 4.15. Описание системы автобусного транспорта и более детальное
обсуждение результатов ее анализа можно найти в работе Roberts [1974b].
Единственной сильной компонентой взвешенного орграфа,
изображенного на рис. 4.16, содержащей более.одной вершины, является К = {4,8,9}.
Ее собственные значения равны 0,92; -0,87; —0,05. Все другие сильные
компоненты не имеют петель, и поэтому остальные собственные значения
равны 0. Таким образом, эта система импульсно и абсолютно устойчива
для всех простых импульсных процессов. Однако наибольшее по
абсолютной величине собственное значение, равное 0,92, достаточно велико. Это
наводит на мысль, что при помощи относительно небольших изменений
весов можно получить собственные значения, превосходящие по
абсолютной величине 1. Поскольку веса обычно определены весьма неточно,
необходимо провести анализ чувствительности, чтобы выяснить зависят ли
результаты об устойчивости от небольших (но достаточно ощутимых
изменений весов). Действительно, так и происходит: при изменении весов
меняются и свойства орграфа, связанные с устойчивостью. Изменение
веса дуги ([4], [8]) с —0,9 на —1,1 приводит к взвешенному орграфу со
следующими ненулевыми собственными значениями: 1,02; —0,97; -0,5.
В результате новый взвешенный орграф импульсно и абсолютно
неустойчив для некоего простого импульсного процесса. Нельзя быть уверенными
в справедливости предсказания устойчивости или неустойчивости для
системы автобусного транспорта, построенной экспертами. Но в любом
случае, будь то начальные или видоизмененные веса, система очень
чувствительна к внешним воздействиям. Даже в исходном варианте, хотя
начальные импульсы и не приводят к произвольно большим импульсам или
значениям вершин, они могут достигать весьма больших величин, прежде
чем "стабилизируются". Покажем (см. упражнение 12 из §4.7), что по
мере возрастания наибольшего по абсолютной величине собственного
значения чувствительность системы к внешним импульсам возрастает в том
смысле, что одинаковый начальный импульс будет стремиться приводить
к большим по величине изменениям. Чтобы продемонстрировать насколько
взвешенный орграф, приведенный на рис. 4.16, чувствителен к внешним
импульсам, сделаем несколько прогнозов. Предположим, что стоимость
201
О 10 20 30
Время, недели
Рис. 4.45. Воздействие на расход горючего увеличения на 10% стоимости автобусной
сети в транспортной системе города Сан-Диего в штате Калифорния. Анализ
системы проводится при помощи взвешенного орграфа, изображенного на рис. 4.16
(Roberts [1874&])
10
35 40 45 SO
15 20 25 30
Время, недели
Рис. 4.46. Воздействие на объем выбросов в атмосферу увеличения на 10% стоимости
автобусной сети в транспортной системе города Сан-Диего в штате Калифорния.
Анализ системы проводится при помощи взвешенного орграфа, изображенного на
рис. 4.16 (Roberts [1974&])
автобусной системы возрастает на 10% в момент времени t =0 (в этом
исследовании считалось, что 10% начального значения принято за
единицу). Воздействие импульса на потребление горючего, рассчитанное на
вычислительной машине на основе модели импульсного процесса, показано
на рис. 4.45. Предсказание состоит в том, что через 50 недель (временных
202
периодов) произойдет 50-процентное увеличение потребления горючего!
Аналогичный прогноз для выбросов в атмосферу приведен на рис. 4.46.
Таким образом, хотя в обоих случаях значения вершин (а значит, и
импульсы) остаются ограниченными, и действительно, в конце концов
становятся близкими, происходят такие большие изменения их уровней, что
система должна считаться слишком чувствительной к внешним
воздействиям. (Для сравнения укажем, что если изменить вес дуги ([4], [8])
с -0,9 до —1,1, то чувствительность возрастет. Для нового взвешенного
орграфа на рис. 4.47 показано воздействие на потребление горючего
начального 10%-го увеличения стоимости транспортной сштемы, а на рис. 4.48 —
воздействие на выбросы в атмосферу. Вместо того чтобы в конечном
счете стабилизироваться как раньше, эти переменные быстро растут и
достигают гигантских уровней.)
Эксперты, строя взвешенный орграф рис. 4.16, стремились
стабилизировать быстро растущие уровни расходов горючего и выбросов в ат-
W
35 40 Ь5 50
15 20 25 30
Время у недели
Рис. 4.47. Воздействие на расход горючего увеличения на 10% стоимости автобусной
сети в транспортной системе города Сан-Диего в штате Калифорния. Анализ
проводится при помощи видоизмененного взвешенного орграфа, изображенного на рис. 4.16,
в котором дуга [4], [8] имеет теперь вес - 1,1 (Roberts [1974b])
to
40 45 SO
15 20 25 30
Время, недели
Рис, 4.48. Воздействие на объем выбросов в атмосферу увеличения на 10% стоимости
автобусной сети в транспортной системе города Сан-Диего в штате Калифорния.
Анализ "проводится при помощи видоизмененного взвешенного орграфа,
изображенного на рис. 4.16, в котором дуга [4], [8] имеет теперь вес - 1,1 (Roberts [1974b])
203
/'
Ю-
/¦
Щ
1
Р
f/j
Л
/i\
\
\
1
Я-ft*
»
[6]
]
ой
И
«И ,
-/,5,
-я/
ш /
/
/
к.
м
Рис. 4.49. Видоизмененный вариант рис. 4.16, в котором анализируется проблема
потребления горючего и поддержания чистоты воздуха в городе Сан-Диего в штате
Калифорния для гипотетической ситуации, когда в транспортной системе
автомобильное движение запрещено и введена обширная и дорогостоящая автобусная сеть
(Roberts [1974&]): [ 1] - протяженность поездки; [2] - экономия горючего, мили
на галлон; [3] — населенность; [4] — стоимость автобусной сети; [5] — цена билета;
[6] - объем выбросов в атмосферу; [ 7] - несчастные случаи; [8] - задержка;
[9] — расход горючего; [ 10] — число автобусов
Рис. 4.50. Видоизмененный вариант рис. 4.15, в котором анализировалась проблема
потребления горючего и поддержания чистоты воздуха в транспортной системе города
Сан-Диего в штате Калифорния, когда транспортная система в основном состоит из
автомобилей (Roberts [1914b]): [1] - протяженность поездки; [2] - экономия
горючего автомобиля, мили на галлон; [3] — населенность; [4] — стоимость
автомобиля; [5] - стоимость поездки; [6] - объем выбросов в атмосферу; [ 7] -
несчастные случаи; [8] — средняя задержка; [9] — расход горючего; [10]— протяженность
поездок на других транспортных средствах; [11] - число автомобилей; [12] -
число поездок
мосферу. Учитывая это обстоятельство, можно к результатам анализа
устойчивости и прогнозам уровней потребления горючего и загрязнения
атмосферы относиться по-разному. Можно полагать, что имеет недостатки
модель для анализа орграфа, либо считать недостаточной созданную
автобусную систему, либо предполагать, что эксперты, строя взвешенный
орграф на рис. 4.16, неверно описали систему, возможно, вследствие введения
дуг там,, где они не должны быть, или неверной оценки их весов.
Действительно, когда экспертов попросили пересмотреть уже построенный
взвешенный орграф, то они нашли ошибки в выборе дуг и весов и
произвели много изменений. (В то же время они нашли ошибки и сделали
изменения во взвешенном орграфе, изображенном на рис. 4.15.) Этот
пересмотренный орграф показан на рис. 4.49. (Видоизмененный вариант
рис. 4.15 показан на рис. 4.50.) Орграф на рис. 4.49 использует
переменные, незначительно отличающиеся от переменных на рис. 4.16, и вообще
не имеет контуров. Описанный в конце концов экспертами вариант
204
системы не содержит обратных связей1). Все собственные числа равны О
и система импульсно и абсолютно устойчива для всех простых импульсных
процессов. И она совсем нечувствительна к внешним воздействиям. Такие
значительные изменения в природе описываемой системы указывают
на наиболее важную роль знаковых и взвешенных орграфов как средства
планирования. Построение орграфа может помочь лицам, разрабатывающим
долгосрочные проекты, лучше познакомиться с изучаемой системой.
Предварительные прогнозы, основанные на модели в виде орграфа, могут либо
поставить серьезные вопросы об изучаемой системе, либо предположить,
что лица, осуществляющие планирование, неточно описали систему,
которую они стремятся понять.
Упражнения
1. Рассмотрим знаковый орграф на рис. 4.8.
а. Показать, что если дуга ([1], [5]) положительна, то изменение знака дуги ([7],
[8]) с плюса на минус приводит к импульсно устойчивому для всех простых
импульсных процессов знаковому орграфу. Будет ли он абсолютно устойчив?
б. Показать, что если дуга ([7] , [5]) положительна, то изменение знака дуги E,1)
с минуса на плюс является импульсно стабилизирующим. Будет ли оно также и
абсолютно стабилизирующим?
в. Показать, что если удалить дугу ([7], [5]), то полученный знаковый орграф не
будет импульсно устойчив ни для одного простого импульсного процесса.
2. Для знакового орграфа на рис. 4.7 дать интерпретацию предложенных в тексте
трех стратегий для достижения импульсной и абсолютной устойчивости путем
изменения двух знаков. Какую из них можно осуществить?
3. Для знакового орграфа на рис. 4.7 найти потенциальную стратегию для
достижения импульсной и абсолютной устойчивости, состоящую в изменении более двух
знаков.
4. Применить результат упражнения 15 § 4.5 для доказательства того, что, если в
знаковом орграфе на рис. 4.8 дуга ([7], [5]) положительна, то единственными
потенциально абсолютно стабилизирующими изменениями, состоящими в изменении знака
некоторой дуги сильной компоненты {1, 5, 7, 8}, могут быть изменения знака либо
дуги ([7 ], [8]), либо ([5], [7 ]). (Указание. Использовать теорию роз.)
5. Для знакового орграфа на рис. 4.8, в котором удалена дуга ([7 ], [5]), найти
импульсно стабилизирующую стратегию, состоящую в изменении знака одной дуги, или
показать, что такой стратегии не существует.
6. Для знакового орграфа, изображенного на рис. 4.11, характеристический
многочлен имеет вид
С(\) = \5 - X4 + \3 + 9\2 + 3\.
а. Будет ли этот орграф импульсно устойчивым для всех простых импульсных
процессов? (Рекомендация. Вычислить С@), СA), С B), С(-1), С(-2) и т.д.)
б. Определить будет ли этот орграф абсолютно устойчивым для всех простых
импульсных процессов.
7. Выполнить упражнение 6 для орграфов, изображенных на рис. 4.14, и пояснить
полученные результаты.
Выражения
С(\) = \5 -3\4 -X* +6Х + 5,
С(\) = \s - \4 _ 4\3 + 2\2 + 2\ + 6,
С(\) = \5 - \4 _ 5\3 + 4\2 + 2\ + 6
*' Действительно, в этом орграфе возможны только краткосрочные воздействия.
Если же включаются долгосрочные запаздывания, то должны быть обратные связи.
205
являются характеристическими многочленами для орграфов на рис. 4.14, а, б, в
соответственно.
8. Рассмотреть взвешенный орграф на рис. 4.15.
а. Прогноз, приведенный на рис. 4.22, был сделан для этого орграфа в
Предположении, что потребление горючего падает на 10%. Объяснить качественную природу этого
прогноза при помощи результатов об импульсной и абсолютной* устойчивости,
изложенных в тексте, и путем анализа структуры орграфа.
б. После пересмотра экспертами этого орграфа был построен взвешенный орграф,
изображенный на рис. 4.50. Что можно сказать об импульсной и абсолютной
устойчивости нового взвешенного орграфа?
9. Рассмотреть простейшую экосистему "кролики-лисы", описанную в
упражнении 7 § 4.4.
а. Показать, что эта система импульсно и абсолютно устойчива для всех простых
импульсных процессов.
б. Пояснить смысл импульсной и абсолютной устойчивости в экологических
терминах.
в. Показать, что при определенном выборе весов на дугах эта система перестает
быть импульсно и абсолютно устойчивой. Дать интерпретацию этих результатов.
10. Рассмотреть экосистему "растения - травоядные - хищники" из
упражнения 8 § 4.4 .
а. Показать, что она импульсно и абсолютно неустойчива для некоторого простого
импульсного процесса. {Указание, Показать, что С(Х) имеет действительный корень,
меньший по абсолютной величине, чем 1.)
б. Проинтерпретировать полученные результаты.
11. Рассмотреть экосистему "мыши - крысы - орлы" из упражнения 9 § 4.4.
а. Показать, что она импульсно и абсолютно устойчива.
б. Показать, что она импульсно и абсолютно неустойчива, если петля (орлы, орлы)
считается отрицательной или нулевой, т.е. отсутствует.
в. Обсудить какой знак петли (орлы, орлы) наиболее реалистичен.
12. Для взвешенного орграфа, изображенного на рис. 4.18, характеристический
многочлен равен \s - \4 + 16\3 + 41 \2 + 7\ - 2. Выполнить для этого орграфа
упражнение 6.
13. Выполнить упражнение 6 а и б для взвешенных орграфов, изображенных на
рис. 4.21, и дать интерпретацию полученных выводов. (Это упражнение предполагает,
что у читателя есть доступ к вычислительной машине.)
14. Применить теорию роз к знаковым орграфам, изображенным на рис. 4.6 и 4.9.
а. Определить являются ли они импульсно устойчивыми для всех простых
импульсных процессов.
б. Определить являются ли они абсолютно устойчивыми для всех простых
импульсных процессов.
в. Если импульсной устойчивости нет, найти потенциально импульсно
стабилизирующую стратегию, изменяющую знак одной дуги, или показать, что такой стратегии
не существует.
г. Если абсолютной устойчивости нет, найти потенциально абсолютно
стабилизирующую стратегию, изменяющую знак одной дуги, или показать, что такой стратегии
не существует.
15. Рассмотреть взвешенный орграф на рис. 4.16.
а. Использовать структуру орграфа для объяснения прогнозов, представленных на
рис. 4.45 и 4.46.
б. Указать дуги, которые возможно были включены в этот орграф ошибочно.
16. Применима ли какая-либо теорема из § 4.5 к знакомому орграфу,
изображенному на рис. 4.12? Если нет, то почему.
17. Читатель, имеющий доступ к ЭВМ для вычисления собственных значений, может
попытаться проанализировать экосистемы, представленные на рис. 4.51 и 4.52. Более
детальное представление об экосистемах можно получить в работе Левинса (Levins
[1974]) О.
О См. сноску О на с. 184.
206
а. На рис. 4.51 представлен знаковый орграф, иллюстрирующий систему контроля
за насекомыми-вредителями на обрабатываемом поле путем использования
инсектицидов. Является ли эта система импульсно и абсолютно устойчивой? К чему приведет
начальное увеличение использования инсектицидов? Что произойдет при
продолжающемся увеличении использования инсектицидов, вызванном внешними причинами?
б. На рис. 4.52 исследуется загрязнение озера двумя веществами - нитратами и
фосфатами. Является ли эта система импульсно и абсолютно устойчивой? Будет ли
резко расти количество водорослей, если происходит начальное увеличение фосфатов?
(Этим объясняется "цветение", наблюдаемое во многих озерах.) Что произойдет при
продолжающемся увеличении уровня фосфатов, вызванном внешними причинами?
Рис. 4.51. использование инсектицидоь па обрабатываемом поле. Рх - урожай
некоторого вида растений, ограниченный плотностью растений на поле. Нх — насекомые-
вредители, уничтожающие растения Рх. W - особые насекомые (например, осы),
уничтожающие только Нх. G - хищные насекомые, которые питаются насекомыми
НХУ а также некоторыми другими насекомыми #,. Р2 - некоторый другой вид
растений, / - инсектицид (Levins [ 1974])
Рис. 4.52. Анализ загрязнения озера нитратом N и фосфатом Р. Зеленые водоросли
G потребляют N и Р, сине-зеленые водоросли BG потребляют Р, но выделяют N.
Зеленые водоросли чувствительны к токсинам, выделяемым сине-зелеными водорослями
(Levins [1974])
18. В упражнении 21 § 3.5 читателю было предложено исследовать отношение
обратной зависимости между сложностью экосистемы и ее уязвимостью. В этом
упражнении исследуется экологический принцип, утверждающий, что сложность связана с
устойчивостью обратной зависимостью.
а. Подходят ли понятия устойчивости, разработанные в данной главе, для
формализации названного принципа? Если нет, то какие понятия более уместны?
б. Исследовать соотношение между устойчивостью и сложностью простых
экосистем, представленных на рис. 4.27 - 4.29, 4.51, 4.52. (Некоторые результаты о
связи между сложностью и устойчивостью содержится в литературе (Levins [ 1974 ],
Gardner, Ashby [1970], May [1971,1972,1973]). Однако предстоит еще немало работы для
формализации этой связи.)
§ 4.7. Доказательство теорем 4.6 - 4.8 *)
Перед доказательством теорем 4.6 — 4.8 введем необходимую
терминологию. Если X = (хь х2, ..., хп ) - вектор из комплексных (или
действительных) чисел, то его нормой называется число
1) Этот сугубо технический параграф может быть опущен без потери для
понимания дальнейшего изложения. Читателю, незнакомому с канонической жордановой
207
где I Xi | — абсолютная величина xt. Читатель, незнакомый с этим понятием,
может легко убедиться в стандартных свойствах нормы:
IIX + YH < 11X11 +||Y||, ||аХ||*|а|||Х||,
где а - действительное (или комплексное) число.
Норма матрицы М = (ту) определяется аналогично
\\M\\ =Л/2|т//|2
и обладает такими же свойствами.
Начнем с доказательства теоремы 4.6, утверждающей, что если
взвешенный орграф D имеет собственное значение, превосходящее по абсолютной
величине единицу, то D импульсно неустойчив для некоторого простого
импульсного процесса. Пусть X собственное значение с | X | > 1 и U -
соответствующий ему собственный вектор. Можно найти такой вектор U со
свойством IIU || = 1. (Почему?) Это доказательство было бы тривиальным,
если бы мы могли использовать U в качестве вектора начального импульса.
Если Р@) = U, то по теореме 45 Р@ = Р@L' = UA* = XfU. Таким образом,
llP@lle ix'iliun = 11X41 = 1Х|'+~
Это означает, что абсолютная величина некоторой компоненты вектора
Р@ становится сколь угодно большой. К сожалению, вектор U может
иметь нецелочисленные компоненты и тогда его нельзя использовать в
качестве вектора начального импульса. Действительно, допустимые векторы
начальных импульсов имеют вид Е,- = @,0,..., 0,1, 0,..., 0) с единицей
в 1-й компоненте. Эти векторы образуют базис пространства л-мерных
векторов-строк и поэтому мы можем представить U линейной комбина-
п
нацией Z а{Е;. Тогда для любого целого f >0
Но | а* | < 1, 1 = 1, 2,..., п9 так как II U || = 1. Таким образом,
|Х|'< 2 НМ'И.
i = i
Отсюда следует, что для всякого t>0 найдется такое /, что
Поскольку имеется лишь конечное число векторов Е/, получим, что по
крайней мере для одного из них
для сколь угодно большого t. Выберем Р @) = Ef. Тогда при сколь угодно
большом t имеем
формой матрицы или имевшему мало опыта в доказательстве сходимости и
ограниченности, не следует углубляться в детали этого параграфа. Однако он может
попытаться понять теоремы 4.12 и 4.13.
208
Так как | X | > 1 и п — фиксировано, A/и) | X | * ->«>. Мы получаем, что
при Р @) = Е/, ИР (г) II становится сколь угодно большой при t -*°°, и
поэтому взвешенный орграф импульсно неустойчив для простого
импульсного процесса с начальной вершиной щ. Это завершает доказательство
теоремы 4.6.
Вместо доказательства теоремы 4.7 докажем более общий результат.
Для его формулировки напомним, что каждая (п X п) -матрица
(действительная или комплексная) А подобна1) (п X п) -матрице /, ее
канонической жордановой форме специального вида
(9)
где Bj — (ej + 1) X (et + 1) диагональная подматрица вида
в,
/
X в,
X 5/
X 6,
X 5,-
X 5,-
где X — собственное значение матрицы Л, а 6;- равно 0 или 1 Eу =0, если
ej + 1 = 1 и 1 в противном случае). (Заметим, что X может появляться в
нескольких блоках Bj.) В частности, если все собственные значения
орграфа D (включая 0) различны, то каждая Bj - это A X 1)-матрица, а/ -
диагональная матрица
/
\
V 'к I
с диагональными элементами, равными собственным значениям. В качестве
1) Матрицы А и J подобны, если существует такая невырожденная (т.е.
обращаемая) матрица Р, что/ =РАР~*
14. Ф.С. Роберте
209
примера, возьмем следующую матрицу Л:
(Ю)
Тогда/ = А. Ниже показаны блоки В /Г
/п
V:
О О
о о
о ошо
0 0 0
0 0 0
0 0 0
о
о
о
о
о
о
0,1
0
0
1
0,1
0
0
1
0,1
о
о
о
о
о
о
а/
0 0 0 0 О О Ш
о о о о о о
Для /, представленной в форме (9), /* имеет вид
Ш\ О
\°
Тогда, если 8/ = 0, то,
= (X) и
(И)
Если 8/ = 1,- то легко доказать индукцией по t, что элемент (к, /) в матрице
В! задается в виде
¦7
О
A2)
, если к > /,
~/+*, если ?</.
{Замечание. Принимаем I | = 0, если$>/\)
Будем говорить, что собственное значение X орграфа D связано в /, если
в некоторой строке /, в которой Х-диагональный элемент, имеется внедиа-
гональный элемент, равный 1, или, что эквивалентно, X связано в/, если
находится на диагонали в некотором блоке Bj9 где 8/ =1. Например, еслмГ
210
ASJ- матрица A0), то собственные значения 3 и 0,1 связаны, тогда как
собственные. значения / и -/ не связаны. Связанными могут быть лишь
кратные собственные значения.
Вместо доказательства теоремы 4.7 мы докажем более общий
результат, из которого следует теорема 4.7, поскольку по ее условию в/
отсутствуют связанные собственные значения.
Теорема 4.121). Пусть / — каноническая жорданова форма взвешенного
орграфа Я Тогда следующие утверждения эквивалентны.
(a)D импульсно устойчив для всех автономных импульсных процессов.
(b)D импульсно устойчив для всех: простых импульсных процессов.
(с) Каждое собственное значение D не превосходит по абсолютной
величине единицу, а каждое собственное значение Д связанное в /, по
абсолютной величине меньше единицы.
Прежде чем приступить к доказательству теоремы 4.12, проиллюстрируем
ее. Приведенные ниже матрицы А представлены уже в жордановой форме.
Таким образом, во всех случаях
1 0 0\ /1/4 0 0
л I ' I л ¦ ° 1/4 ° °
0
0
0,
1/4
0
0
0
0
1/'
0
0
0
1/4
0
0
0
¦ 0
-1
0
0
0
-1
0
0
0
0
-1
0
0
0
-1
0
1
1
0
о -ь
А4
Г 1/4
0
0
0
\о
0
1/4
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
1
q
Во всех четырех примерах наибольшее по абсолютной величине
собственное значение равно по абсолютной величине единице. Однако А2 и А% имеют
связанные собственные значения с абсолютной величиной единица, и поэтому
соответствуют импульсно неустойчивым для некоторого простого
импульсного процесса взвешенным орграфам. В Ах иА4 все связанные
собственные значения по абсолютной величине меньше единицы и поэтому
соответствующие взвешенные орграфы импульсно устойчивы (для всех простых
импульсных процессов).
Доказательство теоремы 4.12 начнем с двух лемм.
Лемма 1. Если (п X п) -матрица А имеет каноническую жорданову
форму J, то последовательность
Ш'11, г = 0,1,2,...} A3)
ограничена тогда и только тогда, когда ограничена последовательность
1, г = 0,1,2,..Л . A4)
д) Теорема впервые была сформулирована в данной форме в статье Roberts,
Brown [1975J.
14*
211
Доказательство1). Доказательство использует топологические
рассуждения. Матрицы А и / связаны преобразованием подобия. Такое
преобразование непрерывно в обе стороны в топологии, вводимой нормой
II • II, поэтому {А*} содержится в сфере тогда и только тогда, когда{/'}
содержится в сфере 2). ¦
Лемма 2. Если взвешенный орграф D импульсно устойчив для всех
простых импульсных процессов, то последовательность
{11/41, t = 0,1,2,...} A4)
ограничена. Если последовательность A4) ограничена, то D импульсно
устойчив для всех автономных импульсных процессов.
Доказательств о. По теореме 4.5
Таким образом, импульсная устойчивость для всех простых импульсных
процессов означает ограниченность последовательности
{IU4I, г = 0,1,2,...> A3)
(почему?); поэтому из леммы 1 получаем, что последовательность A4) также
ограничена. Обратно, если последовательность A4) ограничена, то по
лемме 1 ограничена и последовательность A3). Следовательно,по теореме4.5
орграф должен быть импульсно устойчивым для всех автономных
импульсных процессов. (Почему?) ¦
Для доказательства теоремы 4.12 заметим, что утверждение, (а) =* (Ь)
очевидно. Докажем теперь, что (Ь) => (с) и (с) => (а). Мы уже показали,
доказав теорему 4.6, что, если взвешенный орграф D импульсно устойчив
для всех простых импульсных процессов, то каждое собственное значение D
не превосходит по абсолютной величине единицу. Для завершения
доказательства утверждения (Ь) => (с), покажем, что каждое связанное
собственное значение в / по абсолютной величине меньше единицы. По лемме 2
из импульсной устойчивости мы получаем, что последовательность {II 3х 11}
ограничена. Предположим теперь, что X - собственное значение Д связанное
в / и превосходящее по абсолютной величине единицу. Если X находится
на диагонали блока Bj, то Ъх\ = t\f~l из соотношения A2), Поскольку
| Х| > 1, величина | ь[*2.\ становится сколь угодно большой при t -*°°;
значения IIJ* II также становятся сколь угодно большими. Это завершает
доказательство.
Для доказательства утверждения (с) => (а) по лемме 2 достаточно
показать, что, если выполнено (с), то { IIJ* II) ограничена. Для этого достаточно
доказать, что для каждого/ последовательность {II2?f II} ограничена. Пусть
Х- диагональный элемент в BfT- По условию I Х| <1. Если 8У =0, то
BJ имеет вид A1), и поэтому, так как | X | * ограничена, то и IBJ II
ограничена. Если 6;- =1, то по условию I X | < 1. Покажем, что при к </ пос-
д) Это доказательство следует опустить, если читатель незнаком с топологией
точечных множеств.
2) Автор благодарен Г. Биркгофу, предложившему это доказательство.
212
ледовательность{1 bj^ I , / = 0, 1, 2....} ограничена, где bJk] определяется
отношением A2)
f Заметим,что/ —
соотношением A2). Положим е = е}-, т.е. е на единицу меньше размерности
B Заметим, что / — к <е. Таким образом, при t>2e имеем
так как | X | < 1. Отсюда следует, что
Поскольку re I X I f~c стремится к 0 при t стремящемся к °°, получаем,
что последовательность {| ьЦ |} ограничена."
Следствие. Пусть D — целочисленно-взвешенный орграф и / — его
каноническая жорданова форма. Тогда следующие утверждения эквивалентны.
(a) D импульсно устойчив для всех автономных импульсных процессов.
ф) D импульсно устойчив для всех простых импульсных процессов.
(c) Каждое собственное значение D не превосходит по абсолютной
величине единицу, а отличные от нуля собственные значения связаны в /.
(d) Каждое ненулевое собственное значение D равно по абсолютной
величине единице, а отличные от нуля собственные значения D связаны в /.
Доказательство. Очевидно, что из (d) следует (с). По
теореме 4.12 (с) =*(д). Также ясно, что (а) влечет (Ь). Для доказательства
того, что из (Ь) следует (d), заметим, что (Ь) влечет утверздение (с) по
теореме 4.12 и (Ь) означает по следствию из теоремы 4.6 равенство" по
абсолютной величине каждого ненулевого собственного значения /^единице.
Гаким образом, (Ь) =* (d). ¦
Вместо теоремы 4.8 докажем более сильную теорему.
Теорема 4.13. ПустьD-взвешенный орграф. Следующие утверждения
эквивалентны.
(a) D абсолютно устойчив для всех автономных импульсных процессов.
(b)D абсолютно устойчив для всех простых импульсных процессов.
(с) D импульсно устойчив для всех простых импульсных процессов и
единица не является собственными значением D.
Доказательство. Доказательство использует леммы,
аналогичные леммам 1 и 2, для
N
(II 2 АЧ, W = 0,1,2,...} A5)
и
(II 2 Jf !l , # = 0,1,2,...} A6)
Очевидно, что (а) =>(Ь). Докажем, что (Ь) =>(с) и (с) =»(я).
Для доказательства последнего утверждения достаточно показать, что
N
если выполнено (с), то {II 2 J* ||) ограничена. Для этого достаточно по-
213
N f
казать, что для каждого / ограничена последовательность {II 2 В: \\) .
* = 0 '
Пусть собственное значение X находится на диагонали матрицы Bj. Если
5у = 0, то
N . N
2 я/= 2 X'.
Поскольку из импульсной устойчивости следует, что | X | < 1, и по условию
N
X Ф 1, то 2 X* сходится, откуда заключаем, что последовательность
t = 0
(I 2 Х<|> = {|| 2 */1|>
ограничена. Предположим теперь, что 5/ = 1. Тогда из импульсной устойчи-
вости следует, что | X | < 1. Если к>1,то 2 Ьк1 = 0. Если же к < /, то
*=о
из доказательства теоремы 4.12 дляг>2е получаем, что
где е на единицу меньше размерности Bj. Таким образом, для t > 2e
A7)
Применяя сравнительный признак сходимости к сумме в правой части
неравенства A7), находим
1 Л I ± I I /\ I # * I I t
lim
2 bkl
t=0
I
I < —
el
N
2
t ^
Поскольку I X I < 1, эта сумма в A7) сходится. Таким образом,
последовательность {| 2 Ь^х |} ограничена, а значит, ограничена и
последовало
N f
тельность {|| 2 В. ||} .
t = o '
Чтобы закончить доказательство, допустим, что выполнено (Ь) и
докажем (с). Во-первых, абсолютная устойчивость означает и импульсную
устойчивость. Наконец, допустив, что единица является собственным
значением придем к противоречию. Достаточно доказать, что последователь-
N
ность {|| 2 /' ||} не ограничена. В частности, пустьХ=1 -диагональный
г=о
элемент в диагональной подматрице Bj. Из импульсной устойчивости
следует, что собственное значение X не связано, и поэтому
N N
2 Яу = 2 Х'=
f=0 f*0
214
N
Таким образом, последовательности {|| 2 В. ||}, а значит, и {II 2 /' II)
f = О ¦ = л
не ограничены, что противоречит абсолютной устойчивости. ¦
N
2
*=о
Упражнения
1. Приведенные ниже матрицы А имеют каноническую жорданову форму, так что
J - А. Считая Л матрицей смежности взвешенного орграфа, исследовать в каждом
случае вопросы импульсной и абсолютной устойчивости:
/1 0 0 0 0\
б. А
в. А
0
0
0
0
0,6
0
0
0
0
0
/
0
0
0
0
0
1
0
0
0
0
о
0
1
0
0
0
1
/
0
0
0
0
0
1
0
0
0
0
0
1
0
2
0
0
0,6
0
0
0
0
0
6
-/
0
0
0
0
0
0
0
3/
0
0
0
0,5/
0
0
0
-
0
0
1
-i
0,1+0,2j
0
0
0
0
0
0
0
0
0
3/
;
0
0
0
-0,5/
0
0
0
0
0
и
0
0
0
0
0
0
0
0
0
0,8+0,2/
0
0,1-0,2/
0
0
0
0
0
0
0
0
°\
о\
0
0
1
°/
0,8-0,2/
0
0
0
0
0,8
0
0
0
0
0
0
1
0,8
0
°\
0 )
0
0
0
1 i
0,8/
2. Следующие матрицы, представленные в канонической жордановой форме, суть
матрицы смежности целочисленноезвешенных орграфов. Исследовать в каждом
случае вопросы импульсной и абсолютной устойчивости.
1
0
0
0
0
1
0
0
0
0
0
0
0
0
1
0
-1
0
0
0
1
-1
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
1
0
0
0
1
1
0
0
0
0
0
3. Привести пример взвешенного орграфа D, у которого имеются ненулевые
собственные значения, меньшие единицы, и являющегося импульсно устойчивым для всех
простых импульсных процессов.
4. а. Привести пример знакового орграфа D, имеющего кратные ненулевые
собственные значения, и импульсно устойчивого для всех простых импульсных процессов.
б. Привести пример другого знакового орграфа с такими же свойствами
собственных чисел, но импульсно неустойчивого для всех простых импульсных процессов.
215
5. Пусть наибольшая иэ абсолютных величин собственных значений (п X п)-матр1
цы А равна 2. Показать, что существует простой импульсный процесс, для которог
II Р(г) || не меньше 2*/п при достаточно больших t.
6. Пусть взвешенный орграф D имеет диагональную матрицу смежности вид
о
о
ее наименьшее по абсолютной величине собственное значение больше 1. Показать
что D импульсно неустойчив для всех простых импульсных процессов.
7. Пусть взвешенный орграф D импульсно устойчив для всех простых
импульсных процессов. Используя равенство ?(t) = ?@)Ati показать, что
последовательность { || А*||, t = 0,1, 2,...} ограничена.
8. Показать, что утверждение в упражнении 7 становится неверным, если
импульсная устойчивость имеет место лишь для некоторого простого импульсного процесса.
9. Предположим, что последовательность {|| А * II, t«* 0, 1, 2, ... } ограничена.
Показать, используя теорему 4.5, что D импульсно устойчив для всех автономных
импульсных процессов. t
10. Доказать, что если бу= 1, то элемент к, I в матрице В: задается следующим
образом:
0, если к > /,
\*~1+к, если к<1.
(Замечание. Полагаем, что \ 1=0 при s > г.)
11. Теорема 4.7 имеет особенно простое доказательство, если все собственные
значения \19 \2, ..., \п различны. В этом случае из известной теоремы линейной
алгебры следует, что соответствующие собственные векторы \JX, U2,..., Uw линейно
независимы. Следовательно, Р@) можно представить линейной комбинацией
п
X a/U/. Воспользовавшись этим и теоремой 4.5, показать, что, если каждое \/ по
/ = 1
абсолютной величине не превосходит единицу, то IIP (О II ограничена для всех
простых импульсных процессов.
12. Наибольшее по абсолютной величине собственное значение может быть
использовано для получения оценок импульса и значения вершины. Предположим, что X -
наибольшее по абсолютной величине собственное значение взвешенного орграфа D.
Показать существование простого импульсного процесс и такой положительной
константы с, что для некоторого / в этом процессе I P/(O I > с\\ \* для сколь угодно
больших значений t. (Таким образом, импульсы растут по меньшей мере
экспоненциально со "скоростью роста", равной наибольшей абсолютной величине собственных
чисел I \ I). (Указание. Использовать доказательство теоремы 4.6.)
13*. Предположим, что собственные значения взвешенного орграфа D по
абсолютной величине меньше единицы.
а. Показать, что А* -* 0. (Указание. Воспользовавшись доказательством
теоремы 4.12, показать, что I b^ I ->(), а затем применить равенство J* = РЛ^Р".)
б. Показать, что р{ (t) -* 0 для всех автономных импульсных процессов.
(Замечание. Результат п. а будет применен в упражнении 16 § 5.4, для
доказательства следующего утверждения: если каждое собственное значение D по абсолютной
величине меньше единицы, то для любого автономного импульсного процесса
V(O - V (исх) + Р @) (/ - А Ух.)
216
14*. Большинство изложенных в этом параграфе результатов о взвешенных
орграфах зависит от конкретного правила изменения значений в импульсном процессе,
введенного соотношением F) и представленного при помощи теоремы 4.5 в виде
Заметим, что доказательство теоремы 4.12, по существу, основано только на этом
уравнении. Пусть веса имеют отличную интерпретацию о той, которая им была дана
ранее и имеет место
1^ + 1) = 2 w(Uj,tii)vf(t), A8)
т.е. значение вершины определяется значениями в предшествующий момент времени.
Рис. 4.53. Взвешенные орграфы к упраж-
нениям 14 и 15 § 4.7
о л*
Примем, что V@) = У(исх). В матричной форме соотношение A8) переписывается
следующим образом:
Начальное условие, приводящее к этому правилу, состоит просто в задании У(исх),
равного V@). (Все импульсные процессы, определяемые новым правилом,
автоматически автономны, вводить в разные моменты времени внешние импульсы, не
имеет смысла, а значит, не надо и говорить о неавтономных импульсных процессах.
Можно было вводить внешние импульсы, заменяя vf-(t) в правой части соотношения
A8) на ty (О + pj (Г), где pj (?) - некоторые внешние импульсы, поступающие в
вершину Uj непосредственно перед моментом времени t + 1. Не будем прибегать к этому
усложнению.) Пусть, как и ранее, Р(Г) = V(f) - V(r - 1) при t > 0. Примем прежние
определения импульсной и абсолютной устойчивости.
а. Для взвешенного орграфа, изображенного на рис. 4.34, вычислить УC),
используя A8), если У(исх) = V@) = @, 1, 1, 0, 0). Проверить результат при помощи
соотношения V (О = У@)А*.
б. Для взвешенного орграфа Dl изображенного на рис. 4.53, выбрать величины
У(исх) = V@), приводящие к абсолютной неустойчивости и к абсолютной
устойчивости.
в. Повторить п. б для свойств импульсной устойчивости и неустойчивости.
г. Предложить необходимое и достаточное условие абсолютной устойчивости
взвешенного орграфа/) для всех импульсных (автономных) процессов.
д. Выполнить п. г для знаковых орграфов.
15*. Заменить правило изменения значений из упражнения 14 следующим:
п
vf(t + 1) = vi(t) + 2 w (w;., ut) Vj(t). A9)
Снова допустим, что V@) = V(hcx) . (Все импульсные процессы, изменения в которых
определяются этим правилом, также автономны.)
а. Используя соотношение A9), получить матричное представление V(?) через
V(hcx) = V@).
б. Для взвешенного орграфа, изображенного на рис. 4.34, вычислить VC),
используя A9), если V(hcx) = V@) = @, 1, 1, 0, 0). Проверить результат, применив
соотношение, полученное в п. а.
217
в. Для взвешенного орграфа D29 изображенного на рис. 4.53, привести примеры
выбора У(исх) = V@), приводящего к абсолютной устойчивости и абсолютной
неустойчивости.
г. Повторить пункт в для свойств импульсной устойчивости и неустойчивости.
д. Предложить необходимое и достаточное условие абсолютной устойчивости
взвешенного орграфа D для всех импульсных (автономных) процессов.
е. Выполнить пункт д для знаковых орграфов.
ж. Показать, что \ есть собственное значение матрицы А тогда и только тогда,
когда \ + 1 - собственное значение матрицы А +1.
з. Пусть А - матрица смежности знакового орграфа Р. Показать, что если А
имеет собственное значение, отличное от 0, -1 или -Уг ± i%/3/2, то D не может быть
абсолютно устойчивым для импульсных процессов, определяемых правилом A9) этого
упражнения и правилом A8) упражнения 14.
Глава 5
МАРКОВСКИЕ ЦЕПИ
§ 5 Л. Стохастические процессы и цепи Маркова
Математические модели, рассматривавшиеся в предыдущей главе, можно
назвать детерминированными. Они описывают процессы, состояние
которых в любой момент времени полностью определено, если известно их
состояние в предшествующие моменты времени. В этой главе мы введем
элементы неопределенности в наши модели и будем изучать вероятностные
модели 1). Всякая вероятностная модель является во многих смыслах
менее точным описанием реального процесса, чем детерминированная, она не
позволяет точно предсказывать изменения его отдельных параметров
(выходов объекта). С другой стороны, она позволяет часто сделать
достаточно точный прогноз относительно ожидаемых средних значений параметров
процесса. Кроме того, вполне возможно, что широкий круг процессов
является по своей природе вероятностным и их адекватное описание
невозможно при использовании детерминированных моделей.
Мы сейчас увидим, что значительная часть математического аппарата,
развитого в предыдущих главах для изучения детерминированных моделей,
может быть приспособлена дня исследования вероятностных моделей. (Это
будет еще одним примером математических методов, разработанных для
одних задач и оказавшихся полезными для решения других.) В частности,
мы будем изучать класс процессов, носящих название цепей Маркова,
которые можно описать, используя взвешенные орграфы, аналогичные
рассмотренным в предшествующей главе 2).
Марковские цепи, как аппарат исследования, используются во многих
областях науки. В данной главе рассмотрим их применение к таким
разнородным областям, как генетика, потоки загрязнений атмосферы, денежные
потоки между городами и теория обучения в психологии.
Прежде чем определить цепь Маркова, введем понятие стохастического
процесса. Рассмотрим последовательность экспериментов, в которой исход
f-ro эксперимента зависит от некоторых случайных обстоятельств. Будем
предполагать, что если исходы первых t экспериментов известны, то можно
определить все возможные исходы (f+l)-ro эксперимента и
соответствующие им вероятности. (Можно при этом использовать не все сведения
1) Вероятностные модели иногда называют cm хаотическими.
2) Читатель, который пропустил эту главу, должен обратиться к § ч.1, где
вводятся взвешенные орграфы и излагаются их основные свойства. В частности, в данной
главе, как и в предшествующей, во взвешенных орграфах допускается существование
петель.
219
относительно предшествующих исходов или даже вообще не обращаться
к ним при определении новых исходов или их вероятностей.) Если
множество исходов при каждом испытании конечно, то такая
последовательность исходов называется конечным стохастическим процессом. Все
стохастические процессы, рассматриваемые в настоящей книге, конечны, и
поэтому в дальнейшем это дополнительное указание будем опускать.
Приведем несколько примеров конечных стохастических процессов.
Пример 1. Производитель некоторого изделия упаковывает его в
коробки по 10 штук. Известно, что в коробке два из 10 изделий имеют
дефекты. Первое изделие, взятое для использования, может оказаться с
дефектом или бездефектным с вероятностями 2/10 и 8/10 соответственно.
Качество второго изделия зависит от того, каково было первое
использованное изделие. Если первое не имело дефектов, то второе может оказаться
с дефектами или без них с вероятностями соответственно 2/9 и 7/9. Если
первое изделие имело дефекты, возможные исходы не меняются, однако
их вероятности становятся равными 1/9 и 8/10 соответственно. Если первые
два изделия оказались дефектными, то третье обязательно будет без
дефектов. Характеристики изделия, взятого при Ш испытании (наличие или
отсутствие дефектов), определяют стохастический процесс. Для вычисления
возможных исходов при Ш испытании и их соответствующих вероятностей
необходимо знать все исходы до этого момента.
Пример 2. Рассмотрим "игру"называемую "револьверной рулеткой).
Имеется револьвер с шестицилиндровым барабаном, заряженный одним
патроном. Барабан приводится во вращение и играющий стреляет себе в
голову. (Обычно существует второй игрок, который участвует в пари, но
мы опустим это обстоятельство.) При первом испытании возможными
исходами были "живой" и "мертвый", и соответствующие им вероятности
равны 5/6 и 1/6. В одном из вариантов револьверной рулетки, если первый
игрок остался в живых после первого испытания, он производит в себя
следующий выстрел, не проворачивая барабан. Тогда при втором испытании
возможными исходами снова будут: "живой" и "мертвый", однако их
вероятности равны теперь соответственно 4/5 и 1/5. Если исходом
некоторого испытания оказался результат "мертвый", то считается, что исходы
всех последующих испытаний принимают значение "мертвый".
Последовательность исходов револьверной рулетки определяет стохастический
процесс.
Имеется и другой вариант револьверной рулетки, когда барабан после
каждого испытания, при котором игрок остался жив, снова вращается.
Таким образом, при (t+ 1)-м испытании возможные исходы и их вероя-
ности зависят лишь от результатов Г-го испытания. Если исходом служил
результат "мертвый", то при (f + 1)-м испытании единственным
возможным исходом также будет результат "мертвый". Если исходом был
"живой", то возможными исходами при (г + 1)-м испытании являются "живой"
или "мертвый" с вероятностями 5/6 и 1/6 соответственно. Этот вариант
револьверной рулетки также определяет стохастический процесс. В нем
1) В тексте и в американской литературе используется термин "русская рулетка"
(Примеч. пер.)
220
возможные исходы и соответствующие им вероятности при (г+1)-м
испытании можно определить, зная лишь исходы предшествующего
испытания, хотя, конечно, нам известны исходы всех имевших место испытаний.
Однако для определения исходов при (г+1)-м испытании используется
лишь "память" об одном прошлом временном периоде.
Пример 3. Рассмотрим последовательность бросаний правильной
монеты. Известно, что возможные исходы при (t + 1)-м испытании всегда
одни и те же - герб (Г) или решетка (Р) и, более того, соответствующие
им вероятности всегда равны Vi,l/i. Эти результаты нам известны даже при
отсутствии информации об исходах первых t испытаниях, и мы несомненно
можем это уверенно утверждать. Таким образом, результаты повторных
бросаний правильной монеты определяют стохастический процесс, причем
для его описания не требуется пользоваться памятью.
Пример 4. Рассмотрим теперь более сложную игру. Начинается она
с бросания монеты. Если исход бросания — Г, то в следующем испытании
снова бросается монета. Если же исходом была Р, то бросается игральная
кость. При четном числе очков на кости в следующем испытании бросается
снова монета, при нечетном — кость. Последовательность исходов этой
игры определяет стохастический процесс. Информация о результатах t-ro
испытания достаточна для определения возможных исходов (t + 1)-го
испытания. Таким образом, мы снова получили стохастический процесс с
памятью, глубина которой одно испытание.
Пример 5. Сегодняшняя погода образовалась под влиянием погоды,
имевшей место несколько дней или даже недель тому назад. Однако
представляется разумным, по крайней мере при использовании относительно
полной информации о погоде на всем земном шаре, предположить, что
можно достаточно точно предсказать погоду на завтра на основе, например,
данных о погоде за прошлую неделю. Таким образом, в первом
приближении состояние погоды в t-й день определяет стохастический процесс с
ограниченной памятью, равной примерно от пяти до семи дней.
Пример 6. Проведем дальнейшее рассмотрение примера 5. Одна из
возможных стратегий при предсказании погоды — просто использовать
данные о погоде в предшествующий день. В исследовании о выпадении
дождей в Тель-Авиве, Габриэль и Нейман (Gabriel, Neumann [1962]),
показали, что последовательность дождливых и солнечных дней за 27-летний
период наблюдений можно считать стохастическим процессом с памятью
в один день.
В частности, согласно их данным, вероятность дождливого дня равна
0,662, если предшествующий день был дождливым, и лишь 0,250, если
накануне дождя не было. Вероятность отсутствия дождя равна 0,750,
если его не было в предшествующий день, и лишь 0,338, если накануне
шел дождь.
Стохастические процессы, не зависящие от прошлого даже на один
шаг, т.е. процессы без памяти, легче всего изучать, но они нечасто
встречаются на практике. Бросание монеты является примером такого
процесса. Следующий простейший тип стохастических процессов - процессы,
память которых простирается в прошлое не более чем на одно
испытание. Математическое изучение подобных процессов — еще достаточно
простая задача, но она имеет удивительно широкие приложения. Мы уже
221
указали ряд примеров таких процессов, их более подробное изучение
будет проведенр в последующих разделах данной главы.
В действительности будут рассматриваться стохастические процессы,
обладающие следующими свойствами. Во-первых, предполагается, что
существует конечное множество исходов, включающее все возможные
исходы всех испытаний. Во-вторых, полагают, что вероятность Pt+i(O)
появления исхода О при (t+ 1)-м испытании известна, если известен
исход t-ro испытания, хотя информация об этом исходе не обязательно
используется. Наконец, зависимость вероятности рт+х(О) от исхода t-ro
испытания инвариантна относительно ?, т.е. она одна и та же для испытания
f = 2 и испытания t = 1000. Такой стохастический процесс называют по
имени русского математика А.А. Маркова цепью Маркова *). В марковской
цепи информация о предшествующих испытаниях, а также относительно
номера проводимого испытания не влияет на вероятности будущих
событий, если известен последний исход. Из примеров, рассмотренных выше,
несомненно последовательность исходов бросаний монеты (пример 3)
представляет цепь Маркова, как и более сложный вариант игры (пример 4).
Если ограничиться использованием лишь определенного нами множества
исходов, то результаты варианта револьверной рулетки с повторным
вращением барабана определяет марковскую цепь, хотя ее вариант без
повторного вращения не является цепью Маркова.
В этой главе будут изучаться указанные примеры цепей Маркова, а
также ряд других, и приводится описание общей теории марковских цепей,
которая позволит исследовать их свойства. Цепи Маркова будут
использованы в качестве математических моделей различных явлений. На их
основе мы получим различные следствия.
Упражнения
1. Производится многократное бросание неправильной монеты. Пусть вероятность
выпадения герба равна 2/3. Определяет ли последовательность исходов цепь Маркова?
2. Рассмотрим следующий вариант игры с монетой и игральной костью. Бросается
монета до появления двух последовательных гербов, затем бросается кость до двух
последовательных выпадений грани с числом 3, потом снова бросается монета и т.д.
Определяет ли такая последовательность исходов цепь Маркова?
3. Среди 10 000 изделий, содержащихся в коробке, имеется некоторое
(неизвестное) число дефектных. Случайным образом выбирается одно изделие, его качество —
нормальное или дефектное — фиксируется и изделие возвращается обратно в коробку.
Процесс заканчивается, как только получено 20 дефектных или 100 нормальных
изделий. При Ш испытании исходами являются события "дефектно", "нормально" или
"стоп". Как только процесс выборки остановился, он больше не возобновляется.
(Рассмотренная схема имеет большое значение при выборочном контроле качества
продукции.) Определяет ли описанная последовательность исходов цепь Маркова?
4. (Howard [1963]). В небольшом городе имеются два супермаркета. - "Дешевый"
и "Ближний". Покупатели достаточно лояльно относятся к своим магазинам. Однако
каждую неделю 10% покупателей "Дешевого" переходят к "Ближнему" и 20%
покупателей "Ближнего" меняют его на "Дешевый". Кампания, занимающаяся
изучением рыночной конъюнктуры, выбрала случайным образом одного местного жителя
О Читателей, интересующихся цепями Маркова с бесконечным числом состояний
мы отсылаем к работам Bharucha-Reid [1960] или toward [1971 ]. В данной главе все
марковские цепи предполагаются конечными.
222
и еженедельно опрашивала его, в каком из магазинов он производит свои покупки.
Определяет ли данная последовательность исходов (ответов) марковскую цепь?
5. Один старый политический принцип гласит, что партия, находящаяся у власти,
имеет более высокие шансы победить на президентских выборах, нежели партии
оппозиции. Более того, считается, согласно этому принципу, что если партия побеждала
на президентских выборах несколько раз подряд, то ее шансы на очередных выборах
еще более повышаются. Если такой принцип верен, определяет ли последовательность
правящих партий цепь Маркова?
6. (Goodman, Ratti [1971 ]). Часто кажется, что преуспевающим людям везет. Так,
если некоторый человек, скажем бизнесмен, завершил успешно переговоры, то
вероятность, что он добьется успеха в следующей сделке кажется нам выше. Более того,
после успешного завершения ряда сделок, вероятность добиться успеха в следующей
будет еще более высокой. Определяет ли такая последовательность исходов деловых
переговоров цепь Маркова?
7. (Bhat [1972]). Снабжение города водой осуществляется из некоторого
естественного резервуара. Тщательные наблюдения за ним в течение 20 лет показали, что если
резервуар был полон в начале лета, то он оказывался полным к началу следующего
лета с вероятностью 0,8 независимо от состояний его наполнения в предшествующие
годы. Аналогично, если резервуар был к началу лета незаполненным, то вероятность
того, что к началу следующего лета он окажется полным, равна лишь 0,4. Определяет
ли последовательность состояний резервуара ("полный", "неполный") в начале
каждого лета цепь Маркова?
8. Владелец небольшого завода утверждает, что большая часть стоков его
предприятия, спускаемых в протекающую рядом реку, очень быстро выносится в море. Более
того, он утверждает, что вероятность выноса в море в течение одного дня какой-либо
молекулы ртути, обнаруженной в стоках его завода, равна 0,999. Если же эта молекула
оказывается на месте по прошествии нескольких дней, то вероятность ее выноса к
морю на следующий день остается равной 0,999. Предполагается, что молекулы,
вынесенные к морю, обратно не возвращаются. Пусть некоторая молекула ртути была
"помечена" и в течение t дней мы можем следить за ее присутствием или отсутствием
в отстойнике системы очистных сооружений завода. Обладает ли последовательность
таких наблюдений свойствами марковской цепи?
§ 5.2. Вероятности перехода и орграфы перехода
Марковская цепь содержит множество исходов {кь Из» • • •» "лЬ
включающее всю совокупность исходов при всех возможных испытаниях. По
традиции эти исходы трактуются как состояния и говорят, что марковская
цепь находится в состоянии щ в момент времени Г, если исход щ произошел
в момент времени t. Мы можем описывать марковскую цепь, задавая для
каждой пары i и / число р/7«, представляющее собой вероятность того, что
если при некотором испытании произошел исход щ, то при следующем
испытании появится исход Uj. Таким образом, рц есть вероятность перехода
цепи из состояния щ9 в котором она находилась после некоторого
испытания, в состояние и}- при следующем испытании. Например, в игре,
описанной в примере 4, в качестве состояний можно взять следующие значения:
Wj = r, и2 =Р, Из - четно, ы4 - нечетно. Тогда рп =#, так как, если при
некотором испытании выпал "герб", то вероятность получения при
следующем испытании "решетки" равней, С другой стороны р1Ъ = 0, так как
нельзя получить в качестве исхода (в результате бросания кости) четное
число в испытании, следующим за исходом "герб", полученным при
бросании монеты.
Число ру называется вероятностью перехода или переходной
вероятностью и совокупность переходных вероятностей удобно представить в
223
виде матрицы
' Рп Рп ... Pi л
Рг\ Ргг .. . Ргп
к Ли Рт ..
Например, в нашей игре Р задается матрицей
И й О О
О О И И
О О К К
Й И О О
Матрицу Р называют матрицей переходов или переходной матрицей
цепи Маркова. Элементы матрицы Р удовлетворяют условию
п
= 1, /= 1,2,...,л,
A)
т.е. сумма элементов строк матрицы Р равна 1. Если цепь Маркова после
некоторого испытания находится в состоянии щ, то после следующего
испытания она перейдет в одно и только одно состояние Uj. Каждый вектор
матрицы Р состоит из неотрицательных чисел, сумма которых равна 1.
Такие векторы называются вероятностными векторами, а матрица,
состоящая из вероятностных векторов, — стохастической матрицей. Ясно, что
иг-Г
'цу-четный
—нечетный
Рис. 5.1. Переходный орграф для игры
с монетой и игральной костью
каждая цепь Маркова определяет стохастическую матрицу. Обратно,
каждой стохастической матрице можно поставить в соответствие цепь
Маркова: достаточно в качестве состояний взять строки матрицы, а ее элементы
считать переходными вероятностями.
Из каждой стохастической матрицы Р можно достаточно очевидным
путем построить соответствующий ей взвешенный орграф. В качестве
вершин Hi, и2, ..., ип этого орграфа возьмем строки 1, 2, ..., п
матрицы Р и проведем дугу из щ к uj9 если рц > 0. В качестве весов дуг (м/, uj)
примем значения рц. (В § 4.2 этот орграф был назван орграфом Коатса
матрицы.)
На рис. 5.1 показан переходный орграф матрицы игры, описанной в
примере 4. Этот взвешенный орграф снова обладает неотрицательными
весами, удовлетворяющими уравнению A). Такого типа взвешенные
224
орграфы в дальнейшем мы будем называть стохастическими. Очевидно,
что существует взаимно однозначное соответствие между стохастической
матрицей и стохастическим орграфом. Если матрица Р есть матрица
переходов цепи Маркова, то соответствующий взвешенный орграф называют
орграфом переходов или переходным орграфом. Излагая материал этой
главы, покажем, что иногда полезно для изучения цепей Маркова
использовать переходные матрицы, а в других случаях более удобно проводить
исследования, используя их переходные орграфы.
Перейдем теперь к рассмотрению примеров цепей Маркова, описанных
в § 5.1, а также ряда дополнительных примеров, которые приведем ниже.
?3 Г)
Смерть Жизнь
Смерть /1 о v
L JL
Жизнь Смерть \ 6 6
Рис. 5.2. Переходные орграф и матрица для игры в револьверную рулетку
Р V »/2 1/2/
Рис.5.3. Переходные орграф и матрица для игры с бросанием монеты
0,662 0,150 п а
f\ Г\ .Дождь Ясно
Дождь /0,750 0,250 \
г = Ясно I 0,338 0,662 /
0.250 ¦ Ч '
Рис. 5.4. Переходные орграф и матрица для задачи о прогнозе погоды (Gabriel, Neuman
[1962])
благоп.
ty^*—'
Неблагоп.
Благоп.
Неблагоп.
(
Благоп.
1-р
Р
Неблагоп.
р '
1-р t
Рис.5.5. Переходные орграф и матрица для задачи о передаче сообщений, 0 < р < 1
(Различный характер приводимых примеров должен показать читателю
широкую применимость концепции цепей Маркова.) Во всех случаях мы
определим переходные матрицы и переходные орграфы. Номера
примеров продолжают нумерацию, начатую в предыдущем параграфе.
Пример 2. В варианте револьверной рулетки с барабаном,
вращаемым после каждого испытания, переходная матрица и переходный орграф
имеют вид, показанный на рис. 5.2.
15. ф.С. Роберте 225
Пример З.В случае бросания монеты переходные матрица и орграф
принимают вид, показанный на рис. 5.3.
Пример 6. В случае погоды в городе переходные матрица и орграф
принимают вид, указанный на рис. 5.4.
Пример 7. Политический деятель высказывает своему главному
помощнику собственную позицию (благоприятную или неблагоприятную)
относительно некоторого законопроекта. Помощник передает это решение
другому человеку, тот сообщает следующему и т.д. Предположим, что на
каждом шаге существует вероятность р того, что при передаче смысл
сообщения изменится на обратный. (Предполагается, что р - положительное
число, не равное 1.) Можно представить такой процесс передачи сообщений
цепью Маркова с двумя состояниями: щ - благоприятное
отношение, и2 - неблагоприятное. Переходные матрицы и орграф
показаны на рис.5.5.
Соображения, объясняющие, почему ситуация данного примера
определяет марковскую цепь, состоят в следующем. В любой момент времени
вероятность того, что некоторый человек передает сообщение "он
благоприятно относится к законопроекту" зависит только от полученного
данным человеком сообщения и не зависит от серии шагов, пройденных
сообщением, прежде чем оно его достигло. Мы обсудим в § 5.5 этот пример
цепи Маркова, являющийся модификацией примера, приведенного в книге
Kemeny, Snell, Thompson [1966, с. 276].
Пример 8. Рассмотрим элементарную модель прохождения молекулы
фосфора через экосистему "Пастбище". Для простоты примем во внимание
лишь четыре возможных состояния молекулы (рис. 5.6). В начальном
состоянии молекула фосфора находится в почве. Далее она может быть
абсорбирована каким-либо растением и перейти в травяной покров, выйти
из экосистемы или остаться в почве. Таким образом, находясь в одном из
состояний, молекула может переходить в другие состояния. Однако, как
только молекула вышла из экосистемы, она больше в нее не возвращается.
Переходные матрица и орграф, задающие вероятности различных
переходов, приведены на рис. 5.6. (Орграф построен на основе рисунка из книги
Mosimann [1968].)
Этот пример определяет цепь Маркова, ибо в любой момент
времени следующее состояние молекулы фосфора полностью
зависит лишь от ее настоящего положения и не зависит от предыстории.
Мы рассмотрим более подробно эту систему в § 5.4. Аналогичные модели
можно построить для самых различных пестицидов.
Пример 9. Потребление электроэнергии летом тесно связано с
температурой воздуха. Поэтому, планируя ежедневно производство и
потребление электроэнергии, компании, снабжающие население электричеством,
должны в принципе учитывать вероятности установления жаркой,
умеренной или холодной погоды.
Предположим для простоты, что в течение лета возможность наступления
завтра жаркой, умеренной или холодной погоды зависит лишь от того, был
ли сегодняшний день жарким, умеренным или холодным. Предположим
также, что переходные вероятности определены стохастической матрицей
и орграфом, приведенными на рис. 5.7. Мы задали, таким образом, цепь
Маркова, которую рассмотрим далее в § 5.5.
226
ПочВа и.
Эрозия
Внешнее
окрутя
экосистем^
«Пастбище,
± L. ± о
W 5 2
/1
10
4
\o
3_
10
2
5
1
20
Рис. 5.6. Переходный орграф и матрица переходов молекулы фосфора в экосистеме
"Пастбище" (Mosimann [ 1968, р. 161])
Ж
У
X
Ж У X
1/3 1/2 1/61
1/2 1/3 1/6
1/3 1/3 1/3 ,
Жара
Рис. 5.7. Переходные орграф и ма!рица для вариантов летней погоды
0,69В
Высокая
Средняя
вен
В / 0,448 0,484 0,068 \
?=С 0,054 0,699 0,247 )
Н \ 0,011 0,503 0,486/
Низкая
Рис.5.8. Переходные орграф и матрица для задачи о мобильности занятого населения
Пример 10. Социологи интересуются перемещениями, возникающими
между различными профессиональными группами населения при переходе
от одного поколения к другому. Следуя Прайсу (Prais [1955]), Кемени
и Снеллу (Kemeny, Snell [I960]), будем рассматривать интегрированную
мобильность населения между профессиональными группами как цепь
15*
227
И р И р М р W
0
1 1
з !
4
0
[1
о
о
\о
1
0
-р 0
1-
0
0
2
0
Р 0
1-р
0
3
0
0
0
0
4
0
0
0
р
1
Рис. 5.9. Переходные орграф и матрица для задачи о разорении игрока, 0< р< 1
Маркова. Состояниями такой цепи служат профессиональные группы
занятости, например, высшей В, средней С и низшей Н. На рис. 5.8
показаны переходные вероятности цепи Маркова с указанными состояниями.
Эти данные базируются на материалах 1949 г. по Англии и Узлсу и были
собраны Глассом и Холлом (Glass, Hall [1954]). Можно
интерпретировать Pij как вероятность того, что сын человека, работающего в группе
занятости /, получит работу в группе занятости /.
Пример 11. Стохастические матрицы и орграф, приведенные на
рис. 5.9, определяют переходные вероятности для цепи Маркова,
соответствующей знаменитой задаче о разорении игрока. Игрок, имея начальный
капитал, равный, например, двум долларам, делает разовые ставки в один
доллар. Он выигрывает с вероятностью р и проигрывает с вероятностью
1 — р (предполагается, что 0< р< 1). Если его капитал достигает четырех
долларов, игрок прекращает игру. Он также прекращает игру, когда
разоряется, т.е. теряет все свои деньги. Задача о разорении игрока служит одним
из примеров задач о случайном блуждании. Можно представить себе частицу
(например, молекулу газа), которая перемещается по прямой и меняет
направление движения в соответствии с определенными вероятностями.
Предполагается существование двух поглощающих границ — это точки О
и 4. Задачи о случайных блужданиях на прямой, на плоскости, в
пространстве имеют большое значение при исследовании моделей диффузии и
броуновского движения, в частности, при моделировании процессов
загрязнения атмосферы. Мы рассмотрим такие модели в § 5.4 и 5.11.
При изучении цепей Маркова одна из основных проблем заключается
в определении переходных вероятностей высших порядков р$р. Здесь
р\р означает вероятность того, что цепь находится в состоянии щ в момент
t = г, если в начальный момент t = О она находилась в состоянии щ. В
первой теореме утверждается, что вычисление вероятностей р\р сводится к
возведению в степень t переходной матрицы Р.
Теорема 5.1. Пусть Р — переходная матрица цепи Маркова; тогда
вероятность р(г) есть элемент (/,/) матрицыР*.
Доказательство. Доказательство проводится индукцией по г.
Теорема, очевидно, верна для t = 1. Теперь предположим, что она верна
для некоторого t и докажем, что она остается верной для t + 1. Чтобы
228
перейти из состояния ut в состояние щ за t + 1 шагов, сначала перейдем
за один шаг в состояние ик и потом из состояния ик в состояние Uj за
шагов.
Таким образом,
Согласно индукции pff — элемент (к> /) матрицы Р*. Отсюда следует
4iopjjt+1) - элемент (/,/) матрицы РР* =Pt+l. ¦
Читатель заметит аналогию между доказанной теоремой и теоремой 4.4
В экосистеме "Пастбище" примера 8 матрица Р имеет вид
1
р-
5
1
10
3
4
\о
10
2
5
0
0
0 —)
10 1
— 0
2
1 1
5 20 i
0 1/
Матрицы Р2,Р3 яР4 в этом
/ 0,390 0, 300 0,
р>-{°-
С-
U
\ о
475
600
3765
5290
4125
0,190 0,
0,225 0,
0 0
0, 2370
0,2185
0, 2700
0
\
{
1
0,6
0,1
0,75
\о
0,3
0,4
0
0
случае равны
150 0, 160 \
300 0,035
040 0, 135
1
0, 1800 0,
0, 1550 0,
0,1205 0,
0
1
Г
/
2065
0975
1970
0
0,5
0,2
0
\
V
)
/
0,1
0
0,05
1
0,384600 0, 207750 0, 154500 0, 253150 \
0,^55500 0,246100 0,140250 0,158150 j
0,364875 0,231750 0,159100 0,244275 Г
0 0 1 /
Пусть продолжительность шага равна одному дню. Тогда вероятность
выхода определенной молекулы из системы (попадание в ы4) по
прошествии четырех дней при условии, что в начале движения она была в
почве (состояние и\), определяется элементом A, 4) матрицы Р4, т.е.
она равна в нашем случае 0,253150.
Предположим теперь, что начальное состояние цепи Маркова выбирается
случайным образом. Тогда можно говорить о векторе вероятностей началь-
229
ных условий р@) = (р^, р2@), .. ., Ри0)) э где р/0) определяет
вероятность нахождения цепи в начальный момент времени в состоянии щ. Если
известно, что начальное состояние для цепи — состояние щ, то вектор
вероятностей начальных условий имеет вид р@* = @, ..., 0, 1, 0, ..., 0),
где лишь i-я компонента равна 1.
Пусть p/f* — вероятность пребывания цепи в состоянии щ в момент
времени t и пусть p(f* = (p[f*,р(*), ..., Рл'*) • Тогда в качестве
следствия теоремы 5.1 получаем следующий результат, доказательство которого
оставляем читателю в виде упражнения 19.
Теорема 5.2. p(f) =p@>Pf,
Возвращаясь к экосистеме "Пастбище" предположим теперь, что нам
неизвестно, откуда начинается движение молекулы фосфора. Можно тогда
предположить, что оно с равной вероятностью может начаться из любого
состояния. Следовательно, вероятность начала движения из любого
заданного состояния равна 1/4 и р^ = A/4, 1/4, 1/4, 1/4). Тогда вероятность
р^ выхода молекулы из экосистемы "Пастбище" за 3 с задается четвертой
компонентой вектора р@) Р3 = @, 330; 0, 181; 0, 114; 0, 375), т.е.
р4C) =0,375.
Упражнения
1. а. Составить матрицу переходов, соответствующую переходному орграфу,
приведенному на рис. 5.10.
б. Нарисовать переходный орграф, соответствующий следующей матрице
переходов :
1
1/2
1/4
0
0
1/2
1/4
1/8
0
0
1/4
7/8
0
0
1/4
0 .
2. а. Привести пример матрицы, не являющейся стохастической.
б. Могут ли два элемента вероятностного вектора быть равными Уг. А более,
чем два?
3. Рассмотрим цепь Маркова с матрицей переходов
A 0 0
0 1 0
Уг 0 Уг
а. Если начальное состояние цепи иг - 3, чему равна вероятность оказаться в
состоянии 3 после двух шагов?
б. Если начальное состояние цепи выбирается случайным образом, чему равна
вероятность оказаться в состоянии 3 после двух шагов?
в. Если р<°) = (Уг, 0, Уг), чему равен вектор р<2* ?
4. Определить переходную матрицу и нарисовать орграф для цепи Маркова в задаче
о супермаркете из упражнения 4 § 5.1. Вычислить вероятность того, что если
покупатель был замечен в эту неделю в "дешевом", то он еще будет продолжать покупать
в "дешевом" две недели спустя.
5. Определить переходную матрицу и нарисовать орграф для цепи Маркова в задаче
о водоснабжении из упражнений 7 § 5.1. Определить вероятность того, что резервуар
будет наполнен в начале 1985 г., если известно, что наблюдалось заполнение
резервуара в начале 1982 г.
6. Определить переходную матрицу и нарисовать орграф для цепи Маркова в
примере со сточными водами из упражнения 8 § 5.1. Какова вероятность того, что моле-
230
кула ртути, освобожденная в процессе производства сегодня, будет находиться в
сточных водах еще неделю?
7. (Bhat [1972]) Счета универсального магазина за купленные товары должны быть
оплачены в течение трех месяцев. Таким образом, по некоторому лицевому счету
существует после первого месяца положительный баланс в пользу покупателя. В
течение второго и третьего месяца после выписки извещений положительный баланс
в пользу покупателя сохраняется. Однако после третьего месяца, если положительный
баланс в пользу покупателя остается, неоплаченные извещения считаются
безнадежным долгом.
Построим цепь Маркова, описывающую переходы счетов из одного состояния в
другое. Рассмотрим состояния 7, 2, 5, Б и О, где 1, 2, 3 описывают ситуацию, когда
Рис. 5.10. Переходный орграф к
упражнению § 5.2
в течение первого, второго или третьего месяцев счет имеет положительный баланс
в пользу покупателя, Б - "безнадежный должник", а О - "оплаченный счет".
Состояние счетов универсального магазина описывается следующей матрицей
переходных вероятностей:
1 2 3 О Б
О 0,7 0 0,3 0
0 0 0,6 0,4 0
0 0,5
0 1
0 0
Нарисовать соответствующий ей переходный орграф. Какова вероятность того,
что положительный баланс, появившийся впервые в этом месяце сохранится еще
через два месяца?
8. Имеются три организации: "Олени", "Лоси", "Львы", каждый мужчина может
стать членом одной из них. Предположим, что 80 % сыновей Оленей становятся
Оленями, а остальные становятся Лосями. Среди сыновей Лосей 60 % становятся Лосями,
20% Оленями, а остальные Львами. Среди сыновей Львов 50% становятся Львами,
40% - Лосями, 10% - Оленями. Пусть каждый сын определенного индивидуума
присоединяется к одной и только одной из перечисленных организаций. Предположим
также, что каждый отец имеет только одного сына.
а. Описать переходную матрицу и переходный орграф, соответствующие членству
в организациях сыновей.
б. Какова вероятность того, что внук Оленя тоже станет Оленем?
в. Предположим, что' в данной популяции 50% - Олени, 40% - Лоси,
остальные — Львы, причем каждый человек принадлежит какой-либо организации. Если
выбран случайным образом один из членов этих организаций, то какова вероятность,
что его внук будет Оленем?
г. Почему условие задачи дополнено предположением, что каждый отец имеет
только одного сына?
9. Предположим, как и в предыдущей задаче, что у каждого мужчины, имеется
только один сын. И пусть рослый отец имеет сына высокого роста с вероятностью
0,6, сына среднего роста с вероятностью 0,2 и низкорослого сына с вероятностью
0,2. Отец среднего роста имеет сына высокого роста, среднего или низкорослого
с вероятностями 0,1; 0,7 и 0,2 соответственно. Низкорослый отец имеет сына
высокого, среднего или низкого роста с вероятностями 0,4; 0,2 и 0,4 соответственно.
231
а. Описать переходную матрицу и переходный орграф, соответствующие ситуации
задачи.
б. Какова вероятность того, что правнук высокого мужчины будет низкого роста?
в. Предположим, что нам неизвестен рост прадедушки некоторого человека, но мы
думаем, что он был с равной вероятностью или высокого или среднего роста.
Какую вероятность мы должны приписать допущению, что этот человек
высокого роста?
г. Предположим, что 20% мужской популяции имеют высокий рост, 20% - низкий
рост, остальные - средний рост. Каково будет распределение ростов через три
поколения?
10. (Goodman, Ratt [1971]) Две компании А и В производят и продают очень
хорошее пиво. И это единственные компании, торгующие пивом в одном небольшом
городе. Ежегодно рынок этого города может поглотить ровно 4000 баррелей пива.
В настоящее время на долю компании А приходится 25 % объема продажи пива, а на
долю компании В - остальная часть. Компания А решает начать активную рекламную
кампанию. В результате ежегодный объем продажи пива компанией А может возрасти
на 1000 баррелей с вероятностью 3/5 и уменьшиться на 1000 баррелей с вероятностью
2/5. Такой прогноз верен для тех лет, когда объем ее продажи в предшествующем
году был отличен от нуля. Если же объем продажи пива падает до нуля, то компания
прекращает свою деятельность в этом городе.
Определить набор состояний для цепи Маркова, описывающей приведенную
ситуацию, и указать соответствующие переходную матрицу и переходный орграф. Какова
вероятность того, что компания А будет продавать 3000 баррелей пива через два года
после начала рекламной кампании?
11. (Bhat [1972]) Исследование рынка выявило характер поведения потребителей
относительно трех сортов кофе - А, В и С. Анализ показал, что из покупателей,
предпочитающих в некотором месяце сорт/4, в следующем месяце 60%, покупают снова
кофе сорта А, 30 % переключаются на сорт В и 10 % переходят к сорту С. Для сортов
кофе В и С проценты переключения потребительского спроса равны: 50% от В к А,
30% от В к В, 20% от В к С, 40% от С к А, 40% от С к В и 20% от С к С. Описать
соответствующие переходную матрицу и орграф. Какова вероятность того, что
покупатель через два месяца будет пить тот же сорт кофе, который он потребляет сейчас?
(Предполагается, что в настоящее время потребитель с равной вероятностью пьет
любой сорт кофе.)
12. В задаче о построении цепи Маркова для прогноза погоды (пример 6 §5.1),
определить какова вероятность того, что если сегодня идет дождь, то в последующие
два дня дождя не будет?
13. В задаче о построении цепи Маркова для потребления электроэнергии
(пример 9 данного параграфа), определить какова вероятность того, что в ближайшие
два дня сохранится сегодняшняя погода? (Предполагается, что сегодня с равной
вероятностью может быть жарко, умеренно, холодно.)
14. В примере 4 § 5.1 описывается азартная игра с монетой и игральной костью.
Предположим, что игра начинается случайным образом из одного из четырех
состояний: Г, Р, чет, нечет. Какова вероятность того, что после двух испытаний игра
находится в состоянии Г?
15. Рассмотрим снова экосистему "Пастбище" из примера 8 настоящего параграфа.
Пусть нахождение молекулы фосфора в почве или в траве есть случайное событие.
Какова вероятность того, что через два периода времени она еще будет находиться
в почве?
16*. Показать, что, если Р - стохастическая матрица, то для всех t > 0 Р* остается
стохастической матрицей.
17. Пусть р - вероятностный вектор и Р — стохастическая матрица. Является ли
вектор рР вероятностным вектором? (Указать доказательство или привести
контрпример.)
18. Рассмотрим цепь Маркова с двумя состояниями. Пусть? - матрица вида
232
Доказать, что если а Ф 0 или b Ф О, то Р * имеет вид
b аA-а—Ь)* a a(l-a—b)f
a + b a + b a + b a + b
b ЬA-а-ЬУ a b(l-a-b)f
a+b a + b a +b a+b
19. Доказать теорему 5.2.
20. Рассмотреть, для каких задач из примеров 7—11 настоящего параграфа
марковские процессы служат достаточно хорошими моделями. После того как методы
исследования поведения цепей Маркова будут развиты в последующих параграфах,
можно вернуться к этому упражнению и обсудить специальные способы анализа
соответствия моделей марковских процессов задачам вышеперечисленных примеров.
§ 5.3. Классификация цепей Маркова и их состояний
Для удобства изучения цепей Маркова их полезно разделить на классы.
Проведем это деление таким образом, чтобы различные классы обладали
своими особыми свойствами. Кроме того, как увидим далее, понимание
поведения частных типов цепей Маркова приводит к пониманию поведения
цепей общего вида.
Перед тем как начать классификацию цепей Маркова, введем ряд
определений. Будем говорить, что множество С состояний замкнуто
(стохастически) , если для произвольных щ, принадлежащих С, и му, не
принадлежащих С, Pfj = 0. Таким образом, множество состояний С замкнуто, если,
однажды попав в С, цепь никогда его не покинет. Множество состояний С
называется эргодическим, если оно замкнуто, но никакое его
подмножество не замкнуто. Например, на рис. 5.11 множество {и7> Ив,Мп } замкнуто.
Но оно не является эргодическим, так как подмножество {иц} также
замкнуто. Последнее множество {ип } эрогодическое. Эргодические
множества удобно описывать ориентированными графами. Напомним, что
база вершин (вершинная база) орграфа D есть минимальная группа В
таких вершин, что каждая вершина и из D достижима из некоторой
вершины группы В. Аналогично, контрабаза вершин орграфа D представляет
собой минимальное множество вершин В* таких, что любая вершина и из
D достижима из некоторой вершины В' (контрабаза вершин в D является
базой вершин в орграфе, полученном из D заменой направлений всех дуг
на противоположные.)
Пусть Т есть переходной орграф цепи Маркова и D - образующий его
орграф, т.е, орграф Т без его весов р/у. В § 2.3 мы рассматривали орграф
?>*, являющийся конденсацией (путем стягивания сильных компонент) D.
Было показано (см. теоремы 2,7,2.8 и 2.9, а также следствие теоремы 2.8),
что D имеет сильную компоненту без .входящих дуг и что совокупность
всех таких сильных компонент образует единственную базу вершин в D.
Аналогично, легко показать, что D имеет сильную компоненту без
исходящих дуг и совокупность всех таких сильных компонент образует
единственную контрабазу вершин в Z)*.
Используя эти представления, легко показать, что эргодическое
множество состояний цепи Маркова совпадает с множеством состояний,
образующих в D сильную компоненту орграфа D без исходящих дуг, т.е.
сильную компоненту, образующую контрабазу вершин в D*. Например, в
233
'и9
Сильные компоненты
орграсра D: /Tf
Конденсация. Д*о^«-
А^ AA
Рис. 5.11. Переходный орграф /), его сильные компоненты и его множество
конденсации D*
орграфе, показанном на рис. 5.11, {ип) служит такой сильной
компонентой. Такими же являются множества {ии и2, Из) и {и9> Мю}.
Следовательно, они представляют собой эргодические множества состояний. Все
сильные компоненты орграфа D9 отличные от эргодических, будем называть
переходными (или неустойчивыми) множествами. Так как сильные
компоненты орграфа единственным образом осуществляют разделение его
вершин (см. теорему 2.6), можем определить состояние цепи Маркова
как эргодическое или переходное в зависимости от того, является ли ее
сильная компонента эргодической или переходной. Таким образом,
состояние цепи будет эргодическим тогда и только тогда, когда оно принадлежит
эргодическому множеству. Всегда существует по крайней мере одно
эргодическое множество и эргодическое состояние (почему?). Если цепь
Маркова находится в состоянии, принадлежащем эргодическому множеству,
она никогда это множество покинуть не сможет. Аналогично, покинув
переходное множество, цепь Маркова никогда в него не сможет вернуться,
ибо множество конденсации D* ациклично (см. теорему 2.7). Более того,
так как эргодические множества образуют контрабазу вершин в D*, из
любого состояния в переходном множестве можно достичь некоторого
эргодического множества.
Переходные орграфы на рис. 5.1, 5.3, 5.4, 5.5, 5.7 и 5.8 сильно связны
и, следовательно, сами образуют эргодические множества. Переходные
орграфы на рис. 5.2, 5.6 и 5.9 не являются сильно связными. На рис. 5.6
единственная сильно связная компонента без исходящих дуг состоит из
234
одной лишь вершины и4. Следовательно, {щ} есть единственное эргоди-
ческое множество и щ — единственное эргодическое состояние. Будем
называть такое состояние, которое само образует эргодическое множество,
поглощающим состоянием. Поглощающее состояние щ характеризуется
тем, что для него р#= 1. На рис. 5.2 состояние "Смерть" является
поглощающим. На рис. 5.9 имеются два поглощающих состояния: 0 и 4.
После классификации множеств и состояний цепи Маркова перейдем
теперь к классификации самих цепей. Если в цепи нет неустойчивых
(переходных) множеств, то все его сильные компоненты суть эргодические
множества. Более того, так как в конденсации D* этих сильных компонент
нет ни исходящих, ни входящих дуг (почему?), то процесс, начавшись в
одном из эргодических множеств, там и остается. Следовательно, можно
изучать поведение цепи на различных эргодических множествах
независимо. И без потери информации изучение марковских цепей без
неустойчивых состояний может быть сведено к исследованию цепей, у которых
множество состояний образует единственное эргодическое множество.
Такие цепи называются эргодическими. Следовательно, марковская цепь
называется эргодической тогда и только тогда, когда она сильно связна.
Мы изучим далее в § 5.5 особый класс эргодических цепей, называемых
регулярными цепями, и обобщим эти результаты в §5.6, перенеся их
на эргодические цепи произвольного вида.
Изучение цепей Маркова общего типа с неустойчивыми (переходными)
множествами можно разбить на две части: этап перед входом в
эргодическое множество и последующий этап. Как только цепь вошла в некоторое
эргодическое множество, она никогда не сможет его покинуть. И мы
можем сразу исследовать ее поведение в этом эргодическом множестве,
как будто имеем дело с эргодической цепью. До входа в эргодическое
множество мы можем игнорировать его структуру. Достаточно
объединить все состояния данного эргодического множества в одно состояние
и рассматривать его в качестве некоторого поглощающего состояния.
Как только цепь вошла в это состояние, следует изучать соответствующую
эргодическую цепь. Таким образом, как правило, можно свести изучение
этой первой фазы истории цепи Маркова к исследованию цепи, в которой
эргодические множества состоят каждое из единственного элемента. Такая
марковская цепь называется поглощающей цепью или цепью с
поглощающими состояниями. Изучению поглощающих цепей будет посвящен § 5.4,
а применение теории поглощающих цепей к произвольной цепи Маркова
будет обсуждаться в §5.10. Рассмотрение револьверной рулетки (см.
рис. 5.2), экосистемы "Пастбища" (см. рис. 5.6) и задача о разорении
игрока (см. рис. 5.9) служат примерами использования цепей Маркова
с поглощающими состояниями.
Упражнения
1. Для стохастических орграфов, изображенных на рис. 5.12, определить все
замкнутые, эргодические и неустойчивые множества.
2. Для стохастических орграфов, изображенных на рис. 5.12, определить все
эргодические, неустойчивые и поглощающие состояния.
3. Среди стохастических орграфов, изображенных на рис. 5.13, выделить орграфы,
соответствующие эргодическим цепям, поглощающим цепям и не относящиеся к ним.
235
Of 1 1
Рис. 5.12. Стохастические орграфы для упражнений 1 и 2 § 5.3
f
г 3
Рис* 5.13. Стохастические орграфы к упражнению 3, § 5.3 и упражнениям § 5.4
4* Среди приводимых ниже стохастических матриц выделить матрицы,
соответствующие эргодическим цепям, поглощающим цепям и не относящиеся к ним.
1/2 1/2 0 \ /О 1 О О
а. 1 0 0 1 1 б. | 1/2 0 1/2 0
0 0 1 у I 0 0 2/3 1/3
\0 0 1 0
236
0
0
0
0
1/2
1
0
0
0
0
0
1
1/2
0
1
0
-О 1 0 0 0
2/3 0 1/3 0 0
в | 0 1/2 0 1/4 1/4 | г.
0 0 0 10
>0 0 0 0 1
'о 1 о о
д. | 0 0 10
1/3 0 0 2/3
0 0 0
5. Для указанных ниже цепей Маркова ответить на вопросы упражнений 1 и 2.
а. Цепь Маркова для задачи о супермаркете (см. упражнение 4 § 5.1).
6. Цепь Маркова для задачи об уплате счетов (см. упражнение 7 § 5.2).
в. Цепь Маркова для задачи "Олени", "Лоси" и "Львы" (см. упражнение 8 § 5.2).
г. Цепь Маркова для задачи о наследовании признаков (см. упражнение 9 § 5.2).
д. Цепь Маркова для задачи о конкуренции пивоваренных компаний (см.
упражнение 10 § 5.2.).
б. Рассмотрим сеть коммуникаций, приведенную на рис. 2.3. Ее можно превратить
в цепь Маркова предположив, что, если у некоторого абонента сети имеется
сообщение, то он передаст его ровно одному абоненту (в том числе, самому себе), с которым
он непосредственно связан. Причем он с одинаковым удовольствием обращается
к любому из них.
а. Определить в се замкнутые, эргодические и неустойчивые состояния.
б. Рассмотреть две стадии, на которые следует разбить изучение этой цепи, т.е.
определить поглощающие и эргодические цепи, о которых шла речь в тексте. Мы
вернемся к аналогичным примерам в упражнениях 22 § 5.5 и 11,12 § 5.10.
7. Как можно использовать конденсацию D* орграфа D - образующего орграфа
переходного орграфа, для облегчения идентификации замкнутых множеств цепи
Маркова?
§ 5.4. Поглощающие цепи 1)
В поглощающей цепи Маркова имеется некоторое число поглощающих
состояний, а также неустойчивые, т.е. непоглощающие состояния. Читателю
предоставляется возможность самому доказать следующий полезный
критерий, характеризующий свойство поглощающей цепи.
Теорема 5.3. Цепь Маркова является поглощающей тогда и только тогда,
когда существует по крайней мере одно поглощающее состояние и из
любого непоглощающего состояния можно перейти в какое-нибудь
поглощающее.
Доказательство. См. упражнение 9.
Например, в задаче о разорении игрока (см. рис. 5.9) одно из
возможных доказательств наличия поглощающей цепи Маркова может состоять
в следующем. Поглощающее состояние существует, это, например,
состояние 4. Из любого непоглощающего состояния можно перейти в
поглощающее. В нашем случае из произвольного поглощающего состояния можно
перейти в состояние 4. В цепи Маркова, представленной на рис. 5.11, имеет-
1) Изложение материала в этом и последующих разделах следует Kemeny, Snell
[I960, гл. 3].
237
ся единственное поглощающее состояние «и. Но из состояния и9 нельзя;
перейти в состояние w 11, поэтому эта цепь Маркова отлична от
поглощающей. В цепи Маркова на рис. 5.12,5 из состояния и6 нельзя перейти
в поглощающее состояние uu, однако эта цепь является поглощающей.
(Почему?)
При изучении поглощающих цепей Маркова нас будут интересовать
следующие сведения.
A) Вероятность перехода в поглощающее состояние м,- при условии,
что процесс начался в непоглощающем состоянии щ.
B) Среднее время пребывания процесса в непоглощающем состоянии щ
до его перехода в некоторое поглощающее состояние при условии, что в
начальный момент он находился в непоглощающем состоянии щ\
C) Среднее число шагов до перехода процесса в некоторое
поглощающее состояние при условии, что начальное состояние есть непоглощающее
состояние щ.
Мы сумеем дать ответы на все эти вопросы, выразив их через переходные
вероятности матрицы перехода Р.
Теорема 5.4. В произвольной (конечной) цепи Маркова независимо от
начального состояния вероятность перейти за t шагов в эргодическое
состояние стремится к единице при t -* °°.
Приведем перед доказательством этой теоремы следующее следствие.
Следствие. В поглощающей цепи Маркова вероятность поглощения равна
единице.
Доказательство теоремы 5.4 *). Пусть Т — переходный
орграф и D порождающий его орграф. Так как эргодическое множество
образует контрабазу вершин для конденсации ?>*, из каждой неустойчивой
вершины (переходного состояния) можно перейти в некоторую эргодичес-
кую вершину (состояние) щ. Так как множество вершин конечно, то
найдется число г такое, что для каждой неустойчивой вершины щ
существует эргодическая вершина щ удовлетворяющая условию d(щ,и/) < г где
с1(щ, uj) — длина в орграфе D кратчайшего пути из щ в My. Таким образом,
независимо от начального состояния вероятность перейти в эргодическую
вершину не более чем за г шагов, есть положительное число р.
Вероятность не попасть в эргодическую вершину за число шагов, не
превосходящее г , равна 1 -р.
Так как процесс марковский, то вероятность не попасть в
эргодическую вершину за следующий период, тоже не превосходящий г
шагов, снова равна 1 — р. Рассуждая далее аналогичным образом, можно
прийти к выводу, что вероятность не попасть в эргодическую вершину за
число шагов, не превосходящее кг, равна A -р)к. Посколькур
положительно и не превосходит единицы, эта вероятность стремится к нулю, что и
завершает доказательство. ¦
В поглощающей цепи Маркова условимся так нумеровать состояния,
чтобы поглощающие получили первые номера. Тогда1 переходная
матрица Р принимает особенно простой вид который мы будем называть
') В данной главе доказательства теорем, как уже указывалось выше, можно
опустить.
238
канонической формой матрицы Р.
Поглощающие
состояния
Непоглощаю-
щие
состояния
Поглощающие
состояния
иг /
Ы2 / /
L /
"m+ll
"m + 2 \
\ R
\
Непоглощаю щие
состояния
ит + 1» ит + 2 > • • • > w«
\
С/
G
i
B)
Здесь / - единичная матрица размерности тХ т9О - матрица размерности
m X (п - т), все элементы которой равны нулю. Матрица Q размерности
(п - т)Х(п- т) указывает переходные вероятности, определяющие
переходы из непоглощающих состояний в непоглощающие, а матрица R
размерности (п- т)Х т — переходные вероятности, определяющие
переходы из непоглощающих состояний в поглощающие.
При подобной перенумерации состояний цепи Маркова,
соответствующих задачам о револьверной рулетке (см. рис. 5.2), экосистеме
"Пастбища" (см. рис. 5.6) и задаче о разорении игрока (см. рис. 5.9) имеют
переходные матрицы Р\, Рг и Р$ следующего вида:
Мертвый Живой
Мертвый
Живой
1
1/6
5/6
«1
U2
из
1 1
1/10
0
1/20
«1
0
3/5
1/10
3/4
«2
0
3/10
2/5
0
«3
0
0
1/2
1/5
0
4 I
1
2 '
3
0
/ 1
о
1-р
1 о
\о
4
0
1
0
0
р
1
0
0
0
1-р
0
2
0
0
р
0
1-р
3
0'
0
0
р
0
Условимся теперь относительно ряда определений. В частности, для
произвольной квадратной матрицы М определим М° = /, где / — единичная
матрица. Кроме того, будем говорить, что последовательность матриц Mt
239
приближается,шт стремится, к матрице А и писать М -*А, если каждый
элемент М стремится к соответствующему элементу А при t, стремящемся
к бесконечности. Например, пусть
/1/2 0
/1/2 0
[
\0 1
, / A/2)' 0 \
Так как A/2)г->0 и l'-> 1,то
\0
Аналогично, если
0 1/2
и Л/, =Л/', легко доказать, что
О A/2)'-Ч
A/2)' j'
и, таким образом,
\о о/
Как обычно, если последовательность Rt= 2 Ms сходится к матрице В
оо J = О
при t-*°°, мы будем говорить, что В= Б Ms. Например, если
1/2 О
О 1/2
A/4/
то
)*
S A/2)* О
s = 0
2 A/4/
,!.*'¦( о
240
Теорема 5.5 Для поглощающей цепи Маркова с переходной матрицей,
представленной в канонической форме B), справедливы следующие
утверждения.
а. С-+0.
б. Матрица (/ - б) имеет обратную матрицу.
В.С/-0 = /+б + б2 + ... = ? QS.
s = o
Доказательство. Пункт а следует из теорем 5.1 и 5.4, так как
Q - переходная матрица для непоглощающих состояний. Перейдем к
доказательству пп. б и в. Напомним ряд свойств определителей: det (AB) =
= det A det В; det / = 1. Матрица М имеет обратную матрицу тогда и только
тогда, когда det МФО. Заметим, что
Таким образом,
(/-б)(/+б + б2+. .. + Q'-1) = /-?'. C)
Тогда / — Q * -* /, ибо Q * -> 0. Но нам известно, что det / = 1. Отсюда для
достаточно больших значений t имеем det(/ - Qt) Ф 0 *). Поскольку
det D2?) = det Л det В, из соотношения C) следует, что det(/ - Q) Ф 0 и
п. б теоремы доказан.
Так как обратная матрица (/ — Q) существует, можно ее умножить на
обе части равенства C); получим
/+e+G2+.+G'-1=(/-Gr1e-e'). D)
При t -* °° правая часть D) стремится к (/ - Q), что доказывает часть в.
Теорема доказана полностью. ¦
Следствие. Пусть Q — любая матрица, элементы которой —
действительные числа, и Q * -» 0. Тогда матрица (/ - Q) имеет обратную и
(С) ? <2.
5 = 0
Доказательство. При доказательстве пп. б и в теоремы
использовалось лишь условие Q * -*0. Тем самым, следствие доказано.
Нужно заметить, что формулу, полученную в следствии, нельзя считать
практическим средством для вычисления матрицы (/ - б). Это лишь
теоретический аппарат, который мы в дальнейшем будем использовать.
Обращение же матрицы (/ - Q) следует проводить традиционными
методами.
Матрицу N = (/ — б) будем называть фундаментальной матрицей
поглощающей цепи Маркова. Мы скоро увидим, что с ее помощью можно
получить ответ на основные вопросы относительно поглощающих цепей,
упомянутые в начале параграфа.
' Здесь использован хорошо известный факт, что детерминант определяет
непрерывную функцию и, кроме того, что det(/ - Q *) весьма близок к det /для достаточно
больших значений и
16. Ф.С. Роберте 241
Теорема 5.6. Для поглощающей цепи Маркова среднее время (число
попаданий) до поглощения в непоглощающее состояние м/ при условии, что
в начальный момент она находилась в непоглощающем состоянии м,-,
равно элементу (/, /) фундаментальной матрицы N!).
Доказательство. Пусть вц - искомое среднее время. Введем
величину cjs\ равную 1, если процесс находится в состоянии щ в момент
времени s и нулю в остальных случаях. Далее, пусть для произвольной
величины х Ei(x) представляет среднее значение х при условии, что
процесс начался в состоянии щ. Тогда
» 4S))= 2 *,(с,A))« 2 [A -pf} pl
5 = 0 ' 5 = 0 ' 5=0 ' ' s = 0
Но ptj есть элемент (/,/) матрицы Q. Следовательно, ец является элемен-
оо
том (/,/) матрицы 2 Qst которая, согласно п. в теоремы 5.5 равна N. ¦
5 = 0
Следствие. Среднее число шагов до поглощения, определяемое при
условии, что в начальный момент процесс находился в непоглощающем
состоянии щ , равно сумме элементов ш строки матрицы N3).
С целью иллюстрации применений этой теоремы и ее следствия
рассмотрим снова примеры цепей Маркова, описывающие игру в револьверную
рулетку (см. рис. 5.2), поведение экосистемы "Пастбище" (см. рис. 5.6) и
задачу о разорении игрока (см. рис. 5.9). Матрица Q для задачи о разорении
игрока равна
v
2
1
0
\-р
0
2
Р
0
1
3
0
р
-р 0
Для случая р = 1/3 имеем
/1 -1/3 О
1-G= -2/3 1 -1/3
\ 0 -2/3 1
и, проделав соответствующие вычисления, находим
1 2 3 Сумма по строке
1/7/5 3/5 1/5 \ 11/5
^=(/-еГ1= 2 6/5 9/5 3/5 18/5 E)
3\4/5 6/5 7/5/ 17/5
О В этом параграфе мы будем считать, что элемент (/,/) матрицы есть элемент в
строке, соответствующей щ9 и столбце, соответствующему му. В матрице /-я строка
есть строка, соответствующая W/.
2) Замечание. Равенство /Г,-B) = 2(?/) справедливо, ибо известно, что
= ?р{у , а последний ряд, как мы знаем, сходится.
3) См. сноску *).
242
Таким образом, среднее число шагов до поглощения при условии, что
вы начали играть, имея 2 доллара, равно 18/5. Мы его находим, вычислив
сумму элементов второй строки матрицы N. В среднем, начав играть с
капиталом 2 доллара, у вас 3 доллара будет 3/5 раза (и2 з = 3/5). Эти
результаты можно интерпретировать следующим образом. Бели бы вы играли до
проигрыша (поглощения) много раз, начиная каждый раз с суммой в 2
доллара, и подсчитывали число туров до разорения, то оказалось бы, что в
среднем игра длится 3 или 4 тура, т.е. 18/5 тура. Кроме того, число туров до
проигрыша, когда у вас было 3 доллара, в среднем меньше одного и
разорение часто происходит до накопления 3 долларов.
В задаче об экосистеме "Пастбище" матрицы Q,I - Q kN имеют
следующий вид:
3/10 0
2/5 1/2
0 1/5
I-Q-
Сумма по строке
15,6
17,6 F)
16,0
Среднее число дней до выхода фосфора из системы при условии, что в
начальном состоянии он находился в почве, равно 15,6. Оно находится
суммированием элементов первой строки матрицы N9 соответствующей их
(их - почва). Аналогичные вычисления, сделанные для двух других
пестицидов, позволяют получить информацию, необходимую дня определения
пестицида с возможно меньшей продолжительностью пребывания в
экосистеме. В свою очередь эту информацию можно использовать для выбора
альтернативного варианта. (Одна из проблем, возникающих при
использовании пестицидов, например ДЦТ, состоит в чрезвычайно длительном
пребывании пестицидов в экосистеме после их внесения.)
Для игры в револьверную рулетку матрица Q имеет вид
Живой
<2 = Живой E/6)
Здесь 1 - Q = A/6) и N= A - Q)'1 = F). Отсюда можно заключить, что
среднее число испытаний до гибели при условии,что началом есть состояние
живой, равно шести.
В задачах, аналогичных проблеме разорения игрока, где существуют два
поглощающих состояния, желательно определить вероятности поглощения
для каждого из поглощающих состояний. Эти вероятности зависят от
начальных состояний.
16* 243
Теорема 5.7. Пусть в поглощающей цепи Маркова с переходной
матрицей, заданной в канонической форме B), Ъц представляют вероятности
попадания в поглощающее состояние W/ при условии, что в начальный
момент процесс находился в непоглощающем состоянии щ. Бели
В - (п - т)Х ю-мерная матрица с элементами 6#, то
где R определяется канонической матрицей B),aiV- фундаментальная
матрица (/ - Q) этой цепи *).
Доказательство. Начнем доказательство с вывода рекурентного
соотношения для Ьц. Пусть щ — начальное состояние. Из этого состояния
цепь может попасть в поглощающее состояние и3, перейти в поглощающее
состояние м*, к Ф / или перейти в непоглощающее состояние иг . Эти
переходы совершаются соответственно с вероятностями р/у-, pik или pir .
Вероятности перехода из состояний и/, ик ииг в поглощающее состояние щ
равны соответственно 1,0 и Ьп: Следовательно,
п
Ьц=Рц+ 2 pirbrj.
? = tn + 1
Но так как щ — непоглощающее состояние, а щ — поглощающее, то
вероятность ptj есть элемент (/, /') матрицы R 2). Аналогично ввиду, того, что
Ui и иг — непоглощающие состояния, вероятность pf/- есть элемент (/, г)
матрицы Q. Отсюда следует, что
B = R + QB.
Вычитая из обеих частей этого равенства QB и умножая его на (/ - Q) *1 ,
получим
В задаче об экосистеме "Пастбище" матрица/? имеет вид
R = «2 I О
«з V 1/20,
Отсюда, используя матрицу N уравнения F), получим
«з
Это неудивительно. Независимо от начального состояния вероятность
перехода цепи в единственное поглощающее состояние равна 1. В
действительности это результат следствия теоремы 5.4.
1) См. сноску !) на с. 242 ¦
а) См. сноску О на с. 242.
244
В задаче о разорении игрока, если задана вероятность р = 1/3 матрица Л
имеет вид
4
0 \
R = 2 ( О О ]. Отсюда, используя N из уравнения E), находим
1/3/
4
1/15 \
В= 2 ( 4/5 1/5 1 .
7/15 /
Вероятность попасть в поглощающее состояние 0, т.е. вероятность
разорения, меняется в зависимости от выбора начального состояния. Она равна
4/5 если игра начинается из состояния 2, и даже если вы начинаете игру из
состояния 3 она больше 1/2, точнее Рзо = 8/15. Естественно, что чем ближе
в начальный момент капитал игрока к нулю, тем выше вероятность его
разорения. Читатель может заметить, что Z>/0 + Ъц = 1 для всех /. Это снова
иллюстрирует следствие теоремы 5.4.
Наконец, в задаче об игре в револьверную рулетку,/? = A/6) nB = NR =
= A). И-вероятность смертельного исхода, как это ни печально, равна 1.
Упражнения
1. Используя теорему 5.3 определить, какие из цепей Маркова, изображенных на
рис. 5.13, являются поглощающими.
2. Определить для каждой из представленных ниже матриц, используя теорему 5.3,
соответствуют ли они поглощающей цепи Маркова? Для проверки применить
определение поглощающей цепи:
1
0
0
0
1
0
0
1/3
2/3
0
1
0
0
0
1
0
0
0
0
0
1/2
1/2
0
1
1/2
0
0
0 ^
о 1
1/2
112)
0
0
0
0
0
/ 1/3 1/3 1/3 \
>=( 1 О О I ;
V 0 1/2 1/2 /
Р'\
О
О
в. Р=\ О О 1/2 0 1/2
2/3
1/3.
3. Преобразовать следующие переходные матрицы поглощающих цепей Маркова
в каноническую форму и определить Q и R:
О 0 1/3 2/3
0 10 0
0 0 10
1/2 1/4 1/4 0
в.
/ 1 0 \
( I; г. Р-.
\ 1/3 4/5 /
р
1
1/5
1
1/5
¦(
0
1/5
0
1/5
1/3
0
0
1/5
0
1/5
0
1/3
0
0
1/5
0
1/5
1
1/3
1
0
1/5
0
1/5
245
4. Для цепи Маркова, описывающей загрязнение реки сточными водами (см.
упражнение 8 §.5.1) определить вероятность того, что некоторая молекула ртути будет
вынесена в море, и вычислить среднюю продолжительность этого процесса в днях.
5. В ситуации с проведением рекламной акции, описанной в упражнении 10 § 5.2,
найти вероятность того, что компания А откажется от производства пива? Какое
в среднем число лет может пройти после начала рекламной кампании пока одна
из компаний (А или В) не откажется от производства пива?
6. В ситуации с оплатой счетов, описанной в упражнении 7 § 5.2, предположим,
что месячный анализ показал появление положительного баланса неоплаченных
счетов. Какова вероятность того, что произошла просрочка платежей?
Рис. 5.14. Переходный орграф для "Страны
Дождей" см. упражнение 7 § 5.4
7. В Стране Дождей возможны три вида погоды: дождь (Д) ясно (Я) и снег (С).
Переходные вероятности указаны на стохастическом орграфе, приведенном на
рис. 5.14.
а. Известно, что в настоящий момент идет снег. Определить среднее число ясных
дней до начала постоянных дождей.
б. Известно, что сейчас идет снег. Определить среднее число дней до начала
постоянных дождей.
в. Известно, что в настоящий момент ясно; какова вероятность, что пройдет
неожиданный дождь?
8 .(Keme ny, Snell, Thompson [1966]) Анализ недавнего хоккейного матча между
Дартмутом и Принстоном позволил сделать следующие выводы: если шайба
находилась в центре (Ц), то после этого она с вероятностью 0,4 входила на половину поля
Принстона и с вероятностью 0,6 - на половину поля Дартмута. Со стороны поля
Дартмута шайба посылалась обратно в центр с вероятностью 0,95 или в ворота
Дартмута (ВД) с вероятностью 0,05. Последнее означает, что Принстон забил гол.
Со стороны поля Принстона шайба шла в центр с вероятностью 0,90 и посыпалась
в ворота Принстона с вероятностью 0,1; гол забивал Дартмут. Пусть шайба
находится в центре. Найти переходную матрицу для цепи Маркова из пяти состояний,
описывающих ход игры до первого гола. Вычислить вероятность того, что первым
забьет гол Дартмут.
9. Доказать теорему 5.3.
10. Привести пример цепи Маркова, обладающей поглощающим состоянием, но не
являющейся поглощающей цепью.
11. Для приведенных ниже матриц М найти матрицу такую, что М* -> А:
f l ° °\ /Уг 0 \
а. М =[ 0 1 0 1; б. М = [ ) ;
\ 0 0 1 / \ 0 И /
I Уг 0 0 ч ,_i/2 0\
в. Л/ = ( 0 Уг 0 1; г. М = ( ;
\ 0 0 1/ \ 0 О/
/ ~1/2 0 0ч ,у2 у2\ I 1/2 1/2ч
д. Л/= 0 Уг 0 ; е. М = [ I ; ж. М = ( I.
V 0 0 1 / \0 0/ \ 0 И/
246
t
12. Для приведенных ниже матриц М найти матрицу А такую, что 2 Ms -*A:
5=0
д.
t
13. В задаче об экосистеме "Пастбище" вычислить Б Qs для t = 1, 2 и 3. Схо-
5 = 0
дятся ли результаты к N1 Объясните ответ.
14. Пусть
Q"
* и/
t
Вычислить X Qs ддя t = 1, 2 и 3. Стремится ли последовательность сумм к некото-
рому пределу? Привести объяснение.
15. Доказать, что QN = NQ.
16. Согласно упраженнию 13 § 4.7, если Л есть матрица смежности взвешенного
орграфа и все собственные значения А меньше единицы, то А -*- 0. Пусть для такого
орграфа V(?) есть вектор значений, принимаемых его вершинами при автономном
импульсном процессе (используются обозначения и терминология гл. 4).
Показать, что
V@ -* V(hcx) + P(r) (/ - A)'l,
где Р@ -вектор начальных импульсов.
17. (Kemeny, Snell [160]. Пусть Р - переходная матрица поглощающей цепи
Маркова и пусть В* - матрица размерности п X п элемент (/, / ) которой, равный &?•, есть
вероятность перехода в поглощающее состояние иг при условии, что в начальный
момент процесс находился в состоянии Uj. Таким образом, если м/ — поглощающее
состояние, то by равно 1, если /=/ и равно 0 в остальных случаях. Доказать, что РВ* = В*.
§ 5.5. Регулярные цепи
5.5.1. Определение регулярной цепи. Напомним читателю, что цепь
Маркова называется эргодической, если образующий орграф его переходного
орграфа является сильно связным, т.е. из любого состояния цепи можно
перейти в произвольно выбранное, Если существует такое число к9 что
переход из любого состояния цепи в любое другое состояние совершается
ровно за к шагов, то цепь Маркова называется регулярной. Не всякая эрго-
дическая цепь регулярна, Рассмотрим, например, следующую эргодическую
марковскую цепь (рис, 5.15). Из состояния их можно перейти в
состояние и2 лишь за нечетное число шагов, а переход из Mi в состояние U\
требует четного числа шагов. Таким образом, цепь не является регулярной.
В регулярной цепи все элементы матрицы, получаемой в результате
возвышения в степень к переходной матрицы Р9 положительны. Более того, так
как все элементы матрицы Рк положительны, то положительны и все
элементы матрицы Р* для всех t > к (Почему?) Следовательно, независимо
от начального состояния, существует положительная вероятность
нахождения в момент г, следующий за к, любого заданного состояния. Согласно
теореме 5.2 р^ = р(°)р*9 где все компоненты вектора рО положитель-
247
ны ввиду положительности элементов матрицы Р* г и сумма компонент
вектора р*0* равна 1 1). Эргодическая цепь на рис, 5,15 не обладает
указанным свойством. Так, если начальное состояние есть состояние uit то
вероятность очутиться в том же состоянии после нечетного числа шагов
равна 0.
Выше были перечислены многие примеры регулярных цепей.
Стохастические орграфы, приведенные на рис. 5.1, 5.3, 5,4, 5.5, 5.7 и 5.8 определяют
регулярные цепи Маркова. На рис. 5,3, 5.4, 5.5, 5,7 и 5,8 можно из
произвольной вершины перейти в любую другую вершину (или вернуться
Рис. 5.15. Пример эргодической цепи
Маркова, не являющейся регулярной
в исходную) за один шаг. (Для рис. 5.5 используется предположение, что
0 < р < 1,) В примере, показанном на рис, 5.1, из состояния Г нельзя
перейти во все остальные за один шаг. Но из произвольной вершины можно
перейти в любую другую за два шага* Например, можно за два шага перейти
из Г в Р, Такой двухшаговый переход осуществляется если сначала
перейти из Г в Г, а на втором шаге из Г в Р. Для проверки покажем, что
все элементы матрицы Р2 положительны. Непосредственные вычисления
дают
1
4
1
4
1
4
1
4
1
4
1
4
1
4
1
4
1
4
1
4
1
4
1
4
1
4
1
4
1
4
1
4
Существуют различные пути для выяснения факта регулярности цепи
Маркова. Один из них состоит в рассмотрении переходного орграфа и
использовании определения регулярности. Другой заключается в
следующем: необходимо показать, что в некоторой степени матрицы Р все
элементы положительны. Наконец, докажем в следующем параграфе, что
эргодическая марковская цепь регулярна, если в матрице Р существует
диагональный элемент ри > 0.
Этот результат показывает, что многие эргодические цепи являются
регулярными. Рассматриваемые в практических задачах эргодические цепи,
как правило, также регулярны. Кроме того, большинство теорем,
относящихся к регулярным марковским цепям, обобщаются в той или иной
1) Напомним читателю, что р^' = (р^\ р^\ ...,р^), где р^ есть
вероятность находится в момент t в состоянии /.
248
форме на эргодические цепи. Поэтому, учитывая, что с регулярными
цепями работать легче, мы наше рассмотрение начнем именно с них,
В регулярных цепях Маркова нет поглощающих состояний, и из любого
состояния можно перейти в любое другое. Возникающие здесь вопросы
отличны от проблем, решаемых при исследовании цепей с поглощающими
состояниями, Вот два из числа наиболее интересных вопросов.
1. Если цепь находится в состоянии щ9 то какова вероятность ее
перехода после t шагов в состоянии щ и как эта вероятность зависит от
начального состояния, когда t становится большим?
2, Какое среднее число шагов необходимо для возвращения в
произвольно выбранное состояние?
5.5.2. Стационарные векторы. Рассмотрим цепь Маркова, описывающую
изменения состояния погоды (см. рис. 5.7). Согласно теореме 5.1
последовательность степеней Р* матрицы Р определяют Мпаговые переходные
вероятности. Вычислив степени матрицы Р>< матрицы Р29 Р3, Р4,
получим *)
/ 0,3333 0,5000 0,1667
0,5000 0,3333 0,1667
0,3333 0,3333 0,3333
/0,4167
Р2 = I 0,3889
\0,3889
0,3889
0,4167
0,3889
/ 0,3982 0,4028
Р3 = 0,4028 0,3982
\ 0,3982 0,3982
0,3997
0,4005
0,3997
Строки этих матриц, по-видимому, стремятся к одному и тому же
вектору w = @,4; 0,4; 0,2). Это наблюдение подтверждается при вычислении
*) Суммы строк матриц Р2,Р*,Р*. не равны в точности 1 ввиду ошибок
округления.
249
более высоких степеней матрицы Р. Например,
/ 0,4001 0,4001 0,2001 \
Р* = I 0,4001 0,4001 0,2001 I .
\ 0,4000 0,4000 0,2000 /
Следующая теорема покажет, что это не случайно.
Теорема 5.8. Пусть Р - переходная матрица регулярной цепи Маркова.
Тогда
а. Рг стремится к стохастической матрице W при t -> ©о.
б. Все строки матрицы W совпадают и представляют собой
вероятностный вектор w= (wb w2>...,ww).
в. Все компоненты вектора w положительны.
Отнесем доказательство теоремы 5.8 в п. 5.5.4 данного параграфа.
Оказывается, что вектор w на практике легко вычисляется. Следующая
теорема укажет способ его определения, а также позволит выявить
несколько других важных свойств регулярных цепей Маркова.
Теорема 5.9. Пусть Р — переходная матрица регулярной цепи Маркова,
а матрица W и вектор w определены согласно теореме 5*8. Тогда
выполняются следующие условия.
а. Для каждого вероятностного вектора р вектор рРг стремится к
вектору w при t -* оо.
б. w - единственный вероятностный вектор, обладающий
свойством wP = w.
в. PW = WP = W.
Обсудим условия теоремы 5.9 до ее доказательства. Предположим, что
мы применили первое условие теоремы (условие а) к вероятностному
вектору р@*, т.е.4 к вектору вероятностей начальных состояний. Тогда
р(<>)/> = р\ где вектор р<г) определяет вероятности различных состояний
цепи в момент t. Согласно условию п. а теоремы 5.9, если t достаточно
велико, то вероятность находится в состоянии щ в момент t близка
к щ независимо от выбора начального состояния. Пункт б этой теоремы
указывает нам практический способ вычисления вектора w. Уравнение
wP = w преобразуется к системе из п уравнений с п неизвестными W/.
Эти уравнения имеют вид
wi9 G)
ще Pi ~ /-ft столбец матрицы Р.
Такая система в общем случае не имеет единственного решения. Однако,
если дополнить ее условием, что w есть вероятностный вектор, т.е.
2w, = 1, (8)
то уравнения G) и (8) обладают единственным решением. (Конечно, для
получения единственного решения следует использовать уравнение (8)
и произвольные л—1 уравнения системы G).)
Вектор w, определяющий вероятности стационарных состояний, обычно
именуют стационарным вектором или вероятностным вектором неподвиж-
250
ной точки матрицы Р. Второй термин возник из представления, что w -
неподвижная точка преобразования Р *).
(Используя терминологию § 4.2 можно утверждать, что w есть
собственный вектор матрицы Р с собственным значением, равным 1. Таким обра
зом, единица есть собственное значение матрицы Р, и существует
единственный вектор w, соответствующий этому собственному значению, у
которого сумма значений компонент равна 1. В действительности можно
показать, что для регулярных цепей единица есть одно из собственных значений
кратного собственного значения 1, откуда следует единственность
вероятностного вектора w, Читателей, интересующихся более подробным
рассмотрением собственных значений при анализе цепей Маркова и желающих
ознакомиться с частными случаями результатов гл. 4, мы отсылаем к
работам Романовского [1970], Сох, Miller [1965] или Karlin[ 1969 а]. Мы
обсудим также более детально этот подход ниже в упражнениях 16 - 19 и
упражнении 8 § 5.6).
Для иллюстрации применения теоремы 5.9 обратимся к примерам,
обсуждавшимся ранее. В ситуации, соответствующей рис, 5.5, имеем
' 1-Р Р
Р 1-Р
Тоща условие (wu w2)P - (wx$ w2) приводит к уравнениям
= wl9 (9)
'(l -p) = H>2. A0)
Оба эти уравнения совпадают; при р > 0 каждое эквивалентно уравнению
vvx = w2, Однако воспользуемся также условием
W, + W2 = 1. .A1)
Тогда из уравнений (9), A1), учитывая, что р > 0, найдем единственное
решение: w% = %, w2 = lA, Интерпретация этого результата следующая:
независимо от исходной точки зрения политика и как бы ни была малой
вероятность р, при длительном течении процесса мы с вероятностью 1А
услышим, что политик положительно относится к данному законопроекту
и с вероятностью Й, что он относится к нему отрицательно! (Не объясняет
ли это противоречивые сведения, которые мы часто слышим относительно
намерений государственных и общественных деятелей?)
*) Теорема 5.9 утверждает, что любая регулярная цепь Маркова имеет
единственный вероятностный вектор, соответствующий неподвижной точке матрицы Р.
Оказывается, что любая цепь Маркова обладает вероятностным вектором неподвижной
точки. Более того, ряд нерегулярных марковских цепей имеют единственный
вероятностный вектор неподвижной точки. Таким образом, из того факта, что
некоторая цепь Маркова имеет единственный вероятностный вектор,
соответствующий неподвижной точке переходной матрицы, не следует, что эта цепь
регулярна.
251
Проведем аналогичный анализ для примера с юменением летней погоды
(см. рис. 5.7). Здесь
111
3 2 6
111
2 3 6
111
3 3 3 /
Уравнение (vvb w2f w3)P = (wb w2f w3) приводит к системе уравнений
1 1 1
-т wt + ^ vv2 + -j w3 = Wj,
1 1 1
"^ wl + "o W2 + 4 W3 = W2 ,
1 w + 1 w +iw
6 6 3
Отбросив последнее уравнение и используя вместо него условие
Wx + W2 + W3 = 1,
получим Wi = 2/5, vv2 = 2/5, w3 = 1/5.
Эти результаты согласуются с наблюденными нами ранее свойствами
матрицы Рг, строки которой должны стремиться к вектору @,4; 0,4; 0,2).
Таким образом, независимо от сегодняшней погоды, мы должны в течение
длительного периода предсказывать, что будет жарко с вероятностью 2/5,
умеренно — с вероятностью 2/5 и холодно — с вероятностью 1/5; можно
ожидать, что за этот период 2/5 дней будут жаркими, 2/5 с умеренной
погодой и 1/5 дней холодными.
Аналогичные вычисления, проведенные для примеров, приведенных
на рис. 5.1, 5.3, 5.4 и 5.8, дают соответственно следующие значения
стационарных вероятностных векторов:
A/4, 1/5, 1/4, 1/4); A/2, 1/2); @,575; 0,575); @,067; 0,624; 0,309).
Интерпретация этих результатов предоставляется читателю.
Приведем теперь доказательство теоремы 5.9. Для доказательства а
укажем, что р JV = w, так как р — вероятностный вектор. Согласно п.а
теоремы 5.8 pPf ->pW = w. Для доказательства части в теоремы 5.9
заметим, что Рх+1 -+W. Кроме того,
pt+l = ppt ^ рц/ и pt+l = ptp _>. ц/р
Таким образом, PW = WP = W.
Наконец, для доказательства п. б используем тот факт, что согласно п. б
теоремы 5.8 w есть вероятностный вектор, a wP = w следует из п.в. Дока-
252
жем единственность вектора w. Пусть существуют два вероятностных
вектора w и w1 таких, что wP = w и w'P = w1 . Согласно части а
теоремы E.9) w'Pf -> w. Но vr'P - w', поэтому w'P* = w1. Следовательно,
w'Pr => w1 и w = w',4toh завершает доказательство. ¦
5.5.3. Среднее время первого возвращения1). Теперь можно ответить
на вопрос относительно вероятности при больших t пребывания в
некотором состоянии регулярной цепи Маркова. Мы видели, что, исключая случай
цепи с поглощающими состояниями, долговременное поведение регулярной
марковской цепи становится независимым от начального состояния. Далее
ответим на вопросы, касающиеся ожидаемого числа шагов до возвращения
в заданное состояние. Это ожидаемое число шагов называется средним
временем первого возвращения. Его вычисление будет произведено путем
введения фундаментальной матрицы Z регулярной марковской цепи.
Теорема 5.10. Пусть Р - переходная матрица регулярной цепи Маркова
и W — ее предельная матрица. Тогда матрица
Z = [/ _ (Р - И/)]-1 A2)
существует и
оо
Z = / + 2 (Ps - W). A3)
S = 1
Доказательство. Рассмотрим матрицу Q = (Р — W). Покажем,
что при t > 0, (Р - W)x = Рт - W. Отсюда следует, что Q* -> 0.
Используя следствие теоремы 5.5, получим желаемый результат.
Согласно п.в теоремы 5.9 P*W = WP* = W для всех t > 0. Кроме того,
легко показать, что W2 = И7. Далее, пользуясь индукцией, имеем
(/>_ И/)'+1=(/>_ W)(P- Н>У = (Р
= />'+* _ WP' -PW+W2 =/>r+1 _ W- W+W = Pt+1 -W.m
Если Р — переходная матрица регулярной марковской цепи, то матрицу
Z = [/ — (Р — И0]~! называют фундаментальной матрицей этой цепи.
Пусть Е = (в//) — матрица, где при / Ф] значение ец равно среднему
числу шагов, необходимому для первого прихода в состояние щ при
условии, что процесс начался в состоянии щ , а при / = / ец равно среднему
числу шагов, затрачиваемому на возврат в щ. Матрица Е называется
матрицей средних времен первых возвращений.
Теорема 5.11. Матрица средних времен первых возвращений Е для
регулярной цепи Маркова с переходной матрицей Р равна
Е= (I-Z+JZdg)D, A4)
где Z — фундаментальная матрица, Zag — диагональная матрица,
диагональные элементы которой совпадают с диагональными элементами
матрицы Z, J — матрица, все элементы которой равны 1, D - диагональная
*) Этот пункт можно пропустить без потери непрерывности понимания материала.
253
матрица с элементами du = l/Wf (т.е. еданица, деленная на /-ю
компоненту стационарного вероятностного вектора матрицы Р ).
Доказательство этой теоремы опускается. Читатели, интересующиеся
деталями отсылаются к работе Kemeny, Snell [1960, п. 4,4], Приведем одно
следствие, справедливость которого непосредственно следует из A4).
Следствие. Для регулярной цепи Маркова» находящейся в состоянии щ,
среднее время возвращения в то же состояние щ равно ец = 1/и>/,
В случае с предсказанием летней погоды (см. рис. 5.7) из этого
следствия вытекает, что в среднем промежуток между двумя жаркими днями
равен 1/B/5) = 5/2, т.е. 2йдням.Между двумя холодными днями он равен
1/( Vs) = 5 Дням. При более полном рассмотрении этого примера мы
найдем, что матрицы Z и Е имеют следующий вид:
Z =
0,95
0,09
0,08
2,50
2,15
2,58
0,09
0,95
-0,8
2,15
2,50
2,58
-0,04
-0,04
1,16
6,00
6,00
5,00
Е =
5.5.4. Доказательство теоремы 5.8 *), Закончим этот параграф
доказательством теоремы 5«8. Нам понадобится следующая предварительная
лемма.
Лемма. Пусть Р — стохастическая матрица размером л X п,
минимальный элемент которой равен е и
х2
есть w-мерный вектор-столбец2), Пусть т0 - наименьшее значение Х{ и
Мо — наибольшее. Аналогично тх — минимальная компонента вектора Рх,
а Мх - его максимальная компонента. Тогда Мх <М0, тх> т 0 и
Мг -w
1) Читатель, слабо знакомый с доказательствами, использующими понятия предела
и сходимости, может пропустить этот пункт.
2) Заметим, что е не обязательно положительно. (Доказательство леммы
приводится только для е> О. (Примеч. ред.)
254
Доказательство. Сконструируем из х вектор х', заменив все
компоненты х, исключая т0, на Мо. Тогда х<х\ т.е. каждая
компонента х не превосходит соответствующей компоненты х'. В матрице Р сумма
элементов каждой строки равна 1, и поэтому компоненты вектора Рх
имеют вид
ат0 +A -а)М0 =Л/0 -а(М0 -т0),
где а > 6. Следовательно, любая компонента вектора Рх' не превосходит
Мо - е (Мо - т0). Но х < х#, и поэтому каждая компонента вектора Р х
не превосходит компоненты Рх'; отсюда следует, что
М1<М0-€(М0-т0). A5)
Так как Мо - то>О и е > О, то М г < Мо. Проведя аналогичные
рассуждения по отношению к вектору -х, получим
-шх < -m0 - e(-w0 +Л/0), A6)
откуда тх > т0. Складьюая A5) и A6), находим
Мх -тг<М0 -m0 -2eCf0 -mo) = (l - 2е)(М0-т0). ш
Для доказательства теоремы 5.8 заметим сначала, что если Р - матрица
размером 1X1, результаты тривиальны. Рассмотрим матрицу Р размером
п X л, где п> 2. Будем сначала исходить из предположения, что все
элементы матрицы Р положительны и с - ее минимальный элемент. Так как
я > 2, то 0< е <Vi. Рассмотрим вектор-столбец е/
где 1 стоит в /-й строке. Пусть Р *е/ имеет максимальную компоненту Mt
и минимальную т t. Так как Р *е/ = РРг ~1 в] , из леммы следует, что
Мг >М2 >МЪ > ..., тг < тг < w3 < ...,
Полагая dt =Mt — mt, имеем
dt< (l-l
255
Из 0 < е < 1А следует, что dt ->0 при t ->оо, Таким образом, Mt — mt -+Q
и Ptej стремится к вектору, все компоненты которого равны w/. Но
P*ej есть /-й столбец матрицы Р*, и, значит, Р* стремится к матрице W,
имеющей вид
/1
Сумма элементов строк Р* равна 1, откуда следует, что ? wj = 1. Так
/= 1
как последовательность /n r — неубьюающая, а последовательность Mt —
невозрастающая, то для каждого t
0<тг
Следовательно, 0 < Wj < 1. И доказательство теоремы 5.8 для случая
положительных элементов Р завершено.
Предположим теперь, что матрица Р имеет размер пХ п, п > 2, но ее
минимальный элемент 6=0. Согласно лемме имеем
dt< (l-
откуда dt <<?f _i. Таким образом, последовательность dt невозрастающая.
Из регулярности Р вытекает существование такого числа к, при котором
все элементы матрицы Рк положительны. Пусть е' — минимальный
элемент Рк. Применяя первую часть доказательства к Рк, получим, что
drk <(l-2e')'-1dfc.
Следовательно, подпоследовательность d^f dik$ &ък> ••• стремится к нулю.
Но последовательность dt невозрастающая, и поэтому она также стремится
к нулю. Остальная часть доказательства повторяет доказательство для
положительных Р. ¦
Упражнения
1. Какие из приведенных здесь матриц регулярны?
1/2 1/2 0 \ /0 1/3 1/3'
а. ( 0 1/2 1/2 1; б. I 0 1 0
1/2 1/2 0/ V 1/3 2/3 0
0
0
1
1
0
0
0
1
0
г. I 1/2 0 1/2 I.
\ 0 1 0 /
256
2. Какие из стохастических орграфов, приведенных на рис. 5.16, регулярны?
3. Найти единственный стационарный вектор для следующих матриц:
а Р
ъ.Р
1/2
1/2
О
4. Пусть
Р
I 0,1 0,9 \
\ 0,5 0,5 /
а. ВычислитьР2, Р3,РА и оценить вектор w.
б. Проверить свой ответ, вычислив вектор w.
в. Вычислить W.
г. Проверить, что Р И>= WP = W.
5. Для цепи Маркова в задаче о выборе супермаркета (упражнение 4 § 5.1) оценить
долгосрочную вероятность того, что, покупатель изберет магазин "Дешевый".
6. Для цепи Маркова в задаче о водоснабжении (см. упражнение 7 § 5.1) найти
долгосрочную вероятность того, что в начале лета резервуар будет полным?
7. Рассмотрим цепь Маркова из упражнения 8 §5.2. Пусть случайным образом
выбран индивидуум, прадед которого был "Оленем". Как вычислить вероятность того,
что он также "Олень"? Изменится ли эта вероятность, если его прадед был "Лосем"?
Что произойдет, если мы заменим прадеда предком, отстоящим от нас на достаточно
а о в г
Рис. 5.16. Стохастические орграфы к упражнению 2 § 5.5
большое число поколений? Какова согласно теории цепей Маркова будет в пределе
доля "Оленей" в популяции мужчин?
8. Рассмотрим задачу о покупках из упражнения 11 § 5.2. Пусть некоторый
человек начал пить кофе, выбрав сорт А. Если мы спустя много лет спросим его, какой
сорт кофе он предпочитает, то какова вероятность, что это снова будет сорт Л ?
9* Рассмотрим снова законы передачи наследственных признаков, описанные в
упражнении 9 § 5.2. Каков прогноз будущего соотношения в популяции числа
высоких, средних и низкорослых людей, если в настоящее время оно составляет 20%
высоких, 20% низкорослых и 60% среднего роста?
10. Обратимся снова к задаче о водоснабжении из упражнения 7 §5.1. Пусть в
некотором году резервуар был полон. Сколько в среднем должно пройти лет прежде,
чем резервуар снова будет наполнен?
11. Рассмотрим задачу о погоде в городе из примера 6 в 5.1 (см. рис. 5.4).
Пусть в некоторый день наблюдалась ясная, безоблачная погода. Сколько в
среднем пройдет дней пока погода снова станет ясной? Сколько дней пройдет до
появления дождливой погоды?-
17. Ф.С. Роберте
257
12. Может ли цепь Маркова одновременно быть регулярной и поглощающей?
13. Имеет ли матрица
\i о /
единственный стационарный вероятностный вектор w? Стремится ли Р * к W1
Использовать свои ответы для определения того, является ли Р переходной матрицей
регулярной цепи.
14. Показать, что матрица
¦С °
\0 1
имеет более чем один стационарный вероятностный вектор. Использовать ответ для
выяснения того, является ли матрица Р переходной матрицей регулярной цепи.
15. Если стохастическая матрица Р обладает тем свойством, что каждый ее
столбец-стохастический вектор, то матрицу Р называют дважды стохастической матрицей.
а *. Показать, что, если переходная матрица регулярной цепи Маркова является
дважды стохастической, то все компоненты вектора w одинаковы.
б. Пусть Р - переходная матрица регулярной цепи Маркова и все компоненты
вектора w одинаковы. Означает ли это, что матрица Р дважды стохастическая? (Привести
доказательство или указать контрпример.)
16. Пусть Р - переходная матрицы регулярной цепи Маркова с двумя состояниями.
Можно написать
A -а а
Ъ \-Ь
а. Доказать, что 1и1 -а- Ь - собственные значения матрицы Р.
б. Предположим, что а + Ь Ф 0. Тогда Р имеет различные собственные значения,
и из хорошо известной из линейной алгебры теоремы следует, что ее можно
преобразовать к диагональному виду. Таким образом, существует матрица Q такая, что
/I 0 \
\0 \-a-b)
ть, что матр
/1 .4
\ 1 -Ь J
Показать, что матрица
Q
удовлетворяет этому условию и вычислить б"
в. Вывести формулу
t Iх ° \
\ 0 A -а-ЬУ J
г. Формулу, полученную выше, можно использовать для вычисления г-шаговых
переходных вероятностей. Применить ее к цепи Маркова, соответствующей матрице
для вычисления Р2 и Ръ.
258
д *. Показать, что в общем случае, если а + b ФО, то | \ -а - Ь\ < 1.
е. Из п. д следует, что A -а - Ь)* -*0. Используя это и результаты пп. б и в
показать, что
Ъ а
а + Ь
ж. Использовать этот результат для определения вектора w матрицы Р из п.г.
17* Показать, что любая стохастическая матрица Р (и, тем самым, любая цепь
Маркова) имеет единицу в качестве своего собственного значения. Доказательство
провести следующим образом.
а. Пусть м= A,1, ...,!)• Показать, что иР' - и, где Р' - транспонированная
матрица.
б. Показать, что X - собственное значение матрицы Р тогда и только тогда, когда
она собственное значение матрицы Р',
18. Пусть Р - переходная матрица цепи Маркова. Можно показать (Сох, Miller
[ 1965), Karlin [ 1969а ] и т.д.), что, если единица есть собственное значение матрицы Р
кратности к, то цепь содержит к эргодических множеств. В частности, оно имеет одно
эргодическое множество тогда и только тогда, когда к = 1. Кроме того, можно также
показать, что если Р - переходная матрица эргодической цепи, то Р есть матрица
регулярной марковской цепи тогда и только тогда, когда единица является ее
однократным собственным значением.
Использовать эти результаты для определения, какие из ниже приведенных
матриц соответствуют марковским цепям с единственным эр годи чески м множеством.
Провести проверку этих цепей на эргодичность (это не делается с помощью
собственных значений, почему?) Если цепи эргодичны, использовать полученные собственные
значения для определения, являются ли сами цепи регулярными. (Указание- Согласно
упражнению 17, выражение \-1 всегда может быть представлено в
характеристическом многочлене С (Л) в виде коэффициента.)
О 1 0 \ /10 0
6.1
1/2
0
0
0
1
0
0
1
0
0
0
1
0
1/2
1 /
\
!
0
0
Уг
0
Уг
1/2
1/2
Уг
Уг
0
1/2
1/2
0
Уг
Уг
0
1
1
Уг
0
0
Уг
0
0
в. 0 0 1 : г. О Уг Уг ; Д.
19. Пусть Р - переходная матрица регулярной цепи Маркова не имеет кратных
собственных значений. Использовать результаты упражнения 18 и обобщение
процедуры в упражнении 16 для нахождения Р * и HmPf при t -*•«.
20. Рассмотрим стохастическую матрицу
/ 1/2 1/2 \
\ 1/3 3/4 /'
Вычислить значения М х, М2, М3, М4, т%, т 2, т3 и т4. (Используются обозначения из
доказательства теоремы 5.8 для Р1ех.) С помощью полученных результатов оценить
вектор w, и проверить оценку, вычислив его точное значение.
21 *. Пусть Р - переходная матрица регулярной цепи Маркова их- стационарный
вектор-столбец (неподвижная точка матрицы Р), т.е. /)х = х. Показать, что в этом
случае все компоненты вектора х одинаковы.
22. Рассмотрим коммуникационную сеть. Можно перейти к цепи Маркова,
предположив, что, если у некоторого абонента сети имеется сообщение, то он передает его
абоненту, с которым непосредственно связан (в том числе самому себе), и только
17* 259
одному, причем такая передача сообщений происходит с определенной вероятностью.
Считая получающуюся цепь Маркова регулярной, Кемени и Снелл (Kemeny, Snell
[1962, с. 102|) предложили измерять значимость абонента i в такой
коммуникационной сети, используя компоненту wj стационарного вероятностного вектора w.
Вычислить эту меру значимости для произвольной (по вашему выбору) сети
коммуникаций (с определенными вероятностями передачи сообщений). Не забыть
включить в цепь в подходящих местах петли. Обсудить, является ли и>/ подходящей мерой
оценки значимости абонентов сети коммуникаций.
§ 5.6. Эргодические цепи1)
5.6.1. Периодические свойства эргодических цепей. Стохастический
орграф, изображенный на рис. 5.15, определяет эргодическую цепь Маркова,
которая не является регулярной. Переход из одного состояния в другое
происходит периодически, цепь переходит из состояния их в состояние и2,
из состояния и2 в состояние их и т.д. Она возвращается в состояние их с
периодом 2. Аналогичное положение верно и для общего случая. Вершины
любой эргодической цепи Маркова можно разбить на d классов C0,CXi...
..., Cd_ly обладающих следующим свойством: начав движение с
произвольной вершины класса Со, обнаружим, что все пути длины 1 ведут к
вершинам класса Сх, все пути длины 2 — к вершинам класса С2 и т.д. В общем
случае все пути длины t ведут к вершинам класса С/, где t =/
Рис. 5.17. Орграф, полученный из эргодической цепи Маркова
Рис. 5.18. Другой орграф, полученный из эргодической цепи Маркова
Такую цепь Маркова будем называть периодической с периодом d. Если
d = 1, цепь Маркова регулярна. Разбиение вершин на искомые множества
оказывается независимым от переходных вероятностей и зависит только
от структуры орграфа.
Для иллюстрации приведенных рассуждений рассмотрим орграф,
изображенный на рис. 5.17. Этот орграф сильно связный, и поэтому все
сделанные выше утверждения применимы. Начнем с вершины их и составим спи-
*) Этот параграф можно опустить без потери непрерывности восприятия
дальнейшего изложения материала. В частности, его следует пропустить читателю,
незнакомому с понятием сходимости. Однако со следствием 2 теоремы 5.12 следует
ознакомиться.
260
сок вершин, достижимых из этой вершины за t шагов для различных
значений Г.
Вершины, достижимые
из их за:
1 шаг и2
2 шага щ, м3
3 шага и2, м4
4 шага ulfu3tus
5 шагов u29U49 щ
6 шагов Ui,u3yu5, Us
7 ШаГОВ U2 , Ua , U6 , Щ
8 шагов Mi, м3, и5, м7, м8
9 шагов м2, м4, м6, м9
Из определения понятия периодичности следует, что d = 2 и искомыми
двумя классами служат классы Со ={м1,Мз,м5,М7,м8} и Ci={m2,m4,
и6,и9) . Легко увидеть, что все пути из вершин классаСо к вершинам
класса С\ имеют нечетную длину, длина любого пути из класса Со в класс Со
четная и т.д. Теоремы, которые будут приведены ниже, укажут простой
способ определения периодичности.
Рассмотрим теперь орграф, изображенный на рис. 5.18. Он также сильно
связный. Выполнив аналогичный анализ, получим следующую картину.
Вершины, достижимые
за:
1 шаг
2 шага
3 шага
4 шага
5 шагов
6 шагов
7 шагов
м2
ии
м2,
Mi,
Mi,
Из,
м4,
м2,
м2,
м2,
Uo,
"б
м3,м7
м3,м4
U%4Ua
щ,и6
Проведенный анализ показывает, что все вершины достижимы из щ за
7 шагов и, следовательно, d- 1, т.е. существует лишь один класс. Отсюда
следует, что орграф D регулярен.
Основные результаты относительно периодических свойств эргодических
цепей Маркова обобщаются следующей теоремой.
Теорема 5.12. Состояния эргодической цепи Маркова можно разбить на
d периодических классов Со, Ci9..., С<*_! таких, что если цепь в
начальный момент находилась в состоянии класса С,, то после t шагов она
может оказаться лишь в состоянии класса С/ ф t, где символ е означает
сложение по модулю d. Для достаточно больших t цепь из произвольного
состояния класса С/ может перейти за t шагов в любое состояние класса С/ е t,
261
причем для произвольной вершины i величина d может быть вычислена,
как наибольший общий делитель (н.о-д.I) множества чисел N$:
{t > 0; из состояния щ можно перейти в ]
состояние щ за t шагов
Укажем ряд следствий .из этой теоремы.
Следствие 1. Если d = 1 ? то эргодическая цепь Маркова регулярна.
Доказательство. Из второй части теоремы следует, что для
достаточно больших t существует положительная вероятность перехода из
любой вершины щ (щ принадлежит Со — классу всех состояний) в любую
вершину Uj (и; также принадлежит Со) за t шагов. Поэтому цепь
регулярна. ¦
Следствие 2. Если в эргодической цепи Маркова существует состояние
щ такое, что переходная вероятность рц положительна, то цепь регулярна.
Доказательство. Единица входит в Ntii следовательно d есть
делитель 1,т.е. d= 1.
Читателя, желающего ознакомиться с доказательством теоремы 5.12
мы отсылаем к работе Kemeny, Snell [1960, с. 5]. Однако ниже мы
представим прямое доказательство следствия 1. По-видимому, читателю будет
легче понять теорему 5.12, если он рассмотрит ее, как теорему
относительно орграфов.
Вторая теорема, которую мы сейчас сформулируем, остается
справедливой, если исключить из рассмотрения приписанные орграфу веса. Она
показывает, что периодичность связана лишь со структурой орграфа и не
зависит от численных значений вероятностей.
Теорема 5.13. Вершины сильно связного орграфа можно разбить на d
периодических классов C0,Cj,... 9Cd^x таких, что, если начинать путь
из вершины класса С/, то все пути длины t ведут к вершинам класса С/ф г.
Для достаточно больших значений t существует путь длины t из любой
вершины С/ к любой вершине С,- ф t. При этом для произвольной вершины /
величина d может быть вычислена как наибольший общий делитель
множества чисел Nn.
Nu = {t > 0; существует путь из щ в щ длины t).
Содержание теоремы 5.13 можно проиллюстрировать на орграфах,
представленных на рис. 5.17 и 5.18 .Орграф на рис. 5.18 содержит циклы,
проходящие через вершину и2, длиной 2 и 3 (как и другой длины). Наибольший
общий делитель чисел 2 и 3 есть 1, следовательно, d= 1. Таким образом,
данный орграф содержит лишь один периодический класс. Орграф на
рис. 5.17 содержит два периодических класса: Со ={«i,w3>«5»«7>«8} и
Сг ={и2,щ9иб9и9}. Легко видеть, что все циклы и,значит, все замкнутые
пути имеют четную длину и существует цикл длины 2. Следовательно,
число 2 является наибольшим общим делителем каждого N^.
1) Наибольший общий делитель (нод) множества чисел - наибольшее число, на
которое делится любое число этого множества. Теорема утверждает, что для всех
/ и / нод множеств Nn и Njj одинаковы, и поэтому произвольное Njj можно
использовать для вычисления d.
262
Приведем теперь доказательство следствия 1 теоремы 5.12. В частности,
докажем следующее утверждение относительно орграфов.
Пусть D сильно связный орграф и
Na = {t > 0; в D существует путь из щ в ы,- длины t).
Если Nii имеет для некоторого i наибольший общий делитель, равный 1,
то найдется число к такое, что существует путь длины к из любой
вершины в любую.
Наше доказательство близко следует работе Kemeny, Sneil [1960, с. 5]
и дает представление о методе доказательства полной теоремы 5.131).
Лемма 1. Для каждого / Nu замкнуто относительно операции сложения.
Доказательство. Пусть t и t' принадлежат W//. ЕслиР иР' — пути
из щ ъщ длины t и t' соответственно, то, проходя их последовательно,
получим путъР + Р' длины t + t'изщ вы/."
Лемма 2. Множество N целых положительных чисел, замкнутое
относительно операции сложения, содержит все (их конечное число) кратные их
наибольшему общему делителю.
Доказательство. Пусть d — наибольший общий делитель N.
Предположим, что d = 1, ибо если d Ф 1, то достаточно разделить все элементы
N на d. Если единица есть н.о.д. элементов из N, то она будет и н.о.д.
множества {л!, п2 у. <., л т } — любого конечного подмножества N. Если хоть
одно л,- = 1, то ввиду замкнутости по сложению, N содержит любое целое
число.Пусть все щ Ф\. Согласно хорошо известной теореме теории чисел
существуют такие целые числа а,-, что Ба/Л/ = 1. Положим
s = 2 а,л,- и t = — 2 а/Л/.
а/>0 а/<0
Числа s и t содержатся в N ввиду замкнутости N по сложению. Имеем
s-rsl. Кроме того, так как ни одно щ не равно 1, то должно быть t > 2.
Следовательно, если q> t(t — 1)>ю q положительно. Пусть/ — остаток от
деления q на Г. Тогда q = kt + /, где к> (/-1) и0</ <t — \. Отсюда
следует, что 4 = fcf + /(s-f)= (k-l)t + ls. Но к>19 svit принадлежат JV,
a Wзамкнуто по сложению и, следовательно, q также принадлежат N. Таким
образом, любое число q, большее или равное t (t — 1), принадлежит N. ¦
В совокупности леммы 1 и 2 дают нам желаемые результаты. В самом
деле, по лемме 2, если d = 1, найдется число т такое, что для каждого t > m
существует путь из щ в щ длины t. Мы хотим доказать, что найдется
такое число А:, что для любых г и s существует путь из ur bus длины к.
Возьмем к = т + 2л, где л — число вершин орграфа D. Выберем произвольные
вершины ur имг Так как D — сильно связный орграф, то найдется путь
Pri из щ в щ по крайней мере длины л и путь Pis из щ в us длины не
меньше л. Следовательно, существует путь из ur в us длины к = т+ 2л. Теперь
будем двигаться следующим образом: сначала пройдем путь Рг/, потом
обойдем путь от щ к щ длины т + Bл — а - Ь) и затем пройдем путь
PiS9 выбрав в качестве а и Ь длины путей Pri и PfS соответственно. Это
полностью завершает доказательство следствия 1 теоремы 5.12.
1) Читатель может пропустить это доказательство, использующее элементы теории
чисел.
263
5.6.2. Обобщение свойств регулярных цепей Маркова1). Большинство
теорем относительно регулярных цепей Маркова достаточно легко
обобщаются на эргодические цепи. Естественно, что Р* не сходится, если d> 1.
Кроме того элементы (/,/ ) матрицы Р * равны нулю в d — 1 из каждых d
шагов. Однако последовательность Р* в определенном смысле сходится.
Уточним это понятие сходимости. Будем говорить, что последовательность
матриц Mi, М2,... сходится в смысле Чезаро к матрице Му если
последовательность
t
сходится к М. В качестве примера рассмотрим матрицу
/О 1 \
\ 1 0 /
Здесь М. =PS имеет вид
/О 1\
V 1 о У
если s нечетно и
если s четно. Тогда матрица
t
2 Мк
для некоторых ? равна
/ Й *
\ й И
если / = 2 А:, и равна
к__ к + 1 \
2А:+1 2/: + 1
/с • 1 л
2я + 1 2/: + 1 /
если t = 2А:+ 1. Следовательно, последовательность Р,Р2,.. . сходится в
смысле Чезаро к матрице
\ к а I
1) Этот пункт содержит в основном технические подробности и может быть
опущен.
264
Матрица
с1)
\1 О/
есть простейший пример переходной матрицы периодической
(нерегулярной) эргодической цепи Маркова.
Но использование суммируемости по Чезаро последовательности Р,
Р2,. .. применимо к общему случаю .эргодических цепей. Следующая
теорема, доказанная в работе Kemeny, Snell [1960, гл. V], обобщает этот и
другие важные результаты относительно свойств эргодических цепей. Мы
используем ее в § 5.11 для изучения явлений диффузии и броуновского
движения.
Теорема 5.14. Пусть Р — переходная матрица эргодической цепи
Маркова. Тогда
а. Р* суммируема в смысле Чезаро и сходится к стохастической
матрице W, строки которой одинаковы и равны вероятностному вектору w =
б. Все компоненты wt положительны.
в. Для произвсшьного вероятностного вектора р последовательность
векторов рР* сходится в смысле Чезаро к w.
г. Вектор w служит единственным стационарным вероятностным
вектором матрицы Р.
a.PW=WP=W..
е.МатрицаZ = [/- (Р* - W)] существует.
оо
ж. Матрица /+ S (Pf — W) сходится в смысле Чезаро к матрице Z.
*=i
з. Матрица средних времен первого возвращения Е определяется из
уравнения A4) теоремы 5.11.
Читателю, желающему более глубоко изучить теорию эргодических цепей
Маркова или ознакомиться с примерами, иллюстрирующими эту теорему,
рекомендуем обратиться к работе Кемени и Снелла (Kemeny, Snell) на
которую мы неоднократно ссылались.
Упражнения
1. Найти наибольший общий делитель следующих множеств целых чисел:
а. {2,4, 6, 8,...}; 6.A,3,5,7,...}; в.{2, 3,4,...};
г.{3,6,9,12,...}; д.{3,4,6,8,10,...}.
2. Предположим, что множества, указанные в упражнении 1, представляются
множеством Nх х некоторой эргодической цепи Маркова. В каких случаях эта цепь
регулярна?
3. Для эргодических цепей Маркова, чьи образующие орграфы представлены на
рис. 5.19, определить значение периодичности d, используя теорему 5.13. Указать
также периодические классы вершин.
4. Используя результаты этого раздела, показать, что цепи Маркова,
соответствующие перечисленным ниже задачам, регулярны.
а. Игра в кости и бросание монеты (см. рис. 5.1).
б. Игра в кости (см. рис. 5.3).
в. Прогноз погоды в Тель-Авиве (см. рис. 5.4).
265
Рис. 5.19. Орграфы к упражнению 3 § 5.6 .
г. Задача о передаче сообщений (см. рис. 5.5).
д. Варианты погоды летом (см. рис. 5.7).
е. Задача о мобильности занятого населения между генерациями (см. рис. 5.8).
5. а. Привести пример эргодической цепи Маркова с тремя состояниями,
являющейся периодической с периодом 3.
6. Привести пример эргодической цепи Маркова, являющейся периодической с
периодом d (d > 0 - любое).
6. Пусть частица двигается по действительной прямой между точкой — началом
координат 0 и точкой N. Если частица находится в точке 0, она переходит в точку 1,если
частица находится в точке N, она переходит в точку N - 1. Для любой другой точки
отрезка ON прямой частица делает шаг влево с вероятностью р и шаг вправо с
вероятностью 1 - р, где 0 < р < 1.-Показать для случая N = 100, что такой процесс
случайного блуждания определяет эргодическую цепь Маркова и вычислить ее
периодичность. (Это случайное блуждание с отражающими границами в отличие от
задачи о разорении игрока (пример 11 § 5.2), где случайное блуждание происходило
с поглощающими границами. Здесь, когда частица достигает границы 0 или N> она
отражается обратно в систему. Различные виды случайных блужданий с
отражающими границами изучаются в § 5.11).
7. Повторить упраженение 6 для случайного блуждания с произвольным N > 2.
8. Пусть Р - переходная матрица эргодической цепи Маркова. Можно показать
(Сох, МШег [1965], или Karlin [1969a]), что Р имеет период d тогда и только тогда,
если существуют ровно d собственных значений, равных единице. Использовать этот
Рис. 5.20. Переходный орграф к
упражнению 9 § 5.6
результат для определения периодичности цепей Маркова из упражнения 18 § 5.5,
которые оказываются эргодическими.
9. Исследовать цепь Маркова с переходным орграфом, показанным на рис. 5.20.
а. Найти вектор w.
б. Показать, что Р* сходится в смысле Чезаро к W.
в. Найти матрицу средних времен первого возвращения.
10. Повторить пп. а, б, в упражнения 9 для случайного блуждания упраженения 6
при N = 2.
11. Пусть цепь Маркова имеет единственное эргодическое множество. Как
определить, каковы после длительного течения процесса, вероятности нахождения в
заданном состоянии этого эргодического множества? В заданном неустойчивом множестве?
266
§ 5.7. Применение марковских процессов в генетике
5.7Л. Теория Менделя. Цепи Маркова имеют большое число интересных
приложений в области генетики, некоторые из них будут рассмотрены в
этом параграфе. При обсуждении вопросов генетики мы будем
базироваться на теории наследственности, восходящей к Грегору Менделю, монаху
ордена св. Августина, опубликовавшему свою работу в 1866 г. Проводя
свои эксперименты, Мендель работал с растениями гороха. Эти растения
имеют стручки двух цветов — зеленого и желтого. Некоторые сорта гороха
"чисто" зеленые, другие — "чисто" желтые. К чисто зеленым относят сорта
гороха, которые, будучи скрещенными между собой, дают только зеленое
потомство; аналогичным образом определяются чисто желтые сорта.
Мендель обнаружил, что каждый раз, когда скрещиваются растения гороха
чисто зеленого и чисто желтого сортов, все их потомки обладают лишь
зелеными стручками. Если потом скрестить два потомка, то в следующем
поколении примерно 3/4 потомства будут иметь зеленые стручки, а
около 1/4 - желтые стручки. *).
Результаты экспериментов привели Менделя к созданию следующей
теории наследственности. (В этой теории рассматривается случай, известный
как полное доминирование. Обсуждение неполного доминирования
проводится в упражнениях 4 и 6.) Такой признак, как цвет стручка,
управляется двумя генами 2), которые могут быть двух типов: доминантными (d) и
рециссивными (г ). При наличии двух доминантных генов появляется
доминантный тип признака, двух рециссивных — рециссивный тип признака.
Для гороха гены зеленых стручков доминантные, а гены желтых стручков
рециссивные. Растение гороха с двумя доминантными генами —
^-растение - имеет зеленые стручки, такой же цвет стручков у растений с
одним доминантным и одним рециссивным геном, т.е. у dr - и rd-растений.
В этом случае говорят, что два растения имеют один и тот же фенотип
(внешний облик), но принадлежат к различным генотипам, т.е. имеют
разный набор генов (генетический облик).
Первое растение называют чисто доминантным, второе гибридным.
Растение с двумя рециссивными генами, т.е. rr-растение называют чисто
рециссивным и оно имеет желтые стручки. Приведем ряд других примеров:
в горохе гладкие горошины доминируют над морщинистыми, среди
дрозофил красные глаза доминируют над желто-коричными глазами, у людей
наличие пигментации (волос, глаз или кожи) доминирует над отсутствием
пигментации и чисто рециссивного человека называют альбиносом.
Согласно Менделю при скрещивании двух особей потомство получает
по одному гену от каждого родителя. Выбор гена происходит случайным
образом и у каждого родителя независимо. Пусть, например,
скрещиваются две чисто доминантные cW-особи. Потомок несомненно получит по (/-гену
от каждого родителя и, следовательно, потомок будет типа ddy т.е. также
чисто доминантным. При скрещивании чисто доминантной dd-особи с
*) Эти доли не обязательно точно равны 3/4 и 1/4, мы этот вопрос
рассмотрим далее.
2) Мендель не пользовался термином "ген".
267
Скрещибание чистого доминанта с гибридом
Родители
dd
dr
1
Ген
первого
родителя
1
Ген
Второго
родителя
+—
Потомок
dd
dr
Вероятность (вычисленная,
как произведение
вероятностей вдоль ветви дерева)
с
1
2
Скрещивание гибрида с гидридом
.г с/г] 1 1 _J_
•d dr\ Ч Ь~ 2
г
г г г
ч
Рис. 5.21. Результаты чисто доминантно-гибридного скрещивания и
гибридно-гибридного скрещивания
чисто рециссивной тт-особью потомок получает один ген от своего чисто
доминантного родителя и другой ген от чисто рециссивного родителя;
следовательно, он является гибридом. По внешнему виду его нельзя
отличить от чистого доминанта. Если скрещиваются чистый доминант dd и
гибрид dr, потомок получает один ген d от ^-родителя, а другой ген d
или г от dr-родителя. Последние две возможности появляются с
одинаковой вероятностью. Поэтому потомок является чистым доминантом с
вероятностью й и гибридом с вероятностью Уг. Соображения, лежащие в основе
этих рассуждений, удобно показать на диаграмме типа дерева, подобной
приведенной на рис. 5.21. Мы далее будем извлекать все больше и больше
пользы из анализа графов-деревьев. Пусть гибрид dr скрещивается с
другим гибридом dr. Потомок получает с вероятностью % ген d или г от
первого родителя и также обстоит дело со вторым родителем.
Следовательно, потомок оказывается типа dd, rd (чго генетически равноценно dr)
или гг. Вероятность получения потомка чистого доминанта dd равна 1/4,
гибрида rd или dr равна 1/2, а вероятность получения чистого рециссива
гг равна 1/4 (см. рис. 5.21). Таким образом, если скрещиваются два
гибрида, то с вероятностью 1/4 потомок будет иметь рециссивные признаки,
а с вероятностью 3/4 — доминантные. (Это объясняет цвета стручков
гороха во втором поколении, полученные в результате экспериментов,
упомянутых в начале параграфа. В самом деле, если чисто доминантные
растения (зеленые стручки) скрещиваются с чисто рециссивными (желтые
стручки), то все потомки — гибриды и второе поколение потомков
появляется в результате скрещивания гибридов с гибридами.) В табл. 5.1
приведены окончательные результаты различных скрещиваний. Читатель
может легко проверить значения указанных вероятностей, подсчет которых
мы опустили.
268
Таблица 5.1
Результаты скрещивания
Родители
Потомки
Чистый доминант - чистый доминант
Чистый доминант - гибрид
Чистый доминант - чистый рециссив
Гибрид - гибрид
Гибрид - гибрид
Гибрид - чистый рециссив
Чистый рециссив - чистый рециссив
Все чистые доминанты
f Чистый доминант, вероятность 1/2;
\ гибрид,вероятность 1/2
Все гибриды
( Чистый доминант, вероятность 1/4
| Гибрид, вероятность 1/2
I Чистый рециссив, вероятность 1/4
| Чистый рециссив, вероятность 1/2
I Гибрид, вероятность 1/2
Все чистые рециссивы
5.7.2. Прогнозы на основе теории Менделя. Теорию наследственности
Менделя можно рассматривать как математическую модель, построенную
на основе реальных данных, в частности на базе экспериментов Менделя со
скрещиванием гороха. Как всякая математическая модель, она должна
быть проверена путем анализа вытекающих из нее следствий. Ряд частных
выводов, являющихся непосредственными результатами этой модели, как
будто оправдывается. Например, если скрещиваются большое число чистых
доминантов и чистых рециссивов, то примерно 3/4 потомков второго
поколения проявляют доминантные признаки. Следует отметить, что, как
правило, не точно 3/4 потомства несут доминантные признаки. В самом
деле, при одном опыте возможно, что ни один из потомков второго
поколения не проявит доминантных признаков. В естественных явлениях всегда
существуют колебания *), и именно поэтому был избран вероятностный
тип предсказания, а не детерминированный. Аналогичная ситуация
возникает при бросании монеты, когда мы предсказываем, что в 1/2 опытов
выпадет герб. Однако, выполнив некоторое число бросаний, мы не ожидаем
появления герба точно в 1/2 опытов. Наше предсказание считается
"подтвержденным"^ если такой результат получается за длительный период
времени.
Конечно, детальная проверка прогнозов такого типа, как "вероятность
равна 3/4" требует существенного усложнения модели Менделя. На его
основе можно было бы оценить среднее отклонение от предсказанной
доли 3/4 и затем применить статистические методы анализа значимости этого
отклонения. Более детальное изложение статистической теории
математической генетики приведено в работах Elandt—Johnson [1971], Ewens
[1969] HKarlin[1969b]).
Помимо анализа прямых предсказаний, сделанных на основе модели
Менделя, хотелось бы проверить ее адекватность путем получения сущест-
*) Существуют различные точки зрения относительно этих колебаний. Лежат ли
они в основе наследственных процессов или нам это так только кажется, ибо у нас
нет достаточно глубоких теорий и моделей для понимания протекающих
детерминированных процессов?
269
венно более сложных выводов *). Для начала представим себе, что мы
располагаем особью неизвестного генетического происхождения. Скрестим
ее с известным гибридом. Выберем случайным образом одного из
потомков и снова скрестим его с известным гибридом, и т.д.
Какова при длительном повторении такого процесса вероятность того,
что особь, выбранная из определенного поколения, будет иметь
доминантные признаки? Так, например, в случае скрещивания растений гороха,
какова вероятность, что растение, взятое из t-ro поколения будет обладать
зелеными стручками? Процесс, только что описанный здесь, называется
Рис. 5.22. Переходный орграф для процесса
непрерывного скрещивания с гибридом
непрерывным скрещиванием с гибридом, и ответ на наш вопрос может
быть получен из теории цепей Маркова. Покажем, таким образом, как
математический аппарат теории цепей Маркова используется для получения
выводов из модели Менделя.
Построим цепь Маркова, состояниями которой являются генотипы
особы выбранной из /-го поколения. Следовательно, имеются три состояния: Ц
(для чистых доминантов), Я (для гибридов) и R (для чистых рециссивов).
Переходные вероятности для этой цепи задаются следующей матрицей:
D H R
р=
D (
н\
И
г 1/2
1/4
^ 0
1/2
1/2
1/2
0
1/2
1/2
Элемент (/, / ) матрицы Р определяет вероятность того, что, если особь
генетического типа / скрещивается с известным гибридом, то потомок,
выбранный случайным образом, будет иметь генетический тип /. Так,
например, элемент DD равен 1/2, ибо при скрещивании чистого доминанта
с гибридом вероятность получения потомка — чистого доминанта -
равна 1/2 (см. табл. 5.1). Переходный орграф, соответствующий матрице Р,
показан на рис. 5.22.
Какой тип цепей Маркова определен матрицей Р? Это, несомненно, эрго-
дическая цепь, ибо переходный орграф сильно связен. В вершине D
имеется петля, и по следствию 2 теоремы 5.12 можно заключить, что цепь регу-
1) Дальнейшее изложение материала этого раздела близко следует работе Kemeny,
Snell, Thompson [1956].
270
лярна. В самом деле, несложные вычисления показывают, что все элементы
матрицы Р2 положительны. Выполнив дополнительные элементарные
вычисления, можно показать, что стационарный вероятностный вектор w
матрицы Р имеет вид w = A/4, 1/2, 1/4). Таким образом, из приведенных
рассуждений можно сделать вьшод, что при длительном повторении
процесса независимо от генотипа особи, с которой процесс скрещивания начался,
вероятность того, что в Ш поколении определенная особь будет чисто
доминантной равна 1/4, гибридной 1/2 и чисто рециссивной 1/4.
Следовательно, данная особь с вероятностью 3/4 будет обладать доминантными
признаками. Для случая скрещивания гороха можно предсказать, что при
многократном непрерывном скрещивании с гибридом, 3/4 растений выбранного
поколения будут иметь зеленые стручки. Это вероятностный прогноз,
который без сомнения проверяем, и он подтверждается приближенно 1) не
только экспериментальными данными о цвете стручков гороха, но и
наблюдениями за многими другими признаками. (Вывод о том, что 1/4 часть
потомков является чисто доминантными, проверить не так легко, ибо
нельзя внешне отличить чисто доминантную особь от гибрида. Однако чистых
доминантов можно обнаружить, если наблюдать многие поколения их
потомков. При анализе математических моделей всегда важно получать
выводы, допускающие проверку.)
Приведем еще один способ проверки модели Менделя. Рассмотрим
процесс непрерывного скрещивания с доминантом, когда оно всегда
производится с особью, о которой известно, что она чистый доминант. Снова, как
и ранее, имеем цепь Маркова с состояниями Z), Н и R, но теперь переходная
матрица, полученная из таблицы 5.1, имеет вид
D H R
О
1
Это переходная матрица поглощающей цепи Маркова с одним
поглощающим состоянием D. Следовательно, можно утверждать согласно теории
поглощающих цепей, что практически все потомки — чистые доминанты и
их внешние признаки также будут доминантными. Этот вывод также
подтверждается экспериментальными данными и в данном случае он является
детерминированным. Матрица Р имеет канонический вид и
/Й0\
ъ о)-
Проведя несложные вычисления, получим
Н R
2
2
*. н(
R \
1) Здесь снова нельзя ожидать, что соответствующие доли будут равны точно 3/4,
1/4 и т.д.
271
Среднее число поколений до поглощения равно сумме строк
матрицы N. Таким образом, поглощение произойдет за два поколения, если
исходная особь была гибридом, и за три, если она была чисто рециссивной.
В последнем случае в среднем появится одна чисто рециссивная особь
и две гибридных до получения чисто доминантного потомка 1). Эти
результаты проверяемы, если существует возможность наблюдения за
многими поколениями потомков одной особи .(В этом случае мы сможем отличать
чисто доминантные особи от гибридных.)
Укажем еще одно следствие модели Менделя. Рассмотрим процесс
инбридинга. Скрещиваются две особи противоположного пола, случайным
образом выбираются два потомка и тоже скрещиваются, снова выбираются
случайным образом два потомка и производится очередное скрещивание
и т.д. Пусть наблюдаемые признаки не зависят от пола (не сцеплены с
полом) и имеется большое число потомков. Нас будет в данном случае
интересовать появление различных комбинаций генов и возможность
исчезновения определенного гена (d или г ).
Состояниями цепи Маркова будем считать комбинации генотипов пары
потомков 1-го поколения. Таким образом, имеются шесть состояний:
?>?>, DH9 DR, HR и RR. Например, состояние DD представляет ситуацию,
когда обе выбранные особи суть чистые доминанты. (Так как признаки
не зависят от пола, можно считать DR и RD одинаковыми комбинациями,
аналогично и для других случаев.) Вычислим переходные вероятности.
Пусть, например, начальное состояние есть HR. Тогда, используя табл. 5.1,
найдем, что 1А потомков являются гибридами, a l/i чисто рециссивными.
Выберем случайным образом двух потомков. Пусть их общее число
достаточно велико и можно считать, что имеет место выборка с
возвращением. Тогда можно найти, что с вероятностью 1/4 оба потомка — гибриды,
с вероятностью 1/4 — оба рециссивны, и один гибрид, а другой рециссив-
ный - с вероятностью 1/2. Кроме того вероятность перехода из состояния
HR в состояние НИ равна 1/4, в состояние RR - 1/4 и в состояние HR - 1/2.
Результаты вычислений показаны на диаграмме, представленной в виде
дерева на рис. 5.23.
Аналогичным образом вычисляются остальные переходные вероятности.
Заметив, что состояния DD и RR являются поглощающими, поместим
их первыми в списке. В результате получим следующую переходную
матрицу DD RR DH DR HH HR
DD I \ 0 0 0 0 0
0 0 0 0
RR 1 0 1
DH I 1/4 0
dr\ о о
HH \ 1/16 1/16
HR \0 1/4
1/2
0
1/4
0
0
0
1/8
0
1/4
1
1/4
1/4
0
0
1/4
1/2
Эта матрица определяет поглощающую цепь Маркова, что легко показать,
*) Возможен лишь один чисто рециссивный потомок. Почему?
272
Родители Первое Второе Оба Вероятность
поколение поколение поколения
J Н НН
*—
MR
} i-i-i
Рис. 5.23. Дерево, иллюстрирующее результаты скрещивания гибрида и рециссива
в случае инбридинга
начертив соответствующий переходный орграф. Из каждого непоглощающе-
го состояния можно прийти в любое из двух поглощающих состояний.
Легко также показать, что четыре непоглощающих состояния образуют
единственное неустойчивое множество. Можно предсказать, что через
некоторый период времени один из генов (d или г ) исчезнет из набора
используемых в комбинациях генов, и все потомки будут чисто
доминантными или чисто рециссивными.
Так как матрица Р имеет каноническую форму, найдем, что
1/2 0 1/2 О
° ° ' °
1/4 1/8 1/4 1/4
О 0 1/4 1/2
Дальнейшие вычисления приводят к следующей матрице N:
DH DR НН HR Сумма по строкам
1 4 2 \ 5
DH — — — — \ 4 —
6 3 3 \ 6
, 4 8 4 \ 2
DR\ — — — — 1 6 —
3 3 3 3
, . 1 8 4 I 2 .
HH\ — — — — / 5 —
3 3 3/3
1 4 8 / 5
HR \ — — — — / 4 —
6 3 3/6
Если процесс скрещивания начался с пары, включающей одну чисто
доминантную особь и одну чисто рециссивную, то в среднем можно ожи-
2
дать, что поглощение произойдет за 6 — поколения. Используя матрицу
1/4 0 n 3
18. Ф.С. Роберте 273
найдем, что
DH
DR
НН
HR
DD
/3/4
1/2
1/2
\l/4
RR
1/4
1/2
1/2
2/4
Элемент Ьц матрицы В определяет вероятность поглощения в
состоянии / при условии, что в начальный момент процесс находился в
состоянии /. Например, если начальное состояние есть НН, то с
вероятностью 1/2 на последнем этапе получим чистого доминанта. Читатель
может заметить, что в начальном состоянии НН имелось два гена типа d
и два гена типа г. Вероятность завершения процесса чисто доминантной
особью равна доли генов d в начальном состоянии. Это верно для всех
начальных состояний.
Последний вывод имеет довольно простой вид, но весьма интересен и,
по-видимому, подтверждается экспериментальными данными.
За теорией Менделя последовали многочисленные интересные работы
по математической генетике. Ряд ее положений будет рассмотрен в
упражнениях. Читатель, желающий продолжить работу в области
математической генетики, может ознакомиться, например, с трудами Elandt- John son
[1971],Ewens [1969] и Karlin [1969b].
Упражнения
1. На основе теории наследственности Менделя объяснить описанные ниже явления
(следует исходить при этом из некоторых предположений о виде генотипа и т.п.)
а. Мужчина и женщина никогда не болели серповидно клеточной анемией. Их
ребенок страдает от этого заболевания.
б. После скрещивания двух сортов гороха - с крупными и с мелкими
горошинами - получилось многочисленное потомство, все горошины которого были крупными.
в. Скрещивались мухи-дрозофилы с длинными крыльями с дрозофилами,
обладающими слаборазвитыми крыльями. Все потомство - 150 дрозофил - имело длинные
крылья. Случайным образом выбрана из потомства пара дрозофил и скрещена.
8 результате этого скрещивания получено 200 мух, 155 из них имели длинные
крылья.
г. Жесткошерстная морская свинка спаривалась с гладкошерстной. Через некоторое
время их потомство составляло 20 особей, среди них было 11 гладкошерстных и
9 жесткошерстных.
д. Лошадь-альбинос скрещивалась с лошадью нормальной масти, ряд их потомков
оказался альбиносами.
2. Скрещиваются чисто доминантная и чисто рециссивная особи. Из полученного
потомства случайным образом выбираются две особи и снова скрещиваются.
Выберем из их потомства случайным образом одну особь. Какова вероятность, что она
чистый доминант?
3. Первый потомок скрещивания двух гибридов скрещивается с потомком чисто
доминантной и чисто рециссивной особи. Можно ли таким путем получить чисто
доминантную особь?
4. (Mosimman [1968]). В случае неполного доминирования внешний вид гибрида
(фенотип) отличен от внешнего вида чисто доминантной особи. Например, среди
растений, чисто доминантное может быть высоким, гибрид - средним, а чисто рециссивное
растение - низким. Рассмотрим скрещивание быков и коров красной, красно-белой
274
(чалой) и белой мастей, проводимое в ситуации неполного доминирования. При
скрещивании двух красных животных потомство получается красным. Если
скрещиваются животные белой масти, все потомство получается белым. При скрещивании
красных и белых животных все потомство красно-белое. Какой масти окажется потомство,
появившееся в результате скрещивания двух красно-белых животных?
5. Пусть производится непрерывное скрещивание с рециссивной особью. Какое в
среднем число поколений пройдет до поглощения, если в начальный момент рециссив-
ная особь скрещивалась с доминантной?
6. Пусть в условиях упражнения 4 производится скрещивание по схеме инбридинга,
причем начальная пара — красно-белая. Какова вероятность, что при достаточно
длительном процессе некоторая особь, выбранная из Мт> поколения, окажется красно-
белой?
7. Часто оказывается разумным предположить, что наследование двух различных
признаков происходит независимо. Например, если у морских свинок черная шерсть
доминирует над белой и жесткая над гладкой, можно рассматривать в качестве
генотипа пару, включающую генотипы, соответствующие цвету шерсти и степени их
жесткости. Следовательно, генотип DH будет соответствовать особи, являющейся чисто
доминантной по цвету шерсти и гибридной по степени ее жесткости. Такая особь
будет иметь черную жесткую шерсть. В этих предположениях существуют девять
генотипов и четыре фенотипа.
а. Перечислить их.
б. Показать, что если двойной гибрид НН скрещивается с двойным гибридом НН,
то различные фенотипы появляются в потомстве в соотношении 9:3:3:1. (Для
случая морских свинок можно утверждать, что черная жесткая шерсть появляется у 9/16
потомков.)
в. Используя генотипы (парные генотипы) в качестве состояний цепи Маркова,
вычислить переходные вероятности для цепи, соответствующей непрерывному
скрещиванию с двойным гибридом.
8*. (Kemeny, Snell, Thompson [1956].) Рассмотрим процесс инбридинга для
ситуации, когда процент гибели гибридов достаточно высок. Пусть для выбранной
супружеской пары половина потомков-гибридов умирает до достижения половой зрелости,
в то время как число погибших чисто доминантных или чисто рециссивных потомков
пренебрежимо мало. Пара для вопроизводства следующего поколения выбирается
только из выжившего потомства предшествующего поколения. Так, например, если
скрещиваются чисто доминантная особь и гибрид, то 1/2 потомков - гибриды, а 1/2
чисто доминантны. Но лишь 1/2 гибридов достигает половой зрелости, следовательно,
лишь 1/3 выжившего потомства является гибридами. (Это условная вероятность^
того, что случайно выбранный потомок - гибрид при условии, что он выжил.) Если
мы выбираем случайным образом двух потомков, то они оба - гибриды с
вероятностью 1/9, чисто доминантные особи с вероятностью 4/9 и один гибрид, а другой
листо доминантный с вероятностью 4/9.
а. Построить цепь Маркова для этого процесса, выбрав соответственным образом
множество состояний.
б. Показать, что эта цепь поглощающая.
в. Найти матрицу N.
г. Определить среднее число поколений до поглощения для каждого начального
состояния.
д. Найти матрицу В и дать интерпретацию отдельным элементам.
9. Цветовая слепота - признак, сцепленный с полом. Существует пара генов Си S
таких, что С вызывает цветовую слепоту, a S - нормальное восприятие цвета. Ген S
доминантный. Мужчины имеют лишь один из этих генов, женщины оба. Передача
наследственных признаков происходит следующим образом: потомок мужского пола
наследует один из материнских генов (переданных ему случайным образом), а
потомок женского пола наследует один из материнских генов и ген отца. Таким образом,
мужчина может обладать генами типа С или S, а женщина одной из комбинаций СС,
CS или SS.
Рассмотрим снова процесс инбридинга, когда среди потомков Мч> поколения
случайным образом выбираются особи мужского и женского пола и скрещиваются.
Построить математическую модель такого процесса, используя цепь Маркова, состоя-
18* 275
ниями которой служат пары генотипов Г-го поколения. Эта цепь имеет шесть
состояний, и состояние (С, CS) является одним из возможных.
а. Перечислить остальные состояния и получить переходную матрицу.
б. Показать, что построенная цепь Маркова является поглощающей, дать
интерпретации поглощающим состояниям.
в. Найти матрицу N.
г. Определить среднее число поколений до поглощения для каждого начального
состояния.
д. Показать, что вероятность поглощения в состоянии, где имеются лишь гены
типа С, равна доле генов С в начальном состоянии.
10. Пусть в процессе непрерывного скрещивания с гибридом в некотором
поколении проявился рециссивный признак. Сколько в среднем пройдет поколений, пока
этот рециссивный признак появится вновь?
§ 5.8. Потоковые модели
В этом параграфе мы рассмотрим ряд новых приложений теории цепей
Маркова. Они представляются интересными, ибо речь идет об
использовании марковских цепей в задачах, которые по своей постановке как будто
бы не содержат вероятностных элементов. В первой будут рассмотрены
потоки частиц между различными пунктами, загрязняющие окружающую
среду, во второй — денежные потоки между городами. Представляется
чрезвычайно интересным, и мы это увидим, что как только первая задача
изложена на языке математики и разработан математический аппарат ее
решения, тот же аппарат может быть использован для решения второй
задачи, хотя внешне, при поверхностном рассмотрении, они кажутся слабо
связанными.
5.8.1. Модель загрязнения атмосферы. Рассмотрим простейшую
математическую модель потока частиц, загрязняющих атмосферу. Пусть имеются
п пунктов uiyu2, ..., ип . В дискретные моменты времени t ^ 0, 1,2, ...
в пункте щ концентрация загрязняющего вещества равна Cf(t). За
единичный период времени некоторая доля qi}> загрязняющего вещества из
пункта щ переносится (перетекает) в пункт ц. Числа qtj- зависят от
географических, метеорологических и других аналогичных условий и в
принципе должны быть различными для разных временных периодов.
Однако в нашем рассмотрении мы будем считать их фиксированными.
п
Значения qif- удовлетворяют условию ? qtj- < 1. Оно означает, что для
каждого из пунктов щ9 загрязняющее вещество может быть рассеяно или
перенесено в другой из рассматриваемых пунктов. Однако
предполагается (в нашей модели), что, выйдя за пределы системы пунктов щ,
загрязнения обратно не возвращаются.
Для дальнейшего рассмотрения удобно ввести воображаемый пункт
w0, куда собираются потоки рассеивающихся загрязнений, и считать, что,
попав в н0, частицы там и остаются. Тогда можно расширить матрицу Q
размерности пХп и получить стохастическую матрицу Р размерности
(п + 1) X (п + 1) путем добавления нулевой строки вида A,0,0,..., 0)
и нулевого столбца, элементы которого выбраны так, чтобы суммы строк
матрицы Р были равны единице.
276
Например, если
/ 1/2
1/2
\о
то матрица
1/4
°
\1/3
1/4
1/2
1/3
матрица Q имеет вид
° ^\
°
1/3 J
i P равна
0
1/2
1/2
0
0
1/4
1/2
1/3
|.
I
о \
0
1/3/
И хотя в исходной задаче, может быть, нет вероятностных аспектов,
можно рассматривать матрицу Р в качестве переходной матрицы
некоторой цепи Маркова. В этой цепи и0 является поглощающим
состоянием.
Следует также предположить, что Р определяет поглощающую цепь
с единственным поглощающим состоянием м0. Это предположение
выполнено, если для всех i имеет место
. A7)
Согласно условию A7) в каждой точке щ происходит в любом
временном интервале рассеивание загрязняющих веществ. (Почему условие A7)
гарантирует, что цепь Маркова является поглощающей с единственным
поглощающим состоянием м0?)
Пусть в некоторых из пунктов их, и2, ..., и2 расположены источники
загрязнений атмосферы. За единичный период времени (независимо от
момента рассмотрения) источник загрязнений, расположенный в точке
и,-, выбрасывает некоторое число ft > 0 загрязняющих веществ. (При
отсутствии в точке щ источника загрязнений, положим// = 0; кроме того,
возьмем /о = 0. Здесь снова для упрощения полагаем, что // не зависит
от времени.)
Задача заключается в следующем. Предположим, что существуют и
известны верхние пределы концентрации загрязнений атмосферы,
"разумные" или приемлемые для различных пунктов. Они могут меняться в
зависимости от того, рассматриваются ли промышленные или жилые
зоны, открытые пространства и т.п. Какие ограничения или верхние
пределы должны быть указаны в каждом из источников для выброса ft с
тем, чтобы не превзойти допустимые границы концентрации загрязняющих
веществ? Эти ограничения в принципе могут зависеть от уровня
загрязнений в момент введения нового стандарта. Однако покажем, что в рамках
нашей модели они не зависят от начальных условий. В любом случае пусть
щ — количество загрязняющего вещества в пункте м,- в момент t0 = 0.
Обозначим допустимый верхний уровень концентрации загрязнений
числом gt (это множество ограничений). Нам необходимо выбрать ft
таким образом, чтобы после некоторого времени с/(О <gt для всех /. Пусть
f = (Л,/2, ...,/Л), g = &1,*2,...,^,т=(т1,/я2,...>/яя)и с(г) =
277
= (ci@, Ci(t)> • •., Cn(O) • Проследим, что происходит с частицами
загрязнений, находящимися в воздухе в начальный момент t0 = 0. Из общего
количества тг загрязняющего вещества, находившегося в точке щ (i Ф 0) в
момент t = 0, некоторая часть, а именно, щрц = ЩЯ# переходит в
точку Uj (j Ф 0) к моменту t= 1. Следовательно, если никаких
дополнительных загрязнений не поступает, их распределение в момент t=l
определяется вектором mQ. Таким образом, сA) = mQ. Аналогично распределение
загрязнений к моменту t = 2, сB) определяется вектором mQ2, ...,
распределение загрязнений к моменту t - вектором mQ *. Так как матрица Q
получена для поглощающей цепи Маркова, то из теоремы 5.5 следует, что
Q * -+ 0. Поэтому и mQ * -> 0. Таким образом, можно сделать вьюод, что
если не поступают дополнительные загрязняющие вещества, то начальная
концентрация ввиду рассеивания со временем уменьшается до
незначительных размеров. (Все загрязняющие вещества "поглощаются" со временем
воображаемым пунктом и0.)
Рассмотрим,для примера, случай трех пунктов. За один период времени
1/3 загрязнений в пункте 1 рассеивается, 1/3 переходит в пункт 3 и 1/3
остается в пункте 1. Аналогично, 1/3 загрязнений из пункта 2 переходит
в пункт 1, 1/3 остается там и 1/3 переходит в пункт 3. Наконец, 1/3
загрязнений остается в пункте 3, а остальные 2/3 переходят из пункта 3 в пункт 2.
Таким образом, матрица Q имеет следующий вид:
1 2 3
1/3 0 1/3
«2= 2 | 1/3 1/3 1/3 ) . A8)
1/3
о
р- \\ г :: :.. :: |. 09)
Заметим, что Q не удовлетворяет условию A7), но Ропределяет
поглощающую цепь Маркова с единственным поглощающим состоянием и0 = 0,
в введенном нами вспомогательном пункте.
Пусть в начальный момент имеются три единицы загрязняющего
вещества в пункте 1, шесть единиц в пункте 2 и девять единиц в пункте 3. Тогда
m = C, 6, 9). В момент времени Г= 1 распределение загрязнений
определяется выражением
c(l) = mQ = C,8,6).
Таким образом, пока еще имеются три единицы загрязняющего вещества
в пункте 1, восемь единиц в пункте 2 и шесть единиц в пункте 3. К моменту
г= 2 это распределение имеет вид
сB) = ш<22 =(И/3,20/3, 17/3).
278
Матрица Р имеет вид
0
1
1/3
0
0
1
0
1/3
1/3
0
2
0
0
1/3
2/3
3
0
1/3
1/3
1/3
В дальнейшем, если загрязнения не прибавляются, наличие загрязняющего
вещества во всех пунктах стремится к нулю.
Рассмотрим далее, что происходит с порцией загрязнений fi9 возникшей
в пункте щ в момент t — s.K моменту времени t — s + 1 некоторая часть
загрязнений, а именно ffptj = //<?#, произведенных в пункте м/, перейдет
в пункт uj. Следовательно, к моменту t — s + 1 распределение загрязнений,
внесенных в момент t — s, определяется вектором iQ.
К моменту t распределение загрязнений, внесенных в момент t — s,
определяется вектбром fQs. Общее распределение загрязнений к моменту
времени t при условии, что их источники постоянно действуют, имеет вид
с@ = т<2'+ 2 fQs. B0)
s=0
Возвратимся к нашему примеру. Пусть пункты 1 и 3 за один период
времени вносят по единице загрязняющего вещества каждый, а пункт 2
не является источником загрязнений.
Тогда f = A,0, 1) и
+ A/3,2/3, 2/3) = A3/3, 26/3, 23/3).
Пусть допустимый уровень концентрации загрязнений в нашем примере
определен вектором g = B5, 25, 25). Для выполнения этих условий
необходимо установить такие нормы /i, /2 и /3, определяющие допустимые
уровни внесения загрязнений в пунктах 1, 2 и 3, чтобы после некоторого
периода времени установилось соотношение с (г) < g *). Покажем сейчас,
что если N = (/ - 0, то с достаточной для практики точностью
допустимые уровни не превышаются, если
B1)
Для доказательства этого соотношения рассмотрим выражение B0).
Так как матрица Q получена для поглощающей цепи Маркова, то из теоре-
t
мы 5.5 следует, что 2 f Qs стремится к f (/ - Q) - f Л^Лоэтому,так
как mQг -» 0, то ct ¦+ f/V. Отсюда следует, что с достаточной для практики
точностью, при больших t значение с (г) равно iN. Если fiV выбирается из
условия fTV <g, то при достаточно больших t величина c(t) на практике
не превосходит g. Условие B1) есть система из п линейных неравенств сп
неизвестными. Произвольное решение этой системы дает совокупность
норм для источников загрязнений, при котором уровень загрязнения
воздуха остается ниже допустимых пределов. Выбор набора норм среди
множества возможных требует привлечения информации, не вошедшей
в нашу модель.
1) Если v и w - векторы или матрицы, то соотношение v < w (v < w), означает,
что каждая компонента v не превосходит (или меньше) соответствующей
компоненты w.
279
Для рассмотренного выше примера вычислим матрицу N:
3 3 3 X
3 6 9/2 . B2)
3 6 6 /
Далее из условия fN<g получим следующую систему линейных
неравенств:
3/i+3/2+3/3<25,
3/, +6/2 +6/3<25, B3)
3/i+y/2+6/3<25.
Одним из решений этой системы является вектор f = D,1,1). Это означает,
что допускается внесение за единицу времени четырех единиц
загрязняющего вещества в пункте 1 и по одной в пунктах 2 и 3. Другим решением
системы B3) служит вектор f = D, 2, 0). Он требует отсутствия всякого
источника загрязнений в пункте 3. Любой вектор, служащий решением
системы неравенств B3), приводит к достижению желаемого результата:
уровень загрязнений не выходит за допустимые пределы. При этом его
выбор не зависит от начального распределения. Поэтому устанавливаемые
нормы выброса загрязнений также не зависят от начальных условий. Как
уже отмечалось выше, выбор из двух множеств норм должен базироваться
на соображениях, не вошедших в нашу модель. Например, каковы
экономические или социальные преимущества одной группы норм перед другой?
Рассмотренная здесь модель мало реалистична по различным
соображениям. Например, предполагалось, что величины #/; не зависят от времени t,
что нереально. То же можно сказать относительно независимости// от и Но
эта модель иллюстрирует потенциальные возможности использования
теории цепей Маркова к проблемам загрязнения внешней среды.
Ряд общих ссылок на моделирование загрязнения воздуха приводят в
своих работах Briggs [1969], Slade [1968] и Stern [1973].
5.8.2. Модели денежных потоков. Модель, почти аналогичная
рассмотренной выше, исследовалась в работе Kemeny, Snell [1962] в связи с
изучением денежного обмена (наличными) мевду городами. Здесь щ —
некоторый город, a qtj - доля наличных денег города щ, переходящая в город
Uj за период времени, выбранный в качестве единицы, например, за год.
Как указывают Кемени и Снелл, величину q(j можно оценить, изучив
выборку из оплаченных счетов. Эта модель также не реалистична, ибо, кроме
всего прочего, величины qif- в действительности зависят от времени t.
Будем, как и ранее, предполагать, что qtj удовлетворяют условию A7)
или, для большой общности, условимся, что матрица Р определяет
поглощающую цепь Маркова с одним поглощающим состоянием uq. Здесь и0
представляет собой некий воображаемый дополнительный город, куда
стекаются все наличные деньги, "исчезающие" из других городов
рассматриваемой системы. Предполагается, что, как только деньги исчеза-
280
ют из некоторого города, они больше туда не возвращаются *). Вектор
m предполагается неотрицательным, он определяет начальное
распределение денег между городами. Правительство имеет представление о
некотором идеальном (долгосрочном) распределении наличных денег,
определяемом вектором g. Оно надеется достигнуть его со временем,
помещая некоторое количество наличных денег /,- в город щ в момент
времени t. Возникающие здесь сложности связаны с тем обстоятельством,
что величины /)• могут быть отрицательными (это равносильно изъятию
денег из города), а вместе с тем все ct(t) (<?,•(/) - общая сумма денег
в городе / в момент t) должны быть неотрицательными, ибо ни один
город не может иметь отрицательного количества денег. Задача состоит
в нахождении такого f, при котором с(г) стремится к g.
(Сформулированные сейчас требования более жесткие, чем в задаче о загрязнении
окружающей среды.)
Здесь снова может показаться, что описанная модель не содержит
каких-либо вероятностных элементов, однако теория цепей Маркова
позволяет получить решение поставленной задачи.
Выше было показано, что если задан вектор f, то вектор c(t)
определяется из условия B0) и c(r) -* f/V. Следовательно, в нашем случае
должно иметь место f/V = g и f = g(/ - Q) 2X Это единственное значение f,
удовлетворяющее заданным условиям. Трудности возникают из требования
неотрицательности q@, ибо данное f может привести к отрицательным
значениям с/(г). Таким образом, мы находимся в ситуации, когда для
любого заданного предельного распределения g существует по-крайней
мере одна стратегия f, позволяющая достигнуть g. Ответ на вопрос о
том, можно ли, используя данную стратегию f, удовлетворить
требованию о неотрицательности всех q(/), зависит от начального распределения
наличных денег т. (В модели загрязнения окружающей среды
допустимые уровни выброса загрязнений /,- оказались не зависящими от т.)
Если относительно некоторого m использование стратегии f = g (/ — Q)
приводит к неотрицательным значениям c,(f), предельный вектор g
будем называть допустимым относительно т.
В общем случае для проверки допустимости g подставим значение
f = g(/ - 0 в уравнение B0). Имеем
c@ = mG' + g(/-G) i G' = mG' + (g-gQ) Z Q\ B4)
t
Здесь m > 0; кроме того, Q > 0, Qs > 0 и 2 Q* > 0. Таким образом, если
5=0
% - %Q > 0, т.е., если g > g<2, то c(r) > 0 для всех t и, следовательно,
> 0 при любых значениях / и t. Это условие не зависит от т.
п
х) Эта ситуация отлична от случая, когда деньги не исчезают, т.е. когда S qtj = 1.
Тогда цепь Маркова является эргодической и ее можно счи1ать регулярной. Отсылаем
читателя к работе Kemeny, Snell [1962, гл. VII] и к упражнениям 15-22, где
рассматриваются подобные задачи.
2) Из неравенства tN < g, полученного в задаче о загрязнении окружающей среды
было бы неправильным сделать вывод, что f < g(/ - Q) . Почему?
281
Полученный результат сформулируем в виде следующего утверждения.
Теорема 5.15. Если gQ < g, то g является допустимым относительно
всех ш.
Рассмотрим теперь пример, иллюстрирующий полученные нами
результаты. Пусть имеются три города и потоки наличных денег между ними
описываются матрицей Q, приведенной в A8). Таким образом, за каждый
единичный период времени из города 1 исчезает 1/3 наличных денег.
Зададим матрицу Р снова условием A9). Рассмотрим сначала случай, когда
желаемое предельное распределение имеет вид g = A0, 10, 10), (т.е. имеет
место равномерное распределение денег между городами). Имеем gQ =
= B0/3, 10, 10). Так как gQ <g, то из теоремы 5.15 следует, что данный
вектор g допустим независимо от начального распределения денег т.
Кроме того, правильная политика денежных вложений на каждый период
времени дается вектором f = g (/ - Q) = A0/3,0,0). Следовательно,
правительство не должно вмешиваться в денежное обращение городов 2 и 3 и
должно вкладывать 10/3 единиц наличных денег в первый город за каждый
единичный период времени. Для проверки заметим, что здесь N снова
определяется уравнением B2) и после элементарных вычислений находим
CV = A0/3,0,0)N = A0,10,10) = g.
Для ситуаций, когда условие g > gQ не выполняется, следует вывести
другие критерии проверки допустимости.
Вернемся к уравнению B4). Заметим, что после простых
преобразований
Необходимо, чтобы для всех t c(t)> 0, т.е. чтобы имело место
для всех t> 0. Отсюда для всех t > 0 должно выполняться соотношение
g>(gQ-m)Qt. B5)
Таким образом, вектор g служит допустимым относительно ш тогда и
только тогда, когда условие B5) выполнено для f = 0, 1,2,...
Будем говорить, что выполняется условие Си если для t справедливо
B5). Следовательно, вектор g служит допустимым относительно m тогда
и только тогда, когда условие Ct выполняется для /= 0,1, 2,...
Рассмотрим снова иллюстративный пример. Пусть матрица Р, как и
ранее, определяется условием A8), но желаемое предельное распределение
будет иным, чем изученное выше. А именно: пусть нашей целью будет
вектор g = A2, 6, 3). Здесь gQ = F, 4, 7). Так как 7 > 3, то теорема 5.15
неприменима, и допустимость вектора g может зависеть от начального
распределения т. Рассмотрим сначала распределение m = A, 1, 4). Тогда
(gQ - m) = E, 3,3), что не превышает g и, значит, условие Ct справедливо
для t = 0; однако (gQ - m)Q = (8/3, 3, 11/3) и 11/3 > 3; следовательно,
соотношение (gQ - m)Q <g несправедливо. Поэтому условие Ct
нарушается при t = 1 и, таким образом, целевой вектор g = A2, 6,3) не
является допустимым относительно распределения m = A, 1, 4). Покажем ниже,
282
что он служит допустимым вектором относительно начального
распределения т= F,5,4).
На практике условие Ct трудно использовать в качестве критерия
допустимости. Для достижения полной уверенности, что вектор g допустим
относительно некоторого распределения т, пришлось бы выполнить
бесконечное число проверок. Поэтому, следуя работе Kemeny, Snell [1962],
мы приведем достаточное условие допустимости, что позволит обойти
указанную трудность.
Теорема 5.16. Пусть все компоненты gt вектора g положительны1).
Рассмотрим следующее условие Ds: сумма абсолютных значений
компонент вектора (gQ —m) Qs не превосходит наименьшей компоненты
вектора g. Тогда, если условие Ds выполнено для некоторого значения s, то
условие Ct выполнено для всех t > s и существует такое значение s, для
которого выполнено условие Ds.
Теорему S.16 можно следующим образом использовать для проверки
допустимости. Сначала проверяем условие D5 для s = 0. Если оно
выполнено, то, как известно, условие Ct справедливо для всех t > 0 и вектор g
является допустимым относительно распределения т. Если условие Ds
не выполнено, то проверяем справедливость Ct для t = 0. В случае его
нарушения g не есть допустимый вектор для т; если оно выполнено,
проверяем Ds для t = 1. Пусть оно справедливо; тогда g есть допустимый
вектор для m (Почему?). В противном случае проверяем условие Ct при
t = 1. В случае его нарушения g не есть допустимый вектор для т, если
оно выполнено, проверяем условие Ds для s = 2. При его выполнении,
вектор g является допустимым для т, если оно нарушается, проверяем
условие Ct при t = 2 и далее аналогичным образом. Согласно теореме 5.15
эта процедура конечна, ибо либо условие Ct нарушается для некоторого
значения Г, либо условие Ds удовлетворяется для некоторого
значения s.
Для иллюстрации использования данного критерия вернемся к
матрице Q из уравнения A8). В качестве целевого вектора выберем
рассмотренный ранее вектор g = A2, 6, 3), но начальное распределение изменим и
положим его равным т= F, 5, 4). Здесь gQ- т = @, -1, 3). Имеем 0 +
+ 1 + 3 = 4, что превышает 3 — минимальное значение компоненты
вектора g. Следовательно, условие Ds нарушается при s = 0. Неравенство B5)
справедливо при t = 0, таким образом, условие Ct выполнено для t = 0.
Вычисляем далее вектор (gQ — m) Q; имеем (gQ — m) Q= (—1/3,5/3,2/3).
Теперь 1/3 + 5/3 + 2/3 = 8/3, что меньше 3, минимальной компоненты g.
Следовательно, условие Ds выполняется при 5 = 1. Отсюда, согласно
теореме 5.16, заключаем, что вектор g является допустимым относительно
начального распределения т. Здесь снова f = g (/— Q), откуда f = F, 2, -4).
Таким образом, правительство может достигнуть своей цели и получить
желаемое идеальное распределение, придерживаясь в каждом единичном
периоде времени следующей политики: выделять 6 единиц денег городу 1,
2 единицы городу 2, а 4 единицы денег изымать из города 3.
2) Это предположение накладывает некоторые ограничения на использование
георемы, но достаточно разумные.
283
Закончим этот пункт параграфа доказательством теоремы 5.16. Пусть
h = h(s) = (gQ - m) Qs. Тогда для t > s имеем
m)Q' = hG('-5). B6)
Заметим, что если условие Ds выполнено, то 2 |Л/| < ming/, где
t i i
есть наименьшая компонента вектора g. Согласно B6) условие Ct
(неравенство B5)) для t > s можно написать в виде hQ*~s < g. ПредполагаяDs
выполненным, докажем это неравенство для t>s. В векторе hQ(*~s\
где Q*'"* = (qfj*"^ ), /-я компонента равна 2 hiqtf~s). Так как б('~ 5)
есть степень матрицы Q, у которой сумма элементов строк не превосходит
1 и все элементы неотрицательны, то qj)*"^ < 1 для любых /,/".
Следовательно, для /-Й компоненты вектора hQ^f^ имеет место
i J i ' i
Но 2 \ht\ <ming/ no предположению; отсюда следует, что
Таким образом, неравенство B5) (условие Ct) выполнено для t> что
заканчивает доказательство первой части теоремы 5.16. Для доказательства
второй части заметим, что, согласно теореме 5.5, Qs -*0 при s ->°°.
Следовательно, имеет место h = h(s) = (gQ — m) Qs -*0. Отсюда получаем, что
X\hf(s) | ->0 и, так как все компоненты вектора g — положительные числа,
t
для достаточно больших значений s выполняется неравенство 2 \ht(s)\ <
< min gf. Этим доказательство теоремы 5.16 заканчивается. ¦
1/2
1/4
1/2
0
1/6
0
1/4
1/2
1
1/3
1/4
1/4
0
0
1/3
1. Для приведенных ниже матриц Q найдите соответствующие им матрицы Р:
1/3 1/3 1/6
а.е= | 1/2 0 1/4 |; 6.G= | 1 О О
1 О
в. B =
2. В каких случаях матрица Р упражнения 1 определяет поглощающую цепь
Маркова с единственным поглощающим состоянием и0 ?
3. Рассмотрим пример с загрязнением внешней среды в предположении, что
имеются всего три населенных пункта. Пусть за единичный период времени по 1/3
загрязнений, присутствующих в каждом из пунктов, переходит в два других пункта, а
остающаяся 1/3 загрязнений рассеивается (исчезает).
а. Найти матрицы QuP, соответствующие описанной ситуации.
б. Применима ли наша теория к этой ситуации? Почему?
в. Если в начальный момент имеются по две единицы загрязняющих веществ в
пунктах 1 и 3 и пять единиц загрязнений в пункте 2, а дополнительные загрязнения
не вносятся, то каково будет распределение загрязнений после двух временных
периодов?
284
г. В условиях п.в задачи найти концентрацию загрязняющих веществ в пункте 1
после третьего периода времени?
д. Определить для условий п.в задачи, каким будет распределение загрязнений
при длительном течении процесса.
е. Пусть дополнительно к имеющемуся начальному загрязнению в каждый период
времени в атмосферу пункта 1 выбрасывается единица загрязняющего вещества.
Каково в этом случае распределение концентрации загрязняющих веществ после двух
периодов времени?
ж. Определить в условиях п.е задачи, какое количество загрязнений имеется в
пункте 3 после трех периодов времени.
з. Определить для условий п.е задачи, каково распределение загрязнений при
длительном течении процесса.
4. Рассмотрим пример с загрязнением внешней среды, предполагая, что имеются
всего два населенных пункта. Пусть за единичный период времени 3/4 загрязнений,
присутствующих в пункте 1, там и остаются, а остальные переходят в пункт 2. За
то же время 1/4 загрязнений пункта 2 остаются в нем, 1/2 переходит в пункт 1, а
остальная часть рассеивается (исчезает). Предположим, что начальное распределение
загрязнений и их допустимый уровень выражаются векторами tn= A0, 10) и g =
= B0, 20) соответственно. Определить стандарты (разрешенные уровни) на выбросы
загрязняющих веществ для каждого из населенных пунктов, не приводящие к
превышению допустимых уровней загрязнений. Обсудить эти стандарты.
5. Повторить решение упражнения 4 для ш= A0, 10), g = B0, 20) и следующих
значений матрицы Q:
1/3 1/3 \ кл-/1/3 1/3\ *п-A1в 11в
1 0 У 6-Q-\ 1/3 1/3 У BQ-\ 1/6 1/6
6. Пусть в задаче о загрязнении внешней среды некоторое решение f сие .емы
линейных неравенств f JV< g имеет по крайней мере одну отрицательную компоненту.
Имеет ли это смысл? Возможен ли случай, когда любое решение f имеет по крайней
мере одну отрицательную компоненту? .
7. Пусть m = C, 3, 3) и g = A0,10,10). Определить для матриц Q из упражнения 1,
выполнено ли условие Ct при t = 0.
8. Повторить упражнение 7 для t = 1.
9. Повторить упражнение 7 для условия Ds при s = 0.
10. Повторить упражнение 7 для условия Ds при s = 1.
11. Рассмотрим задачу о денежных потоках и предположим, что имеются два
города. За каждый единичный период времени город 1 сохраняет 1/4 своих наличных
денег и расходует остальные куда угодно. Город 2 сохраняет 1/2 наличных денег
и расходует остальные произвольным образом.
а. Определить матрицы Q и Р, соответствующие описанной ситуации, и показать,
что матрица Р есть переходная матрица поглощающей цепи Маркова с одним
поглощающим состоянием.
б. Показать, что в данной ситуации любой целевой вектор g является
допустимым относительно произвольного начального распределения ш.
12. Рассмотрим задачу о денежных потоках между двумя городами. За каждый
единичный период времени город 1 сохраняет 1/10 своих наличных денег, а
остальные передает в город 2. В свою очередь, город 2 сохраняет 1/10 своих наличных денег,
передает 1/2 в город 1, а остальные расходует куда угодно. Начальное распределение
денег задается вектором ш= (8, 16). Для каждого из следующих целевых
векторов g установить, является ли он допустимым относительно т, и если-да, то какая
стратегия распределения денег f позволяет достигнуть желаемой цели — предельного
распределения g? В допустимых случаях проверить ответы путем вычисления
матрицы TV и показать, что f N = g.
а. g= A0,10);
б. g = B0,10);
в. g= A00,10);
г. g = C0,20).
285
13. В задаче о денежных потоках пусть матрица Q имеет вид
/ 1/3 1/3 \
V 1/3 1/3/'
Для указанных ниже целевых векторов g и начальных распределений m определить,
являются ли g допустимыми относительно т. Для каждого допустимого вектора g
найти стратегию распределения f, позволяющую достигнуть намеченной цели.
а. g= A0,10), m= A0,10),
б. g= A0,50), m= A0,10),
в. g= A0,50), m=: E,5).
14.B задаче о денежных потоках, описанной в упражнении 12, правительство
стремится достигнуть распределения, которое определяется целевым вектором g = E,6).
Но оно не может ни вводить, ни изымать наличные деньги из города 2. Является ли
указанный целевой вектор допустимым? Если - да, то какие приблизительно
денежные суммы /, должны даваться городу 1 или изыматься у него за каждый единичный
период времени для достижения поставленной цели? Что можно сказать относительно
целевого вектора g = E, 5) ? Внимание! Что здесь означает допустимость?
15, В упражнениях 15-22 рассматриваются ситуации, когда матрица Q,
описывающая денежные потоки, является эргодической, т.е. наличные деньги не могут покинуть
систему. Соответствующие результаты приведены в работе Kemeny, Snefl, [1962].
Пусть Р ~ Q} и рассмотрим случай, когда некоторые элементы рц положительны,
т.е. матрица Р регулярна. Пусть w - стационарный вероятностный вектор матрицы Р
и W - матрица, все строки которой равны вектору w. Легко видеть, что с (г) снова
имеет вид
t
2 fP*. B7)
(Это не нужно доказывать.) К чему сходится.первый член выражения B7) ?
16. Второй член выражения B7) не обязательно сходится. Но если он сходится при
некотором f, то f Ps -*0. Так как все компоненты вектора w положи те льны, то можно
показать, что из fPs ->0 следует 2/r -+Q. Истолковать этот результат.
t t
17*. Согласно теореме 5.10 величина Z = (/-/> + WI существует и /+ 2 (P*-W)
5 = 1
сходится к Z при f -+во. Предположив что 2/f = 0, показать, что с (t) сходится к h, где
г
h = (Sw/)w + fZ. B8)
i
18*. Из результатов упражнений 16 и 17 следует, что если для некоторого/ с (Г)
сходится Kg, то
g=BmI)w + fZ.
i
Показать, что отсюда следует равенство
2^=2™,-.
i /
19* Пусть g - произвольный вектор, а вектор f имеет вид f = g (/- Р). Показать,
что в этом случае 2 // = 0. (Указание. Пусть v - единичный вектор-столбец, тогда
/
fv = g(/-/>)u.)
20*. Пусть 2 gf = 2 w/. Положим f = g (/- Р). Показать, что если h удовлетворяет
1 i
соотношению B8), то h = g. (Указание. Умножить B8) на /- Р + W и воспользоваться
равенствами wP=vtn wW=w.)
2f. Используя результаты упражнений 17-20, получить следующее утверждение:
пусть задан вектор g; с (г) сходится к g для некоторого f тогда и только тогда, когда
286
2 #/ = ? /я/. Более того, если вектор с (г) сходится к g для некоторого f, то он
/ i
сходится к g для f =g (/-/*)• (Если вектор с (Г) сходится к g, он не обязательно
положителен, т.е. может оказаться, что с (t) < 0. В этом случае, как и ранее, мы будем
говорить, что вектор g не является допустимым относительно т. Условия
допустимости аналогичны полученным для ситуации с поглощением.)
22. Применить результаты упражнений 15-21 к следующей задаче о денежных
потоках. Имеются три города. За каждый единичный период времени Уг наличных денег
города 1 переходит в город 2, остальные остаются в городе 1, Уг наличных денег
города 2 переходит в город 1, остальные переходят в город 3, Уг наличных денег
города 3 переходит в город 2, остальные остаются в городе 3. Предположим, что
начальное распределение денег задается вектором m = E, 15,10).
а. Какова матрица Р s Q для описанной здесь ситуации?
б. Является ли матрица Р переходной матрицей регулярной цепи Маркова?
в. Может ли целевой вектор g = A0,12,14) быть допустимым?
г. Рассмотреть целевой вектор g = A0, 10, 10). Использовать результаты
упражнения 21 и теорему, аналогичную теореме 5.16, для доказательства допустимости g
относительно т.
д. Найти вектор распределения денег f, позволяющий достигнуть цель g. Дать
интерпретацию результатов.
е. Используя формулу из упражнения 17 проверить, что при значении f, полученном
в п. д задачи, с (г) сходится к вектору g.
ж. Рассмотреть новый целевой вектор g = (8, 10, 12). Является ли g допустимым
относительно т? Если да, то при каком векторе f достигается целевой вектор g?
23. Построить модель потока электрической энергии через распределительный щит
в период его переключения, когда правительство проводит перестройку системы
распределения энергии на новую систему приоритетов (на новую схему
распределенияI).
§ 5.9. Математические модели обучения
Первые попытки моделирования процессов обучения относятся
по-видимому, к 1907 г. (Gulliksen [1934]). До настоящего времени большинство
Рис. 5.24. Г-образный коридор
исследователей ограничивается изучением частных ситуаций обучения и
развивает модели, описывающие процесс обучения в этих ситуациях. В
данном параграфе мы рассмотрим один из таких подходов. В экспериментах,
которые имеются в виду, используется Т-образный коридор, показанный
на рис. 5.24. Крыса, войдя в коридор, может повернуть направо (R) или
налево (L). Предположим, что мы хотим "обучить" крысу поворачивать
направо и пытаемся достичь этого, поощряя ее пищей, если она
поворачивает направо, и оставляя ее без поощрения, если она поворачивает налево.
Помещая крысу в Т-образный коридор и проводя серию испытаний, мы
можем изучить последовательность ее ответов (R или L) и попытаться
') Автор благодарит К. Богарта (личное сообщение) за идею постановки этой
задачи.
287
сделать некоторые предсказания относительно этой последовательности.
Аналогичные эксперименты проводились и с участием людей. Состояли
они в следующем. Перед испытуемым помещается табло, где находятся
две лампочки. Начинается серия испытаний. Перед каждым опытом
испытуемый предсказывает, какая лампочка загорится — правая или левая.
После этого в соответствии с определенным правилом загорается одна из
лампочек. Предположим сначала для простоты, что мы постоянно зажигаем
правую лампочку, т.е. всегда поощряем ответ R. Как и ранее, здесь нас
Л
' ' Рис. 5.25. Кривая обучения для линейной
модели и одноэлементной бинарной
модели (модель Бауэра)
интересует возможность предсказания последовательности ответов или
некоторых ее свойств.
5.9.1. Линейная модель. По-видимому, простейшая модель обучения -
так называемая линейная модель. Эта модель предполагает, что обучение
есть бесконечный процесс, уровень обученности постоянно возрастает,
но состояние полного обучения не наступает никогда.
Для построения модели положим, что pt есть вероятность правильного
ответа R при испытании номер t. Тогда qt = 1 —pt есть вероятность
неправильного ответа при испытании t. Испытания будем нумеровать
числами О, 1,2,... Таким образом, первое испытание имеет номер 0. В линейной
модели предполагается, что с каждый новым испытанием вероятность qt
убывает, причем коэффициент убывания остается постоянным для всех
испытаний. Это означает, что существует константа а, 0 < а < 1 такая, что
Для вероятностей pt имеем
откуда, собственно, и проистекает название линейная модель. Постоянная
а называется параметром модели. Это некоторая числовая величина,
конкретное значение которой необходимо знать для применения данной
модели к изучению различных процессов обучения. Оценка параметра а должна
быть получена на основе экспериментальных данных.
Согласно прогнозу, сделанному на основе линейной модели, имеем
Qt = ®*Яо или, что то же самое,
Pt-l-a'qo. B9)
Постоянная q0 — второй параметр модели, ее значение необходимо также
оценить на основе экспериментальных данных. Построив зависимость р/
от t получим так называемую кривую обучения (рис. 5.25). Модель
позволяет сделать вывод, что в процессе обучения мы все более и более
приближаемся к совершенству, и при достаточно больших значениях t вероятность
правильного ответа близка к единице. Построенную модель можно прове-
288
рйть, вычислив среднее число ошибок, совершаемых при t испытаниях,
если число испытуемых равно к. Это среднее равно kqt, и его можно
сравнить с данными эксперимента.
5.9.2. Одноэлементная бинарная модель. Перед тем как ввести другую
модель обучения, отличную от линейной, напомним сначала читателю
содержание знаменитных экспериментов Павлова с собаками. В нормальных
условиях собаки выделяют слюну, когда им показывают пищу. Будем
говорить, что некоторая пища является стимулом, или раздражителем,
если, будучи воспринята собакой, она вызывает у нее реакцию
слюноотделения. (Воспринята в психологическом смысле, собака воспринимает стимул
"пища" зрением или обонянием, но не пробует ее!) В нашей повседневной
жизни мы воспринимаем многие раздражители (стимулы) из нашего
внешнего окружения и часто на некоторые из них реагируем. Такими
раздражителями служат например, свет, запахи, звуки и т.п. На некоторые
раздражители, существующие в нашем окружении, мы не обращаем внимание. Так,
например, пытаясь углубиться в чтение, мы иногда игнорируем все
посторонние звуки. В сЬоих экспериментах с собакой Павлов сумел путем
многократного повторения опытов заменить стимул (раздражитель)
"пища" другим стимулом — "звонок", который вызывал, как правило, ту
же реакцию - слюноотделение. Будем говорить в этом случае, что новый
стимул (раздражитель) стал условно связанным с реакцией
"слюноотделение", т.е. что между стимулом и реакцией существует условная -связь.
Модель обучения, которую мы сейчас рассмотрим в качестве
альтернативы линейной модели, ввел Г.Х.Бауэр (G.H.Bower)- это модель "стимул -
восприятие" (раздражитель - восприятие) типа "все или ничего" и ее
Состояние
условных
связей
Восприятие
Реакция
Подкрепление
Изменение
условных
связей
Рис. 5.26. Этапы обучения
называют вслед за Бауэром бинарной (или релейной) моделью.
Рассматривается некоторый субъект, воспринимающий стимулы (раздражители) и
устанавливающий условные связи между стимулами (раздражителями) и
реакциями (ответами), которым он пытается обучиться. В большинстве
моделей "стимул - восприятие" предполагается, что процесс обучения
состоит из ряда этапов, показанных на рис. 5.26. Предполагается, что до
начала данного опыта существуют условные связи между стимулами и
реакциями. Затем некоторые или, может быть, все доступные стимулы
воспринимаются субъектом. Он выбирает свой ответ на основе
воспринятых им стимулов и имеющихся у него представлений о состоянии условных
связей стимулов и реакций. Например, если собака восприняла звучание
колокольчика и этот звонок у нее условно связан с реакцией
слюноотделения, она начинает выделять слюну. Затем экспериментатор
производит поощрение или, как иногда говорят, подкрепление. В итоге условные
связи воспринятых стимулов могут измениться, т.е. может произойти
19. Ф.С. Роберте 289
перестройка структуры условных связей стимулов и реакций. Так, если
звонок колокольчика до начала опыта еще не был условно связан с
реакцией выделения слюны, то такая связь может установиться, если собака
поощряется пищей после звонка колокольчика. После перестройки
условных связей возвращаемся в исходную ситуацию, и все готово для нового
опыта. Для формального описания модели типа " стимул — восприятие"
необходимо сделать определенные предположения относительно различных
этапов процесса обучения.
В случае простейшей модели бинарного типа — одноэлементной бинарной
модели — будем постулировать существование единственного
гипотетического стимула или, что одно и то же, единственного гипотетического
стимулирующего элемента s. Мы называем элемент s "гипотетическим",
ибо не будем пытаться его идентифицировать с каким-либо определенным
объектом внешнего окружения, исключая, может быть, сигнал к началу
опыта.
Сделаем сейчас следующие предположения о свойствах отдельных этапов
процесса обучения.
Одноэлементная бинарная модель. Принятые допущения.
Состояние условных связей. Перед каждым опытом
(испытанием) условная связь между стимулирующим элементом s и
правильной реакцией (ответом) может существовать или отсутствовать. До
начала первого опыта — опыта номер 0 — условная связь между s и R
отсутствует.
Восприятие. В каждом из проводимых опытов (испытаний)
субъект воспринимает стимулирующий элемент s.
Реакции. Реакциями субъекта в каждом опыте являются R или L.
Если существует условная связь между s и реакцией R, то субъект
указывает ответ R, т.е. реагирует правильным образом. Если между стимулом s
и реакцией R нет условной связи, то он выбирает R с некоторой
вероятностью g (число g есть параметр модели).
Подкрепление. Экспериментатор всегда поощряет ответ R и
никогда не поощряет ответ L.
Изменение условных связей. Если между стимулом s и
реакцией R до начала опыта существовала условная связь, то эта связь
остается после его завершения. Если между s и R не было условной связи,
то она к концу опыта возникает с некоторой вероятностью с, не зависящей
от номера опыта, вида реакции и т.п. Предполагается, что 0 < с < 1
(число с — второй параметр модели).
Построив бинарную модель, можно делать различные прогнозы
относительно процесса обучения. Их использование требует оценки значений
параметров g и с. Параметр g можно оценить, наблюдая за частотой ошибок
в первом опыте, допускаемых большим числом испытуемых. (При этом
предполагается, что вероятность g не меняется от субъекта к субъекту.)
Далее покажем, как использовать полученное значение g для оценки
величины вероятности с.
Ряд простейших вьюодов можно сделать, построив цепь Маркова.
Будем говорить, что имеет место состояние 1, если существует условная
связь и состояние 0 в противном случае. До начала некоторого опыта
имеется определенное состояние условных связей. Переходная матрица Р
290
имеет вид
1
Р =
С ° )•
\с 1-е/
Так как с > О, то это переходная матрица поглощающей цепи Маркова
с одним поглощающим состоянием (состояние 1). Такое состояние
соответствует ситуации, когда условная связь между стимулом и правильной
реакцией существует.
Согласно теории марковских цепей можно предсказать, что с
вероятностью 1 будет иметь место поглощение. Таким образом, модель
прогнозирует, что "обучающийся" субъект обязательно выработает условную связь
между стимулом и правильной реакцией, другими словами, он "научится"
давать верные ответы. Заметим, что эта модель существенно отличается от
линейной модели, где делается вывод о невозможности завершения
обучения. Здесь относительно процесса обучения делается бинарное утверждение
типа "все или ничего" *).
Среднее число опытов, необходимое для полного обучения, можно
вычислить, определив фундаментальную матрицу N. Здесь Q = A - с),
I — Q = (с) и N = (/ — б) " A/с). Следовательно, среднее число
опытов, необходимое для полного обучения в предположении, что в начальный
момент времени мы находимся в состоянии 0 (условные связи
отсутствуют), равно 1/с. Например, если с = 1/4, то в среднем для обучения
понадобится 4 опыта, т.е. мы надеемся после опыта 3 перейти в состояние 1
(напомним, что опыты нумеруются числами 0, 1, 2, ...). Если с = */s, то
ожидаемое среднее число опытов до полного обучения равно 8. Можно
также определить ожидаемое среднее число "ошибок" до обучения,
оказывающееся равным A/с) A -#), ибо 1/с - среднее число опытов,
необходимое для обучения, а A - g) — вероятность ошибки при отсутствии
условных связей. (После установления условных связей ошибки не
совершаются.) Если значение g известно, его можно использовать для получения
оценки с, наблюдая за средним числом А ошибок, совершаемых до
обучения в большом числе экспериментов. Тогда, положив А = A/с)A — g),
получим, что с = A —g)/A. Таким путем можно, определив оценку с на
основе экспериментальных данных о поведении некоторого субъекта,
использовать ее для прогнозирования поведения других субъектов.
(Указанный подход предполагает, что значения с и g не меняются от субъекта
к субъекту.)
Для сравнения нашей модели с линейной моделью необходимо
вычислить qt — вероятность неправильной реакции в /-м опыте. Нетрудно
') Имеется в виду, что в данном типе моделей возможны лишь два конечных
состояния - полного обучения или необученно ста; промежуточное, как в линейной
модели, невозможно. В нашем случае, в каком бы начальном состоянии ни находился
субъект, через конечное число опытов он обязательно оказывается полностью
обученным. {Примеч. ред.)
19* 291
понять, что для бинарной модели имеем
qt = (l-cYd-g),
ибо A — с)т есть вероятность оказаться в состоянии 0 после г—1 опытов.
Таким образом,
pt = l-(l-c)\l-g). C0)
Это выражение для вероятности pt определяет тот же тип кривой обучения,
что и в линейной модели, ибо уравнение C0) можно привести к виду B9),
положив а = 1 -с и q0 = I -g.
Чтобы получить выводы, отличные от результатов, следуемых из
линейной модели и одноэлементной бинарной модели, рассмотрим условную
вероятность того, что испытуемый ошибется, если в предыдущем опыте он
уже совершил ошибку.
В линейной модели вероятность ошибки зависит лишь от номера
испытания и, следовательно, вероятность г t получения ошибки в опыте t при
условии, что ошибка совершена в опыте t — 1 равна
rt - Qt = <**Яо,
причем вероятность rt убывает с возрастанием г. В бинарной модели
ошибка, сделанная в (t - 1)-м опыте означает, что испытуемый субъект до этого
опыта был в состоянии 0. Поэтому вероятность rt совершения ошибки
в опыте номер t равна
Это вероятность того, что после (t — 1)-го опыта условная связь не была
установлена и в опыте t была совершена ошибка. Из выражения для
вероятности rt следует, что она не зависит от Л Работая с большим числом
субъектов и наблюдая за количеством последовательных ошибок,
совершаемых испытуемыми при возрастании г, можно сравнить обе модели
и выбрать ту, которая более соответствует опытным данным. Бауэр
(Bower [1961]) проводил эксперименты, несколько отличавшиеся от
только что рассмотренных, и при этом исследовал 20 различных следствий,
которые можно вывести из описанных нами выше двух моделей. В
экспериментах Бауэра испытуемому субъекту показывали десять "объектов",
представляющих собой каждый пару согласных букв, и он должен был
научитьсй правильно относить эти объекты к целым числам 1 или 2. Для
пяти объектов число 1 было "правильным" ответом, для остальных верным
ответом было число 2. Обучение на /-м объекте рассматривалось как один
эксперимент, но Бауэр показывал одновременно различные объекты,
проводя в действительности сразу десять экспериментов. Объект / в опыте
номер t показывался испытуемому в t + 1-й раз. После каждого показа и
ответа испытуемого, Бауэр сообщал ему правильный ответ. Согласно
результатам экспериментов Бауэра данные опытов больше соответствовали
бинарной модели в 18 из 20 случаев сравнения моделей.
Итоги опытов других экспериментаторов менее благоприятны для
простой одноэлементной бинарной модели, хотя в опытах, аналогичных
экспериментам Бауэра, получаемые результаты обычно говорят в пользу бинар-
292
ной модели. Однако именно эксперименты, давшие малоблагоприятные
результаты для одноэлементной бинарной модели привели к расширению
и специализации типов моделей обучения. Ниже мы рассмотрим ряд новых
моделей, начав с обобщения бинарной модели.
5.9.3. Двухэлементная бинарная модель. Описанная выше бинарная
модель была названа одноэлементной бинарнбй моделью, ибо при ее
построении постулировалось существование единственного стимулирующего
элемента. Рассмотрим ее обобщение на случай двух гипотетических
стимулирующих элементов sx и 52. В такой двухэлементной бинарной модели
введем в процесс восприятия процедуру выбора. Основанигм для введения
такой процедуры служат наблюдения повседневной деятельности различных
субъектов, указывающие, что обычно индивидуум выбирает для
восприятия или ему оказьюается доступной лишь некоторая часть представленных
стимулирующих элементов.
Двухэлементная бинарная модель. Принятые допущения.
Состояние условных связей. До начала каждого опыта
условная связь между стимулирующим элементом s \ и правильной
реакцией R может существовать или отсутствовать. Аналогичные
предположения имеют место относительно стимулирующего элемента 52. До начала
первого опыта — опыта номер 0 — условные связи между su s2 и R
отсутствуют.
Восприятие. В каждом опыте субъект воспринимает лишь один из
стимулирующих элементов. Выбор производится случайным образом.
Реакции. Реакциями субъекта в каждом опыте являются ответы R
или L. Если существует условная связь между воспринятым стимулом и
реакцией R, то субъект указывает ответ R, если такая связь отсутствует,
он показьюает ответ R с некоторой вероятностью g. (Число g есть
параметр модели. Из соображений простоты разумно предположить, что
число g одно и то же для всех стимулирующих элементов.)
Подкрепление. Экспериментатор всегда поощряет ответ R и
никогда не поощряет ответ L.
Изменение условных связей. Если в некотором опыте был
воспринят стимулирующий элемент Sf и до его начала между этим
элементом и реакцией R существовала условная связь, то эта связь остается
после завершения опыта. Если между s/ и R не существовало условной
связи, то она к концу опыта возникает с некоторой вероятностью с.
Вероятность с одна и та же для каждого из стимулирующих элементов. Состояние
условных связей стимулирующих элементов, не выбранных для восприятия
в данном опыте, не меняется. (Число с также есть параметр модели и
предполагается, что 0 < с < 1.)
Для исследования двухэлементной модели построим цепь Маркова
с тремя состояниями — 2, 1 и 0. Состояниями цепи до проведения
некоторого опыта будем считать число стимулирующих элементов, условно
связанных с правильными реакциями до начала данного опыта. В этих
предположениях можно подсчитать переходные вероятности. Например,
если в начальный момент процесс находится в состоянии номер 2, то он
остается в этом состоянии с вероятностью 1. Пусть начальным .является
состояние номер 1, когда ровно один стимулирующий элемен*т условно
связан с реакцией R. В состояние номер 0 процесс перейти не может.
293
Состояние Восприятие Условные Новое Вероятность
связи состоя-
установились? ние
1
1
Нет
Рис. 5.27. Типичная схема типа дерево для вычисления переходных вероятностей в
случае двухэлементной бинарной модели. С элементом sc установлена связь, с
элементом s u условной связи нет
(Почему?) Для перехода в состояние номер 2 необходимо чтобы,
во-первых, "свободный" (не имеющий условной связи с реакцией R)
стимулирующий элемент был выбран для восприятия (это происходит с
вероятностью Й) и, во-вторых, чтобы .между ним и ответом R была установлена
условная связь (это происходит с вероятностью с). Отсюда ясно, что
переход из состояния 1 в состояние 2 совершается с вероятностью 1А с.
Вычислив аналогичным образом остальные элементы переходной матрицы Р,
получим, что она имеет следующий вид:
2 1 О
Р = 1
1
с/2
О
1-е/2
О
О
О \ 0 с
Эти вероятности очень легко вычисляются, если применить схему типа
"дерево", как показано на рис, 5.27. Читателю будет полезно пользоваться
такими схемами при чтении этого параграфа. Матрица Р есть переходная
матрица поглощающей цепи Маркова с единственным поглощающим
состоянием 2. Таким образом, как и в одноэлементной модели,
вероятность обучения равна 1. Для получения дальнейшей информации
относительно этой модели вычислим фундаментальную матрицу N. Имеем
Q =
1 -с/2
с
О \
-с I
N
1-е
1
2/с
с/2
-с
с /
О
1 / 2/с 0 \
= 0-G)-1 =
О \ 21с \1с'
2/с 1/с
Таким образом, если л,у —элемент (/,/) матрицы N, то
«0 1
2 1
= +
с с
3
с
294
Отсюда можно сделать следующий вывод: если в начальный момент мы
находились в состоянии 0 (полное отсутствие условных связей), то для
полного обучения потребуется в среднем 3/с опытов. В данном случае можно
снова, проведя эксперименты с некоторым числом субъектов и используя
значение g, получить оценку вероятности с, а затем применить ее для
прогноза поведения других субъектов. Так, если с = 1/4, то в среднем следует
ожидать 3/с = 12 опытов до завершения обучения, если же с = 1/8, то
ожидаемое число опытов до полного обучения равно 24.
Одно интересное отличие двухэлементной модели oi одноэлементной
заключается в следующем. В последней вероятность получения
ошибочного ответа в некотором опыте с номером t, о котором известно, что он
производится до последней ошибки, остается постоянной, не зависящей от
t. В работе Суппеса и Гинзбурга (Suppes, Ginsburg [1963]) это свойство
названо стационарностью. В двухэлементной бинарной модели вероятность
ошибки в опыте г, о котором известно, что он производится до
последней ошибки, уменьшается с ростом t.
Двухэлементная бинарная модель естественным образом обобщается
на П'Элементную бинарную модель. Построение трехэлементной модели
оставляем читателю в качестве упражнения 21. Более детальное обсуждение
этой модели можно найти в работе Theis [1963]. (При достаточно больших
п многие свойства и выводы, следующие из л-элементной модели,
аналогичны получаемым на основе линейной модели.) Читатели,
интересующиеся деталями, отсылаются к работе Нормана (Norman [1972]).
5.9.4. Модель Эстеса. Существуют другие модели типа
"стимул—восприятие", применимые к более сложным экспериментам, которые, однако,
служат дальнейшим развитием опытов, обсуждавшихся нами выше. В
частности, проводя эксперименты в Г-образном коридоре или опыты с
прогнозированием зажигания электрических ламп, можно рассмотреть случаи,
когда поощрение правильной реакции R происходит не постоянно.
Например, можно поощрять ответ R лишь в определенной части опытов или в
одной части опытов поощрять ответ R, а в другой — ответ L. На практике
долю тех или иных поощрений можно определять вероятностным путем
с помощью устройства со случайным механизмом и, конечно, получаемые
вероятности, если экспериментатор желает быть уж совсем хитрым, могут
зависеть от ответов испытуемых.
Рассмотрим теперь модификацию модели "стимул — восприятие"
бинарного типа применительно к ситуации, когда имеет место вероятностный
выбор поощрения, или подкрепления. Пусть в простейшем случае ответ R
подкрепляется с вероятностью р9 а ответ L - с вероятностью 1 — р
независимо от реакции испытуемого. Так, в опытах с прогнозом зажигания
электроламп, мы проводим подкрепление, зажигая правую лампу с
вероятностью р, а левую- с вероятностью 1 - р.
В ситуациях, когда используется Г-образный коридор, подкрепление
должно производиться более хитрым способом. Мы можем, например,
оставлять пищу в одном ответвлении коридора и разрешать крысе, если
она ее не нашла в выбранной ею части коридора, немедленно переходить
в другое ответвление и получать свою порцию.
Здесь нельзя уже больше говорить о попытке "обучения" испытуемого
некоторой определенной реакции, поэтому наши исходные предположения
295
о порядке установления условных связей должны быть изменены.
Вернемся снова к ситуации с одним стимулирующим элементом s и приведем
новые модифицированные предположения о свойствах одноэлементной
модели1). Эти предположения ввел В.К. Эстес (W.K. Est'es) и именно
поэтому мы будем называть эту модель обучения моделью Эстеса.
Одноэлементная модель Эстеса. Принятые допущения
Состояние уело в н ых с в я з е й. До начала каждого опыта
существует условная связь между стимулирующим элементом s и
реакциями R или L. Предполагается, что до начала первого опыта выбор одной
из этих условных связей определяется случайным образом.
Восприятие. В каждом опыте субъект воспринимает или не
воспринимает стимулирующий элемент s. Он воспринимает его с вероятностью,
равной 0, где О<0<1 (число в есть параметр модели).
Реакции. Реакциями субъекта в каждом опыте служат ответы R или
L. Если в некотором опыте стимулирующий элемент s был воспринят и он
находился в состоянии условной связи с реакцией R, то субъект дает
ответ R. Аналогично, если при проведении опыта элемент s был воспринят,
и он находился в состоянии условной связи с реакцией L, то субъект
показывает ответ L. Если же стимулирующий элемент s не был воспринят, то
субъект дает отеет R тогда и только тогда, когда между элементом s
и реакцией R существует условная, связь. Таким образом, независимо от
того, произошло или не произошло восприятие элемента s, субъект
показывает ответ R тогда и только тогда, когда элемент s условно связан с
реакцией R.
Подкрепление. Независимо от реакции испытуемого,
экспериментатор подкрепляет ответ R с вероятностью р и ответ L с вероятностью 1 — р
(число .р есть параметр модели).
Изменение условных связей. Состояние условных связей
может измениться только в случае восприятия стимулирующего элемента.
Если между стимулирующим элементом и некоторой реакцией существует
условная связь и эта реакция подкрепляется, изменения состояния
условных связей не происходит. Если воспринятый стимулирующий элемент
условно связан с некоторой реакцией, а в опыте подкрепляется
противоположная реакция, то состояние условных связей меняется с некоторой
вероятностью с. Предполагается, что 0 < с < 1 (число с есть второй
параметр этой модели).
В отличие от модели бинарного типа в одноэлементной модели Эстеса
не происходит выбора реакции. Ответ полностью определяется состоянием
условных связей. Изменчивость в поведении субъекта вводится
неопределенностью процесса восприятия и вероятностным характером изменения
состояния условных связей. Процесс восприятия в этой модели
существенно отличается от характера восприятия в бинарной модели. Здесь
допускаются ситуации, когда ни один стимулирующий элемент не воспринимается
или (в случае наличия многих стимулирующих элементов, который будет
рассмотрен нами ниже), допускается возможность одновременного
восприятия более чем одного стимулирующего элемента. Однако для простоты
1) Следовало бы также изменить линейную модель, чтобы она отвечала новой
ситуации, но мы этого здесь не будем делать.
296
Начальное Элемент s Поднрелление Установлена Новое Вероятность
состояние воспринят? условная связь состоя -
элемента s ние
с реакцией
R 1 9р
¦L 0 9A-р)
•L 0 U-9)p
'L 0 (i-Q)U-p)
Рис. 5.28. Некоторые переходные вероятности для одноэлементной модели Эсте-
са при с - 1
предполагается, что реакция субъекта не зависит от восприятия. (В случае п
стимулирующих элементов такая зависимость существует.)
Мы можем снова исследовать эту модель, построив некоторую цепь
Маркова. Состояниями этой цепи будут 0 и 1 — число стимулирующих
элементов, условно связанных с реакцией R. Предположим также для
простоты, что с = 1. Тогда переходная матрица цепи Маркова имеет следую»
щий вид:
О 1
1 - вр вр
вA-р) 1-вA-1
Так как с = 1, то условные связи переходят из состояния 0 в состояние 1
тогда и только тогда, когда стимулирующий элемент s воспринят (что
случается с вероятностью в ) и ответ R подкреплен (что происходит с
вероятностью р). Дальнейшие рассуждения проводятся аналогичным
образом. На рис. 5.28 показана схема вычисления ряда переходных
вероятностей.
Если 0 < р < 1 и 0 .< 0 < 1, то матрица Р является переходной матрицей
регулярной цепи Маркова. Простые вычисления показывают, что ее
стационарный вероятностный вектор w имеет вид w = A -р, р). Следовательно,
при достаточно длительных опытах вероятность оказываться в состоянии 1
равна р. Отсюда вытекает, что вероятность показать ответ R равна
вероятности р подкрепления реакции R. Выводы, получаемые на основе этой
модели, состоят в следующем: в конечном счете субъект начинает давать
ответ R с той же вероятностью, с какой экспериментатор подкрепляет
реакцию R. Такое поведение испытуемого называют вероятностным
выбором1). Посмотрим, является ли такое поведение "оптимальным". Пусть,
например, р = 3/4. Тогда, если вы даете ответ R с вероятностью 3/4,
вероятность того, что он окажется верным равна 3/4 • 3/4 + 1/4 • 1/4 = 10/16 = 5/8.
Предположим теперь, что вы всегда отвечаете R. Тогда в 3/4 случаях этот
ответ оказывается верным, что является несомненно лучшим показателем.
Итак, одноэлементная модель Эстеса прогнозирует неоптимальное поведе-
1' В терминах теории игр испытуемый пользуется "смешанной стратегией".
(Примеч. ред.)
297
ние испытуемых! В тестовых экспериментах, предпринятых для проверки
этого вывода, обнаружилось, что некоторые животные используют
вероятностный выбор реакций (смешанную стратегию), другие его не применяют.
Например, крысы им не пользуются, в то время как рыбы в экспериментах
аналогичного типа применяют вероятностный выбор реакций. Люди иногда
тоже используют вероятностный тип выбора, но они поступают так менее
охотно, если предлагается денежное поощрение.
Для описания более общей модели, п-элементной модели Эстеса,
положим, что имеютсяп стимулирующих элементов sl9 s2, - . . , sn. До начала
некоторого опыта каждый из элементов Sf условно связан с одной из
реакций R или L. Подкрепление производится вероятностным образом, причем
ответ/? подкрепляется с вероятностью р, а ответ/, — с вероятностью 1 — р.
Введем теперь модифицированные правила восприятия, реакций и
изменений условных связей.
Модель Эстеса с п элементами. Дополнительные допущения.
Восприятие. В каждом опыте любой из стимулирующих элементов
воспринимается с вероятностью 0, где 0 < в < 1. Элементы воспринимаются
независимо.
Реакции. Реакциями субъекта в каждом опыте являются ответы R
или L. В каждом опыте субъект дает ответ R с вероятностью, равной доле
стимулирующих элементов, которые условно связаны с реакцией R, среди
всех воспринятых стимулирующих элементов. Так, если эта доля равна я,
то предполагается, что субъект показывает реакцию R с вероятностью п.
Если ни один из стимулов не был воспринят, то предполагается, что субъект
дает ответ R с вероятностью, равной доле стимулирующих элементов,
условно связанных с реакцией R, среди всех имеющихся стимулирующих
элементов.
Изменение состояния условных связей. Если
некоторый ответ подкрепляется в опыте с номером г, то все стимулирующие
элементы, условно связанные с данным ответом до этого опыта, остаются
условно связанными с ним и после проведения опыта. Состояния условных
связей воспринятых стимулирующих элементов, которые условно связаны
с реакциями, не получившими подкрепления в данном опыте, меняются
с вероятностью с, где 0 < с < 1; с вероятностью 1-е эти состояния не
изменяются.
Для иллюстрации процессов восприятия, реакции и изменения состояний
условных связей рассмотрим случай п = 6. Пусть до начала опыта
стимулирующие элементы sXy s2 и s3 условно связаны с реакцией L, а
стимулирующие элементы s4, ss n s6 — с реакцией R. Предположим, что в опыте
восприняты элементы Si, s2 и ss. Это происходит с вероятностью 03A - 0K.
Субъект показывает ответ R с вероятностью 1/3, ибо лишь один из трех
воспринятых элементов условно связан с R. Если реакция R
подкрепляется* то элемент s5 остается условно связанным с ответом R (то же верно
и для элементов s4 и s6 ибо они не были восприняты). Так как элемент s3
не был воспринят, он остается условно связанным с реакцией L. Наконец,
для элементов sx и s2 появляется возможность установления условной
связи с реакцией R. С вероятностью с они оба оказываются условно
связанными с R, а с вероятностью 1 - с ни для одного из них такая связь не
возникает.
298
Указанные выше предположения позволяют построить цепь Маркова с
я+ 1 состояниями, где / = 0, 1,. .., п — число стимулирующих элементов,
условно связанных с реакцией R в некоторый момент времени. В
упражнении 25 читателю предлагается провести исследование цепи Маркова для
случая 2 элементов (при условии, что с = 1) и показать, что здесь снова
можно сделать вывод о вероятностном поведении (вероятностном
характере выбора) субъекта.
Дальнейшие обобщения модели Эстеса можно получить путем введения
более утонченных предположений о порядке подкрепления. Можно,
например, сделать подкрепление зависящим от реакции. Типичные
предположения о характере подкрепления, при котором существует такая зависимость,
приведены в упражнении 23.
Читатель, интересующийся деталями математических аспектов теории
обучения может обратиться к следующей литературе, указанной в ссылках:
Atkinson, Bower, Crothers [1965], Coombs, Dawes, Tversky [1970] или
Norman [1972].
Упражнения
1. Для каждой из указанных ниже экспериментальных ситуаций установить, какая
из трех моделей (линейная, бинарная, Эстеса) кажется наиболее подходящей.
а. Обезьяну обучают различать красный и голубой цвета. Ей показывают красные
и голубые мячи и она поощряется после выбора красного. По прошествии некоторого
времени обезьяна постоянно выбирает красный мяч.
б. У голубя в клетке стоят две кормушки; корм кладется в 75% опытах в левую
кормушку независимо от того, куда впервые подошел голубь в предшествующем
опыте.
в. Ребенка просят запомнить некоторый список бессмысленных выражений. Он
поощряется при правильном повторении на память этого списка. Его достижения
постепенно возрастают, однако, если он даже несколько раз повторил правильно
список, все-же в последующем ошибки снова появляются.
2. Рассмотрим линейную модель с параметрами ot = Vznqo = 1 и одним субъектом.
Какова вероятность ошибки испытуемого в опыте номер 3 (это 4-й по счету опыт) ?
3. Пусть выбрана одноэлементная бинарная модель. Какова вероятность того, что
после опыта номер 5 между стимулирующим элементом s и реакцией R нет условной
связи?
4. Пусть в одноэлементной бинарной модели для параметра с получена оценка
с = 1/10. Выбранный субъект неоднократно полностью обучается к третьему опыту.
Согласитесь ли вы с заключением, что параметр с был оценен неверно? Почему?
5. Пусть в одноэлементной бинарной модели с = Уг и g = Уг.
а. Каково ожидаемое среднее число "ошибок" до обучения?
6. Каково ожидаемое среднее число "ошибок" после обучения?
в. Построить кривую обучения.
г. Какова вероятность ошибки после правильного ответа?
д. Каково ожидаемое среднее число "ошибок" в N опытах?
б. Какова вероятность ошибки после правильного ответа в линейной модели?
7. Пусть в двухэлементной бинарной модели до начала опыта элемент s, был
условно связан с реакцией R, а между элементом s2 и R такой связи не было.
а. Какова вероятность получения в этом опыте ответа /??
б. Какова вероятность того, что перед следующим опытом между s2 и R будет
существовать условная связь?
8. Нарисовать схему типа дерева для вычисления переходных вероятностей для
двухэлементной бинарной модели, начиная с состояния 0.
9. Пусть в двухэлементной бинарной модели начальным является состояние 1.
Каково среднее ожидаемое число опытов до обучения?
299
10. Пусть в линейной модели опыт Т - первый, в котором вероятность получения
верного ответа больше вероятности получения ошибочного. Показать, что число Т
есть наименьшее целое число, превосходящее величину
-In2-lggo
In a
11. Имеет ли для линейной модели смысл понятие стационарности? Объяснить ответ.
12. Вычислить для линейной модели вероятность г ff+1 того, что будут допущены
последовательно две ошибки в опытах t и t +1 при условии, что испытуемым была
сделана ошибка в опыте t - 1.
13. Вычислить вероятность rty r+1 (см. упражнение 12) для одноэлементной
бинарной модели.
14. Какова вероятность в одноэлементной модели Эстеса восприятия стимула s в
двух последовательных опытах?
15. В одноэлементной модели Эстеса (при с = 1) использовать схему-дерево для
вычисления вероятностей перехода из состояния 1 в состояние 0 и из состояния 0 в
состояние 1.
16. Пусть в одноэлементной модели Эстеса с Ф 1. Какова вероятность перехода
из состояния 0 в состояние 1?
17. Рассмотрим одноэлементную модель Эстеса при с Ф 1. Какова вероятность
получить ответ R в опыте t +1, если известно, что до опыта t элемент s был условно
связан с реакцией /??
18. Пусть в одноэлементной модели Эстеса с = 1. Какова вероятность для
достаточно больших t получения в некотором опыте ответа, отличного от подкрепляемого
в этом опыте?
19. Пусть имеется 4-элементная модель Эстеса.
а. Какова вероятность того, что в некотором опыте восприняты стимулы s, и s2 и
не восприняты стимулы s3 и$4?
б. Какова вероятность того, что ни один элемент не будет воспринят?
20. Пусть в 4-элементной модели Эстеса до начала f-го опыта элементы sx и s2
условно связаны с /?, а элементы s3 и s4 условно связаны с L.
а. Какова вероятность получения в r-м опыте ответа R если восприняты
элементы st ns3t
б. Чему равна эта вероятность, если восприняты элементы jj и s2?
в. Если восприняты элементы slts2 и s3 ?
г. Если ни один стимулирующий элемент не воспринят?
д. Если элементы я, и s3 восприняты в t-ом опыте и подкрепляется реакция R, то
какова вероятность того, что элементы slfs2 и s3 будут условно связаны с R после
опыта t? (Условие с = 1 не предполагается.)
е. В продолжении п. д задачи определить, какова вероятность того, что элементы
sl9 s2 и s4 будут условно связаны с R после опыта Г? (Снова не
обязательно с = 1.)
ж. При условии, что восприняты элементы st и ;3, какова вероятность того, что
элементы $,, s2 и s3 будут условно связаны с R после опыта ti (Здесь не
предполагается ни условие с = 1, ни подкрепление реакции R.)
21. а. Сформулировать предположения относительно 3-элементной бинарной
модели.
б. Используя обычное определение Состояний, построить переходную матрицу для
соответствующей цепи Маркова.
в. Каково среднее ожидаемое число шагов до обучения при с = У%1
г. Какова вероятность неправильного ответа в опыте 2 (это третий по счету опыт) ?
22. В одноэлементной модели Эстеса устраним предположение с = 1 и введем
условие в - 1. (Последнее психологически плохо обосновано.)
а. Используя обычное определение состояний, получить переходную матрицу для
цепи Маркова, соответствующую процессу обучения согласно этой модели.
б. Остается ли для данной модели в силе вывод о вероятностном поведении
обучаемого субъекта?
23*. Модифицируем модель Эстеса путем введения подкрепления, зависящего от
реакции. В частности, пусть правила подкрепления определяются следующей
300
матрицей:
R
\ ъ \-ь/
Ее нужно понимать следующим образом. После получения реакции R, она
подкрепляется с вероятностью 1 - а и с вероятностью а подкрепляется реакция L. После
получения реакции L с вероятностью Ъ подкрепляется реакция /?, ас вероятностью
1 - b - реакция L. (В рассмотренной ранее ситуации независимости реакций и
подкреплений имеет место \ -а -Ъ ~ р.)
а. Используя обычное определение состояний, показать, что приведенная ниже
матрица является переходной матрицей цепи Маркова для модифицированной
одноэлементной модели Эстеса при с =1:
О 1
0/1 -be Ьв\
1 \ ав 1 - а в )
б. Показать, что при достаточно больших t вероятность того, что экспериментатор
будет подкреплять ответ R равна bw0 + A -d)wl, где вектор (w0, w,) = w есть
стационарный вероятностный вектор переходной матрицы Г.
в. Вычислить w0 и Wj и показать, что для достаточно больших значений t
вероятность того, что субъект выдаст реакцию R, равна вероятности того, что
экспериментатор будет подкреплять реакцию /?. (Это более общий случай вероятностного
поведения испытуемого.)
24. Заменить в предыдущем упражнении предположение с = 1 на условие в = 1.
Получить переходную матрицу. Можно ли в данном случае сделать, как и в
предыдущем упражнении, вывод о вероятностном поведении обучаемого субъекта? (В смысле,
указанном в упражнении 23.)
25* а. Построить переходную матрицу Р для двухэлементной модели Эстеса с
неслучайным законом подкрепления согласно аксиомам о подкреплении, описанным
в основном тексте. Положить с = 1 (на рис. 5.29 приведены вычисления элемента
@,2) матрицы/0.
б. Следующий вектор является стационарным вероятностным вектором матрицы Р:
(d -p)e + a(i -p)*u -е) 4рA-р)A -е) ре + 2р2а-е)\
2-е ' 2-е ' 2-е /
Используя это выражение, показать, что в рамках данной модели можно сделать
вывод о вероятностном поведении обучаемого субъекта. (Указание. Для больших
Начальное Поднрепле- Элемент sf Элемент s2 Установлена Новое Вгроят-
состоя- ние боспри- бос при- условная связь состоя ность
ние нят? нят? элементов ние
s, и s2
с
соответствующими
реакциями
1
1
1
0
0
Рис. 5.29. Вычисления вероятности перехода из состояния 0 в состояние 2 для
двухэлементной модели Эстеса
301
Состояние Элемент sf Элемент s2 Реакция
воспринят ? Воспринят ?
Рис. 5.30. Часть дерева для определения вероятности ответа R в двухэлементной
модели Эстеса при больших значениях t
значений t вероятность получения ответа R можно вычислить, используя схему,
аналогичную показанной на рис. 5.30.)
26 V) а. Построить переходную матрицу Р для двухэлементной модели Эстеса с
неслучайным законом подкрепления в предположении, что вероятность с более не
равна 1, но вероятность 0 = 1.
б. Показать, что из этой модели снова следует вывод о вероятностном поведении
обучаемого субъекта.
27. Какие основные упрощающие предположения используются во всех описанных
нами моделях обучения?
Как можно избежать этих упрощений, построив более абстрактную модель?
§ 5.10. Влияние и власть в социальных группах
В этом параграфе мы применим теорию цепей Маркова к построению
математической модели влияния в социальной группе. Модель, которую мы
сейчас опишем и основные результаты принадлежат Френчу (French, [1956])
и Харари (Нагагу [1959]). Исследование этой модели послужит
иллюстрацией описанного в § 53 метода анализа общей цепи Маркова, когда сначала
рассматривается поглощающая, а затем эргодическая марковские цепи.
Пусть группа, состоящая из п членов и и и2,... ,ит должна принять
некоторое решение, например, выделить определенную сумму денег на
рассматриваемый проект. В начальный момент времени t = 0 у всех членов
группы имеются определенные мнения и предполагается, что мнение члена
группы щ выражается некоторым действительным числом at. Каждый
член группы обладает определенным влиянием на других ее членов. Пусть
для любых i и / неотрицательное число Qfy обозначает влияние лица щ
на лицо uj. В дальнейшем будем предполагать, что для любого / выполнено
соотношение
? а>, = 1. C1)
(Это достигается путем деления каждого а^ на число S о^.)
i = 1
Условие C1) позволяет интерпретировать величину а,у как
относительное влияние щ на Uj. Под термином "относительное" здесь понимается
степень влияния щ на м;, сравниваемая с влиянием на щ остальных
') Читателю следует вернуться к выполнению этого упражнения после чтения
§ 5.10.
302
членов группы. Ситуацию взаимных влияний в группе можно почти
очевидным путем представить в виде взвешенного ориентированного графа D.
Вершинами орграфаDявляются члены группы мьм2 "и; если cty Ф О,
проводим дугу из щ в Uj. Дуге (и,-, и/), если она существует, приписывается
вес а,у. Полученный таким образом ориентированный граф D мы будем
в дальнейшем называть орграфом {графом) влияний в группе.
Относительно построенной нами модели сделаем еще несколько дополнительных
предположений. Во-первых, мы будем считать, что орграф влияний D в
процессе принятия решений не изменяется и, следовательно, наша модель
статична. Во-вторых, предполагается, что высказываются точки зрения и
принимаются решения лишь в дискретные моменты времени / = 1,2,3,...
Мнение члена группы и}- в момент времени t выражается величиной яДО-
Наконец, сделаем следующее предположение относительно того, как
давление или влияние формируют мнения. В момент времени t + 1 точка зрения
cij(t + 1) члена группы и/ есть взвешенная сумма мнений #/@ в момент
времени t всех членов группы м,-, непосредственно влияющих на М/, в
частности
C2)
Нас интересует, существует ли для некоторого избранного члена групп
устойчивое финальное мнение, т.е. сходится ли последовательность мнений
at{t) к пределу при г->°°и, кроме того, одинаковы ли финальные мнения
у всех членов группы. Такое финальное мнение, если оно существует, мы
будем называть финальным общим мнением группы или групповым
решением, (Модель не исключает, что достижение устойчивого финального
мнения потребует бесконечного времени при стремлении at{t) к
предельному состоянию. Заметим, что во всех реальных случаях мнения, если они
становились практически устойчивыми, достигали этого состояния на
определенном расстоянии от теоретического предела.)
Используя теорию цепей Маркова, можно показать, что при некоторых
предположениях относительно структуры графа влияний группа достигает
финального общего мнения. Кроме того, мы можем в некотором смысле
измерить относительное влияние каждого члена группы, определяемое
его вкладом в достижение финального решения. Самое удивительное здесь,
? * 1 i
Рис. 5.31. Орграф влияния D и
обращенный орграф С (D)
7 Т
D С(В)
как и при изучении потоковых моделей, состоит в том, что в задачах, по
своей природе совсем не являющимися вероятностными, методы теории
цепей Маркова оказываются весьма эффективными.
Определим сначала понятие обращения для взвешенного орграфа D.
Взвешенный орграф C{D) называется обращением орграфа ?>, если он
303
содержит дугу (w/, uf) с весом pijf равным Ц(9. тогда и только тогда, когда
орграф D содержит дугу (и/, щ) с весом с*/,-. Таким образом, при обращении
орграфа направления всех дуг (исключая входящих в петли) меняются на
противоположные. На рис. 5.31 показан орграф влияний D и его
обращение C(D).
Если орграф D есть орграф влияний некоторой группы, то, учитывая
условие C1), его обращение C(D) есть стохастический орграф.
Следовательно, можно рассматривать C(D) в качестве переходного орграфа
марковской цепи.
В дальнейшем будем также предполагать, что некоторые ан отличны
от нуля. Это предположение, введенное Френчем и Харари, достаточно
разумно и просто означает, что некоторые лица могут влиять сами на
себя. (Представляется естественным предположить, что каждое лицо может
как-то на себя повлиять.)
Теоремы теории цепей Маркова теперь нетрудно переформулировать
как теоремы, описывающие влияние в группе. Пусть
А(Г) =
есть вектор мнений группы в момент времени t. Пусть матрица Р является
матрицей весов рц. Тогда условие C2) утверждает, что
Следовательно, мы имеем следующее уравнение1):
C3)
Теорема 5Л7. Если орграф влияний D сильно связный и содержит по
крайней мере одну петлю, то члены группы достигают финального общего
мнения, т.е. групповое решение существует. Это решение 2 w{a{@) есть
средне взвешенное значение начальных мнений членов группы, где весами
служат компоненты вероятностного вектора w,соответствующего
стационарной точке матрицы цепи Маркова, описывающей обращенный орграф C(D).
Доказательство. Нетрудно показать, что, если граф D сильно
связен, то сильно связен и граф C(D). Тогда C(D) определяет эргодичес-
кую цепь и, так как по-крайней мере некоторые рц отличны от нуля, из
следствия 2 теоремы 5.12 следует, что эта цепь регулярна. Следовательно,
Р* в пределе стремится к матрице W, все строки которой представляют
собой один и тот же вектор (wi, w2, ..., vvw). Из условия C3) следует,
О Читателю следует сравнить данное уравнение с уравнением Р (Г) =/40) А* для
импульсных процессов на взвешенных орграфах (см. гл. 4). Он может заметить, что
рассматриваемая модель снова является моделью импульсного процесса с тем
отличием, что описывающая его матрица стохастическая.
304
что для каждого у
п
2 W/а/@). C4)
Таким образом, каждое мнение at(t) стремится к одному и тому же
финальному мнению. ¦
Следствие. Бели орграф влияний сильно связен и содержит по крайней
мере одну петлю, то арифметическое среднее начальных мнений достигается
группой в качестве финального общего мнения (группового решения)
тогда и только тогда, когда матрица (а/у) стохастическая.
Доказательство. Матрица называется дважды стохастической
тогда и только тогда, когда все ее элементы неотрицательны и суммы
элементов каждой строки и каждого столба равны 1. Таким образом,
стохасхичность матрицы (а/у) есть необходимое и достаточное условие
того, что матрица Р = (р/у ) дважды стохастическая. Наконец, легко
показать, что стационарный вектор (щ, w2, ..., wn) представляет собой
/ / f f
х
/1
0
1
[0
\
0
1
0
2
3
0
0
0
1
3
0
0
0
0
i 1
w/l 0 \
At!)
Рис. 5.32. Орграф влияний D, обращенный орграф C(D), преобразованная
поглощающая цепь, полученная из C(D) (а) и вычисление матрицы В -NR для поглощающей
цепи (б)
20. Ф.С. Роберте
305
вектор (l//i, 1/и,,.., 1/w) тогда и только тогда, когда матрице Р -
дважды стохастическая матрица. Доказательство оставляется читателю в
качестве упражнения (упражнение 15 § 5.5). ¦
В качестве примера заметим, что, если D есть орграф влияний из рис. 5.31
и U\ = w, и2 =t>, то вероятностный вектор, соответствующий стационарной
точке, имеет вид w= C/5, 2/5). Если лицо и имеет начальное мнение
аи@) = 5 и лицо v имеет начальное мнение av@) = 10, то групповым
решением будет мнение Wiau@) + w2av@) = 3/5 • 5 + 2/5 • 10 = 7.
Воспомним (гл. 2), что вершинной базой орграфа является минимальное
множество вершин, из которого достижима любая другая вершина графа.
Согласно теоремам 2.7 и 2.8, если D - орграф, то его конденсация D*
содержит единственную вершинную базу, состоящую из всех сильных
компонент и не имеющую входящих дуг. Следуя Харари (Нагагу [1959]),
будем Называть подгруппу из группы лиц {ui, и2, ..., ип } сильной
подгруппой, если она образует сильную компоненту в орграфе влияний D и
эта компонента является вершинной базой D*. Сильная подгруппа в
точности совпадает с эргодическим множеством цепи Маркова, определяемой
орграфом С(Р). В орграфе влияний, представленном на рис. 5.32,
сильными подгруппами являются множества {u,v) n{y9z). Члены сильной
подгруппы всегда могут влиять друг на друга, быть может, и не прямо. Более
того, сильные подгруппы, объединившись, могут оказывать влияние, пусть
даже не прямое, на любого члена группы. Покажем сейчас, что если по
крайней мере одно лицо в каждой из сильных подгрупп влияет само на
себя, то их члены внутри своих подгрупп достигают общего мнения, а
любой член остальной части группы, подверженный влиянию: сильных
подгрупп, достигает устойчивого мнения, зависящего лишь от начальных
мнений членов сильных подгрупп. Таким образом, сильные подгруппы
не только сами достигают согласия внутри себя, но и подавляют своим
влиянием остальных членов группы.
Рассмотрим список сильных подгрупп: 5Ь S2, ..., Sr. Проведем
нумерацию вершин таким образом, чтобы сначала шли вершины, входящие
в подгруппу 5Ь затем вершины из 52, и так далее до подгруппы Sr, a
неустойчивые вершины (в эргодических множествах их нет) были
поставлены после них. Для определенности
51 ={un,ui2,...tuini)9
52 }
Пусть Т — множество неустойчивых вершин; положим Т = { иг+ \, мг+ г> 2,,.
..., иг+1уПг+). Таким образом, множество состояний цепи описывается
соотношением
{uif: /=l,2,...,r + l, /=1,2,. ..,*/}.
306
Выпишем переходную матрицу для C(D) в следующей канонической
форме:
R
Для орграфа влияний D (см. рис. 5.32) имеем
В этом случае матрица Р имеет вид
и
V
У
Z
W
х
и
J4
0
0
0
0
V
%
54
У
0
0
0.
0
Vi
Vl
1 0
0
2/3
z
0
0
V4
14
0
0
w
0
0
0
0
0
1/3
X
0
0
0
0
0
o/
Если вся совокупность вершин образует эргодическое множество, то
возникает ситуация, хорошо изученная нами выше. Предположим теперь,
что множество вершин не является эргодическим множеством. Мы можем
построить поглощающую цепь Маркова, преобразуя каждое эргодическое
множество в одно состояние. Из теоремы 5.4 известно, что, в каком бы
неустойчивом (переходном) состоянии ни находилась цепь Маркова в
начальный момент, она в конце концов перейдет в эргодическое состояние.
Таким образом, в наших целях мы можем использовать преобразованную
поглощающую цепь Маркова вместо первоначально заданной. (Такая
процедура использовалась при классификации цепей Маркова в §5.3.)
В примере, приведенном на рис. 5.32, показана преобразованная
поглощающая цепь Маркова.
Если первоначально цепь Маркова находится в некотором неустойчивом
состоянии иг+1,/> то вероятность ее перехода в эргодическое множество
состояний Sf равна некоторому числу Ъц. (Числа Ъц можно определить,
используя метод, описанный в теореме 5.7. Проведем эти вычисления на
примере цепи, показанной на рис. 5.32.) При этом, если цепь перешла в
эргодическое множество состояний Su она его уже никогда не покинет.
Поэтому мы можем рассматривать цепь вне этого эргодического
множества как самостоятельную цепь Маркова. В частности, если орграф
C(D) получен из орграфа влияний, у которого в каждом эргодическом
множестве 5/ имеются вершины с петлями, то всякое такое эргодическое
множество состояний определяет регулярную цепь Маркова. Тогда, как
20*
307
известно, при достаточно длительном течении процесса вероятность
оказаться в заданном состоянии щ* эргодического множества 5/ становится
независимой от начального состояния (т.е. состояния, при котором цепь
перевила в эргодическое множество S/) и, более того, эта вероятность
стремится к пределу, равному wjfK Таким образом, совокупность
предельных вероятностей определяется вектором w^ = (w^ ,* w$*\ ...
..., wjf)) — стационарным вектором матрицы Pt цепи Маркова,
соответствующей множеству 5/. В нашем примере эти векторы равны w*'' =
= A/2, 1/2) и W*2* = C/5, 2/5). В конечном итоге, проведенные
рассуждения показывают, что если исходная цепь Маркова в начальный момент
находилась в некотором переходном состоянии wr+i,/> то вероятность
того, что после достаточно продолжительного времени она окажется в
состоянии Щк эргодического множества Siy равна byw^.
Соответствующая вероятность перехода в неэргодическое состояние равна нулю.
Если W^ — матрица, содержащая щ строк w^^, то можно показать,
что матрица Р* в пределе при t ->°° стремится к матрице W следующего
вида:
В нашем примере
= 1A/2,1/2) = A/2,1/2), *12w<2> = 0B/5,2/3) =@,0),
A/3) A/2, 1/2) =A/6,1/6), *22w<2> = B/3)C/5,2/5) =
= B/5,4/15).
Таким образом, матрица W имеет следующий вид:
л
Л
и
1/2
J/2
0
0
1/2
1/6
V
1/2
1/2
0
0
1/2
1/6
У
0
0
3/5
3/5
2/5
z
0
0
2/5
2/5,
~б]
4/15|
w
0
0
0
0
0
0
X
0
0
0
0
0
0
Напомним, что A(r) =/>fA@) и, следовательно, матрица А(г) в
пределе стремится к матрице И>А@). Пусть <ty(r) есть "мнение" вершины
3108
иц в момент t. Если вершина иц входит в множество St, то предельное
значение пц (г) имеет вид
0@
?
C5)
Таким образом, окончательное мнение члена группы м# зависит лишь
от начальных мнений других членов сильной подгруппы, куда он входит.
Это мнение одинаково для любого члена / из данной сильной подгруппы,
и поэтому мы можем считать, что оно выражает общее финальное мнение
всех ее членов и использовать для его обозначения символ о (/).
Если член группы «r+i,/ входит в Г, то его окончательное мнение
описывается выражением
C6)
Оно зависит от начальных мнений всех членов всех сильных подгрупп,
но не зависит от мнений лиц, не входящих в сильные подгруппы. Как видно
из C6), это мнение представляет собой взвешенное среднее финальных
общих мнений различных сильных подгрупп. Таким образом, в любом
случае каждый член группы достигает финального устойчивого мнения
Пусть, в рассматриваемом нами примере, начальные мнения членов
группы определяются вектором
2
10
10
100
6
Ю /
Тогда
у 10 = 38/5.
Таким образом, и и v стремятся к финальному мнению, равному 6,
а у и z к финальному мнению, равному 38/5, Финальное мнение для w
стремится к величине
а финальное мнение х к значению 106/15:
Следовательно, каждый член подгруппы достигает финального мнения,
но эти мнения неодинаковые для всех ее членов.
Если существует лишь одна сильная подгруппа, то г = 1, Ъц = 1 для всех /
и в правой части уравнения C6) имеем о (/) = о A). В этом случае финаль-
309
ные общие мнения всех членов группы одинаковы и определяются
уравнением C5). Входящие в него числа wff) можно интерпретировать как
степени влияния (силы, власти) эргодических членов uik = uki. Они
представляют собой относительные веса, с которыми их начальные мнения
входят в выражение для вычисления финального группового мнения.
Степень влияния неэргодических (неустойчивых) членов группы равна 0.
Бели существуют несколько сильных подгрупп, то каждая сильная
подгруппа Sf достигает финального общего мнения о (/). В случае, когда
финальные общие мнения всех сильных подгрупп совпадают, уравнение
C5) определяет одно и то же его значение для всех г = 1, 2, ... ,г. Каждый
член группы отвечающей в C(D) эргодическому состоянию, достигает этого
финального мнения. И из условия C6) следует, что любой член группы,
отвечающий неустойчивому состоянию, также достигает этого финального
мнения о. В самом деле,
г г г
2 bjio(i)= 2 Ьио-оЪ Ъц-о.
i=i i = i i=i
Таким образом, в этом случае снова вся власть в руках эргодических
членов группы.
Если в рассмотренном выше примере положить ау@) равным 10 и
az @) равным 0, то о B) примет значение 6, что совпадает с значением
оA). Отсюда следует, что все члены группы достигают финального общего
мнения, равного 6.
В результате проведенных рассуждений нами доказана следующая
теорема.
Теорема 5.18. Пусть имеется группа, члены которой подвергаются
взаимному влиянию, и в каждой сильной подгруппе этой группы, по крайней
мере, один член влияет сам на себя. Тогда справедливы следующие
положения.
а. Каждый член группы приходит к устойчивому финальному мнению,
зависящему лишь от начальных мнений членов сильных подгрупп.
б. Если имеется лишь одна сильная подгруппа, то вся группа приходит к
финальному общему мнению, которое является финальным общим
мнением сильной подгруппы и зависит лишь от начальных мнений ее членов.
в. Если имеются несколько сильных подгрупп, то каждая сильная
подгруппа приходит к финальному общему мнению, но вся группа приходит к
финальному общему мнению тогда и только тогда, когда финальные общие
мнения всех сильных подгрупп совпадают. При этом финальное общее
мнение группы, если оно достигнуто, зависит лишь от начальных мнений
членов сильных подгрупп.
Упражнения
1. Пусть рассматриваются взаимоотношения в группе, состоящей из четырех
человек. Предполагается, что каждый член группы подвергается в одинаковой степени
влиянию точек зрения, остальных участников группы, в том числе своей собственной.
Нарисовать для этой группы орграф влияний D и соответствующий ему орграф C(D),
2. Для каждого из орграфов влияний D (рис. 5,33) выполнить следующие задания,
а. Нарисовать С(?>).
310
3\1
в з
Рис. 5.33. Орграфы влияний к упражнению 2 § 5.10. Начальные мнения: a)aw@)= 10,
av @) = 20; б) аиф) = 20, av @) = 30, aw@) = 40; в) *м@) = 10,^ @) = 20,aw = 30
Рис. 5.34. Орграфы влияний к упражнениям 4 и 5 § 5.10. Начальные мнения: а)
МО) = 1, МО) = 2, *w@) = 3, <z*@) = 4; б) *м@) = l,/zv@) = 2,^w@) = 3; в)
МО) = 1, av @) = 2, Лн; @) = 3, **@) = 4, ау @) = 4, az @) = 4
Начальные
f мнения
10
3
x
ау@) = /
1 Начальные
у мнения
ах@) = '
Рис. 5.35. Орграфы влияний к упражнению 6, § 5.10
б. Определить, достигают ли соответствующим им группы финального общего
мнения.
в. Вычислить эти общие мнения, если они существуют.
3. Рассмотреть группу из упражнения 1.
а. Достигает ли эта группа финального общего мнения?
б. Если достигает, то каково оно?
4. Для орграфа влияний, показанного на рис. 5.34, найти все сильные подгруппы.
5. Для орграфа влияний, показанного на рис. 5.34, определить, достигает ли
соответствующая ему группа финального общего мнения. Если да, то каково это мнение?
В ситуации, когда имеется лишь одна сильная подгруппа, какова степень влияния
каждого члена группы?
6. Для каждого из орграфов влияний, приведенных на рис. 5.35, выполнить
следующие задания.
а. Найти все сильные подгруппы.
б. Выписать переходную матрицу Р в указанной в этом параграфе канонической
форме.
в. Найти соответствующую ему укороченную поглощающую цепь.
г. Вычислить для этой поглощающей цепи матрицу В.
д. Вычислить для всех сильных подгрупп векторы w'''.
е. Вычислить предельную матрицу W,
ж. Вычислить для всех сильных подгрупп величины o(i).
з. Для всех членов группы, не входящих в сильные подгруппы, определите
финальные мнения.
и. Если группа не достигает финального общего мнения, определить различные
возможные подмножества начальных мнений, которые ведут к одному общему мнению.
7. Рассмотрим высший уровень управления некоторой компанией. Известно, что
на мнение ее президента в равной степени влияют мнения его двух первых
вице-президентов и его собственное. Один из первых вице-президентов (вице-президент 1)
формирует свое мнение лишь на основе мнения президента. Другой первый
вице-президент (вице-президент 2) придает одинаковый вес своему собственному мнению и мне-
Рис. 5.36. Орграф влияний
ниям двух вторых вице-президентов. Наконец, оба вторых вице-президента находятся
под влиянием лишь своих собственных мнений.
а. Кто пользуется реальной властью в этой группе, т.е. кто в действительности
влияет на групповое финальное мнение?
б. Придет ли группа к финальному общему мнению при указанных ниже начальных
мнениях ее членов? Если придет, то каково оно?
Начальные мнения:
президент = 10,
первый вице-президент 1 = 20,
первый вице-президент 2 = 30,
второй вице-президент 1 = 100,
второй вице-президент 2 = 100.
в. Что произойдет, если второй вице-президент изменит свое мнение на 200?
8. Рассмотреть орграф влияний, показанный на рис. 5.36. Что произойдет с
мнениями в этой группе?
9. Пусть из вершины и некоторого орграфа D достижимы все вершины D (т.е.
существуют пути из и ко всем вершинам D), но не существует ни одной другой
вершины обладающей таким свойством. Доказать, что группа придет к конечному
общему мнению, совпадающую с начальным мнением члена группы и. (Почему нет
необходимости вводить явно предположение о существовании дуги из и в и?)
10*. а. Доказать, что любая группа, для которой орграф влияний является
односторонне связным, приходит к финальному общему мнению, если по крайней мере один
член в каждой из сильных подгрупп влияет сам на себя.
312
Капита
Лейтенант
Рис. 5.37. Сеть коммуникаций
Полицейский
на посту 1
Полицейский
посту 2
I
2
Полицейст
на посту
j Представитель
j_ печати
Лейтенант сержант
полицейский
на посту 1
Полицейский на
посту 2
Рис. 5.38. Сети коммуникаций к упражнению 13 § 5.10
б. Показать, что этот результат неверен, если не вводить предположения о наличии
в каждой из сильных подгрупп членов, влияющих сами на себя.
11. Рассмотрим коммуникационную сеть, показанную на рис. 5.37. Сообщения
передаются от одного лица к другому. Получив сообщение, человек может в
следующий период времени передать его одному из возможных получателей или сохранить
его у себя. Предполагается, что выбор адресата происходит случайным образом,
причем отправитель рассматривает себя наравне с другими возможными
получателями. Бели сообщение задержано, то на следующем шаге снова принимается решение -
передать его кому-либо дальше или снова хранить сообщение у себя. Используя
методы этого параграфа, дать ответ на следующие вопросы
а. Какова вероятность получения капитаном сообщения, исходящего от
полицейского на посту 1?
б. Какова вероятность при длительном наблюдении, что капитан только что
получил сообщение при условии, что в начальный момент времени оно исходило от
постового полицейского 1?
в. Если рассматривать рис. 5.37 не в качестве сети коммуникаций, а считать его
обращением некоторого орграфа влияний, то что представляют собой сильные
подгруппы? Что определяет, приходит ли группа к финальному общему мнению? Если
оно достигается, каковы степени влияния различных членов группы?
313
12. Дать ответ на вопросы а и б упражнения 11 для сети коммуникаций,
изображенной на рис. 5.38.
13. Какие следствия из утверждений теорем 5.17 и 5.18 можно вывести
относительно автономных импульсных процессов, определенных взвешенным орграфом Z)?
Можно ли при некоторых условиях предположить устойчивость импульсного
процесса?
14. Верны ли утверждения, обсуждавшиеся в упражнении 13, для всех. взвешенных
орграфов? (Привести примеры.)
15. Каковы основные упрощающие предположения сделаны при формулировке
моделей влияния? Каким образом их можно модифицировать?
§ 5.11. Диффузия и броуновское движение 1)
Большинство математических моделей движения воздушных потоков и
распространения загрязнений в воздухе рассматривает эти явления как
процессы диффузии. Часто такие модели формулируют в рамках теории
бесконечных марковских процессов с непрерывным временем. Однако
диффузионные модели, описанные при помощи конечных цепей Маркова,
по идее проще, а получаемые на их основе выводы часто хорошо
согласуются с результатами, которые следуют из их бесконечных, непрерывных
временных аналогов (см. Feller [1962, гл. XIV. 6], где обсуждается эта
проблема).
Одна из простейших математических моделей процесса диффузии
принадлежит П. и Т.Эренфестам (P. and T.Eherenfest [1907]). (Эта модель
применима к различным диффузионным процессам, включая движение
частиц, распределенных в жидкости, происходящее под влиянием
последовательных быстрых взаимных столкновений. Движение таких частиц
называется броуновским движением.) Представим себе, что имеется* а
молекул некоторого вещества ("загрязнителя''), распределенных в двух
областях А и В, разделенных тонкой проницаемой перегородкой. В
каждый момент времени случайным образом выбранная в одной области
молекула переходит в соседнюю область. Построим цепь Маркова,
описывающую эту систему. Состояние цепи определим как число молекул
вещества в области А. Таким образом, имеются а + 1 состояния:
О, 1, 2, ..,, а. Для нахождения переходных вероятностей предположим, что
система находится в состоянии /. Если / ^ 0 и / Фа, то в области А
выбирается молекула с вероятностью i/a, а в области В — с вероятностью
1 - (i/а). В первом случае система перейдет в состояние i - 1, во
втором — в состояние / + 1. Следовательно,
Pi, /-1 = */*. Pi, /+1 = l ~11а> Pi, k = 0 для k Ф i-1, i+1. C7)
Если i = 0, мы можем лишь перейти в состояние 1 и -сделать это с
вероятностью 1. Аналогично, если / = а мы можем лишь с вероятностью 1
перейти в состояние а — 1. Таким образом, легко проверить, что
условия C7) выполнены для всех /. Ясно, что цепь Маркова, определенная
*) Материал данного параграфа базируется на следующих работах: Feller [19621,
Kemeny, Snell [I960], Kemeny, Mirkil, Snell, Thompson [19541, см. также Кае [1947].
Этот параграф следует пропустить, если не был прочитан п. 5.6.2.
314
матрицей переходов Р = (Р/;), эргодическая. Кроме того, легко видеть,
что она периодическая с периодом 2.
Аналогичная переходная матрица возникает при случайном блуждании
по прямой между точками 0,1, 2,..., а, когда состояния 0 и а служат
отражающими барьерами. В каждый момент времени частица находится в
некоторой точке / отрезка @, а) прямой. Бели г не равно 0 или а, то частица
движется на одну единицу влево с вероятностью if а и на единицу вправо
с вероятностью 1 - (i/a). Граничные точки 0 и а "отражают" частицу
обратно внутрь отрезка. (Этот тип случайного блуждания следует отличать
от случайного блуждания с поглощениями, рассмотренного нами в связи
с задачей о разорении игрока, когда граничные точки поглощают любую
попавшую к ним "частицу". Его также следует отличать от случайного
блуждания с отражениями, когда вероятности перехода частиц влево и
вправо из точки / не зависят от /.В упражнении 6 § 5.6 рассмотрен
подобный тип случайного блуждания.)
При изучении процессов диффузии, описываемых переходной
матрицей C7), важно определить распределение молекул между двумя
областями после относительно длительного протекания процесса. Это
распределение можно получить, определив стационарный вероятностный вектор w
/а \
переходной матрицы Р. Легко показать, что если j J - биномиальные
коэффициенты, т.е.
то вектор w = (и>0, wlt ..., wa) является стационарным вероятностным
вектором матрицы Р и, более того, согласно теореме 5.14, п. г он
единственный. Число W/ равно вероятности попадания i молекул в область А,
если для каждой молекулы область выбирается независимо. При
длительном течении процесса вероятность системы оказаться в состоянии, близком
к "центру" а 12 (или а ± 1/2, если а нечетно), оказывается большой по
сравнению с другими состояниями, а вероятности находиться в состоянии,
близком к граничным точкам 0 или а малы, что справедливо независимо
от начального состояния. Можно в этом смысле утверждать, что модель
Эренфеста выражает некоторую "центральную тенденцию".
Представляет интерес вычисление среднего числа шагов ец требуемого
для перехода из состояния i в состояние /. Если i = /, то по
теореме 5.14, п. з и утверждению, аналогичному следствию из теоремы 5.11,
следует, что
ец =
1
Таким образом, среднее значение ец мало, если точка / близка к
центру ajl или {а ± 1/2) и велико, если г находится вблизи границ. Анало-
315
гично, используя теорему 5.14, п.з, легко установить, что вц
относительно мало, если точка / находится близко от центра, и велико, если она
расположена вблизи границы. В частности, величина ео,*/2 весьма мала,
тогда как еа/2,о достаточно велика. Напомним читателю, что а\2
представляет ситуацию, когда молекулы распределены по областям равномерно,
а 0 означает, что все молекулы находятся в области В. Согласно
полученным нами результатам первое из состояний я/2 есть в некотором роде
точка равновесия, и если даже процесс начинается относительно близко от
нее, то среднее число шагов, требуемых для возврата к состоянию
равновесия, мало. И обратно, если процесс начинается в состоянии, когда молекулы
распределены равномерно по областям, то среднее число шагов,
необходимое для перехода в состояние с существенным различным количеством
молекул в областях А и В, весьма велико. Физически это означает, что
распределение молекул стремится к ситуации равенства по областям, даже
если в начале все молекулы были сосредоточены в одной области.
Интересно также рассмотреть поведение чисел е0 а,2 и еа,2 0, когда а
становится достаточно большим.
Подробное обсуждение этих вопросов читатель может найти в работе
Kemeny,Snell [1966, с. 173].
Упражнения
1. Показать, что модель Эренфеста превращается в эргодическую цепь Маркова,
являющейся периодической с периодом 2.
2. Для модели Эренфеста при а - 2 выполнить следующие задания.
а. Выписать матрицу Р.
б. Вычислить вектор w.
в. Вычислить ? -матрицу средних времен первых возвращений.
г. Показать, что полученные результаты находятся в согласии с проведенными
в тексте рассуждениями.
3. Для модели Эренфеста при а = 3 выполнить следующие задания.
а. Выписать матрицу/*.
б. Вычислить вектор w, используя приведенные в тексте формулы.
в. Проверить, что wP = w.
г. Вычислить ец - среднее время первого возвращения для всех * и обсудить
результаты.
4. Для модели Эренфеста при а = 7 выполнить следующие задания.
а. Вычислить w, используя приведенные в тексте формулы.
б. Вычислить* ?# для всех i и обсудить результаты.
5. Один из способов вычисления среднего времени первого возвращения в
состояние 1 состоит в превращении / в некоторое поглощающее состояние и вычислении
среднего числа шагов до поглощения. Например, для вычисления среднего времени
первого возвращения системы в состояние 0 в модели Эренфеста прид = 2 рассмотрим
цепь Маркова с переходной матрицей
Использовать этот метод для проверки вычислений в упражнении 2 пункт в
средних времен возвращения из состояний 1 и 2 в состояние 0.
6. Использовать метод, предложенный в упражнении 5, для вычисления в модели
Эренфеста при а - 3,следующих средних времен возвращения.
а. Из состояний 1, 2 и 3 в состояние 0.
б. Из состояний 0, 1 и 3 в состояние 2.
316
Глава 6
ИГРЫ п ЛИЦ
§6.1. Игры в форме характеристической функции
В этой главе мы рассмотрим ситуацию "игры", в которой п "игроков"
пытаются достичь соглашения о возможных исходах. Подобная ситуация
может возникнуть на рынке, в законодательных органах, при проведении
международных переговоров и тд. "Решение" в такой игре либо указывает
тот исход из множества возможных исходов, который будет реализован,
либо, в более слабом смысле, прогнозирует появление некоторого исхода.
Нами будут использоваться в настоящей главе различные понятия решений
игры.
Каждая игра, которая будет исследоваться, имеет конечное множество
/= {1, 2,..., п)игроков. Подмножество S в / называется (возможной)
коалицией» Мы позволяем игрокам сотрудничать и образовывать коалиции,
если им это выгодно. Определим цену v{S) коалиции S, как наибольший
доход, который она может себе гарантировать. Цена и является функцией,
сопоставляющей некоторое действительное число каждому подмножеству S
множества / . Будем считать, что v полностью задает игру, и иметь дело
лишь с играми, в которых эта функция v удовлетворяет следующему
условию:
<Ч0) = О, A)
v(SUT)>v(S)+v(T), если 5пГ = 0. B)
Условие A) принято для удобства. Условие B), назьюаемое супераддитив-
ностью, означает, что создание коалиции, вообще говоря, выгодно. Две
непересекающиеся группы работают совместно по крайней мере так же
успешно, как и две группы, работающие раздельно, и затем складывающие
свои "выигрыши". Функция и, определенная на подмножествах в / и
удовлетворяющая соотношениям A) и B), называется
характеристической; будем говорить, что она определяет игру в форме характеристической
Функции. (Иногда мы даже будем называть v игрой.)
Изложение начнется с вычисления характеристических функций для
нескольких игр, которые будут рассматриваться на протяжении всей этой
главы1).
*) Первые два примера принадлежат Л. Шепли и М. Шубику (не опубликованы),
а третий является вариантом игры (пример За далее), которая исследовалась в книге
фон Неймана и Моргенштерна (von Neumann, Morgenstern [1944]). Автор признателен
доктору Шепли, познакомившему его с этими играми.
317
Пример \."Чистые торги".Частная организация выделяет п штатам
сумму в d долларов на развитие системы очистки воды на льготных
условиях, если штаты договорятся между собой о распределении денег. Когда
соглашение не достигается, то деньги не предоставляются. В этой игре
коалиция /{= 1, 2,..., п) из всех п игроков сможет гарантировать себе d
долларов. Любая другая коалиция игроков S не сможет гарантировать
себе ничего, поскольку игроки вне коалиции могут не согласиться с планом
распределения денег, предложенном коалицией. Итак,
0, если |5
Ц
где 15 | обозначает число игроков в S. Читателю следует проверить в этом и
последующих примерах, что v действительно служит характеристической
функцией, т.е. удовлетворяет условиям A) и B). При анализе такой игры
мы хотим выяснить, достигнут ли штаты соглашения.
Пример 2. "Угроза". Каждый из п игроков обладает средствами
уничтожить состояние любого другого игрока. Если w,- — состояние /-го
игрока, то
»<*)-¦ -- ¦ npHl5Kw'
при S = I.
Только самая крупная коалиция / может прийти к соглашению ничего не
уничтожать, тогда как любая коалиция меньших размеров полностью
уязвима для внешних игроков. (Заметим, что v(S) определяет изменение
состояния, возникающее в игре; чтобы получить то состояние, которым обладает
после игры коалиция 5, необходимо к его первоначальной величине
добавить приращение и(?).) При анализе этой игры мы хотим определить, будет
ли достигнуто соглашение или произойдет конфронтация.
Пример 3."Землепользование".Данная полоса земли оценивается
настоящим ее владельцем, игроком, использующим ее в
сельскохозяйственных целях, в 100 000 долларов. Один из ее возможных будущих
владельцев, игрок 2, планирующий ее промышленное использование, считает, что
земля стоит 200 000 долларов, а возможный владелец, игрок 3,
собирающийся продавать ее затем по частям, оценивает ее стоимость в 300 000
долларов. Других ожидаемых покупателей нет. Характеристическая функция
задается следующим образом:
и({1})= 100 000, и({2}) = 0, »({3}) = 0,
у({1,2}) = 200000, и( {1,3}) = 300 000, и({2,3}) = 0,
v( {1,2,3}) = 300 000,
Например, v ( {1, 2}) = 200000,, поскольку эта коалиция могла бы
использовать землю для размещения завода, v[{29 3}] = 0, потому что
промышленник вместе с возможным будущим ее продавцом по частям не
могут использовать землю без согласия нынешнего владельца и т.д. Этот
пример обобщается для любого простого рынка с одним продавцом и
двумя покупателями (см. следующий пример). Нам хотелось бы
выяснить - состоится ли продажа и, если — да, то кому и по какой цене.
318
Пример За. "Рынокс двумя покупателями". Игрок 1 обладает
некоторым предметом. Он оценивает его стоимость в а единиц. Игрок 2
предполагает, что предмет стоит Ь единиц, и игрок 3 оценивает его с единицами. Если
допустить, что а < Ъ < с, то характеристическая функция имеет вид
и( {1,2,3}) = с.
П р и м е р 4. Правило большинства. Коалиция "выигрывает" если
обладает большинством среди п игроков и "проигрывает" в противном случае.
Тогда можно определить v следующим образом:
1, если |5|>л/2,
[ 0 в противном случае.
Мы хотим узнать, вероятно ли образование коалиции, и если - да, то
какой именно.
Пример 5. Взвешенные мажоритарные игры. Игрок г имеет к(
голосов. Коалиция "побеждает", если сумма ее голосов не меньше некоторой
доли Q от их общего количества. Таким образом, v определяется
следующим образом:
1, если 2 kt>Q9
О в противном случае.
Мы можем задавать взвешенную мажоритарную игру (л + 1)-строкой
(Qlklt к2,..., кп)у где п — число игроков. Взвешенные мажоритарные
игры возникают во многих ситуациях. Например, игроки могли бы быть
акционерами компании, а число голосов игрока могло бы соответствовать
его доле акций. В качестве игроков можно рассматривать также штаты
или избирательные округи; в этом случае число голосов, которым обладает
округ в законодательном органе, соответствует численности населения.
Число голосов у игрока не всегда соответствует его реальной силе.
Например, рассмотрим игру E1; 49,48,3). В этой игре игрок 1 имеет 49 голосов,
игрок 2 имеет 48 голосов и игрок 3 имеет 3 голоса, а для победы
необходимо простое большинство в 51 голос. Выигрывающие коалиции — {1, 2},
{1, 3 } , { 2, 3} и {1, 2, 3 } . Таким образом, v(S) - 1 тогда и только тогда,
когда | S | > 2. Выигрывающие коалиции в этом случае в точности такие же,
как и в игре {2; 1, 1, 1} . В последней игре все игроки равной силы,
поскольку обладают одинаковым числом голосов. В игре {51; 49,48,3}
игроки также имеют одинаковую силу с точки зрения их способности войти
в выигрышную коалицию. Одна из интерпретаций этого результата состоит
в следующем: если в политической системе нет партии, обладающей
большинством, и каждый голосует согласно линии своей партии, то небольшая
партия может иметь такую же реальную власть, как и каждая из
превосходящих ее партий. Мы вернемся к понятию силы в § 6.7.
Другой пример взвешенной мажоритарной игры — процедура
голосования в 1964 г. в Совете инспекторов округа Нахау штата Нью-Йорк, состоя-
319
щем из iifecra членов, имеющих соответственно 31,31,21,28,2,2 голосов.
Для победы необходимо 59 голосов. Таким образом, мы имеем игру
E9; 31,31,21,28,2,2) (Banzhaf [1965]). В австралийском правительстве
при голосовании по некоторым вопросам каждый из шести штатов
получает один голос, тогда как федеральное правительство — два голоса. Для
победы необходимо пять голосов. В случае равенства голосов 4—4,
федеральное правительство само принимает решение. Выигрывают все коалиции,
включающие по меньшей мере пять штатов или по меньшей мере два штата
и федеральное правительство. Они совпадают с коалициями во взвешенной
мажоритарной игре E; 1, 1, 1, 1, 1, 1, 3); поэтому мы можем считать, что
федеральное правительство имеет три голоса. Заседание Совета
Безопасности ООН также можно представить как взвешенную мажоритарную игру.
Некоторая резолюция утверждается в том и только том случае, если она
получает поддержку пяти постоянных членов и по меньшей мере четырех
из остающихся десяти членов. Легко показать, что процедура голосования
в Совете Безопасности соответствует взвешенной мажоритарной игре
C9; 7, 7, 7, 7, 7, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1), поскольку, если игроков 1-5
считать постоянными членами, то в этой игре выигрывают те же коалиции.
П р и м е р 5а. Простые игры. Игра в форме характеристической
функции называется простой, если каждая коалиция S имеет цену, равную О
или 1. Коалиции S, для которых v(S) = 1, называются выигрывающими,
а все остальные — проигрывающими. Примерами простых игр служат все
взвешенные мажоритарные игры. Однако не каждую простую игру можно
рассматривать как игру такого типа (см. упражнение 10).
П р и м е р 6. Игра "Мусор"г). У каждого из п игроков имеется мешок
с мусором, который он должен выбросить во дворе у кого-то другого.
Полезность или стоимость Ъ мешков, мусора равна -Ь. Тогда
{0, если 5=0,
-(и-s), если s<n,
-и, если s = «,
где s = | S |. При s < п участники коалиции могут договориться не оставлять
мусор во дворе друг у друга. Тогда при наихудшем для S исходе, все
остальные игроки принесут мусор во дворы членов коалиции. Для
коалиции, содержащей всех игроков, такое соглашение, запрещающее
выбрасывание мусора, невозможно. При исследовании этой игры мы попытаемся
выяснить смогут ли игроки достичь соглашения о размещении мусора.
Пример 7. "Озеро". Вокруг озера расположено п предприятий. Мы
допускаем, что обработка стоков перед их сбросом в озеро стоит
предприятию В, а очистка воды для собственных нужд стоит предприятию /хС, где м
равно чисшу предприятий, не обрабатывающих свои отходы. Считая, что
С<В<пС% получаем
js«C если*<*/С,
(-snC + s(sC-B), если s>B/C,
где s = | S |. (Доказательство этого соотношения остается в качестве
упражнения (см. упражнение 9).) Мы хотим узнать, смогут ли предприятия
прийти к соглашению об обработке отходов.
1) Эта и следующая игра предложены Шегош и Шубиком (Shapley, Shubik [1969b] )•
320
Упражнения
1. Какие из функций являются характеристическими? Почему?
1» 2»= -3, и({1, 3})= 3, и({2, 3}) = 4,
б. л = 3,
и({2})=0, у
в. vis)- - IS I при всех 5 для любого п.
2. Показать, что функция v, определенная в тексте, в каждом из следующих
примеров действительно является характеристической функцией.
а. "Чистые торги".
б. "Угроза".
в. "Землепользование".
г. Правило большинства.
3. (L. Shapley, M. Shubik). В игре, названной "Почта", каждый игрок должен послать
доллар некоторому другому игроку. Вычислить характеристическую функцию этой
игры.
4. Для каждой из приводимых ниже взвешенных мажоритарных игр описать все
выигрывающие коалиции.
а. E1; 50,30,20).
б. E1; 60,30,10).
в. Совет инспекторов в округе Нассау штата Нью-Йорк E9; 31, 31, 21, 28, 2,2).
г. B01; 100,100,100,100,1).
д. A51; 100,100,100,1).
5. Для следующих взвешенных мажоритарных игр вычислить характеристические
функции и найти все минимальные выигрывающие коалиции, т.е. такие
выигрывающие коалиции, что удаление любого игрока преобразует их в проигрывающие
коалиции.
а. G; 3,3,5,6,1).
6. A5; 14,1,1,1,1,5).
в. Все игры из упражнения 4.
б. (A. Tucker) *). Положим п - 4 и определим v следующим образом:
и(ф) = 0,
1>({*'}) = 0 для всех/ ,
*>({*>/})= ~- для всех / Ф/,
v({/, U к}) = для всех различных /, /, к,
.({1,2,3,4))- 1+
Показать, что и - характеристическая функция.
) Автор выражает благодарность проф. Таккеру за разрешение использовать это
и ряд других неопубликованных упражнений.
21. Ф.С. Роберте 321
7. (A. Tucker). Обобщая предыдущее упражнение, положим /= {1,2,..., 2л} и
v ({/})« 0 для всех/,
с/ для всех
если имеется 2л положительных констант с/ с суммой, равной 1. Проверить, «гго
и - характеристическая функция игры 2 л лиц.
8. Предположим, что v - характеристическая функция и и G) = 1. Обязательно ли
выполняется неравенство v(S) < 1? (Привести доказательство или противоречащий
пример.)
9. Показать, что соотношение C) действительно задает характеристическую
функцию для игры "Озеро".
10.Рассмотрим заседание комитета, состоящего из трех сенаторов x,y,z и трех
членов Палаты представителей а, Ь9 с. Комитет принимает решение по некоторому
вопросу в том и только том случае, если оно получает поддержку по меньшей мере
двух сенаторов и двух членов Палаты представителей.
а. Вычислить характеристическую функцию этой простой игры.
б. Показать, что эта игра не является взвешенной мажоритарной игрой. Другими
словами не существует такого количества' голосов v(x)fv (у), v (z), v (a),
v (b), и (с) и доли от общего числа голосов Q (квота), чтобы решение утверждалось
тогда и только тогда, когда сумма, отданных за него голосов, не менее Q.
(Замечание. Аналогичное рассуждение показывает, что, вообще, голосование в двухпалатном
законодательном органе нельзя рассматривать как взвешенную мажоритарную игру.)
11. Какие из следующих простых игр будут взвешенными мажоритарными играми
в том смысле, что для каждой имеется взвешенная мажоритарная игра с теми же
выигрывающими коалициями? Обосновать ответ.
а. Имеется три игрока и коалиция выигрывает тогда и только тогда, когда в нее
входит игрок 1.
б. Имеется четыре игрока а, Ь,х,у и коалиция выигрывает тогда и только тогда,
когда в нее по меньшей мере входят игрок а или Ьнх или у.
в. Имеется четыре игрока и коалиция выигрывает тогда и только тогда, когда в
нее входят, по крайней мере три игрока.
12. Коалиция S с I S \ > 2 называется существенной, если для каждого разбиения
множества S на (непересекающиеся) множества Г,, Т2,..., 7* меньших размеров
имеем 2 v GV) < v {S ). Определить все существенные коалиции в следующих иг-
/=1
pax. (Замечание. Если нам известна цена и (S ) для всех одноэлементных и
существенных коалиций S, то можно вычислить и (S ) для всех коалиций. Почему?)
а. "Чистые торги".
б. Угроза".
в. "Землепользование".
г. Правило большинства.
д. Взвешенная мажоритарная игра C; 1,1,1,1.1).
ж. Взвешенная мажоритарная игра F; 1,2, 3,4).
з. Совет Безопасности,
и. Игра "Мусор".
13. Задание. Собрать данные о распределении результатов голосования в некоторых
законодательных органах и выяснить относительную силу различных партий. В работе
Lucas [1974] приводятся сведения о бюджетном комитете Нью-Йорка, израильском
кнессете (в 1965 г.), городском совете Токио (в 1973 г.) и другие.
14. Какие упущения можно отметить при трактовке игры в виде
характеристической функции?
§ 6.2. Ядро
6.2.1. Эффективное предпочтение. Игра может иметь различные
возможные исходы. 'Тешение" игры сообщает нам, какой из этих исходов
322
встретится или по меньшей мере предсказывает, что исходом будет один
из данной группы.
При выработке различных понятий решения в качестве исходов мы
будем рассматривать векторы (xlbx2i... ,х„), где X/ интерпретируется
как "платеж" игроку /, a n равно числу игроков. Допускается, что платежи
измеряются некоторой величиной (например, деньгами), которая, в
принципе, трансферабельна и бесконечно делима1). Таким образом,
предположим, что общий доход коалиции S =0'i,г*2> • ••>** }равен и единицам. Эти
и единиц можно разделить произвольным способом между лицами, вхо-
5
дящими в S. Если 2 Xf * и, то вектор (х*,, X/ ,. •, X/ ) выражает допус-
s
тимое распределение доходов в S. Более того, если 2 у и = 0, то вектор
/=1 '
также дает допустимое распределение. Будем говорить, что игроки из 5
могут передать друг другу побочные платежи в виде награды или взятки
после того, как благодаря действиям коалиции были получены общие
доходы. Допуская существование побочных платежей, мы можем отделить
вопрос о гарантируемом доходе коалиции от вопроса дележа доходов в
игре среди участников.
Если х = (Xj, х2,..., х„) - возможный исход игры, то представляется
обоснованным допустить, что он не принимается как вектор платежей
1-м игроком, если X/ меньше величины, которую этот игрок мог бы себе
гарантировать сам. Таким образом, разумно предположить, что
X/ > у(/) при всех i. D)
Условие D) называется условием индивидуальной рациональности.
Аналогично, выглядит разумным предположение, что
? *,>и(/). E)
В действительности мы ничего не потеряем, ограничив себя векторами
х, удовлетворяющими более сильному условию:
2 х, = и(/). F)
/=i
Условие E) называется допустимостью, а условие F) -
оптимальностью по Парето. Допустимость означает, что сумма всех платежей по
крайней мере не меньше дохода полной коалиции /, оптимальность по
Парето — что эта сумма в точности равна доходу полной коалиции.
Множество /г-мерных векторов х = (xt, х2,..., х„), удовлетворяющих
условиям индивидуальной рациональности и оптимальности по Парето,
называется множеством дележей игры с характеристической функцией v.
*) Трансферабельность означает возможность передачи выигрыша другому игроку.
(Примеч. пер.)
21* 323
Для примера положим п = 3 и
0, G)
Тогда вектор х= (х19х2,х3) будет дележом в том и только том случае,
если */ > О для i = 1, 2,3 и *i +х2 + х3 = 1. Так, х= A/2,1/3, 1/6) и у =
= A/3, 5/12, 1/4) являются примерами дележей.
Множество дележей M=M(v) — это множество возможных исходов
игры. Для определения реалистичных исходов (одного или множества)
заметим, что для каждой коалиции есть предпочтения среди различных
возможных исходов. Однако только некоторые из этих предпочтений
эффективны в том смысле, что коалиция S, действуя совместно, может
навязать их всей группе. Будем говорить, что коалиция S эффективно
предпочитает дележ х= (xl9x,.. .9хп) дележу у = (ух,у2,. • • ,Уп)> если?=?0,
для всех i € S (8)
2 xt<v(S). (9)
Условие (8) означает, что для S х (строго) предпочтительнее, чем у, а
условие (9) что S обладает возможностью гарантировать исход, не худший,
чем 2 X/. Мы будем писать х>$ у, если х эффективно предпочтительнее.
чем у для коалиции 5. Если х>5у для некоторой коалиции S, будем
говорить, что дележ х эффективно предпочитается дележу у и писать х>у.
Продолжая наш пример G), заметим, что для дележей х= A/2, 1/3,
1/6) и у = A/3, 5/12, 1/4) имеем у > {2,3}х> поскольку у2 >х2, уъ >х3
и у2 +Уз <v({2,3}). Далее, пусть z = (9/24, 1/3, 7/24). Тогда z > {it3}y.
Таким образом, z > у и у > х. Однако в этом случае отношение z > x не
выполняется. В самом деле, если допустить z > s x, то условие (8) означает,
что S ={3}. Однако z3>u({3}),a это неравенство нарушает условие (9I).
(Другими словами, отношение >• не обязательно транзитивно, т.е. не
удовлетворяет условию, что z >- x при z>y и у>х. Однако отношение
> s транзитивно (см. упражнение 14).
Мы могли бы продолжить наш пример, чтобы найти дележ w
эффективно предпочитаемый дележу z = (9/24, 1/3, 7/24), затем дележ, эффективно
предпочитаемый дележу w, и т.д. Однако имеются некоторые дележи, для
которых не существует эффективно более предпочтительных. Таким
примером служит дележ A/3, 1/3,1/3).(Справедливость этого будет
установлена далее непосредственно из теоремы 6.1.)
6.2.2. Нахождение ядра. Д. Джиллис (Gillies [1953]) и Л. Шепли (см.
Kuhn [1953]) назвали ядром множество всех дележей х, для каждого из
которых нет другого дележа, эффективно более предпочтительного (см.
1) Вообще, эффективное предпочтение невозможно для одноэлементных коалиций
S (см. упражнение 15).
324
также Gillies [1959]). Таким образом, дележ A/3, 1/3, 1/3) является
ядром игры G). Чтобы прояснить смысл понятия ядра, построим орграф
эффективного предпочтения Д взяв в качестве множества вершин D
множество дележей М =M(v) и проводя дугу от дележа х к дележу у, если х
эффективно предпочтительнее у. Естественно предположить, что в D нет
петель. Мы сделаем такое допущение для всех рассматриваемых здесь
орграфов. D может иметь бесконечное число вершин; в таком случае
большинство результатов по теории графов, полученных в этой книге, не
применимо. Ядро С есть множество всех вершин арграфа Д для которых
полустепень захода, равна 0, т.е. у этих вершин нет входящих дуг. По-видимому,
Рис. 6.1. Орграф с ядром, состоящим
из вершин 1 я 2
обоснованно предположение, что решение игры сводится к выбору
некоторого исхода в ядре. Ни одна коалиция не в состоянии улучшить исход,
принадлежащий ядру. Таким образом, ядро могло бы считаться
"решением" игры. К сожелению, не каждый орграф имеет ядро, точнее, непустое
ядро1). Например, у ориентированного контура длины «нет ядра. Кроме
того, ядро может состоять из нескольких вершин, а не из одной;
примером служит орграф на рис. 6.1. В идеальном случае решение игры должно
было бы определять не множество, а конкретный исход. Однако, как мы
увидим, нельзя ожидать, что структурный анализ множества исходов
обязательно даст такой единственный исход.
Для взвешенной мажоритарной игры E1; 51, 48, 1)
характеристическая функция равна
1, если 1 ?5,
Э, если 1 ^5.
Дележами служат все векторы х= (Xi,x2ix3), для которых хх > 1, х2 > О,
хъ > 0 HXt +х2 +*з = 1. Таким образом, множество дележей М(и) состоит
из единственного дележа A, 0, 0). Орграф эффективного предпочтения
содержит единственную вершину. Поскольку нет дележа, эффективно более
предпочтительного, чем A, 0, 0), ядро состоит из этого единственного
дележа. Легко дать интерпретацию такому "решению" игры. Очевидно, что
игрок 1 - это "диктатор". Он побеждает всех.
В качестве другого примера рассмотрим взвешенную мажоритарную
игру B; 1, 1, 1), v({i) ) =0 для / =1,2, 3 и у({1,2,3}) = 1. Таким
образом, M(v) - бесконечное множество всех неотрицательных векторов
х= (xl9x2,x3), сумма компонент которых равна 1. Ядро в этом случае
пусто. В самом деле, для данного у= (у\,Уг, y3)i&M(v) некоторая пара
компонент в сумме меньше, чем 1. Допустим для определенности что
и х = (у + е/2, у2 + е/2, у3 - е),
1) В теории игр принято считать, что ядро существует, если оно непусто.
325
где е выбирается так, что ух + у2 + е<1. Тогда х > {ь2} У, поскольку
х\ >Уг р Х2 >Уг и *х + х2 < 1 = v ( {1, 2}). Этот результат имеет следующую
интерпретацию. Никакое соглашение о разделе вознаграждения не сможет
удовлетворить любую группу игроков, если они не будут уверены в
отсутствии лучшего способа дележа.
Вообще, полезно иметь процедуру нахождения всех дележей,
составляющих ядро. В нашей первой теореме и предлагается такая процедура.
Теорема 6.1. Ядро игры с характеристической функцией v состоит из
всех таких дележей х = (хг, х2,..., хп), что
2 Xi>v(S) для всех БФф*). A0)
Доказательство. Пусть х — некоторый дележ. Если х
удовлетворяет условию A0), то неравенства yi > х( для всех i G S влекут
неравенство 2 ух > v(S). Таким образом, отношение у >s x невозможно
для любых у и S, т.е. х входит в ядро. Далее, предположим, что для х
условие A0) не выполнено. Тогда для некоторого S Ф ф
2 jc/ = v(S)-e, e > 0.
Пусть
Из супераддитивности (условие B)) следует, что 5 > 0. Пусть
fx/ + € Л, если i € 5,
A1)
v({i}) + d/(n-s)9 если /?&
где s = \S\. Относительно нетрудно проверить, что у >sx и у является
дележом. Эти доказательства остаются читателю в качестве упражнения
(см. упражнение 21). ¦
Теорема 6.1 имеет очень интересную интерпретацию. Она утверждает, что
дележ входит в ядро тогда и только тогда, когда он удовлетворяет
минимальным требованиям каждой коалиции. В игре с пустым ядром всегда
найдется одна неполностью удовлетворенная коалиция.
В § 6.4 мы докажем несколько общих теорем о существовании
(непустых) ядер в играх в форме характеристической функции. А теперь,
используя теорему 6.1, определим еще некоторые ядра.
В игре "Чистые торги" (пример 1 из предыдущего параграфа) дележами
п
служат все векторы х, для которых */ > 0 при всех /и 2 л:/ = d. Из
/= 1
*) Условие A0) часто называют групповой рациональностью. Некоторые авторы
предпочитают определять ядро, как множество всех дележей, удовлетворяющих
условию A0), и затем доказывают, что ядро состоит из всех дележей, для которых нет
другого дележа, эффективно более предпочтительного. Необходимо отметить, что
теорема 6.1 не верна без предположения о супераддитивности или некоторого более
слабого допущения, формулируемого в работе Shapley, Shubik [1969a] (см. упражнение
16).
326
теоремы 6.1 легко получить, что каждый дележ принадлежит ядру. Если
допустить, что некоторый дележ из ядра будет выбран в качестве решения
игры, то интерпретация такого предположения состоит в том, что группа
придет к заключению некоторой сделки. Но теория игр не называет, какой
именно.
Вернемся теперь к взвешенной мажоритарной игре B; 1,1,1),которая
имеет пустое ядро, и покажем, что это так еще раз, используя теорему 6.1.
По теореме 6.1 дележ х = (хь х2, х3) принадлежит ядру тогда и только
тогда, когда
х<>0, /=1,2,3, A2)
Хг+Х2>1, A3)
Х!+*з>1, A4)
*2+jc3>1 A5)
и
хх+х2+х3>1. A6)
Неравенства A2) и A6) автоматически выполняются для всех дележей.
Вообще говоря, при применении теоремы 6.1 неравенство A0) необходимо
проверять только для коалиций 5, для которых 1 < \S\ < п. (Почему?)
Складывая неравенства A3), A4) и A5), получим неравенство
хх
противоречащее соотношению xt + х2 + х3 = 1 (оптимальности по Парето).
Таким образом, ядро пусто.
В игре "Землепользование" (пример 3 предыдущего параграфа),
дележами служат все векторы х = (xif x2, х3), для которых хх > 100000,
х2 > 0, х3 > 0 и хх +х2 + х3 = 300000, Применяя теорему 6.1, мы увидим,
что дележ х находится в ядре тогда и только тогда, когда он удовлетворяет
следующим неравенствам:
хх > 100000, A7)
х2 > 0, A8)
*з > 0, A9)
хх+х2 > 200000, B0)
лгх +лг3 > 300000, B1)
х2+х3 > 0, B2)
300000. B3)
Как обычно, неравенства A7) - A9) и B3) для каждого дележа х
автоматически выполняются. Теперь, если х входит в ядро, то неравенство
B1) означает, что хх + х3 > 300000. Поскольку х - дележ, хх + х2 +х3 =
= 300000. Значит х2 = 0. Из B0) следует, что хх > 200000. Кроме того
х3 < 300000. (Почему?) Таким образом, х2 = 0, 200000 <xt < 300 000 и
*з = 300000 - хх. Обратно, если х удовлетворяет этим ограничениям, тогда
327
легко проверить неравенства A7) - B3). Итак, ядром в игре "Землеполь
зование" — служит множество
С={(лг1,0,х3): 200000 < хг < 300000,*! + х3 = 300000). B4)
Этот результат интерпретируется так. Ядро содержит все такие ситуации,
в которых будущий землевладелец, собирающийся продавать землю затем
по частям, купит ее у первоначального владельца по цене между 200000 и
300000 долларами. Игрок 1 останется с деньгами, а игрок 3 с землей
(стоящей для него 300000 долларов) и без денег, уплаченных за нее. Как
отмечают Льюс и Райфа (Luce, Raiffa [1957, p. 2081) ]), это "решение" имеет
смысл; ясно, что игрок 3 всегда может исключить игрока 2 из сделки,
заплатив не менее 200000 долларов. Главное затруднение с таким
решением заключается в том, что оно не единственно, а определяет лишь
множество дележей. Типичный ответ теории игр на это замечание состоит в том,
что окончательную цену определяют социальные стандарты или
способность вести переговоры. Сама структура игры не приводит к точному
определению цены, а лишь налагает на нее некоторые ограничения 2).
Это решение для игры "Землепользование" обобщает игру "Рынок с
двумя покупателями" (пример За предыдущего параграфа). В упражнении 22
настоящего параграфа читателю будет предложено определить в этой игре
ядро.
В игре "Мусор" (пример 6 предыдущего параграфа) дележами
оказываются все векторы х = (хь x2t ..., xn)t удовлетворяющие условиям
п
X/ > 1 — и и 2 jc/ = — п. Предположим, что х принадлежит ядру. Тогда
/= 1
по теореме 6.1 при S Фф, имеем
Ъ xt> v(S).
iG S
В частности, это верно для всех коалиций S из п - 1 игроков, для которых
2) xt > -1. B5)
i e s
Имеется п таких коалиций 5. Складывая неравенства B5) по всем
возможным множествам 5, получим
(л-1) 2 jc, > -п. B6)
i = 1
Но, поскольку х является дележом, 2 х? = — п. Тогда B6) принимает
вид
*) В русском переводе с. 271. (Примеч. пер.)
2) Этот результат не вполне учитывает чувство собственности владельца земли или
другое аналогичные факторы. В гл. 8 мы обсудим, как измерить полную стоимость
или "полезность" такого предмета, как земля. Тогда число порядка 100 000 долларов
можно было бы считать полезностью или денежным эквивалентом, который дает
игрокам такое же удовлетворение, что и владение землей. При такой интерпретации
обсуждение можно продолжать, как и выше.
328
(и- l)(-w) > —п, откуда л- и2 > —w, и(и - 2) <0,т.е. л < 2. Таким
образом, еащ п > 2, то в игре "Мусор" ядро отсутствует. При любом
соглашении о размещении мусора найдется некоторая коалиция, которой
будет выгодно его нарушить.
Мы продолжим исследование ядер в § 6.4 и 6.6, где определим ядра
некоторых других игр, например, игры "Озеро".
Упражнения
1. Какие из следующих векторов выражают приемлемые способы для игроков
коалиции S, получившей 10 единиц дохода, разделить его между собой?
а. C,3,4);
б. C,1, 3,1, 3,8);
в. @,0,10);
г. D, 4,4).
2. Какие из следующих векторов для игры, определяемой соотношениями G),
удовлетворяют условию индивидуальной рациональности?
а. @,0,0);
6.A,0,-1);
в. (-1,-1,-1);
г. A/3,1/3,1/3);
д. A/2,0,1/2).
3. Какие из следующих векторов удовлетворяют условиям оптимальности по
Парето или условиям допустимости для игры, определяемой соотношениями G)?
а. @,0,0);
6.A/3,1/3,1/3);
в. A/2,0,1/2);
г. A,1,1,1).
4. В следующих играх найти М (у) - множество дележей.
а. E1; 40,30,30);
б. E1; 60,30,10).
в. Игра "Почта" (см. упражнение 3 из § 6.1).
5. В игре B; 1, 1, 1) найти дележ х, эффективно предпочитаемый
дележу A/2,1/2,0).
6. В игре "Землепользование" найти дележ, эффективно предпочитаемый дележу
A80000,20000,100000).
7. В игре, определяемой соотношениями G), найти дележ, эффективно
предпочитаемый дележу z = (9/24, 1/3, 7/24).
8. В каждом из орграфов, изображенных на рис. 6.2, найти ядро.
9. В игре, определяемой соотношениями G), показать, что дележ A/3, 1/3, 1/3)
образует ядро.
10. Определить имеют ли ядра (не пустые) следующие взвешенные мажоритарные
игры:
а. E1; 35,35,30);
б. B0; 10,10,1);
в. E1; 26,26,26,22).
П. Пусть и = 3ии определяется следующим образом:
»({1,2}) = У({2,3}) = и({1,2,3}) = 1,
v(S) = 0 в остальных случаях.
Найти ядро.
329
t 2 3 4
а
2 3
в
4
Рис. 6.2. Орграфы к упражнениям 8 § 6.2 и 3 § 6.3
12. Пусть п =4 и v определяется следующим образом:
иE) = 0 в остальных случаях. Найти ядро.
13. Рассмотрим взвешенную мажоритарную игру F; 1, 1, 1, 2, 3, 3). Определить»
существует ли (непустое) ядро.
14. Показать, что отношение >$ транзитивно, т.е., если z >s у, у >$ х, то z >$ х.
15. Показать, что для всех / и всех дележей а и у невозможно
отношение Х>(/) у.
16. Рассмотрим следующую игру трех игроков:
»@) =0, и({1}) = и({2}) = и( {3}) = и({2,3}) = и({1,3}) = 0,
и({1,2>)-2, и<{1,2,3>)«1.
Показать, что теорема 6.1 в этом случае не верна. Как это объяснить?
17 (A, Tucker). Определить ядро характеристической функции v из
упражнения 6 § 6.1.
18 (A. Tucker). Определить ядро характеристической функции v из
упражнения 7 § 6.1.
19. Для заседаний Совета Безопасности, определяемого взвешенной мажоритарной
игрой C9; 7, 7, 7, 7, 7, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1), найти ядро и обсудить полученный
результат.
20. Определить ядра в следующих играх и обсудить результат.
а. "Угроза" (Замечание. Если */ > 0, каким образом игрок i мог бы
увеличить свое состояние?)
б. Игра из упражнения 10 § 6.1.
21. Завершить доказательство теоремы 6.1, показав; что вектор у, определяемый
соотношением A1), является дележом, и у >$ х
22.Рассмотрим игру "Рынок с двумя покупателями" (пример За §6.1).
а. Определить М (у ).
б. Определить ядро.
23 (A, Tucker). Найти ядро для взвешенной мажоритарной игры A2; 5,5, 2, 2,1).
24. Доказать, .что если коалиция S существенная и S Ф /, то для некоторых х и у
выполнено отношение х >g у (см. упражнение 12 § 6.1, где определяется
существенная коалиция).
25. Доказать следующее утверждение или привести противоречащий пример. Если
х^У для некоторого х, то коалиция S существенная.
26. Критически проанализировать определение эффективного предпочтения, данное
в этом параграфе. Можно ли предложить другое определение?
27. Всегда ли плохо, если ядро содержит более одного элемента?
330
§ 63. Устойчивые множества
Ядро нельзя считать вполне удовлетворительным решением игры,
поскольку иногда оно пусто или содержит более одного элемента. Фон
Нейман и Моргенштерн (von Neumann, Morgenstern[1944]) в своей
фундаментальной книге, вышедшей в 1944 г., предвидели некоторые сложности
с этим понятием и предложили другой подход. Говорят, что множество
вершин В в орграфе D внутренне устойчиво, если никакие две вершины из В
не соединены дугами; для орграфа эффективного предпочтения это
означает, что для любых х и у в В ни одна из них эффективно не
предпочитается Другой. Например, множество {1,3} внутренне устойчиво в орграфе на
Рис. 6.Э. Орграф с двумя устойчивыми множествами
Рис. 6.4. Орграф без устойчивых множеств
рис. 6.3. Множество вершин В называется внешне устойчивым, если для
каждой вершины х ^ В найдется некоторая вершина у € В, из которой
в х выходит дуга; в терминах предпочтения это означает, что для каждой
вершины, не входящей в В, найдется вершина в В, эффективно
предпочитаемая ей. Множество {1, 3} в орграфе на рис. 6.3 является и внешне
устойчивым. Внутренне и внешне устойчивое множество исходов называется
устойчивым.
Фон Нейман и Моргенштерн предложили искать решение игры среди
исходов, входящих во внутренне устойчивое множество орграфа
эффективного предпочтения. Должны быть веские причины ограничить рассмотрение
такими множествами. Ни один исход в этом множестве эффективно не
предпочитается любому другому исходу, а над каждым внешним исходом
"доминирует" некоторый исход, входящий в рассматриваемое множество.
Понятие устойчивого множества можно считать обобщением понятия
вершинной базы, обсуждавшегося в § 2,3, Устойчивое множество может
быть названо 1-й базой (см. упражнение 26). Отметим, что ядро всегда
содержится в устойчивом множестве. (Почему?)
Определение решения для игр п лиц как элемента устойчивого множества
имеет несколько негативных сторон, Во-первых, в орграфе может быть
более одного устойчивого множества, Орграф на рис. 6,3 имеет два
устойчивых множества {1,3} и {2, 4 }. Действительно, произвольный четный
контур имеет два устойчивых множества. Во-вторых, орграф вообще может
не иметь устойчивых множеств. Орграф на рис. 6.4 является таким
примером. На самом деле, любой нечетный контур не содержит устойчивых
множеств. И, наконец, как и в случае с ядром, в устойчивое множество
может входить более одной вершины. В идеале решение должно определять
не множество исходов, а конкретный исход.
Имеет практическое значение еще одна проблема, связанная с понятием
устойчивого множества: неизвестна общая процедура, например, такая,
331
как в теореме 6.1, для нахождения устойчивых множеств. Действительно,
устойчивые множества могут принимать весьма патологическую форму.
В § 6.5 будет приведено несколько общих теорем о существовании
устойчивых множеств. Здесь же рассмотрим еще несколько примеров.
В игре "Чистые торги" ядром служит все множество дележей. Поскольку
ядро должно входить в любое устойчивое множество, в этом случае
имеется лишь одно устойчивое множество - множество всех дележей.
Возвращаясь теперь к взвешенной мажоритарной игре E1; 51, 48, 1),
получим аналогичную ситуацию. В этом случае, как мы заметили
в п. 6.2.2, M(v) содержит единственный дележ A,0,0), который и
составляет ядро. Поскольку ядро входит во все устойчивые множества,
дележ A, 0, 0) является одним и только одним устойчивым множеством.
Во взвешенной мажоритарной игре B; 1, 1, 1) ситуация несколько
иная. Здесь ядро было пустым множеством. Покажем, что следующее
множество дележей В устойчиво:
? = {04,^,0), (Й.О.Й), @,Й,й)}. B7)
Этот результат интерпретируется следующим образом. Образуется
некоторая коалиция из двух игроков, в которой выигрыши делятся полностью
(и поровну). Решение в виде устойчивого множества не указывает какая
именно коалиция будет создана: если ситуация симметрична, нет оснований
ожидать информации о составе коалиции.
Чтобы показать, что В в B7) внутренне устойчиво *), заметим, что ни
один дележ в В не будет эффективно предпочитаться любому другому
дележу в В, Например, если для S у = (%, 54, 0) эффективно
предпочтительнее, чем х = AА, 0, Й), то 5 может быть лишь коалицией {2}. Однако,
Б уг = Ы > и ({2}). (Вообще говоря, для одноэлементных коалиций
эффективное предпочтение невозможно.) Чтобы показать, что В внешне
устойчиво, предположим, что дележ х = (хх, х2, х3) не содержится в В
Нам известно, что х/ > 0 и хх +лг2 +х3 = *• Пусть */ - наибольшая
величина из xlr х2, х3. Из соображений симметрии можно положить i = 1. Если
Xi > 1/2, тогда, так какхх + х2 +х3 = 1,х2 их3 меньше 1А. Это означает,что
@, Viy Vl) > i2 3jx. Если хг < Vi, то х2 < 1А и х3 < %« Если х2 = Vi или
*з = Й, то х = (Й, 1А, 0) или х= (И, 0, Й ) их содержится в В. Таким
образом, Х2<Йих3<Йи снова получаем, что @, й, lA) >-<2 3»x. Это
завершает доказательство устойчивости В.
Следует обратить внимание на то, что даже, если дележ х содержится
в устойчивом множестве В t могут найтись исходы у вне В, эффективно
более предпочтительные, чем х. Например, в нашем примере так
происходит для дележа (Й, ХА, 0), поскольку в противном случае этот исход
должен был бы входить в ядро, которое, как уже известно, пусто. Легко по-
*) В оставшейся части этого параграфа читатель может пропустить доказательства,
которые содержат технические детали.
332
строить дележ, эффективно более предпочтительный дележа AА, 1А, 0);
оставляем это читателю (см. упражнение 5 § 6.2).
Оказывается, что множество Ву определяемое B7), не единственное
устойчивое множество игры B; 1,1,1). Так же, как и в книге фон
Неймана и Моргенштерна (von Neumann, Morgenstern [1944]), выберем с в
интервале [0, Vi). Тогда множество
Дс = {(*1, \-с-хХу с): 0<хг<1-с) B8)
также устойчиво. (Такое устойчивое множество, в котором данный игрок
получает фиксированную величину, называется дискриминационным.)
Для проверки внутренней устойчивости1) предположим, что дележи
х = (*i, 1 - с - хи с) и у = (ух, 1 - с -уи с) содержатся в Вс. Тогда,
например, Х\ > уг, и поэтому х2 < у г ¦ Эффективное предпочтение могло
иметь место лишь для коалиций из одного игрока, что никогда невозможно
(см. упражнение 15 § 6.2). Таким образом, Вс внутренне устойчиво. Для
проверки внешней устойчивости предположим, что дележ у = (ylf у^, у3)
не входит в В с. Тогда у г > с или уг< с, Если уъ > с, положим у$ = с + е
и определим х = (ух + е/2, у2 + е/2, с). Легко показать, что х является
дележом и что х > t% 2j у. Если у3 < с, то либо ух < й, либо у2 < И.
Если ух < 1А, положим х= A — с, 0, с). Тогда хV^ 3» у. Доказательство
аналогично, если j2 < Й.
Однако пояснить смысл устойчивого множества Вс в B8) сложнее, чем
устойчивого множества В в B7), Одна интерпретация состоит в том, что
игроки 1 и 2 соглашаются передать игроку 3 побочный платеж с и
разделить выигрыш между собой. Это устойчивое множество в некотором
смысле снова является решением игры. Какое устойчивое множество среди
многих возможных и какой дележ в этом устойчивом множестве
выбираются при таком анализе, определить не удается. Выбор одного
устойчивого множества из нескольких производится согласно фон Нейману и Мор-
генштерну на основе норм поведения в обществе. Если в обществе принята
традиция, что в такой ситуации голосования два игрока получают общее
вознаграждение и делят доходы, то В следует считать обоснованным
"решением" игры. Существование нескольких устойчивых множеств даже
для такой простой игры иллюстрирует явление, названное Шепли и Шуби-
ком (Shapley, Shubik [1973, с. 40]) "неопределенностью, присущей играм
многих лиц",
В заключение рассмотрим игру "Землепользование". Напомним
читателю, что ядро задается множеством B4)
С = {(xt,0,jt3): 200000<хх <300000, хг +х3 = 300000).
Объяснение этого результата состояло в том, что игрок 1 продает землю
игроку 3 по цене между 200000 и 300000 долларов. С является
подмножеством каждого устойчивого множества, но, к сожалению, само С
1) Доказательство снова можно опустить.
333
неустойчиво, так как в С нет дележа эффективно более предпочтительного,
чем дележ A00000, 100000, 100000). Чтобы найти устойчивое множество,
необходимо ввести новые дележи. Одно из множеств дележей,
устраивающих нас, состоит из дележей, для которых продажная цена опускается до
100000 долларов. Другими словами, устойчиво следующее множество:
В = {(х150,х3): 100 000 < хх < 300000, хг +*3 = 300000). B9)
В - это множество всех дележей с х2 - 0. Докажем устойчивость
множества В. Свойство внутренней устойчивости следует из двух фактов.
Во-первых, отношение эффективного предпочтения невозможно для
одноэлементных коалиций (см. упражнение 15 § 6.2), а, во-вторых, условия у\ >х%,
Ух + Уъ - 300000 означают, что у3 < х3. Для доказательства внешней
устойчивости предположим, что дележ х = (xlf x2t x3) не
содержится в В. Тогда х2 #0, Пусть ^i =хх + х2/2, у2 =0пуд =х3 +х2/2. Вектор у
является дележом и у > *х 3jx. Поскольку у2 " 0, у входит в В. Таким
образом, В - устойчивое множество. Этот результат заслуживает
комментария. Возьмем в качестве дележа вектор х = A00000, 0, 200000). Дележ
у = A01000, 1000, 198000), конечно, эффективно предпочтительнее
дележа х, Это не нарушает внутренней устойчивости В. (Почему?) Однако
дележ A01500, 0, 198500) в свою очередь эффективно предпочтительнее
дележа у. Таким образом, игрок 2 может не приниматься во внимание.
Учитывая это, мы видим, что поскольку ни один из дележей в В
эффективно не предпочитается другому, все они являются возможными решениями.
Для игры "Землепользование", как и во взвешенной мажоритарной
игре B; 1,1,1), имеется более одного устойчивого множества. Пусть
, х2, х3) : 100000<*! < 200000,
х2 = 100000 - Йхх, х3 = 200000 - Viхх},
Тогда множество В' = С U Д где С - ядро, также устойчиво. Заметим, что
дележи из D имеют следующую интерпретацию. Земля продается игроком 1
игроку 3 по цене хх между 100 000 и 200 000 долларами, Игрок 3
выплачивает тогда игроку 2 сумму денег, равную разности между 100000
долларами и половиной продажной цены за поддержку предложенной цены.
Если в обществе выработана традиция не смотреть сквозь пальцы на
подобные доходы "под столом переговоров", то это устойчивое множество не
будет приемлемым решением для такого общества.
В игре "Землепользование" имеется много других устойчивых
множеств, Предположим, что t - действительное число из интервала @, 1).
Пусть
Dt = {(xlfx2, х3): 100000<хг< 200000,
*з = 100000 + A -0B00000 -хО}. C0)
Тогда множество Bt = С U Dt устойчиво. Множество В' уже рассмотрен-
334
ное нами, совпадает, конечно, с 2?^. Доказательство устойчивости Bt
предоставляется читателю в качестве упражнения (см. упражнение 17),
Имеются и другие устойчивые множества кроме таких множеств Bt.
Мы вернемся к устойчивым множествам в § 6.5 и 6.6. В § 6,7 будет
введено дополнительное понятие решения игры — цена Шеготи, — в котором
удается избежать некоторых трудностей, возникающих при использовании
ядер и устойчивых множеств. Эта цена всегда существует и определяет
единственное решение.
Упражнения
1. Привести пример орграфа, в котором внутренне устойчивое множество не явля-с
ется внешне устойчивым.
2. Привести пример орграфа, в котором внешне устойчивое множество не
является внутренне устойчивым.
3. В орграфах на рис. 6.2 найти следующие множества.
а. Все максимальные внутренне устойчивые множества, т.е. не содержащиеся ни
в одном другом большем внутренне устойчивом множестве.
б. Все минимальные внешне устойчивые множества.
в. Все устойчивые множества.
4. Может ли одно устойчивое множество быть собственным подмножеством
другого устойчивого множества? Объяснить ответ.
5. Является ли ядро взвешенной мажоритарной игры E1; 60, 30, 10) устойчивым
множеством?
6. Понятие внутренне устойчивого множества имеет приложение при передаче
информации. Пусть S - множество сигналов; построим граф G с множеством
вершин V(G) = 5, в котором два сигнала (вершины) соединены ребром, если их можно
спутать. Будем представлять G орграфом, проводя дуги в обоих направлениям между
х и у, если х и у соединены ребром. Используя этот подход, найти максимальное число
сигналов, которое можно передавать так, что при приеме они будут различаться,
если S = {а, Ьу с, d, е } и а можно понять как д или Ь, Ь - как? или с, с-каксили d,
d — как d или е и е - как е или а. Как решение связано со свойством внутренней
устойчивости? (Замечание. Дополнительные сведения о внутренней устойчивости
при передаче сигналов можно найти в книге Бержа (Beige [1962, с. 46]) и статье
Шенонна (Shannon [1956]).
7. На атомных электростанциях световые предупредительные сигналы расположены
в различных местах. Предположим, что с участка 2 можно увидеть сигналы участков
2 и 3, с участка 3 - сигналы участков 3 и 5, с участка 4 - сигналы участков 4 и 5, с
участка 5 только сигналы участка 5. Какое наименьшее число неподвижных
контрольных станций нужно установить для постоянного наблюдения за всеми сигналами?
(Указание. Построить орграф и использовать понятия внешней или внутренней устой*
чивости.)
8. В известной задаче, предложенной Гауссом, спрашивается можно ли расставить
на шахматной доске восемь ферзей так, чтобы они не били один другого. Можно ли
эту задачу сформулировать в терминах внутренней устойчивости? Как? (См. с. 43
книги Бержа.)
9. Аналогичная задача состоит в нахождении наименьшего числа ферзей, бьющих
фигуры, находящиеся в любом положении на шахматной доске. Могут ли понятия
внутренней или внешней устойчивости оказаться полезными в этой задаче? Что будет
решением? (См. с. 49 книги Бержа.)
10. Является ли устойчивым множеством ядро игры из упражнения 11 § 6.2?
П. Является ли устойчивым множеством ядро игры из упражнения 12 § 6.2?
12. Является ли устойчивым множеством ядро игры "Угроза"?
13. Для взвешенной мажоритарной игры E1; 26, 26, 26, 22) показать, что
следующее множество устойчиво:
В = { A/2,1/2, 0, 0), A/2, 0,1/2, 0), @,1/2,1/2, 0) } .
335
14. Показать, что, если ядро игры совпадает с множеством дележей М(и), то оно
служит устойчивым множеством.
15. Предположим, что ядро игры - устойчивое множество. Показать, что оно
единственно.
16. Найти все устойчивые множества в простой игре трех лиц, в которой
единственная выигрывающая коалиция из двух игроков есть коалиция {2,3}.
17*. В игре "Землепользование** пусть С — ядро, a Dt — множество, определенное
C0). Показать, что множество В t = CuDt устойчиво.
18*. Пусть в общей игре "Рынок с двумя покупателями** (пример За § 6.1) С -
ядро (см. упражнение 22 §6.2), Г принадлежит интервалу @,1) и
<b,x2 =t{b -хх),
}.
Показать, что множество Bt = CvDt устойчиво1).
19 (A. Tucker). Найти устойчивое множество во взвешенной мажоритарной игре
A2; 5,5, 2,2, 1) (см. упражнение 23 § 6.2).
20. Поскольку ядро содержится во всех устойчивых множествах, оно входит в
пересечение всех устойчивых множеств. Шепли (см. работу Kuhn[1953]) была
высказана гипотеза, что пересечение устойчивых множеств игры совпадает с ядром.
Следующий противоречащий пример приведен в работе Лукаса (Lucas [ 1967]).
Пусть/= {1,2,3,4,5}и и(/) = 1,
для всех подмножеств, включающих {1,2} или {4,5} , и v(S) =0 для всех
остальных S.
а. Определить множество всех дележей М (у).
б. Показать, что ядро имеет вид
С={хеЛ/(и): хх + х2 =У2,
Х4 +*S =^2> Х2 +Х3 +*4 Ж).
в. Показать, что единственное устойчивое множество имеет вид
K = M(v) - { х:у > х для некоторого уеС} =
= {xeAf(u): хх +х2 =Уг, хг =0, х4 + xs -Уг).
21* (A. Tucker). Рассмотрим характеристическую функцию и из упражнения 6
§ 6.1. Показать, что объединение следующих двух множеств является устойчивым
множеством для v:
{(vt,xa,0,3;0,4): хх +х2 =0,3, хх >0, х2 >0},
{@,1;0,2;х3,х4): хъ +*4=0,7, хъ > 0, х4 > 0}.
22. (Berge [1962]). Показать, что в орграфе D устойчивое множество S
оказывается и максимальным внутренне устойчивым множеством2).
23. Показать, что в орграфе D устойчивое множество S оказывается и
минимальным внешне устойчивым множеством. ^
24. (Berge [1962]). Показать, что утверждение, обратное результату упражнения
22, в общем случае неверно.
25. (Berge [1962]). Доказать утверждение, обратное полученному в
упражнении 22, для симметричного орграфа, т.е. орграфа содержащего обе дуги из у в х
низ х в у одновременно.
26 (Нагагу, Norman, Cartwright [ 1965].) Множество вершин В орграфа D
называется п-покрытием, если каждая вершина D достижима из некоторой вершины в
') Следует предостеречь читателя: в ряде публикаций по теории игр устойчивое
множество этой игры некоторыми авторами определяется неверно.
*' Предполагается, что все орграфы в упражнениях этого параграфа конечны.
336
В самое большее за п шагов, л-покрытие называется п-базой, если в В нет вершины,
достижимой из любой другой вершины из В менее, чем за п + 1 шаг. Таким образом,
внешне устойчивое множество есть 1-покрытие, а устойчивое множество — 1-база.
Доказать, что каждая «-база есть минимальное «-покрытие. Этим обобщается
утверждение из упражнения 23.
27 (Нагагу, Norman, Cartwright [1965].) Показать, например, что в орграфе
может иметься «-база, но может отсутствовать (п + 1)-база.
28 (Berge [ 1962]). Пусть число внутренней устойчивости a (G) графа G
определяется, как размер наибольшего внутренне устойчивого множества в G, если G
представлять орграфом, имеющим дуги из хвуипзувх вместо каждого ребра
{х, у). Показать, что a (G) x (G) > п, где х (G) - хроматическое число графа G
(см. § 3.6) 1).
§ 6.4. Существование непустого ядра
Подход, основанный на изучении ядер, дает возможность ввести
обоснованное понятие решения игры. Часто можно ограничиться рассмотрением
лишь тех дележей, которые находятся в ядре. К сожалению, как мы видели,
ядро может быть пустым. Одна из задач теории игр «лиц состоит в
доказательстве теорем о существовании или отсутствии ядра. (По принятому
нами соглашению существование ядра означает, что оно непусто.)
Понятие ядра может вводиться и в случае произвольных орграфов, а
не только для орграфов эффективного предпочтения, описывающих игры
в форме характеристической функции. Ядром является множество всех
вершин орграфа с полустепенями захода, равными 0. Таким образом,
теоремы о существовании ядра можно найти и в теории орграфов.
(Конечно, часто будет более уместно рассматривать орграфы на бесконечных
множествах, если множество исходов заранее не ограничено тем или иным
способом.) Нам известны некоторые теоремы о существовании вершин
с полустепенями захода, равными 0. В частности следствие из теоремы 2.8
утверждает, что каждый (конечный) бесконтурный орграф имеет такие
вершины, а значит, и ядро. К сожалению, орграф эффективного
предпочтения нередко содержит контуры. В действительности может даже оказаться,
что х >• у и у >- х. Например, если п = 5,
и({1,2» = и({3,4»=1/2, х = A/4,1/4,1/6,1/6,1/6)
и у = A/6, 1/6,1/4,1/4, 1/6), то х >{и2}у и у>(з,4>х.
Теоремы из теории орграфов более полезны при доказательстве
существования и единственности устойчивых множеств, а не ядра. В этом можно
будет убедиться в следующем параграфе. Здесь же мы попытаемся
исследовать вопрос о существовании ядра другими способами.
Напомним читателю, что характеристическая функция должна быть
супераддитивной, т.е. удовлетворять условию
v(SU T)>v(S) + v(T), если SDT=<t>.
Если здесь всегда достигается равенство, то характеристическая
функция v называется аддитивной, а игра — несущественной. Таким образом, v
*' Понятие внутренне устойчивого множества вводится непосредственно и для
графа как множество вершин, не соединенных ребрами, так что переход к орграфу
становится тогда излишним. В терминологии, принятой в гл. 3, внутренняя
устойчивость тогда эквивалентна независимости (см. сноску3), с. 143). (Примеч. пер.)
22. Ф.С. Роберте 337
определяет существенную игру тогда и только тогда, когда имеются такие
непересекающиеся коалиции S и Г, что v(S UT) >v(S) + и(ГI).
Взвешенная мажоритарная игра B; 1, 1, 1), конечно, существена, тогда как
игра E1; 51, 48, 1) несуществена. Игра v называется игрой с постоянной
суммой, если v(S) + v(I- S) = v(I) для всех S.
Таким образом, все несущественные игры оказываются играми с
постоянной суммой, но не наоборот. Игра B; 1,1,1) является существенной
игрой с постоянной суммой. Первая теорема обобщает полученный ранее
результат о том, что игра B; 1,1,1) не имеет ядра.
Теорема 6.2. Если v - существенная игра с постоянной суммой, то и
не имеет ядра.
Доказательство. Пусть х= (х1э х2, ..., хп) есть некий дележ.
Читатель может легко проверить (см. упражнение 12), что в существенной
п п
игре v(J) > 2 v({i}). Поскольку 2 jc/ = u(J), для некоторого / полу-
i=i /=i
чаем, что v({j}) < х^ Далее, так как рассматривается игра с постоянной
суммой, то п
Таким образом, v(I\{j}) > 2 х* и теорема 6.1 означает, что х не
входатв ядро. ¦
Необходимо сделать одно замечание об играх, не имеющих ядер. В такой
игре коалиция может быть вынуждена согласиться на меньшее, чем она
могла бы получить. Это происходит из-за того, что игроки входят в
несколько коалиций и в каждой подтверждают свою лояльность. В играх с
ядром имеется способ удовлетворения сразу всех коалиций. В играх без
ядер такого способа может не оказаться.
Вернемся теперь к общей игре с тремя игроками.
Теорема 6.3. В существенной игре трех лиц v ядро существует тогда
и только тогда, когда
Доказательство. Докажем теорему для специального случая,
когда и(Ш) =и({2}) =и({3}) =0 и у({1, 2,3}) = 1. В § 6.6 мы увидим,
что каждая существенная игра может быть сведена к такой форме (так
называемой @,1)-нормальной форме, или @, 1)-нормализации), и поэтому
будет справедлива более общая теорема (см. упражнение 23 §6.6).
Применим теперь теорему 6.1. Неравенство A0) в теореме 6.1 всегда выполнено
для дележей х= (xiy х2, х3) в коалициях S с \S\ = 1 или |5| =п. Таким
образом, х удовлетворяет неравенству A0) для всех S тогда и только
тогда, когда
и(П,3}), C1)
х2 +>(B3»
0 Читателю следует отличать существенную игру от существенной коалиции,
которую мы определили в упражнении 12 § 6.1.
338
Складывая эти три неравенства и используя соотношение Xi + х2 + х3 = 1,
получим, что если х принадлежит ядру, то
». C2)
Обратно, пусть справедливо неравенство C2). Покажем, что тогда ядро
непусто. Предположим сначала, что по крайней мере две из трех величин
и({1, 2», 0({1, 3}) и и({2, 3» меньше, чем V4, например, и({1, 2» < гА
и и({1, 3» < Vi. Тогда, поскольку и({2, 3}) <1 (почему?), дележ (О,
Й, Й) удовлетворяет неравенствам C1) и потому входит в ядро.
Допустим теперь возможность самое большее для одной их трех величин
у({1,2}), и({1,3}) и и({2, 3}) быть меньше, чем Йэ например, v({ 1,2}) >
Ж, v({l,3))>ft. В таком случае у({1, 2»+и({1, 3}) > 1. Мы можем
положить
Тогда x»(xi, Хг, *з) — дележ (почему?) и, используя неравенство
C2), получаем, что х удовлетворяет неравенству C1). Поэтому х
принадлежит ядру. ¦
Теорема 6.3 дает еще одно доказательство отсутствия ядра во
взвешенной мажоритарной игре B; 1, 1, 1), впрочем, как и в любой существенной
игре трех лиц с постоянной суммой.
Необходимые и достаточные условия существования ядра, обобщающие
теорему 6.3, были получены Бондаревой (Бондарева [1962, 1963]) и
Шепли (Shapley [1967]). Мы не приводам их здесь.
Множество векторов К в пространстве <ft" называется выпуклым, если
для х€ К, у € К и а из отрезка [0, 1] вектор ах+ A - а) у Е К. Легко
показать, что ядро выпукло. По теореме 6.1, если х и у содержатся в ядре,
то для всех S Фф
а J Х/ + A— а) 2
tes i<=s
Таким образом, вектор ах+ A —a) у принадлежит ядру. Это
замечание поможет нам сформулировать условия существования ядер в
симметричных играх, т.е. таких играх, для которых v(S) — характеристическая
функция - зависит лишь от |5|. (Игры "Чистые торги", "Мусор", "Озеро"
B; 1, 1, 1) и E1; 49,48,3) симметричны.) Пусты; - характеристическая
функция симметричной игры, * = |S I, а / - действительно-значная функция
на {0, 1, 2, ...,«}, значение которой /(s) = v(S). Если ядро
существует, то оно симметрично, т.е. дележ (хх, х2, . ¦., хп) принадлежит ядру
тогда и только тогда, когда и (*„(!), *лB)> •••> хп(п)) принадлежит
ядру для всех перестановок тг множества A, 2, ..,, п}1). Если ядро
непусто, то из его симметричности и выпуклости следует, что оно содержит
и дележ х= (f(n)ln9f(ri)ln9 ...,/(«)/«). Таким образом, ядро существует
в том и только в том случае, если содержит этот дележ х. По теореме 6.1
!) Перестановкой называется взаимно однозначное отображение множества на само
себя. Ее можно представить как введение на множестве нового порядка или
изменение наименований элементов.
22* 339
х принадлежит ядру тогда и только тогда, когда для всех s > 0 справедливо
соотношение
-/(")>/(*)• C3)
п
Сформулируем этот результат в виде теоремы.
Теорема 6.41). Пусть v — характеристическая функция симметричной
игры и f(s) = u(S) для коалиции S с IS | = s. Тогда ядро для v существует
тогда и только тогда, когда при всех s = 1, 2,..., п
- /(*)>/(*)• C4)
п
Например, в игре "Чистые торги"
d> если s = и,
1 0, если s < я.
Тогда C3) выполняется для всех s > 0. Для взвешенной мажоритарной
игры B; 1,1,1) имеем
f(s)
1 0, если s < 2.
В этом случае C3) нарушается при s = 2.
В игре "Мусор"
— (и — s), если s < и,
—я, если 5= я.
Если л>2,то C3) не выполняется для любого такого s, что п/2< s< п.
Если я = 2, то C3) справедливо при каждом s > 0.
Наконец, в игре "Озеро" неравенства C3) выполняются для каждого
s > 0. Доказательство предоставляется читателю в качестве упражнения
(см. упражнение 7). Таким образом, в отличие от игры "Мусор" в игре
"Озеро" ядро есть. Предприятия имеют возможность достигнуть
соглашение об очистке сточных вод, так как при его нарушении ни одна коалиция
не может быть уверена в лучшем исходе. К сожалению, ядро здесь настолько
велико, что дает мало информации о соответствующем соглашении 2).
Упражнения
1. Привести пример орграфа с 10 вершинами, не имеющего ядра.
2. Какие из следующих игр являются существенными?
а. E1; 60,30,10).
б. "Чистые торги" (пример 1 § 6.1).
в. Игра "Землепользование" (пример 3 § 6.1).
г. E1; 40,30,30).
3. Какие игры из упражнения 2 имеют постоянную сумму?
*) Эта теорема принадлежит Шепли (не опубликована) и должна появиться в
предстоящем отчете Рэнд,
О Продолжить изучение этих вопросов можно, используя работу Shapley, Shubik
[1969b].
340
4. Для произвольного п привести пример игры с п игроками в случае
несущественной игры (а) и существенной игры (б).
5. Привести пример игры в форме характеристической функции с бесконтурным
орграфом эффективного предпочтения, имеющим не менее двух вершин.
6. Имеют ли игры и, определяемые ниже, ядро при л = 3?
а. и, определяемая соотношением G).
в. и({1, 2}) = и({1, 3}) « и({2, 3}) =3/2, остальные значения, принимаемые и,
определяются также, как в п. б.
7. Доказать, что в игре "Озеро", неравенство C3) выполнено для каждого s > 0.
8. Имеет ли игра E1; 49, 48, 3) ядро?
9. Имеет ли игра "Почта" (упражнение 3 § 6.1) ядро?
10. Пусть v(S) = [s/2], где s = \S\ и [х] - целая часть х (наибольшее целое, не
превосходящее х). Имеется ли ядро? Зависит ли ответ от л? Если зависит, то каков
вид зависимости?
11. Описать все возможные простые игры трех лиц и применить теорему 6.3, чтобы
выяснить в каких из них есть ядро?
12. Доказать, что игра v существенна тогда и только тогда, когда
п
v(I)> 2
1 = 1
13. Привести пример несущественной игры с постоянной суммой, имеющей ядро.
14* (Shapley [1953b]). Игра и называется игрой с квотой (долевой игрой), если
имеется такой вектор k = (klt k2, ..., kn), что для всех /=?/, ?/ + ?/ = и ({/, /}) и
п
2 kf = v(I). Показать, что каждую игру четырех лиц с постоянной суммой можно
/ = 1
представить, как игру с квотой.
15*. Показать, что если в игре с квотой имеется ядро, то оно состоит в точности
из дележа к.
§ 6.5. Существование и единственность устойчивых множеств
Мы видели в § 6.3, что может быть более одного устойчивого множества,
в которые, кроме того, может входить несколько дележей. Длительное
время полагали, что, в отличие от случая ядра, некоторое устойчивое
множество игры в форме характеристической функции всегда существует.
Как показал Лукас (Lucas [1968, 1969]), это предположение оказалось
ошибочным.
Здесь будут приведены некоторые теоремы о существовании и
единственности устойчивых множеств. Первый результат (в основном
негативный) утверждает, что возможность существования единственного дележа,
составляющего все устойчивое множество, реализуется в очень
неинтересных, несущественных (в смысле данного определения) играх. Такой
единственный дележ мог бы быть выбран в качестве решения игры.
Теорема 6.5 (von Neumann, Morgenstern [1944]). Игра v в форме
характеристической функции обладает одноэлементным устойчивым множест-
зом В={х) тогда и только тогда, когда она несущественная. В таких
играх В является единственным устойчивым множеством.
341
Доказательство. Читателю следует заметить (см.
упражнение 12 § 6.4), что v есть несущественная игра тогда и только тогда, когда
п
2 и({/}) =v(l). Предположим, что v — несущественная игра. Тогда М(р)
состоит из единственного дележа (и({1)), у({2}), ..., v({n))). Этот
дележ и составляет устойчивое множество, которое, конечно, единственно.
Обратно, пусть v - существенная игра с одноэлементным устойчивым
множеством В = {х}. Имеем
? *, = »(/)> 2
Таким образом, Xj>v({j}) для некоторого /\ Определим у следующим
образом:
*/-¦><{/»
7/ = JC/ + - , если гФ).
п- 1
Тогда у — дележ и у Ф х; поэтому из внешней устойчивости множества
1? = {х} следует, что х >- у. Предположим, что для коалиции S выполнено
х > s у. Тогда xt >yt для всех / ? S и, значит, 5 совпадает с {/}. Из
упражнения 15 § 6.2 известно, что эффективное предпочтение для
одноэлементных коалиций невозможное мы приходим к противоречию. ¦
Некоторые теоремы о существовании и единственности устойчивых
множеств могут быть доказаны в более общем виде для произвольных
орграфов, после чего полученные результаты переносятся на орграфы
эффективного предпочтения. (Конечно, следует помнить, что возможность
использования таких теорем в играх в форме характеристической функции
ограничена, если только они не обобщаются на бесконечные орграфы или
не применяются к конечным множествам дележей, выбранным заранее
некоторыми другими способами.)
Теорема 6.6 (von Neumann, Morgenstern). Каждому (конечному)
бесконтурному орграфу D соответствует единственное устойчивое множество.
Доказательство. Воспользуемся индукцией по |К|, где V -
множество вершин ?>, Результат очевиден, если \V\ =1. Пусть \V\ > 1.
По следствию к теореме 2,8 бесконтурный орграф имеет вершину с
нулевой полустепенью захрда. Положим
{u}U{x: (u,x) -дуга}.
Тогда подграф D' орграфа Z), порожденный множеством вершин V\Ri(u),
также бесконтурный и содержит меньше вершин, чем D. По
предположению индукции D' имеет единственное устойчивое множество В.
Докажем теперь, что В* =5и{м} — устойчивое множество в D. Для этого
заметим, что В' внутренне устойчиво, поскольку полустепень захода и
равна О, В не содержится в R\(u) и В внутренне устойчиво в D'. Далее
В' внешне устойчиво, так как любая вершина х, не входящая в В\
достижима за один шаг либо из и, либо из некоторой вершины в В. Наконец,
покажем, что В* — единственное устойчивое множество орграфа D. Пусть
342
8 ®
Рис. 6.5. Процедура нахождения устойчивого множества В в бесконтурном орграфе.
Вершина, выбираемая на каждом этапе, окружена штриховой границей.
В = {1,4, 5, 7, 9}
В" также устойчиво в D. Полустепень захода вершины и равна 0,
поэтому и€В". Из свойства внутренней устойчивости следует, что В"\{и) С.
С V\Ri(u)9 откуда В"\{и) _ множество вершин подграфа D\ Оно,
конечно, внутренне устойчиво в D'. Это множество также внешне устойчиво
в D\поскольку вершина х из Уф1) \(В"\{и\) достижима за один шаг
из некоторой вершины в В" и этой вершиной не является и. Мы получаем,
что множество В"\{и) устойчиво в D', и поэтому по предположению
индукции В " \ { и } совпадает с В. ¦
В доказательстве предлагается конструктивная процедура нахождения
в бесконтурном орграфе единственного устойчивого множества В. Она
иллюстрируется рис. 6.5. На первом шаге выбираем вершину с
полустепенью захода, равной 0; ею оказывается вершина 1, помещаем ее в В.
Пусть орграф /У порожден вершинами из V(D)\Ri(l). Возьмем
некоторую вершину с полустепенью захода в D1 равной 0, например вершину 4,
и добавим ее к В. Пусть орграф D" порожден вершинами из V (D1) \RX D).
Выберем некоторую вершину с полустепенью захода в D", равной 0,
например, вершину 5. Этот процесс продолжается и далее. В результате получаем
в D единственное устойчивое множество A,4,5,7,9).
Теорема 6.7 (Harary, Norman, Cartwrigth [1965]).Каждый (конечный)
сильно связный орграф Z), в котором содержится более одной вершины
и нет нечетных контуров, имеет не менее двух устойчивых множеств.
Доказательство. Теорема 3.13 (теорема Кенига о 2-раскрашивае-
мых графах) утверждает, что если в неориентированном графе нет
нечетных циклов, то его вершины можно разбить на два класса таким образом,
что каждое ребро графа соединяет вершины из разных классов.
Аналогично доказывается, что вершины сильно связного орграфа D без нечетных
контуров можно разбить на два класса V\ и V2 таким образом, чтобы
каждая дуга D соединяла вершины двух различных классов. (Для определения
343
Vx и V2 вьдберем любую вершину х и поместим ее в Vx. Тогда множество Vx
образуют все вершины у, которые можно достичь из х по пути четной
длины, а множество V2 — все остальные вершины. Доказательство, что это
построение приводит к нужному результату, представляется читателю (см.
упражнение 12).) Поскольку орграф D сильно связен и имеет более одной
вершины, Vx и V2 непусты. Легко показать, что Vx и V2 — устойчивые
множества. ¦
Доказательство теоремы 6.7 дает нам конструктивную процедуру
нахождения устойчивого множества в сильно связном орграфе D без нечетных
контуров. Для этого используются множества Vx и V2, строящиеся так же,
Рис. 6.6. Сильно связный орграф без
нечетных контуров. Множества Vi = {1, 2, 3}
и V2 = {4, 5 } устойчивы
как в доказательстве. В орграфе на рис. 6.6, например, выберем в
качестве * .вершину 1. Тогда Vx = {1, 2, 3} и V2 = D, 5}, Оба множества
устойчивы.
Теорема 6.8 (Richardson [1946]). Каждый конечный орграф D без
нечетных контуров имеет устойчивое множество.
Доказательство. Будем определять по шагам два множества
вершин В и С, первое будет устойчивым множеством, а второе его
дополнением. Пусть D* — конденсация сильных компонент/) (см. § 2.3).
Известно, что в D* нет контуров (см. теорему 2.7), и поэтому в Dнайдется силь-*
ная компонента Кх,имеющая в D* полустепень захода, равную 0.
Поскольку в Кх нет нечетных контуров, теоремы 6.6 и 6.7 означают, что в Кх есть
устойчивое множество Вх. Включим все вершины из Вх в В, а все вершины,
достижимые дугой из D хоть из одной вершины Вх, включим в С. Пусть
подграф Dx орграфа D порожден всеми вершинами D, не вошедшими ни
в В, ни в С. Повторим процесс для D\ и будем продолжать его до тех пор
пока все вершины из D не окажутся в В или в С.
Покажем теперь, что В — устойчивое множество. В множестве С
оказались лишь вершины, достижимые дугой из В. Следовательно, В внешне
устойчиво. Далее ни одна вершина в множестве В не смежна с любой другой
вершиной из него, так как мы всегда включали в В вершины из внутренне
устойчивого множества, не достижимые дугами из вершин, ранее
помещенных в В. Таким образом, множество В также внутренне устойчиво. ¦
Процедуру построения устойчивого множества В, рассмотренную в
доказательстве теоремы 6.8, легко проиллюстрировать на примере. На рис. 6.7
показаны последовательный выбор множеств К{, Bf и С/ и орграфы Dt.
Do совпадает с D. Ki+1 есть сильная компонента в конденсации
орграфа Di с полустепенью захода, равной 0. Bi+X — устойчивое множество в
Ki+l. Ci+l состоит из всех вершин D/, достижимых дугой из D хотя бы
из одной вершины, содержащейся в Bi+i. Наконец, подграф Di+X оргра-
344
фа D порожден теми вершинами из D, которые не входят ни в Bi+i, ни
в Q+1. Таким образом, множество Z? = U Bt устойчиво.
Как мы уже отмечали ранее, для различных игр в форме
характеристической функции теоремы типа теоремы Ричардсона должны применяться к
предварительно выбранным конечным множествам дележей или же в
противном случае доказываться для бесконечных орграфов. Теорему
Ричардсона в свою очередь можно доказать для некоторых классов бесконечных
орграфов — так называемых локально конечных и вполне индуктивных
орграфов (см. Berge [1962, с. 58]).
Теоремы, подобные уже доказанным, применяются к орграфам с
некоторыми специальными структурными свойствами. Другие теоремы о
существовании и единственности устойчивых множеств могут быть доказаны при
специальных допущениях о характеристической функции v. Мы
проиллюстрируем это, доказав теорему для и, определяющих простые игры, т.е. игры,
каждая коалиция в которых имеет цену 1 (выигрыш) или 0 (проигрыш).
Теорема 6.9. В каждой простой игре существует устойчивое множество.
В частности, для каждой минимальной выигрывающей коалиции S
/<^^
10
14
6 5
3 8 Щ 4
6
10
-*•
[13
D =подграш, порожденный
1 множество» вершин
о -^ = подграф,портденныи
{11,12,13,1М } множеством вершин
{6,7,8,9,10,11,12,13,14)
. !
7,5}
^?3= подграф,порожденный
множеством вершин
{11,12,13,*}
{
{11,13}
[12,1М}
Д»= <Lnyс той» подграф
B3VBf {2,4,7,9,11,13}
Рис. 6.7. Построение устойчивого множества 5 в орграфе без нечетных контуров
345
множество
Bs = {xeM(v): x/ = 0, если i$S) C4)
устойчиво.
Доказательство. Если выигрывающих коалиций нет, то v (S) = О
для всех St и потому вектор @, 0, ..., 0) - единственный дележ. Он и
составляет одноэлементное устойчивое множество. При наличии
выигрывающей коалиции определим для такой минимальной коалиции S
множество Bs соотношениями C4). Если хиу входят в В$ , то любое
множество Г с такими /, для которых л:,- >>>,-, есть подмножество в S.
Действительно, поскольку
Z х{ = 2 у, = 1,
i G S iGS
T должно быть собственным подмножеством S. Из
минимальности S, v ( Г) = 0 и для Т нет отношения эффективного предпочтения. Это
доказывает, что Bs внутренне устойчиво. Далее, пусть дележ х не
принадлежит Bs. Тогда 2 Х( < 1. Изменим значения */ (/ ? 5 ) на величины Д /,
/65
удовлетворяющие условию 2Д/ = 2 х/, так, чтобы получить в В$
i $ S
дележ у, эффективно более предпочтительный для S, чем х. Таким
образом, множество Bs и внешне устойчиво. ¦
Применим эту теорему ко взвешенной мажоритарной игре B; 1, 1, 1).
В качестве одного из устойчивых множеств возьмем, например,
^{1,2} =И*ь*2,0): *i>0, x2>0, хх +х2 = 1}.
(Читатель должен обратить внимание, что это множество совпадает с
множеством Вс , определенным в B8), при с = 0.) Устойчивые множества
вида Bs называются дискриминирующими решениями, в них некоторые
игроки исключены.
Упражнения
1. Показать, что взвешенная мажоритарная игра B; 1,1,1) не имеет
одноэлементного устойчивого множества.
2. Привести пример игры с одноэлементным устойчивым множеством.
3. Найти единственное устойчивое множество для каждого из изображенных
на рис. 6.8 орграфов.
4. Использовать процедуру, примененную в доказательстве теоремы 6.7, для
нахождения устойчивого множества каждого из орграфов, изображенных на рис. 6.9.
5. Найти устойчивые множества для каждого из орграфов, приведенных на
рис. 6.10.
6. Найти дискриминирующее решение для взвешенной мажоритарной игры E1;
51,48,1).
7. Найти дискриминирующее решение для взвешенной мажоритарной игры E1;
50,30,20).
8. Найти дискриминирующее решение для игры "Заседание комитета** (см.
упражнение 10 § 6.1). Пояснить результат.
9. Найти все дискриминирующие решения для взвешенной мажоритарной игры
E; 1,1,1,2,3).
346
а 6 \ю
Рис. 6.8. Орграфы к упражнению 3 § 6.5
а 6
Рис. 6.9. Орграфы к упражнению 4 § 6.5
14 15 16
CL 6 /5с
Рис. 6.10. Орграфы к упражнению 5 § 6.5
10. Показать, что два устойчивых множества орграфа не обязаны иметь одинаковое
число вершин.
11. Привести доказательство или противоречащий пример для следующего
утверждения: если в (конечном) орграфе D нет нечетных контуров, то либо D -
бесконтурный орграф, либо в нем имеется не менее двух устойчивых множеств.
12. Доказать, что вершины (конечного) сильно связного орграфа D без нечетных
контуров можно разбить на два класса так, что каждая дуга из D соединяет вершины
разных классов.
13. (Нагагу, Norman,Cartwright [1965]). Показать, что в (конечном) сильно
связном орграфе существует не более одного разбиения множества вершин на такие два
множества, что, если вершины и и и соединены дугой, то они находятся в разных
множествах (которые, следовательно, устойчивы).
347
14. (Harary, Norman, Cartwright [1965]). Доказать, что если В — устойчивое
множество в (конечном) сильно связном орграфе D с множеством вершин V (D), то
множество V (D) \В внешне устойчиво. Верно ли это утверждение без предположения
о сильной связности D1
15. (von Neumann, Morgenstern [1944]). Пусть и определяет простую игру с
постоянной суммой и для вектора х*= (х *, x*t..., xjj) выполнены соотношения
х* > О для всех/
х* = 1 для всех минимальных выигрывающих коалиций 5.
Пусть для каждой минимальной выигрывающей коалиции S имеем дележ хE)
( )
¦it
>,где
если i e S,
если
Тогда (x(iS) : S - минимальная выигрывающая коалиция } образует главное простое
решение игры. Найти главное простое решение для следующих игр.
а. Существенная простая игра с постоянной суммой.
б. Взвешенная мажоритарная игра C; 1,1,1,2).
в. Взвешенная мажоритарная игра F; 1,1,1, 2, 3, 3).
г. (A.Tucker). Игра с постоянной суммой 5 лиц, в которой минимальными
выигрывающими коалициями служат все трехэлементные, коалиции.
16. (von Neumann, Morgenstern [1944]). Доказать, что главное простое решение
(если оно существует), всегда является устойчивым множеством.
17. (von Neumann, Morgenstern [1944]). Взвешенная мажоритарная игра (Q, кх,
п
к2, .... кп) называется однородной, если L fc/ = 2fi - 1, и для каждой
минимальной выигрывающей коалиции S имеем
2 *, = Q.
Показать, что каждая однородная взвешенная мажоритарная игра имеет главное
простое решение.
§ 6.6.5-эквивалентность и @,1)-нормализация
6.6.1. Изоморфизм и 5-эквивалентность. Рассмотрим две
характеристические функции v и у' на одном множестве игроков / ={1, 2, ...,и}.
Будем говорить, что игра (функция) v изоморфна игре (функции) t/,
если существует такое взаимно однозначное отображение / множества
дележей М (и) наМ(у'), что для всех х, у ЕМ (и) и всех коалиций S
отношение х У8 у выполняется тогда и только тогда, когда
/(Х).^/(У). C5)
Мы будем называть отображение / изоморфизмом из игры у в игру и'.
Легко показать, что если функция v изоморфна v\ то и vr изоморфна v.
Отображение Z также является изоморфизмом. Таким образом, можно
348
говорить об изоморфизме v и и'без упоминания о направлении
изоморфизма. Возьмем в качестве примера следующую игру v' на множестве
игроков {1,2,3} :
ГО, если \S\ =0 или 1,
v'(S)=\ C6)
12, если |5| = 2 или3.
Тогда характеристическая функция v взвешенной мажоритарной игры
B; 1, 1,1) изоморфна у'. Здесь
М(у)={х: xi >0, х2>0, x3 >0, Xi+x2+x3 = 0 ,
и
M(v') = {x: Xi >0, х2 >0, хэ>09 хх +х2 + х3 =2}.
Если Дх) = 2х, т.е. Дхь х2, х3) = Bхь 2х2, 2х3), то / есть отображение
M(v) наЛ/(у;). Кроме того, отношение (xi,x2,x3) >s Gь .Уг, .Уз) верно
(для и) тогда и только тогда, когда B*i, 2х2, 2х3) >$ Byi9 2y>2, 2у3)
(для v'). Таким образом, / есть изоморфизм.
Ясно, что изоморфные игры имеют изоморфные ядра и семейства
устойчивых множеств. Другими словами, если С — ядро или устойчивое
множество для и, а/ - изоморфизм из vbv\ to f(C) = {/(х): х G С } есть
соответственно ядро или устойчивое множество для v'. Например, в § 6.3 было
показано, что
В = { 04, й, 0), 04, 0, J4), @, й, Й)> C7)
есть устойчивое множество игры B; 1,1,1). Тогда
= {A,1,0), A,0,1), @,1,1)}
есть устойчивое множество в игре у', определенной соотношениями C6).
С точки зрения теории игр изоморфные игры во многих отношениях
равнозначны ).
В этом параграфе мы покажем, что все "интересные" игры в форме
характеристической функции изоморфны играм, характеристические
функции которых удовлетворяют очень простым условиям, а именно:
u( {i} ) = 0 для всех / C8)
И о(/) = 1. C9)
Характеристическую функцию, удовлетворяющую C8), называют
^•нормализацией, а если выполнены условия C8) и C9) — то @, 1) -нормали-
1) Однако они не вполне взаимозаменяемы. В работе Shapley, Shubik [1969a]
показано, что существуют изоморфные игры, одна из которых "вполне сбаланси-
рованна", а другая нет. (Игра вполне сбалансированно, если каждая подыгра, т.е.
сужение игры на подмножество /, имеет ядро). Возможен также случай, когда
изоморфизм не обязательно сохраняет цену Шепли, представляющую еще один вид
решения, которое мы введем в следующем параграфе. Шепли и Шубик [1969а] показали
что если и является, так_называемой "сбалансированной игрой", то существует
изоморфизм / из v в и, где v - "покрытие" игры и. Однако цена Шепли v не
обязательно совпадает со значениями / для цены Шепли и.
349
зацией. Характеристические функции в О-нормальной форме имеют ряд
интересных свойств.
Теорема 6.10. Бели характеристическая функция v является 0-нормали-
зацией, то
a. v(S) > 0 для всех 5,
6.5 С T=>v(S)<v(T).
Доказательство. Используя условие супераддитивности B) и
определение 0-нормализации, получаем
Часть а теоремы можно доказать индукцией по 5, учитывая, что и(ф) = 0.
Утверждение б следует из части а, поскольку v(T\S) > 0, а значит,
v(T) > v(S) + v(T\ S) > v(S). ¦
Напомним, что игра v называется существенной, если имеются
непересекающиеся коалицииS и Т9 для которых v(SUT)>v(S) + v(T). Покажем,
что каждая существенная игра эквивалентна игре в @, 1)-нормальной
форме. Для этого введем понятие стратегической эквивалентности, или
s-эквивааентности, двух характеристических функций у и и'на одном
множестве игроков /. (Не путать s с обозначением для коалиции.) Будем
говорить, об ^эквивалентности игры у игре t/, если найдутся такие
действительные числа сьа2,...,^и положительное действительное число
а, что
а( D0;
для всех коалиций 5.
Если игра г/ s-эквивалентна игре и, то можно представить себе, что v'
получается из v следующим образом. Перед игрой каждому игроку
выплачивают сумму п( и затем единицы, в которых эти платежи измеряются,
изменяют путем умножения всех платежей на а. Для примера рассмотрим
следующую характеристическую функцию и:
D1)
= 3, u(U,3»-3, u({2,3}) = 4,
Выберем ei=l, a2 =0, а3 =2 и а = 2. Тогда, функция и',
удовлетворяющая D0), имеет следующий вид:
»'({*))-0,
350
= 15.
Другой пример «-эквивалентных игр дают игры "Чистые торги" и
"Угроза" (см. примеры 1 и 2 § 6.1) при d = 2 w0 Почему?
s-эквивалентные игры обладают следующими свойствами.
Игра v s-эквивалентна самой себе. D2)
Если vr 5-эквивалентна v, то v s-эквивалентна и'. D3)
Если v и и', v и v" «-эквивалентны, то v «-эквивалентна и". D4)
В терминологии теории отношений (см. упражнение 20 § 8.2)
«-эквивалентность является отношением эквивалентности. Проверка свойств
D2) — D4) предоставляется читателю в качестве упражнений (см.
упражнение 16).
Теорема 6.11. Каждая существенная игра «-эквивалентна игре в
@,1)-нормальной форме.
Доказательство. Пусть v - характеристическая функция
существенной игры. Положим в/ = — и( {/)) и зададим и' в виде
2 а/.
Далее функция v' является 0-нормализацией и «-эквивалентна и. Кроме
того, v (I) > 0 (это следует из упражнений 18 и 19). Наконец,
определяет характеристическую функцию, которая «-эквивалентна v и
является @,1) -нормализацией. ¦
Следствие 1. Каждая игра «-эквивалентна игре в @,1)-нормальной
форме.
Доказательство следствия 1 следует непосредственно из доказательства
теоремы 6.11.
Следствие 2. Существенная игра v «-эквивалентна единственной игре и"
в @,1)-нормальной форме, имеющей вид
1
2 ««/»]. D5)
/5
/ = 1
Доказательство предоставляется читателю (см. упражнение 20).
Если v существенная игра, то единственная игра в
@,1)-нормальной форме, «-эквивалентная и, называется @,1) -нормализацией v .
Например, игра у, определяемая соотношениями D1),существенна. Ее
@,1)-нормализацию можно получить, используя следствие 2. Она имеет вид
v"(S) = Oi если |5 | = 0 или 1,
i/'({l,2»=: й, и"({1,3}) = 0, и"({2,3})= И,
351
Следующая теорема завершает доказательство изоморфизма каждой
существенной игры игре в @,1)-нормальной форме.
Теорема 6.12. Две s-эквивалентные игры изоморфны.
Доказательство. Пусть v и v' s-эквивалентны и удовлетворяют
D0), и а = (дь а2,. .., ап). Определим / на M(v), полагая Дх) = ах + а.
Изоморфизм/проверяется непосредственно (см. упражнение 22). ¦
Утверждение, обратное теореме 6.12, было доказано Мак-Кинси
(McKinsey [1950]) для специального класса существенных игр,
называемых играми с нулевой суммой. Такая игра удовлетворяет равенству
v(S) + v(I\S) = 0 для всех 5.
(Игры с нулевой суммой образуют специальный класс игр с постоянной
суммой.)
Теорема 6.13 (McKinsey). Изоморфные характеристические функции и
и v' существенных игр с нулевой суммой s-эквивалентны.
Доказательство теоремы 6.13 значительно труднее, чем теоремы 6.12.
Хорошее изложение доказательства имеется в книге Бержа (Berge [1957]).
По-видимому, теорема 6.13 справедлива1), и если не предполагать, что
игры — существенные и имеют нулевую сумму, однако автору не известно
опубликованного доказательства.
При помощи @,1)-нормализации, можно определять ядра и устойчивые
множества для многих игр. Мы уже воспользовались этим в игре г/,
определяемой условием C6). Для у'игра B; 1, 1, 1) является
@,1)-нормализацией. (Почему?) Было показано, как найти устойчивое множество для
и', зная устойчивое множество В, определенное C7) для игры B; Г, 1,1).
В качестве второго примера рассмотрим игру v трех лиц "Мусор". Для
нее, если IS I = 1, то v(S) = — 2. По следствию 2 к теореме 6.11
@,1)-нормализация имеет вид
3 /65 3 »G5\3
Таким образом,
0, если |5|<1,
1, если \S\>2.
Читатель снова узнает в v" взвешенную мажоритарную игру B; 1,1,1).
Одно устойчивое множество для v" задается множеством В, определенным
C7). Его легко преобразовать в устойчивое множество для игры трех лиц
"Мусор" v.
Возьмем в качестве а = (аг, а2, а3) вектор B/3, 2/3, 2/3) и
пусть /(у) = A/3) у + а, где у = (у1,Уг,Уз). Тогда из упражнения 22
следует, что / есть изоморфизм игры v в игру v". Поэтому В' ={у: /(у) ?
в В} = f1 (В) определяет устойчивое множество для и. Заметим, что соот-
*) Л.С. Шепли (личное сообщение).
2) Е г/ = г | 5 |. (Примеч. пер.)
S
352
ношение A/3) у + а = z эквивалентно у = 3z - За, так что / 1{г) = 3z - За.
Далее,
Г1 [A/2,1/2, 0)] = 3A/2, 1/2, 0) - 3B/3, 2/3, 2/3) = (- 1/2, - 1/2, - 2).
Аналогичными вычислениями ддя (&, 0, й) и @, И, й) получим
Это устойчивое множество имеет следующий смысл. Создается коалиция
из двух игроков. Два игрока договариваются выбрасывать каждый мешок
мусора во дворе третьего игрока и делить между собой тот мешок мусора,
который собирается оставить во дворе у одного из них третий игрок.
ОАО)
ОАО)
(Ш
@,0,0
D4)
Рис. 6.11. Пространство дележей для игры 3 лиц в @,1)-нормальной форме
Рис. 6.12. В квадратиках показано устойчивое множество В для взвешенной
мажоритарной игры B; 1, 1,1)
6.6.2. Геометрический подход. @,1)-нормализация приводит к весьма
полезному геометрическому представлению разнообразных множеств
дележей. Предположим, что и — игра в (ОД) -нормальной форме. Тогда
множество дележей задается следующим образом:
п
M(v) = { (xi, х2,..., хп)\ xt > 0 для всех /и 2 xt = 1} .
/ = 1
Если множество M(v) изображать множеством точек «-мерного евклидова
пространства,то оно определяет п-мерный симплекс, т.е.(и - 1)-мерный
многогранник или правильный л-вершинный многогранник, вершинами
которого служат п векторов A, 0, 0,. .. , 0), @, 1, 0,. . . , 0),..., @, 0,
0,. .., 0,1). (При п = 3 это равносторонний треугольник, при п = 4
правильный тетраэдр и т.д.) Пространство дележей состоит из всех течек на
границе и внутри правильного «-вершинного многогранника в «-мерном
пространстве, «-вершинный многогранник удобно изображать в (« - 1)-мерном
пространстве. На рис. 6.11 показано пространство дележей в игре трех лиц
в @,1) -нормальной формз и отмечено несколько дележей. Для нахождения
дележа (х\, х2,..., хп) применим следующий метод: найдем центр
тяжести, если для каждого i масса xt помещена в ш вершине, соответствующей
вектору @, 0,0,1,0,..., 0) с единицей на /-м месте.
При выделении ядер и устойчивых множеств целесообразно использовать
геометрический подход. Рассмотрим взвешенную мажоритарную игру
B; 1, 1, 1) в @,1)-нормальной форме . На рис. 6.12 изображено
устойчивое множество, определенное C7), а на рис. 6.13 — устойчивое множест-
23. Ф.С. Роберте 353
МАО)
(O,1tO)
x що)
Рис. 6.13. Прямая х9 = V* определяет устойчивое множество ВуА для взвешенной
мажоритарной игры B; 1.1,1)
Рис. 6.14. Ядро (ОД)-нормализации игры "Землепользование"
А
(ОАО то) (OAD (о±,1) (о,1,о) (Opoj)
Рис. 6.15. Устойчивые множества В и В^ для (ОД)-нормализации игры
'Землепользование"
Рис. 6.16. Устойчивое множество для (ОД)- нормализации игры "Землепользование"
во Вс, задаваемое B8) для с = 1/4. Оно представимо отрезком прямой,
состоящим из всех точек треугольника, для которых х$ = 1/4.
@,1)-нормализация игры "Землепользование" имеет вид
»(.«) = 0,
t,(U>) = u({2» = u({3}) = 0,
и({1,2>)=1/2, у({1эЗ»=1, и({2,3}) = 0,
Ядро игры в такой (ОД)-нормальной форме можно представить
отрезком, соответствующим множеству
и показанным на рис. 6.14. Устойчивое множество В, определенное B9),
соответствует множеству
В9 = {(х!,0,х3): 0<хх<\, Xl +х3 = 1),
а устойчивое множество Ву2 — множеству В[/г, которое является
объединением множества, определяющего ядро, и множества
соответствующего множеству Z)% из C0). Далее, Я' есть отдельный
отрезок, а В'к - объединение двух отрезков, как показано на рис. 6.15 *).
*) Чтобы убедиться, что множество D^ - отрезок прямой, заметим, что его можно
представить в виде хх = t9 х2 - 1/4 = —% t, хъ - 3/4 = - Уг t при 0 < t < Vi. Читатель
354
В более общем случае устойчивые множества для игры
"Землепользование" можно построить добавлением к ядру некоторых типов непрерывных
кривых. Пример такого устойчивого множества приведен на рис, 6.16. Для
дальнейшего изучения этого вопроса читателю рекомендуется работа
Shapley,Shubik[1973,p.61].
Упражнения
1. Найти такую игру v ", изоморфную игре B; 1,1,1), что v " (Г) = 3.
2. Для игры, построенной в упражнении 1, найти устойчивое множество.
3. В каких играх характеристическая функция 0-нормальна, а в каких
@,1)-нормальна?
а. "Чистые торга".
б. "Землепользование".
в. E1; 50,30,20).
4. Привести пример игры, нарушающей условия а и б теоремы 6.10.
5. Найти игру в @, 1) - нормальной форме, которая ^-эквивалентна игре ir,
определенной следующим образом:
и(ф) = 0,
= -3, v({2}) = -1, v({3}) = 0,
6. Найти игру в @, 1)- нормальной форме, ^-эквивалентную игре "Озеро" с
четырьмя игроками в следующих случаях.
а. 5 = 3, С = 2.
б. В * 2, С = 1.
7. Показать, что игра B; 1, 1, 1) есть @,1)-нормализация для игры,
определенной соотношением C6).
8. Найти 0-нормализацию игры, определенной следующим образом: v(S) = \S\.
Имеет ли эта игра @,1) -нормализацию? Объяснить ответ.
9. Найти @,1)-нормальную форму игры. "Мусор" с четырьмя игроками.
10. Доказать, что игра трех лиц "Мусор" изоморфна взвешенной мажоритарной
игре B; 1,1,1).
11. а. Доказать, что игры "Угроза" и "Чистые торга" s-эквивалентны.
б. Найти ядро и все устойчивые множества игры "Угроза" из соответствующих
решений игры "Чистые торга".
13. Используя ядро С, заданное в виде D6), получить еще раз выражение для
ядра игры "Землепользование".
14. Для игры трех лиц в @, 1)-нормальной форме представить геометрически
следующие дележи:
а. (У2,0, %),
б. @,99; 0,01; 0),
в. (Т.,1/*. W.
15. Для игры трех лиц в @, 1)-нормальной форме, дать геометрическое
представление следующих подмножеств множества дележей М{ и).
а. {(xux3,x9)(EM(v): Xl +х2 +х8 = l}.
б. {(*1,хя,хэ)еЛ/(и): *i = °> хг =0 ИЛИ ^з*0^
в. Устойчивое множество BCt определенное B8), при с = 0.
г. {(*,, х2, хг) <EM(v): х, > Уг).
узнает в этих соотношениях параметрические уравнения прямой в 3-мерном
пространстве.
23* 355
16. Доказать, что s-эквивалентность обладает свойствами D2) - D4).
17. (A.Tucker). Пусть и и v - 0-нормализованные характерические функции для
множеств лиц Я и / соответственно, Н п I = фш Определим w на Н и / следующим
образом: w (R и S ) = u{R) v(S) для любых RcHnScI.
а. Показать, что w - характеристическая функция на Я и /.
б. Обязательно ли игра w 0-нормализована (привести доказательство или
противоречащий пример) ?
в. Обязательно ли w - существенная игра, если кии существенны?
г. Обязательно ли w - простая игра, если и и v простые игры?
д. Всегда ли w можно представить, как взвешенную мажоритарную игру, если этим
свойством обладают игры и и и?
е. Имеет ли игра w непустое ядро, если ядра игр и и v непусты?
ж. Можно ли доказать пункт а, если не обязательно игры и и v 0-нормализован-ы?
18. Доказать, что если игры v и v9 ^-эквивалентны, то v* существенна тогда и
только тогда, когда существенна и.
19. Доказать, что для существенной игры и в 0-нормальной форме и(/) > 0.
20. Доказать следствие 2 теоремы 6.11.
21. Пусть v и v * - характеристические функции и для всех коалиций S
v'(S) = av(S)+ Б aiy
iS
где а>0. Определим Дх) = <*х + а, где & = (а1,а2,...,ап), а х = (х19х9,..*,хп)
-действительный вектор. Доказать, что х еЛ/(и) тогда и только тогда, когда f(x)€Af(u').
22. Доказать, что если игры v и и' s-эквивалентны и удовлетворяют соотношению
D0) при а > 0, а = (а1, а2,..., ап) и f(х) = ах + а, то / является изоморфизмом
и в и'.
23. Теорема 6.3 была доказана лишь для @,1)-нормальной игры. Применить
результат упражнения 22 для завершения доказательства теоремы.
§ 6.7. Цена Шепли
6.7.1. Аксиомы Шепли. В идеальном случае анализ игры в форме
характеристической функции должен был бы приводить к отбору конкретного
дележа, который и следовало бы принять за решение. Это и будет теперь нашей
целью. Однако ядро игры может быть пусто, устойчивое множество может
не существовать, а эти множества могут содержать более одного дележа;
поэтому, если необходимо выявить единственный дележ,мы вынуждены
воспользоваться иным подходом для построения решения. Мы будем здесь
придерживаться аксиоматического подхода, сопоставимого с теми, которые
применялись при аксиоматизации меры трофического статуса в п. 3.5.2 и
группового принятия решений в главе 7. Будет перечислен ряд
аксиом, которым должно удовлетворять наше понятие решения.
Решение считается приемлемым, если эти аксиомы выполняются. Аксиомы,
вводимые далее, незначительно отличаются от первоначально предложенных
Шепли ( Shapley [ 1953 а]); они основаны на аксиомах, излагаемых в
работе Шепли и Шубика (Shapley, Shubik [в печати]).
Пусть v - игра в форме характеристической функции. Мы будем искать
единственный дележ Ф [v ], называемый ценой Шепли, который и будет
служить решением игры. (Эта цена имеет смысл только для игр в форме
характеристической функции; считается, что она зависит лишь от
характеристической функции и.) Обозначим через Ф/[и] /-ю компоненту вектора Ф [v],
т.е. платеж игроку /. Предположим,что функция Ф[v] = (Фх [v], Ф2 [и],...
356
..., ФиМ) удовлетворяет нескольким аксиомам. Сформулируем сначала
первую. Пусть п - перестановка множества / = {1, 2, ..., п} *). Тогда для
каждой коалиции S = {ilf i2t ..., is), содержащейся в / 2), я5 есть
коалиция {тгО'О, 7г(/2), .... я(**)}.
Аксиома 1. Если и — характеристическая функция на множестве
игроков /, я — перестановка / и характеристическая функция w 3) определена
на / равенством и>E) = v (nS), то для всех /€/
Аксиома 1 утверждает независимость цены игрока от его "метки". В
симметричной игре, в частности, всем игрокам приписывают равные цены.
Вторая аксиома необходима, чтобы цена Ф [и] была дележом.
п
Аксиома2. 2 Ф/[и] = *>(/).
/= 1
Второе условие Ф/[у] > и(/), которому должен удовлетворять
дележ Ф[и], в явном виде не предполагается. Это неравенство следует из
других аксиом. Формулируя аксиомы, мы пытаемся накладывать как
можно меньше условий, чтобы не включать в них следствия из других
допущений.
Аксиома 3 утверждает, что если игрок / ничего не добавляет к любой
коалиции, то его цена равна 0. Такой игрок называется "болваном".
Аксиома 3. Если v (S \{i}) = v(S) для всех 5, то Ф/ [и] = 0.
Последняя аксиома есть аксиома аддитивности.
Аксиома 4. Если v и v' - характеристические функции на множестве
игроков /, а характеристическая функция 4) w на / равна v + vf, то
Ф[м>] = Ф[и] + Ф[и'].
Аксиома 4 на первый взгляд имеет чисто эстетическое значение. Однако
для ее понимания требуется некоторое пояснение смысла суммы двух
игр v и vf. Если эти игры проводятся последовательно для одного и
того же множества игроков, то неясно как объединяются исходы: первая
игра может повлиять на реализацию второй или изменить отношения
между игроками. Более правдоподобно такое объяснение: игры и и i/
происходят одновременно, но каждый игрок / имеет во второй
игре v' "дублера".
Как уже отмечалось в п. 3.5.2, множества аксиом бывают различного
типа. Возможны следующие варианты. Аксиомам удовлетворяет несколько
1) Напомним, что перестановкой назьюается переупорядочение или
переименование элементов множества.
. 2) Напомним, что s = 1 S 1. {Примеч. пер.)
3) Необходимо доказать (и это делается непосредственно), что w действительно
есть характеристическая функция.
4) Вновь необходимо доказать, что w - характеристическая функция.
357
функций (цен) Ф[и], такой функции Ф[и] не существует, или же,
наконец, найдется единственная функция Ф[*>], удовлетворяющая
аксиомам. В нашем случае мы сталкиваемся с последней, очень
привлекательной ситуацией. (Такое множество аксиом называют категоричным.)
Теорема 6.14 (Shapley). Для всех характеристических функций v
существует единственная функция Ф [ v ], удовлетворяющая аксиомам 1-4.
Ф/ [v] имеет вид
¦/И = 2{y(s)[HS)-v(S\ {/})]: SBi), D7)
s
где s = | S | и
(s-l)!(/i-s)!
7U) = - —, -• D8)
Доказательство теоремы 6.14 переносится в конец этого параграфа.
6.7.2. Примеры. Используя теорему 6.14, определим цену Шепли 5> [ V ]
для некоторых игр. Во-первых, как мы уже заметили, в симметричной игре
цена Шепли делит v (/) на п равных частей. Таким образом, во взвешенной
мажоритарной игре B; 1, 1, 1) ценой Ф[*>] служит дележ A/3, 1/3, 1/3).
Кроме того, Ф[у] = A/3, 1/3, 1/3) будет ценой Шепли и для игры E1; 49,
48, 3), поскольку последняя также симметрична. Мы отмечали ранее, что
в игре E1; 49, 48, 3) мы имеем, по существу, одинаково сильных трех
игроков и цена Шепли отражает это обстоятельство. В определенном
смысле величину Ф,- [v] можно рассматривать, как меру "силы" /-го
игрока. В другой симметричной игре "Чистые торги" цена Шепли равна
(d/n, djn, ..., d/n)9 в игре "Мусор" - (-1, —1, ..., —1) при любом п.
Аналогичные вычисления можно провести для других симметричных игр,
например, для игры "Озеро".
Игра "Землепользование" будет нашим первым более интересным
примером. Для нее, используя договоренность 0! = 1, находим
7A) = j, 7B) = \, 7C) = \.
Таким образом, поскольку игрок 1 входит в коалиции {1}, {1, 2} и
{1, 2,3}, имеем
+ 7({3}[и({1,2,3})-и({2,3})]=100000тA)
+ 300000 7B)+ 300000 7C) * 216667.
Аналогично
Ф2М ^16667
358
и
ФзМ ^66667.
Одна из интерпретаций полученного результата состоит в следующем.
Землевладелец платит промышленнику 16 667 долларов за отказ от участия
в торгах и затем продает свою землю за 233 334 долларов покупателю,
намеревающемуся продавать ее по частям. Читатель заметит, что цена не
входит в ядро. В действительности эта цена не содержится ни в одном
устойчивом множестве (доказательство не составляет труда). Это, конечно,
вызывает беспокойство и наводит на мысль, что подход к нахождению
решения игры,основанный на понятии цены, также не "идеален".
6.7.3. Простые игры. Пусть v — простая игра. Тогда величина v(S) —
— v(S\ {/}) всегда равна 0 или 1, причем принимает значение 1 в том и
только том случае, если S — выигрывающая коалиция, a S\ {/} —
проигрывающая. Поэтому получаем, что
Ф,[и]= S y(s)= 2 V LJ L , D9)
где s = | S | и суммирование в D9) осуществляется по множеству 8 / всех
выигрывающих коалиций S, содержащих /, и таких, что S \{/}— не
выигрывающая коалиция. Таким образом, например, легко вычислять цены
взвешенных мажоритарных игр. Рассмотрим игру E1; 51, 48, 1). Для нее
коалиция S выигрывающая тогда и только тогда, когда игрок 1 входит
в S. Поэтому v(S) — v(S\ {/}) = 1 лишь при / = 1. Тогда Ф/[и] = 0 при
п
гф\ и, поскольку 2 Ф|[и]= 1, то Ф\[о] = 1. Таким образом, Ф[и] =
/ = 1
= A, 0, 0). Игрок 1 обладает полной властью, так как коалиция
оказывается выигрывающей тогда и только тогда, когда содержит игрока 1. Игрок,
входящий в каждую выигрывающую коалицию, называется диктатором.
В качестве другого примера, рассмотрим игру E1; 40, 30, 20, 10).
В ней выигрывают коалиции
{1,2), {1,3}, {1,2,3}, {1,2,4), A,3,4}, {2, 3,4}, {1,2,3,4}.
Имеем 7B) = 1/12 и)C) = 1/12. Следующие выигрывающие коалиции,
включающие игрока 1, становятся невыигрывающими при его удалении:
U,2}, {1,3}, {1,2,3} ,{1,2,4},{1,3,4).
Следовательно,
Ф1[и] = 2тB) +37C) = 5/12.
Следующие выигрывающие коалиции,включающие игрока 2, становятся
невыигрывающими при его удалении:
A, 2}, {1,2, 4},{2,3,4}.
Следовательно, Ф![и] = 2уB) +2?C) =1/2.Аналогично Ф3[у]=1/4 и Ф4[у] =
= 1/12. Таким образом, Ф [v] = E/12,1/4, 1/4, 1/12).
В отношении цены Шепли игроки 2 и 3 обладают одинаковой силой,
в то время как сила игрока 1 в пять раз превосходит силу игрока 4.
Заметим, что сила игрока не обязательно пропорциональна его доле голосов.
В этом примере игрок 1 имеет вчетверо больше голосов, чем игрок 4,
359
однако в пять раз превосходит его по силе; в игре E1; 49, 48, 3) число
голосов игрока 1 более чем в 16 раз превышает число голосов игрока 3,
однако, игрок 1 не превосходит по силе игрока 3. Сила, в нашем
понимании, отражает способность маневрировать в "выигрывающих" коалициях,
и доля голосов, очевидно, не служит хорошим способом измерения этого
качества.
Исходя из такого толкования силы игрока, рассмотрим теперь, как
интерпретируется это понятие при принятии решений в Совете
Безопасности ООН. Напомним, что заседание Совета Безопасности представляется
игрой C9; 7, 7, 7, 7, 7, 1,1,1, 1,1,1,1,1,1,1). Выигрывающая коалиция
должна состоять из всех пяти постоянных членов (игроки 1 — 5) и по
меньшей мере из четырех непостоянных членов (игроки 6 — 15). Если
игрок i не является одним из постоянных членов и входит в S, то S —
выигрывающая коалиция, a S\ {/} нет, тогда и только тогда, когда S
состоит из девяти игроков, включая всех постоянных членов. Таким образом,
выбор S сводится к выбору трех непостоянных членов из девяти других,
/9\ 9!
отличных от / . Это означает, что существует Г I = таких коалиций.
\ 3 / 3! 6!
Поэтому
(9-1IA5-9)! 8Г6!
15! 15! '
откуда
9! 8! 6!
Ф'М%ТТ, 'Т7Г * °>001 865-
3: о! 15!
Теперь, поскольку имеется 10 непостоянных членов (равной силы),имеем
15
2 ФДи]^ 10 0,001865 = 0,01865.
/ = б
Таким образом,
15
S ФДи]« 1 - 0,01865 = 0,98 135.
i = б
Из соображений симметрии сила каждого постоянного члена равна
Ф/М*- @,98135)^0,1963.
Получаемый отсюда вывод состоит в том, что постоянные члены совместно
обладают в Совете Безопасности почти всей властью, а именно,
превышающей 98%. Идея выявления реальной силы (власти) членов Совета
Безопасности и других подобных органов впервые была высказана в работе Shap-
ley, Shubik [1954].
6.7.4. Вероятностная интепретация цены Шепли и ее применение в
законодательных органах. Часто цену Шепли можно вычислить другим путем,
позволяющим дать ей вероятностную интерпретацию 1). Предположим, что
упорядочение игроков в игре выбрано случайным образом. Пусть о =
= 0*ь h, • •»in) - некоторое такое упорядочение и пусть 5/(о) обозначает
1) Читатель может перейти непосредственно к следствию из теоремы 6.15.
360
множество игроков, предшествующих / в о, a S = S,- (о) U {/). Как легко
видеть, числитель в y(s), равный (s - 1)! (п - s)!, определяет число
упорядочений множества {1,2, ...,«}, в которых игроки из S \ {i} находятся
на местах перед /, а после / размещаются остальные игроки. Знаменатель
в тE) > равный и!, определяет число упорядочений множества {1, 2,. .., п }.
Таким образом, если упорядочение о выбирается случайно, то величина
y(s) есть вероятность предшествования игроков из 5\{/} игроку /. Из
теоремы 6.14 следует, что Ф,ф] есть математическое ожидание случайной
величины
Ыо) = v(Si(p) U {/ » - и№(о)), E0)
если усреднение производится по всем упорядочениям о. Сформулируем
этот результат в виде теоремы.
Теорема 6.15 (Shapley, [1953a]). Если Sj(o) представляет множество
игроков, предшествующих игроку/ в упорядочении о на / и все
упорядочения о равновероятны, тогда Ф,- [v] — математическое ожидание случайной
величины
\i(o) = v(Si(o)U{i})-v(Si(o)).i) E0)
Для простой игры эта теорема допускает изящную, интерпретацию. В
этом случае величина Х,(о) равна 1, если St(o) - проигрывающая коалиция,
Si(o)U {i} — выигрывающая, а \(о) равно 0 в противном случае. Пусть
расширение коалиции на каждом шаге происходит путем добавления
случайно выбранного игрока.
Получаемое в результате упорядочение всех игроков и будет о. Тогда
Ф, [у] — вероятность следующего события, а именно того, что добавление
игрока / делает коалицию выигрывающей. Такой игрок называется
"основным" для упорядочения о. Добавление его поднимает коалицию на
"вершину". Эта интерпретация, в частности, оказывается чрезвычайно
полезной при вычислении цены. Поскольку все упорядочения считаются
равновероятными, можно переформулировать теорему 6.15 для случая
простой игры.
Следствие. В простой игре цена Ф/ [v] равна вероятности того, что игрок
/ - основной, т.е. равна отношению числа упорядочений, в которых
игрок / основной, к числу упорядочений п игроков п\.
Воспользуемся следствием для рассматриваемой ранее игры B; 1,1.1).
Возможными упорядочениями игроков 1,2,3 являются следующие:
Номер
по порядку
1
2
3
4
5
6
Упорядочение
1 23
1 32
21 3
231
312
321
') Другими словами, Ф^и] =— \/(о). (Примеч. пер.)
п\
361
В третьем и пятом упорядочениях игрок 1 основной, поэтому Ф\[о] =
= 2/3! = 1/3, что согласуется с нашими прежними вычислениями. В игре E1;
40, 30,20,10) имеются следующие упорядочения.
№
Упорядочение
Упорядочение
№
Упорядочение
1
2
3
4
5
6
7
8
1 234
1243
1 324
1342
1423
1432
2134
2143
9
10
11
12
13
14
15
16
2314
2341
241 3
2431
31 24
3142
3214
3241
17
18
19
20
21
22
23
24
3412
3421
41 23
4123
4213
4231
43 12
4321
Игрок 1 основной в упорядочениях 7, 8, 9, 11, 13, 14, 15, 17, 21 и 23, и
поэтому Ф1 [и] = 10/24 = 5/12, что согласуется с результатом наших
прежних расчетов. Чтобы привести еще один пример, напомним, что при
принятии некоторых решений действия правительства Австралии описываются
игрой E; 1, 1,1,1,1,1,3), в которой федеральное правительство
выступает в роли игрока 7, а штаты - в роли остальных шести игроков.
Федеральное правительство является основным игроком в данном упорядочении
тогда и только тогда, когда занимает в нем третье, четвертое или пятое
место. Федеральное правительство оказывается третьим с вероятностью
F/7) -E/6) • A/5) = 1/7,четвертым -свероятностью F/7)- E/6) >D/5)Х
X A/4) = 1/7 и пятым - с вероятностью F/7) • E/6) • D/5) • C/4) • A/3) =
= 1/7. Это означает,что Ф7 [v] = 3/7 = 9/21. Далее, из соображений симметрии
следует, что Ф1 [v] = Ф2 [и] = ... = Ф6 [v]. Поскольку Ф1 [v] + Ф2 [v] + . . .
. • • + Ф6 Ы = 4/7, получаем Ф! [v] + Ф2 [v] + . . . + Ф6[и] = A/6) • D/7) = 2/21.
Таким образом, согласно цене Шепли при принятии решений федеральное
правительство в 4 % раза влиятельнее любого штата.
В качестве более сложного примера, рассмотрим двухпалатный
законодательный орган, в первой палате которого пх членов, а во второй п2
членов *). Предположим, что некоторое решение утверждается этим
органом в том и только том случае, если оно получает большинство в каждой
палате, и для простоты будем считать пхипг нечетными. Пусть / -
объединение множеств членов обеих палат, а о - его произвольное упорядочение.
Игрок / основной в о, если он в с? занимает [(я, + 1)/2]-е место среди
игроков его палаты, а большинство игроков другой палаты предшествует
ему. Однако для каждого упорядочения о, в котором игрок из первой
палаты — основной, обратное упорядочение делает основным некоторого
игрока из второй палаты. (Почему?) Кроме того, в каждом упорядочении
имеется основной игрок. Поэтому игрок из палаты 1 является основным
с вероятностью Й. А поскольку все игроки в палате 1 равноправны,
каждый из них может оказаться основным с вероятностью l/Bfli). Аналогично
каждый из игроков палаты 2 может оказаться основным с вероятностью
1) Этот пример взят из работы Shapley, Shubik [19541-
362
1/Bи2). Таким образом, сила каждого игрока из палаты 1 и 2
соответственно равна 1/Bhi) и 1/B«2). В палате представителей и сенате конгресса
Соединенных Штатов Америки пх = 435 и пг = 101, включая
вице-президента, голосующего при равенстве голосов. Согласно нашим расчетам,
влияние каждого члена палаты представителей измеряется величиной
1/870 « 0,0011, а влияние каждого сенатора (включая вице-президента)
величиной 1/202 « 0,005. Таким образом, сенатор в пять раз влиятельнее
члена палаты представителей.
Далее включим в рассмотрение еще главу исполнительной власти
(губернатор, президент и т.д.), который имеет право вето при голосовании в двух
палатах и допустим, что если право вето использовано, процесс принятия
решения заканчивается. Теперь имеется пх + п2 + 1 игроков, и коалиция
оказывается выигрывающей тогда и только тогда, когда в нее входит
глава исполнительной власти и большинство из каждой палаты. Для
достаточно больших п\ и п2 в работе Shapley, Shubik [1954] показано, что глава
исполнительной власти является основным игроком с вероятностью,
приблизительно равной Й. (Доказательство этого достаточно сложно и мы
его опускаем.) Две палаты делят оставшуюся "власть" примерно поровну.
Наконец, если добавляется возможность "отвергнуть" вето большинством
2/3 голосов обеих палат, аналогичные рассуждения показывают, что глава
исполнительною органа обладает приблизительно 1/6 частью "власти",
а оставшаяся делится между палатами примерно поровну. Для более
подробного изучения этого вопроса читателю рекомендуется работа Шепли и
Шубика.
Аналогичные расчеты могут быть проделаны для определения
относительной силы штатов в коллегии выборщиков. Менн и Шепли (Mann,
Shapley [1960, 1962]) выполнили их, используя распределение голосов по
данным 1961 г. Нью-Йорк имел 43 из общего числа в 538 голосов выборщиков
и обладал силой, оцениваемой величиной 0,0841. Она сравнивалась с
величиной 0,0054 для штата типа Аляски с тремя голосами выборщиков. Согласно
цене Шепли, "сила" штата Нью-Йорк превышает долю его голосов, а "сила"
штата Аляска меньше соответствующей ему доли.
Аналогичные результаты для более позднего распределения голосов
выборщиков по данным 1972 г. были получены Бойсом и Кроссом (Воусе,
Cross [не опубликовано]). В новой ситуации Нью-Йорк имел 41 голос
(из общего числа в 538 голосов) и обладал "силой", измеряемой величиной
0,0797, тогда как Аляска обладала по-прежнему тремя голосами и "силой",
измеряемой той же величиной 0,0054.
В упражнениях мы рассмотрим другое понятие цены, предложенное в
работе Banzhaf [1965] *). Считается, что такое определение цены и цена
Шепли дают приемлемые способы нахождения решения игры и, как
показало их практическое применение, они достаточно хорошо согласуются друг
с другом. Однако в работе Dubey, Shapley [в печати] показано, что это не
всегда так. Цену Баншофа более целесообразно применять для анализа
процедур голосования для некоторых типов судебных заседаний. Читатель
1) Цене Баншофа недавно было дано аксиоматическое обоснование в работе Dubey,
Shapleyfв печати].
363
может дополнительно воспользоваться работами Banzhaf [1968, р. 306]
и Johnson [1969].
6.7.5. Доказательство формулы цены *)• Мы завершаем эту главу
доказательством теоремы 6.14. Сначала докажем несколько лемм.
Лемма 1. Пусть R - коалиция на множестве игроков / и
характеристическая функция vR на/ определяется следующим образом:
. ч ( 1, если R С S,
vR(S) = \
[ 0 в противном случае.
Если существует функция Ф, удовлетворяющая аксиомам 1 - 4, с -
действительное, неотрицательное число и r=\R\9m
с/г, если
I 0, если
Доказательств о. По аксиоме 3 <&i[cvR ] = 0, если i ^ R. По
аксиоме 1 Ф,-[сия] =&j[cvR]9 если i,jGR. Таким образом, по аксиоме 2, если
/ G R, то г Ф,, [с vR ] = (с vR )(/) = с vR (/) = с. ¦
Лемма 2. Произвольная характеристическая функция v представляется
линейной комбинацией
v = 2 cRvR
R С /
характеристических функций 1>я, определенных в лемме 1.
Доказательство 2). Для коалиции R на множестве игроков /
определим функцию v 'R следующим образом:
если R = 5,
в противном случае.
Заметим, что vR не является характеристической функцией, если R Ф I.
Однако каждая характеристическая функция v на / есть линейная
комбинация функции vR, поскольку
Наконец, покажем, что каждая функция vR представима линейной
комбинацией функций vR из леммы 1. Докажем это индукцией по к = п - \ R |,
где п = | / |. Если к = 0, то vR = и/ = i>/. Допустим справедливость
утверждения для к и докажем его для к + 1. Заметим, что
' _ f ' '
VR ~vR ~vRl ~ VR2 - • • • ~ VR.,
где Rlt R2,... , Rj - собственные подмножества R. По предположению
индукции каждая функция v'Rf является линейной комбинации функций
vR , а значит, то же справедливо и для vfR. ¦
!) Этот пункт можно пропустить.
2) Это доказательство принадлежит Dubey [ 1974].
364
Чтобы закончить доказательство теоремы 6.14, заметим, что если
функция Ф существует и, если 0 — характеристическая функция, тождественно
равная 0, то Ф[0] = 0. (Почему?) По лемме 1 Ф однозначно определяется
для игр в форме характеристической функции с vR, с > 0. Это также верно,
если с < 0, так как
*[cvR+{-cvR)] =Ф[0] =0,
и поэтому по аксиоме 4
Ф[сия] =-<&[-cvR].
Наконец, используя снова аксиому 4 и утверждения лемм 1 и 2, получаем,
что Ф однозначно определяется для любой функции v, поскольку
Ф[и]= 2 *[cRvR].
R С I
Таким образом, доказано, что функция Ф, удовлетворяющая аксиомам
1 - 4, определяется однозначно. Остается показать, что такая функция Ф
существует. Для этого достаточно проверить, что для функции Ф,
задаваемой равенством D7), действительно выполнены приведенные выше
аксиомы. Доказательство предлагается читателю в качестве упражнения
(упражнение 17).
Единственный вопрос, который не был нами рассмотрен, связан с тем,
что Ф[и] может не являться дележом. По аксиоме 2 Ф[*^ удовлетворяет
условию оптимальности по Парето (см. соотношение FЛ). Но второе
требование, требование индивидуальной рациональности (см. соотношение
D)) не включалось в наши аксиомы, так как оно следует из них. Чтобы
убедиться в справедливости условия индивидуальной рациональности для
функции Ф, удовлетворяющей аксиомам 1-4, необходимо доказать
неравенство Ф/[и]>и({/ }) для всех /. Отметим, что v(S) — v(S\{i}) > и({/})
по условию супераддитивности. Таким образом, используя D7),
достаточно показать, что
Имеем
2 GE): 5Э/}=- X{(s-l)\(n-s)\: S Э /} .
Величина я! есть число перестановок на множестве /. Для каждого 5, как
мы уже видели, число E-1)! (н - s)! равно числу перестановок /, в
которых элементы из 5\ {/} находятся впереди (в некотором порядке), затем
следует элемент /', а потом оставшиеся элементы (в некотором порядке).
Поскольку каждая перестановка при таком способе подсчета реализуется
для какого-то множества S, содержащего /, а п\ равно общему числ>
перестановок, то
2{(s- \)\(n-s)\: S3i} = n\
Это соотношение завершает доказательство. ¦
365
Упражнения
1. Согласно одной из аксиом для цены Шепли Ф;[и] = 0, если i - третий игрок в
игре E1; 60, 30,10). Указать аксиому и объяснить полученный результат.
2. Согласно одной из аксиом для цены Шепли Ф[и] = A/4,1/4,1/4, 1/4), если v -
взвешенная мажоритарная игра C; 1, 1, 1). Указать аксиому и объяснить
полученный результат.
3. Согласно одной из аксиом для цены Шепли Ф[и] = A, 1, 1) не может быть ценой
Шепли для взвешенной мажоритарной игры. Указать аксиому и объяснить полученный
результат.
4. Вычислить цену Шепли для игры "Озеро" при Д = 2, С - 1, и = 4.
5. Для предлагаемых взвешенных мажоритарных игр выполнить такие задания:
а. Перечислить выигрывающие коалиции.
6. Проанализировать (до выполнения вычислений) относительную силу каждого
игрока. В частности, указать болванов (игроков, не входящих в минимальные
выигрывающие коалиции) и диктаторов (игроков, присутствующих в каждой
выигрывающей коалиции).
в. Вычислить цену Шепли и сравнить результат со своими интуитивными
результатами (можно воспользоваться либо формулой D9), либо следствием теоремы 6.15) для
следующих случаев:
(I) E1; 49,47,4);
(II) B01; 100, 100, 100,100, 1);
(Ш) A51; 100, 100, 100, 1);
(IV) E1; 26,26, 26,22);
(V) A6; 9, 9, 7, 3, 1, 1) (эта игра возникла при анализе работы Совета
инспекторов в округе Нассау штата Нью-Йорк в 1958 г.; см. Banzhaf [ 1965]);
(VI) E9; 31, 31, 21, 28, 2, 2) (эта игра возникла при анализе работы
Совета испекторов в округе Нассау штата Нью-Йорк в 1964 г.; снова
см.Banzhaf [1965]). 1
б. Вычислить цену Шепли для игры "Заседание комитета" (упражнение 10 § 6.1).
7. Вычислить цену Шепли для игры "Рынок с двумя покупателями" (пример 3;
§6.1).
8. Вычислить цену Шепли для игры, определенной в упражнении 6 § 6.1.
9. Вычислить цену Шепли для игры, определенной в упражнении 7 § 6.1.
10. Вычислить цену Шепли для взвешенной мажоритарной игры A2; 5, 5, 2, 1)
(Указание. Является ли игрок 4 основным?).
11. Вычислить цену Шепли для взвешенной мажоритарной игры A2: 5, 5, 2,2,1)
12. Вычислить цену Шепли для взвешенной мажоритарной игры F; 1,1,1, 2, 3, 3)
13. (Lucas [1974]). В первоначальном варианте Совета Безопасности было пять
постоянных и шесть непостоянных членов. Выигрывающие коалиции содержали все
пять постоянных членов и по крайней мере двух непостоянных членов.
Сформулировать соответствующую взвешенную мажоритарную игру и вычислить
цену Шепли.
14. (Lucas [1974]). Предположим, что было предложено добавить в качестве
шестого постоянного члена Совета Безопасности Японию. Допустим,что по-прежнему
остается 10 непостоянных членов, а выигрывающие коалиции состоят из шести
постоянных членов и по меньшей мере четырех непостоянных. Сформулировать
соответствующую взвешенную мажоритарную игру и вычислить цену Шепли.
15. Одна из проблем, связанных с ценой Шепли для простых игр, состоит в том,
что вводится понятие упорядочения, но не все упорядочения равновероятны, Бан-
шоф (Banzhaf [1965]) предложил другое, весьма похожее понятие цены,
характеризующее силу игрока. Рассмотрим простую игру с постоянной суммой, т.е. v(S) +
+ v(I\S) = у(/) для всех S и пусть Р - разбиение игроков на два множества. Тогда
в каждом разбиении Родна из двух групп выигрывает, а-другая проигрывает. Будем
говорить, что игрок 1 критический относительно разбиения Р, если, голосуя иначе,
он меняет выигрывающую группу. (Для данного разбиения может быть несколько
критических игроков.) Например, в игре B; 1, 1, 1) одно из разбиений состоит
из множеств{1,2}и{3}.В этой игре выигрывает первая группа, и оба игрока 1 и 2
будут критическими относительно этого разбиения. Если обозначить число разбиений
366
Таблица 6.1
Вычисление индекса Баншофа для игры B; 1,1,1)
Разбиение
Критические игроки
р
{1}
{2}
{3}
{1,2}
{1,3}
{2,3}
{1,2,3}
{1,2,3}
{2,3}
{1.3)
{1.2}
ill
{1}
{*}
X
X
X
X
в которых игрок i критический через bj, то индекс Баншофа задается формулой
ft= "тН—
Ъ Ь;
/=1
Например, в игре B; 1, 1, 1) мы можем составить таблицу, в которой наличие* в
некоторой строке и столбце / означает, что игрок / является критическим
относительно приведенного в данной строке разбиения, (табл. 6.1). Из этой таблицы видно,
что Ьх =Ь2 -Ьъ =4 и 0, = 02 = 0Э =4/12 = 1/3. Все три игрока имеют одинаковую
силу. Вычислить индекс Баншофа для следующих игр и сравнить его с ценой Шепли.
а. E1; 51,48,1).
б. B0; 1,10,10,10).
в. A02; 80,40,80,20).
г. Правительство Австралии E; 1,1,1,1,1,1, 3).
16*. Показать, что s-эквивалентность сохраняет цену Шепли в том смысле, что, если
и' удовлетворяет D0), то
(Замечание. Изоморфизм не всегда сохраняет цену Шепли: если / - изоморфизм v в
и', то функция Ф[и']не обязательно равна /(Ф[и]). Обратить внимание на сноску
нас. 349в § 6.6).
17*. Доказать, что функция Ф[и]из соотношения D7), удовлетворяет аксиомам
1-4. (Указание. По аксиоме 2, если .и/? определяется так же как в доказательстве
леммы 2, то функция Ф[и/? ] определена, даже если и/? не является характеристической
функцией. Кроме того,
п
/ = 1
Наконец,
Ф[и] =
Г»)
R
С/
Г 1, если
1 0, если
v(R)<b[v'R]
R
R
.)
= /,
Ф1.
18. Показать, что если Ф определяет цену Шепли, a v и w - характеристические
функции на одном множестве игроков /, то для всех а из @, 1) справедливо
соотношение
Ф[<хи + A -a) w] =(*Ф[и] + A -a)O[w].
367
19. Shapley [1953a]. Носителем игры v называется такая коалиция 7\ для которой
иE) = v(S п Т) для всех S. Показать непосредственно из аксиом 1—4, что, если Т -
носитель, то
2 Ф/[и] = и(Г).
/671
20. Доказать, что в симметричной игре с ядром цена Шепли принадлежит ядру.
21* (Shapiro, Shapley [I960]). Показать, что во взвешенной мажоритарной игре с
п игроками {Q;k, 1, 1,..., \\к < Q < п - 1, цена Ф равна {{к/п\ (п - к)/п(п - 1),
(п - к)!п(п - 1),.... (я - к)/п(п - 1)).
22. Проанализировать результаты наших вычислений цены Шепли для некоторых
игр в этом параграфе (Совет Безопасности, конгресс США и др.). Согласуются ли они
с вашей интуицией? Какие чрезмерные упрощения были сделаны?
23. Попытаться предложить свои собственные аксиомы для измерения силы игрока.
Глава 7
ГРУППОВОЕ ПРИНЯТИЕ РЕШЕНИЙ
§ 7.1. Функции группового выбора
В гл. 6 мы рассматривали группы в ситуации конфликта и
сотрудничества. В группах формировались каолиции, и индивидуумы использовали свою
власть и влияние, чтобы добиться своих целей. В этой главе считается, что
решение в группе вырабатывается на демократических основах, и все
индивидуумы равноправны. Примерами таких групп являются
законодательный орган, эксперты или арбитры, производящие отбор среди претендентов
на должность, среди возможных переменных знакового орграфа или
ранжировок игроков в турнире. Наконец, такой группой можно считать все
общество, на одобрение которого представлен новый законопроект или
несколько кандидатов на выборах. Каждый член группы имеет свои
предпочтения или мнения. Будем пытаться выработать некоторые
справедливые и регулярные процедуры, с помощью которых из индивидуальных
мнений можно построить согласованное.
Одной из классических ситуаций, в которых результаты настоящей
главы находят себе применение, это, конечно, выборы. Исторически
сложилось так, что на выборах каждый избиратель голосует за наиболее
предпочтительного для него кандидата, а победителем затем объявляется кандидат,
набравший большинство голосов. Если такого не нашлось, то иногда для
"первых" двух кандидатов устраивается второй тур выборов. Победитель
таких выборов часто оказывается не очень популярным. Например, два
региональных кандидата в президенты могут победить примерно в
половине первичных выборов. Между тем, популярный в масштабах всей страны
кандидат, занимающий второе место в каждом из регионов, может не
победить на первичных выборах и все же быть значительно более
предпочтительным для большинства людей, чем любой из двух других кандидатов.
Чтобы на выборах учитывалась такая информация, можно было бы
попросить каждого избирателя проранжировать или перечислить в порядке его
предпочтения всех имеющихся кандидатов. (На самом деле, следовало
бы представить избирателю все возможные ранжировки (упорядочения)
кандидатов и предложить ему проголосовать за одну из них.) Если такая
информация имеется, то перед нами встает вопрос о том, каким образом
выявлять победителя. В этой главе мы обсудим методы для определения
такого победителя, или более широко, методы получения согласованной
ранжировки всех кандидатов, выражающейд-рупповое мнение.
Во многих ситуациях более полезно производить ранжирование всех
кандидатов вместо того, чтобы указывать единственного победителя,
например, при отборе кандидатур на должность различными
специалистами, так как в этом случае потребуется сделать предложение кандида-
24. ф.С. Роберте 369
ту, занявшему второе место, если первый откажется от работы, третьему,
если откажется второй и т.д.
Говоря более строго, пусть имеется множество лиц /, занумерованных
числами 1,2,...,*). Пусть элементами множества А являются некоторые
объекты, альтернативы, факторы, события, кандидаты, о которых и
выносят свои суждения индивидуумы из множества /. Обозначим через />/, 1 <
</ </ ранжировку альтернатив из А, указанную i-m индивидуумом. Для
а, Ъ Е А запись aPtb будет употребляться, если i'-й индивидуум ставит а
на более высокое место, чем Ь. Таким образом, аРф означает, что с точки
зрения /-го индивидуума а предпочтительнее Ъ или а более высокого
качества, чем Ъу или а имеет большую важность и т.д. Обычно мы будем
интерпретировать ранжировки в терминах предпочтений, хотя результаты этой главы
также применимы в других случаях.
В наших ранжировках будут допускаться связи. Если объекты
(альтернативы) а и Ъ считаются индивидуумом i связанными, мы будем писать
aTfb. (Если ранжирование производилось по отношению предпочтения,
то тогда 7/ интерпретируется как отношение "безразличия"). Удобно
представлять Ph выписывая элементы А в столбец в порядке уменьшения
предпочтительности сверху вниз. Таким образом, если А = {х9у9 z, v) , то одна
из ранжировок Р\ имеет вид
Pi
y-v
и
Дефис между у и v указывает, что они связаны в ранжировке, т.е. имеет
место уТ(о. Кроме того, в Р/ элемент х занимает более высокое место,
чем у и v, которые в свою очередь предпочтительнее и.
Мы не будем определять в этой главе понятие ранжировки более точно.
В гл. 8 читатель узнает, что ранжировка является строгим слабым
порядком. По предположению каждая ранжировка Р транзитивна, т.е. если аРЬ
и ЬРс, то справедливо иаРс, и асимметрична, т.е. аРЬ и ЬРа не
выполняются одновременно.
Набор ранжировок (Pl9P2,... ,Рп)у выражающих предпочтение членов
группы, определяет групповой профиль. Один из профилей множества
А ={х, у, z, v } для группы из трех индивидуумов имеет вид
Pi P2 Рз
X
У
U'V
Обозначим
У
X
и
V
через *
хм
V
У
л л
совокупность всех возможных ранжировок А
1) Читателю следует иметь ввиду, что в прошлой главе вместо буквы t
использовалась буква п.
370
и пусть SPf (А) равно произведению сомножителей1) 3* XS&X ... ХЗ5. Таким
образом,^ (Л) обозначает совокупность всех профилей группы из t
индивидуумов на множестве А.
Нас интересует следующая проблема: как найти по данному профилю
(^1*^2» ••• >^г) "выигрывавшую" альтернативу или, в менее общей
постановке 2), как найти ранжировку Р на А, которая выражает
согласованное мнение группы. Если каждая ранжировка Р/ получается в результате
упорядочения по предпочтению, то Р представляет групповое предпочтение.
Поскольку по групповой ранжировке можно определить "победителя",
мы сосредоточим свое внимание на проблеме нахождения такой
ранжировки. Однако читателю следует иметь в виду, что это может оказаться более
трудной задачей, чем просто выявить победителя3). Правило построения
групповой ранжировки по групповому профилю будет называться
групповой функцией согласования. Если ранжировки отражают предпочтения,
в особенности, когда множеством индивидуумов / служит все общество,
то часто говорят о функции группового (общественного) выбора.
Групповую функцию согласования можно представлять как функцию/7:^ (А) -*
-»$(Л). Займемся выявлением того, какие функции F можно считать
"разумными". В основном будем уделять внимание случаю упорядочения
по предпочтениям и, следуя литературе, употреблять термин "функция
группового выбора). Читателю следует иметь в виду и другие
интерпретации ранжировок Р(.
Одним из очевидных принципов для получения групповой ранжировки
является правило простого большинства: если дан профиль (Pl9P29...
... ,Pt)y альтернатива а получает в групповой ранжировке более высокое
место, чем альтернатива Ъ, тогда и только тогда, когда большинство (т.е.
более половины) индивидуумов оценивает а выше Ь. Пусть А ={х,у, z},
t = 3, а групповой профиль имеет вид
Pi Рг Рг
х у z
у z х
z х у
Большинство индивидуумов ранжирует х выше у, у выше z и z выше х.
По правилу простого большинства в групповой ранжировке Р должно
выполняться хРу, yPz и zPx. Однако ранжировки с такими тремя
свойствами не существует! (Так как ранжировка асимметрична, то zPx означает,
что xPz не выполнено. Поэтому такая "ранжировка" не удовлетворяет
условию транзитивности.) Этот пример иллюстрирует парадокс голосова-
1) Множество <Рх?Рх ... XlP составляют все возможные наборы (Р19Р29...
..., Pt). (Примеч. пер.)
2) Поскольку в ранжировке допускаются связи, по ней не всегда удается выявить
"победителя" при дележе первого места, тогда как строгая ранжировка определяет
единственного "победителя". (Примеч. пер.)
3) В упражнениях 5, 7, 9, 10. и 11 мы отметим несколько правил определения
только "группового победителя".
4) Нередко в литературе под функцией группового выбора понимается функция,
определяющая по индивидуальным предпочтениям лишь группового "победителя"
или множество неупорядоченных "победителей" . (Примеч. пер.)
24* 371
ним (парадокс КондорсеI). Объединение индивидуальных ранжировок
по отношению предпочтения на основе правила простого большинства не
обязательно приведет к групповой ранжировке. По нашему определению
групповой функции согласования или выбора правило простого
большинства даже не всегда задает такую функцию, поскольку не всякому профилю
сопоставляет ранжировку.
Нетрудно описать функции группового выбора, соотносящие каждому
профилю допустимую ранжировку. Один из примеров— правило Борда2).
Пусть величина /?,• (а) равна числу альтернатив а, расположенных ниже аль-
t
тернативы а в ранжировке /*,-, и В (а) = X Bf (a). В (а) называется числом
/-1
Борда для альтернативы а. Функция выбора Борда определяется
следующим образом: в групповом предпочтении а выше Ъ тогда и только тогда,
когда В (а) больше, чем В (Ь). Для примера рассмотрим следующий
групповой профиль:
Рг Р2 Ръ Р*
X
У
и
V
У
и
X
V
V
X
У
и
X
У
U-V
Тогда Вх (х) = 3, В2 (х) = 1, Въ (х)=2и В4 (х) = 3, поэтому В (х) = 9.
Аналогично, В (у) =2 + 3+1 + 2 =8, В (и) = 1 + 2 + 0 + 0 = 3 и Я (и) =0 + 0 +
+ 3 + 0 = 3. Таким образом, согласно правилу Борда, х получает более
высокое, место, чем у, у выше и и у, а и и v равноценны (связаны). Групповая
ранжировка имеет вид
Р
х
У
U-V
Правило Борда всегда приводит к ранжировке, но не всегда эта ранжировка
согласуется с нашим интуитивным представлением о "справедливости".
Например, рассмотрим следующий профиль:
Рх Р2 Р3 РА Ps
X
У
и
V
W
Здесь
X
У
Z
и
V
W
В (х) = 20, i
X
У
Z
и
V
W
iB(y)
X
У
Z
и
V
W
= 21,
У
z
и
V
W
X
поэтому
1) Парадокс назван по имени философа и ученого в области общественных наук
маркиза де Кондорсе, обнаружившего его в XVIII в. Парадокс был позднее в том же
веке переоткрыт участником военных сражений и мореплавателем Джином Чарльзом
де Борда, а в XIX в. - Льюисом Кэрроллом.
2) Оно принадлежит Джину Чарльзу де Борда (см. предыдущую сноску).
372
из пяти индивидуумов считают х наилучшим кандидатом.
Нетрудно описать и другие функции группового выбора. Мы сделаем
это в упражнениях 13 и 14. Однако, как будет предложено показать
читателю, для каждой из них можно построить примеры, неприемлемые с
определенной точки зрения, подобные примеру для правила Борда. Таким
образом, определить какая из двух функций выбора более "обоснованна"
очень сложно. При таких обстоятельствах возможный подход состоит в
том, что сначала выписываются условия, которым должна была бы
удовлетворять "обоснованная" функция группового выбора, а затем
выясняется можно ли из них вывести конкретную функцию или класс таких
функций. Таким качеством обладает аксиоматический подход, с которым мы
уже встречались при рассмотрении трофического статуса в п. 3.5.2 и цены
Шепли в п. 6.7.1. Мы будем придерживаться его и в следующем параграфе.
Для более обстоятельного изучения вопросов коллективного принятия
решений читателю рекомендуются работы Luce, Raiffa [1957], Sen [1970]
и Fishburn [1972]. К классической литературе по принятию решений
относится книга Arrow [1951]. По теории голосования полезны также
работы Black [1958], Farguharson [1969] и Riker, Ordeshook [1973].
Упражнения
1. а. Выписать все возможные ранжировки множества {х, у, z).
б. Сколько элементов содержится в ЗР(А), если А -{и, v, w, *}?
в. Сколько элементов содержится в РРг (А), если А -{и, и, w}?
2. Транзитивно ли предпочтение индивидуума относительно марок автомобилей?
Он предпочитает "бьюин" - "кадиллаку", "кадиллак" - "фольксвагену" и
"фольксваген" — "бьюику". •
3. Транзитовен ли индивидуум, предпочитающий для проведения отпуска один
штат другому: Орегон - Калифорнии, Калифорнию-Нью-Хемпширу, Ныо-Хёмпшир -
Мэну, Мэн-Орегону?
4. Асимметрично ли предпочтение индивидуума относительно марок автомобилей?
Он предпочитает "бьюик" - "кадиллаку", "кадиллак" - "фольксвагену" и
"кадиллак" — "бьюику"?
5. Если по групповому профилю необходимо определить только победителя, а не
согласованную групповую ранжировку, то правило большинства голосов1)
предлагает следующее решение: альтернатива а объявляется победителем, если в этом
профиле а чаще других альтернатив занимает первое место.
Рассмотрим все возможные ранжировки без связей множества Л ={х,у, z):
Л Рг Г> Р* Р, Р,
х у z х у z
у z у z х х
z х х у z у
Какая альтернатива будет победителем согласно правилу большинства, если 10
избирателей голосует за Рх, 31 за Р2, 45 за Р3» 30 за Р4, a Ps и Рь не получают ни одного
голоса?
6. Какие проблемы возникают при применении правила большинства из
упражнения 5? (Пояснить на примерах профилей.)
7. Для выбора победителя имеется следующий критерий Кондорсе:
альтернатива а побеждает, если большинство индивидуумов отводит ее более высокое место,
чем любой другой альтернативе Ь.
1 > Следует отличать от правила простого большинства. (Примеч. пер.)
373
а. Определяет ли победителя критерий Кондорсе для выборов, рассмотренных в
упражнении 5?
б. Какие проблемы возникают при применении критерия Кондорсе? (Пояснить на
примерах профилей.)
8. (Riker, Ordeshook[1973]). Использовать следующий пример для сравнения
метода большинства (упражнение 5) с критерием Кондорсе (упражнение 7).
Президентские* выборы 1912 г. с тремя кандидатами х (Вильсон - демократ), у (Рузвельт -
прогрессивная партия) и z (Тафт - республиканец) дали следующий результат:
(х\ (у\ (х\
45% избирателей проголосовало за ранжировку ( у I , 30% за I z I и 25% за I у ).
(Вильсон оказался победителем по большинству, когда каждый избиратель называл
лишь самого предпочтительного кандидата.) Обсудить свои выводы.
9. Если требуется выбрать только победителя, а не согласованную ранжировку,
предлагается следующая процедура, состоящая из двух туров: сначала применяется
правило большинства из упражнения 5; если же ни одна альтернатива не набирает
большинства голосов, то отбираются две альтернативы, получившие наибольшее число
первых мест. Тогда а предпочитается Ь, если большее число индивидуумов ставит а
на более высокое, чем Ь, место. Если же более двух альтернатив получают наивысшую
сумму первых мест, то эта процедура не определит победителя и проводятся новые
выборы.
а. Кто окажется победителем, если в упражнении 5 использовать описанную
процедуру из двух туров?
б. Привести пример, показывающий, что согласно этому методу а может
оказаться победителем, даже если получит меньшее число первых мест, чем Ъ.
10. (Malkevitch, Meyer [1974, p. 405] ). Пусть А содержит четыре элемента. Если
ни одна альтернатива не получает большинства по числу первых мест, то можно
использовать следующую процедуру для определения победителя: сначала на основе
двухтуровой процедуры из упражнения 9 сравнивают первый и третий по числу
голосов элементы, второй и четвертый, а затем сравнивают двух "победителей"
предыдущих сравнений. Проанализировать возможные проблемы, возникающие в такой
процедуре. (Можно ли назвать виды спорта, где подобная процедура применяется для
определения победителя?)
11. Правило простого большинства можно использовать для определения
победителя, если оно применимо, т.е., если в результате получается ранжировка. Может ли
правило простого большинства выявить победителя, отличного от полученного в
результате процедуры из упражнения 9, состоящей из двух туров?
12. (Malkevitch, Meyer [1974, p. 411]). В этом упражнении правило Борда
сравнивается с другими методами коллективного принятия решения. Для этого потребуется
привести примеры ранжировок Pj без связей.
а. Показать на примере, что победители, определяемые по правилам Борда и
большинства из упражнения 5, могут не совпадать.
б. Показать на примере, что победители, определяемые по правилу Борда и по
критерию Кондорсе из упражнения 7, могут не совпадать.
в. Показать, что если правило простого большинства выявляет ранжировку, то она
может не совпадать с ранжировкой, полученной по правилу Борда.
г. Показать, что победители, определяемые правилами Борда, большинства из
упражнения 5 и процедурой из упражнения 9, состоящей из двух туров, могут не
совпадать.
д. Привести пример, в котором правило Борда и правило большинства выявляют
одного победителя, а правило простого большинства ранжировку с тем же
победителем, что и процедура из упражнения 9, состоящая из двух туров, но эти два
победителя не совпадают.
е. Привести пример, в котором правило простого большинства определяет
ранжировку, а значит, и победителя, а четыре метода — правило Борда, правило простого
большинства, правило большинства и процедура из упражнения 9, состоящая из двух
туров, дают различных победителей.
13. Ниже приводится функция группового выбора, называемая
лексикографическим групповым предпочтением, т.е. альтернатива а для группы предпочтительнее
альтернативы Ъ тогда и только тогда, когда выполняется аР\ Ъ или (аТхЬ и аР2Ь) или
374
(aTtb и al2b naP3b) или ... (пГ^Ь и аТ2Ь и.. xaTt^xb и я/^&). Другими словами,
определяющим является предпочтение первого из индивидуумов, для которых а и b
окажутся небезразличны. Если относительно рассматриваемых альтернатив все
индивидуумы безразличны, то говорят, что и группа безразлична.
а. Привести пример, показывающий, что даже если по правилу простого
большинства строится ранжировка, то она может не совпадать с ранжировкой по отношению
лексиграфического группового предпочтения.
б. В чем заключаются некоторые недостатки этой функции группового выбора?
14. Мажоритарная система может использоваться для определения другой
функции группового выбора. В групповом отношении а ставится выше b тогда и только
тогда, когда а получает больше первых мест, чем Ь. Показать, что правило Борда и
мажоритарная система могут приводить к различным ранжировкам для некоторого
группового профиля.
15. Выяснить, допустимо ли и желательно получение индивидуальных
ранжировок в каждой из следующих ситуаций, а также не будет ли более обоснованным
отыскивать групповую ранжировку, а не одного победителя?
а. Члены комиссии конгресса рассматривают несколько альтернативных вариантов
раздела законопроекта.
б. Организаторы заключительной футбольной игры сезона на кубок колледжа
обсуждают для приглашения двух команд 20 возможных кандидатур.
в. Информационные агенства (Ассошиэйтед Пресс, Юнайтед Пресс интернэшнл)
хотят составить список 20 лучших футбольных команд колледжей. (Между прочим,
какой метод используется сейчас?)
16. В гл. 4 обсуждался вопрос выбора переменных при исследовании проблемы
потребления энергии с использованием знакового орграфа. В одном из применяемых
методов каждый эксперт ранжирует различные переменные по порядку их важности.
Проанализировать возможные процедуры, основанные на этой информации, при
выборе, например, 10 переменных. Нужна ли групповая ранжировка?
17. В гл. 3 рассматривалась задача ранжирования игроков турнира. Мы видим,
что, используя полный простой путь, можно определять различные ранжировки.
Можно ли применить какой-либо метод из этой главы для выбора согласованной
ранжировки?
18. Если каждый индивидуум выбирает свою ранжировку случайно, то можно
вычислить вероятность возникновения парадокса голосования при использовании
правила простого большинства. Показать, что если t индивидуумов (г = 3) ранжируют
п альтернатив (л = 3) и связи в ранжировках не допускаются, то имеется 216
возможных профилей, и 12 из них приводят к парадоксу голосования. Поэтому вероятность
возникновения парадокса, равная 12/216 = 0,0556, невелика. (В работе Niemi, Weisberg
[1968) проведены аналогичные вычисления для различных значений t и и, и
обнаружено, что эта вероятность не превышает 0,31, если число альтернатив не более 6,
независимо от количества индивидуумов, производящих выбор.)
19. Одна из причин, из-за которой вычисленная в упражнении 18 вероятность
возникновения парадокса голосования была несколько занижена, могла быть вызвана
тем, что ранжировки не являются случайными для индивидуумов. В работе
Riker, Ordeshook [ 1973] говорится о стратегическом голосовании, в котором избиратель
"действует не в соответствии со своими истинными вкусами с тем, чтобы достичь
более высоких целей". Для иллюстрации эффекта стратегического голосования
рассмотрим президентские выборы 1912г. (см. упражнение 8). Предположим, что каждый
избиратель голосует только за наилучшего для него кандидата, а победитель
определяется правилом большинства. Тогда победителем оказывается Вильсон. Пусть
избиратели знают предпочтения друг друга. Показать, что если 25% избирателей голосуют
"стратегически", то победителем может оказаться другой кандидат. Если есть
возможность предотвратить стратегическое голосование, следует ли это делать? Можно
ли представить себе, как можно не допустить стратегического голосования?
375
§ 7.2. Теорема Эрроу о невозможности
7.2.1. Аксиомы Эрроу. В этом параграфе мы обсудим следствия из
набора аксиом для функции группового выбора, первоначально
предложенных в несколько иной форме Нобелевским лауреатом Кеннетом Эрроу
(Arrow [1951]). В этих аксиомах формулируются условия, которым
должна удовлетворять "разумная" функция группового выбора. Наше
изложение материала тесно связано с книгой Luce, Raiffa [1957, гл. 14].
Аксиома 1 (положительная связь групповых и индивидуальных
предпочтений) . Если функция группового выбора определяет по данному
профилю, что а предпочтительнее Ь, то это предпочтение сохранится, если
профиль изменить следующим образом:
а. Индивидуальные предпочтения для пар альтернатив, отличных от а,
не меняются.
б. Индивидуальное предпочтение для альтернативы а и любой другой
альтернативы может измениться только в пользу а.
Для иллюстрации этой аксиомы рассмотрим четыре индивидуума,
выбирающих автомобиль из множества А = {"Форд","Шеви","Плимут" }. Их
выбор определяет следующий групповой профиль:
Pi Рг Ръ Ра
"Форд" "Шеви" "Шеви" "Плимут"
"Шеви" "Форд" "Форд" "Форд"-"Шеви"
"Плимут" "Плимут" "Плимут"
Предположим, что функция группового выбора определяет ранжировку
"Форд"
"Шеви"
"Плимут"
Рассмотрим теперь профиль второй группы индивидуумов:
Р\ Р\ Ръ Р*
"Форд" "Форд" "Шеви" "Плимут"
"Шеви" "Шеви" "Форд" "Форд"
"Плимут" "Плимут" "Плимут" "Шеви"
Тогда Pi -Pi пР'з -Ръ* В ранжировке/^ "Шеви" становится менее
предпочтительным, чем "Форд", хотя по-прежнему предпочтительнее
"Плимута". В Р\ "Шеви" становится менее предпочтительным, чем "Форд",
и по-прежнему менее предпочтителен, чем "Плимут". Таким образом,
если функция группового выбора удовлетворяет аксиоме 1 и в качестве
альтернативы взять "Форд", то во второй группе "Форд" по-прежнему
предпочтительнее "Шеви".
Аксиома 2 (независимость несвязанных альтернатив). Пусть А х -
произвольное подмножество множества альтернатив А. Если при изменении
профиля индивидуальные предпочтения среди элементов А сохраняются,
то групповые предпочтения, получающиеся для исходного и измененного
профиля, на альтернативах из А х должны совпадать.
Аксиома 2 утверждает, что в групповой ранжировке результаты
попарных сравнений альтернатив, не входящих в А ь и их сравнений с альтернати-
376
вами из А1, не связаны с результатами сравнений альтернатив из A i. Для
иллюстрации этой аксиомы возьмем А = {"Форд","Шеви", "Плимут",
"Фольксваген", "Датсун" }. Пусть Аг ={ "Форд", "Шеви", "Плимут" } и
t = 3. Рассмотрим профили
"Форд" "Фольксваген" "Форд"-"Шеви "-"Плимут"-
-"Фольксваген"
"Фольксваген" "Илимут"-"Датсун" "Датсун"
"Датсун" "Шеви"
"Шеви"-"Плимут" "Форд"
"Датсун" "Плимут" "Форд"-"Шеви"-"Плимут"
"Форд" "Шеви" "Фольксваген"-"Датсун"
"Шеви"-"Плимут" "Фольксваген"
"Фольксваген" "Датсун"
"Форд"
BPi иР| наЛх имеем ранжировку
"Форд"
"Шеви"-"Плимут"
В Р2 и Рг - ранжировку
"Плимут"
"Шеви"
"Форд"
и в Ръ и Р'ъ — ранжировку
"Форд"-"Шеви"-"Плимут".
Таким образом, согласно аксиоме 2, какие бы групповые ранжировки
не получались для первого и второго профилей на множестве А, они
должны совпадать на А х. Если добавляются две новые альтернативы —"Датсун"
и "Фольксваген",—которые сравниваются мевду собой и "Фордом", "Шеви"
и "Плимутом"и при этом результаты индивидуальных попарных сравнений
между "Фордом", "Шеви"и "Плимутом"не меняются, то и в групповой
согласованной ранжировке результаты попарных сравнений между
"Фордом", "Шеви" и "Плимутом" также не меняются.
Аксиома 3 (суверенность граждан). Для каждой пары альтернатив а
и Ъ существует профиль, для которого в групповой ранжировке а
предпочтительнее Ь.
Если бы эта аксиома не выполнялась, то нашлась бы пара таких
альтернатив а и Ьу что независимо от индивидуальных предпочтений, даже
если для каждого индивидуума а предпочтительнее Ь9 в групповой
ранжировке альтернатива а никогда не была бы предпочтительнее Ь,.В.этом
случае результат общественного (группового) сравнения а и Ь навязан
группе и предпочтения граждан (индивидуумов) не играют никакой роли.
Аксиома 3 удовлетворяется при выполнении следующего естественного
377
условия: если каждый индивидуум ставит а впереди Ь, то для группы а
предпочтительнее, чем Ь.
Аксиома 4 (отсутствие диктатора). В группе нет такого индивидуума,
что если для него а предпочтительнее b при любых а и b G А, то и для
группы а должно быть предпочтительнее Ь независимо от предпочтений других
индивидуумов.
Если для индивидуума / аксиома 4 нарушена, естественно назвать его
"диктатором). Оставшаясь часть общества (группы) может иметь
влияние на окончательный результат сравнения альтернатив а и b только, если
для/ они безразличны.
Исследуем теперь аксиомы Эрроу для различных значений t и п = \А\.
При t = 1, когда имеется только один индивидуум, аксиомы Эрроу не
представляют особого интереса. Аналогична ситуация в случае п= I. Если
л = 2, то при всех / > 2 правило простого большинства определяет функцию
группового выбора, удовлетворяющую аксиомам Эрроу. Для проверки
аксиомы 1 заметам, что если для большинства людей а предпочтительнее Ь,
то это предпочтение сохранится при передвижении b на более низкое место
в некоторых ранжировках. Аксиома 2 представляет интерес лишь при
Ах ФА; в нашем случае Ах может состоять только из одного элемента.
Поскольку имеется единственная ранжировка на одноэлементном
множестве, аксиома 2 тривиально удовлетворяется. Аксиома 3 выполняется, так
как для следующего профиля по правилу простого большинства а пред
почтительнее Ь:
а а а
Ъ Ъ Ъ
Чтобы убедиться в справедливости аксиомы 4, рассмотрим сначала
случай t > 2. Тогда для приводимого ниже профиля по правилу простого
большинства а получает более высокое, чем Ь, место, хотя для /-го
индивидуума b предпочтительнее а.
Р Р Р Р Р Р
а а ... a b а ... а
b b ... b a b ... b
Если t = 2, то для следующего профиля группа считает а п b
равноценными, хотя индивидуум/ так не считает!
a b
Ъ а
Рассмотрим теперь случай, когда имеется не менее трех альтернатив,
а группа состоит хотя бы из двух индивидуумов, т.е. п> 3 и t > 2. Тогда
справедлива следующая теорема.
О Сравнить с определением диктатора в гл. 6. [В литературе встречаются также
термины "лидер", "доминирующий член группы". (Примеч. ред.)]
378
Теорема 7.1 (теорема Эрроу о невозможности). Пусть множество
альтернатив А содержит не менее трех элементов, число индивидуумов t
не меньше двух и 9*t (A) - множество всех профилей на А для группы
из t индивидуумов. Тогда функции группового выбора, определенной
на 9t (А) и удовлетворяющей аксиомам 1—4, не существует.
Эта теорема совершенно поразительна, поскольку на первый взгляд
аксиомы 1—4 вполне естественны. Другими словами, теорема утверждает,
что если функция группового выбора удовлетворяет аксиомам 1 и 2, тогда
она либо навязанная, либо диктаторская. Мы откладываем доказательство
теоремы на конец этого параграфа.
7.2.2. Обсуждение. Теорема Эрроу рассматривается многими как
негативный результат относительно возможности демократического принятия
решений. Если мы столкнулись с подобным результатом, то имеется
несколько путей. Один подход состоит в том, чтобы попытаться осмыслить
аксиомы несколько более критически. В рамках другого подхода можно
было бы изменить условия, для которых формулируется теорема Эрроу,
и учесть, что она говорит лишь о невозможности получения групповой
ранжировки из заданных индивидуальных ранжировок. Не исключено,
что мы могли бы изменить требования, предъявляемые ко входу
(индивидуальным ранжировкам) или к выходу (групповым ранжировкам)
так, чтобы допускались некоторые другие рациональные процедуры
принятия решений. Мы попытаемся использовать оба подхода. (Более подробно
с этими возможностями можно познакомиться по книге Luce, Raiffa
[1957].)
Большинство авторов находит наиболее уязвимой аксиому 2. И вот
почему. Пусть группа состоит только из двух индивидуумов. Будем
предполагать, что оба они равноправны при выработке коллективного мнения,
и если для одного а предпочтительнее Z>, а для другого Ъ
предпочтительнее я, то для группы эти альтернативы равноценны.
Рассмотрим пример, когда A f{ "Форд","Шеви","Плимут" } и
профиль имеет следующий вид:
Рх Рг
"Форд" "Форд"
"Шеви" "Шеви"
"Плимут" "Плимут"
Поскольку ранжировки Pi иР2 совпадают, кажется естественным считать,
что согласованная групповая ранжировка Р, соответствующая этому
профилю, также совпадает с ними: Р=Р\ =/V Однако рассмотрим теперь
профиль
Р'г Рг
"Форд" "Плимут"
"Шеви" "Форд"
"Плимут" "Шеви"
Пусть Р' — согласованная групповая ранжировка, соответствующая этому
профилю. По аксиоме 2 Р' должна совпадать сР тА\ = {"Форд","Шеви").
379
Мы получаем ("Форд")^("Шеви"), а значит, и ("Форд'ОР'С'Шеви"), т.е.
"Форд" находится в ранжировке/*' выше "Шеви".
Рассмотрим теперь профиль
?Г P'j
"Форд" "Плимут"
"Плимут" "Форд"
"Шеви" "Шеви"
Если индивидуумы считаются равноправными членами группы, то, по-
видимому, обоснованно, чтобы для группы в этом случае "Форд" и
"Плимут" были равноценны. Однако теперь по аксиоме 2,
примененной к (Р[, Р'г) и А* = {"Форд","Плимут"}, для группы "Форд"и
"Плимут" должны быть также равноценны и по профилю (Р[,Р'г). Таким
образом, "Форд" и "Плимут" связаны в Р\ Поскольку ранее мы отметили, что
выполнено ("Форд") Р' ("Шеви"), ранжировка Р' имеет вид
Р'
"Форд"-"Плимут"
"Шеви"
Аналогично,взяв вместо (Р\9Р'г) профиль
РГ Рг"
"Шеви" "Плимут"
"Плимут" "Шеви"
"Форд" "Форд"
можно доказать, что "Шеви" и "Плимут"связаны в Р[Это противоречит
полученной ранжировке Р\ а именно предпочтительности "Плимута" перед
"Шеви". По-видимому, этот пример содержит сильные аргументы против
аксиомы 2. Однако необходимо отметить, что полученное противоречие
определяется не одной аксиомой 2. Оно также зависит от ряда сделанных
допущений: по профилю (Р1у Р2) группа выбирает согласованную
ранжировку Рх =Р2; если задан профиль (РГ,/^), то Для группы равноценны
"Плимут" и "Форд", а если задан профиль (Р[",Рг")> то дня группы
равноценны "Шеви" и "Плимут".
Ко второму аргументу против аксиомы 2 приводит следующее
рассуждение. Пусть t = 2, Предположим, что А г = { "Форд", "Шеви" } и группа
должна определить какую марку автомобиля выбрать, если будет решено
вообще совершить покупку. Допустим, что индивидуум 1 предпочитает
"Форд" "Шеви", а индивидуум 2 предпочитает "Шеви" "Форду".
Предложим теперь каждому индивидууму сравнить приобретение группой "Форда"
или "Шеви" с получением некоторой денежной суммы. Предположим, что
имеются следующие упорядочения индивидуальных предпочтений:
Рх Рг
6000
5000
4000
"Форд"
"Шеви"
6000
5000
4000
"Шеви" "Форд"
380
Mi>i бы испытывали искушение выбрать для группы "Шеви", а не "Форд",
поскольку для первого индивидуума, предпочитающего "Форд", и "Форд",
и "Шеви"не очень ценны, тогда как для второго "Шеви" весьма ценен
в отличие от "Форда". Однако, согласно аксиоме 2, нужно также выбрать
"Шеви" и для таких упорядочений по предпочтениям
Р'х Р'г
"Форд"
6000
5000
4000
6000
5000
4000
"Шеви"
"Шеви" "Форд"
Примеры, подобные этому, наводят на мысль, что причина ошибочности
аксиомы 2 вызвана исключением из рассмотрения в допустимых исходных
данных (профиле) интенсивности предпочтительности одаой альтернативы
перед другой. Таким образом, можно было бы несколько изменить
основную исследуемую структуру, задаваемую лишь индивидуальными
ранжировками, и учитывать больше информации, в особенности обращая
внимание на интенсивность предпочтений индивидуумов разных альтернатив.
С различными предложениями о введении интенсивности предпочтений
можно познакомиться в работах Luce, Raiffa [1957], Coombs [1954] или
Goodman, Markowitz [1952]. Альтернативой этому подходу было бы,
конечно, использование меньшей информации. Можно было бы, как это
исторически и делалось, собирать информацию лишь о наиболее
предпочтительной для каждого индивидуума альтернативе, а не о ранжировке. Можно
было бы также наложить ограничения на допустимые индивидуальные
ранжировки. Будем придерживаться этого подхода в следующем
параграфе. Все такие подходы предусматривают изменение исходных данных для
принятия решений. Некоторые студенты, изучавшие методы принятия
решения, предпочли сохранить исходные структуры, но заменить аксиомы
Эрроу другими. Однако не существует универсального набора аксиом,
не приводящих к определенным трудностям. Тем не менее остается еще
один подход, использующий прежнюю основную входную информацию,
но изменяющий условия, предъявляемые к результату применения
функции группового выбора. Она могла бы определять только победителя, а
не полные ранжировки. К сожалению, упражнения из предыдущего
параграфа показывают, что в этом случае имеется много достаточно
обоснованных различных функций группового выбора, среди которых трудно
выявить наилучшую. Кроме того, аксиоматизация выбора победителя
вместо ранжировки также приводит к затруднениям. При другом
очевидном видоизменении в качестве группового решения допускается вместо
ранжировки некоторый другой тип отношения порядка. (Этот подход
можно было бы развивать на основе работ Богарта (Bogart [1973,1975]),
показавшего, как находить так называемый строгий частичный порядок
из множества ранжировок. В строгом частичном порядке некоторые
альтернативы могут быть несравнимы.) Наконец, как и будет указано в § 7.4,
можно считать допустимым, чтобы функция группового выбора
определяла несколько согласованных ранжировок, вместо одной.
381
7.2.3. Доказательство теоремы Эрроу1). Завершим этот параграф
доказательством теоремы Эрроу. Сначала введем несколько определений.
Пусть 9 = (Pi ,7*2, ..., Pt) -профиль из совокупности §>t (A), F -
функция группового выбора на 9>t(A),J — подмножество множества
индивидуумов /И аФЬ входит в множество А. Будем говорить, что профиль5й
J-предпочтителен для (я, Ь), если для всех i из / выполнено аР(Ь. Будем
говорить, что профиль 3* строго J-предпочтителен для (я, Z>), если он
/-предпочтителен для (я, Ь) и для всех i^J выполнено ЬР{а. Таким
образом, профиль 3* /-предпочтителен для (я, Ь), если для каждого
индивидуума из J а предпочтительнее Ъ и строго /-предпочтителен для (я, Ь)9
если дополнительно для каждого индивидуума, не входящего в /, Ь
предпочтительнее я. Наконец, множество /называется решающим для (я, Ь),
если для каждого профиля 3й, в котором выполнено aPtb при всех /€/,
выполнено и aF (<р) Ъ. Другими словами, / служит решающим множеством
для (я, Ь), если на каждом профиле, /-предпочтительном для (я, Ъ), в
групповом выборе а также предпочтительнее Ь. Для примера рассмотрим
групповой выбор по правилу простого большинства (забыв на мгновение, что
оно не является функцией группового выбора) и допустим, что / содержит
2/3 членов /. Тогда / — решающее множество для любой пары (а,Ь).
Лемма 1. Если выполнены аксиомы Эрроу, то множество / является
решающим для (а, Ъ) тогда и только тогда, когда имеется строго
/-предпочтительный для (я, Ь) профиль 9*, для которого выполнено aF (9) b.
Доказательство. Если / — решающее множество для (я, Ь), то
на каждом строго /-предпочтительном для (я, Ъ) профиле 5й выполнено
aF(9>) Ъ.
Остается допустить существование такого профиля и доказать, что
/ — решающее множество для (я, Ъ). Для этого возьмем произвольный
/-предпочтительный для (я, Ъ) профиль Р' и покажем, что выполнено
aF(SP') Ъ. В доказательстве мы, конечно, должны опираться на аксиомы
Эрроу.
Последовательно преобразуем 5й в 3й . Эта процедура иллюстрируется
рис. 7.1, которым следует пользоваться при доказательстве. Построим
по профилю 3й профиль 9" следующим образом.
а) Для каждого / € / заменим /*/ на Р\.
б) Если для / ф J выполнено ЬР\а, заменим Pt на Р\.
в) Если для i $ J выполнено аР\Ь или аТ\Ь, изменим Ри перемещая Ь
максимально вниз, но так, чтобы b оставалось выше я.
Таким образом на рис.7.1 по правилу а) имеем Р" = Р[, Р% =/JИ Р'з = Р'ъ,
по правилу б) - P's =P's и по правилу в) Р^и Р*1 получены из Р* и Р6
соответственно максимально возможным для сохранения предпочтительности
Ь перед я, перемещением Ъ вниз. Читатель должен проверить, что из
аксиомы 2, примененной к множеству А г = {я, Ь), следует, поскольку выполнено
aFi^b, что выполнено и aF Eй") Ъ.
Пусть теперь в профиле ?Р' отсутствуют элементы, (вязанные с я.
Построение для случая наличия таких связей предоставляется читателю.
*) Этот пункт можно пропустить.
382
&":
р%
а
Ъ
X
У
z
Р"%
а
b
X
У
z
а
b
X
У
z
р;
х
а
У
z
Ь
Р'2
X
а
У
z
b
Рг
X
а
У
z
Ъ
Рг
У
а
Ъ
X
Z
Рг
У
а
Ъ
X
Z
рг
У
а
Ъ
X
Z
р*
X
а-Ь
z
У
р:
У
ь
а
X
Z
Р4
X
а-Ь
z
У
Р'ш
Ъ
z
X
а
У
Р'1
ъ
z
х
а
У
ъ
z
х
а
У
К
X
а
У
b
z
р!
Z
X
У
b
а
р,
X
а
У
b
z
а
X
У
b
z
а
b
X
У
z
X
а
z
У
b
Рг
X
а
У
z
Ъ
У
z
X
а
Ъ
У
а
Ъ
X
Z
Ъ
У
а
л*
z
у
а-Ь
X
Z
у
X
b
У
а
Р9
b
z
X
а
У
b
z
X
У
а
Рф
z
X
У
а
b
Рис. 7.1. Иллюстрация к доказательству теоремы 7.1. Здесь J = {1, 2,3}
Теперь построим из & " профиль &'" следующим образом:
а) Если z^/и выполнено аР}Ь, переместим Ъ на один уровень ниже а.
б)Если / ^ /и выполнено аТ(Ь, переместим Ъ на один уровень с а.
в) В остальных случаях пусть РJ" = Р'1.
Таким образом, на рис. 7.1 /^"получается из Pi по правилу а) РЦ' полу-
чается из РЦ по правилу б). По аксиоме 1 изaF($>")b следует aF($>'")b.
Наконец, получим &"" из ф'" следующим образом. Для всех /ф/, для
которых выполнено аР\Ъ или аТ\Ъу заменим/^-" наР/. На рис. 7.1 Pfl "и Р™
получены изР*,[и Р'ь' соответственно по этому правилу. Из аксиомы 2,
примененной к {а, Ь}9 находим, что выполнено aFC>'")b. Кроме того,
легко показать, что #>""= 3й '. ¦
Лемма 2. Если выполнены аксиомы Эрроу, то множество / -
решающее для каждой пары (а, Ь).
Доказательство. По аксиоме 3 имеется такой профиль # =
~ (Л у Ргу •.. >?t)у чго выполнено aF(&) b. ПостроимР\из Р/,
перемещая а на первое место, и 9' = (Р'и PL . • •, P't). По аксиоме 1
выполнено aF(<7>')b. Заметим, чго ^'является строго /-предпочтительным
профилем для (а, Ь). Тогда из леммы 1 следует искомое утверждение. ¦
Для завершения доказательства теоремы Эрроу возьмем некоторое
минимальное решающее множество /, т.е. такое решающее для некоторой
пары (д, Ь) множество, ни одно собственное подмножество которого не
является решающим для любой пары (с, d). Такое множество / найдется,
поскольку по лемме 2 / - решающее множество для некоторой пары {а, Ь).
Будем удалять из / элементы до тех пор, пока получающиеся множества
будут оставаться решающими. Последним таким множеством окажется /.
Множество / непусто, так как в противном случае для некоторой пары
383
множество /\/ = /нерешающее. Зафиксируем/ G/ и получим противоречие
с аксиомой 4, показав, что / является диктатором.
Пусть/- решающее множество для (а, Ь) и с Фа. (Здесь используется
предположение, что А содержит не менее трех элементов, позволяющее
выбрать элемент с, отличный от а и Ь.) Рассмотрим следующий профиль 9*:
Pt для i€/\{/> Pi для ijj Pj
с Ъ а
а с Ъ
Ъ ас
А\{а,Ь,с) А\{а,Ь,с) А\{а,Ъ,с}'
В каждой ранжировке Р,- (i = 1, 2, ..., t) все элементы из А \{а, Ь, с}
связаны и занимают последнее место. Заметим, что для всех iEJ
выполнено аР(Ь. Поскольку множество / — решающее для (ау Ь), выполнено
аРЬ, где P=F(&>). Так как ^является строго
G\{/})-предпочтительным профилем для (с, Ь), также имеем ~ сРЬ. В противном случае по
лемме 1 множество J\{j) оказывается решающим для (с, Ь), что
противоречит минимальности решающего множества J. Таким образом,
выполнено аРЬ и ~~сРЬ. Элементы д, Ъ и с должны быть упорядочены в Р одним
из двух способов:
а а
или Ъ
Ь< с
В любом случае выполнено аРс, тогда, учитывая, что,кроме того,/ —
единственный индивидуум, для которого а предпочтительнее с, и применяя
лемму 1, получаем, что {/} —решающее множество для (а, с). Таким
образом, {/} не может быть собственным подмножеством J и поэтому
{/} -л
Теперь можно заключить, что {/} — решающее множество для (а, с)
при любом с Фа. Выше справедливость этого утверждения была
установлена при с Фа, Ь, а для с = Ъ следует из условия {/} =/. Чтобы убедиться,
что / является диктатором, остается показать, что {/} — решающее
множество для (J, а) при любом AФа,и для (d9 с) при любых с!,сФа.
Для доказательства последнего свойства, рассмотрим профиль 9* :
d
а
с
А\{а
,c,d}
с
d
а
А\{а,
Ч
c,d)
Пусть P=FCP). По лемме 2 множество /- решающее для любой пары
(х, у), поэтому выполнено dPa. Поскольку!/} - решающее множество
для {а, с), имеем аРс. Тогда из транзитивности следует и dPc. По лемме 1
получаем, что { / } является решающим множеством для (d9 с), что и
требовалось.
384
Остается убедиться, что {/} будет решающим множеством для (d9 a)
при йФа. Для этого рассмотрим профиль &:
i,
d с
с а
a d
A\{a,c,d) A\{aiCid)
Пусть Р =F(&). Поскольку {/ } — решающее множество для (<2, с), имеем
dPc. По лемме 2 выполнено сРа. Тогда из транзитивности получаем dPa.
Наконец, из леммы 1 следует, что {/ } является решающим множеством
для (d, а), это и завершает доказательство теоремы 7.1. ¦
Упражнения
1. Предположим, что три старых друга выбирают место для отдыха из четырех
штатов: Орегон (О), Нью-Йорк (Н), Флорида (Ф) и Калифорния (К)Г Рассмотрим
два профиля (первый представляет предпочтения друзей, а второй предложен их
женами)
Р р р Р' Р' р'
ф
О
к
н
ф
О
к
н
ф
О
к
н
ф
О
к
н
О
ф
К-Н
ф
о-к-н
Допустим, что в групповом выборе по первому профилю Ф предпочтительнее Н.
а. Следует ли из первой аксиомы Эрроу, что такое же предпочтение сохранится
и на втором профиле?
б. Выполнена ли вторая аксиома Эрроу?
2. Повторить упражнение 1, взяв первый профиль в качестве второго, а второй
в качестве первого.
3. Предположим, что в упражнении 1 действует следующее правило: если для
первого друга штат Флорида предпочтительнее штата Орегон, то такое же
предпочтение сохраняется и для группы. Является ли первый друг диктатором в том смысле,
как было определено в этом параграфе? Будет ли первый друг диктатором, если выбор
группы совпадает с его выбором, всегда, когда он не безразличен?
4. Может ли быть два диктатора для функции группового выбора FC^0), не
обязательно удовлетворяющей аксиомам Эрроу? (Использовать определение диктатора,
приведенное в этом параграфе.)
5. Показать, что лексикографическое отношение предпочтения, определенное
в упражнении 13 § 7.1, нарушает по меньшей мере одну из аксиом Эрроу.
6. Привести пример ранжировок Р/ без связей, показывающий, что правило Б орда
нарушает по меньшей мере одну из аксиом Эрроу.
7. Порождает ли мажоритарная система, определенная в упражнении 14 § 7.1,
функцию группового выбора, удовлетворяющую всем аксиомам Эрроу? (Привести
доказательство или противоречащий пример.)
8. (Riker, Ordeshook [1973]). Предположим, что часть советников президента
лояльно относится к нему, а другие нет, и президент хочет учитывать мнение только
преданных советников. В частности число голосов за некоторую альтернативу полагается
равным разности числа лояльных и не лояльных советников, поставивших а на первое
место. Президент ранжирует альтернативы, основываясь на числе голосов, полученных
ими в такой процедуре. Какие аксиомы Эрроу нарушены в ней?
25. Ф.С. Роберте 385
9. Воспользоваться следующим профилем для получения довода против второй
аксиомы Эрроу.
рыба пиво
мясо рыба
ростбиф мясо
виски ростбиф
пиво виски
10. Взяв в качестве начального следующий профиль, привести аргумент против
второй аксиомы Эрроу.
Л *t_
рыба рыба
мясо мясо
ростбиф ростбиф
11. Аксиомы Эрроу также оправданы и при несколько другой интерпретации.
Имеется единственный индивидуум, принимающий решение. Множество / образуют
различные случайные условия или события, в зависимости от которых меняется
принимаемое решение. Р\ представляет собой единственную ранжировку,
предложенную лицом, принимающим решение при условии /. (Например, во время
обострения международной напряженности целесообразно предпочесть в качестве президента
человека с опытом в международных делах, а во время инфляции или депрессии -
специалиста по экономике. Таким образом, наши ранжировки меняются в
зависимости от обстоятельств ').. Различные условия считаются равновероятными (хотя можно
было бы рассматривать и разные вероятности). Ищется в некотором смысле
наилучшая ранжировка альтернатив для рассматриваемых условий. Вся эта проблема может
быть названа проблемой условного ранжирования.
а. Привести аргументы, показывающие; что аксиома 2 может не годиться для этой
задачи.
б. Что в этом случае можно сказать об аксиоме 1?
12. Пусть/ = {1,2}.
а. Какой профиль из упражнения 1 /-предпочтителен для (Ф, Н) ?
б. Какой профиль /-предпочтителен для (Ф, О) ?
в. Какой профиль строго /-предпочтителен дня (О, К) ?
А
13. Функция группового выбора на ^ (Л) называется оптимальной по Парею 2\
если для любых а я Ь, входящих в А9 из предпочтительно ста а перед Ь в каждой
ранжировке профиля следует, что а предпочтительнее Ь в соответствующей
групповой ранжировке.
а. Переформулировать свойство оптимальности по Парето в терминах
/-предпочтительности.
б. Если правило простого большинства считать функцией группового выбора,
удовлетворяет ли оно условию оптимальности по Парето?
в. Оптимально ли по Парето правило Борда?
г. Оптимально ли по Парето лексикографическое групповое предпочтение из
упражнения 13 § 7.1?
д. Оптимальна ли по Парето мажоритарная система из упражнения 14 § 7.1.
14. Пусть г = 3 и третий индивидуум является диктатором. Аксиомы Эрроу не
предполагаются выполненными. Назвать все решающие и все минимальные решающие
множества.
1) Можно было бы также считать, что в различных условиях меняется не лицо,
принимающее решение, а его предпочтения. {Примеч. пер.)
2) Термин оптимальности по Парето используется в ситуации, отличной от
рассмотренной в гл. 6.
386
15. Проиллюстрировать доказательство леммы 1, используя следующие профили^
и полагая / = { 1}:
Л Рг Ръ Л
а Ь х Ь
Ь а Ь х
&= х х a z &
У У z у
z z у а
16. Предположим, что I является решающим множеством для всех (а, />), а / -
решающее множество для (х, у). Показать, что для приведенного ниже профиля^
выполнено zF {.°Р)у.
Pi для /€/ Pf для i$J
а
X
У
z
а
У
X
Ъ
К
ь
а
X
z
Р4
X
а-Ъ
Z
^ У
X Z
У х
A\{x,y,z) A\{x,y,z}
17. Предположим, что решающее множество J для (х, у) минимально. Пусть
к е /. Показать,, что для приведенного ниже профиля ^выполнено xF(fr)z.
(Лемма 1 может считаться доказанной.)
Pi для i<EJ\{k) Pt для ieI\J Рк
z ух
х z у
у х г
A\{x,y,z) ^\{jc,^,z} A\{x,ytz)
18. Достаточно ли одной аксиомы 1 для справедливости леммы 1? (Привести
доказательство или противоречащий пример.)
19. Достаточно ли одной аксиомы 2 для справедливости леммы 1? (Привести
доказательство или противоречащий пример.)
20. Проанализировать, подходят ли аксиомы Эрроу для ситуаций принятия
решений, описанных в упражнении 15 § 7.1?
21. Проанализировать аксиомы Эрроу на примере ранжирования кандидатур на
должность.
22. Проанализировать аксиомы Эрроу на примере выбора переменных знакового
орграфа в задаче о потреблении энергии (см. упражнение 16 § 7.1).
23. Проанализировать аксиомы Эрроу на примере выбора ранжировки игроков
турнира (см. упражнение 17 § 7.1).
24. Сравнить правомерность аксиом Эрроу в двух ситуациях: при независимом
голосовании в соответствии с предпочтениями избирателя и при стратегическом
голосовании в смысле упражнения 19 § 7.1.
25. Предложить несколько аксиом для функции группового выбора по своему
усмотрению.
§ 7.3. Совмещенные шкалы
и условия однопиковости предпочтений
В этом параграфе будет рассмотрена возможность ограничения
множества допустимых профилей (входной информации) в ситуации
коллективного принятия решений. Мы изменим наше понятие функции группового вы-
25* 387
бора и определим ее как процедуру, отыскивающую групповую
ранжировку для каждого профиля из некоторого множества профилей. Будет
показано, что если профиль получается в результате специальной процедуры, то
правило простого большинства не приводит к парадоксу голосования,
т.е. может использоваться для определения ранжировки. Поэтому правило
простого большинства является функцией группового выбора в том
смысле, что для каждого профиля из некоторого отобранного множества
профилей оно строит ранжировку. Эта функция выбора будет удовлетворять
Идеал индивидуума I Индибидуум 3 Индибидуум 2 Индивидуум 1
70 20 50 " 79
г II II i о 1 i i i i | i
х=0 у=5 и =60 и-100 xs0 (/=5 и-60 v-WO
Рис. 7.2. Совмещенная количественная шкала
всем аксиомам Эрроу, если изменить их так, чтобы они относились только
к профилям из выделенного множества.
Предварительно напомним понятие медианы. Если множество чисел S
(возможно с повторениями) содержит нечетное число элементов,
перечисленных в порядке возрастания, то медианой называется число,
находящееся и середине этой последовательности. Таким образом, если S
содержит 2А + 1 элементов, то медианой S будет (к+ 1)-й элемент. Например,
для множества S ={1,5, 2} упорядоченная последовательность элементов
имеет вид 1, 2, 5 и медианой служит число 2. Если S = {1,4,3,3,6} , то
упорядоченной последовательностью элементов служит 1,3,3,4, 6, а
медианой— число 3.
Приведем пример ситуации, когда правило простого большинства дает
ранжировку. Предположим, что кандидаты в президенты х,у, z и т.д.
оцениваются на шкале от 0 до 100 согласно общему числу набранных голосов
на основе процедуры голосования в соответствии с Законом о выборах.
На этой шкале кандидаты могут также оцениваться в соответствии с их
консерватизмом, либерализмом, отношением к военным расходам и т.п.
Пусть при рассмотрении возможных кандидатов индивидуум определяет
на этой шкале свою идеальную оценку (эта оценка характеризует его
предпочтение в приведенной выше шкале 0-100), например, равную 20,80 или
100. Тогда он считает, что кандидат а предпочтительнее кандидата Ъ в том и
только том случае, если расстояние от а до идеала меньше расстояния от Ъ
до идеала. Например, согласно рис. 7.2, а индивидуум / предпочитает
кандидата и кандидатам х, у и и, кандидата v кандидатам л: и у, а кандидата у
кандидату х1). Таким образом, ранжировка z-го индивидуума имеет вид
и
V
У
X
1) Для индивидуума / расстояние от идеала до кандидата а можно использовать
для измерения интенсивности /-го предпочтения а.
388
Предположим теперь, что каждый индивидуум может оценивать
кандидатов в единой шкале и на той же шкале оценок помещаются индивидуумы
(идеальные оценки каждого индивидуума). Тогда получается
совмещенная количественная шкала индивидуумов и альтернативу пример которой
показан на рис. 7.2, б. Используя вышеописанную процедуру, можно по
совмещенной шкале получить групповой профиль. Кумбс (Coombs [1954])
предложил функцию группового выбора для этой ситуации, если имеется
нечетное число индивидуумов. Функция Кумбса строится следующим
образом. Ищется индивидуум /, идеальная оценка которого является
медианой идеальных оценок всех индивидуумов. В качестве групповой
ранжировки берется ранжировка индивидуума /. Например, по рис. 7.2, б
определяется следующий профиль:
и
V
У
X
и
У
X-V
У
X
и
V
Для трех индивидуумов с множеством идеальных оценок {20, 50, 79}
медиану определяет индивидуум 2 с оценкой 50. Таким образом, групповой
ранжировкой согласно функции группового выбора Кумбса является
ранжировка индивидуума 2. Интересно отметить, что к тому же результату
приводит и правило простого большинства. (Проверить это утверждение.)
Такое совпадение не случайно.
лТеорема 7.2 (Goodman [1954]). Пусть А — множество альтернатив,
aJ#2fc+i (А) — множество всех профилей группы из Bк + 1) индивидуумов
на А, полученных по совмещенной количественной шкале. Функция
группового выбора Кумбса HaJ#2fc+i (Л) совпадает с правилом простого
большинства.
Следствие. Правило простого большинства на множестве профилей
Л?2*+1 (Л) определяет ранжировку.
Доказательство теоремы 7.2. Сначала предположим, что
индивидуум I, определяющий медиану, предпочитает альтернативу а
альтернативе Ъ. Тогда /-я идеальная оценка ближе к а, чем к Ь. Покажем, что,
поскольку идеальная оценка /-го индивидуума является медианой, то по
крайней мере к из других идеальных оценок ближе к а, чем к Ь, и поэтому
а предпочтительнее Ъ по меньшей мере для к + 1 индивидуумов, т.е. для
большинства. Все случаи взаимного расположения оценок альтернатив а, Ъ
и идеальной оценки индивидуума / представлены на рис. 7.3. В случаях
а, в, д альтернатива а предпочтительнее Ъ для всех индивидуумов с
идеальными оценками, не превосходящими i'-ю оценку, а в случаях б, г, е
альтернатива а, предпочтительнее Ь для всех индивидуумов с идеальными
оценками, не меньшими z-й оценки. Предположим теперь, что индивидуум /,
определяющий медиану, оценивает альтернативы а и Ь одинаково. Тогда
имеются две возможности, соответствующие случаям ж и з на рис. 7.3.
В случае ж оценка /-го идеала находится посередине между а и Ь. Тогда
точно к индивидуумов с оценками, не превосходящими /-ю, могут находиться
ближе к а, чем к Ь, и, аналогично, точно к индивидуумов с оценками, не
389
lab 7 1> Рис. 7.3. Оценка индивидуума /,
являющаяся медианой, и оценки двух альтер-
f • • е • • натив а и Ъ в различных случаях
2 ? %
меньшими z-и, могут находиться ближе к Ь, чем к а. Поэтому ни одна
из альтернатив а и Ъ не получает большинства. В случае з аиЬ имеют
одинаковые оценки и для всех индивидуумов они равноценны. Это .доказывает
теорему 7.2.. ¦
Кумбсом были сформулированы другие условия, при которых правило
простого большинства приводит к ранжировке. Предположим, что нет
возможности численно оценить все альтернативы или идеальные оценки
индивидуумов. Однако можно построить единое упорядочение всех
альтернатив и индивидуумов1). .Цля простоты будем считать, что полученная
ранжировка полная, т.е. не имеет связей. Например, для четырех
альтернатив х,у, и, v и трех индивидуумов 1, 2, 3 одной из таких ранжировок
оказывается следующая: х
2
У
и A)
1
V
3
Мы могли бы проинтерпретировать A) следующим образом:
альтернативы располагаются по убыванию их степени предпочтительности — х,у, и,
у; индивидуум 2 считает, что его место на этой шкале где-то между х и у,
индивидуум 1 считает, что его место между и и v и т.д. Такое
упорядочение называется совмещенной качественной шкалой индивидуумов и
альтернатив (в отличие от количественной совмещенной шкалы эта носит
название качественной). На ней можно определить расстояние от одного
элемента до другого, полагая его равным числу элементов между ними
плюс единица. (Если на совмещенной шкале имеются связи, то расстояние
определяется несколько иначе.) В нашем примере .расстояние от 2 до 1
равно 3, от у до и равно 1, от у до v равно 3 и т.д. По совмещенной
качественной шкале индивидуумов и альтернатив индивидуум / может
определить свою ранжировку следующим образом: если i находится на равном
расстоянии от двух альтернатив а и Ь, то в качестве более
предпочтительной он может выбрать любую из них; в противном случае предпочтительной
является ближайшая к нему альтернатива. Полученная в результате
ранжировка не имеет связей 2). В нашем примере для индивидуума 1 несомненно
1) Имеются в виду идеальные оценки индивидуумов. (Примеч. пер.)
2) При другом способе определения /-й ранжировки а и b считаются связанным
(равноценными), если находятся на равном от / расстоянии. Однако в дальнейшем
более удобно рассматривать ранжировки без связей.
390
v предпочтительнее у н х,и предпочтительнее у и х, у предпочтительнее х.
Выбор между и и v для него произволен, например, он может выбрать м.
Тогда его ранжировкой является и
v
У
х
Допустим, что групповой профиль (т.е. ранжировки всех членов
группы) получается именно таким образом. Бели в множестве индивидуумов
содержится нечетное число элементов, равное 2к+ 1, то на нем
по-прежнему можно выбрать медиану, а именно (к+ 1)-го индивидуума, считая с
любого конца. В нашем примере им оказывается индивидуум 1. Теперь
естественным образом можно определить функцию выбора, которую
также будем называть функцией группового выбора Кумбса: в качестве
групповой ранжировки выбирается ранжировка индивидуума,
являющегося медианой. Доказательством, аналогичным предыдущему, теперь
устанавливается следующий результат. В нем используется отсутствие связей
в полной совмещенной качественной шкале (см. упражнение 12. *)).
Теорема 7.3. Пусть А — множество альтернатив, a$2*+i (A) —
множество всех профилей группы из B?+ 1) индивидуумов на Л, полученных по
совмещенной (полной) качественной шкале. Функция группового выбора
Кумбса на $2fc+i (А) совпадает с правилом простого большинства,
определяющим ранжировку. А
Теорема 7.4. Функция группового выбора Кумбса на #2*+i (А)
(правило простого большинства) удовлетворяет всем аксиомам Эрроу2).
Доказательство. Доказательство предоставляется читателю
(упражнение 13).
Вернемся к совмещенной (полной) качественной шкале A) и выберем
некоторый профиль, произвольным образом удалив связи. Получим
следующий профиль:
Р, Рг Ръ
и х v
v у и
У и у
X V X
Представим каждую ранжировку в виде некоторой кривой следующим
образом. На оси х приведены альтернативы в порядке, соответствующем
1) Если в ранжировке индивидуума /, полученной по совмещенной качественной
шкале, а и Ь считаются связанными при равенстве, расстояний от / до а и Ь, то
доказательство проводится без предположения о полноте совмещенной качественной
шкалы.
а)Необходимо соблюдать осторожность при формулировке аксиом. Аксиомы 1 и
2 должны выполняться только для таких профилей из §2k+l (А)* ДЛЯ которых и
вновь получаемые профили находятся в$2к+1 (А). В аксиоме 3 следует потребовать,
чтобы профиль, обладающий нужным свойством, принадлежал &2к+1 И)* Наконец,
в определении диктатора из аксиомы 4 необходимо говорить лишь о профилях из
391
В(х)
BCr)
В(х)
и и
1
х у и и х
Индивидуум
у и v х
Индивидуум 2
В(х) Индивидуум 2 и , л я ,
<*. /*>*У* Индибидуум 3
Индибидуум 1
х у и v х
Совмещенные графики
Рис. 7.4. Примеры индивидуальных и совмещенных однопиковых кривых
совмещенной качественной шкале. По оси у отложены числа Борда В(х)
(см. § 7.1). На рис. 7.4 приведены результаты для трех ранжировок из
нашего профиля сначала раздельно, а затем в единой системе координат. Читатель
заметит, что каждая кривая состоит не более чем из двух монотонных
частей, причем, если их две, то сначала она возрастает, а затем убывает.
Таким образом, кривая либо всегда возрастает, либо всегда убывает, либо
некоторое время возрастает, а затем достигнув максимума, начинает
убывать. Такая кривая называется однопиковой 1). Профиль 9 удовлетворяет
условию однопиковости, если существует такое упорядочение множества
альтернатив А, что для этого упорядочения кривые, соответствующие
всем ранжировкам в #>, являются однопиковыми.
Теорема 7.5 (Coombs [1954]). Профиль ранжировок без связей#>можно
получить по полной совмещенной качественной шкале тогда и только
тогда, когда 5йудовлетворяет условию однопиковости.
Доказательство опускается.
Следствие. Если число индивидуумов нечетно, рассматриваются профили
без связей и для них выполнено условие однопиковости2), то правило
простого большинства удовлетворяет аксиомам Эрроу3).
Достоинство условия однопиковости состоит в необязательности ограни-
чивания себя установленной процедурой (методом совмещенной
качественной шкалы) для получения ранжировок. Можно просто попытаться
выяснить удовлетворяет ли профиль условию однопиковости. При
положительном результате применимо правило простого большинства.
Читателю следует обратить внимание на проверку условия
однопиковости. Любую ранжировку без связей можно представить однопиковой кривой,
!) Такие кривые обычно называются унимодальными. В литературе по принятию
решений говорят об условии однопиковости. (Примеч. пер.)
2) Условие однопиковости было предложено Блеком (Black [1948 а, Ь]),
доказавшим, что при его выполнении существует единственная альтернатива, которая
предпочитается большинством. Эрроу доказал достаточность условия однопиковости
для того, чтобы правило простого большинства определяло ранжировку.
3) См. сноску на с. 391.
392
нанося на ось х альтернативы в соответствии с порядком, определенным
самой ранжировкой. Условие однопиковости требует, чтобы однопико-
вые кривые для всех альтернатив профиля получались при одном и том же
упорядочении альтернатив. Для примера рассмотрим профиль:
Л Р2 Ръ
х у z
у z х
z х у
Для этого профиля правило простого большинства не определяет
ранжировку, и поэтому не существует упорядочения альтернатив, порождающего
однопиковые кривые для всех ранжировок профиля. Доказательство этого
факта предлагается в качестве упражнения (упражнение 9) -
Подробнее с вопросами, связанными с условием однопиковости, можно
ознакомиться в работах: Black [1958], Luce, Raiffa [1957] или Riker,
Ordeshook [1973].
Упражнения
1. Найти медиану для следующих множеста:
а. {0,5, 10, 11,16};
6.E,2,7,73,21};
в.{5,5,5,1,2};
г.{5,5,5,1,1}.
2. Предположим, что при оценивании по степени участия в движении "Американцы
за демократические действия'' сенатор А имеет оценку 0, сенатор В - оценку 20,
Индивидуум
5
Индивидуум ИндивидууА Индивидуум Индивидуум
2 4 I 3 1
10 40 45 70 95
0 15 50 75 tQO
Сенатор Сенатор Сенатор Сенатор Сенатор
А В С П Е
Рис. 7.5. Совмещенная количественная шкала для упражнения 5 § 7.3
сенатор С - оценку 60 и сенатор D - оценку 95. Какую ранжировку можно получить
по этим оценкам, если идеальная оценка немного меньше 80?
3. Оценки из упражнения 2 используются пятью индивидуумами, дающими
идеальные оценки, равные соответственно 0,10, 25, 50 и 80."
а. Построить для этих пяти индивидуумов профиль.
б. Определить индивидуум, который служит медианой.
в. Проверить, что его ранжировка и ранжировка, полученная по правилу простого
большинства, совпадают.
4. Повторить упражнение 3, если идеальные индивидуальные оценки равны 40, 50,
70, 90 и 100.
5. Повторить упражнение 3 для совмещенной количественной шкалы,
изображенной на рис. 7.5.
393
6. Рассмотрим совмещенную качественную шкалу для индивидуумов 1, 2, 3 и
альтернатив х, y,u,.vr w, имеющую вид
х
У
1
и
2
v
W
3
а. Построить ранжировки для каждого индивидуума.
б. Найти индивидуума, который является медианой.
в. Проверить, что его ранжировка совпадает с ранжировкой, полученной по правилу
простого большинства.
7. Повторить упражнение 6 для совмещенной качественной шкалы вида
1
3
х
У
4
z
5
2
8. Представить графически ранжировку
У
и
V
для каждого из приведенных ниже способов упорядочения по оси х альтернатив и
определить о дно пиковые кривые.
a. х, у, и, v.
б.
в. х, u9y,.v.
г. и, x,y,v.
9. Доказать, что приведенный ниже профиль отличен от однопикового, рассмотрев
все шесть возможных упорядочений альтернатив на оси х.
Рг Рг Рг
z х у
10. Определить, являются ли следующие профили однопиковыми:
X Z X
у у z
z х у
394
Рг
Z
X
у
рг
X
z
У
Рг
У
X
Z
р.
X
У
Z
11. Определить, можно ли получить приведенный ниже профиль из совмещенной
(полной) качественной шкалы индивидуумов и альтернатив
Л Рг рг
х у z
Z X X
у z у
12. Показать, что, если сов менянная качественная шкала неполная, т.е. допускает
связи, то функция группового выбора Кумбса и правило простого большинства могут
не совпадать. | Указание. Рассмотреть шкалу
13. Доказать теорему 7.4.
14. При каких обстоятельствах естественно допустить, что можно построить
совмещенную количественную или качественную шкалы индивидуумов и альтернатив?
§ 7.4. Расстояния между ранжировками
7.4.1. Аксиомы Кемени — Снелла. Кемени и Снеллом был предложен
другой подход определения функции группового согласования ( Kemeny,
Snell [1962, гл. 2]). В этом параграфе мы будем следовать ему, хотя наши
аксиомы будут несколько иными.
Рассмотрим следующие ранжировки множества А = { "Форд", Шеви",
"Плимут", "Фольксваген", "Датсун"}»
Р Q R
"Форд"
"Шеви"
"Плимут"
"Фольксваген"
"Датсун"
"Датсун"
"Фольксваген"
"Плимут"
"Шеви"
"Форд"
"Шеви"
"Форд"
"Плимут"
"Фольксваген"
"Датсун"
По-видимому, естественно считать ранжировки Р и Q сильно удаленными
друг от друга, а ранжировки R и Р близкими. Поэтому имеет смысл
говорить о расстоянии между двумя ранжировками. Обозначим через d(P, Q)
расстояние между ранжировками Р и Q. Если бы можно было точно
измерять расстояние, то за разумное правило получения согласованного
группового мнения следовало бы принять следующее: по данному профилю
ранжировок (Pl9P2, ,.., Pt) найти ранжировку Р с наименьшим
расстоянием от всех ранжировок Pt. Естественный путь, уточняющий это правило,
состоит в том, чтобы выбрать в качестве Р медиану, т,е. такую ранжиров-
t
ку Р9 что 2 d(P,Pt) минимальна О-В дальнейшем будут упомянуты
у = 1
') Почему это понятие аналогично понятию медианы для множества чисел?
395
другие пути для уточнения этого правила. Естественно, учитывая теорему
Эрроу, ожидать, что процедура либо нарушит одну из его аксиом, либо
окажется не в состоянии выбрать единственную ранжировку Р, либо будет
обладать обоими этими не достатками. Однако, даже если данная процедура
не приведет к выбору единственной ранжировки Р, она сможет ограничить
рассмотрение множеством разумных согласованных ранжировок Р
Эта новая процедура окажется бесполезной, если мы не будем знать, как
измерять расстояние d(P, Q). Прежде чем выписывать формулы для его
измерения, применим аксиоматический подход, как делалось в § 7.2.
Следуя Кемени и Снеллу, перечислим аксиомы, которым, как естественно
ожидать, наша мера расстояния могла бы удовлетворять. Если такое
множество аксиом задано, то имеется несколько возможностей. Во-первых,
может найтись ряд функций расстояния, удовлетворяющих аксиомам.
Во-вторых, может не существовать ни одной такой функции расстояния;
наше знакомство с теоремой Эрроу предполагает, что это наиболее реальная
возможность. Наконец, может найтись единственная функция расстояния,
удовлетворяющая этим аксиомам. Такая ситуация представляется
наилучшей, поскольку для нее аксиомы точно определяют способ измерения
расстояния. Аксиомы в этом случае называются категоричными 1)
Перед формулировкой аксиом, по-видимому, имеет смысл определить
ранжировку Q, находящуюся между двумя другими
ранжировками Р и R. Q находится между Р и R9 если для каждой пары
альтернатив а и Ъ из А результат их сравнения в Q находится между результатами
их сравнения в Р и R. А именно, если в Р и R результаты сравнения а и
Ь совпадают, они должны совпадать и в б- Если же в Р и R различные
результаты сравнения а и Z>, то результат сравнения в Q совпадает с одним
из них, причем в Q альтернативы а и Ъ могут быть связаны (равноценны),
если в одном случае а предпочтительнее Ь, а в другом Ъ предпочтительнее д.
Например, пусть А = {"Форд", "Шеви", "Плимут", "Фольксваген" } , а
ранжировки Р, Q, Q\ R имеют следующий вид:
Р Q ? R
"Форд" "Шеви" "Шеви" "Шеви"
"Шеви" "Форд" "Форд"-"Плимут" "Фольксваген"
"Плимут" "Фольксваген" "Фольксваген" "Плимут"
"Фольксваген" "Плимут" "Форд"
Тогда Q находится между Р и R, поскольку для пары {"Форд", "Шеви"} Q
совпадает с R; для пары {"Плимут", "Шеви"} Q совпадает с Р и R; для
пары {"Форд", "Плимут"} Q совпадает с Р; для пары {"Форд",
"Фольксваген"} б совпадает с Р\ для пары {"Шеви", "Фольксваген") Q совпадает с Р
и R и для пары {"Плимут", "Фольксваген"} Q совпадает с R. Аналогично,
') При рассмотрении понятия относительного баланса для малых групп в
упражнениях 21-26 § 3.1 отмечалось, что было бы хорошо получить аксиомы для меры
баланса. Можно было бы сначала ввести аксиоматику для расстояния между двумя
малыми группами, а затем для получения меры степени сбалансированности из меры
расстояния. Такой подход, основанный на представленных здесь аксиомах Кемени -
Снелла развивается в работе Norman, Roberts [1972].
396
Q' находится между Р и R, поскольку для пары { "Форд", "Шеви" } Q'
совпадает с R; для пары {"Шеви", "ПЛимут"} Q' совпадает с Р и R; пара
{"Форд", "Плимут" } связана в Q\ тогда как в Р предпочтительнее "Форд",
а в R предпочтительнее "Плимут" и т.д. Если Q находится между Р и R,
иногда будем пользоваться обозначением В(Р, Q, R).
Прежде чем сформулировать аксиомы для расстояния заметим, что мера
расстояния является действительно-значной функцией d:
$>(А)Х 9>{А)-» «,
л
где &{А) - множество ранжировок на множестве А. По-видимому,
естественно, что наша функция расстояния должна удовлетворять следующим
А
условиям для всех Р, Q, R из $>(А).
Аксиома 1.1. d(P, Q)>0 и равенство достигается тогда и только тогда,
Аксиома 1.2. d(P, Q) = d(Q, P).
Аксиома 1.3. d(P9 Q) + d(Q, R) >d(P, R) и равенство достигается тогда
и только тогда, когда выполнено В(Р, Q, R). Первая часть аксиомы 1.3 —
обычное неравенство треугольника. Если считать Р, Q ^ R точками на
плоскости, то тогда Q находится между двумя другими точками Р и R тогда
и только тогда, когда лежит на отрезке прямой, их соединяющей, или когда
кратчайший путь из Р в R проходит через Q, или когда d(P, Q) + d(Q, R) =
= d(P, R). Эти рассуждения объясняют вторую часть аксиомы 1.3.
Наша следующая аксиома утверждает, что мера расстояния не зависит
от конкретных "названий" ;.анных элементам из А. Другими словами, если
элементы А переименовать, то расстояния не должны измениться. В
частности, это означает, что если ранжировки Р, Q,P' и ?>' имеют вид
Р Q Р^ Q'
"Форд" "Плимут" "Шеви" "Форд"
"Шеви" "Шеви" "Плимут" "Плимут"
"Плимут" "Форд" "Форд" "Шеви"
то rf(P, Q) совпадает с d(P\ Qf), поскольку Р' и Q' можно получить изРи Q
переименованием "Форда" в "Шеви", "Шеви" в "Плимут" и "Плимута" в
"Форда". Переименование объектов из А обычно называется
перестановкой А, т.е. взаимно однозначным отображением А на себя. Тогда аксиома
перестановочности объектов формулируется следующим образом:
Аксиома 2. Если ранжировки Р' и Q' получаются из ранжировок Р и Q
соответственно одной перестановкой элементов множества A, iod(P, Q) =
Нашу следующую аксиому неформально можно сформулировать
следующим образом:
Аксиома 3 (неформальная формулировка). Если ранжировки Р и Q
совпадают в начале и конце и отличаются только на множестве элементов
в середине, то расстояние между Р и Q зависит только от упорядочений этих
средних элементов.
Прежде чем уточнить эту аксиому, проиллюстрируем ее на примере.
Допустим, что производится выбор цветных телевизоров и множеством
397
альтернатив является А = {"Зенит", "РСА', "Магнавокс", "Сильвания",
"Моторола", "Филко"). Рассмотрим следующие ранжировки (для
простоты опускаем кавычки):
Р Q Р1 Q'
Зенит
РСА
Магнавокс-
-Сильвания
Моторола
Филко
Зенит
РСА
Магнавокс
Моторола
Сильвания
Филко
РСА
Магнавокс-
Сильвания
Моторола
Филко
Зенит
РСА
Магнавокс
Могорола
Сильвания
Филко
Зенит
B)
Тогда PkQ различаются лишь на среднем сегменте, содержащем Магнавокс,
Сильванию и Моторолу. Они совпадают на верхнем сегменте, содержащем
Зенит и РСА и нижнем сегменте, содержащем Филко. Кроме того, Р' и Q'
различаются на среднем сегменте, содержащем Магнавокс, Сильванию и
Моторолу, и совпадают на верхнем сегменте, содержащем РСА, и нижнем
сегменте, содержащем Филко и Зенит. По аксиоме 3 d{P, Q) = d(P\ Q').
Читатель должен обратить внимание на сходство этой аксиомы и
аксиомы 2 Эрроу о независимости несвязанных альтернатив.
Для уточнения аксиомы З1) введем понятие сегмента ранжировки.
Подмножество S из А называется сегментом ранжировки Р9 если каждый
элемент а из A \S находится либо выше любого элемента из 5, либо ниже
любого элемента из 5. S называется собственным сегментом, если S Ф А.
Например, в ранжировке Р из B) множества {Магнавокс, Сильвания,
Моторола} и {РСА, Магнавокс, Сильвания, Моторола} суть сегменты. Множество
{ РСА, Моторола)не будет сегментом, так как между РСА и Моторолой
находится Магнавокс. Множество {PC А, Магнавокс } также не является
сегментом, поскольку Сильвания находится не выше njie ниже Магнавокса.
Если S = S(P) — сегмент ранжировки Р9 то множество S = S (Р), содержащее
все элементы выше S в Р9 и множество 5 = 5(Р), содержащее все элементы
ниже S в Р9 также сегменты. P(S\ P(S) и РE) обозначают ранжировки,
полученные из Р для элементов, входящих в сегменты 5, S и 5
соответственно. Например, для ранжировки Р из B), если S(P) = { Магнавокс,
Сильвания, Моторола}, то S = S(P) = {Зенит, РСА} и 5 = 5(Р) = {Филко}
Кроме того,P(S ),РE) и РE) имеют следующий вид:
РE)РE)P(S)
Зенит Магнавокс<йльвания Филко
РСА Моторола
Если S_- общий сегмент двух ранжировок Р и Q, то S (Р) может не совпа
дать с S (Q). (Почему?) Будем говорить, что ранжировки Р и Q согласованы
*) Читатель может пропустить строгую формулировку аксиомы 3 и перейти
непосредственно к аксиоме 4.
398
вне 5, если S их общий сегмент и S (P)= S (Q) = S, S_(Р) = 5(Q) = 5,. />(? ) =
= Q(S ) и />(? ) = Q( 5 ). После этих предварительных замечаний можно дать
строгую формулировку аксиомы 3.
Аксиома 3. Пусть S — сегмент ранжировок Р, Q, P\ Q1; ранжировки
Р, Q и ранжировкиР\ Q' попарно согласованы вне S иP(S) = Р'(?), Q(S) =
В нашем примере, представленном в B) для S = {Магнавокс, Сильва-
ния, Моторола }, легко проверить, что Р и Q, Р1 и Q* согласованы вне S и
P(S) =P'(S), Q(S) = Q'(S). Соответствующие ранжировки приведены ниже.
P(S ) = Q(S ) P'(S ) = Q\S )
Зенит Филко РСА
PCA
P(S)=P'(S)
Филко Магнавокс-Сильвания Магнавокс
Зенит Моторола Моторола
Сильвания
Таким образом, по аксиоме 3 d(Pf Q) = d(P\ Q).
Последняя аксиома достаточно произвольна и принимается из
соображений удобства: в ней устанавливается единица измерения.
Аксиома 4. Минимальное положительное расстояние между элементами
из &(А) равно 1, т.е. для всех Р и Q из 9>(А) d(P, Q) = 0 или d(P, 0 > 1,
а для некоторых Р и Q из §>(А) tf (Р, 0 = 1.
7.4.2. Вычисление расстояния. Теперь нас будет интересовать вопрос
существования функции расстояния, удовлетворяющей аксиомам Кемени
и Снелла, а если такая функция существует, то единственна ли она? Ответы
на эти вопросы положительны.
Теорема 7.6. (Kemeny, SnellI. Для каждого множества альтернатив А>
содержащего не менее двух элементов, существует единственная функция
л л
расстояния d на 3*(А) X SP(A), удовлетворяющая аксиомам 1-4.
Для доказательства существования такая функция d будет построена
в явном виде. Доказательство единственности не приводится. Пусть Р и Q —
ранжировки на множестве А, и а, Ь — элементы А. Положим ЪР д(а, Ь),
равным 0, если порядок а и Ъ совпадает ьР и Q; равным 2, если в одной
ранжировке а превосходит Ь9 а в другой Ъ превосходит а, и равным 1, если
в одной ранжировке либо а превосходит Ь, либо Ъ превосходит а, а в другой
ранжировке а и Ъ связаны. Тогда функция d(P, Q) равна сумме значений
bp, q(u> b) по всем (неупорядоченным) парам {а, Ь) из А. Например,
возьмем следующие ранжировку Ри Q:
Р_ Q
"Форд" "Форд-"Плимут"
"Шеви" "Шеви"
"Плимут"
399
Тогда
d(P, Q) = 8Pf q ("Форд", "Шеви") + 8Pt Q ("Форд", "Плимут") +
+ 8Pt Q ("Плимут", "Шеви") =0+1 + 2 = 3.
Теперь проверим, что определенная таким образом функция d9
удовлетворяет аксиомам 1-4 для каждого множества альтернатив А9
содержащего не менее двух элементов.
Аксиома 1.1. Все величины 8Рд (а, Ь) неотрицательны. Поэтому сумма
всех величин 8Ргд(а,Ь) также неотрицательна. Кроме того эта сумма
равна 0 тогда и только тогда, когда каждый ее член равен 0, или, что
эквивалентно, когда для всех а, Ъ из А ранжировки PmQ совпадают, т.е. Р = Q.
Аксиома 1.2. Эта аксиома верна, поскольку дР> q (а, Ъ) = 8gt P(af b).
Аксиома 1.3. Определим 8р(а, Ь) следующим образом:
11, если аРЬ9
-1, если ЬРа, C)
0, если а и Ь связаны в Р.
Тогда для всех а, Ьиз А имеем
>\8p(a,b)-8R(a,b)\. D)
Складывая неравенства D) по всем парам {а, Ь), получим первую часть
аксиомы 1.3, т.е.
d(P,Q) + d(Q,R)>d(P,R). E)
Равенство в E) может достигаться только тогда, когда в D) имеется
равенство для всех at b из А, которое в свою очередь означает, что 5 ® (а, Ь)
находится между Ьр(а, Ь) ъ8к(а,Ь). Таким образом, легко видеть, что
равенство в D) для всех пар а, Ьиз А означает, что Q находится между Р и
R (упражнение 21).
Аксиома 2. Перестановка элементов А не влияет на d, потому что
приводит к сложению (в другом порядке) тех же слагаемых дР д(а, Ь).
Аксиома 3. Легко проверить, что, если ранжировки Р и Q совпадают
на начальных и конечных элементах и различаются лишь на среднем
сегменте 5, то 8Pt q(u, Ь) = 0 при а ? S или b?S. Таким образом, d(P, Q)
получается суммированием членов 5/>, Q\at b) для а и b из 5, что и означает
выполнение неформальной формулировки аксиомы 3. Для проверки ее строгой
формулировки заметим следующее. Сходные рассуждения показывают,
что, если ранжировки Р' и Q' совпадают на начальных и конечных
элементах и отличаются лишь на среднем сегменте S, то d(P\ Q') получается
суммированием членов 5^ Q>(a, b) для а и b из S. Наконец, если Р и Р'
совпадают наS, a Q и Q' совпадают на 5, то 8Pf gfa b) = 8Р> Q>(a, b) при а и
ft, находящихся в S. Таким образом, d(P, Q) = d(P\ Q').
Аксиома 4. Поскольку 8Pt q(u, Ъ) всегда является неотрицательным
целым числом, таким же свойством обладает и d(P, б). Пусть а0 Ф Ьо
(по предположению А имеет не менее двух элементов), а Р и Q имеют
400
Рис. 7.6. Расстояния между ранжировками
трех объектов. Расстояние между i* и Q равно
наименьшей сумме весов по цепи,
соединяющей Р и Q (Kemeny, Snell [1972])
следующий вид:
Р Q
А\ {по, bo) bo
А\{а0, b0}
Тогда 5р^(д0, b0) = 1 и 5Р^(д, Ь) = О
для всех остальных пар, поэтому d (P, Q) =
= 1. Таким образом, минимальное
положительное расстояние равно 1.
При | А | = 3 расстояния легко вычисляются. Совокупность ранжировок
из трех элементов удобно представлять шестиугольником, как сделано
на рис. 7.6; на нем показаны расстояния между некоторыми ранжировками.
Для определения расстояния между двумя произвольными
ранжировками Р и 2, следует найти на рис. 7.6 кратчайшую цепь из Р в
Q. Длина этой цепи равна d(P, Q). Например, расстояние между
ранжировками
СО-С)
равно 5. Одна из цепей длины 5 имеет вид
7.4.3. Медианы и средние. Если имеется способ измерения расстояния
между двумя ранжировками, то с его помощью можно определять
групповую функцию согласования. Назовем медианой профиля ранжировок
t
(Р%* Piy-y Pt) такую ранжировку Р, что 2 d{Py P
минимальна, а
средней ранжировкой - такую ранжировку /\ что 2 d(P, PfJ минималь-
/= 1
на. Желательно выбирать в качестве согласованной групповой ранжировки
медиану или среднее. Медиана и среднее являются в статистике мерями
"центральности" или "основной тенденции", и действительно, можно было
бы использовать вместо медианы или среднего любое понятие
центральности.
Приведем несколько примеров. Рассмотрим профиль:
"Форд"
"Шеви"
"Плимут"
26. ф.С. Роберте
"Форд"
"Шеви"
"Плимут"
"Шеви"
"Форд"
"Плимут'1
401
Используя для вычисления расстояний рис. 7.6, получим, что медианой
является ранжировка /
"Форд"
"Шеви"
"Плимут"
В самом деле, ^d(PtP{) = 0 + 0 + 2 = 2, тогда как ддя любой другой
ранжировки Q 4Ld(QtPi)>3. Чтобы показать это, заметим сначала, что
если е=Рз, то Zd(Q, Pt) = 2 + 2 + 0 = 4. Далее, если Q Ф Ри Р2, Рз, то
по аксиоме 4 d(Q, Р() > 1 для всех /. В этом примере согласованная
ранжировка, определенная медианой, совпадает с двумя из трех ранжировок
профиля. При помощи среднего определяется ранжировка вида
"Форд"-"Шеви"
"Плимут"
Для нее 2d(Q, РJ = I2 + I2 + I2 = 3. Легко видеть, что эта величина
минимальна, поскольку для любой другой ранжировки Q либо d(Q, Рг) > 2,
либо d(Q,P3)>2, и поэтому TE,d(Q,PiJ >4. Таким образом, среднее
отличается от медианы, в средней ранжировке "Форд" и "Шеви"
равноценны и оказываются предпочтительнее "Плимута". Обе процедуры
представляются достаточно разумными: первая принимается большинством, во
второй имеющиеся данные о предпочтительности Форда и Шеви считаются
недостаточными. Таким образом, остается проблема определения
процедуры, приводящей к более обоснованной функции согласования, и этот
вопрос не решается на основе аксиоматического подхода к выбору
расстояния.
Использование в качестве групповой функции согласования медианы
и среднего приводит и к другой серьезной проблеме. Оказывается, что
медиана и среднее определяются не единственным образом. Рассмотрим
для примера профиль
Pi Рг Ръ
"Форд" "Шеви" "Плимут"
"Шеви" "Плимут" "Форд"
"Плимут" "Форд" "Шеви"
Ддя него три ранжировки Л, Рг иР3 являются медианами. Средним
оказывается единственная ранжировка "Форд"-"Шеви"-"Плимут",
свидетельствующая о связи всех трех элементов. Вновь оба подхода кажутся
достаточно естественными: первый рекомендует экспертам "принять свой выбор",
а второй считает, что имеющиеся различия в данных недостаточно велики.
К сожалению, если медиана не единственна, ее нельзя использовать ддя
определения функции группового согласования в принятом нами смысле:
требуется выбрать единственную согласованную ранжировку. Однако, если
профиль полностью симметричен, то в той же степени, что и одну,
естественно отобрать и несколько ранжировок.
402
Средние также определяются не однозначно, в чем можно убедиться,
рассмотрев следующий профиль:
Л Р%
"Форд" "Плимут"
"Шеви* "Шеви"
"Плимут" "Форд"
Средними оказываются ранжировки:
"Шеви" "Форд"-"Плимут" "Форд"-"Шеви"-"Плимут"
"Форд"-"Плимут" "Шеви"
Как упоминалось при обсуждении теоремы Эрроу, разумный подход
состоит в ослаблении требований к функции группового согласования.
Бели отказаться от выявления единственной согласованной ранжировки,
го медиана и среднее определяют вполне приемлемые функщш группового
согласования. Однако проблема выбора между ними остается.
7.4.4. Замечания. 1. Одна из трудностей, связанных с применением
метода Кеменн — Снелла, вызывается отсутствием эффективной процедуры
нахождения по данному профилю медианы или среднего. Вычисление
величин Zd(Q,Pi) или 2 d(Q9PiF для каждой возможной ранжировки Q не
представляет сложности. Однако это может потребовать очень больших
затрат времени. Иногда, как в нашем первом примере, легко убедиться,
что некоторые ранжировки Q приводят к меньшим значениям ZduZd2,
чем другие, что можно использовать, чтобы исключить многие вычисления.
2. Нахождение расстояния d(P, Q) часто можно свести к вычислению
расстояний между ранжировками, не совпадающими на небольшом
множестве элементов. Предположим, что ранжировка О, в которой все
элементы равноценны (связаны), находится между ранжировками Р и Q. Тогда
d(P, Q)=d(P, O) + d(p, Q) = d(P, O) + d(Q, О).
Таким образом, достаточно вычислить d(P, О) и d(Q, О). Покажем, как
определить первое расстояние. Бели ранжировка не содержит связанных
элементов, то d(P,O) =п(п — 1)/2, где п — число элементов в А (см.
упражнение 5). Пусть теперь в Р входят связаннные элементы. Возьмем
Л) = Р и построим из Л) ранжировку Pi, упорядочивая произвольным
образом первое множество связанные элементов. Повторим этот процесс для
построения ранжировок Рг, Рг и т.д., пока не будет получена ранжировка
Рг без связей. Тогда легко доказать, что
d(P, О)="(П~ 1} - d(P0, Л) -d(Plt P2)-.. .-d(Pr_lf Pr). . F)
(Доказательство предоставляется читателю в качестве упражнения 22.)
Расстояния d(Р/, Р( + г) вычисляются просто, поскольку Pt и Р{+1 различа
ются только на множестве связанных элементов 5, которые были
упорядочены при переходе к Р,* +1 •
Таким образом,
26* 403
где s = | S |. (Почему?) В результате:
где сумма берется по всем множествам S связанных в Р элементов.
Для иллюстрации этой процедуры зададим Р = Ров ввде
x-y-z
u-v
а
b-c-d
В ранжировке Р имеется три множества связанных элементов {х, у, z },
{и, v}n{b, c,d) . Поэтому
2B-1)
РанжировкиР\, /а иРз имеют следующий вид:
JC X
У У
z z
и и
V V
а а
b-c-d b
с
d
Для ранжировки Q
a-b-c-d
u-v-x
У
z
аналогичные вычисления показывают, что d(Qf О) = 27. Поскольку О
находится между Р и Q получаем, что d(P, Q) = d(Pf О) + d(Qf О) = 29 +
+ 27 = 56
3. Рассмотренные аксиомы действительно не дают всей процедуре
прочную аксиоматическую основу. В этих аксиомах ничего не говорится
о выборе способа согласования (медиана или среднее).
4. В аксиомах содержится одно неявное предположение. А именно,
аксиомы для расстояния зависят от нашего определения отношения
находиться "между". Для данного понятия "между" аксиомы представляются
достаточно обоснованными. Но почему следовало принять именно это
конкретное определение? Скорее всего, чтобы можно было воспользовать-
404
ся аксиоматическим подходом. (Аналогичная проблема встречалась нам
при аксиоматизации меры трофического статуса в п. 3.5.2.) Подобные
неявные предположения часто возникают, если используются термины,
близкие по своему значению. Другие определения понятия "между" могли
бы привести к иным способам измерения расстояния.
5. Один из подходов к проблеме единственности медиан и средних
состоит в ослаблении ограничения на тип отношения порядка, к которому
относятся ранжировки. В этом параграфе рассматривались отношения,
которые в гл. 8 будут называться отношениями строгого слабого порядка.
Богарт (Bogart [1973]) недавно показал, что аксиомы, аналогичные
аксиомам 1—4, определяют единственную функцию расстояний для случая
отношений строгого частичного порядка. Среднее и медиана тогда также
оказываются строгим частичным порядком. Аналогичный результат о
единственности расстояния получен в работе Bogart [1975] для
асимметричных отношений, удовлетворяющих единственному условию: если
выполнено аРЬ, то не выполнено ЬРа. Медиана в пространстве
асимметричных отношений по существу единственна. (См. Bogart [1975, теорема 4].)
Кроме того она определяется по правилу простого большинства, т.е.
медианой является такое асимметричное отношение М, для которого
выполнено аМЬ тогда и только тогда, когда выполнено aPfi для большинства
индексов /.
Для случая, рассмотренного Кемени и Снеллом, этот результат имеет
следующий смысл. Если правило простого большинства, примененное
к профилю ранжировок (ранжировки в смысле,рассматриваемом в этой
главе), определяет ранжировку, то она является ранжировкой в
пространстве всех асимметричных отношений. Она оказывается единственной
медианой, если только для некоторых а и Ь, число индивидуумов, для которых а
предпочтительнее Ь, не равно числу индивидуумов, для которых Ъ предпоч.-
тительнее а 1).
б2). При анализе социально-экономической информации и в статистике
используется понятие корреляции между двумя множествами данных.
Коэффициент корреляции — это функция, относящая двум множествам
данных число между —1 и 1. Чем больше по абсолютной величине это
число, тем более точные заключения можно делать об одном множестве
данных, используя другое. Положительная корреляция означает, что данные
соответствуют друг другу, отрицательная, что данные несовместимы.
Классическим коэффициентом корреляции служит коэффициент Кендалла
т, измеряющий корреляцию между двумя ранжировками Р и Q одного
множества объектов. Коэффициент Кендалла задается формулой
2d(P, Q)
(i>0l
где d — функция расстояния, которая была введена ранее, а п — число
элементов А. Чтобы прояснить смысл этого коэффициента, заметим, что
*) Автор благодарен профессору Богарту, обратившему его внимание на это
обстоятельство.
2) Это замечание принадлежит Богарту (Bogart [1973J).
405
в действительности он получается нормировкой расстояния d(P, Q) в
величину, изменяющуюся между 0 и 1 и затем преобразованную в шкалу
[—1,1]. В самом деле,
т(Р, 0=1-,
"max
где dm8LX — максимальное расстояние между двумя ранжировками на
множестве Л. Читателю остается доказать, что dmux действительно равно
п (п — 1) (упражнение 17). Таким образом, аксиомы 1—4 можно считать
теоретическим фундаментом для стандартных методов ранговой
корреляции.
71). Меры различия, рассматриваемые в этом параграфе, оказываются
частным случаем функщш расстояния хеммингова типа между
взвешенными множествами (см. Раппопорт [1979 а, Ь]). Пусть Л = (а\, . . . ,ят),
В = (&ь ..., bm) - векторы весов, соответствующие подмножествам их и
U2 множества U={ик, к = 1,..., m }, элементы которых взвешены, ак и
Ьк — веса элемента ик в t/i и U2 соответственно, ак и Ьк = 0 при ик ^
^ U\(U2), pk^Q — априорные весовые коэффициенты, характеризующие
важность элементов из U и фиксированные для всех возможных выборов
из него, Н — совокупность допустимых подмножеств в U. Вектор С лежит
между векторами АиВЕ:Н9 если С € Я, и
, bk) <ck <max{0?, bk) ,k = 1,..., m.
Оказывается, что для действительных весов единственной функцией
расстояния d(A, В) удовлетворяющей условиям:
1) d(Л, В) = d(B, А) (симметрия);
2) если С, лежит между А и В, то d(Ay В) =d(A,C) +d(C, В)
(аддитивность по "прямой"),
3) d(A, А + ХЕк) =рк\щгя всех X G [0, 1], Ек = @,. . . , 0, ек = 1, 0, . . .
... , 0), является функция расстояния хеммингова тапа
m
d(UuU2) = d(A,B)= 2 pk\ak-bk\
к = 1
(щ>ирк > 0, к = 1,..., m, d(U\, U2)- метрика). Используя это
утверждение, можно единственным образом ввести расстояние и между
произвольными взвешенными орграфами. Теперь А, В - матрицы весов дуг орграфов
Gi(Xif {УД G2(X2, U2) с п вершинами в Xi UX2 -Xy p(Uf) —априорные
весовые коэффициенты дуг
) {) ц
i, i = 1
Аналогичные результаты справедливы для различных классов
взвешенных орграфов: транзитивных, графов упорядочений, сверхтранзитивных
и др.; из них, в частности, следуют и результаты Кемени—Снелла и Богарта,
приведенные ранее для ранжировок, частичных порядков и асимметричных
отношений.
1) Добавление переводчика.
406
Упражнения
1. Пусть А ={окорок, копченая колбаса, салями, ростбиф}. Рассмотрим
ранжировки:
Р
окорок окорок салями
салями копченая колбаса-ростбиф окорок-копченая колбаса-
ростбиф
копченая колбаса салями
ростбиф
а. Вычислить d(P,Q), d(Q,R) и d(P,R), используя введенную в этом параграфе
функцию расстояния.
б. Выяснить, применив аксиому 1.3, находится ли Q между Р и R.
в. Проверить результат, полученный в пункте б, используя определение отношения
"между".
2. Повторить упражнение 1 для следующих ранжировок на множестве альтернатив
А = (Хемингуэй, Фолкнер, Шекспир, Милтон}
Р Q R
Хемингуэй
Фолкнер
Шекспир
Милтон
Хемингуэй-Фол кнер
Шекспир-Милтон
3. Пусть расстояние d (/>/» Pj) равно элементу /, /
Л ?г
Л/о 6
РЛ 6 0
РЛ 1 5
РЛЗ 5
Ръ
1
5
0
4
РА
3\
А
4
о/
Милтон
Шекспир
Фолкнер
Хемингуэй
в следующей матрице:
а. Найти ранжировку Pj, служащую медианой, если множество всех возможных
ранжировок есть {Pt, Рг, Р3, Р4} .
б. Единственна ли медиана?
в. Найти среднюю ранжировку Pj .
г. Является ли эта средняя ранжировка единственной?
4. Пусть Р - ранжировка без связей на множестве А; обозначим через Рс обратную
ранжировку. Показать, что d (Р, Р с) = п (п - 1), где п - число элементов в А.
5. Пусть Р - ранжировка без связей на множестве Л, а в ранжировке О все
элементы А связаны. Показать, что d{P, О) ~ п(п - 1)/2, где п равно числу элементов в А.
6. Применить аксиому 2 к следующим ранжировкам:
JP_ Q_ Jl _?
х z x-z x-y
У x у x
z у
а. Верно ли, что d{P, Q) = d{R, S)l
б. Верно ли, что d(P, R) = d(Q, 5)?
в. Верно ли, что d(P, S) = d(Q, Л)?
7. Повторить упражнение 6 для следующих ранжировок. (Замечание. При
переобразовании не все элементы изменят свое наименование.)
Р Q_ R S
х x-y-z у х-у-х
у х
z z
407
8. Рассмотреть следующие ранжировки. К какому выводу позволяет прийти
аксиома 3?
"Кадиллак"
"Форд"
"Плимут"
"Меркури"
"Фиат"
'Тойота"
Р'
"Фиат"
"Форд"
"Кадиллак"
"Форд"
"Плимут"-"Меркури"
"Фиат"
"Тойота"
С
"Фиат"
"Форд"
"Плимут"-"Меркури" "Плимут"
"Кадиллак"
"Тойота"
"Меркури"
"Кадиллак"
"Тойота"
9. Какие из приведенных ниже множеств являются сегментами ранжировки Q из
упражнения 8?
а. S = {"Кадиллак", "Форд"}-
б. S = {"Форд", "Плимут" }.
в. S ={ "Плимут", "Меркури", "Фиат" }.
10. В ранжировке Р'из упражнения 8найти5 (Р'),?(/>'),/>' (S),P' (S) иР' (?)
для каждого из следующих сегментов S:
2l.S = {"Форд", "Плимут", "Меркури"};
6.5 ={ "Форд" };
в. S = {"Плимут", "Меркури", "Кадиллак"}.
11. Пусть A = {x,y,z} . Используя расстояния, приведенные на рис. 7.6, найти все
средние и медианы для следующего профиля:
л
X
У
z
р*
x-y-z
Рг
Z
У
X
12. Пусть A ={x,yyz) . Используя расстояния, приведенные на рис. 7.6, найти все
средние и медианы для следующего профиля:
x-y-z x-y-z x-y-z x-y-z x
У
z
13. Пусть А ={ окорок, копченая колбаса, салями } . Используя расстояния,
приведенные на рис. 7.6, найти все средние и медианы для следующего профиля:
Л Р_г Р»
окорок окорок окорок
копченая колбаса салями копченая колбаса-салями
салями копченая колбаса
14. Привести пример профиля для множества А, | А \ = 4, который имеет более
одной медианы.
15. Привести пример профиля для множества А, \ А \ =4, который имеет более
одного среднего.
16. Существуют ли такие две ранжировки Р тл R, между которыми нет ни одной
ранжировки кроме них самих?
17. Показать, что если \ А\ =ии </тах = тах<*(Р, Q), где максимум берется по
всем возможным ранжировкам Р и Q множества А, то dmax = и (л - 1).
408
18. Предположим, что в ранжировке О все элементы связаны, а ранжировки Р и
Q имеют следующий вид:
а-Ъ-с Ы
d g
e-f e-f
g-h-i d
a-b-c
а. Показать, что выполнено отношение В (Р, О, Q), т.е. О находится между Р и Q.
б. Вычислить d(P,Q), используя формулу G).
19. (Kemeny, Snell [1962]). Определим матрицу D//), перечисляя в npon3Bonv
Р Р
ном порядке элементы а19 а2,..., ап из Л и полагая 4/у = б (я/, Jy), где б
определено C). Для матриц (аф выполнены при всех/,/ следующие условия:
A)*,у = +1,-1,0.
(II) 40 «-«//.
(III) Если Л/у > 0 и ajk > 0, то я/? > 0; а^ = 0 только если ац = 0 и яд = 0.
Матрица, удовлетворяющая условиям (I) - (III), называется матрицей упорядочения.
Показать, что каждая матрица упорядочения удовлетворяет следующим условиям.
(Замечание. В доказательстве можно использовать только условия (I) - (III).)
а. Если ац = 1, 4у* = 1» то а^ = 1.
б. <7# = 0.
в. Если ац = 0, то 4у/ = 0.
г. Если ац = 1 и afjc = 0, то д,-? = 1.
д. Если ац = 0 и лд = 1, то д,-? = 1.
20. Будем говорить, что ранжировки Р19 Р2,... ,РГ лежат на прямой, если для
всех i </ < А: выполнено В (Pi,Pj,Pic)9 т.е. Ру лежит между Р/ и Р^. Показать,
используя только аксиомы, что если Р,, Р3,... ,РГ лежат на прямой, то
d(PltPr) = d(PitP2) + d(P2,P9) + ...+d(Pr_1,Pr).
21. а. Доказать, что если б определяется C), то Q лежит между Р и R тогда и
только тогда, когга для всех a. h из Л
6Р(а, b)<6 Q(a, b) < bR(a, b)
или
8Р(а, Ъ) > bQ(a, Ь) > bR(a, b).
б. Проверить, что равенство в соотношении D) для каждой пары at b достигается
тогда и только тогда, когда Q находится между Р и R.
22. Доказать справедливость F). (Указание. Показать, что О, Ро, Р1, ..., Рг
лежат на прямой в смысле упражнения 20.)
23. (Kemeny, Snell [1962]). Построить чертеж, аналогичный рис. 7.6, для всех
ранжировок на множестве из четырех альтернатив. (Указание. О можно взять за
центр "полуправильного" тела, т.е. тела, ограниченного двумя типами правильных
многоугольников, а другие точки, соответствующие ранжировкам, можно расположить
на поверхности тела. Изобразить только поверхность.)
24. Привести доказательство или противоречащий пример для каждого из
следующих утверждений:
а. Если выполнено В (Р/, P/+i, P/+ 2) Для всех / = 1, 2,..., г - 2, то Р1, Р2,...
• • ,РГ лежат на прямой (см. упражнение 20).
б. Если выполнено ^(P/,P/+i,P/+2) Д™ всех / = 1, 2, ...,/¦- 2, то d(P.iPr) =
(PP)+d(PP)+ + d(P1,Pr).
409
Если d(PltP2) = d(PltP2) + d(P2,P9) +. ..+d(Pr_i,Pr), то выполнено
В (Ph Ph Pk) для всех i <j < к.
25. (Kemeny, Snell [ 1962 f).
а. Пусть &= (/>1, P2, Рг) hPj находится между /\ и Ръ. Доказать, что Я^ -
единственная медиана для ^
б. Можно ли обобщить этот результат на случай пяти индивидуумов?
в. Что происходит в случае четырех индивидуумов? (Существует ли аналогичный
результат?)
26. Рассмотрим ранжировки Rt,R2 и R3 на множестве Л ={а, b)
R\ &г Яэ
а Ь а-Ь
Ъ а
л
а. Вывести из аксиом, что, если d - мера расстояния на^(Л) и d(RltR2) =a,
то расстояния определяются следующей матрицей
Rt R2 Я3
Rt / 0 2л а \
R2 | la 0 а \
R3 \ а а 0 /
б. Кроме того, показать, что а = 1.
27. Продемонстрировать, как стратегическое голосование (см. упражнение 19
§ 7.1) может изменить для профиля медиану или среднее.
28. Проанализировать возможные ситуации, в которых вы отказались бы от
аксиомы 3.
29. Предложить другие способы измерения расстояния между двумя
ранжировками и проверить, удовлетворяют ли они аксиомам Кемени и Снелла.
Глава 8
ИЗМЕРЕНИЕ И ПОЛЕЗНОСТЬ
§ 81. Введение
В предыдущей главе мы исследовали поведение группы индивидуумов,
каждый из которых выражал свое предпочтение относительно набора
альтернатив. В этой главе мы рассмотрим понятие предпочтения с
индивидуальной точки зрения. Точнее, нам предстоит изучить, что же понимается
под мерой индивидуального предпочтения. Как средство для измерения
предпочтения будет введено понятие функции полезности. Более
подробное обсуждение теории полезности читатель может найти в работах Fishburn
[1968, 1970 с] и Luce, Suppes [1965], в которых имеются ссылки и на
другие обзоры научной литературы по этому вопросу.
Будет изучено с общих позиций, что представляет собой измерение в
различных контекстах научных дисциплин. В § 3.1 уже обсуждалась идея,
согласно которой научный прогресс есть следствие того, что ранее неточные
понятия и отношения были сделаны точными. Довольно часто такой
переход от неточных отношений к точным может быть достигнут путем
"измерения". В этой главе мы попытаемся понять смысл измерения именно на
таком фундаментальном уровне. Полученные результаты будут применены
к измерению предпочтений, измерению громкости звука, к
интеллектуальным тестам, к сравнениям,, использующим потребительский индекс цен,
к анализу данных по результатам парных сравнений и к различным другим
проблемам.
Нетрудно выделить два основных типа измерений: фундаментальные и
производные. Фундаментальные измерения и меры возникают на
ранних стадиях научного развития, когда несколько основных понятий
впервые подвергаются метризация. В качестве примера такого типа понятий в
физике можно указать на понятия массы и объема. Производные
измерения возникают позже, после того, как основные понятия уже метризованы:
новые меры определяются в терминах уже существующих. Например,
плотность определяется как отношение массы к объему. Ниже обсуждаются
в основном фундаментальные измерения1), хотя большинство
развиваемых идей в такой же степени применимы и к производным мерам.
Читателю следует помнить, что по мере развития научной дисциплины
появление фундаментальных мер происходит совсем не таким формальным
путем, как это излагается ниже. Цель нашего обсуждения не в том, чтобы
описать реальные процессы измерений, а скорее в том, чтобы попытаться
поставить проблему измерений на твердое основание.
1) Обсуждение вопросов, связанных с производными измерениями, можно найти в
работах Suppes, Zinnes [1963] и Roberts.
411
Излагаемый подход к проблеме фундаментальных измерений близок
к работам Scott, Suppes [1958], Suppes, Zinnes [1963], Krantz [1971]
и к работе Робертса. Для читателя, который пожелает ознакомиться с
другими взглядами, нашедшими отражение в обширной литературе о
природе измерения, можно рекомендовать работы Adams [1965], Campbell
[1920, 1928], Cohen, Nagel [1934], Ellis [1966], Helmholtz [1887], Pfan-
zagl [19431, Ruse [1943], Stevens [1946,1951,1959,1968].
§ 8.2. Отношения
В этом параграфе вводятся некоторые математические понятия, которые
широко используются в настоящей главе. Более подробно с ними можно
ознакомиться по работам Робертса и Suppes [1957].
8.2.1. Определение отношения. Пусть А есть множество вершин и U —
множество дуг ориентированного графа/). Множество (/представляет собой
совокупность упорядоченных пар элементов множества А9 т.е.
подмножество прямого произведения АХ А. Такие подмножества упорядоченных пар
элементов из А часто называют бинарными отношениями. Таким образом,
каждый орграф определяет бинарное отношение и любое бинарное
отношение определяет некоторый орграф. Различие между теорией
ориентированных графов и теорией отношений, по-существу, сводится к
расстановке акцентов. Первая из них имеет дело со структурами и во многих случаях
может быть классифицирована как геометрическая. Теорию отношений
тогда можно охарактеризовать как алгебраическую. В теории графов
множество А часто предполагается конечным, в то время как большинство
утверждений теории отношений справедливы не только для конечных
множеств, но и для бесконечных. Помимо бинарных отношений можно
рассматривать и л-арные отношения при любом положительном целом я.
Определим парное отношение как множество упорядоченных элементных
Рис. 8.1. Орграф, соответствующий бинарному отношению (A, R), где Л =
{ 1, 2, 3, 4,5}, aR определено соотношением A)
Рис. 8.2. Орграф, соответствующий бинарному отношению D, S), где А =
{ 1, 2, 3, 4, 5} , a S - определено соотношением B)
подмножеств из множества Л,т.е. подмножество декартова произведения
А XА X ... XЛ, содержащего п множителей.
Как правило, отношения будут обозначаться буквами Р, R, S, Т и т.п.
Например,
Д = {A,1), B, 2), A,2), B,1)} A)
и
S = { A, 2), B,3), C,4), D, 5), A,3), A,4), A, 5), B,4), B,5), C, 5)} B)
есть бинарные отношения, определенные на множестве А = {1, 2, 3, 4, 5).
412
(Поскольку каждому отношению соответствует определенный орграф,
то иногда бывает полезно привести соответствующий рисунок; графы,
отвечающие выписанным отношениям R и S, изображены соответственно
на рис. 8.1 и 8.2.) Примерами тернарного и четырехместного (кватернар-
ного) отношений на множестве А = {1, 2,3,4, 5 } могут служить отношения
R ={A,1,1), A,2,1), B,5,5), D,5,3)} C)
и
? = {A,1,1,1), B,2,2,2), C,4,5,5), C,5,5,4), A,2,2, 1)}. D)
Обычный, каждодневный язык — богатый источник примеров
отношений. Если А — множество людей, проживающих в Соединенных Штатах,
то
S = ((a,b): aEA, ЬеА и а сестра^} E)
определяет бинарное отношение на А. Это отношение родства можно
назвать "быть сестрой". Аналогично множество пар
L ={(я, Ь): а€А и ЬЕА и а любит Ъ}
определяет еще одно бинарное отношение на А . Пусть В - множество
всех кандидатов на выборах, тогда множество пар
P={(a,b): aGA и
и вы явно предпочитаете кандидатам кандидату Ъ}
определяет бинарное отношение на В, называемое отношением
предпочтения. Четырехместное отношение S н&В может быть задано в виде
S = {(a, by су d): a, bt с, d G В и вы предпочитаете а по
сравнению с Ъ не в меньшей степени, чем вы предпочитаете с по
сравнению с d).
И, наконец, пусть С — совокупность всех учащихся в данной школе;
тернарное отношение R на С можно определить следующим образом:
R = { (a, bt с): а, Ь, с ? С и оценка по среднему баллу
успеваемости ученика а лежит строго между
соответствующими оценками учеников b и с}.
Следует предупредить читателя, что отношение не будет корректно
определенным, если не указать множество, на котором оно определено.
Так, например, если В есть множество всех женщин в Соединенных
Штатах, то отношение
S'H(atb): а ев и bGB и а сестра 6}
отличается от отношения 5, заданного соотношением E) на
множестве А — всех людей, проживающих в США. Чтобы подчеркнуть эту
зависимость от области определения, мы, как правило, будем говорить не об
отношении R, а об отношении (А, R).
Предположим, что (A,R) — бинарное отношение. Утверждение (a, b) E
в R будем записывать в виде aRb. Например, если отношение R определено
соотношением A), то имеем LR1, 1Л2,но не 1R3. Для тернарного
отношения (A,R) запись R (а, Ь, с) равносильна утверждению (a,b,c)ER.
Аналогичные обозначения используются для и-арных отношений при ^> 3.
413
Таблица 8.1
Свойства бинарных отношений
Бинарное (AR) отношение I Условия
Рефлексивное aRa для всех a G Л
Нерефлексивное Отрицание рефлексивности*)
Антирефлексивное ~ aRa для всех а е А
Симметричное aRb** bRa для всех af b e A
Несимметричное Отрицание симметричности
Асимметричное aRb^ ~ bRa для всех a, b e A
Антисимметричное aRb, bRa*>a = b для всех a, b e A
Транзитивное aRb, bRc -* aRc для всех а, Ь, с G/
Нетранзитивное Отрицание транзитивности
Отрицательно транзитивное ~аЯЪ, -bRc => -aRc для всех а, Ьу
Эквивалентное условие: xRy *» (xRz
или zRy)wi* всех x,y,zeA
*) Читателю предлагается подумать о примерах неантирефлексивных отношений,
которые, тем не менее, нерефлексивны.
8.2.2. Свойства бинарных отношений. Для многих бинарных отношений
характерно то, что они обладают рядом общих свойств; некоторые из таких
свойств обсуждаются ниже. Для удобства читателя все обсуждаемые
свойства сведены в табл. 8.1. Бинарное отношение (A, R) называется
рефлексивным, если для всех а Е A, aRa. Для примера предположим, что А есть
множество всех действительных чисел <R, &R - равенство, тогда отношение
(A,R) рефлексивно. Если же А = A, 2,3,4,5), a R определено
соотношением A), то отношение (A,R) не будет рефлексивным, поскольку не
выполняется 3R3.C другой стороны, если под R понимать то же отношение,
но определенное на множестве {1,2} , то оно становится рефлексивным.
Это еще одна причина почему, говоря об отношении, так важно указать
область его определения (см. табл. 8.1).
Пусть А есть множество всех людей, проживающих в Соединенных
Штатах, и отношение S "быть сестрой..." определено на А; в этом случае
отношение (A, S) нерефлексивно: никто не может быть сестрой самому себе.
Действительно, для каждого элемента а из А выполняется ~ aSa, т.е.
неверно, что aSa. Такое бинарное отношение называется антирефлексивным.
Бинарное отношение (AtS), в котором Л ={1, 2,3,4, 5}, а множество S
определено соотношением B), тоже антирефлексивно.
Бинарное отношение (A9R) называется симметричным, если всякий
раз, когда выполняется aRb, выполняется и bRa. Отношение "равенства"
на (R симметрично. Симметрично и отношение (A,R) с А = {1, 2,3,4, 5} и
множеством R, определенным соотношением A). Отношение "быть
сестрой" на множестве всех людей, проживающих в Соединенных Штатах,
несимметрично, хотя то же отношение "быть сестрой", определенное
на множестве всех американских женщин, - симметрично. К сожалению,
отношение "любить", по-видимому, несимметрично.
Бинарное отношение (А, 5), в котором А = {1, 2, 3, 4, 5), a S задано
соотношением B) в высшей степени несимметрично: для любых элемен-
414
тов а и Ь из А у если aSb, то ^bSa, т.е, не выполняется bSa. Такое
бинарное отношение называется асимметричным. Отношение (<ft, >) дает еще
один пример асимметричного отношения. Ранжирования, которые
изучались в гл. 7 предполагались асимметричными. Возможно, что и отношение
строгого предпочтения в общем случае также асимметрично.
Бинарное отношение (<R, >) неасимметрично. Положив а = b = 2 и
замечая, что 2> 2, из условия асимметричности следовало бы ~B> 2). Это
отношение почти асимметрично в том смысле, что всякий раз, KormaRb
и bRa, элемент а должен быть равен Ъ. Бинарное отношение,
удовлетворяющее такому условию, называется антисимметричным. Бинарное отношение
включения С, определенное на произвольной совокупности множеств,
дает еще один пример антисимметричного отношения.
В ряде мест этой книги уже упоминалось понятие транзитивного
бинарного отношения. Отношение (A,R) называется транзитивным, если каждый
раз, когда выполняются включения aRb и bRc, справедливо и включение
aRc. Бинарное отношение (<R, >) транзитивно, так же как и бинарное
отношение (<#, =). Транзитивным будет и бинарное отношение D, 5),
определенное на множестве Л = {1,2, 3,4, 5} соотношением B). (Потому
что S есть просто отношение < на множестве А) Представляется
разумным предположить транзитивность строгого отношения предпочтения:
если предпочитать альтернативу а альтернативе ЬугЬ — альтернативе с, то
следовало бы предпочесть а альтернативе с. Тем не менее позже мы узнаем
доводы, опровергающие это предположение.
Бинарное отношение называется отрицательно транзитивным, если
всякий раз, когда выполняется ~~aRb n-^bRc, имеет место и ~*aRc.
Отрицательно транзитивно и бинарное отношение (<R, >), потому что, если
~~(а>Ь) и ^(Ь>с), то а<Ь и Ь<с; следовательно, а<с и, значит,
~(а>с). Вообще говоря, отношение (A, R) отрицательно транзитивно
в тех случаях, когда транзитивно отношение "не быть в отношении R",
определенное на множестве А. Если А есть множество {1, 2,3,4,5 } и
множество S определено соотношением B), то отношение (А> S) отрицательно
транзитивно. Ибо отношение "не состоять в отношении 5" есть просто
отношение >, определенное на множестве А. Нетрудно доказать, что отношение
(A, R) отрицательно транзитивно в том и только том случае, если всякий
раз, когда xRy> всегда для любого z из А выполняется либо xRz9 либо
zRy, Это утверждение J есть строгое обращение утверждения §,
формулирующего свойство отрицательной транзитивности. (Так, если 8
утверждает "X влечет Yy\ то утверждение Cf означает "не Y влечет не Х*\) В
частности, легко видеть, что бинарное отношение С, определенное на некотором
семействе подмножеств, вообще говоря, не будет отрицательно хранзитив-
ным. Вполне может случиться, что, хотя х С у, найдется такое множество z,
что xfcz hz <?y.
8.2.3. Операции. Переходя от бинарных отношений к тернарным,
заметим, что такие операции, как сложения по существу представляют собой
тернарные отношения. Операцию сложения действительных чисел можно
считать соответствующей тернарному отношению ®, определенному на (R
следующим образом:
{(а,Ь, с): а,Ь9сЕб1 и с = я + Ь}.
415
В частности, D, 5, 9) G © и F, 8, 14) G ©, но C, 5, 9) $ ©. Аналогично
операция умножения также может рассматриваться как определение
тернарного отношения ® на (Я:
и с = аХЬ).
Отношение в обладает следующими свойствами: для любых двух чисел
а> & € (R существует третье число cGfi такое, что (a, Ь9 с) € ©, и если
(а9 Ь, с) € е и (я, Ь, d) € е, то с = d. Такими же свойствами обладает и
отношение ®. Обобщая эти примеры, назовем отношение {А, о) бинарной
операцией, если: а) для любых а9 Ь€А существует элемент с€Л такой,
что (я, &, с) Е о; б) для любых a9b,c9d€A выполняется (а, Ь9 с) G о и
(a9b9d) G о,тос = J.
Если (А, о) — операция и (а, Ь, с) € о, мы обычно будем писать c=aob.
Для примера предположим, что операция о определена на А условием
а
о(а,Ь,с), если с=— .
Ь
Но в этом случае не существует числа с такого, что о A, о, с), и поэтому
пара {А у о) - не операция1). Если же под о понимать тернарное отношение,
определенное на множестве положительных чисел, то определение операции
корректно. Для того чтобы привести еще один пример, предположим,
что операция о определена на (R условием
о(д, ьгс) тогда и только тогда, когда с2 =аХЬ.
Тогда для каждой пары чисел а, & € <R существует число с Е <R такое, что
о(а, Ьу с). Однако A, 1, 1) и A, 1, -1) одновременно принадлежат о,
что нарушает свойство б), определяющее понятие операции. Допустим
теперь, что операция ° на <R определена условием
o(a9b, с) тогда и только тогда, когда с = 2 (а X Ь).
Тогда о — корректно определенная операция на (R. Для нее имеем 6 - 1 о 3,
16 = 4 о 2. И, наконец, допустим, чгоЛ = {1, 2,3}и определим на А
операцию о следующим образом:
о= {A,1,0), A,2,1), A,3, 1),B, 1,1), B, 2,0),
B,3,1), C,1,1), C,2,1), C,3,0)}.
Тогда о _ корректно определенная операция на А: а о Ь равно единице,
если аФЬуЪ равно нулю, если а = Ь. Однако если о задано в виде
о= {A,1,0), A,2,1), A,3, 1),B,1,1), B, 2,0), B,3,1),
C,1, 1),C,2, 1),C,3,0), A,1,1)},
то о не будет операцией на А9 потому что о A,1,0) иоA,1,1).
!) Предполагается, что Л s R.(Примеч. пер.)
416
Упражнения
1. Выписать множество упорядоченных пар для бинарного отношения >,
определенного на множестве А ={1,6,8}.
2. Предположим, что А = {1, 2, 3, 4, 5}, a 5 определено на>4 соотношением D).
Выписать множество упорядоченных /i-элементных подмножеств для следующих
отношений.
а. Тернарное отношение 5', определенное на А условием (а, Ь, с) е 5'тогда и
только тогда, когда в множестве А найдется такой элемент d, что (а, Ь, с, d) e 5;
б. Бинарное отношение 5", определенное на А условием aS"b тогда и только тогда,
когда (fl,stt,b) е 5 для некоторых элементов s и t из Л.
в. Четырехместное отношение 5'", определенное на А условием {а, Ьу s, t) е 5'"
тогда и только тогда, когда (t,s,bta) G61.
3. Поскольку бинарное отношение, определенное на множестве действительных
чисел, есть подмножество декартова произведения, то его можно представить
совокупностью точек на координатной плоскости. Нарисовать соответствующие
диаграммы для бинарных отношений 04, R) и (A, 5), где А = {1, 2, 3, 4,5},аУ?и5
определены соотношениями A) и B) соответственно.
4. Пусть (A, R) - бинарное отношение; определим на том же множестве А
обратное отношение /?, положив aRb тогда и только тогда, когда bRa. Дать описание или
выписать в явном виде множества упорядоченных пар для отношений, обратных к
следующим отношениям.
а. Отношение 04, R) > где А -{1,2, 3,4,5} и R задано соотношением A).
б. Отношение 04,5), где А = {1, 2, 3,4,5} и 5 задано соотношением B).
в. Отношение "быть отцом".
г. Отношение "приходиться тетей".
д. Отношение > на множестве натуральных чисел.
5. (Thrall et al. [1967]). Кровь людей классифицируется по 4 типам: типу А, типу
В, типу АВ и типу О. В общем случае человек с типом крови А может получить кровь
типов А и О; люди с кровью типа В могут получать кровь только от доноров крови
типов В и О; люди с кровью типа АВ могут получать кровь любого типа, а люди
с кровью типа О - только кровь того же самого типа. Пусть X = {А, В, АВ, О
^Определить на X бинарное отношение 5 следующим образом: aSb выполнено тогда и
только тогда, когда человек с кровью типа а может получить кровь типа Ь.
а. Выписать отношение {X, 5) как множество упорядоченных пар.
6. Какова интерпретация обратного отношения {Х> S) (см. упражнение 4) ?
б. Пусть (A* R) и (A* S) - бинарные отношения; определим на А отношение
R п S следующим образом:
Rn S={(a,b): aRbnaSb),
т.е. как обычное теоретико-множественное пересечение. Дать интерпретацию
следующим отношениям типа D, R n S).
а. (A»R) "доводиться братом" и 04, S) "состоять не в прямом родстве с".
б. 04,/?) есть отношение > и 04,5) - отношение <.
в. 04, R) - "быть родителем" и 04,5) - "бытьпотомком".
г. aRb тогда и только тогда, когда а не уступает по качеству b и aSb тогда и только
тогда, когда а заведомо качественнее b
7. Пусть 04, R) и 04, 5) - бинарные отношения; определим отношение R и5
следующим образом:
R и S = {(a,b): aRbwiuaSb),
т.е. как обычное теоретико-множественное объединение. Дать интерпретацию
следующим отношениям.
а. 04,7?) - "быть братом" и 04,5) - "быть сестрой".
б. 04,/?) -"бытьотцом"и 04,5) - "бытьматерью".
в. 04, /?) - отношение > и 04, 5) - отношение >.
г 04, /?) - "громче, чем" и 04,5) - "тише, чем".
27. Ф.С. Роберте 417
8. Пусть D, R) - отношение "бытьотцом^, 04,5) - отношение "быть матерью'*;
что представляет собой отношение 04, (R и 5)), обратное к отношению 04, R и S)
(см. упражнение 4) ?
9. Пусть 04, Л) и 04,5) - бинарные отношения. Определим отношение R/S={(a%b):
для некоторого сизА,аЯси cSb).
Отношение R/S называется относительным произведением отношений 04, R) и
04, 5). Например, отношение 04, R) "быть братом" и отношение 04, S) "быть
родителем" приводят к отношению a(R/S) b, которое выполняется тогда и только тогда,
когда существует индивидуум с, имеющий брата я, и с - родитель для Ь> т.е.
отношение a (R/S) b выполняется тогда и только тогда, когда а приходится дядей Ь.
а. Если R и S определены так же, как и выше, то отношение 04, SfR) совпадает
с отношением 04,/?/5); почему?
б. Пусть отношение 04, S) определено так же, как и выше; что представляет
собой отношение 04, S/S) ?
в. Пусть 04, Л) - отношение "быть сестрой" и 04,5) - отношение "быть матерью";
что представляют собой отношения 04, R/S) и 04, S/R) ?
г. Пусть 04, R) .— отношение "быть отцом", что представляет собой отношение
(A,R/R), где R - отношение, обратное к отношению Л?
д. Пусть 04, Л) - отношение "быть братом", 04, 5) - отношение "быть
отцом" и 04, Т) - отношение "быть матерью"; что представляет собой отношение
04,Л/0S и Г))?
10. Определить, какие из следующих свойств: рефлексивность, нерефлексивность,
симметрия, асимметрия, антисимметрия, транзитивность или отрицательная
транзитивность выполняются для приводимых ниже бинарных отношений.
а. Отношение 04, R), где А = [0,1 ] и R = >.
б. Отношение (A, R), П& А ={ау Ь, с, d, е}и R определено как множество {(а, Ь),
(Ь.Ь)).
в. Отношение 04, R), где А ={река, озеро, океан, морской рукав, ручей} и R
определено как множество { (река, озеро), (океан, океан), (озеро, река)}.
г. Отношение 04, /?), где А = {ЕРА, HEW, FAA и R - как {(ЕРА, ЕРА), (HEW,
HEW)};
д. Отношение 04, R), где А - множество электрических подстанций и aRb
выполняется тогда и только тогда, когда средний выход окиси азота в час со станции а
больше, чем со станции Ъ.
е. Отношение D, Л), где .4 ={1, 2, 3} \iaRb выполняется тогда и только тогда,
когда а делит Ь.
ж. Отношение 04, R), где Л - множество автомобилей к aRb выполняется тогда
и только тогда, когда двигатели автомобилей а и b имеют одинаковую мощность;
з. Отношение (X, S), описанное в упражнении 5. w
11. Пусть 04, R) - бинарное отношение и D, R) - обратное к нему отношение
(см. упражнение 4). Какие из следующих свойств, справедливых для отношения R,
выполняются и для обратного к нему отношения /??
а. Рефлексивность.
б. Нерефлексивность.
в. Симметрия.
г. Асимметрия.
д. Антисимметрия.
е. Транзитивность.
ж. Отрицательная транзитивность.
12. Пусть 04, R) и 04, S) - бинарные отношения и D, R п 5) - отношение
пересечения (см. упражнение 6).
а. Если и D, R), и D, S) — рефлексивные отношения, то будет ли рефлексивным
и отношение D, R п S) ?
б. Тот же вопрос, но относительно свойства нерефлексивности.
в. Тот же вопрос, но относительно свойства симметрии.
г. Тот же вопрос, но относительно свойства асимметрии.
д. Тот же вопрос, но относительно свойства антисимметрии.
е. Тот же вопрос, но относительно свойства транзитивности.
ж. Тот же вопрос, но относительно свойства отрицательной транзитивности.
418
13. Пусть 04, R) и 04, S) - бинарные отношения и 04, R и5) - отношение их
объединения (см. упражнение 7). Дать ответы на вопросы упражнения 12 для
отношения 04,/? и5).
14. Пусть 04, R) и 04, 5) - бинарные отношения и (A,R/S) - отношение
относительного произведения отношений 04, Л) и 04, S) (см. упражнение 9). Дать ответы
на вопросы упражнения 12 для отношения (A,R/S).
15. Привести пример бинарного отношения, которое одновременно и
антисимметрично, и транзитивно.
16. Привести пример бинарного отношения, которое одновременно и симметрично,
и антисимметрично.
17. Привести пример бинарного отношения, которое симметрично, но не
транзитивно.
18. Пусть D, D) - четырехместное отношение. Будем говорить, что это
отношение рефлексивности для каждой пары элементов а, Ь &А выполняется D(а,Ь,а,Ь).
Отношение D симметрично, если для всехa,b,s, t еЛ из D(a, b, s, t) следует D(s, t,
а,Ь),н транзитивно, если для любых элементов a, b, s, t, p>q GA из D{a,b9s ,t) и
D(s 11, p,q) следует D(a,b ,p > q) Привести примеры четырехместных отношений.
а. Рефлексивных.
б. Симметричных.
в. Транзитивных.
г. Рефлексивных и симметричных, но не транзитивных.
19. Пусть IP - совокупность ранжировок множества А (см. гл. 7). Определим
на 3> тернарное отношение B(JP, Q, R) следующим образом: (Р, Q,R) принадлежит 5
тогда и только тогда, когда Q лежит между Р и R в смысле, определенном в § 7.4.
Пусть на Ф определено также бинарное отношение В': пара (/\ Q) принадлежит
В' тогда и только тогда, когда в &> найдется элемент R такой, что R Ф Р или R Ф Q,
и выполняется В (Р, R, Q). Каким будет в общем случае отношение 2?'?
а. Рефлексивным?
б. Нерефлексивным?
в. Симметричным?
г. Асимметричным?
д. Антисимметричным?
е. Транзитивным?
ж. Отрицательно транзитивным?
20. Бинарное отношение 04, R) называется отношением эквивалентности, если
оно рефлексивно, симметрично и транзитивно. Определить какие из следующих
отношений будут отношениями эквивалентности.
а. («,=).
б. («,».
в. («, »
г. А - множество людей; aRb тогда и только тогда, когда а к b одного и того
же веса.
д. Л = { 0, 1,2,..., 22}, aR Ъ тогда и только тогда, когда a s b (mod 5).
е. А - множество всех конечных подмножеств множества действительных чисел
и aRb тогда и только тогда, когда а п ЬФ ф.
ж. А = {A,1), B, 3), C, 8) } иЯ ={< A, 1),AД)>, < B, 3), B, 3) >, < C, 8), C, 8»,
<A1) B3)><B3) A1)}
}
21. Если 04, R) и 04, S) - отношения эквивалентности (см. упражнение 20),
то будут ли таковыми отношения:
а. 04,Лп5);б. 04,R и S); в. 04,R/S)!
22. Показать необходимость всех свойств, приведенных в определении отношения
эквивалентности, и привести примеры бинарных отношений:
а. Рефлексивных и симметричных, но не транзитивных.
б. Рефлексивных и транзитивных, но не симметричных.
в. Симметричных и транзитивных, но не рефлексивных.
23. Пусть 04, R) - отношение эквивалентности (см. упражнение 20). Обозначим
через а* множество { b e A: aRb}, Это множество называется классом
эквивалентности, содержащим элемент а. Например, если А = {1, 2, 3, 4, 5 } и R = {A, 1), A, 2),
27* 419
B, 1), B, 2), C, 3), D, 4), E, 5)}, то (Л, R) представляет собой отношение
эквивалентности. Классами эквивалентности для этого отношения будут 1*=2 *={1, 2},
а. Определить все классы эквивалентности для отношения эквивалентности (А, Ю,
определенного в упражнении 20, п. д.
б. Показать, что два класса эквивалентности либо не содержат общих элементов,
либо полностью совпадают друг с другом.
в. Привести пример отношения эквивалентности, содержащего три различных
класса эквивалентности.
г. Привести пример отношения эквивалентности, содержащего два различных
класса эквивалентности, один из которых состоит из двух, а другой - из трех
элементов.
24. Какие из следующих отношений определяют операцию С4, о) ?
Л{8ОД)
о = {(SO3, SO,, NO*}, (SO2, ДДТ, NO*), (SO,, NO*, NO*),
(ДДТ, SO,, NO*), (ДДТ, ДДТ, NO*), (ДДТ, NO*NO*),
(NO*, SO2, NO*), (NO*, ДДТ, NO*), (NO*, NO*NO*)}.
6.^={SO2,NO*>,
o=:{(SO2,NO*),(NO*,SO2)}.
bM={SO2,NO*},
о ={(SO2, SO2, NO*), (SO2, NO*, SO2), (NO*, SO2, SO2),
(SO,, SO2, SO,), (NO*, NO*, SO2)}.
r. A - множество положительных целых чисел и о (я, ъ, с) тогда и только тогда,
когда а + Ь = с.
д. А = множество положительных целых чисел и о (д, Ъ, с) тогда и только тогда,
когда а — Ь = с.
е. А = множество действительных чисел и о (а, Ь, с) тогда и только тогда, когда
а - Ъ = с.
ж. А = множество действительных чисел и о (д, Ь, с) тогда и только тогда, когда
а + Ь + с = 0.
25. Представить операцию умножения по модулю 4 как тернарное отношение,
определенное на{ 0, 1,2, 3, 4}.
§ 8.3. Теория измерений
Кажется почти излишним говорить, что измерение имеет дело с
процедурой присвоения числовых значений. (Однако в § 8.3 будет показано, что
измерение, не использующее числовые данные, тоже вполне законное и
полезное мероприятие.) Исходя из таких физических парадигм, как
измерение температуры или массы тела, замечаем, что измерение состоит в
присвоении числовых значений, при котором "сохраняются" определенные
наблюдаемые отношения. Измерение температуры состоит в таком
присвоении числовых значений, при котором сохраняется наблюдаемое отношение
"быть теплее, чем"; при измерении массы тела сохраняется отношение
"быть тяжелее, чем".
Для того чтобы выразить мысль точнее, предположим, что А — некоторая
совокупность дней и отношение aWb выполняется тогда и только тогда,
когда вы считаете, что день а теплее дня Ъ. Хотелось бы каждому а из А
присвоить такое действительное число /(а), что для любых двух.злемен-
420
това,Ь€А выполнялось бы соотношение
aWb~f(a)>f{b). F)
Аналогично, если А — совокупность поднимаемых объектов и Я —
сравнительное суждение "а тяжелее Ь", то каждому элементу а из А было бы
желательно приписать такое действительное значение /(д), чтобы для всех
пар элементова,Ь€А имело место
аНЬ~№>№. G)
Таким же образом можно рассмотреть измерения в социологии.
Например, измерение предпочтений есть не что иное, как процедура присвоения
числовых значений, сохраняющая наблюдаемое отношение "быть
предпочтительнее, чем". Пусть А - множество альтернатив и включение аРЪ
выполняется на А тогда и только тогда, когда при сравнении а с Ъ вы (строго)
предпочитаете а ; нам бы хотелось каждой альтернативе а € А присвоить
такое действительное значение u(a)t чтобы для любых а, Ь G А
выполнялось соотношение
аРЬ *=> и(а) > и(Ь). (8)'
Функцию и часто называют функцией полезности или порядковой
(ординальной) функцией полезности, а значение и(а) —полезностью
альтернативы а. Если удается определить функцию полезности, то ее можно
использовать для принятия решений: всегда выбирается та альтернатива, которая
имеет наибольшую полезность. По аналогии с измерением предпочтений
в случае измерения громкости требуется так присваивать числовые
значения, чтобы сохранялось отношение "быть громче, чем". Таким же образом
при измерении состояния воздушной среды мы пытаемся сохранить
наблюдаемое отношение "состояние воздушной среды в день а лучше, чем
в день 6".
При измерении массы тела мы в действительности требуем несколько
больше от нашей "меры". Мы хотели бы чтобы она была "аддитивной"
в том смысле, чтобы масса комбинации из двух объектов совпадала с
суммой масс каждого из них. С формальной точки зрения здесь следовало бы
говорить о бинарной операции о - комбинации из двух объектов,
определенной на множестве всех объектов А (можно считать а о Ъ объектом,
полученным из объектов а и Ъ расположением объекта а рядом с b) !).
Мы хотим определить на А действительно-значную функцию /, которая не
только удовлетворяет условию G), но и сохраняет бинарную операцию о в
том смысле, что для всех а,Ь.ЕА выполняется условие
f(a о ft) = Па) + f(b). (9)
Невозможно провести сравнение операций для случаев измерения массы и
температуры: в последнем случае такой операции не существует. Сущест-
') При сопоставлении комбинации объектов формальной операции в строгом
смысле теории отношений возникают определенные формальные трудности, связанные
с определением комбинаций типа а о а, (д о Ь) о а и др. Какова интерпретация
таких комбинаций? Чтобы обойти эти трудности, будем предполагать, что в исходном
множестве содержится бесконечное число "копий" каждого элемента.
421
вует ли такая операция при измерении предпочтений будет зависеть от
структуры множества альтернатив, подлежащих рассмотрению, и от того,
насколько мы хотим быть требовательными при проведении измерения.
Можно допустить существование сложных альтернатив типа карандаш и
бумага и потребовать, чтобы функция полезности была аддитивной, т.е.
удовлетворяла условию
и(а о Ь) = и(а) + и(Ь). A0)
Функции полезности, которые удовлетворяют условию аддитивности, часто
называются кардинальными функциями полезности *).
Абстрагируясь от этих примеров, введем понятие системы отношений.
Системой отношений назьшается упорядоченная и-ка
H = (A,RuR2,...,Rp* ol9 о2, ..., о^),
в которой А — множество, Ru R2, ..., Rp — отношения, определенные
на А, и ох, о2, ..., Од — бинарные операции, определенные на А. (Сумма
р+ q + 1, конечно, равна п). Последовательность (г ь г2, ».м rp\ q)
длины р + 1, в которой rt равно т, если Л/ — т -местное отношение,
называется типом системы отношений. Например, при измерении массы тела
имеем дело с системой отношений {А, Н, о) типа B; 1), при измерении
температуры - с системой отношений (A, W) типа B; 0). Система
отношений (Л, >,>,+) относится к типу B,2; 1). В последнем случае мы
привели пример того, что называется числовой системой отношений, т.е.
системы, определенной на множестве действительных чисел. Приведем еще
один пример числовой системы отношений - систему (<R, +, X)
типа B; 2).
Как видно из приведенных примеров, измерение начинается с
наблюдения эмпирической системы отношений % , которую желательно отразить
в числовую систему отношений 85 , "сохраняющую" все отношения и
операции системы % , Например, при измерении массы тела искалось такое
отображение системы Ж = (А, Н, о ) в систему 85 = (<R, >, +), которое
"сохраняет" отношение Н и операцию о. При измерении температуры —
отображение системы 3(= (A, W) в систему 85= (<R,
>),"сохраняющее"отношение W. Отображение / одной системы отношений 91 в другую
систему 85, при котором сохраняются все отношения и операции, называется
гомоморфизмом. (Сформулируем это определение точнее: пусть система
отношений 85= (В, R\, R2, ...,Лр, о{, о29,.., о^) имеет тот же тип, что и
эмпирическая система % ; функция / : А -> В называется
гомоморфизмом 91 в 85, если для любых аи а,г,,.., ar t выполняется условие
Rt(au а2у ..., ar.) <=> Rt{f{ax)f{a2\ ..., f(ar.) (/= 1,2, ...9p)
и для всех а, Ъ ? А имеет место
f(a o,i) =/(e)o;/(ft) (/= 1,2,..., 17).
1) В научной литературе функция полезности назьшается кардинальной, если она
приводит к шкале не менее сильной, чем та, которую мы назовем интервальной
шкалой.
422
При этом отображение / не обязано быть взаимно однозначным. Если
существует гомоморфное отображение /, то говорят, что система 31
гомоморфна системе отношений 55.
Для того чтобы привести конкретный пример, предположим, что
А={а,Ь,с) и Я = {(*,*), (ft, с), (а, с)}.
Тогда отображение / такое, что /(я) = 3, /(ft) = 2, /(с) = 1, задает
гомоморфизм системы % - (A, R) в систему 85 = (<R, >), так как
единственными упорядоченными отношением > парами значений f(a), / (ft)
и /(с) будут (/(я), /(ft)), (/(ft), /(с)) и (/(я), /(с)), и они
в точности соответствуют парам (я, ft), (ft, с) и (я, с) в (R. Таким
образом,
aRb <=> f{a)
Еще один гомоморфизм из % в 85 задается соотношениями: g(a) = 7,
#(ft) = 3, #(с) = 0, Допустим теперь, что А = {я, ft, с} и Л = {(я, ft),
(ft, с), (с,л)}, Тогда не существует гомоморфизма / из (A,R) в
(Л, >), поскольку из aRb следует /(я) > /(ft), из ft/*c- /(ft) >/(c),
но сЛд влечет /(с) > f(a).
Аналогично, если А = {О, 1, 2, ... } и 5 = {0, 2, 4, ...}, то функция
f(a) = 2 а определяет гомоморфизм системы % = {А9 >, +} в систему
Я5 = (В, >, +), ибо для любых заданных а иЬ из А а>Ь тогда и только
тогда, когда 2а > 2ft, и, более того,
f(a + ft) = 2(a + ft) = la + 2ft = f(a) + /(ft).
Еще один пример гомоморфизма получим, положив g(a) = 4а. (Не
требуется чтобы гомоморфизм был бы обязательно функциональным
отображением "на")» Если И = («, >, +) и 85 = (<R+, >, X), где <R+ -
множество положительных действительных чисел, то функция f{a) = еа
определяет гомоморфизм из 9С в S5 , поскольку
а > ft <=* еа > еь9
/(a + ft) = е<*+ь) = е* X е* = f(a) X /(ft).
Приведем последний примеров котором А ={а, ft, crd), B={a9/3, 7,5} ,
Я= {(я, ft), (ft, с), (с, с?)} и 5 = <(е*, /3), @, т), G. 6)}. Если
функцию f: А •+В определить системой равенств f(a) = a, /(ft) = |3,
/(с) = Jf f(d) = 6, то она определит гомоморфизм из (A, R) в (В, S),
В общем случае можно утверждать, что фундаментальное измерение есть
определение гомоморфизма между наблюдаемой (эмпирической) системой
отношений % и некоторой (специальной) числовой системой отношений 85.
Измерение температуры состоит в установлении гомоморфизма из
наблюдаемой системы отношений (A, W) в числовую систему
отношений (<R, >); измерение массы тела - гомоморфизма из наблюдаемой си<
стемы отношений (А,Н., о) в числовую систему отношений (<R, >, +)
423
и т.д. Говорят также, что гомоморфизм задает представление. Тройка
(% , 9 , / ) называется шкалой, хотя иногда мы будем допускать
небрежность и называть шкалой само отображение /.
Первая основная проблема теории измерений формулируется как
проблема представления: найти условия, налагаемые на наблюдаемую
систему отношений V , которые были бы (необходимы и) достаточны для
существования гомоморфизма из системы Я в заданную конкретную
числовую систему отношений 9, причем основной упор делается на задачу
отыскания достаточных условий. Эти условия говорят о возможности
выполнения измерений. Если такие условия оказываются к тому же и
необходимыми, го тем лучше. Гораздо более важное требование заключается
в том, чтобы все налагаемые условия могли быть проверены или, в
некотором смысле, эмпирически верифицируемы, Такие условия обычно
называют аксиомами представления, а теоремы, утверждающие их
достаточность, - теоремами представления. По сравнению с аксиомами, которые
были изучены нами раньше, например в связи с определением трофического
статуса (см. § 3.5), цен Шепли (см. § 6,7) и теоремы Эрроу (см. § 7.2),
аксиомы и теоремы представления играют совсем другую роль. Теперь мы
имеем дело с ментальным представлением и хотим найти достаточные и
необходимые условия, гарантирующие осуществление такого
представления. Раньше же мы формулировали достаточно разумные условия с самого
начала и стремились найти не нарушающее их представление. По
возможности, теоремы представления должны быть конструктивными: нужно не
только показать, что представление возможно, но и как конкретно
построить его.
Типичной аксиомой представления служит следующее требование.
Допустим, что мы хотим установить гомоморфизм / из (A, R) в (ft, >).
Если такой гомоморфизм существует, то отношение (A, R) должно быть
транзитивным, так как если aRb и bRc, то f(a) >f(b) и f(b) >/(c),
а отсюда следует, что /(#) > /(с) и aRc. Таким образом, типичная
аксиома измерения состоит в требовании транзитивности отношения (A, R).
Вторая основная проблема теории измерения - проблема
единственности: оказывается ли построенный гомоморфизм / единственным? В
следующем параграфе увидим, что теоремы единственности говорят нам о
типе шкалы / и приводят к теории содержательности *) для утверждений,
использующих понятие шкалы,
Упражнения
1. Привести примеры систем отношений следующих типов:
а) B,2; 1), б) D,2; 1),в) (; 2), г) B,2; 2).
2. Пусть А - {а9 Ъ9.с }и R = {(а, Ь), (Ь9 с), (а, с)} . Определить гомоморфизм /
из Ъ = (A, R) в © = (Я, >), отличающийся от двух гомоморфизмов, приведенных
в тексте.
') Обсуждение понятия содержательности (meaningfulncss) приводится у А.Чёрча
в книге "Введение в математическую логаку". - М.: ИЛ, 1960, 485 с. (с. 345).
(Примеч. пер. и ред.)
424
3. Пусть N означает множество положительных целых чисел, 2N - множество
четных целых чисел, Z - множество целых чисел, Л - множество действительных чисел,
а* - множество положительных действительных чисел. Для каждой из приведенных
ниже ситуаций постройте гомоморфизм из Я в 85.
А. Я = {N, >), » = BN, >).
Б. Я = {2N, >), 85 = (N, >).
В.
Г.
Д.
Е.
Ж.
3.
И.
= (N, >,+), ® = BN, >, + ).
- («, +), • = («*, X ).
= (W, =), » = BJV, = ).
= (Z, >), 85 = (Z, < ).
= (N, > ), » = (Z, < ).
(«\ >, X),® =(«,>,+).
(A,R) и & = (Л, >), где Л = {а,0,7,б}, Л = {(<*,0), (а, 7 )* («. 5 ),
@, 6), G, /3), G, 6)}.
К. Я = (/1, /О и 85 = (б?, =), где А = {а,/3,7,б}, Я = {(а,а), (а,0), @, а),
@, 0), G, 7 ), F» &)}•
4. Пусть Я = (Я, >, +) и 85 = (Я+, >, X). Найти гомоморфизм из Я в 83,
отличающийся от приведенного в тексте.
5. Существует ли гомоморфизм из (N, >) в (N, <)? Объяснить ответ.
6. В каком из следующих примеров, где Я - Ы, Я), 83= (В, S), система Я
гомоморфна системе 85? Объяснить ответ.
A. А ={1,2,3}, Я = {A,2), B,3), A,3)}, Д = «, 5 = >.
Б. А ={1,2,3}, Я = {A,2), B,3), A,3)}, 5 = 6?, S = <.
B. А ={1,2,3}, Л ={A,1), A,2), B, 1), B,2), A,3), C, 1), C,3), B,3), C,2)},
В = {8}, 5 = {8,8}.
Г. А = {1,2,3), А = {A,2), B,3), A,3)}, B={a.b,c.d), 5 = {(д, b)Ab, с),
(с, d), (a, d)}.
Д. А ={1,2,3}, R ={A,2), B,3), A,3)}, B = {a.b,c,d). S ={(*, b)Ab,c)Acd\
(b, d)}.
E. A ={1,2,3,4}, Я = {A,1, 1,1), B,2,2,2), C,3,3, 3), D,4,4,4)}. В = {8, 9},
S = {8,8}.
Ж. А ={1,2,3,4}, Я= {A,1,1,1), B,2,2,2), ( 3, 3, 3, 3)}. В * {8, 9}. S =
= {(8,8,8,8), (9,9,9,9)}.
3. A ={1,2,3,4}, R = {A,1, 1,1), B,2,2,2), C,3,3, 3),D, 4, 4, 4)}, В = {8,9},
S ={(8,8,8,8), (8,9,8,9)}.
И. A = { SO2, DDT, NO*} , R = { (SO2, DDT), (DDT, NO*)}, В = { Нью-Йорк,
Уичито, JIoc Анжелос}, S ={ Нью-Йорк, Уичито}.
7. Гомоморфизм /' системы отношений Я в систему отношений 93 называется
изоморфизмом, если отображение / -взаимнооднозначно. В каком из случаев,
перечисленных в упражнениях 3 и 6, имеет место изоморфизм систем Я и 83 ?
8. Пусть А = Л, D(a, b,cfd) выполняется на А тогда и только тогда, когда
а + b > с + d, В = «, и Е{а, b,.c,.d). выполняется на В тогда и только тогда, когда
в В а + b < с + d. Гомоморфна ли система (A, D) системе (В, А)? Почему?
9. Пусть Я , 95 и € - системы отношений одного и того же типа. Если Я
гомоморфна 83 и 83 гомоморфна € , то будет ли система Я гомоморфна системе б ?
Привести доказательство своего ответа.
10. Попробовать сформулировать теорию измерения длин. (Будет ли эта теория
похожа на измерения температуры или массы тела?)
П. Попробовать сформулировать теорию измерения площадей. (Будет ли эта
теория похожа на измерения температуры или массы тела?)
425
12. Совпадает ли то, что обсуждалось в этом параграфе с вашим интуитивным
пониманием процесса измерения?
13. Какие упрощения мы допустили при построении модели процесса измерения?
Что мы упустили издида?
§ S.4. Типы шкал и теория содержательности
8.4.1. Регулярные шкалы. Хотя вполне осмысленно сообщение, что число
крупнорогих овец в заданной области и в указанное время равно 400,
сообщение о том, что данная овца весит 400 бессмысленно. Вполне
осмысленно сообщение о том, что сегодняшняя температура около 5 часов
пополудни была вдвое выше вчерашней, не имеет смысла, если мы не
знаем по какой шкале она измерена (либо мы должны отсчитывать от
"абсолютного нуля"). Число овец указывается без ссылки на какую-либо
конкретную шкалу измерения, тогда как в сообщении о весе овцы такое
указание необходимо. Аналогично отношение весов остается тем же, в
какой бы шкале ни проводилось измерение, но для отношения температур
это уже не так. Чтобы иметь адекватное описание того, что мы понимаем
под измерением, модель должна отражать такого типа различия.
Попытаемся учесть их, введя в нашу модель измерения понятие содержательности.
Выражаясь несколько неточно, утверждение считается содержательным,
когда оно осмысленно: если оно может быть корректно проинтепретиро-
вано, допускает проверку и т.п. Содержательность утверждения, однако,
не совпадает с его истинностью: и ложное утверждение может допускать
корректную интерпретацию, если его можно проверить, и т.п. Ниже
попытаемся дать более точное определение понятию содержательности.
В общем случае критическим моментом при определении того,
осмысленно ли утверждение, содержащее числовые данные и использующее
понятие гомоморфизма, будет проверка однозначности процедуры присвоения
числовых данных. Вполне возможно, что для двух заданных систем
отношений 9J и 85 одного и того же типа существуют две различные
функции / и g, которые гомоморфно отображают 5t в 85 . Поэтому любое
утверждение об измерении должно либо сопровождаться указанием на
то, какие использовались шкалы (гомоморфизмы), либо же быть
истинным независимо от используемых шкал, Примем следующее определение
понятия содержательного утверждения: утверждение, использующее
понятие числовой шкалы содержательно в том случае, когда его истинность или
ложность остаются неизменными при замене каждой из упомянутых в нем
шкал на любую другую допустимую шкалу.
Во многих случаях мы оказываемся в состоянии проверить
содержательность утверждения, используя классификацию допустимых
преобразований шкалы. С целью пояснить этот момент, напомним, что мы
назвали шкалой тройку ( 51 ,85 , /), где St и 85 — системы отношений, а/ -
гомоморфизм системы Ж в систему 85 . Нас интересует единственность
гомоморфизма /. Пусть А — множество, на котором определена система
отношений Й, и (R — множество, на котором определена система 85.
Если </? - функциональное отображение из f(A) — множества значений
функции / — в (R, то композиция <р о/ будет функциональным
отображением А в (R. Если ^р of к тому же оказывается гомоморфизмом системы
426
91 в систему отношений 86 , то функция у называется допустимым
преобразованием шкапы (» , 85 ,/). Для примера предположим, что
А = (а9Ь,с),Я = {(а9Ь)ЛЬ,с),{а,с)}9
/(в) =10, /(ft) =8, /(с) =4.
Функция / определяет гомоморфизм из 91 = (Л, Я) в 85 = (Я, >). Если
у?(л) положить равным —х, to # = *? о/ не будет гомоморфизмом из 91 в
Ж , так как g{a) =-10, #(?) =-8 и g(b) >g(a). Значит, <^(jc) = -х не
будет допустимым преобразованием шкалы /. Однако у(х) =2х—
допустимое преобразование, поскольку 2/ - гомоморфизм.
Пусть имеется шкала ( Ж , й ,/) и какая-нибудь другая шкала ( 31 ,
86 , g); часто оказывается возможным найти такую функцию </?: /04) -+
->Я, что g = </> о/. (Например, это всегда можно сделать, когда / -
взаимно однозначное соответствие. В этом случае мы можем положить по
определению, что if(x) -g{a)y когда х=/(д).) Если в приведенном выше
примере положить g (а) =22, g (b) = 16, g (с) = —10, то тем самым определится
еще один гомоморфизм. Мы можем найти такую функцию <?, что g = <? о/,
а именно, такой функцией будет </> A0) = 22, у (8) = 16, *р D)=-10.) Шкала
(Я,в,/) называется регулярной шкалой, если для каждой шкалы
(Ж » SJ ,#) существует такое допустимое преобразование </>, <р: /D) ->Я,
что g = <р о/. Представление 91 -> 85 называется регулярным, если любой
гомоморфизм из К в 16 определяет регулярную шкалу. Представление
регулярно, если для любых двух заданных гомоморфизмов можно найти
допустимое преобразование, отображающее один из них в другой. Почти
все представления, которые встретятся в этой главе, регулярны, пример
нерегулярной шкалы и нерегулярного представления будет приведен в § 8.8.
Если 91 -* 85 — регулярное представление, то шкала ( 51 , 86 , /),
определенная с точностью до допустимых преобразований заданного
класса, - единственна. Имея дело только со шкалами регулярных
представлений можно модифицировать определение содержательности утверждения
следующим образом: утверждение, использующее понятие (числовой)
шкалы содержательно в том и только том случае, когда оно остается
истинным (или ложным) при действии любых допустимых преобразований
над упоминаемыми в нем шкалами. В том же смысле понятие
содержательности описано в работе Suppes, Zinnes [1963] и Suppes [1959].
Приведенное определение содержательности утверждения есть точное выражение
первоначально нечетко сформулированного. Это еще один пример так
называемой процедуры экспликации — превращения недостаточно
определенного понятия в точное. И нам предстоит испытать введенное понятие
на примерах, которые были приведены в начале этого раздела книги.
Отчасти тем самым подвергнется испытанию и вся модель процесса измерения.
8.4.2. Тип шкалы. Прежде чем приступить к проверке понятия
содержательного утверждения, следует заметить, что используемое при его
определении понятие допустимого преобразования позволяет определить
тип шкалы. Идея введения такого определения восходит к работе S.S.
Stevens [1946], [1951]. Однако подобное определение можно использовать
только для шкал, которые возникают при регулярных представлениях
(см. упражнение 31). Таким образом, здесь будем предполагать, что все
шкалы, о которых пойдет речь, возникают из регулярных представлений.
427
Таблица 8.2
Типы некоторых шкал
Допустимые преобразования
Тип шкалы
Примеры
ф(х) =х (тождественное
преобразование)
^(х)=<*х, а->0
(преобразование подобия)
<р(х) =а* + 0, с*>0
(положительное линейное
преобразование)
донесли ч>{х) > <р(у)
(монотонно возрастающее
преобразование)
Любое взаимно
однозначное преобразование
*) Согласно работе Stevens [1959].
Абсолютная
Шкала
отношений
Интервальная шкала
Порядковая
Номинальная
Пересчет предметов
Масса тела
Температура (шкала Кельвина)
Временные интервалы
Громкость (фоны) *)
Яркость (ниты) *)
Температура (шкалы
Фаренгейта и Цельсия)
Время календарное
"Стандартные баллы*9
интеллектуального теста (?) *)
Предпочтения?
Твердость
Качество воздуха
Качество кожных заготовок,
пиломатериалов, шерсти и т.п.
"Баллы" интеллектуального
теста*)
Номера игроков
Номера разных планов
Несколько примеров шкал различных типов сведены в табл. 8.2.
Наиболее простая из них та, в которой допускается только одно
преобразование ф(х) =х В такой ситуации существует единственный способ измерения
объекта. Поэтому подобная шкала называется абсолютной. Обычный
пересчет предметов дает нам пример измерения в абсолютной шкале. Когда
мы говорим, что х есть элемент заданного множества, то имеем в виду
именно элемент х и ничто другое: не существует допустимого
преобразования шкалы (отличного от тождественного), которое бы изменяло
элемент х.
Для того чтобы привести еще один пример, предположим, что набор
допустимых преобразований составляют функции вида у(х) =ах, а>0.
Такие преобразования называются преобразованиями подобия, а шкала,
класс допустимых преобразований которой состоит из всех преобразований
подобия, называется шкалой отношений. В шкале отношений измеряется
масса тела: нулевая точка на шкале фиксирована и допустимо изменить
единицу массы, умножив значение полученное при измерении на
постоянный положительный множитель. Например, мы переходим от измерения
в граммах на килограммы, увеличивая единицу измерения в 1000 раз.
Само название "шкала отношений" возникло из-за того, что, так же как
в случае измерения массы тела, утверждение об отношении измеренных
428
количеств содержательно, осмысленно, без указания на единицу
измерения. Шкала температуры будет шкалой отношений лишь в том случае,
когда предполагается существование абсолютного нуля, как в шкале
Кельвина. Согласно исследованиям Стивенса (Stevens [1959]) в шкале
отношений могут измеряться такие ощущения, как громкость, яркость
итл.
Приводя пример третьего типа шкал, будем предполагать, что класс
допустимых преобразований описывается функциями вида^(х) =адс+|3, а>0.
Таккепреобразовттяназъгвштсяположительнымилинейнымипреобразова-
ниями, а соответствующие им шкалы - интервальными шкалами.
Примером интервальной шкалы служит обычная шкала для измерения
температуры. Допустимо варьировать нулевую точку шкалы, что сводится к
изменению коэффициента 0, и единицу измерения, что равносильно изменению
значения а. Так, при переходе от шкалы Фаренгейта к измерению
температуры по Цельсию нужно положить а = 5/9 и /3 = —160/9. Определение
календарных сроков и дат, например — 1980 г., есть еще один пример
измерения в интервальной шкале. Существует мнение (см. Stevens [1959,
р. 25]), что "стандартные баллы", используемые при тестах на
интеллектуальность, определяют измерение в интервальной шкале.
Некоторые из шкал единственны лишь с точностью до порядка
расположения замеренных величин. Такова, например, шкала, по которой
замеряется качество воздуха в различных городах. По этой шкале значение 1
приписывается нездоровому воздуху, значение 2 — неудовлетворительному
состоянию воздушной среды, 3 — допустимому, 4 — хорошему и 5 —
отличному состояниям. Для тех же целей мы могли бы использовать,
например, значения 1, 7, 8, 15, 23 либо значения 1,2; 6,5; 8,7; 205,6; 750, либо
-10, -5, 0, 5, 10, либо какие-нибудь другие числа, не меняющие порядок
расположения значений. Шкала, значения которой определены с точностью
до порядка их следования, называется порядковой или ординальной
шкалой1) . Допустимые преобразования такой шкалы состоят из всех
монотонно возрастающих функций, т.е. функций, которые удовлетворяют
условию
Еще один пример ординальной шкалы дает нам шкала твердости. В этой
шкале числа, которые присваиваются минералам, отражают твердость
соответствующего минерала и их значения должны удовлетворять только
одному ограничению: минералу а присваивается значение большее, чем
минералу Ъ, тогда и только тогда, когда минерал а тверже минерала Ъ.
(На практике минерал а считается тверже, чем Ь, если он оставляет
царапину на минерале Ь.) Категория связности 0, 1, 2 или 3
ориентированного графа так, как она определена в 2.2.4, — еще один пример измерения
в порядковой шкале. В порядковой шкале измеряется и баланс малой
группы, определенный в упражнениях §3.1. Баллы по шкале
интеллектуальных тестов, вероятно, определяют только порядковую шкалу (Ste-
0 В русскоязычной научной литературе такие шкалы чаще называются порядко
выми. (Примеч. пер.).
429
vens [1959, p. 25]). He исключено, что и предпочтения могут быть
измерены лишь в порядковой шкале.
И наконец, в некоторых шкалах допустимыми преобразованиями может
быть класс всех взаимно однозначных отображений <р: f(A) -><R. Такие
шкалы называются номинальными. Номинальную шкалу представляет
совокупность номеров на спортивных костюмах игроков бейсбольной
команды, перечисление альтернативных планов: 1-й план, 2-й план и т.п.
Значения чисел не играют никакой роли, и взаимно однозначная смена
номеров другими будет содержать ту же информацию: идентификацию
элементов множества Л.
Вообще, шкалы, перечисленные в табл. 8.2, расположены в таком
порядке: от наиболее "сильной" шкалы к "слабейшей" в том смысле, что
абсолютная шкала и шкала отношений содержат гораздо больше
информации, чем порядковая или же номинальная шкала. Но часто цель
измерения и состоит в том, чтобы построить максимально возможную сильную
шкалу.
8.4.3. Примеры содержательных и бессодержательных утверждений.
Определив несколько типов шкал, можем теперь приступить к проверке
понятия содержательности утверждения на примерах, которые обсуждались
в начале настоящего параграфа. Предполагаем, что все обсуждаемые шкалы
порождаются регулярными представлениями и поэтому используем второе
определение содержательности утверждения. Рассмотрим сначала
утверждение
№ = 2№, (и)
где /(а) — некоторое значение, приписанное элементу а, например его
температура или масса. Зададимся вопросом, при каких условиях это
утверждение будет содержательным? В соответствии с определением,
утверждение содержательно тогда и только тогда, когда оно остается
истинным при любых допустимых преобразованиях <р:
/(*) = 2/(*) ~ (* о /) (я) = 2
Если у - преобразование подобия, т.е. </?(*) = ах при некотором а>0,
то действительно имеем
И приходим к заключению, что утверждение A1) содержательно, если/ —
шкала отношений, как в случае измерения массы тела. С другой стороны,
предположим, что это всего лишь интервальная шкала, которая обычно
используется для измерения температуры. Тогда типичное допустимое
преобразование имеет вид <^(лг) = cu:+0, а>0. И нетрудно найти пример,
в котором f(a) = 2f{b), но af(a) +0Ф2[<xf(b) + /3]. В частности,
достаточно положить1) f(a) = 2, f(b) = 1,а=1и|3 = 1. Этим объясняется,
почему имеет смысл сказать, что одна из круторогих овец вдвое больше другой,
но бессмысленно утверждение, что сегодня около 5 часов пополудни
температура была вдвое выше вчерашней.
О Читатель должен отметить, что для демонстрации бессодержательности
утверждения достаточно указать один пример, но для демонстрации его содержательности
требуется привести доказательство.
430
Таким же образом можно объяснить, почему содержательно утверждение
о том, что в заданном районе число круторогих овец равно 400, но
бессмысленно сообщение о том, что данная овца весит 400. Ибо, рассмотрев
утверждение
fia) =400, A2)
когда / — абсолютная шкала (такая, какой мы пользуемся при пересчете
предметов), для каждого допустимого преобразования имеем
f(a) = 400 «=> (# о /) (a) = 400,
поскольку единственным допустимым преобразованием будет
тождественное. (Заметим, что совсем не обязательно, чтобы значение /(д) на самом
деле равнялось 400 для того, чтобы утверждение f(a) = 400 было
содержательным. Содержание утверждения не то же, что его истинность: нас просто
интересует, имеет ли данное утверждение какой-нибудь смысл.) Если же
f— шкала отношений, как при измерении веса, то утверждение A2)
бессодержательно: например, если для какого-нибудь преобразования /
утверждение f(a) = 400 истинно, то, положив а Ф 1, получим ложное утверждение
а/ (а) =400.
Приведем другой пример, положив, что (91 , 85 ,/) — шкала, а а и Ъ —
элементы множества А, на котором определена система отношений 3(.
Рассмотрим утверждение
/(*)+/(*)= 15. A3)
Соотношение A3) может быть утверждением о том, что сумма весов
предметов а и Ь равна 15. Содержательно ли оно? Ответ будет отрицателен,
если /- шкала отношений. Ибо если f(a) +f(b) = 15, то otf(a) + ocf(b) =
= 15 а Ф 15 при а Ф 1. Однако утверждение
/(*) + fiP) есть постоянная величина для всех а и Ь из А A4)
содержательно, когда/ - шкала отношений.Можно переписать это
утверждение следующим образом:
f(a)^f(b)-f(c)^f(d) тявсеха,Ь,с,с!кзА. A5)
Таким образом, если а > 0, то утверждение A5) выполняется тогда и
только тогда, когда
af(a) + af(b) = af{c) + af(d ) для всех а, Ь, с, d из А.
Приведем еще один пример, рассмотрев утверждение
№>f(b). A6)
Если <р(х) = otx+ b9 a> 0, то
of (а) + 0 > ocf(b) + 0 ^ (xf(a) > af(b) *
Таким образом, утверждение A6) содержательно, когда/ - интервальная
шкала. На самом деле оно содержательно и в случае, когда/ - порядковая
шкала. (Почему?) Например, высказывание о том, что твердость элемента а
больше, чем твердость Ь, — содержательно.
Продолжим наше обсуждение, приведя дополнительные примеры.
Рассмотрим две шкалы ( 91 , 8& ,/) и ( Я ', IB ';#), в которых системы 5( и
431
9f' определены на одном и том же множестве, и исследуем высказывание
f(a)=2g(a). A7)
Например, это может быть сообщение о том, что высота некоторого
животного вдвое больше, чем его вес. Если и / и g — шкалы отношений, то
высказывание A7) содержательно, когда его истинность или ложность не
меняется при любых (возможно различных) допустимых преобразованиях
шкал. Так, если ф(х) =ахиир'(х) = /Здс, то высказывание A7)
содержательно тогда и только тогда, когда справедливо соотношение
Но это неверно: достаточно положить а^/3, чтобы равенство не
выполнялось. С другой стороны, вполне очевидно, что высказывание A7)
содержательно, если f Jig - абсолютные шкалы. При рассмотрении высказываний
вроде A7) может оказаться, что шкала g определяется в терминах
шкалы /. В этом случае нежелательно, чтобы множества допустимых
преобразований шкал определялись независимо: достаточно определить
допустимые преобразования шкалы/, а для шкалыg использовать преобразования,
"выведенные" из преобразований для /. Такое положение типично для
теории производных измерений, в которой шкалы определяются друг
через друга. В теории производных измерений имеется несколько
вариантов понятия содержательности высказываний в узком и широком смысле
и в зависимости от того, выбираем ли мы множества допустимых
преобразований для всех шкал независимо или же нет1). Однако в этой главе,
если не будет оговорено противное, предполагается, что для всех шкал
множества допустимых преобразований независимы.
Для того чтобы построить более сложный пример, представим себе, что
наблюдаются группа из п животных, находящихся под специальным
экспериментальным воздействием (например, на определенной диете), и другая
группа, состоящая из т животных, которая подвергается воздействию
иного типа. Нам бы хотелось установить, что средний вес животных,
находящихся под воздействием первого типа, больше среднего веса животных
второй группы. Конкретно: пусть / - шкала, в которой измеряется вес
животного; мы намерены исследовать высказывание
\ п 1 m
— 2 f(ai)>— 2 f(bd. A8)
п /=i m /=i
Рассчитывается арифметическое среднее по двум различным наборам
данных, и полученные величины сравниваются между собой. Утверждение
A8) считается содержательным при любых допустимых преобразованиях
*р A8) выполняется тогда и только тогда, когда
— 2 (*<>/)(*/)> — S & of) (Ы). A9)
п 1=1 m /=i
Если у - преобразование подобия, т.е. функция вида <р(л) =ах, а>0,
О Более подробно с этим вопросом можно ознакомиться по работе Suppes, Zinnes
[1963].
432
то соотношение A8) выполняется тогда и только тогда, когда
выполняется соотношение A9), поскольку последнее равносильно утверждению
\ п 1 т
— 2 (*/(*,)>— 2 а МЫ).
П i = 1 Ш i = 1
Высказывания A9) и A8) равносильны и в том случае, когда у
-положительное линейное преобразование, т.е. у (х) - функция вида у(х) = ах + /3,
а > 0, поскольку соотношение A9) тогда можно переписать в виде
1 я 1 т
— 2 [<*/(*,)+ 0]>— 2 [аДад + Р],
И I = 1 /Я / = 1
а это неравенство в свою очередь сводится к A8). Таким образом,
высказывание A8) содержательно, когда / - либо шкала отношений, либо
шкала интервалов. Если же / - порядковая шкала, то высказывание A8)
бессодержательно. Доказательство этого положения предоставляется
читателю как упражнение 20. На основании этого результата можно утверждать,
что высказывание "группа А в среднем обладает более высоким
коэффициентом интеллектуальности, чем группа В" бессодержательно, если
измерения проводились в порядковой шкале. (Коэффициенты
интеллектуальности, по-видимому О, определяют только порядковую шкалу (Stevens
[1959]).) Сравнение средних значений коэффициента интеллектуальности
содержательно только в интервальной шкале ("стандартные баллы",
по-видимому, определяют именно интервальную' шкалу). К сожалению,
слишком часто в биологии и социальных науках проводятся сравнения по
арифметическим средним (да и другие виды сравнений) без должного внимания
к тому, содержательны ли соответствующие утверждения.
Предположим теперь, что несколько экспертов или индивидуумов
ранжируют пару альтернатив а и Ъ. Пусть ft (а) обозначает ранг
альтернативы а, присвоенный ей /-м экспертом, и fi(b) — соответствующее значение
ранга альтернативы Ь у того же эксперта. Может возникнуть желание
рассмотреть высказывание
— 2 /,(*)>— 2 /,(*). B0)
П . i =1 П / = 1
Мы утверждаем, что средний ранг альтернативы а выше среднего ранга
альтернативы Ъ. Утверждение бессодержательно даже в том случае, когда
каждая шкала ft есть шкала отношений. Нам надо одновременно рассмот-
ретьпреобразования ^{х)-а(хдля каждого отображения fu и, конечно,
найдутся такие значения а/} что, хотя неравенство B0) будет
справедливым, неравенство
— 2 щШ>- 2 счМЬ) B1)
/1i = l П i = 1
1) Мы говорим "по-видимому" из-за того, что большинство конструируемых нами
шкал используют эмпирические процедуры, при которых не существует достаточно
ясного ментального представления, а допустимые преобразования требуется
определить как преобразования, сохраняющие эмпирическую информацию,
зафиксированную шкалой. Суждения же о том, что представляет собой эмпирическая информация,
носят несколько субъективный характер. Более подробное обсуждение этого вопроса
можно найти в работе (Stevens [1968, р. 850]).
28. Ф.С. Роберте 433
выполняться не будет. С другой стороны, сравнение геометрических
средних 1) по всем индивидуумам будет содержательным, ибо
Следует кратко указать на возможные приложения последнего
результата. В недавно проведенных экспериментах (см. Roberts [1972, 1973])
группе экспертов предлагалось высказать свои суждения об относительной
важности каждого набора переменных, характеризующих возрастание
потребности в энергетических ресурсах. Экспертам предлагалось
воспользоваться методом бальных оценок, в котором наиболее важной переменной
присваивается оценка 100 баллов; оценки других переменных
определяются экспертом уже в долях наиболее важной из них; так, например,
переменная, которой присваивается оценка 50 баллов, трактуется как "вдвое менее
важная" по сравнению с альтернативой, получившей 100 баллов. Типичный
набор переменных и их оценок, проставленных одним из экспертов,
приведен в табл. 8.3. Эти оценки переменных по важности были использованы
для выбора наиболее важных переменных, определенных как вершины
знакового орграфа, представленного на рис. 4.8 (см. § 4.3). Весьма
вероятно, что такая процедура оценки приводит к шкале отношений; такое
предположение было высказано Стивенсом (Stevens [1957,1968]) и
подверглось теоретическому анализу (Krantz [1972], Krantz et al. [1971, § 4.6]).
Таким образом, сравнение геометрических средних экспертных оценок
важности показателей — по всей вероятности,'содержательная процедура,
сравнение же арифметических средних - скорее всего, нет. Наиболее
важная переменная была определена как такая, среднегеометрическая оценка
которой при осреднении по всем экспертам оказалась наибольшей.
Замечание. К анализу проведенного примера надо подходить с некоторой
осторожностью. Поскольку оценка наиболее важного элемента была
установлена одной и той же для различных экспертов, то в действительности
шкалы нельзя расценивать как независимые и поэтому неразумно
требовать, чтобы истинность утверждения была бы инвариантом при различных
преобразованиях шкал; такую инвариантность следует требовать при
одинаковых для всех шкал преобразованиях вида у(х) = ах. Но тогда,
по всей вероятности, становятся содержательными и сравнения
арифметических средних. Ибо,если для любого / положить <*,=(*, то неравенство
B0) выполняется тогда и только тогда, когда выполняется неравенство
B1). Однако для того, чтобы прийти к такому заключению, требуется
сделать дополнительные предположения, и поэтому безопаснее
пользоваться геометрическими средними. В любом случае доводы такого типа
указывают на то, что теория измерения должна применяться с некоторой
аккуратностью.
Читатель, заинтересованный в более детальном ознакомлении с теорией
содержательности, может обратиться к работе Pfanzagl [1968].
п ^Геометрическим средним чисел х19хг,...,хп называется величина
\/*1 ' х2 '... хп = ^/П */, где ПХ{ означает операцию взятия произведения по xt>
i i
распространенную на все индексы /.
434
Таблица 8.3
Экспертные оценки относительной важности переменных,
характеризующих энергетические потребности автобусного транспорта
в заданном районе по данным Roberts [ 1972]
Переменная
Уровень
относительной важности
1. Число миль в расчете на одного пассажира (в год, автобусом) 80
2. Число поездок (в год) 100
3. Длина автобусных маршрутов (в милях) 50
4. Длина специализированных автобусных пробегов 5 0
5. Среднее время проезда от дома до работы (либо от работы до
дома, либо суммарное время) 70
6. Среднее расстояние от дома до работы 65
7. Средняя скорость пробега 10
8. Среднее число пассажиров в автобусе 20
9. Расстояние от остановки автобуса до дома (или до работы,
либо суммарное расстояние) 50
10. Численность автобусов в районе 20
11. Число остановок (от дома до работы или от работы до
дома, либо суммарное число остановок) 20
Последний пример приложения теории содержательности посвящен
расчету потребительского индекса цен. Такой индекс рассчитывается по
заданным ценам фиксированного набора товаров, включающего продукты
питания, одежду, топливо и т.п. Пусть р/(г) — цена /-го товара в момент
времени t. Величина р,- @) называется базисной ценой товара /-го типа.
Брэдстрит и Дьюто (см. Fisher [1923, р. 40]) предлагают рассчитывать
индекс потребительских цен по формуле
2 Р/С)
1 = 1
й@)
(Таким образом,/@ следует считать шкалой, выведенной из шкалы цен.)
Попробуем выяснить, будет ли содержательным высказывание о том,
что за последний год индекс потребительских цен удвоился. Иными
словами, будет ли содержательным высказывание
= 2/@?
B2)
Цены измеряются в денежных знаках, которые допускают смену
единицы измерения (переход от долларов к центам, или от долларов к франкам
и т.п.). Значит, Pi(t) определяет шкалу отношений. Если мы допускаем
использование независимых допустимых преобразований, то высказывание
B2) бессодержательно. Действительно, бессодержательным оказывается
даже высказывание /(г + /)>/@ (Почему?) Однако если все цены
измерены в одних и тех же единицах, то для всех цен можно применить только
28*
435
одно и то же допустимое преобразование. В этом случае высказывание B2)
содержательно, потому что для любого значения а > 0 получаем
п п п п
l) 2 OLPi(t) 2 Р/0+1) 2
f i 1
2 ^ 2
2 ocPi@) 2 аР/@) 2 р,@) 2 Pi@)
i=i i=i i=i i=i
Более подробное обсуждение этого вопроса можно найти в книге Pfanzagl
[1968, р. 49].
Упражнения
Всюду, где нет специальных указаний, все шкалы предполагаются возникшими
из регулярных представлений.
1. Пусть А = { а, 0, 7} , R = {(& у), (у, а), @, а)} , а отображение / определено
следующим образом: /(а) = 20,/@) = 30,/(у) = 25.
а. Показать, что / - гомоморфизм системы 8 = (A, R) в систему в = (fi, > ).
б. Будет ли отображение <р(х) = 2х допустимым преобразованием шкалы?
в. Тот же вопрос при \р(х) = х2.
2. Пусть А = { 0,1, 2,...} и гомоморфизм /изИ =04, >) в 85= («, >) задается
функцией f(a) = 2а.
а. Будет ли </>(*) = 2х допустимым преобразованием шкалы?
б. Тот же вопрос при <р(х) = х+2.
3. В упражнении 1 определить еще один гомоморфизм g из Ь в ЯЗ следующим
образом: g(a) = 5О,#@) = 70, g(y) = 61, и найти функцию ^: /04) -> Л такую, что
4. Какие из следующих преобразований будут допустимыми преобразованиями
порядковой шкалы, определенной на множестве <Я?
в. <р(х)=х + 7.
г. «^>(jc) = х.
5. Тот же вопрос, что и в упражнении 4, но относительно шкалы отношений.
6. Тот же вопрос, что и в упражнении 4, но относительно интервальной шкалы.
7. Тот же вопрос, что и в упражнении 4, но относительно абсолютной шкалы.
8. Тот же вопрос, что и в упражнении 4, но относительно номинальной шкалы.
9. Предположив, что связность графа определяет порядковую шкалу, определить
какие из следующих функций входят в класс допустимых преобразований шкалы:
а.^@) = 5, ^A) = 5,1, #B) = 100,
б. <р@) = 10, <^A) = 9, (р B) = 8,
в. ^@) = 3, vKD = 2, v?B)=l, </>C) = 0.
= 3,
10. Определяют ли номера на спортивных костюмах футболистов номинальную
шкалу? Указание. В некоторых схемах нумерации игроков нападающие получают
номера не выше 50, защитники нумеруются числами от 80 до 99 и т.д.
11. Какой из описанных выше типов шкал применим для измерения высоты?
Объяснить ответ.
12. Показать, что высказывание f(a) = 2f(b) бессодержательно, если его
рассматривать как утверждение о соотношении температуры тел, приведя пример, когда
оно справедливо для шкалы Фаренгейта и нарушено для шкалы Цельсия.
436
13. Пусть / - шкала отношений. Какое из следующих высказываний
содержательно?
а./(«)+/№)> /(с).
6.f{a)+f(b)>f2(c).
B.f{a)-f(b)> f(c).
г./(я) = f(b).
14. Тот же вопрос, что и в упражнении 13, но для интервальной шкалы.
15. Тот же вопрос, что и в упражнении 13, но для номинальной шкалы.
16. Рассмотреть утверждение f(a) + g(b) = 7.
а. Будет ли это утверждение содержательным, если fag -.шкалы отношений?
б. Будет ли это утверждение содержательным, если / и g - интервальные шкалы?
в. Будет ли это утверждение содержательным, если fug- абсолютные шкалы?
г. Допустим, что мы изменили утверждение следующим образом: f(a) + g(b) -
постоянная величина для всех а и Ъ из А. Будет ли оно содержательным, если / и g -
шкалы отношений; если fug- интервальные шкапы?
17. Пусть / - шкала отношений, a g - абсолютная шкала. Какое из следующих
высказываний содержательно?
б. f{a) — константа при всех а из Л.
в. f(d) + g(a) - константа при всех а из А.
18. Шкалой разностей называется шкала, допустимые преобразования которой
состоят из всех функций вида у(х) = х + 0. (Согласно работе Suppes, Zinnes [1963,
гл. 4.2] так называемая шкала Терстоуна типа V, которая возникает в психологии
при измерении степени реакции, представляет собой пример шкалы разностей.) Какое
из следующих утверждений содержательно при условии, что / - шкала разностей?
а. f(a)>f(b).
б. /(д) = 2/(Ь).
в. f(a) + f(b) - постоянная величина при всех а и b из А.
19. Шкала называется лог-интервальной, если класс допустимых преобразований
шкалы состоит из всех функций вида ах , а,/3 > 0. Лог-интервальные шкалы играют
важную роль в психофизике (см. Luce [1959] и Roberts [готовится к печати]). Пусть
/ - лог-интервальная шкала; какие из следующих высказываний содержательны?
а. f(a)>f(b).
б. f(a) = 2f(b).
в. f{a) + f(b) - константа при всех а и b из А.
г. f(a\f(b) - постоянная величина при всех а и Ъ из А.
20. Показать, что высказывание, выписанное в виде соотношения A8),
бессодержательно, если / - порядковая шкала.
21. Если в утверждении, записанном соотношением A8), арифметическое среднее
заменить на геометрическое, а шкалу / - на шкалу отношений, то будет ли
получившееся в результате утверждение содержательным?
22. В ситуации, когда все оценки получены от различных экспертов и каждая из
шкал fi - порядковая, какое из сравнений приводит к содержательным
утверждениям?
а. Сравнение арифметических средних.
б. Сравнение геометрических средних.
в. Сравнение медиан при нечетном числе экспертов. (Медианой совокупности С,
состоящей из п = 2k+ 1 чисел называется (к + 1)-е число в упорядочении
совокупности С по возрастанию элементов.)
23. Ответить на вопросы упражнения 22, когда каждое отображение /J - шкала
разностей.
437
24. Показать, что высказывание/(? + 1) > lit) об индексах потребительских цен
оказывается несодержательным, если считать классы допустимых преобразований
цен независимыми.
25. Пусть гомоморфизм /: И-» $6 определяет интервальную шкалу. Показать,
что при таком гомоморфизме сохраняется отношение интервалов: если g: Ь -*- © -
еще один гомоморфизм, то
№ - fib) g{a) - gib)
fie)-f{d) gic)-gid)
26. Какое из следующих высказываний содержательно. Объяснить ответ.
а. ''Эта палка вдвое длиннее той1'.
б. "Площадь этого треугольника вдвое больше, чем того".
в. "Рост Джона вдвое больше его веса".
г. 'Температура Джона больше, чем его вес".
д. "Этот полет вдвое длиннее того, в котором я участвовал в прошлый раз".
е. "Алмазы вдвое твержде угля".
ж. "Сегодня ветер спокойнее, чем вчера" (Шкала ветра Бьюфорта включает такие
категории, как спокойный ветер, легкий ветер, легкий бриз, и т.п.)
з. "Различие между сегодняшней и вчерашней температурами в 5 часов вечера
такое же, как между температурами вчерашнего и позавчерашнего дней".
и. "Этот образец весит на50% больше, чем тот".
27. Обсудить, при каких обстоятельствах содержательно сообщение о том, что
средняя оценка одного из учащихся выше, чем у другого.
28. Обсудить, при каких обстоятельствах содержательно сообщение о том, что
средний балл по чтению в одной из школ выше; соответствующего балла другой школы.
29. Упражнения 29 - 34 основаны на работе Roberts [1974]. Показать, что шкала
( U > Я5 »/) регулярна' тогда и только тогда, когда при любом гомоморфизме g>:
8 -+ f& из fia) =fib) следует gia) = gib).
30. Показать, что любой взаимно однозначный гомоморфизм (изоморфизм)
определяет регулярную шкалу.
31. Это упражнение демонстрирует одну из проблем, которые* возникают при
работе с нерегулярными шкалами - трудность лежит в определении типа шкалы.
Пусть А = { г, s} и R = {ir, г), is, s), (r, s), (s, г)} . Определим на Я отношение S условием
xSy <=> ix = у; - 1, или у =х - 1, или х = у).
а. Показать, что отображения fug будут гомоморфизмами системы Я = 04, R)
в систему 85 = («, S), если fir) = 0, fis) = 0 и gir) = 0, gis) = 1.
б. Показать, что ( Я , ЯЗ , /) - нерегулярная шкала.
в. Показать, что ( V , fB »/) есть шкала отношений, предположив, что
определение имеет смысл и применительно к нерегулярным шкалам.
г. Показать, что ( Я , $5 , g) не будет шкалой отношений.
32. Доказать, что если (К , SJ , /) - регулярная шкала отношений и ( К , 9В , g) -
еще одна шкала, то эта шкала также будет шкалой отношений.
33. Повторить упражнение 32, переформулировав его для интервальных шкал.
34. Повторить упражнение 32, переформулировав его для порядковых шкал.
35. Провести критическое обсуждение приведенного нами объяснения понятия
содержательности высказывания. Продумать примеры, допускающие объяснение и
не допускающие объяснения этого понятия.
§. 8.5. Примеры фундаментальных измерений I:
Ординальные функции полезности
8.5.1. Теорема представления. Изучая вопросы, связанные с
измерением температуры, предпочтений и т.п., мы пришли к следующей проблеме.
При каких условиях можно указать такую действительную функцию /,
определенную на А, что для заданной системы отношений (A9R) с
бинарным отношением R на множестве А для всех а и Ь из А будет выполнено
438
условие
aRb =>№>f(bL B3)
функция / определяет гомоморфизм системы (A,R) в числовую систему
отношений (<R,>). В настоящем параграфе будут сформулированы
необходимые и достаточные условия существования функции,
удовлетворяющей условию B3). Иными словами, будет сформулирована теорема
представления для представлений вида B3). Более того, приведем также и
теорему единственности.
Читатель, конечно, помнит, что бинарное отношение (A9R)
асимметрично, если во всех случаях, когда aRb, выполняется и ~ bRa. Бинарное
отношение отрицательно транзитивно, если из ~aRb и ~bRc следует^ aRс.
Теорема 8.1. Пусть R — бинарное отношение, определенное на
конечном множестве А. Определенная на А действительная функция/
удовлетворяет условию
aRb*>f(a)>f(b) B3)
в том и только том случае, когда отношение (A9R) асимметрично и
отрицательно транзитивно.
Доказательство теоремы 8.1 будет дано позже.
Асимметричное и отрицательно транзитивное бинарное отношение
называется строгим слабым порядком. Если R — строгое предпочтение, то
функция /, для которой выполняется условие B3), называется
(ординальной) функцией полезности. Таким образом, видим, что для выявления с
достаточной полнотой предпочтения человека и определения его функции
полезности нужно просто проверить, удовлетворяют ли его предпочтения
условиям, определяющим строгое слабое упорядочение, т.е. выполняются
ли для них свойство асимметрии и отрицательной транзитивности. В
общем случае такая проверка осуществляется процедурой парных
сравнений. Для каждой пары альтернатив индивидууму предлагается вынести
суждение, какую из них он предпочитает. Пары альтернатива, b E А
предъявляются в случайном порядке и по полученным ответам определяется
отношение предпочтения наЛ. Результаты опроса можно представить в виде
таблицы, подобной табл.8.4, полученной при выяснении предпочтительных
вариантов поездок в отпуск. (Мы уже втречались с похожими таблицами
и процедурой парных сравнений в § 3.2 при изучении турниров). Используя
табличные данные, проверяем выполнимость аксиом асимметрии и
отрицательной транзитивности: были ли случаи, когда индивидуум
предпочитает альтернативе b альтернативу а и в то же время утверждает, что b
предпочтительнее а. Затем выясняется, были ли случаи, когда он отказывался
предпочесть альтернативу а альтернативе Ь, не предпочитал альтернативу b
альтернативе с, но утверждал, что а предпочтительнее с.
Существуют две интерпретации аксиоматики строгого слабого порядка.
При первой из них утверждается, что это есть условие измеримости системы
индивидуальных предпочтений. Тем самым принимается дескриптивный
подход к измерению и соответственно выясняется, удовлетворяет ли
система индивидуальных предпочтений условиям измеримости. При второй
интерпретации эти аксиомы используются как определение
рациональности системы индивидуальных предпочтений. Считается, что индивидуум,
439
система предпочтений которого не удовлетворяет этим аксиомам,
действует иррационально. Действительно, многие убеждены, что человек,
который нарушил, например, свойство отрицательной транзитивности,
признается: "да, я сделал ошибку". Такой подход обычно принят в
экономических теориях и называется прескрептивным, или, чаще, нормативным
подходом. При этом теоремы представления используются для того,
чтобы определить класс индивидуумов, к которым применима
развиваемая теория, т.е. класс так называемых рациональных индивидуумов.
Именно такой подход или интерпретация принимается в приложениях
теоремы представления при изучении проблемы измерения температуры.
Для отношения R- "теплее, чем" — условия асимметрии и отрицательной
транзитивности считаются характеристикой рациональности суждений, и
для того, чтобы измерение имело место, эти условия должны быть
выполнены.
Хотя в случае отношения "теплее, чем" вполне естественно думать, что
эти условия допускают экспериментальную проверку, и мы были бы
удивлены, если в индивидуальных суждениях оно оказалось бы нарушеным
(скорее, мы были бы склонны отнести такое нарушение к категории
ошибки эксперимента, а не к "действительному" нарушению), при выявлении
отношения предпочтения ситуация существенно меняется. Если для
отношения R> считающегося выражением строгого предпочтения, подвергнуть
экспериментальной проверке выполнимость свойств асимметрии и
отрицательной транзитивности, то мы можем вдруг обнаружить, что они не
выполнены. Например, индивидуум может считать, что цена продукта важнее
его качества, но при близких ценах выбирать более качественный продукт.
Таким образом, если продукты а и Ъ почти одинаковы по цене, так же как и
продукты Ъ и с, то он может предпочесть а по сравнению с Ъ как более
качественный продукт и по той же причине предпочесть Ъ по сравнению с сь
но в то же время предпочесть с по сравнению с а, поскольку с дешевле
а и разница в ценах стала ощутимой. Здесь свойство транзитивности
предпочтения оказывается нарушенным. Более того, нарушено и свойство
отрицательной транзитивности: для него с не предпочтительнее Ь, и Ъ не
предпочтительнее а, но он предпочитает с по сравнению сд1). Если одна из
аксиом, например аксиома отрицательной транзитивности, нарушена, то
нельзя получить представление B3) и, таким образом, не существует
ординальной функции полезности. Однако в некотором другом смысле
измерение все-таки возможно. Как это сделать, будет показано в § 8.8.
Для доказательства теоремы 8.1 предположим сначала, что существует
гомоморфизм /, удовлетворяющий условию B3). Покажем, что тогда
(A,R) есть отношение строгого слабого порядка. Во-первых, отношение
(A,R) асимметричное, так как если aRb, то f(a) >f(b), следовательно,
f(b) не больше f(a) и, значит, ~ bRa. Во-вторых, отношение (A,R)
отрицательно транзитивно ибо если ~aRb и ~ bRc, то ~ [/ (а) >/(?)] и
~ [f(b) >f(c)] и, таким образом, f(a)<f(b) и f(b)<f(c). Отсюда
следует, что/(a) </(с), поэтому ~ [f(a) >f(c) ] и, значит, ~~ aRc.
!) Этот пример взят из работы Krantzet al. [1971, р. 17]. Мы уже встречались с
ним в § 3.2 в качестве довода, опровергающего утверждение о транзитивности
отношения предпочтения. Другие примеры того, что эти простые аксиомы не выполняются
для отношения предпочтения, будут приведены в § 8.8.
440
Обратно, предположим, что (A,R) есть отношение строгого слабого
порядка. Приведем конструктивное доказательство существования
гомоморфизма/, определив его следующим образом:
f(x) = числу таких элементов у множества А, что1) xRy. B4)
Начнем с того, что проиллюстрируем предложенную схему. Пусть
A={a,b,c,d,e) и R ={(а, с), (a, d), (а, е), (Ъ, с), (b,d), (b,e),(ctd),
(с, е)}. Нетрудно показать, что (A,R) - асимметричное и отрицательно
транзитивное бинарное отношение. Функция /, определяемая B4),
принимает значения:
f(a) = 3 (поскольку aRc, aRd, aRe),
=2,
= О,
Легко проверить, что отображение / задает гомоморфизм.
Для формального доказательства того, что определенная соотношением
B4) функция / всегда удовлетворяет условию B3), сначала следует
доказать транзитивность отношения (A,R). Воспользуемся предположением
о том, что (A,R) есть строгий слабый порядок. ПустьaRb и bRc; вопреки
свойству транзитивности, предположим, что ~ aRc. Поскольку (A,R) —
асимметричное отношение, то из bRc следует ~ cRb. Атак как отношение
(A,R) к тому же и отрицательно транзитивно, то из ~~ aRc и ~~cRb следует
^aRb, что противоречит сделанному предположению. Следовательно,
отношение (Л,R) транзитивно. Перейдем к проверке условия B3). Если
aRb, то из транзитивности отношения R при любом у из bRy следует
aRy. Таким образом, число элементов у таких, что aRy, во всяком случае
не меньше, чем число элементов у таких, что bRy. Отсюда следует,
что f(a{)>f(b). Более того, aRb, но неверно, что bRb, поскольку слабый
порядок антирефлексивен. (Почему?) Значит, f(a) >f(b). Обратно, если
^ aRb, то по свойству отрицательной транзитивности из ~ bRy следует
~aRy. И отсюда, поскольку aRy влечет bRy, то f(b) >f(a), и значит,
~" [/ (а) >f(P) ]• Тем самым показано, что условие B3) выполнено, что
и завершает доказательство теоремы 8.1.
Следует отметить полезное следствие, вытекающее из приведенного
доказательства.
Следствие 1. Любой строгий слабый порядок транзитивен.
Это следствие дает нам еще один способ продемонстрировать тот факт,
что не существует гомоморфного отображения, удовлетворяющего
условию B3). Надо просто показать, что нарушается условие транзитивности.
Следует отметить, что если А — конечное множество и отображение /,
определенное соотношением B4), - не гомоморфизм, то отношение (A,R)
не будет строгим слабым порядком, что и объясняет отсутствие
гомоморфизма. Таким образом, у нас появился еще один способ узнать, существует
ли гомоморфизм, а именно: построить по предложенной процедуре отобра-
!) Читатель может увидеть, что функция f{x) есть число Борда, введенное в тп.1.
441
Таблица 8.4
Предпочтительность вариантов поездок в отпуск
Поездка / считается предпочтительнее поездки / тогда и только тогда, когда (/,/)-й
элемент равен
Рим
Лондон
Афины
Москва
Париж
Копенгаген
Вена
1.
Рим
/ °
/ °
/ о
о
о
\ °
\ о
Лондон Афины
1
0
1
1
1
0
1
1
0
0
0
1
0
0
Москва
1
0
1
0
1
0
0
Париж
0
0
0
0
0
0
0
Копенгаген
1
1
1
1
1
0
1
Вена
1 \
0 )
1 '
0
1 ]
0 /
о/
Сумма по
строке
5
1 1
4
2
I 5
0
2
Таблица 8.5
Измененный порядок данных табл. 8.4
Рим Париж Афины Москва Вена Лондон Копенгаген Сумма
Рим
Париж
Афины
Москва
Вена
Лондон
Копенгаген
о
о
о
о
о
\:
о
о
о
о
о
11
о
о
о
о
IL
Таблица 8.6
Предпочтительность вариантов поездок в отпуск
Поездка / считается предпочтительнее поездки / в том и только том случае, когда
(/./) -й элемент таблицы равен 1.
Рим
Лондон
Афины
Москва
Париж
Копенгаген
Вена
Рим
/ °
1
0
0
0
0
\о
Лондон Афины
0
0
1
1
1
0
1
1
0
0
0
1
0
0
Москва
1
0
1
0
1
0
0
Париж
0
0
0
0
0
0
0
Копенгаген
1
1
1
1
1
0
1
Вена
1 \
0
1
0
1
0
0 /
Сумма
4
2
4
2
5
0
2
442
жение / и посмотреть приводит ли оно к успеху. Это достаточно важный
результат, и сформулируем его как отдельное следствие.
Следствие 2. Пусть бинарное отношение R определено на конечном
множестве А. Определенная на А действительная функция / удовлетворяет
условию B3) в том и только том случае, если
f(x) = числу элементов у из А, таких, что xRy. B4)
Применим эти представления к проблеме измерения предпочтений.
Допустим, что у индивидуума спрашивают его предпочтения относительно
поездок в отпуск по схеме парных сравнений, которые затем сводятся в
табл. 8.4. Нетрудно найти значения функции/(л:), определенной
соотношением B4), просуммировав элементы строки х. По данным табл. 8.4
получим
/(Рим) =/ (Париж) =5,
/(Афины) = 4,
/(Вена) =/ (Москва) = 2,
/(Лондон) = 1,
/(Копенгаген) = 0.
Легко проверить, будет ли это отображение гомоморфизмом, если
переписать матрицу так, чтобы альтернативы располагались в порядке убывания
сумм элементов по строкам; надо посмотреть, есть ли здесь единицы в
тех строках х, для которых при любых значениях^ выполняется
неравенство /(у) </(х). Должен получиться блок из единиц вплоть до конца
просматриваемой строки х. Для нашего примера матрица, упорядоченная по
убыванию сумм элементов по строкам, выписана в виде табл. 8.5, где
выделены соответствующие блоки из единиц. Легко видеть, что отображение /
есть гомоморфизм. Значит, для данного индивидумма функция / служит
его ординальной функцией полезности.
С другой стороны, если система предпочтений индивидуума такая,
как показано в табл. 8.6, то соотношением B4) функция / определяется
следующим образом:
/(Париж) =5,
/ (Рим) =/(Афины) = 4,
/(Лондон) =/(Москва) =/ (Вена) =2,
/(Копенгаген) = 0.
В матрице с измененным порядком данных, как можно видеть из табл. 8.7,
блок из единиц разрушен появлением нуля на пересечении строки,
соответствующей поездке в Рим, и столбца, соответствующего поездке в
Лондон. Поэтому отображение / не есть гомоморфизм, и в силу следствия 2
искомого гомоморфизма не существует вообще. (Легко обнаружить, что
несмотря на то, что / (Лондон) </(Рим), поездка в Лондон оказывается
предпочтительнее поездки в Рим.) В этом случае не существует и
ординальной функции полезности. А отсюда следует, что по крайней мере одна
из аксиом строгого слабого порядка должна быть нарушена, и по
имеющимся данным нетрудно обнаружить, что не выполняется аксиома отри-
443
Таблица 8.7
Измененный порядок данных табл. 8.6
Париж
Рим
Лондон
Москва
Вена
Копенгаген
Париж
/ °
0
0
0
о
\ о
Рим
0
0
1
0
0
0
Афины
1
Ь
0
0
0
0
Лондон
1
0
0
1
1
0
Москва
1
1
0
0
0
0
Вена
1
1
0
0
0
0
Копенгаген Сумма
1 \
И
1
1
1 1
0 /
5
4
2
2
2
0
цательной транзитивности: поездка в Лондон предпочитается поездке в
Рим, но поездка в Париж не предпочитается Риму, и Лондон не
предпочитается Парижу.
Если (A, R) - строгий слабый порядок, то функция/, определенная
соотношением B4), задает ранжировку того же типа, что и в гл. 7.
Элементу присваивается более высокий ранг, чем другим, если на нем функция /
принимает большее значение; ранги двух элементов связаны, если значение
функции / на этих элементах одинаково. Например, система предпочтений
из табл. 8.4 приводит к следующей ранжировке:
Рим-Париж,
Афины,
Вена-Москва,
Лондон,
Копенгаген.
(Дефис между двумя альтернативами указывает на то, что ранги этих
альтернатив связаны.) Если отношение (A, R) не есть строгий частичный
порядок, то такой ранжировки получить не удается, так как любая такая
ранжировка определяет строгий слабый порядок. И ранжировка есть
удобный способ представления такого порядка. Для целей принятия решений
ранжировка содержит в себе столько же информации, сколько ее имеется
в орданальной функции полезности.
8.5.2. Гипотеза ожидаемой полезности. Процедура парных сравнений,
при которой индивидуума заставляют сравнить каждую пару альтернатив,
может оказаться довольно трудоемкой. Множество всех пар альтернатив
может быть очень большим. Опишем процедуру, которая позволяет обойти
эту трудность при определении функции полезности. Процедура применима
только в том случае, когда предполагается, что функция полезности
заведомо существует, т.е. система предпочтения, на основе которой мы хотим
делать выводы, представляет собой строгий слабый порядок.
Мы часто сталкиваемся с выбором альтернативных действий, риском в
игре или лотерее, когда каждый поступок влечет несколько возможных
последствий, предопределяет один из возможных результатов, или исходов
сх, с2, ..., сп. Каждый из возможных исходов имеет определенную
вероятность р(С(), и если имеет смысл говорить о полезности исхода, то и вполне
444
определенное значение полезности и{с{). Мы не будем предполагать, что
величины р и и нам известны, достаточно знать, что они существуют.
Величина
п.
2 р(сди(с{)
определяет ожидаемую полезность. Она представляет собой математическое
ожидание функции полезности. Гипотеза об ожидаемой полезности состоит
в том, что система предпочтений на множестве возможных действий такая
же, как если бы ее получили в результате следующих расчетов: для каждого
из возможных действий подсчитывается значение ожидаемой полезности
и затем выбирается то из них, для которого полученное значение
оказывается самым высоким1). (Эта идея восходит к работам Бернулли 1738 г.)
Опишем процедуру расчета значения функции полезности на
совокупности исходов А. Пусть на А определено бинарное отношение
предпочтения R2). Возьмем два элемента а* и а* из А, таких, что a*Ra* и для всех а
из А имеет место ~aRa* и ~a*Ra, Это означает, что элемент а*
предпочитается элементу д*, не существует элемента предпочтительнее а* и не
найдется ни одного элемента, которому мы предпочли бы элемент а». Среди
всех элементов множества А исход а* "наилучший", а исход а* — самый
"плохой". Поскольку a*Ra* и и — функция полезности, определенная
на множестве исходов Ау то и(а*) >м(а*). И, значит, и(а*) —и(а*) >0.
Для заданного элемента а множества А обозначим через Х(а) действие,
в результате которого заведомо произойдет исхода; выберем вероятность
f(a) так, чтобы нам оказалось безразлично, выбрать ли действие \(а)
или же действие 0(я), которое может иметь два исхода а* и а*, причем
первый из них наступает с вероятностью /(а), а второй — с вероятностью
1 —f(a). Безразличие в том и состоит, что мы не отдаем предпочтения ни
действию \(а) перед 0(а), ни, наоборот, действию в(а) перед Х(а). Легко
показать, что функция f(a) есть ординальная функция полезности на
(Ау R). Ожидаемая полезность действия Х(д) равна и(а), а ожидаемая
полезность для в(а) есть
f(a)u(a*)+[l-f(a)]u(a*)=f(a)[u(a*)-u(a.)] +u(a.).
Поскольку нам безразличен выбор между \(а) и в(а), то можно
приравнять эти полезности и получим
А так как м(я*) - и(а*) > 0, то, разделив на и(а*) - и(а*), найдем
и (а) — и (а*)
и (а*)-и (а*)
0 Здесь не утверждается, что вы в действительности подсчитываете ожидаемые
полезности, но вы поступаете так, как если бы такие вычисления были бы проделаны.
а) Отметьте, что тем самым задаются два отношения предпочтения: одно - на
множестве возможных действий, второе - на совокупности возможных исходов.
445
где
а =
и
—м
0
и(в*)-
И поскольку а > О, то приходим к заключению, что для любых двух
элементов аи b из А справедливо утверждение
Таким образом,
aRb**=>u(a)>u(b) *=*f
и, следовательно,/ есть ординальная функция полезности на (А, R).
Подведем итоги обсуждения процедуры нахождения ординальной
функции полезности / на множестве А. Пусть заранее выделены "наилучший" -
д* и "наихудший" - <*¦ из возможных исходов. Задавшись а, надо спросить
индивидуума при какой вероятности/(а) ему будет безразлично получить
ли заведомо исход а или же оказаться в неопределенной ситуации, когда
он может получить результат а* с вероятностью f(a) и исход а+ с
вероятностью 1-/(я). (На практике величина f(a) определяется
последовательным испытанием нескольких значений до тех пор, пока не будет достигнут
удовлетворительный результат.) Но один раз найденное число f(a) может
в дальнейшем использоваться для целей принятия решений. Насколько
известно автору, эта процедура принадлежит Говарду Райфа. Для расчета
полезности в рамках многих практически применяемых процедур
рекомендуется ознакомиться с работами Raiffa [1968, 196J]. По гипотезе
об ожидаемой полезности существует обширная литература. Укажем
некоторые из работ: Luce, Raiffa [1957], Fishburn [1964], Savage [1954];
из работ, освещающих этот вопрос с точки зрения теории фундаментальных
измерений, можно рекомендовать работы Luce, Krantz [1971], Krantz
etal. [1971,гл.8].
85.3. Теорема единственности. Обращаясь к проблеме единственности,
начнем с формулировки теоремы о единственном представлении B3).
Теорема 8.2. Пусть на множестве А определено бинарное отношение R
и действительно-значная функция/, удовлетворяющая условию
aRb*=*f(a)>f(b). B3)
Тогда Я = (Ау R) -* 85 = (<R, >) есть регулярное представление, а (9( ,
85 ,/)-регулярная шкала.
Доказательство. Если </>: f(A) -*<R — произвольное монотонно
возрастающее функциональное отображение, то суперпозиция <р о /
удовлетворяет соотношению B3) во всех тех случаях, когда ему
удовлетворяет функция /, ибо
Обратно, допустим, что функция / удовлетворяет соотношению B3) и
446
нам задано функциональное отображение </>: f{A) -*<R такое, что
суперпозиция у of тоже удовлетворяет этому соотношению. Нам нужно показать,
что в этом случае функция <р монотонно возрастает. Предположим, что
а и 0 принадлежат/(к) и а =/(д), a /3 =f(b). Тогда
а >0<=>aRb <=> fa о/) (д)> (<р о/) (Ь)<
Отсюда заключаем, что класс всех допустимых преобразований/совпадает
с классом монотонно возрастающих функций. Наконец, нам предстоит
показать, что каждая функция /, удовлетворяющая соотношению B3),
определяет регулярную шкалу, и, следовательно, мы имеем дело с
регулярным представлением. Пусть g — еще одна функция, которая
удовлетворяет условию B3); определим отображение кр: /(Л)—(R, положив
<?(<*) =#(<*)» если а=/(я). Возможно, что функция \р определена
неоднозначно. Например, если а=/(я) и а=/(Ь), то как узнать, какое будет
значение у </? (а), будет ли это g (а)\ или g (b) ? К счастью, ответить на этот^
вопрос нетрудно: ибо если/(д) =/(?), то из-за того, что/ — гомоморфизм,
получаем ~*aRb и ~bRa и, поскольку g - тоже гомоморфизм, то g(a) =
=g(b). Более того, g =</> о/. Таким образом, отображение / порождает
регулярную шкалу, ¦
Применим доказанную теорему для решения вопроса об измерении
температуры. При измерении температуры представление B3) возникает
в том случае, когда отношение Л интерпретируется как "быть тепдее, чем".
Однако в соответствии с теоремой 8.2 температура измерима в порядковой
шкале, но в § 8,4 предполагалось, что она измерима в интервальной шкале.
Что-нибудь не так с нашей моделью? Ответ состоит в том, что вполне
возможно получить и интервальную шкалу, но при условии, что мы можем
судить и о различиях в значениях температуры. Для достижения
необходимой точности в теории потребуется ввести четырехместное отношение
D(a, b9s, t), определенное на множестве объектов А, температура
которых подлежит измерению. Отношение D(a9 b, s9 t) означает, что разница
температур объектов аи b считается больше, чем различие в температурах
объектов s и t. Предстоит найти такую действительно-значную функцию /,
определенную на множестве Ау чтобы для любых a, b, s, tGA было
справедливо утверждение
D(a, b, s, 0 ~/(ц) -/(*>) >/(*) -/(г). B5)
При некоторых разумных предположениях такая процедура присвоения
числовых значений температуре объектов оказывается регулярной и
единственной с точностью до линейного преобразования, и, тем самым,
определяет интервальную шкалу. Достаточные условия справедливости
представления B5) и доказательство теоремы единственности приводятся в
работах Suppes, Winet [1955],Krantzet al. [1971, §4.4.1].
8.5.4. Замечания1).
1. Теоремы 8.1 и 8.2 действительно справедливы и в более общем случае,
а именно, для счетных множеств Л, т.е. таких множеств, которым можно
поставить во взаимно однозначное соответствие множество натуральных
О Не прерывая последовательности ознакомления с материалом книги, читатель
может пропустить этот пункт.
447
чисел. Этот результат получен Кантором (Cantor [1895]). Доказательство
можно найти в книгах (Birkhoff [1948], Krantz et al. [1971] и Roberts).
2. Если отказаться от предположения о счетности множества А, то
нетрудно показать, что теорема 8.1 перестает быть справедливой. Для того
чтобы привести контрпример, положим А = (R X (R и определим на А
отношение R условием
(я, b)R(s, t)<=>a>s или (a=snb>t).
Отношение R называется отношением лексикографического упорядочения
плоскости. Лексикографическое упорядочение плоскости (А9 R)
соответствует упорядочению слов в словаре. Слова упорядочиваются по первым
буквам, если первые буквы слов одинаковы, то слова упорядочиваются
по вторым буквам слова и т.д. Легко видеть, что отношение (A, R)
определяет строгий слабый порядок (см. упражнение 20). Покажем, что не
существует действительной функции на Л, которая удовлетворяла бы
условию B3). Предположим, что такая функция существует. Мы знаем, что
(а, 1) R (я, 0). Значит, в силу соотношения B3) имеем/(я, 1) >/(д, 0),
Известно, что всегда можно найти рациональное число, лежащее строго
между двумя различными действительными числами. Пусть g(a) будет
таким рациональным числом, что
f(a9l)>g(a)>f(a90).
Но тем самым мы на множестве (R определили функцию g, которая
отображает (R в множество рациональных чисел. И более того, это отображение
взаимно однозначное, ибо, если аФЬ,то либо а > Ь, либо же Ъ >а; пусть,
например, а > Ь. Тогда
g(a)>f(a,O)>f(b,l)>g(b)9
откуда заключаем, что g (a) >g(b). Но хорошо известно, что не существует
взаимно однозначного соответствия между множествами действительных
и рациональных чисел. Следовательно, мы получили противоречие и
приходим к выводу, что строгий слабый порядок не допускает представление
вида B3).
3. Теорема, устанавливающая необходимые и достаточные условия,
которым должно удовлетворять бинарное отношение (A, R),
определенное не обязательно на конечном множестве А, для того, чтобы
представление B3) имело место, была открыта Милграмом (Milgram [1939]) и
Биркгофом (Birkhoff [1948]). Формулировку и доказательство этой
теоремы можно найти в работе Кранца (Krantz et al. [1971]).
Упражнения
1. Какие из следующих бинарных отношений определяют строгий слабый порядок?
а. Отношение "состоять из большего числа членов, чем", определенное на
множестве организаций.
б. Отношение "иметь больший, выход окиси азота", определенное на множестве
электростанций.
в. Отношение "быть внуком", определенное на множестве жителей Соединенных
Штатов.
448
г. Отношение (Я, < ) .
д. Отношение (A, R), где Л = [0, 1] и R - это <.
е. Отношение (А, R), где А ={A, Г), A,2), B, 4)} и (в, b) R (s, t) тогда и только
тогда, когда [fl>s,6>fn (a > s или Ь > г) ].
ж. Отношение (A,R), где /1 ={A,1), A,2), B,1)} и отношение Л такое же,
как в п. е.
2. Пусть у4={3,4,5,6}и/? - это < . Воспользовавшись функцией, определяемой
соотношением B4), найти гомоморфизм из (A, R) в (<R, >).
з. Повторить упражнение 2, если R - это отношение >.
4.ПустьЛ ={*, Ъ, с, d)nR = {(*>, с), (Ь,я), F,tf), (d,c), (d,*)}.
а. Показать, что отношение (A,R) определяет строгий слабый порядок.
б. Найти гомоморфизм из (A9R) в (<R, >), используя функцию /, определяемую
соотношением B4).
5. Ниже приводится ранжирование, определяющее строгий слабый порядок R на
множестве А = {Рим, Париж, Афины, Вена, Москва, Копенгаген, Лондон}. Найти
гомоморфизм из (Л, R ) в (Л, > ):
Рим-Париж-Афины
Вена
Москва
Копенгаген
Лондон
6. Пусть А = { (а, Ь) : а, Ь е {1, 2, 3,4}}, и предположим, что (a, b) R (с, d) тогда и
только тогда, когда а > с.
а. Показать, что отношение {A, R) определяет строгий слабый порядок.
б. Использовать функцию /, определенную соотношением B4), для того чтобы
найти гомоморфизм из (A, R) в («,>).
7. Пусть А = { 0,1,..., 23 }. Каждое число а из А сравнимо по модулю 3 с одним
из чисел {0,1,2}. Будем называть такое число a mod 3. Пусть aRb выполняется тогда
и только тогда, когда a mod 3 > Ь mod 3.
а. Показать, что отношение (A, R) определяет строгий слабый порядок.
б. Использовать функцию /, определенную соотношением B4), для того, чтобы
найти гомоморфизм из (At R) в («,>).
8. Пусть А ={0, 1, 2,. .., 31} и aRb имеет место тогда и только тогда, когда
a mod 4 > b mod 4, где a mod 4 определено, как в упражнении 7. Использовать
функцию /, определенную соотношением B4), для того, чтобы найти гомоморфизм из
04, /?) в («, >). Будет ли g (х) = -/ (х) также гомоморфизмом?
9. Данные о системе предпочтения, собранные в табл. 8.8, получены в результате
проведения гипотетической процедуры парных сравнений. Построить ординальную
функцию полезности либо доказать, что такой функции не существует.
10. Повторить упражнение 9, используя данные табл. 8.9.
11. Пусть имеется набор альтернатив А ={а, Ь, с, d) и функция полезности,
определенная равенствами и (а) - 9, и(Ь) = 12, и (с) = 15, u(d) =18. Рассчитать ожидаемую
полезность для следующих лотерей.
а. Получить альтернативу а с вероятностью 1/3 или альтернативу b с вероятностью
1/3 или же альтернативу с.
б. С равными вероятностями получить альтернативу b или d.
в. Получить альтернативу а с вероятностью 1/4 или же альтернативу с.
12. Какую из лотерей упражнения 11 предпочесть в предположении, что
выполняется гипотеза о полезности?
13. Как рассчитывать полезность исхода стоимостью в 200 доллларов, если из всех
возможных исходов А "наилучшим" считается исход в 1000 долларов, а
"наихудшим" - в 100 долларов; предполагается что функция полезности существует и
гипотеза об ожидаемой полезности справедлива. (Заметим, что и(п) совсем не
обязательно равна пи A). Почему?)
14. Предположим, что вам безразлично в какой из следующих двух игр
участвовать.
Игра 1. В результате игры вы заведомо выигрываете один доллар.
Игра 2. В 50% случаев вы выигрываете 20 долларов и в 50% случаев -
проигрываете 6 долларов.
29. Ф.С. Роберте 449
Табл ица 8.8
Система предпочтений при выборе автомобилей
Модель i предпочтительнее модели / в том и только том случае, когда (/,/)-й
элемент равен 1
"Бьюик" "Датсун" "Фолькс- "Понтиак" "Кадиллак" "Форд"
ваген"
"Бьюик"
"Датсун"
"Фольксваген**
"Понтиак"
"Кадиллак**
**Форд**
/ °
/ °
°
0
\ 1
Х 0
1
0
1
0
1
1
1
0
0
0
1
0
1
0
1
0
1
1
0
0
0
0
0
0
1 ч
о ^
1
о 1
1
о '
Таблица 8.9
Система предпочтений при выборе автомобилей
Модель i предпочитается модели / тогда и только тогда, когда (/,/)-й элемекг
таблицы равен 1
"Бьюик" "Датсун" "фолькс- "Понтиак""Кадиллак" "Форд"
ваген"
"Быоик"
"Датсун**
''Фольксваген"
"Понтиак"
"Кадиллак"
"Форд"
/ °
/о
1
1
\ 1
\ 1
1
0
1
1
0
0
1
0
0
1
1
1
0
0
0
0
0
0
0
1
0
1
1
1
л
0
1
о /
0 /
Предполагается, что и - функция полезности и гипотеза об ожидаемой полезности
справедлива.
а. Вывести выражение, связывающее значения и A), мB0) и и F)
б. Безразличен ли выбор игры, если и (я) = пи A) ?
15. Предположим, что вы решаете, брать ли с собой зонтик, когда вероятность
выпадения дождя равна 50%. Если вы решитесь взять зонтик с собой, то будете
испытывать определенное неудобство из-за того, что его придется носить с собой целый день.
Если же вы не берете зонтик, то 50% шансов за то, что вы не будете испытывать
такого неудобства (предполагается, что при ношении зонтика вы учитываете только
неудобство от того, что его надо все время иметь при себе), но с вероятностью 50% вы
промокнете. Что бы вы выбрали из этих двух исходов?
16. Пусть / - ординальная функция полезности; будут ли содержательны
высказывания:
()
17. Пусть (A,D) - четырехместное отношение,/ - действительно-значная функция
на А, удовлетворяющая условию B5). Показать, что положительное линейное
преобразование функции / также удовлетворяет условию B5). Что еще требуется для
доказательства, что функция / определяет интервальную шкалу?
18. Пусть И = (А,Я, о), Я5 = («,>, + ) и /: А ->« - гомоморфизм из 1С в $5 .
Следует ли отсюда с необходимостью, что (А,Н) - строгий слабый порядок?
(Привести доказательство или контрпример.)
- 19. Пусть А - конечное множество событий и включение aRb означает, что событие
а субъективно более вероятно, чем событие Ь. Допустим, что в множестве А имеется
450
элемент е - событие, которое происходит "наверное". При каких условиях
существует действительная функция р, определенная на А, интерпретируемая как
вероятность и такая, что
aRb <=> р(а)>р(Ь) (для всех а, Ье А) B6)
и
р(е) = 1 ир(д)>0 (длявсехдеЛ)? B7)
Для дальнейшего ознакомления с вопросом о представлении субъективной
вероятности см. упражнение 13 § 8.6 и упражнения 10 и 20 § 8.7, а также работы Кг ant z et al.
[ 1971, гл. 5] или Робертса [готовится к печати].
20. Доказать, что лексикографическое упорядочение плоскости задает строгий
слабый порядок.
21. Привести пример асимметричного бинарного отношения, которое не
отрицательно транзитивно.
22. Привести пример отрицательно транзитивного бинарного отношения, которое
не асимметрично.
23. Привести пример отрицательно транзитивного, но не транзитивного бинарного
отношения.
24. Привести пример транзитивного, но не отрицательно транзитивного бинарного
отношения.
25. Рассмотреть следующие "игры":
Игра 1. Вы выигрываете 1 000 000 долларов автоматически.
Игра 2. Вы выигрываете 5 000000 долларов с вероятностью 0,10; 1 000000
долларов - с вероятностью 0,89 и ничего не выигрываете - с вероятностью 0,01.
Игра 3. Вы выигрываете 5 000000 долларов с вероятностью 0,10 или же ничего не
выигрываете.
Игра 4. Вы выигрываете 1 000 000 долларов с вероятностью 0,11 или же ничего не
выигрываете.
Французский экономист Аллаис (Allais [1953J) сообщает, что большинство людей
предпочитает игру 1 игре 2, и игру 3 игре 4.
а. Нарушает ли гипотезу об ожидаемой полезности выбор из игр 1 и 2 игры 1.
б. Тот же вопрос, но относительно выбора игры 3 вместо игры 4?
в. Тот же вопрос, когда эти два предпочтения делаются одновременно?
г. Объяснить причины, по которым люди склонны к таким предпочтениям.
д. Как можно убедить их в том, что они совершают ошибку? (см. Raiffa [1968],
р. 80.)
26. Предложение. Провести процедуру парных сравнений для выяснения
системы предпочтений, системы сравнения относительной громкости звука или на
каком-нибудь другом материале. Выяснить, существует ли сохраняющее порядок
отображение множества альтернатив в множество действительных чисел; если
отображение существует, то построить его (по аналогии с упражнениями 9 и 10).
27. Можно ли представить себе систему экономики, в которой свойства
транзитивности или отрицательной транзитивности во мнениях людей нарушались достаточно
часто? Какие это влекло бы последствия?
§ 8.6. Примеры фундаментальных измерений II:
Экстенсивное измерение1}
8.6.1. Теорема Гельдера. Изучение проблемы измерения массы тела и,
если выполнены определенные условия, системы предпочтения начинается с
введения системы отношений (A9R, о), где R — бинарное отношение,
определенное на Л, и о — бинарная операция. Требуется найти такую дейст-
1) В отличие от остальных частей книги^ этом параграфе обсуждаются
математические вопросы теории измерения не дискретные по своей природе. Читатель может
пропустить его, не прерывая последовательности восприятия. (Если он ранее не встре-
29* 451
вительно-значную функцию /, чтобы выполнялось условие B3) и условие
f(aob)=f(a)+f(b). B8)
Нам предстоит найти (необходимые и) достаточные условия, которые надо
наложить на систему отношений (A,R, о ), для существования функции/,
т.е. (необходимые и) достаточные условия существования гомоморфизма из
(A,R,o)b («,>,+).
По сложившейся в литературе по теории измерения традиции
показатели, которые обладают свойством аддитивности, принято называть
экстенсивными, и поэтому задача определения (необходимых и) достаточных
условий, которые требуется наложить на систему отношений (A9R, о ) для
того, чтобы существовало гомоморфное отображение этой системы в систему
отношений (<R, >, +), называется задачей экстенсивного измерения.
Теория экстенсивного измерения естественно пересекается с теорией
абстрактных алгебр, в которой часто исследуются системы вида (А, о).
Поскольку знакомство с алгебраическими теориями не считается
обязательным для чтения настоящей книги, постараемся представить читателю
необходимые сведения вкратце. Пусть о — операция, определенная на
множестве А; пара (А, о) называется группой, если приняты следующие
аксиомы1).
Аксиома G1 (ассоциативность). Для любых трех элементов а, Ь, с,
принадлежащих А, справедливо равенство (а о Ь) о с-а о (Ъ ос).
Аксиома G2 {существование единицы). В множестве А существует
элемент е такой, что для любого элемента а из А справедливы равенства
а о е = е о а = а.
Аксиома G3 (существование обратного элемента). Для каждого
элемента а из А существует (обратный) элемент Ъ такой, что a ob-b оа-е.
Читатель уже знаком со многими примерами групп. Например, группой
будет система (<R, +), в которой роль единицы, определяемой аксиомой
G2, выполняет 0, а обратный элемент в аксиоме G3, есть -а. Если й+
означает множество положительных действительных чисел, и Х- операцию
умножения, то пара (<R+, X) есть группа с 1 в роли единицы и обратным
элементом для а служит 1/я. Пара (<R, X) — не группа, так как
единственным элементом, который может служить единицей будет 1, но тогда для
элемента 0 в множестве (R не существует обратного элемента Ь, т.е. такого,
чтобы выполнялись равенства OXb =bXQ= 1.
В группе (А, о) для произвольного целого числа п можно определить
элемент па. Определим его по индукции, положив \а-а. Если уже
определен элемент па, то положим (и+ \)а = а о па. И это определение
корректно, поскольку (А, о ) - ассоциативная система.
Часто задача выяснения системы аксиом, которым удовлетворяет
заданное семейство гомоморфизмов, приводит к переносу свойств системы
чался с понятием группы, то, по-видимому, этот параграф пропустить необходимо,
хотя, может-быть, и стоит посмотреть, как далеко удастся продвинуться, если все-
таки его не пропускать.)
1) Часто приводится дополнительная аксиома - аксиома замыкания. Она
утверждает, что для любых а и Ь из А следует, что элемент а о Ь также принадлежит А; это
утверждение неявно предполагается в определении операции.
452
действительных чисел на абстрактную систему отношений. В большинстве
аксиоматизаций теории измерения стремятся выявить одно из важнейших
свойств действительных чисел - свойство Архимеда. Архимедово свойство
состоит, в следующем: для любых двух действительных чисел а и Ь, одно из
которых строго больше нуля а > О, всегда найдется положительное целое
число л такое, что па>Ъ. Это означает, что как бы не было мало число а
и каким бы большим не оказалось число Ь, если только а - положительное
число, то взяв это число достаточно много раз мы получим число, большее
чем Ъ. Именно это свойство действительных чисел и делает
измерение возможным: с его помощью мы получаем возможность
грубого сравнения по величине двух различных количеств а и Ь,
посмотрев, сколько раз потребуется взять величину а, чтобы получить
значение большее, чем Ь. И для того чтобы аксиоматизировать представление
системы (A, R,o) в систему отношений (<R,>,+), нам необходимо
перевести архимедово свойство в аксиому для системы (А, R, о ). Впервые
условия, достаточные для экстенсивного измерения, — представления системы
(A,R, о) в виде системы (<R,>, +) были выведены Гёльдером (Holder
[1901J). Мы сформулируем некоторые условия, довольно близкие к
первоначально выдвинутым Гёльдером, с помощью следующего определения.
Система отношений (A,R, о) называется архимедовой упорядоченной
группой, если она удовлетворяет следующим аксиомам:
Аксиома А1. (А, о ) есть группа.
Аксиома А2. Система (AtR) есть простой строгий порядок, т.е. полный
(в том смысле, что для любых двух неравных элементов а, ЬизА
выполняется либо aRb, либо bRa ) строгий слабый порядок.
Аксиома A3 (монотонность). Для любых а, Ь, с из A aRb тогда и только
тогда, когда а ос Rb ос, и тогда и только тогда, когда с oaRc о Ь.
Аксиома А4 {аксиома Архимеда). Если aR e, где е —единица группы, то
для любых а и Ъ из А найдется такое положительное число и, что naRb.
Парадигмой архимедовой упорядоченной группы служит система (<R,
>, +). Мы уже знаем, что система (<R, +) - группа. Система же (<R, >) есть
простой строгий порядок, потому что для всех а Ф b из (R либо а > Ь, либо
b > а. Система (<R, >, +) удовлетворяет свойству монотонности, ибо а > Ъ
тогда и только тогда, когда с + с>Нси когда с + а > с + Ь. Она
удовлетворяет и аксиоме Архимеда, поскольку при заданных а и Ь, если а > О, то
всегда найдется такое положительное целое число п, что па>Ь. Система
(<R+ , >, X ) дает нам еще один пример упорядоченной архимедовой группы.
Теорема Гёльдера состоит в следующем.
Теорема 8.3 (Holder). Всякая упорядоченная архимедова группа
гомоморфна группе (<R, >, +).
Доказательство опустим1).
Аксиомы упорядоченной архимедовой группы приводят к теореме
представления экстенсивного измерения. В этой роли они должны быть
подвергнуты проверке на различных примерах. Начнем со случая измерения массы
1) Читателю следует отметить, что любой гомоморфизм «(<R, >, +) есть в то же время
и взаимно однозначное соответствие. Это объясняется тем, что система (A,R)
удовлетворяет свойству полноты (см. аксиому А2.)
453
тела. Множество 4 — это совокупность предметов и включение aRb следует
интерпретировать как утверждение о том, что предмет а тяжелее предмета
Ь; а о Ъ - есть комбинация двух предметов а и Ь. Начнем с рассмотрения
аксиомы группы1). Ясно, что свойство ассоциативности выполняется:
комбинация из двух предметов а и Ь, пополненная третьим предметом с
приводит к тому же самому объекту (его массе), что и комбинация
предметов с и by дополненная предметом я. Более того по крайней мере в
идеале, можно считать, что существует предмет с нулевой массой, который мы
принимаем за единицу группы. Говорить же об обратных предметах
бессмысленно. Для данного объекта а соответствующая аксиома требует,
чтобы существовал другой объект Ь, который в комбинации с а давал бы
единицу группы, т.е. предмет с нулевой массой. Но такого объекта не
существует. Поэтому для получения практически применимой теоремы о
представлении для измерения массы тела необходимо модифицировать
эту аксиому.
Рассмотрим остальные аксиомы упорядоченной архимедовой группы.
Хотя мы можем столкнуться с проблемой полноты (ведь массы двух
разных предметов могут оказаться настолько близкими, что мы не сможем
различить, какая из них больше), будет достаточно разумно предположить,
что в идеале система отношений (A, R) есть простой строгий порядок.
Предположение о том, что выполняется свойство монотонности, вполне
разумно: если считать, что объект а тяжелее объекта Ь, то добавление
одного и того же объекта с к каждому из них не должно изменить
суждения о том, что тяжелее, и, аналогично, исключение из сравниваемых
комбинаций объекта с не должно повлечь изменения в оценке остатков. Более
того, ваше мнение не изменится, если добавить с к а и b (или д и b к с).
И, наконец, вполне разумно предположить справедливость аксиомы
Архимеда: если мы соберем достаточно копий объекта а, более тяжелого, чем
объект нулевой массы, то, по крайней мере в принципе, сможем создать
объект, который будет тяжелее любого другого. Аксиома Архимеда не
допускает экспериментальной проверки; ни в каком конечном опыте
не содержится достаточно данных для проверки ее справедливости.
Поэтому, принимая аксиому Архмеда, мы делаем некоторое идеализированное
допущение, которое нам кажется вполне разумным.
Рассмотрим теперь те же аксиомы применительно к вопросу об
измерении предпочтений. Множество А теперь рассматривается как совокупность
альтернатив (объектов, предъявленных на выбор) о — снова операция
комбинирования объектов, а включение aRb трактуется как
"альтернатива а (строго) предпочтительнее альтернативы Ь*\ Доводы в подтверждение
приемлемости аксиом такие же, как и в случае измерения массы тела2).
!) Для того чтобы утверждать, что система {А, о) - группа, надо,чтобы о была
операцией, в частности, надо, чтобы выражения типа а о а, а о ф о а) и т.п. имели
смысл. Мы уже упоминали, что таким комбинациям можно придать определенный
смысл, если считать, что в множестве А содержится бесконечное количество
идеальных копий каждого элемента.
2) В обосновании аксиом существенно используется предположение о том, что
комбинируемые объекты инертны, их соединение не сопровождается ни физическими,
ни химическими взаимодействиями между элементами. (Мы неявно предполагали это
454
По-видимому, аксиомы существования единицы и обращения в этом случае
вполне приемлемы. Мы можем принять в качестве идеализации
существование объекта, не имеющего никакой ценности. И если вы задолжали и
должны вернуть объект а его хозяину, то его можно рассматривать как
объект, обратный объекту а. Ибо если у нас есть объект а, но мы его
должны вернуть, то это все равно, что его нет1). Мы уже обсуждали вопрос о
приемлемости аксиомы простого строгого порядка и даже интересовались
тем, можно ли считать отношение предпочтения строгим слабым порядком;
допустимо поставить вопрос и о полноте отношения предпочтения: может
оказаться безразличным какую из двух альтернатив выбрать.
Перейдем к свойству монотонности. Даже приемлемость этой аксиомы
можно поставить под вопрос: может оказаться, что комбинированный
объект более полезен, чем набор его составных частей. Например,
предположим, что а означает черный кофе, Ъ — коробку конфет и с - сахар. Вы
можете предпочесть Ъ по сравнению с а (вы не любите черный кофе), но
в то же время а о с вы предпочитаете Ъ о с. В действительности, это — довод
против аддитивного представления, а не только против приемлемости
аксиомы монотонности. И, наконец, может вызвать сомнение и
приемлемость аксиомы Архимеда. Например, пусть а означает лампу, а Ь -долгую
жизнь без болезней. Может ли очень большое число ламп быть
предпочтительнее долгой и полноценной жизни?
Проведенные рассмотрения приводят к выводу, что даже если мы
ограничимся только измерением массы тела, то и тогда для получения теоремы
о представлении экстенсивного измерения потребуется видоизменить
систему аксиом Гёльдера. С некоторыми первыми попытками улучшить теорему
Гёльдера можно ознакомиться по работам Huntington [1902a, 1917],
Suppes [1951], [1953, 1956] и Hoffman [1963]. Во всех этих работах
не все вводимые аксиомы необходимы; впрочем, избыточность системы
аксиом имеет место и в теореме Гёльдера. Необходимые и достаточные
системы аксиом были предложены в работах Алимова [1950], Holman
[1969], Roberts, Luce [1968]. Для детального ознакомления с вопросом
рекомендуется работа Krantz et al. [1971, гл. 3] (см. также упражнения
16-22).
8.6.2. Единственность. Прежде чем закончить с темой экстенсивного
измерения, следует обсудить вопрос о единственности. Результаты
проведенных исследований по измерению массы тела приводят к
предположению о том, что представление / должно быть единственным с точностью
до преобразования подобия, т.е. измерение должно проводиться в шкале
и при обсуждении вопроса об измерении массы тела.) Если же такое взаимодействие
допускается, то в результате соединения комбинации элементов а и Ь с элементом с
может получиться объект, отличный от того, который получается соединением
элемента а с комбинацией элементов Ь и с. Например, если а - пламя, Ь - какая-либо
покрышка, с - огнестойкий материал, то результат комбинирования сначала а и Ъ, а
потом с будет радикально отличаться от результирующей комбинации Ь с с, а затем, —
с а. Однако так будет, лишь когда мы допускаем взаимодействие (например, пламя
сжигает покрышку). Можно придумать аналогичный пример с химическим
взаимодействием.
1) Это не так, если взять предмет а в долг под проценты; в этом случае обратный
элемент надо искать среди альтернатив, более дорогостоящих, чем предмет а.
455
отношений. Теперь нам предстоит доказать ,это. Соответствующий результат
будет иметь большое значение и для вопроса об измерении предпочтений.
Утверждается, что если функция / удовлетворяет условиям B3) и B8),
то высказывания о том, что полезность одной из альтернатив вдвое больше
полезности другой, или же, наоборот, вдвое меньше и т.п., оказываются
содержательными. В этом случае мы можем использовать функцию
полезности для принятия "количественных" решений, а не только
"качественных". (Иногда функцию полезности, удовлетворяющую условиям B3) и
B8), называют кардинальной функцией полезности.)
Теорема 8.4. Пусть А - непустое множество, R и о — соответственно
бинарное отношение и бинарная операция, определенные на А, и
определенная на А действительная функция f удовлетворяет условиям для всех
at be.A
aRb*=>f(a)>f(b) B3)
B8)
Тогда отображение 9J = {A, R, о ) -» ® = (<R, >, + ) дает регулярное
представление и тройка ( % , 95 , /) есть шкала отношений.
Доказательство. Для того чтобы показать, что отображение
91 -* ® дает регулярное представление, предположим, что помимо шкалы
(91 , ® ,/) есть еще одна шкала ( % , SB ,g). Определим отображение </>:
'f(A -* (R), положив ${х) = g(a), если х = f(a). Корректность такого
отображения показывается, точно так же, как и при доказательстве теоремы 8.2.
Имеем g = ip о /.
Покажем теперь, что ( 91 ,95,/) есть шкала отношений; допустим
сначала, что для некоторого числа а > 0 и для всех х, принадлежащих f(A),
выполняется sp(x) = ax. Но тогда, поскольку функция / удовлетворяет
условиям B3) и B8), то этим же условиям удовлетворяет и суперпозиция
*р о /. Обратно, предположим, что у: f(A) -»<R есть допустимое
преобразование. Нам надо показать, что ^есть преобразование подобия, т.е.
существует такое число а > 0, что равенство у{х) - qlx справедливо для всех х из
f(A). Пусть g = tpo f. Покажем сначала,что если Дд)>0, то и g(a) > 0.
Если предположить, что g(a) < 0, то g(a о а) = g(a) + g(a) < g(a), и
справедливость равенства следует из того, что функция g удовлетворяет условию
B8). Далее, поскольку функция g удовлетворяет и условию B3), то из
g(a о a)<g(a) следует ~ [а о aRa]. Но функция / тоже удовлетворяет
условию B3), и поэтому f(ao a)< f(a). Таким образом,из условия B8),
выполненного для /, имеем f(a) + Да) < f(a) и, значит, f(a) < 0. Аналогично
доказывается, что если f(a) < 0, то g(a) < 0, и если f(a) = 0, то g(a) = 0.
Если для всех а из А имеет место f(a) = 0, то для всех этих а будет и
g(a ) = 0. Но тогда для любого положительного числа а выполняется
тождество ${х) = ах при всех х из f{A). Предположим, однако, что в А
существует такой элемент е, что f(e) Ф 0, и предположим, что f(e) > 0.
Доказательство для случая /(е)<0 проводится аналогично. Поскольку f(e) > 0,
то и g(e) должно быть строго больше нуля. Найдем число а из условия
g(a) = ocf(a). И раз Де) > 0 и g{e) > 0, то а > 0. Нам надо доказать, что для
любого элемента а из множества А справедливо тождество g(d) = af(a),
456
чем будет доказано, что </?(х) = ах при всех х из f(A). Доказательство
проведем от противного. Предположим, что g(a) < af(a). Тогда
g(a)
Поскольку между двумя неравными друг другу действительными
числами всегда найдется рациональное число, то найдутся такие натуральные
числа т и и, что
af(e) e #e)
или
g(a) m
а п
Отсюда следует, что mf{e)<nf(a) и, значит, firne)<f(na) и naRme.
(Почему find) = nf(a) ?) Но тогда g(na) > g(me), и поэтому ng(a) >mg(e) =
= maf(e) и
Полученное противоречие показывает, что неравенство g(a) < ocf(a)
невозможно. Аналогично доказывается, что неравенство g{a)> <xf{d) тоже не
выполняется.
8.6.3. Замечания. Заканчивая этот параграф, отметим, что, хотя
исторически свойству аддитивности уделялось повышенное внимание, ничего
таинственного операция сложения в себе не содержит. Действительно, если
функция / удовлетворяет условиям B3) и B8), то функция g = ef
удовлетворяет условию B3) и условию
B9)
Таким образом, посредством положительной функции g может быть
получено мультипликативное представление B3) и B9). И, обратно, имея
мультипликативное представление с положительной функцией g, с
помощью преобразования /= In# приходим к аддитивному представлению
B3), B8). Мультипликативное представление изменяет тип шкалы, хотя
логарифм от такого представления приводит к такому же типу шкалы,
что и в аддитивном случае (см. упражнение 15).
Упражнения
1. Пусть А = {0,1} , R = > и операция о определена условиями
0о0 = 0, Ool = loO=lol = l.
Каким из перечисленных ниже условий удовлетворяет система (A, R, о )?
а. Ассоциативность.
б. Существование единицы.
в. Существование обратного элемента.
457
г. Простой строгий порядок.
д. Монотонность.
е. Аксиома Архимеда (Строго говоря, если множество А не содержит единицы, то
аксиома Архимеда требует модификации, а именно изменения предпосылки: "Если
а о a Ra, то ..." Если рассматриваемая система не содержит единицы, то выполняется
ли аксиома Архимеда в модифицированном варианте?)
2. Пусть Л = {1,2} , R = > и операция о определена условиями
Ю2 = 1о1 = 1, 2о1=2о2 = 2.
Повторить упражнение 1 для новой системы отношений.
3. Какая из следующих систем будет группой?
а. 0V, + ), где N множество натуральных чисел.
б. (Z, + ), где Z множество целых чисел.
в. (N,X).
г. (?, + ), где Q множество рациональных чисел.
Д. (fix).
4. Какое из бинарных отношений, перечисленных в упражнении 1 § 8.5, определяет
простой строгий порядок?
5. Для заданной системы отношений (А, о ) типа (; 1) доказать, что если f(a о Ъ) =
= /'(<*) + f(b) для всех а, ЬеА, то /(па) = nf(а) при любом аеЛ и произвольном
положительном целом числе л. (Использовать метод доказательства по индукции.)
6. Доказать, что (Л+, >, X ) - упорядоченная архимедова группа-.
7. Какая из перечисленных ниже структур (A, R, о) будет упорядоченной
архимедовой группой?
а. («,<, + ).
б. (Л, <, X ), где Я - множество отрицательных целых чисел.
в. #V, >, + ), TjifiN- множество натуральных чисел.
г. (fi >, X ), где Q - множество рациональных чисел.
Д. (&, >, X ), где Q+ - множество положительных рациональных чисел.
8. Пусть А = « X Л, R - лексикографический порядок плоскости (см. я. 8.5.4) и
результат (а, Ъ) о (с, d) применения операции о есть (а + с, Ь + d).
а. Показать, что система (Л R, о ) не группа, указав, какая из аксиом оказывается
нарушенной.
б. Показать то же, не проводя проверки справедливости аксиом.
9. Привести пример системы отношений, в которой не выполняется свойство
монотонности.
10. Пусть / - кардинальная функция полезности, т.е. функция, удовлетворяющая
условиям B3) и B8), a R — отношение предпочтения. Какое из следующих
утверждений будет содержательным?
/№
б. Полезность а больше полезности Ь.
в. Полезность а больше удвоенной полезности Ъ.
11. Пусть система (Л R, о ) гомоморфна (Я, > , + ). Доказать, что ~ [а о Ъ Rb од].
12. Какая из аксиом упорядоченной архимедовой группы дает необходимые
условия для экстенсивного измерения?
13. Имея дело с субъективными вероятностями, введенными в упражнение § 8.5,
естественно говорить об объединении двух событий. В этом случае мы хотели бы
получить функцию р, определенную на А и такую, чтобы выполнялись условия B6)
и B7) упражнения 19 и во всех тех случаях, когда апЬ = фу чтобы имело место
равенство
р(аиЬ) = р(а)+рф). C0)
(Предполагается, что все обычные свойства операций пересечения и объединения
выполнены1).) Такая функция р называется субъективной вероятностной мерой
*) Формально предполагается, что множество событий с определенными
на нем операциями взятия пересечения и объединений образует алгебру,
замкнутую относительно этих операций, а также относительно дополнений.
458
или качественной вероятностью. Будет ли сформулированное ниже условие
монотонности необходимым условием для существования такой меры р?
Условие монотонности: если аг\Ь=апс = ф, то bRc тогда и только тогда, когда
(а и b)R (аи с). Дальнейшее обсуждение субъективных вероятностей можно найти
в упражнениях 10 и 20 § 8.7.
14. Закончить доказательство теоремы 8.4, рассмотрев случай g(a) > af(a).
15. Пусть g: A-> «+ гомоморфизм из II =U,A,o) в ЯЗ = (Я*, >, X ). Доказать,
что отображение Я -> Я5 дает регулярное представление и что <р: g(A) -*- Л+ будет
допустимым преобразованием в том и только том случае, когда для некоторого
а > 0 и для всех х &g(A) имеет место *р(х) - ха.
16. Приводимые ниже необходимые и достаточные условия для экстенсивного
измерения были впервые предложены в работе Roberts, Luce [1968], где определяется
экстенсивная структура (A, R, о ).
Аксиома Е1 (слабая ассоциативность). Для всех а, Ь, с е А ~[а о(Ь о c)R(a о Ь)ос]
и ~ [(а о Ь} о cRa о ф о с)].
Аксиома Е2. (A, R) — строгий слабый порядок.
Аксиома ЕЭ - аксиома монотонности (аксиома A3).
Аксиома Е4 (модифицированная аксиома Архимеда). Для а, Ь, с, d e А, если
только aRb, то существует такое положительное целое число и, что па о cRnb о d.
Показать, что справедливость каждой из аксиом экстенсивной структуры есть
необходимое условие для экстенсивного измерения. В частности, показать, что
аксиома Е4 действительно представляет собой аксиому Архимеда в том смысле, что она
вытекает из архимедового свойства системы действительных чисел.
17. Какая из систем выписанных в упражнении 7 удовлетворяет всем аксиомам
экстенсивной структуры (упражнение 16) ?
18. Прокомментировать аксиомы экстенсивной структуры как аксиомы
измерения массы тела
19. Прокомментировать аксиомы экстенсивной структуры как аксиомы измерения
предпочтений.
20. Пусть (At R) - строгий слабый порядок, а (А, о) - ассоциативная операция
на множестве А (либо слабо ассоциативная; см. упражнение 16). Элемента
называется положительным, если 2aRa. Допустим, что каждый элемент из А положителен.
Может ли в этом случае множество А быть конечным? (Привести доказательство или
опровергающий пример.)
21. Может ли быть множество А конечным, если (A, R,o) экстенсивная структура
(упражнение 16). Если это так, то описать, как будет выглядеть структура (A, R, о ).
(Указание. Могут ли в ней быть положительные элементы, которые определены в
упражнении 20?)
22. Пусть система (A, R, о) удовлетворяет первым трем аксиомам экстенсивной
структуры (упражнение 16). (Вместо слабой ассоциативности можно предполагать
ассоциативность.) Пара элементов аиЬизА называется аномальной, если либо aRb
или bRa, либо для любого положительного целого числа п
naR(n+l)b и nbR(n + 1)а,
либо
(п + 1) bRna и (п + 1) aRnb.
Показать, что когда система (At R, о) гомоморфна (Л, >, +), то не существует
аномальных пар. (Замечание. Доказательство того, что первые три аксиомы
экстенсивной структуры вместе с предположением об отсутствии аномальных пар
представляют собой необходимые и достаточные условия для экстенсивного измерения было
дано в работе Алимова [1950].)
23. Предложение. Провести следующий эксперимент. Взять четыре простых и
разных по массе предмета. Пусть множество А состоит из взятых предметов и
предметов вида а о Ъъ где а и b - простые. Провести процедуру парных сравнений с целью
выяснения, какой из предметов тяжелее каждой из пар предметов из А. Проверить,
какие из аксиом упорядоченной архимедовой группы или экстенсивной структуры
(упражнение 16) выполняются на полученном массиве данных. Какие из них не
допускают проверки по имеющимся данным?
459
24. Обсудить теорему Гёльдера в качестве аксиоматики для измерения (а) длины,
(б) площади.
25. Обсудить систему аксиом экстенсивной структуры в качестве аксиоматики для
измерения (а) длины, (б) площади.
§ 8.7. Примеры фундаментальных измерений III:
Совместное измерение
В этом параграфе мы рассмотрим третий тип примеров
фундаментальных измерений, который несколько отличается по характеру от
рассмотренных ранее.
Очень часто для принятия решения о том, какую из альтернатив выбрать,
мы оцениваем предложенные на выбор альтернативы с разных точек
зрения. Например, при выборе автомобиля, мы учитываем его стоимость,
внешний вид, простоту в управлении, экономичность в эксплуатации и т.п.
При разработке скоростной транспортной системы мы можем учитывать
мощность двигателя, конструкцию перевозочного средства,
проектируемую полосу отвода и т.п. В таких случаях каждую альтернативу
предъявленного на выбор множества А, можно рассматривать как
^-мерный вектор я ь а г, ..., ап. Координата я,- представляет собой некоторую
меру альтернативы а по /-й размерности или признаку. Так, в примере
с выбором автомобилей ах может означать цену, а2 — оценку внешнего
вида, и т.п. В экономике координата я,- часто трактуется как количество
определенного продукта и вектор а = (alt а 2,..., 0и) - как "продуктовая
корзинка". Потребителей запрашивают о предпочтениях в выборе
возможных продуктовых наборов.
Обозначим через А% множество всевозможных значений я/ и
рассмотрим множество альтернатив А как декартово произведение
Л! ХЛ2 X .,.ХЛЛ. Множество А имеет структуру произведения.
Существует еще одна возможная интерпретация значений я/ и множеств Л,-.
Каждое из множеств А / рассматривается как множество возможных
вариантов /-го элемента создаваемой системы и элемент множества я/ —
как один из допустимых вариантов. Например, А х может быть множеством
источников энергии (двигателей), А2 — множеством вариантов
конструкций перевозочных средств, и т.п. Выбор альтернативы в этом случае состоит
в выборе представителя из каждого множества А г , например, конкретного
двигателя, конкретной конструкции кузова, и т.д.
Особую важность проблема построения структурного произведения на
неструктурированном множестве альтернатив приобретает в приложениях
теории полезности к проблемам принятия решений. Наиболее естественный
метод построения такой структуры основан на использовании принципа
иерархии. С этим методом читатель может ознакомиться по работам
Manheim, Hall [1968], Raiffa [1968,1969], Miller [1969].
Мы же с самого начала будем предполагать, что множество
альтернатив А имеет структуру произведения. Расчет полезности элементов
множества А был бы намного легче, если бы было можно рассчитать полезность
каждого варианта в отдельности и затем просуммировать полученные
полезности. Иными словами, если и: А -* (R есть ординальная функция
полезности, то хотелось бы найти такие действительно-значные функции
460
иi, и2, ..,, ип, определенные соответственно на множествах АиА^у,.., А„,
что для всех элементов а= (яь я2, ..., ап) из Л выполнялось бы
соотношение
и (а) = м^) + и2(а2) + ... + ww (я„)- C1)
Функция полезности, удовлетворяющая условию C1), называется
аддитивной.
Пусть на множестве А со структурой произведения задано бинарное
отношение R. Если интерпретировать отношение R как (строгое)
предпочтение, то надо найти такой набор действительных функций щ, определенных
на множествах Aiy что для любых элементов а = (дь а2, ..., яя) и
Ъ = (?i, Ь2,..., Ьи) из Л выполняется условие
О2)
Строго говоря, представление C2) не соответствует общей схеме теории
измерения. Здесь уже нельзя говорить о гомоморфизме одной системы
отношений в другую. Однако можно трактовать условие C2) как форму
представления измерения, точно так же, как это было сделано в двух
предыдущих параграфах, и попытаться найти (необходимые и) достаточные
условия для того, чтобы в системе (A, R) существовали функции щ9
удовле воряющие соотношению C2). Представление C2) часто называется
(аддитивным) совместным измерением, поскольку оно требует
одновременного измерения всех координат.
Для иллюстрации предположим, что я=2, Аг = А2= {0, 1},и отношение
этого предпочтения порождает следующую ранжировку:
A,1) A,0) @,1) @,0).
Предположим также, что существует ординальная функция полезности,
которая принимает значения
иA,1) = 3, иA,0) = 2, 11@,1)= 1, fi@,0) = 0.
Более того, мы можем получить и совместное аддитивное
представление C2). Выберем
Hi(l) = 2, «i@) = 2, и2A)=1 и и2@) = 0.
Тогда
и, таким образом,
Если мы используем те же множества Ах нА2, когда элемент @,1) строго
предпочтительнее, чем @, 0), а элемент A, 0) - чем элемент A, 1), то
совместное представление не существует. Если допустить его
существование, то из @, 1) R @, 0) следует, что
461
откуда
@ > @),
и, значит,
что влечет противоречие, а именно A,1) Я A,0).
Потенциально возможны приложения модели совместного измерения не
только в теории полезности, но и в других областях. Так, например, изучая
силу реакции, психологи часто учитывают два фактора: раздражитель и
мотивацию. Иногда желательно измерить силу реакции сразу по обоим
этим факторам. Точнее, пусть R означает бинарное отношение "реакция
сильнее, чем", a d и к - соответственно мотивацию и раздражитель, и
нужно найти такие функции 5 и к, чтобы для всех пар элементов dx md2
из множества мотиваций Ах и элементов ки к2 из множества
раздражителей Л 2 выполнялось бы соотношение
(<*ь kx)R{d2t к2) ~ «(</,) + *(*!) > 8(d2) + K(k2). C3)
Аналогичные модели возникают при изучении восприятия громкости
стереофонического звучания, когда на каждое ухо испытуемого поступает
два звуковых сигнала различной интенсивности, и психологов интересует
совместный эффект звучания, Пусть R — отношение "быть громче, чем",
/ - первый компонент, измеряющий интенсивность звука, слышимого
левым ухом, г - второй компонент, измеряющий интенсивность звука,
слышимого правым ухом; требуется найти функции ? и (R такие, что для
всех пар элементов /ь 1г из множества Аг и элементов гь г2 из
множества А2 выполнялось бы соотношение
/а, г,) <=> JCOO + ftto) > JC(/a) + «(ra). C4)
Представление совместного измерения возникает также в теории
определения интеллектуальных способностей. Пусть А х - множество тестируемых
субъектов, А2 -множество вопросов в тесте. Включение (sb t,x)R (s2, t2)
содержательно интерпретируется так: субъект st набирает больше баллов
по вопросу tl9 чем субъект s2 — по вопросу t2% Кажется привлекательным
предположить независимость субъектов и вопросов и допустить, что
значение оценки субъекта зависит только от его способностей и от трудности
вопросов, а не от того, насколько сложным кажется вопрос конкретному
индивидууму. В этом случае функции а и 5, отражающие способности
субъекта и трудность вопроса, должны были быть такими, чтобы для всех
пар элементов Si,s2^-4iH элементов tiyt2^A2 выполнялось
соотношение
C5)
Изучим специальный случай представления совместного измерения,
когда п = 2, т.е, представление вида
C6)
Достаточные условия существования у системы (A, R) представления
совместного измерения впервые были получены в работе Deb геи [1960],
462
причем некоторые из этих условий носили топологический характер.
Соответствующая теорема алгебраического типа, сформулированная в духе
теорем, приведенных в двух предыдущих параграфах, была доказана
Luce, Tukey [1964]. Уточненные условия можно найти в работе
Krantz et al. [1971, гл. 6]; они приводятся в упражнениях. Ограничимся
рассмотрением лишь конечных множеств Ai% В таком случае найденные
условия будут не только достаточными, но и необходимыми. Выводом
этих условий мы обязаны Скотту (Scott [1964]).
Условия Скотта удобно сформулировать в терминах бинарного
отношения 5, которое определяется на множестве А следующим образом:
aSb <=> ~ bRa.
Если R есть отношение строгого' предпочтения, то отношение S
оказывается слабым порядком, потому что aSb тогда и только тогда, когда мы
считаем, что альтернатива а по крайней мере не хуже альтернативы Ь.
Первое условие Скотта заключается в следующем.
Аксиома S1. Для всех аиЪ\ ъъАх иа2,Ь2 из А 2 имеет место либо
(alfa2)S(bub2)9 либо (blf b2)S(alt a2).
Это условие со всей очевидностью следует из представления C6). (Почему?)
Второе условие Скотта состоит в следующем,
Аксиома S2. Пусть элементы xo,xlt ..., х„_1 принадлежат
множеству А!, а элементы yOf у*,..., уп_ г - множеству А2; пусть, далее, я и а две
перестановки *) из множества {0, 1, ..., п— 1}. Тогда, если для любого
/ = 1, 2 и-1 имеет место (xif yt) S (*я(,), Уа(г) )» т0 выполняется
(*тг(о)> Уо(о) ) s (*о, ^о).
Для иллюстрации этой аксиомы рассмотрим множества Ах = А2 ={0,1},
считая п = 2 и х0 = 1, хх = 0, у0 = 0, ух = 1. Пусть тг -
тождественная перестановка, которая переводит 0 в 0 и 1 в 1. И пусть
перестановка о переводит 0 в 1, а 1 - в 0. Аксиома S2 утверждает, что если
(xuyi)S (*ЯA), .ya(i)), то (хя@), уа@) )S (хо,уо). Таким образом,
если (xi,yx)S (xlfy0)t то (^0,^1)^(^0,^0). Для нашего примера это
означает, что если @, 1) 5 @, 0), то A, 1) S A, 0). Если это условие
(с которым мы сталкивались и ранее) оказывается нарушенным, то функ*
ций Mi и и2, удовлетворяющих условию C6), не существует.
Для того чтобы показать, что аксиома S2 вытекает из представления C6),
отметим, что поскольку я и а есть перестановки, то
и-1 п- 1 и-1
1=0 1=0 1=0
w-1 и-1 и-1
= 2 w1(x7r@)+ 2 u2(ya(i))= X
1 = 0 / = о / = о
]) Читатель, конечно, помнит, что перестановка — это взаимно однозначное
соответствие множества самому себе, что равносильно перенумерации элементов или их
переупорядочению.
463
ибо в предпоследнем выражении каждое значение jc/ и yi встречается один
и только один раз. Заметим также, что если для любого / = 1, 2, ..., и—1
выполняется (xf, yf) S (*„(/), Ja(l) ), то
п - 1 п - 1
/ = 1 / = 1
Таким образом,
и отсюда
(*тг(О)>
Теорема 8.5 (Scott). Пусть Ах иА2 — конечные множества и R -
бинарное отношение, определенное на А = Ах ХА2. Необходимые и достаточные
условия существования таких функций их: Ах ->йим2: Л 2 ~*<R, что для
всех аиЬл GAX и всех а2,Ь2 €А2 выполняется условие
(al,a2)R(b1, Ъ2) *=*
C6)
состоят в том, что должны выполняться аксиомы S 1 и S2. Если
существуют еще две функции и[ и и2, удовлетворяющие условию C6), то
найдутся такие действительные числа a, j3 и у, причем а > 0, что 2)
и\ = QiU\ +0, и2 - аи2 + 7-
Опустим доказательство достаточности условий теоремы 8.1 (это
доказательство основывается на нетривиальном использовании известной теоремы
о разделяющей гиперплоскости). Кажется вполне разумным принять
аксиому S1 для измерения предпочтений и полезностей. Аксиома S2 тоже
кажется разумной, но она не допускает полноценной эмпирической
проверки. В действительности, аксиома S2 - это целое семейство аксиом: для
каждого п - своя аксиома 2).
Несмотря на то, что аксиомы Скотта не допускают полной проверки,
само аддитивное представление может быть проверено непосредственно.
В одном из таких способов проверки используется программа для ЭВМ,
"подбирающая" наилучшее аддитивное представление, а затем применяется
метод статистических испытаний с целью удостовериться
соответствуют ли имеющиеся данные выбранному представлению. Применение
этой процедуры для анализа громкости стереофонического звучания
!) Так, в частности, будет в тех случаях, когда Uf - регулярные интервальные
шкалы, но допустимые преобразования для и1 и и7 нельзя проводить независимо
друг от друга.
2) Мы не можем обойтись конечным числом аксиом (до некоторого конечного
значения и), поскольку элементы */ и v/ не обязаны быть различными; например,
х0, *,, ..., xn_i могут оказаться различными обозначениями одного и того же
элемента.
464
(Levelt, Riemersma, Buht [1972]) позволило обнаружить, что аддитивное
представление очень хорошо согласуется с имеющимся набором данных.
Другой подход к проверке модели совместного измерения на
адекватность конкретной ситуации состоит в проверке разнообразных
необходимых условий, которые вытекают как следствие принятой модели. Если эти
условия оказываются нарушенными, то, конечно, представление моделью
совместного измерения невозможно. Одно из таких необходимых условий
называется условием независимости. Говорят, что система (A,R) =
= (Л ! ХА2, R) удовлетворяет условию независимости, если всякий раз,
когда (а, х) R (Ь, х) для любого у выполняется (а, у) R (Ь,у) и всякий
-раз, когда (а,х) R (а,у), то для любого Ъ выполняется (b,x) R (Ь,у).
Эта аксиома кажется вполне подходящей для измерения предпочтений для
полезностей. Например, аксиома утверждает, что если альтернатива
A0 000 доллар, 1 дом) предпочитается альтернативе A0 000 долларов,
0 домов), то также отдается предпочтение альтернативе A миллион
долларов, 1 дом) по сравнению с альтернативой A миллион долларов, 0 домов).
Условие независимости оказывается нарушенным, когда между
альтернативами имеется взаимодействие. Можно повторить пример, приведенный
в § 8.6: если вы не любите черный кофе, то можете предпочесть
альтернативу (нет кофе, нет сахара) альтернативе A чашка кофе, нет сахара), но не
предпочтете альтернативу (нет кофе, 1 порция сахара) альтернативе
A чашка кофе, 1 порция сахара), Также часто условие независимости
оказывается нарушенным в процедурах измерения интеллектуальных
способностей людей, Например, если субъект хорошо владеет арифметикой,
а субъект Ь - имеет хороший словарный запас, то для вопроса х по
арифметике и вопроса у по развитию речи, мы можем получить {а, х) R (b, jc), но
не согласиться с тем, что (а, у) R (Ъ9 у).
Если модель аддитивного представления совместного измерения не
согласуется с конкретной ситуацией, возможно, по причине взаимодействия
между элементами, то можно попытаться видоизменить представление.
Например, можно поискать действительные функции их и Хь
определенные на Множестве А х, и функции и2 и Х2, определенные на множестве А2,
и такие, чтобы для всех пар элементов аи Ьх из Аг и а2, Ъг из А2
выполнялось условие
(alfa2)R(blfb2) «-» щ(а1) + и2(а2) + \1(а1)\2(а2) >
> Hi(*i) + i«a(fta) + M*i)Aa(fta). C7)
Слагаемое \i(ai)\2(a2) учитывает эффект взаимодействия
альтернатив. Выражение C7) называется квазиаддитивным представлением.
Другие типы представлений изучаются в рамках теории полиномиального
совместного измерения. Для ознакомления с представлениями этого типа
читателю рекомендуется работа (Krantz et al. [1971, гл, 7]).
Упражнения
1. Покупателя запрашивают о его предпочтениях в выборе из следующего набора
товаров:
а. 3 буханки хлеба, 6 дюжин яиц.
30. Ф.С. Роберте 465
б. 3 буханки хлеба, 2 дюжины яиц,
в. 1 буханка хлеба, 6 дюжин яиц,
г. 1 буханка хлеба, 2 дюжины яиц.
Пусть система предпочтений покупателя сводится к определению следующего
отношения предпочтения:
R = {(*, », (а, с), (л, </), (Ь, с), (*, <*), (с, </)}.
Найти совместное аддитивное представление для полезности.
2. Допустим, что психолог изучает две мотивации dx и 43 и два раздражителя кх
и *3. Для каждой комбинации из мотивации и раздражителя он измеряет силу
реакции. Допустим, что сравнения силы реакции приводят к следующей ранжировке:
(dXtkx) (dx,k2) (d2tkt) W,.*,).
Найти функции б и к такие, чтобы для всех /, j 9 sr t имело место соотношение
(d{, kj) приводит к более сильной реакции, чем (ds, kt) *-*
3. Сформулировать аксиому Скотта S2 для случая х9 = a, хх = Ь9 х2 - с, у0 - О,
ух * 1, ^=2, ir@) = 1, яA) = 2, *B)= 0, а@)= 0, аA) = 1, аB)« 2.
4. Пусть в упражнении 2 сравнение силы реакции приводит к следующей
ранжировке:
а. Показать, что в отличие от упражнения 2 теперь не существует функций Ь и к;
допустить их существование и прийти к противоречию.
б. Показать, какая из аксиом Скотта оказывается нарушенной.
5. В эксперименте с громкостью стереофонического звука каждый стимул (/, г)
состоит из интенсивности звука, слышимого левым ухом /, и интенсивности звука,
слышимого правым ухом г. Каждая из величин /иг может принять одно из
следующих значений: 20 дБ, 21 дБ или 22 дБ (дБ - означает децибел, единицу измерения
интенсивности звука). Пусть сравнение стимулов по уровню громкости приводит к
следующей ранжировке:
B2, 22), B2, 21)-B1, 22), B2, 20), B1, 20), B1, 21),
B0,21), B0, 22), B0, 20).
Существует ли совместное аддитивное представление?
6. Пусть Лх =Аг ={0, 1} и R - отношение, определенное на А =АХ ХАг, есть
отношение лексикографического предпочтения (см. п. 8.5.4). Какие из следующих
аксиом выполнены для отношения 04, Л)?
а. Аксиома Скотта S1.
б. Аксиома Скотта S2.
в. Аксиома независимости.
г. Аксиомы аддитивного совместного измерения.(Если они выполнены, то каковы
функции и, и(/2?)
7. Пусть функции Mj им, определяют совместное аддитивное представление C6)
ии(а19аг) =их(ах) +w2(ea). Какие из приведенных ниже высказываний оказываются
содержательными?
2L.u(alta3) >u(bltbt).
6.u(aifa2) =2и(Ьх,Ъг).
в. и(ах, а2) - константа при всех ах, принадлежащихАх>1л.аг, принадлежащихА2.
8. Пусть А=АХ ХА2, (А, Ю - строгий слабый порядок и выполнено условие
независимости. Определим на Л/ отношения Я/ следующим образом:
466
aRxb тогда и только тогда, когда существует элемент х&А2 такой, что (at х) R (Ь, *);
aR2y тогда и только тогда, когда существует элемент xGAx такой, что (a,x)R(a,y);
Какими будут отношения Rl nR2 в упражнении 2?
9. Показать, что отношения D/, /?/) из упражнения 8 определяют строгий слабый
порядок.
10. Основываясь на модели субъективных вероятностей, рассмотренной в
упражнении 19 § 8.5 и в упражнении 13 § 8.6, предположим, что существует действительная
функция р, определенная на Л и удовлетворяющая условиям B6), B7), C0). Пусть
а0, ах, ..., пп_\ иЬ0,Ьх,..., Ьл_1 - элементы множества А и для любого / = 1, 2,...
..., п - 1 имеет место 0/ЗД/, где S определено как отношение R в совместном
измерении. Показать, что если события j0, ах, ..., ап-1 попарно несовместны, события
Ьо, Ьх,..., Ъп_! тоже попарно несовместны и
а0 и ах и ...Jn_i =*>0 и Ьх и ...и Ъп__ъ
то b0Sa0. (Обобщение этого утверждения использовалось в работе Scott [1964]
для вывода необходимых и достаточных условий существования субъективной
вероятностной меры.)
11. Показать, что если система (Ах ХА2, R) отвечает аддитивной модели
совместного измерения, то она удовлетворяет также и условиям совместного
мультипликативного измерения, т.е. существуют функции vx: Ах -*•«* и v2: Аг -»«+ такие,
что для всех ах,Ьх&Ах и всех а2, ?2е А2 выполняется условие
(al9a2)R(bX9b2)<=*>vx(ax)v2(a2)>vx(bx)v2(b2).
12. Предположим, что выполняется гипотеза об ожидаемой полезности, которая
обсуждалась в п. 8.5.2. Предположим, далее, что множество исходов имеет структуру
произведения А =АХ ХА2. Пусть при фиксированном х, принадлежащем А2>\хпвх
означают элементарные события, всевозможные исходы которых имеют вид (а, х)'.
Пусть \у и в у получаются из \х и вх соответственно заменой каждого исхода (л, х)
исходом (в, у) и пусть вероятность р(а, х) равна р(а,у). Если для всех хну тА2
событие \х предпочтительнее, чем вх в том и только том случае, когда \у
предпочтительнее Ву, то говорят, что выполняется сильная независимость по первому
аргументу. (Строгая независимость по второму аргументу определяется аналогично.)
Будет ли с необходимостью выполняться условие сильной независимости по первому
аргументу, если определенная на множестве исходов функция полезности аддитивна?
13. Если принимается гипотеза об ожидаемой полезности, то следует ли из
квазиаддитивного представления уравнением C7) свойство сильной независимости по
первому аргументу (упражнение 12)? Привести доказательство или контрпример.
14. 6 упражнениях 14-18 развивается еще одна аксиоматизация теории
аддитивного совместного измерения. Пусть А =АХ ХА2. Определим отношение Е на А
следующим образом:
(xiy)E(uiv)~*~[(x,y)R(utv))H~[(uiv)R(x,y)].
(Если R есть отношение предпочтения, то Е будет соответственно отношением
безразличия: вам безразлично какую из двух альтернатив выбрать, ни одну из них Вы
не предпочитаете другой.) Мы говорим, что отношение D, R) удовлетворяет
условию ТомсеШу если для всех х,уи2изА1 и q, г, а из А 2 имеет место
(x,s)E{z,r)n (
Будет ли условие Томсона необходимым условием для возможности проведения
совместного измерения?
15. Пусть A =i4j XA2; мы говорим, что отношение 04, R) удовлетворяет
условию ограниченной разрешимости по первому аргументу, если всякий раз, когда
для любых Ху у, у из Ах iaqtrvaA2 выполняется (у, г) R Ос, q) и (х, q) R (y,r),
в А найдется такой элемент у, что (у, г) Е (х, q); определение отношения /Пдано
в упражнении 14. Ограниченная разрешимость по второму аргументу определяется
аналогично. (Смысл определения в том, что при известных предположениях мы
можем "вычислить" у.) Будет ли условие ограниченной разрешимости по каждому
из аргументов необходимым для выполнимости совместного измерения?
30* 467
16. Пусть А -ах хА^тл 04, R) есть слабый строгий порядок, удовлетворяющий
условию независимости. Будем говорить, что 1-й (/ = 1, 2) аргумент существен, если
в множестве Af найдутся такие элементы х и у, что либо xfyy, либо y#fx;
отношения Rf определены в упражнении 8. Будет ли выполнимость аксиомы о
существенности каждого аргумента необходимым условием для возможности проведения
совместного измерения?
17. Пусть А =А1 ХАг, R - бинарное отношение, определенное на А, и
отношение Е определяется так же, как в упражнении 14. Пусть р, q принадлежат А2 и а,
ах,а2,...,ап,... принадлежат A t.
(I) Предположим, что (<z,p) R (а,?).
(II) Предположим, что при любом i выполняется {а^р)Е faj+it?)*
(III) Предположим, что в множестве Ах найдется такой элемент Ь, а в
множестве А 2 - такой элемент с, что для всех / выполняется F, с) R (д, с).
Показать, что если отношение (A, R) удовлетворяет представлению выражением
C6) для совместного измерения, то последовательность ах, аг,..., ап>... конечная.
(Замечание. Последовательность элементов, удовлетворяющая условиям (I) и (II)
называется стандартной последовательностью. В стандартных последовательностях
разность между двумя последовательными элементами сохраняется постоянной.
Стандартная последовательность называется строго ограниченной, если она
удовлетворяет условию (III). Аксиома, состоящая в том, что каждая стандартная
последовательность - конечнаяi представляет собой обычную аксиому Архимеда в
аксиоматике совместного измерения.)
18. Перечисленные ниже условия определяют совместную аддитивную структуру
отношения 04, Л) на множестве Л -Ах ХА2.
Аксиома CS1. Отношение 04, R) есть слабый строгий порядок.
Аксиома CS2. Отношение 04, Я) удовлетворяет условию независимости.
Аксиома CS3. Отношение (А* Ю удовлетворяет условию Томсена (упражнение 14).
Аксиома CS4. (Аксиома Архимеда) Любая строго ограниченная
последовательность - конечная (упражнение 17).
Аксиома CS5. Отношение D, R) удовлетворяет условию ограниченной
разрешимости по каждому аргументу (упражнение 15).
Аксиома CS6. Каждый аргумент в (A,R) существен (упражнение 16).
В работе KrantzH др. [1971, гл. 6] доказана следующая теорема. Если отношение
04, R) имеет совместную аддитивную структуру, то оно удовлетворяет условиям
совместного аддитивного измерения.
а. Имеет ли отношение 04, Л), определенное в упражнении 2, совместную
аддитивную структуру?
б. Тот же вопрос относительно отношения (A, R) определенного в упражнении 6?
19. Рассмотреть аксиомы упражнения 18 как аксиомы для отношения
предпочтения.
20. Для случая субъективных вероятностей, введенных в упражнении 19, § 8.5,
упражнении 13 § 8.6 и упражнении 10, предположим, что существует субъективная
вероятностная мера (упражнение 13, § 8.6). Определим на множестве А отношение ?
условием
aEb<=*>~-aRb и ~bRa.
(Отношение Е интерпретируется как отношение "считаются равновероятными".)
Пусть ах, а2, ..., ап - последовательность элементов из Л и в множестве А
существуют элементы a, bit ct такие, что для них выполняются следующие условия:
«!»*!, ЪхЕа, Ь(П с/ = ф, Ь{Еаь
Показать, что если aR(py где ф- обозначение для пустого множества, то
элементы af должны образовывать конечную последовательность. (Как и в упражнении 17,
элементы в/ образуют строго ограниченную стандартную последовательность.)
21. Продумать другие возможные приложения для совместного аддитивного
измерения.
22. Продумать возможные приложения для совместного мультипликативного
измерения (упражнение 11).
23. Продумать возможные приложения для квазиаддитивного представления
(условие C7)).
468
§ 8.8. Полупорядки
8.8.1. Теорема Скотта—Суппеса. В §8.5 был приведен пример, когда
отношение (строгого) предпочтения оказывалось нетранзитивным. В таких
случаях, если R есть отношение предпочтения на множестве А, то не
существует гомоморфного отображения (A, R) в (<R, >). Рассмотрим вопрос
о возможности проводить измерения в таких ситуациях. (Аналогичные
соображения можно применить и к другим изученным нами
представлениям измерений.)
Если R есть отношение предпочтения, то понятию безразличия
соответствует бинарное отношение Е на множестве А, которое определяется
условиями
аЕЬ тогда и только тогда, когда ^aRbn^bRa. C8)
Таким образом, вы безразличны к выбору из а и b в том и только том
случае, когда не высказываете предпочтения к а по сравнению с b и не
предпочитаете b по сравнению с а. Допустим, что существует ординальная
функция полезности м, т.е. существует функциональное отображение и:
A ->(R, удовлетворяющее условию
aRb<=*u(a)>u(b). C9)
(По теореме 8.1 из существования ординальной функции полезности
следует, что отношение (A,R) есть отношение слабого строгого порядка.)
Если существует функция н, то
*и(а) = и(Ь). D0)
Из утверждения D0) следует, что отношение (А,Е) транзитов но,
поскольку из того, что аЕЬ и ЬЕс, следует, что и{а) = и(Ь) и и{Ь) = и{с), и поэтому
и(а) = и{с) и аЕс. Одним из первых, кто поставил под сомнение
необходимость наложения условия транзитивности на отношения безразличия,
был экономист Армстронг (Armstrong [1939,1948,1950,1951]). В работе
Menger [1951] утверждается, что такого типа возражения восходят к
Пуанкаре, т.е. к XIX в. Как один из доводов против наложения условия
транзитивности на отношение безразличия в работе Luce [1956]
приводится следующее соображение. Большинство людей предпочтет чашку
кофе с одной ложкой сахара, а не с пятью. Но если содержание сахара
в кофе будем постепенно увеличивать добавляя по 1/100 г, то можно
с уверенностью сказать, что будет наблюдаться безразличие в выборе между
двумя последовательно предъявленными чашками кофе. Если бы
отношение предпочтения было транзитивным, то должно было бы наблюдаться
безразличие в выборе между чашками кофе с одной и пятью ложками
сахара. Аналогично, если система предпочтений к состоянию воздушной
среды определяется по степени раздражения глаз, то вы, вероятно,
предпочтете воздушную среду, содержащую 0,05 частей озона на миллион,
воздушной среде, содержащей 0,5 частей на миллион. Но вы останетесь
безразличны к изменению воздушной среды в содержании озона, если
каждый раз это изменение не будет превышать 10"0 частей на миллион.
Другой по своему характеру пример состоит в следующем. Допустим,
что вы безразличны в выборе между двумя альтернативными планами
469
по снижению уровня загрязнения водных ресурсов; на выполнение
первого плана а требуется отвести бюджетные капиталовложения федеральной
организации по охране окружающей среды в размере 2 миллиарда
долларов, для выполнения плана Ь - те же 2 миллиарда долларов различным
государственным организациям. Скорее всего вы останетесь безразличными
и при выборе между планами а и Ъ\ если план b' требует вложений в 2
миллиарда и один доллар, отводимых государственным организациям. Ибо
если бы вы предпочли один из этих, столь близких по бюджету, планов
другому, то ваше предпочтение, вероятно, основывалось бы на каком-то
особом подходе к проблеме борьбы с загрязнением водных ресурсов,
когда играет роль, кто конкретно этим занимается: федеральные или
государственные органы. С другой стороны, если вы хотите, чтобы
правительство расходовало деньги на снижение уровня загрязнения водных ресурсов,
то вы определенно предпочтете план Ъ плану Ь, что приведет к нарушению
свойства транзитивности отношения безразличия.
Другие доводы против наложения требования транзитивности на
отношение безразличия и ссылки на работы по этому вопросу можно найти в
работах Fishburn [1970a] ,Krantz et al, и Roberts.
Вопрос о нетранзитивности «ртношения безразличия привел Льюса (Luce
[1956]) к необходимости слегка модифицировать требования,
обеспечивающие измеримость отношения предпочтения. Убежденный примерами
вроде первых двух, описанных выше, и психологической концепцией о
пороге восприятия, он предложил искать такую действительную
функцию м, определенную на множестве А, чтобы для всех а, Ъ €А элемент а
предпочитался элементу Ь тогда и только тогда, когда значение и(а) не
только больше значения и(Ь), но "значительно" больше, настолько, чтобы
можно было отличить а от элемента Ь. Для формализации такого
представления проблемы, зафиксируем положительное число Ь — порог или
минимально различимую разность — и поставим вопрос о том, каким
необходимым и достаточным условиям должна удовлетворять система
отношений (A, R), чтобы существовала действительная функция м,
определенная на Л и такая, чтобы для всех я, Ь € А имело место
aRb<=>u(a)>u(b). D1)
(Чтобы сформулировать эту проблему как задачу определения
соответствующего гомоморфного отображения, зададим на множестве (R бинарное
отношение >б:
и поставим вопрос о существовании гомоморфизма из (A, R) в (<R, >6).)
Если А — конечное множество, то необходимые и достаточные условия,
которым должна удовлетворять система отношений для существования
представления D1), могут быть определены явно. Однако следует
заметить, что такое представление, будучи вполне удовлетворительным для
задач типа выбора чашки кофе или для сравнения состояний воздушной
среды, не охватывает ситуаций с альтернативными бюджетами. Поскольку,
если а' — план, требующий отведения федеральному органу охраны
окружающей среды двух миллиардов и одного доллара, то вы, вероятно,
предпочтете план а' плану а, но останетесь безразличными к выбору между
470
а и Ь или между а1 и b\ Таким образом, отношением предпочтения на
множестве планов {а, а\ b, b'}будет по всей вероятности отношение
{{a, a); (b\ b)}. Но такое отношение предпочтения нельзя представить
в виде соотношения D1), поскольку, допустив противное, мы бы
получили
(Второе неравенство выполняется, так как план Ъ' не предпочитается
плану д.) Но теперь из неравенства и(а) >и(Ь) + б следует a'Rb, что
противоречит сделанному предположению.
Для изучения представления D1) в работе Luce [1956] вводится
понятие полупорядка. Приведем определение полупорядка, следуя работе
Рис. 8.3. Выполнение аксиомы по- ^ * — -у *— -ч
лупорадка 5 3 как необходимое ус- u(J} ц(с) ф) *() • Jg)
ловие л
Scott, Suppes [1958]. Будем говорить, что бинарное отношение (A, R)
представляет собой полупорядок, если для всех a, b, c,d€zA принимаются
следующие аксиомы.
Аксиома SI. ~~aRa.
Аксиома S2. (aR bucRd)=> (aRd или cR b).
Аксиома S3. (aRb nbRc)=>(aRdилиdRc).
С тем чтобы пояснить содержание аксиом и показать, что онц
согласованы с представлением D1), сначала отметим, что аксиома S1 утверждает
антирефлексивность отношения (A9R); это свойство отражает тот факт,
что значение и(а) не может быть больше u(d) + 8. Чтобы убедиться в
выполнимости аксиомы S3, предположим, что aRb и bRc. Тогда на числовой
прямой значения u(a), u(b) и и(с) расположатся так, как показано на
рис. 8.3. Значение u(d) теперь может занять одну из позиций u(dt), u(d2),
"(<*з), u(d4). Таким образом, имеем dARc, d3Rc, aRd2, aRd2. Для того
чтобы показать, что выполняется аксиома S2, рассмотрим два случая:
и(а) > и(с) и и(с) > и(а). В первом случае имеем
u(a)>u(c)>u(d) + 8
и, значит, aRd. Во втором случае
u(c)>u(a)>u(b) + 8
и поэтому cRb, Если А — конечное множество, то выполнимость аксиом
полупорядка будет и необходимым, и достаточным условием
существования представления D1).
Теорема 8,6. (Scott, Suppes). Пусть R — бинарное отношение,
определенное на конечном множестве А9 и 5 — положительное число. Тогда отношение
(A, R) будет полупорядком в том и только том случае, когда существует
такая действительная функция м, определенная на множестве А, что дли
всех а,Ь€А выполняется условие
aRb<=*u(a)>u(b) + 8. D1)
471
Доказательство теоремы, конструктивное по своему характеру, можно
найти в работах Scott, Suppes [1958], Suppes, Zinnes [1963], Rabinovitch
[1976]. Из этой теоремы вытекает следствие: если отношение (Л, R)
допускает представление в виде D1) для какого-нибудь положительного
числа Я, то оно допускает такое представление при любом положительном
числе б и, в частности, при 5 = 1 (почему?)
Рассмотрим пример. Пусть А ={1,2,3,4,5}и
R = {A,3), A,4), A,5), B,4), B,5), C,5)}. D2)
Отношение (Л,R) не есть отношение слабого строгого
порядка.Поскольку ~AЛ2), ~BR3), но AДЗ), значит, отношение (A, R) не
удовлетворяет свойству отрицательной транзитивности. Поэтому не существует
функции и, которая на множестве А удовлетворяет условию C9). Но на А
может быть определена функция и, удовлетворяющая условию D1),
потому что отношение (A, R) есть отношение полупорядка. Для того чтобы
удостовериться в этом, отметим, что аксиома полупорядка S1, очевидно,
выполнена. Проверить выполнимость аксиомы S2 несколько труднее.
В частности, поскольку IR 3 и 2R 4, то по аксиоме S2 должно следовать
1R 4 или 2R 3. В нашем случае следует IR 4, Аналогично, поскольку 3R 5
и 2R 4, то из аксиомы S2 следует, что либо 3R 4, либо 2R 5. В нашем случае
2R 5 и т.д. Иногда справедливость этой аксиомы легче проверить, опираясь
на теорию графов. Всякий раз, когда в графе отношения имеются две
независимые дуги, вроде тех, которые показаны сплошными линиями
на рис. 8.4, в нем должны присутствовать также одна или две диагональных
дуги, изображенные штриховыми стрелками. Читателю предлагается
нарисовать орграф исследуемого отношения полупорядка. Для проверки
выполнения аксиомы S3 также оказывается удобно воспользоваться теорией
графов. Всякий раз, когда в орграфе отношения имеются две дуги, вроде
показанных сплошными линиями на рис. 8.5, в нем при любой вершине d
(в том числе и при вершинах а, Ъ и с) должны существовать одна или две
пунктирные дуги, изображенные на рис. 8.5. В нашем примере видно,
что IR3 и 3R5; поэтому, используя d = 4, приходим к заключению, что
должно иметь место 1R 4 или же 4R 5. У нас выполняется \R4.B
остальном проверка проводится таким же способом.
Иногда оказывается легче найти функцию и, удовлетворяющую
условию D1), чем проверить выполнимость аксиом полупорядка для
отношения (A9R). При 5 = 1 в нашем примере такой функцией будет (см. D2))
иA)=2,6, иB)=1,8, иC)=1,5, иD) = 0,7, мE)=0.
Читателю предлагается проверить выполнимость условия D1) для этой
функции.
8.8.2. Единственность. Не существует теоремы об единственности
представления D1), характеризующей класс допустимых преобразований,
поскольку функция, удовлетворяющая условию D1), отнюдь не всегда
определяет регулярную шкалу. Чтобы проиллюстрировать это, положим
А = {1, 2, 3} и R = {A, 3), A, 2)} . Тогда при 5 = 1 существуют две
функции, для которых выполнено условие D1):
иA)=2, иB) = 0, иC)=0,
472
Не существует такой функции у: и(А) -><R, чтобы для всех а из .4
выполнялось v(a) = ((/? о и) (а). Если бы это было так, то мы бы получили
иB) =иC). Таким образом, система [(A, R)9 (R, >б), и] не определяет
представление регулярной шкалы.
8.8.3. Интервальные порядки и нечисловые измерения. Для более
глубокого понимания представления D1), рассмотрим интервал
J(a)=[u(a)-8/2, и(я) + 5/2].
Пусть / и /' — два интервала; будем говорить, что J > J1 тогда и только
тогда, когда а > Ъ для всех дб/ и & ? /'.
Если функция и удовлетворяет условию D1), то
aRb*=*J(a) >J(b). D3)
Интервал J(a) можно рассматривать как совокупность альтернатив,
почти не отличающихся от альтернативы а9 или же как альтернативы в
пределах порогового значения для а. Интервал J (а) определяет область
"размытости" вокруг значения а, или же область возможных значений.
Рис. 8.4. Графический способ проверки выполнения аксиомы S2 из определения
полупорядка
Рис. 8.5. Графический способ проверки выполнения аксиомы S3 из определения
полупорядка
(В п. 3.4.2 обсуждались оценки в денежном выражении качества
различных вин. Интервал J (а) можно понимать как область таких оценок.)
Альтернатива а предпочитается альтернативе Ь тогда и только тогда, когда
мы уверены в том, что любое из возможных значений оценки
альтернативы а будет больше, чем любое из возможных значений оценки
альтернативы Ь. Если отношение (A,R) есть отношение полупорядка, то все такие
интервалы / (а) имеют одну и ту же длину. Но представляется интересным
продумать возможность того, что они имеют различную длину.
(Несомненно, что в случае определения денежной оценки качества вин, такое
допущение вполне осмысленно.) Зададимся вопросом: при каких условиях
существует отображение, ставящее в соответствие каждому элементу aGA
интервал / (а) такой, что для всех а и Ъ из А удовлетворяется условие D3).
С более общей точки зрения, чем та, которой мы придерживались в § 8.3,
видно, что указание интервалов, удовлетворяющих соотношению D3),
такая же законная форма измерения, как и приписывание чисел,
удовлетворяющих представлению
aRb=> и(а)>иф). C9)
473
Ведь одна из целей теории измерения как раз и состоит в том, чтобы
выразить эмпирическую систему отношений с помощью хорошо известной
системы отношений на математических объектах. Если осуществить такой
перевод эмпирической системы в то, что, выражаясь несколько нестрого,
мы называем математической системой отношений, то в распоряжении
оказывается весь арсенал математических методов, посредством которых
можно углубить понимание математической системы, а следовательно, и
понимание исходного эмпирического отношения. В частности, мы можем
применить математические методы для задач принятия решений. В таком
~7т 7т
Рис. 8.6. Интервальное представление для интервального порядка D, R), где А =
{ 1, 2, 3, 4}, R = { A, 2), B, 3), A, 3)} . Для облегчения сравнения соответствующие
интервалы снесены параллельно вниз
широком смысле процедура присвоения каждой альтернативе векторного,
множественного или интервального значения будет вполне законной в
рамках теории измерения, коль скоро может быть доказана теорема о
соответствующем представлении, утверждающая существование гомоморфного
отображения эмпирической системы отношений в математическую. Такая
же точка зрения отражена в работе Krantz [1968].
Выразив, таким образом, нашу точку зрения, перейдем к формулировке
теоремы о представлении для условия D3), Бинарное отношение (A,R)
называется интервальным порядком, если оно удовлетворяет первым
двум аксиомам, определяющим полупорядок. Таким образом, каждый
полупорядок есть, вместе с тем, интервальный порядок, но совсем нетрудно
привести пример интервального порядка, который отличен от
полупорядка. Пусть А = {1, 2,3,4}; определим на А отношение R: R ={ A, 2), B,3),
A,3)} . Интервальное представление отношения (А}R), удовлетворяющее
условию D3), показано на рис. 8.6. Доказательство того, что отношение
(A,R) не удовлетворяет аксиомам полупорядка, предоставляется читателю
(упражнение 6). Приведем формулировку теоремы о представлении.
Теорема 8.7 (Fishburn [1970b, 1970c]). Пусть (A,R) есть бинарное
отношение, определенное на конечном множестве А. Тогда отношение (A, R)
будет отношением интервального порядка в том и только том случае,
когда существует отображение, ставящее в соответствие каждому
элементу а из множества А интервал / (а) так, что для всех а, Ъ € А
aRb*=>J(a) > J(b). D3)
В заключение рассмотрим отношение безразличия Е, которое
определяется по интервальному порядку (A,R) с помощью условия C8). Из
теоремы Фишберна нетрудно видеть, что
aEb<=>J(a) П/(Ь)=?ф.
Это представление для отношения безразличия нам уже встречалось
в § 3.4, где при таком соответствии интервалов пара (А, Е) была названа
интервальным графом. В п. 3.4.3 были приведены необходимые и доста-
474
точные условия, которым должно удовлетворять отношение (А9Е) для
того, чтобы существовало такое соответствие. Было также показано, что
условие D3) определяет транзитивную ориентацию графа, дополнительного
к графу (А,Е). Несложно доказать (упражнение 19), что если бинарное
отношение (A,R) определено на конечном множестве А, то оно будет
интервальным порядком в том и только том случае, если определенное
условием C8) бинарное отношение (А9Е) задает интервальный граф,
причем (A9R) есть транзитивная ориентация графа, дополнительного к
графу (А,Е).
Упражнения
1. Пусть А есть множество звуков и aRЬ имеет место тогда и только тогда, когда
звук а считается громче звука Ь . Привести доводы, аналогичные аргументации
Льюса при критике отношения предпочтения, из которых следовало бы, что на
множестве А нельзя определить действительнозначную функцию м, удовлетворяющую
условию C9).
2. Найти функцию и, заданную на множестве А и удовлетворяющую условию D1)
при 6 = 2, для бинарного отношения, определяемого условием D2).
3. Широко известный в теории полезности пример (Armstrong [ 1939 ]) заключается
в следующем. Предположим, что ребенку безразлично получить ли в подарок пони
или велосипед. Он бы несомненно предпочел велосипед со звонком, если бы звонок
был добавлен к велосипеду без звонка. Но скорее всего, он все равно остался бы
безразличен к выбору между велосипедом и пони.
а. Показать, что в этом случае отношение безразличия не будет транзитивным.
б. Добавить еще к пони уздечку и показать, что в этом случае не существует
функции и, удовлетворяющей условию D1).
в. Согласны ли вы с тем, что этот пример убедителен?
4. Пусть отношение (A,R) определяется следующим образом: А ={1,2, 3,4} и
/г = {A,4)}.
а. Используя определение, показать, что отношение (A,R) есть отношение
полупорядка.
б. Найти определенную на множестве А функцию и, которая удовлетворяла бы
условию D1).
5. Пусть А ={0, 1, 2} и R ={B,1), B, 0), A,0)}. Показать, что по определению
отношение (A,R) есть отношение полупорядка. (Замечание. Отношение (A,R) есть
также отношение слабого строгого порядка.)
6. Показать, что если А = {1, 2, 3,4} и R = { A, 2), B, 3), A,3)} , то отношение
(Л, R) есть отношение полупорядка.
7. Привести пример нерефлексивного бинарного отношения (At R) такого, чтобы
множество А содержало три элемента и отношение (A, R) не было бы полупорядком.
8. Найти функцию и, определенную на множестве А и удовлетворяющую условию
D1) и показать, что отношение (At R) - полупорядок. Здесь
А = {1,2, 3,4, 5, 6, 7),
R = { A,4), A, 5), A, 6), A, 7), B, 5), B,6), B, 7), C, 5), C,6),
C,7), D, 5), D, 6), D,7), E,7)}.
9. Индивидуум пробует пять вин и следующим образом определяет их стоимость
в долларах: вино w, стоит от 1 до 4 долларов, w2 - между 2 и 3 долларами, н'3 -
между 10 и 15, н>4 - между 5 и 6 и w6 - между 1 и 1,50 долларами. Предположив,
что выполняется условие D3), определить систему предпочтения индивидуума.
10. Пусть отношение (A, R) определено следующим образом:
Л= {1,2,3,4,5},
R = { E, 3), E,1), E, 2), D, 1), D, 2), A, 2)}.
475
Таблица 8.10
Система предпочтений на множестве легковых автомобилей
Модель / предпочитается модели / тогда и только тогда, когда в (/,/ )-й позиции
таблицы стоит 1
"Понтиак"
"Фольксваген"
"Бьюик"
"Кадиллак" "Датсун
"Понтиак"
"Фольксваген" i
"Бьюик" 1
"Кадиллак"
"Датсун"
/ °
0
1
\ °
0
0
1
0
0
0
0
0
0
0
0
0
1
0
1
0 \
0 1
0
0 /
0 /
а. Показать, что отношение (A. R} есть отношение интервального порядка.
б. Показать, что отношение (A, R) отлично от полупорядка.
в. Найти отображение в множество интервалов J(a), которое удовлетворяет
условию D3).
г. Нарисовать интервальный граф (А,Е) и показать, что (A,R) есть транзитивная
ориентация графа, дополнительного к графу (А, Е).
11. Пусть индивидуальные предпочтения определены так, как это отображено в
табл. 8.10. Существует ли функция м, определенная на множестве А такая, что
выполняется условие D1) ?
12. Доказать, убедившись в соответствии аксиоматике, что любой слабый строгий
порядок есть одновременно и полупорядок.
13. Будет ли любой полупорядок в то же время и слабым строгим порядком?
(Дать доказательство или привести контрпример.)
14. Рассмотрим следующий полупорядок: А ={0,1, 2, 3}, R ={C, 0)} . Показать
посредством отыскания двух функций ми v, которые удовлетворяли бы условию D1)
(причем было бы не верно, что при любом отображении <р: и (А) -*Я функция v
совпадает с sp ом) что при 6 = 1 представление (A, R) -+ (<R, >б) не будет регулярным.
15. Это упражнение имеет целью доказать, что теорема 8.6 неверна, если снято
условие конечности множества А. Пусть #означает множество положительных целых
чисел, и х - элемент не из N. Положим А = NU{x) и определим на Л отношение R
следующим образом: для любых элементов л, Ъ е //выполняется условие
aRb «-» д>/> + 1
и имеет место
xRa.
а. Показать, что отношение (Л, R) - полу порядок.
б. Предположив существование функции м: A -+R, удовлетворяющей условию
D1), показать, что м есть взаимно однозначное соответствие.
в. Показать, что к тому же справедливо неравенство
г. Обосновать вывод, что такой функции и не существует.
16. (Roberts [1969].) Пусть А - конечное множество и отношение (A,R)
-полупорядок. Определим на множестве А с помощью условия C8) отношение Е. Доказать,
что в множестве А не существует элемента х, для которого выполнялось бы
следующее свойство: всякий раз, когда хЕа и хЕЪ, то аЕЬ. (Указание. Воспользоваться
теоремой о представлении.)
17. (Roberts [1971].) Пусть А - конечное множество и существует представление
и: A-+R, удовлетворяющее условию D1). Определим на А отношение W условием
476
Определим на А отношение Е условием C8). Показать, что если
aWu,uWv и vWb,
то
аЕЬ**иЕЬ.
Иными словами, интервалы предпочтения не могут содержаться внутри интервалов
безразличия. Этот результат назван (Goodman [1951 ]) правилом слабого
отображения.
18. Используя предположения упражнения 17 § 8.7, допустим что вместо
представления совместного измерения, определяемого условием C6), принимается
следующее представление:
где б — некоторая положительная константа. Будет ли вывод о том, что
последовательность а19а2,... ,а„,... конечна, все еще справедливым? Объеснить ответ.
19. Доказать, что если (Af R) есть бинарное отношение, определенное на конечном
множестве А, то оно будет интервальным порядком в том и только в том случае, если
бинарное отношение (А,Е), определяемое условием C8), задает интервальный граф,
а отношение (A,R) - транзитивную ориентацию графа, дополнительного к графу
(А,Е).
20. Используя данные упражнения 26 § 8.5, выяснить, определяют ли они полу
порядок или же интервальный порядок; в зависимости от результата найти
соответствующее отображение в множество действительных чисел или в множество
интервалов числовой прямой.
21. Порог слуха есть функция от интенсивности звука. Если такого же типа
зависимость справедлива и для отношения предпочтения, то как надо видоизменить
представление полупорядка, чтобы учесть эту зависимость? Можно ли доказать какие-
нибудь теоремы о таком представлении? (См. Roberts [ 1971 ], Krantz et al.)
22. Переформулировать обсуждение представления экологической ниши
пространства, проведенное в п. 3.6.1, в терминах измерения, не использующего числовые
оценки.
23. Считать ли полезной идею нечислового измерения? Можно ли придумать
возможные области ее приложения?
24. Провести критический анализ аргументации Льюса в примере со сладким кофе.
СПИСОК ЛИТЕРАТУРЫ
К введению
Dan nig G.B. Linear Programming and Extensions, Princeton Univ. Press, Princeton, N.J.,
1963. {Данциг Дж. Линейное программирование, его применения и обобщения:
Пер. с англ. - М.: Прогресс, 1966. - 600 с.)
DwassM. Probability Theory and Applications, W.A. Benjamin, New York, 1969.
Feller W. An Introduction to Probability Theory and its Applications, John Wiley & Sons., Inc.,
New York, 1950,1957,1968. (Феллер В. Введение в теорию вероятностей и ее
приложения. Т.1,2: Пер. с англ.. - М.: Мир, 1984. - T.I.-527 с, т. 2-751 с.
Goldberg S. Probability: An Introduction, Prentice-Hall, Inc, Englewood Cliffs, N.J., 1960.
Hillier F.S. and Lieberman GJ. Introduction to Operations Research, Holden-Day, Inc.
San Francisco, 1967,1974.
Luce R.D. and Raiffa H. Games and Decisions, John Wiley & Sons, Inc., New York, 1957.
(Лыос Р., Райфа X. Игры и решения: Пер. с англ. - М.: Изд-во инострлит., 1961.—
642 с.)
Owen G. Game Theory, W.B. Saunders, Philadelphis, 1968. (Оуэн Г. Теория игр: Пер. с
англ. -М.: Мир, 1971. - 230 с.)
Parzen Е. Modern Probability Theory and its Applications, John Wiley & Sons Inc.,
New York, 1960.
Polya G. Induction and Analogy in Mathematics, Vol. I, Princeton Univ. Press, Princeton,
N.J., 1954. (ПойяД. Индукция и аналогия в математике. - В кн.: Математика
и правдоподобные рассуждения: Пер. с англ. - М.: Наука, 1975, с. 25-224)
Rapoport A. Two-Person Game Theory: The Essential Ideas, Univ. of Michigan Press, Ann
Arbor, Mich., 1966.
Spivey W.A. and Thrall R.M. Linear Optimization, Holt, Rinehart & Winston, Inc. New
York, 1970.
Wagner H.M. Principles of Operations Research with Applications to Managerial Decisions,
Prentice-Hall, Inc., Englewood Cliffs, N., 1969.
К главе 1
Carnap Я Foundations of Logic and Mathematics* in International Encyclopedia of Unified
Science, VoL 1, No. 3, Univ. of Chicago Press, Chicago, 1939,1947.
Carnap R. Logical Foundations of Probability, Univ. of Chicago Press, Chicago, 1950.
Cohen M.R. and Nagel E. An Introduction to Logic and Scientific Method Harcourt, Brace
& Co., New York, 1934.
Freudenthal H. (ed.). The Concept and the Role of the Model in Mathematics and Natural
and Social Sciences, Gordon and Breach, New York, 1961.
Hempel C.G. Fundamentals of Concept Formation in Empirical Science, in International
Encyclopedia of Unified Science, Vol. 2, No. 7, Univ. of Chicago Press, Chicago, 1952.
Hempel C. G, On the Nature of Mathematical Truth, in Readings in the Philosophy ofScien-
. ce. H. Feigl and M. Brodbeck (eds), Appleton-Century-Crofts, New York, 1953.
Hume D. An Enquiry Concerning Human Understanding, Open Court, La Safle, III., 1946.
Kemeny J.G. A Philosopher Looks at Science, D. Van Nostrand Co., Inc. Princeton, N.J.,
1959.
Kemeny J.G. and Snett J.L Mathematical Models in the Social Sciences, Blaisdell Publishing
Co., Waltham,Mass., 1962;reprinted by M.I.T. Press, Cambridge, Mass, 1972. (КемениДж.,
Снелл Дж. Кибернетическое моделирование: Некоторые приложения: Пер. с англ. -
М.: Сов. Радио, 1972, - 192 с.)
478
Madden E.H. The Structure of Scientific Thought, Houghton Mifflin Company, Boston, 1960.
Maki D.P and Thompson M. Mathematical Models and Applications, Prentice-Hall, Inc.,
Englewood Cliffs, N.J., 1973.
Reichenbach H. On the Justification of Induction, in Readings in Philosophical Analysis,
H. Feigl and W. Sellars (eds), Appleton-Century-Crofts, New York, 1949.
Robbins HE. A Theorem on Graphs, with an Application to a Problem of Traffic Control.
Amer. Math. Monthly, 46 A939), 281-283.
Whitehead A.H. The Abstract Nature of Mathematics, in Readings in the Philosophy of
Science, P.P. Wiener (ed.), Charles Scribner's Sons, New York, 1953.
Wilder R.L. Introduction to the Foundations of Mathematics, John Wiley & Sons, Inc., New
York, 1952.
К главе 2
Berge С. The Theory of Graphs and its Applications, Methuen, London, 1962. (Берж К
Теория графов и ее применения: Пер. с фр. - М.: Изд. иностр. лит., 1962. - 319 с.)
Cayley A.L. On the Theory of Analytical Forms Called Trees, Phflos. Mag., 13 A857),
19-30; reprinted in Mathematical Papers, Cambridge, 3 A891), 242-246.
Cayley A.L. On the Mathematical Theory of Isomers, Philosophical Mag., 67 A874),
444-446; reprinted in Mathematical Papers, Cambridge, 9 A895), 202-204.
Eider L. Sotutio Problematis ad Geometriam Situs Pertinentis, Comment. Academiae Sci. 1.
Petropolitanae, 8A736), 128-140; reprinted in Opera Orhnia, Series 1-7A766),
1-10.
Euler L. The Kbnigsberg Bridges. Sci Amer., 189 A953), 66-70. (A translation of the
previous article).
Horary F Graph Theory, Addison-Wesley Publishing Co., Inc., Reading, Mass., 1969.
{Харари Ф. Теория графов: Пер. с англ. - М.: Мир, 1973. - 300 с.
Harary F., Norman R.Z., and Cartwright D. Structural Models: An Introduction to the
Theory of Directed Graphs, John Wiley & Sons, Inc., New York, 1965.
Hutchinson G. Evaluation of Polymer Sequence Fragment Data using Graph Theory, Bull.
Math. Biophysics, 31 A969), 541-562.
Hutchinson J.P., and Wilf, H.S. On Eulerian Circuits and Words with Prescribed Adjacency
Patterns, J. Comb. Th, (A), 18 A975), 80-87.
Kemeny J.G., and Snell J.L. Mathematical Models in the Social Sciences, Blaisdell Publishing
Co., New York, 1962. Reprinted by M.I.T. Press, Cambridge, Mass., 1972.
Kirchhoff G. Uber die Auflbsung der Gleichungen, auf Welche man bei der Untersuchung der
Linearen Verteilung Galvanicsher Strbme Gefuhrt Wird, Ann. Phys. Chem., 72 A847),
497-508.
Konig D. Theorie des Endlichen und Unendlichen Graphen, Akademische Verlagsgesel-
lschaft M.B.H., Leipzig, 1936; reprinted by Chelsea, New York, 1950.
Luce R.D. and Perry A.D. A Method of Matrix Analysis of Group Structure, Psychometrika,
14 A949), 95-116.
Parthasarathy K.R. Enumeration of Paths in Diagraphs, Psychometrika, 29, A964), 153-165.
Ross I.C. and Harary F. On the Determination of Redundancies in Sociometric Choices,
Psychometrika, 17 A952), 195-208.
Ross I.C. and Harary F A Description of Strengthening and Weakening Members of a Group.
Sociometry, 22 A959), 139-147.
Tucker A. and Bodin L A Model for Municipal Street Sweeping Operations, in СUPM Applied
Mathematics Modules Project, Berkeley, California, 1975.
К главе З
Abett P. and Jenkins R. Perception of the Structural Balance of Part of the International
System of Nations, J. of Peace Res., 4 A967), 76-82.
Aho A., Hopcroft У. and Ullman J. The Design and Analysis in Computer Algorithms,
Addison-Wesley Publishing Co., Inc., Reading, Mass, 1974. (Ахо А., Хопкрофт Дж.,
Уллман Дж. Построение и анализ вычислительных алгоритмов: Пер. с англ. - М.:
Мир, 1979.-576 с.)
479
Axelrod R.M. Framework for a General Theory of Cognition and Choice Institute of
International Studies, Univ. of California, Berkeley, Research Series, No. 18,1972.
Axelrod ЯМ. Schema Theory: An Information Processing Model of Perception and Cognition,
Amer. Pol. Sci. Rev., 4 A973), 1248-1266.
Beltrami E. and Bodin L. Networks and Vehicle Routing for Municipal Waste Collection,
Networks, 4 A973), 65-94.
Benzer S. On the Topology of the Genetic Fine Structure. Proc. Nat. Acad. Sci. USA, 45
A959), 1607-1620.
Benzer S. The Fine Structure of the Gene, Sci. Amer., 206 A962), 70-84.
Berge С The Theory of Graphs and its Applications, Methuen, London, 1962. (БержК.
Теория графов и ее применения: Пер. с фр. - М.: Изд. иностр. лит., 1962. - 319 с.)
Berge С. Some Classes of Perfect Graphs, in Graph Theory and Theoretical Physics, F. Harary
(ed.), Academic Press, Inc., New York, 1967.
Berge C. Graphs and Hypergraphs, American Elsevier Publishing Co., New York, 1973 (transl.
from the French edition by E. Minieka).
Bonham M., and Shapiro M. Explanation of the Unexpected: the Syrian Intervention in
Jordan in 1970, in The Structure of Decision, R.M. Axelrod (ed.), Princeton University Press,
Princeton, N.J., to appear.
Booth K.S. and Lueker G.S. Linear Algorithms to Recognize Interval Graphs and Test for the
Consecutive Ones Property, Proceedings of the Seventh Annual ACM Symposium on
Theory of Computing, May 1975, 255-265.
Brooks R.L On Coloring the Nodes of a Network, Proc. Cambridge Philos. Soc., 37 A941),
194-197.
Burnett R.W., Fisher H.I., and Zim H.S. Zoology: An Introduction to the Animal Kingdom,
Golden Press, New York, 1958.
Camion P. Chemie et circuits hamiltoniens des graphes complets, C.R. Acad. Sci. Paris, 249
A959), 2151-2152.
Cartwright D. and Harary F. Structural Balance: A Generalization of Heider's Theory, Psych.
Rev., 63 A956), 277-293.
Coombs CM. and Smith J.E.K. On the Detection of Structure in Attitudes and
Developmental Processes, Psych. Rev., 80 A973), 337-351.
Danzer L. and Grunbaum B. Intersection Properties of Boxes in /?d, IVlimeographed,
Department of Mathematics, Univ. of Washington, Seattle, August, 1967.
Davis J.A. Clustering and Structural Balance in Graphs, Human Relations, 20,1967,181-187.
Dirac G.A. On Rigid Circuit Graphs, Abhandlungen Mathematischen Seminar Universitat
Hamburg, 25 A961),*71-76.
Doreian P. Unteraction under Conditions of Crisis: Applications of Graph Theory to
International Relations, Peace Res. Soc. (International) Papers, 11 A69), 89-107.
Dowly A. Conflict in War Potential Politics, Peace Res. Soc. (International) Papers, 13 A970),
85-105.
Fisher J. Reprieve for the Wolf, National Wildlife, 13 A975), 5-10.
Foulkes J.D. Directed Graphs and Assembly Schedules, Proc. Symp. Appl. Math. Amer. Math.
Soc, 10A960X281-289.
FUlkerson ДЛ, and Gross O.A. Incidence Matrices and Interval Graphs, Pacific J. of Math.,
15A965), 835-855.
Gabai H. JV-dimensional Interval Graphs, Mimeographed, Yokr College, C.U.N.Y., New York,
1974.
Gattai T. Transitiv Orientierbare Graphen, Acta Math. Acad. Sci. Hungar., 18, A967), 25-66.
Ghoulia-Houri A. Caracterisation des graphes nonorientes dont on peut orienter les^etes de
maniere a obtenir le graphe d'une relation d'ordre, C.R. Acad. Sci, Paris, 254 A962),
1370-1371.
Gilmore P.C. and Hoffman A.J. A Characterization of Comparability Graphs and of Interval
Graphs, Canadian J. Math. 16 A964), 539-548.
Gohimbic M.C. Comparability Graphs and a New Matroid, Ph. D. Thesis, Columbia University,
1975 (To appear in J. Comb. Theory).
Hadwiger H., Debrunner H. and Klee V. Combinatorial Geometry in the Plane, Holt, Rine-
hardt & Winston, Inc., New York, 1964.
Hajnal A.t and Surdnyi J. Uber die Auflosung von Graphen in Vollstandige Teilgraphen, Ann.
Univ. Sc. Budapestinensis, 1 A958), 113-121.
480
Harary F On the Notion of Balance of a Signed Graph, Michigan Math. J., 2 A954),
143-146.
Harary F Status and Contrastatus, Sociometry, 22 A959), 23-43.
Harary F A Structural Analysis of the Situation in the Middle East in 1956, J. of Conflict
Resolution, 5 A961), 167-178, a.
Harary F Who Eats Whom, General Systems, 6 A961), 41-44b.
Harary F A Graph Theoretic Approach to Similarity Relations, Psychometrika, 29 A964),
143-151.
Harary F Graph Iheory, Addison-Wesley Publishing Co., Inc., Reading Mass, 1969. (Xapa-
pu Ф. Теория графов: Пер. с англ. - М.: Мир, 1973 - 300 с.
Harary F, Norman R.Z. and Cartwright D. Structural Models: An Introduction to the Iheory
of Directed Graphs, John Wiley & Sons, Inc. New York, 1965.
Hart J. Structures of Influence and Cooperation-Conflict, International Interactions 1 A974),
141-162, a.
Hart J. Symmetry and Polarization in the European International System, 1870-79:
A Methodological Study. J. of Peace Recears, 11 A974), 229-244, b.
Healy В., and Stein A. The Balance of Power in Internation History, J. of Conflict ResoL,
17 A973), 33-61.
HeiderF Attitudes and Cognitive Organization, J. of Phych. 21 A946), 107-112.
Held M., and Karp R. The Travelling Salesman Problem and Minimum Spanning Trees, Oper.
Res., 18A970), 1158-1162.
Hopcroft J. and Tarjan R. Efficient Algorithm* for Graph Manipulation, Communications
of the ACM, 16 A973), 372-378.
Johnson SM. Optimal Two- and Three-Stage Production Schedules with Setup Times
Included. Naval Res. Logistics Quart, 1 A954), 61-68.(В кн.: Календарное планирование:
Пер. с англ. - М.: Прогресс, 1966, с. 33-41).
Karp R.M. Reducibility Among Combinatorial Problems, in Complexity of Computer
Computations, R.E. Miller and J.W. Thatcher (eds.), Plenum Press, New York, 1972. (KapnPM
Сводимость комбинаторных задач. — Кибернетический сборник (новая серия).
Вып. 12. - М.: Мир, 1975, с. 16-38).
Кетепу J.G. and Snell J.L. Mathematical Models in the Social Sciences. Blaisdefl Publishing
Co., New York, 1962, reprinted by M.I.T. Press, Cambridge, Mass, 1972. {КемениДж.,
СнеллДж. Кибернетическое моделирование: Некоторые приложения: Пер. с англ. -
М.: Сов. Радио, 1972. - 192 с.)
Kendall D.G. A Statistical Approach to Flinders Petrie's Sequence Dating, BulL Intern.
Statist. Inst., 40 A963), 657-680.
Kendall D. G. Incidence Matrices, Interval Graphs, and Seriation in Archaeology, Pacific J.
of Math. 28 A969), 565-570, a.
Kendall D.G. Some Problems and Methods in Statistical Archaeology, World Archaeology,
1A96 9), 61-76, b.
Kendall M.G. and Smith B.B. On the Method of Paired Comparisons, Biometrika, 31 A940),
324-345.
Klee V.L. What is the Maximum Length of a tf-dimensional Snake, Amer. Math. Monthly,
77 A970), 63-65.
Konig D. Theorie des Endlichen und Unendlkhen Graphen, Akademische Verlagsgesellschaft
M.B.H., Leipzig, 1936; reprinted, Chelsea, New York, 1950.
Krantz D.H., Luce R.D., Suppes P. and Tversky A. Foundations of Measurement, Vol. 1,
Academic Press Inc., New York, 1971.
Kuratowski K. Sur le Probleme des Courbes Gauches en Topologie, Fund. Math., 15 A930),
271-283.
Landau H.G. On Dominance Relations and the Structure of Animal Societies: III. The Condi-
tion for a Score Structure, BulL Math. Biophys., 15 A955), 143-148.
Lekkerkerker C.B. and Boland J. Ch. Representation of a Finite Graph by a Set of Intervals
on the Real Line. Fund. Math. 51 A962), 45-64.
Lin S., Computer Solutions of the Travelling Salesman Problem, Bell Sys. Tech. J., 44 A965),
2245-2269.
Liu C.L. Topics in Combinatorial Mathematics, Mathematical Association of America,
Washington D.C., 1972.
31. Ф.С. Роберте 481
Lovasz L Normal Hypergiaphs and the Perfect Graph Conjecture, Discrete Math., 2 A972),
253-267.
MarczewskiE. Sur deux Propriltls des Classes d'ensembles, Fund. Math., 33,A945),
303-307.
Moon J. Topics on Tournaments, Holt, Rinehart & Winston, Inc., New York, 1968.
Morissette J.O. An Experimental Study of the Theory of Structural Balance, Human
Relations, 11A958), 239-254.
Norman R.Z. and Roberts F.S. A Derivation of a Measure of Relative Balance for Social
Structures and a Characterization of Extensive Ratio Systems, J. Math. PsychoL, 9 A972),
66-91, a.
Norman R.Z. and Roberts F.S. A Measure of Relative Balance for Social Structures, in
Sociological Theories in Progress, II, J. Berger, M. Zelditch, and B. Anderson (eds), Houghton-
MifflinCompany, New York, 1972, pp. 358-391, b.
Ogden W.F. and Roberts F.S. Intersection Graphs of Families of Convex Sets with
Distinguished Points, in Combinatorial Structures and Their Applications, R. Guy, H. Ha-
nani, N. Sauer, and J. Schonheim (eds.) Gordon and Breach, New York, 1970.
p. 311 -313.
Ore O. The 1 our-Color Problem, Academic Press, Inc., New York, 1967.
Petrie WMF. Sequences in Prehistoric Remains, J. Anthrop. Int., N.S., 29 A899), 295-301.
Petrie W.M.F. Diospolis Parra, Egypt Exploration Eund, London, 1901.
Petrie W.M.F. Prehistoric Egypt, British School of Archaeology in Egypt, London, 1920.
Petrie W.M.F. Prehistoric Egypt Corpus, British School of Archaeology in Egypt, London,
1921.
Pnueli A., Lempel A., and Even S. Transitive Orientation of Graphs and Identification of
^Permutation Graphs, Can. J. Math., 23 A971), 160-175.
Redei L. Ein Kombinatoriseher Satz. Acta Litterarum ac Scientiarum (Sectio Scientiarum
Mathcmaticarum). Szeged, 7 A934), 39-43.
Robbins H.E. A Theorem on Graphs, with an Application to a Problem of Traffic Control,
Amer. Math. Monthly. 46 A939), 281-283.
Roberts F.S. Indifference Graphs, in Proof Techniques in Graph Theory, I. На гагу (ed.),
Academic Press, Inc., New York, 1969, pp. 139-146, a.
Roberts F.S. On the Boxicity and Cubicity of a Graph, in Recent Progress in Combinatorics,
W.T. Tuttc (ed.), Academic Press, Inc., New York, 1969, pp. 301-310, b.
Roberts F.S. On Nontransitive Indifference, J. Math. PsychoL, 7 A970), 243-25&.
RyserH. Combinatorial Configurations, SI AM J. Appl. Math. 17 A969), 593-602.
Sherwin R.G. The Notion of Structural Balance and the International System, unpublished
manuscript. World Event Interaction Survey, Support Study No. 6, Univ. of Southern
Califirnia, Los Angeles, Jan. 1972.
Stoffers K.E. Scheduling of Traffic Lights - a New Approach, Transportation Research,
2A968), 199-234.
Szckercs G. and Wilf U.S. An Inequality for the Chromatic Number of a Graph. J. Comb.
Theory, 4 A968), 1-3.
Tar/an R. Depth-first Search and Linear Graph Algorithms, S1AM J. on Computing 1 A972),
146-160.
Tarjan R. A Note on 1 inding the Bridges of a Graph, Inf. Processing Letters, 2A974),
160-161.
Taylor H.F. Balance in Small Groups, Van Nostrand Reinholm Company, New York, 1970.
Tucker A.C. Characterizing Circular-arc Graphs, Bull. Amcr. Math. Soc, 75 A970),
1257-1260, a.
Tucker A.C. Characterizing the Consecutive Ts Property, in Proceedings of the Second
Chapel Hill Conference on Combinatorial Mathematics and its Applications, R.C. Bose,
EM. Chakravorti. T.A. Dowling, D.G. Kelly, and K.J.C. Smith (eds.), Univ. of North
Carolina Press, Chapel Hill, North Carolina, 1970, pp. 472-477. b.
Tucker A.C. Matrix Characterizations of Circular-arc Graphs. Pacific J. Math., 39 A971),
535-545.
Tucker A.C. A Structure Theorem for the Consecutive Г s Property, J. Combinatorial Гпеогу,
12BU972), 153-162.
Tucker A.C Perfect Graphs and an Application to Optimizing Municipal Services, SIAM
Review, 15 A973), 585-590.
482
Tucker A,C. and Bodin L. A Model for Municipal Street Sweeping Operations, CUPM Applied
Mathematics Modules Project, Berkeley Calif., 1975.
Wegner G. Eigenschaften der Nerven Homologisch-einfacher Familien in Rn, Doctoral
Dissertation, Gottingen, 1967.
Whitney H. Congruent Graphs and the Connectivity of Graphs, Amer. J. Math. 54 A932),
150-168.
Wilson E.O. The Insect Societies, Belknap Press of Harvard University Press, Cambridge Mass.,
1971.
Wilson E.O. Sociobiology: The New Synthesis, Belknap Press of Harvard University Press,
Cambridge, Mass., 1975.
Wilson E.O. and Bossert W.H. A Primer of Population Biology, Sinauer Associates, Stamford,
Conn., 1971.
Добавлено при переводе:
Гэри M.t Джонсон Д. Вычислительные машины и труднорешаемые задачи: Пер.
с англ. - М.: Мир, 1982. - 416 с.
Зыков А.А. Теория конечных графов. T.I. - Новосибирск: Наука, 1969. - 542 с.
Конвей Р., Максвелл В., Миллер J1. Теория расписаний: Пер. с англ. - М.: Наука,
1975. -360 с.
МиркинБТ., Родин СИ. Графы и гены. - М.: Наука, 1977. - 237 с.
Танаев B.C., Шкурба В.В. Введение в теорию расписаний. - М.: Наука, 1975. - 256 с.
Appel К., Haken W. Every planar map is 4-colorable. Illinois J. Math. 1977, v. 21, No. 3,
429-517.
К главе 4
Antle L.G. and Johnson G.P. Integration of Policy Simulation, Decisition Analysis and
Information Systems: Implications of Energy Conservation and Fuel Substitutuon
Measures on Inland Waterway Traffic, in Proceedings of Computer Science and Statistics:
Seventh Annual Symposium on the Interface, Iowa State Univ., Ames, Iowa, 1973.
Axelrod R.M. Psycho-Algebra: A Mathematical Theory of Cognition and Choice with an
Application to the British Eastern Commitee in 1918, Peace Research Society, Papers
XVIII, The London Conference, 1971, pp. 113-131.
Axelrod R.M. (ed). The Structure of Decision, Princeton University Press, Princeton, N. J.,
to appear.
Bonham M. and Shapiro M. Explanation of the Unexpected: The Syrian Intervention in
Jordan in 1970, in The Structureof Decision, R.M. Axelrod (ed.), Princeton University
Press, Princeton, N J., to appear.
Brown *T.A., Roberts F.5., and Spencer J. Pulse Processes on Signed Digraphs:
A Tool for Analyzing Energy Demand, Rand Corporation Report R-926-NS1,
Macrh 1972.
Chen W., Applied Graph Theory, American Elsevier, New York, 1971.
Coady S.K., Johnson G.P. and Johnson J.M. Effectively Conveying Results: A Key to the
Usefulness of Technology Assesment, Mimeographed, Institute for Water Resources,
Corps of Engineers, paper delivered at the First International Congress on Technology
Assessment, The Hague, May 31, 1973.
Coombs C.H., Dawes R.M. ,and Tversky A. Mathematical Psychology: an Elementery
Introduction, Prentice-Hall, Inc., Englewood Cliffs, N.J., 1970.
Forrester J.W., Industrial Dynamics, M.I.T., Press, Cambridge,Mass, \96\.(ФоррестерДж.
Основы кибернетики предприятия (индустриальная динамика): Пер. с англ. -
М.: Прогресс, 1971. - 340 с.)
ForresterJ.W. Urban Dynamics, M.I.T. Press, Cambridge, Mass, 1969. {ФоррестерДж.
Городская динамика. Динамика развития города: Пер. с англ. - М.: Прогресс,
1974. -285 с.)
Forrester J.W. World Dynamics, Wright-Allen Press, Cambridge, Mass, 1971 .(Форрестер Дж.
Мировая динамика: Пер. с англ. - М.: Наука, 1978. - 167 с.)
Gardner M.R. and Ashby W.R. Connectance of Large Dynamic (Cybernetic) Systems: Critical
Values for Stability, Nature, 228 A970), 784.
31* 483
Harary F. A Graph-Theoretic Method for the Complete Reduction of a Matrix with a View
Toward Finding its Eigenvalues, J. Math, and Physics, 38 A959), 104-111.
Harary F., Norman R.Z. and Cartwright D. Structural Models: An Introduction to the Theory
of Directed Graphs, John Wiley & Sons, Inc., New York, 1965.
Kane J. A Primer for a New Cross-Impact Language - К SIM, Technological Forecasting and
Social Change, 4 A972), 129-142.
Kane J., Thompson W. and Vertimky I. Health Care Delivery: A Policy Simulation, Socio-
Econ. Plan. Sci.,6 A972), 283-293.
Kemeny J.G., and Snell J.L. Mathematical Models in the Social Sciences, Blaisdell Publishing
Co., New York, 1962; reprinted by M.I.T., Press, Cambridge, Mass, 1972. (КемениДж.,
СнеллДж. Кибернетическое моделирование: Пер. с англ. - М.: Сов. Радио, 1972. -
192 с.)
Kruzic P.G. A Suggested Paradigm for Policy Planning, Stanford Research Institute Technical
Note TN-OED-016, June 1973, a.
Kruzic P. G. Cross-Impact Analysis Workshop, Stanford Research Institute Letter Report,
June 23,1973, b.
Levins R. The Qualitative Analysis of Partially Specified Systems, Annals of the N.Y. Acad.
Sci, 231 A974), 123-138.
Levins R. Evolution in Communities near Equilibrium in Ecology of Species and
Communities, J. Diamond and M. Cpdy (eds), Belknap Press of Harvard University Press, Cambridge,
Mass, to appear.
Мальцев A.M. Основы линейной алгебры. - Изд. 3-е, перераб. - М.: Наука, 1970. -
400 с.
Maruyama M. The Second Cybernetics: Deviation-Amplitying Mutual Causal Processes, Amer.
Scientist, 51 A963), 164-179.
May R.M. Stability in Multispecies Community Models, Mathematical Biosciences, 12 A971),
59-79.
May RM. Will a Large Complex System be Stable? Nature, 238 A972), 413-414.
May R.M. Stability and Complexity in Ecosystems, Princeton University Press, Princeton,
N.J., 1973.
Meadows D.H., Meadows D.L., Randers J. and Behrens W.W. III. The Limits to Growth,
Universe Books, New York, 1972.
Organization for Economic Cooperation and Development, llie Slowdown in R & D
Expenditure and the Scientific and Technical System, Report SPT G4) 1, Paris, France, February
1974.
Phillips J.L. A Model for Cognitive Balance, Psychol. Rev., 74 A967), 481-495.
Roberts F.S. Signed Diagraphs and the Growing Demand for Energy, Environment and
Planning, 3 A971), 395-410.
Roberts F.S. Building an Energy Demand Signed Diagraph I: Choosing the Nodes, Rand
Corporation Report R-927/1-NSF, April 1972, a.
Roberts F.S. Building an Energy Demand Signed Diagraph II: Choosing Edges and Signs
and Calculating Stability, Rand Corporation Report R-927/2-NSF, May 1972, b.
Roberts F.S. Building and Analyzing an Energy Demand Signed Digraph, Environmet and
Planning, 5 A973), 199-221.
Roberts F.S. Structural Characterizations of Stability of Signed Digraphs under Pulse
Processes, in Graphs and Combinatorics, R. Bari and F. Harary (eds.), Springer Verlag Lecture
Notes # 406, New York, 1974, pp. 330-338, a.
Roberts F.S. Weighted Digraph Models for Energy Use and Air Pollution in Transportation
Systems, Rand Corporation Report R-1578-NSF, Dec. 1974, b. (Abridged version to
appear in Environment and Planning).
Roberts F.S., and Brown T.A. Signed Digraphs and the Energy Crisis, Amer. Math. Monthly,
82 A975), 577-594.
Ross S. Complexity of the Presidency: Gouvernor Morris in the Constitutional Convention,
in The Structure of Decision, R.M. Axelrod (ed.), Princeton University Press, Princeton,
N J., to appear.
Vickrey W.S. Pricing in Urban and Suburban Transport, in Readings in Urban Transportation,
G.M. Smerk (ed.), Indiana University Press, Bloomington Ind., 1968.
WilfH.S. The Eigenvalues of a Graph and its Chromatic Number, J. London Math. Soc, 42
A961), 330-33?:'
484
К главе 5
Atkinson R.C., Bower G.H. and Crothers E.J. An Introduction to Mathematical Learning
Theory, John Wiley & Sons, Inc., New York, 1965.
Bharucha-Reid A.T. Elements of the Theory of Markov Processes and their Applications,
McGraw-Hill Book Company, New York, 1960.
Bhat U.N. Elements of Applied Stochastic Processes, John Wiley & Sons, Inc., New York,
1972.
Bower G.H. Application of a Model to Paired-associate Learning, Psychometrika, 26 A961),
255-280.
Briggs G.A. Plume Rise, AEC Critical Review Series. U.S. Atomic Energy Commission,
Washington, D.C., 1969.
Coombs C.H., Dawes R.M. and Tverskv A. Mathematical Psychology, Prentice-Hall, Inc.,
Englewood Cliffs, N.J., 1970.
Cox D.R. and Miller H.D. The Theory of Stochastic Processes, John Wiley & Sons, Inc.,
New York, 1965.
EhrenfestP. and Ehrenfest T. Uber zwei bekannte Einwande gegen das Boltzmannsche
Я-Theorem. - Physikalische Zeitschrift, 8 A907), 311-314.
Elandt-Jolinson R.C. Probabilistic Models and Statistical Methods in Genetics, John Wiley
& Sons, Inc., New York, 1971.
Ewens WJ. Population Genetics, Methuen, London, 1969.
Feller W. An Introduction to Probability Theory and its Applications, John Wiley & Sons,
Inc., New York, 1962. (Феллер В. Введение в теорию вероятностей и ее приложений.
Т. 1,2: Пер. с англ. - М.: Мир, 1984. - Т.1 -527 с, т. 2-751 с.)
French J.R.P., Jr. A Formal Theory of Social Power, Psychol. Rev., 63, A956), 181-194.
Gabriel K.R. and Neumann 7. A Markov Chain Model for Daily Rainfall Occurrence at Tel
Aviv, Quart. J.R. Met. Soc, 88 A962), 90-95.
Glass D. V. and Hall J.R, Social Mobility in Great Britain: A Study of Integeneration Changes
in Status, in Social Mobility in Great Britain, D.V. Glass (ed.), Routledge and Kegan Paul,
London, 1954.
Goodman A. W., and Ratti J.S. Finite Mathematics with Applications, The Macmillan
Company, New York, 1971,1975.
Gulliksen H.A. Rational Equation of the Learning Curve Based on Thorndike's Law of Effect,
J. of General Psychology, 11 A934), 395-434.
Horary F. A Criterion for Unanimity in French's Theory of Social Power, in Studies in Social
Power, D. Cartwright (ed)., Inst. Soc. Res., Ann Arbor, Mich., 1959, pp. 168-182.
Howard R.A. Stochastic Process Models for Consumer Behavior, J. Advertising Res., 3 A963),
35-42.
Howard R.A. Dynamic Probabilistic Systems I: Markov Models, John Wiley & Sons, Inc.,
New York, 1971.
Kac M. Random Walk and the Theory of Brownian Motion, Amer. Math. Monthly, 54 A947),
369-391.
Karlin S. A First Course in Stochastic Processes, Academic Press, Inc. New York,
1969, a.
KarHn S. Equilibrium Behavior of Population Genetic Models with Non-Random Mating,
Gordon and Breach, New York, 1969,b.
Kemeny 7.G.. Mirkil If.. SneU J.L.. and Thompson G.L. Finite Mathematical Structures,
Prentice-Hall, Inc., Englewood Cliffs, N.J., 1959.
Kemeny 7.G. and Sncll J.L. Finite Markov Chains, D. Van Nostrand Co., Inc., Princeton,
N.J., 1960. {Кемени Дж., Снелл Дж. Конечные цепи Маркова: Пер. с англ. - М.:
Наука, 1970.- 271с.)
Kemtny J.G. and Sncll J.L. Mathematical Models in the Social Sciences, Blaisdell Publishing
Co., New York, 1962; reprinted by M.I.T. Press, Cambridge, Mass. 1972. (Кемени Дж.,
Снелл Дж. Кибернетическое моделирование: Пер. с англ. - М.: Сов. Радио, 1972. -
192 с.)
Kemeny J.G.. SneU J.L and Thompson G.L. Introduction to Finite Mathematics, Prentice-
Hall, Inc., Englewood Cliffs, N.J., 1956, 1957, 1966, 1974. (Кемени Дж., Снелл Дж.,
Томпсон Дж. Введение в конечную математику: Пер. с англ. - М.: Мир, 1965. -
486 с.)
485
Mosimann J. Elementary Probability tor the Biological Sciences, A ppleton-Century-Crofts,
New York, 1968.
Norman M.F. Markov Processes and Learning Models, Academic Press, Inc., New York, 1972.
Prais SJ. Measuring Social Mobility, J. of the Royal Stat. Soc, 118 A955), 56-66.
Романовский В.И. Дискретные цепи Маркова. - М.; Л.: Гостехиздат, 1949.
Slade D.H. Meteorology and Atomic Energy, AEC Critical Review Series U.S. Atomic Energy
Commission, Washington, D.C., 1968.
Stern A.C., Wohlers H.C., Bowbel R.W. and Lowry W.P. Fundamentals of Air Pollution,
Academic Press, New York, 1973.
Suppes P., and Ginsburg R.A. A Fundamental Property of AU-or-None Models Binomial
Distribution Prior to Conditioring with Application to Concept Formation in Children,
Psychol. Rev., 70 A963), 139-161.
Tfieios J, Simple Conditioning as Two-stage AU-or-none Learning, Phychol. Rev., 70 A963),
403-417.
К главе 6
Banzhaf Xf., III. Wieghted Voting Doesn't Work: A Mathematical Analysis, Rutgers Law
Review, 19 A965), 317-343.
Banzhaf J.F., III. One Man, 3.312 Votes: A Mathematical Analysis of the Electroral College,
Villanova Law Review, 13 A968), 304-332.
Berge C. Thforie generate des jeux a n personnes, Mem. des Sciences Math.", 138, Gauthier-
Villars, Paris, 1957. (Берж. К. Общая теория игр нескольких лиц: Дер. с фр. - М.:
Наука, 1961.- 126 с.)
Berge С. The Theory of Graphs and its Applications, John Wiley & Sons, Inc., New York,
1962. (Берж К. Теория графов и ее применения: Пер. с фр. - М.: Изд-во иностр.
лит., 1962.-319 с.)
Бондарева О.Н. Теория ядра в игре // лиц. - Вестник Ленингр. университета. Сер. мат.,
мех. и астрон., вып. 3, № 13. 1962, с. 141-142.
Бондарева О.Н. Некоторые применения методов линейного программирования к
теории кооперативных игр. - Проблемы кибернетики, 1963, вып. 10, 1963.
с. 119-139.
Воусе W.M. and Cross MJ. An Algorithm for the Shapley-Shubik Voting Power Index for
Weighted Voting, unpublished Bell Telephone Laboratories manuscript.
Dubcy P. On the Uniqueness of the Shapley Value, Technical Report, Applied Mathematics
Center, Cornell University, Ithaca, New York, June 1974.
Dubey P. and Shapley L.S. Some Properties of the Banzhaf Power Index, to appear as a Rand
Corporation Reprot, 1975.
Gillies D.B. Some Theorems oft n-Person Games, Ph. D. Thesis, Department of Mathematics,
Princeton University, Princeton, N.J., 1953.
Gillies D.B. Solutions to General Non-zero-sum Games, Annals of Mathematics Studies No.
40, Princeton University Press, Princeton, N.J., 1959, p. 47-85.
Horary F.. Norman R.S. and Cartwright D. Structural Models, John Wiley, & Sons, Inc.,
New York, 1965.
Johnson R.F. An Analysis of Weighted Voting as Used in Reapportionment of County
Governments in New York State, Albany Law Review, 34 A969), 1 -45.
Kuhn H.W. (ed.). Report of an Informal Conference on the Theory of n-PersonGames Held
at Princeton University, March 20-21,1953.
Lucas W.F. A Counterexample in Game Theory, Management Science, 13 A967),
766-767.
Lucas W.F. A Game with no Solution, Bull. Amer. Math. Soc, 74 A968), 237-239.
Lucas W.F. The Proof that a Game may not have a Solution, Trans. Amer. Math Soc, 137
A969), 219-229.
Lucas W.F. Measuring Power in Weighted Voting Systems, Tech. Report No. 227, Department
of Operations Research, Cornell University. September 1974.
Luce R.D. and Raiffa H. Games and Decision, John Wiley & Sons, Inc. New York, 1957.
(Льюс Р., Райфа X. Игры и решения: Пер. с англ. - М.: Изд. иностр. лит., 1961. -
642 с.)
486
Mann I. and Sha pie у L.S. Values of Large Games, IV: Evaluating the Electoral College by
Monte Carlo Techniques, Rand Corporation Memorandum RM-2651, September 1960;
reproduced in Game Theory and Related Approaches to Social Behavior', M. Shubik
(ed.), Johns Wiley & Sons, Inc., New York, 1964.
Mann /., and Shapley L.S. Values of Large Games, VI: Evaluating the Electoral College
Exactly, Rand Corporation Memorandum RM-3158-PT, May 1962; reproduced in part
in Game Wieory and Related Approaches to Social Behavior, M. Shubik (ed.), John
Wiley & Sons, Inc., New York, 1964.
McKinsey J.C.C. Isomorphism of Games and Strategic Equivalence, in Contributions to the
Theory of Games, II, H.W. Kuhn and A.W. Tucker (eds.), Annals of Mathematics Studies
No. 24, Princeton University Press, Princeton, N J., 1950.
Owen G. Game Theory, W.B. Saunders, Philadelphia, 1968. (Оуэн Г. Теория игр: Пер.
с англ. - М.: Мир, 1971. - 230 с.)
Rapoport A. N-Person Game Theory: Concepts and Applications, University of Michigan
Press, Ann Arbor, Mich., 1970.
Richardson M. On Weakly Ordered Systems, Bull. Amer. Math. Soc, 52, A946), 113-116.
Shannon C.E. The Zero-етгог Capacity of a Noisy Channel, Сотр. Information Theory,
IRE Trans., 3A956), 3-15.
Shapiro N. V. and Shapley L.S. Values of Large Games I: A Limit Theorem. Rand Corporation
Memorandum RM-2648,1960.
Shapley L.S. A Value for n-Person Games, in Contributions to the Theory of Games, II,
H.W. Kuhn and A.W. Tucker (eds), Annals of Mathematics Studeies No. 28, Princeton
University Press, Princeton, N.J., 1953, p. 307-317, a.
Shapley L.S. Quota Solutions of n-Person Games, in Contributions to the Theory of Games
II, H.W. Kuhn and A.W. Tucker (eds), Annals of Mathematics Studies No. 28, Princeton
University Press, Princeton, N.J., 1953, 343-359, b.
Shapley L.S. On Balanced Sets and Cores, Nav. Res. Logist. Quart., 14 A967), 453-460.
Shapley L.S., and Shubik K. A Method for Evaluating the Distribution of Power in a
Committee System, The American Political Science Review, 48 A954), 787-792.
Shapley L.S., and Shubik M. On Market Games, J. Econ. Theory, 1 A969), 9-25, a.
Shapley L.S., and Shubik M. On the Core of an Economic System with Externalities, The
American Economic Review, 59 A969), 678-684, b.
Shapley L.S., and Shubik M. Characteristic Function, Core and Stable Sets, Game Theory in
Economics, Chapter 6, Rand Corporation. Report R-904/6-NSF, July 1973.
Shapley L.S., and Shubik M. Game Theory in Economics, to appear. (Certain chapters are
presently available as Rand Corporation Reports R-904/1-NSF, R-904/2-NSF, R-904/3-
•NSF, R-904/4-NSF, R-904/6-NSF), a.
Shapley L.S., and Shubik M. The Value, Game Theory in Economics, Chapter 7, Rand
Corporation Report R-904/7-NSF, to appear, b.
Von Neumann J., and Morgenstem O. Theory of Games and Economic Behavior, Princeton
University Press, Princeton, NJ., 1944,1947,1953. (Фон Нейман Дж.,Моргенштерн О.
Теория игр и экономическое поведение: Пер. с англ. - М.: Наука, 1970. - 707 с.)
К главе 7
Arrow К. Social Choice and Individual Values, Cowles Commission Monograph 12, John
Wiley & Sons, Inc., New York, 1951; second edition, 1963.
Black D. On the Rationale of Group Decision-making, J. of Political Economy, 56 A948),
23-24, a.
Black D. The Decisions of a Committee Using a Special Majority, Kconometrica, 16 A948),
245-261, b.
Black D. The Theory of Committees and Elections, Cambridge University Press. London. 1958
Bogart K. Preference Structures, I, J. Math. Sociology, 3 A973), 49-67.
Bogart K. Preference Structures II, SIAM J. Appl. Math., 29 A975), 254-262.
Coombs CM. Social Choice and Strength of Preference, in Decision Processes, R.M. Thrall,
C.H. Coombs, and R.L. Davis (eds), John Wiley & Sons, Inc., New York, 1954. pp 69-86.
Farquharson R. Theory of Voting, Yale University Press, New Haven, Conn., 1969.
Fishburn P.C. The Theory of Social Choice, Princeton University Press, Princeton, N.J.,
1972.
487
Goodman L.A. On Methods of Amalgamation, in Decision Processes, R.M. Thrall, C.H. Coombs
and R.L. Davis (eds), John Wiley & Sons, Inc., New York, 1954, pp. 39-48.
Goodman L.A. and Markowitz H. Social Welfare Functions Based on Individual Rankings,
Amer. J.of Sociology, 58 A952), 257-262.
Kemeny J.G. and Snell J.L. Mathematical Models in the Social Sciences, Blaisdell, New
York, 1962; reprinted by MIT. Press, Cambridge, Mass, 1972. {КемениДж., СнеллДж.
Кибернетическое моделирование: Пер. с англ. - М.: Сов. Радио, 1972. - 192 с.)
Luce R.D., and Raiffa H. Games and Decisions, John Wiley & Sons, Inc. New York, 1957.
(Лыос Р., Райфа X. Игры и решения: Пер. с англ. - М.: Изд-во иностр. лит., 1961. -
642 с.)
Malkevitch /., and Meyer W. Graphs, Models, and Finite Mathematics, Prentice-Hall, Inc.,
Englewood Cliffs, N.J., 1974.
Neimi R.G., and Weisberg H.F. A Mathematical Solution for the Probability of the Paradox
of Voting, Behav. Sci., 13 A968); 317-323.
Norman R.Z., and Roberts F.S. A Derivation of a Measure of Relative Balance for Social
Structures and a Characterization of Extensive Ratio Systems, J. Math. Psychol. 9 A972),
66-91.
Riker W.H., and Ordeshook P.C. Positive Political Theory, Prentice-Hall, Inc. Englewood
Cliffs, N.J., 1973.
Sen A.K. Collective Choice and Social Welfare, Holden-Day, San Francisco, Calif., 1970.
Добавлено при переводе:
Раппопорт AM. Измерение расстояний между взвешенными графами структуризо-
ванных экспертных суждений. - В кн.: Многокритериальный выбор при решении
слабоструктуризованных проблем. Вып. 5. - М.: ВНИИСИ,1979. с. 97-108.
Раппопорт AM* Измерение расстояний между сверхтранзитивными графами. - В кн.:
Экспертные методы в системных исследованиях. Вып. 4. - М.: 1979, с. 55-61.
К главе 8
Adams ЕЖ Elements of a Theory of Inexact Measurement, Phil. Sci., 32 A965), 205-228.
Алимов Н.Г. Об упорядоченных полугруппах. - Изв. АН СССР. Сер. мат., №.14,
A950), с. 569-576.
Allais M. Le_ comportement de Гпотте ratiomiell devant le risque: Critique des postulate de
Гecole Americaine, Econometrika, 21 A953), 503-546.
Armstrong W.E. The Determinateness of the Utility Function, Econ. J., 49 A939), 453-467.
Armstrong W.E. Uncertainty and the Utility Function, Econ. J., 58 A948), 1-10.
Armstrong W.E. A Note on the Theory of Consumer's Behavior, Oxford Economic Papers,
2A950), 119-122.
Armstrong W.E. Utility and the Theory of Welfare, Oxford Economic Papers; 3 A951),
259-271.
Behrend F.A. A System of Independent Axioms for Magnitudes, J. Proc. Roy Soc. New South
Wales, 87 A953), 27-30.
Behrend F.A. A Contribution to the Theory of Magnitudes and the Foundations of Analysis,
Math. Z.,63 A956), 345-362.
Bernoulli D. Specimen Theoriae Novae de Mensura Sortis, Comentarii Academiae Scientiarum
Imperiales Petropolitanae, 5 A738), 175-192; translated by L.Sommer in Econometrica,
22 A954), 23-36.
Birkhoff G. Lattice Theory, American Mathematical Society Colloquium Publication No. XXV,
New York, 1948, 1967. (Биркгоф Г. Теория решеток: Пер. с англ. - М.: Наука,
1984. - 564 с.)
Campbell N.R. Physics: The Elements, Cambridge University Press, Cambridge, England,.
1920; reprinted as Foundations of Science: The Philosophy of Theory and Experiment,
Dover Publications, Inc., New York, 1957.
Campbell N.R. An Account of the Principles of Measurement and Calculation, Longmans,
Green & Co., Inc., London, 1928.
Cantor G. Beitrage zur Beer'undung der Transfiniten Mengenlehre, Math. Ann., 46 A895),
481-512.
488
Cohen M.R. and Nagel E. An Introduction to Logic and Scientific Method, Harcourt,
Brace & World, Inc., New York, 1934.
Debreu G. Topological Methods in Cardinal Utility Theory, in Mathematical Methods in the
Social Scinces, K.J.Arrow, S.Karlin, and P.Suppes (eds), Stanford University Press,
Stanford, Calif., 1960, pp.16-26.
Ellis B. Basic Concepts of Measurement, Cambridge University Press, London, 1966.
Fishburn P.C. Decision and Value Theory, John Wiley & Sons, Inc., New York, 1964.
Fishburn P.C. Utility Theory, Management Science, 14 A968), 335-378.
Fishburn P.C. Intransitive Indifference in Preference Theory: A Survey, Operations
Research, 18 A970), 207-228,a.
Fishburn P.C. Intransitive Indifference with Unequal Indifference Intervals, J. Math. Psycho!.,
7A970),144-149,b.
Fishburn P.C. Utility Theory for Decisionmaking, John Wiley & Sons, Inc., New York,
1970. {ФишбернП. Теория полезности для принятия решений: Пер. с англ.- М.:
Наука, 1978. - 352 с.)
Fisher I. The Making of Index Numbers, Houghton Mifflin Co., Boston, Mass., 1923.
Goodman N. Structure of Appearance, Harvard University Press, Cambridge, Mass, 1951.
Helmholtz H.V. Zahlen und Messen, Erkenntnistheoretisch Betrachtet, in Philosophische
AufsatzeEdwardZellergewidmet, Leipzig, 1887; Engl. translation by C.L.Bryan,
Counting and Measuring, D. van Nostrand Co. Inc., Princeton, N. J., 1930.
Hoffman K.H Sur Mathematischen Theorie des Messens, Rozprawe Mat. (Warsaw),
32 A963), 1-31.
Holder O. Die Axiome der Quantitat und die Lehre vom Mass, Ber. verh. Kgl. Sachsis Ges.
Wiss. Leipzig, Math-Phys. Klasse,.53 A901), 1-64.
Holman E.W. Strong and Weak Extensive Measurement, J. Math. Psychol., 6 A969),
286-293.
Huntington E.V. A Complete Set of Postulates for the Theory of Absolute Continuous
Magnitude, Trans. Amer. Math. Soc, 3 A902), a.
Huntington E. V. Complete Sets of Postulates for the Theories of Positive Integral and of
Positive Rational Numbers, Trans. Amer. Math. Soc, 3 A902), 280-284, b.
Huntington E. V. The Continuum and Other* Types of Serial Order, Harvard University Press,
Cambridge, Mass., 1917.
Krantz D.H. A Survey of Measurement Theory, in Mathematics of the Decision Scinces,
Part 2, G.B.Dantzig & A.F.Veinott, Jr. (eds.), Vol. 12 of Lectures in Applied
Mathematics, American Mathematical Society, Providence, R.I., 1968, pp. 314-350.
Krantz D.H. A Theory of Magnitude Estimation and Cross-Modality Matching, J. Math.
Psychol., 9 A972), 168-199.
Krantz D.H.t Luce R.D., Suppes P. and Tversky A. Foundations of Measurement, Vol. I;
Academic Press, Inc., New York, 1971.
Krantz D.H, Luce R.D., Suppes P. and Tversky A. Foundations of Measurement, Vol. II,
Academic Press, Inc., New York, to appear.
Levelt W.J.M., Riemersma J.B. and Bunt A.A. Binaural Additivity of Loundness, British J.
of Math, and Stat. Psychol., 25 A972), 51-68.
Luce R.D. Semiorders and a Theory of Utility Discrimination, Econometrica, 24 A956),
178-191.
Luce R.D. On the Possible Psychophysical Laws, Psych. Rev., 66 A959), 81 -95.
Luce R.D. and Krantz D.H. Conditional Expected Utility, Econometrica, 39 A971),
253-271.
Luce R.D. and Raiffa H. Games and Decisions, John Wiley & Sons, Inc.: New York, 1957.
(Льюс P.t Райфа X. Игры и оешения. / Пер. с англ. под ред. Д.Б. Юдина -М.:
Изд-во иностр. лит., 1961, - 642 с.)
Luce R.D. and Suppes P. Preference, Utility and Subjective Probability, in Handbook of
Mathematical Psychology, Vol. 3, R.D.Luce, R.R.Bush, and E.Galanter (eds.),
John Wiley & Sons, Inc. New York, 1965, pp. 249-410.
Luce R.D. and Tukey J.W. Simultaneous Conjoint Measurement: A New Type of! undamen-
tal Measurement, J. Math. Psychol., 1 A964), 1-27.
Manheim M.L. and Hall F.L. Abstract Representation of Goals, Paper P-67-24, Department of
Civil Engineering, Massachusetts Institute of Technology, January 1968.
MengerK. Probabilistic Theories of Relations, Proc. Nat. Acad. Sci., 37 A951), 178-180.
489
MUgram A.N. Partially Ordered Sets, Separating systems, and Induct lveness, in Reports of a
Mathematical Colloquium, Second Series No. 1, K.Menger (ed.), University of
Notre Dame, 1939.
Miller J.R. Assessing Alternative Transportation Systems, Rand Corporation Memorandum
RM-5865-DOT, 1969.
Pfanzagl J. Theory of Measurement, John Wiley & Sons, Inc., New York, 1968. (Пфан-
цагльДж. Теория измерений: Пер. с англ. - М.: Мир, 1976, - 248 с.)
Rabinovitch I. The Scott-Suppes Theorem on Semiorders, J. of Math. Psycho 1., to appear.
Raiffa H. Decision Analysis, Addison-Wesley, Reading, Mass., 1968; (Райфа Х. Анализ
решений: Пер. с англ. - М.: Наука, 1977. - 408 с.)
Raiffa H. Preferences for Multi-attributed Consequences, Rand Corporation Memorandum
RM-5868-DOT, 1969.
Reese T W. The Application of the Theory of Physical Measurement to the Measurement of
Psychological Magnitudes, with Three Experimental Examples, Psychol. Monogr.,
55 A943), 1-89.
Roberts F.S. Indifference Graphs, in Proof Techniques in Graph Theory, F. Haraxy (ed.),
Academic Press, New York, 1969, pp. 139-146.
Roberts F.S. On the Compatibility between a Graph and a Simple Order, J. Comb. Theory,
11 A971), 28-38.
Roberts F.S. Building an Energy Demand Signed Diagraph I: Choosing the Nodes, Rand
Corporation Report R-927/1-NSF, April 1972.
Roberts F.S. Building and Analyzing an Energy Demand Signed Diagraph, Environment and
Planning, 5 A973), 199-221.
Roberts F.S. On the Theory of Uniqueness in Measurement, Mimeographed, Department of
Mathematics, Rutgers University, New Brunswick, N. J., 1974.
Roberts F.S. Measurement Theory, a volume in the Encyclopedia of Mathematics and its
Applications, Addison-Wesley, Reading, Mass, to appear.
Roberts R.S. and Luce R.D. Axiomatic Thermodynamics and Extensive Measurement,
Synthese, 18 A968), 311-326.
Savage L. J. The Foundations of Statistics, John Wiley & Sons, Inc., New York, 1954.
Scott D. Measurement Models and Linear Inequalities, J. Math. Psychol., 1 A964), 233-247.
Scott D. and Suppes P. Foundational Aspects of Theories of Measurement, J. Symbolic
Logic, 23 A958), 113-128.
Stevens S.S. On the Theory of Scales of Measurement, Science, 103 A946), 677-680.
Stevens S.S. Mathematics, Measurement and Psychophysics, in Handbook of Experimental
Psychology,xS.S.Stevem (ed.), John Wiley & Sons, Inc., New York, 1951, p. 1-49.
Stevens S.S. Oh the Psychophysical Law, Psych. Rev., 64 A957), 153-181.
Stevens S.S. Measurement, Psychophysics and Utility, in Measurement: Definitions and
Theories, C.W.Churchman and P.Ratoosh (eds.), John Wiley & Sons, Inc., New, York,
1959, pp. 18-65
Stevens S.S. Measurement, Statistics and the Schemapiric View, Science, 161 A968),
849-856.
Suppes P. A Set of Independent Axioms for Extensive Quantities, Portugal Math., 10 A951),
163-172.
Suppes P. Introduction to Logic, D.Van Nostrand Co., Inc., Princeton, N. J., 1957.
Suppes P. Measurement, Empirical Meaningfulness and Three-Valued Logic, in Measurement:
Definitions and Theories, C.W.Churchman and P.Ratoosh (eds.), John Wiley & Sons,
Inc., New York, 1959, pp. 129-143.
Suppes P., and Winet M. An Axiomatization of Utility Based on the Notion of Utility
Difference, Management Science, 1 A955), 259-270.
Suppes P.t and Zinnes J. Basic Measurement Theory, in Handbook of Mathematical
Psychology, Vol. I, R.D.Luce, R.R.Bush and E.Galanter (eds), John. Wiley & Sons; Inc.,
New York, 1963, pp. 1-76. (СуппесП., ЗиннесДж. Основы теории измерений. -
В кн. Психологические измерения / Под ред. Л.Д.Мешалкина. - Mf: Мир, 1967,
с. 9-110).
Thrall R.M., Mortimer J.A., Rebman K.R. and Байт R.F. (eds.). Some Mathematical
Models in Biology, Revised Edition, Report No. 40241-R-7, University of Michigan,
1967.
490
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Аксиома Архимеда 453,459
-замыкания 452
-категоричная 396
-представления 424
-Скотта 464
Аксиомы Кемени - Снелла 395
-Шепли 356
-Эрроу 376
Аргумент существенный 468
Ассоциативность 452 , 459
База вершинная 51 , 233 , 331
Баланс в малых группах 67
-относительный 78
- структурный 67
Барьер отражающий 315
Блуждание случайное 228 , 266
Вектор вероятностей начальных условий
229 - 230
- вероятностный 224 , 250 - 251
- допустимый относительно
начального распределения 281
-значений 178
- импульсов 178
- собственный 154
- стационарный 249 , 250
Вероятность качественная 459
- перехода 223
- переходная высших порядков 228
Вершина 37
- достижимая 42
- симплициальная 127
Власть 302
Влияние 302
- собственных значений на устойчивость
187
- структуры на устойчивость 190
Время первого возвращения среднее 253
Выбор вероятностный 297
- групповой 369
Выборы 369
Ген 267
Генотип 267
Гибрид двойной 275
Гипотеза ожидаемой полезности 445
-о совершенных графах сильная 145
слабая 151
Голосование 319 , 369
- стратегическое 375
Гомоморфизм 422
Граф 34
- влияний 303
- двудольный 142
- дополнительный 112
- дуг окружности 120
- жестко-циклический 127
- знаковый 67, 69, 74, 75, 76
- интервалов 104
- интервальный 474
- клик 125
- конкуренции 129
- критический по отношению к
раскраске 143
- неориентированный 26
- однозначно ^-раскрашиваемый 150
- ориентированный 26, 37
- пересечений 103
- планарный 147
- полный 114
р-дольный 131
- порожденный подграфом 56
- реберный 125
- рейсов 140
- связный 26,49
- слабо т-совершенный 143
- собственных интервалов 127
- совместимости 120
- сравнений 96
- Аг-критический 150
- ^-раскрашиваемый 141
- ft-реберно-раскрашиваемый 150
- т-совершенный 143-144
Графы гомеоморфные 148
Группа 452
- сбалансированная 68
- социальная 302
- упорядоченная архимедова 453
491
Движение броуновское 314
Дедукция 24 , 70
Делёж 323
Дерево 50
- остовное 91
Диаметр графа 102
Дибаза вершинная 57
Диктатор 325 , 359 , 378
Дискретность 20
Диффузия 314
Длина полупути 44
- простой цепи 65
- пути 42 , 65
- цепи 48 , 65
- цикла 48 , 65
Добыча 134
Доминирование 267 , 274
Допустимость 323
Достижимость 41 , 42 , 65
Дуга 37 , 93
Единственность 455
- представления 472
- устойчивых множеств 341
Задача коммивояжера 90
- о кенигсбергских мостах 34
- о разорении игрока 228
Замыкание транзитивное 101
Знак 67
Значение собственное 154 , 156
Игра вполне сбалансированная 349
- в форме характеристической функции
317
-долевая 341
- "Землепользование" 318 , 327
- мажоритарная взвешенная 319 , 348
- "Мусор" 320 , 328
- несущественная 337
- "Озеро" 320 , 329
- простая 320 , 359
- симметричная 339
- с квотой 341
- с нулевой суммой 352
- с постоянной суммой 338
-"Угроза" 318
- "Чистые торги" 318 , 326
-ллиц 317
Игрок критический относительно
разбиения 366
- "основной" 36J
Иерархия превосходства 80
Измерение 411 , 420
- нечисловое 473
- производное 411 , 438
- совместное 460 , 465
- фундаментальное 411 , 423
- экстенсивное 451
Изоморфизм 348 , 425
Импульс 177
492
Инбридинг 272
Индекс Баншофа 367
- путей знаковый 180
- реберный 79 , 80
- цен потребительский 435
Индукция 24 , 70
Интенсивность предпочтительности
альтернатив 381
Интерпретация цены Шепли
вероятностная 360
Каркас 91
Карта когнитивная 175
Категория связности 65
Класс эквивалентности , содержащий
элемент 419
Клика 114
Коалиция 317 , 320 , 321 , 322
Коммуникация 35
Компонента односторонняя 57
- подграфа 56
- связности 66
- сильная 51 , 66
- слабая 56
Конденсация 52 , 233
Контрабаза вершинная 57 , 233
Контур 42 , 65
- гамильтонов 89
- обратной связи 161
- эйлеров 50
Корень 91
Коэффициент Кендалла 405
- корреляции 405
Кратность собственных значений 155
Кривая обучения 288
- однопиковая 392
- унимодальная 392
Критерий связности 46
Лес 101
Маршрут мусоровоза 140
Матрица дважды стохастическая 258 ,
305
- диагональная 156
- достижимости 60
- инциденций 64
максимальных клик 125
- переходов 224
- расстояний 63
- смежности 58 , 156
- средних времен первых возвращений
253
- стохастическая 224
- транспонированная 58
- упорядочения 409
- фундаментальная 241 , 253
- циклов 64
Медиана 388 , 395 , 401 , 437
Мера баланса 79
- вероятностная субъективная 458
Мера индивидуального предпочтения 411
- степень транзитивности турнира 87
Мнение финальное 303
Многочлен характеристический 155
Множество аксиом категоричное 134 , 358
- векторев выпуклое 339
- вершин независимое 144
устойчивое 331
- дискриминационное 333
- исходов устойчивое 331
- неустойчивое 234
- переходное 234
- ребер независимое 139
- решающее 382
- состояний 233
- сочленения 151
- счетное 447
- устойчивое 331
Моделирование имитационное 30
- математическое 22 , 24
- сложных систем 160
Модель бинарная 288 , 289 , 293 , 295
- вероятностная 31 , 219
- денежных потоков 280
- дескриптивная 32
- детерминированная 31 , 219
- загрязнения атмосферы 276
- линейная 288
- обучения 287
- потоковая 276
- прескриптивная 32
- релейная 289
- "стимул-восприятие" 289
- стохастическая 219
- Эстеса 295 , 296 , 298
Монотонность 455
Мост 27 , 91
Мультиграф 39
Мультиорграф 3Q
Направление транспортное 119
Независимость несвязанных альтернатив
376
- сильная по первому аргументу 467
Ниша экологическая 128
Носитель игры 368
Обращение взвешенного орграфа 303
- структуры расценок 174
Однопиковость предпочтений 387
Операция 415 , 416
Оптимальность по Парето 323
Орган законодательный двухпалатный
362
Орграф 26 , 37
- взвешенный 152
- влияний 303
- дополнительный 50
- знаковый 67 , 76 , 168
- импликаций 86
- Коатса 157
Орграф несвязный 45
- образующий 233
- обратный 57
- однопутный 49
- перехода 223 , 225
- связный 45
- стохастический 225
- транзитивный 85 , 96
- устойчивый 186
- цел о численно-взвешенный 153
- эффективного предпочтения 325
Ориентация графа 91
Ориентируемость 90 , 96
Отношение бинарное 412 , 414
- обратное 417
- предпочтения 413
- симметричное 414
- рефлексивное 414
- транзитивное 414
га-арное 412
Отрицание множества ребер 79
Оценка экспертная 433
Пара аномальная 459
- ребер независимая 139
Парадокс голосования 371-372
- Кондорсе 372
Параметр модели 288
Перекрываемость мутаций 106
Перестановка 339 , 357 , 397
Петля 39
Планирование транспортных потоков 25 ,
90
Платеж побочный 323
Плотность 143
Подграф 51 , 56 , 66
- остовный 57 , 120
- порожденный 52 , 66 , 139
Подгруппа сильная 306
Подкрепление 289
Подррграф 51
Подразбиение 148
Подтурнир 88
Полезность 411 , 421
Положительность элемента 459
Полуконтур 43 , 44 , 65
Полупорядок 469 , 471
Полупуть 43 , 44 , 64 , 65
Полустепень захода 96
- исхода 81
Порог 470
Порядок интервальный 473 , 474
- слабый строгий 439
- строгий простой 453
Последовательность лепестковая 191
- очков 81
- стандартная 468
Правило большинства 319
голосов 373
- Борда 372
493
Правило изменения значений параметров
вершин 117
- импульсного процесса 172
- простого большинства 371
- слабого отображения 477
Предпочтение групповое
лексикографическое 374
- эффективное 322 , 324
Предпочтительность 36
Представление 104 , 424 , 427 , 465
Преобразование 427 , 428 , 429
Принцип Гаузе 129
- конкурентного исключения 129
Принятие решений групповое 369
Проблема Бензера 105
- единственности 424
- представления 424
- стратегий 174
- условного ранжирования 386
- четырех красок 145
Прогнозирование 24 , 70
Произведение матриц 58
- отношений относительное 418
Пространство фазовое экологическое
128
Профиль 370
Процедура парных сравнений 439
- поиска глубины один 91
Процесс импульсный 152 , 177 , 178
- простой с начальной вершиной 180
- стохастический 219 , 220
Псевдоорграф 39
Путь в орграфе 41 , 64
- гамильтонов 83
- замкнутый 42 , 65
- полный 46 , 65
- простой 42 , 65
полный 83
- эйлеров 50
Размерность интервальная 129
Разность минимально различимая 470
Разрешимость по первому аргументу ,
ограниченная 467
Ранжировка 36 , 370 , 390 , 401
Раскраска графа 140
Расстояние 42 , 65
- между ранжировками 395
Реакция 290
Ребро графа 39
Решение групповое 303 „
- дискриминирующее 346
- игры простое главное 348
Роза 190
- обобщенная 190
Рулетка револьверная 220
Рынок с двумя покупателями 319 ,
328
Свойство Архимеда 453
Связность 41 , 45 , 47 , 65
494
Связь условная 289
Сегмент ранжировки 398
Сеть коммуникаций 51
- питания 36 , 127 , 136
Симплекс л-мерный353
Система мажоритарная 375
- отношений 422
Скрещивание 268 , 270 , 271
Слепота цветовая 275
Сложение булевское 61
Смежность вершин 37
Согласованность ранжировок 398-399
Содержательность 424 , 426 , 430
Соединимость 43 , 44 , 65
Соответствие сигналов допустимое 119
Состояние цепи Маркова 223 , 234 , 235
Сравнение парное 80
Статус трофический 132
Стационарность 295
Степень вершинной уязвимости 101
- вершины 101 , 142
- влияние 310
- дуговой уязвимости 95
- связности 45
Стимул 289
Стратегия 174
Структура аддитивная совместная 468
- партийная идеализированная 76
- экстенсивная 459
Суверенность граждан 377
Супераддитивность 317
Существование 341 , 452
Сходимость в смысле Чезаро 264
Теорема Гельдера 451
- о единственном представлении 446
- о раскраске 142
- о структуре 69 , 72
- представления 422
- Эрроу 376 , 379
Теория выбора по предпочтениям 87
- Менделя 267
- организаций 132
- структурного баланса 67
Тип системы отношений 422
- шкалы 427
Торги чистые 318 , 326
Торможение 160
Точка сочленения 76 , 99
Точность 31
Трансляция 24 , 70
Трансферабельность 323
Триангулятор 102
Тройка астероидальная 127
Турнир 36 , 80
Уборка мусора 140
Упорядочение плоскости
лексикографическое 448
- по силе 80
- последовательное 117
Упорядочение хронологическое 110
Уравнение характеристическое 155
Уровень трофический 134
Усиление 160
Условие групповой рациональности 326
- индивидуальной рациональности 323
- независимости 465
- однопиновости 392
- Томсена 467
Устойчивость абсолютная 185
- внутренняя 195
- импульсная 185
Уязвимость 90 , 95
Фенотип 267
Форма жорданова каноническая 209
- переходной матрицы каноническая
238-239
Функция булева 61
- группового выбора 371 , 391
- оптимальная по Парето 386
- полезности 411 , 421 , 422 , 438 , 456 , 461
- расстояния 399 , 406
- согласованная групповая 371
- характеристическая 317 , 337
Хорда в графе 102
Цена 317 , 349 , 356 , 363 , 435
Цепь 43 , 48 , 65
- Маркова 219
- периодическая 260
- поглощающая 235 , 237
- регулярная 235 , 247
- эйлерова 50
- эргодическая 235 , 260
Цикл 43 , 48 , 65 , 102
- эйлеров 50
Цикличность моделирования 24
Часть орграфа 51
Число Борда 372 , 441
- вершинной независимости 150
- внутренней устойчивости 337
- графа хроматическое 141
Чувствительность 177
Шкала 424 , 426
- абсолютная 428
- интервальная 429
- лог-интервальная 437
- номинальная 430
- ординальная 429
- отношений 428
- порядковая 429
- разностей 437
- регулярных представлений 427
- совмещенная 387 , 388 , 390
Эквивалентность 350
Экосистемы 36
Экспликация 31 , 68 , 427
Ядро 322
Ящик ^-мерный 128
U /-вершина 100
I , /-дуга 95
га-база 337
л-покрытие 336-337
Я-множество минимальное 79
/-предпочтительность 382
^множество минимальное 79
^-эквивалентность 348
0-нормализация 349
@ , 1)-нормализация 348 , 349 - 350
Фред С. Роберте
ДИСКРЕТНЫЕ МАТЕМАТИЧЕСКИЕ МОДЕЛИ
С ПРИЛОЖЕНИЯМИ К СОЦИАЛЬНЫМ , БИОЛОГИЧЕСКИ!
И ЭКОЛОГИЧЕСКИМ ЗАДАЧАМ
Серия "Теория и методы системного анализа" , №19
Редактор В.М. Витвицкий
Художественный редактор Т.Н , Колъченко
Технические редакторы С.В.Геворкян , В.Н.Никитина
Корректоры Л.И.Назарова , Т.В.Обод
Набор осуществлен в издательстве
на наборно-печатаюших автоматах
ИБ № 11710
Сдано в набор 20 , 05.86. Подписано к печати 23.09.86
Формат 60 X 90 1/16. Бумага офсетная
Гарнитура Пресс-Роман. Печать офсетная
Усл.печ.л. 31 , 0. Усл.кр.-отт. 31 , 0. Уч.-изд.л. 36 , 54
Тираж 4150 экз. Тип. зак2 20Цена 5 р. 40 к.
Ордена Трудового Красного Знамени
издательство "Наука"
Главная редакция физико-математической литературы
117071 Москва В-71 , Ленинский проспект , 15
4-я типография издательства "Наука"
630077 г.Новосибирск-77 , ул.Станиславского , 25