Текст
                    -ц
i
• •
о
ill
■
• J
ло?
#
^
**
#


Wiley-Interscience Series in Discrete Mathematics and Optimization The Probabilistic Method Second Edition NogaAlon Joel H. Spencer AWiley-Interscience Publication JOHN WILEY & SONS, Inc. New York Chichester Weinheim Brisbane Singapore Toronto
Н. Алон, Дж. Спенсер Вероятностный метод Перевод 2-го английского издания под редакцией А. А. Сапоженко Допущено учебно-методическим советом по прикладной математике и информатике УМО по классическому университетскому образованию в качестве учебного пособия для студентов высших учебных заведений, обучающихся по специальности и направлению «Прикладная математика и информатика» и по направлению «Информационные технологии» Москва БИНОМ. Лаборатория знаний 2011 %
УДК 519.1 ББК 22.176 А45 Алон Н. А45 Вероятностный метод : учебное пособие / Н. Алон, Дж. Спенсер; Пер. 2-го англ. изд. — М. : БИНОМ. Лаборатория знаний, 2011.- 320 с. : ил. ISBN 978-5-94774-556-6 (русск.) ISBN 0-471-37046-0 (англ.) Одна из самых известных зарубежных книг в области применения вероятностных методов в комбинаторике. В книге содержатся основные элементы методологии. Строгие обоснования и доказательства сопровождаются ясными и неформальными обсуждениями задач, методов и их приложений. Каждый метод иллюстрируется целым рядом точно подобранных примеров. Для специалистов в области дискретной математики и теории случайных графов, студентов, аспирантов и преподавателей соответствующих дисциплин. УДК 519.1 ББК 22.176 Издано при поддержке образовательной программы «Формирование системы инновационного образования в МГУ» Предыдущий тираж книги выпущен при финансовой поддержке РФФИ в рамках издательского проекта № 05-01-14048 Учебное издание Алон Нога Спенсер Джоэл ВЕРОЯТНОСТНЫЙ МЕТОД Учебное пособие Ведущий редактор М. С. Стригунова Художник Н. В. Зотова Компьютерная верстка: О. Г. Лапко Подписано в печать 05.06.11. Формат 70x100/16. Усл. печ. л. 26,00. Тираж 1100 экз. Заказ БИНОМ. Лаборатория знаний 125167, Москва, проезд Аэропорта, д. 3 Телефон: (499)157-5272 e-mail: binom@Lbz.ru, http://www.Lbz.ru Отпечатано в полиграфической фирме «Полиграфист» 160001, г.Вологда, ул. Челюскинцев, 3 ISBN 978-5-94774-556-6 (русск.) ISBN 0-471-37046-0 (англ.) Copyright © 2000 by John Wiley & Sons, Inc. All rights reserved. This translation published under license. © Перевод, оформление, БИНОМ. Лаборатория знаний, 2007
Оглавление Предисловие редактора перевода 9 Предисловие авторов к русскому изданию 11 Предисловие 13 Благодарности 15 Часть I МЕТОДЫ Глава 1. Основы 18 1.1. Вероятностный метод 18 1.2. Теория графов 20 1.3. Комбинаторика 24 1.4. Комбинаторная теория чисел 27 1.5. Пары с пустым пересечением 28 1.6. Упражнения 29 Вероятностный взгляд: Теорема Эрдёша—Ко—Радо 31 Глава 2. Линейность математического ожидания 32 2.1. Основы 32 2.2. Разбиение графов 33 2.3. Два быстрых результата 35 2.4. Балансировка векторов 36 2.5. Разбалансировка лампочек 38 2.6. Без подбрасывания монет 39 2.7. Упражнения 40 Вероятностный взгляд: Теорема Брегмана 42 Глава 3. Малые вариации 44 3.1. Числа Рамсея 44 3.2. Независимые множества 46 3.3. Комбинаторная геометрия 47 3.4. Упаковка 48 3.5. Перекраска 49 3.6. Непрерывное время 53 3.7. Упражнения 58 Вероятностный взгляд: Большой обхват и большое хроматическое число 59 Глава 4. Второй момент 60 4.1. Основы 60 4.2. Теория чисел 61
6 ОГЛАВЛЕНИЕ 4.3. Дополнительные теоретические сведения 64 4.4. Случайные графы 66 4.5. Максимальный размер клики 70 4.6. Различные суммы 71 4.7. Подход Рёдля 73 4.8. Упражнения 78 Вероятностный взгляд: Гамильтоновы пути 80 Глава 5. Локальная лемма 83 5.1. Лемма 83 5.2. Свойство В и разноцветные множества действительных чисел 86 5.3. Нижние оценки для чисел Рамсея 87 5.4. Геометрический результат 89 5.5. Линейная древесность графов 90 5.6. Латинские трансверсали 95 5.7. Алгоритмический аспект 96 5.8. Упражнения 100 Вероятностный взгляд: Ориентированные циклы 101 Глава 6. Корреляционные неравенства 102 6.1. Теорема о четырех функциях Альсведе и Дайкина 103 6.2. FKG-неравенство 106 6.3. Монотонные свойства 107 6.4. Линейные расширения частично упорядоченных множеств 109 6.5. Упражнения 112 Вероятностный взгляд: Теорема Турана 113 Глава 7. Мартингалы и плотная концентрация 115 7.1. Определения 115 7.2. Большие уклонения 117 7.3. Хроматическое число 118 7.4. Два обобщения 121 7.5. Четыре примера 125 7.6. Неравенство Талаграна 127 7.7. Приложения неравенства Талаграна 130 7.8. Полиномиальная концентрация Кима—By 133 7.9. Упражнения 135 Вероятностный взгляд: Теорема Вейерштрасса о приближении 136 Глава 8. Парадигма Пуассона 137 8.1. Неравенства Янсона 137 8.2. Доказательства 139 8.3. Решето Вруна 142 8.4. Большие уклонения 145 8.5. Оценка числа расширений 146 8.6. Число представлений 148 8.7. Дальнейшие обобщения 151
ОГЛАВЛЕНИЕ 7 8.8. Упражнения 153 Вероятностный взгляд: Локальная раскраска 154 Глава 9. Псевдослучайность 156 9.1. Турниры квадратичных вычетов 157 9.2. Собственные значения и расширители 160 9.3. Квазислучайные графы 167 9.4. Упражнения 173 Вероятностный взгляд: Случайные блуждания 174 Часть II Приложения Глава 10. Случайные графы 178 10.1. Подграфы 179 10.2. Размер максимальной клики 181 10.3. Хроматическое число 183 10.4. Ветвящиеся процессы 184 10.5. Гигантская компонента 188 10.6. Фазовый переход изнутри 192 10.7. Законы «нуля или единицы» 195 10.8. Упражнения 204 Вероятностный взгляд: Число подграфов 205 Глава 11. Сложность схем 207 11.1. Предварительные замечания 207 11.2. Случайные ограничения и схемы ограниченной глубины 209 11.3. Еще о схемах ограниченной глубины 213 11.4. Монотонные схемы 216 11.5. Формулы 219 11.6. Упражнения 221 Вероятностный взгляд: Максимальные антицепи 222 Глава 12. Разброс 223 12.1. Основы 223 12.2. Достаточность шести стандартных отклонений 224 12.3. Линейный и наследственный разброс 228 12.4. Нижние оценки 231 12.5. Теорема Бека—Фиала 233 12.6. Упражнения 235 Вероятностный взгляд: Несбалансированные матрицы 237 Глава 13. Геометрия 238 13.1. Наибольший угол между точками в евклидовом пространстве 239 13.2. Пустые треугольники, определяемые точками плоскости 240 13.3. Геометрическая реализация ±1-матриц 242 13.4. £-сети и VC-размерности ранжированных пространств 244
8 ОГЛАВЛЕНИЕ 13.5. Двойственная функция расщепления и разброс 250 13.6. Упражнения 253 Вероятностный взгляд: Эффективная упаковка 254 Глава 14. Коды, игры и энтропия 256 14.1. Коды 256 14.2. Игра лжеца 259 14.3. Игра «постоянная должность» 261 14.4. Игра «балансировка векторов» 263 14.5. Неадаптивные алгоритмы 265 14.6. Энтропия 266 14.7. Упражнения 272 Вероятностный взгляд: Экстремальные графы 273 Глава 15. Дерандомизация 275 15.1. Метод условных вероятностей 275 15.2. d-независимые случайные величины в пространствах малого размера 280 15.3. Упражнения 284 Вероятностный взгляд: Число пересечений, инцидентности, суммы и произведения 285 Приложение А. Оценки для больших уклонений 287 АЛ. Оценки для больших уклонений 287 А.2. Упражнения 295 Вероятностный взгляд: Графы, свободные от треугольников, содержат большие независимые множества 296 Приложение В. Пол Эрдёш 298 8.1. Труды 298 8.2. Гипотезы 300 8.3. Об Эрдёше 301 8.4. Дядюшка Пол 302 Литература 305 Предметный указатель 314 Именной указатель 319
Предисловие редактора перевода Мне приятно представить читателю эту замечательную книгу двух выдающихся специалистов в области дискретной математики. Нога Алон —член Национальной Академии наук Израиля, автор более чем трехсот работ по комбинаторике и теории сложности, обладатель премий Эрдёша (1989), Фей- ера (1991), Пойа (2000), Бруно (2001), Ландау (2005), Гёделя (2005). Джоэл Спенсер — профессор Института Куранта Нью-Йоркского университета, автор около двухсот работ по теории случайных графов, комбинаторике и теории сложности, соавтор Пола Ердёша по книге «Случайные графы», один из основателей и главных редакторов журнала «Случайные структуры и алгоритмы». Авторы являются членами редакций многих математических журналов. Они неоднократно приглашались в качестве пленарных докладчиков на международные конференции и конгрессы. Не последнее место в ряду их достижений занимает монография «Вероятностный метод» Первое издание книги, вышедшее в свет в 1991 г., стало одной из самых цитируемых книг в сообществе математиков, специализирующихся в области дискретной математики, информатики и применения вероятностных методов. Идея перевода ее на русский язык возникла еще в 1993 г., когда Джоэл Спенсер подарил мне экземпляр «Вероятностного метода» и еще более окрепла, когда я получил второе издание книги от Н. Алона. Благодаря Российскому фонду фундаментальных исследований идея перевода книги стала реальностью. Главная цель монографии — изложение идей вероятностного подхода к решению задач дискретной математики. Авторы явно придерживаются известного тезиса о том, что пример учит лучше, чем теория. Подбор примеров внутри глав отвечает самым высоким требованиям целесообразности и вкуса, а примеры, помещенные в промежутках между главами, являются избранными шедеврами. По существу, это — мастер-класс двух маэстро для лиц, заинтересованных в освоении вероятностных методов. В книге делается акцент на методологии. При относительно небольшом объеме она обладает высокой плотностью идей, приходящихся на страницу текста. Авторы часто жертвуют законченностью результатов в пользу ясности и краткости изложения. Строгое изложение утверждений как правило предваряется содержательным обсуждением метода. Наличие упражнений способствует более продуктивному восприятию материала и приобретению навыков в применении методов. Книга Н. Алона и Д. Спенсера удачно дополняет монографии отечественных авторов В. Ф. Колчина, В. Н. Сачкова, Б. А. Севастьянова, В. П. Чистякова и др. по аналогичной тематике.
10 Предисловие редактора перевода Книга будет полезна специалистам в области дискретной математики (комбинаторики, теории сложности, приложений теории вероятностей) как краткая энциклопедия приемов, связанных с применением вероятностных методов. Преподаватели вузов найдут в ней обширный материал для спецкурсов и аспирантских экзаменов. Известно, что спецкурсы по материалам книги читаются во многих университетах мира, в том числе и российских. Книга будет полезна студентам и аспирантам математических специальностей для первоначального ознакомления с предметом. Она доступна читателям, знакомым с университетскими курсами математического анализа и теории вероятностей. Специалисты в области теории вероятностей найдут много замечательных примеров применения вероятностных методов в комбинаторике и тории чисел. Авторы иногда используют устоявшиеся понятия без определений. Для читателей, знакомых с университетским курсом дискретной математики, это не доставляет каких-либо неудобств. В книгах, добавленных при переводе, можно найти все используемые здесь понятия. Над переводом книги работали Ф. Ю. Воробьев, К. Г. Омельянов, Т. Г. Пет- росян и автор этих строк. Общее редактирование осуществлялось мною. Т. В. Андреева много сделала для улучшения стиля перевода. А. Б. Дайняк принял участие в подготовке оригинал-макета. Весьма ценные замечания сделаны Н. Н. Кузюриным, Д. С. Романовым и Б. С. Стечкиным. Г. А. Махина оказала нам помощь при переводе эпиграфов к главам. Авторы книги любезно предоставили электронный вариант рукописи и список замечаний от читателей, что предотвратило внесение опечаток при наборе формул и позволило исправить некоторые имеющиеся. Редактор берет на себя ответственность за качество перевода и будет признателен всем, кто укажет на его возможные недостатки. А. А. Сапоженко
Предисловие авторов к русскому изданию Написание предисловия к книге вещь всегда приятная, поскольку на самом деле является завершением долгой работы над проектом. Нам доставляет особое удовольствие написать предисловие к русскому изданию Вероятностного метода поскольку в данном случае большая, тщательная и профессиональная работа по переводу выполнена А. А. Сапоженко и его аспирантами К. Омелья- новым, Т. Петросяном и Ф. Воробьевым, в то время как наша задача состояла в основном в добавлении этих коротких комментариев. Открытие того, что детерминированные утверждения могут быть доказаны с помощью вероятностных соображений, позволило уже в первой половине XX в. доказать ряд замечательных утверждений из анализа, теории чисел, комбинаторики и теории информации. Вскоре стало ясно, что метод, который сейчас называется вероятностным, является весьма мощным инструментом получения результатов в дискретной математике. Ранние результаты такого сорта сочетали комбинаторные соображения с элементарной вероятностной техникой, однако развитие метода в последние годы потребовало применения все более изощренных инструментов теории вероятности. Применение вероятностного метода в дискретной математике было инициировано Полом Эрдёшем, который сделал для его развития больше, чем кто-либо другой. Полученные им результаты можно разбить на три группы. К первой относится изучение определенных классов комбинаторных объектов, таких как случайные графы или случайные матрицы. Эти результаты по существу являются теоретико-вероятностными, хотя большинство из них мотивировано задачами из комбинаторики. Вторая группа состоит из примеров применения вероятностных соображений для доказательства существования комбинаторных структур, обладающих рядом предписанных свойств. Доказательства существования такого типа часто приводят к экстремальным решениям различных задач дискретной математики. Третья группа состоит из самых поразительных примеров, фокусирующих внимание на применении вероятностных соображений к доказательству тех утверждений, формулировка которых не дает каких-либо указаний на то, что вероятность может быть полезна при их исследовании. Книга содержит результаты каждой из этих трех групп. Многие фундаментальные и наиболее важные элементы теории вероятностей были получены русскими математиками. Такие исследователи как П. Л. Чебышёв, А. А. Марков, А. Я. Хинчин и А. Н. Колмогоров заложили основы теории вероятностей, обеспечив тем самым математические основы для последующего развития вероятностного метода. Таким образом, русское изда-
12 Предисловие авторов к русскому изданию ние данной книги основано в значительной мере на достижениях российской математики. Нам очень приятно выразить свою признательность нашему другу и коллеге Александру Сапоженко за идею перевода нашей книги, а также всем, кто способствовал успешному осуществлению этой идеи. Мы убеждены, что этот перевод сделает книгу доступной для широкого круга российских исследователей. Нога Алон Джоэл Спенсер
Посвящается Нурит и Мэри Энн Предисловие В последнее время наблюдается весьма интенсивное развитие вероятностного метода. Он стал самым мощным и широко применяемым инструментом в комбинаторике. Одной из главных причин столь быстрого развития является важная роль случайности в теоретической информатике — области, которая является в настоящее время источником многих интересных комбинаторных задач. Взаимосвязь между дискретной математикой и информатикой подразумевает алгоритмическую точку зрения при изучении вероятностного метода в комбинаторике, и именно такой подход мы пытались проводить в этой книге. Поэтому монография включает обсуждение алгоритмических аспектов наряду с изучением классического метода и современных приемов, применяемых в ней. Первая часть книги содержит описание методов, применяемых в вероятностных доказательствах, включая традиционную технику, использующую математическое ожидание и дисперсию, а также более современные методы, связанные с применением мартингалов и корреляционных неравенств. Вторая часть включает изучение различных тем, в которых вероятностная техника оказалась весьма успешной. Эта часть содержит главы, посвященные разбросу и случайным графам, а также некоторым областям теоретической информатики: сложности логических схем, вычислительной геометрии и дерандомизации вероятностных алгоритмов. Промежутки между главами заполнены жемчужинами под общим заголовком «Вероятностный взгляд». Они представляют собой элегантные доказательства, относящиеся к главам, после которых они появляются и, как правило, могут читаться отдельно. Основная идея вероятностного метода может быть описана следующим образом: чтобы доказать существование комбинаторной структуры с определенными свойствами, мы конструируем соответствующее вероятностное пространство и показываем, что случайно выбранный элемент этого пространства обладает данными свойствами с положительной вероятностью. Этот метод был предложен Полом Эрдёшем, который за последние пятьдесят лет внес в его развитие столь значительный вклад, что представляется справедливым назвать его «методом Эрдёша». Его вклад состоит не только в огромном числе глубоких результатов, касающихся вероятностного подхода, но также во многих интересных проблемах и гипотезах, которые в значительной степени стимулировали исследования в этой области. Написание энциклопедической книги по вероятностному методу представляется невозможным. Слишком много новых интересных результатов получено с помощью вероятностных соображений, и мы не пытаемся даже упомянуть каждый из них. В книге делается акцент на методологию. Главной
14 Предисловие целью является изложение идей. Поэтому мы не всегда приводим наилучший известный результат, если он технически слишком сложен для того, чтобы ясно изложить его. Многие результаты являются асимптотическими. При их изложении используются стандартные асимптотические обозначения. Пусть / и д — две функции, мы пишем / = 0(#), если / ^ с\д + С2 для всех значений переменных, где с\, С2 — абсолютные константы. Мы пишем / = £1(д), если д = 0(/), и / = 6(#), если / = 0(g) и / = 0(g). Запись / = о(д) означает, что предел отношения f/g стремится к нулю при стремлении переменных этих функций к бесконечности. Наконец, f ~ д означает, что / = (1 + о(1))#, т. е. что f/g стремится к 1, когда переменные стремятся к бесконечности. Каждая глава заканчивается упражнениями. Наиболее трудные помечены символом *. Упражнения, добавленные в этом издании книги, позволяют читателю проверить понимание материала, а также дают возможность использовать книгу как учебник. Кроме этих упражнений второе издание содержит некоторые улучшенные результаты и развивает различные темы, обсуждавшиеся в первом издании. Среди добавлений упомянем следующие. В гл. 3 описан непрерывный подход к дискретным вероятностным задачам, в гл. 7 излагаются некоторые новые неравенства для концентрации, в гл. 13 обсуждаются отношения между разбросом и VC-размерностью, в гл. 14 описываются некоторые приложения функции энтропии и ее свойства. Имеются также добавления в последних двух «Вероятностных взглядах» и новое приложение о Поле Эрдёше, в котором приведены список его статей, его гипотезы и воспоминания о нем. С особым удовольствием мы благодарим наших жен Нурит и Мэри Энн. Их терпение, понимание и поддержка явились ключевым моментом в успехе данного предприятия. Нога Алон Джоэл Спенсер
Благодарности Мы очень признательны нашим студентам и коллегам, принявшим участие в создании второго издания книги путем совместных публикаций, полезных обсуждений и ценных замечаний. В их числе: Грег Бачелис, Амир Дембо, Эхуд Фрейтгут, Марк Фоссорье, Донг Фу, Сванте Янсон, Гай Котцерс, Михаил Кривелевич, Альберт Ли, Боян Моар, Янош Пач, Ювал Перес, Аравинд Шринивасан, Бенни Судаков, Тибор Сабо, Грег Соркин, Джон Тромп, Дэвид Уилсон, Ник Уормалд и Ури Цвик, которые указали на различные небрежности и ошибки. Их предложения позволили улучшить изложение и результаты. Необходимо отметить, что ответственность за остающиеся ошибки, так же как и ответственность за новые ошибки (надеемся, что их немного) лежит целиком на нас. С удовольствием благодарим Орена Нечуштана за большую техническую работу, проделанную при окончательной подготовке рукописи.
Часть i МЕТОДЫ
Основы Все, что нужно, — это чтобы ваш разум был открыт. Пол Эрдёш 1.1. ВЕРОЯТНОСТНЫЙ МЕТОД Вероятностный метод является мощным инструментом для решения многих задач дискретной математики. Грубо говоря, этот метод работает следующим образом: пытаясь доказать, что структура с некоторыми искомыми свойствами существует, мы определяем подходящее вероятностное пространство структур, а затем показываем, что искомые свойства выполняются для случайно выбранного элемента в этом пространстве с положительной вероятностью. Метод лучше всего проиллюстрировать примерами. Ниже — один из них. Число Рамсея R(k,l) есть наименьшее целое п, такое, что при любой раскраске ребер полного n-вершинного графа в синий и красный цвета либо существует красный подграф К к (т. е. полный подграф на к вершинах, каждое ребро которого раскрашено в красный цвет), либо существует синий подграф К\. В 1929 г. Рамсей показал, что число Я(/с, /) конечно для любых /си/. Мы найдем нижнюю оценку для диагонального числа Рамсея R(k, к). Предложение 1.1.1. Если (£) • 21_W < 1, то R(k,k) > п. Таким образом, R(k,k) > L2fc/2J для всех к ^ 3. Доказательство. Рассмотрим случайную раскраску ребер графа Кп, полученную раскраской каждого из ребер независимо в красный или синий цвет, причем каждый цвет появляется с равной вероятностью. Определим для каждого фиксированного /с-вершинного множества R событие Ая, состоящее в том, что подграф графа Кп, порожденный подмножеством Я, является монохроматическим (т.е. либо все его ребра являются красными, либо все являются синими. Очевидно, что Рг[Ая] = 21 ~Ь). Так как существует (£) возможностей для выбора Я, вероятность того, что по крайней мере одно из событий Ац произойдет, не больше чем (^)21_Ь; < 1. Таким образом, с положительной вероятностью ни одно из событий Ля не произойдет, а значит, существует 2-раскраска графа Кп без монохроматических подграфов К к, т. е. R(k, к) > п.
1.1. ВЕРОЯТНОСТНЫЙ МЕТОД 19 Заметим, что если к ^ 3 и п = |_2fc/2J, то (1)2г~^) < ^р- • ^^ < 1, а, следовательно, R(k, к) > |_2fc/2J для всех к ^ 3. ■ Этот простой пример демонстрирует суть вероятностного метода. Чтобы доказать существование хорошей раскраски, мы вовсе не должны предъявить ее явно. Достаточно неконструктивным образом показать, что она существует. Этот пример появился в статье П. Эрдёша в 1947 г. Хотя уже в 1943 г. Селе применил вероятностный метод к другой комбинаторной задаче, упомянутой в гл. 2, Эрдёш был определенно первым, кто вполне осознал силу этого метода и на протяжении многих лет успешно применял его для решения большого числа задач. ^ Можно, конечно, сказать, что в рассмотренном выше примере легко обойтись и без вероятности. Столь же простое доказательство можно получить чисто комбинаторным путем. Достаточно лишь убедиться в том, что общее число 2-раскрасок Графа Кп больше числа тех, что содержат монохроматический подграф К к- Кроме того, поскольку большинство вероятностных пространств, рассматривавшихся при изучении комбинаторных задач, являются конечными, это утверждение справедливо в отношении большинства приложений вероятностного метода в дискретной математике. Теоретически это так. Однако на практике использование понятия вероятности является существенным. Было бы безнадежно пытаться заменить применение многих изложенных в книге приемов — например, метод второго момента, локальную лемму Ловаса и доказательство концентрации с помощью мартингалов — комбинаторными соображениями даже в случае их применения к конечным вероятностным пространствам. Вероятностный метод имеет интересный алгоритмический аспект. Рассмотрим, например, доказательство предложения 1.1.1, которое показывает, что существует реберная 2-раскраска графа Кп без монохроматических клик ^2iog2n- Можем ли мы представить такую раскраску явно? Такой вопрос, как уже говорилось, может показаться нелепым. Ведь общее число возможных раскрасок конечно, поэтому можно проверить их все, пока не найдем подходящую. Однако такая процедура может потребовать 2^) проверок. Это количество экспоненциально относительно размера входа задачи (равного (з))- Алгоритмы, время работы которых больше полинома от размера (входа) задачи, обычно рассматриваются как практически неприменимые. Класс задач, которые решаются за полиномиальное время, обычно обозначается через Р (см., например, [Aho, Hopcroft and Ullman (1974)]) и рассматривается как класс разрешимых задач. В этом смысле подход, связанный с полным перебором, в применении к поиску хорошей раскраски графа Кп, неприемлем, и в этом причина нашего замечания о неконструктивности доказательства предложения 1.1.1. Оно не дает конструктивного, эффективного и детерминированного алгоритма ^Отметим, что в 1942 г. появилась статья [Гончаров (1942)], в которой с помощью теоретико-вероятностных методов решались комбинаторные задачи о числе циклов в перестановках (см. также [Гончаров (1944)]). — Прим. ред.
20 Глава 1. ОСНОВЫ построения раскраски с требуемыми свойствами. Однако, более внимательный взгляд на доказательство показывает, что оно может быть использовано для эффективного построения раскраски, которая с большой вероятностью является хорошей. В самом деле, для больших к при п = [2к/2\ выполнено (£) • 21_W < ^L_L(_™_) <c; 2_L ^ -^ Следовательно, случайная раскраска графа Кп с большой вероятностью не содержит монохроматических подграфов ^2 log п- Это означает, что если по некоторой причине необходимо представить явно 2-раскраску ребер графа if Ю24 без монохроматических подграфов ^205 то можно просто подбросить правильную монету (10224) раз и тем самым получить требуемую раскраску с достаточной степенью уверенности. Вероятность того, что раскрашенный полный граф содержит монохроматический подграф ^205 меньше |qj-, что, наверное, гораздо меньше, чем шанс совершить ошибку в любом строгом доказательстве того, что некоторая раскраска является хорошей! Следовательно, в некоторых случаях вероятностный, неконструктивный метод дает эффективные вероятностные алгоритмы. Эта тема достаточно подробно обсуждается в гл. 15. Вероятностный метод является мощным инструментом в комбинаторике и теории графов. Он оказывается также крайне полезным в теории чисел и вычислительной геометрии. С недавних пор он стал применяться для разработки эффективной алгоритмической техники и при изучении различных вычислительных задач. В конце этой главы мы приведем простые примеры, демонстрирующие широкий спектр вопросов, для решения которых полезен этот метод. Более сложные примеры, включающие более тонкие вероятностные соображения, появятся в дальнейшем. 1.2. ТЕОРИЯ ГРАФОВ Турнир Т = (V,E) на множестве V из п игроков есть результат ориентации ребер полного графа со множеством вершин V. Таким образом, для любых двух элементов х и у множества V либо пара (ж, у), либо пара (у, ж) принадлежат множеству Е, но не обе вместе. Название «турнир» вполне естественно, поскольку его можно представлять себе как множество игроков V', в котором каждая пара участников проводит одну встречу, а присутствие дуги (ж, у) означает, что х побеждает у. Скажем, что Т обладает свойством S&, если в каждом множестве из к игроков найдется хотя бы один, который побеждает их всех. Например, ориентированный треугольник Тз = (V, Е), в котором V = {1,2,3} и Е = {(1,2), (2,3), (3,1)}, обладает свойством S\. Верно ли, что для любого конечного к существует турнир Т (с более чем к вершинами), обладающий свойством Sfc? Как показал Эрдёш [Erdos (1963b)], эта проблема, поставленная Шютте, может быть решена почти тривиально с помощью вероятностных соображений. Более того, эти соображения позволяют получить довольно точную оценку минимально возможного числа вершин в таком турнире. Основная (и естественная) идея заключается в том, что если п достаточно велико как функция аргумента /с, то случайный турнир на множестве V = {1,... ,п} из
1.2. ТЕОРИЯ ГРАФОВ 21 п игроков с большой вероятностью обладает свойством S&. Под случайным турниром мы подразумеваем турнир Т на множестве вершин V, полученный выбором для каждой пары 1 ^ г < j ^ п независимо или дуги (г, j), или дуги 0, г), причем каждая из этих возможностей равновероятна. Заметим, что при этом все 2^) возможных турниров на множестве V равновероятны, т. е. рассматриваемое вероятностное пространство симметрично. Мы часто используем симметричные вероятностные пространства в приложениях. В этих случаях мы будем иногда говорить об элементе пространства как о случайном элементе, без точного описания распределения вероятностей. Так, например, в доказательстве предложения 1.1.1 рассматривались случайные 2-раскраски, т. е. все возможные раскраски были равновероятны. Аналогично, в доказательстве следующего простого результата мы изучаем случайные турниры на множестве V. Теорема 1.2.1. Если (£)(1 — 2~к)п~к < 1, то существует турнир на п вершинах, обладающий свойством S&. Доказательство. Рассмотрим случайный турнир на множестве V = {l,...,n}. Для каждого фиксированного /с-элементного подмножества К множества V определим событие Ак, состоящее в том, что не существует вершины, которая побеждает все вершины из К. Ясно, что Рг[Лк] = (1 — 2~k)n~k, поскольку для каждой фиксированной вершины v eV — К вероятность того, что v не побеждает всех игроков из К, равна 1 — 2_fc, и все эти п — к событий, соответствующих различным выборам вершин v, независимы. Отсюда следует, что Рг V Ак \К\ = к К £ Рг[АК]=(£)(1-2-кГ \К\ = к к < 1. Следовательно, с положительной вероятностью ни одно из событий Ак не происходит, т. е. существует турнир на п вершинах, обладающий свойством S&. ■ Пусть f(k) — минимальное число вершин в турнире, обладающем свойством Sk. Поскольку (£) < (f)k и (1 - 2-k)n~k < e-(n-fc)/2\ из теоремы 1.2.1 следует, что f(k) ^ к2 • 2к • (1п2)(1 + о(1)). Нетрудно проверить, что /(1) = 3 и /(2) = 7. Как доказал Секереш (см. книгу [Moon (1968)]), f(k) ^ c\ • к • 2к. Существует ли явная конструкция турнира с не более чем с\ вершинами, обладающего свойством S&? Такая конструкция известна, но нетривиальна. Мы опишем ее в гл. 9. Доминирующим называется такое множество U С V неориентированного графа G = (V,E), что всякая вершина v eV — U имеет хотя бы одного соседа в U. Теорема 1.2.2. Пусть G = (V,E) —граф с п вершинами и минимальной степенью S > 1. Тогда G имеет доминирующее множество с не более чем nl+1^|i+ вершинами.
22 Глава 1. ОСНОВЫ Доказательство. Пусть р — некоторое число из отрезка [0,1]. Будем выбирать случайно и независимо каждую вершину из V с вероятностью р. Пусть X — (случайное) множество всех выбранных таким образом вершин, a Y = Yx — множество тех вершин из V — X, которые не имеют соседей в X. Математическое ожидание величины \Х\ равно, очевидно, пр. Для каждой фиксированной вершины v Е V, по определению Рг[г; Е Y] = Рг[г; и все ее соседи не принадлежат X] ^ (1 — р) +1. Так как математическое ожидание суммы случайных величин равно сумме их математических ожиданий (даже если они не являются независимыми), и поскольку случайные переменные |У| могут быть представлены в виде сумм п индикаторных случайных величин Х{ (короче, индикаторов) Xv (у € V), где Xv = 1> если г; Е У, и Xv = 0 в противном случае, мы заключаем, что математическое ожидание величины \Х\ + \Y\ не превыша- ет пр + п(1 - p)s+1 = п1-^ + п(1 - ^^ТГ1)^1 < n1+1^+1). Следова- тельно, существует по крайней мере одно множество X С V, такое, что 1-Х"! + \Ух\ ^ ^1+1^|х+ • Множество t/ = X U Ух является, очевидно, доминирующим множеством в графе G, и его мощность не превосходит п—^^ К Проведем некоторые элементарные вычисления с целью оптимизации результата. Для удобства мы оценим сверху 1 — р ^ е~р (это справедливо для всех действительных р), чтобы вывести более простую оценку \U\ ^np + ne"p(5+1). [ по р и пр ln(<J+l) Возьмем производную правой части пори приравняем ее нулю. Правая часть минимальна при р= 6+1 ■ При таком значении р имеем \U\ ^ nl+ls+i > что и тРебовалось. ■ В последнем доказательстве содержатся три простые, но важные идеи. Первая—это линейность математического ожидания. Многие применения этого простого, но важного принципа встретятся нам в гл. 2. Вторая, быть может, более тонкая идея является примером принципа «малых вариаций». Он будет обсуждаться в гл. 3. Случайный выбор не позволяет получить требуемое доминирующее множество сразу. Он дает только множество X, которое должно быть слегка изменено (путем добавления множества Yx) для получения требуемого доминирующего множества. Третья идея заключается в выборе оптимального р. Часто хочется сделать случайный выбор, не фиксируя р заранее. Идея состоит в том, чтобы провести доказательство, имея р в качестве параметра, и получить результат как функцию от р. Значение параметра р выбирается в конце с целью получения оптимального результата. Имеется и четвертая идея, которую можно назвать асимптотическим вычислением. Мы хотели получить асимптотику величины min(np + n(l — p)5+1), где р принимает значения из отрезка [0,1]. Иметь дело с точным минимумом величины р = 1 — (S + I)-1/5 затруднительно, и во многих подобных случаях
1.2. ТЕОРИЯ ГРАФОВ 23 этот точный минимум невозможно представить в явном виде. Предпочтительнее потерять немного в точности, заменив 1 — р на е~р для получения «легко воспринимаемой» оценки. Значительная часть искусства вероятностного метода лежит в поиске близкого к оптимальному, но ясного результата. Много ли мы теряем в данном случае? Ответ зависит от конкретной ситуации. При S = 3 наша грубая оценка дает \U\ ^ 0.596п, в то время как уточненный подсчет приводит к \U\ ^ 0.496п, что, возможно, существенно. Для больших S оба метода дают асимптотически п^£. Из результатов Алона [Alon (1990b)] легко выводится, что оценка в теореме 1.2.2 почти оптимальна. Яевероятностное, алгоритмическое доказательство этой теоремы может быть получено выбором вершин доминирующего множества одной за другой, так, чтобы на каждом шаге покрывалось максимальное число еще не покрытых вершин.2^ В самом деле, обозначим через C(v) множество вершин, состоящее из г; и всех ее соседей. Пусть в процессе выбора вершин число тех вершин и, которые не лежат в объединении множеств C(v), взятом по всем вершинам г;, выбранным к этому моменту, равно г. По предположению сумма мощностей множеств С(и) по всем непокрытым вершинам и равна по меньшей мере г(6 + 1). Тогда, вычисляя среднее, получаем, что существует вершина v, принадлежащая по меньшей мере г(5 + 1)/п таким множествам С (и). Добавляя такую вершину к уже выбранным, мы замечаем, что число непокрытых вершин не превосходит г(1 — ^р). Отсюда следует, что на каждом шаге нашей процедуры число непокрытых вершин уменьшается в 1 — (5+ 1)/п раз. Следовательно, после ^тг[ 1п(5+1) шагов останутся непокрытыми п/(6 + 1) вершин. Последние могут быть добавлены в число выбранных с целью получения доминирующего множества. Размер последнего превышает размер множества, полученного в теореме 1.2.2, не более чем на единицу. Сочетая сказанное с некоторыми соображениями Поддерюгина и Матулы, мы можем получить весьма эффективный алгоритм для решения вопроса о том, является ли n-вершинный граф, скажем, ^-реберно связным. Разрез в графе G = (V,E) — это разбиение множества вершин V на две непустые и непересекающиеся части V = V\ U V2. Будем говорить, что разрез разделяет vi и ^2, если v\ G V\ и V2 G V2. Размер разреза определяется как число ребер графа, у которых один конец лежит в V\, а другой в V^. В действительности, мы иногда отождествляем разрез с множеством этих ребер. Реберная связность графа G — это минимальный размер разреза графа G. Следующая лемма принадлежит Поддерюгину и Матуле (независимо). Лемма 1.2.3. Пусть G = (V,E) — граф с минимальной степенью 5, и пусть V = V\ U Vb —разрез в графе G размера, меньшего, чем 8. Тогда каждое доминирующее множество U графа G содержит вершины как из V\, так и из V-2- "^Подобного типа процедуры часто называют термином «жадный алгоритм» (см., например, разд. «Без подбрасывания монет»). В отечественной литературе используются также названия: «алгоритм наискорейшего спуска» (см. [Нигматуллин (1974)]) и «градиентный алгоритм»(см. [Сапоженко (1972)]). — Прим. ред.
24 Глава 1. ОСНОВЫ Доказательство. Предположим, это неверно и С/ С V\. Выберем произвольно вершину v G V2, и пусть v 1,^2, ••• >^<5 — некоторые J ее соседей. Для каждого г, 1 ^ г ^ S, определим ребро е^ данного разреза следующим образом. Если V{ G 14, то е^ = {v,Vi}, иначе Vi Е V2 и, поскольку множество £/ является доминирующим, существует по крайней мере одна вершина и е U, такая, что {u,Vi} является ребром. Возьмем такую вершину и и положим е^ = {u,V{}. Тогда все S ребер e\,...,es различны и принадлежат данному разрезу, что противоречит предположению о том, что размер разреза меньше S. Тем самым утверждение доказано. ■ Пусть G = (V, Е) — граф на п вершинах. Предположим, мы хотим выяснить, является ли G n/2-реберно-связным, т. е. верно ли, что его реберная связность не меньше п/2. Матула показал с помощью леммы 1.2.3, что это может быть сделано за время 0(п3). В силу замечания к теореме 1.2.2, можно слегка улучшить это утверждение и получить оценку вида 0(п8/3 log п) следующим образом. Сначала мы проверим, что минимальная степень S вершины в графе G не меньше п/2. Если это не так, то G не является п/2-реберно-связным, и алгоритм завершает работу. В противном случае, по теореме 1.2.2 существует доминирующее множество U = {u\,...,Uk] графа G с к = O(logn). Оно может быть найдено за время 0(п2). Далее укажем для каждого г, 2 ^ г ^ /с, минимальный размер Si разреза, разделяющего и\ и щ. Каждая из этих задач может быть сведена к решению стандартной задачи построения минимального потока в сети за время 0(п8/3) (см. например, [Tarjan (1983)]). По лемме 1.2.3 реберная связность графа G — это просто минимум из S и min Si. Общее время работы алгоритма не превышает 0(п8/3 logn), что и требовалось. 1.3. КОМБИНАТОРИКА Пара Н = {V,E), где V — конечное множество, элементы которого называются вершинами, а # —некоторое семейство подмножеств множества V, называемых ребрами, называется гиперграфом. Гиперграф называется п-однородным, если каждое его ребро содержит ровно п вершин. Говорят, что гиперграф Н обладает свойством В или, что его можно раскрасить в два цвета, если существует раскраска множества V в два цвета, такая, что никакое ребро не является монохроматическим. Через т(п) обозначим минимальное число ребер n-однородного гиперграфа, который не обладает свойством В. Предложение 1.3.1 [Erdos (1963a)]. Каоюдый п-однородный гиперграф с числом ребер, меньшим 2п~1, обладает свойством В, т. е. т(п) ^ 2n_1. Доказательство. Пусть Н = (V,E) является n-однородным гиперграфом с числом ребер, меньшим 2П-1. Раскрасим множество V в два цвета случайным образом. Пусть для каждого е Е Е событие Ае заключается в том, что ребро е
1.3. КОМБИНАТОРИКА 25 является монохроматическим. Ясно, что Pr[Ae] = 21 п. Следовательно, Рг leeE ееЕ Таким образом, существует 2-раскраска без монохроматических ребер. ■ В разд. 3.5 гл. 3, будет представлено более тонкое рассуждение, принадлежащее Радхакришнану и Сринивасану и основанное на идее Бека, из которого следует, что т(п) ^ П((^у/*2п). Лучшая известная оценка сверху для числа т(п) получена путем «переворачивания вероятностного доказательства с ног на голову». Идея заключается в следующем: каждое множество выбирается случайным образом, а каждая раскраска определяет некоторое событие. Зафиксируем множество V с v точками (в дальнейшем мы оптимизируем значение этого v). Пусть раскраска \ множества V окрашивает а точек в один цвет и, соответственно, Ь = v — а точек —в другой. Пусть S С V — равновероятно выбранное п-множество. Тогда П + С) Рг[5 является монохроматическим относительно х] — m • \п) Предположим для удобства, что v четно. Из выпуклости функции (^) следует, что данное выраженное достигает минимума при а = Ь. Получаем, что Рг[5 является монохроматическим относительно х] ^ Р-, где Р = 4VL2) О ' Пусть S\,..., Srn — равновероятно и независимо выбранные п-множества; т будет определено позже. Для каждой раскраски х событие Ах заключается в том, что ни одно из множеств Si не является монохроматическим. Из независимости выбора Si следует, что Число раскрасок равно 2V, поэтому Рг Va ^2V(1-Ру Если эта величина меньше 1, существуют Si,..., Sm, такие, что ни одно из событий Ах не выполняется, т. е. Si,..., Sm не могут быть раскрашены в два цвета и, следовательно, т(п) ^ т. Доказанная асимптотическая оценка является характерным примером оценок, возникающих при использовании вероятностного метода. Мы пользуемся неравенством 1 — р ^ е~р. Оно верно для всех действительных р, причем левая
26 Глава 1. ОСНОВЫ и правая части неравенства близки, когда р мало. Если3) ~vln2" т Р то 2V(1 — р)ш < 2ve~pm ^ 1. Откуда следует, что т(п) ^ т. Теперь нужно найти v, минимизирующее значение v/p. Величину р можно интерпретировать как удвоенную вероятность извлечения п белых шаров из урны с г;/2 белыми и v/2 черными шарами (выбор производится без возвращения шаров). Возникает желание оценить р величиной 2_n+1, вероятностью для выборки с возвращением. Эта аппроксимация дала бы оценку т ~ г;2п_11п2. Однако, когда v уменьшается, аппроксимация становится менее точной и, поскольку наша цель состоит в минимизации га, возникает необходимость в более точном приближении. Мы используем аппроксимацию второго порядка _ 2(V/n) _ ol-n ТТ V~2i _ 9l-n-n2/2v P = i=0 О "v" до тех пор, пока v ^> п3/2. Мы использовали оценку Ц^ц- = 1 — £+0(^) = — e~v+ (^г)ф Элементарный анализ дает оптимальное значение v = п2/2. Четность v может потребовать изменений не более чем на 2, что в данном случае асимптотически пренебрежимо. Это дает следующий результат [Erdos (1964)]. Теорема 1.3.2. Имеет место соотношение ra(n)<(l+o(l))^n22n. Пусть Т — {(Ai, Bi)}i=1 — семейство пар подмножеств произвольного множества. Семейство Т называется (к, £)-системой, если \А{\ = к и \В{\ = £ при всех 1 ^ i ^ h, А{ П В{ = 0 и Ai Г) Bj ^ 0 для всех различных г, j, 1 ^ г, j ^ h. Боллобаш в [В (1965)] доказал следующий результат, который имеет множество различных обобщений и применений. Теорема 1.3.3. Если семейство Т = {(Ai,Bi)}i=1 является (к,^-системой, то h ^ ( £ ). h Доказательство. Пусть X = [j (AiUBi). Рассмотрим случайный порядок 7Г г=1 на множестве X. Пусть для каждого г, 1 ^ г ^ к, событие Х{ состоит в том, что все элементы подмножества А{ предшествуют всем элементам подмножества В{ относительно данного порядка 7г. Ясно, что PrpQ] = l/(fc^). Легко проверить, что события Xi попарно несовместны. В самом деле, предположим, 3) Везде в дальнейшем \а] есть наименьшее целое, которое не меньше а, [а\ — целая часть числа а. — Прим. ред.
1.4. КОМБИНАТОРНАЯ ТЕОРИЯ ЧИСЕЛ 27 что это не так, и пусть порядок 7г таков, что все элементы множества Ai предшествуют элементам множества Bi, и все элементы из Aj предшествуют элементам из Bj. Без ограничения общности можно считать, что последний элемент множества А% не следует за последним элементом Aj. Но тогда все элементы из Ai предшествуют элементам из Bj, что противоречит условию Ai П Bj ф 0. Поэтому, все события Xi попарно несовместны. Отсюда следует, что 1 ^ Рг h У Xi =i h £Рг№] = л-1/(Т)- = 1 Пример семейства Т = {(А,X \ А) : А С Х,\А\ = к}, где множество X = {1,2,...,/с + ^}, показывает, что теорема 1.3.3 дает точную оценку. 1.4. КОМБИНАТОРНАЯ ТЕОРИЯ ЧИСЕЛ Подмножество А абелевой группы G называется свободным от сумм, если (А + А) П А = 0, т. е. не существует трех элементов а\, а,2, аз € А таких, что ^1+^2=^3- Теорема 1.4.1 [Erdos (1965a)]. Каждое множество В = {bi,...,bn}, состоящее из п целых чисел, отличных от нуля, содержит множество А, свободное от сумм, такое, что \А\ > ^п. Доказательство. Пусть р = 3/с + 2 — простое число, удовлетворяющее неравенству р > 2 max \bi\. Пусть С = {к + 1, к + 2,..., 2к + 1}. Заметим, что С является подмножеством циклической группы Zp, свободным от сумм, и что ~У[ = Jk+i > k' Выберем случайным образом натуральное число х, 1 ^ х < р, согласно равномерному распределению на множестве {1,2,...,р - 1}. Пусть числа di,...,dn удовлетворяют сравнениям di = xbi(modp), О ^ di < р. Очевидно, что если х пробегает числа 1,2,... ,р — 1, то для любого фиксированного г, 1 ^ г ^ п, величина di пробегает все ненулевые элементы группы Zp. Отсюда получаем Pr[di Е С] = -М[ > ^- Таким образом, математическое ожидание числа элементов bi, таких, что di € С, превосходит ^. Следовательно, существуют х, 1 ^ х < р, и подпоследовательность А последовательности В, такая, что \А\ > § и xa(modp) E С для всех а € А. Ясно, что множество А свободно от сумм. Действительно, если равенство а\ + а^ = аз выполнялось бы для некоторых ai,a2,a$ ^ А т0 тогДа выполнялось бы сравнение ха\ +ха2 = xas(modp), а это противоречило бы тому, что С является подмножеством группы Zp, свободным от сумм. ■ В статье [Alon and Kleitman (1990)] показано, что в любом подмножестве мощности п абелевой группы, не содержащем нейтрального элемента, существует более чем 2п/7 элементов, образующих множество, свободное от сумм. Причем константа 2/7 неулучшаема. Наилучшая константа в утверждении теоремы 1.4.1 неизвестна.
28 Глава 1. ОСНОВЫ 1.5. ПАРЫ С ПУСТЫМ ПЕРЕСЕЧЕНИЕМ Наиболее поразительные результаты, полученные вероятностным методом, связаны с его применением при доказательстве теорем, условие которых казалось бы совсем не требует такого подхода. Большинство примеров из предыдущих разделов являются простыми случаями таких теорем. В этом разделе мы приведем доказательство несколько более сложной теоремы, полученной в статье [Alon and Prankl (1985)] и дающей решение гипотезы Дайкина и Эрдёша. Пусть Т является семейством из га различных подмножеств множества X = {1,2,... ,п}. Обозначим через d(T) количество непересекающихся пар в семействе Т, т. е. d{T) = \{{F,F'):F,F' ef,FnF' = 0}|. Дайкин и Эрдёш предположили, что если га = , то d(T) = о (га2) для любого фиксированного S > О и п, стремящемся к бесконечности. Это утверждение следует из следующей теоремы, которая, в свою очередь, является частным случаем более общего результата. Теорема 1.5.1. Пусть Т — семейство состоящее из га = подмножеств множества X = {1,2,..., п), где 8 > 0. Тогда d(T)<m2-%. (1.1) Доказательство. Предположим, что неравенство (1.1) неверно. Выберем (в качестве элементов семейства Т) случайно и независимо t множеств А 1,^2,...,At где £ —большое натуральное число, которое будет определено позже. Мы покажем, что с положительной вероятностью выполняется неравенство \А\ U Л2 U • • • U At\ > п/2, и что данное объединение не пересекается более чем с 2П/2 различными подмножествами множества X. Это противоречие покажет, что неравенство (1.1) верно. В самом деле, Рг [|Ai U A2 U • • • U At\ ^ п/2] ^ Y1 Рт1А* С 5,t = 1, ...,*] ^ ScX,\S\^n/2 <с: 2n(2n/2/2^1/2)+5)n)£ = 2n(1~St\ (1.2) Введем обозначение v(B) = \{A еГ:ВПА = 0}\. Ясно, что Y,v{B)=2d{T)>2m2-52/2. Пусть У —случайная величина, значение которой равно числу множеств В G Т, которые не пересекаются с каждым из Л г (1 ^ г ^ t). В силу выпуклости функции zl математическое ожидание величины Y удовлетворяет
1.6. УПРАЖНЕНИЯ 29 условиям >±-гп(2-^)1>2т^. (1.3) тъ \ т ) Так как Y ^ га, то Рг[У ^ ш1"^2/2] ^ т-£52/2. (1.4) Легко проверить, что при t = \l + 1/J] выполняется m1~tS I2 > 2n/2, и правая часть неравенства (1.4) больше правой части неравенства (1.2). Итак, с положительной вероятностью выполняется неравенство IAiU^U- • -иЛ^| > п/2 и, к тому же, это объединение не пересекается с более чем 2П/2 множествами из семейства Т. Это противоречие доказывает неравенство (1.1). ■ 1.6. УПРАЖНЕНИЯ 1. Доказать, что если существует действительное число р, 0 ^ р ^ 1, такое, что fn рв) + 0(1-р)«)<1, то число Рамсея R(k, t) удовлетворяет неравенству R(k, t) > п. С использованием этого доказать неравенство r(4,^ft(*3/2/(ln*)3/2). 2. Пусть п ^ 4, и Я является n-однородным гиперграфом с не более чем ~^- ребрами. Доказать, что существует раскраска вершин графа Н в четыре цвета, такая, что в каждом ребре представлены все эти четыре цвета. 3* Доказать, что для любых двух независимых, одинаково распределенных действительных случайных величин X и Y Рг[|Х-У|^2]^ЗРг[|Х-У|^1]. 4* Пусть G = (V,E) — граф с п вершинами, причем минимальная степень S его вершины больше 10. Доказать, что существует разбиение множества V на два непересекающихся подмножества А и В, такое, что |Л| ^ 0(I]lj^-) и каждая вершина из множества В имеет по крайней мере одного соседа в каждом из множеств А и В. 5? Рассмотрим граф G = (V,E) на п ^ 10 вершинах. Допустим, что при добавлении любого ребра число копий полных графов на десяти вершинах в нем увеличивается. Доказать, что число ребер в графе G не меньше, чем 8п - 36.
30 Глава 1. ОСНОВЫ 6? Теорема 1.2.1 утверждает, что для любого натурального числа к существует турнир Tk = (V, Е), \V\ > к, в котором для любого множества С/, состоящего не более чем из к вершин, существует вершина v, такая, что все ориентированные ребра {(v,u) : и Е U} содержатся в Е. Доказать, что каждый такой турнир содержит не меньше чем Q(k2k) вершин. 7. Пусть {(Ai, Bi), 1 < i ^ h} — семейство пар подмножеств множества целых чисел, такое, что \Ai\ = к для всех г, а \В{\ = I для всех г. Кроме того, пусть А{ П В{ = 0 и (Лг П Bj) U (Л7 Г\В{) ^ 0 для всех г ^ j. Доказать, что h < (k+i)k+l "^ кЧ • 8. {Коды, обладающие свойством префикса; неравенство Крафта.) Пусть F — конечное множество наборов из нулей и единиц конечной длины. Пусть никакой набор из F не является префиксом другого набора из F. Обозначим через Ni число наборов длины г в F. Доказать, что Е IT**1- 2г 9* (Однозначно декодируемые коды; неравенство Крафта—Макмиллана.) Пусть F — конечное множество наборов из нулей и единиц конечной длины. Допустим, что никакие две различные конкатенации двух конечных последовательностей кодовых слов не дают в результате один и тот же набор. Обозначим через Ni число наборов длины г в F. Доказать, что Е Ni 2г 10. Доказать, что существует абсолютная константа с > 0 со следующим свойством. Пусть А — квадратная матрица размера пхпс попарно различными элементами. Тогда существует перестановка строк матрицы Л, такая, что ни один из столбцов полученной матрицы не содержит возрастающую подпоследовательность длины, не меньшей, чем су/п.
ВЕРОЯТНОСТНЫЙ ВЗГЛЯД: Теорема Эрдёша—Ко—Радо Семейство Т множеств называется пересекающимся, если для любых двух множеств А, В G f выполняется условие А П В ^ 0. Пусть п ^ 2/с и семейство Т является пересекающимся семейством /с-элементных подмножеств множества мощности п. Для определенности будем считать, что элементы Т являются подмножествами множества {0,..., п— 1}. Теорема Эрдёша—Ко—Радо утверждает, что \Т\ ^ (fcZJ)- Данная оценка достижима на семействе /с-мно- жеств, содержащих какую-то определенную точку. Мы приводим короткое доказательство, полученное в [Katona (1972)]. Лемма 1.6.1. Для каждого 5,0 ^ s < п — 1, рассмотрим множество As = = {s, s + l,...,s + fc — 1}, где сумма берется по модулю п. Тогда Т может содержать не более к множеств А8. Доказательство. Зафиксируем некоторое As Е Т. Из всех остальных множеств At, пересекающих ASi составим к — 1 пар {As-i, As+k-i}, 1 ^ г ^ /с — 1. Элементы каждой такой пары являются непересекающимися. Утверждение леммы теперь вытекает из того, что Т не может содержать более одного элемента из каждой пары. ■ Теперь мы докажем теорему Эрдёша—Ко—Радо. Выберем случайным образом перестановку а на множестве {0,..., п — 1} и число г Е {0,..., п — 1}. Пусть А = {a(i),a(i + 1),..., a(i + к — 1)}, где сумма, как и раньше, берется по модулю п. В силу произвольности выбора а из леммы вытекает, что Рг[Л Е Т\ ^ к/п. Следовательно, Рг[Л Е Т\ ^ к/п. Но А выбирается равновероятно из всех fc-множеств, поэтому п (*) . ^. к /п\ (п — 1\ _
2 Линейность математического ожидания Поиск истины важнее обладания ею. Альберт Эйнштейн 2.1. ОСНОВЫ Пусть J\Ti,...,Хп —случайные величины, X = с\Х\ + ... + спХп. Линейность математического ожидания означает, что Е[Х]=с1Е[Х1] + ... + спЕ[Хп]. Сила этого принципа в том, что не требуется никаких ограничений на зависимость или независимость слагаемых Xi. Во многих случаях ЩХ] может быть легко вычислено путем разложения на простые случайные величины Xi (чаще всего индикаторы). Пусть а — случайная перестановка на множестве {1,...,п}, выбранная равновероятно. Обозначим через Х(а) количество неподвижных точек перестановки а. Чтобы найти Е[Х], рассмотрим разложение X = Х\ + ... + Хп, где Xi — индикатор события a(i) = г. Тогда E[Xi]=Fr[a(i)=i} = -, п и 1 1 Е[Х] = - +... + - = 1. п п В приложениях мы часто пользуемся тем, что существует точка вероятностного пространства, для которой X ^ ЩХ] и точка, для которой X ^ ЩХ]. Результаты, представленные в этой главе, подобраны так, чтобы проиллюстрировать эту базовую методологию. Следующая теорема Селе [Szele (1943)] многократно упоминается как первое использование вероятностного метода. Теорема 2.1.1. Существует турнир Теп игроками и по меньшей мере с n!2_(n_1) гамильтоновыми путями.1^ ^Гамильтоновым называется остовный путь, несамопересекающийся по вершинам; см. Харри Ф. Теория графов. — М.: Мир, 1973. — Прим. ред.
2.2. РАЗБИЕНИЕ ГРАФОВ 33 Доказательство. Обозначим через X число гамильтоновых путей в случайном турнире. Для каждой перестановки а обозначим через Ха индикатор того, что а порождает гамильтонов путь, т. е. выполняется условие (<т(г), <т(г+1)) € Т для 1 ^ г < п. Тогда X = ]Г Ха и Е[Х] = ^Е[Ха] = п\2-^п-1\ Таким образом, существует турнир, имеющий по крайней мере ЩХ] гамильтоновых путей. ■ Селе предположил, что максимально возможное число гамильтоновых путей в турнире из п игроков не превосходит (2-o(i))n • ^то было доказано в [Alon (1990а)] и представлено в разд. «Вероятностный взгляд: гамильтоновы пути» (гл.4). 2.2. РАЗБИЕНИЕ ГРАФОВ Теорема 2.2.1. Пусть G = (V,Е) —п-вершинный граф с е ребрами. Тогда G содероюит двудольный подграф с не менее чем е/2 ребрами. Доказательство. Пусть Т С V — случайное подмножество, заданное распределением Рг[х Е Т] = 1/2, причем элементы подмножества выбираются независимо друг от друга. Положим В = V — Т. Назовем ребро {х,у} соединяющим, если ровно одна из вершин х,у принадлежит Т. Через X обозначим число соединяющих ребер. Разложим х = 2_^ хху, {х,у}еЕ где Хху — индикатор того, что ребро {х,у} является соединяющим. Тогда Е[Хху] = 1/2, так как вероятность того, что результаты двух подбрасываний «правильной» монеты будут различными, равна 1/2. Следовательно, Е[Х]= J2 E[A*v] = |- {х,у}еЕ Таким образом, X ^ е/2 для некоторого Т, а двудольный граф определяется множеством соединяющих ребер. ■ Более тонко построенное вероятностное пространство позволяет немного улучшить результат. Теорема 2.2.2. Если граф G содержит 2п вершин и е ребер, то в нем найдется двудольный подграф с не менее чем 2^\ Ребрами. Если граф G содероюит 2п +1 вершин и е ребер, тогда в нем найдется двудольный подграф с не менее чем е^Х\ ребрами.
34 Глава 2. ЛИНЕЙНОСТЬ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ Доказательство. Пусть граф G имеет 2п вершин, выберем Т случайно среди всех n-элементных подмножеств V. Каждое ребро {ж, у} является соединяющим с вероятностью 2пя_1, доказательство проводится аналогично предыдущему. Пусть G имеет 2п + 1 вершин, выберем Т случайно из множества всех n-элементных подмножеств V, дальнейшее доказательство аналогично предыдущему. ■ Рассмотрим теперь более сложный пример, в котором выбор распределения требует предварительной леммы. Положим V = V\ U.. .Ul4, где V{ представляют собой непересекающиеся множества мощности п. Рассмотрим отображение h : [V]k —► { —1, +1} как раскраску /с-элементного множества в два цвета. Множество Е, состоящее из к элементов (в дальнейшем, /с-множество) является соединяющим, если оно содержит в точности один элемент из каждого V£. Для 5 С V положим h(S) = J2h(E)i гДе сумма берется по всем /с-множествам ECS. Теорема 2.2.3. Предположим, что h(E) = +1 для всех соединяющих к-мно- жеств Е. Тогда найдется множество S С V, для которого выполнено неравенство \h(S)\>cknk, где сь — положительная константа, не зависящая от п. Лемма 2.2.4. Обозначим через Pk множество всех однородных полиномов /(pi,... ,pfc) степени к с коэффициентами, не превосходящими по абсолютному значению единицы, у которых коэффициент при р\Р2 - - 'Pk Vaeen единице. Тогда для всех f Е Рк существует набор pi,... ,р& G [0,1] такой, что |/(Рь...,Р*)| ^ сь где Ck — положительная константа, не зависящая от /. Доказательство. Положим M(f) = max l/(pi,...,Pfc)|. Pi,...,Pfc6[0,l] Для каждого / G Pk выполнено неравенство M(f) > 0, так как / является ненулевым полиномом. Из того, что Pk является компактом, а отображение М : Pk —► R непрерывно, следует, что М достигает своего минимума, равного с*. ■ Доказательство теоремы 2.2.3. Выберем случайное множество S С ]/, полагая Pr[xeS]=ph xeVi, где выбор каждого элемента происходит независимо от других. Определим вероятности р^. Положим X = h(S). Для каждого /с-множества Е положим Г h(E), если Е CS, Хе= Л ел О иначе.
2.3. ДВА БЫСТРЫХ РЕЗУЛЬТАТА 35 Будем говорить, что множество Е имеет тип (ai,... ,а&), если \Е П Vi\ = a», 1 ^ г ^ /с. Для таких Е справедливо равенство ЩХЕ] = НЕ) Рт[Е CS} = h(E)p? • •-р£\ Группируя слагаемые по их типу, получаем е[*]= Е pV---pV Е мя). ai+ ...-}-afc=fc E имеет тип (ai,...,afc) Если ai = ... = аь = 1, то все h(E) = 1 по условию теоремы. Таким образом, Е Л(Я)=п*. £ имеет тип (1,...,1) Для каждого другого типа существует менее пк слагаемых, каждое из которых имеет значение ±1, тогда Е ад Е имеет тип (ai,...,afc) <п* Следовательно, E[X]=n*/(Pi,...,Pfc), причем /GPfc, где Р& определено в лемме 2.2.4. Выберем теперь pi,... ,р* G [0,1] так, что |/(pi,... ,Рк)\ > с*. Тогда Ц\Х\]>\ЦХ]\>скпк. Некоторое значение \Х\ должно превосходить или быть равным своему математическому ожиданию. Следовательно, найдется множество S С V, такое, что \X\ = \h(S)\>cknk. Ш Теорема 2.2.3 имеет интересное применение в теории Рамсея. Известно (см. [Erdos (1965b)]), что при заданной раскраске в два цвета /с-множеств, являющихся подмножествами некоторого n-множества, существуют такие к непересекающихся m-множеств, га = 0((lnn)1/^fc_1^), что все соединяющие /с-множества одноцветны. Из теоремы 2.2.3 следует, что существует множество размера 0((1пп)1/^-1^), в котором по крайней мере \ + ек множеств размера к одноцветны. Это довольно неожиданно, так как известно, что существуют раскраски, в которых размер наибольшего монохроматического множества не превосходит (к -* 2)-кратного логарифма п. 2.3. ДВА БЫСТРЫХ РЕЗУЛЬТАТА Линейность математического ожидания позволяет иногда быстро получать интересные результаты.
36 Глава 2. ЛИНЕЙНОСТЬ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ Теорема 2.3.1. Существует раскраска в два цвета графа Кп, при которой число монохроматических подграфов Ка не превосходит п 21-©. Доказательство [набросок]. Рассмотрим некоторую случайную 2-раскрас- ку. Обозначим через X число монохроматических подграфов Ка и найдем ЩХ]. Для некоторой раскраски значение X не превосходит значения математического ожидания. ■ В гл. 15 показано, как такая раскраска может быть найдена с помощью детерминированного и эффективного алгоритма. Теорема 2.3.2. Существует раскраска в два цвета графа Кщ^, при которой число монохроматических подграфов Ка,ь № превосходит m\fn\2l_ab Доказательство [набросок]. Рассмотрим произвольную случайную 2-рас- краску. Обозначим через X число монохроматических подграфов Ка,ь и найдем ЩХ]. Для некоторой раскраски значение X не превосходит значения математического ожидания. ■ 2.4. БАЛАНСИРОВКА ВЕКТОРОВ У следующего результата имеется элегантное кевероятностное доказательство, которое мы приводим в конце этой главы. Здесь через \v\ обозначена обычная евклидова норма вектора v. Теорема 2.4.1. Пусть векторы vi,...,vn € ^п таковы, что все \vi\ = 1. Тогда существует набор ei,...,en = ±l, такой, что \e\vi + ... + envn\ ^ у/п. Кроме того существует набор ei,...,en = ±l, такой, что |eivi + ... + envn\ ^ у/п. Доказательство. Выберем элементы набора £i,..., еп равновероятно и независимо из множества { —1,+1}. Положим X = \e\vi + ... + envn\2. Тогда п п i=\ j = \
2.4. БАЛАНСИРОВКА ВЕКТОРОВ 37 Следовательно, Если г ф j, то Е^е^] = E[^]E[£j] = 0. Если же г = j, то е\ = 1 и E[ef] = 1. Тогда E[X] = JT/vi-Vi = n. Таким образом, найдутся наборы £i,... ,£n = ±1> такие, что X ^ п, и такие, что X ^ п. Извлекая квадратные корни, получаем требуемые утверждения. ■ Следующий результат включает в себя теорему 2.4.1 как частный случай (npnpi = ... =рп = 1/2). Теорема 2.4.2. Пусть векторы v\,...,vn € ^п таковы, что все \vi\ ^ 1, а значения pi,..., рп Е [0,1] произвольны. Положим w = p\V\ +... +pni;n. Тогда существует набор £i,... ,£п £ {0>1}? такой, что при v = eivi + ... + envn выполняется неравенство i i ^ v™ \w-v\ ^ —. Доказательство. Выберем величины е^ независимо друг от друга с вероятностями Рф< = 1]=Л,Рф< = 0] = 1-р<. Случайный выбор чисел е* порождает случайный вектор v и случайную величину X = \w — v\ . Заметим, что X = Тогда ^2(Рг ~ £i)vi г=\ t=l j=l Для г ^ j имеем E[(Pi - е0(р,- " £j)] = ЕЬг - ег]Е\р3- - Sj] = 0. Для i = j получаем Щ(Рг ~ £i)2\ = PiiPi ~ !)2 + (1 - P^Pl = Pi(l - Pi) ^ ^ (величина E[(p* — £i)2] = Varfe*], называемая дисперсией, будет рассмотрена в гл. 4). Таким образом, г=1 г=1 и доказательство завершается так же, как и в теореме 2.4.1.
38 Глава 2. ЛИНЕЙНОСТЬ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ 2.5. РАЗБАЛАНСИРОВКА ЛАМПОЧЕК Теорема 2.5.1. Пусть a,ij = ±1 при 1 ^ г, j^ п. Тогда существуют xi,y3- = = ±1, 1 ^ г, j^ п, такие, что f^f^aijXiyj^ (y^ + o(l)jn3/2. г=1 j=l \ / У этого результата есть забавная интерпретация. Рассмотрим матрицу размера п хп, составленную из лампочек, каждая из которых либо включена (ciij = +1), либо выключена (а^- = —I)- Предположим, что для каждой строки и каждого столбца имеется переключатель, поворот которого (х{ = — 1 для строки г и yj = — 1 для столбца j) переключает все лампочки в соответствующей линии: с «вкл.» на «выкл.» и с «выкл.» на «вкл.». Тогда для любой начальной конфигурации можно установить такое положение переключателей, что число выключенных лампочек будет не меньше (v/f + о(1)) п3/2. Доказательство теоремы 2.5.1. Забудем пока о числах Х{. Пусть величины У\, • • • ->Уп — ±1 выбираются независимо и равновероятно. Положим п п j=l i=l Зафиксируем г. Независимо от а^ величины a^yj принимают значения +1 или —1с вероятностями 1/2, кроме того, они независимы (по j). (To есть, независимо от того, что представляла из себя г-я строка изначально, после случайного переключения она становится равномерно распределенной, и все 2П возможных значений становятся равновероятными.) Таким образом, случайная величина Ri распределена так же, как величина Sn, являющаяся суммой п независимых, одинаково распределенных случайных величин, принимающих значения {±1}. Поэтому E[\IU\] = E[|S„|] = После некоторых элементарных преобразований эта асимптотика может быть получена при оценке Sn величиной л/nN, где N — случайная величина со стандартным нормальным распределением. С другой стороны, точную формулу E»s""="24<»"-~iU) можно вывести комбинаторными методами (задача из олимпиады Путнама 1974 г.), а асимптотика следует из формулы Стирлинга. Воспользуемся теперь линейностью математического ожидания E[R} = J2n\Ri\}=(]fl + o(l)\ п3/2. Существует набор yi,...,yn = ±1, при котором R принимает не меньшее значение. В заключение выберем числа Хг так, чтобы знак каждого из них
2.6. БЕЗ ПОДБРАСЫВАНИЯ МОНЕТ 39 совпадал со знаком соответствующей величины R{. Тогда п п п п / г^г \ Х>* $>^- = Y,xiRi = ]£i^i = R ^ V-+°м ™3/2- ■ г=1 j=l г=1 г=1 \ / Другой результат по разбалансировке лампочек приводится в разд. «Вероятностный взгляд: несбалансированные матрицы» (гл. 12). 2.6. БЕЗ ПОДБРАСЫВАНИЯ МОНЕТ Яевероятностное доказательство теоремы 2.2.1 может быть получено путем последовательного включения каждой вершины в множества Т или В. На каждом шаге поместим х либо в Т, либо в В так, что бы по крайней мере половина ребер из х, инцидентных предыдущим вершинам, были соединяющими. При использовании этого эффективного алгоритма по крайней мере половина ребер будут соединяющими. Существует простой итерационный алгоритм для выбора знаков в теореме 2.4.1. Для выбора знака V{ вычислим частичную сумму w = e\V\ + .. .+Si-\Vi-i. Теперь, если требуется получить малое значение суммы, следует выбрать значение в{ = ±1 так, чтобы вектор e^i составлял тупой (или прямой) угол с w. Если же желательно получить большое значение суммы, то следует сделать угол острым или прямым. В вырожденном случае, когда все углы прямые, с помощью теоремы Пифагора и индукции можно показать, что конечный вектор w будет иметь норму у/п, в остальных случаях норма будет либо меньше v/n, либо больше л/п, как нам того и хотелось. В теореме 2.4.2 требуемые Е{ можно получить с помощью так называемого «жадного» алгоритма. Пусть нам даны vi,...,vn Е Rn, Pi,...,pn € [0,1]. Предположим, что величины £i,...,£s_i Е {0>1} уже выбраны. Рассмотрим частичную сумму ws-\ = Si=i ip% ~~ ei)vi- Выберем es так, чтобы вектор s ws = ws-i + (ps - es)vs = ^(Pi - Si)vi i=\ имел минимальную норму. Случайное число es E {0,1}, выбранное с вероятностью Pr[£s = 1] = Ps, дает нам E[\ws\2] = |ws_i|2 + 2ws_i • vsE\ps - es] + \vs\2E\ps - es]2 = = \ws-1\2+ps(l-ps)\vs\2. (2.1) Таким образом, для некоторого выбора es E {0,1} выполняется неравенство \WS\2 ^ |ws_i|2+ps(l -Ps)\vs\2. Поскольку это верно для всех 1 ^ s ^ п (при wq = 0), для вектора, получаемого жадным алгоритмом, будет выполняться неравенство п \wn\2 ^ ^Pi(l -Pi)\Vi\2. г=1
40 Глава 2. ЛИНЕЙНОСТЬ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ Несмотря на то, что эти доказательства схожи, прямое применение доказательства теоремы 2.4.2 для нахождения £i,..., еп может привести к перебору, требующему экспоненциального времени. При применении жадного алгоритма на стадии с номером s производится два вычисления значения \ws\2\ для es = О и 1, с последующим выбором того значения £s, которое дает наименьшее значение. Таким образом, мы проделываем лишь линейное количество вычислений норм, а алгоритм в целом занимает лишь квадратичное время. В гл. 15 мы обсудим несколько схожих примеров при более общей постановке задач. 2.7. УПРАЖНЕНИЯ 1. Пусть п ^ 2, и Н = (V, Е) — n-однородный гиперграф с числом ребер, равным \Е\ = 4n_1. Показать, что существует такая раскраска множества вершин V в четыре цвета, что ни одно ребро не является монохроматическим. 2. Доказать, что существует положительная константа с, такая, что в каждом множестве А, состоящем из п отличных от нуля действительных чисел, содержится подмножество В С А мощности \В\ ^ сп, в котором нет четверок Ь\, Ъ2, &з> £>4 £ В, удовлетворяющих условию Ьг + 2Ь2 = 2Ъ3 + 2ЬА. 3. Доказать, что каждое множество, состоящее из п отличных от нуля действительных чисел, содержит подмножество А мощности, строго большей чем n/З, в котором нет троек ai,a2,^3 € А, удовлетворяющих равенству а\ + а2 = аз- 4. Предположим, что р > п > Ют2, р — простое, и пусть 0 < а\ < а2 < ... <агп<р — целые. Доказать, что существует целое х, 0<х<р, для которого т чисел ((xcii) (mod p)) mod n, 1 ^ г ^ ш, попарно различны. 5. Рассмотрим граф Н и целое число п > \V(H)\. Предположим, что существует граф с п вершинами и t ребрами, не содержащий копий графа Я, и пусть tk > n2lnn. Показать, что для полного графа на п вершинах существует раскраска его ребер в к цветов без монохроматических копий графа Н. 6* С использованием соображений вероятностного взгляда на гамильтоновы пути, доказать, что существует константа с > 0, такая, что для любого четного п ^ 4 верно следующее утверждение: для всякого неориентированного полного графа К с п вершинами, ребра которого раскрашены в красный и синий цвета, число альтернирующих гамильтоновых циклов в К (т. е.
2.7. УПРАЖНЕНИЯ 41 правильно раскрашенных по ребрам циклов длины п) не больше 2п Пусть .Т7 — семейство подмножеств множества TV = {1,2,...,п}, в котором нет пар А, В Е J7, удовлетворяющих отношению А С В. Пусть а Е §п — случайная перестановка элементов множества TV. Рассмотрим случайную величину X = \{i:{a(l),a(2),...,a(i)}GT}\. Путем вычисления математического ожидания величины X доказать, что 1Л<(^). Пусть X — множество попарно ортогональных единичных векторов из Rn. Предположим, что проекция каждого из этих векторов на первые к координат имеет евклидову норму, не меньшую е. Показать, что \Х\ ^ /с/е2, и что эта оценка является точной для всех е = к/2г < 1. Рассмотрим двудольный граф G = (V, Е) с п вершинами. Пусть для каждой вершины v E V задан список S(v) из более чем log2n цветов. Доказать, что существует правильная раскраска графа G, приписывающая каждой вершине v цвет из ее списка S(v).
ВЕРОЯТНОСТНЫЙ ВЗГЛЯД: Теорема Брегмапа Пусть А = [a,ij] — матрица размера п х п с элементами а^ Е {0,1}, а г» = — Si^j^n a*i ~ количество единиц в г-й строке. Обозначим через 5 множество таких перестановок <7 Е §п, для которых а^ = 1 при всех г, 1 ^ г ^ п. Тогда перманент2) per (А) есть просто |5|. Следующий результат был сформулирован Минком и доказан Брегманом [Брегман (1973)]. Представленное здесь доказательство аналогично тому, которое предложил Схрийвер [Schrijver (1978).] Теорема (Брегман). Имеет место неравенство рег(Л) < Д (г*!)1'". Выберем а Е 5 и т Е §п независимо и равновероятно. Положим А1 = А. Пусть RTi —количество единиц в строке т\ матрицы А1. Удалив строку т1 и столбец (7т1 из А1, получим матрицу Л2. В общем случае, пусть матрица Аг получена из А удалением строк т1,..., т(г — 1) и столбцов crrl,..., ат{г — 1), и пусть Я^ — число единиц в строке тг из Аг. (Оно не равно 0, поскольку ari-й столбец содержит 1.) Пусть L = L(g,t)= Ц RTi. Грубо говоря, можно рассматривать L как вычисление перманента Лентяем. Существуют RT\ возможностей выбора единицы в строке т1, каждая из которых ведет к различным вычислениям субперманента. Вместо этого Лентяй берет множитель RT\, берет одну из перестановок а и рассматривает А2. Поскольку a E 5 выбирается равновероятно, Лентяй стремится к максимальным субперманентам и поэтому не удивительно, что это приводит к завышенной оценке перманента. Чтобы сделать ее точной, мы определим геометрическое среднее G[V]. Если Y > О принимает значения ai,...,as с вероятностями Pi,...,ps соответственно, то G[Y] = ПаГ- Или, что то же, G[Y] = еЕ^1пУ1 Линейность математического ожидания переводит произведение средних геометрических в среднее геометрическое произведений. Утверждение. Имеет место неравенство рег(Л) ^ G[L]. Доказательство. Докажем это для произвольного фиксированного т. Для краткости положим т\ = 1. Проведем индукцию по размеру матрицы. Для удобства переупорядочим столбцы так, чтобы первая строка начиналась с г единиц, где г = г\. Для 1 ^ j ^ r пусть tj является перманентом матрицы, 2)Для произвольной матрицы Л — [a>ij] ее перманентом называется число рег(Л) = = Е<те§п Пг аг,°г- ~ Прим. ред.
Вероятностный взгляд: Теорема Брегмана 43 полученной из А удалением первой строки и j-ro столбца. Этот перманент равен числу перестановок а Е 5, таких, что о\ = j. Положим Г так что per (A) = rt при условии, что о\ = j. Произведение R2 • • • Rn представляет собой вычисление Лентяем величины рег(Л2), где матрица А2 получена из матрицы А удалением первой строки и j-ro столбца. По индукции G[R2---Rn\ol=3]>tj и, следовательно, С[Ь]^П(^)^/Рв^)=гП^/г*. 3=1 3=1 Для продолжения доказательства утверждения воспользуемся следующей леммой. Лемма. Справедливо неравенство Доказательство. Логарифмируя, приходим к эквивалентному неравенству 1 г - /_\tj lntj ^ tint, i=i которое вытекает из выпуклости функции f(x)=xlnx. Ш Применяя лемму, имеем г G[L] >гЦ t)/rt > г(*')1Л =rt = per(A). ■ 3 = 1 Теперь вычислим G[L] для фиксированной перестановки а. Для удобства проведем переупорядочение так, что аг = г для всех г, и предположим, что первая строка имеет единицы ровно в первых г\ столбцах. Столбцы 1,... ,г\ удаляются в порядке т, выбранном случайным образом из всех г\\ возможностей. R\ — число столбцов, остающихся в момент, когда первый столбец должен быть удален. Поскольку первый столбец может оказаться в любой из г\ позиций, то R\ равномерно распределен на множестве от 1 до п, и мы имеем G[R\] = (ri!)1/7*1. «Линейность» дает теперь G[L] = G IIя* \[G[Ri] = X{{r .\\i/n \_г=1 J i=l г=1 Величина G[L] является средним геометрическим условного G[L] и, следовательно, имеет то же значение. То есть pev(A)^G[L} = f[(ri\)1^. i=\
3_ Малые вариации Красота — важнейший тест: в мире нет места для некрасивой математики. Г. X. Харди Идея вероятностного метода сформулирована в гл. 1 следующим образом: пытаясь доказать, что некоторая структура с определенными свойствами существует, мы определяем подходящее вероятностное пространство структур, а затем показываем, что требуемые свойства выполняются в этом пространстве с положительной вероятностью. В этой главе рассматриваются ситуации, в которых «случайная» структура не обладает всеми требуемыми свойствами, а может иметь несколько изъянов. С помощью небольшой переделки мы удаляем эти изъяны, получая требуемую структуру. 3.1. ЧИСЛА РАМСЕЯ Напомним (см. гл. 1, разд. 1.1), что неравенство R(k,l) > п означает существование 2-раскраски ребер полного графа Кп в красный и синий цвета, при которой не существует ни красных подграфов Kk, ни синих подграфов Ki. Теорема 3.1.1. Для любого натурального п R(k,k)>n-(fj21-('). Доказательство. Рассмотрим случайную 2-раскраску ребер графа Кп, полученную раскраской каждого ребра независимо и равновероятно либо красным, либо синим цветом. Для всякого множества R из к вершин пусть Xr является индикатором следующего события: «индуцированный подграф Кп на множестве R является монохроматическим». Положим X = ^ Xr, где сумма берется по всем R. Из линейности математического ожидания вытекает, что Е[Х] = £Е[ХД] = т, гдет = (^V"®.
3.1. ЧИСЛА РАМСЕЯ 45 Таким образом, существует 2-раскраска, для которой X ^ га. Зафиксируем такую раскраску. Удалим по одной вершине из каждого такого монохроматического ^-множества. Понадобится удалить не более га вершин (возможно, что некоторая вершина удаляется более одного раза, но это ничему не мешает). Поэтому остается s ^ п—т вершин. Полученная раскраска на этих s вершинах не имеет монохроматических /с-множеств. ■ В заключение рассмотрим «оптимизационную» задачу получения наиболее сильной формы доказанного неравенства путем выбора подходящего значения п. Анализ показывает, что следует взять п ~ е~1к2к/2(1 — о(1)), при котором R(k,k)> -(1 + о(1))к2к/2. Внимательный анализ предложения 1.1.1 (см. гл. 1) дает нижнюю оценку Д(*,*)>^(1 + о(1))*2*/2. еу2 Более мощная локальная лемма Ловаса (см. гл. 5) позволяет получить R{k,k)>— (l + o(l))k2kt2. Исследование различий между этими границами может показаться нелогичным, поскольку наилучшая известная верхняя оценка для R(k,k) имеет вид (4+о(1))*. Для получения верхних оценок вероятностные методы не используются. Эти оценки можно найти, например, в [Graham, Rothschild and Spencer (1990)]. Мы даем все три нижние оценки, следуя философии нашего подхода, состоящего в главенстве методологии над результатами. Что касается недиагональных чисел Рамсея, то различия между базовым методом и перестройкой иллюстрируются следующими двумя результатами. Теорема 3.1.2. Если существует такое р Е [0,1], что СУ» + (?)(.-,)<» <i, то R(k,l) > п. Теорема 3.1.3. Для любых целых п и р Е [0,1] верно неравенство Д(*,0>»-(^)р«)-(,;)(1-рА Доказательство. В обоих случаях рассматривается случайная 2-раскраска графа Кп, полученная независимым раскрашиванием каждого ребра в красный или синий цвет, при котором ребро окрашивается красным цветом с вероятностью р. Пусть X — сумма числа красных /с-множеств и числа синих /-множеств. Из линейности математического ожидания следует, что E[X]=Q)p6) + (;)(l-p)(i).
46 Глава 3. МАЛЫЕ ВАРИАЦИИ В теореме 3.1.2 ЩХ] < 1, поэтому существует 2-раскраска с X = 0. В теореме 3.1.3 существует 2-раскраска с s «плохими» множествами (красными к-множествами или синими /-множествами), s ^ ЩХ]. Удаление по одной вершине из каждого плохого множества позволяет получить раскраску по крайней мере п — s вершин без плохих множеств. ■ Получение асимптотик для теорем 3.1.2, 3.1.3 может оказаться весьма сложным. Часто теорема 3.1.3 дает существенное улучшение по сравнению с теоремой 3.1.2. Дальнейшие продвижения могут быть получены с использованием локальной леммы Ловаса. Эти оценки проанализированы Спенсером; см. [Spencer (1977)]. 3.2. НЕЗАВИСИМЫЕ МНОЖЕСТВА Здесь приводятся короткие и изящные соображения, позволяющие, грубо говоря, доказать половину знаменитой теоремы Турана.. Пусть a(G) — максимальный размер независимого множества в графе G. Неравенство a(G) ^ t означает, что существует t вершин без ребер между ними. Теорема 3.2.1. Пусть граф G = (V, Е) имеет п вершин и nd/2 ребер, d ^ 1. Тогда a{G) ^ n/2d. Доказательство. Пусть 5 С V — случайное подмножество, определяемое равенством рф eS]=p, где р будет определено позднее. События v E 5 являются взаимно независимыми. Пусть X = \S\ и пусть У— число ребер в G\s- Для каждого е = {i,j} G Е обозначим через Ye индикатор события <d,j е 5». Тогда Y = YleeE^- Для каждого такого е имеем E[Ye]=Fr[i,jeS}=p2. В силу линейности математического ожидания, Е[У] = £Е[Уе] = ^2. е£Е Ясно, что ЩХ] = пр. Поэтому вновь в силу линейности математического ожидания, ЩХ-¥]=пр-Г^р\ Чтобы максимизировать эту величину, положим р = 1/d (здесь используется, что d ^ 1) и получим Таким образом, существует множество 5, для которого число вершин множества 5 минус число ребер в 5 не меньше n/2d. Выберем по вершине в
3.3. КОМБИНАТОРНАЯ ГЕОМЕТРИЯ 47 каждом ребре множества 5 и удалим их. Это приводит к множеству 5* с не менее чем n/2d вершинами. Все ребра разрушены, поэтому 5* — независимое множество. ■ Полное доказательство результата Ту рана дано в разд. «Вероятностный взгляд: теорема Турана» (после гл. 6). 3.3. КОМБИНАТОРНАЯ ГЕОМЕТРИЯ Рассмотрим множество 5 из п точек в единичном квадрате U. Обозначим через T(S) минимальную из площадей треугольников с вершинами в трех различных точках из 5. Положим Т{п) = maxТ(5), где максимум берется по семейству всех n-точечных подмножеств 5 множества U. Хейлбронн предположил, что Т(п) = 0(1/п2). Эта гипотеза опровергнута в работе [Komlos, Pintz and Szemeredi (1982)], где с помощью довольно сложной конструкции показано, что существует множество 5 из п точек множества С/, такое, что T(S) = Q(\ogn/n2). Поскольку это доказательство довольно громоздкое, мы приведем здесь более простое доказательство, показывающее, что Т(п) = П(1/п2). Теорема 3.3.1. Существует множество S из п точек в единичном квадрате U, такое, что T(S) ^ 1/(100п2). Доказательство. Сначала проведем некоторые вычисления. Пусть точки P,Q,R выбираются независимо и равновероятно из U. Обозначим через fi = fi(PQR) площадь треугольника PQR. Мы оценим величину Рг[/х ^ е] следующим образом. Пусть х — расстояние между Р и Q. При этом Рф ^ х ^ Ь + АЬ] ^ тг(Ъ + АЬ)2 - тгЪ2, а в пределе Рг[Ъ ^ х ^ Ь + db] ^ 2nbdb. Если расстояние между точками Р, Q равно 6, то высота, опущенная из R на прямую PQ, должна иметь величину h < 2s/6, и, таким образом, точка R должна лежать в полосе ширины Ае/b и длины не больше чем у/2. Это происходит с вероятностью, не превышающей 4у/2е/Ь. Так как 0 < b < л/2, искомая вероятность ограничивается сверху величиной ру/2 / (2тгЬ)(4>/2е/Ь)с» = 16тг£. Jo Пусть теперь точки Р\,..., Р2П выбираются независимо и равновероятно из С/, и пусть X обозначает число треугольников PiPjPk площади, меньшей чем 1/(140п2). Вероятность появления произвольной тройки г, j, k меньше чем О.бп-2, и поэтому ЩХ] < (23nVo.6n-2) < п. Таким образом, существует множество из 2п вершин, в котором менее п треугольников имеют площадь меньше, чем 1/(100п2). Удалим по вершине
48 Глава 3. МАЛЫЕ ВАРИАЦИИ из каждого такого треугольника. При этом остается не менее п вершин, но теперь уже нет треугольников, имеющих площадь, меньшую чем 1/(100п2). ■ Мы опишем следующую конструкцию Эрдёша, показывающую, что Т(п) ^ 1/(6(п - I)2) при простом п. На квадрате [0,п - 1] х [0, п - 1] рассмотрим п точек (х,х2), где х2 берется по mod п. (Более формально, (ж, у), где у = х2 mod п и 0 ^ у < п.) Если через некоторые три точки этого множества можно провести прямую, то она будет задаваться уравнением у = тпх + 6, где га — рациональное число со знаменателем, не превосходящим п. Но тогда в Z^ парабола у = х2 должна пересекать прямую у = тпх + Ь в трех точках, и, тем самым, квадратный трехчлен х2 — тпх — Ь имеет три различных корня, что невозможно. Площадь каждого треугольника с вершинами в целых точках плоскости является либо целым числом, либо половиной целого. Следовательно, эти площади должны быть не меньше 1/2. Сжимая плоскость путем деления обеих координат на п — 1, получаем требуемое множество. Хотя этот изящный результат лучше теоремы 3.3.1, он все еще слабее результата, полученного в [Komlos et al. (1982)]. 3.4. УПАКОВКА Пусть J — ограниченное измеримое подмножество пространства Rd, а через В(х) обозначен куб [0, x]d со стороной х. Упаковкой множества С в В(х) называется семейство взаимно непересекающихся копий множества С, каждая из которых лежит в В(х). Обозначим через f(x) наибольшую меру такого семейства. Константа упаковки определяется равенством 8(C) = ц(С) lim f{x)x~d, х—кх> где ц(С) — мера множества С. Таким образом, 8(C) —это максимальная доля пространства, которая может быть заполнена непересекающимися копиями множества С (Можно доказать, что предел в определении 8(C) всегда существует. Но даже без этого следующий результат имеет место с заменой lim на lim inf.) Теорема 3.4.1. Пусть множество С ограничено, выпукло и центрально симметрично относительно начала координат. Тогда 8(C) > 2~d-\ Доказательство. Пусть точки Р, Q выбираются независимо и равномерно из В(х). Рассмотрим событие «(С + Р) П (С + Q) ф 0». Для того чтобы оно произошло, мы должны иметь для некоторых с\, С2 Е С P-Q = Cl-c2 = 2^4^ е 2С в силу центральной симметрии и выпуклости. Событие Q E Q + 2C имеет вероятность, не превышающую ii(2C)x~d для любого заданного Q, следовательно, Рг[(С + Р) П (С + Q) ^ 0] ^ №C)x~d = 2dx~dix(C).
3.5. ПЕРЕКРАСКА 49 Теперь пусть Pi,... ,РП выбираются независимо и равномерно из В(х), а через X обозначено число тех г < j, для которых (С + Pi) П (С + Pj) ф 0. В силу линейности математического ожидания имеем ЩХ] ^ ^2dx-dfi(C). Следовательно, существует выборка из п точек с меньшим, чем указанное, числом пересекающихся пар копий множества С. Для каждой пары Pi,Pj с (С + Pi) П (С + Pj) ф 0 удалим или Р^, или Pj из множества. Остаются по меньшей мере п — ^2dx~d\i(C) непересекающихся копий множества С Положим п = xd2~d/fji(C), чтобы максимизировать это количество. Отсюда вытекает существование по меньшей мере xd7~d~1 / fi(C) попарно непересекающихся копий множества С. Не все они лежат внутри В(х), но, обозначив через w верхнюю оценку абсолютных величин координат точек множества С, мы обнаружим, что они все лежат внутри куба со стороной x + 2w. Следовательно, f(x + 2w) >xd2-d-xlix{C), а значит, 8(C) ^ lim ii(C)f(x + 2w)(x + 2w)~d ^ 2"d"1. ■ x—>oo Обычный жадный алгоритм дает несколько лучший результат. Пусть Р\,...,Рш — какое-нибудь максимальное подмножество множества [0,x]d, обладающее тем свойством, что множества C+Pi не пересекаются. Мы заметили, что C+Pi перекрывает С+Р тогда и только тогда, когда Р Е 2С+Рг- Следовательно, множества 2С + Рг должны покрывать [0, x]d. Поскольку каждое такое множество имеет меру /х(2С) = 2d//(C), необходимо чтобы т ^ xd2~dj\х[С). Как и прежде, все множества C + Pi лежат в кубе со стороной х + 2ги, где w — константа. Поэтому /(ж + 2w) ^ m ^ xd2~dlii{C) и, значит, 5(C) > 2~d. Дальнейшие улучшения еще появятся в разд. «Вероятностный взгляд: эффективная упаковка» (после гл. 13). 3.5. ПЕРЕКРАСКА Предположим, при случайной раскраске возникает некоторое множество дефектов. Тогда мы применяем случайную перекраску к дефектам с целью их удаления. Если перекраска является слишком слабой, то не все дефекты устраняются. Если перекраска является слишком сильной, то создаются новые дефекты. Интенсивность перекраски задается параметром р, а указанные две возможности соответствуют убыванию и возрастанию некоторых функций параметра р. Последующие вычисления дают нам оптимальное значение р. Мы используем определение свойства В из разд. 1.3. Свойство В: т(п) > п
50 Глава 3. МАЛЫЕ ВАРИАЦИИ означает, что для данного n-однородного гиперграфа Н = (V, Е) с т ребрами существует 2-раскраска множества V такая, что никакое ребро не является монохроматическим. Бек в [Beck (1978)] улучшил оценку Эрдёша (1938), доказав, что т(п) = Q(2nn1^3). С использованием его методов доказано (см. [Radhakrishnan and Srinivasan (2000)]), что ra(n) = ft(2n(n/ Inn)1/2). Именно это доказательство и будет представлено. Оно не является ни длинным, ни технически сложным и разбито на ряд тонких и красивых шагов. Не удивительно, что понадобилось тридцать пять лет, чтобы его найти. Как было сказано, верхняя и нижняя оценки для т(п) по-прежнему далеки друг от друга. Теорема 3.5.1. Если существует р Е [0,1], удовлетворяющее условию к(1-р)п + к2р< 1, то т(п) > 2п~1к. Следствие 3.5.2. Справедливо равенство т(п) = Q(2n(n/\nn)1^2). Доказательство следствия 3.5.2. Используем неравенство 1 — р ^ е~р. Функция ке~рп + к2р принимает наименьшее значение при р = \п(п/к)/п. Подставляя это значение, получаем к2 — [1 + ln(n/fc)] < 1. п Тем самым условие теоремы 3.5.1 выполнено. Это неравенство справедливо при к = с(п/ Inn)1/2 для всех с < у/2 и достаточно больших п. Ш Условие теоремы 3.5.1 в некотором смысле типично. Необходимо, чтобы общая вероятность ошибки была меньше 1, причем имеется два типа ошибок. Часто удается найти разумные границы наложением более сильных требований, чем те, при которых ошибка каждого типа имеет вероятность меньше 1/2. Здесь к9р < | дает р ^ \к~2. Подставляя максимально возможное р во второе неравенство к(\ — р)п ^ |, получаем 2к2 1п(2/с) < п. Это справедливо также и при к = (^(n/lnn)1/2, хотя при этом мы имеем более слабое условие с < 9. Можно рекомендовать этот грубый подход в качестве первой попытки решения задачи, когда приблизительный разброс параметров еще под сомнением. Тонкости вычислений можно оставить до публикации работы! Доказательство теоремы 3.5.1. Зафиксируем гиперграф Н = (V,E) с т = 2п~1к ребрами и число р, удовлетворяющее условию теоремы. Мы опишем рандомизированный алгоритм, приводящий к раскраске множества V. Проведем предварительную обработку случайности: для каждой вершины v G V бросим сначала первую монету, при этом герб выпадает с вероятностью ^, а затем — вторую монету, при этом герб выпадает с вероятностью р (представляя потенциальную перекраску). Вдобавок (это важно) заметим, что вершины из множества V упорядочены случайно. Шаг 1. Раскрасим вершину v E V в красный цвет, если при соответствующем
3.5. ПЕРЕКРАСКА 51 подбрасывании первой монеты выпал герб. В противном случае раскрасим ее синим. Назовем это первой раскраской. Обозначим через D (в честь dangerous) множество вершин v e V, которые лежат в некотором (возможно, в нескольких) монохроматическом ребре е Е Е. Шаг 2. Рассмотрим элементы множества D последовательно в (случайно выбранном) порядке на V. Вершина d рассматривается как все еще опасная, если существует некоторое ребро ееЯ (их может быть несколько), содержащее d и являвшееся монохроматическим при первой раскраске, для которого ни одна вершина еще не изменила цвет. Если d не является все еще опасной, то не делаем ничего. Но если она все еще опасна, то бросаем вторую монету. Если выпадает герб, то изменяем цвет вершины d, иначе ничего не меняем. Назовем раскраску финальной, если она стабилизировалась и далее не меняется. Скажем, что алгоритм срабатывает неудачно, если в результате раскраски некоторое ребро оказывается монохроматическим. Оценим вероятность ошибки сверху величиной /с(1 — р)п + к2р. Предположение теоремы 3.5.1 тогда гарантирует нам, что с положительной вероятностью алгоритм заканчивается успешно. Отсюда с помощью наших обычных рассуждений получаем, что существует способ применения алгоритма, приводящий к финальной раскраске без монохроматических ребер е, а тем самым, существует 2-раскраска множества V без монохроматических ребер. Для определенности оценим вероятность того, что некоторое ребро е Е Н в финальной раскраске является красным. Вероятность неудачного срабатывания алгоритма превышает ее не более чем в два раза. Ребро е Е Е может оказаться красным в финальной раскраске в двух случаях. Либо е было красным после первой раскраски и остается таковым до финальной раскраски, либо е не было красным после первой раскраски, но стало красным при финальной раскраске. (Из определения алгоритма следует, что вершина не может изменить цвет более одного раза.) Пусть Ае будет первым событием, а Се — вторым. Тогда Рг[Ле] = 2-"(1-р)п. Первый множитель есть вероятность того, что е стало красным при первой раскраске, т. е. на первом шаге при всех соответствующих подбрасываниях монеты выпал герб. Второй множитель есть вероятность того, что при всех оставшихся подбрасываниях монеты выпала решетка. Если все подбрасывания сделаны, то ни одна из вершин v E е не перекрасится на шаге 2. Наоборот, если при каком-либо подбрасывании на втором шаге выпал герб для некоторой вершины v E е, то существует первая (в данном упорядочении) вершина v, для которой выпал герб. Когда эта вершина v была еще опасной, ребро е было монохроматическим, и поэтому v ждала выпадения герба на втором шаге для изменения своего цвета. Имеем 2^Pv[Ae] = k(l-p)n, еен что является первым слагаемым вероятности неудачи.
52 Глава 3. МАЛЫЕ ВАРИАЦИИ В доказательстве Бека, приведенном в первом издании нашей книги, в котором понятие «все еще опасная» отсутствовало, каждая вершина меняла цвет тогда и только тогда, когда на втором шаге выпадал герб. Значения Рг[Ле] = 2_п(1 — р)п одинаковые в обоих доказательствах. Бек получил оценку Pr[Ce] ^ к2рерп. Новое доказательство позволяет избежать лишних перекрасок и приводит к лучшей оценке для Рг[Се]. Мы переходим к хитроумной оценке вероятности Рг[Се]. Для различных ребер е, / Е Е скажем, что е осуждает f если: • ребра е, / пересекаются в точности по одной вершине (обозначим ее через v); • при первой раскраске ребро / было синим, а ребро е при финальной раскраске стало красным; • на шаге 2 вершина v была последней из принадлежащих ребру е, которая изменила синий цвет на красный; • когда v меняет свой цвет, ребро / все еще полностью синее. Предположим, что имеет место событие Се. Некоторые вершины ребра е меняют цвет с синего на красный так, что существует последняя вершина v, изменившая цвет. Но почему v требует бросания монеты? Она должна быть все еще опасной. То есть v должна лежать в некотором (возможно, в нескольких) множествах /, которые являются синими при первой раскраске и остаются все еще синими в момент, когда v рассматривается. Могут ли е и / пересекаться по некоторой другой вершине v'l Нет! Такой вершине v' было бы необходимо быть синей при первой раскраске (так как v' Е /) и красной при финальной раскраске (поскольку v' E е). Но тогда v' меняет цвет раньше, чем v. Значит, / не является полностью синим, когда v рассматривается, и поэтому е не может осуждать /. Следовательно, когда Се имеет место, е осуждает некоторое /. Обозначим через Bef событие «е осуждает /». Тогда ]Ге Pr[Ce] ^ Se^/^M^e/]- Поскольку существует меньше чем (5П_1А:)2 пар е ф /, теперь достаточно показать, что Рг[Ве/] < 28_2пр. Пусть зафиксированы е, /, такие, что е П / = {v} (иначе Bef не может произойти). Случайное упорядочение множества V порождает случайный порядок а на eU/. Пусть г = г(а) обозначает число вершин v' E е, встречающихся перед v в этом порядке, и пусть j = j(a) есть число вершин v' E /, встречающихся перед v. Фиксируя сг, мы имеем Рг[Ве/|а] < г2-п+\1-рУ2-п+^ (!±^У . Будем рассматривать множители по одному. Во-первых, вершина v сама должна быть сначала синей и превратиться в красную. Во-вторых, все другие v' E / должны быть сначала синими. В-третьих, все v' E / встречаются раньше чем v при перекраске. В-четвертых, вершины v' E е, встречающиеся после v, должны быть вначале красными (так как v — последняя вершина множества е, которая меняет цвет). Наконец, все v' E е, встречающиеся перед v, должны либо сначала быть красными, либо сначала быть синими, но перекраситься в красный. Последний множитель можно оценить сверху достаточно точно. Те
3.6. НЕПРЕРЫВНОЕ ВРЕМЯ 53 вершины v' G е, которые встречаются перед v и являлись вначале синими, не только требуют второго подбрасывания монеты и выпадения герба, но, кроме того, сами должны лежать в некотором еЧЯ, ставшем монохроматическим после первой раскраски. Попытки дальнейшего улучшения оценок величины т(п) часто концентрируются на этом, но (до сих пор!) они оказывались безуспешными. Теперь мы имеем Pr[Bef]^21-2npE[(l+p)i(l-Py], где математическое ожидание берется при равновероятном выборе упорядочения а. Следующая жемчужина завершает доказательство. Лемма 3.5.3. Справедлива оценка: Е [(1 +р)г(1 -p)j] ^ 1. Доказательство. Зафиксируем некоторое соответствие между е \ {v} и /\ {г;}, держа в уме м-ра и миссис Джонс, м-ра и миссис Смит, и т. д. Никаких ограничений на количество лиц, которые приходят перед v, в паре нет (двое Джонсов, один Смит, никого из Тейлоров, и т. д.). Условное математическое ожидание величины (1 +р)г(1 — р)-7 раскладываем на множители для каждой пары. В случае отсутствия Тейлоров соответствующий множитель отсутствует. Если Джонсов двое, присутствует множитель (1 +р)(1 — р) ^ 1. Если Смит один, то с равной вероятностью присутствует ровно один из множителей 1 + р или 1 — р. Таким образом, условное математическое ожидание заменяется множителем 1. Каждый множитель не превышает 1, поэтому их произведение не больше 1. ■ Отсюда вытекает требуемый результат. ■ 3.6. НЕПРЕРЫВНОЕ ВРЕМЯ Дискретные случайные процессы могут иногда изучаться путем помещения их в рамки непрерывного времени. Это позволяет применить мощные методы математического анализа (например, интегрирование). Такой подход оказывается наиболее эффективным, когда речь идет о случайных упорядочениях. Ниже приводятся два примера. Свойство В. Мы модифицируем доказательство оценки т(п) = = ft(2nn1^2 ln~ ' n) из предыдущего раздела. Припишем каждой вершине v G V «момент рождения» xv. Тогда xv— это независимые действительные переменные, каждая из которых равномерно распределена на отрезке [0,1]. При этом порядок на множестве V задается упорядочением (относительно ^) величин xv. Мы утверждаем, что Рг[Ве/] < ]Г (П~ V-2" fxlpl+\l - хрГ~1 dx.
54 Глава 3. МАЛЫЕ ВАРИАЦИИ Для Т С e\{v} обозначим через Бе/т следующее событие: «выполнено Ре/, и при первой раскраске ребро е содержит в точности Г U {v} синих вершин». Имеется (п~^1) способов выбора /-множества Г при /, меняющемся от 0 до п — 1. Тогда первая раскраска множества е U / определена и имеет вероятность появления, равную 21_2п. Предположим, что v имеет момент рождения xv = е. Для всех w Е T U {v} при втором подбрасывании монеты должен выпадать герб. Вероятность этого равна р1^1. Все w Е T должны родиться раньше v, т. е. х™ < х, что выполняется с вероятностью х1. Ни для какой вершины ги € / \ {г;}, рождающейся прежде v, при бросании монеты не может выпасть герб. Каждая такая w имеет вероятность рождения хр, а вероятность того, что ни одна из w не родится, равна (1 — хр)п~1. Поскольку величина xv = х равномерно распределена в [0,1], мы интегрируем по х. Суммируя по /, имеем Pr[Be/] ^ 21"2пр / (1 + жр)п"1(1 - хр)71-1 dx. Jo Подынтегральное выражение всегда не превосходит единицы, поэтому Pr[Bef] < 21~2пр. Остающаяся часть доказательства не меняется. Случайная жадная упаковка. Пусть Н — (к + 1)-однородный гиперграф на множестве вершин V размера N. Элементы е Е Я, называемые ребрами, являются просто (fc+1)-подмножествами множества V. Мы предполагаем, что выполнены следующие условия: Условие на степени: каждая вершина v €V принадлежит в точности D ребрам. Условие на ко-степени: любая пара v,v' eV имеет не более o(D) общих ребер. Мы предполагаем, что к фиксировано (к = 2 является иллюстративным примером), а асимптотика рассматривается при TV, D —► оо без какой-либо связи между N и D. Упаковка —это семейство Р непересекающихся по вершинам ребер е Е Н. Ясно, что \Р\ ^ N/(k + 1). Определим рандомизированный алгоритм получения (не обязательно оптимальной) упаковки. Припишем каждому ребру е Е Н равномерно и независимо момент рождения хе Е [0,D). (Выбор [0,D) вместо [0,1] сделан по техническим соображениям. Заметим, что поскольку хе —действительные величины, с вероятностью 1 они независимы.) В нулевой момент Р = 0. При изменении времени от 0 к D в момент рождения ребра е оно добавляется к Р по возможности — т. е. всегда, когда не существует ребра е' Е Р, пересекающегося с е. Пусть Рс обозначает величину Р в точности перед моментом с, когда все е с временем рождения te < с уже рассмотрены. Положим PFINAL = pD. Заметим, что к моменту D все ребра появились, а их появления совершались в случайном порядке. Таким образом, pFiNAL Идентична дискретному процессу (часто называемому вероятностным жадным алгоритмом), при котором ребра гиперграфа Н сначала случайно упорядочиваются, а затем рассматриваются последовательно. Теорема 3.6.1 [Спенсер (1995)]. Математическое осисидание величины |pFINAL| асимпгпотически равНО N/(k + 1).
3.6. НЕПРЕРЫВНОЕ ВРЕМЯ 55 Скажем, что вершина v Е V живет в момент с, если ни одно из ребер е € Рс не содержит v. Обозначим через 5С множество таких v € V. Вместо pFiNAL будем рассматривать Рс, где с — произвольное действительное число. Пусть # /(c)=limPr[i7GSc], где, формально, мы имеем ввиду, что для всякого е > 0 существуют Do, No и J > 0, такие, что если Я является (fc+ 1)-однородным гиперграфом на TV > 7V0 вершинах, каждая вершина v содержится в D > Do ребрах, а каждая пара вершин v,vf £ V имеет меньше чем SD общих ребер, то |/(с) - Рг[г; € 5С]| < е для всех v € V. Главная часть доказательства состоит в том, чтобы показать, что /(с) существует как величина, определяемая некоторым процессом, состоящим из актов рождения (и смерти) и происходящим в непрерывном времени. Теперь мы опишем такой процесс, опуская некоторые эпсилон-дельта манипуляции, необходимые для формального доказательства существования предела. Наш процесс начинается в момент с, а время движется к 0. Он начинается с корня Ева (это наша «очеловеченная» вершина v). Ева производит потомство во временном интервале [0,с). Число родов распределено по закону Пуассона со средним значением с, а моменты родов распределены равномерно. [Это стандартный пуассоновский процесс с интенсивностью 1. Его можно понимать также следующим образом: на произвольно малом интервале времени [я, х + dx) Ева может с вероятностью dx произвести потомство, и эти события независимы для непересекающихся интервалов]. При каждых родах наша плодовитая Ева всегда производит на свет к потомков. Плодовитость каждого потомка подчиняется тем же правилам. Так, если длительность репродуктивного периода Алисы равна х, то число родов (в нашей однополой модели) имеет пуассоновское распределение со средним х, а моменты времени родов равномерно распределены в промежутке [0,х). Результирующее случайное дерево Т = Тс, как можно показать, является конечным (ввиду конечности интервала) с вероятностью 1. В произвольно заданном конечном дереве Т каждая вершина (назовем ее, скажем, «Алисой») остается в живых или умирает согласно следующей схеме. Правило Менендеса: если Алиса дала жизнь множеству (или, быть может, нескольким множествам) из к потомков, каждый из которых остается живым, она умирает. В противном случае она остается живой. В частности, если Алиса бездетна, она продолжает жить. Таким образом, по дереву мы можем определить для каждой вершины, жива она или нет. Пример. Пусть с = 10, к = 2. Ева производит на свет Алису и Барбару в момент 8.3, а затем Рэчел и Сиенну в момент 4.3. Алиса рожает Нэнси и Оливию в момент 5.7, а Рэчел рожает Линду и Маявати в момент 0.4. Других родов нет. Остаются в живых Нэнси, Оливия, Линда, Маявати, Барбара и Сиенна. В соответствии с деревом, Алиса и Рэчел умирают. Ни при каком из родов оба потомка не остаются в живых, поэтому Ева продолжает жить.
56 Глава 3. МАЛЫЕ ВАРИАЦИИ Обозначим через /(с) вероятность того, что корневая вершина Ева остается живой в случайном родословном дереве Т = ТС. Определим дерево Т = Tc(v) для произвольной вершины v € Н. Для каждого ребра е, содержащего вершину v с моментом рождения t = te < с, скажем, что е \ {v} есть множество к потомков, порожденных вершиной v в момент t. Мы действуем рекурсивно. Если w родилась в момент £, то для всякого е', содержащего w с моментом рождения t' = te> < t, мы скажем, что е' \{w} есть множество к потомков, рожденных вершиной w в момент t'. Возможно, что этот процесс не дает дерево, так как одна и та же вершина w может достигаться более чем одним путем. Простейшим примером является ситуация, когда v € е,е', где оба имеют момент рождения, меньший чем с, и ребра е, е' имеют еще одну общую вершину w. Тогда процесс является вырожденным, a,Tc(v) не определено. Докажем, что для произвольно заданного дерева Т * ШпРгрВД ^ Т] = Рг[Тс = Т]. (3.1) Поскольку ^тРг[Тс = Т] = 1, это является косвенным аргументом в пользу того, что процесс определения Тс(у) почти никогда не является вырожденным. Мы построим Tc(v) поэтапно. Сначала рассмотрим D ребер е, содержащих вершину v. Число таких ребер с моментом рождения te < с имеет биномиальное распределение B[D,-^], сходящееся к пуассоновскому со средним значением с. При условии, что существует / таких ребер е, их моменты рождения te распределены равномерно. По ко-степенному условию существует o(D2) пар е,е7, содержащих v и еще некоторую другую вершину. Значит, вероятность того, что два ребра е,е7 имеют момент рождения меньше чем с, есть о(1). Теперь предположим, что дерево Tc(v) построено до определенного уровня, и вершина w рождена в момент t. Существует только o(D) общих ребер между w и любыми из конечного числа уже рожденных к этому моменту вершин w'. Поэтому существуют все еще ~ D ребер е, содержащих w и не содержащих никакой другой вершины w'. Далее рассмотрим моменты их рождения. Число вершин с te < х имеет биномиальное распределение B[D—o(D), j|], сходящееся к распределению Пуассона со средним значением х. Как и прежде, почти наверное не существует двух таких ребер е, е' с общей вершиной, отличной от w. Для любого фиксированного Т величина Pv[Tc(v) = Т] является суммой конечного числа таких пределов, что позволяет нам сделать заключение о справедливости равенства (3.1). Для с < d случайное дерево Td включает Тс, состоящее из вершин, соответствующих тем родам Евы, которые происходят в интервале [0, с). Если Ева жива в дереве Х^, она должна быть жива и в Тс. Следовательно, f(d) < /(с). Мы утверждаем, что .. г/ ч hm /(c) = О, с—юо ибо в противном случае невозрастающая функция / имела бы предел L > О и f(x) ^ L. Предположим, что к моменту Тс Ева производит потомство г раз. Для каждого акта рождения существует вероятность по меньшей мере Lfc, что все к потомков живы. Вероятность того, что Ева жива, не больше (1 — Ьк)г. Так как число родов Евы распределено по Пуассону со средним значением с,
3.6. НЕПРЕРЫВНОЕ ВРЕМЯ 57 имеем ^ /(cK£e-c£(l-L*)<=e-L4 г=0 %' Но тогда limc—oo /(c) = 0. Приходим к противоречию. В силу линейности математического ожидания Е[|5С|] —» f(c)n. Поскольку (fc+l)|Pc|+|Sc| = п, имеем Е[|РС|] -> (1-/(с))п/(/с+1). Но E[|PFINAL|] ^ Е[|РС|]. Мы делаем /(с) произвольно малой, выбирая константу с достаточно большой, такчтоЕ[|РГШАЬ|] ^ (l-o(l))n/(fc+l). Поскольку |P™AL| ^ n/(fc+i) всегда, теорема доказана. ■ Замечание. В действительности, мы можем сказать о /(с) больше. Для малого Ас имеем /(с+ Ас) — /(с) ~ —(Ac)/(c)fc+1. Это, грубо говоря, означает, что Ева, начиная с момента с + Ас, могла бы производить потомство во временном интервале [с, с+ Ас) (причем потомки, родившиеся в этом интервале живы), и в то же время не иметь родов в интервале [0, с) с остающимися в живых потомками. При Ас —» 0 приходим к дифференциальному уравнению /'(с) = —/(c)fc+1. Начальное значение /(0) = 1 дает единственное решение /(с) = (1 + c/c)_1/fc. Интересно было бы положить с — D. Но это недопустимо, поскольку наши предельные соображения распространяются на фиксированные с при Лг, D —» оо. Тем не менее это бы повлекло £[|5d|] = 0(ND~1^k), а это означает, что вероятностный жадный алгоритм оставлял бы 0(ND~1^k) вершин непокрытыми. Предположим, мы заменили ко-степенное условие на более сильное, что каждая пара различных вершин v,v' € V имеет не более одной общей вершины. Компьютерное моделирование показывает, что в подобных случаях жадный алгоритм оставляет непокрытыми 0(ND~1^k) вершин. Это означает, что вопрос по-прежнему открыт, хотя в работе [Alon, Kim and Spencer (1997)] доказано, что в таких случаях неплохо работает модифицированная версия жадного алгоритма. Следствие 3.6.2. В условиях теоремы существует упаковка Р размера ~N/(k + l). Доказательство. Мы определили случайный процесс, который дает упаковку с ожидаемым размером ~ N /{к + 1), и теперь с помощью наших обычных приемов убеждаемся в том, что такая упаковка Р должна существовать. ■ В частности, это дает альтернативное доказательство гипотезы Эрдёша— Ханани, впервые доказанной Рёдлем (см. разд. 4.7). Мы используем определения этого раздела и определяем число т(п, к, I) как максимальный размер семейства F из /с-элементных подмножеств множества [п] = {1,..., п}, такой, что не существует /-множества, содержащегося в более чем одном /с-множестве. Определим гиперграф Н = Я(п, /с, /) следующим образом: вершины гиперграфа Н суть /-элементные подмножества множества [п]. Для каждого /с-эле- ментного множества А С [п] определим ребро ел как множество /-элементных подмножеств множества А. Тогда семейство F, удовлетворяющее указанным
58 Глава 3. МАЛЫЕ ВАРИАЦИИ выше условиям, соответствует упаковке Р = {ел '• А € F} в Н. Гиперграф Н имеет N = (™) вершин. Каждое ребро ел имеет размер К + 1 = (^). Каждая вершина содержится в D = (£l{) ребрах. Число ребер, содержащих две вершины v,v'', зависит от их пересечения. Оно максимально (при v ф г/), когда v,v' (рассматриваемые как /-множества) пересекаются по / — 1 точкам, т. е. (£1/1 J) • Мы предполагаем (как в разд. 4.7), что /с, / фиксированы и п —► схэ, а значит, число общих ребер есть o(D). Предположение из разд. 4.7 дает при фиксированном К + 1 и N, D —► оо существование упаковки Р, такой, что т(п,к,1) = \Р\ ~ N/(K +1) ~ Щ. 3.7. УПРАЖНЕНИЯ 1. Доказать, что число Рамсея г (к, к) для каждого целого п удовлетворяет неравенству г(к,к)>п-(Пк\21-®, откуда следует, что r(fc,fc)^(l-o(l))-2fc/2. е 2. Доказать, что число Рамсея г(4, к) удовлетворяет неравенству r(4,fc) ^П((к/\пк)2). 3. Доказать, что каждый 3-однородный гиперграф с п вершинами и т ^ п/3 ребрами содержит независимое множество размера по меньшей мере 2п ' 3\/3 у/т' 4* Показать, что существует конечное по, такое, что любой ориентированный граф на п > по вершинах, в котором степень исхода не меньше log2 n — jq log2 log2 n, содержит четный простой цикл.
ВЕРОЯТНОСТНЫЙ ВЗГЛЯД: Большой обхват и большое хроматическое число Многие рассматривают следующее ниже утверждение как одно из самых красивых применений вероятностного метода, поскольку сам результат удивительный и, на первый взгляд, не предполагает неконструктивного доказательства. Обхватом girth(G) графа G называется размер его кратчайшего цикла. Через a(G) обозначается максимальный размер независимого множества в G, а через х(^)— хроматическое число G. Теорема [Erdos (1959)]. Для любых k J существует граф G с обхватом girth(G) > I и x(G) > к. Доказательство. Зафиксируем 9 < 1/1 и положим G ~ G(n,p) с р = пв~1. (То есть G — случайный граф на п вершинах, порождаемый выбором каждой пары вершин в качестве ребра случайно и независимо с вероятностью р). Пусть X — количество циклов размера, не превосходящего /. Тогда I / \ l Qi г=3 г=3 так как 91 < 1. В частности, Рг[Х ^ п/2] = о(1). Положим х = |~! Inn\, тогда Pr[a(G) > х] ^ fn\l-p)& < [ne-**-1*/2]* = о(1). Пусть п настолько велико, что оба события имеют вероятность, меньшую чем 0.5. Тогда существует граф G с менее чем п/2 циклами длины, не большей /, и с ot(G) < Зп1~в\пп. Удалим из G по вершине из каждого цикла длины, не превышающей /. Получим граф G* по крайней мере с п/2 вершинами. При этом G* имеет обхват больше чем / и a(G*) ^ a(G). Таким образом, a(G*) " ?>п1-в\ъп 61пп' Чтобы завершить доказательство, возьмем п достаточно большим с тем, чтобы последнее было больше к. Ш
4 Второй момент Вы можете не верить в Бога, но должны верить в Книгу. ^ Пол Эрдёш 4.1. ОСНОВЫ После математического ожидания наиболее используемым статистическим понятием для случайной величины X является дисперсия. Мы обозначаем ее через Var[X]. Она определяется равенством Var[X] = Е[(Х - Е[Х})2} и является мерой отклонения величины X от своего математического ожидания. Следуя обычной практике, будем обозначать через // математическое ожидание, а через а2 — дисперсию. Положительный квадратный корень а из дисперсии называется стандартным отклонением. При этих обозначениях нашим основным инструментом будет следующее утверждение. Теорема 4.1.1 (неравенство Чебышёва). Для любого положительного Л Pr[|X-/i|>A<rK^. Доказательство. Имеем а2 = Var[X] = Е[{Х - /х)2] ^ AV Pr[|X -/л\ ^ \<г]. Ш Использование неравенства Чебышёва принято называть методом второго момента. Неравенство Чебышёва неулучшаемо, если нет никаких дополнительных ограничений на X. Например, если X принимает значения // + Ха и // — Ха с вероятностью А2/2, а значение \i — с вероятностью 1 — А2, то неравенство превращается в равенство. Заметим, однако, что если X имеет нормальное 1) Смысл высказывания станет понятным после прочтения приложения В.4. — Прим. ред.
4.2. ТЕОРИЯ ЧИСЕЛ 61 распределение со средним \х и стандартным отклонением <7, то Pr[|X -fx\^Xa}=2 -^e-t2/2dt. JX \/27Г Для больших Л эта вероятность асимптотически равна >/2/7ге_л /2/Л, что существенно меньше 1/Л2. В гл. 7 и 8 будут рассмотрены примеры, когда X является суммой «почти независимых» случайных величин, и подобные улучшенные оценки оказываются справедливыми. Предположим, что X = Х\ + ... + Хт. Тогда Var[X] может быть подсчитана по формуле 771 Var[X] = J2 Var[J*Q] + ^ Cov[J*Q, X,]. г=1 i^j Здесь вторая сумма берется по упорядоченным парам (i,j) ^ (j, г), а ковариа- ция Cov[Y, Z] определяется следующим образом: Соу[У, Z] = E[YZ] - E[y]E[Z]. Если случайные величины Y и Z независимы, то Соу[У, Z] = 0. Это часто существенно упрощает вычисление дисперсии. В дальнейшем мы предполагаем (это всегда будет выполняться в последующем), что Х{ являются индикаторами некоторых событий, т. е. Х{ = 1, если событие А{ происходит, и Х{ = 0 иначе. Если Xi равна единице с вероятностью pi = Рг[Л»], то Var[Xi] = Pi(l - Pi) ^Pi = E[Xi], и поэтому Var[X] ^ E[X] + ^2Cgv[XuXj]. 4.2. ТЕОРИЯ ЧИСЕЛ Метод второго момента оказывается эффективным в теории чисел. Пусть v(ri) обозначает количество простых чисел р, делящих п. (Мы не учитываем кратность, хотя это приводит к некоторым отличиям.) Следующий результат утверждает, грубо говоря, что «почти все» п имеют число простых делителей «весьма близкое» к In In п. Это впервые было обнаружено Харди и Рамануд- жаном в 1920 г. с помощью весьма сложного доказательства. Мы представим здесь удивительно простое доказательство, принадлежащее Турану [Тигап (1934)] и сыгравшее ключевую роль в развитии вероятностных методов в теории чисел. Теорема 4.2.1. Пусть и(п) —► оо произвольно медленно. Тогда число тех х из множества {1,..., п}, для которых \v(x) - lnlnn| > u(n)V\n\nn, есть о(п).
62 Глава 4. ВТОРОЙ МОМЕНТ Доказательство. Пусть х случайно выбирается из множества {1,..., п}. Для простого р положим если р\х, ■а I 0 иначе. Пусть М = п1/10 и X = ^Г,ХР, где суммирование ведется по всем простым р ^ М. Поскольку никакое х < п не может иметь более десяти простых делителей, больших М, мы имеем v(x) — 10 ^ Х(х) ^ v{x), и, тем самым, границы больших уклонений для X переходят в асимптотически равные им границы для и. (Здесь число 10 может быть заменено любой другой достаточно большой константой.) Имеем Е[*р] = Ж п Поскольку у — 1 < [у\ < у, то Е[Хр] = 1/р + 0(1/п). В силу линейности математического ожидания E[X]=£Q + oQ))=lnlnn + 0(l). Здесь мы использовали хорошо известный факт, что ^2р<х - = lnlnx + 0(l), который может быть доказан комбинированием формулы Стирлинга с суммированием по Абелю. Теперь мы найдем асимптотическое выражение для Var[X] = Y, Var[Xp] + ^Cov[Xp,X9]. р^М p^q Поскольку Var[Xp] = ±(1 - ±) + 0(£), то £ Var[Xp] = ( £ M +0(1) =lnlnn + 0(l). p^M \p^MP/ Для различных простых рид равенство XpXq = 1 выполняется тогда и только тогда, когда р\х и д|ж, что эквивалентно pq\x. Следовательно, Cov[Xp,Xq] = E[XpXq] - ЩХрЩХд] = ^ - ^^ < 1 Л lwl Г 11 1 < К- - + -)• pq p n q n n p q Таким образом, ^—' у п *-^ \р qj п *-^ р
4.2. ТЕОРИЯ ЧИСЕЛ 63 Отсюда Y2Cov[Xp,Xq] < 0(n"9/10 In Inn) = o(l), Рт^<? и, аналогично, ^Cov[Xp,Xg]>-0(l). р^<? То есть ковариации не влияют на дисперсию, Var[X] = In Inn + O(l) и неравенство Чебышёва приводит к соотношению Рг \Х - lnlnn| > AVlnlnn < A"2 + о(1) для любой константы А > 0. Так как \Х — v\ ^ 10, то же самое справедливо для v. Ш В классической работе [Erdos and Kac (1940)] показано, что распределение случайной величины v приблизительно нормально с математическим ожиданием и дисперсией, равными In In п. Сформулируем точный результат. Теорема 4.2.2. Пусть А — произвольное фиксированное число (положительное, отрицательное или ноль). Тогда lim — п—>оо П /»00 -I {х : 1 < х ^ п, z/(x) ^ In In п + \Vln\nn} = / —=е~£ l2dt. 1 Л V27T Доказательство. Мы представим набросок доказательства, подчеркивающий связь с доказательством Турана. Зафиксируем функцию s(n) такую, что s(n) —► ехэ и s(n) = o^lnlnn)1/2). Например, s(n) = In In In n. Пусть M = nl/s(n\ Положим X = ^Г,ХР, где суммирование ведется по всем простым р < М. Так как никакое х ^ п не может иметь больше s(n) простых множителей, превосходящих М, мы имеем v(x) — s(n) ^ X(x) < v(x). Поэтому достаточно доказать теорему 4.2.2 с заменой i/наХ. Пусть Yp — независимые случайные величины, для которых Рг[У^ = 1] = р-1, Рг[У^ = 0] = 1 — р-1, и пусть Y = ^2 Yp — сумма по всем простым р ^ М. Такое Y представляет собой идеализированную версию X. Положим fi = Е[У] = ^2 р-1 = In Inn + o^lnlnn)1/2), р^М a2=Va,v[Y}= ^ p~l{\ - p~l) ~ In Inn p^M и определим нормированную величину Y = (Y — ц)/а. По центральной предельной теореме, Y сходится к случайной величине N со стандартным нормальным распределением, при этом E[Ffc] —► E[iVfc] для всякого положительного целого к. Положим X = (X — fi)/a. Сравним X и Y. Для любых различных простых чисел р\,..., ps < М имеем Е[ХР1 x...xXj- Е[УР1 х ... х YVs) = ^£ll _ = 0{п-'). Т1 Р\ ' ' ' Ps
64 Глава 4. ВТОРОЙ МОМЕНТ Пусть к — произвольное фиксированное натуральное число; сравним E[Xfc] и E[Ffc]. Величина Хк является полиномом от X с коэффициентами, не превосходящими п°(1\ Дальнейшее разложение каждого Х^ = (]Г ХРУ (всегда сводящее Х£ к Хр, когда а ^ 2) дает сумму 0(Мк) = п°^ слагаемых вида ХР1 х ... х XPs. To же самое разложение применяется к Y. Поскольку математические ожидания соответствующих слагаемых имеют порядок 0{п~1), общая разность есть Е[Хк] - E[Yk] = п-1+0^ = о(1). Следовательно, каждый момент величины X сходится к соответствующему моменту стандартно нормально распределенной случайной величины N. Согласно стандартной, хотя и нетривиальной теореме из теории вероятностей из этого следует, что распределение величины X должно стремиться к нормальному. ■ Мы процитируем здесь известное изречение Харди: «Число 317 является простым вовсе не потому, что мы так решили или наш мозг устроен так, а не иначе, но потому, что это на самом деле так, потому, что такова математическая реальность.» Может показаться странным (хотя это ничему и не противоречит), что именно методы теории вероятностей позволяют прийти к лучшему пониманию свойств разложения чисел на простые множители.. 4.3. ДОПОЛНИТЕЛЬНЫЕ ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ Рассмотрим неотрицательную целочисленную случайную величину X. Предположим, нам требуется оценить вероятность Рт[Х = 0] при заданном значении \х = ЩХ]. Если \х < 1, то можно использовать неравенство Рт[Х > 0] < Е[Х], так что, если ЩХ] —► 0, то X = 0 почти всегда. (При этом мы мысленно имеем дело с бесконечной последовательностью Х-ов, зависящей от некоторого параметра п, стремящегося к бесконечности.) Предположим теперь, что ЩХ] —► ос. Вовсе не обязательно при этом окажется, что X > 0 почти всегда. Например, пусть X — число смертей, причиненных ядерной войной в течение двенадцати месяцев, начиная с данного момента. Вычисление математического ожидания ЩХ] может породить оживленную дискуссию, но мало кто может утверждать, что оно окажется очень большим. Более того, мы можем верить (или надеяться), что вероятность Рт[Х ф 0] очень близка к нулю. Можно даже иногда утверждать, что X > 0 почти всегда, если имеется некоторая информация о Var[X].
4.3. ДОПОЛНИТЕЛЬНЫЕ ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ 65 Теорема 4.3.1. Имеет место неравенство Доказательство. Пусть Л = fi/a в неравенстве Чебышёва. Тогда Рг[Х = 0}^ Рт[\Х -ц\^>\а}^^ = ^. Ш По большей части мы будем применять этот результат в асимптотической форме. Следствие 4.3.2. Если Var[X] = о(Е[Х]2), то X > О почти всегда. Доказательство теоремы 4.3.1 в действительности позволяет утверждать, что для любого г > О Рг[|Х-Е[1]|^ЕИ]Л е2Е[Х}2 и, таким образом, в асимптотической форме, мы и в самом деле имеем следующий, более сильный результат. Следствие 4.3.3. Если Var[X] = о(Е[Х]2), то X ~ ЩХ] почти всегда. Предположим, что X = Х\ + ... + Хт, где Х{ является индикатором события Ai. Для индексов i,j мы пишем г ~ j, если г ф j и события Ai, Aj не являются независимыми. Положим (сумма ведется по упорядоченным парам) Д = 5>г[ЛЛ^]. Заметим, что при г ~ j Ст[ХиХД = E[XiXj} - ЩХЩХД < Е[Х^-] = Рг[А, Л Aj], а при г ф j и г ~ j имеем Cov[Xi,Xj] = 0. Итак, Var[X] < ЦХ] + А. Следствие 4.3.4. Если ЩХ] —► схэ и А = о(Е[Х]2), то X > 0 почти всегда. Более того, X ~ ЩХ] почти всегда. Будем говорить, что индикаторы Х\,..., Хш симметричны, если для любых г ф j существует автоморфизм рассматриваемого вероятностного пространства, отображающий событие Ai в событие Aj. Примеры будут приведены в следующем разделе 2\ В нашем случае мы пишем Д = £>г[Л, Л АД = 5>г[Д]5>г[^М, i~j г j~i 2^В приводимых примерах рассматриваются симметричные случаи. Несимметричная система случайных величин рассматривалась, например, в работе [Сапоженко (1968)]. — Прим. ред.
66 Глава 4. ВТОРОЙ МОМЕНТ причем внутреннее суммирование не зависит от г. Мы полагаем где г — фиксировано. Тогда Д = ^Рг[А*]Д* = Д*^Рг[А*] = Д*Е[Х]. г г Следствие 4.3.5. Если ЩХ] —► ос и Д* = о(Е[Х]), то X > 0 почти всегда. Кроме того, X ~ ЩХ] почти всегда. Условие следствия 4.3.5 имеет следующий интуитивный смысл. Учет того условия, что некоторое конкретное событие Ai происходит, несущественно увеличивает среднее число ЩХ] происходящих событий. 4.4. СЛУЧАЙНЫЕ ГРАФЫ Определение случайного графа G(n,p) и «пороговой функции» приведено в разд. 10.1, гл. 10. Результаты этого раздела существенно перекрываются результатами гл. 10. Однако они были исторически первыми и являются хорошей иллюстрацией метода второго момента. Мы начнем с частного примера. Начиная с этого момента через lj(G) будем обозначать максимальное число вершин клики в графе G. Теорема 4.4.1. Пороговая функция для свойства lj(G) ^ 4 равна п-2/3. Доказательство. Для всякого четырехэлементного множества 5 вершин графа G(n,p) обозначим через As событие «5 является кликой». Пусть Xs — индикатор события As- Тогда E[XS] = Pr[As} = р6, поскольку графу G(n, p) должны принадлежать шесть различных ребер. Пусть X=J2xs, |5|=4 так что X —число 4-клик в графе G, a w(G) ^ 4 тогда и только тогда, когда X > 0. В силу линейности математического ожидания имеем ЩХ] = £ ЦХз] = ("V ~ %■ При р(п) <С п-2/3 выполнено ЩХ] = о(1), и, следовательно, X = 0 почти наверное. Теперь предположим, что р(п) ^> п-2/3, а значит, ЩХ] —> ос. Рассмотрим А* из следствия 4.3.5. (Все четырехэлементные множества «неотличимы друг
4.4. СЛУЧАЙНЫЕ ГРАФЫ 67 от друга», поэтому множество всех Xs симметрично.) Здесь S ~ Т тогда и только тогда, когда S ф Тиу 5 иТ есть общие ребра, т. е. тогда и только тогда, когда |5ПТ| = 2 или 3. Зафиксируем 5. Существует 0(п2) множеств Т, таких, что \S П Т\ = 2, причем для каждого из них Pr[Ar|j4s] = ръ. Имеется 0(п) множеств Т, таких, что |5ПТ| = 3, причем для каждого из них Pr[Ar|j4s] = р3. Таким образом, А* = <Э(пУ) + 0(пр3) = о(п4р6) = о(Е[Х}) так как р ^> п-2/3. Значит, следствие 4.3.5 применимо и X > О, т.е. клика размера 4 существует почти всегда. ■ В доказательстве теоремы 4.4.1 мы уже столкнулись с вычислением А*. Следующие понятия необходимы для доказательства более общей теоремы 4.4.2. Определение 1. Рассмотрим граф Н с v вершинами и е ребрами. Назовем отношение р(Н) = e/v плотностью графа Н. Граф Н называется сбалансированным, если для каждого его подграфа Н' выполнено неравенство р(Н') < р(Н). Назовем граф Н строго сбалансированным, если для каждого собственного подграфа Н' выполнено строгое неравенство р{Н') < р(Н). Примеры. Граф К\ и, вообще, графы К^ строго сбалансированы. Граф не является сбалансированным, поскольку он имеет плотность 7/5, в то время как его подграф К4 имеет плотность 3/2. Граф ш сбалансирован, но не строго, ибо он и его подграф К4 имеют плотность 3/2. Теорема 4.4.2. Рассмотрим сбалансированный граф Н с v вершинами и е ребрами. Пусть A(G) — событие «Н является подграфом (не обязательно порожденным) графа G». Тогда р = n~vle является пороговой функцией для А. Доказательство. Мы следуем доказательству теоремы 4.4.1. Для каждого ^-множества 5 пусть As — событие «G\s содержит Н в качестве подграфа».
68 Глава 4. ВТОРОЙ МОМЕНТ Тогда ре ^Fr[As}^v\pe. (Любое конкретное размещение подграфа Н (на некотором фиксированном ^-подмножестве вершин графа G) имеет вероятность ре и при этом имеется не более v\ возможных размещений. Точный подсчет Pr[As] в общем случае затруднителен в силу взаимного наложения копий графа Н.) Обозначим через Xs индикатор события As- Положим х = Е xs- \S\=v Ясно, что событие A(G) происходит тогда и только тогда, когда X > 0. Из линейности математического ожидания вытекает, что Е[х] = Е в[х5] = (п) Рг[л5] = e(nV). \S\=v W Если р <С n~vle, то ЩХ] = о(1) и X = 0 почти наверное. Пусть теперь р ^> n~vle и, следовательно, ЩХ] —► схэ. Рассмотрим Д* из следствия 4.3.5. (Все ^-множества равноправны, поэтому Xs симметричны.) Здесь 5 ~ Т в том и только том случае, когда S^TnySnT есть общие ребра, т. е. тогда и только тогда, когда |5ПТ| = г с 2 < г < г?—1. Зафиксируем 5. Имеем V— 1 д* = ^ рг[ат|л5] = Е Е рг^нм T~S i=2 \Tf)S\=i Для каждого г существует 0(nv~l) способов выбора Т. Зафиксируем 5, Т и рассмотрим Pi^A^l^s]. Имеется O(l) возможных копий графа # на множестве Т. Каждая из них имеет (поскольку граф Н сбалансированный) не более ^ ребер с обоими концами в 5, а, значит, не менее е — ™ ребер другого типа. Отсюда Рт[Ат\А3}=0(ре-г-?) и V—1 V—1 д* = £оК"У"*) = X>((nV)1--) = г=2 г=2 v-1 ^o(nV) = o(E[X]), г=2 так как nvpe —► оо. Это означает, что применимо следствие 4.3.5. ■ Теорема 4.4.3. В обозначениях теоремы 4.4.2, если Н не является сбалансированным, то р = n~vle не является пороговой функцией для события А. Доказательство. Пусть Н\ — подграф графа Н с v\ вершинами и е\ ребрами, e\jv\ > e/v. Пусть а удовлетворяет неравенствам v/e < а < v\/e\.
4.4. СЛУЧАЙНЫЕ ГРАФЫ 69 Положим р = п~а. Математическое ожидание числа копий Hi есть тогда о(1). Поэтому почти всегда G(n,p) не содержит копий графа Н\. Но если он не содержит копий графа Hi, то он, конечно, не содержит и копий графа Н. Ш Пороговая функция для свойства содержания копий Н для произвольного Н изучалась в классической статье Эрдёша и Реньи [Erdos and Renyi (I960)]. (Она все еще служит великолепным введением в теорию случайных графов.) Пусть Н\— подграф максимальной плотности, т.е. p(#i) = e\/v\ (если Н сбалансирован, можно положить Hi = Н). Эрдёш и Реньи показали, что функция р = n~Vl/ei является пороговой. Мы не доказываем это здесь, хотя это непосредственно вытекает из обсуждаемых методов. Мы заканчиваем этот раздел двумя усилениями теоремы 4.4.2. Теорема 4.4.4. Пусть Н — строго сбалансированный граф с v вершинами, е ребрами и а автоморфизмами. Обозначим через X число копий графа Н в G(n,p). Предположим, что р ^> n~vle. Тогда для почти всех графов п"ре л ~ . а Доказательство. Пронумеруем вершины графа Н числами l,...,v. Для каждого упорядоченного множества xi,...,xv вершин графа G обозначим через AXl,..^Xv событие «{х\,... ,xv} содержит копию графа Н именно в этом порядке». А именно, мы полагаем : {i,j} е Е(Н) => {xi,Xj} e E(G). Пусть IXl,...,Xv —соответствующий индикатор. Определим класс эквивалентности на v-кортежах следующим образом. Положим (xi,..., xv) = (yi,..., yv), если существует автоморфизм а на множестве V(H), такой, что уаф = Х{ для 1 ^ г ^ v. Тогда величина X = / ;-Lxi,...,xvi где в сумме участвует по одному представителю из каждого класса эквивалентности, есть число копий графа Н в G. Поскольку существует (n)v/a слагаемых, Ел = —— Е [IXl,...,xv\ = — —• а а а Так как по предположению р ^> n~vle, то ЩХ] —► схэ. Теперь достаточно показать, что А* = о(Е[Х]). Фиксируя х\,..., xVi имеем А* = Е P^(yi,...,yw)l^i,...,xw)]. (yi,---,yv)~(xi,...,xv) Существует v\/a = 0{\) слагаемых с {yi,...,yv} = {^i,... ,xv}, причем для каждого из них условная вероятность не превышает 1 (в действительности, не больше р), внося, тем самым вклад O(l) = о(Е[Х]) в А*. Когда {Уъ • • • ,Уу} П {xi,...,xv} имеет г элементов, 2 ^ г ^ v — 1, рассуждения теоремы 4.4.2 показывают, что вклад в А* равен о(Е[Х]). В итоге А* = о(Е[Х]) и мы можем применить следствие 4.3.5. ■
70 Глава 4. ВТОРОЙ МОМЕНТ Теорема 4.4.5. Пусть Н —произвольно фиксированный граф. Для каждого подграфа Н' графа Н (включая сам Н) обозначим через Хн' число копий графа Н' в G(n,p). Пусть р таково, что Е[Хн'\ —► оо для каждого Н'. Тогда Хн ~ ЩХн] для почти всех графов. Доказательство. Пусть Н имеет v вершин и е ребер. Как в теореме 4.4.4, достаточно показать, что Д* = о(Е[Х]). Представим А* суммой конечного числа слагаемых. Для каждого Н' с w вершинами и / ребрами мы имеем такие (Уъ • • • > Уу), которые пересекаются с фиксированными (xi,..., xv) по некоторой копии графа Н'. Эти слагаемые вносят вклад в А*, с точностью до константы равный »"">-'=е (Ий)=0{ПХи]у Поэтому можно применить следствие 4.3.5. ■ 4.5. МАКСИМАЛЬНЫЙ РАЗМЕР КЛИКИ Зафиксируем вероятность р = \ появления ребра и пусть uj(G) — максимальный размер клики. Обозначим через /w-(;)r(8 математическое ожидание числа /с-клик. Функция /(/с) становится меньше единицы при k ~ 21og2n. (Грубо говоря, f(k) ведет себя как пк2~к /2.) Теорема 4.5.1. Пусть к = к(п) таково, что k ~ 2\og2n, и f(k) —► оо. Тогда для почти всех графов uj(G) ^ к. Доказательство. Для каждого /с-множества 5 пусть As —событие вида «5 является кликой», a Xs~его индикатор. Положим х = Е х*- \S\=k Заметим, что uj(G) ^ к тогда и только тогда, когда X > 0. Тогда ЩХ] = = f(k) —► ос, и мы изучим А* из следствия 4.3.5. Зафиксируем 5 и заметим, что Т ~ S в том и только том случае, когда \Т П S\ = г, где 2 ^ г ^ к — 1. Следовательно, и поэтому L J г=2
4.6. РАЗЛИЧНЫЕ СУММЫ 71 где мы полагаем " (k\ (n—k\ 9(г) = ^^2«). Заметим, что д{г) можно представлять себе как вероятность того, что случайно выбранное Т пересекает фиксированное S в г точках, умноженную на возрастающую по Рг[Лт] функцию. Полагая г = 2, имеем (к\ (п-к\ ,4 9W = 2—рч ^2 < °Уп )• На другом конце, при г = /с — 1, имеем fc(n - k)2-(k-V 2kn2~k д(к-1) = (»)2-(S) B[X] Поскольку /с ~ 21og2n, числитель равен п~1+°(1\ Знаменатель стремится к бесконечности, поэтому д(к — 1) ^ о(п~1). Более детальные вычисления (которые мы опускаем) показывают, что остальными g(i) и их суммой можно пренебречь, так что следствие 4.3.5 применимо. ■ Теорема 4.5.1 приводит к сильной концентрации для lu(G). При /с ~ 2 log2 n Пусть /со = ко(п)— то значение, при котором /(/со) ^ 1 > /(/со + 1). Для «большинства» п функция /(/с) резко изменяет большое значение /(/со) на малое /(/со + 1)- Вероятность того, что G содержит клику размера ко + 1, не превосходит весьма малой величины /(/со + 1). Когда /(/со) велико, из теоремы 4.5.1 следует, что G содержит клику размера ко с вероятностью, близкой к 1. Таким образом, с очень большой вероятностью uj(G) = ко- Для некоторых п одна из величин /(/со), /(/со + 1) может оказаться средних размеров. В этом случае эти соображения не применимы. Тем не менее можно доказать строгую концентрацию, полученную независимо в работах [Bollobas and Erdos (1976)] и [Matula (1976)]. Следствие 4.5.2. Существует к = к{п), такое, что Pt[lu(G) = k или к + 1] -> 1. Мы еще получим более сильные результаты относительно распределения величины oo(G) в разделе 10.2. 4.6. РАЗЛИЧНЫЕ СУММЫ Говорят, что множество {xi,... ,£&} натуральных чисел имеет различные суммы, если все суммы 5^х», где 5 С {1,...,/с}, ies
72 Глава 4. ВТОРОЙ МОМЕНТ попарно различны. Через f(n) обозначим максимальное /с, для которого существует множество {xi,...,x*} С {1,...,п} с различными суммами. Простейший пример множества с различными суммами: {2г : г ^ log2n}. Этот пример показывает, что /(n)^l+Llog2nJ. Пол Эрдёш обещал $300 за доказательство или опровержение того, что f(n) ^log2n + C для некоторой константы С Из сказанного следует, что все 2^п^ сумм различны и меньше n/с, а значит, 2^п) < пк = nf(n). СЗтстоття f(n) < log2 п + log2 log2 п + O(l). Метод второго момента дает небольшое улучшение. Зафиксируем {xi,..., Xk} С {1,..., п} с различными суммами. Пусть £i,...,£& выбираются независимо и i Рт[ег = 1]=Рт[вг = 0} = -. Положим X = eixi + ... + SkXk- (Мы представляем X в виде случайной суммы.) Положим ц = Е[Х] = и а2 = Vai[X]. Заметим, что <2 Xi ~\~ ♦ ♦ ♦ i Хг, ТЬ /С 4 4 так что сг ^ пук/2. По неравенству Чебышёва для любого Л > 1 имеем Рг[|Х-/и| ^Хпу/к/2] ^Л"2. Тогда для вероятности обратного события получаем неравенство 1 - -^ < Рг [|Х - /и| < Хпу/к/2^ . Но X принимает каждое конкретное значение с вероятностью либо ноль, либо 2-fc, поскольку каждое значение представляется в виде суммы не более чем одним способом. Отсюда Рг \\Х -ц\< \nVk/2~\ ^ 2-к(\пу/к + 1) и 2fc(l -A"2)- 1 Vk\ Хотя Л = л/3 максимизирует правую часть последнего неравенства, при любом выборе Л > 1 из этого неравенства вытекает следующий результат. Теорема 4.6.1. Справедливо соотношение f(n) ^ log2 п + - log2 log2 п + O(l).
4.7. ПОДХОД РЁДЛЯ 73 4.7. ПОДХОД РЁДЛЯ Для чисел 2 ^ / < к < п пусть М(п, к, /),— минимальный размер семейства /С из /с-элементных подмножеств множества {1,..., п}, обладающего тем свойством, что каждое /-множество содержится по крайней мере в одном А Е /С. Ясно, что М(п, k,l) ^ (?)/(/)> так как каждое /с-множество покрывает (^) /-множеств и каждое /-множество должно быть покрыто. Равенство выполняется тогда и только тогда, когда семейство /С обладает тем свойством, что каждое /-множество содержится ровно в одном А Е /С. Такое семейство называется (п, /с, /)-тактической конфигурацией (или блок-схемой). Например, (п, 3,2)-тактическая конфигурация больше известна как система троек Штей- нера. Вопрос о существовании тактических конфигураций является центральным в комбинаторике, но одним из тех, в которых вероятностные методы играют (по крайней мере, в настоящий момент) незначительную роль. В 1963 г. Эрдёш и Ханани предположили, что для фиксированных 2 ^ / < к _. М(п,/с,/) lim ———-т-^ = 1. ™ (?)/(?) Их предположение состояло, грубо говоря в том, что можно асимптотически приблизиться к тактической конфигурации. Хотя эта гипотеза представлялась идеальной для вероятностного анализа, потребовалось целое поколение, прежде чем Рёдль [Rodl (1985)] нашел доказательство, которое приводится в данном разделе. (Можно подобным образом определить число т(п,к,1) как максимальный размер семейства /С из /с-элементных подмножеств множества {1,...,п}, обладающего тем свойством, что каждое /-множество содержится не более чем в одном А Е /С. С помощью элементарных соображений Эрдёш и Ханани получили, что Ит М(пЛ0= u"(».*.*)=1. ™ (»)/(*) ™ («)/(*) Хотя результат Рёдля можно формулировать как в терминах упаковки, так и в терминах покрытий, здесь мы имеем дело только с задачей о покрытии.) Многие исследователи осознавали, что метод Рёдля применим в более общей ситуации, когда рассматриваются покрытия в однородных гиперграфах. Это было замечено Франклем и Рёдлем, и впоследствии было упрощено Пип- пенджером и Спенсером [Pippenger and Spencer (1989)], а также Каном [Kahn (1996)]. В нашем изложении мы следуем Пиппенджеру и Спенсеру [Pippenger and Spencer (1989)] и основываемся на обзоре Фюреди [Furedi (1988)], в котором основным инструментом является метод второго момента. Для r-однородного гиперграфа Н = (V, Е) и вершины х Е V мы используем обозначение dn(x) (или просто d(x), когда это не приводит к недоразумению) для степени вершины х в гиперграфе Я, т. е. числа ребер, содержащих х. Аналогично, для х, у Е V пусть d(x, у) = dn(x, у) — число ребер гиперграфа Я, содержащих как ж, так и у. Покрытие гиперграфа Н — это множество ребер, объединение которых содержит все вершины. В дальнейшем, везде под ±6
74 Глава 4. ВТОРОЙ МОМЕНТ мы подразумеваем произвольное число между — 8 и 8. Следующая теорема принадлежит Пиппенджеру. Изложим ее, следуя Франклю и Рёдлю. Теорема 4.7.1. Для каждого целого г ^ 2, действительного к ^ 1 и а > О существуют 7 = l(r,k,a) > О и do = do(r,k,a), такие, что для всех п ^ D ^ do выполнено следующее. Пусть Н = (V,E) является г-однородным гиперграфом на множестве V из п вершин, в котором все вершины имеют положительные степени, и удовлетворяет следующим условиям: (1) для всех х eV, за исключением не более чем jn, d(x) = (1 ± j)D, (2) для всех х Е V выполнено неравенство d(x) < kD, (3) для любых двух различных х, у Е V выполнено d(x, у) < jD. Тогда Н содержит покрытие из не более (1 + a)j ребер. Основная идея доказательства проста. Зафиксируем малое е > 0. Можно показать, что случайное множество приблизительно из еп/г ребер с высокой вероятностью содержит только 0(е2п) вершин, покрываемых более одного раза, и, следовательно, покрывает не менее чем еп — 0(е2п) вершин. Кроме того, после удаления покрытых вершин гиперграф, порожденный оставшимися вершинами, все еще удовлетворяет свойствам (1), (2) и (3) из условия теоремы (для некоторых других значений n,j,k и D). Следовательно, можно снова выбрать случайное множество ребер в этом гиперграфе, покрывающее приблизительно е-долю его вершин почти без пересечений. Действуя таким образом достаточно большое число раз, мы получим еп оставшихся непокрытыми вершин. Они могут быть покрыты тривиально, путем выбора для каждой из них произвольного содержащего ее ребра. Поскольку е достаточно мало, последний шаг является вполне приемлемым, несмотря на явную его неэффективность. Технические детали требуют аккуратного применения метода второго момента, используемого несколько раз в доказательстве следующей леммы. Лемма 4.7.2. Для любого целого г ^ 2, действительных К ^ 1 и е > 0, а также для любого действительного 8' > 0 существуют S = 8(г,К,е,8') > 0 и Do = Do(r,K,e,8'), такие, что для всякого п ^ D ^ Do выполняется следующее. Пусть Н = (V,E) является г-однородным гиперграфом на множестве V из п вершин и удовлетворяет следующим условиям: (г) для всех х Е V, за исключением не более чем 8п, d(x) = (1 ± 8n)D, (И) для всех х Е V выполнено d(x) < KD, (Hi) для любых двух различных х, у Е V выполнено d(x, у) < 8D. Тогда Н содержит подмножество Е' ребер со следующими свойствами: (iv) \E'\ = f(l±S% (v) множество V = V - \J e имеет мощность \V'\=ne €(l±8f), е€Е'
4.7. ПОДХОД РЁДЛЯ 75 (vi) для всех вершин х eV, за исключением не более чем 6f\Vf\, степень d'(x) вершины х в индуцированном гиперграфе Н на мнооюестве V удовлетворяет условию d'(x) = De~£^r~l\l ±S'). Доказательство. На протяжении доказательства мы предполагаем, когда это необходимо, что D (а, значит, и п) достаточно велики. Мы обозначаем через 61,62,... положительные константы (которые могут быть точно оценены), которые стремятся к нулю, когда 6 стремится к нулю, и D стремится к бесконечности (при фиксированных г,К,е). Следовательно, выбирая 6 и Do подходящим образом, мы можем быть уверены, что каждая из них будет меньше 6'. Пусть Е' — случайное подмножество множества Е, полученное путем случайного и независимого включения в Е' каждого ребра из Е с вероятностью р = j). Мы должны показать, что с положительной вероятностью свойства (iv), (v) и (vi) выполняются. Доказать, что выполняется равенство (iv), легко. Заметим, что по предположению гиперграф Н имеет не менее (1 — 6)п вершин степени, не меньшей (1—6)D. Поэтому число его ребер не меньше гп . Аналогично, число ребер в Я не превосходит (1+*)^+*"**?. Следовательно, \Е\ = (1 ± 6г)^. Отсюда вытекает, что математическое ожидание величины \Е'\ удовлетворяет условию Ц\Е'\] = \Е\р = (li^, а дисперсия равна Var[|S'|] = \Е\р(1-р) ^ (1±6г)^. По неравенству Чебышёва, для подходящего 62 > О РгГ|Я'| = (1±*2) —1 >0.99. L r j Отсюда следует равенство (iv). Чтобы доказать утверждение (v), определим для каждой вершины х £ V индикатор 1Х так, что 1Х = 1, если х 0 иее£'в, и 1Х = О иначе. Заметим, что \Vf\ = Ylxev ^х' Назовем вершину х Е V хорошей, если d(x) = (1 ± 6)D; в противном случае назовем ее плохой. Если х — хорошая вершина, то Е[/х] = Рг[4 = 1] = (1 - р)*Ы = (l - -) = е"е(1 ± *з). Если ж —плохая, то, ясно, что 0 ^ Щ1Х] ^ 1- Поскольку имеется не более 6п плохих вершин, отсюда с использованием линейности математического ожидания получаем, что математическое ожидание величины \Vf\ равно пе~е(1±5±). Чтобы вычислить дисперсию величины |V^71 = ^2xeV Ix, заметим, что Vax[\V'\] = J2 Var[Jx] + £ CovV*> ^ < x£V x,y£V,x^y < E[|V'|] + £ Cov[Ix,Iy]. (4.1) х,уЕУ,хфу Однако Cov[/x, Iy] = E[IxIy] - Щ1ХЩ1У] = = (1 — p)d(x)+d(v)-d(x>v) - (1 — p)d(x)+d(v) ^ ^ (1 -p)~d^y) - 1 < (1 - ^)-5D ^ S5.
76 Глава 4. ВТОРОЙ МОМЕНТ Отсюда следует, что Var[|F'|] < Ц\У\} + 65п2 ^ <56(Е[|П])2. Теперь с использованием неравенства Чебышёва получаем, что с вероятностью, не меньшей чем 0.99 \V'\ = (l±67)E[\V'\] = (l±es)ne-*, как и требовалось в утверждении (v). Остается доказать (vi). Заметим прежде всего, что все вершины ж, за исключением не более чем S^n, удовлетворяют следующим двум условиям: (A) d(x) = (1 ± S)D и (B) все ребра е Е Е с х Е е, за исключением, быть может, SwD ребер, удовлетворяют условию |{/ е Е : х $ /, / Л е ^ 0}| = (1 ± «5u)(r - 1)L>. (4.2) В самом деле, (А) выполняется по предположению для всех вершин, за исключением не более чем 5п < 5дп/2. Более того, общее число ребер, содержащих вершины, степени которых лежат вне интервала (1± S)D, не превышает SnKD а, значит, число вершин, содержащихся в более чем &wD таких ребрах, не больше SnKDr/(SioD) < &$п/2 для подходящего выбора £g,£io- Заметим далее, что если х Е е и е не содержит вершин, степени которых лежат вне интервала (1 ± S)D, то, поскольку d(y,z) < SD для всех у, z, число ребер /, не содержащих х и пересекающих е, не больше (г — 1)(1 ± S)D и не меньше (г — 1)(1 ± S)D — i^~^l)8D. Следовательно, е удовлетворяет (4.2). Таким образом, достаточно показать, что для большинства вершин х, удовлетворяющих (А) и (В), d'{x) удовлетворяет (vi). Зафиксируем такую вершину х. Назовем ребро е, такое, что х Е е, хорошим, если оно удовлетворяет (4.2). Обозначим через Ех подмножество хороших ребер е, для которых х Е е. При условии, что х € V, вероятность того, что ребро е Е Ех остается в гиперграфе, порожденном множеством V', равна (1— p)(1±5ll)(r-1)D. Следовательно, математическое ожидание величины d'(x) равно E[d'(z)] = (1 ± 610 ± ОД1 " p)<1=w"Xr-1>D ± S10D = e-£{r-^D(l ± 612). Для каждого ребра е, содержащего х, обозначим через /е индикатор, принимающий значение 1, если и только если е содержится в V. Тогда степень d'{x) есть просто сумма этих индикаторов при условии, что х Е V. Отсюда следует, что __ Var[d'(x)] ^ E[df(x)} + J2 Соу[7е^/] ^ x€e,x(zf ^E[d'(x)] + 2J10L>2(1±J) + Yl Cov[7e,//]. (4.3) Остается оценить сумму Yle feE Cov[Je,J/]. Для каждого фиксированного хорошего ребра е такая сумма имеет вид YlfeE Cov[Je,//]. Имеется не более (г — 1)6D ребер / в последней сумме, для которых \е П /| > 1, и их вклад
4.7. ПОДХОД РЁДЛЯ 77 в сумму не превышает (г — 1)SD. Если еП/ = {х}, то пусть t(e,f) — число ребер гиперграфа Я, которые пересекают как е, так и / и не содержат ж. В этом случае, очевидно, £(е, /) ^ (r—l)2SD. Поэтому для таких ей/ выполнено Cov[/e, //] < (1— р)-£(е'Я — 1 ^ j13. Отсюда вытекает, что для каждого хорошего ребра е J2 Cov[Je, //] ^ (г - 1)<Ш + 13(1 + S)S13 ^ SUD. feEx Поскольку ]Ге *еЕ Cov[/e, If] состоит из не более чем D(l + S) таких величин (слагаемых), мы заключаем, что Var[d'(aO] ^ E[d'(x)] + S15D2 ^ S16(E[d'(x)})2. Отсюда в силу неравенства Чебышёва следует, что с вероятностью, не превышающей Ji7, степень d!(x) лежит вне интервала (1 ± S\%)De~£^r~l\ и, следовательно, по неравенству Маркова, с вероятностью, не меньшей чем, скажем, 0.99, для всех вершин, за исключением не более Sign, d'(x) = (l±Sig)De~£(r~1\ Это завершает доказательство леммы. ■ Доказательство теоремы 4.7.1. Зафиксируем е > 0, такое, что е + re < 1 + а, 1 - е~£ и 1/10 > S > 0, такое, что (1 + 4S) л 6 р + те < 1 + а. 1 - е~£ Зафиксируем также целое £, такое, что e~£t < е. Теорема доказывается ^-кратным применением леммы. Положим S = St и определим с помощью обратной индукции последовательность St > St-\ > • • • > So, такую, что Si ^ Si+\e~£(r~l>} и Пг=о(1 + &) < 1 + 25. Тогда для п ^ D ^ Ri можно применить лемму с г, К = ке£г(г~1\ е, S' = Si+i и S = Si. Это доказывает утверждение теоремы с 7 = So, ^о — шах Щ. В самом деле, применяя повторно лемму, мы получаем убывающую последовательность множеств вершин V = Vo, V\,..., Vt, каждое из которых вложено в предыдущее, и последовательность множеств ребер Ei, E2,. •., Et, где Ei —множество ребер Е'', полученное применением леммы к гиперграфу, порожденному множеством К-ь Здесь \Vi\ = |K_!|e-£(l ±Si)( = \V0\e-i£(l ± 2S) ), \Ei\ = eJ^(l±6i)<(l+46)^e-«-1», г г Di= A-ie-£(r-1} = De-£i^~l\ Покроем каждую вершину из множества Vt произвольным содержащим ее ребром. Мы получим покрытие, общее число ребер в котором не больше t-i (1 + 45) V — е~г£ + Щ ^ (1 + 4S) — - + (1 + 2S)ne-£t ^ t—' г г 1 — е Е г=0 <2[(i + 4J)(—L-7+re)]<(l + aA г 1 — е Е г
78 Глава 4. ВТОРОЙ МОМЕНТ Тем самым теорема доказана. ■ Мы завершим раздел демонстрацией того, как легко из доказанной теоремы вытекает предложенное Рёдлем решение проблемы Эрдёша—Ханани, упоминавшейся в начале раздела. Теорема 4.7.3 (Рёдль). Для фиксированных k J выполнено неравенство ^п\ I /АЛ M(n,fc,0<(l + o(l))| где о(1) стремится к нулю при п, стремящемся к бесконечности. Доказательство. Положим г = (J, и пусть Н — r-однородный гиперграф, вершинами которого являются все /-подмножества множества {1,2,...,n}, a ребрами — семейства из (t) /-множеств, содержащихся в /с-множествах. Гиперграф Н содержит (™) вершин, каждая из которых имеет степень D = (£lj), и любые две различные вершины лежат не более чем в (^ZiZl) = o(D) общих ребрах. Следовательно, по теореме 4.7.1 гиперграф Н имеет покрытие размера, не превышающего (1 -h о(1)) ( 7 ) / ( 7 ) 5 что и требовалось. ■ 4.8. УПРАЖНЕНИЯ I / V/ 1. Пусть X — случайная величина, принимающая целые неотрицательные значения, Е[Х2]—математическое ожидание ее квадрата и Var[X] — ее дисперсия. Доказать, что Var[X] Рг[Х = 0] ^ Е[Х2 2* Доказать справедливость следующего утверждения. Пусть п действительных чисел ai, аг,. •., ап удовлетворяют условию Y17=i °% = ^ а (еь • • • > еп) — случайный { —1,1}-вектор, полученный путем случайного и независимого выбора Si, с равной вероятностью принимающих значения — 1 или 1. Тогда существует положительная константа с такая, что п Рг[|^^аг|^1]^с. г=1 3? Доказать справедливость следующего утверждения. Пусть п векторов ai,a2,...,an € ^2 удовлетворяют условию Y17=i lla*ll2 — 1 и \\ai\\ ^ 1/Ю, где || • || обозначает обычную евклидову норму. Пусть (ei,..., еп) —случайный { — 1,1}-вектор, полученный путем случайного и независимого выбора £г, с равной вероятностью принимающих значения —1 или 1. Тогда существует положительная константа с, такая, что Г| I п II "I Рг V^aJ ^1/3 ^ с. ~| | п | y^gjQj . U=i 1 1 Ul/3
4.8. УПРАЖНЕНИЯ 79 Пусть X — случайная величина с математическим ожиданием ЩХ] = 0 и дисперсией а2. Доказать, что для всех Л > 0 справедливо неравенство 2 Рт[Х > А] ^ ^рд2. Рассмотрим п двумерных векторов v\ = (xi,yi),... ,vn = (жп,уп), где каждое Х{ и каждое у г является целым числом с абсолютной величиной, не превышающей ттЬг-Тп* Показать, что существуют два непересекающихся множества /, J С {1,2,..., п}, такие, что iei jeJ Доказать, что для каждого множества X из не менее чем 4к2 различных классов вычетов по простому модулю р существует целое число а, такое, что множество {ах (mod р) : х Е X} имеет непустое пересечение с каждым интервалом длины, не меньшей р//с, множества {0,1,... ,р — 1}.
ВЕРОЯТНОСТНЫЙ ВЗГЛЯД: Гамилътоновы пути Каково максимально возможное число ориентированных гамильтоновых путей в турнире на п вершинах? Обозначим это число через Р(п). Первым применением вероятностного метода в комбинаторике был результат Селе [Szele (1943)], представленный в гл. 2. Результат утверждает, что Р(п) ^ n!/2n_1. Эта оценка немедленно следует из того, что правая часть неравенства является средним числом путей в случайном турнире на п вершинах. В той же статье (p. v \ 1/П -^) и доказал, что 1 ,. ГР(п)\1/п 1 Он высказал также гипотезу о том, что точное значение предела равно 1/2. Эта гипотеза доказана Алоном [Alon (1990a)]. Доказательство приводится ниже. Основной инструмент — это доказательство Брегмана гипотезы Минка о перманенте (0,1)-матрицы, представленное в разд. «Вероятностный взгляд» после гл. 2. Теорема. Существует положительная константа с, такая, что для всякого п выполнено неравенство Р(п) ^ сп3'2-^. Доказательство. Для турнира Т пусть Р(Т) — число ориентированных гамильтоновых путей в Т, С(Т) — число гамильтоновых циклов в Т, a F(T) — число остовных подграфов в Т, у которых для каждой вершины существуют в точности одна заходящая дуга и в точности одна исходящая дуга. Очевидно, С(Т) ^ F(T). (1) Если Т = (V,E) является турниром на множестве V = {1,2,...,п} из п вершин, то матрица смежности турнира Т представляет собой (0,1)-матрицу размера п х п, обозначаемую через Ат = {o>%j) и определяемую равенствами dij = 1 при (i,j) € Е и dij = 0 в противном случае. Обозначим через г» количество единиц в строке с номером г. Ясно, что Комбинаторная интерпретация слагаемых из разложения перманента рег(Ат) влечет равенство рег(Лт) = F(T). (3) Нам понадобится следующая техническая лемма.
Вероятностный взгляд: Гамильтоновы пути 81 Лемма. Для любых двух целых чисел а,Ь, таких, что Ь — 2 ^ а ^ 1 выполняется неравенство (а!)1/" • (Ы)1/6 < ((а + l)!)1/^!) . ((Ь _ 1)!)1/(ь-1). Доказательство. Утверждение состоит просто в том, что /(а) < /(6—1) для функции /, определенной равенством /(а) = (а!)1/а/((а + 1)\)1^а+1\ Таким образом, достаточно показать, что для всякого целого числа х ^ 2 выполнено неравенство /(ж — 1) < /(ж). Подставим сюда выражение для / и возведем обе части в степень ж(ж — 1)(ж + 1). Теперь достаточно убедиться в том, что для всех х ^ 2 выполнено соотношение ((ж - 1)!)*<*+1> • ((ж + l)!)***"1' < (ж!)2^2"1), 'х*\2 /х + Пх(х-1} ^Г1 > Это, конечно, справедливо для х = 2. При ж ^ 3 это следует из того, что 4х > ех+1, ж! < (^)х и ех_1 > (^)х(х_1). ■ Следствие. Положим д(х) = (ж!)1/*. Для всякого целого S ^ п и целочисленных Xi ^ 1 при ограничении Y17=i Xi = ^ максимум функции ПГ=1 9{xi) достигается тогда и только тогда, когда Х{ различаются не более чем на единицу (т. е. тогда и только тогда, когда Х{ равны либо \_S/n\, либо \S/n\.) Доказательство. Если существуют два индекса г и j, такие, что Х{ ^ х3? + 2 то по лемме значение произведения возрастает при добавлении единицы к Xj и вычитании единицы из Х{. Ш Возвращаясь к нашему турниру Т, мы заметим, что числа г^, определенные выше, являются степенями исхода вершин турнира Т. Если хотя бы одна из них равна нулю, то ясно, что С(Т) = F(T) = 0. В противном случае, из теоремы Брегмана, только что доказанного следствия, а также из соотношений (2) и (3), вытекает, что F(T) является минимальным значением функции ПГ=1(Г*')1^Г% где целочисленные переменные г^ удовлетворяют условию (2) и являются равными, сколь это возможно. Прямым, хотя и слегка нудным, дифференцированием асимптотики с использованием формулы Стирлинга получаем следующий результат. Предложение. Для всякого турнира Т на п вершинах C(T)^F(T)<(l + o(l))^n3/2^l. Чтобы закончить доказательство теоремы, мы должны получить оценку для числа гамильтоновых путей в турнире из полученного выше результата. Рассмотрим турнир 5 на п вершинах. Обозначим через Т случайный турнир, полученный из 5 добавлением новой вершины у и присвоением ориентации ребрам, связывающим у с вершинами из 5, случайно и независимо. Для каждого фиксированного гамильтонова пути в 5 вероятность того, что он расширится до гамильтонова цикла в Т, равна 1/4. Значит, математическое
82 Вероятностный взгляд: Гамильтоновы пути ожидание числа гамильтоновых циклов в Т равно jP(S), и, следовательно, существует Т, для которого С(Т) ^ jP(S). Но в силу предложения выполнено неравенство С(Т) ^ (1 + o(l))^S-(n + l)3/2^^:, и, таким образом, P(S) ^ 0(п3/22^т). Тем самым теорема доказана. ■
5 Локальная лемма Математика, на самом деле, — это почти полностью предмет эстетики. Эта мысль непостижима для нематематиков. Доюон Конвей 5.1. ЛЕММА В типичном вероятностном доказательстве комбинаторного результата обычно требуется показать, что вероятность некоторого события положительна. Однако многие из таких доказательств в действительности дают больше и показывают, что вероятность рассматриваемого события не только положительная, но и достаточно большая. Фактически, большинство вероятностных доказательств имеют дело с событиями, которые происходят с большой вероятностью (т. е. вероятность стремится к 1), когда размерность задачи возрастает. Например, рассмотрим приведенное в гл. 1 доказательство того, что для каждого k ^ 1 существуют турниры, в которых для любого множества из к игроков существует игрок, побеждающий каждого из них. Доказательство действительно показывает, что для любого фиксированного /с, при достаточно большом числе игроков п почти все турниры с п игроками обладают этим свойством; т. е. вероятность того, что случайный турнир с п игроками обладает требуемым свойством, стремится к 1 при п, стремящемся к бесконечности. С другой стороны, существует тривиальный случай, в котором можно показать, что определенное событие происходит с положительной, хотя и очень малой, вероятностью. В самом деле, если мы имеем п взаимно независимых событий, и каждое из них происходит с вероятностью, не меньшей р > О, то вероятность того, что все события происходят одновременно, равна по меньшей мере рп, т. е. положительна, хотя может быть экспоненциально малой по п. Естественно ожидать что случай взаимной независимости может быть обобщен на слабые зависимости и дать более общий способ доказательства того, что определенные события происходят с положительной, хотя и малой вероятностью. Такое обобщение возможно, и это утверждается в следующей лемме, известной как локальная лемма Ловаса. Эта простая лемма, впервые
84 Глава 5. ЛОКАЛЬНАЯ ЛЕММА доказанная в работе Эрдёша и Ловаса [Erdos and Lovasz (1975)], является чрезвычайно мощным инструментом, поскольку дает возможность работать с редкими событиями. Лемма 5.1.1 (локальная лемма: общий случай). Пусть Ai,A2,...,An - события в произвольном вероятностном пространстве. Ориентированный граф D = (V, Е) на множестве вершин V = {1,2,... ,п} называется орграфом зависимости для событий А \,..., -/А71) если для всякого г, 1 ^ г < п, каждое событие А{ взаимно независимо с событиями {Aj : (i,j) $. Е}. Предположим, что D = (V,E) является орграфом зависимости для определенных выше событий и пусть существуют действительные числа xi,...,xn, такие, что 0 ^ xi < 1 и Рт[Аг] ^ хгПиj)£eO~ ~ хз) для всех 71 1 ^ г ^ п. Тогда Рг [Д™=1 Aj\ ^ П (1 — х0- В частности, с положительной г=1 вероятностью ни одно из событий А{ не происходит. Доказательство. Сначала докажем индукцией по s, что для любого набора чисел S С {1,..., n}, \S\ = s < п и любого г 0 5 справедливо неравенство Рг Ai\ f\Aj jes ^ Xi. (5.1) Это, конечно, справедливо для s = 0. Предполагая, что неравенство выполняется для всех чисел s' < s, докажем его для s. Положим S\ = {j € S; (i,j) € E}, S2 = S\Sx. Тогда Pr Ц Л AJ jes Pr[AA(Aj€Sl^)|A^52^ ^[Ajes^AAees,^ (5.2) Чтобы оценить числитель, заметим, что так как каждое событие Ai взаимно независимо с событиями {Ае : £ Е 5г}, то Рг А А | Д А А | Д А А ^РгШ Д Ае jeSi J ees2 J L ees2 Pi[Ai]^Xi Y[ (1-х,). (iJ)eE (5.3) С другой стороны, знаменатель может быть оценен с использованием предположения индукции. В самом деле, предположим S\ = {ji, J2, • • • 5>}• Если г = 0, то знаменатель равен 1, и неравенство (5.1) выполняется. В противном
5.1. ЛЕММА 85 случае Рг AhAAJ2A...AAjr\ Д At ees2 = (l-Pr[Ail| /\A£] • 1-Pr ees2 ... x 1 - Рг 4?2|4пЛ Д А* ees2 Ajr\Ah Л.-.Л^Л Д At ees2 > >{l-xn){l-xh)...{l-x3r)> Y[ (1-х,). (i,3)eE (5.4) Подставляя соотношения (5.3) и (5.4) в равенство (5.2), заключаем, что Рг \Ai\ hjes Aj ^ Xi, что завершает индуктивное доказательство. Теперь легко получить утверждение леммы 5.1.1, поскольку Рг Л* ,г=1 = (1-Рг[Л1])-(1-Рг[Л2|Л1])х... п-1 (1-рг[л,| д л]^П(1-х<). (5.5) г=1 г=1 Лемма доказана. Следствие 5.1.2 (локальная лемма: симметричный случай). Пусть Ai,A2,...,An — события в произвольном вероятностном пространстве. Пусть каждое событие А{ взаимно независимо со всеми событиями, за исключением тех не более чем d событий Aj, для которых Pr[Ai] ^ p при всех 1 ^ г < п. Если ep(d+l)<l, (5.6) ™>оРт[№=1А{] >0. Доказательство. Если d = 0, то утверждение тривиально. В противном случае рассмотрим орграф зависимости D = (V,E) для событий Ai,...,An, в котором по предположению для каждого г выполнено \{j : (г, j) E E}\ ^ d. Результат теперь вытекает из леммы 5.1.1, если положить £j = l/(d+l)(<l) для всех г и использовать тот факт, что (1 — ^~ ) > 1/е для всякого d ^ 1. ■ Как показал Ширер в 1985 г., константа «е» является наилучшей из возможных в неравенстве (5.6). Заметим также, что доказательство леммы 5.1.1 показывает, что утверждение остается справедливым, даже если заменить два предположения о том, что каждое А{ является взаимно независимым с событиями {Aj : (i,j) $ Е} и что Рг[Лг] < Х{ YI (1 ~~ xj)> более слабым пред- (iJ)eE положением о том, что для каждого г и любого Si С {1,..., n}\{j : (г, j) Е Е}
86 Глава 5. ЛОКАЛЬНАЯ ЛЕММА выполнено Рг \А{\ Д -eS. АА ^ Xi YI (1 ~~ xj)- Это оказывается полезным в L г J (ьз)еЕ некоторых приложениях. В нескольких следующих разделах мы рассмотрим различные применения локальной леммы для получения комбинаторных результатов. Доказательства этих результатов, не использующие локальную лемму, неизвестны. 5.2. СВОЙСТВО В И РАЗНОЦВЕТНЫЕ МНОЖЕСТВА ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ Напомним, что гиперграф Н = (V,E) обладает свойством Б, (т. е. является 2-раскрашиваемым), если существует раскраска множества V в два цвета, при которой никакое ребро / Е Е не является монохроматическим. Теорема 5.2.1. Пусть Н = (У, Е) — гиперграф, в котором каждое ребро содержит по меньшей мере к элементов и каждое ребро пересекается не более чем с d другими ребрами. Если e(d+ 1) ^ 2k~l, то Н обладает свойством В. Доказательство. Раскрасим каждую вершину v из Н случайно и независимо либо синим, либо красным цветом с равной вероятностью. Для каждого ребра / Е Е пусть Af — событие «/ является монохроматическим». Ясно, что Рг[Л/] = 2/2^1 ^ l/2fc_1. Кроме того, каждое событие А/, очевидно, не зависит от событий Ау, соответствующих тем ребрам /', которые не пересекаются с /. Теперь результат вытекает из следствия 5.1.2. ■ Специальный случай теоремы 5.2.1 состоит в том, что для всех k ^ 9 любой /с-однородный гиперграф Н обладает свойством В. В самом деле, любое ребро / такого гиперграфа Н содержит к вершин, каждая из которых инцидентна к ребрам (включая /). Поэтому ребро / пересекает не более d = к(к — 1) других ребер. Требуемый результат вытекает отсюда, поскольку е(к(к — 1) +1) < 2к~1 для каждого к > 9. Следующий результат, который мы рассмотрим, появился в работе Эрдёша и Ловаса, и касается /с-раскрасок действительных чисел. Пусть даны /с-рас- краска с : R —> {1,2, ...,/с} действительных чисел в цвета 1,2, ...,/с и подмножество Т С R. Скажем, что Т разноцветно (относительно с), если с(Т) = {1,2,...,/с}, т. е. Т содержит элементы всех цветов. Теорема 5.2.2. Пусть тик— два натуральных числа, удовлетворяющих условию ( 1\т е {т(т - 1) + 1) к f 1 - - ) < 1. (5.7) Тогда для любого множества S из т действительных чисел существует к-раскраска, такая, что каждый сдвиг х + 5 {для х Е Ж) является разноцветным. Заметим, что неравенство (5.7) справедливо для всех т > (3 + o(l))k\ogk.
5.3. НИЖНИЕ ОЦЕНКИ ДЛЯ ЧИСЕЛ РАМСЕЯ 87 Доказательство. Сначала зафиксируем конечное подмножество X С R и докажем существование /с-раскраски, для которой каждый сдвиг х + 5 (для х е X) является разноцветным. Это простое следствие локальной леммы. В самом деле, положим Y = [jxex(x + S) и пусть с : Y —> {1, 2,..., к} — случайная /с-раскраска множества У, полученная выбором для каждого у Е У, случайно и независимо с(у) Е {1,2,...,/с} в соответствии с равномерным распределением на множестве {1,2,...,к}. Для каждого х Е X пусть Ах— событие «х + 5 не является разноцветным (относительно с)». Ясно, что Рг[Лх] ^ к (1 — ^) . Кроме того, каждое событие Ах является взаимно независимым со всеми другими событиями Axi кроме тех, для которых (х + 5) П (х' + 5) ^ 0. Поскольку существует не более m(m — 1) таких событий, требуемый результат вытекает из следствия 5.1.2. Мы можем теперь доказать существование раскраски множества всех действительных чисел, удовлетворяющей требуемым свойствам, с помощью стандартного понятия компактности. Дискретное пространство с к точками (тривиально) является компактом. Теорема Тихонова (эквивалентная аксиоме выбора) утверждает, что произвольное произведение таких пространств также является компактом. В частности, пространство всех функций из R в {1,2,...,к} с обычной топологией произведения, является компактом. В этом пространстве для каждого фиксированного х Е Ж. множество Сх всех раскрасок с, таких, что х + 5 является разноцветным, замкнуто. (В действительности, оно и открыто и замкнуто, так как базис для открытых множеств — это множество всех раскрасок, значения которых определены в конечном числе точек.) Как доказано выше, пересечение конечного числа множеств Сх не является пустым. Отсюда следует, ввиду компактности, что пересечение всех множеств L^x не пусто. Любая раскраска из этого пересечения обладает свойствами из утверждения теоремы 5.2.2. ■ Заметим, что, в общем, невозможно применить локальную лемму к бесконечному множеству событий и сделать заключение о том, что в некоторой точке вероятностного пространства ни одно из них не выполняется. В самом деле, существуют тривиальные примеры счетного множества взаимно независимых событий Ai, удовлетворяющих условиям Рг[Лг] = 1/2 и /\i:>lAi = 0. Поэтому соображения компактности в предыдущем доказательстве являются существенными. 5.3. НИЖНИЕ ОЦЕНКИ ДЛЯ ЧИСЕЛ РАМСЕЯ Получение Эрдёшем в 1947 г. нижних оценок для чисел Рамсея было одним из первых применений вероятностного метода. Локальная лемма дает простой способ улучшения этих оценок. Сначала получим нижнюю оценку для диагональных чисел Рамсея R(k, к). Рассмотрим случайную 2-раскраску ребер полного графа Кп. Для каждого множества 5 из к вершин графа Кп обозначим через As событие «полный граф на множестве 5 является монохроматическим». Ясно, что Pr[As] = 21 ~Ь). Очевидно, что каждое событие As является
88 Глава 5. ЛОКАЛЬНАЯ ЛЕММА взаимно независимым со всеми другими событиями Ат кроме тех, для которых |5ПТ| > 2, поскольку только в этом случае соответствующие полные подграфы имеют общее ребро. Значит, можно применить следствие 5.1.2 с р = 21 "W и d = (2)(fc-2) c тем> чт°бы заключить: Предложение 5.3.1. Если е ((^(^г) + 1) * 21_^ < 1> mo Щк,к) > п. Отсюда легко следует, что R(k,k) > & (1 + о(1)) к2к/2. Это всего лишь в два раза лучше оценки, полученной прямым вероятностным методом. Хотя столь небольшое улучшение несколько разочаровывает, это не удивительно. Локальная лемма наиболее эффективна, когда зависимости между событиями редки, а в данном случае это не так. В самом деле, существует всего К = (£) рассматриваемых событий, а максимальная степень исхода d в орграфе зависимости равна приблизительно (£) (fc™2) * Для больших к и много больших п (что как раз и представляет для нас интерес) мы имеем d > Kl~°^l^k\ т. е. массу зависимостей. С другой стороны, если мы рассмотрим малые множества 5, например, множества размера 3, то увидим, что всего их К = (™), и каждое из них имеет общее ребро только с 3(п — 3) « Кх13 множествами размера 3. Это подсказывает, что локальная лемма может дать больше для улучшения оценок внедиагональных чисел Рамсея Я(/с, /), особенно если один из параметров, скажем /, мал. Рассмотрим например, следуя Спенсеру [Spencer (1977)], число Рамсея Я(/с, 3). Здесь, конечно, мы должны применить несимметричную форму локальной леммы. Раскрасим ребра графа Кп в два цвета случайно, независимо и так, что каждое ребро окрашивается в синий цвет с вероятностью р. Для каждого множества из трех вершин Т обозначим через Ат событие «треугольник на множестве Т синий». Аналогично, для каждого множества 5 из к вершин обозначим через Bs событие «полный граф на множестве 5 красный». Ясно, что Рг[Лт] = р3 и Pr[Bs] = (1 -р)(5). Построим орграф зависимости для событий Ат и Bs путем соединения двух вершин дугами (в обоих направлениях) тогда и только тогда, когда соответствующие графы имеют общее ребро. Ясно, что каждая вершина Ат орграфа зависимости 5 смежна с 3(п — 3) < Зп вершинами Ат> и не более чем с (£) вершинами Д$/. Аналогично, каждая вершина Bs смежна с {^)(п—к) < к2п/2 вершинами Ат и не более чем с (£) вершинами Bsf. Как вытекает из общего случая локальной леммы 5.1.1, если мы сможем найти 0 < р < 1 и два действительных числа 0^х<1и0^у<1, таких, что р3^х(1-х)3п(1-ур) (1-р)(2к)^у(1-ж)*ап/2(1_у)(;)> то R(k, 3) > п. Наша цель —найти наибольшее возможное к = fc(n), для которого существуют такие числа р, х и у. Элементарное (но утомительное) вычисление показывает, что наилучшим является выбор, при котором р = с\П~1/2,
5.4. ГЕОМЕТРИЧЕСКИЙ РЕЗУЛЬТАТ 89 к = C2n1/2\ogn, х = сз/n3/2 и у = те1/2?0 2п- Это Дает оценку R(k,3) > с$к2/log2 к. Подобные же соображения дают Д(А;,4) > къ^2+0<^1\ В обоих случаях количество вычислений соизмеримо. Однако, тяжкий труд оплачивается. Оценка R(k,3) > с$к2/log2 к сравнима с нижней оценкой Эрдёша, доказанной в 1961 г. с помощью весьма сложных вероятностных соображений. Она была улучшена Кимом [Kim (1995)] до R(k, 3) > с^к2/log/с. Данная оценка для R(k, 4) лучше, чем любая известная из тех, что получены без применения локальной леммы. 5.4. ГЕОМЕТРИЧЕСКИЙ РЕЗУЛЬТАТ Семейство Т открытых шаров в трехмерном евклидовом пространстве R3 называется к-кратным покрытием пространства R3, если любая точка х Е R3 принадлежит не менее чем к шарам. В частности, однократное покрытие называется просто покрытием. Назовем /с-кратное покрытие Т разложимым, если существует разбиение семейства Т на два попарно непересекающихся семейства Т\ и Тг, каждое из которых является покрытием пространства R3. Мани-Левицка и Пач [Mani-Levitska and Pach (1988)] построили неразложимые /с-кратные покрытия пространства R3 открытыми единичными шарами для любых целых чисел k ^ 1. С другой стороны, они доказали, что любое /с-кратное покрытие пространства R3, при котором никакая точка не покрывается более чем c2fc/3 шарами, является разложимым. Обнаруживается неожиданное явление: труднее разложить те покрытия, которые покрывают некоторые точки пространства R3 слишком часто, чем те покрытия, которые покрывают каждую точку равномерно. Точное утверждение теоремы Мани- Левицки и Пача состоит в следующем. Теорема 5.4.1. Пусть Т = {Bi}iej является к-кратным покрытием трехмерного евклидова пространства открытыми единичными шарами. Пусть каждая точка пространства R3 содержится не более чем в t шарах из Т. Если e.t*2l*/2k-l^l, то покрытие Т разложимо. Доказательство. Определим бесконечный гиперграф Н = (V(H),E(H)) следующим образом. Множество V(H) вершин гиперграфа Я —это просто Т = {Bi}iej. Для каждого х Е R3 положим Ех = {Bi е Т : х Е Д}. Множество Е(Н) ребер гиперграфа Н есть просто множество семейств Ех с учетом того, что при Ех = Еу ребро берется один раз. Мы утверждаем, что каждое ребро Ех пересекает менее t3218 других ребер из Н. Если х Е Bi, то центр шара Bi находится на расстоянии не больше 1 от х. Если же BjOBi ф 0, то центр шара Bj находится внутри шара радиуса 3 с центром в точке х, а сам Bj полностью содержится в шаре радиуса 4 с центром в х. Шар Bj покрывает долю, в точности равную 4_3 = 2_6 от объема этого
90 Глава 5. ЛОКАЛЬНАЯ ЛЕММА шара. Поскольку ни одна из вершин не покрывается больше t раз, существует не более 26t таких шаров. Нетрудно проверить, что т шаров в R3 разделяют пространство R3 меньше чем на га3 компонент связности. Поэтому существует не более (26£)3 различных шаров Еу, пересекающих Ех. Рассмотрим теперь произвольный конечный подгиперграф L гиперграфа Н. Каждое ребро в L имеет по меньшей мере к вершин и пересекает не более d < t3218 других ребер из L. Так как по условию e(d + 1) < 2fc_1, из теоремы 5.2.1 (которая является простым следствием локальной леммы) следует, что L является 2-раскрашиваемым. Это означает, что можно раскрасить вершины гиперграфа L в синий и красный цвета так, что ни одно из ребер в L не является монохроматическим. Это справедливо для любого конечного гиперграфа L. Соображения компактности, аналогично тому, как они использовались в доказательстве теоремы 5.2.2, показывают что Н является 2-раскрашиваемым. При заданной 2-раскраске гиперграфа Н без монохроматических ребер мы просто выбираем в качестве Т\ множество всех синих шаров, а в качестве ^-множество красных. Ясно, что каждое Т% является покрытием для R3. что и завершает доказательство теоремы. ■ Стоит заметить, что теорема 5.4.1 может быть легко обобщена на случай больших размерностей. Мы опускаем детальную формулировку этого обобщения. 5.5. ЛИНЕЙНАЯ ДРЕВЕСНОСТЬ ГРАФОВ Линейным называется лес (т. е. ациклический простой граф), в котором каждая компонента связности является цепью. Линейная древесностпь la(G) графа G есть минимальное число линейных лесов, объединение которых содержит все ребра графа G. Это понятие было введено Харари как один из типов покрытий, являющийся инвариантом графа. Следующая гипотеза, известная как гипотеза линейной древеснос?аи возникла в статье [Akiyama, Exoo and Нагагу (1981)]. Гипотеза 5.5.1 (гипотеза линейной древесности). Линейная древесностпь любого d-регулярного графа равна \(d+ l)/2]. Заметим, что поскольку каждый d-регулярный граф Gen вершинами имеет nd/2 ребер, каждый линейный лес в нем имеет не более п — 1 ребер. Отсюда немедленно следует неравенство la(G) > w^T) > 2- Так как la(G) — целое, la(G) > \{d + l)/2]. Трудность доказательства гипотезы 5.5.1 лежит в обосновании справедливости обратного неравенства: la(G) ^ \{d + 1)/2]. Заметим, что поскольку каждый граф G с максимальной степенью вершины А является подграфом А-регулярного графа (который, быть может, имеет больше вершин, а также большее число ребер, чем G), то
5.5. ЛИНЕЙНАЯ ДРЕВЕСНОСТЬ ГРАФОВ 91 гипотеза линейной древесности эквивалентна утверждению о том, что линейная древесность каждого графа G с максимальной степенью А не превышает Г(А + 1)/21. Хотя эта гипотеза привлекла большое внимание, наилучший общий результат в этом направлении, полученный без применения вероятностных соображений, состоит в том, что la(G) ^ [ЗА/5] для четных А и la(G) ^ |~(ЗА + 2)/5] для нечетных А. В этом разделе мы докажем, что для любого е > О существует Ао = Ао(е), такое, что для всякого А > Ао и любого графа с максимальной степенью А его линейная древесность меньше (^+е)А. Этот результат (с несколько более сложным доказательством) был получен А лоном в [Alon (1988)]. Его доказательство существенно опирается на локальную лемму. Заметим, что его доказательство более сложное, чем другие, приводимые в этой главе, и требует определенных предварительных сведений. Некоторые из них представляют самостоятельный интерес. Нам будет удобнее вывести результат для неориентированных графов из его аналога для ориентированных графов. Ориентированный граф называется d-регулярным, если степени захода и исхода каждой вершины равна d. Линейный ориентированный лес —это ориентированный граф, в котором каждая компонента является ориентированной цепью. Ориентированная линейная древесность dla(G) ориентированного графа G — это минимальное число линейных ориентированных лесов в G, объединение которых содержит все дуги графа G. «Ориентированная версия» гипотезы линейной древесности, впервые сформулированная в 1987 г. в статье [Nakayama and Peroche (1987)], гласит: Гипотеза 5.5.2. Для каждого d-регулярного орграфа D dla(D) = d+l. Заметим, что ребра любого (связного) 2d-регулярного неориентированного графа G могут быть ориентированы вдоль эйлерова цикла так, что полученный в результате ориентированный граф является d-регулярным. Справедливость гипотезы ориентированной линейной древесности 5.5.2 для d влечет справедливость гипотезы линейной древесности 5.5.1 для 2d. Легко доказать, что произвольный граф с п вершинами и максимальной степенью d содержит независимое множество размера не меньше n/(d + 1). Следующее утверждение показывает, что ценой уменьшения размера такого множества в некоторое постоянное число раз можно гарантировать, что оно будет обладать некоторым дополнительным свойством. Предложение 5.5.3. Рассмотрим граф Н = (V, Е) с максимальной степенью d и разбиение V = V1UV2U.. .UVr множества V наг попарно непересекающихся множеств. Пусть каждое множество V* имеет мощность \У%\^ 2ed, где е — основание натурального логарифма. Тогда существует независимое множество вершин W CV, такое, что оно содержит по одной вершине из каждого VJ.
92 Глава 5. ЛОКАЛЬНАЯ ЛЕММА Доказательство. Мы можем предположить, что каждое множество V* имеет мощность, в точности равную д = \2ed] (иначе просто заменим каждое V* подмножеством мощности д, а Я —графом, который индуцирован объединением этих г новых множеств). Выберем из каждого множества VJ случайно и независимо по одной вершине в соответствии с равномерным распределением. Пусть W — случайное множество выбранных таким образом вершин. Чтобы закончить доказательство, покажем, что с положительной вероятностью W является независимым множеством вершин в графе Н. Для каждого ребра графа Н определим событие А/, состоящее в том, что W содержит оба конца ребра /. Очевидно, Рг[Л/] ^ 1/<72- Кроме того, если концы ребра / лежат в VJ и Vj, то Af взаимно независимо со всеми событиями, соответствующих ребрам, концы которых не лежат в Vi U Vj. Следовательно, максимальная степень вершины орграфа зависимости меньше 2gd. Поскольку е - 2gd • 1/д2 = 2ed/g < 1, то в силу следствия 5.1.2 мы заключаем, что с положительной вероятностью ни одно из событий Af не происходит. Но это означает, что W является независимым множеством, содержащим по одной вершине из каждого VJ, что и требовалось. ■ Предложения 5.5.3 достаточно, чтобы доказать гипотезу линейной древес- ности 5.5.2 для орграфов без коротких ориентированных циклов. Напомним, что ориентированный обхват орграфа —это минимальная длина ориентированного цикла в нем. Теорема 5.5.4. Пусть G = (U,F) — d-регулярный орграф с ориентированным обхватом д ^ Sed. Тогда dla(G) =d+l. Доказательство. Как хорошо известно, F может быть разбито на d попарно непересекающихся 1-регулярных остовных подграфов i*\,..., Fj графа G. (Это — следствие теоремы Кенига—Холла. Рассмотрим двудольный граф Я, у которого долями вершин А и В являются копии множества С/, и в котором вершина и Е А соединена с v Е В тогда и только тогда, когда (и, v) E F. Поскольку Н является d-регулярным, множество его ребер может быть разбито на d совершенных паросочетаний, соответствующих d 1-регулярным остовным подграфам графа G.) Каждое Fi является объединением непересекающихся по вершинам направленных циклов Сц, С\2,..., CiTi. Пусть Vi, V2,..., Vr — множества ребер всех циклов {Cij : 1 ^ г ^ d, 1 ^ j ^ Г{}. Очевидно, Vi, V2,..., Vr является разбиением множества F всех ребер G, по условию на обхват имеем |VJ| ^ g ^ Sed для всех 1 ^ г ^ г. Рассмотрим линейный граф Н графа G, т. е. граф, множеством вершин которого является множество F ребер графа G, причем два ребра смежны тогда и только тогда, когда у них существует общая вершина в G. Очевидно, Н является {Ad — 2)-регулярным. Поскольку мощность каждого Vi не меньше Sed ^ 2е(Ы — 2), то в силу предложения 5.5.3 существует независимое множество графа Я, содержащее по одному элементу из каждого VJ. Но это означает существование в G
5.5. ЛИНЕЙНАЯ ДРЕВЕСНОСТЬ ГРАФОВ 93 паросочетания М, содержащего не менее одного ребра из каждого цикла С^ из 1-факторов Fi,..., Frf. Следовательно, М, -РДМ, F2\M,..., Fd\M — это d+1 ориентированных лесов в G (один из них является паросочетанием), которые покрывают все его ребра). Следовательно, dla(G) ^d+1. Поскольку G имеет \U\ • d ребер, а каждый ориентированный линейный лес может иметь не более \U\ — 1 ребер, выполнено dla(G) ^ \U\d/(\U\ - 1) > d. Таким образом, dla(G) = d + 1. Теорема доказана. ■ Последняя теорема показывает, что утверждение гипотезы 5.5.2 справедливо для орграфов с достаточно большим (ориентированным) обхватом. Для того, чтобы оперировать с графами малого обхвата, мы покажем, что большинство ребер каждого регулярного орграфа может быть разложено на относительно небольшое число регулярных орграфов с большим обхватом. Для этого нам потребуется следующее утверждение, доказываемое с помощью локальной леммы. Лемма 5.5.5. Пусть G = (V,E) — d-регулярный граф с достаточно большим d, а р — целое число, удовлетворяющее неравенствам lOVa < р ^ 20Vd. Тогда существует р-раскраска вершин графа G цветами 0,1,2, ..., р — 1 со следующим свойством: для всякой вершины v Е V и любого цвета г величины N+(v,i) = \{и е V : (v,u) Е E, и раскрашена в цвет г}\ и N~(v,i) = \{u Е V : (и,v) e E, и раскрашена в цвет г}\ удовлетворяют неравенствам \N+(v,i) - -I ^ 3y/d/pV\nd, t <5-8> N-(v,i)--\ ^S^/dfrVhul. р\ Доказательство. Пусть / : V —► {0,1,...,р- 1} —случайная раскраска множества V в р цветов, при которой f(v) Е {0,1,... ,р — 1} выбирается для каждого v e V в соответствии с равномерным распределением. Для каждой вершины v Е V и каждого цвета г,0 < г < р, обозначим через А^i событие «число 7V+(v, г) соседей вершины v в G, окрашенных в цвет г, не удовлетворяет неравенству (5.8)». Очевидно, N+(v, г) — биномиальная случайная величина с математическим ожиданием ^ и стандартным отклонением л/^(1 — ^) < л/^. Следовательно, в силу стандартных оценок для биномиального распределения (см. Приложение А), для всякого v eV и 0 ^i < р Pr[A+J < \/d\ Аналогично, если А~{ — событие «число N~(v,i) соседей вершины v в G, окрашенных в цвет г, не удовлетворяет неравенству (5.8)», то Pr[A-J < 1/d4.
94 Глава 5. ЛОКАЛЬНАЯ ЛЕММА Ясно, что каждое из событий А^ i или Av i взаимно независимо со всеми событиями А+ или А~ • для всех вершин и Е V, которые не имеют общих соседей си в графе G. Следовательно, орграф зависимости для всех наших событий имеет максимальную степень, не превосходящую {2d)2 • р. Поскольку е - -jj((2d)2p + 1) < 1, следствие 5.1.2 (т. е. симметричная форма локальной леммы) утверждает, что с положительной вероятностью ни одно из событий А^i или A~i не происходит. Следовательно, существует раскраска /, удовлетворяющая неравенствам (5.8) для всех vEVn0^i<p. Что и требовалось. ■ Теперь мы можем работать с произвольными регулярными орграфами. Пусть G = (V, Е) — произвольный d-регулярный орграф. Везде далее в доказательстве мы предполагаем, где это необходимо, что d существенно велико. Пусть р — простое число, удовлетворяющее неравенствам lOd1/2 ^ р ^ 20с?1/2 (хорошо известно, что для всякого п существует простое число между п и 2п). По лемме 5.5.5 существует вершинная раскраска / : V —► {0,1,...,р— 1}, удовлетворяющая неравенствам (5.8). Для всякого г, 0 ^ г < р, пусть Gi = (V, Ei) — остовный подграф орграфа G, определяемый равенством Ei = {(u,v) G Е : f(y) = (f(u) + z)modp}. По неравенству (5.8) максимальная степень захода А~ и максимальная степень исхода А* в каждом Gi не превосходит ^ + 3w-л/lnd. Кроме того, для каждого г > 0 длина каждого ориентированного цикла в Gi делится на р. Поэтому ориентированный обхват gi графа Gi не меньше р. Поскольку каждый Gi может быть дополнен путем добавления вершин и ребер до А^-регулярного орграфа с тем же ориентированным обхватом ^ и с Д< = max (А+,А~), и поскольку gi > SeAi (для достаточно больших d), мы заключаем по теореме 5.5.4, что dla(Gi) ^ Аг + 1 < | + 3J^V\nd-\-1 для всех 1 ^ г < р. Для Go мы применяем тривиальное неравенство dla(Go) ^ 2А0 ^ 2- + 6W->/ind, V у Р получаемое, например, вложением Go как подграфа в Ао-регулярный граф, разделяющий ребра этого графа на Ао 1-регулярных остовных подграфов, и разбивая каждый из этих 1-регулярных остовных подграфов на два линейных ориентированных леса. Последние два неравенства вместе с 10Vd ^р^ 20y/d дают dla(G) < d + 2- + Зу/pdVh^d + 3А -у/Ш + Р - К d + с • d3/4(lnd)1/2. V у Р Таким образом доказан следующий результат. Теорема 5.5.6. Существует абсолютная константа с > 0, такая, что для каждого d-регулярного орграфа G dla(G) ^d + c^/^lnd)1/2.
5.6. ЛАТИНСКИЕ ТРАНСВЕРСАЛИ 95 Заметим, что, действуя более аккуратно, мы можем довести остаточный член до c'd2/3(\nd)1/3. Поскольку ребра неориентированного ^-регулярного графа с d = 2/ могут быть ориентированы так, что полученный орграф станет /-регулярным, и поскольку всякий (2/ — 1)-регулярный неориентированный граф является подграфом некоторого 2/-регулярного графа, последняя теорема влечет следующий результат. Теорема 5.5.7. Существует абсолютная константа с > О, такая, что для всякого неориентированного d-регулярного графа G la^^+cd^tod)1'2. 5.6. ЛАТИНСКИЕ ТРАНСВЕРСАЛИ Обсуждая доказательство локальной леммы, мы заметили, что предположение взаимной независимости может быть заменено более слабым предположением о достаточно малой условной вероятности каждого события, при условии взаимной «невстречаемости» произвольного множества событий, каждое из которых несмежно с ним в орграфе зависимости. В этом разделе мы покажем, как эта модифицированная версия леммы была применена в статье Эрдёша и Спенсера [Erd6s and Spencer (1991)]. Пусть А = (а^) — матрица размера п х п скажем, из целых чисел. Перестановка 7г называется латинской трансверса- лью (для А), если все элементы а^г) (1 ^ г < п) различны между собой. Теорема 5.6.1. Пусть k ^ (п— 1)/(4е) и никакое целое число не встречается в качестве элемента матрицы А более к раз. Тогда А обладает латинской трансверсалью. Доказательство. Пусть 7г —случайная перестановка на множестве {1,2,... ,п}, выбранная в соответствии с равномерным распределением из всех возможных п\ перестановок. Обозначим через Т множество всех упорядоченных четверок (i,j,if,jf), таких, что г < i',j ф j' и а^ = а^у. Для каждого (z,j, if,jf) G Т, пусть А^у означает событие «7г(г) = j и 7г(г7) = j'». Существование латинской трансверсали эквивалентно утверждению, что с положительной вероятностью ни одно из этих событий не происходит. Определим симметричный орграф (т. е. просто граф) G на вершинах множества Т, полагая, что вершина (z,j, if,jf) смежна с (p,q,p',q') тогда и только тогда, когда либо {г, г7} П {р,р'} Ф 0, либо {j,f} П{#, q'} ф 0. Таким образом, эти две четверки несмежны тогда и только тогда, когда четыре клетки (г, j), (г7,/), (р,q) и {p',q') встречаются в четырех различных строках и в четырех различных столбцах матрицы А. Максимальная степень графа G меньше 4пк. В самом деле, для данной четверки (i,j,if,jf) G Т существует не более An способов выбрать пару (s, t) такую, что или s E {г, г'} или t G {j,/}, и для каждой пары (s,t) существует не более к способов выбора (s',t') ф (s,t) с ast = as>t>. Всякая такая четверка (s,t,s',t') может
96 Глава 5. ЛОКАЛЬНАЯ ЛЕММА быть однозначно представлена в виде (p,q,p',q') при р < р'. Поскольку е ' ^п^ ' n(n-i) ^ 1> требуемый результат вытекает из упомянутого выше усиления симметричной версии локальной леммы, если мы покажем, что Рг Aiji'jA l\ Apqpfqf п[п — 1) для любой четверки (г, j, г'\jf) Е Т и любого множества 5 элементов множества Т, не смежных в G с (г, j, i\f). В силу симметрии мы можем предположить, что г = j = 1,г' = j' = 2, и что, следовательно, ни одна из р или q не равна ни 1, ни 2. Назовем перестановку 7Г хорошей, если l\Apqpiqi. Пусть s Sij обозначает множество всех хороших перестановок 7г, удовлетворяющих условию 7г(1) = г и 7г(2) = j. Мы утверждаем, что |Si2| ^ \&ij\ Для всех г ф j. В самом деле, предположим сначала, что г, j > 2. Для каждой хорошей 7Г G 5i2 определим перестановку 7г* следующим образом. Предположим, что 7г(х) = г, 7r(y) = j. Тогда определим 7г*(1) = г,7г*(2) = j,7г*(ж) = 1,7г*(у) = 2 и 7г*(£) = 7г(£) для всех t ф 1,2,х,у. Можно легко проверить, что 7г* —хорошая, так как ни одна из пар (1,г), (2, j), (х, 1), (у,2) не является частью ни одной {РЛ,Р'\q') £ S. Поэтому 7Г* Е Sij, и так как отображение 7г —► 7г* инъективно, то |5i2| ^ |^j|5 как и обещано. Аналогично можно определить инъективное отображение, показывающее, что |Si2| ^ |^|5 даже когда {i,j} П {1,2} ф 0. Отсюда следует, что Рг[Лц22 Л Д Avqv>qi\ < Pr[Au2j Л Д Avqv>q>] для всех г ф j, S S а, значит, Рг А1122 | Д Ар ^pqp'q s' неравенство (5.9). Тем самым доказательство завершено. ^ — —-. В силу симметрии отсюда следует п(п — 1) 5.7. АЛГОРИТМИЧЕСКИЙ АСПЕКТ Когда вероятностный метод применяется с целью доказать, что определенное событие имеет место с высокой вероятностью, это часто дает эффективный детерминированный алгоритм или, по крайней мере, рандомизированный алгоритм решения соответствующей проблемы. Применение локальной леммы Ловаса часто дает нам возможность доказать, что данное событие происходит с положительной вероятностью, хотя эта вероятность может быть экспоненциально малой от размерности задачи. Поэтому неясно, можно ли извлечь из таких доказательств полиномиальные алгоритмы решения соответствующих алгоритмических проблем. Довольно долго не существовало методов преобразования доказательств какой-либо из обсуждаемых в этой главе задач в эффективный алгоритм. В 1991 г. Д. Бек предложил метод, позволяющий решать эту проблему для некоторых таких задач с небольшими потерями в константах. Он продемонстрировал в работе [Beck (1991)] свой метод на примере задачи о 2-раскраске
5.7. АЛГОРИТМИЧЕСКИЙ АСПЕКТ 97 гиперграфа. Для простоты мы опишем здесь только случай ребер фиксированного размера, когда каждое ребро пересекается с фиксированным числом других ребер. Пусть n, d — фиксированные натуральные числа. Под (п, ^-задачей подразумевается следующее. Пусть заданы множества Ai,... ,An С Q, такие, что \Ai\ = n, и при этом каждое из А{ пересекается не больше чем с d другими А у Требуется найти 2-раскраску множества £2, при которой не существует монохроматических Ai. Теорема 5.2.1 гарантирует разрешимость нашей задачи при e(d+l) < 2n_1. Вопрос: можем ли мы найти раскраску за полиномиальное (от N при фиксированных n, d) время? Бек дал утвердительный ответ на этот вопрос при некоторых более сильных предположениях. Предположим, что Q = {1,..., га}, га < Nn, а начальная структура данных состоит из списка элементов множеств А{ и списка, указывающего для каждого элемента j те г, для которых j e А{. Обозначим через G граф зависимости с А{ в качестве вершин и парами пересекающихся A{,Aj в качестве ребер. Теорема 5.7.1. Пусть n,d таковы, что для величины D = d(d — I)3 существует разложение п = щ + п^ Л- пз, где 16£>(l + d) <2ni, 16£>(l + d) < 2П2, 2e(l + d) <2П3. Тогда существует рандомизированный алгоритм с математическим ожиданием времени работы 0(N(\nN)c) для (n, d)-задачи, где с —константа (зависящая только от п и d). Для фиксированного е < 1/11 заметим, что упомянутые выше условия выполняются для достаточно больших п, если d < 2П£ и п\ = П2 ~ 5п/11, пз ~ п/11. Подчеркнем еще раз, что анализ алгоритма проводится для фиксированных n, d и N, стремящегося к бесконечности, хотя рассуждения могут быть распространены на случай, когда указанные переменные не являются фиксированными. Бек указал детерминированный алгоритм решения (n, d)-задачи. Рандомизированный алгоритм, который здесь предлагается, может быть деран- домизирован с использованием приемов из гл. 15. Время работы остается полиномиальным, и, по-видимому, не большим ДГ1+°(1). Более того, алгоритм может быть распараллелен с использованием техники из гл. 15 и некоторой модификации алгоритма. Доказательство. Первый проход. Во время этого прохода точки будут красными, синими, нераскрашенными или резервными. Мы движемся по вершинам j G ^, раскрашивая их красным или синим случайно, выбирая цвет подбрасыванием правильной монеты. После того, как некоторая вершина j раскрашена, мы проверяем все А{, содержащие j. Если А{ в этот момент имеет П\ точек одного цвета и ни одной точки другого цвета, мы назовем Ai опасной.
98 Глава 5. ЛОКАЛЬНАЯ ЛЕММА Все нераскрашенные к Е А{ объявляются резервными. Когда резервные точки к впоследствии встречаются при раскраске, они не окрашиваются, а просто пропускаются. В результате первого прохода точки становятся красными, синими или резервными. Мы скажем, что множество А{ выживает, если оно не состоит только из красных или только из синих точек. Обозначим через 5 (случайное) множество выживших точек из G. Утверждение 5.7.2. Почти наверное все компоненты С из G\s имеют размер 0(ln N). Доказательство. Множество Ai Е 5 может быть опасным или, возможно, многие из его точек были резервными ввиду того, что соседствующие с ними (в G) множества оказались опасными. Вероятность того, что некоторое Ai становится опасным, не превышает 21_П1, так как должно произойти п\ подбрасываний монеты (определяющих цвета точек j Е Ai) с одним и тем же исходом. (Мы имеем только неравенство, так как, к тому же, все эти п\ точек из Ai должны быть окрашены, а не стать резервными.) Пусть V — независимое множество в G, т. е. Ai Е V попарно не пересекаются. Тогда вероятность того, что все Ai E V становятся опасными, не превышает (21_ni)lvl, поскольку бросания монеты проводятся для непересекающихся множеств. Пусть теперь V С G таково, что все расстояния между Ai E V не меньше 4. (Расстояние — это длина кратчайшей цепи между вершинами в G). Мы утверждаем, что Pr[FC5]^(d+l)lvl(21-ni)lvl. Это выполнено потому, что для каждого Ai £ V существуют не более d + 1 способов выбора опасного соседа А#, а следовательно, не более (d + l)'v' способов выбрать А^. Поскольку Ai, находящееся на расстоянии не меньшем четырех от А#, не может быть смежным с ним, вероятность того, что они все опасны, не больше (21_ni)lvl, как и утверждалось. Назовем Т С G ^-деревом, если Ai E T таковы, что расстояния между ними в графе G не меньше четырех, и при этом, соединив ребром каждые два множества Ai,Aj E Т, находящиеся на расстоянии четыре, мы получим связный граф. Мы оценим сначала число 4-деревьев размера и. Граф «дистанции четыре», определенный на Т, должен содержать дерево. Существует не больше чем 4J деревьев (с точностью до изоморфизма) на j вершинах. Зафиксируем одно из них. Мы можем пометить вершины дерева числами 1,..., и так, что каждое j > 1 смежно с некоторой г < j. Теперь рассмотрим число семейств (А1,...,Аи), для которых граф дистанции четыре соответствует этому дереву. Существует N способов выбора А1. При выбранном Аг для всех г < j множество А7 должно быть на расстоянии четыре от Лг в G. Имеется не более D таких точек. Следовательно, число 4-деревьев размера и не больше AuNDu~l < N(4D)U. Для заданного 4-дерева Т мы уже доказали, что Рг[Т С S] ^ [(d+l)21_ni]u. Значит, математическое ожидание числа 4-деревьев Т С 5 не больше N[8D(d+l)2-ni]u.
5.7. АЛГОРИТМИЧЕСКИЙ АСПЕКТ 99 Поскольку содержимое скобок по предположению меньше 1/2, при и = с\ In N все выражение есть о(1). Итак, почти наверное G\s не содержит 4-деревьев размера, большего чем с\ In TV. В действительности, мы хотим ограничить размер компонент С графа G\s- Максимальное 4-дерево Т в компоненте С обладает тем свойством, что каждое Л{ Е С лежит в дереве Aj E Т. Имеется меньше чем d3 (константа) множеств А{ с тремя Aj, следовательно, с\ In N ^ \Т\ ^ |C|d-3, и поэтому (поскольку d — константа) \С\ <с21пАГ, что и требовалось. ■ Если после первого прохода остаются компоненты размера, большего чем С2 In TV, мы просто полностью повторяем всю процедуру. В ожидаемое линейное время первый проход оказывается успешным. Точки, окрашенные красным и синим, отныне зафиксированы (в своем статусе). Множества Ai, в которых встречаются как красные, так и синие точки теперь игнорируются. Для каждого выжившего А{ зафиксируем подмножество В{ его п — п\ резервных точек. Теперь достаточно раскрасить резервные точки так, чтобы ни одно из В{ не было монохроматическим. Множество Bi разбито на компоненты размера O(lniV), поэтому достаточно раскрасить каждую компоненту в отдельности. При втором проходе мы применяем метод первого прохода к каждой компоненте множества Bi. Назовем множество Bi опасным, если оно содержит П2 точек одного цвета и не содержит точек другого цвета. Математическое ожидание времени, требуемого при втором проходе для раскраски компоненты размера М, равно О(М). Следовательно, математическое ожидание времени, требуемого для раскраски всех компонент, равно O(N). (Для того чтобы такая раскраска была успешной, мы должны потребовать, чтобы компонента размера М разбивалась на компоненты размера не больше C2lnM. Во избежание тривиальностей, при М < In In TV мы не проводим второй проход для соответствующей компоненты). После осуществления второго прохода (все еще за линейное время!) существует семейство дважды выживших множеств Ci С Bi С Ai размера пз, максимальный размер компоненты которых не больше O(lnlniV). Нам все еще нужно раскрасить эти O(N) компонент из множеств размера пз, каждая компонента которых имеет размер O(lnlniV). В силу локальной леммы (или прямо по теореме 5.2.1), каждая из этих компонент может быть 2-раскрашиваемой. Мы найдем теперь 2-раскраску с помощью грубой силы! Перебирая все 2-раскраски компонент размера М, мы тратим время 0(М2М), которое в нашем случае равно 0((ln N)C). Проводя это для каждой компоненты, мы тратим время 0(N(\nN)c). Раскраска завершена. ■ Заметим, что при чуть больших ограничениях на n, d с помощью третьего прохода можно было бы добиться общей затраты времени порядка 0(iV(lnlniV)c). Заметим также, что подобный прием может быть применен для преобразования некоторых других приложений локальной леммы в эффективные алгоритмы.
100 Глава 5. ЛОКАЛЬНАЯ ЛЕММА 5.8. УПРАЖНЕНИЯ 1* Доказать, что для любого целого d > 1 существует конечное c(d), такое, что ребра любого двудольного графа с максимальной степенью вершины d, в котором каждый цикл имеет не менее c(d) ребер, могут быть раскрашены d + 1 красками так, что не существует двух смежных ребер одного цвета, и не существует 2-раскрашенных циклов. 2* Доказать, что для каждого е > 0 существует /о = 1о(е) и бесконечная двоичная последовательность а1,а2,аз>--- > аг £ {0,1}, такая, что для всякого числа / > /о и любого номера г ^ 1 два бинарных вектора и = (а*, а*+1,..., ai+/_i) и v = (a*+/, a*+/+i,..., a^j-i) отличаются не менее чем в (| — е)1 координатах. 3. Пусть G = (V,E) — простой граф, и пусть каждой вершине v G V сопоставлено множество 5(v) цветов, такое, что \S(v) ^ 10d|, где d ^ 1. Предположим вдобавок, что для любой вершины v Е V и цвета с G 5(v) существует не более d соседей w вершины v, таких, что с G 5(w). Доказать, что существует правильная раскраска графа G, окрашивающая каждую вершину v в цвет из S(v). 4. Пусть G = (V, £?) — цикл длины 4п и V = V\ U V2 • • • U Vn — разбиение его 4п вершин на п попарно непересекающихся подмножеств, каждое из которых имеет мощность 4. Верно ли, что обязательно существует независимое множество графа G, содержащее ровно одну вершину из каждого Vi ? (Доказать или привести контрпример.) 5* Доказать, что существует абсолютная константа с > 0, такая, что для любого к существует множество Sk, состоящее по меньшей мере из ск In к целых чисел, такое, что для любой раскраски целых чисел в к цветов существует целое х, для которого множество x+Sk не пересекает все классы цветов.
ВЕРОЯТНОСТНЫЙ ВЗГЛЯД: Ориентированные циклы Пусть D = (V, Е) — простой ориентированный граф с минимальной степенью исхода 8 и максимальной степенью захода Д. Теорема [Alon and Linial (1989)]. Если е{А6 +1) (1 - £)* < 1, то граф D содержит ориентированный простой цикл длины 0(mod/c). Доказательство. Очевидно, можно предполагать, что степень исхода каждой вершины в точности равна J, так как иначе можно рассмотреть подграф графа D с таким свойством. Пусть / : V —► {0,1,..., к — 1}—случайная раскраска множества V, полученная путем выбора для каждой вершины v Е V независимо и равновероятно значения f(v) Е {0,..., к — 1}. Для всякой вершины v eV обозначим через Av событие «не существует вершины и Е V, для которой (v,u) Е E и f(u) = (f(v) + l)(mod/c)». Ясно, что Pr[Av] = (l - £) . Нетрудно проверить, что каждое Av взаимно независимо со всеми событиями Аи, кроме тех, которые удовлетворяют условию N+(v)n(u{jN+(u)) фа, где N+(v) = {w E V : (v,w) Е Е}. Число таких и не превосходит AS и, значит, по нашему предположению и локальной лемме (следствие 5.1.2) вероятность Рг [/\veV Av] > 0. Следовательно, существует / : V —► {0,1,..., к - 1}, такое, что для каждого v €V существует вершина ugF, для которой (v, и) Е Я и /(и) = (/(v) + 1) (mod /с). (1) Начав с произвольной вершины v = vo E V и применяя раз за разом (1), мы получим последовательность vo, v\, V2,... вершин из £>, такую, что (v*, Vi+i) Е i£ и /(vi+i) = (f(vi) + 1) (mod/с) для всех г ^ 0. Пусть j — минимальное целое, для которого существует £ < j, такое, что v^ = Vj. Последовательность veve+ive+2 • • • Vj = ve представляет собой простой ориентированный цикл в £), длина которого делится на к. Ш
6_ Корреляционные неравенства Думай, Буч, думай, — это именно то, в чем ты силен. Роберт Редфорд Полу Ньюмену, Буч Кассиди и Санденс Кид Пусть G = (V,E) —случайный граф на множестве вершин V = {1,2, ...,п}, в котором произвольная пара г, j Е У,г Ф j является ребром независимо (от других) с вероятностью р, где 0 < р < 1. Обозначим через Я событие «граф G является гамильтоновым», а через Р — событие «граф G является планарным». Предположим, мы хотим сравнить две величины Рг[Р Л Я] и Рг[Р] -Рг[Я]. Интуитивно кажется, что знание того, что граф G — гамильтонов, предполагает, что в нем много ребер и, значит, G скорее всего не является планарным. Следовательно, представляется естественным ожидать, что выполнено неравенство Рг[Р|Я] ^ Рг[Р], влекущее Рг[РАЯ] ^Рг[Я]-Рг[Р]. Это неравенство, которое и в самом деле верно, является специальным случаем FKG-неравенства, принадлежащего Фортуину, Кастелейну и Джинибру [Fortuin, Kasteleyn and Ginibre (1971)]. В данной главе мы приводим доказательство этого неравенства и некоторых родственных результатов, которые имеют отношение к корреляции между определенными событиями в вероятностных пространствах. Доказательства всех этих результатов достаточно простые, и, тем не менее, они порождают много интересных следствий. Первое неравенство такого типа принадлежит Харрису [Harris (I960)]. Результат, наиболее близкий к тем, что рассматриваются здесь, — это лемма Клейт- мана [Kleitman (1966b)], утверждающая, что если Л и В — два монотонно убывающих семейства подмножеств множества {1,2, ...,п} (т.е., А € Ли А' С А => А' е Л и, аналогично, В е В и В' С В => В' е В), то \АПВ\-2П>\А\-\В\. За этой леммой последовала масса усилений и обобщений, пока Альсведе и Дайкин [Ahlswede and Daykin (1978)] не получили весьма общий результат,
6.1. ТЕОРЕМА О ЧЕТЫРЕХ ФУНКЦИЯХ АЛЬСВЕДЕИ ДАЙКИНА 103 из которого все эти обобщения вытекают. В следующем разделе мы приведем этот результат и его доказательство. Некоторые из многочисленных его приложений обсуждаются в оставшейся части главы. 6.1. ТЕОРЕМА О ЧЕТЫРЕХ ФУНКЦИЯХ АЛЬСВЕДЕ И ДАЙКИНА Для п ^ 1 положим N = {1,2, ...,п}. Через P(N) обозначим семейство всех подмножеств множества N, а через R+ — множество неотрицательных действительных чисел. Для функции <р : P(N) —► R4" и семейства А подмножеств множества N положим <р(А) = Хмед^^)- Для ДВУХ семейств А и В подмножеств множества N определим Аи В = {Аи В : А е А, В е В} и АпВ = {АпВ:АеА,ВеВ}. Теорема 6.1.1 (теорема о четырех функциях). Пусть четыре функции а, (3,1,6: P(N) —► R+ отображают семейство всех подмножеств множества N во множество неотрицательных действительных чисел. Если для любых двух подмножеств A,BCN выполняется неравенство а(А)(3(В) ^ <у(А U В)6(А П В), (6.1) то для любых двух семейств подмножеств А, В С P(N) а(А)(3{В) ^ >у(А U В)6{А П В). (6.2) Доказательство. Сначала модифицируем четыре функции а, (3,7,6, положив а(А) = 0 для всех А 0 A, (3(B) = 0 для всех В 0 В, 7(C) = О Для всех С 0 A U S и £(£>) = 0 для всех D 0 АПВ. Ясно, что соотношение (6.1) остается справедливым для модифицированных функций, и в неравенстве (6.2) мы можем считать теперь, что A = B = AuB = Af)B = P(N). Докажем неравенство (6.2) индукцией по п. Единственный случай, когда требуются некоторые вычисления, это п = 1. Тогда P(N) = {0,N}. Для всякой функции (р G {a, (3,j,6} определим </?о = <р(&) и <pi = <p(N). В силу неравенства (6.1) имеем &о(Зо ^ 7о^о, ao0i ^ 7i<*o, <*iA> ^ 7i^o, Согласно замечанию из предыдущего раздела мы должны только доказать неравенство (6.2), где А = В = P(N), т. е. доказать, что (ао + ai)(flo + (3i) ^ (7о + 7i)(*o + <Ji). (6.4) Если 7i = 0 или 6о = 0, утверждение сразу следует из условий (6.3). В противном случае в силу соотношений (6.3) выполнены неравенства 7о ^ ^$ и ^ ^ £i£i Значит, достаточно показать, что (^+7i) (<*о + ^) ^ (ao + ai)(A> + (Зг), или, что то же, (аоА) + 7i^o)(^o7i + ai/?i) ^ (ао + ai)($) + /3i)<Jo7i- Последнее эквивалентно
104 Глава 6. КОРРЕЛЯЦИОННЫЕ НЕРАВЕНСТВА неравенству (7i*o - ao0i)(7i<*o - ai#>) ^ 0, которое вытекает из соотношений (6.3), поскольку оба сомножителя из левой части неотрицательны. Это завершает доказательство для случая п = 1. Пусть теперь утверждение справедливо при п — 1. Докажем его для п ^ 2. Положим TV7 = 7V\{n} и определим для каждой функции <р G {а,/?,7,*} и любых А С N' функцию <р'(А) = <р(А) + </?(А U {п}). Ясно, что для каждой <р G {a, /J, 7, *} выполнено равенство (p'(P(N')) = (p(P(N)). Поэтому требуемое неравенство (6.3) будет следовать из предположения индукции, примененного к функциям ос',/?'',7'',&' : P(N') —► R+. Однако чтобы применить это предположение, необходимо убедиться, что эти новые функции удовлетворяют условиям теоремы 6.1.1 на множестве N', т. е. что для любых А', В' С Nf выполнено неравенство а'(А')0(В') ^ У(^/ U B')<J'(4' П В'). (6.5) Оно легко вытекает из случая п = 1, который уже рассмотрен. В самом деле, пусть Т является одноэлементным множеством. Определим а(0) = а(Л'), а(Т) = а{А' U {п}), 0(0) =J(B'), 0(Т) = 0(В' U {п}), 7(0) = 7^' U В'), 7(Г) = 7(^' U Б7 U {п}) и J(0) = 8(А' П Б7), <J(T) = 6((А' П Б7) U {п}). По предположению (6.1), для всех S,R С Т выполнено соотношение a(S)(3(R) ^ 7(«5 U R)S(S П Я), и, следовательно, в силу доказанного для п = 1, имеем а'(Л')/?'(Я') = а(Р(Т))ЖР(Т)) ^ %Р(Т))6(Р(Т)) = 7'(А' U В')8'{А' П -В'), которое является требуемым неравенством (6.5). Следовательно, неравенство (6.2) выполняется, что и завершает доказательство. ■ Теорема Альсведе—Дайкина может быть обобщена на произвольные конечные дистрибутивные решетки. Решетка — это частично упорядоченное множество, в котором любые два элемента ж и у имеют единственную верхнюю грань, обозначаемую через ж V у и называемую объединением ж и у, а также единственную нижнюю грань, обозначаемую через ж А у и называемую пересечением х и у. Решетка L является дистрибутивной, если для всех ж, у, z Е L выполнено равенство х А (у V z) = (ж А у) V (х A z), или, что эквивалентно, если для всех ж, у, z G L верно соотношение х V (у Л z) = (ж V у) Л (ж V z). Для двух множеств X,Y С L определим X V У = {ж V у : ж G X, у G Y}, и X Л У = {ж Л у : ж G X, у G Y}.
6.1. ТЕОРЕМА О ЧЕТЫРЕХ ФУНКЦИЯХ АЛЬСВЕДЕИ ДАЙКИНА 105 Любое подмножество L множества P(N), где N = {1,2, ...,п}, упорядоченное по включению и замкнутое относительно операций объединения и пересечения, является дистрибутивной решеткой. Здесь объединение двух элементов A,BeL есть просто объединение множеств Ли Б, а их пересечение есть обычное пересечение множеств А Г) В. Нечто более удивительное (но легко проверяемое) состоит в том, что для каждой конечной дистрибутивной решетки L существует п, такое, что L изоморфна некоторой подрешетке решетки Р({1,2,... ,п}). (Чтобы в этом убедиться, назовем элемент х Е L объединительно-неизбыточным, если из х = у V z вытекает, что х = у или х = z. Пусть х i,X2,... ,хп — множество всех объединительно-неизбыточных элементов в L. Каждому элементу х Е L поставим в соответствие множество А = А(х) С TV, где х = V Х{ и {xi : i e A} — все объединительно-неизбыточные у, такие,что у ^ х. Отображение х —► А(х) является искомым вложением.) Этот факт позволяет нам обобщить теорему 6.1.1 на произвольные конечные дистрибутивные решетки следующим образом. Следствие 6.1.2. Пусть L —конечная дистрибутивная решетка, а а,(3,ч и S — четыре функции из L в R+. Если а(х)(3(у) ^ 7(я V у)8(х А у) для всех х,у G L, то для всех X,Y С L выполняется неравенство a(X)0(Y) ^ ч{Х V Y)S(X A Y). Простейшим в последнем следствии является случай, когда все четыре функции а,/?,7 и 8 равны 1. Он формулируется следующим образом. Следствие 6.1.3. Пусть L—конечная дистрибутивная решетка и X,Y CL. Тогда \X\-\Y\ ^ \XVY\-\XAY\. Завершая этот раздел, мы представим очень простое следствие из последнего утверждения, которое впервые было доказано в работе [Marica and Schonheim (1969)]. Следствие 6.1.4. Пусть X — семейство всех подмнооюеств конечного множества. Полооюим X\X = {F\F' :F,F' еХ}. Тогда \X\X\ ^ \Х\. Доказательство. Пусть L — дистрибутивная решетка всех подмножеств множества N. Применяя следствие 6.1.3кХ иУ = {N\F : FgI}, получаем \Х\2 = \Х\ • \Y\ ^ \X U Y\ • \Х П Y\ = \X\X\2, откуда и вытекает требуемое утверждение. ■
106 Глава 6. КОРРЕЛЯЦИОННЫЕ НЕРАВЕНСТВА 6.2. FKG-HEPABEHCTBO Функция ц : L —► R+, где L — конечная дистрибутивная решетка, называется log-супермодулярной, если /х(х)/х(у) ^ /х(х V у)//(х Л у) для всех ж, у G L. Функция / : L —► R+ называется возрастающей, если /(х) ^ /(у) при ж ^ у, и убывающей, если /(ж) ^ /(у) при ж ^ у. В работе [Fortuin et al. (1971)], мотивированной одной задачей из статистической механики, доказан следующий полезный результат, ставший известным как FKG-неравенство. Теорема 6.2.1 (FKG-неравенство). Пусть L—конечная дистрибутивная решетка, и пусть ц : L —► R+ — log-супермодулярная функция. Тогда для любых двух возрастающих функций /, g : L —► R+ имеем (5>(*)/(*)) • (Ем*м*)) < ($>(*)/(*м*)) • (Е^) • (6-6) \хвЬ / \хвЬ / \хвЬ / \хвЬ ) Доказательство. Определим четыре функции а, /3,7,8 • L —► R+ следующим образом. Для всякого х е L положим а(х) = /х(х)/(х), /3(х) = fi(x)g(x), 7(х) = /х(х)/(х)#(х), <J(x) = /х(х). Мы утверждаем, что эти функции удовлетворяют условию теоремы Альсведе— Дайкина, сформулированной в следствии 6.1.2. В самом деле, если х,у G L, то в силу супермодулярности функции // и возрастания функций /ид имеем а(х)/%) = ii(x)f(x)ii(y)g(y) ^ /х(х V y)f(x)g(y)fi(x Ay) ^ ^ //(ж V у)/(ж V у)д(х V у)/х(х Л у) = 7(х V y)J(x Л у). Значит, в силу следствия 6.1.2 (с X = Y = L) выполнено неравенство a(L)(3(L) ^ i(L)6(L), что и требовалось доказать. ■ Заметим, что утверждение теоремы 6.2.1 остается справедливым и в том случае, когда обе функции / и д являются убывающими (просто заменяем 7 и 6 друг на друга в доказательстве). В случае, когда / — возрастающая, а д — убывающая (или наоборот), имеет место противоположное неравенство: (5>(*)/(*)) ($>(*м*)) > (ЕчСоязМ*)) (Ем*) VxGL / VxGL / VxGL / \xeL Чтобы это доказать, просто применим теорему 6.2.1 к двум возрастающим функциям /(ж) и к — д(х), где к есть константа maxxGL g(x). (Эта константа необходима, чтобы гарантировать выполнение неравенства к — д(х) ^ 0 для всех х е L.) Полезно рассмотреть \х как меру на L. Предполагая, что // не равна тождественно нулю, мы можем определить для каждой функции / : L —► R+
6.3. МОНОТОННЫЕ СВОЙСТВА 107 ее математическое ожидание EzglMz) В этих терминах FKG-неравенство утверждает, что, если \х является log- супермодулярной, а /, д : L —► R"1" обе являются возрастающими или убывающими, то < fg>^< f> - <g> • Аналогично, если / является возрастающей, а д — убывающей (или наоборот), то < fg>^< f> - <g> • Эта формулировка ясно демонстрирует вероятностную природу неравенства. Некоторые из его интересных следствий представлены в оставшейся части главы. 6.3. МОНОТОННЫЕ СВОЙСТВА Напомним, что семейство Л подмножеств множества TV = {1,2,... ,п} является монотонно убывающим, если А Е Л и А' С А => А' Е Л. Аналогично, оно является монотонно возрастающим, если А Е Л и А С А' => А' Е Л. Рассматривая показательное семейство P(N) всех подмножеств множества TV как симметричное вероятностное пространство, естественно определить вероятность множества Л равенством Итак, Рг[Л] есть просто вероятность того, что случайно выбранное подмножество множества N лежит в Л. Лемма Клейтмана, служившая стартовой точкой всех корреляционных неравенств, рассматриваемых в этой главе, формулируется следующим образом. Предложение 6.3.1. Пусть Л и В —два монотонно возрастающих семейства подмножеств множества N = {1,2,...,п}, и пусть С и V — два монотонно убывающих семейства подмножеств множества N. Тогда Рг[ДпВ]^Рг[Д].Рг[В], Рг[СП£>] ^Pr[C]-Pr[Z>], Рг[ЛПС] ^Рг[Л]-Рг[С]. В терминах мощностей это можно записать так: 2п\АПВ\>\А\-\В\, 2n\Cf)V\^ \C\-\V\, 2п\ЛГ)С\^\Л\-\С\.
108 Глава 6. КОРРЕЛЯЦИОННЫЕ НЕРАВЕНСТВА Здесь и в дальнейшем через Л ПВ, С Г) V и Л П С обозначены обычные пересечения семейств. Доказательство. Пусть / : P(N) —► R4" — характеристическая функция семейства Л, т. е. /(Л) = О, если А 0 Л, и /(Л) = 1, если Л е Л. Аналогично, пусть g — характеристическая функция семейства В. По предположению / и д — обе возрастающие. Применяя FKG-неравенство с тривиальной мерой \х = 1, получаем Рг[Л П В] =< /0 >^< f>-<g>= Рг[Л] • Рг[В]. Два других неравенства подобным образом вытекают из теоремы 6.2.1 и следующего за ней абзаца. Легко видеть, что предложение может быть выведено из теоремы Альсве- де—Дайкина или из следствия 6.1.3. ■ Последнее предложение имеет некоторые интересные комбинаторные следствия, часть из которых появилась уже в оригинальной статье Клейтмана. Поскольку они являются прямыми следствиями и не содержат дополнительных вероятностных идей, мы опускаем их точные формулировки и возвращаемся к версии предложения 6.3.1 в более общем вероятностном пространстве. Для действительного вектора р = (pi,... ,рп) с координатами 0 ^ pi ^ 1 определим вероятностное пространство, элементами которого являются члены множества P(N), где каждому Л С N приписана вероятность Рг[Л] = Пг€лР*Г1(£л(1 "" Рз)- Ясно, что это вероятностное распределение получается, если мы строим Л С N случайно, включая в Л каждый элемент г G N независимо с вероятностью р\. Обозначим для каждого семейства Л С P(N) его вероятность в этом пространстве через Ргр(Л). В частности, если все вероятности р^ равны 1/2, то Ргр(Л) — величина, обозначаемая через Рг[Л] в предложении 6.3.1. Определим ц, = цр : P(N) —► R+ равенством KA) = IlieAPiUrtA(1-Pj)- Легко проверить, что функция \х является log-супермодулярной. В самом деле, fi(A)fjL(B) = /х(Л U В)ц(А П В) для любых Л, В С N. Это нетрудно проверить сравнением вклада, вносимого произвольным г Е N в левую и правую части последнего равенства. Таким образом, можно применить FKG-неравенство и получить следующее обобщение предложения 6.3.1. Теорема 6.3.2. Пусть Л и В — два монотонных возрастающих семейства подмножеств множества N и пусть С и V — два монотонных убывающих семейства подмножеств множества N. Тогда для действительного вектора Р — (pi,, - - -, ,Рп), 0 ^ pi ^ 1, выполнены неравенства Ргр(ЛпВ)^Ргр(Л)-Ргр(В), Ргр(СПР)^Ргр(С)-Ргр(Р), Ргр(ЛпС) ^ Ргр(Л) • Ргр(С). Эта теорема может быть применена во многих случаях и будет использована нами в гл. 8 для вывода неравенства Янсона. В качестве иллюстрации
6.4. ЛИНЕЙНЫЕ РАСШИРЕНИЯ ЧАСТИЧНО УПОРЯДОЧЕННЫХ МНОЖЕСТВ 109 предположим, что А\, Ач, - - -, Ak — произвольные подмножества множества TV, причем каждое случайное подмножество А множества TV строится путем выбора каждого i e N независимо с вероятностью р. Тогда из теоремы 6.3.2 легко следует, что к Рг[ А пересекает каждое Ai] ^ Т7Рг[АпересекаетАг]. г=1 Заметим, что это, вообще говоря, неверно для других подобных вероятностных моделей. Например, если А — случайно выбранное ^-элементное подмножество множества TV, то последнее неравенство неверно. Рассматривая члены множества TV как п = (™) ребер полного графа на множестве вершин V = {1,2,...,ш}, мы можем вывести корреляционное неравенство для случайных графов. Пусть G = (V,E)— случайный граф на множестве вершин V, порожденный выбором для всех i,j Е У,г ф j, независимо пары {i,j} в качестве ребра с вероятностью р. (Эта модель случайного графа подробно обсуждается в гл. 10). Свойство графов — это подмножество множества всех графов на множестве V, замкнутое относительно изоморфизма. Так, например, связность — это свойство (соответствующее всем связным графам на V), планарность — также является свойством графов. Свойство Q называется монотонно возрастающим, если для графа G, обладающего свойством Q, граф Я, полученный из G добавлением ребер, также обладает свойством Q. Монотонно убывающее свойство определяется аналогично. Интерпретируя члены множества TV в теореме 6.3.2 как (™) пар {i,j} с i,j Е V,i Ф j, мы получаем следующий результат. Теорема 6.3.3. Пусть Qi,Q2,Q3 и Qa~свойства графов, такие, что Qi,C?2 являются монотонно возрастающими, a Qz,Q± — монотонно убывающими. Пусть G = (V, Е) — случайный граф на множестве вершин V, полученный путем случайного выбора каждого ребра с вероятностью р. Тогда Pr[G E Qi П Q2] > Pr[G E Qi] • Pr[G E Q2], Pr[G E Q3 П Q4] > Pr[G E Q3]' Pr[G G Q4], Pr[G E Qi П Q3] ^ Pr[G E Qi] • Pr[G E Q3]. Так, например, вероятность того, что G является и гамильтоновым и планарным, не превосходит произведения вероятности того, что он гамиль- тонов, на вероятность того, что он планарный. Представляется безнадежным пытаться доказать такое утверждение непосредственно, без использования корреляционных неравенств. 6.4. ЛИНЕЙНЫЕ РАСШИРЕНИЯ ЧАСТИЧНО УПОРЯДОЧЕННЫХ МНОЖЕСТВ Пусть (Р, ^) —частично упорядоченное множество, состоящее из п элементов. Линейное расширение Р — это взаимно-однозначное отображение
110 Глава 6. КОРРЕЛЯЦИОННЫЕ НЕРАВЕНСТВА а : Р —► {1,2, ...,п}, сохраняющее порядок, т.е. если ж, у G Р и х ^ у, то (т(х) ^ 0"(у)- Интуитивно, а — это ранжирование элементов множества Р, которое сохраняет частичный порядок Р. Рассмотрим вероятностное пространство всех линейных расширений множества Р, в котором каждое возможное расширение равновероятно. В этом пространстве можно рассматривать, например, события вида х ^ у или (х < у) А (х ^ z) (для ж, у, z E Р) и вычислять их вероятности. Оказывается, что FKG-неравенство является очень полезным инструментом для изучения корреляций между такими событиями. Наилучший известный результат такого типа был предугадан Райвалом и Сэндсом и доказан Шепом [Shepp (1982)]. (См. также работу [Fishburn (1992)], где доказан более сильный результат.) Он утверждает, что для всякого частично упорядоченного множества Р и любых трех элементов ж, у, z e P выполнено неравенство Рг[ж ^ у Л х ^ z] ^ Рг[ж ^ у] Рг[ж ^ z]. Этот результат стал известен как XYZ-теорема,. Хотя она выглядит интуитивно очевидной, ее доказательство нетривиально и основано на остроумном применении FKG-неравенства. В этом разделе мы представим этот результат и его элегантное доказательство. Теорема 6.4.1. Пусть Р—частично упорядоченное множество, состоящее из п элементов а\, а2, - - • -> о>п- Тогда Pr[ai < а2 Л а\ ^ а3] ^ Pr[ai ^ a2] Pr[ai ^ а3]. Доказательство. Пусть га — большое целое число (которое в дальнейшем будет стремиться к бесконечности), и пусть L — множество всех упорядоченных наборов длины п вида х = (xi,..., хп), где Х{ Е М = {1,2, ...,т}. (Заметим, что числа Х{ не обязательно различны между собой.) Определим отношение порядка ^ на L следующим образом. Для у = (yi,...,yn) € L и х, указанных выше, х ^ у тогда и только тогда, когда х\ ^ у\ и Xi — х\ ^ У% — У\ для всех г, 2 ^ г ^ п. Нетрудно проверить, что (L, ^) является решеткой, в которой г-я компонента пересечения х Л у равна (хЛу)г = min(xi — Х1,уг —yi) + max(xi,yi), а г-я компонента объединения х Vу равна (xVy)j = max(xi - ^ьУг - 2/i) + min(zi,yi). Кроме того, решетка L — дистрибутивная. Это является простым следствием того факта, что тривиальная решетка целых чисел (относительно обычного порядка) является дистрибутивной, а, значит, для любых трех чисел а, Ь и с min(a, max(6, с)) = max(min(a, 6), min(a, с)) (6.7) и max(a, min(6, с)) = min(max(a, 6), max(a, с)). (6.8) Покажем, как отсюда следует, что L дистрибутивна. Пусть х = (xi,..., хп), У — (j/i, - - -, Уп) и z = (zi,..., 2П) — три элемента решетки L. Мы должны показать, что х Л (у V z) = (х Л у) V (х Л z).
6.4. ЛИНЕЙНЫЕ РАСШИРЕНИЯ ЧАСТИЧНО УПОРЯДОЧЕННЫХ МНОЖЕСТВ 111 Заметим, что г-я компонента в х Л (у V z) равна (х Л (у V z))i = mm(xi - хь (у V z)t - (у V z)i) + + max(xb(y Vz)i) = = mm(xi - xi, тах(у. - yb z{ - zi))+ + max(xi,min(yi,zi)). Аналогично, г-я компонента в (х Л у) V (x Л z) равна ((xAy)V(xAz))z = = тах((х Л у)г - (х Л у)ь (х Л z)» - (х Л z)i) + H-min((xAy)i,(xAz)i) = = max(min(xi - xi,y* - yi),min(xi - Х1,г» - z\)) + + min(max(xi,2/i),max(xi,2;i)). Указанные две величины равны, что легко показать применением равенства (6.7) с а = Хг — xi, Ь = Уг — yi,c = Z{ — z\ и равенства (6.8) с а = Х1,Ъ = у!,с = zi. Таким образом, решетка L дистрибутивна. Чтобы применить FKG-нера- венство, нам понадобится функция меры // и две функции / и д. Определим \х как характеристическую функцию множества Р, т. е. для х = (xi,..., хп) Е L выполнено равенство /х(х) = 1, если Xi ^ Xj как только а{ ^ aj в Р, и /х(х) = О иначе. Чтобы показать, что \х является log-супермодулярной, достаточно убедиться в том, что, если /х(х) = //(у) = 1, то /х(х V у) = /х(х А у) = 1. В самом деле, если /х(х) = //(у) = 1 и а» ^ а;- в Р, то Xi ^ Xj и у^ ^ yj и поэтому (х V у)» = max(xi - хг, у* - У\) + min(xi, yi) ^ ^ тах(х^ - xi, yj - yx) + min(xi, yx) = (x V y^, т. e. /x(x V y) = 1. Аналогично, из /x(x) = /x(y) = 1 следует /x(x A y) = 1. Вполне естественным будет определить / и д как характеристические функции двух событий х\ ^ Х2 и х\ ^ хз, соответственно, т. е. /(х) = 1, если X] ^ Х2, и /(х) = 0 иначе, и д(х) = 1, если х\ ^ хз, и д(х) = 0 иначе. Обе функции / и #, очевидно, являются возрастающими. В самом деле, если х ^ у и /(х) = 1, то 0 ^ Х2 — xi ^ у2 — 2/i, а, значит, /(у) = 1. То же справедливо для#. Таким образом, мы имеем все необходимое для применения FKG- неравенства (теорема 6.2.1). Отсюда следует, что вероятность того, что п-ка (xi,...,xn) из L, которая удовлетворяет в Р обоим неравенствам х\ ^ Х2 и х\ ^ хз, по крайней мере столь же велика, как произведение вероятностей того, что х\ ^ Х2 и того, что х\ ^ хз- Заметим, что это еще не то, что мы хотели доказать. Ведь n-ки в L не являются n-ками различных целых чисел, и поэтому не соответствуют линейным расширениям множества Р. Однако, при т —► оо вероятность того, что Xi = Xj для некоторых г ^ j в элементе х = (xi,... ,хп) решетки L, стремится к нулю. Отсюда следует утверждение теоремы. ■
112 Глава 6. КОРРЕЛЯЦИОННЫЕ НЕРАВЕНСТВА 6.5. УПРАЖНЕНИЯ 1. Обозначим через Р вероятность того, что случайный подграф графа G, полученный независимым выбором каждого ребра графа G с вероятностью 1/2, является связным (и остовным). Рассмотрим случайную раскраску ребер графа G в синий и красный цвета, при которой выбор цвета производится случайно и равновероятно. Обозначим через Q вероятность того, что при такой раскраске графа G оба графа, синий и красный, являются связными (и остовными). Верно ли, что Q ^ Р2? 2. Семейство подмножеств Q называется пересекающимся, если Gi П G2 ф 0 для всех Gi,G2 G Q. Пусть Т\,Тъ, • • • ,?к — к пересекающихся семейств подмножеств множества {1,2,...,п}. Доказать, что U* < 2П - 2п~ 3. Показать, что вероятность того, что в случайном графе G(2fc, 1/2) максимальная степень вершины не превышает к — 1, не меньше l/4fc.
ВЕРОЯТНОСТНЫЙ ВЗГЛЯД: Теорема Турана Обозначим через dv степень вершины v в графе G = (V,E). Пусть a(G) — максимальный размер независимого множества вершин графа G. Каро и У эй доказали следующий результат. Теорема. Справедливо неравенство Доказательство. Пусть «<» —линейный порядок на множестве V, выбранный случайно и равновероятно. Положим I = {v е V : {v,w} е Е => v < w}. Пусть Xv — индикатор события v Е /, а X = Ylvev ^v = 1^1- Для всякого v так как v e I тогда и только тогда, когда v является наименьшим среди v и вершин из ее окрестности. Следовательно, vEV и поэтому существует порядок «<», для которого Но если ж, у G / и {ж, у} G Е, то х < у и у < х. Приходим к противоречию. Таким образом, I является независимым и a(G) ^ \1\. ■ Для всякого га ^ п пусть д, г удовлетворяют условиям п = mq + г, О ^ г < га, и пусть е = г(9^1) + (га — г)(^). Определим граф G = Gn,e на п вершинах и е ребрах, разделив множество вершин на га максимально близких по мощности классов и соединив две вершины в том и только том случае, когда они принадлежат одному классу. Ясно, что a{Gn,e) = га. Теорема [Turan (1941)]. Пусть граф Н имеет п вершин и е ребер. Тогда а(Н) ^ га и а(Н) =т^Н^ Gn,e. Доказательство. Граф Gn,e удовлетворяет условию ^2veV(dv + I)-1 = га, поскольку каждая клика вносит в эту сумму 1. Положив е = ^2vev dv/2, мы минимизируем ^2veV(dv + I)-1, выбирая dv близкими друг к другу, насколько
114 Вероятностный взгляд: Теорема Турана это возможно. Таким образом, для всякого Н vev При а(Н) = т мы должны иметь равенство в обоих случаях. Из второго равенства следует, что dv должны быть близки друг к другу насколько это возможно. Положив X = |/|, как в предыдущей теореме, получим а(Н) = ЩХ]. Но а(Н) ^ X для любого знака неравенства <, поэтому X должно быть константой. Предположим, Н не является объединением клик. Тогда существуют ж, у, z Е V с {ж, у}, {ж, z) G Е, {у, z} 0 Е. Пусть < — порядок, в котором наименьшими являются элементы ж, у, z и <'— тот же самый порядок за исключением минимальных элементов, порядок которых — у, z, ж. Пусть /, Г — соответствующие множества вершин, все соседи которых «больше» их самих. Тогда 1,Г идентичны за исключением того, что х Е /, у, z 0 /, в то время как х 0 I',y,z G .Г. Таким образом, X не является константой. То есть из а(Н) = ЩХ] следует, что Я —это объединение клик, и поэтому Н = Gn,e. Ш
7 Мартингалы и плотная концентрация Математика представляется мне гораздо более реальной, чем бизнес. К примеру: ну что за реальность в рекламном стенде МакДональдса? Сегодня он здесь, а завтра его нет. А целые числа — это реальность. Доказав теорему, вы действительно сделали что-то, что имеет субстанцию, и с чем никакая деловая афера не может сравниться по реальности. Джим Саймоне 7.1. ОПРЕДЕЛЕНИЯ Мартингал — это последовательность Хо,...,Хт случайных величин, такая, что для 0 ^ г < т выполняется равенство "E[Xi+i\Xi, Xi-i,... ,Хо] = Х{. Представим себе игрока, пришедшего в казино с Xq долларами. Казино предоставляет ассортимент азартных игр. Все игры «справедливые» в том смысле, что математические ожидания выигрыша в них равны нулю. Игрок может учесть предысторию при планировании своей игры и расчете ставки. Он может использовать игровое определение мартингала — удваивай ставку, пока не выиграешь. Он может играть в рулетку до трех выигрышей, а затем переключиться на кено. Пусть Х{ —выигрыш игрока в момент г. При Х{ = а условное математическое ожидание величины Xi+i должно быть равно а, следовательно, это — мартингал. Простой, но поучительный пример мартингала — это игра с бросанием монеты с постоянной ставкой в один доллар. Пусть Yi,..., Ym — независимые бросания монеты, при которых выигрыш +1 и проигрыш —1 имеют одинаковую вероятность \. Пусть начальная сумма Xq = 0, и при этом игрок имеет неограниченный кредит. Тогда Х{ = Y\ + ... + Yi имеет распределение Si. Наши мартингалы будут выглядеть совершенно различными, по крайней мере, внешне. Мартингал проявления ребер. Рассмотрим случайный граф G(n, p) в качестве вероятностного пространства. Пометим потенциальные ребра {i,j} С [п] произвольно символами ei,..., ет, положив для удобства т = (™). Пусть / — произвольная теоретико-графовая функция. Определим мартингал Хо,...,Хт заданием значений Xi(H). Величина ХШ{Н) есть просто /(Я), a Xq(H) — математическое ожидание величины /(G) с G ~ G(n,p). Заметим, что Xq
116 Глава 7. МАРТИНГАЛЫ И ПЛОТНАЯ КОНЦЕНТРАЦИЯ является константой. В общем (включая случаи г = 0 и г = га), Xi(H) = E[/(G)|e, GG^ejG^Hj4 г]. Словом, чтобы найти ХДЯ), мы сначала проявим первые г пар ei,...,ei и посмотрим, принадлежат ли они графу Я. Остальные ребра невидимы и рассматриваются как случайные. Тогда Х{(Н) является условным математическим ожиданием величины /(G) с учетом этой частичной информации. При г = 0 ни одно ребро не проявляется, и Xq является константой. При г = га все ребра проявились, и Хш есть функция /. Наш мартингал продвигается малыми шагами от полного отсутствия информации к полной информации. з^ 2ZL- 2_\ 2 . . 2^4 2/ . 2. \ 1 . На рисунке представлен мартингал проявления ребер с п = т = 3 и хроматическим числом в качестве /. При этом ребра проявляются в следующем порядке: «нижнее, левое, правое». Величины Хг(Н) определяются по ходу движения от центральной вершины к листу, помеченному символом Н. Рисунок показывает, почему это мартингал. Математическое ожидание /(#) при условии, что первые г —1 ребер известны, есть взвешенное среднее математических ожиданий величины f(H) при условии, что г-е ребро проявилось. В более общем случае (на который иногда ссылаются как на мартингальный процесс Дуба) величина Х{ может рассматриваться как математическое ожидание величины f(H) при условии, что определенная информация остается открытой до тех пор, пока информация, известная к моменту г, включает информацию, известную к моменту г — 1. Мартингал проявления вершин. Вновь пусть G(n,p)— вероятностное пространство и / — произвольная теоретико-графовая функция. Определим величины Х\,..., Хп равенством Xi(H) = Е[/((3)|для ж,у ^ г, {х,у} е G <—> {х,у} е я].
7.2. БОЛЬШИЕ УКЛОНЕНИЯ 117 Словом, чтобы найти ХДЯ), мы проявляем первые г вершин, а также все их внутренние ребра и вычисляем условное математическое ожидание значения /(G) с этой частичной информацией. При подходящем упорядочении ребер мартингал проявления вершин может рассматриваться как подпоследовательность мартингала проявления ребер. Заметим, что Х\(Н) = E[/(G)] является константой, если ни одно из ребер не проявилось, и Хп(Н) = f(H)— если проявились все ребра. 7.2. БОЛЬШИЕ УКЛОНЕНИЯ Мори [Маигеу (1979)] применил неравенство больших уклонений для мартингалов при доказательстве изопериметрического неравенства для симметрической группы. Это неравенство оказалось полезным при изучении нормированных пространств (см. также [Milman and Schechtman (1986)]). Все применения мартингалов в теории графов также опираются на тот же самый основной мартингальный результат, использованный Мори и заключающийся в следующем. Теорема 7.2.1 (неравенство Ацумы). Пусть 0 = Х0,..., Хш — мартингал, удовлетворяющий условию \Xi+\ — Xi\ ^ 1 для всех 0 ^ г < га. Пусть Л > 0. Тогда Pr[Xm > \у/Ш] < е"л2/2. В мартингале «подбрасывания монеты» Хш имеет распределение Sm, и этот результат есть теорема А. 1.1. На самом деле доказательство общего случая совершенно аналогично. Доказательство. Предусмотрительно положим а = Х/у/т. Пусть У\ = Xi - Xi-i, так что \Yi\ ^ 1 и Е[У»|Х»_1, Х;_2,..., Х0] = 0. Тогда, подобно тому как это сделано в теореме А. 1.16, имеем E[ea*|*i-i,*i-2,... ,ХоК chH ^ е*2/2- Следовательно, (т-\ \ Ц e"y* E[eay-|Xm_i,Xm_2,...,Xo]| Е[е ОсХгг = Е <Е " т ~| пН .г=1 J 'та— 1 IR* .»=i = Е 1 е^ ^ Значит, Pr[Xm > Xy/m\ = Рг[еаХ™ > eaXV™} < Е[еаХ-]е"аЛ^^ ^ ^ cot2rn/2-ot\y/rn _ £}-Х2/2 5^ С — С , что и требовалось.
118 Глава 7. МАРТИНГАЛЫ И ПЛОТНАЯ КОНЦЕНТРАЦИЯ Следствие 7.2.2. Пусть с = Хо,... ,Хт — мартингал, удовлетворяющий условию |-^г+1 — Xi\ ^ 1 для всех 0 ^ г < га. Тогда Pr[\Xm -c\> AVm] < 2е"л2/2. Скажем, что теоретико-графовая функция / удовлетворяет реберному условию Липшица, если для любых графов Я и Я7, отличающихся в точности одним ребром, выполняется неравенство \f(H) — f(H')\ ^ 1. Функция / удовлетворяет вершинному условию Липшица, если для любых графов Н и Н', отличающихся в точности одной вершиной, выполняется неравенство |/(Я)-/(Я')|<1. Теорема 7.2.3. Если f удовлетворяет реберному условию Липшица, то соответствующий мартингал проявления ребер удовлетворяет неравенству |Xi+i — Xi\ ^ 1. Если f удовлетворяет вершинному условию Липшица, то соответствующий мартингал проявления вершин удовлетворяет неравенству \Xi+i — Xi\ ^ 1. Мы докажем эти результаты в более общей форме позднее. Они имеют тот интуитивный смысл, что если проявление некоторой частной вершины или ребра не могут изменить / больше, чем на единицу, то проявление вершины или ребра не может изменить математическое ожидание больше, чем на единицу. Теперь мы приведем простой пример применения этих результатов. Теорема 7.2.4 [Shamir and Spencer (1987)]. Пусть п,р —произвольные числа, и пусть с = E[x(G)], где G ~ G(n,p). Тогда Рг [|x(G) - с\ > А>/гП=Т| < 2е"л2/2. Доказательство. Рассмотрим мартингал проявления вершин Х\,..., Хп на графе G(n,p) с /(G) = x(G). Одной вершине всегда можно присвоить новый цвет. Поэтому вершинное условие Липшица выполняется. Теперь применим неравенство Any мы в форме следствия 7.2.2. ■ Пусть А —► оо сколь угодно медленно. Этот результат показывает, что распределение величины x(G) является «плотно сконцентрированным» около ее среднего. Однако доказательство не дает рецепта для вычисления самого среднего. 7.3. ХРОМАТИЧЕСКОЕ ЧИСЛО В теореме 10.3.1 мы докажем, что x(G) ~ n/21og2 n почти всегда при условии, что G ~ G(n, 1/2). Здесь мы представим оригинальное доказательство Белы Боллобаша, использующее мартингалы. Мы используем определения гл. 10, разд. 10.3. Положим f(k) = (£)2~W. Пусть ко таково, что /(/с0-1) > 1 > /(fco). Пусть далее к = ко — 4, так что к ~ 21og2n и f(k) > n3+°^l\ Наша цель —
7.3. ХРОМАТИЧЕСКОЕ ЧИСЛО 119 показать, что 2+от Pr[w(G)<Jfc]=e-n + (), где u(G) — это размер максимальной клики графа G. В действительности, мы докажем в теореме 7.3.2 более точную оценку. Остальные соображения приводятся в разд. 10.3. Пусть Y = У(Н) —максимальный размер семейства непересекающихся по ребрам /с-клик в Н. Этот остроумный и необычный выбор функции является ключом к применению мартингалов в доказательстве. Лемма 7.3.1. Справедливо неравенство Е[У] ^ ^рг(9 + о(1)). Доказательство. Обозначим через /С семейство /с-клик графа G так, что f(k) = fi = Е[|/С|]. Через W обозначим количество неупорядоченных пар {Л, Б}, составленных из /с-клик графа G с 2 < |Л П В\ < к. Тогда E[W] = А/2 при А, определенном как в гл. 10, разд. 10.3 (см. также гл. 4, разд. 4.5), имеем А ~ fj?k4n~2. Пусть С —случайное подсемейство семейства /С, определяемое тем, что для всякого Л Е /С Рг[Л 6 С] = q, где q будет определено позже. Пусть W — количество неупорядоченных пар {Л, Б}, Л, В е С с 2 < |Л П В\ < к. Тогда E[VT7] = E[W}q2 = Aq2/2. Удалим из С по одному множеству из каждой такой пары {Л, Б}. В результате получим семейство С* непересекающихся по ребрам /с-клик графа G и Е[У] > Е[|С*|] ^ Е[|С|] - E[VT7] = м - Ад2/2 = М2/2А ~ п2/2А:4, где мы выбираем q = /х/Д (неважно, что это меньше единицы!), чтобы минимизировать квадратичную функцию. ■ Мы предполагаем, что неравенство в лемме 7.3.1 можно улучшить, заменив правую его часть на Е[У] > сп2/к2. То есть с положительной вероятностью существует семейство непересекающихся по ребрам /с-клик, которое покрывает положительную долю ребер. Теорема 7.3.2. Справедливо неравенство Pr[u;(G)<fc]<e-(c+o(1))l^, где с — некоторая положительная константа. Доказательство. Пусть Уо>..., Ym, т = Q)» — мартингал проявления ребер на графе G(n, 1/2) с функцией У, определенной перед леммой. Функция Y удовлетворяет реберному условию Липшица, так как добавление одного ребра может добавить не более одной клики к семейству клик, непересекающихся по ребрам. (Заметим, что условие Липшица могло бы не выполняться для обычного числа /с-клик, поскольку добавление одного ребра могло бы повлечь появление нескольких клик.) Граф G не имеет /с-клик тогда и только
120 Глава 7. МАРТИНГАЛЫ И ПЛОТНАЯ КОНЦЕНТРАЦИЯ тогда, когда Y = 0. Применим неравенство Ацумы с т = (™) ~ п2/2 и ЦУ}> ^(1 + о(1)). Тогда Pr[u(G) < А;] = Рг[У = 0] ^ Рг [у - Е[У] ^ -Е[У]| ^ ^ е-Е[У]2/2(;) ^ e-(c4o(l))n2/fc8 = e-(c+o(l))n2/ln8n5 что и требовалось. ■ Ниже — еще один пример того, какой изобретательности требует мартин- гальный подход при выборе теоретико-графовой функции. Теорема 7.3.3. Пусть р = п~а, где а — фиксированное, а > §. Пусть G = G(n,p). Тогда существует и = и(п,р), такое, что почти всегда и ^ x(G) ^ и + 3. То есть x(G) сконцентрировано в четырех значениях. Для начала нам потребуется одна хорошо известная техническая лемма. Лемма 7.3.4. Пусть а, с — фиксированные числа, а > §. Пусть р п Тогда почти наверное каоюдые Су/п вершин графа G правильно раскрашены в три цвета. G(n,p) могут быть Доказательство. Пусть это не так. Обозначим через Т множество минимального размера, которое не является 3-раскрашиваемым. Поскольку для всякого х € Т подграф, порожденный множеством Т\ {х}, является 3-раскрашиваемым, а для множества Т это не так, х должен иметь по меньшей мере трех соседей в Т. Отсюда следует, что если Т имеет t вершин, то граф, порожденный множеством Т, должен иметь по меньшей мере у ребер. Вероятность того, что это происходит для некоторого Т с t ^ Су/п, ограничено сверху числом Су/п t=4 Поскольку ^ (")'■ 2 Q 2 rfit/2 < - то каждое слагаемое не превышает пе &2е3/2 t З3/2 -п -За/2 € cm2"**1/2 ^ te\3t/2 1—1" 1/4 С2П 2 П ' = [С2П £] , где е = Зр — | > 0. Следовательно, их сумма равна о(1). ■ Доказательство теоремы 7.3.3. Пусть е > 0 произвольно мало и пусть и = и(п,р,е) —наименьшее число, такое, что Pr[x(G) ^ и] > е. Пусть теперь Y(G) — минимальный размер множества вершин 5, для которого G — S может быть ^-раскрашено. Такое Y удовлетворяет вершинному условию Липшица, так как в худшем случае можно добавить одну вершину к 5. Применим мартингал проявления вершин на G(n,p) к функции Y. Положив
7.4. ДВА ОБОБЩЕНИЯ 121 ll = E[F], имеем Рг[У ^li- AV^^l] < е"л2/2, Рг[У ^ ц + AV^^I] < е"л2/2. Пусть Л удовлетворяет соотношению е~х /2 = е. Тогда вероятность каждого из этих «хвостовых» событий меньше чем е. Мы определили и так, что с вероятностью по меньшей мере £, граф G мог бы быть и-раскрашиваемым и, значит, Y = 0. То есть, Рг[У = 0] > е. Из первого неравенства следует, что \х ^ Ху/е — 1. Теперь с использованием второго неравенства имеем Рг[У ^ 2\Vn^l] ^ Рг[У ^ /х + А>/п - 1] ^ е. С вероятностью не меньшей 1-е существует и-раскраска всех, кроме не более чем с'у/п вершин. По лемме 7.3.4 почти всегда, а значит, с вероятностью, не меньшей чем 1-е, эти вершины могут быть окрашены тремя дополнительными цветами, что дает в результате (и + 3)-раскраску графа G. Минимальность и гарантирует, что с вероятностью, не меньшей 1-е, требуется как минимум и цветов для раскраски графа G. В итоге Рт[и ^ x(G) ^ и + 3] ^ 1 - Зе. Осталось вспомнить, что е произвольно мало. ■ С использованием этой же техники аналогичные результаты могут быть получены и для других значений а. Вместе с некоторыми похожими идеями это приводит к доказательству того, что для любых фиксированных а > ^, значение х(^) сконцентрировано не более, чем в двух значениях (см. детали доказательств в работах [Luczak (1991)] и [Alon and Krivelevich (1997)]). 7.4. ДВА ОБОБЩЕНИЯ Мартингалы, полезные при изучении случайных графов, могут быть помещены в следующую общую схему, которая подробно исследовалась в работах [Маигеу (1979)] и [Milman and Schechtman (1986)]. Обозначим через Q, = Ав множество функций д : В —► А. (Если, например, В — множество пар элементов некоторого n-множества и А = {0,1}, мы можем сопоставить д £ Ав граф на п вершинах.) Мы введем меру, определяя значения wab равенствами вида Рт[д(Ъ) =а]= wab, считая при этом величины д(Ь) взаимно независимыми. (В графе G(n,p) для всех Ь полагаем w\b = р, шоь = 1 — Р-) Теперь зафиксируем последовательность, называемую далее шкалой 0 = В0 С В1 С ... С Вт = В. Пусть L : Ав —► R — функционал (например, размер максимальной клики). Определим мартингал Хо, Х\, ... Хт, полагая Xi(h) = E[L(g)\g(b) = h{b) для всех Ь е BJ.
122 Глава 7. МАРТИНГАЛЫ И ПЛОТНАЯ КОНЦЕНТРАЦИЯ Здесь Xq — константа, равная математическому ожиданию величины L для случайного графа д, а Хш есть само L. Величины Xi(g) приближаются к L(g) по мере того как величины д(Ъ) «проявляются». Скажем, что функционал L удовлетворяет условию Липшица относительно введенной шкалы, если для всех 0 ^ г < т ft, Ы отличаются только на В{+\ — Bi=> \L(h') — L(h)\ ^ 1. Теорема 7.4.1. Пусть L удовлетворяет условию Липшица. Тогда соответствующий мартингал удовлетворяет неравенству \Xi+1(h)-Xi(h)\^l для всех 0 ^ г < т, ft € Ав. Доказательство. Пусть Н — семейство тех Ы', которые совпадают с ft на Bi+1. Тогда Xi+1(h) = £ L{h>h>, Н'ен где Wh' — условная вероятность того, что g = Ы при условии, что g = h на Bi+i. Для каждого Ы £ Н обозначим через H[h'] семейство тех ft*, которые совпадают с Ы везде, исключая, возможно, В{+\—В{. Семейство H[h!) разбивает семейство функций ft*, совпадающих с ft на В{. Таким образом, справедливо представление ад = Е Е w)4hAwh.% hfeHh*eH[hf] где qh* — условная вероятность того, что g совпадает с ft* на Д+i при том, что g совпадает с ft на Б^. (Это потому, что для ft* € H[h'} величина w^ также является вероятностью того, что g = ft* при условии, что g = ft* на i?i+i.) Таким образом, \Xi+1(h) - Xi(h)\ Е Wh' h'€H < \L(h')- Yl L^)^ |_ h*EH[h'] < E>*' E |9н-[ДЛ')-ДЛ*)]|. Л'бЯ h*eH[h'] По условию Липшица |L(ft') — L(ft*)| ^ 1, поэтому \Xi+i(h) - Xi(h)\ ^ ^2 Wh' E ^*= E wh' = L и Н'ен h*eH[hf] Н'ен Теперь мы можем сформулировать неравенство Any мы в общем виде. Теорема 7.4.2. Пусть L удовлетворяет условию Липшица относительно шкалы длины т, и пусть \х — E[L(<j)]. Тогда для всех А > О Pr[L(g) >n + *V™\ <е"л2/2, Pv[L(g) ^fx-Xy/Ш] <е"л2/2.
7.4. ДВА ОБОБЩЕНИЯ 123 Второе обобщение взято из работы [Alon et al. (1997)]. Мы предполагаем, что наше вероятностное пространство порождено конечным множеством взаимно независимых выборов типа ДА/НЕТ, помеченных индексами i £ I. Рассмотрим случайную величину Y на этом пространстве. Обозначим через Pi вероятность того, что выбор с индексом г—ДА. Пусть с» таково, что при изменении выбора г (и сохранении всех остальных индексов прежними) величина Y изменяется не более чем на с*. Назовем а результатом выбора г. Пусть С — максимальное число среди с*. Назовем pi(l — Pi)c2 дисперсией выбора г. Теперь рассмотрим игру «солитер», в которой Пол находит величину У, задавая вопросы всегда правдивому оракулу Кэрол. Вопросы всегда касаются выбора г £ I. Выбор вопроса Полом может зависеть от предыдущего ответа Кэрол. Стратегия Пола может быть представлена в форме дерева решений. «Линия опроса» — это путь от корня к листу этого дерева, т. е. последовательность вопросов и ответов, которая определяет значение величины Y. Полная дисперсия линии опроса есть сумма дисперсий составляющих ее вопросов. Теорема 7.4.3. Для всякого е > 0 существует S > О, для которого выполнено следующее. Предположим, Пол использует стратегию для нахождения Y, при которой каждая линия опроса имеет полную дисперсию, не превышающую а2. Тогда 2 Рг[|У - Е[У]| > аа] ^ 2е"^) (7.1) для всех положительных а, таких, что аС < сг(1 + е)6. Приложения. Для получения конкретной субоптимальной оценки можно положить e = S = l. Если С = O(l), а —► оо и а = о(а), то верхняя граница (7.1) равна ехр[—^(а2)]. Во многих случаях все вопросы Пола лежат в /. Тогда мы можем взять <7, такое, что а2 = ^2ieIPi(l — Pi)cf. Например, рассмотрим реберную Липшицеву величину Y на G(n,p) с р = р(п) —► 0. Множество / состоит из т = (£) потенциальных ребер, все pi = р, С = 1, так что а = Q(^n2p). Если а —► сю с а = о(у/п2р), то верхняя оценка (7.1) снова равна ехр[—£2(а2)]. Доказательство. Для простоты заменим Y на Y — Е[У], с тем, чтобы впредь предполагать Е[У] = 0. В силу симметрии будем оценивать только верхний хвост величины Y. Предусмотрительно положим Л = а/[а(1 + е)}. В условиях теоремы имеем СЛ < 8. Покажем, что Е[еАУ] < е^+^2""'2. (7.2) Тогда мартингальное неравенство будет следовать из неравенства Маркова Рг[У > аа] < e"wE[eAy] ^ е""2/2^. Прежде всего, мы утверждаем, что для всякого е > 0 существует S > 0, такое, что при 0^р^1и|а|<£ ре(1-Р)* + (1 - р)е-Ра < е(1+*)р(1-Р)а2/2в (7<3)
124 Глава 7. МАРТИНГАЛЫ И ПЛОТНАЯ КОНЦЕНТРАЦИЯ Разложим левую часть неравенства в ряд Тейлора по а. Константа в этом разложении равна 1, линейный член равен 0, коэффициент при а2 равен ^р(1 — р), а при j^ 3 коэффициент при о? не превосходит jiP(l - р)\р*~1 + (1 - рУ~1] ^ тгР(1 ~ Р)- Выберем 8 так, чтобы при \а\ ^ S выполнялось соотношение ^ i=3 ■/" (В частности, это справедливо для е = 6 = 1.) Тогда pe(i-p)« + (1 _р)е-р<^ 1+Р(1 _p)?:(i+е); и соотношение (7.3) вытекает из неравенства 1 + х ^ ех. Используя такое J, мы докажем неравенство (7.2) индукцией по глубине М дерева решений. Для М = 0 значение Y есть константа, и (7.2) следует немедленно. В противном случае обозначим соответственно через р, с, v = р(1 — р)с2 вероятность, результат и дисперсию первого вопроса Пола. Через цу,цп обозначим условное математическое ожидание величины Y при ответах Кэрол ДА и НЕТ, соответственно. Тогда 0 = Е[У] может быть представлено в виде 0 = Р//у + (1-р)//п. Разность fly — fin есть ожидаемое изменение величины Y при условии, что все другие выборы были сделаны независимо с соответствующими вероятностями, а корневой выбор изменился с ДА на НЕТ. Поскольку это всегда изменяет Y не более чем на с, имеем \Цу -Мп| ^ С. Поэтому мы можем ввести параметр 6, |6| ^ с, для которого цу = (1 - р)Ь и \хп = -рЬ. В силу соотношения (7.3) имеем ре^у + (1 _р)еАМп ^ е(1+г)р(1-р)Ь2А2/2 ^ ^1+^/2, Обозначим через Лу математическое ожидание величины ел(у_м^ при условии, что первый ответ Кэрол был ДА, а через Ап — аналогичную величину при ее ответе НЕТ. Если ответ Кэрол на первый вопрос известен, Пол имеет дерево решений (одно из двух основных поддеревьев), которое определяет Y с полной дисперсией, не превосходящей а2 — v, а глубина дерева не больше М — 1. Отсюда по предположению индукции Ау,Ап ^ Л~, где Теперь мы разлагаем Е[еЛУ] = рех^Ау + (1 - р)ех^Ап ^ < \рех»у + (1 - р)ех^]А~ < e(i+^)^2(^(^2-^))/25 (7<4) что завершает доказательство неравенства (7.2), а, значит, и теоремы 7.4.3. ■
7.5. ЧЕТЫРЕ ПРИМЕРА 125 Заметим, что это формальное индуктивное доказательство слегка затеняет роль мартингала. Мартингал ЩУ] = УЬ,...,Ум — У можно определить как условное математическое ожидание Yt величины Y после первых t вопросов и ответов. Теорему 7.4.3 можно понимать как оценку хвоста величины Y хвостом нормального распределения с большей или равной дисперсией. Для очень больших уклонений от среднего и больших а эта оценка оказывается неверной. 7.5. ЧЕТЫРЕ ПРИМЕРА Пусть д —случайная функция, отображающая множество {1,...,п} само на себя, причем все пп возможных функций равновероятны. Пусть L(g) =n — val(g), где val(g) —размер области значений функции д, или что то же, число тех у, для которых уравнение д(х) = у имеет решение. Из линейности математического ожидания следует, что Е[^)] = п(1-1)П~7- Рг Положим В{ = {1,...,г}. Функционал L удовлетворяет условию Липшица относительно этой шкалы, так как изменение значения д{г) может изменить L(g) не более, чем на 1. Следовательно, имеем следующий результат. Теорема 7.5.1. Справедливо неравенство 1^Ы--| > Ал/n+ll <2е"л2/2. е J Выводить эти асимптотические оценки без использования мартингалов довольно обременительно. Второй пример: пусть В — произвольное нормированное пространство, и пусть ^1,..., vn G -В, причем все \vi\ ^ 1. Пусть случайные величины £i,..., еп независимы, и пусть Prk = +l]=Pr[ei = -l] = i. Положим X = |eivi + ... +envn\. Теорема 7.5.2. Имеют место соотношения Рг[Х - Е[Х] > \^п\ <е"л2/2, Рг[Х - ЩХ] < -\у/п\ < е"л2/2. Доказательство. В качестве вероятностного пространства рассмотрим множество { — 1, +1}п, в котором все элементы (ei,..., еп) равновероятны. Тогда X является случайной величиной на этом пространстве. Определим мартингал Хо,...,Хп = X, проявляя по одному 8{ для очередного г > 0. При этом Хо = ЩХ]. Значение €{ может изменить X на 2, так что прямое применение теоремы 7.4.1 дает \Xi+i — Xi\ ^ 2. Пусть е,е' — два вектора длины п,
126 Глава 7. МАРТИНГАЛЫ И ПЛОТНАЯ КОНЦЕНТРАЦИЯ различающиеся только в г-й координате: Xi(e) = ^[Xi+1(e) + Xi+1(e')}, так что .. \Xi(e) - Xi+1(e)\ = - \Xi+1(ef) - Хц.г(е)\ < 1. Теперь применяем неравенство Ацумы. ■ Третий пример: пусть р — метрика Хэмминга на множестве {0,1}п. Для А С {0,1}п обозначим через B(A,s) множество таких у Е {0,1}п, что р(х,у) ^ s для некоторого х Е А. (Ясно, что А С B(A,s), так как мы можем взять х = у.) Теорема 7.5.3. Пусть величины е, А > 0 связаны соотношением е~х I2 = е. Тогда \А\ ^ е2п =» \В(А, 2Ау^)1 ^ (1 - е)2п. Доказательство. Рассмотрим в качестве вероятностного пространства множество {0,1}п, в котором все точки равновероятны. Для у Е {0,1}П положим Х(у) = minp(x,y). Пусть Хо, Х\,..., Хп = X — мартингал, полученный проявлением одной координаты из {0,1}П на каждом шаге. Условие Липшица для X выполняется, ибо, если у, у' различаются только в одной координате, то \Х(у) — Х(у')\ < 1. Следовательно, если ц = ЩХ], то Рг[Х < ц - \^п\ < е~х2/2 = е, Рг[Х >1л + \у/п\ < е"л2/2 = е. Но Рг[Х = 0} = \A\2~n ^ е, так что Li ^ \у/п. Значит, Рг[Х > 2АуЯ < е \В(А,2\у/п)\ = 2пРг[Х^2АуЯ ^2п{1-е). Ш В действительности, известен гораздо более сильный результат. Через B(s) обозначим шар радиуса s с центром в точке (0,...,0). Изопериметрическое неравенство, доказанное Харпером [Harper (1966)], заключается в том, что \A\2\B(r)\=>\B(A,s)\2\B(r + s)\. Фактически, это неравенство можно использовать как начало альтернативного доказательства того, что х(^) ~ n/2 log2 n, а также для вывода еще нескольких результатов, которые мы доказали с помощью мартингалов. Мы иллюстрируем теорему 7.4.3 ключевой технической леммой (в упрощенной форме) из [Alon et al. (1997)]. Пусть G = (V, Е) — граф на N вершинах, степень каждой вершины равна D. Асимптотика рассматривается при TV, D —► оо.
7.6. НЕРАВЕНСТВО ТАЛАГРАНА 127 Положим р = 1/D. Определим случайный подграф Я С G, включая в него каждое ребро е G Е независимо с вероятностью р. Обозначим через М (от слова matching — паросочетание) множество изолированных ребер графа Я. Пусть множество V* состоит из вершин v G V, не входящих ни в одну пару {v,w} G М. Для v G V положим deg*(i;) равным числу таких w e V*, что {v, w} G Е. Так как {v,w}eE из линейности математического ожидания следует, что E[deg»]=D(l-e-2) + 0(l). Нам нужно, чтобы deg* (v) было плотно сосредоточено вокруг своего среднего значения. В обозначениях теоремы 7.4.3 вероятностное пространство определяется выбором для каждого е G Е, верно ли е G Я. Все р* = V- Изменение е G Я на е 0 Я может изменить deg*(i;) не более, чем на С = 4. Полу нужно найти deg*(v) с помощью запросов вида «е G Я?» Для всех таких ги, что {v,tu} G #, он определяет, верно ли, что w G V*, с помощью следующей линии опроса. Прежде всего, для всех таких и, что {ги, и} G Е, он запрашивает, верно ли, что {w,u} G Я. Если это неверно для всех и, то w G V*. Если два (или более) {ги, ui}, {ги, 1^2} G Я, то w не может быть в изолированном ребре Я, так что w G V*. Теперь предположим, что {ги, w} G Я в точности для одного и. Затем Пол спрашивает (используя полученную информацию!) для каждого z Ф w с {и, z] G Е, верно ли, что {u,z} G Я. Ответы определяют, является ли {w,u} изолированным ребром в графе Я, а значит, верно ли, что w е V*. Пол сделал не более D + (D — 1) запросов для каждого ги, всего не более D(2D — 1) = 0(D2) запросов. Мы делаем вывод, что Pr[|deg» - £>(1 - е"2)| > AD1/2] = exp[-ft(A2)] при А —► сю и А = o(D1^2). В приложениях бывает желательно итерировать эту процедуру (применяемую здесь при ограничении графа G на множестве V*) для получения большого паросочетания. Это отчасти напоминает метод Рёдля из разд. 4.7. Есть много других трудностей, но плотная концентрация deg*(v) вокруг своего среднего значения играет особую роль. 7.6. НЕРАВЕНСТВО ТАЛАГРАНА Пусть ft = ПГ=1 ^*> где кажД°е ^г — вероятностное пространство, и мера на Q задана как произведение мер. Пусть А С Q, и х = (xi,...,xn) G 1]. В статье [Talagrand (1996)] дано необычное, изящное и чрезвычайно мощное понятие расстояния р(А,х) от х до А. Представим себе движение из х к некоторому у = (yi,..., уп) G А посредством изменения координат. Обозначим
128 Глава 7. МАРТИНГАЛЫ И ПЛОТНАЯ КОНЦЕНТРАЦИЯ через р(А, х) минимальную цену такого движения, когда определенным образом ограниченный в возможностях соперник задает цену каждого изменения. Определение 2. Обозначим через р(Л, х) наименьшую величину, для которой при любом 3 = (ai,...,an) Е Кп с \3\ = 1 существует такой вектор У = (Уи---,Уп) € А, что Y^ ai ^ р(А,х). ХгфУг Заметим, что вектор у может зависеть, и, как правило, зависит от 3. Для любого действительного t ^ 0 положим At = {х Е О, : р(А,х) ^ t}. Заметим, что Aq = А, так как при х Е А можно выбрать у = х. Неравенство Талаграна: Рг[Л](1 — Рг[Л£]) < е~ь /4. В частности, если Pv[A] ^ \ (или больше любой фиксированной константы) и t «очень велико», то все элементы пространства Г£, за исключением очень малой их доли, находятся от А на «расстоянии», не превышающем t. Пример. Рассмотрим пространство ft = {0,1}П с равномерным распределением, и обозначим через т метрику Хэмминга (L1). Тогда р(Л, х) ^ minr(x, у)п-1/2, так как соперник может выбрать все ai = п-1/2. у£А Предположим, что для того, чтобы переместиться из х в А, должны быть изменены значения xi,...,x/ (или любых других / координат). Тогда р(Л, х) ^ Z1/2, так как соперник может выбрать а; = /_1/2 при 1 ^ г ^ /, и ноль в противном случае. Обозначим через U(A,x) множество наборов s = (si,...,sn) Е {0,1}п, обладающих свойством, что существует у Е А, для которого Xi ф Уг => Si = 1. Можно считать, что U(A,x) — множество возможных путей из х в А. Заметим, что когда Si = 1, мы, по некоторым техническим соображениям, не требуем условия Xi ф Уг- В этих обозначениях р(Л,х) —это наименьшее из таких действительных чисел, что при всех 3 с \3\ = 1 существует s Е £/(А,х), для которого выполнено неравенство 3 • s ^ р(Л, х). Пусть V(A,x) — это выпуклая оболочка множества U(A,x). Следующий результат придает другой смысл величине р, открывающий большую глубину этого понятия. Теорема 7.6.1. Справедливо равенство р(А,х) = ^ min \v\. veV(A,x) Доказательство. Пусть этот минимум достигается в v E V(A,x). Тогда гиперплоскость, проходящая через v и перпендикулярная прямой, соединяющей
7.6. НЕРАВЕНСТВО ТАЛАГРАНА 129 начало координат с tf, отделяет V(A,x) от начала координат. Следовательно, для всех s G V(A,x) выполнено неравенство s • v ^ v • v. Положим а = v/\v\. Тогда для всех s£ U(A,x) С V(A,x) верно соотношение s-a^v- v/\v\ = \v\. С другой стороны, возьмем любое ас |а| =. 1. Тогда а • v ^ \v\. Так как v G V(A, ж), мы можем записать, что v = ^T,\iSi для некоторых Si G £/(Л, ж), где А* ^ 0 и ]Г А* = 1. Тогда а, значит, некоторое произведение а • Si ^ |v|. ■ Случай Q = {0,1}П особенно важен и поучителен. Здесь р(Д ж) — просто евклидово расстояние от ж до выпуклой оболочки А. Теорема 7.6.2. Справедливо неравенство / ехр -гр2(А, ж) | dx ^ Рг[Л]- Теорема Талаграна — прямое следствие этого результата. Действительно, зафиксируем А и рассмотрим случайную величину X = р(Л, ж). Тогда Рг[Л] = Рг[Х ^ t} = Рг[е*2/4 ^ е£2/4] ^ Е[е*2/4]е"*2/4, и по утверждению теоремы Е[ех /4] ^ рЛ^Т- Доказательство теоремы 7.6.2. Будем вести индукцию по размерности п. Пусть п = 1. Тогда р(Л, ж) = 1, если ж 0 Л, и р(Л, ж) = 0 в противном случае, так что /« ехр ^р2(А, £)] dx = Рг[Л] + (1 - Рт[А])е^* ^ щ^ ибо, как нетрудно видеть, и + (1 — и)е1^ ^ и-1 при 0 < и ^ 1. Предположим, что утверждение верно для п. Положим OLD = ПГ=1 ^> NEW = fin+i, так что ^ = OLD x NEW и любое z G ft может быть единственным образом представлено в виде z = (ж, и) при ж G OLD, lu G NEW. Положим В = {ж G OLD : (ж, cj) G Л для некоторого и G NEW}, и для любого a; G NEW пусть Аш = {ж GOLD: (ж» G А}. При z = (ж, о;) G ^ мы можем двигаться к А двумя основными путями — изменяя cj, что сводит задачу к перемещению из f в Б, или, не изменяя cj, что сводит задачу к перемещению из ж в Аш. Таким образом, з G U(В, ж) =» (5,1) G £/(Л, (ж, о;)) и Tg U(Au,,x) => #0) G £/(Л,(ж»).
130 Глава 7. МАРТИНГАЛЫ И ПЛОТНАЯ КОНЦЕНТРАЦИЯ Рассмотрим выпуклые оболочки. Если s E V(B,x) и t € V(A,;,x), то (s*, 1) и (£, 0) принадлежат V(A, (x,u;)), а, значит, для любого Л е [0,1] ((1 - А)? + ЛГ, 1 - Л) е V{A, (£,u>)). Тогда, в силу выпуклости, имеем р2(А, (ж,о;)) < (1 - Л)2 + |(1 - X)s + ЛГ|2 < (1 - Л)2 + (1 - Л)Н2 + А|*|2. Выбор 5* и t с минимальными нормами дает нам важное неравенство р2(А, (я, о;)) < (1 - Л)2 + Ар2(А,,£) + (1 - А)р2(Б,£). Процитируем Талаграна: «Главный прием доказательства — избежать сейчас соблазна оптимизировать по А.» Вместо этого сначала зафиксируем и и оценим интеграл сверху: 1 / exp |-p2(A,(£,u;)) dx ^ < Л1'^'* /(ехр 1\ А Р2(^,Х) ехр р2(Б,£) 1-А dx. По неравенству Гёльдера это не превосходит значения / ехр 4р2(Ла;'^ dA / exp 4р2(Б,:?) D(l-A)2/4 что по предположению индукции не превышает X / , \ 1-Х dx 1-Х о(1-АГ/4 1 1 _е(1-А)2/4г-А PrlA^J \Pr[B}J Рг[Б] где г = Рг[Лы]/Рг[Б] ^ 1. Теперь мы минимизируем функцию е^1_л^ /4г_л, выбирая А = 1 + 2 In г при е-1/2 ^ г ^ 1 и А = 0 —в противном случае. Дальнейшие (несколько громоздкие, но простые) вычисления показывают, что е(!-А) /4г-а ^ 2 — г при таком А = А(г). Следовательно, Рг[Л /ехр[ ехр|-^р2(А,(£,и;)) dx ^ Рг[В] 2- Рг[В] Интегрирование по и дает ехр -р2(Д(£,о;)) // ^*т(2-ш) = тф-л где у = Рт[А]/Рт[В] G [0,1]. Но у(2 — у) ^ 1, что завершает индукцию, а вместе с ней и доказательство теоремы. ■ 7.7. ПРИЛОЖЕНИЯ НЕРАВЕНСТВА ТАЛАГРАНА Пусть Q = ПГ=1 ^*> где кажД°е ^г— вероятностное пространство, и мера на Q задана как произведение мер. Рассмотрим функцию h : Q —► R. Неравенство
7.7. ПРИЛОЖЕНИЯ НЕРАВЕНСТВА ТАЛАГРАНА 131 Талаграна дает нам возможность при определенных условиях показать, что случайная величина X = h(-) плотно сконцентрирована. При этом неравенство Талаграна может играть ту же роль, что играет неравенство Ацумы для мартингалов, и во многих случаях оно дает гораздо более сильные результаты. Говорят, что функция h : Q —► R удовлетворяет условию Липшица, если \h(x) — h(y)\ ^ 1 для любых ж и у, отличающихся не более чем в одной координате. Неравенство Талаграна наиболее эффективно на тех липшицевых функциях, для которых из выполнения неравенства h(x) ^ s следует, что существует сравнительно небольшое число координат, обеспечивающих выполнение неравенства h(x) ^ s. Мы формализуем эту идею следующим образом. Определение 3. Пусть f : N —► N. Функция h называется проверяемой со сложностью /, если при h(x) ^ s существует такое мнооюество 1С {1,..., п} c\I\ ^ f(s), что для всех у eft, совпадающих с х в координатах из I, выполняется неравенство h(y) ^ s. Пример. Рассмотрим граф G(n,p) как результат (™) подбрасываний монеты, и пусть h(G)— число треугольников в G. Тогда h — функция, проверяемая со сложностью f(s) = 3s. Это объясняется тем, что если h(G) ^ s, то существует s треугольников, у которых в сумме не более 3s ребер, а у любого другого графа G' с этими 3s ребрами h(G') ^ s. Заметим, что множество / (здесь — множество индексов этих 3s ребер) очень сильно зависит от G. Отметим еще, что нам необходимы только нижние оценки для h. Теорема 7.7.1. При сделанных предполооюениях для всех but справедливо неравенство Рг[Х О - ty/Щ] Рт[Х ^Ъ}^ е~ь /4. Доказательство. Положим А = {х : h(x) < Ь — ty/f(b)}. Пусть теперь h(y) ^ Ь. Мы утверждаем, что у 0 At. Пусть / — множество индексов размера не больше /(&), гарантирующее условие h(y) ^ 6, как показано выше. Положим а, = 0 при i 0 /, oti = |/|-1/2 при i € I. Если у G Л, то существует z E А, отличающееся от у не более чем в ^/l1/2 ^ ty/f(b) координатах из / (и в произвольном числе координат вне /). Пусть у' совпадает с у на / и совпадает с z вне I. Гарантируется, что h(y') ^ Ь. Далее, у' и z отличаются не более чем в ty/f(b) координатах, а значит из условия Липшица следует, что h(z) > %') - tyfttb) > Ь - tyfttb), но тогда z 0 Д противоречие. Так что Рг[Х ^ Ь\ < Рг[Д], и по теореме Талаграна Рг[Х < Ь - ty/ТЩ] Рт[Х ^Ъ}^ е~ь /4. Так как правая часть непрерывна по t, мы можем заменить < на ^, получив тем самым утверждение теоремы. ■ Иногда оказывается полезным небольшое обобщение. Функцию h : Q, —► R назовем К-липшицевой, если \h(x) — h(y)\ ^ К, когда х и у различаются только в одной координате. Применяя предыдущую теорему к функции h/K,
132 Глава 7. МАРТИНГАЛЫ И ПЛОТНАЯ КОНЦЕНТРАЦИЯ удовлетворяющей обычному условию Липшица, мы получаем Рт[Х О - tKy/Щ] Рг[Х ^ Ь] ^ е"£2/4. На практике часто в качестве Ь выбирают медиану, так что для больших t вероятность оказаться на ty/f(b) ниже медианы резко стремится к нулю. С другой стороны, выбирая параметр так, что га = Ь — ty/f(b) — медиана, как правило получаем Ь ~ га + tyjf(m), и вероятность оказаться на ty/JJb) выше медианы резко стремится к нулю. Мартингалы с использованием неравенства Ацумы обычно дают результат, сконцентрированный вокруг //, среднего значения X, в то время как неравенство Талаграна дает результат, сконцентрированный вокруг медианы га. Обычно средние значения легко вычислимы. Медианы, как известно, сложно вычислимы, но при плотной концентрации результата, как правило, можно показать, что среднее значение и медиана близки друг к другу. Пусть х = (xi,... ,хп), где величины Х{ выбраны независимо и равномерно из отрезка [0,1]. Пусть X = h(х) — длина самой длинной возрастающей подпоследовательности х. С помощью простейших методов можно выяснить, что почти наверное с\пх12 < X < С2П1/2 для некоторых положительных констант ci,C2, и что fjt (среднее значение величины X), и га (медиана X) входят в этот диапазон. Кроме того, X удовлетворяет условию Липшица, так как изменение одного Х{ может изменить X не более чем на единицу. Насколько сконцентрированы значения X? С помощью неравенства Ацумы можно доказать, что если s ^> п1/2, то почти наверное \Х — /х| < s. Но этот результат не очень хорош, так как порядок самого X — лишь п1/2. Теперь рассмотрим неравенство Талаграна. Случайная величина X проверяема со сложностью f(s) = 5, так как, если в х есть возрастающая подпоследовательность длины 5, то эти s координат гарантируют, что X ^ s. Тогда Рт[Х < га — tmxl2\ ^ е~ь /4/Рт[Х ^ га] ^ 2е~ь /4, так как га —медиана. Но га = в(п1/2). Значит, при s ^> п1/4 почти наверное X > га — s. С другой стороны, пусть t медленно стремится к бесконечности, и пусть Ь удовлетворяет равенству Ь - tb1/2 = га. Тогда Рт[Х ^ Ъ] ^ е~ь /4/Рг[Х ^ га] ^ 2e"t /4. Следовательно, X ^ Ь почти наверное. Но Ь = га + (1 + o(l))tm1/2, так что X ^ га + tmxl2 почти наверное. Объединяя, получим, что если s ^> п1/4, то \Х — га| < s почти наверное. Гораздо более сильный результат, определяющий точное асимптотическое распределение X, был недавно получен в работе [Baik, Deift and Johansson (1999)] с помощью глубоких аналитических методов. Рассмотрим еще раз теорему 7.3.2. Оценивается вероятность того, что граф G(n, ^) не имеет клик определенного размера к. Пусть, как и в теореме 7.3.2, Y — максимальное число непересекающихся по ребрам /с-клик. Было доказано, что Е[У] = ft(n2k~4) и Y плотно сконцентрировано вокруг Е[У]. так что га, являющееся медианой У, должно также удовлетворять равенству га = fJ(n2/c-4). Как и раньше, У удовлетворяет условию Липшица. Более того, У проверяемо со сложностью f(s) = ({j)^, так как наличие в графе множества
7.8. ПОЛИНОМИАЛЬНАЯ КОНЦЕНТРАЦИЯ КИМА-ВУ 133 ребер некоторых s клик размера к гарантирует, что Y > s. Следовательно, Рг и\ V2' Y^m-tw}l2[K2 Рг[У ^ т] < е-'2/4. fc\!/2 Положим £ = 0(m1/2/fc), так что m = tm1'2®' . Тогда Рг[ш(<7) < fc] = Рг[У ^ 0] < 2е-'2/4 < ехр -fi U6JJ что улучшает оценку теоремы 7.3.2. Тем не менее, надо отметить, что с помощью обобщенного неравенства Янсона в разд. 10.3, оценку удается усилить еще больше. 7.8. ПОЛИНОМИАЛЬНАЯ КОНЦЕНТРАЦИЯ КИМА—ВУ Многообещающе выглядит подход, использованный в недавней работе [Kim and Vu (2000)]. Пусть Н = (V(H), E(H)) —гиперграф, и пусть у каждого ребра е Е Е(Н) есть неотрицательный вес w(e). Пусть U, г Е V(Я), — попарно независимые индикаторы с Щи] = Pi. Рассмотрим многочлен от случайных величин У= Л We [[и ееЕ(Н) гее Мы допускаем е = 0, в этом случае Пгее ^ полагается равным 1. Нам нужно показать, что Y сосредоточено вокруг его среднего значения. Пусть 5 С V(H) —случайное множество, Рг[г Е 5] = pi, эти события попарно независимы для г Е V(H). Тогда У —взвешенное число гиперребер е в подгиперграфе Я, порожденном множеством 5. На практике все веса, как правило, равны единице, так что Y просто равно числу гиперребер в случайном 5. Но мы также можем рассматривать Y как произвольный абстрактный многочлен от индикаторов U, у которого все коэффициенты не отрицательны. Пусть п —- |V(jfiT)| —число вершин в гиперграфе Н (число переменных U). Пусть к — наибольшее возможное значение для размера гиперребер (наибольшее возможное значение степени полинома Y). Пусть А С V(H) и \А\ ^ к. Мы сокращаем Y до Уд следующим образом. Для тех слагаемых Yliee U, У которых А С е, мы полагаем U = 1 для всех г Е Л, заменяя слагаемое на Y\iee_AU. Все остальные слагаемые (где е не содержит А) удаляются. Например, при А = {1}, многочлен 2tit2 + 5Мз^4 + 7^4 пеРе~ ходит в 2^2 + 5£з^4- Интересно, что, как полином от U, случайная величина Уд представляет собой частную производную У по переменным U,i e А. Положим Еа = Е[Уд]. То есть Ел~ ожидаемое число содержащих А гиперребер в 5, при условии, что все вершины А принадлежат 5. Положим Е{ равным максимальному Еа из всех А С V(H) размера г. Для удобства положим /х = Е[У]. Пусть Е" = max EiH E' = max[/x, Я"].
134 Глава 7. МАРТИНГАЛЫ И ПЛОТНАЯ КОНЦЕНТРАЦИЯ Теорема 7.8.1 (полиномиальная концентрация Кима—By). В сделанных выше предположениях Рг[|У -ii\> ak(E'E")l/2\k) < dke-xnk-1 для любого А > 1. Для определенности мы можем здесь положить ак = &кк\1/2 и4 = 2е2. Мы опускаем доказательство, в котором применяются неравенства для мартингалов, похожие на неравенства из теоремы 7.4.3, а также изящная индукция по степени к. Остается простор для улучшения оценок сомножителей dk,d>k и пк~1. На практике обычно к зафиксировано, и Л ^> Inn, так что сомножитель е_Л является главным в оценке искомой вероятности. Применение полиномиальной концентрации Кима—By, как правило, не вызывает затруднений. Пусть G — некоторая реализация случайного графа G(n,p) с р = n_Q;, и пусть О < а < 2/3. Выберем вершину х в G и обозначим через Y = Y(x) число треугольников, содержащих х. Положим \х — Е[У] = (П2 г)р3 ~ ^п2~3а. Пусть S > О зафиксировано. Нам нужно оценить сверху вероятность Рг[|У — /х| < Sfj]. Случайный граф G определен случайными величинами tij, индикаторами смежности пар вершин, по одной для каждой неупорядоченной пары вершин. В этом контексте Это —полином степени к — 3. Если А состоит из единственного ребра хг, получим Еа = (п — 2)р2; если оно состоит из трех ребер, составляющих треугольник, содержащий вершину ж, получим Еа = 1. Если А = 0, Еа = Ц. Другие случаи дают меньшие Еа- Ясно, что Е" ~ max[np2,l]. Вычисления показывают, что Е" ~ с\хп~е для некоторого положительного е (зависящего от а) на всем рассматриваемом диапазоне. Мы применяем полиномиальную концентрацию Кима—By с Л = с'п£^, где с' — малая положительная константа, чтобы ограничить Рг[|У — /х| < Sfj] сверху величиной ехр[—П(пе/6)]. Заметим, что множитель пк~1 поглощается экспонентой. В частности, так как эта вероятность равна о(п~1), почти наверное каждая вершина х входит в ~ ц треугольников. Этот результат можно обобщить1). Зафиксируем а Е (0,1), и пусть (Я, Н) — граф с корнем, безопасный в смысле разд. 10.7, относительно а. Пусть G — некоторая реализация случайного графа G(n,p) с р = п~а. Для различных вершин xi,...,хг пусть Y = F(xi,...,хг) обозначает число расширений G относительно Н. Положим \х = Е[У]. Полиномиальная концентрация Кима—By дает экспоненциально малую верхнюю оценку вероятности того, что Y не близко к //. В частности, эта вероятность равна о(п~г). Следовательно, почти наверное у любых г вершин имеется ~ ц расширений относительно Н. х) Дальнейшее может быть понято после ознакомления с разд. 10.7. — Прим. ред.
7.9. УПРАЖНЕНИЯ 135 7.9. УПРАЖНЕНИЯ 1. Пусть G = (V, Е) — граф, вершины которого —все 7п векторов длины п над Z7, в котором две вершины смежны тогда и только тогда, когда они различаются ровно в одной координате. Пусть U С V — множество из 7n_1 вершин графа G, и пусть W — множество всех вершин G, расстояние от которых до U превышает (с + 2)у/п, где с > 0 —константа. Доказать, что \W\ ^ 7п • е"с2/2. 2? Пусть G = (V, Е)— граф с хроматическим числом х(^) — 1000. Пусть U С F —случайное подмножество множества вершин V, выбранное равномерно из всех 2lvl подмножеств V. Пусть Н = G[U] —индуцированный подграф G на U. Доказать, что Рг[х(Я) ^ 400] < 1/100. 3. Доказать, что существует такая абсолютная константа с, что для каждого п > 1 найдется интервал 1п не более чем из Cy/n/\ogn последовательных целых чисел, такой, что вероятность того, что хроматическое число графа G(n, 0.5) принадлежит /п, не меньше 0.99.
ВЕРОЯТНОСТНЫЙ ВЗГЛЯД: Теорема Вейерштрасса о приближении Хорошо известная теорема Вейерштрасса утверждает, что множество действительных полиномов на [0,1] плотно в пространстве всех непрерывных действительных функций на [0,1]. Теорема (теорема Вейерштрасса о приближении). Для любой непрерывной действительной функции / : [0,1] \—► R и любого е > О существует полином р(х), такой что \р(х) — f(x)\ ^ е для всех х Е [0,1]. Работа [Bernstein (1912)] дает замечательное вероятностное доказательство этой теоремы, основанное на свойствах биномиального распределения. Оно заключаете в следующем. Доказательство. Так как непрерывная функция / : [0,1] »—► R равномерно непрерывна, найдется такое 8 > О, что если х,х' Е [0,1] и |х — х7| ^ 5, то \f(x) — f(x')\ ^ е/2. Кроме того, так как / должна быть ограничена, найдется такое М > 0, что |/(х)| ^ М на [0,1]. Пусть В(п,х) обозначает биномиальную случайную величину с п независимыми испытаниями и вероятностью успеха х для каждого из них. Тогда вероятность того, что В(п,х) = j, равна Q)xJ'(l - x)n~j. Математическое ожидание величины В(п,х) равно пх, а стандартное отклонение составляет у/пх{\ — х) ^ у/п. Следовательно, по неравенству Че- бышёва, рассмотренному в гл. 4, для каждого целого п выполнено неравенство Рг[|Б(п, х) — пх\ > п2/3] ^ —г/з- Значит, найдется такое целое п, что Рг[|В(п,х) - пх\ > п2/3] < -4- LI I 4М и 1 - Положим ™ /г)\ . / 7 \ Мы утверждаем, что для каждого ж Е [0,1] выполнено требуемое неравенство \Рп{х) — /(х)| < е. Действительно, так как Y17=o (?)x4l"" ж)п_г = 1» т0 \рп(Х) - /(x)i < Y1 ("У*1 - ^""Ч/ф - /wi+ г;|г—nrr|^n2/3 + Е (")х*(1 - а;)"-*(1/(|)1 + 1/(^)1) < i;\i—nx\>n2/3 < Е (f)xi(l-x)n-i\f(t)-f(x)\ + г;|г/тг—ж|^гг-1/з<<5 ^ ' + Рг [|Б(п,х) -пх\ >п2/3 ш^шш = е^ что завершает доказательство.
8 Парадигма Пуассона К решению математической задачи более всего побуждает призыв, всегда звучащий внутри нас: вот задача, ищи решение, ты можешь найти его одной только силой мысли, — в математике нет непознаваемого. Давид Гильберт Если случайная величина X является суммой большого числа индикаторов «почти независимых» случайных величин и \х — Е[Х], мы будем говорить, что X имеет почти пуассоновское распределение со средним \х и, в частности, что Рг[Х = 0] близко к е_м. Мы называем это нестрогое утверждение парадигмой Пуассона. В настоящей главе рассматривается несколько случаев, когда эта парадигма может быть строго доказана. 8.1. НЕРАВЕНСТВА ЯНСОНА Часто возникает необходимость в оценке вероятности того, что ни одно из «плохих» событий Бг, г G /, не выполнено. Если события попарно независимы, то Г -. Pr \/\Wi\ = ПРг№ liei J iei Когда Bi «почти» независимы, неравенства Янсона позволяют нам иногда утверждать, что эти две величины «почти» равны. Пусть Q является конечным универсальным множеством. Пусть R является случайным подмножеством множества Q и задается равенствами Рг[г е R] =рг,г е ft, где все события с такими вероятностями попарно независимы. Пусть А», г € J, являются подмножествами пространства Q, I — конечное множество индексов. Обозначим через В{ событие «Ai С R». (То есть каждая точка г е П «подбрасывает монету», чтобы определить принадлежит ли она R. Через Bi обозначим событие, состоящее в том, что при всех подбрасываниях монеты, соответствующих г Е Ai, выпал герб.) Пусть Хг — индикатор события Bi, a X = ^2ieIXi — количество Ai С R. Тогда события /\ieI Bi и X = 0 будут
138 Глава 8. ПАРАДИГМА ПУАССОНА идентичны. Мы пишем г ~ j, г, j е I , если г ф j и А{ П Aj ф 0. Заметим, что если г ф j, и не верно г ~ j, то события Bi и Б7 являются независимыми, поскольку они зависят от подбрасывания различных монет. Более того (и это играет решающую роль в доказательствах), если г 0 J с I и не верно г ~ j для всех j е J, то события Bi и {-Bj|j G J} взаимонезависимы, т. е. Bi независимо с любой булевой функцией от этих Bj. В самом деле, «подбрасывания монет» элементами множества Ai и элементами множества Uj<zjAj независимы. Введем обозначение Д = 5^Рг[В<ЛВ,-]. г~3 Здесь сумма берется по всем упорядоченным парам, поэтому, очевидно, А/2 равно той же сумме, только взятой по неупорядоченным парам. Обозначим M = JJPr[ft], iei что было бы равно Рг[Д^е/ Bi], если бы В{ были независимы. И, наконец, пусть М = Е[Х] = 5>г[В<]. Теорема 8.1.1 (неравенство Янсона). Пусть события Bi,i el, и величины А,М, fjt определены выше. Предположим, что все Рг[Бг] ^ е. Тогда М <Рг и, более того, Для любого iei Рг iei /\в ^ Me1-* 2 ie/ <е -м+# Рг[Д] =1-Рг[Б^е"Рг^, поэтому произведение по всем iei дает М ^ е"м. Две верхние оценки в теореме 8.1.1 довольно близки. Однако для удобства мы будем в основном использовать вторую оценку. Часто для получения асимптотических оценок путем несложных вычислений можно показать, что М ~ е-м# в частности, такую оценку можно получить, когда е = о(1) и Е{1 — 0(1). Может быть, самым простым примером применения теоремы 8.1.1 служит асимптотика вероятности того, что граф G(n,c/n) является свободным от треугольников. Соответствующий результат приведен в разд. 10.1. В этой
8.2. ДОКАЗАТЕЛЬСТВА 139 теореме, также как и во многих других случаях, е = о(1), А = о(1) и ц стремится к константе к. В этих случаях Pr[^ieI В{] —> е~к. Далее мы не будем рассматривать случай, когда А становится большим. В самом деле, если А ^ 2/х, то верхняя оценка теоремы 8.1.1 становится бесполезной. Даже когда А немного меньше, эту оценку улучшает следующий результат. Теорема 8.1.2 (обобщенное неравенство Янсона). Пусть выполнены условия теоремы 8.1.1 и при этом А ^ //. Тогда Рг Л* Lie/ ^ е 2д. Теорема 8.1.2 (когда ее можно применить) как правило дает гораздо более сильные оценки, чем неравенство Чебышёва, которое применялось в гл. 4. В разд. 4.3 было показано, что Var[X] ^ // + А, откуда вытекает неравенство Рг Л* liei =pr[*=ou^eu^A ЕМ* ^ Предположим, что \х —> оо, // <^С А, и 7 — ^ —» оо. Тогда неравенство Чебышёва дает оценку для Рт[Х = 0], грубо говоря, порядка 7-1> в то время как неравенство Янсона дает, грубо говоря, е-7. 8.2. ДОКАЗАТЕЛЬСТВА Оригинальные доказательства Янсона базируются на оценках преобразования Лапласа соответствующей случайной величины. Мы приводим доказательство, полученное в работе [Воррапа and Spencer (1989)]. Будем пользоваться неравенством Рг Bi\/\Bj ^ Рт[В& которое верно для любого множества индексов J С /, г 0 J, а также неравенством Рг Bi\BkA /\Bj ^Pr[Bi\Bk], справедливым для любого множества индексов J С /, г, к 0 J. Первое неравенство следует из теоремы 6.3.2. Второе же неравенство эквивалентно первому, поскольку условие, накладываемое на Bk, эквивалентно предположению, что рг = Pr[r e R] = 1 для всех г е Ак- Доказательство теоремы 8.1.1. Нижняя оценка доказывается тривиально. Для удобства упорядочим множество индексов / = {1,...,т}.
140 Глава 8. ПАРАДИГМА ПУАССОНА При 1 < i ^ m Рг Bi\ Д в, i<j<t < Pr[Bi], откуда вытекает соотношение Рг Ж| Л ^ и, следовательно, выполняется неравенство ^ Рг[Д Рг г -| Л^ Lie/ J m = ПРг г=1 >Г1Рг[^]- Is*I Л ^ l^j<i | г=1 Докажем теперь первую верхнюю оценку. При заданном г для удобства перенумеруем индексы так, что г ~ j верно при 1 ^ j ^ d и не верно при d+l ^ j < г. Мы пользуемся неравенством Рг[Л|БлС] > Рг[АлБ|С], справедливым для любых А, Б, С. Пусть А = Б^, Б = i?iA.. ./\Вд, С = Bd+iA.. .ЛД_1, тогда Рг[А|Б Л С] ^ Рх[А Л Б|С] = Рг[А|С] Рт[В\А Л С]. Рг|б,| Д вЛ Из взаимной независимости событий следует, что Рг[Л|С] = Рг[Л]. Из корреляционного неравенства вытекает, что d d Рт[В\ААС] ^ 1-^Рг[Б7|Б*ЛС] ^ 1-^2Рт[В,\Вг]. 3 = 1 3 = 1 Таким образом, Откуда следует Рг Рг Bi\ Д Вз i^j<i ^Рт[Вг]-^2Рт[В,ЛВг]. 3 = 1 Bi\ Д в3 ^Рт[В{] + ^Рг[^ЛВ<]^ 3 = 1 ^Pr[Bi] I l + ^i-^Pr^ABi]) , поскольку Рг [ Бг ] ^ 1 — е. Воспользовавшись неравенством 1 + х ^ еж, получаем 1 \^d Рг Bi| Д Bi <Рг[Ж]е^2?=1Рг[^лв1]>
8.2. ДОКАЗАТЕЛЬСТВА 141 Для каждого 1 ^ г ^ т мы подставляем последнее неравенство в соотношение Рг л*< Uei Прг г=1 Bi\ Л Вз i<j<t Члены Рг [ В{ ] в произведении дают М. Показатели степеней складываются: для каждого i,jelcj<inj~i член Pr[Bj Л В{] появляется однажды, поэтому в сумме они дают А/2. При доказательстве второй верхней оценки мы используем ограничения Рг в{\ Д Bj ^ 1 - Pr[Bi} + ^ Рг№ Л Bi] ^ 3 = 1 ^ ехр - Рт[Вг] + Yl FtIBj л Bi\ ] • > Теперь сумма членов — Pr[i?;] дает —//, в то время как сумма членов Pr[Bj ЛВ{] снова дает А/2. ■ Доказательство теоремы 8.1.2. Вторая верхняя оценка теоремы 8.1.1 может быть переписана в виде In Рг Ь^Рг[В,]-^Рг[ДЛВ,]. / iel i~j Для любого подмножества индексов S С / то же неравенство, только примененное к В{, г G 5, дает In Рг Л* lies Ь£Рг[Д]~ J2 Рг[В<ЛВ,-]. / ies i,jes,i~j Пусть теперь 5 является случайным подмножеством / и задается равенством Pr[ieS}=P, (8.1) где р — константа, которая будет определена позже, и события с вероятностями (8.1) взаимно независимы. (Здесь мы будем использовать вероятностные методы для доказательства вероятностной теоремы!) Каждый член Рг[Бг] появляется с вероятностью р, а каждый член Рт[В{ ABj]—c вероятностью р2. Откуда вытекает Е - In Рг /\Вг i€S ^Е lies -\* i,J€S,i~3 ■■W-P -£•
142 Глава 8. ПАРАДИГМА ПУАССОНА Положим р А' чтобы максимизировать оценку снизу. Из дополнительного условия теоремы 8.1.2 следует, что вероятность р не превосходит 1. Тогда Е ■In Рг ies > EL 2А* Поэтому существует такое подмножество S С I, что ,2 - In Рг Lies > EL 2Д' То есть Но Рг л* i€S € е~&. Рг л* iei <Рг ies что и завершает доказательство. 8.3. РЕШЕТО БРУНА Более традиционным подходом к парадигме Пуассона является метод решета Бруна, названный так в честь специалиста по теории чисел Т. Бруна, который пользовался этим методом. Пусть В\,..., Вт — события, Xi — индикатор события Вг, и X = Х\ + ... + Хш (количество наступивших событий В{). Пусть есть скрытый параметр п, т. е. на самом деле т = ra(n), Bi = Bi(n), X = Х(п). Это объясняет использование символов о и О. Введем обозначение 5^)=^Рг[Б,1Л...ЛБ,г], где сумма берется по всем множествам {ii,..., ir} С {1,..., га}. Из формулы включений-исключений следует, что рТ[Х = 0]=Рг[Жл...ЛБ^]=1- S^ + 5(2) - ... + {-l)rS^ + ... . Теорема 8.3.1. Пусть существует константа fi, такая, что Е[Х] = S™ -> /i, и для любого фиксированного г имеет место сходимость E[I<r»/r!] = S{r) -► цг/г\. Тогда Pr[X = 0] -» е-"
8.3. РЕШЕТО БРУНА 143 и, более того, для каждого t Рх[Х = t] £«-■ Доказательство. Мы ограничимся рассмотрением только случая t = 0. Зафиксируем некоторое е > 0. Выберем s так, что 2s ^£1 _„-м| г! В-1)' г=0 ^ Неравенства Бонферрони утверждают, что в общем случае формула включений-исключений попеременно оценивает то сверху, то снизу вероятность Рт[Х = 0]. В частности, 2s Pr[X = 0]^^(-l)r5(r). r=0 Выберем По (скрытую переменную) так, чтобы при п ^ щ выполнялось неравенство |s(r)-^-| ^ 2(25 + 1)' где 0 ^ г ^ 25. При таких п Рт[Х = 0] ^ е_/А + е. Аналогично, суммируя до 25 + 1, мы найдем По, такое, что при п > щ выполняется Рт[Х = 0] ^ е-** - е. Поскольку е было выбрано произвольно, то Рт[Х = 0] —> е_м. ■ Пороговые функции свойства содержания графом G ~ G(n,p) копии заданного графа if, выводимые в разд. 10.1 с помощью неравенства Янсона, были в оригинале получены с помощью решета Бруна. В следующем примере задействованы оба метода. Пусть G ~ G(n,p) —случайный граф, определенный в гл. 10. Введем обозначение EPIT (Every Point In Triangle) для утверждения о том, что любая вершина лежит в некотором треугольнике. Теорема 8.3.2. Пусть зафиксирована константа с > 0, а величины р = р(п) и \х — \х(п) удовлетворяют условиям 1 Р = V, с п Тогда lim Pr п—>оо G(n,p) \=ЕР1Т\ =е~с. В статье [Spencer (1990a)] найдены пороговые функции для очень широкого класса «утверждений о расширениях»: все г вершин лежат в копии некоторого фиксированного графа Н.
144 Глава 8. ПАРАДИГМА ПУАССОНА Доказательство. Сначала зафиксируем х Е V{G). Для каждой неупорядоченной пары у, z E V(G) \ {х} пусть Bxyz обозначает событие, что тройка {ж, у, z} образует треугольник в графе G. Обозначим через Сх событие ABxyz, a через Хх — соответствующий индикатор. Мы используем неравенство Янсона, чтобы оценить Е[Хг] = Рг[Се]. Поскольку р = о(1), то и е = о(1). Согласно определению, данному выше, ]Г Рг^Дг^] = М- Зависимость xyz ~ xuv возникает тогда и только тогда, когда множества пересекаются (в точке, отличной от х). Следовательно, А = Y, Рг[Д*у* Л B^z'] = 0(n3)p5 = о(1), поскольку р = п"2/3"1"^1). Итак, ЦХх}~е-» = -. п Теперь определим х = 2_^ хх, xev(G) что равно числу вершин ж, не лежащих в треугольниках. Тогда из линейности математического ожидания имеем Е[Х}= ]£ ЩХх]-*с. xev(G) Нам нужно показать, что парадигму Пуассона можно применить к X. Зафиксируем г. Тогда E[XM/r!] = S<r> = J2 PrtC-i Л ... Л СЯг], где сумма берется по всем множествам вершин {xi,...,xr}. Нет разницы между г-множествами, поэтому Е[Х«/г!] = (Л Рт[СХ1 Л ... Л СХт\ ~ ^ Рг[СХ1 Л ... Л С1г], где xi,..., хг — некоторые конкретные вершины. Но СХ1 Л ... Л СХг = /\BXiyZ, где пересечение берется по всем 1 ^ г ^ г и всем у, z. Мы применяем неравенство Янсона к этому пересечению. Снова е = р3 = о(1). Количество троек {жг,у,г} равно г(п~1) — О(п), где лишние тройки появляются из-за треугольников, содержащих две (или три) вершины Хг. (Здесь важную роль играет то, что г фиксировано.) Таким образом, $>[Вх4уг]=Р3(г(П2 1) -О(п)) =rM + 0(n-1+°W). Как и ранее, Д равно произведению ръ на количество пар Xiyz ~ Xjy'z'. Есть 0(гп3) = 0(п3) членов с г = j и 0(г2п2) = 0(п2) членов с г ф j. Таким
8.4. БОЛЬШИЕ УКЛОНЕНИЯ 145 образом, снова получаем, что А = о(1). Поэтому Рт[СХ1 А ... Л СХг] ~ е~г» и E[*M/r!] ~ ^^ т \ т\ Следовательно, условия теоремы 8.3.1 выполнены для X. Ш 8.4. БОЛЬШИЕ УКЛОНЕНИЯ Вернемся к терминологии разд. 8.1. Наша цель состоит в получении для случайной величины X неравенств больший уклонений, аналогичных неравенствам, доказанным в приложении А. Пусть R — случайное подмножество множества Q. Мы называем подмножество J множества индексов непересекающимся множеством (НМ), если • Событие Bj выполняется для любого j E J. • Ни для каких j, j'-E J не выполняется j ~ jf. Если к тому же • При выполнении события By из j' 0 J следует, что j ~ j' для некоторого j e J, то J называется максимальным непересекающимся множеством (МНМ). Приведем некоторые общие результаты о размерах максимальных непересекающихся множеств. Связь с X будет затем установлена с помощью специально разработанных для этого средств. Лемма 8.4.1. При введенных выше обозначениях для любого s Рг[ЗНМ J,\J\ = s] ^ ^. Доказательство. Пусть ]Р* обозначает сумму по всем s-множествам JC/, не содержащим пар j, j7, таких, что j ~ j'. Обозначим через ]Р° сумму по всем упорядоченным наборам (ji,..., js) из s элементов, образующим множество J. И, наконец, пусть ]Га обозначает сумму по всем упорядоченным наборам (jb • • • > js) из s элементов. Тогда Рг[Э НМ J, |J| = s] ^ J2* Рг[ Д Bj} = = £* П Pr^i = 7,H° Pr^ ] • • • ад.] < }€J <^Харт[вл---Рт[вл^^ EPr^i Lie/ = ixa/si
146 Глава 8. ПАРАДИГМА ПУАССОНА Лемма 8.4.1 дает эффективную верхнюю оценку при /zs < 5!, в основном, когда s > /ш, где а > е. Для небольших s мы учитываем условие максимальности НМ J. В этом случае обозначим через /xs минимум, взятый по всем jb • • • 5 Js € I, от ]Г Рг[£?г], где сумма берется по всем г е /, кроме тех г, для которых г ~ ji при некотором 1 ^ / ^ s. В приложениях s обычно мало (в противном случае мы используем лемму 8.4.1), и ц3 близко к //. В некоторых случаях удобно ввести обозначение v = тахУ^Рг[Бг] и использовать то, что \is^ \x — sv. Лемма 8.4.2. В предыдущих обозначениях для любого целого s справедливы неравенства Рг[3 МНМ J, \J\ = s]^ ^-e-^e* < ^e"^esz/e*. Доказательство. Также, как и в лемме 8.4.1 мы оцениваем эту вероятность сверху величиной ]Г*, где J = {ji, • • • ,js} является МНМ. Для выполнения данного условия J должно быть, во-первых, непересекающимся семейством, а во-вторых, должно выполняться событие Л*Бг, где Л* обозначает пересечение по всем i е/, кроме г ~ ji для некоторого 1 ^ / ^ s. Применим неравенство Янсона, чтобы получить верхнюю оценку для Pr[A*Bi]. Соответствующие значения //*, Д* удовлетворяют неравенствам if > lis, Д*^Д. Последнее неравенство следует из того, что Д* имеет меньше слагаемых. Таким образом, Рг[Л*£*] ^ е^'е* Y^ Pr[J является МНМ] ^ e"Mse* ^* Рг[ Д Bj] ^ Когда Д = о(1) и v\x = о(1) или, более общо, /хз^ = М + о(1), лемма 8.4.2 дает хорошую аппроксимацию распределению Пуассона, поскольку Рг[3 МНМ J, \J\ = s] ^ (1 + o(l))^le-/A при 5 ^ 3/х, и по лемме 8.4.1 эта вероятность гораздо меньше при больших s. 8.5. ОЦЕНКА ЧИСЛА РАСШИРЕНИЙ Начнем со случая, где используется основной результат, касающийся больших уклонений из приложения А.
8.5. ОЦЕНКА ЧИСЛА РАСШИРЕНИЙ 147 Теорема 8.5.1. Пусть р = Щ^и{п), где и(п) —> сю как угодно медленно. Тогда в графе G(n,p) почти всегда deg(x) ~ (п — 1)р для всех вершин х. Это, на самом деле, результат по большим уклонениям. Достаточно доказать следующее утверждение. Теорема 8.5.2. Пусть р = —cj(n), где и(п) —> оо сколь угодно медленно. Пусть точка х Е G фиксирована. Зафиксируем некоторое е > 0. Тогда Pr [|deg(x) - (п - 1)р\ > е(п - 1)р] = о(п~1). Доказательство. Поскольку deg(x) ~ В(п — 1,р), т.е. это биномиальная случайная величина с указанными выше параметрами, то согласно следствию А. 1.14 получаем, что Pr [|deg(x) - (п - 1)р\ > е{п - 1)р] < 2е~с^п-1)р = о^'1), так как с£ фиксировано и (п — \)р ^> Inn. ■ Этот результат показывает, почему логарифмические члены появляются так часто при изучении случайных графов. Мы хотим, чтобы каждое х обладало некоторым свойством, поэтому мы стараемся, чтобы вероятность того, что это свойство не выполняется, была о(п~1). Когда можно применить парадигму Пуассона, вероятность этого нежелательного события, грубо говоря, экспоненциальна, поэтому мы хотим, чтобы показатель был логарифмическим. Это часто ведет к тому, что в выражении для вероятности появления ребра р возникает логарифм. В гл. 3 мы нашли пороговую функцию условия, что любая вершина лежит в треугольнике. Это событие случалось, когда ожидаемое число расширений заданной вершины до треугольника достигало Inn. Обозначим через N(x) количество треугольников, содержащих х. Пусть ц = (п~г)р3 = E[7V(x)]. Теорема 8.5.3. Пусть р таково, что \х ^> Inn. Тогда почти всегда N(x) ~ \х для всех х G G(n,p). Как и выше, данный результат относится, фактически, к большим уклонениям. Докажем следующее утверждение. Теорема 8.5.4. Пусть р таково, что \х ^> Inn. Зафиксируем х Е G и е > 0. Тогда Pr[\N(x)-fi\ >efj] = o(n-1). Доказательство. Мы будем доказывать это утверждение, предполагая, что р = п-2/3-^1) (или, что эквивалентно, \х — п°^). Данного ограничения общности можно избежать техническими методами. Теперь в условиях лемм 8.4.1, 8.4.2 имеем i/, //, Д = о(1). Пусть Р обозначает случайную величину,
148 Глава 8. ПАРАДИГМА ПУАССОНА распределенную по закону Пуассона с математическим ожиданием //. Тогда Рг [з МНМ J, \J\ < fi(l - е)] ^ (1 + о(1)) Рг[Р ^ //(1 - е)], Рг [з МНМ J, //(1 + е) ^ | J| ^ 3 J ^ (1 + о(1)) Pr L(l + е) ^ Р ^ 3 J, оо s Рг [Э МНМ J, \J\ > 3J < Рг [З НМ J, \J\ ^ 3/i] < JZ ^7 = ^ ~ с)")' где с > 0 —некоторая постоянная. Поскольку \х ^> Inn, третий член равен о(п~1). По теореме А. 1.15 первый и второй члены равны о(п~1). Каждое МНМ J с вероятностью 1 — о(п~1) лежит в интервале от (1 — е)/х до (1 + е)/х. Зафиксируем некоторое такое МНМ J. Заметим, что всегда существует некоторое МНМ, даже в случае, когда не выполняется ни одно из В^ мы можем взять J = 0. Элементами J являются тройки xyz, которые образуют треугольники. Следовательно, N(x) ^ \J\ ^ (1-е)//. Верхняя оценка. Вероятность того, что существует пять треугольников xyz\,xyz2, хугз, xyz±, xyz$, не превосходит п6рп = о(п~1). Вероятность того, что существуют треугольники xyiZi,xyiz[, 1 ^ г ^ 4, где все вершины различны, не превосходит п12р20 = о(п~1). Рассмотрим граф, вершинами которого являются треугольники xyz. Пусть ~ обозначает отношение смежности. Существует N(x) вершин, МНМ J является максимальным независимым множеством. В этом графе с вероятностью 1 — о(п~1) каждая вершина xyz имеет степень не более 9, и не существует множества, состоящего из четырех несмежных ребер. Из этого вытекает, что для любого J выполнено неравенство | J\ ^ N(x) — 27 и N(x) ^ (1 + е)ц + 27 ^ (1 + е')ц. ■ Для любого графа Н с «корнями» xi,...,xr мы можем подсчитать в графе G(n,p) количество расширений N(xi,...,xr) заданного множества из г вершин до копии графа Н. В работе [Spencer (1990b)] даны некоторые общие результаты, которые являются обобщениями теорем 8.5.2 и 8.5.4. При весьма широких предположениях (см. упр. 5, гл. 10), когда математическое ожидание \х количества расширений удовлетворяет условию \х ^> Inn, почти всегда выполняется отношение N(x\,..., xr) ~ \х. 8.6. ЧИСЛО ПРЕДСТАВЛЕНИИ Теоремы этого раздела основываются на следующем очень простом и очень полезном результате. Лемма 8.6.1 (лемма Бореля—Кантелли). Пусть события Ап,п Е N, удовлетворяют неравенству 5^ Рг[Лп] < оо. 71=1
8.6. ЧИСЛО ПРЕДСТАВЛЕНИЙ 149 Тогда Рг i=l j=i 0. То есть при достаточно больших п событие Ап почти всегда не выполнено. Для того чтобы применить эту лемму, мы будем стремиться получить неравенство Рг[Лп] < п~с, где с > 1. В очередной раз мы начинаем со случая, который использует только результаты о больших уклонениях, полученные в приложении А. Для заданного множества 5 натуральных чисел обозначим (для любого п е N) через /(n) = fs(n) количество представлений n = x + y,£,yES, x < у. Теорема 8.6.2 [Erdos (1956)]. Существует мнооюество S, для которого f(n) = 0(lnn). To есть существуют мнооюество S и константы с\,С2 такие, что для всех достаточно больших п выполняются неравенства ci Inn ^ f(n) ^ C2 Inn. Доказательство. Определим случайное множество 5 равенством Рг[х е S] = рх = min X Зафиксируем п. Теперь /(п) является случайной величиной с математическим ожиданием M = B[/(n)] = - Y1 РхРу х+у=п,хфу Примерно для п слагаемых выполняется неравенство рхру > р2п = 100~р. Мы получаем, что рхрх = ©(^г)> за исключением случаев, когда х = о(п),у = о(п). Нужно проследить, чтобы эти члены не давали существенного вклада в значение \х. Аккуратные асимптотические вычисления дают соотношение Л f dx \i ~ (50Inn) / = = 507rlnn. Jo yx(l — x) Незначительность вклада членов х = о(п),у = о(п) отражает конечность неопределенного интеграла в точках х = 0 и х = 1. Возможные представления х + у = п являются взаимно независимыми событиями. Поэтому из следствия А. 1.14 получаем, что Рг[|/(п) -ц\> efi] < 2e-s» для некоторых констант е и 8 = 6(e). Для определенности мы можем взять е = 0.9,6 = 0.1; тогда Рг[|/(п) - ц\ > 0.9/и] < 2е~б7г1пп < п~1Л при достаточно больших п. Возьмем с\ < 0.1(507г) и с^ > 1.9(507г).
150 Глава 8. ПАРАДИГМА ПУАССОНА Пусть Ап — событие, заключающееся в том, что неравенства с\ In n ^ /(n) ^ ^ С2 Inn не выполняются. При достаточно больших п справедливо неравенство Рг[Лп] < п~1Л. Из леммы Бореля—Кантелли следует, что почти всегда все события Ап не выполнены при достаточно больших п. Поэтому существует некоторая точка в вероятностном пространстве, т. е. некоторое множество 5, для которого ci Inn ^ /(n) ^ C2 Inn при всех достаточно больших п. ■ Исследование бесконечного вероятностного пространства, использованного здесь и ниже, было аккуратно проведено в книге «Последовательности» Халберстама и Рота. Использование бесконечного вероятностного пространства ставит много вопросов, связанных с экзистенциальной природой доказательств. Например, существует ли рекурсивное множество 5, удовлетворяющее условию теоремы 8.6.2? Положительный ответ на этот вопрос был получен в статье [Kolountzakis (1999)]. Для заданного множества 5 натуральных чисел обозначим через 9(п) = 9s(n) количество представлений п = х + у + z, x,y, z е 5, х < у < z. Нижеследующий результат на самом деле был получен для представлений числа п в виде суммы к слагаемых при любом фиксированном к. Для простоты изложения мы приводим доказательство только для случая к = 3. Теорема 8.6.3 [Erdos and Tetali (1990)]. Существует множество S, для которого д(п) = 0(1пп). То есть существуют множество S и константы с\, С2 такие, что для всех достаточно больших п справедливы неравенства с\ In n ^ g(n) ^ C2 In n. Доказательство. Зададим случайное множество 5 равенствами 1/з Рг[х Е 5] = рх = min 10 т Зафиксируем п. Теперь д(п) является случайной величиной с математическим ожиданием fi = Щд(п)] = Y2 PxPyPz- x+y+z=n Аккуратные асимптотические вычисления дают 1031 Г1 (l~x dxdy * л \i ~ -—Inn / / -— -гт-рг = Ктп, 6 Jx=0 Jy=0 [xy(l -х- у)]2/3 где К велико. (Можно сделать К сколь угодно большим, увеличивая «10».) Применим лемму 8.4.2. Здесь Д = ^PxPyPzPy'Pz', где сумма берется по всем пятеркам с х + у + z = х + у' + z' = п. Число слагаемых приблизительно равно п3, и каждое из них асимптотически составляет р„ = п-10/3-^1), так что сумма есть о(1). И снова необходимо проследить, чтобы слагаемые, в которые входят малые переменные, не
8.7. ДАЛЬНЕЙШИЕ ОБОБЩЕНИЯ 151 привносили большой вклад в сумму. В предположении s ^ 3/х = 0(1пп) получим асимптотику для ц8. Это минимально возможное значение величины ^L,PxPyPz, где сумма берется по всем ж, у, z, таким, что х + у + г = пине пересекающимися с заданными s представлениями; ослабим данное условие, рассмотрим сумму по заданному множеству с 3s элементами. Вновь требуется показать, что основная составляющая суммы Ylx+y+z=n PxPyPz приходится не на края, а «сосредоточена» вблизи центра, и что fis ~ //. Теперь, как и в разд. 8.5, обозначим через Р случайную величину, распределенную по закону Пуассона с параметром \х. Вероятность того, что существует МНМ J, размер которого меньше \х(\ — е), или заключен между \х(\ + е) и 3/х, асимптотически равна вероятности того, что Р лежит в этих промежутках. Так как К велико, при умеренных е эти вероятности, как и вероятность того, что существует непересекающееся семейство размера, большего чем 3/х, равны о(п~с), где с > 1. По лемме Бореля—Кантелли почти всегда для всех достаточно больших п размер всех МНМ J находится в промежутке от с\\пп до C2lnn. Отсюда вытекает оценка д(п) ^ с\ Inn. Верхняя оценка. При заданном р пусть f(n) является, как и раньше, количеством представлений п в виде суммы двух элементов из 5. Мы используем только то, что рх = х-2/3^0^1). Имеем E[/(n)]= Y, Оп/Г2/3+о(1)=п-1/3+о(1), х+у=п учитывая также «полюс» в нуле. Здесь возможные представления взаимно независимы, так что Рг[/(п) > 4] ^ Е[/(п)]4/4! = п"4'3*0*1), и по лемме Бореля—Кантелли почти всегда /(n) ^ 3 для всех достаточно больших п. Но тогда почти всегда существует такое С, что f(n) ^ С для всех п. Для всех достаточно больших п существует МНМ (с представлениями в виде суммы трех слагаемых) размера, меньшего чем a In п. Каждая тройка х, у, z G 5, такая, что х + у + z = n, должна содержать по крайней мере одну из этих не более чем Зс2 Inn точек. Количество троек x,y,z E S с x + y + z = n при фиксированном х равно f(n — я), т. е. числу представлений п — х = у + z (быть может, на одно меньше, поскольку y,z ф х), и поэтому не превосходит С. Но тогда всего существует не более С(3с2 Inn) представлений п = х + у + z. Ш 8.7. ДАЛЬНЕЙШИЕ ОБОБЩЕНИЯ Здесь мы обсуждаем некоторые ситуации, когда применима парадигма Пуассона. Пусть Bi,i G /, являются событиями в произвольном вероятностном пространстве. Так же как и в локальной лемме Ловаса из гл. 5, мы говорим, что симметрическое бинарное отношение ~ на / называется орграфом зависимостей, если для всякого г Е / событие Bi взаимно независимо с событием {-В^|не выполняется г ~ j}. (Для орграфа из гл. 5, разд. 5.1 имеем Е = {(h3)\i ~ j}•) Предположим, что события В{ удовлетворяют неравенствам
152 Глава 8. ПАРАДИГМА ПУАССОНА из разд. 8.2: Рг \Вг\ /\Щ ^Рг[В<], L jeJ J верным для любых множеств индексов J С /, г 0 J, и неравенствам Рг Bi\BkA /\Bj jeJ ^Рт[В{\Вк], верным для множеств индексов J С /, г, к 0 J. Тогда утверждения теорем 8.1.1 и 8.1.2 о неравенствах Янсона, а также лемм 8.4.1 и 8.4.2 выполняются. Доказательства идентичны; были использованы только перечисленные выше свойства событий Bi. В работе [Suen (1990)] (см. также [Janson (1998)] для существенных вариаций) получен весьма общий результат, позволяющий аппроксимировать вероятность Рг[Д^е/Бг] посредством произведения М = YlieIPr[Bi]. Снова пусть Bi,i G /, являются событиями в произвольном вероятностном пространстве. Будем говорить, что бинарное отношение ~ на / является орграфом суперзависимостей, если выполняется следующее условие. Пусть J\, J2 С I — такие непересекающиеся подмножества, что j\ ~ 2i не выполняется ни для каких ji G Ji,j2 € ^2- Пусть В1 является произвольной булевой комбинацией событий Bj,j G Ji, и пусть В2 является булевой комбинацией событий Bj,j G J2- Тогда события В1 и В2 независимы. Заметим, что отношение ~, определенное в разд. 8.1, является на самом деле орграфом суперзависимостей. Теорема 8.7.1 (Сен). При указанных выше условиях Рг Л*< U6/ м [ < М WZ*~i y(i'j) - 1 где y(i,j) = (Pr[Bi Л БД + Pr[Bi]Pr[Bj]) П (1 - РгЭДГ1. l~i или l~j Мы не будем доказывать теорему 8.7.1. Во многих случаях последнее произведение невелико. Предположим, что оно меньше двух для всех г ~ j. В этом случае 5>(мК2[д + £Рг[В4]Рг[В,]]. Во многих случаях величина Х^ Рг[£?г] Pr[£j] мала по сравнению с А (как и во многих случаях, когда г ~ j, события Bi,Bj положительно коррелированны). Если кроме того А = о(1), то теорема Сена дает аппроксимацию вероятности Рг[Дге/ ^i] чеРез М. Сен применил свой результат для оценки числа индуцированных копий фиксированного графа Н в случайном графе G(n,p). В работе [Janson (1990)] получено одностороннее неравенство для больших уклонений величины X из разд. 8.1, которое несколько проще применить к леммам 8.4.1 и 8.4.2.
8.8. УПРАЖНЕНИЯ 153 Теорема 8.7.2 (Янсон). Для математического ожидания \х = ЩХ] и произвольного 7 > 0 справедливо соотношение Рг[Х^(1-7)м]<е-7^/(2+^). Когда А = о(/х), эта оценка остаточного члена становится близка к оценке, задаваемой функцией нормального распределения, у которого среднее значение и стандартное отклонение равны //. Мы не будем доказывать теорему 8.7.2. Доказательства теорем 8.7.1 и 8.7.2, как и оригинальные доказательства Янсона теорем 8.1.1 и 8.1.2, основаны на оценках преобразования Лапласа величины X, оценивающих Е[е_£Х]. 8.8. УПРАЖНЕНИЯ 1. Доказать, что для любого е > О существует некоторое по = по(е) такое, что для всех п > по существует граф на п вершинах, содержащий в качестве индуцированного подграфа всякий граф на к ^ (2 - е) log2 n вершинах. 2. Найти пороговую функцию для следующего свойства: граф G(n,p) содержит по крайней мере п/6 попарно вершинно-независимых треугольников.
ВЕРОЯТНОСТНЫЙ ВЗГЛЯД: Локальная раскраска Этот результат Эрдёша [Erdos (1962)] является еще одним вероятностным свидетельством того, что хроматическое число не может быть найдено путем локального анализа. Теорема. Для всех к существует такое е > О, что при всех достаточно больших п существуют графы G на п вершинах с хроматическим числом x(G) > k, но, тем не менее, x(G\s) ^ 3 для любого мнооюества вершин S размера не большего еп. Доказательство. Для заданного к пусть с, е > О удовлетворяют неравенствам п, о гг/1 /I \ 1 г» О 2/r#(l//c)ln2, е < е"533с-3, где Н(х) = —х log2 х — (1 — х) log2(l — х) — функция энтропии. Пусть р = с/п и пусть G ~ G(n,p). Мы покажем, что граф G почти наверное удовлетворяет обоим условиям теоремы. Если х(^) ^ ^^ то существует независимое множество размера п/к. Ожидаемое число таких множеств равно ( П Vl_p)(n2/fc) <2n(^l/fcHo(l))e-cn/2fc2(Ho(l))) \n/kj что есть о(1), исходя из нашего выбора величины с. Следовательно, почти наверное x(G) > &• Предположим, что для раскраски некоторого множества 5, содержащего t ^ еп вершин, необходимо не менее четырех цветов. Тогда, как и в доказательстве леммы 7.3.4, существует минимальное такое множество 5. Для любого v G 5 существует 3-раскраска множества 5 \ {v}. Если v имеет двух или менее соседей в 5, то эта раскраска может быть продолжена до 3-раскраски 5. Следовательно, любая v E 5 имеет степень не меньше трех в G\s, и поэтому граф G\s содержит не менее 3£/2 ребер. Вероятность того, что некоторые t ^ еп вершин имеют не меньше 3£/2 ребер, меньше чем ШД)©3"2 t^.en Мы наметим путь дальнейших рассуждений. Когда t = O(l), множителями можно пренебречь. В противном случае мы оцениваем каждый множитель СВ6РХУ: - 3/2 1* т(1) (;Tb(eS/w^)'-
Вероятностный взгляд: Локальная раскраска 155 Теперь, поскольку t ^ en, последняя величина в скобках не превосходит значения е5/23_3/2с3/2б:1/2. Из условия на е следует, что последнее выражение меньше единицы. Вся сумма равна о(1), т. е. почти наверное такого 5 не существует. ■ Многие заманчивые гипотезы легко опровергаются посредством вероятностного метода. Если всякие n/(lnn) вершин могут быть окрашены в три цвета, может ли тогда граф G на п вершинах быть раскрашен в четыре цвета? Данный результат показывает, что ответ является отрицательным.
I Псевдослучайность «Узел!» — воскликнула Алиса, всегда готовая помочь ближнему, и, с тревогой оглядываясь вокруг, продолжила: «Ах, позвольте мне помочь вам развязать его!» Льюис Кэрролл, Алиса в Стране Чудес Как уже не раз говорилось в различных главах этой книги, вероятностный метод представляет собой мощный инструмент для установления факта существования комбинаторных объектов с определенными свойствами. Часто таких доказательств существования недостаточно, хотелось бы построить объект явным образом. Это желание вызвано не только тем, что явное построение может пролить больше света на соответствующую проблему. Часто случайная на вид конструкция может требоваться для некоторого алгоритмического метода. При этом хотелось бы не просто доказать существование алгоритма, а получить сам алгоритм. Проблема поиска явных построений может показаться тривиальной. В конце концов, мы в основном имеем дело с конечными случаями. Получив вероятностное доказательство существования, можно найти явный пример полным перебором. Более того, многие вероятностные доказательства фактически показывают, что большинство элементов выбранного должным образом вероятностного пространства обладают желаемыми свойствами. Таким образом, можно ожидать, что найти один такой элемент не будет слишком сложно. Но несмотря на то, что в принципе это верно, ясно, что нецелесообразно перебирать все возможности. Поэтому обычно под явным построением комбинаторного объекта понимается построение, которое может быть выполнено эффективно. Например, за время, полиномиальное относительно некоторых параметров объекта. Поясним эти идеи на примере одной из наиболее известных открытых проблем в области явных построений — проблемы построения явных графов Рамсея. Первый пример, приведенный в гл. 1 — доказательство Эрдёша того, что для каждого п существуют графы на п вершинах, не содержащие ни клики, ни независимого множества на 2 log2 n вершинах. Это — доказательство существования. Можем ли мы явным образом указать такие графы? Эрдёш предложил награду в $500 за явное построение бесконечного семейства графов,
9.1. ТУРНИРЫ КВАДРАТИЧНЫХ ВЫЧЕТОВ 157 в которых нет ни клики, ни независимого множества размера более чем некоторая абсолютная константа, умноженная на логарифм числа вершин. В принципе, мы, конечно, можем для любого фиксированного п перебирать все графы на п вершинах, пока не найдем подходящий, но это не эффективный способ построения желаемых графов, а, значит, и не явный. Несмотря на то, что этой проблеме было уделено значительное внимание, она до сих пор открыта. Наилучшее явное построение дано в статье [Prankl and Wilson (1981)], где явно описываются графы на п вершинах, не содержащие ни клику, ни независимое множество на более чем 2c^lognloglogn вершинах, где с —некоторая абсолютная положительная константа. Хотя проблема построения явных графов Рамсея до сих пор открыта, есть несколько других проблем, для которых явные построения известны. В этой главе мы приведем несколько примеров и кратко обсудим некоторые их алгоритмические приложения. Также мы опишем несколько, казалось бы, не связанных между собой свойств графа, которые окажутся эквивалентными. Все это — свойства случайных графов, поэтому граф, удовлетворяющий этим свойствам, принято называть квазислучайным. Эквивалентность всех этих свойств позволяет в некоторых случаях показать, что определенные явные графы обладают рядом псевдослучайных свойств, просто показав, что они обладают одним из свойств. 9.1. ТУРНИРЫ КВАДРАТИЧНЫХ ВЫЧЕТОВ Напомним, что турниром на множестве V из п игроков называется ориентация Т = (V,E) множества ребер полного графа на множестве вершин V. Если (ж,у)—ориентированное ребро, то мы говорим, что х побеждает у. Пусть дана перестановка 7г множества игроков. Ориентированное ребро (х,у) турнира совместимо с 7г, если х предшествует у в 7г. Если рассматривать 7г как турнирное ранжирование, то разумно пытаться найти турнирные ранжирования с максимально возможным числом совместимых дуг. Пусть с(7г, Т) обозначает число дуг Т, совместимых с 7г. Введем обозначение с(Т) = тах(с(7г,Т)), где максимум берется по всем перестановкам 7г на множестве вершин Т. Для каждого турнира Теп игроками если 7г = 1,2,..., п и 7г7 = п,п - 1,..., 1, то с(7г,Т) + с(7г',Т) = (£). Следовательно, с(Т) ^ |(£). На самом деле, можно показать, что для каждого такого Т выполнено неравенство с(Т) ^ ^(2) + ft(n3/2). С другой стороны, с помощью вероятностных методов легко доказать, что существуют турниры Теп игроками, для которых с(Т) ^ (1 + о(1))^(£). (Наилучшая из известных оценок, которая дает точный порядок максимально возможного значения разности с(Т) — \С£), довольно сложна. Показано (см. [de la Vega (1983)]), что существуют турниры Теп игроками, для которых с(Т) ^ ^Q) + 0(п3/2).) Можем ли мы явно указать те турниры Т на п вершинах, для которых с(Т) ^ (1 + о(1))^(£)? Эта задача упоминается в работах [Erdos and Moon (1965)] и [Spencer (1985b)]. Оказывается, можно получить несколько таких конструкций. Мы опишем одну из них.
158 Глава 9. ПСЕВДОСЛУЧАЙНОСТЬ Пусть р = 3 (mod 4) — простое число, и пусть Т = Тр — турнир, вершинами которого являются все элементы конечного поля GF(p), a (z,j) является ориентированным ребром тогда и только тогда, когда (г — j) —квадратичный вычет по модулю р. (Так как р = 3 (mod 4), — 1 — квадратичный невычет по модулю р, а, значит, любые два различных элемента соединены единственным ребром, и турнир Тр определен корректно.1)) Теорема 9.1.1. Для описанных выше турниров Тр справедливо соотношение c(Tp)^Q+0(p3/2logp). Для доказательства этой теоремы нам потребуется предварительная подготовка. Пусть х — характер квадратичного вычета, определенный на элементах конечного поля GF(p) как \(у) — з/р_1^2. Это равносильно тому, что х(у) равно 1, если у — ненулевой квадрат, 0, если у = О и — 1 иначе. Пусть D = (dij)?~=0 — матрица размера р х р с элементами dij = x(i ~ J)- Утверждение. Для любых двух различных j и I выполнено соотношение / J dijdu = -1. ieGF(p) Доказательство. Выпишем цепочку равенств: Y2diJdil = ^2^~ Ях(г ~1)=^2х(г- З)х(г ~ 0 = г г ъфз^ = £ X((i - j)/(i - I)) = £ X(l + (l- 3)/(i - О)- По мере того как г принимает все значения из поля GF(p), кроме j и /, величина (1 + (/ — j)/(i — /)) принимает все значения из GF(p), кроме 0 и 1. Так как сумма х(г) по всем г из GF(p) равна 0, отсюда следует, что правая часть последнего соотношения равна 0 — х(0) ~ х(1) = ~ 1- Это завершает доказательство утверждения. ■ Пусть А и В — подмножества поля GF(p). Обозначим через е(А,В) количество ориентированных ребер Тр, начинающихся в вершине из Л и заканчивающихся в вершине из Б. Из определения матрицы D следует, что ieAjeB Следующая лемма была доказана в статье [Alon (1986b)]. Лемма 9.1.2. Для любых двух подмножеств А и В поля GF(p) справедливо неравенство ieAjeB < {ai^WY'2. 1) Число а называется квадратичным вычетом по модулю т, если сравнение х2 = a(mod m) имеет решение. В противном случае а называется квадратичным невычетом. — Прим. ред.
9.1. ТУРНИРЫ КВАДРАТИЧНЫХ ВЫЧЕТОВ 159 Доказательство. Из неравенства Коши—Буняковского и из предыдущего утверждения следует, что 2 / / \2\ / ' ч2' ЕЕ<Ч ^1л1 vieAjeB Е Ем Ни Е Е^ V ieGF(p) \jeB = \A\i J2 МБ1+2 Е *i^ \t€GF(p) У i</GB = |A||B|p + 2|A| £ X) *i^ = j</eBieGF(P) = |A||S|p - |Л||В|(|В| - 1) = |Л||Я|(р - |B| + 1) ^ |Л||Б|р. Этим завершается доказательство леммы. ■ Доказательство теоремы 9.1.1. Пусть г —наименьшее целое число, удовлетворяющее неравенству 2Г ^ р. Пусть 7г = 7ri,..., 7гр — произвольная перестановка вершин турнира Тр. Введем обозначение 7г' = 7гр,..., 7ri. Мы должны доказать, что с(7г,Тр) ^ ^(^) + 0(p3/2logp), или эквивалентное утверждение о том, что с(7г,Тр) — с(7г',Тр) ^ 0(р3/2 logp). Пусть ai и й2 -два целых числа, удовлетворяющих условиям р = а\+а2 и а\ ^ 2r_1, й2 ^ 2r_1. Обозначим через Лх множество первых а\ вершин в перестановке 7г, а через Л2 — множество последних а2 вершин в 7г. По лемме 9.1.2 е(АиА2) -е(А2,А1) ^ (aia2p)1/2 ^ 2г~1р1/2- Далее, пусть ац, ai2, ^21, ^22 — целые числа, каждое из которых не превосходит 2Г_2, такие, что а\ = ац + а\2 и а2 = а2\ + й22- Пусть Лц —подмножество Л^ состоящее из элементов А\, занимающих первые ац позиций в 7г, и пусть А\2 — множество из а\2 оставшихся элементов А\. Разбиение Л2 на два множества Л21 и Л22 определяется аналогично. Применяя лемму 9.1.2, получаем: е(Лц, А12) - е(А12, Ап) + е(Л2ь Л22) - е(Л22, А21) ^ < (аца12р)1/2 + (а21а22рУ/2 < 2 . 2г~2р1/2- Продолжая действовать таким же образом, мы получим на г-м шаге разбиение множества вершин на 2г блоков, каждый из которых состоит не более чем из 2г~г последовательных элементов перестановки 7г. Это разбиение получено делением каждого блока разбиения, соответствующего предыдущему шагу, на две части. Применяя лемму 9.1.2 для каждой такой пары А£\,Ае2 (здесь е — вектор длины г — 1, состоящий из единиц и двоек), и суммируя, мы делаем вывод, что сумма разностей e(A£i, Ае2) — е(Ае2, А£\) по всем 2г~1 векторам е не превышает 2г_12г~У/2 = 2Г~У/2. Заметим, что сумма левых частей этих равенств по г от 1 до г в точности равна разности с(7г, Тр) — с(тг',Тр). Следовательно, суммируя, мы получаем с(тг,Тр) - с(тг,,Гр) = 2r~lpl,2r = 0{pV2\ogp). Доказательство завершено. ■
160 Глава 9. ПСЕВДОСЛУЧАЙНОСТЬ Заметим, что любая кососимметрическая матрица из элементов +1 и —1, в которой каждые две строки почти ортогональны, может быть использована для построения турнира, как это сделано выше. Некоторые родственные результаты появлялись ранее в статье [Prankl, Rodl and Wilson (1988)]. Однако, турниры Тр обладают более сильными псевдослучайными свойствами, чем другие турниры. Например, для каждого к ^ \ logp, и для каждого множества 5 из к вершин турнира Тр число вершин Тр, побеждающих все элементы 5, равно (1 + о(1))р/2к. Это было доказано Грэхемом и Спенсером [Graham and Spencer (1971)] с помощью знаменитой теоремы Вейля, известной как гипотеза Римана о кривых над конечными полями [Weil (1948)]. При достаточно больших р приведенные рассуждения дают явное построение для задачи Шютте, упомянутой в гл. 1. 9.2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И РАСШИРИТЕЛИ Граф G = (V,E) называется (n, d, с)-расширителем, если в нем п вершин, максимальная степень вершины равна с/, и для каждого множества вершин W С V такого, что \W\ ^ п/2, выполнено неравенство |JV(W)| ^ c\W\, где N(W) обозначает множество всех вершин в V \ W, смежных с какой-либо вершиной из W. Заметим, что иногда используется несколько иное определение, но разница несущественна. Расширители обладают многими свойствами разреженных случайных графов, и по ним имеется обширная литература. Семейство линейных расширителей плотности d и расширения с — это последовательность {Gi}^!, где Gi — (щ, а1, с)-расширитель, и щ —► схэ при г —► сю. Такое семейство является главным компонентом параллельной схемы сортировки (см. [Ajtai, Komlos and Szemeredi (1983)]). Оно может быть использовано для создания определенных помехоустойчивых линейных таблиц. Кроме того, оно образует основной строительный блок, используемый при создании графов с особыми свойствами связности и небольшим числом ребер. Некоторые другие примеры многочисленных приложений этих графов в различных задачах теоретической информатики можно найти, например, в работе [Alon (1986b)] и списке литературы к ней. Не слишком сложно доказать существование семейства линейных расширителей с помощью вероятностных методов. Впервые это сделал Пинскер [Pinsker (1973)]. Найти явное построение гораздо сложнее. Первым это сделал Маргулис (1973). Позже это построение было улучшено различными авторами; наиболее известными построениями являются графы Кэли определенных групп матриц. Их расширительные свойства доказываются с помощью оценки собственных значений матриц смежности графов, опираясь на тесную связь между расширительными свойствами графа и его спектральными свойствами. Впервые эта связь была независимо изучена в работах [Tanner (1984)] и [Alon and Milman (1984)]. Так как это несколько проще в случае регулярных графов, на этом случае мы и сосредоточим внимание. Пусть G = (V, Е) — d-регулярный граф, и пусть А = Ас = (o>uv)u,vev -его матрица смежности, в которой auv = 1, если uv Е Е, и auv = 0 в противном
9.2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И РАСШИРИТЕЛИ 161 случае. Так как G — d-регулярный граф, то наибольшее собственное значение матрицы А равно d. Оно соответствует собственному вектору, целиком состоящему из единиц. Пусть Л = A(G) обозначает второе по величине собственное значение матрицы А. Для двух (не обязательно непересекающихся) подмножеств В и С множества V пусть е(В,С) обозначает число упорядоченных пар (гх, г»), где u Е Б, v Е С и uv — ребро G. (Заметим, что если В и С не пересекаются, то это просто количество ребер графа G, соединяющих вершины из Б с вершинами из С.) Теорема 9.2.1. Для любого разбиения множества вершин V на два непересекающихся подмножества В и С выполнено неравенство п Доказательство. Положим |V| = n, Ь = \В\,с = \С\ = п — Ь. Пусть D = dl — скалярная матрица размера п на п со степенью вершин графа G на диагонали. Заметим, что для любого действительного вектора х длины п (рассматриваемого как функция х : V •—* Rn) uEV v\uv£E = d £>(n))2 - 2 J2 *(»)*(«) = E (*(") - <u))2- uEV uveE uveE Теперь определим вектор х, полагая x(v) = —с при v € В и x(v) = b при v E С Заметим, что у матриц А и D — А одинаковые собственные векторы, и что собственные значения матрицы D — Ав точности равны d — //, где \х пробегает все собственные значения матрицы А. Также заметим, что Ylvev x(v) = ^> т. е. вектор х ортогонален собственному вектору матрицы D — А, отвечающему наименьшему собственному значению. Так как D — А — симметричная матрица, ее собственные векторы попарно ортогональны и составляют базис n-мерного пространства. Следовательно, х — это линейная комбинация других собственных векторов матрицы D — А, а значит, из определения Л и из того факта, что d — Л — второе снизу по величине собственное значение матрицы D — А, мы делаем вывод, что ((£> - А)х, x)>{d- А)(ж, x) = {d- \){Ьс2 + сЬ2) = {d- \)Ъсп. Из второго абзаца доказательства следует, что левая часть последнего неравенства равна ^2uveE(x(u) — x(v))2 = е(В,С) • (b + с)2 = е(В,С) • п2. Следовательно, п Следствие 9.2.2. Если Л — второе по величине собственное значение d-pe- гулярного графа Gen вершинами, то G — (n, d, с)-расширитель при с = 4^р.
162 Глава 9. ПСЕВДОСЛУЧАЙНОСТЬ Доказательство. Пусть W — множество w ^ п/2 вершин графа G. По теореме 9.2.1 существует не менее ' ~ ^ ^ > ' ~2 *w ребер из If в его дополнении. Так как ни одна из вершин дополнения не смежна с более чем d из этих ребер, получаем, что |iV(W)| > ' ~2d • ' На самом деле, оценка для с в последнем следствии может быть улучшена до за^2а ' как показано в статье [Alon and Milman (1984)]. Каждая из этих оценок показывает, что если второе по величине собственное значение графа G далеко от первого, то G — хороший расширитель. Обратное утверждение также верно, хотя и более сложно доказывается. Доказательство можно найти в статье [Alon (1986a)]. Здесь мы приводим это утверждение без доказательства. Теорема 9.2.3. Если G — d-регулярный граф, являющийся (n,d, с)-расширителем, то \{G) ^ d — 4+2с2 • Два последних результата дают эффективный алгоритм для приближения расширительных свойств d-регулярного графа; мы просто вычисляем (или оцениваем) его второе по величине собственное значение. Чем больше разница между этим собственным значением и d, тем лучше следующие из этого расширительные свойства графа G. Поэтому естественно интересоваться, насколько d может быть удалено от этого второго собственного значения. Известно (см. [Nilli (1991)]), что второе по величине собственное значение любого d-pery- лярного графа с диаметром к не меньше 2y/d — 1(1 — 0(1 /к)). Следовательно, в любом бесконечном семействе d-регулярных графов верхний предел второго по величине собственного значения не меньше 2y/d — 1. Явные построения бесконечных семейств d-регулярных графов G{ со вторыми по величине собственными значениями X(Gi) ^ 2y/d — 1 независимо были представлены в работах [Lubotzky, Phillips and Sarnak (1986)] и [Маргулис (1988)] (при этом d = р + 1, где р — простое число, сравнимое с 1 по модулю 4). Построенные графы являются графами Кэли фактор-групп группы всех обратимых матриц размера 2x2 над конечным полем. Их собственные значения оцениваются с помощью результатов Эйхлера и Игуса по гипотезе Рамануджана. Доказательство Эйхлера опирается на теорему Вейля, упомянутую в предыдущем разделе. Не двудольные графы G, построенные таким образом, удовлетворяют немного более сильному условию \{G) ^ 2\/d — 1. В действительности, за исключением их наибольших собственных значений d, у них нет собственных значений, превосходящих по модулю 2\/d — 1. Как показывают следующие результаты, из этого факта следуют некоторые сильные псевдослучайные свойства. Теорема 9.2.4. Пусть G = (V,E) —d-регулярный граф с п вершинами. Предположим, что модули всех его собственных значений, кроме первого, не превосходят X. Пусть v EV, а В — подмножество V'. Обозначим через N(v) мноэюество всех соседей вершины v eG, и пусть Nb{v) = N(v)C\B обозначает мноэюество всех соседей вершины v в В. Тогда для любого подмножества
9.2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И РАСШИРИТЕЛИ 163 В С V мощности Ьп справедливо неравенство Y,(\NB(v)\-bd)2 ^X2b(l-b)n. Заметим, что в случайном d-регулярном графе у каждой вершины v, как правило, примерно bd соседей в каждом множестве размера Ьп. Приведенная выше теорема показывает, что если Л гораздо меньше d, то |Л^(г>)| не очень далеко от bd для большинства вершин v. Доказательство. Пусть А — матрица смежности графа G. Определим вектор / : V у-> R, полагая f(v) = 1 — 6 при v £ В и f(v) = —b при v 0 В. Ясно, что Svgv f(v) = 0» т- е* вектоР / ортогонален собственному вектору, отвечающему наибольшему собственному значению матрицы А. Следовательно, (Af,Af)^X2(f,f). Правая часть последнего неравенства равна А2(6п(1-6)2+(1-6)п62) = Л26(1-6)п. Левая часть равна J2 ((1 - b)\NB(v)\ - b(d - \NB(v)\))2 = £№(«)! - bd)2. Отсюда следует желаемый результат. ■ Следствие 9.2.5. Пусть G = (V,E),d,n u A — гае же, что и в теореме 9.2.4- Тогда для любых двух множеств В и С вершин графа G при \В\ = Ьп и \С\ = сп справедливо неравенство \е(В,С) -cbdn\ ^ Xy/bcn. Доказательство. По теореме 9.2.4 имеем J2([NB(v)\ - bd)2 ^ £(|WB(t,)| - bd)2 < A26(l - b)n. vec vtv Тогда согласно неравенству Коши—Буняковского |е(В, С) - cbdn\ ^ J2 \Nb(v) - bd\ ^ veC ^ V^ ( 5^(|^b(v)| - bd)2 ) ^ y/cH\y/b(l - b)n ^ Xy/bc п. Ш В частном случае В = С получаем следующий результат. Немного более сильная оценка аналогичным образом доказана в статье [Alon and Chung (1988)]. Следствие 9.2.6. Пусть G = (V,E),d,n и Л — гае же, что и в теореме 9.2.4- Обозначим через В произвольное множество из Ьп вершин графа G, и пусть е(В) = ^е(В,В) —число ребер в индуцированном подграфе G на В.
164 Глава 9. ПСЕВДОСЛУЧАЙНОСТЬ Тогда е{В) - h2dn ^ -ХЬп. Путь длины I в графе G — это последовательность vo,...,vi вершин G, где для каждого г, 1 ^ г ^ /, Vi-\Vi является ребром графа G. Ясно, что общее число путей длины / в d-регулярном графе с п вершинами в точности равно п • dl. Предположим теперь, что С — подмножество из, например, п/2 вершин графа G. Сколько этих путей не содержат ни одной вершины из С? Если граф G — несвязный, то может случиться, что половина этих путей избегает С. Тем не менее, как показано в [Ajtai, Komlos and Szemeredi (1987)], в случае, когда все собственные значения G, кроме наибольшего, малы, существует гораздо меньше таких путей. У этого результата и некоторых его обобщений есть несколько приложений в теоретической информатике, как показано в упомянутой выше работе (см. также [Cohen and Wigderson (1989))]. В завершение раздела мы приведем и докажем этот результат и одно из его приложений. Теорема 9.2.7. Пусть G = (V, Е) — d-регулярный граф с п вершинами. Предположим, что каждое из его собственных значений, кроме первого, не превосходит А. Пусть С — множество из сп вершин графа G. Тогда для любого I число путей длины I в G, избегающих С, не превосходит (l-c)n((l-c)d + cA))'. Доказательство. Пусть А — матрица смежности графа G, и пусть А! — матрица смежности его индуцированного подграфа на дополнении С Мы утверждаем, что максимальное собственное значение матрицы А' не превосходит (1 — c)d -h cA. Для того, чтобы это доказать, мы должны показать, что для любого вектора / : V ь-> Rn такого, что f(v) = 0 для каждого v E С и J2vtv f(v)2 = 1» верно неравенство (Af,f) ^ (1 - c)d -h сЛ. Пусть /ъ /2, • • • ? /n — ортонормальный базис из собственных векторов матрицы Л, где /i — собственный вектор А^, Ai = d) и каждый элемент вектора /i равен 1/у/п. Тогда / = £Г=1 с*/*> гДе ЕГ=1 сг? = 1 и vev vtv\c ( V/2 < Е /W2 ((l-c)n/n)1/2 = vT^. Wv\c / Здесь мы использовали неравенство Коши—Буняковского. Следовательно, i=2cf=c,H (Af,f) = ^2^\i^(l-c)d + cX, г=1 что дает нам желаемую оценку для максимального собственного значения матрицы А!. Пусть 7i ^ 72 ^ • • • ^ 7т— собственные значения матрицы Af, где т = (1 — с)п. По теореме Фробениуса—Перрона отсюда следует, что модули
9.2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И РАСШИРИТЕЛИ 165 каждого из них не превосходят 71 ^ (1 — c)d + сА. Общее число путей длины /, избегающих С, в точности равно (Апд,д), где # —вектор, целиком состоящий из индикаторов вершин множества V \ С. Выражая д как линейную комбинацию собственных векторов матрицы А\ т. е. д = YIIlLi hgi, где gi — собственный вектор с собственным значением 7г? мы делаем вывод, что это число в точности равно т т £ ЬЬ\ < 7i £ % = т^ < ™((i - °)d+сХУ- г=1 г=1 Подставляя m = (1 — с)п, получаем желаемый результат. ■ Случайно выбранный путь длины / в графе G — это путь длины / в G, выбранный согласно равномерному распределению среди всех путей этой длины. Заметим, что если G — d-регулярный граф, то такой путь может быть выбран с помощью случайного выбора начальной точки г>о, и случайного выбора V{ для каждого 1 ^ г ^ / среди d соседей вершины vi-\. Следствие 9.2.8. Пусть G = (V, Е), d, n, А, С и с — те же, что и в теореме 9.2.7. Предположим, что (1 -c)d + c\ ^ —=. V2 Тогда для любого I вероятность того, что случайно выбранный путь длины I в графе G, избегает множество С, не превосходит 2~1/2. Доказательство. Число путей длины / в графе G, избегающих множество С, не больше (1 - с)п((1 - c)d + с\)1 ^ ndl2~1/2 по теореме 9.2.7. Так как общее число путей равно ndl, получаем желаемый результат. ■ Приведенные выше результаты полезны для увеличения вероятностей в рандомизированных алгоритмах. Хотя такое увеличение может быть достигнуто для любого алгоритма Монте-Карло, мы для простоты рассмотрим один характерный пример — алгоритм проверки простоты, описанный в работе [Rabin (1980)]. Для нечетного q обозначим через а и b два целых числа, однозначно определяемых из соотношения q — 1 = 2afr, где Ь нечетно. Целое х, 1 ^ х ^ q— 1, называется свидетелем (непростоты д), если для последовательности xq,. .. ,ха, определенной равенствами хо = хъ (mod q) и Xi = х2_г (mod q) для 1 ^ г ^ а, либо ха ф 1, либо существует такое г, что Х{ ф —1,1 и Xi+\ = 1. Можно показать, что если q — простое, то таких свидетелей для q не существует; если же q — нечетное составное число, то по крайней мере половина чисел между 1 и q — 1 — свидетели для q. (На самом деле, не менее 3/4 из них — свидетели, как показал Рабин.) Это наводит нас на мысль о следующем случайном алгоритме проверки того, что нечетное число q является простым (для четных целых чисел есть более простой алгоритм!).
166 Глава 9. ПСЕВДОСЛУЧАЙНОСТЬ Выберем случайно целое х между 1 и q — 1 и проверим, является ли оно свидетелем. Если является, то сообщаем, что q — не простое. В противном случае сообщаем, что q — простое. Заметим, что в случае, когда q — простое, алгоритм гарантированно сообщает, что оно простое, в то время как в случае, когда q не простое, вероятность того, что алгоритм делает ошибку и сообщает, что оно простое, не превосходит 1/2. Что если нам хочется уменьшить вероятность такой ошибки? Ясно, что мы можем просто повторить алгоритм. Если мы независимо повторим его / раз, то вероятность сделать ошибку (т. е. сообщить, что составное число — простое) уменьшается до 1/2'. Тем не менее, количество случайных битов, необходимых для этой процедуры, равно / • log2(q — 1). Предположим, нам надо использовать меньше случайных битов. Применяя свойства случайно выбранного пути в подходящем графе, доказанные в двух предыдущих результатах, мы можем получить ту же оценку для вероятности ошибки, используя лишь log2(<7 — 1) + 0(1) случайных битов. Это делается следующим образом. Пусть G — d-регулярный граф с q — 1 вершинами, помеченными всеми целыми числами от 1 до q— 1. Предположим, что у G нет собственных значений, модуль которых больше Л, кроме первого, и предположим, что ^<£ <91> Теперь выберем случайно путь длины 21 в графе G и проверим для каждого числа, отмечающего его вершину, является ли оно свидетелем. Если q составное, то по крайней мере половина вершин графа G помечены его свидетелями. Значит, согласно следствию 9.2.8 и неравенству (9.1) вероятность того, что на пути нет свидетелей, не превосходит 2~~2'/2 = 2~1. Таким образом, мы получили такое же уменьшение вероятности ошибки, что и при выборе / независимых свидетелей. Оценим количество случайных битов, необходимых для выбора такого случайного пути. Известные построения расширителей, полученные в работах [Lubotzky et al. (1986)] и [Маргулис (1988)], дают явные семейства графов со степенью d и с Л ^ 2y/d — 1 для каждого d = р + 1, где р — простое число, сравнимое с 1 по модулю 4. (Заметим, что у этих графов не ровно q — 1 вершин, но это не вызывает никаких реальных трудностей, так как мы можем взять граф с п вершинами, где q — 1 ^ п ^ (1 + о(1))(д — 1), и пометить его г-ю вершину числом г (mod (q — 1)). В этом случае число вершин, помеченных свидетелями, все еще будет не меньше (^ + о(1))п.) Нетрудно проверить, что, например, d = 30 и Л = 2\/29 удовлетворяют неравенству (9.1), а, значит, можно использовать 30-регулярный граф. Число случайных битов, необходимых для выбора в нем случайного пути длины 21, меньше, чем \og2(q — 1) 4- 10/ 4- 1. Это намного меньше, чем l\og2(q — 1) битов, необходимых в процедуре с повторением.
9.3. КВАЗИСЛУЧАЙНЫЕ ГРАФЫ 167 9.3. КВАЗИСЛУЧАЙНЫЕ ГРАФЫ В этом разделе мы опишем некоторые псевдослучайные свойства графов, которые довольно неожиданно оказываются эквивалентными. Всем этим свойствам удовлетворяет почти наверное случайный граф, в котором каждое ребро выбирается независимо с вероятностью 1/2. Эквивалентность некоторых из этих свойств впервые была доказана несколькими авторами (см. [Thomason (1987)], [Prankl et al. (1988)] и [Alon and Chung (1988)]), но [Chung, Graham and Wilson (1989)] — первая работа, в которой появляются все указанные свойства (и некоторые другие). Мы следуем этой работе, хотя для упрощения изложения рассматриваем только регулярные графы. Прежде всего, нам понадобятся некоторые обозначения. Для двух графов G и Н пусть Nq(H) — число помеченных вхождений Н как индуцированного подграфа G (т. е. число инъекций / : V(H) ь-> V(G), сохраняющих смежность, образом которых является множество вершин индуцированной копии Н в G). Аналогично, Ng(H) обозначает число помеченных копий Н как (не обязательно индуцированного) подграфа G. Заметим, что Ng(H) = ^2L Nq(L), где сумма берется по всем графам на множестве вершин Я, полученным из Н добавлением (возможно, пустого) множества ребер. В этом разделе G всегда обозначает граф с п вершинами. Обозначим собственные значения его матрицы смежности (взятой с учетом кратности ребер) через Ai,...,An, где |Ai| > ... ^ |АП|. (Так как в этом разделе мы рассматриваем только собственные значения G, мы пишем просто Ai, а не Ai(G).) Также напомним следующее обозначение, использованное в предыдущем разделе: для вершины v графа G множество ее соседей в G обозначается через N(v). Если S — подмножество вершин графа G, то e(S) обозначает число ребер в индуцированном подграфе G на 5. Если В и С — два (необязательно непересекающихся) подмножества вершин графа G, то е(В,С) обозначает количество упорядоченных пар (Ь, с), где Ь Е В, с Е С и be — ребро графа G. Тогда e(S) = ±e(S,S). Теперь мы можем перечислить упомянутые псевдослучайные свойства. Все они относятся к графу G = (V, Е) с п вершинами. В этом разделе мы используем обозначения о(-) без упоминания точного поведения каждой такой величины. Таким образом, если в выражении встречаются два о(1), то они не обязаны быть идентичными. Но если мы рассмотрим семейство графов G и устремим число вершин п к бесконечности, то каждое о(1) стремится к нулю. Свойство Pi(s). Для каждого графа H(s) на s вершинах N£(H(s)) = (l + o(l))ns2-&. Свойство Р2« Для цикла С(4) с 4 вершинами ЛГ<з(С(4)) ^ (1 4- о(1))(п/2)4. Свойство Р3. |А2| = о(п). Свойство Р±. Для каждого подмножества S вершин графа G выполнено соотношение e(S) = \\S\2 + o(n2). Свойство Р§. Для любых двух множеств вершин В и С выполнено соотношение е(В,С) = \\В\\С\ + о(п2). Свойство Р6. Eu,vev I №) П N(v)\ - \\ = о(п3).
168 Глава 9. ПСЕВДОСЛУЧАЙНОСТЬ Легко проверить, что все эти свойства почти наверное выполнены для случайного графа на'п вершинах. В этом разделе мы покажем, что все свойства эквивалентны для регулярного графа с п вершинами и степенью вершин около п/2. Один из интересных особых случаев этого результата заключается в том, что простое с виду свойство Р2 оказывается достаточным для выполнения свойства P\(s) при всех s > 1. ./ Графы, удовлетворяющие любому из этих свойств (а значит, и всем), называются квазислучайными. Как было сказано выше, предположение о том, что граф G регулярный, может быть опущено (при этом немного изменится свойство Р2, и немного усложнятся доказательства). Теорема 9.3.1. Положим d = (^ + о(1))п. Если d-регулярный граф G на п вершинах удовлетворяет любому из семи свойств Pi(4), P\(s) для всех s ^ 1, Р2, Рз5 Рь Рб> Рб, то он удовлетворяет всем семи свойствам. Доказательство. Мы покажем, что Pi (4) =» Р2 =» Р3 =» Р4 =» Ръ =» =» Р6 => Pi(s) для всех 5 > 1 (=> Pi(4)). 1. Р1(4)=»Р2. Предположим, что граф G удовлетворяет свойству Pi (4). Тогда Ng(C(4)) = Y2lNq(L), где сумма берется по четырем помеченным графам, полученным из помеченного С(4) добавлением к нему (возможно, пустого) множества ребер. Так как G удовлетворяет свойству Pi (4), то Nq(L) = (1 + о(1))п42~16 для каждого из этих графов L, а, значит, Ng{C(A)) = (1+о(1))п42~4. Следовательно, граф G удовлетворяет свойству Р2. 2. Р2 =» Р3. Предположим, что граф G удовлетворяет свойству Р2, и пусть Л — его матрица смежности. След матрицы А4 в точности равен Yl7=i ^Ч- С ДРУГ0И стороны, нетрудно видеть, что этот след равен числу (помеченных) замкнутых путей длины 4 в графе G, т. е. числу последовательностей г>о, v\, г>2, г>з, г>4 = t>o вершин графа G, таких что ViVi+i —ребро для каждого 0 ^ г ^ 3. Это число равно Ng({C(4)) плюс число таких последовательностей, в которых г>2 = г>о, равное nd2, плюс число таких последовательностей, в которых г>2 ^ г>о и г>з = vi, равное nd(d — 1). Тогда £ А4 = d4 + f>4 = (1 + о(1))(п/2)4 + £ А? = NG(C(A)) + 0(п3) = г=1 г=2 г=2 = (1 + о(1))(п/2)4. Следовательно, ]СГ=2 ^ч = °(n4)> а> значит, |А2| = о(п), что и требовалось. 3. Р3 =» Р4. Это напрямую вытекает из следствия 9.2.6. 4. Р4=>Р5. Предположим, что граф G удовлетворяет свойству Р*. Прежде всего, мы утверждаем, что для него выполнено свойство Р$ для непересекающихся множеств вершин В и С. Действительно, если множества В и С не пересекаются,
9.3. КВАЗИСЛУЧАЙНЫЕ ГРАФЫ 169 п то е(В, С) = е{В U С) - е{В) - е{С) = = \(\В\ + \С\)2 - \\В\2 - \\С\2 + о(п2) = 1|В||С| + о(п2). Утверждение доказано. В случае, когда множества В и С пересекаются, получаем е(В, С) = е(В\С,С\В) + е{В П С, С \ Б) + е(В П С, Б \ С) + 2е(£ П С). Положим |В| = Ь, |С| = с,\В П С\ = х. По предыдущему выражению для е(В,С) и из того факта, что граф G удовлетворяет свойствам Р± и Р5 Для непересекающихся множеств В и С, получаем 1 112 е(В, С) = -(Ь - х){с -х) + -х{с -х) + -х(Ь - х) + -х2 + о(п2) = = ±Ъс + о(п2) = ±\В\\С\+о(п2). Следовательно, для графа G выполнено свойство Р$. 5. Р5 =» Р6. Предположим, что граф G удовлетворяет свойству Р5 и напомним, что G — d-регулярный, где d = (| + о(1))п. Пусть г; — фиксированная вершина G. Оценим сумму ^ |АГ(и)ПАГ(г;) Положим г ^ ^ В1 = [ueV,u^v: \N(u)nN(v)\^-j, B2 = [ueV,u^v: \N(u)nN(v)\ < ^}. Пусть С —множество всех соседей вершины v в G. Заметим, что £ | №)пвд| - Л = Е №)nNW " lBlli = е(дьС) - |Bi|^. Так как граф G удовлетворяет свойству Р$, а значит, d = (^+o(l))n, последняя разность равна ||i?i|d + o(n2) - |#i|§ — o(n2). Рассуждая аналогично, получим, что £ |№)ПЛГ(г,)|- J|=o(n2). Следовательно, для каждой вершины v графа G J2 \\N(u)nN(v)\-^\=o(n2), и£У,ифу и, суммируя по всем вершинам г>, мы делаем вывод, что граф G удовлетворяет свойству Pq. 6. Pq => Pi (s)для всех5 > 1.
170 Глава 9. ПСЕВДОСЛУЧАЙНОСТЬ Предположим, что граф G = {V,E) удовлетворяет свойству Pq. Для любых двух различных вершин и и v графа G пусть a(u,v) равно 1, если uv Е Е, и 0 в противном случае. Положим s(u,v) = \{w e V : a(u,w) = a(v,w)}\. Так как G является d = (\ + о(1))п-ре- гулярным, то s{u,v) = 2\N(u) П N(v)\ + n - 2d = 2\N(u) П N(v)\ + о(п). Следовательно, из того, что G удовлетворяет свойству Рб? следует, что £ \s(u,v)-^\=o(n3). (9.2) u,v£V Пусть Н = Н(s) — произвольный фиксированный граф на s вершинах; положим Ns = Nq(H(s)). Мы должны показать, что We = (l + o(l))ne2-G). Обозначим множество вершин графа H(s) через {vi,...,vs}. Для каждого 1 < г. < s положим Vr = {vi,...,vr}, и пусть Н(г) — индуцированный подграф графа Н на множестве вершин Vr. Мы докажем индукцией по г, что для Nr = А^(#(г)) справедливо равенство ЛГг = (1 + о(1))п(г)2-(5), (9.3) где П(г) = п(п — 1) • • • (п — г + 1). Это очевидно для г = 1. Предположим, что равенство справедливо при всех г, 1 ^ г < 5, и докажем его для г + 1. Для вектора а = (ai,... ,ar) из различных вершин графа G и для вектора е = (si,... ,£г) из нулей и единиц положим fr(a,e) = \{v eV : v ^ а\,.. .аг и a(v,aj) = Sj для всех 1 ^ j ^ г}\. Ясно, что 7Vr+i — это сумма величин fr(a,e) в количестве 7Vr, где Sj = a(vr+i, wy), и а пробегает все 7Vr индуцированных копий Н(г) в G. Заметим, что всего существует в точности П(Г)2Г величин fr(a,e). Удобно рассматривать fr(a,e) как случайную величину, определенную на том же пространстве из П(Г)2Г точек, у каждой из которых равная вероятность. Чтобы завершить доказательство, вычислим математическое ожидание и дисперсию этой случайной величины. Покажем, что дисперсия настолько мала, что большинство величин fr(a,e) очень близки к математическому ожиданию, и получим, таким образом, достаточно точную оценку для величины 7Vr+i, равной сумме Nr таких величин. Начнем с простого вычисления математического ожидания Е[/г] величины fr(a,e). Имеем: П(Г)2' J2(n~r) =
9.3. КВАЗИСЛУЧАЙНЫЕ ГРАФЫ 171 Здесь мы использовали то, что вершина v ф ai,..., аг однозначно определяет £. Далее, оценим величину 5Г, определенную равенством Sr = ^2fr(a,e)(fr(a,e) - 1). OL,E Мы утверждаем, что ^^ Sr = 2j5(u,t;)(r). (9.4) ифу Для доказательства этого утверждения заметим, что Sr можно рассматривать как количество упорядоченных троек (a,£,(u,v)), где а = (ai,...,ar) — упорядоченное множество из г различных вершин графа G, е = (£i,..., ег) — двоичный вектор длины г, и u,v — упорядоченная пара дополнительных вершин G, таких, что а(щ ak) = a(v, ось) = Sk для всех 1 ^ к ^ г. Для любых фиксированных а и е существует ровно fr(a,e)(fr(a,e) — 1) способов выбрать пару (и, г>), а значит, Sr равно количеству таких троек. Теперь вычислим это значение, сначала выбрав и и v. Когда и, v выбраны, все дополнительные вершины а\,..., аг должны принадлежать множеству {w eV : a(u,w) = a(v, w)}. Так как мощность этого множества равна s(u,v), отсюда следует, что существует s(u, v)(r) способов выбрать а\,... аг. Когда они выбраны, вектор е определяется однозначно, и отсюда следует формула (9.4). Далее мы утверждаем, что из соотношения (9.2) вытекает равенство Y, s(u, v){r) = (1 + o(l))nr+22-\ (9.5) ифу Для доказательства этого утверждения введем величины euv = s(u,v) — ^. Заметим, что по формуле (9.2) выполнено равенство ^1ифу \£uv\ = о(п3), и что kuv| ^ ^/2 ^ п для любых u, v. Значит, для каждого фиксированного а > 1 £>„„г ^a_1 Х>™1 = «(na+2)- ифу ифу Тогда 5>(и,и)(г)=5^(^+£ш,) = ифу ифу = ^2 Л Ск \о) е™к = ^ДЛЯ П°ДХ0ДЯПШХ констант ск) к=0 ифу =©r^)+e5:cfc©fc^<©rn(2)+es|cfc|nfc|e-|r"^ к=0ифу к=0ифу г-1 ^ nr+22~r + с2_"пк 2-1 \£иу\Г~к ^ (для подходящей константы с) к=0 ифу г-1 ^ nr+22~r + cJ2nk- o{nr~k+2) = nr+22"r(l + о(1)). к=0 Отсюда следует соотношение (9.5).
172 Глава 9. ПСЕВДОСЛУЧАЙНОСТЬ По формулам (9.4) и (9.5) Sr = (l + o(l)K+22-r. Следовательно, £(/,.(<*,*) - E[/r])2 = J2fr(^e) - J>[/r]2 = £(/*(<*, е) ~ Л (а, е)) + £ /г (а, е) - n(r)2r(n - г)22" -2г = Sr + n(r)2rE[/r] - n(r)2r(n - r)22~2r = = 5r + n(r+1) - n(r)2r(n - r)22~2r = o(nr+2). Напомним, что Nr+i —сумма величин вида fr(a,e) в количестве Nr. Тогда I I2 |iVr+1-JVrE[/r]|2= Yl (Ma,e)-E[fr])\ . I Nr членов I По неравенству Коши—Буняковского последнее выражение не больше Nr J2 (fr(a,e)-nfr])2<NrJ2(fr(a,e)-nfr})2 = члены Nr ос,е = Nr • o(nr+2) = o(n2r+2). Следовательно |7Vr+1-ATrE[/r]|=o(nr+1), а значит, по предположению индукции Nr+1=NrE[fr] + o(nr+1) = = (1 + o(l))n(r)2"G) • (n - r)2~r + o(nr+1) = = (l + o(l))n(r+1)2-(r21). Это завершает доказательство шага индукции, а значит, и теоремы 9.3.1. ■ Есть много примеров семейств квазислучайных графов. Возможно, наиболее широко используется семейство Gp графов Пэли, определенное следующим образом. Для простого числа р, сравнимого с 1 по модулю 4, обозначим через Gp граф, вершины которого суть целые числа 0,1,2,... ,р — 1, и в котором г и j соединены ребром тогда и только тогда, когда (г — j) — квадратичный вычет по модулю р. Графы Gp, которые являются неориентированными аналогами турниров квадратичных вычетов, рассмотренных в разд. 9.1, (р— 1)/2-регуляр- ны. Для любых двух различных вершин г и j графа Gp количество вершин /с, которые либо смежны и с г, и j, либо не смежны с ними, в точности равно числу раз, когда частное |5т является квадратичным вычетом по модулю р. По мере того как к принимает все значения от 0 до р— 1, кроме г и j, это частное принимает все значения, кроме 1 и 0, а значит, оно является квадратичным вычетом ровно \{р — 1) — 1 раз. Таким образом, мы показали, что для любых
9.4. УПРАЖНЕНИЯ 173 двух вершин г и j графа Gp выполнено равенство s(i, j) = (р — 3)/2, а отсюда и из того факта, что Gp — (p— 1)/2-регулярный, легко следует, что для него справедливо свойство Pq. Следовательно, он квазислучайный. Как и в случае с турнирами квадратичных вычетов, в действительности для Gp выполнены более сильные псевдослучайные свойства, которые справедливы не для любого квазислучайного графа, и которые могут быть доказаны с помощью теоремы Вейля. 9.4. УПРАЖНЕНИЯ 1. Пусть случайный двудольный 3-регулярный граф на 2п вершинах получен выбором трех случайных перестановок между двумя хроматическими классами. Доказать, что существует такое с > О, что для любого п существует (2п, 3, с)-расширитель. 2. Пусть G = (V,E) — (n, d, А)-граф. Предположим, что п делится на к. Пусть С : V у-> {1,2,...,/с} —такая раскраска множества V в к цветов, что каждый цвет появляется ровно п/к раз. Доказать, что в графе G существует такая вершина, что у нее есть соседи всех к цветов, если кХ ^ d. 3. Пусть G = (V,E) — граф, в котором есть как минимум одно ребро между любыми двумя непересекающимися множествами размера а +1. Доказать, что для каждого множества Y из 5а вершин существует такое множество X не более чем из а вершин, что для любого множества Z, удовлетворяющего условиям Z Г\ (X U Y) = 0 и \Z\ < а, выполнено неравенство \N(Z)C\Y\ >2|Z|. 4. Доказать, что для любого е > 0 существует такое по = по(е), что для любого (п,п/2,2>/п)-графа G = (У, Е) с п > по число М треугольников в графе G удовлетворяет неравенству \М — п3/48| ^ еп3.
ВЕРОЯТНОСТНЫЙ ВЗГЛЯД: Случайные блуждания Вершинно-транзитивным графом называется такой граф G = (V,E), что для любых двух вершин и и v из множества V существует автоморфизм графа G, отображающий и в v. Случайное блуждание длины / в графе G, начинающееся в вершине г>, — это случайная последовательность v = г>о, vi, •. •, vi, где каждая вершина V{+\ выбирается случайно и независимо среди соседей вершины Vi (О ^ г < I). Следующая теорема утверждает, что для каждого вершинно-транзитивно- го графа G вероятность того, что случайное блуждание четной длины в G заканчивается в его начальной точке, не меньше вероятности того, что оно заканчивается в любой другой вершине. Заметим, что доказательство почти не требует вычислений. Заметим также, что это, вообще говоря, не верно для регулярных графов, и требование вершинной транзитивности необходимо. Теорема. Пусть G = (V,E) — вершинно-транзитивный граф. Для целого к и двух (не обязательно различных) вершин и и v из G обозначим через Pk(u,v) вероятность того, что случайное блуэюдание длины к, начинающееся в и, заканчивается в v. Тогда для каждого целого к и любых двух вершин u, v G V справедливо неравенство Р2к{щи)^Р2к(щу). Доказательство. Нам потребуется следующее простое неравенство, иногда приписываемое Чебышёву. Утверждение. Для любой последовательности (а\,..., ап), состоящей из п действительных чисел, и для любой перестановки 7г на множестве {1,..., п} выполнено неравенство Г п п г=1 г=1 Доказательство. Неравенство напрямую следует из того, что 71 71 -| 71 г=1 г=1 г=1 Теперь рассмотрим случайное блуждание длины 2/с, начинающееся в и. Суммируя по всем возможным вершинам, которые блуждание достигает после к шагов, мы делаем вывод, что для любой вершины v выполнены соотношения Р2к(щу) = Y^ Pk{u,w)Pk(™,v) = J2 Pk{u,w)Pk(v,w), (1)
Вероятностный взгляд: Случайные блуждания 175 где последнее равенство следует из того факта, что G — неориентированный регулярный граф. Так как граф G — вершинно-транзитивный, два вектора (Pk(u,w))wev и (Pk(v,w))w£v могут быть получены один из другого перестановкой координат. Следовательно, по предыдущему утверждению, максимально возможное значение суммы в правой части соотношения (1) достигается при и = г>, чем завершается доказательство теоремы. ■
Часть п Приложения
10_ Случайные графы Шесть часов утра. Дом спит. Играет прекрасная музыка. Я доказываю и делаю предположения. из письма Пола Эрдёша Вере Шош Пусть п является натуральным числом, 0 ^ р ^ 1. Рассмотрим множество графов с множеством вершин {1,..., п}. Вероятностное пространство G(n,p), определенное в соответствии с распределением Pv[{i,j}€G)=p, где все события попарно независимы, называется случайным графом. Данная модель часто применяется в вероятностном методе для доказательства существования некоторых графов. В этой главе мы изучаем свойства графов как самостоятельные объекты. Случайные графы представляют собой область активных исследований, которая находится на стыке теории вероятностей и теории графов. Предмет изучения возник в 1960 г. в основополагающей статье Эволюция случайных графов Пола Эрдёша и Альфреда Реньи. Книга Боллобаша Случайные графы [Bollobas (1985)] является стандартным пособием по этой тематике. Новая книга [Janson, Luczak and Rucinski (2000)] Сванте Янсона, Томаша Лучака и Анжея Ручиньски, тоже названная Случайные графы, также великолепна. В этой главе мы изучаем только некоторые из большого числа тем в этой привлекательной области. Существует интересная динамическая модель для случайных графов. Для всех пар i,j пусть Xij выбираются независимо и равномерно из отрезка [0,1]. Представьте, что р возрастает от 0 до 1. В начале, все потенциальные ребра «выключены». Ребро от г до j (мы можем представлять это ребро в виде света в неоновой трубке) «включается», когда р достигает величины Xij, и остается включенным. При р = 1 все ребра «включены». В момент времени р граф со всеми «включенными» ребрами имеет распределение G(n,p). С ростом р граф G(n,p) расширяется от пустого до полного. В своей оригинальной работе Эрдёш и Реньи рассматривают G(n,e), случайный граф с п вершинами и ровно е ребрами. И снова есть соответствующая
10.1. ПОДГРАФЫ 179 динамическая модель. Начните с пустого графа и продолжайте добавлять ребра случайным образом, пока граф не станет полным. Как правило, при р ~ т§у графы G(n,e) и G(n,p) имеют очень схожие свойства. Мы будем рассматривать только вероятностную модель. 10.1. ПОДГРАФЫ Термин «случайный граф», строго говоря, некорректен: G(n,p) является вероятностным пространством над графами. Пусть задано некоторое теоретико- графовое свойство А. Обозначим через Pr[G(n,p) |= А] вероятность того, что G(n,p) обладает свойством А. Если А является монотонным, то и вероятность Pr[G(n,p) |= А] является монотонной функцией от р. Поучителен следующий пример. Обозначим А через событие «G свободен от треугольников». Пусть X — число треугольников в G(n, p). Из линейности математического ожидания получаем, что ■и. (;у. Из этого следует, что удобно ввести обозначение р = с/п. Тогда lira E[X] = lira (Лр3 = с3/6. п—>оо п—>оо \3/ Получается, что распределение величины X асимптотически является пуассо- новским. В частности, lim Pr[G(n,p) h A] = lim PrfX = 0] = е"с3/6. n—>oo n—>oo Заметим, что 3 3 Нте"с /6 = 1, lim e~c /6 = 0. с—>0 с—>oo Когда p = 10~6/n, очень маловероятно, что граф G(n,p) содержит треугольники. А когда р = 106/n, G(n,p) содержит треугольники с большой вероятностью. С динамической точки зрения, треугольники начинают появляться, когда р = 0(1/п). Если мы возьмем функцию р(п) = п~09 (при этом р(п) ^> п-1), то граф G(n,p) почти наверное будет содержать треугольники. Иногда мы будем позволять себе не совсем корректные обозначения. Например, говоря, что G(n,n~09) содержит треугольник, будем иметь в виду, что вероятность того, что этот граф содержит треугольник, стремится к 1 при п —> оо. Аналогично, когда р(п) Сп"1, например, р(п) = l/(nlnn), и G(n,p) почти наверное не содержит треугольника, мы будем позволять себе вольность речи и говорить, что G(n, l/(nlnn)) является свободным от треугольников. Основным наблюдением Эрдёша и Реньи было то, что многие естественные теоретико-графовые свойства становятся верными в очень узком промежутке значений р. Они ввели следующее ключевое определение.
180 Глава 10. СЛУЧАЙНЫЕ ГРАФЫ Определение 4. Назовем г(п) пороговой функцией теоретико-графового свойства А, если выполнены следующие два свойства: 1) если р(п) <С г(п), то limn^oo Pr[G(n,p) |= А] = 0. 2) если р(п) > r(ri), то limn_>oo Pr[G(n,p) |= А] = 1. (Вероятности 0 и 1 можно поменять местами.) В нашем примере функция 1/п является пороговой функцией для А. Заметим, что пороговая функция, когда она существует, не единственна. Мы могли бы сказать, что и 10/п является пороговой функцией для А. Рассмотрим еще раз задачу о свойстве графа G(n,c/n) быть свободным от треугольников. Для любого множества 5, состоящего из трех вершин, обозначим через В$ событие «S является треугольником». Тогда Рг[Д$] = р3. Откуда следует, что «отсутствие треугольников» является в точности пересечением Д Bs по всем S. Если бы события Bs были взаимно независимы, то выполнялись бы равенства Рг [/\Щ = П \?s] = (1 - Р3Р ~ е-(ЗК - е-3/б. Но на самом деле события Bs не являются взаимно независимыми. В то же время, если \S П Г| ^ 1, то Bs и Вт взаимно независимы. Применим неравенство Янсона (теорема 8.1.1). В обозначениях разд. 8.1 имеем I = {S С V(G) : \S\ = 3} и S ~ Т тогда и только тогда, когда |5ПТ| = 2. Здесь е = р3 = о(1), /х = (£)р3 ~ с3/6 и М = е"^1^1» = е~с^6^1\ Существует б(^) = 0(п4) пар S,T троек с условием, что S ~ Т. Для каждой из них справедливо равенство Pt[Bs Л Вт] = Р5- Таким образом, Л = 0{п4)р5 = п"1+о(1) = о(1). Когда Л = о(1), неравенство Янсона дает следующую асимптотическую оценку: lim Рг[лВ5] = lim M = е~с /6. п—>оо п—>оо Можно ли повторить этот успех, если взять в качестве А свойство «несодержания графом G (не обязательно индуцированной) копии некоторого графа Я»? Мы используем определения сбалансированного и строго сбалансированного графов из разд. 4.4. Теорема 10.1.1. Пусть Н является строго сбалансированным графом с v вершинами, е ребрами и а автоморфизмами. Обозначим через А свойство «G не содержит копию Н». Пусть с > О — произвольно выбранное число. Тогда при р = cn~vle справедливо соотношение lim Pr[G(n,p) (= А] = ехр[-се/а]. п—>оо Доказательство. Пусть Аа,1 ^ а ^ (™)г>!/а, пробегает множества ребер возможных копий Я, и пусть Ва является событием «G(n,p) D Аа». Воспользуемся неравенством Янсона. Поскольку lim \х = lim ( )v\pe/a = се/а, п—>оо п—>оо \V J
10.2. РАЗМЕР МАКСИМАЛЬНОЙ КЛИКИ 181 то lim М = ехр[-се/а]. п—>оо Теперь рассмотрим (как и в теореме 4.4.2) величину Мы разобьем сумму по числу вершин в пересечении копий а и /?. Предположим, что они пересекаются в j вершинах. Если ,7 = 0 или j = 1, то АаГ\Ар = 0. Таким образом, соотношение а ~ /? не верно. При 2 ^ j ^ v обозначим через fj максимальную мощность \Аа П Ар\, где а ~ /? и а и /? пересекаются в j вершинах. Поскольку а ^ /?, то справедливо неравенство fv < е. Когда 2 ^ j < г> — 1, ключевым наблюдением является то, что Аа П Ар является подграфом графа Н и, поскольку Н строго сбалансирован, то к <£. Существует С^п21*""-7') способов выбора а и /?, пересекающихся в j точках, так как а и /? определены (с точностью до порядка) 2г> — j точками. Для каждой такой пары а, (3 Pr[£Q Л Вр] = р1Л"иЛ*1 = р2е-\АаПА0\ ^ р2е-/, Таким образом, Д = ^ 0(п2^')0(п-^2е-^)). 3=2 Но , 2t;-j-^(2e-/i) = ^-j<0> поэтому каждое слагаемое есть о(1) и, следовательно, Л = о(1). Используя неравенство Янсона, получаем lim Рг[л£?а] = lim М = ехр[-се/а], п—>оо п—>оо что завершает доказательство. ■ 10.2. РАЗМЕР МАКСИМАЛЬНОЙ КЛИКИ В этом разделе мы фиксируем р = 1/2 (при других значения получаются аналогичные результаты) и рассматриваем размер максимальной клики Lj(G(n,p)). Зафиксируем некоторое с > 0, и пусть п, к —> оо, так чтобы Э 2-© с. Первым приближением является к гг-к п ~ =V2 vr
182 Глава 10. СЛУЧАЙНЫЕ ГРАФЫ к 2\пп In 2 ' Здесь \х —> с, поэтому М —> е~с. Величина Л была оценена в разд. 4.5. При таком выборе к выполнено равенство Л = о(Е[Х]2), и поэтому Л = о(1). Отсюда вытекает, что lim Pr[u;(G(n,p)) < к] = ехр[-с]. n,fc—>оо Пусть по (к) обозначает минимальное значение п, при котором (;> ГЙ) >1. При более точном анализе можно заметить, что при таком значении п левая часть равна 1 + о(1). Учтем, что (£) растет относительно п, как nfc. При любом Л Е (—оо, +оо), если А + о(1) то п = по (А;) )2-G) = 1 + к 1 + Л + о(1) = ел + о(1). С JTCTO 7ТЯ Pr[w(G(n,p)) < /с] = е"еЛ + о(1). Когда Л возрастает от — оо к +оо, величина е~е убывает от 1 до 0. При по (к + 1) ~ \/2по(к) промежутки не будут пересекаться при различных к. Пусть К произвольно велико. Положим К] h = п0(к) '-т ,п0(/с) 1 + к Тогда Ik-i ИД = 0 при к ^ ко(К). Предположим, что п > по(&о(^0)- Если п лежит между интервалами (это верно для «большинства» п), что мы будем обозначать как 1ь < п < /fc+i, то вероятность Pr[u{G(n,p)) < к] *: е~еК + о(1) почти равна нулю, а вероятность Pr[w(G(n,p)) < k + 1] ^ е"е~* + о(1) почти равна единице. Отсюда следует, что вероятность Pr[w(G(n,p)) = к}> е~е~К - е~еК + о(1) почти равна единице. Когда n G Д, то все еще выполняется Ik-\ < п < Ik+i- Таким образом, вероятность Pr[w(G(n,p)) = к или к - 1] ^ е"е~* - е"е* + о(1) почти равна единице. Поскольку /С можно выбрать произвольно большим, из этого следует знаменитая теорема о двухточечной концентрации размера максимальной клики (см. следствие 4.5.2 в разд. 4.5). Заметим, однако, что для большинства п концентрация u(G(n, 1/2)) приходится на самом деле на одно значение
10.3. ХРОМАТИЧЕСКОЕ ЧИСЛО 183 10.3. ХРОМАТИЧЕСКОЕ ЧИСЛО В этом разделе снова зафиксируем р = 1/2 (имеются аналогичные результаты для других значений р), и пусть G является случайным графом G(n, 1/2). Мы оценим хроматическое число x{G). Другой подход к получению основного результата этого раздела представлен в гл. 7, разд. 7.3. Введем функцию /«-(;>-<! Пусть при &о = ко(п) выполнено двойное неравенство f(k0 - 1) > 1 > f(ko). Тогда п = у/2 . Поэтому при к ~ ко имеем Пусть f(k + !)//(*) = ^2-fc(l + o(l)) = n-1^1). к = к(п) = ко{п) — 4 таково, что /(fc)>n3+°^. Для оценки вероятности Pr[u(G) < к] воспользуемся обобщенным неравенством Янсона (теорема 8.1.2). Здесь \х = f(k). (Заметим, что неравенство Янсона дает нижнюю оценку 2~-^fc)=2~n ° для этой вероятности, но это неверно, поскольку с вероятностью 2~W случайный граф G является пустым!) Значение Л было оценено в разд. 4.5, где Доминирующими слагаемыми являются д(2) ~ к4/п2 и д(к — 1) ~ 2кп2~к/'\х. В данном случае \х > п3+°^ и 2~к = п~2+0^\ поэтому д(2) является доминирующим, и 9 Отсюда вытекает оценка размера максимальной клики Pt[lj(G) <к}< е"^2/2Л = e-©(-2/(inn)4) при к = в (Inn). Вероятность того, что G пусто, дает нижнюю оценку. По- _п2+о(1) этому можно сказать, что вероятность равна е , хотя о(1) в показателе оставляет простор для размышлений. Теорема 10.3.1 [Bollobas (1988)]. Почти всегда X(G) —. Х{ ] 21og2n
184 Глава 10. СЛУЧАЙНЫЕ ГРАФЫ Доказательство. Пусть a(G) = u)(G) обозначает, как обычно, число независимости графа G1). Дополнение G имеет то же распределение G(n, 1/2). Следовательно, почти всегда a(G) ^ (2 + о(1)) log2 п. Поэтому почти всегда Обратное неравенство было открытой проблемой целую четверть века! Введем обозначение т = [п/\п п\. Для любого множества S с т вершинами ограничение G\s имеет распределение G(ra, 1/2). Пусть, как и выше, к = /с (га) = ко(т) — 4. Заметим, что к ~ 2 log2 га ~ 2 log2 п. Тогда ,,яМч Pr[a(G|s)<A;]<e-m2+o(1). Существует (^) < 2n = 2m таких множеств 5. Следовательно, Рг a(G|s) < к для некоторого m-множества Ь < 2 е = о(1). То есть почти всегда каждые m вершин содержат /с-элементное независимое множество. Теперь предполож:им, что граф G обладает этим свойством. Мы берем /с-элементные независимые множества и раскрашиваем их различными цветами пока не останется меньше т вершин. Тогда мы раскрашиваем оставшиеся вершины в различные цвета. Действуя таким образом, получаем X(G)< п — т к п + т^-+га = к П (1 + 0(1)) + Л-^_)=_2_(1+о(1)), 2 log2 n \ log2 n) 2 log2 n что выполнено для почти всех G. ■ 10.4. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ Пол Эрдёш и Альфред Реньи в своей основополагающей работе [Erdos and Renyi (I960)] обнаружили, что случайный граф G(n,p) подвергается удивительному изменению при р = 1/п. Рассмотрим сначала случай р = с/п при с < 1. Тогда G(n,p) будет состоять из маленьких компонент, самая большая из которых будет иметь размер О (Inn). Теперь предположим, что р = с/п, где с > 1. В этом небольшом промежутке «времени» многие компоненты объединятся, образовав таким образом «гигантскую компоненту» размера в(п). Остальные вершины все еще будут содержаться в небольших компонентах, самая большая из которых имеет размер в (Inn). Этот феномен называют большим прыжком. Мы предпочитаем описательный термин фазовый переход х) Число независимости графа G — это максимальное число элементов в независимом множестве графа G. — Прим. ред.
10.4. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ 185 из-за его связи с перколяцией в математической физике (например, превращением воды в лед). Чтобы лучше понять фазовый переход, мы проделаем некоторый экскурс в теорию ветвящихся процессов. Рассмотрим однополую модель размножения. Вначале имеется некоторое существо, которое дает определенное число потомков, задаваемое некоторой случайной величиной Z. (В качестве Z будет взята пуассоновская случайная величина со средним с.) Затем эти потомки производят внуков, число которых вновь определяется случайной величиной Z. Эти внуки тоже становятся родителями, и так далее. Поскольку событие Z = 0 имеет ненулевую вероятность, то возможно, что весь род исчезнет полностью. Мы хотим изучить общее число организмов в этом процессе, обращая особое внимание на вопрос конечности данного процесса. (Первоначальным применением этой модели было, как это ни удивительно, изучение родословной мужской линии британского сословия пэров.) Введем точные определения. Пусть случайные величины Z\, Z2,... независимы, и распределение каждой из них совпадает с распределением случайной величины Z. Определим Yo, У\, • • • рекурсивно: Yi = Yi-i + Zi — 1, и пусть Т является наименьшим £, для которого Yt = 0. Если такого t не существует (род продолжается бесконечно), будем говорить, что Г = +оо. Величины Yi и Zi отражают ветвящийся процесс следующим образом. Мы рассматриваем все организмы, как живые, так и мертвые (в том числе еще не живые). Изначально существует только один живой организм, а все остальные мертвы. В каждый момент времени мы выбираем какой-то из живых организмов, он имеет Zi детей, а потом умирает. Тогда число YJ живых организмов в момент времени г задается рекурсией. Процесс обрывается, когда Yt = 0 (вырождение), но удобно определить рекурсию при всех t. Заметим, что данное определение не влияет на Т, поскольку как только Yt = 0, Т становиться определенным. Значение случайной величины Т (либо конечное, либо бесконечное) обозначает общее число организмов, включая предков, в этом процессе. (Во многих учебниках по теории вероятностей рассматривается естественный подход, заключающийся в предположении, что у всех живых организмов некоторого поколения дети рождаются одновременно, и изучается число детей каждого поколения. Мы можем считать, что организмы дают потомство поколениями, хоть это и не повлияет на нашу модель.) Основным результатом ветвящихся процессов является следующий. Когда E[Z] = с < 1, с вероятностью 1 род вырождается (Т < оо), но когда E[Z] = с > 1, существует ненулевая вероятность того, что процесс будет продолжаться бесконечно (Т = оо). Интуитивно понятно, что это верно. Значения Yi образуют цепь Маркова. Когда с < 1, вследствие сдвига «влево» произойдет событие Yi = 0. Тогда как при с > 1, вследствие сдвига «вправо» Yi —> +00, и с положительной вероятностью численность популяции никогда не достигнет нуля. Если процесс не закончится на ранней стадии, то популяция,
186 Глава 10. СЛУЧАЙНЫЕ ГРАФЫ скорее всего, будет расти и расти. Приведем доказательство, основанное на результатах теоремы А. 1.15 относительно больших уклонений. Заметим, что сумма Z\ + . ,. + Zt имеет пуассоновское распределение со средним ct. Сначала предположим, что с < 1. Для любого t Рг[Т >t]^ Pv[Yt >0}= Pr[Zi + ... + Zt > t] ^ (1 - 6)*, где 5 > 0. Вероятность Рг[Т = oo] = 0, поскольку Нт^-юо Рг[Т > t] = 0. Теперь предположим, что с > 1. Снова используя теорему АЛ. 15, получаем Рг[У4 < 0] = Pr[Zi + ... + Zt^ t] ^ (1 - SY с другим 6 > 0. Поскольку ряд X!tli(l ~~ ^)* сходится, существует такое to, что оо £Рг[У4^0]<1. t=t0 Тогда ^ 2pr[yt+t0-1^0]<l, поскольку при t < to справедливы неравенства Yt + to — 1 > 1 — t + to — 1>0. Теперь мы наложим условие, что первый организм имел ровно to детей. Условное распределение случайной величины Yt = to + (Z2 - 1) + ... + {Zt - 1) совпадает с безусловным распределением величины *t-i + {to ~ 1) = *о + (Zi - 1) + ... + (Zt_i - 1), и поэтому ^ £Pr[yt^0|Zi=to]<l. t=0 С положительной вероятностью выполнено равенство Z\ = to, и поэтому для всех £ имеем Yt > 0. Отсюда вытекает, что Рг[Т = оо] > 0. Метод производящих функций дает более точный результат. Пусть pi = Pv[Zj=i}. Определим производящую функцию оо г=0 В нашем случае _ Pi = е ссг/г!, так что оо р{х) = 5^e-ccV/<! = ес(х-1}. г=0
10.4. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ 187 Пусть Qi = Pr[T = г] И оо г=0 (в сумму не входит случай г = оо). При условии, что первый организм имеет s детей, производящая функция общего числа потомков равна x(q(x))s. Поэтому оо Q(x) = ^PsXQixY = xp[q{x)\. s=0 Значит, производящая функция у = q(x)/x удовлетворяет функциональному уравнению у = р(ху), т.е. У = с Вероятность вырождения оо у = Рг[Т < оо] = £ft = g(l) = g(l)/l г=0 должна удовлетворять уравнению y = ec(y-l)t ( + *) При с < 1 это уравнение имеет единственное решение у = 1, соответствующее обязательному вырождению. (На самом деле, для с = 1 единственным решением также является у = 1, что доказывает вырождение и в граничном случае.) При с > 1 существует два решения: у = 1 и некоторое t/ € (0,1). При с > 1 через /(с) обозначим у, удовлетворяющее уравнению (**), 0 < у < 1. Когда Рг[Т < оо] < 1, имеем Рг[Т < оо] = /(с). Когда ветвящийся процесс является конечным, мы называем Н = (Zi,..., Zt) историей этого процесса. Последовательность (z\,..., zt) является возможной историей тогда и только тогда, когда для последовательности у{, заданной равенствами у о = l,yi = у%-\ + z% — 1, выполнены неравенства у г > 0 при 0^г<£иу*=0. Когда Z является пуассоновской случайной величиной со средним Л, поскольку z\ + ... + Zt = t — 1. Назовем числа d и с, d < 1 < с, сопряженными, если de"d = се"с. Функция /(ж) = #е~х возрастает от 0 до е-1 в промежутке [0,1) и убывает обратно к нулю на интервале (1, оо), поэтому каждое с ф 1 имеет единственный сопряженный элемент. Пусть с > 1 и у = Рг[Т < оо] таковы, что у = ес(у~г\
188 Глава 10. СЛУЧАЙНЫЕ ГРАФЫ Тогда {су)е су = се с, поэтому d = су. Принцип двойственности. Пусть d и с, d < 1 < с, сопряжены. Ветвящийся процесс со средним с, обусловленный обязательным вырождением, имеет то же распределение, что и ветвящийся процесс со средним d. Доказательство. Достаточно показать, что для любой истории Н = (z\,... ,zt) е-с(се-сУ~1 _ e-d{de-dy-1 vllUi^ П!=1*»! Это легко следует из того, что се~с = de~d и ye~d = уе~су = е~с. Ш 10.5. ГИГАНТСКАЯ КОМПОНЕНТА Вернемся к случайным графам. Мы определим процедуру нахождения компоненты C(v), содержащей заданную вершину v в заданном графе G. Здесь мы используем идеи из работы [Кагр (1990)], в которой данный подход применен к случайным орграфам. В этой процедуре вершины будут трех видов: живые, мертвые и нейтральные. Первоначально вершина v является живой, а все остальные— нейтральными, время £ = 0иУо = 1.В каждую единицу времени t мы берем живую вершину w и проверяем, принадлежат ли G все пары {w, it/}, где w' нейтральна. Если {w,wf} G G, то отмечаем w' как живую, в противном случае она остается нейтральной. После отыскания всех нейтральных wf мы отмечаем w как мертвую, a Yt принимает значение, равное новому числу живых вершин. Когда не остается ни одной живой вершины, процедура заканчивается, a C(v) является множеством мертвых вершин. Пусть Zt — количество тех и/, для которых {w,w'} G G. Таким образом, yt = yt-i + zt-i. При G = G(n, p) каждая нейтральная вершина w' независимо и с вероятностью р становится живой. Здесь никакая пара {w, w'} не проверяется дважды, поэтому условная вероятность для {w, w'} £ G всегда равняется р. Когда t—1 вершин мертвы, a Yt-i — живы, Zt~B[n-(t-l)-yt-i,p]. Пусть Т обозначает наименьшее £, при котором Yt = 0. Тогда Т = \C(v)\. Как и в разд. 10.4 мы вводим рекурсивное определение У*, на этот раз при 0 ^ t ^ п. Утверждение 10.5.1. Для всех t У4~В[п-1,1-(1-р)*] + 1-*. Доказательство. Более удобно будет использовать величину Nt=n-t-Yt,
10.5. ГИГАНТСКАЯ КОМПОНЕНТА 189 отвечающую количеству нейтральных вершин в момент времени £, и доказывать эквивалентное утверждение: ЛГ4~В[п-1,(1-р)*]. Это целесообразно, поскольку каждое w ф v имеет независимую вероятность (1 — рУ остаться нейтральной t раз. Так как No = п — 1 и Nt = n-t-Yt=n-t-B[n-(t-l)- Yt-i,p] - Yt-i + 1 = = Nt-i - B[Nt-Up] = B[Nt-U 1 - p], индукция завершает доказательство. ■ Пусть р = с/п. Когда t и Yt-i малы, распределение случайной величины Zt можно аппроксимировать биномиальным распределением В[п,с/п], которое близко к пуассоновскому со средним с. В основном, размеры маленьких компонент будут распределены так же, как и в ветвящихся процессах в разд. 10.4. Аналогия должна нарушиться при с > 1, поскольку ветвящиеся процессы могут иметь бесконечную численность популяции, когда |С(г>)| будет достигать п. В итоге все те v, для которых ветвящиеся процессы для C(v) не «умирают рано», образуют в совокупности гигантскую компоненту. Зафиксируем с. Пусть У0*, У^,..., Г*, Z\, Z%,..., Я* относятся к ветвящемуся процессу из разд. 10.4, а Уо, Ух,..., Т, Zi, Z2,..., Я относятся к процессу, порожденному случайным графом. Для любой возможной предыстории (zu...,zt) Pr[H* = (zu...,zt)] = f[Pr[Z* = Zi], г=1 где Z* является пуассоновской случайной величиной со средним с, и Рг[Я = (гь...,^)]=ПРг[^ = ^], г=1 где Zi имеет биномиальное распределение В[п — 1 — z\ — ... — Zi-i, с/п]. Распределение Пуассона является предельным для биномиального распределения. Когда т = т(п) ~ п и с, г зафиксированы, lim Pr \в\т,с/п] = z] = lim ("Л (-)* (l - -Y'" = e~ccz/zl n-юо L J n^oo\zJ \n/ \ 71/ Отсюда следует, что lim Pr \Н = (zu ..., zt)} = Рг[Я* = (zu ..., zt)}. Предположим, что с < 1. Для любого фиксированного t выполнено соотношение Ит^-юоРг [Т = t\ = Рг[Т* = t]. Оценим теперь размер наибольшей компоненты. Для любого t имеем Рг [Т > t] ^ Pr[Yt > 0] = Рг \в[п - 1,1 - (1 - р)*] > t\ ^ Рг [в[п, tc/n] > t\,
190 Глава 10. СЛУЧАЙНЫЕ ГРАФЫ поскольку 1 — (1 — рУ ^ tp и п — 1 < п. Из неравенства больших уклонений А. 1.14 следует, что Рг [T>t]< e~at, где а = а(с) > 0. Пусть (3 = /3(c) удовлетворяет неравенству а/3 > 1. Тогда Рг [Т > /3\пп] < n~a(3 = о(п-1). Начальную вершину v можно выбрать п способами. Поэтому почти наверное все компоненты имеют размер O(lnn). Теперь предположим, что с > 1. Для любого фиксированного t справедливо соотношение limn_>oo Рг[Т = t] = Рг[Т* = t]. Но что происходит при Т* = оо? При t = о(п) мы можем применить оценки 1 — (1 — р)ь ~ pt и п— 1 ~пи, таким образом, из неравенства больших уклонений получить, что вероятность Рг [Yt ^ 0] = Рг [В[п - 1,1 - (1 - р)1} ^ t - 1] - Рг [В[п, tc/n] ^ t] экспоненциально убывает по t. Когда t = an, мы оцениваем 1 — (1 — р)г через 1 — е~са. Уравнение 1 — е~сос = а имеет решение а = 1 — у, где у является вероятностью вырождения, определенной в разд. 10.4. Поскольку а < 1 — у, то 1 — е~са > а, следовательно вероятность Рг [Yt ^ 0] - Рг [В[п, 1 - e"CQ] ^ an] экспоненциально мала. При а > 1 — у верно, что 1 — е~са < а и Рг[У* ^ 0] ~ 1. Таким образом, почти всегда Yt = 0 при некотором t ~ (1 — у)п. В основном, Т* = оо соответствует Т ~ (1 — у)п. Пусть е, 5 > 0 являются произвольно малыми. При более аккуратной оценке можно показать, что существует такое to, что для достаточно большого п выполнено неравенство Рг [to < Т < (1 - 6)п(1 - у) или Т > (1 + 6)п(1 - у)] < е. Выберем to достаточно большим, чтобы у - е ^ Рг[Т* ^ to] ^ у. Тогда, поскольку Нгпп^оо Рг[Т ^ to] = Рг[Т* ^ to], то у - 2е ^ Рг [Т ^ to] ^ у + е, 1 - у - 2е ^ Рг [(1 - 6)п(1 -у)<Т<(1 + 6)п(1 - у)] < 1 - у + Зе. Теперь обобщим нашу процедуру, чтобы найти компоненты графов. Начнем со случая G ~ G(n,p). Выберем v = v\ G G и построим C(v\) как ранее. Затем удалим C(v\), выберем ^ G G\ C(v\) и так далее. На каждой стадии оставшийся граф имеет распределение G(m,p), где га обозначает число вершин. Заметим, что в оставшемся графе не было проверено ни одной пары {w, w'}, и поэтому он сохраняет свое распределение. Будем говорить, что компонента C(v) малая, если |С(г>)| ^ to, гигантская, если (1 - 5)п(1 — у) < \C(v)\ < (1 -h 5)n(l - у), и средняя в остальных случаях. Выберем s = s(e) так, что (у -h e)s < е. Заметим, что при малых е выполнено s ~ К In e~1. Начнем эту процедуру с полного графа и остановимся,
10.5. ГИГАНТСКАЯ КОМПОНЕНТА 191 когда будет обнаружена либо гигантская компонента, либо средняя, либо s малых компонент. Так как вплоть до этой стадии были найдены только малые компоненты, на каждом шаге число оставшихся вершин равно т = п — 0(1) ~ п. Поэтому условные вероятности малой, гигантской и средней компонент остаются асимптотически одинаковыми. Вероятность обнаружения средней компоненты не превосходит se. Вероятность обнаружения всех малых компонент не превосходит (у + e)s ^ е. Таким образом, с вероятностью не меньше 1-е', где значение е' = (s + 1)е может быть сделано сколь угодно малым, мы можем найти серию из меньше чем s малых компонент, за которой последует гигантская компонента. Оставшийся граф имеет т ~ уп вершин, и pm ~ су = d (сопряженный с с элемент, определенный в разд. 10.4). Поскольку d < 1, то предыдущий анализ дает максимальные компоненты. Резюмируя, заметим, что почти всегда граф G(n,c/ri) имеет гигантскую компоненту размера ~ (1 — у)п и все другие компоненты размера O(lnn). Более того, принцип двойственности, введенный в разд. 10.4, имеет дискретный аналог. Дискретный принцип двойственности. Пусть числа d и с, d < 1 < с, сопряжены. Структура графа G(n,c/n) без ее гигантской компоненты — это структура графа G(m, d/ra), где т — число вершин, не входящих в гигантскую компоненту, и т ~ пу. Малые компоненты графа G(n, с/п) могут быть изучены также со статистической точки зрения. При фиксированном к обозначим через X количество компонент, являющихся деревом размера к. Тогда cvfc(n-fc) + (*)-(fc-l) вд-Ю^СГ'О-г)' Здесь мы пользовались нетривиальным фактом, доказанным Кэли, что существует кк~2 деревьев на заданном /с-множестве. При фиксированных си к р — ск]ск—2пк—\ Поскольку деревья являются строго сбалансированными, используя метод второго момента, получаем, что почти всегда X ~ ЩХ]. Таким образом, ~ р^п вершин содержатся в компонентах, являющихся деревьями размера /с, где е~ск(ск)к-1 Рк = к\ • Аналитически может быть показано, что pk = Рг[Т = к] в ветвящемся процессе со средним с из разд. 10.4. Пусть У^ обозначает количество циклов размера /с, a Y — количество всех циклов. Тогда ВОД = £>*(£)*„£ при фиксированном к. При с < 1 математическое ожидание 00 к Е[У] = £Е[Ук]^£|- к=1
192 Глава 10. СЛУЧАЙНЫЕ ГРАФЫ и имеет конечный предел, в то время как при с > 1 имеет место сходимость Е[У] —> оо. Даже при с > 1 для любого фиксированного к количество /с-циклов имеет ограниченное математическое ожидание, и поэтому не влияет на асимптотику числа компонент заданного размера. 10.6. ФАЗОВЫЙ ПЕРЕХОД ИЗНУТРИ В эволюции случайного графа G(n,p) решающее изменение происходит в окрестности р = с/п при с = 1. Малые компоненты в это время быстро объединяются, образуя гигантскую компоненту. Это соответствует ветвящимся процессам, когда число рождений является пуассоновской случайной величиной со средним 1. В них число Т организмов будет конечным почти всегда, но, тем не менее, его математическое ожидание будет бесконечным. В последние годы обозначился большой интерес в изучении фазового перехода «изнутри» относительно роста наибольших компонент (см., например, [Luczak (1990)] или монументальную работу [Janson, Knuth, Luczak and Pittel (1993)]). Подходящая параметризация, возможно, неожиданна: 1 р=- + п п4/з- Когда Л = Л(п) —> —оо, фазовый переход еще не начался. Наибольшие компоненты имеют размер о(п2/3), и существует еще много компонент почти наибольшего размера. Когда Л = Л(п) —> +оо, фазовый переход осуществлен: появилась наибольшая компонента, размер которой ^> п2/3, а все остальные компоненты имеют размер о(п2/3). Зафиксируем Лиси обозначим через X количество компонент размера к = сп2/3, являющихся деревьями. Тогда «W - (-)*« (£)^- (1 - £)-—<»-«—. Проследите за сокращениями: ^п\ (n)k пкек "j-i ( г кек ь-1 к) к\ кку/2ттк \± V п п> г=1 При г < к можно записать _1ПЛ_*Л = 1 J— о(—} \ п) п 2гг2 \^3/ ' поэтому fc_1 • к2 к3 ,.ч к2 с3
10.6. ФАЗОВЫЙ ПЕРЕХОД ИЗНУТРИ 193 Заметим, что (А-1)1п(1 + Р А 7.1/3 -г=пг~к (1+^) fc-1 = (А-1) п^з А 1/з 2п2/3 + 0(п *>)- Также АА; A2c ^7з-^- + 0(1)- 1 1п(1- р) = -р+0{гСг) = п4/з + 0(n~2) к(п -k)+(k^j-(k-l) = kn-^-+ 0(n2/3), поэтому к(п -к)+ [J и где А = к 2п -(А-1) 1п(1-р) = -*+£- Е[Х] ^== ^ с3 АА; 6 + ni/з А2с А:2 АА: 2 + 2n nV3 АА; Ас2 +-г+«(1) = с3 А2с Ас2 .,, Отсюда вытекает, что E[X]-n"2/3e-V 2 С -5/2 (2тг)" -1/2 Для любого фиксированного к имеет место сходимость ЩХ] —> 0, но если будем суммировать по к от сп2/3 до (с + dc)n2/3, то появляется множитель T?l3dc. Переходя к пределу, получаем интеграл. Для любых фиксированных а, 6, Л обозначим через X количество компонент, являющихся деревьями, размера между an2/3 и Ьт?13. Тогда lim Е[Х] = / ■*-V + ^/.-V2r е""в- 2—г^-с--/-(2тг)~1/2 dc. Большие компоненты не всегда являются деревьями. В статье [Wright (1977)] показано, что при фиксированном / существует асимптотически cikk~2+2l связных графов на к вершинах с к — 1 + / ребрами, где с\ задается рекуррентно. Асимптотически относительно / имеем с\ = /~i/2(1+°(1)). Вычислив Х^\ число таких компонент на к вершинах, получим дополнительные множители Q&2* и п~1, которые дают с\с^1. При фиксированных а, 6, Л, / число Х^ компонент размера от an2/3 до frn2/3, в которых число ребер больше числа
194 Глава 10. СЛУЧАЙНЫЕ ГРАФЫ п—>оо где вершин на / — 1, удовлетворяет соотношению lim Е[Х<'>] = /V£-^+A£c-5/2(27r)-1/2(c,c*,)<fc. п—>оо / ./а Пусть X* — количество всех компонент размера от an2/3 до frn2/3, тогда lim ЕрГ]= ["e-£-^+^c-V2(2ir)-V2g(c) dc, J a оо 0(c)=^QC§', ряд сходится при всех с (здесь со = 1). Компонента размера ~ сп2/3 имеет на / — 1 больше ребер, чем вершин, с вероятностью cicil/g(c), не зависящей от Л. Поскольку limc_>o<7(c) = 1, большинство компонент размера ет?13 , е « 1, являются деревьями, но с ростом с распределение относительно / монотонно растет. Подведем итог настоящего раздела. Для любого фиксированного Л наибольшие компоненты имеют размер сп2/3, где значение константы зависит от компоненты. При Л = —106 существует некоторая положительная предельная вероятность того, что размер наибольшей компоненты больше 106п2/3, а при Л = +106 существует положительная предельная вероятность того, что размер наибольшей компоненты меньше 10~6п2/3, хотя обе эти вероятности мизерны. Подынтегральные функции имеют полюс в точке с = 0, отражая тот факт, что для любого Л должно существовать много компонент размера около ет?13 при достаточно малом е = е{\). Когда Л является большим отрицательным числом (например —106), наибольшая компонента скорее всего будет иметь размер еп2'3, где е — малая величина, и будет много компонент почти такого же размера. Число компонент, не являющихся деревьями, будет составлять незначительную долю числа компонент, являющихся деревьями. Теперь рассмотрим эволюцию G(n,p) относительно Л. Предположим, что при заданном Л существуют компоненты размера С\п2^3 и С2П2/3. Когда мы движемся от Л к Л -h d\, эти компоненты объединятся с вероятностью с\С2<1\. На компоненты действует «сила притяжения»: вероятность объединения пропорциональна их размерам. Так как с вероятностью (c2/2)d\ в компоненте размера C\v?l3 может появиться новое внутреннее ребро, большие компоненты редко остаются деревьями. В то же время, большие компоненты поглощают другие вершины. При Л = —106 будем считать, что у нас феодализм. Много маленьких компонент (замков) конкурируют друг с другом за возможность стать самой крупной. При увеличении Л компоненты увеличиваются в размерах, и начинают появляться немногие большие компоненты (нации). Большая Франция имеет намного больше шансов увеличиться, чем маленькая Андорра. Наибольшие компоненты стремятся к объединению, и при достижении Л = +106 скорее всего образуется гигантская компонента, Римская Империя. С большой
10.7. ЗАКОНЫ «НУЛЯ ИЛИ ЕДИНИЦЫ» 195 вероятностью эта компонента больше не конкурирует за превосходство, но она продолжает поглощать меньшие компоненты, пока не придет к полноте — Всему Миру. 10.7. ЗАКОНЫ «НУЛЯ ИЛИ ЕДИНИЦЫ» В этом разделе мы ограничимся рассмотрением теоретико-графовых свойств, выразимых в формальной теории графов первого порядка. Язык этой теории состоит из переменных (ж,у, г,...), которые всегда обозначают вершины графа, символов равенства и смежности (х = у,х ~ у), обычных булевых связок (Л,-»,...) и кванторов общности и существования (УХ,3У). Предложения теории конечны. Приведем несколько примеров записи свойств на этом формальном языке. Свойство содержания треугольника: ЗхЗуЗг[х ~yAx~zAy~z], отсутствия изолированной точки: Ух3у[х~у], того, что радиус не превосходит двух: ЗхУу\^(у = х) A -i(j/ ~ х) —► Зг[у ~ zAz ~ х]\. Для всякого свойства А и произвольных пир рассмотрим вероятность того, что случайный граф G(n, p) удовлетворяет свойству А. Эта вероятность обозначается Pr[G(n,p) |= A]. Целью данного раздела будет результат, полученный в работах [Glebskii, Kogan, Liagonkii and Talanov (1969)] и [Fagin (1976)] независимо друг от друга, (теорема 10.7.1), а также результат, выписанный в статье [Shelah and Spencer (1988)] (теорема 10.7.2). Теорема 10.7.1. Для любого фиксированного р, 0 < р < 1, и любого свойства А первого порядка lim Pr[G(n,p) |= A] = 0 или lim Pr[G(n,p) |= А] = 1. п—>оо п—>оо Теорема 10.7.2. Для любого иррационального а, 0 < а < 1, пусть р = р(п) =п~а. Тогда для любого свойства А первого порядка lim Pr[G(n,p) \= А] = 0 или lim Pr[G(n,p) |= А] = 1. п—>оо п—>оо Мы приводим наброски доказательств обеих теорем. Будем говорить, что функция р = р(п) удовлетворяет закону «нуля или единицы», если приведенное выше равенство верно для всех свойств А первого порядка. Теорема Глебского—Фагина имеет естественную интерпретацию при р = 0.5, поскольку в этом случае G(n,p) предоставляет равную вероятность
196 Глава 10. СЛУЧАЙНЫЕ ГРАФЫ каждому (помеченному) графу. Далее теорема утверждает, что любое свойство А первого порядка выполняется либо почти для всех графов, либо почти ни для каких графов. Теорема Шелла—Спенсера может быть интерпретирована в терминах пороговых функций. Из общих результатов разд. 10.1 вытекает, например, что р = п~~2/3 является пороговой функцией содержания К±. То есть, если р <^С п~~2/3, то G(n,p) почти наверное не содержит К±, если же р ^> п~~2/3, то G(n,p) почти наверное содержит К±. В промежуточном случае, скажем, при р = п-2'3 вероятность находится строго между 0 и 1. В этом случае она равняется 1-е-1/24. Будем употреблять следующее (правда, несколько вольное) выражение: при пороговой функции закон «нуля или единицы» не будет выполняться, и поэтому под тем, что р(п) удовлетворяет закону «нуля или единицы», понимается, что р(п) не является пороговой функцией —это является скучным моментом в эволюции случайных графов, по крайней мере, с точки зрения языка первого порядка. Что происходит с эволюцией G(n,p) при р = п-7Г/7? Ответ: ничего! В основе нашего подхода к законам «нуля или единицы» лежит вариант игры Эренфойхт, которую мы сейчас определим. Пусть G и Я —два графа с непересекающимися множествами вершин, a t — натуральное число. Рассмотрим совершенную информационную игру, обозначаемую EHR[G, Я, £], с двумя игроками, именуемыми Спойлер и Дупликатор. Игра длится t раундов. Каждый раунд состоит из двух частей. Сначала Спойлер выбирает вершину х Е V(G) или же вершину у Е V(H). Тем самым он выбирает граф, из которого затем выбираются вершины. Затем Дупликатор должен выбрать вершину в другом графе. К концу раунда t выбрано по t вершин из каждого графа. Пусть #i,..., xt являются вершинами, выбранными из V(G), а у\,..., yt — вершинами, выбранными из V(H), где Х{ и у% — вершины, выбранные в г-м раунде. Дупликатор выигрывает тогда и только тогда, когда индуцированные графы на выбранных вершинах являются изоморфными, т. е. если для всех 1 ^ г < J ^ t {xi,Xj} Е E{G) <—> {yi,yj} Е Е(Н). Поскольку нет скрытых ходов и ничьих, один из игроков должен иметь выигрышную стратегию. Будем говорить, что этот игрок выигрывает в игре EHR[G,tf,£]. Лемма 10.7.3. Для любого свойства А первого порядка существует такое t = t(A), что для произвольных графов G и Н со свойствами G \= А и Н \= -*А Спойлер выигрывает в игре EHR[G, Я, t]. Полное доказательство потребовало бы формального анализа языка первого порядка, поэтому мы только приведем пример. Пусть А обозначает свойство УхЗу[х ~ у] отсутствия изолированной точки, и t = 2. Спойлер начинает, выбирая изолированную точку у\ G V(H), он может это сделать, поскольку Н \= -»А Дупликатор должен выбрать х\ G V(G). Так как G \= А, то вершина х 1 не является изолированной, поэтому Спойлер может выбрать Х2 G V(G), так что Х\ ~ #2, и теперь Дупликатор не может выбрать «дублирующую» вершину 2/2-
10.7. ЗАКОНЫ «НУЛЯ ИЛИ ЕДИНИЦЫ» 197 Теорема 10.7.4. Функция р = р(п) удовлетворяет закону «нуля или единицы» тогда и только тогда, когда для любого t lim Pr 7П,П—><ЭО Дупликатор выигрывает EHR[G(n,p(n)), Я(га,р(га)),£] = 1, где G(n,p(n)) и Я(га,р(га)) — независимые случайные графы с непересекающимися множествами вершин. Замечание. При любой выбранной паре G и Я кто-то должен выиграть в игре EHR[G, Я, t]. (To есть не существует случайной игры, игра является совершенной.) Когда задано вероятностное распределение по (G, Я), существует вероятность того, что игра EHR[G, Я, t] будет выиграна Дупликатором, и эта вероятность должна стремиться к единице. Доказательство. Мы докажем только необходимость. Предположим, что значение р = р(п) не удовлетворяет закону «нуля или единицы». Пусть А удовлетворяет условию lim Pr [G{n,p(n)) \=А} = с, п—>оо где 0 < с < 1. Пусть t = t(A) удовлетворяет условию леммы. С предельной вероятностью 2с(1 - с) > 0 ровно один из графов G(n,p(n)) и Н(п,р(п)) будет обладать свойством А, поэтому победит Спойлер, что противоречит предположению. Это не полное доказательство, поскольку, когда закон «нуля или единицы» не выполняется, limn_>oo Pr[G(n,p(n)) |= А] может не существовать. Если существует подпоследовательность щ, на которой предел равен с £ (0,1), то мы можем использовать то же доказательство. В противном случае будут существовать две подпоследовательности щ и га*, пределы которых будут равны 0 и 1, соответственно. Тогда, устремляя п, га —> оо по п^ и га;, соответственно, Спойлер выиграет EHR[G, Я, t] с вероятностью, стремящейся к единице. ■ Теорема 10.7.4 является своеобразным мостом между математической логикой и случайными графами. Чтобы доказать, что р = р(п) удовлетворяет закону «нуля или единицы», нам более не нужно знать что-то относительно логики — достаточно найти хорошую стратегию для Дупликатора. Скажем, что граф G обладает свойством расширения полного уровня s, если для любых различных и\,..., ua, v\,..., Vb G G, где a + b ^ 5, существует такое x G V(G), что {х,щ) G E(G), 1 ^ i ^ a, и {x,Vj} g E(G), 1 ^ j ^ b. Предположим, что и G и Я обладают свойством расширения полного уровня 5 — 1. Тогда Дупликатор выигрывает EHR[G, Я, s] по следующей простой стратегии. В г-м раунде, при уже выбранных х\,..., #г-ъ 2/ъ • • •»Уг-i и выборе Спойлером, скажем, Х{, Дупликатор просто выбирает yi, смежное с теми же вершинами yj,j < г, что и Х{ — с Xj,j < г. Из свойства полного расширения вытекает, что такая вершина yi существует. Теорема 10.7.5. Для любого фиксированного р, 0 < р < 1, и произвольного s граф G(n,p) почти наверное обладает свойством расширения полного уров- НЯ S.
198 Глава 10. СЛУЧАЙНЫЕ ГРАФЫ Доказательство. Для любых различных ui,...,ua,vi,...,Vb,x G G, таких, что а + Ь ^ 5, определим событие EUli„.iUaiVli...iVbjX, заключающееся в том, что {х,щ} G E{G), 1 ^ г ^ а, и {я,^} £ Я(бУ),' lVj k Ь. Тогда Pr[^1,...,ua,vi,...^,x]=pa(l-P)b. Теперь положим &Ui,...,Ua /\ •^/Ui,...,Ua,Vi,...,Vb,X? где пересечение берется по х ф и\,..., иа, v\,..., Уь. Эти события попарно независимы по #, так как они задействуют различные ребра. Следовательно, Рг /\ &Ui,...,Ua,Vi,...,V = (l-p»(l-p)»)' Введем обозначение е = min(p, 1 — р)а. Получим Рг Л£«ь. <(!-£)' Здесь используется то, что £ является фиксированным (зависящим от р и s) положительным числом. Введем обозначение e = \Jeuu .,Ua,Vi,...,Vb, где дизъюнкция берется по всем различным щ,..., ua, i>i,..., Уь G G, a + fr ^ s. Существует меньше s2ns = 0(ns) таких возможностей выбора, поскольку мы можем выбрать а и Ь, а затем вершины. Таким образом, Pi[E]^s2ns{l-e)n-s. Но lim s2n3(l-e)n-s =0, и поэтому Е почти наверное не выполняется. Итак, -*Е, которое в точности утверждает, что G(n,p) обладает свойством расширения полного уровня s, почти наверное выполняется. ■ Мы доказали теорему 10.7.1. Для любого р G (0,1), произвольного фиксированного s при га, п —> оо с вероятностью, стремящейся к единице, оба графа G(n,p) и Н(т,р) будут обладать свойством расширения полного уровня s и поэтому Дупликатор выиграет EHR[G(n,p), #(га,р), s]. Почему Дупликатор не может использовать эту стратегию, когда р = п~а? Мы проиллюстрируем трудности при помощи простого примера. Пусть 0.5 < а < 1, и пусть Спойлер и Дупликатор разыгрывают игру из трех ходов на графах G, Н. Спойлер подумывает о выборе точки z G G, но не говорит Дупли- катору об этом. Вместо этого он выбирает х\, Х2 G G, смежные с z. Дупликатор просто выбирает точки 2/1,2/2 G Я, смежные либо несмежные, в зависимости от того, верно ли, что Х\ ~ #2- Но теперь хитрый Спойлер выбирает Х3 = z.
10.7. ЗАКОНЫ «НУЛЯ ИЛИ ЕДИНИЦЫ» 199 Граф Н ~ Н(т,т~ос) не обладает свойством расширения полного уровня 2. В частности, большинство пар 2/1,2/2 не имеют общего соседа. Если только Дупликатору не повезет, или он не окажется достаточно прозорливым, то он не сможет найти уз ~ у\, 2/2, и поэтому проиграет. Из этого примера не следует, что Дупликатор проиграет даже при совершенной стратегии (на самом деле, как мы установим ниже, он почти всегда выигрывает при использовании совершенной стратегии), он только показывает, что применяемая стратегия должна быть более сложной. Начнем доказательство закона «нуля или единицы», теоремы 10.7.2. Зафиксируем иррациональное число a Е (0,1). Пару (R,H), где Н является графом на множестве вершин, скажем, V(H) = {Х\,..., Xr, Y\,..., Yv}, a R = {Xi,... ,Xr} — заданное подмножество V(H), элементы которого называются корнями, назовем сетью. Например, (R,H) может состоять из одной вершины Yi, смежной с корнями Х\ и Х^ Обозначим через v = v(R, H) количество вершин, которые не являются корнями, а через е = e(R, H) — количество ребер, не соединяющих два корня. Мы назовем сеть (R, Н) плотной, если v — еа < 0; редкой, если v — еа > 0. Из иррациональности а следует, что каждая сеть (R,H) принадлежит одному из этих классов. Будем говорить, что сеть (R,H) жесткая, если для всех S, таких, что R С S С V(H), сеть (S,H) является плотной. Назовем сеть (R,H) надежной, если для всех S, таких, что R С S С V(Н), сеть (R, H\s) является редкой. Доказать некоторые элементарные свойства этих понятий предлагается в упр. 4. Иногда будем писать (R, S) вместо (R, H\s), когда из контекста будет понятно, о каком графе Н идет речь. Мы представляем себе сети как абстрактные точки. Будем говорить, что вершины у\,...,уУ графа G образуют (R,Н)-расширение вершин х\,...,хг тогда и только тогда, когда Хг смежно с Y3 в Н, Х{ смежно с yj в G, а также когда Yi и Yj смежны в Н, у г и yj смежны в G. Заметим, что графу G «позволено» иметь больше ребер чем графу Н, и что ребра между корнями «не в счет». Лемма 10.7.6 (универсальное расширение). Пусть сеть (R,H), определенная выше, является надежной. Пусть t > 0 — произвольное, но фиксированное целое число. Тогда в графе G ~ G(n, п~а) для всех Х\,..., хг почти наверное существуют y\,...,yv, такие, что г) вершины у\,...,yv образуют (R, К)-расширение Х\,...,хг. И) вершины Xi и yj являются смежными в G тогда и только тогда, когда Х{ и Yj являются смежными в H;yi и yj являются смежными в G тогда и только тогда, когда Yi uYj смежны в Н. Ш) если (при t > 0) z\,...,zu, и ^ t, образуют жесткое (R',Н')-расширение над Xi,..., хг, у\,..., yv, то ни одна из пар {z^, yj} не образует ребро.
200 Глава 10. СЛУЧАЙНЫЕ ГРАФЫ Пример. Пусть a Е (^,1), t = 2, и пусть сеть (R,H) содержит корень Х1? некорневую вершину Y\ и ребро {Xi,Yi}. Заметим, что для сети (R',Hf), содержащей два корня Х\ и Х2 с общим соседом Yi, выполнены равенства г> = 1, е = 2, и эта сеть является жесткой. Лемма об универсальном расширении в данном случае утверждает, что любая вершина Х\ имеет соседа у\, такого, что Х\ и у\ имеют общего соседа z\. Доказательство. Из упр. 5 следует, что почти наверное любые #i,...,#r имеют Q(nvpe) (R,Я)-расширений y\,...,yv- Предположим, что число тех 2/1» • • •, 2/v? которые не являются универсальными, в любом из ограниченного числа возможных способов, будет ограничено меньшей степенью п. Назовем у специальным, если у Е c\t+v(xi,... ,хг) (как это определяется ниже), иначе — неспециальным. Пусть К из леммы о конечном замыкании 10.7.7, приведенной ниже, является почти наверное оценкой специальных у, равномерно распределенных по всем способам выбора вершин х. Расширим сеть (R,H) до (Д+,Я+), добавив К новых корней, но не добавляя новых ребер. Это расширение также является надежным, причем того же типа, что и (R, Я), поэтому из упражнения 5 снова следует, что почти наверное каждые Х\,..., хг, 2х,. • •, zk имеют Q(nvpe) (Д+, Я+)-расширений yi,..., yv. Допуская вершинам z включать все специальные вершины, мы получаем, что почти наверное каждый набор х\,..., хг имеет Q(nvpe) (R, Я)-расширений yi,..., yv, где все у г неспециальные. Оценим теперь сверху число тех неспециальных (R, Я)-расширений, которые не удовлетворяют условиям 2 или 3. Рассмотрим расширение (Я, Я') с дополнительным ребром (yt,yj) или (xi, yj). Это расширение не может содержать жесткое подрасширение, поскольку это бы значило, что некоторое yi является специальным. Из упражнения 4 следует, что оно должно быть надежным расширением. Используя упражнение 5, получаем, что существует 6(nvpe+1) = o(nvpe) таких расширений. Рассмотрим расширения у\,..., yv и zi,...,zu из условия 3, где некоторые Zj и у к смежны. Далее мы можем считать, что вершины z образуют минимальное жесткое расширение над вершинами х и у. Пусть вершины z имеют тип (г>х,ех) как расширение над х и у, так что v\ — в\а отрицательно. Если у и z вместе образуют надежное расширение над х, то будет существовать 0(nv~*~Vlpe+ei) = o(nvpe) таких расширений и, следовательно, не более чем столько способов выбора для вершин у. В противном случае из упражнения 4 следовало бы существование жесткого подрасширения. Оно не имеет пересечений с неспециальными вершинами у. Из минимальности следует, что оно должно в точности совпадать со всеми вершинами z. Если заданы вершины х из леммы о конечном замыкании 10.7.7, то существует 0(1) способов выбора вершин z. Тогда у образуют (г>, е') расширение над х иу с е' > е. Это расширение не имеет жестких расширений (опять же, потому, что вершины у не являются специальными) и, следовательно, является надежным. Снова используя упражнение 5, получаем, что для каждого выбора вершин z существует Q(nvpe ) таких у, и поэтому общее число таких вершин у равно 0(nvpe>) = o(nvpe).
10.7. ЗАКОНЫ «НУЛЯ ИЛИ ЕДИНИЦЫ» 201 Во всех случаях число вершин у, которые не удовлетворяют условиям 2 или 3, есть o(nvpe). Следовательно, существуют у (на самом деле, большинство неспециальных у) которые являются (R, Я)-расширениями и удовлетворяют условиям 2 и 3. ■ Последовательность X = Хо С Х\ С ... С Хк-> такая, что все сети (Xi-i,Xi) являются жесткими, и все |Х$+1 — Xi\ ^ £, называется жесткой t-цепъю в G. Максимальное У, для которого существует жесткая £-цепь (произвольной длины) X = Хо С Х\ С ... С Хк = У', называется t-замыканием X и обозначается c\t(X). Когда не существует жестких t-цепей, мы по определению будем считать, что c\t(X) = X. Для проверки корректности данного определения заметим (используя упр. 4), что если X = Хо С Х\ С ... С Хк = Z и X = Хо С Y\ С ... С Yl = У являются жесткими t-цепями, то тогда и X = XoCX1C...cXKcZUY1C...CZL\YL = ZL\Y обладает тем же свойством. Наоборот, минимальное множество, содержащее X, которое не имеет жестких расширений ^ t вершин, назовем t-замыканием cl*(X). Будем говорить, что xi,...,xr Е G и j/i,...,yr € Н имеют тот же £-тип, если их t-замыкания изоморфны как графы, причем изоморфизм ставит в соответствие каждому Х{ соответствующее yi. Понятие t-замыкания является ключевым определением, описывающим специальные свойства корней. Предположим, например, что a G (^,1) и рассмотрим cli(xi,.a;2). Единственное жесткое расширение с t = 1 в данном промежутке — это некорневая вершина, смежная с двумя (или более) корнями. Примером 1-типа является следующий: Xi ИХ2 имеют общих соседей у\ и у% и, более того, Х\ и у\ имеют общего соседа t/з? и между этими вершинами нет других ребер, а никакие другие пары, кроме описанных выше, не имеют общих соседей. Случайно выбранные Х\КХ2 будут иметь тип: х\ и Х2 не имеют общих соседей и несмежны. Теперь мы можем начать описывать стратегию Дупликатора. К концу r-го хода, когда уже будут выбраны х\,..., хг и yi,..., уг из двух графов, Дупликатор убедится, что эти множества имеют тот же аг-тип. Мы будем называть совокупность (ах,..., at) стратегией предварительного просмотра. Здесь аг должно зависеть только от £, общего числа ходов в игре, и а. Условимся, что at = 0, так что в конце игры Дупликатор, если он сможет следовать (ах,..., at) стратегии предварительного просмотра, победит. Однако, если Спойлер выберет, скажем, хг+\ так, что не будет существовать соответствующей вершины уг+х, такой, что жх,..., #r+i и г/i,..., уг+\ имеют один и тот же аг+х-тип, то стратегия будет проигрышной, и будем говорить, что Спойлер победил. Значения аг дают «предварительный просмотр», того, что использует Дупликатор, но перед тем как определять их, нам потребуются некоторые предварительные результаты. Лемма 10.7.7 (конечное замыкание). Пусть зафиксированы а, г > 0. Положим е равным минимальному значению выражения ea~v no всем целым v и е, таким, что l^v^tuea — v > 0. Пусть К таково, что г — Ке < 0. Тогда в графе G(n,n~a) для всех X С G, \Х\ = г, почти наверное выполнено
202 Глава 10. СЛУЧАЙНЫЕ ГРАФЫ неравенство \clt(X)\^K + r. Доказательство. Если бы это было не так, то существовала бы жесткая t-цеиъ X = Х0 С Хг С ... С XL = У, такая, что К + г < \Y\ < К + г + t. Полагая, что (Xi_x, Хг) имеет тип (vi, ег), ограничение G на У имело бы r+^2 v% вершин и хотя бы ^ е* ребер. Но (V+ ^г>Л -а \У2еЧ = r + 5Z(V* ~ае*) ^г-еУ%г<г-#е<0, и G почти наверное не содержит такого подграфа. ■ Замечание. Оценка на |cl*(X)|, полученная в этом доказательстве, очень сильно зависит от того, насколько хорошо может быть приближено а рациональными числами, знаменатель которых не превышает t. Часто это является решающим обстоятельством. Если, например, ^ 4- -^ > а > | 4- ^, то почти наверное будут существовать две точки #х,#2 € G(n,n~Q), у которых есть s общих соседей. Так что |clx(#x, Жг)| > s + 2. Теперь определим элементы ах,..., а* стратегии предварительного просмотра, используя обратную индукцию. Положим at = 0. Если к концу игры Дупликатор может убедиться, что 0-типы из #х,..., xt и у\,..., yt совпадают, то они имеют одинаковые индуцированные подграфы, и он победил. Предположение индукции: пусть определено Ь = ar+x- Определим а = аг как произвольное целое число, удовлетворяющее условиям 1) а > Ь; 2) почти наверное |clb(W)| — г < а для всех множеств W размера г 4-1. Теперь мы должны показать, что эта стратегия почти наверное является выигрышной. Пусть G\ ~ G(n,n~a), G% ~ G(ra, ra~Q) и Дупликатор пытается играть с помощью (ах,..., at) стратегии предварительного просмотра на EHR(Gi,G2,t). Рассмотрим (г 4- 1)-й ход. Пусть, как и выше, Ь = ar+x и a — ar- Точки #х, • • •, #r G Gx, 2/i,..., Уг £ ^2 уже выбраны. Положим для удобства X = {#х, • • •, #г}5 V" = {ух5 • • • ? 2/г}- Предположим, что Дупликатор остался в игре до сих пор, так что cla(X) = с1а(У), изоморфизм сопоставляет каждому Х{ соответствующее у{. Спойлер выбирает, скажем, х = #r+i Е Gi. Положим Х+ = 1и{х} и У+ = У U {у}, где у — не определенный еще контр-ход Дупликатора. Рассмотрим два случая. Будем говорить, что Спойлер пошел внутрь, если х Е cla(X). Тогда, с\ъ(Х+) С cla(X), поскольку Ь ^ а. Дупликатор смотрит на изоморфизм Ф : с\а(Х) -> с1а(У) и выбирает j/ = Ф(ж). Скажем, что Спойлер пошел наружу, если я; £ cla(X). Пусть NEW — те вершины с1б(Х+), которые не лежат в cla(X). Имеем NEW ф 0, поскольку х Е NEW. Кроме того, \NEW\ ^ а, поскольку NEW С с1ь(Х+) - X. Рассмотрим NEW как (#, #)-расширение cla(X). Это расширение должно быть
10.7. ЗАКОНЫ «НУЛЯ ИЛИ ЕДИНИЦЫ» 203 надежным, потому что в противном случае оно бы имело жесткое подрасшире- ние NEW~, но тогда это подрасширение содержалось бы в cla(X). Дупликатор теперь ходит к G2 и, применяя лемму об универсальном расширении 10.7.6 с t = b, находит (R, #)-расширение с1а(У). То есть он находит инъекцию, сохраняющую ребро, Ф : cla(X) U NEW —> if, таким образом расширяя изоморфизм между cla(X) и с1а(У). Дупликатор выбирает у = Ф(я). Почему это работает? Положим NEW = Ф(NEW) и CORE = Ф(с1ь(Х+)). Мы можем достичь с\ь(Х+) при помощи жесткой 6-цепи от Х+, а изоморфизм дает ту же цепь от У+ до CORE, так что с15(У+) содержит CORE. Но может ли оно содержать дополнительные вершины? Мы используем универсальность, чтобы ответить на этот вопрос отрицательно. Предположим, что существует жесткое расширение MORE над CORE с не более чем Ь некорневыми вершинами. Расширение MORE не может целиком содержаться в Ф[с1а(Х)иTVEW], так как в этом случае 4?~l[MORE] содержалось бы в с\ь(Х^). Пусть MORE+ обозначает множество вершин из MORE, лежащих вне Ф[с1а(Х) U NEW]. Тогда MORE+ является жестким расширением Ф[с1а(Х) U NEW]. Из универсальности следует, что MORE+ не имеет смежных вершин из NEW', и, таким образом, будет жестким расширением Ф[с1а(Х)] = с1а(У). Так как а > Ъ, а-замыкание множества не может иметь жестких расширений с не более чем Ь вершинами. Следовательно, MORE не существует. Первый ход аналогичен тому же принципу, но он несколько проще. Положим Ь = а\. Пусть а удовлетворяет условиям: а > Ь и а > |с1ь(#)| при любом х. Спойлер играет х Е G\. На самом деле, не может быть хода внутрь, поскольку X = 0 является множеством предыдущих ходов и с1а(0) = 0. Дупликатор находит граф Н = с\ь(х), который имеет, скажем, v вершин (включая х) и е ребер. Поскольку Н является подграфом G\, то функция появления Н должна появиться до п~а. В частности, для любого подграфа Н' графа Н cv' вершина и е' ребрами не выполняется неравенство v' — ае' < 0, и поэтому должно выполняться v* — ае' > 0. Тогда выполняются условия теоремы 4.4.5, поэтому G2 почти наверное содержит Q(me~va) копий Н. Рассмотрим произвольный граф Я"1", содержащий Н вместе с жестким расширением Я и с не более чем Ь вершинами. Такой граф Я"1" будет содержать v -h v* вершин ие + е+ ребер, также будет выполняться условие v+ — ае+ < 0. Тогда математическое ожидание копий Н+ будет равняться 0(me~va+(v ~ae )), что есть o(me~va). Следовательно, в G2 найдется копия Н, которая не является частью никакого такого Н+. (На самом деле, это универсальное расширение над пустым множеством.) Дупликатор найдет инъекцию, сохраняющую ребра, Ф : с\ь(х) —> G2, таким образом представляя такую копию Н, и выберет у = Ф(ж). Итак, нами показано, что (<ц,..., at) стратегия предварительного просмотра почти наверное приводит к победе Дупликатора. Отсюда по теореме 10.7.4 следует закон «нуля или единицы». 10.7.2
204 Глава 10. СЛУЧАЙНЫЕ ГРАФЫ 10.8. УПРАЖНЕНИЯ 1. Покажите, что существует граф на п вершинах, в котором минимальная степень не меньше п/2 и размер любого доминирующего множества не меньше D(logn). 2. Найти пороговую функцию следующего свойства: G(n,p) содержит копию графа, состоящего из полного графа на четырех вершинах и еще одной вершины, соединенной с одной из ее вершин. 3. Пусть X обозначает число циклов в случайном графе G(n,p) с р = ^. Найти точную формулу для ЩХ]. Найти асимптотику ЩХ] при с < 1. Найти асимптотику ЩХ] при с = 1. 4. Здесь мы пишем (R,S) вместо (Я, #|s), где Н — некоторый фиксированный граф. • Пусть R С S С Т. Покажите, что если сети (R,S) и (S,T) плотны, то и (R, Т) плотна. Покажите, что если (R, S) и (5, Т) являются редкими, то такой же является и (R, Т). • Пусть R С 5. Покажите, что, если сеть (R,S) является жесткой, то и (X U R, X U 5) является жесткой для любого X. • Пусть R С U и сеть (#, U) не является редкой. Покажите, что существует Г, i? С Т С С/, такое, что сеть (R,T) плотна. Докажите также, что существует 5, R С S С Т, такое, что сеть (R,S) жесткая. • Покажите, что любая сеть (R,T) является либо жесткой, либо редкой, либо существует 5, R С S С Т, такое, что сеть (Я, 5) является жесткой, a (S,T) — редкой. 5. Назовем сеть (R,H) шарнирной, если она надежная, и не существует множества 5, R С 5 С V(#), такого, что (5, Я) надежная. Обозначим через N(x\,..., #r), #i,..., xr E G, число (Я, Н) расширений. Положим fi = E[N]~nvpe. • Пусть (R, Н) является шарнирной. Зафиксируем х\,..., xr G G. Используя конструкцию, описанную в разд. 8.5 и, особенно, в теореме 8.5.4, покажите, что Рг |AT(xi,... ,хг) - /х| > ещ = о(п г). • Выведите, что почти наверное все N(x\,..., xr) ~ /х. • Покажите, что N{x\,..., xr) ~ \х выполняется для любой надежной сети (R, Я), разлагая (R,H) на шарнирные расширения.
ВЕРОЯТНОСТНЫЙ ВЗГЛЯД: Число подграфов Граф G = (V,E) на п вершинах имеет 2П индуцированных подграфов, но некоторые из них наверняка будут изоморфны. Сколько различных подграфов может иметь G? Здесь мы покажем, что существуют графы G с 2П(1 — о(1)) различными подграфами. Доказательство, которое мы приводим, довольно грубое. Это типичный случай из числа тех, в которых вероятностный подход дает довольно быстрые ответы на вопросы, к которым трудно подступиться другими методами. Пусть G — случайный граф на п вершинах, в котором ребро появляется с вероятностью 1/2. Зафиксируем S С V, \S\ = t. Для любого взаимно однозначного отображения р : S —> V', р ф id, пусть Ар обозначает событие «р представляет изоморфизм графов», т. е. для х,у Е S выполняется {я? 2/} € Е ^ {РХ>РУ} € Е. Положим Мр = {х Е S : рх ф х}. Мы разбиваем множество отображений р на g = g(p) = \МР\ частей. Рассмотрим g(t — g) + (^) пар (х,у), х,у Е 5, и по крайней мере одну (х,у) в М. Для всех, таких пар, за исключением более д/2 пар, выполнено {#, у} ф {рх, ру}. (Исключением является случай, когда рх = у,ру = х.) Пусть Ер является множеством пар {#,?/}, таких, что {х,у} ф {рх,ру}. Определим граф Нр множеством вершин которого является Ер, и вершина {х,у} смежна с {рх,ру}. В Нр каждая вершина имеет степень не более двух, поскольку {х, у} может быть также смежной с {р~1х, р~гу}, и поэтому она разлагается в объединение изолированных вершин, цепей и циклов. В каждой такой компоненте есть независимое множество размера не меньше чем одна треть от числа элементов; равенство достигается на треугольнике. Таким образом, существует множество 1Р С Ер, такое, что IM>IFI>g(*-g)+®-g/2 \1р\ & \Ьр\ & ^ • Поэтому пары {х,у},{рх,ру}, такие, что {#, у} Е 1Р, все различны. При каждом {х, у} Е 1Р событие {х,у} Е Е 4=> {рх,ру} Е Е выполняется с вероятностью 1/2. Более того, эти события взаимно независимы для всех {х,у} Е 1Р, так как они порождены различными парами. Отсюда вытекает оценка Рт[Ар] < 2-1^1 < 2-^'-^+(S)-^2)/3. При заданном д функция р определяется условием {х : рх ф х} и значениями рх для этих х, поэтому существует меньше п2д таких р. Получаем оценки Y,рг(а>] = t Е Р1Ш ^ J2n292Hgit~g)+{92hg/2)/3- p^id g=l д(р)=д 9=1
206 Вероятностный взгляд: Число подграфов Мы приводим грубую оценку 9(t ~ 9) + Q - Я/2 = 9 (* - f - l) > 9 (| - l) , поскольку # ^ £• Тогда ^Pr[^]^^[n22<-t+1)/3]9. рф-id 9=1 Имеем 2з~ё < п~3 и ]Cn^id ^r[^pl = °(1)> поскольку (опять же из грубых оценок) t > 50 Inn. To есть почти наверное не существует изоморфной копии G\s- Для всех S С V, таких, что \S\ > 50Inn, обозначим через Is индикатор события «нет других подграфов, изоморфных G|s». Положим X = ^2ls- Тогда E[Js] = 1 — °(1)- Отсюда, используя линейность математического ожидания и то, что существует 2П(1 — о(1)) таких 5, получаем Е[Х] = 2п(1-о(1)). Следовательно, существует некоторый граф G, такой, что X > 2П(1 — о(1)).
11 Сложность схем Не знание, а процесс изучения, не обладание, а процесс постижения приносит наибольшее наслаждение. Когда я изучил и исчерпал предмет, я оставляю его, чтобы снова идти в темноту Так странен человек, вечно не удовлетворенный, — если он завершает постройку, то не для того, чтобы жить там в мире, а для того, чтобы начинать новое строительство. Я полагаю, что так должен себя чувствовать завоеватель мира, который, едва завоевав одно королевство, тянет руки к другому Карл Фридрих Гаусс 11.1. ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ Булева функция / = /(#1,..., хп) от п переменных х\, #2,..., хп — это отображение вида / : {0,1}П —> {0,1}. В частности, 0,1, £i Л ... Л хп,х\ V ... V хп,х\ 0 ... 0 хп обозначают, как обычно, две постоянные функции, функцию И (ее значение равно единице тогда и только тогда, когда Х{ = 1 для всех г), функцию ИЛИ (ее значение равно 0 тогда и только тогда, когда Х{ = 0 для всех г), и счетчик четности (ее значение равно 0 тогда и только тогда, когда число переменных ж», равных 1, четно), соответственно. Через / = /01 обозначается не / т. е. отрицание функции /. Функции Xi и Xi называются атомами. В этом разделе мы рассматриваем проблему эффективного вычисления различных булевых функций. Схема — ориентированный, ациклический граф, с особой вершиной без исходящих ребер, называемой выходом. Каждая вершина помечена символом одной из базисных булевых функций, зависящей от ее непосредственных предков, а вершины без предков (т. е. вершин без входящих ребер), называемые входами схемы, помечены либо символом одной из переменных Xi, либо одной из констант 0 или 1. Для всякого двоичного набора значений входных переменных Xi можно рекурсивно вычислить соответствующее значение функции, реализуемой в произвольной вершине схемы, вычисляя соответствующую базисную функцию, символом которой помечена эта вершина, от уже вычисленных значений ее непосредственных предков. Мы говорим, что схема вычисляет функцию / = /(#i,..., жп), если при всех Х{ Е {0,1} соответствующее значение выхода схемы равно f(x\,..., хп). Например, на рис. 11.1 показана схема, вычисляющая функцию /(#i, #2, #3) = (#1 0 (#2 Л #з)) Л х\. Если из каждой вершины в схеме исходит не больше одной дуги (т. е. если соответствующий граф является деревом), то схема называется формулой. Если в каждую вершину схемы заходит не больше двух дуг, то схема
208 Глава 11. СЛОЖНОСТЬ СХЕМ Х\ Х2 Хз Рис. 11.1 называется1) 2-схемой. Таким образом, схема на рис. 11.1 является булевой схемой, но не является формулой. Сложность схемы —это число ее вершин (не являющихся входами), а ее глубина — это максимальная длина направленного пути в ней. Сложность булевой функции в классе 2-схем — это размер наименьшей вычисляющей ее 2-схемы. Простой подсчет показывает, что для больших п сложность почти всех функций от п переменных в классе 2-схем не меньше (1 + о(1))2п/п. Это объясняется тем, что число 2-схем сложности 5, как легко может быть доказано, меньше (ci$)s, в то время как общее число булевых функций, зависящих от п переменных, равно 22 . С другой стороны, не известно нелинейных, а тем более — экспоненциальных (по п) нижних оценок сложности для какой-либо «явной» функции в классе 2-схем. Здесь под «явной» мы понимаем NP-функцию, т. е. одну из семейства {fni}i^i булевых функций, где fni — функция щ переменных, щ —> оо, и существует недетерминированная машина Тьюринга, которая по щ и х\,...,xni может определить за (недетерминированное) полиномиальное (по щ) время, верно ли, что fm(x\, • • •,хп.) = 1. (Пример такого семейства— ^-кликовая функция; здесь щ = Q), щ переменных х\,..., xni соответствуют ребрам графа на г вершинах, и /ni(#i, • • •, xni) = 1 тогда и только тогда, когда соответствующий граф содержит клику на не менее чем г/2 вершинах.) Любая неполиномиальная нижняя оценка сложности явной функции в классе 2-схем означала бы (помимо прочего), что Р ф NP, и таким образом решалась бы возможно важнейшая открытая проблема теоретической информатики. К сожалению, наилучшая известная на данный момент нижняя оценка сложности явной функции от п переменных в классе 2-схем —всего лишь Зп (см. [Blum (1984)], [Paul (1977)]). Тем не менее, известно несколько нетривиальных нижних оценок для случая, когда мы накладываем определенные ограничения на структуру схем. Большинство известных доказательств этих оценок в значитель- х) Авторы используют словосочетание «binary circuit», что в буквальном переводе означает «двоичная схема». Это не соответствует смыслу определения. Для краткости мы используем здесь термин «2-схема». — Прим. ред.
11.2. СЛУЧАЙНЫЕ ОГРАНИЧЕНИЯ И СХЕМЫ ОГРАНИЧЕННОЙ ГЛУБИНЫ 209 ной степени опирается на вероятностные методы. В этой главе мы опишем некоторые из этих результатов. Заметим, что известно множество других красивых результатов о сложности схем; см., например, [Wegener (1987)] и [Karchmer and Wigderson (1990)], однако те, что приведены здесь, не только входят в число важнейших, но и позволяют продемонстрировать элегантные методы, используемые в данной области. Так как большинство результатов этой главы — асимптотические, мы считаем, когда это требуется, что число переменных достаточно велико. 11.2. СЛУЧАЙНЫЕ ОГРАНИЧЕНИЯ И СХЕМЫ ОГРАНИЧЕННОЙ ГЛУБИНЫ Буквой назовем формулу вида Х{ или x~i, где Х{ — символ переменной. Формулы вида у\ А ... Л уп и у\ V ... V уп, где yi —буквы, называются соответственно элементарной конъюнкцией и элементарной дизъюнкцией. Число букв в элементарной конъюнкции (элементарной дизъюнкции) называется ее рангом. Булеву формулу G назовем t-конъюнктивной нормальной формой (сокращенно, £-КНФ), если она представляет собой конъюнкцию произвольного числа элементарных дизъюнкций ранга, не большего £, т.е. G = G\ Л ... Л Gw, где Gi = уп V ... V yiai ,a,i ^ t и каждое yj является буквой. Аналогично, назовем булеву формулу s-дизъюнктивной нормальной формой (сокращенно, 5-ДНФ), если она может быть записана как дизъюнкция конъюнкций, каждая из которых содержит не более s букв. Импликанта функции / — это элементарная конъюнкция К, удовлетворяющая условию K\J f = f. Импликанта К функции / называется простой импликантой или минтермом, если после удаления любой буквы она перестает быть импликантой функции /. Заметим, что функция является s-ДНФ тогда и только тогда, когда ранг каждого из ее минтермов не превосходит s. Ограничение — это отображение р множества индексов {1,..., п} на множество {0,1, *}. Ограничение р на функцию G — G(x\,... ,хп), обозначаемое G\p, — это булева функция, полученная из G присваиванием каждой переменной Х{ значения р(г) при условии, что г Е р_1{0,1}. Каждая Xj при j E р_1(*) остается переменной. Тогда, например, если G(xi,x2,x3) = (xi А х2) \/х3и р(1) = 0, р(2) = р(3) = *, то G\p = х3. Для 0 ^ р ^ 1 случайное р-ограничение — это случайное ограничение р, определенное путем независимого выбора для каждого 1 ^ г ^ п значения р(г) согласно следующему распределению: Рг[р(г) = *] = р, Рг[р(г) = 0] = Рг[р(г) = 1] = (1 - р)/2. (11.1) Улучшив результаты [Furst, Saxe and Sipser (1984)], [Ajtai (1983)] и [Yao (1985)], Хостад [Hastad (1988)] доказал следующее утверждение, очень полезное при установке нижних оценок для схем ограниченной глубины. Лемма 11.2.1 (переключающая лемма). Пусть G = G(x\,..., хп) — t-КНФ, т. е. G = G\ AG2 А ... A Gw, где каэюдое Gi является дизъюнкцией
210 Глава 11. СЛОЖНОСТЬ СХЕМ не более чем t букв. Пусть р — случайное ограничение, заданное распределением (11.1). Тогда Рг [G\p не является (s - 1)-ДНФ] = = Рг [yG\p есть минтерм ранга ^ s] ^ (5pt)s. Доказательство. Пусть Е8 — событие, состоящее в том, что у G\p есть минтерм ранга не меньше s. Чтобы оценить Pr[£s], мы докажем более сильное утверждение: для любой булевой функции F выполняется Рг й ^ {ЪрЬУ (11.2) Здесь мы считаем, что если условие не выполнено, то условная вероятность равна нулю. Утверждение леммы 11.2.1 следует из неравенства (11.2) при F = 1. Мы доказываем (11.2) индукцией по w. При w = О имеем G = 1, и неравенство очевидно. Предположим, что (11.2) верно, когда количество Gi меньше w, и докажем это для w. Положим G = GiAG*, где G* = G^A.. ,AGW, и пусть Е* — событие, состоящее в том, что у G* \р есть минтерм ранга не меньше s. Заменяя при необходимости некоторые переменные их отрицаниями, мы можем для удобства считать, что G\ = V Xi, где |Г| ^ t. Либо G\\p = 1, либо G\\p ф 1. В первом случае Е3 выполняется тогда и только тогда, когда выполняется Е*, а значит, по индукции Рг Ея l,GiL = 1 Pr[s;|(FAGi)|p = l] ^(5pt)s. (11.3) Случай G\\p ф 1 требует большего внимания. В этом случае любой минтерм G\p должен содержать хотя бы одну переменную #i, где г еТ, без отрицания. Для не пустого Y С Т и для функции а : Y —> {0,1}, не равной тождественно нулю, пусть ES(Y, a) — событие, состоящее в том, что у G\p есть минтерм ранга не меньше 5, который содержит букву х^ для каждого г G У, и не содержит отрицаний переменных Xj, где j ET. По предыдущему замечанию Рг ЕЛ F\p = l,Gi|p ф l] ^ ^Рг [es(Y,<t)\f\p = l,Gi|p ф l]. (11.4) У,а Заметим, что условие G\\p ф 1 в точности означает, что р(г) G {0, *} для всех г G Т, а значит, для каждого zgT выполнено соотношение Рг Gi|,#l] = |р(г) = * Следовательно, если |У| = у, то Р Р+(1-р)/2 = 2р/(1+р). Рг р(П г1|р #1 ^ Vi+pJ ■ Дополнительное условие F\p = 1 мож:ет только уменьшить эту вероятность. Это может быть показано с помощью FKG-неравенства (см. гл. 6). Это также можно показать напрямую следующим образом. Для любого фиксированного
11.2. СЛУЧАЙНЫЕ ОГРАНИЧЕНИЯ И СХЕМЫ ОГРАНИЧЕННОЙ ГЛУБИНЫ 211 р': N \ Y —► {0,1,*}, где N = {!,.. .,п}, мы утверждаем, что Рг p(Y) = * \F\P = 1, Gx \Рф 1, p\n\y = Р' ^ [l+pj ' В самом деле, у данного р' есть единственное расширение р с p(Y) = *. Если р не удовлетворяет вышеупомянутым условиям, то условная вероятность равна нулю. Если удовлетворяет, то этим условиям удовлетворяют также все расширения р с р(г) Е {0,*} при г Е У, так что неравенство выполняется и в этом случае. Так как это верно для всех фиксированных р', мы приходим к выводу, что действительно У Рг p(y) = *n, = l,Gi|p^l < 2р 1+р ^ (2р)У. (11.5) Пусть при р' : Т —> {0, *} выполняется р(У) = *. Рассмотрим все возможные ограничения р, для которых р\т = р''. При этом условии р можно рассматривать как случайное ограничение на N\T. Событие F\p = 1 сводится к событию F\p\N = 1, где F — конъюнкция всех функций, полученных из F заменой значений Хг согласно р' для тех г Е Т, у которых р'(г) = 0, и перебором всех возможных значений для остальных переменных Xj, где j ET. Если происходит событие £5(У, сг), то у G*\pa есть минтерм ранга не меньше s — t/, не содержащий никакой переменной #i с г Е Т \ У. Но это происходит тогда и только тогда, когда у G\P\N есть минтерм ранга не меньше s — у, где G — это функция, полученная из G* заменой значений #j при j GY согласно сг, значений я* при г Е Т\ У и р'(г) = 0 согласно р', и выбрасыванием всех переменных х^ с /с Е Т\У и р'(/с) = *. Обозначив это событие Е3-у, мы можем применить индукцию и получить, что Рг 'Ea(Y,<T)\F\p = l,G1\p£l,p\T = p'] ^Pr[4-y|F|p = l] <(5pt)e-". Так как любое р с F|p = l,Gi\p = 1,р(У) = * должно удовлетворять р\т = р' для некоторого р' этого вида, и поскольку событие Es(Y,<r) может произойти только когда p(Y) = *, мы приходим к выводу, что Рг Ea(Y,<T) l,Gi|p#l,p(y) = * ^(bpty-У и согласно неравенству (11.5) Рг E8(Y,<t)\F\p = 1,вг\р^1 Рг p(y) = *F|p = l,Gi|p#l х Рг [я5(У,<т)|,Р|р = l,Gi|p # 1,р(У) = *] ^ (2^(5^)^. Подставляя это в неравенство (11.4) и используя тот факт, что \Т\ ^ £, а также что t £(2»-1)27(5»у!)^ + Х;-
212 Глава 11. СЛОЖНОСТЬ СХЕМ получаем: \Ei Рг \т\ < = (5ptr^-l).-^-^(5p^. Это вместе с соотношением (11.3) дает неравенство Рг Ея F\p = 1 < (5pt)5 завершая индукцию и доказательство. Подставляя отрицание функции G в лемму 11.2.1 и применяя правила де Моргана, мы легко получим ее двойственную форму. Если G — £-ДНФ и р — случайное ограничение, заданное распределением (11.1), то Рг [G\p не является (s - 1)-КНФ] ^ (bpt)s. Теперь мы опишем применение переключающей леммы, дающее нижнюю оценку сложности схем минимальной глубины, реализующих счетчик четности Х\ 0 ... 0 хп. Мы рассматриваем схемы, в которых вершины упорядочены по уровням, вершины первого уровня —буквы (т.е. переменные или их отрицания), и все остальные элементы — либо ИЛИ, либо И произвольного числа вершин предыдущего уровня. Мы предполагаем, что элементы каждого уровня либо все являются элементами типа И, либо все являются элементами типа ИЛИ, и что уровни меняются всякий раз с типа И на тип ИЛИ и наоборот. Схема такого вида называется C(s, s', d, ^-схемой, если она содержит не более s элементов, не более s' из которых выше второго уровня, ее глубина не более d, и число входов каждого элемента второго уровня не более t. Таким образом, например, схема, реализующая счетчик четности путем вычисления дизъюнкции от 2n_1 конъюнкций вида х\1 А ... Л х^1, где (е\,..., еп) — всевозможные четные двоичные векторы, и х\1 = Xi 0 £*, является C(2n_1 + 1,1,2, п)-схемой. Теорема 11.2.2. Пусть f = /(#i,... ,хп) — функция, и пусть С — C(oo,s,d,t)-cxeMa, вычисляющая f, где s • (|)* ^ 0.5. Тогда либо у f, либо у ее дополнения f есть минтерм ранга не больше п — 2.(iot)d-2 ~*~ ^ Доказательство. Применим к С последовательно d — 2 раз случайное 1/(10£)-ограничение. Каждое из этих случайных ограничений, будучи примененным к любой нижней подсхеме глубины 2, преобразует ее по лемме 11.2.1 с вероятностью не меньше 1 - (\)г из £-ДНФ в £-КНФ (или наоборот). Если все эти преобразования успешны, мы можем отождествить новые элементы И с элементами более высокого уровня и получить схему меньшей глубины. Так как общая сложность схемы не превосходит s, и s{\)1 ^ 0.5,
11.3. ЕЩЕ О СХЕМАХ ОГРАНИЧЕННОЙ ГЛУБИНЫ 213 мы делаем вывод, что с вероятностью не меньше 0.5 все преобразования успешны, и С преобразуется в С(оо, 1,2, £)-схему. Каждая переменная Х{ независимо остается переменной (т. е. ей не было присвоено значение) с вероятностью (l0t)d-i • Следовательно, количество оставшихся переменных — это биномиальная случайная величина с математическим ожиданием (1оо<*-2 и немного меньшей дисперсией. По стандартным оценкам для биномиального распределения (см. приложение А) вероятность того, что не менее 2(iot)d-* переменных остались переменными, больше 0.5. Следовательно, с положительной вероятностью не более п — 2.(ш)*-2 пеРеменных зафиксированы, и у получившегося ограничения / есть С(оо, 1,2, £)-схема, т. е. ее значение может быть зафиксировано присваиванием значений не более чем t отрицаниям переменных. Это завершает доказательство. ■ Следствие 11.2.3. Для любого d ^ 2 не существует С (оо, i • 2>1/(d~1\d, -^1/(d-1)) -схемы, реализующей счетчик четности /(#i,..., хп) = Х\ 0 ... 0 хп. Доказательство. Предполагая, что такая схема существует, получаем по теореме 11.2.2, что значение / может быть зафиксировано присваиванием значений не более чем п— \nl^d~l>} + ^n1/^-1) < n переменным. Это неверно, а значит, такой схемы не существует. ■ Оценка в следствии 11.2.3, фактически, близка к наилучшей. Так как ка^к- дая C(s, sf, d, £)-схема может быть преобразована в C(ts, s, d+1,2)-схему (заменой каждого атома на ИЛИ или И двух его копий), из следствия 11.2.3 легко получить, что глубина d любой C(s, s', d, £)-схемы полиномиальной сложности, реализующей счетчик четности от п переменных, не меньше Q(\ogn/ log log n). Эта нижняя оценка также является оптимальной. 11.3. ЕЩЕ О СХЕМАХ ОГРАНИЧЕННОЙ ГЛУБИНЫ В предыдущем разделе мы видели, что счетчик четности сложно реализовать с малой глубиной, используя элементы И, ИЛИ и НЕ. Оказывается, что даже если допустить использование элементов-счетчиков четности (вместе с элементами И, ИЛИ и НЕ), все же существуют некоторые относительно простые функции, которые сложно вычислить. Такой результат был впервые доказан Разборовым (1987). Его метод был изменен и усилен Смоленским [Smolensky (1987)]. Для целого к > 2 пусть MocU(a;i, х2,..., хп) — булева функция, принимающая значение 1 тогда и только тогда, когда Т,Х{ ф 0 (mod к). Смоленский показал, что для любых двух степеней р и q различных простых чисел функция Modp не может быть вычислена ограниченной по глубине схемой полиномиальной сложности, состоящей из элементов И, ИЛИ, НЕ и Modq. Здесь мы приводим частный случай этого результата, в котором q = 3 ир = 2.
214 Глава 11. СЛОЖНОСТЬ СХЕМ Пусть С — произвольная схема глубины d и сложности s, состоящая из элементов И, ИЛИ, НЕ и M00I3. Важный факт, доказанный Разборовым, заключается в том, что функция, которую реализует С, может быть довольно хорошо приближена (в зависимости от d и s) полиномом относительно малой степени над полем GF(3). Это доказывается с помощью следующего применения вероятностного метода. Каждый элемент схемы С заменим приближающей полиномиальной операцией, согласно следующим правилам, гарантирующим, что в каждой вершине новой схемы мы вычисляем полином над полем GF(3), принимающий только значения 0 и 1 (если на входы подаются только 0 и 1). (i) Каждый элемент-отрицание у заменяется полиномиальным элементом (1-у). (ii) Каждый Моёз-элемент Мос1з(2/1, • • • ,2/т) заменяется полиномиальным элементом (yi + у2 + ... + Ут)2- Правило для замены элементов ИЛИ и И немного сложнее. Заметим, что в двух предыдущих случаях (i) и (ii) не было приближенных вычислений; новые элементы вычисляют в точности то же, что и старые, для всех возможных булевых значений переменных. В принципе, это может быть сделано и здесь. Элемент И у\ А... /\ут следует просто заменить произведением у\.. .ут. Тогда элемент ИЛИ yi V ... V ут может быть вычислен по правилам де Моргана. Так как у\ V ... V ут = (уг А ... Л ут) и у реализуется как (1 — у)) это дает представление l-(l-»l)(l-|/2)...(l-l/m). (П.6) Проблема в том, что эта процедура слишком сильно увеличила бы степень наших полиномов. Значит, нам нужно поступить немного хитрее. Пусть £ — целое число, которое мы определим позже. По элементу ИЛИ у\ V ... V уш мы выбираем £ случайных подмножеств Д,..., Ig множества {1,..., га}, где для каждого 1 ^ г ^ £ и для каждого 1 ^ j ^ га независимо Pr[j E Ii] = 1/2. Заметим, что для любого фиксированного г, 1 ^ г ^ £, сумма ( Y1 Уз) Xjeh J над полем GF(3) обязательно равна 0, если у\ V ... V уш = 0, и равна 1 с вероятностью не меньше ^, если у\ V ... V ут = 1. Таким образом, если мы вычислим значение ИЛИ от £ выражений ( YLVj) , 1 ^ ^ ^, то эта функция равна 0, если у\ V ... V ут = 0, и равна 1 с вероятностью не меньше 1 — (1/2)£, если у\ V ... V уш = 1. Тогда мы вычислим ИЛИ и запишем результат в виде полинома, как это было сделано в формуле (11.6). Это дает -fil'-fe*)]- Следовательно, в нашей новой схеме мы заменим каждый элемент ИЛИ на приближающий полиномиальный элемент вида (11.7). Получив приближение для элемента ИЛИ, мы можем получить соответствующее приближение и для элемента И, применяя правила де Моргана. Так как
11.3. ЕЩЕ О СХЕМАХ ОГРАНИЧЕННОЙ ГЛУБИНЫ 215 2/i Л.. .Лут = (уг V ... V t/m), мы заменяем каждый элемент И вида у\ А... /\уш \ (11.8) / Заметим, что степени полиномов (11.7) и (11.8) не превосходят 2£. В исходной схеме С глубины d и сложности s мы теперь можем заменить все ее элементы нашими приближающими полиномиальными элементами и получить новую схему СР, которая зависит от всех случайных выборов, сделанных при каждой замене каждого элемента И/ИЛИ. Новая схема СР вычисляет полином Р(х\,..., хп) степени не больше (2£)d. Более того, для любых фиксированных булевых значений xi,X2,---,xn вероятность того, что все новые элементы вычисляют то же, что и соответствующие элементы в С, не меньше 1 — s/2e. Следовательно, ожидаемое число входных значений, на которых P(xi,...,xn) совпадает с выходными значениями С, не меньше 2n(l — s/2e). Таким образом, мы доказали следующее утверждение. Лемма 11.3.1. Для любой схемы С глубины d и слоэюности s от п булевых переменных, использующей элементы НЕ, ИЛИ, И и Мос1з, и для любого целого £ существует полином Р = Р(х\,..., хп) степени не больше (2£)d над полем GF(3), значение которого совпадает с функцией, реализуемой схемой С, не менее чем на 2п(1 — s/2е) входных наборах. Чтобы применить эту лемму для получения нижних оценок сложности любой схемы описанного выше типа, реализующей счетчик четности, нам потребуется следующий дополнительный комбинаторный результат. Лемма 11.3.2. Не существует полинома P(xi,...,xn) над полем GF(3) степени не больше у/п, равного счетчику четности от #i,...,a;n на множестве S из не менее чем 0.9 • 2п различных булевых векторов (х\,..., хп). Доказательство. Предположим, что это не так, и что S С {0,1}п, \S\ ^ 0.9-271 и Р(х\,..., хп) = Х\ 0 • • • 0 хп для всех (х\,..., хп) G 5. Определим полином Q = Q(yu ..., уп) как Q = Q{yu ...,уп) = Р(уг + 2,..., уп + 2) - 2 и множество Т = {(yi,...,y«) G {1,-1}п : (yi + 2,..., уп + 2) G 5}, где все суммы берутся по модулю 3. Ясно, что степень многочлена Q не п превосходит у/п, и Q(yu ,..., уп) = Ц у{ для всех (ух,..., уп) G Т. Пусть г=1 теперь G = G(yi,... ,уп) : Т —> GF(3) — произвольная функция. Расширим ее произвольным образом до функции из (GF(3))n —> GF(S) и запишем эту функцию как полином от п переменных. Очевидно, что любая функция из (GF(3))n —* GF(3) является полиномом, так как может быть представлена п в виде линейной комбинации функций вида П(Уг ~ £г)(Уг ~ £г ~ 1)? гДе г=1 Si G GF(2>). Заменим каждое вхождение yf в этом полиноме на 1, чтобы п г=1 Е(!-%) jeu
216 Глава 11. СЛОЖНОСТЬ СХЕМ получить полилинейный полином G, совпадающий с G на Т. Теперь заменим каждый одночлен П Уи где \U\ > § + ^, на П Уг ' Я(Уи---,Уп), и этот новый полином заменим на полилинейный полином G, снова заменяя каждое п » yf на 1. Так как для у{ е {±1}, П yt • П yt = П yi,G равно G на Т, и его i&U г=1 г<ЕС/ степень не превосходит § + 2 • ^ем не менее? число возможных G равно I — 4- v^ I 3Ег=о (?) < з0-88271, в то время как число возможных G равно З'т' ^ З0,9 2?г. Это невозможно, а значит верно утверждение леммы. ■ Следствие 11.3.3. Не существует схемы глубины d и сложности 1 ln1/2d 5^-^22 f реализующей счетчик четности от Х\,хъ,... ,хп, состоящей из элементов НЕ, И, ИЛИ и Мос1з. Доказательство. Предположим, что это не так, и пусть С —такая схема. Положим £ = ^ • п1/2^. По лемме 11.3.1 существует полином Р = Р(х\,..., хп) над полем GF(3), степень которого не превосходит (2£)d = yfn, равный счетчику четности от х\,..., хп не менее чем на 2П(1 1 s1/2d ) > 0.9 • 2П входных 2гп значениях. Это противоречит лемме 11.3.2, что завершает доказательство. ■ 11.4. МОНОТОННЫЕ СХЕМЫ Булева функция / = f(x\,..., хп) называется монотонной, если из условий f{xi,...,xn) = 1 и Х{ ^ yi следует, что /(yi,... ,уп) = 1. Монотонная 2-схема — это 2-схема, содерж:ащая только 2-входовые элементы И и ИЛИ. Нетрудно видеть, что функция монотонна тогда и только тогда, когда существует вычисляющая ее монотонная 2-схема. Сложность монотонной функции в классе монотонных схем — это минимальная сложность вычисляющей ее монотонной 2-схемы. До 1985 г. лучшей известной нижней оценкой для сложности монотонной NP-функции от п переменных было 4п. Существенное улучшение было получено в фундаментальной работе [Разборов (1985)], в которой установлена оценка nn^ogn^ для сложности характеристической функции множества клик размера к (равной 1 тогда и только тогда, когда граф содержит клику размера к). Вскоре после этого Андреев (1985), используя аналогичные методы, получил экспоненциальную нижнюю оценку для несколько искусственной NP-функции. Алон и Боппана [Alon and Boppana (1987)] усилили комбинаторные соображения Разборова и доказали экспоненциальную нижнюю оценку для сложности кликовой функции в классе монотонных схем. В этом разделе мы опишем особый случай этой оценки, показав, что не существует монотонных схем линейной сложности, определяющих, содержит ли данный граф треугольник. Хотя этот результат гораздо слабее приведенных выше, он хорошо иллюстрирует все вероятностные соображения более сложных доказательств и обходит некоторые комбинаторные тонкости.
11.4. МОНОТОННЫЕ СХЕМЫ 217 Положим п = (™), и пусть х\, #2, • • • ,хп — п булевых переменных, представляющих ребра графа на множестве вершин {1,2, ...,т}. Пусть Т = = Т (х 1,... ,хп) — монотонная булева функция, чье значение равно 1, если соответствующий граф содержит треугольник. Ясно, что существует монотонная 2-схема сложности О (га3), вычисляющая функцию Т. Поэтому следующая теорема неулучшаема с точностью до константы. Теорема 11.4.1. Сложность монотонной схемы для Т не меньше n(ra3/log4ra). Перед тем как приводить доказательство этой теоремы, введем некоторые обозначения и докажем простую лемму. Для любой булевой функции / = f(xu...,xn) положим A(f) = {(хг,...,хп) Е {0,1}П : f(xu • • •, хп) = 1}. Ясно, что A(f V g) = A(f) U A(g) и A(f Л g) = A(f) n A(g). Пусть С- монотонная схема сложности s, вычисляющая функцию / = /(#i,..., жп). Ясно, что С дает монотонную прямолинейную программу длины s, вычисляющую /, т. е. последовательность функций Жь #2,..., жп, /ь ..., Д, гДе fs = /, и каждая Д, где 1 ^ г ^ s, либо ИЛИ, либо И какой-то пары предшествующих функций. Применяя операцию А, получим последовательность А(С) подмножеств (0,1)П : А-п = АХп,..., A_i = АХ1,А\,..., А8, где AXi = A(xi),As = A(f), и каждое Ai, где 1 ^ г ^ s, есть либо объединение, либо пересечение какой-то пары предшествующих подмножеств. Заменим последовательность А (С) на приближающую последовательность М(С) : М-п = МХп = АХп,..., М_1 = МХ1 = АХ1, Мь ..., М8, определяемую заменой операций объединения и пересечения в Л (С) на приближающие операции U и П соответственно. Точное определение этих двух операций будет дано позже, причем для всех допустимых М и L будут выполняться включения MULDMUL, МПЬСМПЬ. (11.9) Тогда MXi = AXi для всех 1 ^ г ^ п, и если для некоторых 1 ^ j'^ s верно Aj = At \J Ak, то Mj = Me U М^, в то время как если Aj = Ai П Ак, то Mj = М^ П Mfc. В первом случае положим 6^ = Mj \ (Mi U Мк) и #п = 0, а во втором случае положим #п = (М* П Мк) \ Mj и £ц = 0. Лемма 11.4.2. Ддл всех М{, членов последовательности М(С), имеют место включения , v Ai \ j (J $ ) С Mi С Л,и (J <ft. (11.10) Доказательство. Применим индукцию по г. При г < 0 имеем М» = Ai, a значит формула (11.10) верна. Предположим, что вложение (11.10) выполнено для всех Mj при j < г, и докажем это для г. Если Л» = ^ U Ajt, то по предположению индукции Mi = Mi\jMk\J8luC AiUAkU (J 63и = A{U (J 63u
218 Глава 11. СЛОЖНОСТЬ СХЕМ Mi = MeUMkDMeUMkD I At \ {\J S>n)\ U I Ak\ ((J <ft) 1 D \ j<t J \ j^k / элл(и^п), (n.ii) что и требовалось доказать. Случай А{ = At П Аь доказывается аналогично. ■ Лемма 11.4.2 верна при любом выборе операций U и П, удовлетворяющих соотношениям (11.9). Чтобы доказать теорему 11.4.1, определим эти операции следующим образом. Положим г = 100 log2 т. Для любого множества Д, содержащего не более г ребер на V = {1,2, ...,т}, пусть |~Д] обозначает множество всех графов на V, содержащих по крайней мере одно ребро из Д. В частности, |~0] — это пустое множество. Пусть [*] обозначает множество всех графов. Все элементы М(С) будут иметь вид |~Д] или [*]. Заметим, что AXi = MXi — это просто множество [Д], где Д —это множество, состоящее из единственного соответствующего ребра. Для двух множеств Дх и Д2, каждое из которых содержит не более г ребер, положим \R{\ П \R2] = \Ri П Д2~|, \Ri] П [*] = \R{] и [*] П [*] = |Y|. Аналогично, если \Ri U Д2| ^ г, мы определим \R\] U |~Д2] = \R\ U Д2~|, в то время как если \Ri U Д2| > г, то \R{\ U [Д2] = Г*~|. Наконец [*] U \RX] = \*\ U [*] = [*]. Доказательство теоремы 11.4.1. Теперь мы докажем теорему 11.4.1, показав, что не существует монотонной схемы сложности s < (™)/2г2, вычисляющей функцию Т. Действительно, предположим, что это не так, и пусть С — такая схема. Пусть М(С) = МХп,..., МХ1, М\,..., Ms — приближающая последовательность длины s, полученная из С описанным выше способом. По лемме 11.4.2 . . А{Т) \ I U &п ) С Ms С A(T)U (J #,. (11.12) Рассмотрим два возможных случая. Случай 1: Ms = [Д], где |Д| ^ г. Выберем случайный треугольник Л на {1,2,...,га}. Ясно, что Рг(Д€М.)<г.(т-2)/(™)<1. Более того, для каждого фиксированного j,j ^ s, Рг(Д€<йХг2/(-). Это объясняется тем, что если 5^ ф 0, то 53п = (\Ri\ П |~Д21) \ № п ^1 для некоторых двух множеств Ri,R2, содержащих не более г ребер. В эту разность входят только треугольники, содержащие ребро из R\ и ребро из Д2 (и ни одного ребра из обоих). Существует не больше г2 таких треугольников, из чего следует последнее неравенство. Так как s < (™)/2г2, из двух последних
11.5. формулы 219 неравенств получаем, что Рг[Л £ Ms иД^и 5^] > 0, а значит, существует такой треугольник Л. Этот треугольник принадлежит А(Т), что противоречит (11.12), поэтому случай 1 невозможен. Случай 2: Ms = [*]. Пусть В — случайный остовный полный двудольный граф на множестве V = {1,2, ...,т}, полученный раскрашиванием каждой вершины из V случайно и независимо в цвета 0 и 1, в котором две вершины соединены ребром тогда и только тогда, когда они разных цветов. Так как Ms — множество всех графов, В Е Ms. Также В £ А(Т), так как он не содержит треугольников. Мы утверждаем, что для любого фиксированного 7 7* "^ S Рг(В € 6>и) «S 2-^2 < -Дг- (И-13) Действительно, если SJU ф 0, то 6^ = [*] \ (\R{] U №1), где |Дх U R^\ > г. Рассмотрим граф с множеством ребер Ri U R2. Пусть d — его максимальная степень. По теореме Визинга множество его ребер может быть разбито не более чем на d+ 1 паросочетаний. Значит, или d > *(f, или размер максимального паросочетания в этом графе не меньше \/г/2. Следовательно, наш граф содержит множество из к = у/г/2 ребер ei,..., е^, которые образуют либо звезду, либо паросочетание. В каждом из этих двух случаев Prfe^ E В] = ^, и эти события попарно независимы. Тогда Рг[В 0 №1 U №1] ^ 2~^/2, и отсюда следует неравенство (11.13). Заметим, что аналогичная оценка может быть получена без теоремы Визинга, если воспользоваться тем, что В не принадлежит {\R\~\ U [Дг!) тогда и только тогда, когда вершины в любой связной компоненте графа с множеством ребер Ri U R% раскрашены в В в один цвет. Так как s < (^)/2r2 < m5, из неравенства (11.13) следует, что существует двудольный граф В, такой что В Е Ms, В £ А(Т) и В £ U 53и. Это противоре- чит (11.12). Следовательно, случай 2 невозможен, и теорема 11.4.1 доказана. ■ 11.5. ФОРМУЛЫ Напомним, что формула —это схема, в которой число выходов каждого элемента не превосходит 1. В отличие от случая со схемами, есть сверхлинейные нижние оценки минимальной сложности формул, вычисляющих различные явные NP-функции над полным двоичным базисом. Для булевой функции / = /(#!,... ,хп) обозначим через L(f) минимальное число элементов И и ИЛИ в формуле, использующей элементы И, ИЛИ и НЕ и вычисляющей /. В силу правил де Моргана, мы можем считать, что все элементы НЕ входят в первый уровень этой формулы. Мы завершаем эту главу простым результатом Субботовской (1961), который заключается в том, что L(f) > Q(n3/2) для счетчика четности / = Х\ ф... (Вхп. Эта оценка была позднее улучшена Храпченко
220 Глава 11. СЛОЖНОСТЬ СХЕМ (1971) до L(f) = п2 — 1. Тем не менее, мы представляем здесь лишь более слабую нижнюю оценку Q(n3/2) не только потому, что это позволит еще раз продемонстрировать силу относительно простых вероятностных приемов, но и потому, что модификация этого доказательства позволила Андрееву (1987) получить нижнюю оценку Q(n5/2/(\ogn)°^) на L(g) для другой NP-функции д = д(х\,..., хп). Хостад [Hastad (1998)] позднее улучшил эту нижнюю оценку до Q(n3~°^). В настоящее время это лучшая из известных нижняя оценка сложности формулы для NP-функции от п переменных над полным базисом. Метод Субботовской основан на случайных ограничениях, аналогичных использованным в разд. 11.2. Главная лемма заключается в следующем. Лемма 11.5.1. Пусть f = f(x\,..., хп) — булева функция от п переменных, не являющаяся атомом. Тогда существуют г, 1 ^ г ^ п, и е £ {0,1}, такие, что для функции g = f(x\,..., #i_i,£, #г+ь • • •»хп) от п — 1 переменных, полученной из f заменой Хг = е, верно следующее неравенство: (L(g) + 1) < (l - J-) (L(f) + 1) < (l - i) (L(f) + 1). Доказательство. Зафиксируем формулу F, вычисляющую функцию /, с / = L(f) элементами И и ИЛИ. Формула F может быть представлена как двоичное дерево, каждый из / 4- 1 листьев которого помечен атомом Xi или Х{. Случайно выберем переменную Х{, 1 ^ г ^ п, согласно равномерному распределению, и присвоим ей случайное двоичное значение е G {0,1}. Когда мы заменяем значения е и 1 — е на Х{ и Хг соответственно, число листьев F уменьшается; математическое ожидание числа листьев, удаляемых таким образом, равно (/ 4- 1)/гс. Однако, может произойти дальнейшее сокращение. В самом деле, предположим, что лист помечен символом Х{, и питает, допустим, элемент И Хг Л Н в F. Мы можем считать, что переменная Хг не входит в подформулу Я, так как в противном случае F может быть упрощена заменой Xi = 1 в Н. Если Хг = в = 0, то Н может быть удалена после того, как мы заменим значение для Х{, тем самым еще сильнее сокращая число листьев. Так, аналогичный эффект получается, если взять элемент ИЛИ вместо И (а также если взять Х{ вместо хг), математическое ожидание числа дополнительно удаленных листьев не меньше (/ 4- 1)/2п. Следовательно, математическое ожидание числа оставшихся в упрощенной формуле листьев не превосходит (I + 1)[1 — ^], что и требовалось доказать. ■ Многократно применяя лемму 11.5.1, получим Следствие 11.5.2. Если f = f(xi,...,xn) и L(f) ^ (f)3^2 - 1, то можно так присвоить значения п — к переменным, что получившаяся функция g будет атомом.
11.6. УПРАЖНЕНИЯ 221 Доказательство. Применение леммы 11.5.1 п — к раз дает функцию д, для которой п , 1 v 3/2 № + !)< П х"7 №(/) + i) = (*/n)3/2№(/) + i)^i. Значит, д равно либо #i, либо x~i для некоторого г. ■ Следствие 11.5.3. Для счетчика четности f = х\ 0 ... 0 хп справедливо равенство я. /о ад>(|Г-1. 11.6. УПРАЖНЕНИЯ 1. Показать, что существует такая константа с, что число булевых 2-схем сложности s не превосходит (cs)s. 2. Пусть / — булева формула над п переменными х\, #2, • • •, хп, где / — конъюнкция произвольного (конечного) числа скобок, каждая скобка —дизъюнкция 10 букв, где каждая буква — это или переменная, или ее отрицание, и пусть каждая переменная входит (с отрицанием или без) не более чем в 10 скобок. Доказать, что / выполнима. 3? Доказать, что существует ограниченная по глубине монотонная схема полиномиальной сложности с п входами х\, #2, • • •, хп, вычисляющая функцию /, принимающую значение 1, если ]СГ=1 х* ^ п/2 + n/^0&2ni и 0, если ]СГ=1 Xi ^ п/2 ~ п/ 1о&2 п-
ВЕРОЯТНОСТНЫЙ ВЗГЛЯД: Максимальные антицепи Семейство Т подмножеств множества {1,..., п) называется антицепью, если ни одно множество из Т не содержится в другом. Теорема. Пусть Т — антицепь. Тогда <1. LWU лет Доказательство. Пусть а — равновероятно выбранная перестановка на множестве {1,..., п). Положим С. = {{a{j) : 1 ^ j ^г} :0 ^г ^п}. (В случаях г = О и г = п мы получим 0, {1,..., п) ЕС, соответственно.) Введем случайную величину Х = \ГПС„\. Рассмотрим разложение X=J2XA, Ает где Ха — индикатор события «A Е С». Тогда E[XA} = Pr[AeC<7] = l/^ так как CG содержит ровно одно множество размера |А|, которое выбирается равновероятно среди всех множеств размера \А\. Из линейности математического ожидания следует, что «"i-S'/W- Aer Са образует цепь для любого сг, следовательно, каждая пара множеств сравнима. Так как ^ — антицепь, должно выполняться неравенство X = \ТС\ Са\ ^ 1- Следовательно, Е[Х] ^ 1. ■ Следствие (теорема Шпернера). Пусть Т — антицепь. Тогда Доказательство. Функция (™) достигает максимума при х = [п/2\, так что 4-*L ( п Ml ""■-■■> '■;,)'
12 Разброс Тайна и величие математики состоит не столько в том, что абстрактные теории оказываются полезными на практике, но в чудесном свойстве, что теория, предназначенная для решения одного типа задач, часто дает единственно верный путь решения проблем совершенно иного толка, задач, для которых теория не была предназначена. Такие совпадения происходят настолько часто,* что должны отражать саму суть математики. Жан-Карло Рота 12.1. ОСНОВЫ Рассмотрим некоторое конечное семейство конечных множеств. Нам нужно раскрасить точки множеств в красный и синий цвета так, что бы каждое из множеств содержало примерно одинаковое количество красных и синих точек. Может оказаться, что наша задача невыполнима, например, если семейство состоит из всех подмножеств некоторого множества Q. Тогда, независимо от раскраски, найдется монохроматическое множество, состоящее не менее чем из половины точек Q. В противоположной ситуации, когда множества семейства не имеют общих элементов, задача становится тривиальной. В этом случае можно так раскрасить точки множеств, что все множества будут иметь либо равное количество красных и синих точек, либо их количество будет отличаться на единицу, если мощность множества нечетна. Разброс будет определять, насколько хорошую раскраску мы можем найти. Дадим формальное определение разброса. Рассмотрим семейство Л подмножеств множества Q. Отказавшись от использования красного и синего цветов, определим раскраску как отображение Для каждого А С П положим Х(А) = ^2х(а). Определим разброс Л относительно \ равенством disc(Ax) = тах|х(А)| Аел и разброс Л формулой disc(*4) = min disc(A у).
224 Глава 12. РАЗБРОС Следующее эквивалентное определение разброса открывает нам его геометрический смысл. Рассмотрим множества Л = {Si,..., 5m}, ft = {1,..., п} и матрицу инцидентности В = [bij] размерности т х п такую, что bij = 1, если j Е Si, и bij = О иначе. Раскраска \ может быть задана вектором и = (х(1),..., х(п)) Е {-1, +1}п, так что ВиТ = (x(5i),..., *(Sm)) и discL4) = min IBi^loo, u€{-l,+l}n где |г;|оо означает норму L°°, т. е. максимальное из абсолютных значений координат. Иными словами, обозначив j-й столбец матрицы В (образ точки j) через Vj, получаем, что disc (Л) = min \±vi ± ... ±vn\00, где минимум берется по всем 2п возможным вариантам выбора знаков. Далее нас будут интересовать верхние оценки разброса. Пусть disc (Л) ^ К, тогда и только тогда, когда существует раскраска х? для которой |х(Л)| ^ К для всех A Е Л. Естественно будет воспользоваться случайной раскраской. Теорема 12.1.1. Пусть Л —семейство из п подмножеств т-множе- ства ft. Тогда disc (Л) ^ а/2ш1п(2п). Доказательство. Рассмотрим случайную раскраску \ : ft —► { —1,+1}. Для каждого А С ft введем случайную величину Ха — индикатор события \х(А)\ > ai гДе а — у/2т\п(2п). Если \А\ = а, то х(А) имеет распределение Sa, тогда по теореме А. 1.1 Е[ХА] = Рт[\Х(А)\ >а}< 2e"a2/2a ^ 2e"a2/2m = 1/п при нашем выборе а. Обозначим через X число множеств A Е Л таких, что \х(А)\ > а. Тогда X=J2XA, Аел и из линейности математического ожидания следует, что Е[Х]=£Е[Хл]<|Д|(1/п) = 1. Аел Тогда найдется такая раскраска х, что X = 0. Это означает, что disc(v4, x) ^ a и, следовательно, disc(*4) ^ а. Ш 12.2. ДОСТАТОЧНОСТЬ ШЕСТИ СТАНДАРТНЫХ ОТКЛОНЕНИЙ В случае, когда семейство Л состоит из п подмножеств n-множества, по теореме 12.1.1 имеем disc(^) = 0(v/nln(n)).
12.2. ДОСТАТОЧНОСТЬ ШЕСТИ СТАНДАРТНЫХ ОТКЛОНЕНИЙ 225 Следующая теорема дает нам лучшую оценку. Ее доказательство аналогично доказательству основного результата работы [Beck (1981)]. Подход с использованием энтропии был предложен Р. Боппана. Теорема 12.2.1 [Spencer (1985а)]. Пусть Л — семейство из п подмножеств п-множества Q. Тогда disc(*4) < 6\/п. При случайной раскраске х : ^ -+ { —1,4-1} и Л G Л величина х(А) имеет нулевое математическое ожидание и дисперсию, не превосходящую у/п. Если |х(Л)| > 6у/п, то х(А) находится на расстоянии не менее шести стандартных отклонений от своего среднего значения. Вероятность этого события очень мала, но, тем не менее, является некоторой положительной константой, а число множеств A G Л стремится к бесконечности с ростом п. Таким образом, случайная раскраска \ почти всегда не будет, искомой. Константа 6 (в действительности, 5.32) является результатом специальных вычислений и может быть улучшена. Мы не будем здесь касаться этих вычислений. Вместо этого докажем теорему 12.2.1 с заменой множителя 6 константой 11. Отображение X:fi—> {-1,0,4-1} назовем частичной раскраской. Если х{°) — 0> будем говорить, что точка а не раскрашена. Определим х{А) так же как и раньше. Лемма 12.2.2. Пусть Л — семейство из п подмножеств п-множества Q. Тогда найдется частичная раскраска х> такая, что не более 10~9п точек останутся не раскрашенными и \Х(А)\ ^ 10VH для всех A G Л. Значения 10 и 10~9 не являются наилучшими. Важно, что это — абсолютные константы. Обозначим для определенности множества семейства Л через Ai,..., Ап. Рассмотрим случайную раскраску х-п^ {-i,+i}. Для каждого 1 ^ г ^ п определим bi = ближайшее целое число к x(Ai)/(2®Vn)- Например, bi = 0 при — 10у/п < x{Ai) < №у/п и bi = -3 при —70у/п < x(Ai) < — 50у/п. Из теоремы АЛЛ (также как в доказательстве теоремы 12.1.1) следует, что Рт[Ы = 0] > 1 - 2е"50, Рг[^ = 1] = Рг[^ = -1]<е-50, рт[Ъ{ = 2] = Рт[Ь{ = -2] < е"450,
226 Глава 12. РАЗБРОС и, в общем случае, рТ[Ъг =S}= Pr[bi = -8] < е"50^"1)2. Оценим теперь энтропию H[bi]. Это важное понятие подробно рассматривается в разд. 14.6. Положим pj = Pr[bi = j], тогда +оо H(bi) = Yl ("W l0^(Pj)) ^ (1 - 2e-50)[- log2(l - 2e-50)]+ j=-oo + 2e-50[- log2 e-50] + 2e"450[- log2 e"450] + ... . Бесконечная сумма, очевидно, сходится и строго мажорируется своим вторым слагаемым. Вычисления показывают, что H(bi) < е = 3 х 1(Г20. Рассмотрим теперь вектор (bi,... ,ЬП)- Безусловно, между различными bi могут быть взаимосвязи. В самом деле, если Si и Sj мало отличаются, то bi и bj будут, скорее всего, одинаковыми. Но по утверждению 14.6.2 энтропия субаддитивна. Следовательно, п Я((Ь1,...,Ь„))^5]я(Ь0^еп. г=1 Если случайная величина Z не принимает ни одно из значений с вероятностью, большей 2""*, то H(Z) ^ t. Из утверждения, обратного к данному, следует, что найдется вектор (si,..., sn) такой, что Pr[(b1,...,bn) = (5l,...,sn)]^2-£n. Наше вероятностное пространство состоит из 2П равновероятных раскрасок \- Следовательно, найдется множество С, состоящее по крайней мере из 2^1_е^п раскрасок \ : ^ —* {~ 1? +1}? имеющих одни и те же значения (bi,..., Ьп)- Будем рассматривать класс С всех раскрасок \ : ^ —* {~ 1>+1} как кУб Хэмминга { — 1,+1}пс введенной на нем метрикой Хэмминга Р(х,х') = |{а:х(а)^х'(а)}|. В работе [Kleitman (1966a)] было доказано, что если V С С и при г ^ т|, то множество 1> имеет диаметр по крайней мере 2г. То есть множество данного размера с минимальным диаметром есть шар. (То, что множество V имеет диаметр по крайней мере г, доказывается тривиально. Этого было бы достаточно для доказательства леммы 12.2.2 и теоремы 12.2.1 с худшими значениями констант.) Доказательство. Мы можем положить г = an, если а < \, и 2Н(а) ^ 2\-е
12.2. ДОСТАТОЧНОСТЬ ШЕСТИ СТАНДАРТНЫХ ОТКЛОНЕНИЙ 227 Вычисления показывают, что мы можем взять а = | (1 —10 9). (Из разложения в ряд Тейлора следует, что Н(.1 Л„1_ *2 \2 ) In 2 при малых х.) Тогда множество С имеет диаметр по крайней мере п(1 — 10~9). Пусть раскраски ХьХ2 € С находятся на максимальном расстоянии друг от друга. Положим Х 2 * Заметим, что х — частичная раскраска множества Q. Заметим также, что х(о) = 0 тогда и только тогда, когда Xi(a) — Х2(а), что верно для п — р(хьХ2) ^ 10~9п координат а. И, наконец, наиболее критический момент: для каждого г, 1 ^ г ^ п раскраски Хъ Х2 дают одно и тоже значение bi, а это означает, что величины XiO^t) и Х2(^4г) находятся внутри интервала длины 20у/п. Следовательно, \xi(Ai)-X2(Ai)\ \x(Ai)\ = ^ 10у/п, что и требовалось доказать. ■ Для доказательства теоремы 12.2.1 требуется раскраска всех точек множества, в то время как лемма 12.2.2 оставляет 10~9п точек нераскрашенны- ми. Идея дальнейших действий заключается в последовательном применении процедуры раскраски из леммы 12.2.2, которая оставит нераскрашенными, скажем, 10~~18п точек на втором шаге. Но мы не можем применить лемму 12.2.2 напрямую, так как нарушена симметричность ситуации —у нас на п множеств приходится только 10~9п точек. Лемма 12.2.3. Пусть А — семейство из п подмножеств г-множества Q при г < 10~9п. Тогда найдется частичная раскраска х множества ft с не более чем 10~40г нераскрашенными точками, такая, что \Х(А)\ < 10y/fy/]n(n/r) для всех A G А. Доказательство. Мы опишем доказательство, которое оставляет простор для улучшений. Обозначим через А\,..., Ап множества семейства Л. Рассмотрим случайную раскраску х : ^ —* { — 1? +!}• Положим bi = ближайшее целое число к . 20т/гу/\п(п/г) для каждого 1 ^ г ^ п. Вероятность того, что bi = 1, менее (г/п)50. Энтропия Н(bi) мажорируется соответствующим слагаемым, следовательно, (;)" [-*.((;)") < КГ100-. П
228 Глава 12. РАЗБРОС Тогда энтропия (Ь\,... ,Ьп) меньше 10~100г. Найдем пару практически противоположных раскрасок хъ Х2 с одинаковыми b и положим \ — (Xi — Хг)/2, как и в предыдущем случае. ■ Доказательство теоремы 12.2.1. Применим лемму 12.2.2 для нахождения X1, и затем, последовательно применяя лемму 12.2.3, будем получать раскраски х2?Х3?--- Д° тех П0Р? пока все точки не окажутся раскрашенными. Обозначим через х итоговую раскраску. Для каждого А Е Л верно, что Х(А) = Х1(А) + )?(А) + ... \х(А)\ ^ lOVn + 10\/l0-9n\/ln 109+ + 10VlO-49n\/ln 1049 + 10у/Ю-89пу/\п 1089 + ... . При вынесении у/п за скобку получаем сходящийся ряд. Отсюда выводим оценку |Х(А)| ^ 11л/й с возможностью уточнения. ■ Пусть семейство Л состоит из п подмножеств г-множества и г < п. Мы можем последовательно применять лемму 12.2.3 (сначала применив лемму 12.2.2, если г > 10~9п) для получения такой раскраски х? что disc(*4, х) < Ky/fy/ln(n/r), где К — абсолютная константа. При г = п1~°^ эта оценка лучше оценки для случайной раскраски из теоремы 12.1.1. 12.3. ЛИНЕЙНЫЙ И НАСЛЕДСТВЕННЫЙ РАЗБРОС Пусть Л = {А\,... ,Ап} и ft = {1,...,га}, га > п. Заметим, что утверждение disc (Л) ^ К эквивалентно существованию множества S = {j : xU) — +1}? такого, что величина \S П А\ отстоит не более чем на К/2 от \А\/2 для всех множеств А Е А. Определим линейный разброс lindisc(*4) равенством lindisc(*4) = max min maxl > (вг — р*)\. Pi,...,Pme[0,l]ei,...,eme{0,l} AtA ^ Неравенство lindisc(v4) < К означает, что при любых заданных pi,...,pm найдется их «одновременное округление» £i,..., £m, такое, что для множества S = {J '• ез = 1} величина \S П А\ отстоит не более чем на К от суммы весов YlieAPj Для всех множеств A Е Л. Если положить pj = |, то из этой верхней оценки вытекает, что disc (Л) < 2К. Но из утверждения lindisc(*4) ^ К можно вывести гораздо более сильные следствия. Например, если положить Pj = |, то из него следует существование множества 5, для которого величина \S П А\ находится на расстоянии не более чем К от \А\/3. Линейный разброс, а также описанный ниже наследственный разброс были впервые введены в
12.3. ЛИНЕЙНЫЙ И НАСЛЕДСТВЕННЫЙ РАЗБРОС 229 работе [Lovasz, Spencer and Vesztergombi (1986)]. Для произвольного множества X С ft обозначим через Л\х ограничение А по X, т. е. семейство {А П X : A G А}. Следующий результат сводит оценку disc(v4) в ситуации, когда точек больше чем множеств, к оценке lindisc(v4) в случае, когда число точек не превышает числа множеств. Теорема 12.3.1. Пусть Л —семейство из п подмножеств т-множества и т > п. Тогда, если lindisc(v4|x) ^ К для каждого подмножества X мощности не более п, то lindisc(*4) ^ К. Доказательство. Пусть заданы некоторые pi,... ,pm € [0,1]. Опишем процесс сведения оценки disc (Л) к оценке lindisc(*4). Назовем индекс j фиксированным, если pj G {0,1}, иначе назовем его плавающим. Обозначим через F множество всех плавающих индексов. Остановим процесс в случае, когда |F| ^ п. Пусть |F| > n, j G F и yj —ненулевое решение однородной системы jtAHF Такое решение существует, так как система содержит больше переменных (\F\) чем уравнений (п), и может быть найдено стандартными методами линейной алгебры. Положим pj=pj + \yj, jeF, Pj=Pj, j&F, где Л — действительное число с наименьшим абсолютным значением, такое, что для некоторого j G F величина p'j становится равной нулю или единице. Заметим, что z2p,j = z2pj + x zZ yj = z2pj (*) jeA jeA jeAnF jeA для всех множеств A E А. Повторим описанную процедуру с новыми р'. На каждой итерации по крайней мере один индекс j становится фиксированным, так что процесс остановится при некоторых Pi,---?Pm- Обозначим через X получившееся множество плавающих индексов j. Имеем \Х\ ^ п. По предположению теоремы существует набор £j, j G X, такой, что jeAnx ^К, АеА. Положим £j = p'j для всех j g X. Так как равенство (*) выполняется на каждой итерации, то jeA jeA Следовательно, для всех A G А. jeA jeAnx ^к
230 Глава 12. РАЗБРОС Определим наследственный разброс herdisc(*4) следующим образом: herdisc(*4) = maxdisc(.4|x)- Пример. Положим Q = {1,...,п} и пусть семейство Л состоит из всех интервалов [i,j] = {г, г + 1,... ,j}, где 1 ^ г ^ j ^ п. Тогда disc(v4) = 1, так как мы можем раскрасить элементы множества Q поочередно +1 и — 1. Аналогично herdisc(v4) = 1. Для каждого множества X С 1), состоящего из элементов #1 < #2 < • • • < #г, мы можем раскрасить X попеременно х(хк) = (—l)fc- Тогда для каждого интервала [i,j] Е Л элементы множества [г,,?'] П X будут раскрашены поочередно в разные цвета. Теорема 12.3.2. Справедливо неравенство lindisc(v4) ^ herdisc(v4). Доказательство. Пусть К = herdisc(v4). Кроме того, пусть семейство Л состоит из подмножеств множества Q = {1,...,т}. Рассмотрим некоторый набор pi,...,pm Е [0,1]. Предположим, что все числа pi имеют конечную длину записи в двоичной системе счисления. Обозначим через Т наименьшее целое число, такое, что pi2T Е Z. Обозначим через J множество индексов г, для которых Т-я цифра записи числа pi в двоичной системе счисления равна единице, т. е. тех, для которых Pi2T~1 £ Z. Так как disc(v4|j) ^ К, найдется набор Sj Е {-1,4-1}, такой, что jeJnA для всех множеств А Е Л. Положим pj = p\ • Пусть (т-1) = [ pf] при j £ J, Рз \ р{р+е#-т npnjEJ. Таким образом, числа /г ~ ^ являются «округлениями» чисел /г до (Т—1)-го знака после запятой. Заметим, что все числа /г ~~ '2~~(т-1) Е Ъ. Для каждого множества А Е Л верно следующее утверждение: Е- (Т-1) (Т) -Pi jeJDA < 2~ТК. Повторим процедуру и последовательно найдем числа р^ ,..., pj , pj . Все числа Pj '2~° Е Z, тогда р^ Е {0,1} и jeA ^ г=1 ^5] 2-^^^:, г=1 Ер? 1}-р-г' что и требовалось доказать. Что же делать случае произвольных pi,... ,pm E [0,1]? Можно, конечно, сказать, что, по крайней мере для вычислительной техники, все действительные числа имеют конечную длину записи в двоичной системе счисления. Но
12.4. НИЖНИЕ ОЦЕНКИ 231 мы будем, все же, более аккуратны и рассмотрим функцию ieA I которая является минимумом конечного числа максимальных значений конечного числа непрерывных функций. Следовательно, сама функция также непрерывна. Множество чисел pi,...,pm £ [ОД]? таких, что pi2T E Z для некоторого Т, образует плотное подмножество отрезка [0,1]. Так как / ^ К на этом плотном множестве, то / ^ К на всех наборах pi,... ,pm G [0,1]. ■ Следствие 12.3.3. Пусть Л — семейство из п подмножеств т-множе- ства. Пусть disc(*4|x) ^ К для всех мноэюеств X мощности не более чем п. Тогда disc(*4) ^ 2К. Доказательство. Для каждого множества X С 1), такого, что \Х\ ^ п, справедливо неравенство herdisc(v4|x) ^ К. Тогда из теоремы 12.3.2 следует, что lindisc(v4|x) ^ К. По теореме 12.3.1 имеем lindisc(v4) ^ К. Тогда disc(*4) ^ 21indisc(^) ^ 2К. Ш Следствие 12.3.4. Для каждого семейства Л, состоящего из п мноэюеств произвольной мощности, справедливо неравенство disc(*4) ^ 12^. Доказательство. Применим теорему 12.2.1 и следствие 12.3.3. ■ 12.4. НИЖНИЕ ОЦЕНКИ Мы приведем два различных доказательства того факта, что.с точностью до константы при yjn следствие 12.3.4 дает наилучшую из возможных оценок. Матрицей Адамара называется квадратная матрица Н = (hij) с элементами hij e { — 1,4-1} и попарно ортогональными строками (следовательно, столбцы этой матрицы также попарно ортогональны). Рассмотрим матрицу Адамара Н порядка п и вектор v = (vi,..., vn)T, Vi G { — 1, +1}- Тогда Hv = ViCi + ... + VnCn, где через с* обозначен г-й столбец матрицы Н. Положим Ни — (-^1? • • • ? -^п)^ и, понимая под \с\ обычную евклидову норму, имеем L\ + ... + L2n = \Hv\2 = v2|ci|2 + ...+v2|cn|2 = п + ... + п = п2, так как все векторы с* взаимно ортогональны. Следовательно, найдется слагаемое L2 ^ п и |Яг;|оо = max(|Li|,..., \Ln\) ^ у/п. Перенесем этот результат на семейства множеств. Рассмотрим матрицу Адамара Н порядка п, в первом столбце и первой строке которой стоят только /(рь-..,Рт) = min max ei,..-,eme{0,l} АеЛ
232 Глава 12. РАЗБРОС единицы. (Заметим, что любая матрица Адамара может быть приведена к такому виду путем умножения соответствующих строк и столбцов на — 1.) Обозначим через J единичную матрицу порядка п. Пусть v\,..., L\,... обозначают то же, что и прежде. Тогда 71 71 71 Li + ... + Ln = 2_^ vjhij = /^ vi Z-^ ^ = nVl = =^п' так как сумма элементов первого столбца равна п, а суммы элементов остальных столбцов, ортогональных к первому, равны нулю. Положим Л = v\ + ... + vn, тогда Jv = (Л,..., Л) и (H + J)v = (Ll + \,...,Ln + \). Имеем 71 71 |(Я + JH2 = ^(Li + Л)2 = J](L2 + 2\Li + Л2) = п2 ± 2пЛ + пЛ2. г=1 г=1 Будем рассматривать только четные п (для нечетных п, за исключением п = 1, матриц Адамара не существует). Тогда Л четно. Квадратичная (относительно Л) функция п2 ± 2пА 4- пЛ2 достигает минимума в =fl- Тогда при ограничении, что минимум должен достигаться в четном целом Л, получаем, что минимум функции достигается в А = 0, =f2, и \(H + J)v\2>n2. Вновь некоторая координата должна быть не меньше у/п. Положим Н* = ^^, тогда 1Я* > у/п/2. Пусть Л = {Ai,..., Ат} —произвольное семейство подмножеств множества ft = {l,...,n}, обозначим через М соответствующую матрицу инцидентности размерности т х п. Раскраска \ : ^ —> { —1>+1} дает нам вектор v = (х(1),..., х(п)) € {-1, + 1}". Тогда disc(^,x) = \Mv\eo и disc(*4) = min IMvloo. «е{-1, + 1}п Заметим, что элементами матрицы Н* являются числа 0 и 1. Таким образом, верна следующая теорема. Теорема 12.4.1. Если существует матрица Адамара порядка п > 1, то найдется такое семейство Л из п подмноэюеств п-множества, что disc(*4) > у/п/2. Несмотря на то, что неизвестно точно, для каких п существуют матрицы Адамара (гипотеза Адамара состоит в том, что они существуют для п = 1,2
12.5. ТЕОРЕМА БЕКА-ФИАЛА 233 и всех чисел, кратных четырем; см., например, [Hall (1986)]), известно, что порядки матриц Адамара образуют плотное множество в том смысле, что для любого е при достаточно больших п найдется матрица Адамара, порядок которой лежит между п и п(1 — е). Этого факта достаточно для получения из теоремы 12.4.1 асимптотического результата для всех п. Второе доказательство существования семейства Л с большим разбросом сопряжено с «переворачиванием вероятностного доказательства с ног на голову». Рассмотрим случайную 0,1 матрицу М порядка п. Зафиксируем вектор у = (г>1?... ,vn),Vj = ±1 и положим Mv = (Li,... ,Ln). Пусть половина координат Vj =4-1 и половина равна —1. Тогда что приблизительно совпадает с нормальным распределением N(0,y/n/2). Выберем константу Л > 0 таким образом, чтобы J-xy/гИ 2 Тогда Pr [\Li\ < AV^/2] < -. Данное неравенство верно и в том случае, когда вектор v не сбалансирован по числу вхождений +1 и —1, доказательство этого факта мы опустим. Заметим то важное обстоятельство, что все Li взаимно независимы. Это следует из независимости выбора элементов матрицы М. Следовательно, Рг [\Li\ < Ху/п/2 для всех 1 ^ г ^ п] < Всего существует 2П векторов v. Тогда математическое ожидание числа векторов v, для которых |Мг>|оо < Лч/п/2, меньше 2П2~П = 1. Для некоторой матрицы М эта величина должна равняться нулю, т. е. не должно найтись соответствующих векторов v. По матрице М строим семейство Л, такое, что disc(*4) > \л/п/2. 12.5. ТЕОРЕМА БЕКА—ФИАЛА Пусть Л —некоторое семейство множеств. Обозначим через deg(^4) максимальное число множеств из Л, одновременно содержащих какой-либо элемент. Следующий результат [Beck and Fiala (1981)] получен с использованием только лишь методов линейной алгебры и формально дыбивается из ряда рассматриваемых в этой книге задач. Но мы все-таки рассмотрим его потому, что доказательство замечательно красиво, а также потому, что сам результат во многом отвечает духу этой главы.
234 Глава 12. РАЗБРОС Теорема 12.5.1. Пусть Л — произвольное конечное семейство конечных множеств. Кроме того, пусть deg(A) ^ t. Тогда disc(*4) ^ 2t- 1. Доказательство. Рассмотрим семейство Л = {А\,..., Ат}, где все множества А{ С Q = {1,...,п}. Сопоставим каждому элементу j Е ft некоторое значение Xj, которое будет меняться по ходу доказательства. Первоначально пусть все Xj = 0. В конечном итоге, все Xj = ±1. Переменная Xj будет принимать значения из интервала (—1,4-1), до тех пор пока не примет одно из значений ±1, которое и станет конечным. Множество Si (по определению) имеет значение ]Cjes- хз- Назовем элемент j фиксированным, если Xj = ±1, в противном случае назовем его плавающим. Назовем множество S{ безопасным, если оно содержит менее чем t плавающих точек, в противном случае назовем его активным. Отметим важный факт, что так как (по условию) каждая точка содержится не более чем в t множествах, и активное множество содержит более чем t плавающих точек, то активных множеств должно быть меньше чем плавающих точек. Утверждается, что в каждый момент все активные множества имеют значение ноль. Это выполнено изначально, так как все множества имеют значение ноль. Предположим, что утверждение верно на некотором шаге. Будем рассматривать Xj как переменные для плавающих j и как константы для фиксированных j. Условие, что множество S{ имеет значение ноль, равносильно линейному уравнению для соответствующих переменных. Получаем неопределенную систему линейных уравнений, т. е. содержащую меньше уравнений (активных множеств), чем переменных (плавающих точек). Следовательно, мы можем найти прямую, параметризованную следующим образом: Xj = Xj + Xyj, для плавающих j, на которой активные множества сохраняют значение ноль. Возьмем наименьшее значение Л, при котором какое-либо значение x'j становится равным ±1, и заменим все Xj на х'у (Геометрически это означает перемещение по прямой до точки ее пересечения с кубом в пространстве плавающих переменных.) В результате этого процесса фиксированные переменные остаются фиксированными и, следовательно, безопасные множества остаются безопасными (в то время как некоторые активные множества могут стать безопасными), а требуемое условие продолжает выполняться. К тому же, по крайней мере одна из плавающих точек j становится фиксированной. Будем повторять описанную процедуру до тех пор пока все точки j не станут фиксированными. (На какой-то момент может вовсе не остаться активных множеств, в этом случае присвоим оставшимся плавающим Xj значения ±1 произвольным образом.) Рассмотрим произвольное множество S{. Оно имело значение ноль изначально и сохраняло это значение до тех пор, пока в нем было по крайней мере t плавающих точек. Рассмотрим момент, когда множество Si становится безопасным. Пусть 1,..., / — плавающие точки данного множества. На данный момент значение множества равно нулю. Значения переменных
12.6. УПРАЖНЕНИЯ 235 уi,..., уi при переходе к их конечному варианту могут теперь измениться только лишь на величину меньшую двух, так как значения всех переменных принадлежат отрезку [—1,4-1]. Тогда сумма всех изменений должна быть меньше 2t. Следовательно, окончательное значение Si меньше 2t и, так как оно должно быть целым числом, не превосходит 2t — 1. ■ Гипотеза 12.5.2. Пусть deg(v4) ^ t, тогда disc (Л) ^ КуД, где К — абсолютная константа. Видимо, при доказательстве этой гипотезы имеет смысл сочетать вероятностные методы с методами линейной алгебры. Построение семейства из t подмножеств t-множества, описанное в разд. 12.4, показывает, что в случае, если гипотеза верна, она дает оценку наилучшую из возможных. 12.6. УПРАЖНЕНИЯ 1. Пусть Л —семейство из п подмножеств множества ft = {l,...,m}, где га — четное число. Пусть раскраска х(0 точек 1 ^ г < у принимает значения из множества { — 1,4-1} независимо и равновероятно. Положим x(i + ^) = ~x(i) Для 1 ^ * ^ 7Г- С использованием понятия случайной раскраски улучшить результат теоремы 12.1.1, показав, что disc(*4) ^ J— ln(2n). 2. Пусть щ,..., vs Е Шп. Пусть числа £i,..., xs e [-1, 4-1] таковы, что Yli=i xiVi = 0, и не более чем п из них отличны от ±1. Пусть г^+х Е Шп. С использованием линейных методов из разд. 12.5 найти числа х[,... x's, x's+x со следующими свойствами: • Все^ е [-1,4-1]. • Не более чем п чисел х\ отличны от ±1. • х\ — Xi, если Xi e {-1,4-1}. С использованием полученного результата доказать следующее утверждение, полученное впервые Барани и Гринбергом: Пусть | • | —произвольная норма в Rn. Пусть vi,...,vs Е Шп и все \vi\ ^ 1. Тогда найдется набор х\,... ,xs Е {-1,4-1}, такой, что t ^XiVi г=1 ^2п для всех 1 ^ t ^ s.
236 Глава 12. РАЗБРОС 3. Пусть А\,..., Ап С tt = {1,..., га}, где га ~ nlnn. Пусть \Ai\ ^ п. С использованием идей из доказательства теоремы 12.2.1, включая теорему Клейт- мана, доказать существование раскраски \ : {1?---?т} —> {— 1,0,4-1}, такой, что х(-^г) = 0(л/п In Inn), и х(#) = О Для не более чем п точек х. Доказать при помощи теоремы 12.2.1 существование раскраски X : {1,.. .,ш} —> {-1,4-1}, такой, что хС^г) = 0(у/п In Inn).
ВЕРОЯТНОСТНЫЙ ВЗГЛЯД: Несбалансированные матрицы Пусть В = (bij)— матрица размерности т х п, состоящая из элементов b{j = ±1, ПОЛОЖИМ 771 71 F[B] = max V V Хгу,Ъц. Xi,yj=±l ^—* 't—f г=1 .7 = 1 Как и в разд. 2.5, мы можем интерпретировать матрицу В как массив из т х п лампочек, каждая из которых либо включена (Ь^ = +1), либо выключена (Ь^ = —1). Для каждой строки и каждого столбца есть переключатель, поворот которого включает все выключенные и выключает все включенные лампочки в соответствующей линии. Тогда функция F[B] равна максимально возможному значению разности числа включенных и выключенных лампочек. В разд. 2.5 мы получили нижнюю оценку функции F[B] при т = п. Положим теперь п = 2т и найдем точную нижнюю оценку. Пусть п = 2т и Л —матрица размерности т х п, столбцами которой являются все возможные векторы длины т из ±1. Утверждается, что F[A] есть наименьшее значение функции F[B] на множестве всех матриц В размерности тх п. Для произвольной матрицы В выберем независимо и равновероятно случайные величины xi,.. ,,хт = ±1. Пусть га Aj = у ^ XjOij, г=1 X = |Xi| + ... + |Xn|, тогда п п F[B] = max max y_]yjXj = max y_] \Xj\ = maxX Независимо от 6i<7- случайная величина Х^ имеет распределение Sm, так что E[|Xi|] = E[|Sm|] и, вследствие линейности математического ожидания, E[X]=nE[|Sm|]. При В = А каждый выбор х\,..., хт = ±1 приводит, фактически, к перестановке столбцов в матрице Л, так как матрица (xi<iij) также состоит из всех возможных столбцов. Следовательно, величина X = \Х\\ 4-... 4- \Хп\ является константой. Заметим, что ЩХ] не зависит от В. Заметим также, что при ЩХ] = 1л наименьшее возможное значение тахХ достигается, когда величина X есть константа \х. Следовательно, функция F[B] достигает минимума при В = А.
13 Геометрия Мало кто задумывается чаще двух или трех раз в год. Я приобрел мировое имя, думая один или два раза в неделю. Дсисордсис Бернард Шоу Выберем случайно и равномерно п точек Pi,..., Рп на единичной окружности. Какова вероятность того, что начало координат окажется внутри выпуклой оболочки этих точек? Есть удивительно простой (и остроумный) способ вычислить эту вероятность. Выберем п случайных пар противоположных точек Ql,Qn+l = -Ql, Q2,Qn+2 = -Q2,.,Qn,Q2n = ~Qn В СООТВеТСТВИИ С равномерным распределением. Заметим, что с вероятностью 1 все эти пары различны. Далее выберем в качестве Pi с равной вероятностью или точку <3i, или противоположную ей точку Qn+i = ~Qi- Ясно, что эта процедура соответствует случайному выбору точек Pi. Вероятность того, что начало координат не окажется внутри выпуклой оболочки точек Pi, при заданных (различных) точках Qj есть в точности ^, где х — количество подмножеств множества точек Qj, таких, что все точки подмножества содержатся в открытой полуплоскости, определяемой прямой, которая проходит через начало координат и не проходит ни через одну из точек Qj. Легко видеть, что х = 2п. Действительно, перенумеруем точки Qj так, чтобы порядок их расположения на окружности был следующим: Q\,..., Qn, Qn+ъ • • •»Q2n, и Qn+i = —Qi. Тогда подмножества, содержащиеся в таких полуплоскостях — это множества вида {Qi,..., <3n+i_i}, где все индексы берутся по модулю 2п. Следовательно, вероятность того, что начало координат содержится внутри выпуклой оболочки п случайно выбранных точек единичной окружности, в точности равна 1 — §£. Отметим, что аналогичный результат можно получить, заменив единичную окружность на произвольную ограниченную центрально симметричную область плоскости с центром в начале координат, а также, что этот результат может быть с легкостью обобщен на случай пространств больших размерностей. Этот результат [Wendel (1962)] показывает, как в некоторых случаях можно с помощью хорошей идеи избавиться от утомительных вычислений. Также на этом примере хорошо видна связь между вероятностью и геометрией. В
13.1. НАИБОЛЬШИЙ УГОЛ МЕЖДУ ТОЧКАМИ... 239 последнее время вероятностные методы широко используются в дискретной и вычислительной геометрии. Некоторые из результатов, полученных при помощи вероятностных методов, приведены в данной главе. 13.1. НАИБОЛЬШИЙ УГОЛ МЕЖДУ ТОЧКАМИ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ Есть несколько замечательных примеров того, как в самых разных областях комбинаторики вероятностный метод позволял находить очень простые контрпримеры для давно сформулированных гипотез. Следующий результат [Erdos and Furedi (1983)] является одним из них. Теорема 13.1.1. Для каждого d ^ 1 найдется множество, состоящее не менее чем из [^(^)d\ точек d-мерного евклидова пространства Rd, такое, что все углы, образованные тройками точек этого множества, строго меньше 7Г/2. Эта теорема опровергает старую гипотезу [Danzer and Grunbaum (1962)] о том, что максимальная мощность такого множества не превосходит 2d — 1. Доказано (см. [Danzer and Grunbaum (1962)]), что максимальная мощность множества точек Rd, в котором все углы не превосходят 7г/2, есть 2d. Доказательство теоремы 13.1.1. Будем выбирать точки множества X С Rd среди вершин d-мерного куба. Как обычно будем рассматривать вершины куба, которые являются двоичными векторами длины d, как характеристические векторы подмножеств d-множества. То есть каждому 0,1-вектору а длины d соответствует множество А = {г : 1 ^ г ^ d,ai = 1}. Три вершины а, Ь и ев d-мерном кубе, соответствующие множествам А, В и С, образуют прямой угол в точке с тогда и только тогда, когда АПВ сС CAUB, (13.1) это является простым следствием теоремы Пифагора. Так как все углы, образованные тройками вершин d-мерного куба, не превосходят 7г/2, нам достаточно сконструировать множество X мощности не менее [^(тТя)^» никакие три различных элемента которого не удовлетворяют условию (13.1). Положим т = l%(3o)d\ и выберем случайным образом и независимо 2т двоичных d-мерных векторов ец,..., а2Ш так, чтобы значение каждой координаты каждого вектора независимо выбиралось равным 0 или 1 с вероятностью \. Для каждой тройки элементов а,Ь и с выбранного множества вероятность того, что соответствующие этим точкам множества удовлетворяют условию (13.1), в точности равна (3/4)d. Действительно, вложение (13.1) означает, что для всех г (1 ^ г ^ d) не верно ни то, что а* = 6* = 0, с» = 1, ни то, что ai = b{ = l,Ci = 0. Следовательно, вероятность того, что для трех фиксированных индексов z,j и к выбранные нами точки ai,aj,ak образуют прямой угол в точке а&, равна (3/4)d. Так как количество всевозможных троек, которые могут образовать прямой угол, равно ( ^)3, то математическое
240 Глава 13. ГЕОМЕТРИЯ ожидание числа прямых углов равно (23m) 3(3/4)-< т, где последнее неравенство следует из выбора га. Тогда найдется множество X из 2га точек, в котором количество прямых углов не превосходит га. Удаляя по одной точке из каждого такого угла, мы получаем множество мощности не менее чем 2га—га = га, в котором все углы строго меньше 7г/2. Заметим, что все оставшиеся точки различны, так как условие (13.1) выполняется тривиально при А = С. Теорема полностью доказана. ■ Как было показано Эрдёшем и Фюреди, приведенное выше доказательство легко модифицируется для получения следующего результата. Теорема 13.1.2. Для любого е > О существует 6 > О, такое, что для каэюдого d > 1 найдется множество из не менее чем (l+£)d точек пространства Rd, удовлетворяющее условию, что все углы, определяемые тройками различных его точек, не превосходят 7г/3 + е. Мы опустим подробное доказательство этого утверждения. 13.2. ПУСТЫЕ ТРЕУГОЛЬНИКИ, ОПРЕДЕЛЯЕМЫЕ ТОЧКАМИ ПЛОСКОСТИ Пусть X — множество точек плоскости, находящихся в общем положении (т. е. никакая тройка точек не лежит на одной прямой). Обозначим через f{X) число пустых треугольников, т. е. таких, которые не содержат другие точки множества X, определяемых тройками точек множества X. В работе [Katchalski and Meir (1988)] изучалось минимально возможное значение функции f(X) для множеств X мощности п. Положим f(n) = min{/(X)}, где минимум берется по всем множествам X, состоящим из п точек плоскости, находящихся в общем положении. Было доказано, что Г1) ^/(п)<200п2. Эти оценки были улучшены в работе [Вагапу and Furedi (1987)], где показано, что при растущих п справедливы соотношения (1 + о(1))п2 ^ f(n) ^ (1 + о(1))2п2. Для получения верхней оценки была использована вероятностная конструкция, представленная в следующей теореме. Несколько лучший результат был получен в работе [Valtr (1995)]. Теорема 13.2.1. Пусть Ji, /г,..., /n — параллельные единичные отрезки на плоскости: U = {(х,у) : х = г,(К У ^ !}•
13.2. ПУСТЫЕ ТРЕУГОЛЬНИКИ, ОПРЕДЕЛЯЕМЫЕ ТОЧКАМИ... 241 Для каждого г выберем точку pi независимо и случайным образом из отрезка li в соответствии с равномерным распределением. Обозначим через X мноэюество этих п случайно выбранных точек. Тогда математическое ожидание числа пустых треугольников в X не превосходит 2п2 + O(nlogn). Очевидно, что с вероятностью 1 множество X является множеством точек в общем положении и, следовательно, из теоремы вытекает неравенство f{n)^2n2 + 0{n\ogn). Доказательство. Сначала мы оценим вероятность того, что треугольник, определенный точками р^Рг+а и Рг+fc? пуст при некоторых фиксированных г, а ик = а + Ь^З. Обозначим через А = (г, ж), В = (i + а,у) и С = (i + k,z) точки Pi,Pi+a и Рг+fc? соответственно, а через га — расстояние между точкой В и точкой пересечения отрезка АС с отрезком /г+а- Так как все точки р^, где г < j < г + /с, были выбраны случайно и равномерно на 7^, вероятность того, что треугольник, определенный точками А, В и С, пуст, равна ('-")('-1'7)-(1-(-1)7)(1-<'-1)т)-(1-т)* (га га , л ч га ,, ^чга га\ 2- ... - о - 1 - - (Ь - 1 - ... - -) = а а а о о / Зафиксируем произвольные точки А и С при случайном выборе точки Pi+a = 5. Вероятность того, что она находится на расстоянии га ^ d от точки пересечения отрезка АС с отрезком it+a> очевидно, не превосходит 2d для каждого d > 0. Следовательно, вероятность того, что треугольник, определенный точками puPi+a и Pi+fc? пуст, не превосходит 2 / exp(-(fe - 2)m/2)dm = А/(к - 2). Отсюда следует, что математическое ожидание общего количества пустых треугольников не превосходит п-2+ Е Е Е 4/(*-2) = 1^г<п-3 3<fc<n-i1<а<к-1 = „-2+ £ (n-4iSfil = = n-2+ 51 (n - fc)4/(fc - 2) + 4 51 (**-*) = = 2n2 + 0(n log n). Теорема полностью доказана. ■ Приведенный выше результат может быть обобщен на случай больших размерностей с помощью схожей вероятностной конструкции. Множество X
242 Глава 13. ГЕОМЕТРИЯ из га точек d-мерного евклидова пространства назовем независимым, если никакие d + 1 точек не лежат в гиперплоскости. Симплекс, определенный d + 1 точками, назовем пустым, если он не содержит никакой другой точки X. Через fd{X) обозначим число пустых симплексов множества X, положим fd(n) = min/d(X), где минимум берется по всем независимым множествам X, состоящим из га точек пространства Rd. В работе [Katchalski and Meir (1988)] было доказано, что /d(ra) > (П^1)* Следующая теорема Барани и Фюреди показывает, что здесь вероятностная конструкция снова дает нам верхнюю оценку, совпадающую с нижней с точностью до постоянного множителя (который зависит от размерности). Мы опустим подробное доказательство. Теорема 13.2.2. Найдется такая константа К = K(d), что для каждого выпуклого ограниченного множества АсМ^с непустой внутренней частью выполнено следующее. Если X — случайное множество из га точек, полученное в результате га случайных и независимых выборов точек множества А в соответствии с равномерным распределением, то математическое ожидание числа пустых симплексов множества X не превосходит, К Q). 13.3. ГЕОМЕТРИЧЕСКАЯ РЕАЛИЗАЦИЯ ±1-МАТРИЦ Пусть А = (а^)— матрица размера т на га, состоящая из элементов +1 и — 1. Будем говорить, что матрица А реализуема в пространстве Rd, если в Rd найдется т проходящих через начало координат гиперплоскостей Hi,..., Hm, и га точек Р\,... ,Рп, таких, что для всех г и j точка Pj лежит в положительном полупространстве относительно Щ при aij = +1, и в отрицательном — при aij = — 1. Обозначим через d(A) минимальную размерность d, при которой А реализуема в Rd, и положим d(m,n) = mox(d(A)), где максимум берется по всем матрицам А размера т на п, состоящим из 4-1 и — 1. Так как d(m, n) = d(n, т), мы можем ограничиться рассмотрением случая m ^ п. Проблема нахождения или оценки d(m, n) (в частности, d(n, n)) была поставлена в работе [Paturi and Simon (1984)]. Постановка этого вопроса была обоснована попыткой оценить максимально возможную вероятностную коммуникативную сложность булевой функции без ограничений на ошибки. В работе [Alon, Prankl and Rodl (1985)] было доказано, что n/32 ^ d(n,n) ^ (^ 4- о(1))п при растущем п. Обе оценки были получены путем комбинирования вероятностных и некоторых других идей. В следующей теореме доказывается верхняя оценка, вероятно, наиболее близкая к точной. Теорема 13.3.1. Для всех m > n справедливо неравенство1^ d(m, га) ^ (га + 1)/2 + 1 / —— log т. ) Здесь и далее в этой главе запись log а означает log2 a. — Прим. ред.
13.3. ГЕОМЕТРИЧЕСКАЯ РЕАЛИЗАЦИЯ ±1-МАТРИЦ 243 Для доказательства нам потребуются одно определение и две леммы. Пусть а = (ai,..., ап) — вектор из +1 и — 1. Назовем числом перемен знака вектора а количество индексов г,1^г^п— 1, таких, что а{ = — а^\. Для каждой матрицы А, состоящей из 4-1 и — 1, обозначим через s(A) максимальное число перемен знака в строках матрицы А. Лемма 13.3.2. Для каэюдой матрицы А, состоящей из 4-1 и — 1, выполняется неравенство d(A) ^ s(A) 4-1. Доказательство. Пусть А = (а^-) —матрица размера т на п, состоящая из 4-1 и —1, положим s = s(A). Пусть t\ < t% < ••• < £n — произвольные действительные числа. Определим п точек Pi, P2,..., Рп пространства Rs+1, положив Pj = (1, tj,tj,..., Й). Эти точки, последние s координат которых представляют собой точки на d-мерной кривой моментов, будут использоваться при реализации матрицы А. Для завершения доказательства нам требуется показать, что каждая строка матрицы А может быть реализована подходящей гиперплоскостью, проходящей через начало координат. Это можно доказать, применив некоторые известные свойства кривой моментов следующим образом. Рассмотрим вектор из 4-1 и —1, соответствующий произвольной строке матрицы А. Пусть число перемен знака этого вектора равно г, где, естественно, г ^ s. Пусть перемены знака в этом векторе происходят между координатами ij и ij 4- 1, 1 ^ j ^ г. Выберем произвольные действительные числа 2/i,...,уг, где t^ < yj < t^.+i при 1 ^ j ^ г. Рассмотрим полином -Р(^) = Ш=1(^ ~~ Уз)- Так как его степень не превосходит s, найдутся такие действительные числа а^, что P(t) = ]Cj=o aj^• Определим гиперплоскость Н в Rs+1 как Н = {(xo,xi,...,xs) Е Rs+1 : YlSj=oajxj = 0}- Ясно, что точка Pj = (l,tj,...,tj) лежит в положительном полупространстве относительно этой гиперплоскости, если P(tj) > 0, и в отрицательном полупространстве, если P(tj) < О, Из того, что полином Р меняет знак только в точках t/j, следует, что гиперплоскость Н разделяет точки Pi,..., Рп в соответствии с набором знаков из соответствующей строки матрицы А. Следовательно, правильным образом выбирая ориентацию гиперплоскостей Я, мы получаем реализацию матрицы А в пространстве Rs+1. ■ Лемма 13.3.3. Для каэюдой матрицы А, состоящей из 4-1 и — 1, найдется матрица В, полученная из матрицы А путем умноэюения некоторых столбцов на —1, такая, что s(B) ^ (п - 1)/2 4- у1^ logm. Доказательство. Выберем для каждого столбца матрицы А случайно, независимо и равновероятно число е Е {4-1,-1}. Умножим этот столбец на е. Обозначим через В случайную матрицу из 4-1 и —1, полученную таким образом. Рассмотрим произвольную фиксированную строку матрицы В. Нетрудно убедиться, что случайная величина, описывающая число перемен знака в этой строке, имеет биномиальное распределение с параметрами п — 1 и р = 1/2. Это следует из того, что независимо от значений элементов матрицы А в этой строке, строка матрицы В является полностью случайным вектором из — 1
244 Глава 13. ГЕОМЕТРИЯ и 1. С помощью стандартных оценок для биномиального распределения, приведенных в приложении А, получаем, что вероятность того, что это число превосходит (п — 1)/2 + л/21^ logm, меньше 1/га. Следовательно, с ненулевой вероятностью число перемен знака в каждой из т строк не превосходит (п — 1)/2 + л/21^ logm, что и требовалось доказать. ■ Доказательство теоремы 13.3.1. Пусть А — произвольная матрица, состоящая из 4-1 и —1. Из леммы 13.3.3 следует, что существует матрица В, полученная из матрицы А путем замены некоторых столбцов на обратные, такая, что s(B) ^ (п - 1)/2 4- J^^logm. Отметим, что d(A) = d(B), так как из любой реализации одной из этих матриц точками и гиперплоскостями, проходящими через начало координат, можно получить реализацию другой матрицы путем замены точек, соответствующих измененным столбцам, на противоположные им. Тогда по лемме 13.3.2 d(A) = d(B) ^ 8(B) 4-1 ^ (п 4-1)/2 4- у ^ logm, что и требовалось доказать. ■ Применяя теорему о шести стандартных отклонениях (в общем виде), сформулированную в конце разд. 12.2, нетрудно показать, что оценка из леммы 13.3.3 (а следовательно, и теоремы 13.3.1) может быть улучшена до п/2 4- О(у/пlog(т/п)). Можно также показать, что если пит возрастают так, что т/п2 стремится к бесконечности и (log2 m)/n стремится к нулю, то для почти всех матриц А размера т на п, состоящих из ±1, выполняется равенство d(A) = (| 4- о(1))п. 13.4. е-СЕТИ И VC-РАЗМЕРНОСТИ РАНЖИРОВАННЫХ ПРОСТРАНСТВ Пусть / = f(n,e) — минимальное число, такое, что каждое множество X из п точек плоскости содержит подмножество S из не более чем / точек, такое, что каждый треугольник, содержащий не менее еп точек X, содержит по крайней мере одну точку множества S. Наша задача — найти /. Как мы убедимся в этом разделе, существует абсолютная константа с, такая, что f(n,e) ^ |'log(l/e), и эта оценка верна для всех п. Этот несколько неожиданный результат на самом деле является очень частным случаем теоремы, доказанной в работе [Вапник и Червоненкис (1971)], и обобщенной затем в работе [Haussler and Welzl (1987)]. У этой теоремы есть множество интересных применений в вычислительной геометрии и математической статистике. Для изложения этого результата нам понадобятся несколько определений. Ранжированное пространство (range space) —это пара S = (X, R), где X — множество (конечное или бесконечное) и R — семейство (конечное или бесконечное) подмножеств множества X. Элементы множества X будем называть точками, а элементы семейства R — интервалами. Пусть А — подмножество множества X. Проекцией семейства
13.4. е-СЕТИ И VC-РАЗМЕРНОСТИ РАНЖИРОВАННЫХ ПРОСТРАНСТВ 245 R на множество А назовем семейство Pr{A) = {г П А : г G R}. В случае, если проекция содержит все подмножества множества А, будем говорить, что множество А расщеплено. Размерностью Вапника—Червоненкиса (или VC-размерностъю от Vapnik—Chervonenkis) пространства 5, обозначаемую как VC(5), назовем максимальную мощность расщепленного подмножества множества X. В случае, если существуют расщепленные подмножества сколь угодно большой мощности, положим VC(5) = оо. Количество интервалов в любом конечном ранжированном пространстве с заданным количеством точек и заданной VC-размерностью не может быть слишком большим. Для произвольных целых чисел п ^ 0 и О 0 определим функцию g(d, n) равенством Отметим, что для всех n, d > 1 справедливо соотношение g(d,n) = = g(d, n— l)+g(d — 1, n — 1). Следующая комбинаторная лемма была доказана независимо Перлесом и Шелла, в работе [Sauer (1972)] и, в немного более слабой форме, Вапником и Червоненкисом. Лемма 13.4.1. Пусть (X, R) — ранжированное пространство VC-размер- ности d, \Х\ = п. Тогда \R\ ^ g(d,n). Доказательство. Воспользуемся индукцией по п + d. Утверждение тривиальным образом выполняется при d — 0 и п = 0. Предположив, что оно верно для п и d — 1, а также для п — 1 и d — 1, докажем, что утверждение также верно для п и d. Пусть S = (X, R) — ранжированное пространство VC-размерности d на п точках. Пусть х G X, рассмотрим два ранжированных пространства S — х и S \ #, определенных следующим образом: 5-х = (X-{x},R-x), где R-х = {г- {х} : г е R}; S\x = {X - {х},R\x), где R\x = {г Е R : х £ г,rU {x} G R}. Очевидно, что VC-размерность пространства S — х не превосходит d. Также легко показать, что VC-размерность пространства S \ х не превосходит d — 1. Следовательно, по предположению индукции, | Д| = | Я - х\ + |Д \ х\ ^ g{d, n-l)+g(d-l,n-l)= g(d, n), что и требовалось доказать. ■ Несложно проверить, что оценка, приведенная в предыдущей лемме, является точной для всех возможных значений п и d. Пусть (X, R) — ранжированное пространство VC-размерности d, А С X, тогда VC-размерность пространства (A,Pr(A)), очевидно, не превосходит d. Из предыдущей леммы вытекает следующее утверждение. Следствие 13.4.2. Пусть (X, R) — ранжированное пространство VC-размерности d. Тогда \Pr(A)\ ^ g(d, \A\) для каждого конечного подмножества А множества X.
246 Глава 13. ГЕОМЕТРИЯ Ранжированные пространства с конечными VC-размерностями естественным образом возникают в дискретной и вычислительной геометрии. Примером может служить пространство S = (Rd,#), множество точек которого составляют все точки d-мерного евклидова пространства, а множеством интервалов является множество всех (открытых) полупространств. Любое множество из d + 1 аффинно независимых точек расщеплено в этом пространстве, и по теореме Радона никакое множество из d + 2 точек не будет расщепленным. Следовательно, VC(5) = d + 1. Как было показано в работе [Dudley (1978)], в случае, если пространство (X,R) имеет конечную VC-размерность, то это верно и для пространства (X, Д&), где Rk есть множество всех булевых комбинаций, образованных не более чем к интервалами из R. В частности, из следствия 13.4.2 легко может быть получено следующее утверждение. Следствие 13.4.3. Пусть (X,R) —ранжированное пространство VC-раз- мерности d ^ 2, а (X, R^) — ранжированное пространство на множестве X, в котором Rh = {(г\ П...Пг/1):г1,...г/1ЕЙ}. Тогда VC(X, Rh) ^ 2dh\og(dh). Доказательство. Пусть А — произвольное подмножество множества X мощности п. Из следствия 13.4.2 вытекает, что |Рд(А)| ^ g{d,n) ^ nd. Так как каждый интервал пространства Prh(A) представляет собой пересечение h интервалов пространства Pr{A), то |Рдл(Л)| ^ {9^п^) ^ n<ih- Тогда при ndh < 2П множество А не может быть расщепленным. Но это неравенство выполняется для всех п > 2dh\og(dh) при dh > 4. ■ Как было показано выше, ранжированное пространство, множество точек которого составляют все точки евклидова пространства Rd, и множеством интервалов которого является множество всех полупространств, имеет VC-размерность d+1. Отсюда и из последнего следствия вытекает, что ранжированное пространство (Rd,C^), где Сн — множество всех выпуклых d-многогранников с h гранями, имеет VC-размерность, не превосходящую 2(d+ l)/ilog((d+ l)/i). Интересным свойством ранжированных пространств с конечной VC-раз- мерностью является то, что каждое конечное подмножество такого множества содержит относительно мало хороших образцов в смысле, раскрытом ниже. Пусть (X, R) — ранжированное пространство и А — конечное подмножество множества X. Для каждого 0 ^ е ^ 1 множество В с А назовем е-образцом множества А, если для всех г G R справедливо неравенство РПг|/|Л|-|ВПг|/|В|Ке. Аналогично, множество N а А назовем е-сетью множества А, если каждый интервал г G R, такой, что |гПА| > е\А\, содержит по крайней мере одну точку из N. Заметим, что каждый £-образец множества А также является £-сетью, а обратное неверно. Тем не менее, оба понятия определяют подмножества множества А, которые дают приблизительное представление о части свойств множества А, касающихся интервалов. Наша цель — показать существование
13.4. £-СЕТИ И VC-РАЗМЕРНОСТИ РАНЖИРОВАННЫХ ПРОСТРАНСТВ 247 маленьких £-сетей или £-образцов конечных множеств в некоторых ранжированных пространствах. Отметим, что если (X, R) — ранжированное пространство с бесконечной VC-размерностью, то для каждого п найдется расщепленное подмножество А множества X мощности п. Очевидно, что каждая £-сеть (и, следовательно, любой £-образец) такого множества А должна содержать не менее (1 — е)п точек, т. е. почти все точки множества А. Таким образом, при бесконечных VC-размерностях не существует маленьких сетейобразцов. Тем не менее, оказывается, что в случае конечных VC-размерностей всегда находятся очень маленькие сети и образцы. Следующая теорема была доказана в работе [Вапник и Червоненкис (1971)]. Теорема 13.4.4. Пусть (X, R) — произвольное ранжированное пространство VC-размерности, не превосходящей d, A — конечное подмножество множества X ие,6 > 0. Тогда существует положительная константа с такая, что если s не меньше минимума из чисел \А\ и ^(dlog^+logi), то случайное подмножество В множества А, такое, что \В\ = s, является е-образцом множества А с вероятностью не менее 1 — 5. С использованием аналогичных идей в работе [Haussler and Welzl (1987)] была доказана следующая теорема. Теорема 13.4.5. Пусть (X,R) —ранжированное пространство VC-размерности d, A — конечное подмножество множества X, пусть, кроме того, О < £, 5 < 1. Обозначим через N мноэюество, полученное путем случайного и независимого выбора т элементов из множества А, где /4 2 8cL Sd\ . опЧ га > max - log -, — log — . (13.2) \£ ое е J Тогда N является е-сетью множества А с вероятностью не менее 1 — 6. Таким образом, из того, что А является конечным подмножеством ранжированного пространства конечной VC-размерности d, следует, что для любого е > 0 множество А содержит как £-сеть, так и е-образец, размеры которых не превосходят значения некоторой функции, зависящей от £ и d, независимо от мощности А\ Результат, касающийся треугольников, упомянутый в первом разделе этой главы, таким образом, следует из теоремы 13.4.5. Отсюда, используя рассуждения, приведенные после следствия 13.4.3, мы получаем, что ранжированное пространство, интервалами которого являются все треугольники на плоскости, имеет конечную VC-размерность. Как было показано в работе [Pach and Woeginger (1990)], существуют примеры, когда при фиксированном 5 зависимость m от 1/е не может быть линейной, но до сих пор не известны естественные геометрические примеры, на которых проявлялся бы этот феномен. В работе [Komlos, Pach and Woeginger (1992)] содержится более короткая формулировка последней теоремы.
248 Глава 13. ГЕОМЕТРИЯ Доказательства теорем 13.4.4 и 13.4.5 очень похожи. Мы приводим только доказательство теоремы 13.4.5, так как присутствующие в нем вычисления проще, и предлагаем читателю попробовать модифицировать его для получения доказательства теоремы 13.4.4. Доказательство теоремы 13.4.5. Пусть (X, R) — ранжированное пространство VC-размерности d, А — подмножество множества X и \А\ = п. Пусть га удовлетворяет условию (13.2), и множество TV = (х\,..., хт) получено путем независимого случайного выбора га элементов из множества А. (Разумеется, элементы множества N не обязательно все различны). Обозначим через Е\ следующее событие: Ei = {3r e R : \г П А\ > еп, г П N = 0}. Нам достаточно показать, что вероятность события Е\ не превосходит 6. Для этого мы проведем дополнительный случайный выбор и определим другое событие. Независимо от множества TV определим множество Т = (у\,... ,ут), полученное путем случайного и независимого выбора га элементов из множества А. Определим событие Е2 следующим образом: Е2 = l3r e R : |гПЛ| > en,rnN = 0, \гПТ\ ^ ^у\- (Так как элементы множества Т не обязательно все различны, то обозначение \г П Г| понимается здесь в смысле |{г : 1 ^ г ^ га,yi Е г}\. Аналогично определим величины \г П N\ и \г П (N U Г)|.) Утверждение 13.4.6. Справедливо неравенство Pr^] > |Рг[£а]. Доказательство. Достаточно оценить условную вероятность Pr^l-^i] и показать, что она не менее 1/2. Предположим, что произошло событие Е\. Тогда найдется такое г Е R, что |rflA| > еп и г Г\ N = 0. Условная вероятность, упомянутая выше, очевидно, не меньше вероятности того, что для этого фиксированного г верно \г П Г| > ^Jp. С другой стороны, величина \г П Г| есть биномиальная случайная величина с математическим ожиданием рт и дисперсией р(1 — р)т < рга, где р = \г П А\/\А\ > е. Тогда из неравенства Чебышёва следует, что ^ Г, ^1 етЛ £т 4 , /Л Рг гПГ <— ^т 7542 = — ^1/2, L 2 J (em/2)2 em где последнее неравенство следует из соотношения (13.2). Таким образом, наше утверждение верно. ■ Утверждение 13.4.7. Справедливо неравенство Pr[E2] ^g(d,2m)2-^. Доказательство. Случайный выбор множеств N и Т может быть описан следующим эквивалентным предыдущему способом. Сформируем сначала множество TV U Т = (z\,..., 22m), сделав 2га случайных независимых выборов элементов из множества А. Затем выберем случайным образом га элементов
13.4. е-СЕТИ И VC-РАЗМЕРНОСТИ РАНЖИРОВАННЫХ ПРОСТРАНСТВ 249 Zi, которые образуют множество N (оставшиеся элементы Zj, естественно, образуют множество Т). Для каждого интервала г Е R, такого, что \гГ\А\ > еп, обозначим через Ег событие, что |г П Т| > у и г П iV = 0. Ключевым моментом является то, что в случае, если для двух интервалов г, г' Е R выполнено \г П А\ > еп и \г' П А\ > еп, и если г П (N U Т) = г' П (N U Т), то два события Ег и Ег> будут совпадать при условии выбора определенного множества NUT. Действительно, возникновение события Ег зависит только от пересечения г П (NUT). Следовательно, для каждого фиксированного множества NUT число различных событий Ег не превосходит числа различных множеств проекции Pnut(R)- Так как VC-размерность множества X равна d, из следствия 13.4.2 вытекает, что это число не превосходит g(d, 2га). Оценим теперь вероятность возникновения события Ег при заданном выборе множества NUT. Эта вероятность не превосходит Рг rnN = 0 |rn(ATUT)|>^]. Положим I = \г П (N U Т)\. Так как выбор элементов множества TV среди элементов множества N U Т не зависит от выбора самого множества NUT, указанная выше условная вероятность в точности равна (2га - /)(2га - I - 1)... (га - I + 1) _ га(га - 1)... (га - / + 1) , «т 2га(2га-1)...(га+1) ~ 2га(2га - 1)... (2га - / + 1) ^ Так как всего может произойти не более чем g(d, 2га) различных событий Ег, вероятность возникновения по крайней мере одного из них при заданном выборе N U Т не превосходит g(d, 2ra)2~^. Так как эта оценка верна при условии любого выбора множества NUT, вероятность возникновения события Е% не превосходит g(d, 2ra)2~^, что и требовалось доказать. ■ Из утверждений 13.4.6 и 13.4.7 следует, что Рг[£а] ^ 2g(d,2m)2~§^k. Для завершения доказательства теоремы остается показать, что если га удовлетворяет неравенству (13.2), то 2g(d,2m)2-^ ^ S. Мы приводим доказательство для случая d > 2. В случае d = 1 вычисления еще проще. Так как g(d, 2га) ^ (2ra)d, достаточно показать, что 2(2m)d^S2^, т. е. что 0 — ^dlog(2ra)+log-. Из неравенства (13.2) следует em 2 тогда достаточно показать, что — ^ dlog(2m). Справедливость последнего неравенства для некоторого значения га влечет за собой его справедливость для всех больших значений га. Следовательно, нам
250 Глава 13. ГЕОМЕТРИЯ достаточно проверить, что неравенство верно при т = ^ log ^=, т. е. 2dlogf ^log(^log^). Последнее неравенство эквивалентно неравенству ^ ^ log ^, которое, конечно же, верно. Теорема полностью доказана. I Теоремы 13.4.4 и 13.4.5 используются для построения эффективных структур данных в различных задачах вычислительной геометрии. Рассмотрим следующий тривиальный пример (утверждение вытекает из теоремы 13.4.4): для любого е > О найдется такая константа с = с(е), что для каждого п и каждого множества А из п точек плоскости существует структура данных размера с(е), которая позволяет для некоторого заданного треугольника на плоскости оценить число точек множества А, находящихся в этом треугольнике, с точностью до аддитивной погрешности £п. Этой структурой данных будет являться множество координат точек, составляющих £-образец множества А, рассматриваемое как подмножество ранжированного пространства, интервалами которого являются все треугольники плоскости. Более сложные структуры данных, построения которых опираются на две приведенные выше теоремы, можно найти в работе [Haussler and Welzl (1987)]. 13.5. ДВОЙСТВЕННАЯ ФУНКЦИЯ РАСЩЕПЛЕНИЯ И РАЗБРОС Двойственной функцией расщепления ft ранжированного пространства S = (X, R) назовем такую функцию ft, отображающую множество целых чисел на себя, что h(g) есть максимальное число атомов в диаграмме Венна для д множеств семейства R, где максимум берется по всем возможным наборам из д множеств семейства R. Несложно показать, что если VC-размерность пространства S равна d, то h(g) ^ 0(g2 _1), но в геометрических приложениях обычно оказывается, что лучше оценивать эту функцию напрямую для каждого конкретного случая. В работе [Matousek, Welzl and Wernisch (1993)] было доказано, что если двойственная функция расщепления ранжированного пространства S = (X,R) удовлетворяет условию h(g) ^ 0(дг), А — произвольное множество из п точек ранжированного пространства и .Т7 —проекция Pr(A) семейства R на множество Л, то разброс семейства Т удовлетворяет неравенству disc(JT) <g 0(п*~А v'togn)- (13-3) Это неравенство позволяет доказывать нетривиальные оценки во многих геометрических задачах, в частности, с помощью этого результата можно улучшить тривиальные оценки, вытекающие из теоремы 12.1.1 гл. 12. Распространено мнение, что в большей части этих геометрических задач можно избавиться от множителя yflogn. Тем не менее, в общем случае это не так, что было доказано в работе [Matousek (1997)] (для t = 2,3), и позже —в работе [Alon, Ronyai and Szabo (1999)] для всех t.
13.5. ДВОЙСТВЕННАЯ ФУНКЦИЯ РАСЩЕПЛЕНИЯ И РАЗБРОС 251 Доказательство утверждения (13.3) основывается на замечательном результате из работы [Chazelle and Welzl (1989)], улучшенном в статье [Haussler (1995)]. Несколько проще доказывать это утверждение с добавочным логарифмическим множителем. Это доказательство мы здесь и изложим. Более подробно этот вопрос рассмотрен в работе [Pach and Agarwal (1995)]. Пусть .F — семейство подмножеств конечного множества А. Далее будут рассматриваться графы, ребрами которых являются (неупорядоченные) пары точек множества А. Для каждого множества F Е Т и пары точек #, у € А будем говорить, что ребро {х, у} прокалывает множество F, если F содержит ровно одну из двух точек х и у. Следующая теорема была доказана в работе [Chazelle and Welzl (1989)]. Результат был улучшен на логарифмический множитель в статье [Haussler (1995)]. Теорема 13.5.1. Пусть (A, F) — конечное ранжированное пространство, \А\ = п, и пусть его двойственная функция расщепления h удовлетворяет условию h(g) ^ eg1 для некоторых фиксированных c,t > 0. Тогда найдутся константа С = С (с, t) и гамильтонов путь на множестве А, такие, что каждое множество F семейства Т прокалывается не более чем Сп1~1^ logn ребрами гамильтонова пути. Для доказательства этой теоремы нам понадобится следующая лемма. Лемма 13.5.2. Пусть (А,Т),п, h, t и с удовлетворяют условиям, сформулированным в теореме 13.5.1, В —конечное подмножество мощности р > 1 множества A, Q — семейство из т (не обязательно различных) множеств семейства Т. Тогда в множестве В найдутся две различные точки #, у, такие, что ребро ху прокалывает не более чем m11/fp множеств семейства Q, где Ь = Ь(с). Доказательство, целое число, такое, что eg1 ^ р — 1, тогда д = [С2—-)1/*]. Обозначим через L случайное семейство из д множеств семейства Q, каждое из которых было выбрано случайно и независимо (возможно, с повторениями), среди всех т множеств семейства Q в соответствии с равномерным распределением. Диаграмма Венна всех множеств семейства L разбивает множество В на не более чем h(g) ^ сдь < р атомов, следовательно, найдутся две различных точки х, у множества Б, которые находятся в одном и том же атоме. Для завершения доказательства остается показать, что с ненулевой вероятностью для каждой пары точек множества В, которые прокалывают более чем (bm\ogp)/p1/t множеств семейства Q, по крайней мере одно из этих множеств содержится в семействе L (а значит, пара не содержится в соответствующем атоме диаграммы Венна). Всего таких пар (JJ), и для каждой из них вероятность того, что L не содержит ни одного из множеств семейства Q, которые они прокалывают, не превосходит / _ b\Qgp\9 ^L(£=i)i/*j V V^ ) ^ что меньше 1/р2 при соответствующем выборе константы Ь = Ь(с). Ш
252 Глава 13. ГЕОМЕТРИЯ Доказательство теоремы 13.5.1. Заметим, что, если d — это VC-раз- мерность заданного пространства, то найдется расщепленное множество D мощности d. Несложно видеть, что среди расщепляющих D множеств найдутся д = [log2 d] таких, что никакие две точки множества D не принадлежат одному и тому же атому их диаграммы Венна. Тогда d ^ c([log2 d])*, откуда следует, что d ^ 2ctlogt, где с' = с'(с). По лемме 13.4.1 отсюда вытекает, что общее количество интервалов R не превосходит п2° Докажем далее, что существует остовное дерево на множестве А, удовлетворяющее утверждению теоремы 13.5.1, а затем покажем, как заменить это дерево гамильтоновым путем. Из леммы 13.5.2 при Во = А,ро = п и 0о = Т,то = \Q0\ (^ п2 ) вытекает, что найдется пара точек #о? Уо множества А, такая, что ребро хоУо не прокалывает более 1о1^Ггпо множеств семейства Q. Пусть Q\ — семейство множеств, полученное из Q дублированием всех множеств семейства 0, проколотых ребром Хоуо. Положим Bi = В - xo.Pi = п - 1, mi = |£/11 ^ гпо{1 + ^f/1). Вновь применяя лемму 13.5.2, на этот раз для В\ и 0i, получаем другую пару Х\у\. Положим #2 = В\ — #i,p2 = Pi — 1 = п — 2, и обозначим через 02 семейство множеств, полученное из Q\ дублированием всех множеств семейства Q\, проколотых ребром Х\у\, т2 = |021- По утверждению леммы m2 ^ mi(l + ^1°ДГЛ)- Повторяя этот процесс, мы получим последовательность ЖоУо»#12/1> * * * ->хп-\Уп-\ ребер графа на множестве А, последовательность подмножеств Во = А, В\,..., Вп-ъ где каждое множество В{ получено из предыдущего исключением точки #i_i, и последовательность семейств 0о, 0i,..., Qn-1 ? где и-|«™.пО+^)* ^ n2C,tlogtebl°8nSr=o1("-0"1/t ^ 2b'nl~1/tlogn для соответствующего Ь' = b'(c,t). Заметим, что ребра ХгУг образуют остовное дерево на множестве А. Ключевым моментом доказательства является то, что если множество Т проколото s ребрами, то оно s раз дублировалось в процессе построения 0n-i, откуда следует, что 2s ^ |0n-i| и, следовательно, s ^ bfn1'~1^t\ogn. Остается заменить остовное дерево гамильтоновым путем. Для этого заменим каждое ребро дерева двумя параллельными ребрами и выделим эйлеров цикл в получившемся графе (в котором степени всех вершин четны). Мы получили последовательность хо,Х\,Х2,... ,#2n-2 = #о точек множества А, такую, что каждая соседняя пара элементов последовательности есть ребро дерева и каждое ребро встречается в последовательности дважды. Подпоследовательность этой последовательности, полученная удалением повторных вхождений точек множества А, является гамильтоновым путем, и несложно проверить, что каждое множество семейства Т проколото не более чем 2b'n1~1/t logn ребрами этого пути. Теорема полностью доказана. ■ (13.4)
13.6. УПРАЖНЕНИЯ 253 Следующий результат представляет собой простое следствие теоремы 13.5.1. Как было упомянуто ранее, ее утверждение может быть улучшено на множитель y/\ogn. Теорема 13.5.3. Пусть (А,Т) —конечное ранжированное пространство, \А\ = п, и пусть его двойственная функция расщепления h такова, что h(g) ^ eg1 для некоторых фиксированных c,t > 0. Тогда найдется константа С = C'(c,t), такая, что разброс семейства Т удовлетворяет неравенству disc(.F) ^ С'п*~~я log п. Доказательство. Не ограничивая общности рассуждений, мы можем предположить, что число точек множества А четно (в противном случае, удалим одну точку). Из теоремы 13.5.1 следует, что найдется гамильтонов путь Х\Х2...хп на множестве А, такой что каждое множество семейства Т проколото не более чем Cn1-1/4ogn ребрами этого пути. Обозначим через / : А н-> { — 1,1} случайную раскраску множества А, такую, что для каждого г, 1 ^ г ^ п/2, случайно и независимо пара вершин окрашивается либо как f(x2i-i) = 1,/(я2г) = -1, либо как f(x2i-i) = -1,/(ж2») = 1 с равной вероятностью. Зафиксируем множество F Е Т и отметим, что вклад каждой пары #2г-1#2г в сумму Y2x.ep f{xj) равен нулю, если ребро #2г-1#2г не прокалывает F, и равен 4-1 или —1 в противном случае. Отсюда следует, что эта сумма (в обозначениях теоремы АЛЛ) имеет распределение Sr для некоторого г ^ Cn1"1/* log п. Таким образом, вероятность того, что абсолютное значение этой величины не меньше а, может быть оценена как 2е~а /2г. Как было показано в первом разделе доказательства теоремы 13.5.1, общее число множеств пС t log t семейства Т не превосходит п . Тогда вероятность того, что существует множество F £ J7, для которого сумма ]СЖ -gf f(xj) превосходит С'п* ~ ъ log n, меньше 1 при соответствующем выборе константы С = C'(c,t). Ш Ранжированное пространство, множеством точек которого является произвольное множество точек плоскости, и множество интервалов которого составляют все круги плоскости, имеет двойственную функцию расщепления, равную 0(д2). Из приведенной выше теоремы следует, что можно так раскрасить произвольные п точек плоскости в красный и синий цвета, что абсолютное значение разности между числом красных и числом синих точек внутри любого круга не будет превосходить п1/4"1"0^1). Аналогичные результаты можно получить для многих других ранжированных пространств. 13.6. УПРАЖНЕНИЯ 1. Пусть Л —множество из п точек плоскости, обозначим через Т семейство пересечений множества А со всеми открытыми треугольниками плоскости. Доказать, что разброс семейства Т не превосходит п1/4"1"0^1). 2. Доказать, что п различных точек плоскости определяют не более 0(п4/3) единичных отрезков.
ВЕРОЯТНОСТНЫЙ ВЗГЛЯД: Эффективная упаковка Пусть множество С С М71 имеет ограниченную риманову меру \х = //(С) > 0. Обозначим через N(C,x) максимальное число непересекающихся копий множества С, которые можно разместить в кубе со стороной х. Определим константу упаковки следующим образом: 6(C)=ii(C) lim N(C,x)x-n, х—>оо т. е. как максимальную долю пространства, которая может быть заполнена непересекающимися копиями множества С. Следующая теорема улучшает результат, описанный в гл. 3, разд. 3.4. Теорема. Пусть множество С ограничено, выпукло и центрально-симметрично относительно начала координат. Тогда 6(C) > 2-(п~1\ Доказательство. Зафиксируем е > 0. Пусть // = //(С) = 2 — е. Для каждого действительного z обозначим через Cz вектор (z\,..., zn-i) G Mn_1, такой, что (z\,..., 2n-i» z) £ С, и пусть fx(Cz) — обычная мера (п— 1)-мерного вектора Cz. Из измеримости по Риману следует, что Итп У2 MCm7)7 = /i(C). Обозначим через К целое число, для которого выполняется неравенство X)/i(Cmif-(»-i))A'-(n-1)<2 и, следовательно, все точки множества С имеют координаты меньшие К/2. Для 1 ^ г ^ п — 1 обозначим через V{ G W1 вектор, все координаты которого равны нулю, а г-я координата равна К. Пусть v = {z1,...,zn-1,K-ln-»), где действительные числа zi,...,zn-i выбраны независимо в соответствии с равномерным распределением на интервале [0,К). Обозначим через Av решетку образованную векторами v: Av = {rriiVi + ... + mn-ivn-i + mv : mi,..., mn_i, m G Z} = = {(mzi + miK,..., mzn-i + mn-iK, mX"^"1^ : mi,..., mn_i, m G Z}. Обозначим через б (ж) число ж' G (—у, у], для которого при некотором т G Z выполнено я; — mif = х'. Существует только одно такое число. Для т EZ обозначим через Ат событие «некоторая сумма mi^i +... + ran_ivn_i +тг> G С».
Вероятностный взгляд: Эффективная упаковка 255 Так как все координаты точек множества С меньше К/2, событие Аш происходит тогда и только тогда, когда (0(mzi),..., 0(mzn-i), тХ"^1)) G С, что верно лишь в том случае, если (0(mzi),... ,0(mzn-i)) G CmK-(n-i). Из независимости и равномерности выбора чисел Z{ на интервале [О, К) вытекает независимость и равномерность распределения величин 0(zi) на интервале (— у, у], следовательно, Рг[Лт] = ^-("-1)М(СтХ-(„-1)). Суммируя по всем положительным т и используя центральную симметрию, получаем, что m>0 mGZ Следовательно, существует вектор г>, для которого ни одно из событий Ат, т > О не произошло. Из центральной симметрии следует, что Аш и А-ш обозначают одно и то же событие. Следовательно, не произошло ни одно из событий Ат при т ф 0. При т = 0 все точки rai^i + ... -h mn-ivn-i = К (mi,... ,mn_i,0), за исключением начала координат, лежат вне множества С. Для этого v AvnC = {0}. Рассмотрим множество копий С + 2w,w G Av. Пусть z = с\+ 2wi = С2 + 2w2 при ci, c2 G C, iui, w2 G Av. Тогда (ci — c2)/2 = W2 — W\. Из выпуклости и центральной симметрии следует, что (с\ — с2)/2 G С. Так как разность w2 — w\ G Av, а значит, равна нулевому вектору, то С] = с2 и г^х = ги2. Следовательно, данное множество копий образует упаковку пространства Rn. Из того, что det(2Av) = 2п det(Av) = 2П, следует, что эта упаковка имеет плотность равную 2~п\х = 2~п(2 — е). Поскольку е > 0 выбирался произвольно, то 6(C) > 2~(п~1\ Ш
11 Коды, игры и энтропия — Скажи, зачем ты приехал в Касабланку, Рик? — Я приехал на воды. — Воды, какие воды? Касабланка находится посреди пустыни. — Я был неверно проинформирован. Клод Рэйнс Хэмфри Богарту в фильме «Касабланка» 14.1. КОДЫ Предположим, требуется передать некоторое сообщение в виде двоичной последовательности по каналу с помехами. С вероятностью р каждый бит может быть принят неправильно, т. е. р — это вероятность того, что посланный ноль будет принят как единица, а посланная единица будет принята как ноль. Величина р является параметром канала, и влиять на него мы не можем. Посланные биты всегда принимаются, иногда с ошибкой. Будем считать, что события, заключающиеся в неверном приеме битов, взаимно независимы. Рассмотрим пример такой ситуации. Пусть, скажем, р = 0.1. Как добиться высокой надежности системы? Простым решением будет посылать каждый бит трижды. Для декодирования принятых трех бит будем применять правило голосования. Тогда вероятность неправильной расшифровки будет равна в нашем случае Зр2 +р3 = 0.031. Мы пожертвовали скоростью передачи данных, она теперь составляет 1/3 от исходной, зато повысили надежность. Если посылать каждый бит пять раз и использовать правило голосования для декодирования, то вероятность неправильной расшифровки понизится до 0.01051, но скорость передачи также понизится. Она составит 1/5 от исходной. Ясно, что мы можем сделать вероятность неправильной расшифровки сколь угодно малой, но, по-видимому, за это придется поплатиться стремящейся к нулю скоростью передачи данных. Фундаментальная теорема теории информации, принадлежащая Клоду Шеннону, заключается в том, что такой обмен не обязателен: существуют коды со скоростью передачи данных, стремящейся к некоторой положительной константе (зависящей от р), и со стремящейся к нулю вероятностью ошибки при передаче. Схему кодирования составляют два целых числа га, п, функция /: {0,1}т —> {0,1}п, которую называют функцией кодирования, и функция д: {0,1}п —> {0,1}т, называемая функцией декодирования. Эта запись означает, что сообщение (или часть сообщения) х G {0,1}т будет закодирована
Глава 14. КОДЫ, ИГРЫ И ЭНТРОПИЯ 257 и послана как /(#), а полученное сообщение у Е {0,1}П будет декодировано как д(у). Скорость передачи данных в такой схеме определяется отношением т/п. Пусть Е = (ei,... ,еп) —случайный вектор, в котором Pr[e; = 1] = р, Pr[e; = 0] = 1 — р, а случайные величины в{ взаимно независимы. Определим вероятность правильной передачи сообщения как Pr[<7(/(#) + Е) = х] (+ означает сложение векторов по тосВ). Подразумевается, что случайная величина х имеет равномерное распределение на множестве {0,1}т и не зависит от Е. Ключевую роль в дальнейшем будет играть функция энтропии Н(р) = -p\og2p-(l -p)log2(l -р), определенная для всех р £ (0,1). Функция энтропии фигурирует в асимптотической формуле ( п \ = пПе~П (1 + o(l))n = 2nWP)+°™ \рп) (рп)Рпе-Рп((1 -p)n)(1~P)ne-(1-P)n ' справедливой для каждого фиксированного р. При р Е (0,0.5) мы будем пользоваться оценкой ")<(1+рп)(Пп)=2п(Я(р)+о(1)). Теорема 14.1.1 (теорема Шеннона). Пустьр Е (0,0.5) —некоторое фиксированное число. Для любого сколь угодно малого е > 0 существует схема кодирования со скоростью передачи данных, превосходящей 1 — Н(р) — е, и вероятностью ошибки при передаче меньшей, чем е. Доказательство. Пусть 6 > 0 таково, что р4- 6 < 0.5 и Н(р + 5) < Н(р)+е/2. Для достаточно больших п положим т = п(1 — Н(р) — £), обеспечивая требуемую скорость передачи данных. Зададим случайным образом функцию /: {0,1}т —> {0,1}п, выбирая каждое значение f(x) независимо в соответствии с равномерным распределением. При заданной функции / определим декодирующую функцию д: {0,1}п —> {0,1}т следующим образом. Положим 9(у) — х-> если х — это единственный вектор, для которого расстояние между f(x) и у не превосходит п(р + 5). В качестве расстояния используется метрика Хэмминга р, где p(y,yf) равно числу координат, в которых отличаются векторы у и у'. Если такой вектор х не существует или существует более чем один такой вектор, то будем считать декодирование некорректным. Рассмотрим две ситуации, в которых декодирование оказывается некорректным. Во-первых, вектор f(x)+E может оказаться на расстоянии, большем чем п(р -h S) от f(x). Заметим, что расстояние от f(x) -f E до f(x) равно весу вектора Е, имеющему биномиальное распределение В(п,р), а значит, такое событие происходит с вероятностью о(1), фактически с экспоненциально малой вероятностью. Во-вторых, может случиться, что существует х' ф х, такой, что f(xf) G 5, где 5 —множество векторов у', находящихся на расстоянии не U
258 Глава 14. КОДЫ, ИГРЫ И ЭНТРОПИЯ более п(р 4- 6) от /(#). При заданных значениях f(x) и Е, величина f(xf) по- прежнему равномерно распределена на множестве {0,1}П, а следовательно, такое событие происходит с вероятностью |5|2~п для каждого отдельного х'. Тогда общая вероятность возникновения этого события не превосходит 2m|5|2-n < 2-п(§+о(1)) = ^ Таким образом, суммарная вероятность того, что декодирование некорректно, равна о(1) и, фактически, экспоненциально мала. Для достаточно больших п она меньше е. Среднее значение вероятности некорректного декодирования х по всем возможным выборам / меньше е. Следовательно, найдется такая функция / (а значит, и схема кодирования) с вероятностью неверного декодирования меньшей е. Ш Теорема Шеннона касается в высшей степени практической стороны передачи информации, тем самым особенно четко проявляются недостатки вероятностного подхода. Как найти подходящую схему кодирования? Если схема кодирования существует, то как обеспечить быстрое кодирование-декодирование сообщений? Групповой код— это схема кодирования, в которой отображение / : {0,1}т -> {0,1}П линейно, т. е. /(0) = 0 и f(x + х1) = f(x) + f(x'), все вычисления проводятся по модулю 2. (Другими словами, множество значений функции / есть подгруппа группы {0,1}п.) Групповым кодам уделяется особое внимание, в частности, из-за простоты кодирования. Теорема 14.1.2. Пусть зафиксировано некоторое значение р Е (0,0.5). Для любого сколь угодно малого е > 0 существует групповой код со скоростью передачи данных, превосходящей 1 — Н(р) — е, и вероятностью ошибки при передаче меньшей е. Доказательство. Для всякого 1 ^ г ^ т обозначим через щ двоичный вектор длины га, содержащий единицу на г-й позиции и нули на всех остальных. Выберем значения f(u\),...,f(um) случайно и независимо, определим функцию / на остальных наборах, положив f(eiui + ... 4- етит) = eif(ui) + ... + emf(um). Повторим доказательство теоремы Шеннона до момента оценки вероятности того, что f(x) + Е находится на расстоянии не более чем п(р 4- 6) от f(x). Положим z = х — х' = e\U\ + ... + emum, где все операции проводятся по модулю 2. Так как х ф а/, то z ф 0. Перенумеруем для определенности координаты так, чтобы ет = 1. Из линейности следует, что f(z) = f(x) — f{x'). Оценим вероятность Pr[/(z) G 5], где 5 —это множество векторов, находящихся на расстоянии не более п(р 4- 5) от нулевого вектора. При любых фиксированных Si и f{ui), г < т, у f(z) остается еще слагаемое /(um), которое независимо и равномерно распределено. Следовательно, f(z) распределено равномерно. Тогда Pr[/(z) G S] = |5|2~п и доказательство завершается так же, как доказательство теоремы Шеннона. ■
14.2. ИГРА ЛЖЕЦА 259 14.2. ИГРА ЛЖЕЦА Пол пытается узнать число х Е {1,..., п} у лживой Кэрол, сопротивляющейся этому. Он может задать q вопросов вида «Верно ли, что х Е 5?», где S может быть произвольным множеством. Вопросы задаются последовательно, и г-й вопрос Пола может зависеть от предыдущих ответов. Кэрол может лгать, но она не может солгать больше к раз. При каких n, q, к Пол сможет определить число х? При к = 0 Пол может выиграть в том и только том случае, когда п ^ 2я. При значениях п = 100, q = 10, к = 1 мы получаем замечательную детскую игру. Кэрол вряд ли можно назвать пассивным наблюдателем. Она может осуществлять стратегию, препятствующую Полу. Под этим мы подразумеваем, что Кэрол не загадывала х заранее, но ее ответы согласуются по крайней мере с одним х. В конце игры, если ее ответы согласуются с более чем одним х, то она выиграла. Таким образом, игра, называемая (n, g,/с)-игрой лжеца, является игрой с полной информацией без скрытых ходов и без ничьих. Следовательно, либо у Пола, либо у Кэрол есть выигрышная стратегия. Но у кого? Опишем эквивалентную игру, называемую игрой лжеца с фишками. Имеется доска с позициями 0,1,...,к и п фишек, пронумерованных числами 1,..., п и находящихся на позиции к. Игра длится q раундов. В каждом раунде Пол выбирает множество фишек 5. Кэрол может либо передвинуть все фишки из дополнения S множества S на одну позицию влево, либо передвинуть все фишки из множества S на одну позицию влево. (Будем считать, что позиция г — 1 находится слева от позиции г. Фишки, передвинутые на одну позицию влево с позиции 0, убираются с доски.) По окончании q раундов Кэрол выигрывает, если на доске находится более одной фишки, а Пол выигрывает, если на доске останется одна или ноль фишек. Присутствие фишки г на позиции j означает, что при ответе х = г Кэрол солгала k—j раз. Выбор Полом множества S соответствует вопросу: «Верно ли, что х Е 5?». Перемещение Кэрол фишек из S соответствует ответу «да», перемещение фишек из S соответствует ответу «нет». (В игре лжеца с фишками Кэрол может удалить все фишки с доски, в то время как в игре лжеца ответы должны согласовываться по крайней мере с одним х. Но если Кэрол уберет все фишки с доски, то она автоматически проиграет. Следовательно, это различие не влияет на определение победителя.) В игре лжеца с фишками нет необходимости помещать сначала все фишки на позицию к. Для xo,...,Xk ^ 0 определим [(#о, • •. , а^),д]-игру лжеца с фишками так же, как и g-раундовую игру, описанную выше, но с размещением Х{ фишек на позиции г вначале. Что, в свою очередь, соответствует игре лжеца, в которой для Кэрол есть Х{ чисел, относительно которых можно солгать не более г раз. Обозначим через B(q,j) вероятность того, что при q подбрасываниях монеты герб выпадает не более j раз. Мы, конечно же, располагаем точной формулой ВЫ)-«-gO.
260 Глава 14. КОДЫ, ИГРЫ И ЭНТРОПИЯ Теорема 14.2.1. При условии к ^XiB(q,i)>l г=0 Кэрол выигрывает [(яо, • • •, Xk), я\-игру лжеца с фишками. Следствие 14.2.2. При условии 2* Кэрол выигрывает (п^,к)-игру лжеца. Доказательство теоремы 14.2.1. Зафиксируем стратегию Пола. Пусть теперь игра Кэрол случайна! То есть в каждом раунде, после того как Пол выбрал множество фишек 5, Кэрол подбрасывает монету. Если выпадает герб, то она передвигает фишки из S на одну позицию влево, если выпадает решка, то она передвигает на одну позицию влево фишки из S. Для каждой фишки с обозначим через 1С индикатор, описывающий присутствие или отсутствие фишки с на доске в конце игры. Обозначим через X = ^ 1С число фишек, остающихся на доске в конце игры. Рассмотрим некоторую фишку с. В каждом раунде Пол мог выбрать с Е S или с £ 5, но независимо от этого фишка с передвигается влево с вероятностью \. Пусть фишка с находится на позиции г в начале игры. Она останется на доске в конце игры, тогда и только тогда, когда во всех q раундах она передвигалась влево не более г раз. Тогда Е[/с] — вероятность этого события —в точности равна B(q,i). Из линейности математического ожидания следует, что ЩХ] = ^2i=0XiB(q,i). Из условий теоремы вытекает, что ЩХ] > 1. Но тогда событие X > 1 должно происходить с ненулевой вероятностью. То есть с ненулевой вероятностью Кэрол выиграет. Никакая стратегия не поможет Полу всегда выигрывать. Но мы имеем дело с игрой с полной информацией без ничьих, следовательно, у кого-то должна быть выигрышная стратегия. Этот кто-то —не Пол, следовательно, это должна быть Кэрол. ■ Изложенное выше доказательство хорошо иллюстрирует присутствие магического элемента в вероятностном подходе. У Кэрол есть выигрышная стратегия, но как ее найти? Переход от вероятностного доказательства существования к явному построению называется дерандомизацией и будет детально рассмотрен в следующей главе. Здесь же мы приведем явную стратегию. При остающихся до конца игры / ходах и числом фишек yi на позиции г, определим вес игровой ситуации как сумму ^2{У1В(1,1). Заметим, что эта сумма представляет собой математическое ожидание Е[У], где У— это число фишек, которые останутся на доске, если Кэрол будет играть случайно. Явную стратегию Кэрол описывает следующее правило: всегда делать ход так, чтобы максимизировать вес игровой ситуации. Рассмотрим произвольную игровую ситуацию с весом W и некоторый ход Пола S. Обозначим через Wy, Wn веса, которые получатся при перемещении
14.3. ИГРА «ПОСТОЯННАЯ ДОЛЖНОСТЬ» 261 Кэрол всех фишек из S или всех фишек из S соответственно. Утверждается, что W = \{Wy + Wn). Подтверждением этого может служить то, что, вследствие линейности веса, проверка этого равенства сводится к рассмотрению случая с одной фишкой, равенство для которого следует из тождества B(l,j) = \{В{1 — 1, j) + B(l — l,j — 1)). В действительности, нам не требуются никакие вычисления. Кэрол играет случайным образом, следовательно, вероятность каждого из ее решений в 1-м раунде равна 1/2. Тогда Е[У] —это среднее арифметическое двух условных математических ожиданий. В начале игры по условию теоремы 14.2.1 вес игровой ситуации больше единицы. Явная стратегия Кэрол не дает весу уменьшиться, следовательно, к концу игры вес по-прежнему будет больше единицы. Но в конце игры вес равен числу оставшихся на доске фишек, а Кэрол побеждает, если это число больше единицы. Утверждения, обратные к теореме 14.2.1 и ее следствию, не верны. Рассмотрим игру лжеца при п = 5, с q = 5 вопросами и к = 1 возможностью солгать. Она соответствует [(0,5), 5]-игре лжеца с фишками. Отметим, что Б(5,1) = 6/32 и 5(6/32) ^ 1. Но Кэрол все-равно выиграет с помощью своей стратегии. Проблема в том, что у Пола нет хорошего первого хода. Предположим, что он выберет какие-то две фишки в качестве множества S (спросит: «Верно ли, что х ^ 2?» в игре лжеца). Тогда Кэрол передвинет две фишки влево (ответит «да»), создав ситуацию (2,3) при четырех остающихся вопросах. Кэрол теперь обязательно выиграет, так как 2В(4,0) + 35(4,1) = 17/16 > 1. Несложно проверить, что все остальные ходы Пола также приводят к поражению. Проблема здесь в том, что Пол, находясь в ситуации с весом W ^ 1, не смог найти ход, приводящий к ситуации Wy <1и Wn ^ 1. 14.3. ИГРА «ПОСТОЯННАЯ ДОЛЖНОСТЬ» Декан Пол пытается добиться постоянной должности для одного из своих преподавателей, но ему противодействует скупая Кэрол, ректор университета. Всего есть к уровней, предшествующих постоянной должности, которые мы пометим числами 1,..., /с, 1-й уровень — наивысший, а 0-й означает постоянную должность. Каждый преподаватель представлен фишкой в нашей игре. Игра «постоянная должность» с параметрами (х\,...,Хк) начинается с Х{ фишками на г-м уровне при 1 ^ г ^ /с, а на нулевом уровне фишек нет. Каждый год Пол представляет Кэрол некоторое множество фишек 5. Кэрол может сделать следующее: • повысить в должности все фишки из множества S и уволить остальные или • повысить в должности все фишки из дополнения S множества S и уволить фишки из 5. Повышение фишки в должности означает ее передвижение с уровня г на уровень г—1. Увольнение фишки означает удаление ее из игры. Пол побеждает, если какая-то фишка достигла уровня 0. Драконовские правила повышения в
262 Глава 14. КОДЫ, ИГРЫ И ЭНТРОПИЯ должности гарантируют, что игра закончится через к лет, и либо выиграет Пол, либо, успешно удалив из игры все фишки, выиграет Кэрол. Теорема 14.3.1. Кэрол выигрывает игру «постоянная должность» с параметрами (х\,.. .,Xk) при Ylixi^~l < 1- Доказательство. Зафиксируем некоторую стратегию Пола. Пусть игра Кэрол будет случайной! То есть в каждом раунде, после того как Пол выберет множество фишек 5, Кэрол подбрасывает монету — если выпадет герб, то она передвигает все фишки из множества S на одну позицию влево, а если выпадет решка, то на одну позицию влево передвигаются фишки из множества S. Для каждой фишки с обозначим через 1С индикатор события, что фишка с достигла уровня 0. Пусть X = ^21с~ число фишек, достигших уровня 0 к концу игры. Рассмотрим некоторую фишку с. В каждом раунде Пол мог решить, что с Е 5, или с £ 5, но в любом случае фишка с передвигается влево с вероятностью \. Пусть фишка с находится на позиции г в начале игры. Она останется на доске к концу игры, только если первые г подбрасываний Кэрол монеты приводили к повышению в должности фишки с. В таком случае Е[/с], вероятность такого события, есть 2~\ В силу линейности математического ожидания ЩХ] = ]Ct=i £г2_г. Из условия теоремы получаем, что ЩХ] < 1. Тогда событие X < 1 должно происходить с ненулевой вероятностью. То есть с ненулевой вероятностью Кэрол должна выигрывать. Никакая стратегия Пола не позволяет ему всегда выигрывать. Но мы имеем дело с игрой с полной информацией без ничьих, так что у кого-то должна быть выигрышная стратегия. Если это не Пол, то это должна быть Кэрол. ■ Как и в игре лжеца, мы можем дерандомизировать приведенное выше доказательство и привести явную стратегию для Кэрол. Пусть на г-й позиции находится yi фишек. Определим вес игровой ситуации суммой ^2{Уг2~г. Заметим, что эта величина равна Е[У], где У— это количество фишек, которые достигнут 0-го уровня, если Кэрол будет играть случайно. Явная стратегия Кэрол заключается в выборе хода, минимизирующего вес игровой ситуации. Рассмотрим произвольную игровую ситуацию с весом W и некоторый ход Пола 5. Обозначим через Wy,Wn веса ситуаций, возникающих, если Кэрол передвинет все фишки из множества S или все фишки из множества 5, соответственно. Как и в игре лжеца, W = \{Wy + Wn). По условию теоремы, в начале игры вес был меньше единицы. Явная стратегия Кэрол не дает весу увеличиться, следовательно, к концу игры вес по-прежнему будет меньше единицы. Фишка, находящаяся на позиции 0, добавила бы к весу игровой ситуации единицу, следовательно, на позиции 0 нет ни одной фишки, а это означает, что Кэрол выиграла. В игре лжеца достаточные условия выигрыша Кэрол не являются одновременно и необходимыми, так как в любом случае у Пола может не оказаться хорошего хода. Тем не менее, справедлива следующая интересная лемма.
14.4. ИГРА «БАЛАНСИРОВКА ВЕКТОРОВ» 263 Лемма 14.3.2. Если вес игровой ситуации не меньше единицы, то она может быть разделена на две игровые ситуации, вес каждой из которых не меньше \. Доказательство. Обязательно найдется позиция г, на которой находятся не менее двух фишек. В противном случае, вес был бы меньше единицы. Если на позиции 1 находятся две фишки, то отнесем их к разным игровым ситуациям. Если две фишки находятся на позиции г > 1, склеим их и будем рассматривать как одну суперфишку на позиции г — 1. Заметим, что мы получили игровую ситуацию с тем же весом, но с меньшим количеством фишек. Далее применяем индукцию по числу фишек. ■ Теорема 14.3.3. Пол выигрывает игру «постоянная должность» с параметрами (Х\,... ,Xk) При ^2Хг2~г ^ 1. Доказательство. Вес игровой ситуации в начале игры не меньше единицы. Пол применяет последнюю лемму и разделяет фишки на два подмножества так, чтобы каждому из них соответствовала игровая ситуация веса не менее ^. Одно из этих подмножеств Пол выберет в качестве множества 5. Кэрол передвинет все фишки одного из подмножеств на одну позицию влево, удваивая их вес, и мы снова получаем ситуацию с весом не менее единицы. Таким образом, мы никогда не получим ситуацию веса меньше единицы. Следовательно, игра не может закончиться удалением всех фишек с доски (у этой ситуации вес равен нулю), а, значит, игра закончится победой Пола. ■ 14.4. ИГРА «БАЛАНСИРОВКА ВЕКТОРОВ» Игра «балансировка векторов» — это игра с полной информацией, в которой участвуют два игрока — Предлагающий и Решающий. У этой игры есть параметр п ^ 1, и нас будет интересовать асимптотика по п. Игра длится п раундов, в каждом из которых мы имеем дело с векторами пространства Rn. Имеется вектор игровой ситуации Р G Мп, изначально равный нулю. Каждый раунд состоит из двух частей. Вначале Предлагающий выбирает вектор v G { — 1, +1}п. Затем Решающий заменяет вектор Р либо вектором P + v, либо вектором Р — v. К концу n-го раунда выигрыш Предлагающего равен |Р|оо? максимальному из абсолютных значений координат вектора Р. Обозначим через VAL(n) значение этой игры для Предлагающего, а через Sn обозначим, как обычно, сумму п независимых случайных величин, принимающих с равной вероятностью значения из множества {1,-1}. Теорема 14.4.1. Если Pr[|Sn| > а] < п~1, то VAL(n) ^ а. Доказательство. Будем считать, что Предлагающий выиграл, если в конце игры |Р|оо > ol- Пусть Решающий определяет, заменить ли ему вектор Р вектором Р + v или вектором Р — г>, подбрасывая монету. Через Х{ обозначим г-ю координату окончательного значения вектора игровой ситуации Р.
264 Глава 14. КОДЫ, ИГРЫ И ЭНТРОПИЯ Обозначим через Wi событие «|#t| > а», положим W = \ZW{. Тогда событие W означает победу Предлагающего. Случайная величина Хг имеет распределение Sn независимо от стратегии Предлагающего. Тогда п Pr[W]^5>r[|Sn|>a]<l. г=1 Предлагающий не может всегда выигрывать, следовательно, всегда выигрывать будет Решающий. ■ Следствие 14.4.2. Справедливо соотношение VAL(n) = 0(у/п\пп). Для получения нижней оценки VAL(n) требуется найти выигрышную стратегию для Предлагающего, т. е. стратегию, которая позволит ему выигрывать независимо от действий Решающего. Мы не можем ограничиться рассмотрением случая, когда Решающий играет случайно. Решающий — противник Предлагающего и может придерживаться любой стратегии. Тем не менее, справедлив следующий результат, касающийся Решающего, который играет случайно. Теорема 14.4.3. Если Pr[|Sn| > а] > сп~1/2, где с —абсолютная константа, то VAL(n) > a. Следствие 14.4.4. Справедливо соотношение VAL(n) = Q(Vn\nn) и, следовательно, VAL(n) = в (у/п Inn). Доказательство теоремы 14.4.3. Положим для х Е Z, 0 ^ г ^ п, Wi(x) = Pr[\x + Sn-i\ > a]. Для Р = (х1,...,хп) положим Wi(P) = J2i^j^nwi(xj)' Пусть Р — вектор игровой ситуации в конце г-го раунда, тогда величину Wi(P) можно интерпретировать как ожидаемое количество координат, абсолютная величина которых будет больше чем а к концу игры, если Решающий будет играть случайно. В начале игры Wo{P) = wo(0) > Сл/п по условию теоремы. Стратегия Предлагающего заключается в следующем. При заданном в конце г-го раунда векторе игровой ситуации Р Предлагающий так должен выбрать вектор v Е { — 1, +1}п, чтобы значения Wi+\ (P — v) и tUi+i (P + v) различались мало. Случайная величина х + Sn_i превращается в величину х + 1 + Sn_i_i или х — 1 + Sn_i_i в зависимости от первого подбрасывания монеты. Тогда для всех г, ж верно равенство wi(x) = i:[wi+\{x + 1) + Wi+i(x - 1)]. Пусть Р = (х\,..., хп), v = (г>1,..., vn). Для 1 ^ j ^ n положим Aj = u>i+i(xj + 1) - Wi+i(xj - 1). Тогда п Wi+i(P + v) -Wi+i(P-v) =^2vjAj,
14.5. НЕАДАПТИВНЫЕ АЛГОРИТМЫ 265 и для е = ±1 имеем п Wi+^P + ev) = Wi(P) 4- -e^VjAj. Оценим \Aj\. Заметим, что Л,- = Pr[Sn_i_i = у] - Pr[Sn_i_i = г], где у — это единственное целое число той же четности, что и п — г — 1, в интервале (а — (хj 4- 1), а - (xj - 1)], a z — это единственное целое число той же четности, что и п — г — 1, в интервале [—а — (xj 4-1), —ос — (xj — 1)). Пусть 9{m) = m^xPv[Srn = s}=(. ™ ,Vm ~ J—, тогда \Aj\ ^ ^(n — г — 1) для всех j. Стратегия Предлагающего будет заключаться в следующем. Так переупорядочить координаты, чтобы |Ai| > ... > \Ап\, а затем последовательно выбрать значения vi,...,vn Е { — 1,4-1} так, чтобы величины ViAi и v\A\ 4- • • • 4- Vi-\Ai-\ имели разные знаки. (Значения V{ выбираются произвольно в случае г; = 1 или при равной нулю второй величине.) Тогда IviAi 4-... 4- vnAn\ < |Ai | ^ g{n - г - 1). Обозначим через Рг вектор игровой ситуации в конце г-го раунда, а через V — вектор, выбранный Предлагающим для (г 4- 1)-го раунда. Независимо от выбора Решающим е = ±1 будут выполнены соотношения ww(Pi+1) = Wi+^F + ev) > ил(Рг) - \ Х>д; |i=i Таким образом, п_1 >ил{Р{)-^д(п-г-1). ^п(Рп)>^о(Р0)-^^(п-г-1). Z г=0 С помощью несложных вычислений можно убедиться в том, что значение указанной выше суммы асимптотически стремится к (Sn/тг)1^2. При с > (2/тт)1/2 имеем wn(Pn) > 0. Но wn(Pn) — это число координат вектора финального состояния Р = Рп, абсолютные величины которых больше а. Стратегия Предлагающего гарантирует, что это число будет больше нуля, а, значит, и его победу. ■ 14.5. НЕАДАПТИВНЫЕ АЛГОРИТМЫ Модифицируем игру «балансировка векторов» из разд. 14.4, предоставив Предлагающему выбирать вектор, состоящий из нулей и единиц, а не из ±1. Обозначим через VAL*(n) значение модифицированной игры. С использованием оценок для VAL(n), можно показать, что VAL*(n) = Q(Vn\nn).
266 Глава 14. КОДЫ, ИГРЫ И ЭНТРОПИЯ В гл. 12 было показано, что каждое семейство из п подмножеств Si,..., Sn n-множества {1,...,п} имеет разброс, равный 0(у/п). То есть существует раскраска \ : {1,...,п} —> {-1,4-1} такая, что |х(^г)1 ^ CV™ ПРИ всех значениях г. Из доказательства этого утверждения нельзя получить эффективный алгоритм нахождения такой раскраски. В самом деле, пока не известно, существует ли полиномиальный алгоритм решения такой задачи. Зададимся вопросом существования неадаптивного или интерактивного алгоритма в следующем смысле. Вместо получения всей информации о семействе S\,..., Sn сразу, мы будем последовательно получать информацию о каждой отдельной точке. На j-м шаге алгоритм получает информацию о том, какие из множеств Si содержат точку j, или, иными словами, j-й столбец матрицы инцидентности. В этот момент алгоритм должен решить, как раскрасить точку j, причем впоследствии эта раскраска не может быть изменена. Как можно оценить сверху величину max |х(£г)1 Для такого алгоритма? Будем считать, что точки нам предлагает наш соперник. Будем рассматривать эти точки как векторы- столбцы матрицы инцидентности. Предлагающего будем рассматривать как наиболее неудобного соперника, а Решающего — как алгоритм. Тогда требуемой оценкой будет VAL*(n). Требование неадаптивности алгоритма одновременно и сильнее и слабее требования его полиномиальности. Тем не менее, приведенный выше результат косвенно подтверждает гипотезу об отсутствии полиномиального алгоритма нахождения раскраски, при которой |х(£г)1 ^ Су/п для всех значений г. 14.6. ЭНТРОПИЯ Пусть X — случайная величина, принимающая значения на множестве S. Обозначим через Рг[Х = х] вероятность того, что случайная величина X принимает значение х. Бинарная энтропия случайной величины X, обозначаемая через Н(Х), определяется следующим образом: H(X) = ^Pr[X = x]log2[¥^--l). Пусть Y — другая случайная величина, принимающая значения на множестве Т, и (X, Y) — случайная величина, принимающая значения на множестве SxT в соответствии с совместным распределением случайных величин X и У. Тогда условной энтропией случайной величины X при заданном значении Y называется H(X\Y)'=H(X,Y)-H(Y). В этом разделе мы приведем некоторые простые свойства энтропии и несколько замечательных примеров применения энтропии в комбинаторике и геометрии. Интуитивно ясно, что энтропия случайной величины характеризует количество информации, содержащейся в ней. Отсюда становится ясен «физический» смысл четырех утверждений следующей леммы. Формальное доказательство, приведенное ниже, опирается на свойства функций log г и z log г, где через log z здесь обозначен двоичный логарифм log2 z.
14.6. энтропия 267 Лемма 14.6.1. Пусть X,Y и Z —случайные величины, принимающие значения на множествах S,T uU соответственно. Тогда О Н{Х) ^ log2 |5|; ii) H(X,Y)>H(X); Ш) Н(Х, Y) ^ Н(Х) + H(Y); iv) H(X\Y,Z)^H(X\Y). Доказательство. i) Так как функция log z вогнута, то из неравенства Иенсена следует, что ^g(EPr[X-]p^)=log|S|. ii) Из монотонности функции log z при всех z > О следует, что ies jer x L J/ = gPr[X = i]log(^^)=tfW. (14.1) iii) По определению H{X) + H{Y)-H(X,Y) = -SS-^-^-^(pSf-V^)- = EEPr[x = il Prty = '№;)• (14-2) где /(г) = z log г и ^ = Pr^x=fi^y=j] ♦ Так как функция f(z) выпукла, то из неравенства Иенсена следует, что последняя величина не меньше ЛЕЕ Рг[* = <] Prty=№>) = /а) = о. \iesjer J iv) Заметим, что H(X\Y) = H(X,Y) - H(Y) = ies jer ч L ' J]/
268 Глава 14. КОДЫ, ИГРЫ И ЭНТРОПИЯ Аналогично, ies jeTkeu Следовательно, H(X\Y)-H(X\Y,Z) = _vvvPr[x = *,y=j]Pr[y=^z=/c] ies jeTkeu L JJ где /(г) = г log z и _ Рг[У = j]Pr[X = j,Y = j,Z = k] Zijk ~ Pv[X = i,Y = j}PT[Y = j,Z = kY Из выпуклости функции f(z) и того, что vvvPr[X = t,r = j]Pr[y = j,Z = fc] ies jeTkeu l •/J вытекает, что последняя величина не меньше / (ее е РГ[Х "■yP;f-r'rAZ - "J - /w - о ■ Приведенное ниже простое, но полезное утверждение о том, что энтропия субаддитивна, уже применялось в гл. 12, разд. 12.2. Предложение 14.6.2. Пусть X = (Х\,..., Хп) — случайная величина, принимающая значения на множестве S = S\ х 52 х ... х Sn, где каждая координата Xi вектора X является случайной величиной, принимающей значения на множестве Si. Тогда H{X)^J2H(Xi Доказательство. Утверждение следует по индукции из третьего пункта леммы 14.6.1. ■ Приведенное выше утверждение используется в работе [Kleitman, Shearer and Sturtevant (1981)] для получения нескольких интересных приложений в экстремальной теории конечных множеств, включая верхнюю оценку для максимально возможной мощности семейства fc-множеств, в котором ни одно из пересечений двух множеств не содержится в третьем. Основная идея работы [Kleitman et al. (1981)] может быть проиллюстрирована с помощью следующего очень простого следствия последнего утверждения.
14.6. энтропия 269 Следствие 14.6.3. Пусть Т — некоторое семейство подмножеств множества {1,2,...,п}. Обозначим через pi долю множеств семейства Т, содержащих элемент г. Тогда где Н(у) = -y\og2y- (1 - j/)log2(l - у). Доказательство. Поставим в соответствие каждому множеству F Е Т его характеристический вектор v(F), представляющий собой двоичный вектор длины п. Пусть X = (Х\,..., Хп) — случайная величина, принимающая значения на множестве {0,1}п, где Рт[Х = v(F)] = 1/\F\ для всех F Е Т. Ясно, что Н(Х) = \Т\(т^т log \T\) = log \!F\, и так как H(Xi) = H(pi) для всех 1 ^ г ^ п, требуемый результат следует из утверждения 14.6.2. ■ Следующее интересное обобщение утверждения 14.6.2 было получено Ширером (см. [Chung, Prankl, Graham and Shearer (1986)]). Пусть X = (Xi,... ,Xn)—случайная величина, принимающая значения на множестве S = S\ х 52 х ... х 5П, где каждая координата Х{ — случайная величина, принимающая значения на множестве Si. Для подмножества / множества {1,2,..., п}, обозначим через Х(1) случайную величину {Xi)iej. Предложение 14.6.4. Пусть X = (Xi,...,Xn) и S обозначают то же, что и прежде. Пусть Q — семейство подмножеств множества {1,..., п), и каждый элемент г Е {1,... ,п} принадлежит не менее чем к множествам семейства Q. Тогда кН(Х) < £ H(X(G)). Geo Доказательство. Применим индукцию по к. При к = 1 заменим каждое множество G Е Q его подмножеством так, чтобы получить семейство Q', члены которого образуют разбиение множества {1,..., п}. Из второго пункта леммы 14.6.1 следует, что ^2q^.q H(X(G)) ^ YlceQ' H(X(Gf)), из третьего пункта леммы 14.6.1 следует, что YlceQ' H(X(G')) ^ H(X), а, значит, и требуемое утверждение для к = 1. Пусть утверждение верно для к—1, докажем его для к (> 2). Если семейство Q содержит множество G = {1,..., п}, то требуемое утверждение следует из предположения индукции. В противном случае рассмотрим два множества G\,G2, принадлежащих семейству Q. Воспользовавшись четвертым пунктом леммы 14.6.1, получаем, что H(X(Gi \ G2)\X(G1 n G2), X(G2 \ G,)) ^ H(X(Gi \ G2)\X(G1 П G2)), откуда следует неравенство H(X(Gx U G2)) - H(X(G2)) ^ H(X(G,)) - H(X(G, П G2)). Следовательно, H((X{Gi U G2)) + H{X{GX П G2)) < H{X{GX)) + H(X(G2)). Тогда мы можем модифицировать семейство Q, заменив в нем множества Gi и G2 их объединением и пересечением, при этом значение суммы YLg&9 ^(-^(^9)
270 Глава 14. КОДЫ, ИГРЫ И ЭНТРОПИЯ может только уменьшиться. После конечного числа таких преобразований мы получим семейство Q, содержащее множество {1,..., п}, а этот случай мы уже рассматривали. Утверждение полностью доказано. ■ Следствие 14.6.5. Пусть Т — семейство векторов из S\ x 52... х Sn. Пусть Q = {Gi,G2,.. .Gm} —семейство подмножеств множества N = {1,2,...,п}, и пусть каждый элемент i e N принадлежит не менее чем к множествам семейства Q. Для каждого 1 ^ г ^ т обозначим через Ti семейство проекций членов семейства Т на множество Gi. Тогда т г=1 Доказательство. Пусть X = (Х\,..., Хп) —случайная величина, принимающая значения на множестве Т, где Рт[Х = F] = 1/\Т\ для всех F G Т. Из утверждения 14.6.4 следует, что m kH(X)^^2H(X(Gi)). г=1 Требуемое утверждение вытекает теперь из того, что Н(Х) = log2 \F\, и неравенства H(X(Gi)) ^ log2 \Fi\, следующего из первого пункта леммы 14.6.1. ■ Объем любого d-измеримого подмножества в Rn может быть оценен объемом аппроксимирующей это множество фигуры, составленной из образованных достаточно частой решеткой кубов, поэтому последний результат имеет и геометрическое применение. Нижеследующее утверждение доказывается другим способом в работе [Loomis and Whitney (1949)]. Следствие 14.6.6. Пусть В — измеримое тело в n-мерном евклидовом пространстве. Обозначим через Vo\(B) его (n-мерный) объем, а через Vo\(Bi) обозначим (п — 1)-мерный объем проекции тела В на гиперплоскость, полученную фиксацией г-й координаты. Тогда п (Voi(B))n-4nv°W ■ г=1 При Si = {0,1} для всех г из следствия 14.6.5 получаем следующее утверждение относительно систем множеств. Следствие 14.6.7 [Chung et al. (1986)]. Пусть N —конечное множество и Т — семейство подмножеств множества N. Пусть Q = = {Gi,...Gm} —семейство подмножеств множества N, и пусть каждый элемент множества S принадлежит не менее чем к множествам семейства Q. Для каждого 1 ^ г < т положим Ti = {F П Gi: F Е Т]. Тогда m*<iii*i г=1
14.6. энтропия 271 В заключение данной главы приведем следующее применение последнего результата, описанное в работе [Chung et al. (1986)]. Следствие 14.6.8. Пусть Т — семейство графов на помеченном множестве вершин {1,2, ..Л], и пусть для каждой пары графов семейства Т найдется треугольник, содержащийся в каждом из них. Тогда 4 Доказательство. Обозначим через TV множество всех (*) неупорядоченных пар вершин из множества Т = {1,2...,*}, будем рассматривать Т как семейство подмножеств множества N. Обозначим через Q семейство всех подмножеств множества N, которые состоят из множеств ребер объединения двух полных графов на непересекающихся почти равномощных множествах вершин из множества Т. Обозначим через 4WfJ) число ребер такого объединения, а через га — мощность семейства Q. Из соображений симметрии следует, что каждое ребро множества TV принадлежит ровно к = %Ц графам семейства Q. Ключевым моментом доказательства является то, что у любых двух графов семейства Т должно быть не менее одного общего ребра в каждом из графов G E G, так как их пересечение содержит треугольник (а дополнение графа G не содержит треугольников). Следовательно, в обозначениях следствия 14.6.7, мощность каждого семейства Тг не превосходит 2S_1. Таким образом, получаем неравенство |jr|sm/(2) ^ (2s"1)m, откуда следует, что |^| < 2(0-0)/», так как s < (l)/2, отсюда вытекает требуемое утверждение. ■ Симонович и Шош предположили, что если семейство Т удовлетворяет условиям последнего следствия, то \т\ < |2а). Причем, если эта оценка верна, то она является наилучшей. Эта гипотеза до сих пор не подтверждена и не опровергнута. Представляется правдоподобной гипотеза, что существует такая абсолютная константа е > 0, что для каждого фиксированного графа if, не являющегося звездным лесом (т. е. лесом, каждая связная компонента которого представляет собой звезду), верно следующее. Пусть .Т7 — семейство графов на помеченном множестве вершин {1,2, ...£}, и пусть для каждых двух графов семейства Т найдется копия графа if,
272 Глава 14. КОДЫ, ИГРЫ И ЭНТРОПИЯ содержащаяся в каждом из них. Тогда И <Q-*) 2®. Вопрос об истинности данного утверждения также является открытым, но, тем не менее, несложно показать, что оно верно для каждого графа Я, хроматическое число которого не меньше 3, а также, что оно не выполняется для произвольного звездного леса Н. 14.7. УПРАЖНЕНИЯ 1. Пусть в (х\,..., я^-игре «постоянная должность» из разд. 14.3 задачей Пола будет максимизировать число преподавателей, получивших постоянную должность, в то время как задачей Кэрол является минимизировать эту величину. Обозначим через v это число при игре с полной информацией. Доказать, что v — LSi=i £;2~fcJ. 2. Пусть А\,..., Ап С {1,..., га} при Yl7=i 2~'Л*' < 1. Пол и Кэрол по очереди выбирают различные вершины из множества {1,...,га}. Пол выбирает первым, процесс продолжается пока не выберут все вершины. Кэрол выигрывает, если она выберет все вершины какого-либо из множеств Аг. Пол выигрывает, если не выиграет Кэрол. Найти выигрышную стратегию Пола. 3. Пусть Т — семейство графов на помеченном множестве вершин {1,2,... 2£}, пусть для каждых двух графов семейства Т найдется паросочетание из t ребер, содержащееся в каждом из них. Доказать, что 4. (Неравенство Хана.) Пусть X = (Х\,... ,Хт) —случайная величина, а Н(Х) обозначает ее энтропию. Для каждого подмножества / множества {1,2,... ,га} обозначим через Х(1) случайную величину (Xi)iei. Для 1 ^ q ^ га положим U-l/ QC{l,...rn},\Q\=q Доказать, что Нг(Х) > Н2(Х) >..> НШ{Х) = Н(Х). 5. Пусть Xi = ±1, 1 ^ i ^ п, — независимые равномерно распределенные случайные величины и Sn = Yl7=i ^i' Пусть О ^ р ^ \. Доказать, что Pr[Sn ^ (1 - 2р)п] ^ 2Я^П2"П, путем вычисления границы Чернова для гшпд^о i£[eASn]e_A(1_2p)n. (Случай р = О потребует небольшой модификации метода, тем не менее, результат будет таким же.)
ВЕРОЯТНОСТНЫЙ ВЗГЛЯД: Экстремальные графы Пусть Т и В — непересекающиеся множества мощности га, a G — двудольный граф с долями Т и В. Предположим, что G не содержит 4-циклов. Сколько ребер может содержать граф G1 Этот вопрос относится к экстремальной теории графов. Удивительно, но для некоторых значений га мы можем дать точный ответ. Пусть m = п2 + п + 1 и существует проективная плоскость Р порядка п (а, следовательно, содержащая га точек). Поставим в соответствие множеству Т множество точек проективной плоскости Р, а множеству В — прямые на плоскости Р, положим G = Gp и пусть вершина t Е T будет смежной с вершиной b Е В, только если точка t принадлежит прямой b на плоскости Р. Так как две точки не могут принадлежать двум различным прямым, граф Gp не содержит 4-циклов. Утверждается, что граф Gp содержит наибольшее количество ребер среди всех графов G без 4-циклов. Более того, каждый граф G, не содержащий 4-циклов, и содержащий такое количество ребер может быть записан в виде G = Gp. Пусть G не содержит 4-циклов. Выберем случайным образом два различных элемента 61,62 Е В. Для каждой вершины t Е Т обозначим через D(t) множество вершин b Е В, смежных с £, через d(t) = \D(t)\ обозначим степень вершины t. Обозначим через It индикатор события «вершина t смежна с вершинами 61,62». Тогда E[/t] = Pr[6b62e^)] = (df)/(;). Положим ш . * = £'*• teT Таким образом, случайная величина X равна числу вершин t E Т, смежных с вершинами 6i, 62. Тогда X ^ 1, т. е. каждая пара вершин 6i, 62 имеет по крайней мере одного общего соседа. (Неравенство X < 1 эквивалентно утверждению, что граф G не содержит 4-циклов.) Из линейности математического ожидания следует, что E[X] = X>[It] = £ teT teT Обозначим через d = га-1 YlteT ^W среднее значение степени вершин графа G. Выпуклость функции (?() влечет за собой неравенство £(?)/(ТМ')/(?)- *>)/?).
274 Вероятностный взгляд: Экстремальные графы обращающееся в равенство, только если у всех вершин t еТ степени совпадают. Заметим, что 1 >тахХ > Е[Х] > га При G = Gp все степени d(x) = d (каждая прямая содержит ровно п + I точку), и всегда верно, что X = 1 (две точки определяют ровно одну прямую). Таким образом, приведенные выше неравенства обращаются в равенства и >"$/£)• Любой граф с большим количеством ребер будет иметь среднюю степень, строго большую d, а следовательно, не будет выполняться условие 1 > га( d2 )/(™), и граф будет содержать 4-цикл. Пусть граф G содержит такое же количество вершин, что и Gp, и не содержит 4-циклов. Приведенные выше неравенства должны тогда обратиться в равенства, и всегда должно выполняться X = 1. Построим геометрический объект, соответствующий данному графу. Вершинам из множества Т поставим в соответствие точки, а каждое множество вершин, смежных с некоторой вершиной Ь G В, пусть определяет прямую. Так как X = 1, каждые две точки определяют единственную прямую. Поменяв местами множества Т и В, получаем, что каждые две прямые определяют единственную точку. Тогда получившийся объект — проективная плоскость. ;/?■
15_ Дерандомизация Математика естественна. Никто не смог бы выдумать математическую вселенную. Она существовала всегда, ждала своих исследователей; она великолепна, она фантастична. Дэюон Конвей Как уже было сказано в гл. 1, с помощью вероятностного метода часто можно получить эффективный вероятностный алгоритм для алгоритмических задач из самых разных областей. В некоторых случаях эти алгоритмы могут быть дерандомизированы и превращены в детерминированные. В этой главе мы обсудим несколько таких случаев. 15.1. МЕТОД УСЛОВНЫХ ВЕРОЯТНОСТЕЙ Простое применение вероятностного метода дает нам следующее утверждение, являющееся частным случаем теоремы 2.3.1. Предложение 15.1.1. Для каждого целого числа п найдется раскраска ребер полного графа Кп в два цвета, при которой число одноцветных копий графа К± не превосходит (™) • 2-5. Действительно, Q) -2-5 — это математическое ожидание числа одноцветных копий графа К± при случайной реберной 2-раскраске графа Кп, следовательно, раскраска из утверждения 15.1.1 существует. Можем ли мы детерминированным образом найти такую раскраску за полиномиальное от п время? Опишем процедуру, решающую эту задачу. Она представляет собой частный случай техники, называемой методом условных вероятностей. Прежде всего нам нужно определить весовую функцию для частично раскрашенного графа Кп. При заданной раскраске части ребер графа Кп в красный и синий цвета определим для каждой копии К графа К±, содержащейся в графе Кп, ее вес w(K) следующим образом. Если в подграфе К найдутся два ребра, раскрашенные в разные цвета, то w(K) = 0. Если ни одно из ребер подграфа К не раскрашено, то w(K) = 2-5, а если г ^ 1
276 Глава 15. ДЕРАНДОМИЗАЦИЯ ребер подграфа К имеют один и тот же цвет, то w(K) = 2Г_6. Определим также общий вес W частично раскрашенного графа Кп как сумму Ylw(K)-> где суммирование ведется по всем копиям К графа К± в Кп. Отметим, что вес каждой копии К графа К\ равен вероятности того, что эта копия окажется одноцветной в случае, если все бесцветные ребра графа Кп будут раскрашены случайно и независимо в красный и синий цвета. Тогда в силу линейности математического ожидания общий вес W представляет собой математическое ожидание числа одноцветных копий графа К± в раскраске, полученной путем случайного завершения частичной раскраски графа Кп. Опишем теперь процедуру нахождения раскраски, описанной в формулировке утверждения 15.1.1. Упорядочим произвольным образом все (™) ребер графа Кп. Построим требуемую 2-раскраску, присваивая в выбранном порядке каждому из ребер красный или синий цвет. Пусть ребра ei,..., е»—i уже раскрашены и требуется присвоить цвет ребру е;. Пусть W — текущий вес графа Кп, определяемый частичной раскраской с ребер е\,..., ei-\. Обозначим через H^red вес графа Кп, определяемый частичной раскраской, полученной из раскраски с при раскраске ребра е* в красный цвет, а через Wbiue-вес графа Кп, определяемый частичной раскраской, полученной из раскраски с при раскраске ребра е* в синий цвет. По определению веса W (это следует также из свойств математического ожидания) ue ~ 2 ' Цвет ребра е* выбирается так, чтобы минимизировать получающийся вес, т. е. при H^red ^ Wbiue раскрашиваем ребро е% в красный цвет, в противном случае — раскрашиваем его в синий. Из приведенного выше неравенства следует, что в нашем алгоритме вес не возрастает с течением времени. Так как начальное значение веса равно (^)2~5, его конечное значение не превосходит этого числа. Процесс останавливается только когда все ребра раскрашены, в этот момент вес равен числу одноцветных копий графа К±. Следовательно, описанный алгоритм создает детерминированным образом и за полиномиальное время реберную 2-раскраску графа Кп, удовлетворяющую требованиям утверждения 15.1.1. Опишем теперь метод условных вероятностей в более общем виде. Неявным образом этот метод возник в работе [Erdos and Selfridge (1973)], более явные примеры его применения можно найти в работах [Spencer (1987)] и [Raghavan (1988)]. Рассмотрим некоторое вероятностное пространство. Пусть, для простоты, оно симметрично и состоит из 21 точек, соответствующих двоичным векторам длины /. Пусть Ai,...,A8 — некоторое множество событий и Yli=i Рг[^г] = к. Таким образом, к — это математическое ожидание числа произошедших событий А{, а, следовательно, найдется точка пространства (£i,...,£i), в которой происходит не более к событий. Наша задача —найти такую точку детерминированным образом. Для каждого набора (е\,... ,£j-i) и для каждого события А{ условная вероятность
15.1. МЕТОД УСЛОВНЫХ ВЕРОЯТНОСТЕЙ 277 события Ai при заданных значениях £i,...,£j_i, очевидно, равна среднему арифметическому двух условных вероятностей, соответствующих двум возможным значениям Sj. To есть Рт[Аг 1 £1, ... , gj-i, 0] + ЩАг [£!,..., £j-l, 1] ГГ[Лг | £Ь. . .,£j-i\ = " Следовательно, 2 S J2PrlAi I £i,...,£j-i] = г=1 ^Рг[Лг | £1,...,^_1,0]+^Рг[Аг | £Ь . . . , 6j-U l] г=1 г=1 ^ 2 ^min <5^Pr [Д | гь...,^_1,0],^Рг[Лг | £b ... ,^-_i, l] L U=l i=l J Таким образом, если значения Sj выбираются поочередно таким образом, чтобы минимизировать значение суммы YH=\ Рг[^г I £ь • • •, £?], то это значение не может увеличиваться. Так как значение этой суммы изначально равно /с, оно не превосходит к ив конце процесса. Но по завершении процесса значения всех €j зафиксированы, следовательно, значение суммы равно числу событий Ai произошедших в точке (£i,..., £j), а это означает, что наш алгоритм выдал нужный результат. Отметим, что требования симметричности вероятностного пространства и того, чтобы оно состояло из 21 точек, могут быть ослаблены. Описанный выше алгоритм эффективен, если значение / не слишком велико (в комбинаторных задачах так обычно и бывает), и, что более важно, если условные вероятности Рт[Аг | £i,..., Sj] могут быть эффективно вычислены для каждого из событий Ai и для каждого из наборов £i,... , £j. Это безусловно так для примера, рассмотренного в утверждении 15.1.1. Тем не менее, есть множество интересных задач, для которых упомянутые требования не выполняются. Технический трюк, полезный в такого рода ситуациях, называется введением функций пессимистических оценок. Впервые этот прием был использован в работе [Raghavan (1988)]. Рассмотрим вновь описанное выше симметричное вероятностное пространство, состоящее из 21 точек, и события Ах,...,А8 в нем. Пусть для каждого события Ai и для каждого числа 0 ^ j ^ I имеется эффективно вычислимая функция /j(£i, • • •, £?). Предположим также, что /]_!(£!,...,£,_!) ^min {/j(£b..., £,_Ь0),/](£!,...,£,_!,!)}, (15.1) и что функция fj мажорирует условные вероятности для события Ai, т. е. /](£!,...,£,) >Pr[Ai | £!,...,£,]. (15.2) (Было бы достаточно предположить справедливость аналогичных неравенств для сумм по г правых и левых частей последнего неравенства, но в данном случае нас устраивает и такой вариант.) Таким образом, если в начале процесса
278 Глава 15. ДЕРАНДОМИЗАЦИЯ ]C*=i /о ^ ^» и на каждом шаге значение Sj выбирается так, чтобы минимизировать сумму YH=\ fj(£i • • •> £j)i то в итоге мы получим точку (£i,..., £i), для которой ^2^=1 fl{si, • • • ,£i) ^ t. Таким образом, число событий Л», происходящих в этой точке, не превосходит t. Функции /j, упомянутые выше, называют функциями пессимистических оценок. Этот метод позволяет получать эффективные алгоритмы в ряде случаев, когда не известен эффективный способ вычисления требуемых условных вероятностей. Примером тому служит следующая теорема, схожая с некоторыми результатами из гл. 12 и 14. Теорема 15.1.2. Пусть {о>^)^=1 —матрица размера п х п, состоящая из действительных чисел, такая, что —1 ^ aij ^ 1 для всех i,j. Тогда за полиномиальное время можно найти такие значения £i,...,£n Е { — 1,1}, что для каждого г, 1 ^ г ^ п, выполняется неравенство ^2£зЧ 3=1 ^ у/2п]п(2п). Доказательство. Рассмотрим симметричное вероятностное пространство, состоящее из 2п точек, соответствующих 2П возможным векторам (£i,...,£n) Е { —1,1}п. Положим Р = у/2п]п(2п) и обозначим через Ai событие, заключающееся в том, что \Yl1j=i£jaij\ > Р- Покажем, что метод условных вероятностей при использовании соответствующих пессимистичных оценок позволяет эффективно определить точку пространства, в которой не происходит ни одно из событий А{. Положим а = Р/п и определим функцию G(x) как pOLX | g-QI G(x) = ch(aa:) = 2 Путем сопоставления соответствующих рядов Тейлора несложно убедиться в том, что для всех действительных чисел х G(x)^e^, причем неравенство обращается в строгое, когда я; и а одновременно отличны от нуля. Не составляет труда также проверить, что для всех действительных чисел х и у справедливо соотношение G(x Л-у) Л- G(x - у) G(x)G(y) 2 Определим теперь функции /£, которые будут выполнять роль наших пессимистичных оценок. Для каждого 1 ^ г ^ п и для каждого набора £l,...,£p Е { — 1,1} ПОЛОЖИМ \i=1 / j=p+*
15.1. МЕТОД УСЛОВНЫХ ВЕРОЯТНОСТЕЙ 279 Несомненно, эти функции могут быть эффективно вычислены. Остается убедиться в том, что они удовлетворяют условиям (15.1), (15.2), и в том, что сумма ЕГ=1 /о меньше 1. Подтверждением тому служат следующие результаты. Утверждение 15.1.3. Для каэюдого 1 ^ г ^ п и для каэюдого набора £i,... ,£p_i Е { — 1,1} справедливо неравенство /*_i(ei, •.. ,ep-i) ^ min {/*(ei,..., £p_i, -1), yj(eb... ,ep_i, 1)}. Доказательство. Положим г> = ]Cj=i sjaij- Из определения функций pv и свойств функции G вытекает, что п fp_1(e1,...,ep-1) = 2e-a>3G(v)G(aip) Д G(aij) = j=P+l = 2e-a0G(v-aip) + G(v + aip) ^ ^^ = j=P+l _ /р(£ь • • • »gp-i» -1) + /ptei, • • • »gp-i» 1) "2 ^ ^ min { fp(eu..., £p_i, -1), /p(ei,... ,ep-i, 1)}, а это и требовалось доказать. ■ Утверждение 15.1.4. Для каэюдого 1 ^ г ^ п и для каэюдого набора £i,... ,£p_i Е { — 1,1} справедливо неравенство /p-l(£b---,£p-l) ^Рг(^г | £l,...,£p-l). Доказательство. Пусть v означает то же, что и в доказательстве утверждения 15.1.3. Тогда Pr[Ai | £Ь ..., £p_i] ^ Рф + J^ ej-aij > /3] + Pr[-v - J^ ^a^ > /3] = j^p j^p ^ eave-a/3E[ea{l:&pejaii)] + e-^e-^Efe""^**^] = = 2e"^G(t;) Д С(ау) = Гр_г(еи ..., £p_i). Утверждение 15.1.4 доказано. ■ Осталось показать, что Y17=i /о < 1- Действительно, из свойств функции G, а также из выбора а и (3 следует, что 71 П 71 71 ^ 2 2 £ /5 = £ 2е-<* п G(«*i) < £ 2е~а/3 ПеЧ* < г=1 г=1 j=l i=l j=\ < Y^2e-^e^ = 2ne^-aP = 2пе~^ = 1. г=1 Более того, первое неравенство является строгим, если не все а^ = О, а второе нер доказана. г=1 венство является строгш второе неравенство является строгим, если не все а?- = 1. Теорема полностью
280 Глава 15. ДЕРАНДОМИЗАЦИЯ 15.2. d-НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ В ПРОСТРАНСТВАХ МАЛОГО РАЗМЕРА Класс сложности NC представляет собой, грубо говоря, множество тех задач, которые могут быть решены за полилогарифмическое (от размера входных данных) время на полиномиальном числе параллельно работающих процессоров. При исследовании этого класса используются несколько моделей параллельных вычислений. Наиболее распространенной является модель EREW (^Exclusive Read, Exclusive Write) PRAM, в которой различные процессоры не могут обмениваться данными с одной и той же ячейкой памяти одновременно. Более подробно эта модель рассмотрена в работе [Кагр and Ramachandran (1990)]. Обозначим через п размер входных данных. Некоторые операции могут быть легко выполнены в классе NC. Например, можно записать содержимое ячейки с в т = п°^ ячеек за время O(logn), с использованием, скажем, т процессоров. Для того, чтобы сделать это, рассмотрим полное двоичное дерево с т листьями и поставим в соответствие каждой из его внутренних вершин процессор, а каждому процессору назначим по одной ячейке памяти. Сначала процессор, соответствующий корню дерева, считывает содержимое ячейки с и записывает его в две ячейки смежных с ним процессоров. Затем, оба этих процессора параллельно считывают информацию из своих ячеек и передают ее дальше. В общем случае, на г-м шаге все процессоры, находящиеся на расстоянии г — 1 от корневого, параллельно считывают информацию, записанную на предыдущем шаге в их ячейки, и записывают ее в ячейки соседей снизу. Ясно, что процесс, как и требовалось, закончится за время O(logm). (В действительности, можно показать, что для этой цели достаточно 0(т/ logm) процессоров, но мы не будем оптимизировать здесь это число.) Аналогичный прием можно использовать для сложения т чисел на т процессорах за время O(logm). Будем считать, что упомянутые числа лежат на листьях полного двоичного дерева с т листьями, а на г-м шаге каждый из процессоров, находящийся на расстоянии г от листьев, вычисляет сумму чисел, находящихся в ячейках его соседей снизу. Ясно, что в корне дерева окажется значение интересующей нас суммы за время O(logm). Вернемся теперь к задаче реберной раскраски полного графа Кп, рассмотренной в утверждении 15.1.1. Из сказанного выше вытекает, что задача проверки условия, что заданная реберная раскраска содержит не более (г1)2~5 одноцветных копий графа К±, принадлежит классу NC. Это означает, что такая проверка может быть выполнена за время (logn)0^1) (в действительности, за время O(logn)) при использовании п°^ процессоров. Действительно, построим сначала (™) копий данной раскраски. Затем назначим каждому процессору по копии графа К^ в Кп, которую он будет проверять на монохроматичность (все эти проверки могут вестись параллельно, так как у нас есть достаточное количество копий раскраски). Затем суммированием соответствующих индикаторов получим число процессоров, которым достались одноцветные копии. Ясно, что этот процесс потребует п°^ параллельных процессоров и завершится за время O(logn).
15.2. d-НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ 281 Итак, мы можем проверить в NC, удовлетворяет ли заданная раскраска графа Кп условиям утверждения 15.1.1. Возникает вопрос: принадлежит ли классу NC задача нахождения такой раскраски? Метод, описанный в предыдущем разделе, не годится, так как ребра в нем раскрашиваются по очереди, а, значит, такая последовательная процедура займет время Q(n2). Тем не менее, оказывается, что эта задача принадлежит NC, и мы можем найти раскраску с нужными свойствами, применив метод, основывающийся на технике, впервые предложенной в работе [Joffe (1974)], и развитой впоследствии многими исследователями. Этот метод позволяет преобразовывать вероятностные алгоритмы, работа которых зависит только от ^-независимых, а не от полностью независимых случайных выборов (для некоторой константы d) в детерминированные (а во многих случаях и в параллельные) алгоритмы. Изложенный здесь подход аналогичен подходу из работы [Alon, Babai and Itai (1986)], но для упрощения модели мы будем рассматривать случайные величины, которые принимают только два значения 0 и 1, каждое с равной вероятностью. Основная идея заключается в замене экспоненциально большого пространства элементарных событий пространством полиномиального размера. Если случайная величина в таком пространстве принимает какое-то значение с ненулевой вероятностью, то мы можем найти точку, где это происходит, простым перебором всех точек пространства. Это можно сделать без каких-либо потерь во времени с использованием полиномиального числа параллельных процессоров. Заметим, что для задачи реберной раскраски, рассмотренной в утверждении 15.1.1, достаточно 6-независимости случайных величин, соответствующих цветам ребер, ведь в этом случае вероятность «оказаться монохроматической» равна 2-5 для каждой из копий К±, а это дает нам требуемое математическое ожидание числа одноцветных копий. Следовательно, в этом конкретном случае достаточно построить вероятностное пространство размера п°^ из (2) случайных величин, каждая из которых принимает значения 0 и 1 с вероятностью 1/2, такое, что каждые 6 случайных величин в нем взаимно независимы. Пространства исходов малого размера с большим количеством d-независи- мых 0,1-случайных величин, могут быть получены из любых линейных кодов, исправляющих ошибки, с подходящими параметрами. Способ, описанный ниже, основывается на двоичных кодах Боуза—Чоудхури—Хоквингема (БЧХ- кодах) (см., например, [MacWilliams and Sloane (1977)]). Теорема 15.2.1. Пусть п = 2k — 1 и d = 2t + 1. Тогда найдется симметричное вероятностное пространство Q размера 2(п + \)г и d-независимые случайные величины у\,... ,уп, определенные над пространством Q, каждая из которых принимает значения 0 и 1 с вероятностью 1/2. Пространство и случайные величины могут быть явным образом построены при заданном представлении поля F = GF(2k) в виде k-мерной алгебры над полем GF(2). Доказательство. Пусть х\,..., хп — п ненулевых элементов поля F, представленных в виде вектор-столбцов длины к над полем GF(2). Обозначим
282 Глава 15. ДЕРАНДОМИЗАЦИЯ через Н следующую матрицу размера 1 + kt на п над полем GF(2)\ /11 1 \ Xi X2 Хп I т»" т»" т»" I Х1 Х2 ХП Это матрица проверки четности расширенного двоичного БЧХ-кода длины п с кодовым расстоянием 2£ + 2. Хорошо известно, что любые d = 2£ + l столбцов матрицы Н линейно независимы над полем GF(2). Для полноты изложения мы доказываем следующую лемму. Лемма 15.2.2. Любые d = 2t+ 1 столбцов матрицы Н линейно независимы над полем GF(2). Доказательство. Пусть J С {1, 2,..., п} — некоторое (2£+1)-элементное подмножество множества индексов столбцов матрицы Н. Пусть Yljej zjHj = 0, где Hj обозначает j-й столбец матрицы Н и zj G GF(2). Требуется показать, что Zj = О для всех j G J. По нашему предположению 5>,-*$=0 (15.3) для г = О и всех нечетных г, удовлетворяющих условию 1 ^ г ^ 2£ — 1. Пусть число а = 2Ъ • I нечетно при / ^ 2t — 1. Для г = I возведем равенство (15.3) в квадрат Ь раз. Учитывая, что (и + v)2 = и2 + v2 по модулю 2, а также, что Zj = z? для всех j, поскольку все Zj равны либо 0, либо 1, получаем, что равенство (15.3) верно для г = а. Следовательно, равенство (15.3) верно для всех г, 0 < г ^ 2t. Таким образом, мы имеем однородную систему 2t + 1 линейных уравнений с 2£+1 неизвестными. Матрица этой системы представляет собой матрицу Вандермонда, следовательно, она невырождена. Верно, что единственным решением этой системы является тривиальное решение: Zj — О при всех j G J, что и требовалось доказать. ■ Возвращаясь к доказательству теоремы, положим fi = {l,2,...,2(n+l)*}, и рассмотрим (0,1)-матрицу А ='(а^),г G f£, 1 ^ j ^ п, в которой 2(п+1)* = 2fct+1 строк представляют собой все возможные линейные комбинации (над полем GF(2)) строк матрицы Н. Пространство исходов Q дополнено теперь равномерной вероятностной мерой, определим случайные величины yj равенствами yj(i) = aij для всех i G 0,1 ^ j ^ п. Остается показать, что случайные величины yj являются ^-независимыми, и каждая из них принимает значения 0 и 1 с равной вероятностью. Для этого нам нужно показать, что для любого набора J из не более чем d столбцов матрицы А строки матрицы Aj = (а^),г G tt,j G J, размера \il\ на \J\ содержат одинаковое количество копий каждого из 2I*7' (0,1)-векторов длины
15.2. d-НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ 283 \J\. Заметим, что по лемме 15.2.2 столбцы соответствующей подматрицы Hj матрицы Н линейно независимы. Число строк матрицы Aj, совпадающих с некоторым произвольно заданным вектором, равно количеству образующих этот вектор линейных комбинаций строк матрицы Hj. Это количество равно числу решений системы из \J\ линейно независимых линейных уравнений с /с£+1 неизвестными, которое равно 2fct+1_lJl, независимо от вектора свободных коэффициентов. Теорема полностью доказана. ■ Теорема 15.2.1 предлагает нам эффективный способ построения для каждых фиксированных чисел d и п пространства элементарных событий размера О (п^/2-!) и п d-независимых случайных величин в нем, каждая из которых принимает значения 0 и 1 с равной вероятностью. В частности, мы можем использовать такое пространство размера О ((2) ) — 0(п6) для нахождения раскраски, как в утверждении 15.1.1, в NC. Несколько других применений теоремы 15.2.1 содержится в работе [Alon et al. (1986)]. Возникает естественный вопрос: можно ли уменьшить размер 0(n^/2J)? Далее мы покажем, что этот размер является наименьшим из возможных, с точностью до постоянного множителя (зависящего от d). Назовем случайную величину почти константой, если она принимает некоторое значение с вероятностью 1. Определим функцию ra(n, d) следующим образом: d/2 ,. ra(n, d) = 2. ( • Ь если d четно, И (d-l)/2 / п_г \ т(п, d) = У^ ( .] + (,, ., ч /л ), если d нечетно. £S V/ \(d-l)/2j' Отметим, что m(n,d) = Г2(п^/2-1) для каждого фиксированного числа d. Предлолсение 15.2.3. Если случайные величиныу\,..., уп, определенные на пространстве исходов Q, являются d-независимыми и ни одна из них не является почти константой, то \£l\ ^ m(n,d). Заметим, что мы не предполагаем здесь ни симметричности пространства D, ни того, что величины yj являются (0,1)-переменными. Доказательство. Не ограничивая общности рассуждений, мы можем полагать, что математическое ожидание каждой из переменных yj равно 0 (иначе можно было бы заменить переменную yj переменной yj — E[j/j]). Для каждого подмножества S множества {1,... ,п}, положим as = YljesVr 0™^тим? что поскольку ни одна из переменных yj не является почти константой, и так как эти случайные величины являются d-независимыми, для всех множеств S мощности не более d выполнено неравенство E[asas} = l[V^[yj}>0. (15.4)
284 Глава 15. ДЕРАНДОМИЗАЦИЯ Аналогично, для всех множеств S и Т, таких, что |5 U Т| ^ d и S фТ, имеем Щрс8ост\= Ц Varbft] Ц E[W]=0. (15.5) jesnr jesuT\(Snr) Пусть m = ra(n, d) и подмножества Si,... 5m множества {1,..., n) таковы, что мощность объединения любых двух из них не превосходит d. (Возьмем все подмножества мощности не более d/2 и, если d нечетно, добавим все подмножества мощности (d+ l)/2, содержащие 1.) Покажем, что m функций а^. (рассматриваемых как действительные векторы длины \£1\) линейно независимы. Отсюда будет следовать, что \£l\ ^ m = ra(n, d), что и требуется. Для доказательства линейной независимости положим JZjli cjaSj — 0. Умножая равенство на а^ и вычисляя математическое ожидание с использованием соотношения (15.5), получаем m 0 = ^2cjE[aSjaSi] = CiE[aSiaSi}. Отсюда и из (15.4) следует, что с» = 0 для всех г. Таким образом, линейная независимость доказана, а, значит, доказано и требуемое утверждение. ■ Последнее утверждение показывает, что размер пространства исходов с п d-независимыми невырожденными случайными величинами может быть полиномиальным от п, только если значение d фиксировано. Тем не менее, как было показано в работе [Naor and Naor (1990)], если требовать только почти d-независимости случайных величин, то размер может быть полиномиальным даже при d = D(logn). Такие пространства элементарных событий со случайными величинами, которые могут быть явным образом построены несколькими способами, имеют множество интересных применений, в которых достаточно почти d-независимости. Более подробно этот вопрос рассматривается в работах [Naor and Naor (1990)] и [Alon, Goldreich, Hastad and Peralta (1990)]. 15.3. УПРАЖНЕНИЯ 1. Пусть множества А\,...,Ап С {l,...,m} таковы, что ^Г=1 21_'Л^ < 1. Доказать, что существует 2-раскраска \ : {1? • • • ?т} ~~> {0,1}, при которой ни одно из множеств Ai не является монохромным. При т = п описать детерминированный алгоритм нахождения такой раскраски \ за полиномиальное время. 2. Найти детерминированный алгоритм, строящий при заданном п за полиномиальное от п время семейство Т из п10 подмножеств множества N = {1,2,...,п}, такое, что мощность каждого из множеств F G Т не превосходит 101og2n и такое, что для каждого семейства Q из п подмножеств мощности п/2 множества TV найдется множество F G J-, имеющее непустое пересечение со всеми множествами семейства Q.
ВЕРОЯТНОСТНЫЙ ВЗГЛЯД: Число пересечений, инцидентности, суммы и произведения Этот раздел мы начнем с изложения одного простого утверждения из теории графов, имеющего вероятностное доказательство. Затем будут рассмотрены некоторые его замечательные следствия, касающиеся комбинаторной геометрии и комбинаторной теории чисел. Вариации большей части этих, на первый взгляд, не связанных между собой утверждений, уже доказывались ранее, причем, доказательства эти были намного более громоздки. До появления новых версий доказательств, приведенных здесь, единственным намеком на то, что между этими утверждениями может быть какая-то связь, являлся тот факт, что соавтором всех первых версий доказательств был А. Семереди. Вложением графа G = (V,E) в плоскость называют его планарное представление, в котором каждой вершине соответствует точка плоскости, а каждому ребру {и, v} соответствует кривая, соединяющая точки, соответствующие вершинам unv. Числом пересечений такого вложения называют число пар пересекающихся кривых, соответствующих парам неинцидентных ребер. Число пересечений cr(G) графа G — это минимально возможное число пересечений его вложения в плоскость. Следующая теорема была доказана в работе [Ajtai, Chvatal, Newborn and Szemeredi (1982)] и, независимо, Лейтоном. Ниже мы приводим ее очень короткое вероятностное доказательство. Теорема 1. Число пересечений произвольного графа G = (V,E) без петель и кратных ребер, такого, что \Е\ > 4|V|, не меньше \E\3/(64\V\2). Доказательство. Из формулы Эйлера следует, что у планарного п-вершин- ного графа без петель и кратных ребер может быть не более Зп ребер, тогда число пересечений любого простого n-вершинного графа с т ребрами должно быть не меньше т — Зп. Пусть G = (V,E) — граф, вложенный в плоскость с t = cr(G) пересечениями, и \Е\ > 4|V|. Обозначим через Н случайный подграф графа G, полученный случайным и независимым выбором вершин графа G, таким, что каждая вершина оказывалась в графе Н с вероятностью р (значение р будет выбрано позже). Математическое ожидание числа вершин графа Н равно p|V|, математическое ожидание числа его ребер равно p2|i£|, а математическое ожидание числа пересечений в заданном его вложении равно p4t, откуда следует, что математическое ожидание числа пересечений не превосходит рН. Таким образом, рН > р2\Е\ - 3p|V|, а, значит, cr(G) = (>!f_4!. РА рЛ Не делая попытки оптимизировать постоянный множитель, подставим число р = 4|V|/|i£| (^ 1), для получения требуемого результата. ■ В работе [Szekely (1997)] было показано, что с помощью этого результата можно получить удивительно простое доказательство теоремы Семереди и Троттера, относящейся к комбинаторной геометрии. Исходное доказательство намного сложнее.
286 Глава 15. ЧИСЛО ПЕРЕСЕЧЕНИЙ... Теорема 2. Пусть Р — мноэюество, состоящее из п различных точек плоскости, a L — мноэюество, состоящее из т различных прямых. Тогда число инцидентностей между элементами мноэюеств Р и L (т. е. количество пар (р,1), где р G Р, I G L и р G I) не превосходит с • (га2/3п2/3 + т + п) для некоторой абсолютной константы с. Доказательство. Обозначим число инцидентностей через /. Пусть G = (V,E) — граф на множестве вершин Р, в котором две вершины смежны, только если они являются соседними точками на некоторой прямой из множества L. Ясно, что, \V\ = пи\Е\ = 1—т. Заметим, что граф G уже вложен в плоскость, причем ребрам соответствуют отрезки прямых из множества L. В этом вложении каждое пересечение дает точку, принадлежащую двум прямым из множества L, следовательно, cr(G) ^ (™) ^ т2/2. По теореме 1 либо I - т = \Е\ < 4\V\ = 4п и / ^ т + 4п, либо ™? ,ГЛ {I - т)3 Т > СГ(С) > "W и / ^ (32)1/3m2/3n2/3 + т. В обоих случаях / ^ 4(m2/3n2/3 + т + п), что и требовалось доказать. ■ Аналогичным образом можно показать, что максимальное число инцидентностей между п точками и т единичными окружностями на плоскости не превосходит 0(га2/3п2/3+га+п), отсюда следует, что число единичных расстояний, определяемых п точками плоскости не превосходит 0(п4/3). Указанная выше верхняя оценка числа инцидентностей точек и прямых точна (если не учитывать постоянный множитель), но в то же время старая гипотеза Эрдёша гласит, что число единичных расстояний, определяемых п точками плоскости, не превосходит с£п1+£ для любого е > 0. Тем не менее, оценка 0(п4/3) — наилучшая из известных верхних оценок. Она была получена Спенсером, Семереди и Троттером гораздо более сложным способом. В работе [Elekes (1997)] было найдено несколько применений для теоремы 2 в аддитивной теории чисел. Доказательства также получились очень простыми. Примером может служить следующая теорема. Теорема 3. Для любых трех мноэюеств действительных чисел А, В и С мощности s верно, что |А • В + С\ = \{аЬ + с : а е А,Ъ е В,с е С}| > ft(s3/2). Доказательство. Положим R = АВ + С, |Д| = г и пусть Р = {(a, t) : a e A, t G Д}, L = {у = Ьх + с : b G В, с G С}. Таким образом, Р — множество из п = sr точек плоскости, L — множество из т = s2 прямых на плоскости, и каждая прямая у = Ьх 4- с из множества L инцидентна s точкам из множества Р, т. е. всем точкам {(a,ab + с) : a G А}. Следовательно, по теореме 2, s3 ^ 4(s4/3(sr)2/3 + sr+s2), а, значит, г > Q(s3/2), что и требовалось доказать. ■ Аналогично можно показать, что для каждого множества А из п действительных чисел выполнено либо |А+А| > D(n5/4), либо \А-А\ ^ п5/4. Это сильно улучшает и упрощает соответствующий результат Эрдёша и Семереди.
Приложение Оценки для больших уклонений АЛ. ОЦЕНКИ ДЛЯ БОЛЬШИХ УКЛОНЕНИЙ В этом приложении приводятся некоторые базовые оценки для больших уклонений, которые часто оказываются полезными при применении вероятностного метода. Наше изложение не опирается на внешние источники. Большая часть результатов может быть найдена или легко получена из основополагающей работы [Chernoff (1952)]. В случае, если мы руководствуемся асимптотическими соображениями, неравенства доказываются для всех значений параметров из заданной области. Следующий результат, несмотря на то, что он описывает частный случай, хорошо раскрывает основную идею этого приложения. Теорема А. 1.1. Пусть Х^ 1 ^ г ^ п, — взаимно независимые случайные величины, такие, что Pr[Xi = +l] = Pr[Xi = -l] = ^. Положим Ъп = Х\ + ... + Хп и пусть а > 0. Тогда Pr[Sn > а] < е~а /2п. Замечание. Для больших п из центральной предельной теоремы вытекает, что случайная величина Sn имеет приблизительно нормальное распределение с нулевым средним значением и стандартным отклонением равным у/п. В частности, при любом фиксированном и имеем: lim Pr[Sn > uy/n] = / -=e~t2/2dt, n^°° Jt=u V2?r причем, можно явным образом показать, что последняя величина меньше е-и /2 Наше доказательство, подчеркнем это еще раз, верно для всех значений п и а > 0. Л
288 Приложение А. ОЦЕНКИ ДЛЯ БОЛЬШИХ УКЛОНЕНИЙ Нам потребуется неравенство Маркова: если Y — произвольная неотрицательная случайная величина и а > О, то Рг[У > аЕ[У]] < 1/а. Доказательство теоремы А. 1.1. Зафиксируем значения п, а и пусть, на короткое время, значение Л > 0 произвольно. Для 1 ^ г ^ п имеем: Е[еЛХ*] = (еЛ+е-Л)/2 = сп(А). Нам потребуется неравенство ch(A) ^ ел2/2, справедливое для всех значений Л > 0, оно следует из леммы А. 1.5 при а = 0. (Это неравенство может быть получено более простым способом — путем почленного сравнения рядов Тейлора этих функций.) В силу определения величины Sn справедливо равенство г=1 Так как величины Xi взаимно независимы, то взаимно независимы и случай- ные величины е г, следовательно, математическое ожидание произведения равно произведению математических ожиданий: п E[eAS"] = []E[eAXi] = [ch(A)]n < е^2. г=1 Отметим, что Sn > а, только если eASn > еАа, и применим неравенство Маркова: Pr[Sn > а] = Pr[eAS" > еХа] < E[eAS-]/eAa ^ ех3^2-Ха. Чтобы оптимизировать неравенство, положим А = а/п. Тогда Pr[Sn > а] < е~а /2п, как и утверждалось. ■ Из соображений симметрии получаем Следствие А.1.2. Пусть выполнены условия теоремы А. 1.1. Тогда Pr[|Sn| > а] < 2е-а2/2п. Далее мы будем иметь дело с случайными величинами X, распределенными следующим образом. Предположение А. 1.3. Pi,...,Pn e [0,1], Р= (Pl +.--+Рп)/Щ
Приложение А. ОЦЕНКИ ДЛЯ БОЛЬШИХ УКЛОНЕНИЙ 289 Х\,..., Хп взаимно независимы и имеют следующее распределение вероятностей: Pr[Xi = 1 -pi] =pU Рг[Х; = -р^ = 1-Pi; X = Xi + ... + Xn. Замечание. Ясно, что ЩХ] = ЩХг] = 0. При всехр^ = 1/2 величина X имеет то же распределение, что и случайная величина Sn/2. Если все pi = р, то X имеет распределение В(п,р) — пр, где через В(п,р) обозначено биномиальное распределение. Теорема А.1.4. При предположении А.1.3 и а > 0 имеем Рг[Х > а] < е-2а2/п. Лемма А.1.5. Для всех действительных чисел а,Р, таких, что \а\ ^ 1, справедливо неравенство ch(/?) + ash(/?)^e^/2+^. Доказательство. Неравенство очевидно при а = +1, а = -1 или |/?| > 100. Если бы лемма была неверна, то функция /(а, 0) = ch(/3) + ash(/3) - e^2*^ достигала бы положительного глобального максимума во внутренней части прямоугольника Д={(а,/?):|а|^1,|/?|^100}. Приравняв частные производные к нулю, получаем sh(/3) + асЦр) = {а + (3)е?2'2+а(3, sh(/J) = peP2'2*"*, следовательно, th(/3) = /3, а это верно только при /? = 0. Но /(а,0) = 0 для всех а. Полученное противоречие доказывает лемму. ■ Лемма А. 1.6. Для всех в Е [0,1] и всех А справедливо неравенство 0eA(i-*) + (1 - в)е~хв ^ ел2/8. Доказательство. Положив в = (1 + a)/2 и Л = 2/5, сводим лемму А.1.6 к лемме А. 1.5. ■ Доказательство теоремы А. 1.4. Пусть, на короткое время, значение Л > 0 произвольно. По лемме А. 1.6 Е[еЛХ*] = Plex{1-pi) + (1 - Pl)e-Xpi ^ ед2/8.
290 Приложение А. ОЦЕНКИ ДЛЯ БОЛЬШИХ УКЛОНЕНИЙ Тогда E[exx] = f[E[eXXi]^ex2n'*. г=1 Применяя неравенство Маркова, получаем Рг[Х > а] = Рг[елх > еХа] < Е[елх]/еЛа ^ e^^/s-Xa Чтобы оптимизировать неравенство, положим Л = 4а/п. Получаем Рг[Х > а] < е"2а2/п, как и утверждалось. ■ Из соображений симметрии получаем Следствие А. 1.7. При предполоэюении А. 1.3 и а > О справедливо неравенство Рт[\Х\ >а] <2е~2а /п. При предположении А. 1.3 и при произвольном Л имеем: п п Е[еЛХ] = []E[eAXi] = Ц\ргех^-^ + (1 -Pi)e'x^] = г=1 г=1 п = e-A"n][[tP<eA + (1-P*)]- г=1 При фиксированном Л функция f(x) = \п[хех + 1-х]= \п[Вх + 1], гдеВ = ех - 1, вогнута, тогда (по неравенству Йенсена) п 5^/(р0<п/(р). г=1 Потенцируя обе части неравенства, получаем п Ц\ргех + (1 - Pi)] ^ Ь>еХ + (1 - Р)]п, г=1 таким образом, мы доказали следующий результат. Лемма А. 1.8. При предполоэюении А. 1.3 справедливо неравенство Е[ехх] < е-Хрп\рех + (1 - р)]п. Теорема А. 1.9. При предполоэюении А. 1.3 и а > О неравенство Рг[Х > а] < е"Лрп[рел + (1 -р)]пе"Ла
Приложение А. ОЦЕНКИ ДЛЯ БОЛЬШИХ УКЛОНЕНИЙ 291 справедливо для всех Л > 0. Доказательство. Рг[Х > а] = Рг[еЛХ > еХа] < Е[елх]/еЛа. Применим теперь лемму А. 1.8. ■ Замечание. При заданных р,п,а оптимальное значение Л в теореме А. 1.9 находится с помощью элементарных вычислений и оказывается равным In 1 -р\ ( а + пр \ 1 р ) \п - (а + пр) J J ' Это значение часто оказывается слишком громоздким в применении. Мы используем близкое к оптимальному значение Л для получения удобочитаемых результатов. Положив Л = 1п[1+а/рп] и используя неравенство (l+a/n)n ^ еа, получаем из теоремы А. 1.9 следующий результат. Следствие А. 1.10. Справедливо неравенство рТ\Х > а] < ea-Pnln(1+a/Pn)-aln(1+a/Pn). Теорема А. 1.11. Имеет место неравенство РГ[Х ^ а] < е-"2/2рп+а*/2(рп)\ Доказательство. При и = а/рп применим к следствию А. 1.10 неравенство 1п(1 + и) > и - и2/2, справедливое для всех и > 0. ■ Если все Pi = р, то величина X имеет дисперсию, равную пр(1 — р). При р = о(1) и а = о(рп) эта оценка отражает аппроксимацию распределения величины X нормальным распределением с дисперсией ~ пр. Оценка из теоремы А. 1.11 достигает минимума при а = 2рп/3. Для а > 2рп/3 у нас есть следующая простая оценка: Рг[Х > а] ^ Рг[Х > 2рп/3] < е"2рп/27, которую можно улучшить описанным ниже способом. Теорема А. 1.12. Для /3 > 1 справедливо соотношение Рг[Х >(р- 1)рп] < [е^р-Р]?71. Доказательство. Подставим соответствующее значение параметра в следствие А. 1.10. ■ Величину X + рп можно интерпретировать как количество успехов в п независимых испытаниях с вероятностью успеха в г-м испытании, равной р^.
292 Приложение А. ОЦЕНКИ ДЛЯ БОЛЬШИХ УКЛОНЕНИЙ Теорема А. 1.13. При предположении А. 1.3 и а > О справедливо неравенство Рт[Х < -а] < е~а /2рп. Заметим, что здесь нельзя воспользоваться «симметричностью», так как при этом р и 1 — р поменяются местами. Доказательство. Пусть, на короткое время, значение Л > 0 произвольно. Из рассуждений, предшествующих лемме А. 1.8 следует, что Е[е"ЛХ] ^ eXpn\pe~x + (1 -р)]п. Тогда, аналогично теореме А. 1.9, Рг[Х < -а] = Рг[е"ЛХ > еХа] < eXpn\pe~x + (1 - р)]пе"Ла. Применив неравенство 1 4- и ^ еи, верное для всех значений и, получаем ре~х + (1 - р) = 1 + (е"Л - 1)р < ер(е"Л-1} и _л _. Рг[Х < —а] < еЛРп+пР(е -1)-Аа _ епр(е А-1+Л)-Ла^ Применим неравенство е~х sSl-A + A2/2, верное для всех значений Л > 0. (Отметим, что аналогичное неравенство ех ^ 1 4- Л 4- Л2/2 неверно для Л > 0, поэтому этот метод, примененный для оценки Рг[Х > а], требует поправочного слагаемого, такого же, как в теореме А. 1.11.) Итак, Рг[Х < -а] ^ епрХ2/2-Ха. Чтобы оптимизировать неравенство, положим Л = а/пр, получим Рг[Х < -а] < е~а /2рп, как и утверждалось. ■ Часто оказывается полезным следующий результат. Следствие А. 1.14. Пусть Y —сумма взаимно независимых индикаторов, /х = Е[У]. Для всех е > 0 выполнено соотношение Рг[|У - /х| > efj] < 2е"с^, где величина с£ > 0 зависит только от е. Доказательство. Применим теоремы А.1.12, А.1.13 при Y = X +рп и с£ = min[- ln(e£(l + £Г(1+е)), е2/2]. Ш Асимметричность случаев Рг[Х < а] и Рг[Х > а], которую демонстрируют теоремы А.1.12, А.1.13, действительно существует. Нормальное распределение с нулевым средним и дисперсией пр аппроксимирует распределение случайной величины X относительно точно при оценке Рг[Х < а] для любого значения а, а также при оценке Рг[Х > а] с а = о(пр). Но когда значения а и пр становятся сравнимыми, или когда а^> пр, пуассоновское поведение начинает
Приложение А. ОЦЕНКИ ДЛЯ БОЛЬШИХ УКЛОНЕНИЙ 293 превалировать, и значение Рг[Х > а] не моэюет быть достаточно точно оценено с помощью нормального распределения. В завершение приведем два результата о больших уклонениях, касающихся распределений, а не сумм индикаторов. Теорема А. 1.15. Пусть случайная величина Р имеет пуассоновское распределение со средним значением \х. Для любого е > О справедливы неравенства Pr[P>ii(l + e)}^ [e£(l + e)-^y. Доказательство. Для любого s имеем Pr[P = s}= lim Pr \в (п, -) =s]. п—кх> L V П/ J Применим теоремы А. 1.12, А. 1.13. ■ Теорема А. 1.16. Пусть случайные величины Xi, 1 < г ^ п, взаимно независимы и ЩХг] = 0, \Xi\ ^ 1. Положим S = Х\ + ... + Хп. Тогда Рг[5 > а] < е-а2/2п. Доказательство. Положим Л = а/п, как и в доказательстве теоремы А. 1.1. Пусть h{x) = *l±fl + ^=flx. Для х Е [—1,1] выполнено неравенство еХх ^ h(x) (у = Н(х)—это хорда выпуклой кривой у = еЛх, проходящая через точки х = ±1). Тогда E[eAXi] ^ E[h{Xi)] = h(E[Xi]) = h{0) = chA. Далее действуем как в доказательстве теоремы А. 1.1. ■ Теорема А. 1.17. Пусть ЩХ] = О и расстояние между любыми двумя значениями случайной величины X не превосходит единицы. Тогда для всех Е[еЛХ] ^ ех /8. Доказательство. Зафиксируем значение Ь Е [— ^, ^], для которого случайная величина X Е [~У"Ь, +12+Ь]- Пусть у = h(x) — прямая, пересекающая кривую у = еХх в точках (±1 + Ь)/2. Так как функция еХх выпукла, то еХх ^ h(x) для всех х Е [=%±, ±Ш]. Тогда Е[еЛХ] ^ E[h(X)] = НЦХ]) = Л(0). Имеем Л(0) = eAb/2[ch(A/2) - bsh(A/2)], а эта величина не превосходит ех /8 по лемме А. 1.5. I
294 Приложение А. ОЦЕНКИ ДЛЯ БОЛЬШИХ УКЛОНЕНИЙ Теорема А. 1.18. Пусть случайные величины Хг, 1 ^ г ^ п, взаимно независимы, ЩХг] = О и расстояние между любыми двумя значениями каждой из случайных величин Хг не превосходит единицы. (Тем не менее, значения различных Xi,Xj могут находиться на большем расстоянии.) Положим S = Х1 + ... + Хп. Тогда Рг[5 > а] < е-2а2/п. Доказательство. По теореме АЛ.17 Е[еЛ5] = ПГ=1-Е[елх*] ^ епХ /8. Тогда для всех А > О имеем Рг[5 > а] = Pr[exs > еЛа] ^ ехр 8 Ла Положим Л = 4а/п. Мы, в целом, руководствовались идеей, что если случайная величина X имеет нулевое математическое ожидание и дисперсию сг2, то вероятность Рг[Х > аа] должна себя вести как е~а I2. Но существуют ситуации, когда это утверждение совершенно не верно. Рассмотрим предположение А. 1.3 при всех pi = 1/п, тогда X = Рп — 1, где величина Рп имеет биномиальное распределение В(п, 1/п) сходящееся к Р, пуассоновскому распределению со средним значением равным единице. Тогда ЩХ] = 0и Var[X] ~ 1. Для произвольного фиксированного а имеем Рг[Х = а] —> Л^,, что намного больше е-а /2 вместе с этим предостережением мы приводим условия, при которых упомянутое суждение асимптотически верно, если значение а невелико. Теорема А. 1.19. Для каждого С > О и е > О существует 5 > 0, такое, что верно следующее. Пусть Хг, 1 ^ г ^ п, где п произвольно, — независимые случайные величины, ЩХг] = 0, \Хг\ ^ С и VarpQ] = сг2. Положим X = Ya=i ^ и а2 = ]СГ=1 ai> так что Var[X] = а2. Тогда для О < а ^ 5а Рг[Х>а<т]<е-^(1-£). Доказательство. Положим Л = а/а, так что 0 ^ Л ^ 6. Тогда E[eXXi] =J^E k=0 '* л^-k \2 °° \k fc=3 Так как \Xk\ ^ Ck 2Х2, выполнено Е[Хк] ^ Е[\Хк\] ^ Ck~2E[Xf] = Ck-2al Для к ^ 3 оценим |? < (к-2)\> так чт0 (СХ)к~2 Е[еЛХЮ + уаг2 1 + Е Ь (* ~ 2)' fc=3 = 1 + у^2еЛС-
A.2. УПРАЖНЕНИЯ 295 Выберем значение 5 так, чтобы оно удовлетворяло неравенству ecs ^ 1 + е. Так как Л ^ £, то А2 E[eAXi] ^ 1 + усгг2(! + е) < ехр уо?(1 + ^ Это неравенство верно для всех Х^, следовательно, "Л2 у*2(1 + £) Е[еЛХ] = JjE[eAXi] < ехр г=1 Рг[Х > аа] < E[eAX]e"w < е"^1"^. А.2. УПРАЖНЕНИЯ 1. Числом Хайоша графа G называют максимальное число к вершин графа G, каждая пара которых может быть соединена путем так, что все (2) путей попарно не пересекаются по внутренним вершинам (а также ни одна из этих к вершин не является одновременно внутренней точкой одного пути и конечной точкой другого). Существует ли граф, хроматическое число которого превосходит удвоенное число Хайоша? 2. Для двух подмножеств А и В множества Zm вычетов по модулю т и для некоторого числа д Е Zm положим s(A,B,g) = |{(а,Ь) : а е А,Ъ е В,а + Ь = д}\. Для разбиения множества Zm на два непересекающихся множества Zm = AU В, АпВ = 0 положим с(А,В) = max \s(A,A,x) + s(B,B,x) - 2s(A,B,x)\. xeZm Доказать, что для каждого нечетного числа т существует разбиение множества Zm на два непересекающихся множества А и В, такое, что с(А,В) = O(Vmlogm). 3. Пусть TV — стандартная нормальная случайная величина с функцией распределения f(t) = (27г)-1/2е~* /2. Найти точное значение E[eA7V]. Для а > О найти точное значение minA>oE[eA7V]e~Aa. Из этого будет следовать оценка Чернова для Pr[7V ^ а]. Как она соотносится с истинным значением Pr[7V > а] при больших а?
ВЕРОЯТНОСТНЫЙ ВЗГЛЯД: Графы, свободные от треугольников, содержат большие независимые множества Обозначим через a(G) размер наибольшего из независимых множеств графа G. Хорошо известно, что для каждого графа G на п вершинах, степень которых не превосходит d, a(G) ^ n/(d + 1). В работе [Ajtai, Komlos and Szemeredi (1980)] было показано, что в случае, когда граф G свободен от треугольников, эта оценка может быть улучшена на логарифмический множитель и a(G) ^ cnlogd/d, где с —некоторая абсолютная положительная константа. В работе [Shearer (1983)] упрощено доказательство и улучшено значение константы до наилучшего значения: с = 1 + о(1). Мы приводим здесь очень короткое доказательство этого факта и не пытаемся оптимизировать значение константы с. Доказательство основано на технике из работы [Shearer (1995)] и ее модификации из работы [Alon (1996)]. Утверждение. Пусть п-вершинный граф G = (V,E) свободен от треугольников и степень его вершин не превосходит d > 1. Тогда nlogd a{G) > "й- Здесь и далее через log d обозначен двоичный логарифм log2 d. Доказательство. При d < 16 утверждение следует из тривиальной оценки ol{G) ^ n/(d+ 1), а, значит, мы можем далее считать, что d > 16. Пусть Неслучайное независимое множество вершин графа G, выбранное равномерно среди всех независимых множеств графа G. Для каждой вершины v Е V определим случайную величину Xv = d\{v}C\W\ + \N(v)C\W\, где N(v) обозначает множество всех смежных с v вершин. Утверждается, что математическое ожидание случайной величины Xv удовлетворяет условию Е[Ху] > ^|—. Докажем это. Обозначим через Н подграф G, индуцированный множеством вершин V \ (N(v) U {v}). Зафиксируем независимое множество S в графе Н и обозначим через X множество всех вершин из N(v), не смежных с вершинами из 5, пусть \Х\ = х. Достаточно показать, что условное математическое ожидание E[Xv\WnV(H) = S}^1^- (1) для каждого фиксированного 5. При условии, что W П V(H) = 5, существует ровно 2х 4- 1 возможностей для выбора множества W: одна —для случая W = SU{v}, и 2х — для случая, когда v £ W и W представляет собой объединение множества S и подмножества множества X. Отсюда следует, что условное математическое ожидание из неравенства (1) равно т^рт + х2х~1/(2х 4-1). Для проверки того, что последняя величина не меньше logd/4, достаточно
Приложение 1. ГРАФЫ, СВОБОДНЫЕ ОТ ТРЕУГОЛЬНИКОВ... 297 заметить, что в противном случае х ^ 1 и 2х (log d — 2х) > Ad — logd. Тогда logd > 2х > 2, а, следовательно, Ad — logd < y/d(\ogd — 2), что неверно для всех d > 16. А значит, E[Xv\WnV(H)=S}>1^, как и утверждалось. Из линейности математического ожидания следует, что математическое ожидание величины ^2veV Xv не меньше п °6 . С другой стороны, ясно, что значение этой суммы не превосходит 2d|W|, так как каждая вершина и Е W вносит вклад d в слагаемое Хи и вклад, равный своей степени в графе G (последняя не превосходит d), в сумму всех остальных слагаемых Xv. Тогда математическое ожидание мощности множества W не меньше п * °Jd, a, следовательно, в графе найдется независимое множество, мощность которого не меньше, чем это математическое ожидание, что и требовалось доказать. ■ Число Рамсея г(3, к) — это минимальное число г, такое, что в любом графе с не менее чем г вершинами найдется либо треугольник, либо независимое множество мощности к. Асимптотическое поведение этой функции изучалось на протяжении последних пятидесяти лет. Выяснилось, что г(3, к) = Q(k2/\ogk). Нижняя оценка была получена в недавней работе [Kim (1995)], основанной на изящной вероятностной конструкции, сопровождающейся тридцатью страницами вычислений. Способ построения такого графа неизвестен, наибольший явным образом построенный свободный от треугольников граф без независимых множеств мощности к описан в работе [Alon (1994)], и он имеет лишь 6(/с3/2) вершин. Точная верхняя оценка для функции г(3,/с), доказанная в работе [Ajtai et al. (1980)], представляет собой очень простое следствие последнего утверждения. Теорема [Ajtai et al. (1980)]. Существует абсолютная константа b, такая, что r(3,/c) ^bk2/\ogk для всех к > 1. Доказательство. Пусть G = (V,E) — свободный от треугольников граф на Sk2/\ogk вершинах. Если G содержит вершину степени не менее /с, то ее граница содержит независимое множество мощности к. В противном случае из утверждения следует, что граф G содержит независимое множество мощности не менее ^т-^~ = к. Таким образом, в любом случае a(G) ^ /с, что и требовалось доказать. ■
Приложение В Пол Эрдёш Работа с Полом Эрдёшем была подобна прогулке в горах. Каждый раз, когда я думала, что мы достигли цели и заслужили отдых, Пол указывал на следующую вершину и мы отправлялись к ней. Фэн Чан В.1. ТРУДЫ Пол Эрдёш был самым плодовитым математиком двадцатого столетия, им было написано более 1500 работ и более 490 в соавторстве. Приведенный ниже крайне субъективный список включает в себя только часть тех работ, в которых создан и сформирован вероятностный метод. Аббревиатуры MR и Zbl. представляют собой ссылки на обзоры в Math Reviews и Zentralblatt, соответственно. Ссылки на главы или разделы относятся к соответствующим частям этой книги. • A combinatorial problem in geometry, Compositio Math 2 (1935), 463-470 (with George Szekeres) Zbl. 12,270. Работа, написанная, когда Эрдёш был еще юношей. Эта жемчужина содержит повторное открытие теоремы Рамсея и теоремы о монотонной подпоследовательности. Многие авторы отмечают, что эта работа сыграла ключевую роль в переходе Эрдёша к более комбинаторной точке зрения на математику. • Some remarks on the theory of graphs, Bull. Arner. Math. Soc. 53 (1947), 292-294, MR 8,479d; Zbl 32,192. Трехстраничная работа, с которой «начинается» вероятностный метод. В ней приводится экспоненциальная нижняя оценка для диагональных чисел Рамсея R(k,k) (разд. 1.1). • The Gaussian law of errors in the theory of additive number theoretic functions, Arner. J. Math. 62 (1940), 738-742 (with Mark Kac) MR 2,42c; Zbl. 24,102. Доказано, что количество простых делителей числа х, выбранного равномерно из множества {1,...,п}, имеет асимптотически нормальное распределение. Продемонстрированная связь между теорией вероятностей и теорией чисел в свое время казалась поразительной (разд. 4.2).
В.1. труды 299 • Problems and results in additive number theory, Colloque sur la Theorie des N ombres, Bruxelles, 1955, 127-137, George Thone, Liege; Masson and Cie, Paris, 1956; MR 18,18a; Zbl. 73,31. Здесь случайные подмножества используются для доказательства существования такого множества целых чисел, что каждое число п может быть представлено в виде п = х + у по крайней мере одним, но не более чем с In n способами. Решена проблема, поставленнаяЭрдёшу Зидоном в 1930-х годах. Эта проблема и далее продолжает интересовать Эрдёша: см., например, [Erdos and Tetali (1990)] (разд. 8.6). • On a combinatorial problem, Nordisk. Mat Tidskr. 11 (1963), 220-223 MR 28# 4068; Zbl. 122,248. On a combinatorial problem II, Acta. Math. Acad. Sci. Hungar. 15 (1964), 445-447; MR 29# 4700; Zbl. 201,337. Свойство В. Вероятностное доказательство того, что любые т < 2п~1 множеств размера п могут быть 2-раскрашены так, что ни одно множество не является монохроматическим, несмотря на то, что существуют сп22п множеств размера п, которые не могут быть так раскрашены (разд. 1.3). • On the evolution of random graphs, Magyar. Tud. Akad. Mat. Kutato Int. Kozl. 5 (1960), 17-61 (with Alfred Renyi); MR 23# A2338; Zbl. 103,163. Очень редко целый раздел математики удается исследовать в одной работе. Однако, для случайных графов произошло именно так (гл. 10). • Graph theory and probability, Canad. J. Math. 11 (1959), 34-38; MR 21# 876; Zbl. 84,396. Вероятностным методом доказывается существование графов с произвольно большим обхватом и хроматическим числом. Работа убедительно продемонстрировала силу метода, поскольку несмотря на то, что данная проблема вызывала большой интерес, построить такие графы не удавалось (разд. «Вероятностный взгляд», следующий за гл. 3). • Graph theory and probability II, Canad. J. Math. 13 (1961), 346-352 MR 22# 10925; Zbl. 97,391. Доказано существование n-вершинного свободного от треугольников графа без независимых множеств размера cn1//2lnn, и, следовательно, того, что число Рамсея R(3, к) = Q(k2\n~2 к). Это технический tour de force, очень тонко использующий вероятностный метод, особенно, если учитывать раннюю дату публикации. • On circuits and subgraphs of chromatic graphs, Mathematika 9 (1962), 170-175; MR 25 # 3035; Zbl. 109,165. Работа опровергает мнение, что хроматическое число является чисто локальным свойством. Эрдёш доказывает существование n-вершинного графа, который не может быть /с-раскрашен, но каждые еп вершин которого могут быть 3-раскрашены (разд. «Вероятностный взгляд», следующий за гл. 8). • On a combinatorial game, J. Combinatorial Theory Ser. A 14 (1973), 298-301 (with John Selfridge) MR 48# 5655; Zbl. 293,05004.
300 Приложение В. ПОЛ ЭРДЁШ Игроки по очереди выбирают вершины, причем второй игрок пытается помешать первому получить выигрышное множество. Использованный здесь метод весовой функции, по существу, является вероятностным и представляет собой одно из первых применений дерандомизации (разд. 15.1). В.2. ГИПОТЕЗЫ Гипотезы всегда играли существенную роль в математической жизни Пола Эрдёша. Вот самые интересные на наш взгляд. • Обязательно ли множество целых чисел положительной плотности содержит арифметические прогрессии произвольной длины? Финитиза- ция проблемы приводит к следующей задаче. Пусть S является подмножеством множества первых п целых чисел, \S\ ^ en. Верно ли, что для всех к и всех е > 0 существует такое число по, что при п > по множество S обязательно содержит арифметическую прогрессию длины к? Эта гипотеза впервые была выдвинута Эрдёшем и Тураном в 1930 г. Она была решена (положительно) Семереди в 1970 г. Обозначим через F(/c, e) минимальное число по, удовлетворяющее приведенным выше условиям. Определение скорости роста функции F остается весьма интригующей проблемой, последние результаты на эту тему были получены Говерсом. • Будем говорить, что три различных множества 5, Г, U образуют Д-си- стему, если SГ\Т = SГМГ = TC\U. Обозначим через F(n) минимальное число га, такое, что среди га произвольных n-множеств какие-то три обязательно сформируют Д-систему. Эрдёш и Радо показали, что функция F(n) существует, и получили верхнюю оценку F(n) ^ 2пп\. Эрдёш предположил, что F(n) < Сп для некоторой константы С. • Какова асимптотика функции Рамсея R(k,k)? В частности, каково значение с предела lim^ Щк^к)1^, если он существует? Классическая работа Эрдёша 1947 г. показывает, что с > \[2. Результат с ^ 4 следует из доказательства теоремы Рамсея, но дальнейших уточнений значения с нет уже полвека, хотя были результаты, касающиеся членов меньшего порядка. • Обозначим через rs{n) число решений уравнения п = х 4- у для х,у G 5. Существует ли множество положительных целых чисел 5, такое, что rs(n) > 0 для всех п, за исключением, быть может, конечного числа, при условии, что функция rs(n) ограничена некоторой константой К? Работа Эрдёша 1955 г. года, ссылка на которую приведена выше, описывает множество 5, такое, что rs(n) = в (Inn). • Пусть га(п), как и в разд. 1.3, обозначает минимальный размер семейства из n-множеств, которое не может быть 2-раскрашено без образования монохроматического множества. Какова асимптотика функции га(п)? В 1963 и 1964 гг. Эрдёш получает оценки Q(2n) ^ тп(п) = 0(2пп2). Впоследствии, Радхакришнан и Шринивасан (см. разд. 3.5) улучшают нижнюю оценку до Q(2n(n/\nn)1^2).
В.З. ОБ ЭРДЁШЕ 301 Рассмотрим 2п~2 + 1 точек плоскости, среди которых никакие три не лежат на одной прямой. Должны ли всегда некоторые п из них образовывать выпуклое множество? Эта проблема была поставлена в работе Эрдёша и Секереша 1935 г., ссылка на которую приведена выше. Обозначим через т(п, к, /) размер наибольшего семейства таких к-эле- ментных подмножеств n-множества, что никакое /-множество не содержится более чем в одном из них. Простой подсчет показывает, что m(n,k,l) ^ (7)/(t). В 1963 г. Эрд ёш и Ханани предположили, что для фиксированного / < к эта оценка асимптотически верна, т. е. отношение функций т(п,к,1) и (7)/(z) стремится к единице при п —» оо. Эрдёш обладал удивительной способностью ставить очень трудные, но все же разрешимые задачи. Справедливость этой гипотезы была доказана Войтехом Рёдлем в 1985 г. (см. разд. 4.7). Асимптотика разности (?)/(/) ~~ m(n> &> О Д° сих П0Р остается неизвестной. В.З. ОБ ЭРДЕШЕ О жизни и математике Пола Эрдёша написано множество книг и статей. Следующие три из них заслуживают отдельного упоминания: • The Mathematics of Paul Erdos (Ron Graham and Jarik Nesetfil, eds.), Berlin: Springer-Verlag, 1996. (Vols. I and II) • Combinatorics, Paul Erdos is Eighty (D. Miklos, V. T. Sos, T. Szonyi, eds.), Bolyai Soc. Math. Studies, Vol. I (1990) and Vol. II (1993). • Erdos on Graphs — His Legacy of Unsolved Problems, Fan Chung and Ron Graham, A. K. Peters, 1998. Среди множества работ, написанных математиками, мы отметим • Laszlo Babai, In and out of Hungary: Paul Erdos, his friends, and times. In Combinatorics, Paul Erdos is Eighty (listed above), Vol. II, 7-93. • Bela Bollobas, Paul Erdos — Life and work, in The Mathematics of Paul Erdos (listed above), Vol. II, 1-42. • A. Hajnal, Paul Erdos' Set theory, in The Mathematics of Paul Erdos (listed above), Vol. II, 352-393. • Janos Pach, Two places at once: a remembrance of Paul Erdos, Math Intelligencer, Vol. 19 (1997), no. 2, 38-48. Появились следующие популярные биографии Эрдёша: • The Man Who Loved Only Numbers, Paul Hoffman, Hyperion (New York), 1998. • My Brain is Open - The Mathematical Journies of Paul Erdos, Bruce Schechter, Simon & Schuster (New York), 1998. И, наконец, Джорж Сисери снял документальный фильм N is a Number, A Portrait of Paul Erdos, выпущенный издательством А. К. Петерса, позволяющий увидеть и услышать Эрдёша на лекции и среди друзей, доказывающего и высказывающего гипотезы.
302 Приложение В. ПОЛ ЭРДЁШ В.4. ДЯДЮШКА ПОЛ Пол Эрдёш умер в сентябре 1996 года в возрасте 83 лет. Его теоремы и гипотезы пронизывают всю эту книгу. Эта речь, произнесенная Джоэлем Спенсером на заседании Американского Математического Общества в январе 19971\ представляет собой попытку выразить тот особый дух, который мы и многие другие восприняли от этого необыкновенного человека. Пол Эрдёш был искателем, искателем математической истины. Место Пола в математическом пантеоне будет предметом бурных дебатов, поскольку в этой изысканной атмосфере у него был уникальный стиль. Лучше всего об этом сказал ныне покойный Эрнст Штраус на праздновании 70-летия Эрдёша. В наш век, когда в математике так сильно доминируют «создатели теорий», он оставался принцем тех, кто решает проблемы, и абсолютным королем тех, кто их ставит. Один из моих друзей, сильный математик, жаловался мне, что «Эрдёш дает нам только следствия великих метатеорем, которые остаются не сформулированными в его голове». Это высказывание во многом верно, однако я не думаю, чтобы Эрдёш мог или хотел отказаться от этих следствий и сконцентрироваться на формулировании метатеорем. Во многом Пол Эрдёш является Эйлером нашего времени. Как «специальные» проблемы, которые решил Эйлер, открыли путь к аналитической и алгебраической теории чисел, топологии, комбинаторике, функциональным пространствам и т. д., так и методы и результаты работ Эрдёша уже дают нам возможность увидеть очертания великих новых дисциплин, таких как комбинаторная и вероятностная теория чисел, комбинаторная геометрия, вероятностная и трансфинитная комбинаторика, теория графов, а также многих других, которым еще только предстоит возникнуть из его идей. Штраус, работавший ассистентом Альберта Эйнштейна, отметил, что Эйнштейн выбрал физику, а не математику, поскольку опасался, что бесплодно растратит силы на решение многих замечательных и завораживающих математических задач, не находя центральных проблем. Штраус продолжил: Эрдёш последовательно и успешно нарушал все рекомендации Эйнштейна. Он поддавался соблазну каждой встретившейся ему красивой задачи, и очень многие из них поддавались ему. Это убеждает меня в том, что в поисках истины всегда есть место и Дон Жуану, как Эрдёш, и Сэру Галахэду, как Эйнштейн. Я полагаю, и это определенно предвзятое мнение, что наследие Пола будет сильнейшим в дискретной математике. Интерес Пола к этой области возник с замечательного доклада Джорджа Секереша в 1935 году, однако в полную силу он проявился только после Второй Мировой войны. Думаю, есть две ^Перепечатано с разрешения Bulletin of the American Mathematical Society.
B.4. ДЯДЮШКА ПОЛ 303 основные причины расцвета дискретной математики в последние полстолетия. Первая —это компьютер. Как чудесно, что этот физический объект привел к таким интригующим математическим задачам. Вторая причина, с полным уважением ко многим другим, заключается в деятельности Пола Эрдёша с его знаменитым лозунгом «Доказывать и ставить проблемы!». Теория Рамсея, экстремальная теория графов, случайные графы. Сколько башен в нашем математическом замке были построены из кирпичиков-теорем Пола, и украшены его многочисленными и всегда прозорливыми гипотезами. Вероятностный метод, предмет моих собственных исследований, безусловно, мог бы быть назван методом Эрдёша. Начало ему было положено в 1947 году трехстраничной статьей в Бюллетене Американского Математического Общества. Пол доказал существование графа, имеющего определенное Рамсе- евское свойство, без фактического его конструирования. Говоря современным языком, он показал, что соответствующим образом определенный случайный граф обладает этим свойством с ненулевой вероятностью и, следовательно, такой граф должен существовать. В течение следующих двадцати лет работы Пола были «гласом вопиющего в пустыне», коллеги восхищались его поразительными результатами, однако приятие методологии шло медленно. Тем не менее, Пол упорно продолжал идти своим путем, он всегда руководствовался чувством математической эстетики, которому полностью доверял, и сегодня метод широко применяется, как в дискретной математике, так и в теоретической информатике. Не может быть никаких разногласий относительно того, какое влияние оказала личность Пола на формирование современной математики. Пол Эрдёш был самым вдохновляющим человеком из всех, кого я когда-либо встречал. Я начал работать с Полом в конце 1960-х, в бурное время, когда девиз «подумай сам» витал в воздухе. Но тогда как другие только говорили об этом, для Пола это было образом жизни. Для него не существовало понятия «работа» — он работал постоянно. У него не было дома —мир был его домом. Имущество было для него помехой, деньги — скукой. Он жил в системе доверия, беспрерывно путешествуя от центра к центру, осеняя своим математическим вдохновением. Что привело столь многих из нас в его круг? Как объяснить радость общения с этим прекрасным человеком? Почему мы любим рассказывать истории об Эрдёше? Я много думал об этом и считаю, что все сводится к вере. Мы, математики, знаем о красоте нашего предмета и мы верим в его трансцендентность. Бог создал целые числа, остальное уже работа Человека. Математическая истина неизменна, она лежит вне физической реальности. Когда мы, к примеру, показываем, что сумма двух степеней числа п никогда не равна степени числа п для п > 3, мы прикасаемся к Истине. В этом наша вера, это дает нам глубинную мотивацию. И все же, наши попытки описать эту веру нашим нематематическим друзьям сродни проповеди о Всемогущем атеисте. Пол воплощал эту веру в математическую истину. Его огромный талант и энергия были полностью посвящены Храму математики. Он не питал никаких сомнений относительно важности, абсолютности его поисков. Видеть его веру
304 Приложение В. ПОЛ ЭРДЁШ означало уверовать самому. В религиозном мире лучше бы смогли понять особые качества личности Пола. Мы знали его как дядюшку Пола. Я надеюсь, что краеугольный камень, если хотите, теологии Пола просуществует долго. Я имею в виду Книгу. Книга состоит из всех математических теорем. Для каждой теоремы в Книге только одно доказательство. Это наиболее эстетичное, наиболее ясное доказательство, то, что Пол называл доказательством Книги. И когда одна из бесчисленных проблем Пола решалась, но решалась «некрасиво», Пол был очень счастлив поздравить доказавшего, но добавлял: «А теперь, давайте поищем доказательство Книги». Эта платоновская идея была очевидна для нас, входящих в его круг. Математика уже была там, нам оставалось только открыть ее. Интенсивность и самоотверженность поиска истины были описаны Хорхе Луисом Борхесом в рассказе «Вавилонская библиотека». Рассказ ведется от лица работника этой библиотеки, бескрайние просторы которой содержали всю мудрость вселенной. Он бродит по ее бесчисленным коридорам в поисках того, что Пол Эрдёш назвал бы Книгой. Он объявляет во всеуслышание: Мне не кажется невероятным, что на какой-то книжной полке вселенной стоит всеобъемлющая книга; молю неведомых богов, чтобы человеку — хотя бы одному, хоть через тысячи лет! — удалось найти и прочесть ее. Если почести, и мудрость, и счастье не для меня, пусть они достанутся другим. Пусть существует небо, даже если мое место в аду. Пусть я буду попран и уничтожен, но хотя бы на миг, хотя бы в одном существе твоя огромная Библиотека будет оправдана. Летом 1985 года я отвез Пола в лагерь, который многие из нас с любовью вспоминают как Лагерь Желтой Свиньи — математический лагерь для талантливых студентов Хемпширского колледжа. Это был прекрасный день — студенты обожали дядюшку Пола, и для Пола было наивысшим удовольствием находиться в обществе пытливых молодых умов. В моем вступлении к его лекции, я говорил о Книге, но я допустил ошибку, описывая ее, как книгу, которую «держит Бог». Пол начал свою лекцию с мягкой поправки, которую я никогда не забуду. «Вы не обязаны верить в Бога», сказал он, «но вы должны верить в Книгу.»
Литература Андреев А. Е. (1985). О методе получения нижних оценок сложности индивидуальных монотонных функций, Доклады Академии Наук СССР 282(5): 1033-1037. Андреев А. Е.(1987). О методе получения более чем квадратичных эффективных нижних оценок сложности 7г-схем, Вестник Московского Университета, Серия 1, Математика, Механика, (1) : 70-73. Брегман Л. М. (1973). Некоторые свойства неотрицательных матриц и их перманентов, Доклады Академии Наук 14: 945-949. Вапник В. Н., Червоненкис А. Я. (1971). О равномерной сходимости относительных частот к их вероятностям, Теория вероятностей и ее применения 16: 264-280. Глебский Ю. В., Коган Д. И., Легонький М. И. и Таланов В. А. (1969). Область и степень реализуемости формул ограниченного исчисления предикатов, Кибернетика 5: 142-154. Маргулис Г. А. (1973). Явные конструкции расширителей, Проблемы Передачи Информации 9, 4: 71-80. Маргулис Г. А. (1988). Явные теоретико-групповые конструкции комбинаторных схем и их применения к постороению синтезу расширителей и суперконцентраторов, Проблемы Передачи Информации 24, 1: 51-60. Разборов А. А. (1985). Нижние оценки монотонной сложности некоторых булевых функций, Доклады Академии Наук СССР 281(4): 798-801. Разборов А. А. (1987). Нижние оценки сложности схем ограниченной глубины над полным базисом, содержащем функцию логического сложения, Математические Заметки 41(4): 598-607. Субботовская Б. А. Реализация линейных функций формулами в базисе \/,Л> -» Доклады Академии Наук СССР 136,(3), 110-112. Храпченко В. М. (1971). Об одном методе получения нижних оценок сложности П-схем, Математические Заметки 10, (1): 83-92. Ahlswede, R. and Daykin, D. E. (1978). An inequality for the weights of two families of sets, their unions and intersections, Z. Wahrscheinl. V. Geb 43: 183-185. Aho, A. V., Hopcroft, J. E. and Ullman, J. D. (1974). The Design and Analysis of Computer Algorithms, Addison Wesley, Reading, MA. Ajtai, M. (1983). E{-formulae on finite structures, Annals of Pure and Applied Logic 24: 1-48. Ajtai, M., Chvatal, V., Newborn, M. M. and Szemeredi, E. (1982). Crossing-free subgraphs, Theory and practice of combinatorics, North Holland Math. Stud. 60: 9-12.
306 ЛИТЕРАТУРА Ajtai, M., Komlos, J. and Szemeredi, E. (1980). A note on Ramsey numbers, J. Combinatorial Theory, Ser. A 29: 354-360. Ajtai, M., Komlos, J. and Szemeredi, E. (1983). Sorting in clogn parallel steps, Combinatorica 3: 1-19. Ajtai, M., Komlos, J. and Szemeredi, E. (1987). Deterministic simulation in LOGSPACE, Proc. 19-th annual ACM STOC, New York, pp. 132-140. Akiyama, J., Exoo, G. and Harary, F. (1981). Covering and packing in graphs IV: Linear arboricity, Networks 11: 69-72. Alon, N. (1986a). Eigenvalues and expanders, Combinatorica 6: 83-96. Alon, N. (1986b). Eigenvalues, geometric expanders, sorting in rounds and Ramsey Theory, Combinatorica 6: 207-219. Alon, N. (1988). The linear arboricity of graphs, Israel J. Math 62: 311-325. Alon, N. (1990a). The maximum number of Hamiltonian paths in tournaments, Combinatorica 10: 319-324. Alon, N. (1990b). Transversal numbers of uniform hypergraphs, Graphs and Combinatorics 6: 1-4. Alon, N. (1994). Explicit Ramsey graphs and orthonormal labelings, The Electronic J. Combinatorics 1: 8 pp. R12. Alon, N. (1996). Independence numbers of locally sparse graphs and a Ramsey type problem, Random Structures and Algorithms 9: 271-278. Alon, N. and Boppana, R. B. (1987). The monotone circuit complexity of boolean functions, Combinatorica 7: 1-22. Alon, N. and Chung, F. R. K. (1988). Explicit construction of linear sized tolerant networks, Discrete Math. 72: 15-19. Alon, N. and Frankl, P. (1985). The maximum number of disjoint pairs in a family of subsets, Graphs and Combinatorics 1: 13-21. Alon, N. and Kleitman, D. J. (1990). Sum-free subsets, in: A tribute to Paul Erdos (A. Baker, B. Bollobas and A. Hajnal, eds.), Cambridge Univ. Press, Cambridge, England, pp. 13-26. Alon, N. and Krivelevich, M. (1997). The concentration of the chromatic number of random graphs, Combinatorica 17: 303-313. Alon, N. and Linial, N. (1989). Cycles of length 0 modulo к in directed graphs, J. Combinatorial Theory, Ser. В 47: 114-119. Alon, N. and Milman, V. D. (1984). Eigenvalues, expanders and superconcentrators, Proc. 25-th Annual FOCS, IEEE, New York, pp. 320-322. See also: N. Alon and V. D. Milman, Ai, isoperimetric inequalities for graphs and superconcentrators, J. Combinatorial Theory, Ser. B, 38, 1985, 73-88. Alon, N., Babai, L. and Itai, A. (1986). A fast and simple randomized parallel algorithm for the maximal independent set problem, J. of Algorithms 7: 567- 583. Alon, N., Frankl, P. and Rodl, V. (1985). Geometrical realization of set systems and probabilistic communication complexity, Proc. 26-th FOCS, IEEE, New York, pp. 277-280.
ЛИТЕРАТУРА 307 Alon, N., Goldreich, О., Hastad, J. and Peralta, R. (1990). Simple constructions of almost /c-wise independent random variables, Proc. 31-st FOCS, St. Louis, IEEE, New York, pp. 544-553. Alon, N., Kim, J. H. and Spencer, J. H. (1997). Nearly perfect matchings in regular simple hypergraphs, Israel J. Math 100: 171-187. Alon, N., Ronyai, L. and Szabo, T. (1999). Norm-graphs: variations and applications, J. Combinatorial Theory, Ser. В 76: 280-290. Baik, J., Deift, P. and Johansson, K. (1999). On the distribution of the length of the longest increasing subsequence of random permutations, J. Amer. Math. Soc. 12: 1119-1178. Barany, I. and Furedi, Z. (1987). Empty simplices in Euclidean spaces, Canad. Math. Bull. 30: 436-445. Beck, J. (1978). On 3-chromatic hypergraphs, Disc. Math. 24: 127-137. Beck, J. (1981). Roth's estimate of the discrepancy of integer sequences is nearly optimal, Combinatorica 1: 319-325. Beck, J. (1991). An algorithmic approach to the Lovasz local lemma. I., Random Structures and Algorithms 2: 343-365. Beck, J. and Fiala, T. (1981). Integer-making theorems, Disc. Appl. Math. 3: 1-8. Bernstein, S. N. (1912). Demonstration du theoreme de Weierstrass fondee sur le calcul des probabilites, Comm. Soc. Math. Kharkov 13: 1-2. Blum, N. (1984). A boolean function requiring 3n network size, Theoretical Computer Science 28: 337-345. Bollobas, B. (1965). On generalized graphs, Acta Math. Acad. Sci. Hungar. 16: 447-452. Bollobas, B. (1985). Random Graphs, Academic Press., New York. Bollobas, B. (1988). The chromatic number of random graphs, Combinatorica 8: 49-55. Bollobas, B. and Erdos, P. (1976). Cliques in random graphs, Math. Proc. Camb. Phil. Soc. 80: 419-427. Boppana, R. B. and Spencer, J. H. (1989). A useful elementary correlation inequality, J. Combinatorial Theory, Ser. A 50: 305-307. Chazelle, B. and Welzl, E. (1989). Quasi-optimal range searching in spaces of finite VC-dimension, Discrete and Computational Geometry 4: 467-489. Chernoff, H. (1952). A measure of the asymptotic efficiency for tests of a hypothesis based on the sum of observations, Ann. Math. Stat. 23: 493-509. Chung, F. R. K., Prankl, P., Graham, R. L. and Shearer, J. B. (1986). Some intersection theorems for ordered sets and graphs, J. Combinatorial Theory, Ser. A 43: 23-37. Chung, F. R. K., Graham, R. L. and Wilson, R. M. (1989). Quasi-random graphs, Combinatorica 9: 345-362. Cohen, A. and Wigderson, A. (1989). Dispersers, deterministic amplification, and weak random sources, Proc. 30-th IEEE FOCS, IEEE, New York, pp. 14-19. Danzer, L. and Grunbaum, B. (1962). Uber zwei Probleme bezuglich konvexer Korper von P. Erdos und von V. L. Klee, Math. Z. 79: 95-99.
308 ЛИТЕРАТУРА de la Vega, W. F. (1983). On the maximal cardinality of a consistent set of arcs in a random tournament, J. Combinatorial Theory, Ser. В 35: 328-332. Dudley, R. M. (1978). Central limit theorems for empirical measures, Ann. Probab. 6: 899-929. Elekes, G. (1997). On the number of sums and products, Acta Arith. 81: 365-367. Erdos, P. (1947). Some remarks on the theory of graphs, Bull. Amer. Math. Soc. 53: 292-294. Erdos, P. (1956). Problems and results in additive number theory, Colloque sur la Theorie des Nombres (CBRM, Bruselles) pp. 127-137. Erdos, P. (1959). Graph theory and probability, Canad. J. Math. 11: 34-38. Erdos, P. (1962). On circuits and subgraphs of chromatic graphs, Mathematika 9: 170-175. Erdos, P. (1963a). On a combinatorial problem, I, Nordisk Mat. Tidskr. 11: 5-10. Erdos, P. (1963b). On a problem of graph theory, Math. Gaz. 47: 220-223. Erdos, P. (1964). On a combinatorial problem II, Acta Math. Acad. Sci. Hungar. 15: 445-447. Erdos, P. (1965a). Extremal problems in number theory, Proc. Symp. Pure Math. (AMS) VIII: 181-189. Erdos, P. (1965b). On extremal problems of graphs and generalized graphs, Israel J. Math. 2: 189-190. Erdos, P. and Furedi, Z. (1983). The greatest angle among n points in the d- dimensional Euclidean space, Annals of Discrete Math. 17: 275-283. Erdos, P. and Hanani, H. (1963). On a limit theorem in combinatorial analysis, Publ. Math. Debrecen 10: 10-13. Erdos, P. and Kac, M. (1940). The Gaussian law of errors in the theory of additive number theoretic functions, Amer. J. Math. 62: 738-742. Erdos, P. and Lovasz, L. (1975). Problems and results on 3-chromatic hypergraphs and some related questions, in: Infinite and Finite Sets (A. Hajnal et al., eds.), North-Holland, Amsterdam, pp. 609-628. Erdos, P. and Moon, J. W. (1965). On sets of consistent arcs in a tournament, Canad. Math. Bull. 8: 269-271. Erdos, P. and Renyi, A. (1960). On the evolution of random graphs, Magyar Tud. Akad. Mat. Kutato Int. Kozl. 5: 17-61. Erdos, P. and Selfridge, J. L. (1973). On a combinatorial game, J. Combinatorial Theory, Ser. A 14: 298-301. Erdos, P. and Spencer, J. H. (1991). Lopsided Lovasz local lemma and latin transversals, Discrete Appl. Math. 30: 151-154. Erdos, P. and Tetali, P. (1990). Representations of integers as the sum of к terms, Random Structures and Algorithms 1: 245-261. Fagin, R. (1976). Probabilities in finite models, J. Symbolic Logic 41: 50-58. Fishburn, P. (1992). Correlation in partially ordered sets, Discrete Applied Math. 39: 173-191.
ЛИТЕРАТУРА 309 Fortuin, С. М., Kasteleyn, P. W. and Ginibre, J. (1971). Correlation inequalities on some partially ordered sets, Comm. Math. Phys. 22: 89-103. Furedi, Z. (1988). Matchings and covers in hypergraphs, Graphs and Combinatorics 4: 115-206. Prankl, P. and Wilson, R. M. (1981). Intersection theorems with geometric consequences, Combinatorica 1: 357-368. Prankl, P., Rodl, V. and Wilson, R. M. (1988). The number of submatrices of given type in a Hadamard matrix and related results, J. Combinatorial Theory, Ser. В 44: 317-328. Furst, M., Saxe, J. and Sipser, M. (1984). Parity, circuits and the polynomial hierarchy, Mathematical Systems Theory 17: 13-27. Graham, R. L. and Spencer, J. H. (1971). A constructive solution to a tournament problem, Canad. Math. Bull 14: 45-48. Graham, R. L., Rothschild, B. L. and Spencer, J. H. (1990). Ramsey Theory, second edition, Wiley, New York. Halberstam, H. and Roth, K. F. (1983). Sequences, second edition, Springer Verlag, Berlin. Hall, M. (1986). Combinatorial Theory, second edition, Wiley, New York. Harper, L. (1966). Optimal numberings and isoperimetric problems on graphs, J. Combinatorial Theory 1: 385-394. Harris, Т. Е. (1960). Lower bound for the critical probability in a certain percolation process, Math. Proc. Cambridge Phil Soc. 56: 13-20. Haussler, D. (1995). Sphere packing numbers for subsets of the boolean n-cube with bounded Vapnik-Chervonenkis dimension, J. Combinatorial Theory, Ser. A 69: 217-232. Haussler, D. and Welzl, E. (1987). £-nets and simplex range queries, Discrete and Computational Geometry 2: 127-151. Hastad, J. (1988). Almost optimal lower bounds for small depth circuits, in Advances in Computer Research (S. Micali ed.), JAI Press, Chapter 5: Randomness and Computation, pp. 143-170. Hastad, J. (1998). The shrinkage exponent of De Morgan formulas is 2, SIAM J. Comput. 27: 48-64. Janson, S. (1990). Poisson approximation for large deviations, Random Structures and Algorithms 1: 221-230. Janson, S. (1998). New versions of Suen's correlation inequality, Random Structures and Algorithms 13: 467-483. Janson, S., Knuth, D., Luczak, T. and Pittel, B. (1993). The birth of the giant component, Random Structures and Algorithms 4: 233-358. Janson, S., Luczak, T. and Rucinski, A. (2000). Random Graphs, Wiley, New York. JofFe, A. (1974). On a set of almost deterministic /c-independent random variables, Ann. Probab. 2: 161-162. Kahn, J. (1996). Asymptotically good list colorings, J. Combinatorial Theory, Ser. A 73: 1-59.
310 ЛИТЕРАТУРА Karchmer, M. and Wigderson, A. (1990). Monotone circuits for connectivity require super-logarithmic depth, SIAM J. Disc. Math. 3: 255-265. Karp, R. M. (1990). The transitive closure of a random digraph, Random Structures and Algorithms 1: 73-94. Karp, R. M. and Ramachandran, V. (1990). Parallel algorithms for shared memory machines, in: Handbook of Theoretical Computer Science (J. Van Leeuwen, ed.), Vol. A, Chapter 17, Elsevier, New York, pp. 871-941. Katchalski, M. and Meir, A. (1988). On empty triangles determined by points in the plane, Acta Math. Hungar. 51: 323-328. Katona, G. О. Н. (1972). A simple proof of the Erdos-Ko-Rado theorem, J. Combinatorial Theory, Ser. В 13: 183-184. Kim, J. and Vu, V. (2000). Concentration of multivariate polynomials and its applications, Combinatorica 20(3): 417-434. Kim, J. H. (1995). The Ramsey number Д(3,£) has order of magnitude t2/\ogt, Random Structures and Algorithms 7: 173-207. Kleitman, D. J. (1966a). On a combinatorial problem of Erdos, J. Combinatorial Theory 1: 209-214. Kleitman, D. J. (1966b). Families of non-disjoint subsets, J. Combinatorial Theory 1: 153-155. Kleitman, D. J., Shearer, J. B. and Sturtevant, D. (1981). Intersection of/c-element sets, Combinatorica 1: 381-384. Kolountzakis, M. N. (1999). An effective additive basis for the integers, Discrete Mathematics 145: 307-313. Komlos, J., Pach, J. and Woeginger, G. (1992). Almost tight bounds on epsilon- nets, Discrete Comput. Geom. 7: 163-173. Komlos, J., Pintz, J. and Szemeredi, E. (1982). A lower bound for Heilbronn's problem, J. London Math. Soc. 25(2): 13-24. Loomis, L. H. and Whitney, H. (1949). An inequality related to the isoperimetric inequality, Bull. Amer. Math. Soc. 55: 961-962. Lovasz, L., Spencer, J. H. and Vesztergombi, K. (1986). Discrepancy of set systems and matrices, Europ. J. Comb. 7: 151-160. Lubotzky, A., Phillips, R. and Sarnak, P. (1986). Explicit expanders and the Ramanujan conjectures, Proc. 18-th ACM STOC, pp. 240-246. See also: A. Lubotzky, R. Phillips and P. Sarnak, Ramanujan graphs, Combinatorica 8, 1988, 261-277. Luczak, T. (1990). Component behavior near the critical point of the random graph process, Random Structures and Algorithms 1: 287-310. Luczak, T. (1991). A note on the sharp concentration of the chromatic number of random graphs, Combinatorica 11: 295-297. MacWilliams, F. J. and Sloane, N. J. A. (1977). The Theory of Error Correcting Codes, North Holland, Amsterdam. Mani-Levitska, P. and Pach, J. (1988). Decomposition problems for multiple coverings with unit balls, manuscript.
ЛИТЕРАТУРА 311 Marica, J. and Schonheim, J. (1969). Differences of sets and a problem of Graham, Canad. Math. Bull 12: 635-637. Matousek, J. (1997). On discrepancy bounds via dual shatter function, Mathematika 44(1): 42-49. Matousek, J., Welzl, E. and Wernisch, L. (1993). Discrepancy and approximation for bounded VC dimension, Combinatorica 13: 455-466. Matula, D. W. (1976). The largest clique size in a random graph, Technical report, Southern Methodist University, Dallas. Maurey, B. (1979). Construction de suites symetriques, Compt. Rend. Acad. Sci. Paris 288: 679-681. Milman, V. D. and Schechtman, G. (1986). Asymptotic Theory of Finite Dimensional Normed Spaces, Lecture Notes in Mathematics, Vol. 1200, Springer Verlag, Berlin and New York. Moon, J. W. (1968). Topics on Tournaments, Holt, Reinhart and Winston, New York. Nakayama, A. and Peroche, B. (1987). Linear arboricity of digraphs, Networks 17: 39-53. Naor, J. and Naor, M. (1990). Small-bias probability spaces: efficient constructions and applications, Proc. 22-nd annual ACM STOC, ACM Press, pp. 213-223. Nilli, A. (1991). On the second eigenvalue of a graph, Discrete Mathematics 91: 207-210. Pach, J. and Agarwal, P. K. (1995). Combinatorial Geometry, Wiley, New York. Pach, J. and Woeginger, G. (1990). Some new bounds for epsilon-nets, Proc. 6-th Annual Symposium on Computational Geometry, ACM Press, New York, pp. 10-15. Paturi, R. and Simon, J. (1984). Probabilistic communication complexity, Proc. 25-th FOCS, IEEE, New York, pp. 118-126. Paul, W. J. (1977). A 2.5n lower bound on the combinational complexity of boolean functions, SIAM Journal on Computing 6: 427-443. Pinsker, M. (1973). On the complexity of a concentrator, 1-th Internat. Teletraffic Conf, Stockholm, pp. 318/1-318/4. Pippenger, N. and Spencer, J. H. (1989). Asymptotic behaviour of the chromatic index for hypergraphs, J. Combinatorial Theory, Ser. A 51: 24-42. Rabin, M. O. (1980). Probabilistic algorithms for testing primality, J. Number Theory 12: 128-138. Radhakrishnan, J. and Srinivasan, A. (2000). Improved bounds and algorithms for hypergraph two-coloring, Random Structures and Algorithms 16: 4-32. Raghavan, P. (1988). Probabilistic construction of deterministic algorithms: approximating packing integer programs, J. of Computer and Systems Sciences 37: 130-143. Ramsey, F. P. (1929). On a problem of formal logic, Proc. London Math. Soc. 30(2): 264-286. Rodl, V. (1985). On a packing and covering problem, European Journal of Combinatorics 6: 69-78.
312 ЛИТЕРАТУРА Sauer, N. (1972). On the density of families of sets, J. Combinatorial Theory, Ser. A 13:145-147. Schrijver, A. (1978). A short proof of Mine's conjecture, J. Combinatorial Theory, Ser. A 25: 80-83. Shamir, E. and Spencer, J. H. (1987). Sharp concentration of the chromatic number in random graphs GnjP, Combinatorica 7: 121-130. Shearer, J. B. (1983). A note on the independence number of triangle-free graphs, Discrete Math 46: 83-87. Shearer, J. B. (1985). On a problem of Spencer, Combinatorica 5: 241-245. Shearer, J. B. (1995). On the independence number of sparse graphs, Random Structures and Algorithms 7: 269-271. Shelah, S. and Spencer, J. H. (1988). Zero-one laws for sparse random graphs, J. Amer. Math. Soc. 1: 97-115. Shepp, L. A. (1982). The XyZ-conjecture and the FifG-inequality, Ann. of Probab. 10: 824-827. Smolensky, R. (1987). Algebraic methods in the theory of lower bounds for boolean circuit complexity, Proceedings of the 19-th ACM STOC, ACM Press, New York, pp. 77-82. Spencer, J. H. (1977). Asymptotic lower bounds for Ramsey functions, Disc. Math. 20: 69-76. Spencer, J. H. (1985a). Six standard deviations suffice,, Trans. Amer. Math. Soc. 289: 679-706. Spencer, J. H. (1985b). Probabilistic methods, Graphs and Combinatorics 1: 357- 382. Spencer, J. H. (1987). Ten Lectures on the Probabilistic Method, SIAM, Philadelphia. Spencer, J. H. (1990a). Threshold functions for extension statements, J. Combinatorial Theory, Ser. A 53: 286-305. Spencer, J. H. (1990b). Counting extensions, J. Combinatorial Theory, Ser. A 55: 247-255. Spencer, J. H. (1995). Asymptotic packing via a branching process, Random Structures and Algorithms 7: 167-172. Suen, W. C. (1990). A correlation inequality and a Poisson limit theorem for nonoverlapping balanced subgraphs of a random graph, Random Structures and Algorithms 1: 231-242. Szekely, L. (1997). Crossing numbers and hard Erdos problems in discrete geometry, Combin. Probab. Comput. 6: 353-358. Szele, T. (1943). Kombinatorikai vizsgalatok az iranyitott teljes graftal kapcsolatban, Mat. Fiz. Lapok 50 pp. 223-256. For a German translation see: T. Szele, Publ. Math. Debrecen 13, 1966, 145-168. Talagrand, M. (1996). Concentration of measures and isopermetric inequalites in product spaces, Publications Mathematiques de VI. H. E. S. 81: 73-205. Tanner, R. M. (1984). Explicit construction of concentrators from generalized 7V-gons, SIAM J. Alg. Disc. Meth. 5: 287-293.
ЛИТЕРАТУРА 313 Tarjan, R. E. (1983). Data Structures and Network Algorithms, SIAM, Philadelphia. Thomason, A. (1987). Pseudo-random graphs, Annals of Discrete Math. 33: 307- 331. Turan, P. (1934). On a theorem of Hardy and Ramanujan, J. London Math Soc. 9: 274-276. Turan, P. (1941). On an extremal problem in graph theory, Mat. Fiz. Lapok 48: 436- 452. Valtr, P. (1995). On the minimum number of empty polygons in planar point sets, Studia Sci. Math. Hungar. 30: 155-163. Wegener, I. (1987). The Complexity of Boolean Functions, Wiley-Teubner, New York. Weil, A. (1948). Sur les courbes algebriques et les varietes qui s'en deduisent, Actualites Sci. Ind, no. 1041. iv+85pp. Wendel, J. G. (1962). A problem in geometric probability, Math. Scand. 11: 109- 111. Wright, E. M. (1977). The number of connected sparsely edged graphs, J. Graph Theory 1: 317-330. Yao, A. C. (1985). Separating the polynomial-time hierarchy by oracles, Proceedings of the 26-th Annual IEEE FOCS, IEEE, New York, pp. 1-10. Литература, добавленная при переводе Гаврилов Г. П., Сапоженко А. А., Задачи и упражнения по дискретной математике. М.: Физматлит, 2004 г. Гончаров В. Л., О распределении циклов в перестановках, Докл. АН СССР 35, No 9 - 1942 - С. 299-301. Гончаров В. Л., Из области комбинаторики, Изв. АН СССР, сер. матем. 8, No 1-1944-С. 3-48. Колчин В. Ф., Севастьянов Б. А., Чистяков В. П. Случайные размещения,— М.: Наука, 1976 г. Комбинаторный анализ. Задачи и упражнения// Под ред. К. А. Рыбникова, — М.: Наука, 1982 г. Нигматуллин Р. Г. Метод наискорейшего спуска в задачах на покрытие// Вопросы точности и эффективности вычислительных алгоритмов. Вып. 5, Труды симпозиума, Киев, 1969, —С. 116-126. Сапоженко А. А., О сложности д. н. ф., получаемых с помощью градиентного алгоритма // Сб. Дискретный анализ — Новосибирск — Вып. 21, — 1972 — С. 62-71. Сапоженко А. А., О наибольшей длине тупиковых д. н. ф. у почти всех функций алгебры логики// Математические заметки — 1968 — т. 4, No.6, — С. 649-658. Харари Ф. Теория графов. М.: Мир, 1973 г. Ширяев А. Н. Вероятность. М.: Физматлит, 1989 г. Яблонский С. В., Введение в дискретную математику. М.: Физматлит, 1986 г.
Предметный указатель NC, 280 NC, 281, 283 NP (недетерминированное полиномиальное время), 208, 216, 219-220 VC-размерность, 244-250, 252 ^-образец, 246-247, 250, 280 £-сеть, 244, 246-247 Автоморфизм, 65, 69, 174, 180 Алгоритм, 19-20, 23-24, 36, 39-40, 51, 96-97, 99, 156-157, 162, 165-166, 266, 275-276, 278 вероятностный или рандомизированный, 50, 54, 57, 96-97, 165, 275, 281 детерминированный, 97, 284 жадный, 49, 54, 57 неадаптивный или интерактивный, 265-266 проверки простоты, 165 типа Монте-Карло, 165 Антицепь, 222 Биномиальная случайная величина, 248 Биномиальное распределение, 189, 244, 257, 289, 294 Блок-схема, 73 Вектор несбалансированный, 233 Выпуклая оболочка, 238, 242, 246, 254 Выпуклое тело, 48, 128-130 Гигантская компонента, 184, 188, 194 Гиперграф, 57, 86, 89, 133 2-раскраска, 97 однородный, 50, 54, 58, 73-74, 78, 86 подгиперграф, 90 покрытие, 73-74, 77 порожденный, 74-77 свойство В, 49, 53, 86 Гипотеза Адамара, 232 Данцера и Грюнбаума, 239 линейной древесности, 90-93 ориентированная, 91 Минка, 42, 80 Райвала и Сэндса, 110 Рамануджана, 162 Римана, 160 Селе, 80 Симоновича и Шош, 271 Хейлбронна, 47 Эрдёша, 286, 300 Эрдёша и Секереша, 301 Эрдёша—Ханани, 57, 73, 78, 301 Граф вершинно-транзитивный, 174-175 гамильтонов, 109 гамильтонов путь, 32, 40, 80, 102 зависимости, 97 квазислучайный, 157, 167-168, 172-173 клика, 66-67, 70-71, 113-114, 119, 216 Кэли, 160, 162 явное построение, 160 матрица смежности, 160 независимое множество, 46, 58-59, 91-92, 98, 100, 113, 156-157, 184, 205, 296-297, 299 обхват, 59, 92-94, 299 ориентированный, 92-94 планарный, 102, 109, 285 реберная связность, 23-24 с корнем, 134 сбалансированный, 67-69, 180 строго, 67, 69, 180-181, 191 цикл, 59 Графа линейная древесность, 90-91 ориентированная, 91
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 315 Группа матриц, 160, 162 подгруппа, 258 симметрическая, 117 фактор, 162 Групповой код, 258 Дисперсия, 37, 60-61, 63, 75, 78-79, 123-125, 170, 225, 248, 291-292, 294 Доминирующее множество, 21, 23-24, 204 Евклидова норма, 41, 78, 231 Евклидово пространство, 89, 239, 242, 246, 270 расстояние, 129 Законы нуля или единицы, 195, 197, 203 Игра Эренфойхт, 196 Клика, 208 в графе, 132-133, 156-157 Клики максимальный размер, 181-182 Ковариация, 63 Код двоичный БЧХ, 281-282 Компактность, 87, 90 Латинская трансверсаль, 95 Лемма Клейтмана, 102, 107 локальная Ловаса, 19, 45-46, 83, 86-91, 93-96, 99, 101 симметричный случай, 85 переключающая, 209 Лес, 90, 271 звездный, 271-272 линейный, 90 ориентированный, 91, 93-94 Линейное расширение частичного порядка, 109-111 Мартингал, 115-118, 120-122, 125-126, 131-132 подбрасывания монеты, 117 проявления вершин, 116-118, 120 проявления ребер, 115-119 Мартингальный процесс Дуба, 116 Математическое ожидание, 35-36, 41, 53, 60, 63-64, 78-79, 93, 107, 115-116, 136, 170, 192, 213, 225, 248, 288, 294, 296-297 линейность, 22, 32, 42, 44-46, 49, 57, 62, 66, 68, 75, 125, 127, 206, 222, 224, 237, 260, 262, 273, 276, 297 условное, 53, 115-117, 124-125, 261, 296 Матрица Адамара, 231-233 смежности графа, 160, 163-164, 167-168 турнира, 80 Метод второго момента, 60-61, 66, 72-73, 191 Метод Рёдля, 73 Метод Субботовской, 220 Метрика Хэмминга, 126, 128 Метрическое пространство, 244 Множества попарно непересекающиеся, 91, 100 Множество частично упорядоченное, 104, 109-111 Монохроматический, 35-36, 40, 44-45, 50-51, 53, 86-87, 90, 97, 99, 275, 299-300 Монохроматический граф, 276, 280-281 Независимое множество в графе, 46, 58-59, 91-92, 98, 100, 113, 156-157, 184, 205, 296-297, 299 в евклидовом пространстве, 242 Непересекающиеся клики, 119 семейства, 89 Неравенство, 64, 81, 85, 90, 93-94, 98, 103-104, 106-109, 111, 117, 121, 124, 126, 130, 159-161, 163-164,
316 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 173-174, 184, 211, 218-220, 240, 246, 248-250, 274, 276, 278-279, 287-288, 290-292, 295 FKG, 102, 106-108, 110-111, 210 Ацумы, 117-118, 120, 122, 126, 131-132 больших уклонений, 117 Бонферрони, 143 Гёльдера, 130 изопериметрическое, 117, 126 Йенсена, 267, 290 корреляционное, 102, 107, 109 Коши—Буняковского, 159, 163-164, 172 Маркова, 77, 123, 288, 290 мартингальное, 123, 134 Талаграна, 127-128, 130-132 Хана, 272 Чебышёва, 60, 63, 65, 72, 75-77, 136, 139, 248 Янсона, 108, 137-138, 180-181, 183 обобщенное, 133, 139, 183 Нормальное распределение, 61, 63-64, 233, 291-293, 295, 298 Объединение, 104-105, 110 Объединительно-неизбыточный, 105 Орграф зависимости, 84-85, 88, 92, 94-95 Отклонение стандартное, 60-61, 93, 136, 224-225, 244, 287 Перекраска, 49 случайная, 49 Пересечение, 104-105, ПО Перманент, 42, 80 Плотность графа, 67, 69 линейного расширителя, 160 множества, 300 упаковки пространства Md, 255 Покрытие, 73 гиперграфа, 73-74, 77 графа, 90 минимальный размер, 73 пространства Rd, 89-90 неразложимое, 89 разложимое, 89 Полиномиальное время, 19 Проективная плоскость, 273 Простое число, 40, 48, 61-64, 79, 94, 158, 162, 165-166, 172, 213, 298 Путь, 164-166, 168 случайный, 166 Разброс, 223-224, 233, 250, 253, 266 линейный, 228 наследственный, 228, 230 семейства, 223 Размер максимальной клики, 121 Разрез, 23-24 Рамсея граф, 156-157 теория, 303 число, 44-45, 58, 87-88, 297-299 Ранжированное пространство, 245-248, 250-251, 253 Раскраска, 21, 35-36, 44-46, 50, 86-87, 90, 93-94, 97, 99, 121, 219, 223-228, 232, 266, 275-276, 280-281, 283 гиперграфа, 97 случайная, 21, 44-45, 49, 87, 93, 101 Распределение, 21, 108, 115, 117-118, 132, 178, 184-185 биномиальное, 56, 93, 136, 189, 213, 243-244, 257, 289, 294 нормальное, 61, 63-64, 125, 233, 291-293, 295, 298 Пуассона, 55-56, 185-186, 189, 293-294 равномерное, 78, 87, 92-93, 95, 101, 128, 165, 220, 238, 241-242, 251 Расширитель, 160-162, 173 линейный, 160 плотность, 160 явное построение, 160, 166 Реберная связность, 24, 109 Решетка, 48, 104, ПО, 254 дистрибутивная, 104-106, ПО подрешетка, 105 Свидетель, 165-166 Свойство графов, 109 Случайная величина, 22, 32, 38, 41, 60-61, 63, 78-79, 115, 123, 125, 129, 131, 170, 185, 222, 263,
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 317 266-270, 272, 281-284, 287-288, 294, 296 ^-независимость, 280-284 биномиальная, 93, 136, 213, 243, 248 индикаторная, 22, 32, 44, 46, 61, 68, 70, 75-76, 113, 206, 222, 224, 226, 243, 260, 262, 273, 292-293 ковариация, 61 разложение, 32, 61, 97 стандартная нормальная, 295 Случайное блуждание, 115, 174 Случайный путь, 166 Собственное значение, 160 графа, 167 матрицы, 162 регулярного графа, 161-162, 164, 166 симметричной матрицы, 160-161, 163-164, 167 Собственный вектор симметричной матрицы, 161, 163-165 Среднее, 55-56, 61, 118, 125, 153, 185 Среднее значение, 127, 132-133, 287, 292-294 Среднее геометрическое, 42-43 Стратегия предварительного просмотра, 201 Схема, 207-208, 212-216, 218-219, 221, 299 2-схема, 208, 216-217, 221 булева, 208 глубина, 208 кодирования, 256-258 монотонная, 216-218 ограниченной глубины, 209, 213, 221 подсхема, 212 сложность, 207-209, 216-217 сортировки, 160 Счетчик четности, 207, 212-213, 215, 219, 221 Тактическая конфигурация, 73 Теорема XFZ-теорема, ПО Альсведе—Дайкина, 103-104, 106, 108 Бека-Фиала, 233 Брегмана, 81 Вейерштрасса, 136 Вейля, 162 Визинга, 219 Кёнига—Холла, 92 Клейтмана, 236 Пифагора, 239 Радона, 246 Рамсея, 298, 300 Тихонова, 87 Турана, 46-47, 113 Фробениуса—Перрона, 164 Шеннона, 257-258 Эрдёша— Ко—Радо, 31 Тройки Штейнера, 73 Турнир, 20-21, 32-33, 80-81, 83, 157-158, 160 квадратичных вычетов, 157-158, 172-173 явное построение, 21, 160 Уклонение большое, 62, 117, 146-147, 190, 287, 293 стандартное, 186 Упаковка, 48-49, 54, 57-58, 73, 254 жадная, 54 константа, 254 пространства Md, 255 случайная, 54 число, 57, 73 Упаковки константа, 48 Условие Липшица, 122-123, 125-126, 131-132 вершинное, 118, 120 реберное, 118-119 Фазовый переход, 184-185, 192 Формула булева, 209 включений-исключений, 143 Стирлинга, 62, 81 Функция log-супермодулярная, 106-108, 111 булева, 207-210, 213, 216-217, 219-220, 242 сложность, 208 кликовая, 208
318 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ липшицева, 131 пессимистических оценок, 277-278 пороговая, 66-69, 143, 180, 203-204 Рамсея, 300 энтропии, 257 Характер квадратичного вычета, 158 Хроматическое число, 59, 116, 118, 135, 183, 272, 295, 299 Хэмминга метрика, 226, 257 Цепь, 222 жесткая, 201-203 Маркова, 185 Число клик, 70 пересечений, 285 Энтропия, 225-228, 256, 266, 268, 272 бинарная, 266 случайной величины, 266 условная, 266 Явное построение, 156-157, 160, 162, 260, 284, 297 линейного расширителя, 160 расширителя, 166 турнира, 21, 160
Адамар, 231-233 Акияма, 90 Алон, 80, 123 Альсведе, 102-104, 106, 108 Андреев, 216 Ацума, 117-118, 120, 122, 126, 131-132 Бабай, 301 Барани, 235, 242 Бек, 52, 96-97, 233 Боллобаш, 118, 178, 301 Бонферрони, 143 Боппана, 225 Брегман, 42, 80-81 Буняковский, 159, 163-164, 172 Вапник, 245 Вапник и Червоненкис, 244, 247 Вейерштрасс, 136 Вейль, 160, 162, 173 Визинг, 219 By, 133-134 Гёльдер, 130 Гончаров, 19 Гринберг, 235 Грэхем, 160, 301 Грюнбаум, 239 Дайкин, 102-104, 106, 108 Данцер, 239 Де л а Вега, 157 Дуб, 116 Ексо, 90 Зидон, 299 Игуса, 162 Йенсен, 267, 290 Именной указатель Кан, 73 Каро, 113 Кац, 298 Кёниг, 92 Ким, 89, 123, 133-134 Клейтман, 102, 107-108, 236 Ко, 31 Комлош, 47 Конвей, 83 Коши, 159, 163-164, 172 Кэли, 160, 162 Липшиц, 118-120, 122-123, 125-126, 131-132 Ловас, 45-46, 83-84, 86 Лучак, 178 Мани-Левицка, 89 Маргулис, 162, 166 Марков, 77, 123, 288, 290 Матула, 23-24 Миклош, 301 Милман, 121 Минк, 42, 80 Мори, 117, 121 Нешетржиль, 301 Нигматуллин, 23 Пач, 89, 301 Пер л ее, 245 Пинскер, 160 Пинц, 47 Пиппенджер, 73-74 Пифагор, 239 Поддерюгин, 23 Пуассон, 56, 185, 189 Пэли, 172
320 ИМЕННОЙ УКАЗАТЕЛЬ Рабин, 165 Радо, 31, 300 Радон, 246 Разборов, 214, 216 Райвал, ПО Рамануджан, 61, 162 Рамсей, 44-45, 58, 87-88, 156-157, 297-300, 303 Реньи, 69, 178-179, 184, 299 Рёдль, 57, 73-74, 78, 127, 301 Риман, 160, 254 Рот, 150 Ручински, 178 Саймоне, 115 Сапоженко, 23, 65 Секереш, 21, 298, 301-302 Селе, 19, 33, 80 Селфридж, 299 Семереди, 47, 285-286, 300 Сёньи, 301 Симонович, 271 Смоленский, 213 Спенсер, 73, 95, 123, 160, 286, 302 Стирлинг, 62, 81 Субботовская, 220 Сэндс, ПО Троттер, 285-286 Туран, 46-47, 63, 113, 300 Уэй, 113 Фиала, 233 Фишборн, ПО Франкл, 73-74 Фюреди, 240, 242 Хайнал, 301 Хал беретам, 150 Хан, 272 Ханани, 57, 73, 78, 301 Харари, 90 Харди, 44, 61, 64 Харрис, 102 Хейлбронн, 47 Холл, 92 Хостад, 220 Хоффман, 301 Чан, 298, 301 Чебышёв, 60, 63, 65, 72, 75-77, 136, 139, 174, 248 Червоненкис, 245 Чернов, 272, 295 Шелла, 245 Шеннон, 256-258 Шехтман, 121 Ширер, 85, 269 Шош, 271, 301 Штейнер, 73 Шютте, 20, 160 Эйлер, 302 Эйнштейн, 302 Эйхлер, 162 Эрдёш, 18-19, 31, 57, 60, 69, 73, 78, 84, 86-87, 89, 95, 156, 178-179, 184, 240, 286, 298-304 Эренфойхт, 196 Янсон, 108, 133, 137-139, 153, 178, 180-181, 183
Открытие того, что детерминированные утвер 1ен • мо быть доказаны с помощью вероятностных соображений, позволило е в первой половине в. по ить ряд замечательных утвер 1ений из анализа, теории чисел, комбинатори « и теории информации. Вскоре стало ясно, что метод, который сейчас называется вероятное лм, ■ :ляется весьма мощным стру- ментом по ен • результатов в математике. Главная цель монографии — изложение 1ей вероятностного подхода к решению задач дискретной матема- « . А :торыпр iep « ;аются известного тезиса о том, что пример учит е, чем теор ■. Подбор примеров в « иге отвечает самым высо « м требован ■ м целесообразности и вкуса, а некоторые из них являются избранными шедеврами. По с еству, это — мастер- класс двух маэстро i • лиц, заинтересованных в освоении вероятностных методов. ига будет полезна специалистам в области дискретной математи « (комбинатори « , теории ело « ости, приложений теории вероятностей), студентам, аспирантам и преподавателям соответств «щих дисциплин. ISBN 978-5-94774-556-6