Текст
                    КОНКРЕТНАЯ
МАТЕМАТИКА
ВТОРОЕ ИЗДАНИЕ


CONCRETE MATHEMATICS SECOND EDITION A Foundation for Computer Science YY ADD1SON-WESLEY Upper Saddle River, NJ • Boston • Indianapolis • San Francisco New York • Toronto • Montriial • London • Munich • Paris • Madrid Capetown • Sydney • Tokyo • Singapore • Mexico City
КОНКРЕТНАЯ МАТЕМАТИКА ВТОРОЕ ИЗДАНИЕ Математические основы информатики Издательский дом "Вильяме" Москва • Санкт-Петербург • Киев 2010
ВБК 32.973.26-018.2.75 Г91 УДК 519.688 Издательский дом "Вильяме" Зав. редакцией С.Н. Тригуб Перевод с английского и редакция канд. техн. наук И.В. Красикова По общим вопросам обращайтесь в Издательский дом "Вильяме" по адресу: inf o@williamspublishing. com, http: //www. williamspublishing. com Грэхем, Рональд Л., Кнут, Дональд Э., Паташник, Орен. Г91 Конкретная математика. Математические основы информатики, 2-е изд. : Пер. с англ. — М. : ООО "И.Д. Вильяме", 2010. — 784 с. : ил. — Парал. тит. англ. ISBN 978-5-8459-1588-7 (рус.) ББК 32.973.26-018.2.75 Все названия программных продуктов являются зарегистрированными торговыми марками соответствующих фирм. Никакая часть настоящего издания ни в каких целях не может быть воспроизведена в какой бы то ни было форме и какими бы то ни было средствами, будь то электронные или механические, включая фотокопирование и запись на магнитный носитель, если на это нет письменного разрешения издательства Addison-Wesley Publishing Company, Inc. Authorized translation from the English language edition published by Addison-Wesley Publishing Company, Inc, Copyright © 1994, 1989 by Addison-Wesley Publishing Company, Inc. All rights reserved. No part of this book may be reproduced or transmitted in any form or by any means, electronic or mechanical, including photocopying, recording or by any information storage retrieval system, without permission from the Publisher. Russian language edition published by Williams Publishing House according to the Agreement with R&I Enterprises International, Copyright © 2010 Научно-популярное издание Рональд Л. Грэхем, Дональд Э. Кнут, Орен Паташник Конкретная математика. Математические основы информатики 2-е издание Литературный редактор Л. Н. Красиожон Верстка А. Н. Полинчик Художественный редактор Е. П. Дьшник Корректор И. В. Крассиков Подписано в печать 02.10.2009. Формат 70X100/16. Гарнитура CM-LH. Печать офсетная. Усл. печ. л. 49,0. Уч.-изд. л. 53,2. Тираж 1000 экз. Заказ № 19486. Отпечатано по технологии CtP в ОАО "Печатный двор" им. А. М. Горького 197110, Санкт-Петербург, Чкаловский пр., 15. ООО "И. Д. Вильяме", 127055, г. Москва, ул. Лесная, д. 43, стр. 1 ISBN 978-5-8459-1588-7 (рус.) © Издательский дом "Вильяме", 2010 ISBN 0-201-55802-5 (англ.) © Addison-Wesley Publishing Company, Inc, 1994, 1989
Оглавление 1 Рекуррентные задачи 17 1.1 Ханойская башня 17 1.2 Прямые на плоскости 22 1.3 Задача Иосифа Флавия 26 Упражнения 36 2 Суммы 41 2.1 Обозначения 41 2.2 Суммы и рекуррентности 46 2.3 Преобразование сумм 51 2.4 Кратные суммы 56 2.5 Общие методы 64 2.6 Исчисление конечного и бесконечного 70 2.7 Бесконечные суммы 82 Упражнения 89 3 Целочисленные функции 95 3.1 Полы и потолки 95 3.2 Применения пола и потолка 98 3.3 Рекуррентности с полом и потолком 109 3.4 'mod': бинарная операция 113 3.5 Суммы с полами и потолками 118 Упражнения 127 4 Теория чисел 137 4.1 Делимость 137 4.2 Простые числа 141 4.3 Простые примеры простых чисел 144 4.4 Факториальные факты 149 4.5 Взаимная простота 154 4.6 'mod': отношение сравнимости по модулю 163 4.7 Независимые остатки 167 4.8 Дополнительные приложения 170 4.9 Фи и мю 174 Упражнения 187 5 Биномиальные коэффициенты 199 5.1 Основные тождества 199 5.2 Необходимые навыки 222 5.3 Специальные приемы 237
6 Оглавление 5.4 Производящие функции 249 5.5 Гипергеометрические функции 257 5.6 Гипергеометрические преобразования 271 5.7 Частичные гипергеометрические суммы 279 5.8 Механическое суммирование 286 Упражнения 300 6 Специальные числа 317 6.1 Числа Стирлинга 317 6.2 Числа Эйлера 328 6.3 Гармонические числа 334 6.4 Гармоническое суммирование 341 6.5 Числа Бернулли 346 6.6 Числа Фибоначчи 354 6.7 Континуанты 367 Упражнения 375 7 Производящие функции 389 7.1 Теория домино и размен 389 7.2 Основные манипуляции 402 7.3 Решение рекуррентных соотношений 409 7.4 Специальные производящие функции 424 7.5 Свертки 427 7.6 Экспоненциальные производящие функции 440 7.7 Производящие функции Дирихле 447 Упражнения 449 8 Дискретная вероятность 461 8.1 Определения 461 8.2 Математическое ожидание и дисперсия 468 8.3 Вероятностные производящие функции 476 8.4 Бросание монет 484 8.5 Хеширование 495 Упражнения 512 9 Асимптотика 529 9.1 Иерархия 530 9.2 0-обозначения 534 9.3 Работа с О 542 9.4 Два асимптотических приема 557 9.5 Формула суммирования Эйлера 564 9.6 Завершающее суммирование 571 Упражнения 586 А Ответы к упражнениям 595 Б Библиография 719 В Первоисточники упражнений 753 Предметный указатель 761 Список таблиц 782
Предисловие "Аудитория, уровень изложения и трактовка материала — вот /\ля чего предназначены предисловия" — П.Р.Халмош (RR.Halmos)[173] "Отдельные лица приобретают дешевый авторитет, оснастив свою речь жаргоном: они могут проповедовать и выставлять напоказ поверхностные суждения. Но от математиков- профессионалов требуются не разглагольствования и даже не степень осведомленности в тех или иных математических вопросах, а готовность применять свои знания и способность реально решать возникающие на практике математические задачи. Короче говоря, мы ждем дел, а не слов" — Дж. Хаммерсли (J. Hammersley) [176] ЭТА КНИГА ОСНОВАНА на одноименном курсе лекций, который ежегодно читается в Станфордском университете начиная с 1970 года. Каждый год его прослушивают около пятидесяти человек— студентов как средних, так и старших курсов, но в первую очередь дипломников (а многие из наших выпускников уже начали вводить такого рода курсы и в других местах). По-видимому, настала пора представить материалы курса более широкой аудитории (включая студентов младших курсов). Конкретная математика зарождалась в смутное и неспокойное десятилетие. В те бурные годы подвергалось сомнениям все, включая казавшиеся до этого незыблемыми ценности. Студенческие городки превращались в арены жарких баталий. Оспаривались сами учебные программы, и математика не могла быть исключением. Как раз в те годы Джон Хаммерсли (John Hammersley) написал свою полемическую статью "О снижении уровня математической подготовки в школах и университетах благодаря 'современной математике' и подобной ей жидкой интеллектуальной похлебке" [176]; другие обеспокоенные математики [332] даже задавались вопросом "А можно ли спасти математику?" Когда один из авторов этой книги (Д.Э.К.) задумал серию книг под названием Искусство программирования, то при написании первого тома он обнаружил, что в его арсенале отсутствуют самые важные инструменты. Математика, которую он изучал в колледже в качестве профильной дисциплины, разительно отличалась от той математики, которая требовалась для досконального, обоснованного понимания компьютерных программ. Поэтому он ввел новый курс, содержащий материал, который хотел бы в свое время прослушать сам. Новый курс с самого начала получил название "конкретная математика" — сперва как противопоставление "абстрактной математике" поскольку конкретные классические результаты очень быстро выметались из современного математического образования новой метлой абстрактных идей, популярно именовавшихся "новоматом" ("New Math"). Абстрактная математика— чудес-
8 Предисловие ный предмет, в котором нет ничего плохого: она красива, обща и полезна. Однако ее приверженцы впали в опасное заблуждение: они решили, что вся остальная математика ниже ее, занимает подчиненное положение и не заслуживает особого внимания. Погоня за общностью оказалась столь захватывающей, что стала самоцелью для целого поколения математиков, которые потеряли способность находить красоту в частностях, в том числе получать удовольствие от решения численных задач или по достоинству оценивать роль математических методов. Абстрактная математика стала вырождаться и терять связь с действительностью. Математическому образованию срочно потребовался конкретный противовес для восстановления равновесия. Когда Д.Э.К. приступал к чтению курса конкретной математики в Станфордском университете, он пояснял несколько странное название курса тем, что это попытка преподавания в стиле "хард" вместо "софт" Он объявил, что, в отличие от своих коллег, он не намерен излагать ни теорию агрегатов, ни теорему вложения Стоуна, ни даже компактификацию Стоуна-Чеха. (Несколько студентов факультета гражданского строительства потихоньку покинули аудиторию.*) Хотя конкретная математика возникла в качестве реакции на другие тенденции в математике, основные причины ее появления на свет скорее позитивны, нежели негативны. По мере того как этот курс завоевывал себе место под солнцем в учебном процессе, содержание предмета "цементировалось" и доказывало свою ценность в целом ряде новых приложений. Тем временем поступило независимое подтверждение уместности подобного наименования, когда 3. А. Мелзак (Z. A. Melzak) опубликовал два тома, озаглавленные Справочник по конкретной математике [267]. На первый взгляд, материал конкретной математики может показаться беспорядочным нагромождением хитроумных трюков, но на самом деле это упорядоченный набор инструментов. Методы конкретной математики обладают не только внутренним единством, но и внешней привлекательностью для множества людей. Когда другой автор этой книги (Р.Л.Г.) впервые прочел этот курс в 1979 году, восторг студентов был столь велик, что они тут же решили продлить это удовольствие еще на год. Но что же такое конкретная математика на самом деле? Это смесь континуальной и дискретной математик. Еще более кон- "Сердце математики—в конкретных примерах и конкретных задачах" — П.Р.Халмош (RR.Halmos)[172] "Непростительный грех— учить абстрактному до изучения конкретного" — 3. А. Мелзак (Z. A. Melzak) [267] * Имеется в виду, что название "конкретная математика" (concrete mathematics) в английском языке, помимо смысла "конкретная" имеет и второй смысл— "бетонная" — Примеч. пер. Конкретная математика — мост к абстрактной математике.
Предисловие 9 "Более подготовленный читатель, пропустивший кажущиеся ему слишком элементарными части, может потерять больше, чем менее подготовленный читатель, пропустивший части, кажущиеся слишком сложными" — Г. Пойа (G. Polya) [297] Мы недостаточно дерзки для названия "Дистинуальная математика" 130 в русском переводе. — Переводчик "... конкретный спасательный круг, брошенный студентам, тонущим в море абстракции" — У. Готтшалк (W. Gottschalk) кретно — это осмысленное оперирование математическими формулами с использованием определенного набора методов решения задач. После того как вы, читатель, изучите материал данной книги, все, что вам потребуется,— это холодная голова, большой лист бумаги и сносный почерк для вычисления ужасно выглядящих сумм, решения запутанных рекуррентных соотношений и выявления коварных закономерностей в данных. Вы овладеете алгебраической техникой в такой степени, что зачастую вам будет проще получать точные результаты, нежели довольствоваться приближенными ответами, справедливыми лишь в ограниченном смысле. Основные темы книги включают исчисление сумм, рекуррентные соотношения, элементарную теорию чисел, биномиальные коэффициенты, производящие функции, дискретную вероятность и асимптотические методы. Основной упор при этом делается на технической стороне дела, а не на теоремах существования или комбинаторных рассуждениях; цель заключается в том, чтобы сделать каждого читателя настолько осведомленным в дискретных операциях (наподобие вычисления функции "наибольшего целого" или конечной суммы), насколько изучающие анализ знакомы с операциями континуальными (наподобие вычисления функции "абсолютной величины" или определенного интеграла). Заметим, что этот перечень тем кардинально отличается от того, что в наше время обычно читается в качестве спецкурсов под названием "Дискретная математика'.' Поэтому наш предмет нуждается в отличительном наименовании, и название "Конкретная математика" право, не хуже любого другого. Первоначальным руководством по конкретной математике для станфордского курса послужил раздел "Математическое введение" из Искусства программирования [207]. Но изложение на этих 110 страницах было слишком сжатым, поэтому еще один автор (О.П.) загорелся желанием внести большое количество дополнений. Настоящая книга выросла на этих примечаниях: она предваряет и расширяет материал "Математического введения" Некоторые вопросы повышенной сложности опущены; в то же время в книгу включено несколько тем, которых не было ранее и без которых материал был бы неполным. Авторы с удовольствием объединили свои усилия для работы над этой книгой, поскольку ее предмет начал зарождаться и обретать собственную жизнь у них на глазах; кажется, что книга написалась как бы сама собой. Более того, несколько различные подходы каждого автора после нескольких лет совме-
10 Предисловие стной работы оказались хорошо пригнанными друг к другу, так что возникает ощущение некоторого манифеста выбранного нами способа занятий математикой. Поэтому мы думаем, что эта книга окажется одой красоте и очарованию математики и что наши читатели разделят с нами хотя бы е того удовольствия, которое мы получили при ее написании. Поскольку книга родилась в университетской среде, мы попытались передать дух аудитории наших дней, выбрав неформальный стиль изложения. Некоторые полагают, что математика— это серьезное дело, холодное и сухое; но мы считаем ее развлечением и не боимся в этом признаться. Так ли уж необходимо проводить четкую грань между работой и игрой? Конкретная математика полна тому примеров — пусть выполняемые действия и не всегда приятны, зато ответы могут принести удивительную радость. Радости и горести математической работы явно присутствуют в этой книге, поскольку представляют собой часть нашей жизни. Студенты всегда все знают лучше преподавателей, поэтому мы попросили первых студентов, изучавших этот материал, внести свой вклад в виде "граффити" на полях. Некоторые из этих заметок были попросту банальны, некоторые полны смысла; одни из них предупреждали о двусмысленностях или неясностях, другие оказывались типичными комментариями умников с "Камчатки'.' Часть замечаний положительна, часть отрицательна, ценность еще одной части попросту нулевая. Но все они, несомненно, отражают реальные чувства читателей, что должно облегчить восприятие книги. (Вдохновляющей идеей для таких пометок на полях послужил справочник Поступающему в Стан- форд, в котором официальной линии университета противопоставляются замечания выпускников. Например, в справочнике сказано: "Есть несколько вещей, которые нельзя пропустить в столь аморфном образовании, каковым является Станфорд"; в примечании на полях— "Аморфное образование! Ну и выражения! Вокруг одни типичные псевдоинтеллектуалы'.' Стан- форд: "Потенциал совместно проживающих студентов безграничен" Граффити: "Здешние общаги— зоопарк без дворника'.') На полях мы также цитируем великих математиков прошлого— подлинные слова, которыми они сообщали о своих фундаментальных открытиях. Представляется уместным привести на одних и тех же страницах слова Лейбница, Эйлера, Гаусса и тех, кому предстоит продолжать их дело. Математика по-прежнему привлекает своих приверженцев, и каждая нить находит свое место в этом богатом полотне. Математическое граффити: Килрой не был Хааром. Освободите группу. Взорвите ядро. N = 1 =Ф P = NP. Не замечаю за собой интереса к этим замечаниям. Это был самый приятный курс из пройденных мною. Но было бы неплохо подытоживать материал по мере продвижения вперед.
Предисловие 11 Понятно: конкретная математика— это муштра. Домашнее задание заставило выучить большой объем нового материала, так что каждый затраченный час стоил того. Домашние контрольные работы вам еще пригодятся— не выбрасывайте их. Контрольные оказались труднее, чем можно было ожидать по домашним заданиям. Лентяи могут сдать курс, просто списывая ответы, но обманут при этом только самих себя. Дополнительные задачи не рассчитаны на студентов, специализирующихся по другим предметам. В книге имеется более 500 упражнений, разделенных на шесть категорий. • Разминка — это упражнения, которые каждый читатель должен попытаться выполнить при первом прочтении материала. • Обязательные упражнения предназначены для самостоятельного установления фактов, которые лучше всего усваиваются, если их выводить самому, а не читать о том, как это делали другие. • Домашние задания представляют собой задачи для углубленного понимания материала той главы, к которой они относятся. • Контрольные работы обычно охватывают материал двух и более глав одновременно; в основном они предназначены для неспешного выполнения дома (а не в цейтноте в аудитории) . • Дополнительные задачи выходят за рамки ожидаемых возможностей среднего студента, изучающего курс конкретной математики на базе этой книги. Они расширяют текст книги в важных и интересных направлениях. • Исследовательские проблемы могут быть разрешимы человеком (а могут и не быть таковыми), но те из них, которые представлены в книге, стоит попытаться решить (без ограничения времени). Ответы ко всем этим упражнениям приведены в приложении А, зачастую с дополнительной информацией о родственных результатах. (Конечно же, "ответы" на исследовательские проблемы являются неполными, но даже в этих случаях частичные результаты или указания могут оказаться полезными.) Читателям не возбраняется заглянуть в ответы главным образом разминочных задач, но только после серьезных попыток решить задачу самостоятельно, без подсказок. В приложении Б мы попытались воздать должное первоисточникам каждого упражнения, поскольку составление той или иной поучительной задачи зачастую представляет собой творческий процесс с изрядной долей везения. К сожалению, математики выработали традицию заимствовать упражнения без какой бы то ни было признательности; мы же считаем, что гораздо лучшей является обратная традиция (практикуемая, например, в шахматных книгах и журналах, где принято указывать авторов, дату и место появления оригинальных шахматных задач). Однако мы так и не смогли выявить источники многих задач,
12 Предисловие ставших частью математического фольклора. Если кому-либо из читателей известно о происхождении того или иного упражнения, ссылка на которое нами пропущена или неточна, мы будем рады получить от него подробную информацию, чтобы исправить упущение в следующих изданиях книги. Шрифт, которым набраны математические обозначения в книге,— новая разработка Германа Цапфа (Hermann Zapf) [227], заказанная Американским математическим обществом. Она выполнена при содействии комиссии, в состав которой вошли Б. Би- тон (B.Beeton), Р.Ф.Боас (R. P. Boas), Л.К.Дарст (L. К. Durst), Д. Э. Кнут (D.E.Knuth), Ф.Мердок (P. Murdock), Р. Ш. Пале (R. S. Palais), П. Ренц (P. Renz), Э. Свансон (Е. Swanson), С. Б. Уид- ден (S.B.Whidden) и У.Б.Вульф (W.B.Woolf). Основная идея дизайна Цапфа— отразить особенности написания математических знаков идеальным почерком. Рукописный стиль, в отличие от механического, более естествен, потому что обычно математические формулы выходят из-под пера, куска мела или карандаша. (Примером одного из фирменных признаков этого дизайна является начертание нуля, '0', который слегка заострен сверху, — ведь рукописный нуль редко закругляется в исходной точке.) Буквы расположены прямо, а не наклонно, с тем, чтобы нижние и верхние индексы, а также штрихи, было легче совмещать с обычными символами. Новое семейство шрифтов получило название AMS Euler, в честь великого математика Леонарда Эйлера (Leon- hard Euler) (1707-1783), открывшего так много в математике из того, что нам известно сегодня. Алфавиты AMS Euler включают текстовые (АаВЬСс ... XxYijZz), готические (21аЯЗЬ?с ... Ху 2)t) Зз) и рукописные прописные (Л Ъ С ... X У Z) буквы, a также греческие буквы (АаВ(3 Гу ... Xx^ty Q-iu) и специальные символы наподобие р и К. Нам особенно приятно торжественно представить это семейство шрифтов в нашей книге, поскольку дух Леонарда Эйлера воистину живет на каждой ее странице: конкретная математика— это эйлерова математика! Авторы чрезвычайно признательны Андрею Бродеру (Andrei Broder), Эрнсту Мэйру (Ernst Mayr), Эндрю Яо (Andrew Yao) и Френсис Яо (Prances Yao), которые внесли значительный вклад в книгу в те годы, когда они преподавали конкретную математику в Станфорде. Кроме того, мы выражаем 1024 благодарности ассистентам, творчески подошедшим к записи происходившего в аудитории каждый год и помогавшим составлять экзаменационные вопросы; их имена перечислены в приложении В. Эта книга, которая по сути представляет собой конспект всего ценного, прозвучавшего на лекциях за шестнадцать лет, была бы просто невозможна без их первоклассной работы. Значит, вы не видели мой почерк. Профессор, спасибо за (1) шутки и каламбуры, (2) серьезность и содержа тельность предмета.
Предисловие 13 Не вижу, где бы я мог применить изученный материал. .. С этим предметом было немало хлопот, но я знаю, что он отточил мои математические и умственные способности. Я бы посоветовал случайному студенту держаться от этого курса подальше. Стать реальностью данной книге помогало множество других людей. Например, достойны похвалы студенты университетов Брауна и Раиса, Колумбийского, Нью-Йоркского, Прин- стонского и Станфордского университетов, внесшие вклад в виде отобранных для книги граффити и оказавшие помощь в отладке первых черновых версий книги. Наше сотрудничество с издательством Addison-Wesley было особенно эффективным и плодотворным; в частности, мы хотим поблагодарить нашего издателя Питера Гордона (Peter Gordon), технического директора Бет Ааронсон (Bette Aaronson), дизайнера Роя Брауна (Roy Brown) и редактора Айн Дюпре (Lyn Dupre). Неоценимую помощь нам оказали Национальный научный фонд и Отделение военно-морских исследований. При составлении предметного указателя незаменима была Шерил Грэхем (Cheryl Graham). Кроме того, мы хотим поблагодарить наших жен— Фэн, Джилл и Эми— за их терпение, поддержку, ободрение и советы. Второе издание книги отличается новым разделом, 5.8, в котором описан ряд важных идей, которые Дорон Зайльбергер (Doron Zeilberger) открыл вскоре после выхода в свет первого издания. Кроме того, исправления к первому изданию встречаются почти на каждой странице. Мы пытались создать идеальную книгу, но сами мы не идеальны, а потому призываем оказать содействие в исправлении допущенных нами ошибок. Мы с признательностью выплатим премию в сумме 2.56 доллара первому нашедшему любую ошибку в английском оригинальном издании книги, будь то ошибка математическая, историческая или типографская. Мюррей-Хилл, Нью-Джерси — Р.Л.Г. Станфорд, Калифорния Д.Э.К. Май 1988 и октябрь 1993 года О.П.
От издательства Вы, читатель этой книги, и есть главный ее критик. Мы ценим ваше мнение и хотим знать, что было сделано нами правильно, что можно было сделать лучше и что еще вы хотели бы увидеть изданным нами. Нам интересно услышать и любые другие замечания, которые вам хотелось бы высказать в наш адрес. Мы ждем ваших комментариев и надеемся на них. Вы можете прислать нам бумажное или электронное письмо, либо просто посетить наш Web-сервер и оставить свои замечания там. Одним словом, любым удобным для вас способом дайте нам знать, нравится или нет вам эта книга, а также выскажите свое мнение о том, как сделать наши книги более интересными для вас. Отсылая письмо или сообщение, не забудьте указать название книги и ее авторов, а также свой обратный адрес. Мы внимательно ознакомимся с вашим мнением и обязательно учтем его при отборе и подготовке к изданию последующих книг. Наши координаты: E-mail: info@williamspublishing.com WWW: http: / /www. williamspublishing .com Адреса для писем из: России: 127055, г. Москва, ул. Лесная, д. 43, стр. 1 Украины: 03150, Киев, а/я 152
Принятые обозначения ЧАСТЬ СИМВОЛИКИ, используемой в этой книге, (пока еще?) не стала нормой. Вот список обозначений, которые могут быть незнакомы читателям, изучавшим аналогичный материал по другим книгам. В нем указаны номера страниц, на которых эти обозначения разъясняются. Обозначение 1пх lgx logx w м х mod у М ^f(x)6x Y"bf(x)6x *•—a X^ X^ Щ Kz 3z Hn Смысл Натуральный логарифм: loge x Бинарный логарифм: log2 x Десятичный логарифм: log10x Пол: max{n | n ^ x, целое n} Потолок: min{n | n ^ x, целое n} Остаток: x — у [x/y\ Дробная часть: x mod 1 Неопределенная сумма Определенная сумма Убывающая факториальная степень: х!/(х —п)! Возрастающая факториальная степень: Г(х + п)/Г(х) Субфакториал: п!/0! - п!/1! + • • • + (-1 )пп1/п1 Действительная часть: х, если z = x + iy Мнимая часть: у, если z = х + \у Гармоническое число: Страница 339 98 541 95 95 113 98 73 74 71,265 71,265 246 91 91 50
16 Принятые обозначения f(TTL)r n m {:} n TTL U ^am...a0Jb K(ab..Man a,b F #A [zn]f(z) [a..(3] [m = n] [m\n] [m\\n] [mln] Обобщенное гармоническое число: 1/1x + --- + 1/nx m-я производная f в точке z Число Стирлинга первого рода (число циклов) Число Стирлинга второго рода (число подмножеств) Число Эйлера Число Эйлера второго порядка Обозначение для Х.ъ=о а^к в системе счисления с основанием b Континуант Гипергеометрическая функция Мощность: количество элементов в множестве А Коэффициент при zn в разложении f (z) Замкнутый интервал: множество {х | а ^ х ^ (3} 1 , если m = п, в противном случае — 0 * 1 , если га нацело делит п, в противном случае — 0 * 1 , если га напросто делит п, в противном случае — 0 * 1 , если га взаимно простое с п, в противном случае — 0 * 340 564 320 318 328 331 30 367 258 62 249 102 45 137 189 154 *В общем случае, если S— некоторое утверждение, которое может быть истинно или ложно, обозначение в квадратных скобках [S] равно 1, если S истинно, и 0 в противном случае. Повсюду в книге мы используем одинарные кавычки ('...') для выделения текста, как он пишется, а двойные кавычки ("...")— для фразы, как она произносится. Так, строка букв 'строка' называется "строка'.' Выражение вида 'a/bc' означает то же, что и 'a/(bc)\ Кроме того, logx/logy = (logх)/(logу) и 2п! = 2(п!). В хорошем учебнике по конкретной математике не обойтись без сбивающего с толку списка обозначений. 'Нестрока' тоже строка.
1 Рекуррентные задачи В ЭТОЙ ГЛАВЕ в качестве примера рассматриваются три задачи, которые дадут вам понять, что же будет дальше. Эти задачи объединяет то, что их неоднократно изучали математики и их решения основаны на идее рекуррентности, согласно которой решение каждой задачи зависит от решений меньших экземпляров той же самой задачи. Поднимите руку, если вы никогда этого не видели. Остальные могут сразу перейти к уравнениям (i.i). 1.1 Ханойская башня Начнем с небольшой изящной головоломки под названием "Ханойская башня" придуманной французским математиком Эдуардом Люка (Edouard Lucas) в 1883 году. Имеется башенка, сложенная из восьми дисков, изначально одетых на один из трех колышков в порядке уменьшения размера дисков. Л, золото!.. Интересно, а из чего сделаны наши чисто конкретные диски? Суть головоломки состоит в том, чтобы перенести всю башню на другой колышек (используя третий в качестве вспомогательного) по одному диску за раз, причем больший диск никогда не должен находиться поверх меньшего. Люка [260] связывал свою головоломку с легендой о гораздо большей "Башне Брахмы" которая, как утверждается, состоит из 64 дисков из чистого золота на трех алмазных шпилях. В начале
18 Рекуррентные задачи времен Бог поместил эти золотые диски на первый шпиль и повелел группе жрецов перенести башню на третий шпиль согласно указанным выше условиям. По слухам жрецы беспрерывно, день и ночь, сменяя друг друга, без устали перекладывают диски, и когда последний диск будет перенесен, башня рассыплется в пыль и настанет конец света. То, что головоломка имеет решение, на первый взгляд не очевидно. Но если немного подумать (или познакомиться с этой задачей заранее), то можно убедиться, что это так. При этом возникает вопрос: как перенести башню наилучшим образом? То есть какого количества переносов дисков достаточно для решения поставленной задачи? Лучший способ решения подобного рода вопросов — это обобщить его и решать более общую задачу. Башня Брахмы состоит из 64 дисков, Ханойская башня— из 8. Давайте рассмотрим обобщенную башню из п дисков. Одно из достоинств такого подхода состоит в том, что можно существенно уменьшить размер задачи. В этой книге мы часто будем видеть, как полезно вначале рассмотреть малые случаи. Легко разобраться, как переместить башню, состоящую всего из одного или двух дисков. После небольшого количества экспериментов с парой дисков становится очевидным, как перемещать башню из трех дисков. Следующий шаг в решении задачи состоит во введении подходящих обозначений: именуй и властвуй. Пусть Тп— минимальное количество перемещений, необходимое для переноса п дисков с одного шпиля на другой в соответствии с правилами Люка. Очевидно, что Ti = 1, Т2 = 3. Можно получить еще одни данные, совершенно не прикладывая усилий: если дисков нет, то и перемещать ничего не надо! Значит, для башни из п = 0 дисков То = 0. Умные математики не боятся обратиться к нулю, поскольку понять общее проще, если хорошо разобраться в предельных случаях (даже если они тривиальны). А теперь давайте изменим перспективу и вместо малого подумаем о большом: как переместить большую башню? Эксперименты с тремя дисками показывают, что выигрышная идея состоит в том, чтобы перенести два диска на средний шпиль, переместить большой диск на третий, а затем два диска со среднего шпиля поместить на третий шпиль поверх большого диска. Эта идея применима и для переноса п дисков в общем случае: сначала мы переносим п—1 меньших дисков на промежуточный шпиль (для чего требуется Tn_i перемещений дисков), затем переносим
1.1 Ханойская башня 19 Большинство опубликованных "решений" задачи Люка, наподобие раннего решения Аллардиса (А1- lardice) и Фрейзера (Fraser) [7], не поясняют, почему Тп должно быть Z 2ТП_! +1. Стоп, стоп... кажется, это слово уже встречалось. .. наибольший диск в его конечное положение (это делается при помощи одного перемещения), а после опять переносим п — 1 меньших дисков с промежуточного шпиля на наибольший диск (для чего нужны очередные Tn_i перемещений). Таким образом, мы можем перенести п > О дисков не более чем за 2Tn_i + 1 перемещения: Тп < 2ТП_! + 1 при п > 0. В этой формуле вместо 1 = * используется '^', поскольку наше построение доказывает только то, что 2Tn_i + 1 перемещений достаточно; мы еще не показали, что необходимо 2Tn_i + 1 перемещений. Вдруг какой-то ученый (или хитрый) муж сумеет отыскать более короткий способ переноса? Но существует ли лучшее решение? На самом деле— нет. На каком-то этапе мы вынуждены переместить самый большой диск. При этом остальные п — 1 меньших дисков должны находиться на одном шпиле, что требует как минимум Tn_i переносов. Если очень хочется, то большой диск можно перекладывать с места на место и несколько раз— например, задумавшись о том, чему равно Tn_i. Но когда большой диск, наконец, окажется на своем месте, нужно будет переместить п — 1 меньших дисков (которые опять должны быть одеты на один шпиль) назад на наибольший диск. Это также потребует выполнения Tn_i переносов. Следовательно, Тп ;> 2Тп_т + 1 при п > 0. Эти два неравенства вместе с тривиальным решением для п = 0 дают То=0; Тп = 2ТП_! + 1 при п> 0. (1.1) (Заметим, что эти формулы дают уже известные нам значения "Л = 1 и Tz = 3. Наши эксперименты с малыми количествами дисков не только помогли вывести общую формулу, но и предоставили возможность проверки решения на наличие глупых ошибок. Такие проверки особенно важны при более сложных способах решения в последующих главах.) Набор равенств типа (l.i) называется рекуррентностью (оно же рекуррентное соотношение или рекурсивная зависимость). Она задается граничным значением и уравнением, которое выражает общий член через предыдущие. Иногда рекуррентностью мы будем называть только это уравнение для общего
20 Рекуррентные задачи члена, хотя технически для полного определения рекуррентности требуется еще и начальное значение. Рекуррентное соотношение позволяет вычислить Тп для произвольного значения п, какого мы пожелаем. Но вряд ли кому-то понравится вычислять значение непосредственно из рекуррентного соотношения при больших значениях п — это потребует слишком много времени. Рекуррентность дает только косвенную, локальную информацию. Решение "рекуррентного соотношения было бы гораздо более приятным и полезным. То есть было бы здорово, если бы мы могли получить решение в аналитическом виде, которое позволяло бы быстро вычислять Тп даже для очень больших значений п. Решение в аналитическом виде позволяет легко понять, что же на самом деле представляет собой Тп. Но как же решить рекуррентное соотношение? Один из способов— угадать правильное решение и затем доказать правильность догадки. Надеяться же при игре в "угадайку" вновь приходится на случаи небольших величин п. Давайте вычислим несколько последовательных значений: Тз = 2 • 3 + 1 = 7; Т4 = 2-7+1 = 15; Т5 = 2-15 + 1 = 31; Т6 = 2 • 31 + 1 =63. Ага! Определенно это что-то напоминает: этот ряд выглядит так, как если бы 1 при n ^ 0. (1.2) По крайней мере это справедливо при тг ^ 6. Математическая индукция— это общий способ доказательства истинности некоторого утверждения для целочисленных значений n ^ tiq. Сначала мы доказываем утверждение для наименьшего значения п, равного tlq. Это называется базой (базисом, основанием (basis)) индукции. Затем мы доказываем утверждение для п > по в предположении, что оно уже доказано для всех значений от По до п — 1 включительно; это называется шагом индукции или просто индукцией. Такое доказательство позволяет получить бесконечное количество результатов при помощи конечного количества работы. Рекуррентность и математическая индукция идеально подходят друг другу. Например, в нашем случае (1.2) легко следует из (i.i): основание индукции тривиально, поскольку То = 2°—1 = 0. Шаг индукции выполняется для п > 0, если предположить справедливость (1.2), когда п заменяется на п — 1: Математическая индукция доказывает, что по лестнице можно взобраться на любую, сколь угодно высокую ступеньку— путем доказательства того, что можно стать на нижнюю ступеньку (база) и того, что с любой ступеньки можно подняться на следующую (шаг индукции). Tn = 2Tn_! + 1 = 2(2n"] - 1) + 1 = 2П - 1
1.1 Ханойская башня 21 Знаете ли вы, что слово "proof" не только переводится как "доказательство" но и означает меру крепости алкогольных напитков (0,5%)? Следовательно, (1.2) выполняется и для п. Отлично! Мы успешно завершили поиск выражения для Тп. Что же касается задачи браминов, то она далеко не завершена— они продолжают упорно трудиться, и вряд ли им доведется отдохнуть в ближайшие тысячелетия: при п = 64 требуется сделать 264 — 1 перенос дисков, что составляет ни много, ни мало: 18446 744073 709551615, т.е. больше 18 квинтиллионов. Если даже брамины будут перемещать диски с нечеловеческой скоростью, один диск за микросекунду, им потребуется более 5 000 веков для перемещения башни Брахмы. Головоломка Аюка практичнее и человечнее— при определенной ловкости рук необходимые 28 — 1 = 255 переносов можно выполнить минуты за четыре. Рекуррентность Ханойской башни типична для многих задач, возникающих в приложениях разного рода. В процессе поиска аналитического выражения интересующей величины наподобие Тп мы проходим три стадии. 1 Рассмотрение малых значений. Это позволяет понять задачу и помогает нам на стадиях 2 и 3. 2 Поиск и доказательство математического выражения интересующей нас величины. В случае Ханойской башни это рекуррентность (l.i), которая позволяет вычислить Тп для любого п. 3 Поиск и доказательство аналитического выражения для полученного рекуррентного соотношения. В случае Ханойской башни это решение рекуррентности (1.2). В этой книге на первое место выходит третья стадия; именно ей будет уделяться основное внимание. Фактически зачастую стадии 1 и 2 будут полностью опущены, поскольку математическое выражение будет задано в качестве исходной точки. Но даже тогда мы будем встречаться с подзадачами, решение которых проходит через все три стадии. Наш анализ задачи о Ханойской башне привел к корректному ответу, но слабым его местом является "индуктивный скачок" когда мы полагались на везение при угадывании ответа. Одна из основных целей данной книги— пояснить, каким образом можно решать рекуррентные соотношения, не обладая сверхъестественными способностями. Например, рекуррентное соотношение (l.i) можно упростить, прибавляя 1 к обоим сторонам уравнений: То + 1 = 1; Tn + 1=2Tn_l+2 при п> 0.
22 Рекуррентные задачи Теперь, если положить Un = Тп + 1, получим при п > 0. U0 = 1; Un = 2Un_, (i-3) Не надо быть гением, чтобы обнаружить, что решение этого рекуррентного соотношения имеет вид Un = 2П; следовательно, Тп = 2П — 1. Даже компьютер в состоянии решить такую простую задачу. Интересно, что от +1 в (i.i) можно избавиться путем прибавления, а не вычитания. 1.2 Прямые на плоскости Вторая задача явно пахнет геометрией: на сколько кусков можно разрезать блин при помощи п прямолинейных разрезов ножом? Или, говоря более академичным языком: каково максимальное количество Ln областей, на которые можно разделить плоскость п прямыми? Эта задача впервые была решена в 1826 году швейцарским математиком Якобом Штайнером (Jacob Steiner) [338]. Мы вновь начнем с рассмотрения малых случаев, помня, что начинать надо с абсолютного нуля. Плоскость без прямых— это единая область; одна прямая делит плоскость на две области, а две прямые— на четыре: Ц = 1 Li =2 L2=4 (Каждая прямая неограниченно продолжается в обоих направлениях.) Этого достаточно, чтобы высказать догадку о том, что Ln = 2П. Похоже, что каждая новая прямая просто удваивает количество областей. Увы, это не так— первый блин оказался комом... Удвоение получалось бы в том случае, если бы новая п-я прямая рассекала каждую без исключения старую область на две; на большее количество частей рассечь старую область невозможно из-за того, что все старые области выпуклы. (Прямая линия может разделить выпуклую область не более чем на две новые области, которые, в свою очередь, также будут выпуклыми.) Но когда мы добавим третью прямую— толстую прямую на приведенном ниже рисунке,— то увидим, что она может рассечь не Пиццу, о которой идет речь в оригинале, разрезать ровно гораздо сложнее, чем блин... — Переводчик Интересно, разрезал ли он швейцарский сыр? Область выпукла, если она включает прямолинейные отрезки между любыми двумя ее точками. (В моем словаре сказано иначе, но давайте поверим математикам.)
1.2 Прямые на плоскости 23 Не будем вдаваться в тонкости неевклидовых геометрий. .. — Переводчик Разворачивая? Скорее уж "подставляя" более трех старых областей, как бы ни располагались две первые прямые: Таким образом, l-з = 4+3 = 7— наилучшее, чего можно достичь. Если немного подумать, то можно найти и подходящее обобщение. Новая п-я прямая (п > 0) увеличивает количество областей на к тогда и только тогда, когда она рассекает к старых областей, а это происходит тогда и только тогда, когда новая прямая пересекает старые прямые в к— 1 различных местах. Две прямые могут пересекаться не более чем в одной точке. Таким образом, новая прямая не может пересечь п — 1 старых прямых более чем в п — 1 разных точках, и должно выполняться соотношение k ^ п. Итак, мы установили верхнюю границу Ln ^ Ln_i + п при п > 0. Более того, при помощи индукции легко показать, что в этой формуле можно достичь равенства. Разместим п-ю прямую так, чтобы она не была параллельна ни одной из остальных линий (а значит, пересекала каждую из них), причем она не должна проходить ни через одну существующую точку пересечения прямых (а значит, она пересекает все существующие прямые в разных точках). При этом рекуррентное соотношение принимает вид L0 = 1; Ln = Ln_T + n при п > 0. (1-4) Уже известные нам значения Li, L2 и 1_з отлично укладываются в это соотношение. Теперь нужно получить решение в аналитическом виде. Можно опять сыграть в "угадайку" но что-то 1, 2, 4, 7, 11, 16... не вызывает никаких ассоциаций. Пожалуй, самое время попробовать другой подход. Часто можно понять рекуррентность, "разворачивая" или "разматывая" ее до конца следующим образом: Ln = t-n-i +rt = = Ln_2 + (n-1)+n - = Ln_3 + (n-2) + (n-1)+n =
24 Рекуррентные задачи = L0 + 1 + 2 + • • • + (п - 2) + (п - 1) + n = = 1 + Sn , где Sn = 1+ 2 + 3 + • • • + (n - 1) + п. Другими словами, Ln на единицу больше суммы Sn первых п натуральных чисел. Поскольку с величиной Sn нам придется сталкиваться еще много раз, стоит составить таблицу ее начальных значений, чтобы легче было ее распознать, встретившись с ней в следующий раз: п Sn 1 2 3 1 3 6 4 10 5 15 6 21 7 28 8 36 9 45 10 11 55 66 12 78 13 91 14 105 Эти числа называются также треугольными, поскольку Sn представляет собой количество биллиардных шаров, расположенных в виде треугольника из п рядов. Например, четырехрядная расстановка """у* состоит из S4 = 10 шаров. Чтобы вычислить Sn, можно прибегнуть к хитрости, которую, как говорят, Гаусс (Gauss) открыл для себя в 1786 году, когда ему было всего девять лет [88] (и которой воспользовался еще Архимед в предложениях 10 и 11 своего классического трактата о спиралях): Sn= 1 + 2 + 3 + ••¦ + (п-1) + п + Sn= п + (п-1) + (п-2) + ••• + 2 + 1 2Sn = (n+1) + (n+1) + (n+1) + --- + (n+1) + (n+1 Мы просто складываем Sn с самим собой, но записанным в обратном порядке, так что сумма каждого из п столбцов равна п + 1. Упрощая, получаем _ п(п+1) . , ч Sn = 2 при n ^ °- (^б) Итак, вот окончательное решение: U = -^—- + 1 при n^O. (i.6) Как специалисты высокого класса мы могли бы удовлетвориться этим выводом и считать его доказательством, невзирая на разворачивание и обращение. Но студенты— дело другое, они обязаны отвечать куда более строгим стандартам, поэтому у нас есть отличный повод построить строгое доказательство методом математической индукции. Вот ключевой шаг индукции: Ln = Ln_!+n = (±(n-1)n+1)+n = ^n(n+1) + 1. Гауссу приписывают столько, что непонятно, кто именно гений— он или его пресс-секретарь. А может, он просто был притягательной личностью? Приятно, что мы смогли разобраться хотя бы в одном открытии такого выдающегося математика, как Гаусс.
1.2 Прямые на плоскости 25 Чем "замкнутое" отличается от "открытого"? Что мы должны представить, услышав эти слова? Ответ: уравнение "замкнуто" если оно самодостаточно, и не выражается через себя же, т.е. не приводит к рекуррентности. "Вопрос закрыт" означает, что он не возникнет вновь. Иногда метафоры дают нам ключ к пониманию вещей. Достаточно ли научно звучит термин "зиг"? Теперь у нас не остается никаких сомнений в справедливости решения в аналитическом виде (i.6). Кстати, мы все время говорим о решении в аналитическом виде (или о "замкнутой форме" решения (closed form)), но пока что не дали точного определения этого термина. Обычно все понятно без лишних слов. Рекуррентности наподобие (i.i) и (1.4) не являются замкнутой формой, поскольку выражают некоторую величину через самих себя, в отличие от решений (1.2) и (i.6). Сумма вида 1 + 2 + • • • + п не является закрытой формой из-за наличия ' • • •'; но выражение наподобие п{п + 1 )/2 представляет собой замкнутую форму. Можно дать такое грубое определение: выражение для величины f (п) имеет аналитический вид (находится в замкнутой форме), если мы можем вычислить его при помощи фиксированного количества "хорошо известных" стандартных операций, не зависящего от п. Например, выражения 2П — 1 и п(п + 1)/2 представлены в закрытой форме, поскольку включают только сложение, вычитание, умножение, деление и возведение в степень в явном виде. Общее количество простых замкнутых форм ограничено, так что существуют рекуррентные соотношения, не представимые в аналитическом виде. Однако если такие рекуррентные соотношения важны, то можно пополнить множество стандартных операций новыми; это может существенно расширить диапазон задач, решаемых в аналитическом виде. Например, произведение первых п натуральных чисел, п!, оказалось настолько важным, что теперь рассматривается как базовая операция. Таким образом, lnV представляет собой замкнутую форму, несмотря на то, что ее эквивалент Ч -2-... -п' таковой не является. А теперь бегло рассмотрим вариацию задачи об угощении блином: предположим, что вместо прямых линий используются ломаные, каждая из которых содержит один "зиг". Чему в этом случае равно максимальное количество Zn областей, на которые разделяют плоскость п таких ломаных? Можно ожидать, что Zn будет раза в два (ну, или в три) больше Ln. Давайте подсчитаем: Zi =2
26 Рекуррентные задачи Из этих малых случаев — после небольшого раздумья — мы приходим к выводу, что ломаная линия похожа на две прямые, с тем отличием, что там, куда после пересечения не продолжаются "две" прямые, области сливаются: ... а может, и большого., Области 2, 3 и 4, которые были бы отдельными областями при наличии двух прямых, становятся одной областью в случае одной ломаной, т.е. мы просто теряем две области. Однако при корректном размещении линий — когда точка излома находится "за" пересечениями с другими линиями — все, что мы теряем,— это две области на одну линию. Таким образом, Zn = L2n-2n == 2u(2n+1)/2 + 1-2n = = 2n2-n+1 при n^ 0. (i-7) Сравнивая аналитические решения (i.6) и (1.7)1 мы находим, что для больших п In2 2п2; Подробности можно найти в упр. 18. так что ломаные линии дают примерно в четыре раза больше областей, чем прямые. (В последующих главах мы рассмотрим, как анализировать приближенное поведение целочисленных функций при больших значениях аргумента п. Символ (~' будет определен в разделе 9.1.) 1.3 Задача Иосифа Флавия Последний из вводных примеров представляет собой вариацию древней задачи* носящей имя Иосифа Флавия, известного историка I века. Легенда гласит, что Иосиф не был бы знаменитым, историком и вообще живым, если бы не его математические таланты. В ходе Иудейско-римской войны он в соста- * Описание происхождения этой задачи и множества ее вариантов (средневекового, восточного и др.) можно найти в [20].— Примеч. пер. (Увлекательную историю этой задачи обсуждают Арене (Ahrens) [5, т. 2] и Герштейн (Herstein) и Ка- плански (Kaplan- sky) [187]. Сам Иосиф [197] несколько невнятен в описании своих похождений.)
1.3 Задача Иосифа Флавия 27 ... и только поэтому данная история дошла до наших дней. ве отряда из 41 иудейского воина был загнан римскими войсками в пещеру, выход из которой был один— в плен. Предпочтя смерть позору плена, воины избрали нетривиальный способ самоубийства— выстроиться в круг и убивать каждого третьего из живых до тех пор, пока не погибнут все. Но Иосиф и его единомышленник сочли такую гибель бессмысленной. Отдавая себе отчет, что в случае прямого выступления против планов воинов первыми падут он со своим единомышленником, Иосиф придумал план получше. Подсчитав спасительные места в круге, он сумел поставить на них себя и своего товарища. Наша версия задачи начинается с выстраивания в круг п человек, пронумерованных от 1 до п, и удалении каждого второго из оставшихся в круге до тех пор, пока не останется только один человек. Вот, например, как выглядит начальная конфигурация при п = 10: В этой задаче начать рассмотрение с нуля не получится. .. Порядок исключения— 2, 4, 6, 8, 10, 3, 7, 1, 9, так что остается номер 5. Задача состоит в том, чтобы определить номер уцелевшего J (п.). Только что мы видели, что J(10) =5. Можно было бы предположить, что J (и) = п/2 при четных п; случай п = 2 тоже подтверждает это предположение: J(2) = 1. Увы, но другие малые случаи (например, значения для и = 4,п = 6ип = 8) опровергают это предположение. п J(n) 123456789 113 13 5 7 13 Отрицательный результат— тоже результат, поскольку он помогает глубже проникнуть в задачу. Придется вернуться к схеме и попытаться найти решение получше... Ну-ка, ну-ка... Похоже, J(n) всегда нечетное. Кстати, тому есть веская причина: первый проход по кругу исключает все четные номера. Кроме того, если п четное, то мы окажемся в ситуации, подобной начальной, однако людей останется в два раза меньше, и изменятся их номера. Итак, предположим, что изначально было 2п людей. После первого прохода по кругу в нем останутся номера
28 Рекуррентные задачи и следующим исключаемым номером будет 3. Задача выглядит так, как если бы у нас имелось п человек, но номер каждого при этом был удвоен и уменьшен на 1: J(2n) = 2J(n)-l притО 1. Теперь можно быстро перейти к большим значениям п. Например, мы знаем, что J(10) = 5, так что J(20) = 2J(10)-1 = 2-5-1 = 9. Вот в чем хитрость: J(2n)=No(J(n))f где No{k) =2k-1. Аналогично J(40) = 17, и вообще J(5-2m) = 2m+1 +1. Ну, а как же быть с нечетными значениями? При наличии А может, нечет- 2п + 1 человек номер 1 становится жертвой сразу после номера не в счет- 2п, и мы оказываемся в ситуации Мы опять получили почти исходную ситуацию с п людьми, но на этот раз номера уцелевших удваиваются и уменьшаются на 1. Таким образом, J(2n+1) = 2J(n) + l прип^1. Объединяя эти уравнения с J(1) = 1, мы получим рекуррентные соотношения, определяющие } для всех значений: J(2n) = 2J(n) - 1 J(2n + 1)=2J(n) + 1 при n ^ 1; при п ^ 1. (1.8) Вместо того чтобы получать ](п) из }(тг—1), эти соотношения предоставляют в наше распоряжение куда более эффективную вычислительную схему, поскольку при вычислениях п на каждом шаге уменьшается в 2 или более раз. Так, значение }(1000000) можно вычислить при помощи всего лишь 19 применений (i.8).
1.3 Задача Иосифа Флавия 29 Есть и более простой путь! Ключевой факт заключается в том, что J(2m) = 1 для всех га, а это непосредственно следует из нашего первого уравнения J(2n)=2J(n)-1. Следовательно, мы знаем, что первый человек спасется, если п представляет собой степень 2. А в общем случае, когда n = 2m + 1, количество людей сокращается до степени 2 после I исключений. Первый из оставшихся после этого человек— тот, кто останется в живых— имеет номер 21+1. Но мы все равно ищем решение в аналитическом виде, поскольку оно должно быть не только более быстрым, но и более информативным. В конце концов, не забывайте, что речь идет о жизни и смерти! Полученное нами рекуррентное соотношение позволяет очень быстро построить таблицу для небольших значений п. Может, мы сумеем увидеть в ней какую-то закономерность и угадать ответ. п J(n) 1 1 2 3 1 3 4 5 6 7 13 5 7 8 9 10 11 12 13 14 15 13 5 7 9 11 13 15 16 1 Bom! Похоже, можно сгруппировать значения по степеням 2 (что в таблице показано при помощи вертикальных линий); J(n) всегда равно 1 в начале группы и на каждом шаге увеличивается на 2 в пределах группы. Так что если записать п в виде n = 2т + I, где 2т — наибольшая степень 2, не превосходящая п, а I— разность между п и этой степенью 2, то, похоже, решение нашего рекуррентного соотношения можно записать следующим образом: J(2m + I) = 21 + 1 при m J> 0 и 0 ^ I < 2m. (1-9) (Обратите внимание, что если 2т <С п < 2т+1, то остаток I = п — 2т удовлетворяет неравенству 0 ^ I < 2m+1 — 2m = 2m.) Мы должны доказать (i.g). Как и ранее, прибегнем к математической индукции, но в этот раз к индукции по т. При т = 0 мы получаем единственное возможное значение 1 = 0; таким образом, база индукции (i.g) сводится к J(1) = 1, что, очевидно, верно. Шаг индукции состоит из двух частей, в зависимости от того, четное I или нет. Если га > 0 и 2т + I = 2п, то I четное и J(2m + l) - 2J(2m~1+1/2)-1 - 2(21/2 + 1) — 1 - 21+1 в соответствии с (i.8) и гипотезой индукции; это именно то, что мы хотим получить. Аналогичное доказательство работает в нечетном случае, когда 2т + I = 2п + 1. Можно также заметить, что из (i.8) вытекает соотношение J(2n+1)-J(2n) = 2. В любом случае индукция завершена и (i.g) доказано. Проиллюстрируем решение (i.g) путем вычисления J(100). В этом случае 100 = 26+36, так что J(100) =2-36+1 = 73. Теперь, когда сделано самое трудное (решена задача), немного задержимся перед тем, как идти дальше: каждое решение
30 Рекуррентные задачи задачи можно обобщить так, что оно будет применимо к более широкому классу задач. Раз уж мы изучили некоторый метод, будет поучительным познакомиться с ним поближе и посмотреть, как далеко он может нас завести. Поэтому в оставшейся части раздела мы изучим решение (l.g) и исследуем некоторые обобщения рекуррентного соотношения (i.8). Эти исследования выявят структуру, лежащую в основе всех задач такого рода. Степени 2 играют важную роль в нашем поиске решения, так что вполне естественно рассмотреть двоичные представления п и J(n). Предположим, что двоичное представление n's имеет вид п (bmb m-1 ¦ bi boh> т.е. n = bm2m + bm_12m"' + ... + Ь!2 + Ьо, где каждое bt равно 0 или 1, причем старший бит bm равен 1. Вспоминая, что n = 2т + I, последовательно получаем .bib 1 D0J2> ?m-1 Dm_2 ...bi Ьо)2 , П = (1 bm_! bm_2 - I = (Obm_!br 21 = (bm_i bm_2...bi b0 0)2 > 21+1 = (bm_! bm_2...b] b0 1)2, J(n) = (bm_i bm_2 . ..bi b0bm)2 . (Последний шаг следует из того, что J(n) =21+1 и bm доказали, что J((bmbm_1...b1b0)2) = (b m-1 •• ¦ bi b0bm)2; 1.) Мы (1.10) т. е., говоря языком компьютерного программирования, }(п) получается из и путем циклического сдвига влево на один бит! Чудеса. .. Так, если п = 100 = (1100100)2> то J(u) = J((1100100)2) = (1001001 )2, что равно 64 + 8 + 1 = 73. Наверняка, работая в двоичной системе счисления изначально, мы бы сразу обратили внимание на данную закономерность. Если начать с п и га + 1 раз итерировать функцию }, то будет выполнено га + 1 однобитовых циклических сдвигов, так что, поскольку п представляет собой (га+1 )-битовое число, казалось бы, мы должны вновь получить число п. Но это не совсем так. Например, если п = 13, то }((1101)2) = (1011)2, но далее J((1011)2) = (Ш)2 и процесс обрывается: когда 0 становится "Итерация" в данном случае означает применение функции к себе самой.
1.3 Задача Иосифа Флавия 31 Довольно забавно: если М. — компактное п -мерное многообразие С°° (п > 1 ), то существует дифференцируемое погружение М В R2n-v(n) ^ m необязательно в R2n-v(n)-1 # Не удивлюсь, если узнаю, что Иосиф — секретный тополог. .. ведущим битом, он исчезает и более не рассматривается. По определению J(n) всегда ^ п, поскольку J(n)— номер уцелевшего человека; следовательно, если }(п) < п, мы никогда не вернемся к п в последующих итерациях. Многократное применение J приводит к последовательности убывающих значений, в конечном счете достигающей "фиксированной точки" в которой J(n) = п. Свойство циклического сдвига позволяет легко выяснить, что это за точка: при достаточном количестве итераций всегда будет получаться значение, состоящее из одних единиц в двоичной записи, равное 2v(n) — 1, где v(n) — количество битов 1 в двоичном представлении п. Таким образом, поскольку у(13) =3, мы получаем J(J(...J(13)...)) = 23-1 = 7; аналогично J(J(...J((101101101101011)2)...)) = 210-1 = 1023. Странно, но факт. Вернемся к нашему первому предположению, что }(п) = п/2 при четных п. Очевидно, что в общем случае это неверно, но теперь мы можем определить, когда это верно: J(n) = п/2, 21+1 = (2m + l)/2, I = 1(2^ -2). Если число I = ^(2т —2) целое, то п = 2m + l является решением, поскольку I меньше 2т. Несложно проверить, что 2т—2 делится на 3 при нечетном та и не делится, когда га четное. (Такие вещи мы будем изучать в главе 4.) Поэтому имеется бесконечно много решений уравнения J(n) = п/2, начиная со следующих: тп I п = 2т + I J(n) = 21 + 1 = п/2 п (двоичное) 1 3 5 7 0 2 10 42 2 10 42 170 1 5 21 85 10 1010 101010 10101010 Обратите внимание на вид чисел в крайнем справа столбце. Это двоичные числа, для которых циклический сдвиг на один бит
32 Рекуррентные задачи влево дает тот же результат, что и сдвиг на один бит вправо (деление пополам). Пожалуй, с функцией } мы разобрались в полной мере; следующий шаг— ее обобщение. Что было бы, если бы в нашей задаче получилось рекуррентное соотношение, подобное (i.8), но с другими константами? Вряд ли бы нам повезло угадать решение, которое могло бы быть воистину причудливым. Давайте исследуем случай с константами а, (3 и у и попытаемся найти в анали- Какая-то Гомеров- тическом виде решение более общего рекуррентного соотношения ская гРамота- • • f(1) = a; f (2n) = 2f (n) + (3 прип^1; (i.h) f(2n+1) = 2f(n)+y при тО 1. (Наше исходное рекуррентное соотношение получается при а = 1, (3 = — 1 и у = 1.) Начнем с f (1) = а и, работая так же, как и раньше, построим таблицу для малых значений п: п. 1 2 3 4 5 6 7 8 9 f(n) а 2а + (3 2а + у 4а+ 3(3 4а + 2(3 + у 4а + (3 + 2у 4а + Зу 8а + 7(3 8а+ 6(3 + у Похоже, что коэффициенты при а представляют собой наибольшие степени 2, не превосходящие п. Кроме того, между степенями 2 значения коэффициентов при (3 уменьшаются на 1 вплоть до 0, а при у— увеличиваются на 1, начиная с 0. Таким образом, если выразить f (п) в виде f(n) - А(п)а + В(п)|3 + C(n)y, (i.i3) отделяя зависимости от а, (3 и у друг от друга, похоже, что А(п) = 2т; В(п) - 2--1-1; (1.14) С(п) = I. Здесь, как обычно, п=:2т + 1и0^1<2т при п ^ 1.
1.3 Задача Иосифа Флавия 33 Не так уж трудно доказать по индукции (1.13) и (1.14), но в этом мало как системы, так и информации. К счастью, имеется лучший способ, состоящий в выборе отдельных значений и их комбинации. Проиллюстрируем его на примере частного случая а = 1, |3 = у = 0, когда f (п) предполагается равной Л(п). В этом случае рекуррентные соотношения (l.n) приводятся к виду А(1) = 1; А(2п) = 2А(п) прип^1; А(2п+1) = 2А(п) прип^1. Достаточно ясно (по индукции по га), что А(2т + I) = 2т. Теперь воспользуемся рекуррентным соотношением (l.n) и решением (1.13) в обратном порядке, начав с простой функции f (п) и выясняя, нет ли каких-то констант (а, 13,7), которые ее Изящная идея! определяют. Подстановка константной функции f (тг) = 1 в (l.n) говорит, что 1 = ос, 1 = 2-1+(3, 1 = 2-1+у, следовательно, значения (а, (3,у) = (1,-1,-1), удовлетворяющие этим уравнениям, дают А(п) — В(п) — C(n) = f(n) = 1. Аналогично можно подставить f (тг) = тг: 1 = ос, 2п = 2-тг+(3, 2п+1 = 2-тг + у. Эти уравнения выполняются для всех тг, если ос = 1, (3 = О и у = 1, так что нам не надо доказывать по индукции, что при данных значениях параметров f (тг) = тг. Мы уже знаем, что f (тг) = тг является решением в данном частном случае, поскольку рекуррентное соотношение (l.n) однозначно определяет f(n) для каждого значения п. По сути, все сделано! Мы показали, что функции А(п), В(п) и С(тг) из (1.13), которые решают (l.n) в общем случае, удовлетворяют уравнениям А(тг) = 2т , где п = 2т + I и 0 ^ К 2т, A(n)-B(n)-C(n) = 1 , А(тг) + С(тг) = тг. Дальше будет кое- что поновее.
34 Рекуррентные задачи Наши предположения в (1.14) подтверждаются немедленно, поскольку можно решить эти уравнения и получить С[п) = п — Л(п) = I И В(п) = А(п) - 1 - С(п) = 2т - 1 - I. Этот подход иллюстрирует на удивление полезный метод наборов (repertoire method) для решения рекуррентных соотношений. Сначала находятся значения общих параметров, для которых решения известны. Это обеспечивает нас набором частных случаев, которые мы в состоянии решить. Затем общий случай получается путем комбинирования частных. Нам надо столько независимых частных решений, сколько и независимых параметров (в данном случае их три— а, (3 и у). Другие примеры данного подхода вы найдете в упражнениях 16 и 20. Мы знаем, что исходная J-рекуррентность имеет магическое решение в двоичной записи: J((bmbm_i ...bi boh) = (bm-i ...bi bobmh, гдеЬт = 1. Допускает ли подобные чудеса обобщенная рекуррентность Иосифа? Конечно, почему бы и нет? Можно переписать обобщенную рекуррентность (i.n) в виде f(1) = a, f(2n + j) =2f(n) + Pj при) =0,1 и n^l, (i-i5) если положить (Зо = (3 и (3i = у. Эта рекуррентность побитово развертывается следующим образом: f ((bm bm_i ... bi boh) = 2f ((b та вт— 1 . . . blh)+Pb0 = 4f((bmbm_T ...b2h)+2|3b1+Pb0 Внимание! Авторы надеются, что читатель поймет идею метода из этих доморощенных примеров, и не излагают его последовательно, "от и до" Лучше всего данный метод работает с "линейными" рекуррентными соотношениями (в том смысле, что их решения могут быть выражены в виде суммы произвольных параметров, умноженных на функции от п, как в (1.13). В этом смысле уравнение (1.13) является ключевым. = 2mf ((bm)2)+2m"1 |3bm_, +• • -+2(3b, +3b0 = 2ma+2m-1 |3bm_, +• • -+2pbl +(3bo . Предположим, что теперь мы так расширили двоичную запись, (Это 'расширение' что в ней допустимы любые цифры, а не только 0 и 1. Предыду- = Уничтожению') щий вывод говорит нам, что f((bmbm_-| ...Ът boh) = (a(3bm_1 (3bm_2 ...(3bl (3bo)2. (1.16) Отлично! Это можно было бы увидеть и раньше, если бы мы с самого начала записали таблицу (1.12) иначе:
1.3 Задача Иосифа Флавия 35 Кажется, я понял: в двоичных представлениях А(п), В(п) и С(п) единицы находятся в разных позициях. "Существует два вида обобщений. Одно— подешевле, другое— подороже. Легко обобщать, разбавляя небольшую идею большими словами. Гораздо сложнее приготовить очищенный концентрат из нескольких хороших ингредиентов." — Г. Пойа (G. Polya) [297] п 1 2 3 4 5 6 7 f(n) а 2а + (3 2а + у 4а + 2(3 + (3 4а + 2(3 + у 4а + 2у + (3 4а + 2у + у Например, для п = ность Иосифа а = 1, (3 100 = (1100100)2 исходная рекуррент- —1 и у = 1, как и ранее, дает п = 1 1 0 0 1 о о 100 f (п) - ( 1 1-1-1 1 -1 -1 )2 = +64 +32 -16 -8 +4 -2 -1 = 73. Свойство циклического сдвига сохраняется, поскольку каждый блок двоичных цифр (1 0 ... 00)2 в представлении п преобразуется в (1-1 ...-1-1)2 = (00 ...01) 2 • Наше изменение записи дает нам компактное решение (i.i6) обобщенной рекуррентности (1.15). Если очень хочется, можно обобщить ее еще больше. Рекуррентность f(j) = Oj при 1 ^ j < d; f(dn + j) =cf(n) + (3j npn0^j<d и n^l (1.17) такая же, как и предыдущая, с тем отличием, что мы начинаем с чисел в системе счисления с основанием d, а получаем значения в системе счисления с основанием с. То есть данная рекуррентность имеет решение с переменным основанием f((bmbm_1 ...bi b0)d) = (<*ът (3bm_1 (3bm_2 ...(3bl Pb0)c (1.18) Пусть, например, нам несказанно повезло и мы сумели получить рекуррентное соотношение f(D f(2) f(3n) f(3n+1) f(3n + 2) 34, 5, 10f(n)+76 10f(n)-2 10f(n) + 8 при n ^ 1; при n ^ 1, при n ^ 1,
36 Рекуррентные задачи и предположим, что мы хотим вычислить f(19). Здесь d = 3 и с = 10. Тогда 19 = (201 )з, и решение с переменным основанием системы счисления состоит в выполнении перехода от системы счисления с основанием 3 к системе счисления с основанием 10 цифра за цифрой. Старшая цифра 2 становится цифрой 5, а 0 и 1 становятся 76 и —2 соответственно, что дает окончательный ответ f(19) = f((201)3) = (5 76-2)10 = 1258. Возможно, это пример невезения. Так Иосиф и иудейско-римская война привели нас к интересным обобщенным возвратным отношениям. В общем случае я против возврата войн. Упражнения Разминка 1 Все лошади— одной масти. Это утверждение можно доказать по индукции по числу лошадей в данном множестве. Вот как это делается. "Если имеется только одна лошадь, то очевидно, что она своей собственной масти, так что база индукции тривиальна. Для выполнения шага индукции предположим, что имеется п лошадей с номерами от 1 до п. Согласно гипотезе индукции лошади от первой до п — 1 — одинаковой масти. То же самое можно сказать о лошадях со второй по n-ю. Лошади со второй по п — 1-ю не в состоянии менять масть, переходя из группы в группу (это же не хамелеоны!), поэтому в силу транзитивности лошади с первой по n-ю должны иметь один и тот же цвет. Следовательно, все тг лошадей— одного цвета. QED*'.' Что в приведенном доказательстве не так? 2 Найдите кратчайшую последовательность переносов для перемещения башни из п дисков со шпиля А на шпиль В, если переносы между шпилями А и В запрещены. (Каждый перенос должен выполняться на средний шпиль или с него. Как обычно, больший диск никогда не должен располагаться поверх меньшего.) 3 Покажите, что в процессе перемещения башни на условиях из предыдущего упражнения будут реализованы все корректные размещения п дисков на трех шпилях. Разминка обязательна к выполнению в каждой главе! —Администрация * "Quod erat demonstrandum" ¦ (лат.).— Примеч. пер. "Что и требовалось доказать"
1 Упражнения 37 Имеются ли для трех шпилей некоторые начальное и конечное расположения п дисков, для которых переход из одного в другое по исходным правилам Люка требует более 2П — 1 переносов дисков? "Диаграмма Венна" с тремя пересекающимися окружностями часто используется для иллюстрации всех восьми возможных подмножеств трех данных множеств: Можно ли проиллюстрировать при помощи четырех пересекающихся окружностей все шестнадцать возможностей, возникающих при наличии четырех заданных множеств? 6 Одни области, определяемые п прямыми на плоскости, бесконечны, в то время как другие— конечны. Чему равно максимально возможное число конечных областей? 7 Пусть Н(п) = J(n+ 1) — J (п.). Уравнение (i.8) говорит о том, что Щ2п) = 2, а Н(2п + 1) = }(2п + 2) - J(2n + 1) = (2J(n + 1) - 1) - (2J(n) + 1) = 2Н(п) - 2 при всех n ^ 1. Поэтому кажется возможным доказательство по индукции по п того, что Н(п) = 2 при всех п. Что здесь неверно? Домашние задания 8 Решите рекуррентное соотношение Qo = a; Qi = (3; Qn = (1+ Qn-1 )/Qn-2 при n > 1. Считаем, что Qn ф 0 при всех n ^ 0. Указание: Q4 = (1+а)/р. 9 Иногда возможно применение индукции в обратном направ- ... эта лошадь — лении, т.е. ведущей доказательство от п к п—1, а не наоборот! другой масти... Рассмотрим, например, утверждение ?[п) : xi ... хп ^ I 1 , если xi,..., х^ ^ 0. Оно верно для п = 2, поскольку (xi + Х2)2 — 4xiX2 = (xi — х2)2^0.
38 Рекуррентные задачи а Полагая хп = [х-\ Н Ьxn_i )/(п — 1), докажите, что из Р(п) вытекает Р(п — 1) для любого тг > 1. б Покажите, что из Р(тг) и Р(2) следует Р(2п). в Поясните, почему отсюда следует справедливость Р(п) для всех тг. 10 Пусть Qn— минимальное число переносов, необходимых для переноса башни из тг дисков со шпиля А на шпиль В, если все переносы осуществляются по часовой стрелке, т.е. с А на В, с В на третий шпиль или с этого третьего шпиля на А. Пусть также Rn — минимальное количество переносов, необходимых для перемещения башни со шпиля В на шпиль А при тех же ограничениях. Докажите, что Г 0, если тг = 0; \ 2Rn_i +1, если тг > 0; Г 0, если тг = 0; I Qn + Qn-i +1) если тг > 0. (Решать эти рекуррентные соотношения не надо; как это делается, вы узнаете в главе 7.) 11 Двойная Ханойская башня состоит из 2п дисков тг разных размеров, по два диска каждого размера. Как обычно, переносить можно только по одному диску за раз, и больший диск нельзя класть поверх меньшего. а Сколько переносов требуется для перемещения двойной башни с одного шпиля на другой, если диски одного размера неотличимы друг от друга? б Что если в окончательном расположении дисков требуется воспроизвести исходный порядок дисков в башне? (Указание: эту задачу решить не так-то просто— на самом деле она относится к "дополнительным задачам") 12 Обобщим упражнение 11, а, предполагая, что имеются диски тг разных размеров, причем размер к имеют ттг^ дисков. Определите, чему равно А(тти,..., ттгп) — минимальное количество переносов, необходимое для перемещения башни при условии неразличимости дисков одинакового размера. 13 На какое максимальное количество областей можно разделить плоскость п зигзагообразными линиями, Qn = Rn = ZZ2 = 12
1 Упражнения 39 Подумайте о помощнике, который будет держать сыр. каждая из которых состоит из двух полубесконечных прямых, соединенных прямолинейным отрезком? 14 На сколько частей можно разрезать головку сыра пятью плоскими разрезами? (Головка в процессе разрезания должна покоиться, а каждый разрез должен представлять собой плоскость в трехмерном пространстве.) Найдите рекуррентное соотношение для Рп — максимального количества трехмерных областей, на которое может быть разбито трехмерное пространство при помощи п различных плоскостей. 15 У Иосифа был друг, спасая которого, Иосиф поставил на предпоследнее место в списке казнимых. Чему равно 1(п), номер предпоследнего выжившего, если казнят каждого второго? 16 Примените метод наборов для решения обобщенного рекуррентного соотношения с четырьмя параметрами: дО) = а, g(2u + j) - 3g(n)+Yn+Pj при j = 0> 1 VL>\. Указание: испытайте функцию д(п) = п. Контрольные работы 17 Пусть Wn— минимальное количество переносов, необходимых для перемещения башни из п дисков с одного шпиля на другой, когда имеется не три, а четыре шпиля. Покажите, что Это уже пятизвездочная рекуррентность! W, п(и+1)/ 7 ^ 2W, п(п-1)/2 + Тп при п > 0. (Здесь Тп = 2П — 1 — количество переносов в случае трех шпилей.) Воспользуйтесь этим для поиска в аналитическом виде f(n), такой, что Wn(n+i)/2 ^ f(n) при всех п^О. 18 Покажите, что следующее множество из п ломаных линий делит плоскость на Zn областей, где Zn определено в (1.7)' j-я ломаная линия (1 <^ j ^ п) имеет излом в точке (п2^,0) и проходит через точки (п2^ — п\ 1) и (п2^ — г0 — n~ri) 1). 19 Можно ли получить Zn областей при использовании п ломаных линий, если угол каждого излома равен 30°? 20 Воспользуйтесь методом наборов для решения обобщенной рекуррентности с пятью параметрами: но: а,
40 Рекуррентные задачи h(2n +j) = 4h(n) +У3П+ (3j при j = 0,1 и n ^ 1. Указание: попробуйте применить функции h(n) = п и h(n)=n2. 21 Предположим, что имеется 2тг человек, построенных в круг, среди которых первые п— "наши" а последние п— "не наши'.' Покажите, что всегда найдется целое число га (зависящее от п), такое, что если при движении по кругу будет исключаться каждый m-й человек, то сначала будут исключены все "не наши'.' (Например, при п = 3 можно взять га = 5; при п = 4 можно использовать га = 30.) Дополнительные задачи 22 Покажите, что можно построить диаграмму Венна для всех 2П возможных подмножеств п заданных множеств при помощи и конгруэнтных выпуклых многоугольников, которые повернуты на разные углы относительно общего центра. 23 Предположим, что Иосифа поставили в круг на конкретное j-e место, но позволили ему назвать параметр q, после чего уничтожается каждый q-й человек. Всегда ли Иосиф сможет спастись? Исследовательские проблемы 24 Найдите все рекуррентные соотношения вида х _ 1 + сц Xn_T Н h aicXn-k bi Xn_i Н h bicXn-jc решения которых периодичны, какими бы ни были начальные значения Хо, ..., Xic_i. 25 Решите задачу о Ханойской башне с четырьмя шпилями для бесконечного числа случаев, доказав, что в упр. 17 имеет место равенство. 26 Обобщим упр. 23. Назовем Иосифовым подмножеством множества {1,2,..., п} множество из к чисел, такое, что при некотором q первыми будут уничтожены люди с оставшимися n — к номерами. (Эти к мест занимают люди, которых хочет спасти Иосиф.) Оказывается, при п = 9 три из 29 возможных подмножеств являются неиосифовыми, а именно подмножества {1,2,5,8,9}, {2,3,4,5,8} и {2,5,6,7,8}. При п — М имеется 13 неиосифовых подмножеств; при всех прочих п ^ 12 неиосифовых подмножеств нет. Являются ли Да, и неплохо бы неиосифовы подмножества редкостью при больших п? их наит-
2 Суммы СУММЫ В МАТЕМАТИКЕ вездесущи, так что мы обязаны знать основные способы работы с ними. Эта глава посвящена обозначениям и методам, которые помогут сделать суммирование простым и дружественным занятием. 2.1 Обозначения В главе 1 мы встречались с суммой первых п натуральных чисел, которую записывали как 1 + 2 + 3-1 Ь (п — 1) + п. Многоточие в таких формулах говорит о необходимости полной записи суммы в соответствии с шаблоном, определенным окружающими членами. Само собой, следует избегать сумм наподобие 1 +7+•••-1-41.7, которые без соответствующего контекста лишены всякого смысла. С другой стороны, включение членов 3 и (п — 1) в определенной степени излишне; шаблон становится совершенно очевидным и при записи 1 + 2 + \-п. Иногда его можно даже сократить до 1 Н \-п. Мы будем работать с суммами общего вида си + a2 + --- + an> (2.i) где каждое а^ представляет собой определенное каким-то образом число. Такая запись обладает тем преимуществом, что при достаточном воображении мы можем "увидеть" всю сумму почти так, как если бы она была записана полностью. Каждый элемент суммы а^ называется ее членом. Зачастую члены определяются неявно, в виде формул, следующих некоторому легко улавливаемому шаблону, и в таких случаях иногда требуется записывать их в развернутом виде, чтобы их смысл был очевиден. Например, если предполагается, что формула Членом не только почетным, но и по нечетным... 1 4-2 4 + 211-1
42 Суммы описывает сумму из п, а не 2П ' членов, ее следует записать более точно как Запись с тремя точками используется очень часто, но она может оказаться неоднозначной и несколько громоздкой. Имеются и иные способы записи сумм, среди которых особенно выделяется запись с явным указанием пределов к=1 Clk, (2.2) которая называется сигма-обозначением, так как использует прописную греческую букву I. Такая запись гласит, что в сумму включаются те члены а^, индекс которых к представляет собой целое число между нижней и верхней границами 1 и п включительно. На обычном языке это звучит как "сумма по к от 1 до п". Жозеф Фурье (Joseph Fourier) ввел это ^-обозначение в 1820 году, и оно очень быстро было принято всем математическим миром. Кстати, величина после 22 (в данном случае— а^) называется общим членом (summand). Говорится, что индексная переменная к связана со знаком Л в (2.2), поскольку к в О-к не имеет никакого отношения к к вне суммы, к можно было бы заменить любой другой буквой без потери смысла (2.2). В качестве индекса часто используется буква г (вероятно, потому что с нее начинается слово "index"), но мы в общем случае предпочитаем применять суммирование по к, считая разумным позволить г оставаться мнимой единицей \/—Т. Еще более полезна обобщенная запись ]Г с одним или несколькими условиями под знаком суммы, указывающая множество индексов, по которым выполняется суммирование. Например, суммы в (2.1) и (2.2) могут быть записаны как У ак. (2-3) l^k^n Этот конкретный пример не сильно отличается от (2.2), но обобщенная форма позволяет брать сумму по множествам значений индексов, не ограниченных последовательными целыми числами. Например, вот как можно выразить сумму квадратов всех нечетных натуральных чисел, меньших 100: L "Lesigne ?_\Z™ in- dique que Von doit donner au nombre entier i toutes ses valeurs 1,2, 3, ..., et prendre la somme des termes." — Ж.Фурье (J. Fourier) [127] He хотите изучить французский язык, чтобы прочесть Фурье (и не только) в подлиннике? — Переводчик Я бы предпочел не использовать в качестве индекса а ИЛИ П В (2.2), ПОСКОЛЬКУ они имеют собственное значение за рамками 1^к<100 к нечетное
2.1 Обозначения 43 Аналог этой суммы с явными пределами, 49 2j2k + i)2, более громоздкий и менее очевидный. Аналогично сумма обратных значений всех простых чисел между 1 и N записывается как р простое запись с явными пределами имеет при этом вид 7Г(М) к=1 КК где pic означает к-е простое число, a 7t(N) — количество простых чисел, не превосходящих N. (Кстати, эта сумма дает приближенное среднее количество различных простых делителей случайного близкого к N целого числа, поскольку около 1 /р этих целых чисел делятся на р. При большом N это значение приближенно равно lnlnN + М., где значение М « 0.2614972128476427837554268386086958590515666 представляет собой константу Мертенса (Mertens) [271], lnx — натуральный логарифм х, a lnlnx— ln(lnx).) Самым большим преимуществом обобщенной записи суммы является то, что все манипуляции выполняются проще, чем в записи с явно указанными пределами. Предположим, например, что мы хотим изменить индексную переменную к на к+1. В случае обобщенной записи мы получим ^~ ак = ^Г ак+1 . Здесь очень легко сообразить, что происходит, и подстановка выполняется практически без лишних раздумий. Но в случае явных пределов запись имеет вид П П.—1 k=1 k=0 и понять, что происходит, несколько сложнее, а совершить ошибку, наоборот, проще. Знак суммы похож на сгорбившегося грузчика.
44 Суммы С другой стороны, запись с явно указанными пределами не является совершенно бесполезной. Она имеет привлекательный округлый вид да и немного короче— так, в (2.2) используется семь символов, а в (2.3)— восемь. Поэтому мы будем часто использовать ]Г с верхним и нижним пределами при формулировке задачи или представлении результата, хотя и будем предпочитать работать с указанными под знаком ]Г соотношениями при манипуляциях суммой, индексные переменные которой требуется изменять. Знак YL в эт°й книге встречается более тысячи раз, так что надо быть твердо уверенными в точном понимании его смысла. Формально мы записываем Р(Ю (24) как сокращенную запись суммы всех членов а^, таких, что целое значение к удовлетворяет заданному условию Р(к). ("Условие (предикат) Р(к)" представляет собой некоторое утверждение относительно к, которое может быть ложным либо истинным.) Пока что допустим, что elk ф 0 только для конечного количества целых значений к, удовлетворяющих условию Р(к); в противном случае выполняется суммирование бесконечного числа ненулевых членов, и ситуация несколько усложняется. Другая крайность— когда Р(к) ложно для всех целых значений к, мы получаем "пустую" сумму, которая по определению равна нулю. Если знак суммы находится в тексте абзаца, а не в отдельной формуле, то используется несколько модифицированный вид (2.4): мы записываем 1Лр(]с) а^'> гАе ^М записывается в виде нижнего индекса при ]Г> чтобы формула не слишком выдавалась за пределы строки. Аналогично *X!k=i аъ представляет собой строчную альтернативу записи (2.2), когда соответствующее обозначение следует разместить в строке текста. Зачастую хочется написать п-1 ]Г k(k-1)(n-k) вместо X>(k-1)(n-k), k=2 k=0 поскольку члены к = 0, 1 и п в этой сумме равны нулю. Может показаться более эффективным суммировать п — 2 члена вместо п+ 1. Однако таких соблазнов следует избегать: эффективность вычислительная— совсем не то же, что эффективность понимания! Позже вы убедитесь, что как можно более простые пределы суммирования обладают тем преимуществом, что существенно упрощают работу с суммами. На самом деле запись Y-\i=2 Можно сказать - круглая сумма. Мелочь по сравнению с количеством U в "Илиаде'!
2.1 Обозначения 45 Заметим, что "символ Кронекера" с которым часто приходится встречаться в математической литературе (бкп равно 1 при к = п и 0 — в противном случае), представляет собой всего лишь частный случай записи Айверсона: вместо символа Кронекера можно записать просто [k = n]. "Я часто удивляюсь новым, важным приложениям [этого обозначения]" —Б. де Финетти (В. de Finetti) [123] может быть просто опасно неоднозначной, поскольку ее смысл при п = 0 или п = 1 не очевиден (см. упр. 1). Нулевые члены безопасны и позволяют избегать многих неприятностей. Рассматривавшиеся до сих пор обозначения достаточно стандартны, но сейчас мы отступим от сложившихся традиций. Кеннет Айверсон (Kenneth Е. Iverson) в своем языке программирования APL [191, с. 11; см. также 220] предложил замечательную идею, которая, как вы увидите, существенно упрощает многое из того, что мы будем делать в книге. Эта идея состоит в том, чтобы заключать логическое утверждение в квадратные скобки и считать, что результат равен 1, если утверждение истинно, и 0, если оно ложно. Например, [р простое] {J: если р— простое число; если р— составное число. Запись Айверсона позволяет выражать суммы без каких бы то ни было ограничений на индекс суммирования, поскольку (2.4) можно переписать в виде ?>><№] (2-5) Если Р(к) ложно, член а]с[Р(к)] равен нулю, так что мы можем спокойно включать его в состав суммируемых членов. Это упрощает работу с индексом суммирования, поскольку позволяет не беспокоиться о граничных условиях. Следует упомянуть одну небольшую техническую деталь: иногда elk не определено для всех целых к. Мы обходим эту трудность при помощи предположения о том, что [Р(к)] имеет "совершенно нулевое значение" когда Р(к) ложно. Оно до такой степени нулевое, что делает а^ [Р(к)] равным нулю, даже если а^ не определено. Например, если использовать запись Айверсона для суммы простых чисел, обратных простым, не превышающим N, в виде Y [р простое] [р ^ N ] /р , то не возникнет никаких проблем с делением на нуль при р = 0, поскольку наше соглашение гласит, что [0 простое] [0 ^ N]/0 = 0. Давайте теперь просуммируем все, что мы узнали о суммах. Имеется два основных способа записи суммы членов. Первый использует троеточие с • • •', второй — знак суммы * Y_ '. Запись с троеточием часто подсказывает полезные преобразования
46 Суммы (например, группировку смежных членов), поскольку, когда перед глазами вся сумма, легче увидеть определенные упрощающие ее закономерности. Беда только в том, что за лесом можно не увидеть деревьев. Запись с использованием YL компактна, впечатляюще действует на девушек и часто подсказывает преобразования, которые в записи с троеточием не очевидны. При работе с Y. нулевые члены не мешают, а зачастую и упрощают выполнение манипуляций. ... и уменьшает шансы провалиться на экзамене из- за "недостаточной строгости" 2.2 Суммы и рекуррентности Отлично, мы разобрались, как записать сумму при помощи причудливых обозначений. Но как найти значение суммы? Один из способов состоит в том, чтобы заметить тесную связь между суммами и рекуррентными соотношениями. Сумма = У ак к=0 эквивалентна рекуррентности So = clo ; Sn — Sn_i + OLn при n> 0. (2.6) Таким образом, можно вычислять суммы в аналитическом виде, используя для этого методы решения рекуррентных соотношений в замкнутой форме из главы 1. Например, если а^ представляет собой сумму константы и кратного п, то рекуррентное соотношение (2.6) приобретает следующий общий вид: Ro = ос; Rn = Rn_! + (3+уп при п > 0. (2-7) Прибегая к методам главы 1, мы находим, что Ri = ос + (3 + у, R2 = ос + 2(3 + Зу и т.д.; в общем случае решение может быть записано в виде Rn = A(n)a+B(n)P + C(n)Y, (2.8) где A(n), В(п) и C(n)— коэффициенты при обобщенных параметрах ос, |3 и у. Метод наборов советует нам попробовать подставить вместо Rn простые функции от п в надежде найти константные параметры сх, (3 и у, при которых решение оказывается особенно про- (Рассматривайте Sn не как отдельное число, а как последовательность, определенную для всех
2.2 Суммы и рекуррентности 47 стым. Подстановка Rn = 1 приводит ка=1,|3=0, у = 0; следовательно, А(п) = 1 . Подстановка Rn = п приводит кос = 0, |3 = 1, у = О, что дает нам В(п) = п. Наконец подстановка Rn = п2 дает а = 0, (3 = — 1, у = 2, откуда 2С(п)-В(п) = п2 и С(п) = (п2 + п)/2. Просто как дважды два. Таким образом, если нам надо вычислить сумму п ?> + Ък), k=0 то рекуррентное соотношение (2.6) сведется к (2.7) с сх = (3 = а, у = Ъ и его решением будет аЛ(п) + аВ(тг) + ЬС(тг) = а(тг + 1) + Ъ(п+1)п/2. И обратно, многие рекуррентные соотношения могут быть сведены к суммам; таким образом, специальные методы вычисления сумм, которые мы изучим позже в этой главе, могут помочь при решении рекуррентностей, справиться с которыми иначе было бы трудно. Примером может служить рекуррентность, связанная с задачей о Ханойской башне: То - 0; Tn = 2Tn_i + 1 при п > 0. Ее можно привести к частному случаю (2.6) путем деления обеих частей на 2П: То/2° = 0; Tn/2n = Tn_! /211-1 + 1 /2П при п > 0. Теперь можно положить Sn = Tn/2n и получить So = 0; Sn = Sn_T + 2_п при n > 0. Отсюда следует, что Sn = 112-4 k=1 Еще проще: 2x2 = 2-(4п+1 )(4п+3)
48 Суммы (Обратите внимание, что член для к = 0 в сумму не включен.) Сумма геометрической прогрессии 2-1 + 2-2 -\ (- 2-тг = (\)1 + (^)2Н t-(^)n будет выведена несколько позже в этой главе — она равна 1 — [\)Ti. Следовательно, Тп = 2nSn = 2П — 1. Здесь мы преобразовали 1П в bn, заметив, что исходное рекуррентное соотношение можно разделить на 2П. Этот трюк — частный случай общего метода, с помощью которого можно почти любую рекуррентность вида О-пТп = bnTn_i + сг (2-9) привести к сумме. Идея состоит в том, что обе стороны умножаются на суммирующий множитель sn: StlC-tl 'п = 5ПЬП1П_1 ~г SnCn . Этот множитель sn выбирается так, чтобы сделать Snbn = Sn-iun-T . Далее, если записать Sn = snanTn, то можно получить рекуррентное соотношение ^п ~ ^п—1 ~г SnCn . Следовательно, Sn = s0aoTo + ^sicCk = S!biT0 + ^ skck) k=1 k=1 и решение исходного рекуррентного соотношения (2.9) представляет собой Тп = ( sib!Т0 + У" skck) (2.10) (sibiTo + sici)/siai = Например, при n = 1 мы получаем Ti (biTo + cO/аь Но достаточно ли мы хитроумны, чтобы найти верное sn? Запросто: можно развернуть отношение sn = sn_i an_i /bn и выяснить, что подходящим суммирующим множителем является дробь Sn = Qn-iQn-2-..ai bnbn-i ...b2 (2.11) которая для удобства может быть умножена на любую константу. Например, у рекуррентности в задаче о Ханойской башне (Так как si сокращается, оно может быть любым, лишь бы не нулем.)
2.2 Суммы и рекуррентности 49 Быстрая сортировка изобретена в 1962 году Хоаром (Ноаге) [189]. ап = 1 и Ъп = 2; только что разработанный обыщи метод гласит, что sn = 2~п— подходящий множитель, если мы хотим свести рекуррентность к сумме. Чтобы его обнаружить, не требуется особого прозрения. Как обычно, нужна определенная осторожность, чтобы не разделить что-нибудь на нуль. Метод суммирующего множителя работает в том случае, когда все а и все Ъ— ненулевые. Применим эти идеи к рекуррентному соотношению, возникающему при изучении "быстрой сортировки" — одного из наиболее важных методов сортировки данных в компьютере. Среднее количество сравнений в типичной реализации быстрой сортировки при ее применении к п элементам в случайном порядке удовлетворяет рекуррентному соотношению Со = Ci 0; TL-1 сг = тг + 1 Н— 5~ С к при п > 1. тг z— (2.12) k=0 Да, это соотношение выглядит куда страшнее всех встречавшихся нам до сих пор рекуррентностеи; мало того что оно включает сумму всех предыдущих значений, так эта сумма еще и делится на п. Малые случаи дают некоторые данные (С2 = 3, Сз = 6, С4 = -у), которые не могут вселить в нас чувство уверенности. Однако можно попробовать понемногу снижать сложность (2.12), сначала избавившись от деления, а затем и от знака ]Г. Идея заключается в умножении обеих частей выражения на п и получении соотношения п-1 пСп = п2 + п + 2 ^ Ск при п > 1; к=0 если заменить п на п — 1, можно получить тг-2 (n-1)Cn-i - (тг-1)2 + (тг-1)+2^Ск к=0 при тг — 1 > 1. Теперь мы можем вычесть это уравнение из первого, и знак ^ исчезнет: пСп — (тг— 1)Cn_i = 2n + 2Cn_i при тг > 2. Таким образом, исходное рекуррентное соотношение для Сп сводится к гораздо более простому: Со = С] = 0; Сг = 3; nCn = (n+1)Cn_i +2тг при тг > 2.
50 Суммы Явный прогресс! Теперь можно применить суммирующий множитель, поскольку данное рекуррентное соотношение имеет вид (2.9) с an = n, Ъп = п + 1 и cn = 2n-2[n = 1]+2[n = 2]. Изложенный выше общий метод говорит о том, что надо умножить все рекуррентное соотношение на некоторое значение, кратное •1 2 a^-Tdn-i. си bnbn-i ...Ьг (n-1)-(n-2)- (n+l)-n-.. (п+1)тГ В соответствии с (2.10) решение имеет вид Сп = 2(п+1)? 1 k=1 k+1 f(n+1] при n > 1. Сумма в этом выражении очень похожа на величину, которая часто появляется в разных приложениях. Она возникает так часто, что мы дадим ей специальное название и введем для нее специальное обозначение: Нг ,+i+. ¦ + ¦ 1 п k=1 К (2.13) Буква Н происходит от слова "harmonic" так что Нп — это гармоническое число, названное так в связи с тем, что k-я гармоника, извлекаемая из скрипичной струны, представляет собой основной тон, производимый струной, в к раз короче исходной (с длиной, равной 1/к от длины исходной струны). Наше исследование рекуррентности быстрой сортировки (2.12) можно завершить получением аналитической записи для Сп. Это возможно, если считать таковой выражение Сп через Нп. Сумма в формуле для Сп такова: Iro= L 1 k=,k+1 i4fenk+r Она легко связывается с Нп путем изменения к на к — 1 и пересмотра граничных условий: 1 к+1 -li-ll- l^k-l^n = Ll)- l^k^n 2^k^n+1 I 1 1 +П+1 = Hn- n n+1 Мы начали с Y. в рекуррентности и долго избавлялись от нее. Затем при помощи суммирующего множителя мы получили новую Y_ t Так все же суммы— это хорошо или плохо?
2.2 Суммы и рекуррентности 51 И даже прилично. Отлично! Мы нашли значение суммы, что требовалось для завершения решения (2.12): среднее количество сравнений при быстрой сортировке п случайно расположенных элементов равно Cn = 2(п+1)Нг тП- при п > 1 . (2.14) Как обычно, проверим корректность малых случаев: С 2 = 3, С3=6. Не спутайте с незаконными валютными операциями. В других моих математических книгах эти законы определены по-другому. И почему бы не назвать закон пер- мутативным, а не коммутативным? 2.3 Преобразование сумм Ключ к успеху при работе с суммами— в умении заменить одну сумму другой, более простой или более близкой к конечной цели. Научиться этому легко, если усвоить несколько фундаментальных правил преобразования и поработать с ними на практике. Пусть К— некоторое конечное множество целых чисел. Суммы по элементам К могут быть преобразованы с использованием трех простых правил: У~ сак = с J" ак; (дистрибутивность) У" (ак + bic) = У" ак + У_ Ьк ; (ассоциативность) кек кек кек У ак кек р(Юек (коммутативность) (2-15) (2.16) (2-17) Дистрибутивность позволяет вносить константы под знак суммы и выносить их из него. Ассоциативность позволяет разбивать сумму на две или объединять две суммы в одну. Коммутативность позволяет переупорядочивать члены в любом удобном нам порядке; здесь р(к)— произвольная перестановка множества всех целых чисел. Так, если К = {—1,0, +1} и если р(к) = —к, то три указанные правила гласят, что ca_i + са0 + cai = c(a_i + а0 + ai); (а_т + Ъ-т) + (а0 + bo) + (сц + Ъ}) = (a_i + а0 + ai) + (b_i -{-Ъo+Ъ^] a_i + а0 + ат = ai + а0 + а_т . (дистрибутивность) (ассоциативность) (коммутативность) Трюк Гаусса из главы 1 можно рассматривать как применение трех указанных фундаментальных законов. Предположим, что мы хотим вычислить сумму обобщенной арифметической
52 Суммы прогрессии, S = ?_ (а + Ък). О^к^п Коммутативность позволяет нам заменить к на п — к и получить S = ]Г (a + b(n-k)) = ^Г (a + bn-bk). О^тг-k^n O^k^n Ассоциативность позволяет сложить эти два уравнения: 2S = YL ((a+ bk) +(a + bn-bk)) = ]Г (2a + bn). О^к^п О^к^п Применение дистрибутивности дает нам тривиальную, легко вычисляемую сумму: 2S (2a + bn) ]Г 1 = (2a + bn)(n+1] O^k^n Разделив на 2, мы доказали, что п ^(a + bk) = (a+lbn)(n + 1), (2.18) k=0 Правую часть можно запомнить как среднее первого и последнего членов, а именно \ (а + (а + Ьтг)), умноженное на количество членов (п + 1). Важно не забывать, что функция р(к) в обобщенном коммутативном законе (2.17) представляет собой перестановку всех целых чисел. Иными словами, для каждого целого п должно быть ровно одно целое к, такое, что р(к) = п. В противном случае коммутативный закон может не выполняться, как наглядно иллюстрируется в упражнении 3. Преобразования наподобие p(k) = к + с или р(к) = с — к, где с— целочисленная константа, всегда являются перестановками, так что они всегда работоспособны. С другой стороны, мы можем несколько ослабить ограничения на перестановку: достаточно потребовать, чтобы существовало ровно одно целое число к, такое, что р(к) = п, когда п — элемент индексного множества К. Если п ? К (т.е. если п не принадлежит К), то не имеет значения, сколько раз р(к) = п, так как такие к не принимают участия в суммировании. Так, например, Это что-то вроде изменения переменных в интеграле, но попроще. "Чему равно один плюс один плюс один плюс один плюс один плюс один плюс один плюс один плюс один плюс один?" "Не знаю, — сказала Алиса. — Я сбилась со счета" "Она не умеет складывать!" —Льюис Кэрролл (Lewis Carroll) [50]
2.3 Преобразование сумм 53 можно утверждать, что X ак = Y_ ап = X а2к = X а2к> (2'19) к<ЕК ПЕК 2кЕК 2кеК к четное тг четное 2к четное поскольку имеется ровно одно к, такое, что 2к = п, когда п Е К и п четное. Запись Айверсона, которая позволяет нам получать значения 0 или 1 для логических утверждений в формуле, может ис- Не вместо? пользоваться вместе с дистрибутивным, ассоциативным и коммутативным законами для вывода дополнительных свойств сумм. Например, вот важное правило для объединения различных множеств индексов: если К и К' являются некоторыми множествами целых чисел, то X dk + XQk = X Qk + X Qk • (2,2°) кек кек' кекпк' кекик' Это следует из общих формул Хак = ?>к[кеК] kGK к И [кеК] + [к<ЕК'] = [кеКПК'] + [кеКиК']. (2.22) Обычно правило (2.20) используется либо для объединения двух почти не пересекающихся множеств индексов, как в случае m п п ак + X Qk = Qm + X Qk ^Р* "¦ ^ m ^ п> k=l k=m k=1 либо для отделения одного члена суммы, как в случае X ак = а0 + X Qk при п ^ О- (2-23) O^k^n l^k^n Эта операция отделения члена представляет собой основу метода перестановок, который часто позволяет нам вычислять суммы в аналитическом виде. Идея заключается в том, чтобы начать с неизвестной суммы, подлежащей вычислению, и обозначить ее как Sn: Sn = X Qk* 0<Ck^n (2.21) L (Здесь поменялись местами части (2.20).) Именуй и властвуй.
54 Суммы Затем мы переписываем Sn+i двумя способами, выделяя последний и первый члены: Sn 4- an+1 = Y_ ак = а0 + ^Г ак = 0^к^п+1 1^к^п+1 ? ао + 2_ Qk+1 (2.24) O^k^n Теперь можно поработать с этой последней суммой и попытаться выразить ее через Sn. Если мы сумеем это сделать, то получим уравнение, решением которого будет искомая сумма. Воспользуемся этим подходом для вычисления суммы обобщенной геометрической прогрессии Sn = Y- ах O^k^n Общая схема из (2.24) гласит, что Sn + axn+1 = ax°+ ^ ax k+l O^k^n а сумма в правой части равна х Ho<k<n axk = х^п в соответствии с дистрибутивным законом. Таким образом, Sn+ax™4"1 = a+xSn, и мы можем решить это уравнение относительно Sn и получить ?axk = a— ax n+1 k=0 1 при хф\. (2-25) (Очевидно, что при х = 1 сумма просто равна (n+ 1)а.) Правую часть этой формулы можно запомнить как разность первого члена суммы и первого члена, не входящего в сумму (члена, следующего за последним членом суммы), разделенную на разность 1 и знаменателя прогрессии. Для настоящих мужчин это слишком просто. Давайте применим данный метод для вычисления несколько более сложной суммы, а именно sn = j_ k2k- Для геометрической прогрессии и доказательство должно быть геометрическим. (( 1 Эту формулу вдолбили в меня еще в школе. O^k^n
2.3 Преобразование сумм 55 В этом случае So = 0, Si = 2, S2 = 10, S3 = 34, S4 = 98; какова же общая формула? Согласно (2.24) получим Sn + (u+1)2n+1 = ^ (k+1)2k+1; O^k^n и теперь нам надо выразить сумму в правой части через Sn. Ассоциативность позволяет разбить ее на две части Y_ k2k+1 + J_ 2k+\ и первая из полученных сумм представляет собой ни что иное, как 2Sn. Вторая сумма— сумма геометрической прогрессии, которая согласно (2.25) равна (2 —2п+2)/(1 — 2) = 2П+2 —2. Таким образом, Sn + (n + 1 )2n+1 = 2Sn + 2n+2 — 2, и после применения алгебраических преобразований мы получаем Y_ Ь2к = (n-1)2n+1 +2. O^k^n Теперь понятно, почему S3 = 34: это 32 + 2, а не 2-17. Аналогичные рассуждения с х вместо 2 привели бы нас к уравнению Sn + (п + 1 )xn+1 = xSn + (х — хп+2)/(1 — х); следовательно, мы можем заключить, что V-i k x-(n+1)xn+1 +uxn+2 ,л , . ) КХ = — г~ ПрИХ^Т. (2.26) L— (I — X z к=0 v ; Интересно, что эту же формулу можно легко вывести совершенно иным способом, при помощи элементарных методов дифференциального исчисления. Если начать с уравнения ^-Х ~ 1-х к=0 и взять производную от обеих частей по х, то можно получить ?кх = п^Р к=0 v ; _ 1 - (n+1)xn+nxn+1 поскольку производная суммы равна сумме производных слагаемых. В последующих главах мы встретимся с множеством связей между континуальной и дискретной математикой.
56 Суммы 2.4 Кратные суммы Члены суммы могут иметь не один, а два и более индексов. Например, вот как выглядит двойная сумма из девяти членов, управляемая индексами j и к: a^Ь^ +aib2 + сиЪз+ + a2bi + агЬг + а2Ъз+ + азЪ] + азЬ2 + азЬз . Для таких сумм используются те же обозначения и методы, что и для сумм с одним индексом. Так, если P(j,k) представляет собой некоторый предикат от j и к, то сумма всех членов а^к, таких, что значение P(j,k) истинно, может быть записана двумя способами. Один из них использует запись Айверсона и суммирование по всем парам целых чисел j и к: Р(ьЮ ЬТс Несмотря на наличие более одного индекса, нам достаточно только одного знака ?1» который означает суммирование по всем допустимым комбинациям индексов. Иногда используются и два знака ]Г, когда мы говорим о сумме сумм. Например, выражение ?2>,к[р(>,к)] Девятеро двоих не ждут?.. Обратите внимание, что 1 ^ j,k ^ 3 не означает суммирование по всем j ^ 1 и всем к?3. является ни чем иным, как сокращенной записью суммы ?(Х>,,,с[Р0,1О] которая, в свою очередь, представляет собой сумму по всем целым j членов 21 k aj>k [P(j> k)] • Эти члены являются суммами по Кратные Е вывеем целым к всех членов а^к, для которых предикат P(j,k) истинен. В таких случаях говорят, что двойная сумма "сначала суммируется по к" Сумму, которая зависит более чем от одного индекса, можно начинать суммировать с любого из ее индексов. С этим связаны важное правило, именуемое изменением порядка суммирования, и обобщающее правило ассоциативности (2.16), с которым мы познакомились ранее: ?Х>,к[ро>10] = YLа^ = ЦИаь4ро>ю]. (2.27) j Ь P(j,k) k j числяются справа налево (изнутри наружу).
2.4 Кратные суммы 57 Никто и не боится. Я думаю, это правило по сравнению с некоторыми вещами из главы 1 — сама простота и очевидность. Здесь средний член представляет собой сумму по двум индексам. Слева Y-\Y-\l означает суммирование сначала по к, а затем по j. Справа ^к Y^\ означает суммирование сначала по j, а затем по к. На практике при вычислении двойной суммы в аналитическом виде обычно суммирование по одному индексу выполняется проще, чем по другому, так что мы можем выбирать, какой из них для нас более удобен. Суммы сумм— это еще не самое страшное в математике, но начинающему они могут показаться настоящим лабиринтом, так что добавим в качестве путеводной нити еще пару примеров. Сумма из девяти членов, с которой мы встретились в начале раздела,— хорошая иллюстрация преобразования двойных сумм, поскольку она может быть упрощена, и этот процесс упрощения типичен для того, что можно делать с двойными суммами: Y_ ajbic = ^ajbk[l ^j,k^3] = l^j,k^3 j,k = ^ajbk[-U;K3ni<:k<C3] = = ^?>эЪк[1<С;)<СЗПКк^З] = j к j ^ к ' В первой строке записана сумма девяти членов без какого-либо конкретного упорядочения. Во второй строке они сгруппированы в тройки (aibi +aib2 + aib3) + (a2bi + а2Ь2 + а.2Ьз) + (а-зЬ1 + азЬ2 + азЬз). В третьей строке для вынесения за скобки всех а- членов использована дистрибутивность суммирования, так как <ij и [1 ^ j ^3] не зависят от к; это дает нам си (bi ¦+¦ Ьг + Ьз) + &2 (Ь1 + Ь2 + Ьз) + аз (Ъ1 + Ьг + Ьз). Четвертая строка аналогична третьей, но в ней имеется лишняя пара скобок, которые требуются для того, чтобы пятая строка не казалась такой загадочной. В ней выносится множитель (bi + b2 + Ьз), который встречается для каждого значения j: (ai + CL2 + аз) (b i + Ьг + Ьз). А последняя строка представляет собой всего лишь иной способ записи пред-
58 Суммы последней строки. Этот метод вывода может использоваться для доказательства обобщенного дистрибутивного закона Y_ ajbk = ( ?_ аЛ ( Y_ bk ) , (2.28) jej ^ jej ' ^кек ' kGK справедливого для любых множеств индексов J и К. У фундаментального закона изменения порядка суммирования (2.27) имеется ряд вариаций, которые возникают, когда мы хотим ограничить диапазоны значений индексов, а не выполнять суммирование по всем целым j и к. Эти вариации вызывают две ассоциации— ванили и булыжной мостовой. Начнем с ванили: XLa^ = X. аь* = ZZ^' (2-2э) jej кек jej кек jej кбК Это всего лишь иной способ записи (2.27), связанный с тем, что "айверсониан" [j ? J, k ? К] можно разложить на множители: [j ? J][k? К]. "Ванильное правило" применимо в тех случаях, когда диапазоны j и к не зависят друг от друга. Булыжник не столь гладкий. Эта формула применима тогда, когда диапазон значений индекса внутренней суммы зависит от индексной переменной внешней суммы: ?_ Ц аьк = I I аьк- (2-3°) jej kGK(j) кек' jej'(k) Здесь множества }, K(j), К' и J'(k) должны быть связаны так, чтобы [j€j][k€K(j)] = [keK'][jGj'(k)]. Подобное разложение, в принципе, всегда возможно: можно положить, что J = К'— множество всех целых чисел, а K(j) = J'(k)— множества, соответствующие предикату P(j,k), управляющему двойной суммой. Однако имеются важные частные случаи, когда множества }, K(j), К' и J'(к) приобретают простой вид. Такие случаи— не редкость в приложениях. Например, вот весьма полезное разложение: [KKnKKk^n] = [ККк^п] = = па^пш^а]. (2.31)
2.4 Кратные суммы 59 Это равенство с использованием "айверсонианов" позволяет нам записать следующее: п к j=1 k=j l^j^k^n к=1 j = 1 (2.32) Самое время не- много разогреться упражнениями 5 и 6. (Или забраться в поисках горячительного в бар.) Одна из приведенных сумм обычно вычисляется проще другой, так что можно воспользоваться (2.32) для того, чтобы переключиться со сложной суммы на простую. Применим описанные идеи на практике. Рассмотрим массив си си си ai си аз 0-2СИ <l2Cl2 CI2CI3 аз си аза2 аз аз апат апа2 апа3 ата^ а2атп аза^ ananJ ют подогнанными? из п2 произведений ajaic. Наша цель заключается в поиске простой формулы для S^q = Yi. aiak) l^j^k^n суммы всех элементов на и выше главной диагонали данного массива. Поскольку aja^ = a^aj, массив симметричен относительно главной диагонали; поэтому S^ будет равен примерно половине Неужто булыжни- суммы всех элементов (за исключением подгоночного множите- ки на дороге быва- ля ддЯ уЧета главной диагонали). Эти соображения наводят на мысль о следующих преобразованиях: S\j = 2_ ajak = 2L ak<1i = X. ajak = S^> l^j^k^n l^k^j^n l^k^j^n поскольку (j,k) можно переобозначить как (kj). Кроме того, поскольку мы получаем 2S^| = S^j + S^ = 2__ a) ak + 2_ aJQk * 1^j,k^n 1^j=k^n Первая сумма в соответствии с обобщенным дистрибутивным законом (2.28) равна (LLi aj)(??=1 ak) = (Lk=i ak) , а вто-
2 60 Суммы рая— Hk=i ак- Поэтому Kja^n W=i ' k=i / Это сумма элементов верхнетреугольной матрицы, выраженная через более простые однократные суммы. Воодушевившись таким успехом, рассмотрим другую двойную сумму: S = 21 (ak-CLjHbic-bj). 1^j<k^n И вновь мы имеем симметрию при перестановке j и к: S = Y_ (cij-ak)(bj-bk) = Y- (ak-cijMbk-bj). l^k<j^n 1^k<j^n Так что, воспользовавшись равенством [Kj<k^n] + [1^k<Kn] - [l<j,k^n]-[1^j=k^n], сумму S можно прибавить к самой себе и получить 2S = Y_ (cij-aicKbj-bic) - Y_ (a; -ak)(bj -bk). l^j,k^n 1^j=k^n Вторая сумма равна нулю. А первая? Она распадается на четыре отдельные "ванильные" суммы: 22 ajbj- y_ ajb^- X акЬз+ X akbk = 1^j,k^n 1^j,k^n 1^j,k^n 1^j,k^n = 2 2Z. akbk-2 ^ aJbk = 1^j,k^n l^j,k^n = 2n 22 akbk - 2(Xak)(Xbk На последнем шаге обе суммы были упрощены в соответствии с обобщенным дистрибутивным законом (2.28). Если преобразование первой суммы кажется загадкой, повторим его в замедленной съемке: 2 22 a^b^ = 2 X X Qkbk = = 2Y_ akbk Ц 1 = = 2 22 akbkn = 2n 22 a^bk. I^k^n l^k^n
2.4 Кратные суммы 61 Индексная переменная, отсутствующая в общем члене (в данном случае это j), может быть легко удалена путем умножения того, что осталось, на размер множества значений этой переменной (в нашем случае — на п). Вернемся к тому месту, где мы остановились. Теперь мы можем разделить все на 2 и, выполнив перестановку, получить интересную формулу: (Чебышев [58] в действительности доказал аналогичный результат не для сумм, а лля интегралов: (J^f(x)dx)x x(J*g(x)dxK ^ (b-a)x x(J^f(x)g(x)dx), если f (х) и g(x) — монотонные неубывающие функции.) к=1 2>)(5>) = к=1 = u^akbk- ^Г (aic-djHbic-bj). (2.34) 1^j<k^n k=1 Это равенство в качестве частных случаев дает неравенства Чебышев а: если Cli ^ • • • ^ О-тг Чс=1 ' Ч:=1 ' к=1 и Ьт ^ ••• < br к=1 к=1 ^Iak)(X.bk) ^ ri^akbk, если ai ^ ••• ^ an nbi ^ ... ^bn. к=1 (В общем случае, если си ^ • • • ^ an и если р — перестановка множества {1,... ,71}, нетрудно доказать, что наибольшее значение ^k=1 akbp(k) достигается при bp(i) ^ • • • ^ Ьр(п), а наименьшее значение— при bp(i) ^ • • • ^ bp(n).) Многократное суммирование имеет интересную связь с обобщенной операцией замены индекса суммирования в однократных суммах. Нам известно, что в силу коммутативности Y_ ak - ]Г ap(k), IcGK p(k)<EK если p(k) представляет собой произвольную перестановку целых чисел. Но что будет, если заменить к на f (j), где f— произвольная функция f: J -» К, которая преобразует целое число j Е J в целое число f(j) Е К?
62 Суммы Общая формула замены индекса имеет вид (2-35) kGK где #f (k) обозначает количество элементов множества f~M = {j|f(j) = ь}> т.е. количество значений j Е J, таких, что f(j) равно к. Формулу (2.35) легко доказать путем изменения порядка суммирования: Haf(D ]Г aic[f(])=k] = ^ak^l[f(j)=lc], kGK JGJ k?K поскольку Hjej [f(j) =k] — #"f (k). В частном случае, когда f представляет собой взаимно однозначное соответствие между J и К, имеем #f~~(k) = 1 при всех к, и общая формула (2.35) сводится к ХаПЛ = Ц аШ) = Цак. j€j f(j)eK кек Это коммутативный закон (2.17), с которым мы уже встречались ранее, но в несколько замаскированном виде. Пока что наши примеры кратных сумм включали обобщенные члены наподобие а^ или Ь^. Но поскольку в названии книги есть слово "конкретная" давайте рассмотрим кратную сумму с реальными числами: Один мой преподаватель математики именовал это "биекцией"; возможно, в один прекрасный день я все же сумею полюбить это слово... Sn = X 1 1^j<k^n k-j В частности, Si = 0; Sz = 1; S3 = jzj + jry + 337 ~ f • Обычный способ вычисления двойной суммы состоит в суммировании сначала по ) или по к, так что рассмотрим оба варианта. Подумать только: эти авторы считают, что j, к и п — "реальные числа" 1 = ? ? к~=Г l^k^n 1^j<k } - L L \- l^k^n 1^k-j<k l^k^n 0<j^k-1 , ) 1 (суммируем no j) (заменяем ) на к — j) (упрощаем границы для j)
2.4 Кратные суммы 63 = 2_ Ик-1 = (по определению Hk_i (2.13)) l^k^n = 2~ Hie = (заменяем к на к + 1) = 2_ ^к • (упрощаем границы для к) 0^к<п Увы! Мы не знаем, как вычислить сумму гармонических чисел Займемся самоби- в аналитическом виде. чеванием? Если попробовать подойти с другой стороны, получим 1 / } -—г = (суммируем по к) (заменяем к на к + j) i^j = L = z = E - L 0^j<n 0<k^n- Hn_j = H, = H,. 1 к 1 к (упрощаем границы для к) (по определению Hn_j (2.13)) (заменяем j на тг — j) (упрощаем границы для j) И мы опять в том же тупике... Но есть и иной путь, на котором мы заменяем к на к + j до приведения Sn к сумме сумм: Sn = 2_ Z—" = (переписываем исходную сумму) = 2~_ - = (заменяем к на к + j) 1^j<k+j^n = У" У~ v = (суммируем сначала по j) к l^k^n 1^j^n-k = Y~ —Г— = (сумма по j тривиальна) к l^k^n = У~ — — У" 1 = (в силу ассоциативности) к = nl Y_ Z ) ~n = (наА° же!) к l^k^n = nHn — п. (по определению Hn (2.13))
64 Суммы Ура! Мы нашли S^. А комбинируя наши фальшстарты с найденным решением, мы в качестве приза находим сумму гармонических чисел: Л Н* = ПНГ П. (2-36) 0^k<n Понять использованный здесь трюк можно двумя путями — алгебраически и геометрически. (1) Алгебраически, если имеется двойная сумма, члены которой включают k+f(j), где f— произвольная функция, этот пример показывает, что неплохо попробовать заменить к на к — f(j) и просуммировать по j. (2) Геометрически можно рассматривать конкретную сумму Sn в следующем виде (рассмотрен случай п = 4): 1с=1 к = 2 к = 3 к = 4 + + + Наши первые попытки суммирования сначала по j (по столбцам) или по к (по строкам) давали нам Hi 4- Н2 + Н3 = Н3 + Н2 + Hi. Выигрышная идея, по сути, заключалась в суммировании по диагоналям, что дало у + | + j. Здесь разумно использовать к ^ тг вместо к ^ тг — 1. Простые границы экономят силы. 2.5 Общие методы Давайте закрепим изученное, рассмотрев один и тот же пример под разными углами. На следующих страницах мы попытаемся найти аналитический вид суммы первых п квадратов, которую будем обозначать как Пп: ?тг - ^ при тг ^ 0. (2-37) О^к^тг Мы увидим, что имеется как минимум восемь разных способов решения этой задачи, и в ходе анализа различных тактических решений мы изучим стратегии успешного наступления на суммы в общем случае. Сначала, как обычно, рассмотрим малые случаи: U п2 ?п 0 1 2 0 1 4 0 1 5 3 4 9 16 14 30 5 6 25 36 55 91 7 49 140 8 64 204 9 81 285 10 11 100 121 385 506 12 144 650
2.5 Общие методы 65 Никакого очевидного аналитического вида для Пп не наблюдается; но если нам удастся его найти, то эти значения могут послужить для проверки. Метод 0: поиск в справочнике Задача наподобие суммы первых п квадратов наверняка уже кем-то решена, так что, скорее всего, ее решение можно найти в каком-нибудь математическом справочнике*. И в самом деле, на странице 36 Стандартных математических таблиц CRC (CRC Standard Mathematical Tables) [28] имеется искомый ответ: ?п = n(n+1)(2n+1] при п ^ 0. (2-38) Более сложные суммы можно найти в таблицах Хансена (Hansen) [178]. Просто чтобы убедиться, что мы корректно прочли формулу в справочнике и в ней нет опечатки, убедимся, что она совершенно верно дает Ds = 5 • 6 • 11/6 = 55. Кстати, на той же странице 36 Таблиц CRC имеется информация о суммах кубов, четвертых, ..., десятых степеней. Очень мощным справочником по математическим формулам является Справочник по специальным функциям (Handbook of Mathematical Functions) под редакцией Абрамовица (Abramowitz) и Стиган (Stegun) [2]. На стр. 813-814 этой книги перечислены значения Пп для n ^ 100; а на стр. 804 и 809 приведена формула, эквивалентная (2.38), вместе с аналогичными формулами для сумм кубов, четвертых, ..., пятнадцатых степеней (как для обычных, так и для знакочередующихся сумм). Но наилучшим источником ответов на вопросы о последовательностях является небольшая книга Справочник по целочисленным последовательностям (Handbook of Integer Sequences) Слоана (Sloane) [330], в которой перечислены тысячи последовательностей в соответствии с их числовыми значениями. Если вы сталкиваетесь с некоторой рекуррентностью, которую есть основание считать изученной, все, что нужно сделать,— это вычислить количество членов последовательности, достаточное для распознавания ее среди прочих; после этого у вас появятся шансы обнаружить эту последовательность и ссылки на соответствующую литературу в Справочнике Слоана. Например, последовательность 1, 5, 14, 30, ... имеет у Слоана номер 1574 и названа последовательностью "квадратно пирамидальных чисел" * См., например, формулу 8 на стр. 597 в А.П.Прудников, Ю.А.Брычков, О.И.Маричев. Интегралы и ряды.— М.: Наука.— 1981. — Примеч. пер.
66 Суммы ("square pyramidal numbers"), поскольку в пирамиде с квадратным основанием из п шаров имеется Пп шаров. Слоан приводит три ссылки, одной из которых является ранее упомянутый справочник Абрамовича и Стиган. Еще один способ приобщиться к мировой математической мудрости заключается в том, чтобы использовать компьютерную программу (типа Axiom, MACSYMA, Maple или Mathematica), предоставляющую инструментарий для символьных преобразований. Такие программы в особенности необходимы людям, работающим с большими формулами. Знакомство со стандартными источниками информации крайне желательно, поскольку они могут оказаться исключительно полезными. Но все же Метод 0 не согласуется с духом данной книги, поскольку мы хотим получать ответы самостоятельно. Метод поиска готового решения ограничивается задачами, которые кому-то показались достойными внимания; интересующие нас задачи могут среди них отсутствовать. Метод 1: угадывание ответа с доказательством по индукции Принесла ли нам ответ на хвосте сорока или к нему привело получасовое биение в бубен— от нас в любом случае требуется доказать его корректность. Можно, например, заметить, что значения Пп имеют относительно небольшие простые множители, так что можно было бы получить формулу (2.38) для небольших значений п. Можно также предложить эквивалентную формулу ?п = n(n+^)(n+1] Или как минимум задачами с теми же ответами, что и у задач, которые кому-то показались достойными внимания. при n ^ О, (2-39) которую несколько легче запомнить. Все говорит в пользу формулы (2.39)) но мы обязаны ее доказать так, чтобы в ней не оставалось никаких сомнений. Для этой цели и была изобретена математическая индукция. "Итак, Ваша Честь, мы знаем, что По = 0 = 0(0+^)(0 + 1)/3, так что с базой все просто. По индукции предположим, что п > О и что (2.39) выполняется, когда п заменяется на п— 1. Поскольку ? г Пп_1 + п2, имеем ЗПП = (n-1)(n-l)(n) + Зп2 = (u3-fn2 + ln) + Зп2 : = (п3 + §п2 + ^п) run- r)(n+i;
2.5 Общие методы 67 Следовательно, (2.39) и в самом деле выполняется при всех n J> 0" Судья в своей бесконечной мудрости благосклонно согласился с доводами адвоката. Индукция здесь уместна и несколько более логична, чем поиск ответа. Но все равно это не то, чего мы хотим. Со всеми прочими суммами в этой главе мы справлялись без привлечения индукции, — давайте попробуем точно так же "с нуля" справиться и с Dn. Нам ни к чему озарения, нам нужен метод, который не полагается на везение. Метод 2: приведение суммы Вернемся к методу приведения, который так хорошо сработал для геометрической прогрессии (2.25). Выделим первый и последний члены Dn+i для того, чтобы получить уравнение для Пп: ?п + (п+1)2 = X. (к+1)2 = = Y. 0<2 + 2к+1) = = L к2+2 L к+ L 1 = О^к^п 0;<к^п О^к^тг = Пп + 2 ^~ к + (тг+1)- О^к^тг Ой!.. Значения Пп сокращаются... Что ж, бывает и так, что несмотря на все усилия метод приведения приводит к чему-то Ничья?.. :) в духе Пп = Dn> и в результате мы ничего не добиваемся. С другой стороны, мы не зря тратили время и бумагу: мы нашли сумму первых п целых чисел в аналитическом виде 2 Yi 1с = (п + 1)2-(п + 1), O^k^n хотя на самом деле собирались найти сумму их квадратов. Логично предположить, что в поисках суммы кубов целых чисел, которые можно обозначить как I®п, мы получим выражение для суммы квадратов. Попробуем? ^n + (n+1)3 = Y_ (k+1)3 = O^k^n = ?L (k3+3k2 + 3k+1) = O^k^n = Шп + ЗПП + 3K ) + (n+1).
68 Суммы Все в порядке: |5РП сокращаются, и мы получаем достаточно информации для определения Пп безо всякой индукции: Метод 2': приведение в смя- ЗПП = (n+1)3-3(u+1)n/2-(u+1) = теше- = (n+1Hu2+2u+1-fu-1) = (n+1)(n+l)u. Метод 3: построение набора Для суммирования квадратов достаточно немного обобщить рекуррентное соотношение (2.7). Решение рекуррентности Ro = ОС] Rn = Rn_i + (5 + yn + 6nz при n> О 2 л (2-4о) будет иметь общий вид Rn = A(n)a + B(n)(3 + C(n)y + D(n)6; (2.41) и мы уже определили А(тг), В(тг) и С(тг), поскольку (2.40)— это то же самое, что и (2.7) при 6 = 0. Если теперь подставить Rn = тг3, то выясняется, что тг3 является решением при a = 0, (3 = 1,у = -3и6 = 3. Следовательно, 3D(n)-3C(n) + B(n) = тг3; это уравнение определяет D(n). Нас интересует сумма Dn, равная Dn_i 4-тг2; если положить в (2.41) ос = (3 =у = 0и6 = 1,то мы получим Пп = Rn- Следовательно, Пп = D(n). Нам не нужны алгебраические преобразования для вычисления D(n) из В(п) и С(тг), поскольку мы уже знаем, каким будет ответ; самым твердолобым надо самостоятельно выполнить следующие действия: 3D(n) = n3+3C(n)-B(n) = n3 + 3 ^n"t^n - n = = тг(тг+^)(тг+1). Метод 4: замена сумм интегралами Воспитанные на континуальной, а не дискретной математике обычно лучше знакомы с интегралами, чем с суммами, так что для них совершенно естественно заменить ^ на J- Одна из целей этой книги заключается в том, чтобы сделать YL настолько простой в обращении, чтобы J казался более сложным, чем J1 (как минимум при точных вычислениях). Тем не менее проследить отношения между YL и J— неплохая идея, поскольку суммирование и интегрирование основаны на очень схожих идеях.
2.5 Общие методы 69 В математическом анализе интеграл может рассматриваться как площадь под некоторой кривой, и вычислить эту площадь можно приближенно путем сложения площадей узких прямоугольников, касающихся этой кривой. Если набор узких прямоугольников задан, можно пойти другим путем: поскольку Пп представляет собой сумму площадей прямоугольников размера- ми 1 х 1, 1 х 4, ..., 1 х п2, она приближенно равна площади под кривой f (х) = х2 в интервале от 0 до п. Здесь масштаб по горизонтали в десять раз превышает масштаб по вертикали. 1 2 3 п Площадь под кривой равна J0 х2 dx = п3/3; следовательно, значение Пп приближенно равно ^п3. Воспользоваться этим фактом можно для оценки ошибки приближения Еп = Пп — ^п3. Поскольку Пп удовлетворяет рекуррентному соотношению Пп = Пп_1 +п2, мы находим, что Еп удовлетворяет более простому рекуррентному соотношению Еп = Пп--п3 = Пп-! +п2--п3 = En_1+l(u-1)3+n2 W Еп_-| +п- Другой способ применения интегрального подхода состоит в поиске формулы для Еп путем суммирования площадей клиновидных фигур, составляющих погрешность. Имеем Для тех, кто склонен к математическому анализу. ?г х2 dx = Y_ (k k=i x2 dx k-1 L* k3-(k-1I ) = !>-*) / V —1 k=1 x 7 k=l В любом случае находим сначала Еп, а затем— Пп.
70 Суммы Метод 5: усложнение и упрощение Еще один способ поиска аналитической записи для Пп заключается в замене исходной суммы кажущейся более сложной двойной суммой, которая при правильном подходе может быть упрощена: ?г = Е l^k^ri = Z = L к2 = Е к = m- к = а j + D = = 1 Y_ (n(n + l)+i-j2) = = ln2(n+1) + ln(n+1)-lDn = = ln(n+l)(n+1)-lnn. Ha первый взгляд, переход от одинарной суммы к двойной может показаться шагом назад, но на самом деле это шаг вперед, поскольку он приводит нас к сумме, с которой легче работать. Нельзя ожидать, что любая задача решается только постоянным упрощением: это так же наивно, как считать, что достичь горной вершины можно, только постоянно поднимаясь. Метод 6: использование конечных разностей Метод 7: использование производящих функций Готовьтесь к встрече с еще более интересными способами вычисления Пп — XLk=o ^2' которые будут изучаться в следующем разделе и последующих главах. Последний шаг несколько напоминает последний шаг в методе приведения, так как мы получаем уравнение с неизвестной величиной с обеих сторон. 2.6 Исчисление конечного и бесконечного Мы изучили ряд способов непосредственной работы с суммами. Теперь настало время расширить кругозор, взглянув на проблему суммирования на более высоком уровне. Математики разработали исчисление "конечных разностей" аналогичное более традиционному исчислению бесконечно малых, которое позволяет работать с суммированием более аккуратно и методично. Исчисление бесконечно малых основано на свойствах оператора дифференцирования D, определяемого как Df(x) = lim f(x + h)-f(x)
2.6 Исчисление конечного и бесконечного 71 Исчисление конечных разностей основано на свойствах разностного оператора А, определяемого как Af(x) = f(x+1)-f(x). (2.42) Это— конечный аналог производной, в котором мы ограничиваемся положительными целыми значениями К. Таким образом, К = 1 — ближайшее к нулю значение, которое можно получить "в пределе" при К —> 0, a Af(x) представляет собой значение (f (х + К) - f (х))/Н при К = 1. Символы D и А называются операторами, поскольку они при работе с функциями дают нам новые функции; это функции от функций, производящие функции. Если f— достаточно гладкая функция, отображающая действительные числа на действительные числа, то Df также является функцией, отображающей действительные числа на действительные числа. И если f— любая действительная функция от действительного аргумента, то таковой же будет и функция Af. Значения функций Df и Af в точке х задаются приведенными выше определениями. Из курса дифференциального исчисления известно, как оператор D действует на степенные функции f(x) = xm. В таких случаях Df (х) = mxm_1. Неформально это можно записать, опуская f: D(xm) = mxm_1 . Было бы неплохо, если бы оператор А мог давать такой же элегантный результат; к сожалению, этого не происходит. Например, Д(х3) = (х+1)3-х3 = Зх2 +Зх+1. Математическая Но имеется разновидность "m-й степени" которая красиво степень? трансформируется оператором А, и это обстоятельство делает конечные разности таким интересным предметом. Подобные видоизмененные т-е степени определяются правилом TTL сомножителей , л ч х— = х(х — 1)... (х — m + 1), целое та ^ 0. (2.43) Обратите внимание на маленький символ подчеркивания под та; он указывает, что та сомножителей пошагово становятся все меньше и меньше. Имеется соответствующее обозначение и для возрастающих сомножителей: ТТЪ сомножителей _ / А s хт = х(х + 1)... (х + та— 1) > целое та ^ 0. (2-44)
72 Суммы При га = 0 получаем х- 1, поскольку произведение не существующих сомножителей по соглашению полагается равным 1 (точно так же, как сумма отсутствующих слагаемых считается равной 0). Если вам надо произнести вслух название величины х—, говорите "х в убывающей степени га"; аналогично хт звучит как "х в возрастающей степени га" Эти функции называются также убывающими факториалъными степенями и возрастающими факториалъными степенями, поскольку они тесно связаны с факториальной функцией п! = п(п — 1)... (1). И действительно, п! =п^ = "Г. В математической литературе встречаются и другие обозначения для факториальных степеней, в частности "символ Пох- гаммера" (х)т для хт или х—; для х— встречаются также записи наподобие ximJ или Х(т). Но лидирующие позиции все же постепенно завоевывает подчеркнуто-надчеркнутое обозначение, поскольку оно легко записывается, запоминается и не требует лишних скобок. Убывающие степени х— особенно хороши по отношению к Л: = (х+ 1)х... (х — га+ 2) — х... (x-m + 2)(x-m+1) = = гах(х— 1)... (х — га+ 2), Математическая терминология иногда кажется сущим бредом: на самом деле Пох- гаммер [293] использовал обозначение (х)тп ДЛЯ биномиального коэффициента Q), а не для факториальных степеней. так что исчисление конечных разностей располагает удобным в обращении правилом, соответствующим правилу D(xm) = mx m-1. А(х^ rax- m-1 (2.45) Это— фундаментальный факториальный факт. Оператор D в исчислении бесконечно малых имеет обратный, антидифференциальный (или интегральный), оператор J. Основная теорема дифференциального и интегрального исчислений связывает D с J: g(x) = Df(x) тогда и только тогда, когда g(x)dx = f(x) + C. Здесь J*g(x) dx— неопределенный интеграл g(x)— представляет собой класс функций, производные от которых равны д(х). Аналогично А также имеет обратный антиразностный (или сум-
2.6 Исчисление конечного и бесконечного 73 "Quemadmodum ad differentiam denotandam usi sumus signo A, ita summam indi- cabimus signo L. ... ex quo aequatio z = Ay, si inver- tatur, dabit quoque у = Iz + С'/ — Л. Эйлер (L. Euler) [110] мирующий) оператор ]Г» и здесь действует иная основная теорема: g(x) = Af(x) тогда и только тогда, когда ^ д(х) 6х = f (х) + С . (2-46) Здесь ]Г дМ 6х— неопределенная сумма д(х), класс функций, у которых разность равна д(х). (Заметим, что строчная 6 соотносится с прописной А так же, как строчная d соотносится с прописной D.) Буква "С" в неопределенных интегралах представляет собой произвольную константу; в случае неопределенных сумм "С"— произвольная функция р(х), такая, что р(х + 1) — р(х). Например, С может быть периодической функцией a + bsin27Tx; такие функции аннулируются при взятии разностей, так же как константы аннулируются при взятии производной. При целочисленных значениях х функция С представляет собой константу. Теперь мы почти готовы к кульминационному моменту. Исчисление бесконечно малых включает в себя определенные интегралы: если g(x) = Df (х), то g(x)dx = f(x] f(b)-f(a) Исчисление конечных разностей— во всем имитирующее своего более известного собрата—включает определенные суммы: если g(x) = Af(x), то У"Ъд(х)6х = f(x) *—a f(b)-f(a). (247) Эта формула поясняет смысл записи Ца д(х) 5х, так же, как предыдущая формула определяет Ja g(x) dx. Но что же на самом деле представляет собой Х1а9(х)^х? Мы определили ее по аналогии, но не по существу. Эта аналогия позволяет хорошо запомнить правила исчисления конечных разностей, но она будет совершенно бесполезна, если мы не сможем понять ее значение. Давайте попытаемся вывести ее смысл, рассматривая сначала некоторые частные случаи, полагая, что g(x) = Af(х) = f(х + 1) - f(х). Если Ъ = а, то У"ад(х)бх = f(a)-f(a) - 0. Затем, если Ъ = a + 1, мы получим 2"а+1дМ6х = f(a+l)-f(a) = д(а).
74 Суммы Если увеличить b на 1, то ¦ Ъ + 1 Y_^ g(x)6x-^Qg(x)6x = = (f(b + l)-f(a))-(f(b)-f(a)) = f(b + 1)-f(b) = g(b). Эти наблюдения и метод математической индукции позволяют нам точно определить, что же означает ]Г Q g(x) 6х в общем случае, когда а и b представляют собой целые числа, такие, что b > a: b-1 ^Qg(x)6x = ?g(k) = = 2_ 9M ПРИ Целых b ^ a. (2.48) a^k<b Другими словами, определенная сумма— это то же самое, что и обычная сумма с пределами суммирования, но с исключенным значением верхнего предела. Давайте попробуем повторить вывод несколько иначе. Предположим, что у нас имеется неизвестная сумма, которая, как мы считаем, вычислима в аналитическом виде, причем ее можно записать в следующем виде: YLa<k<b 90е) = JLagM6x. Теория исчисления конечных разностей гласит, что можно выразить ответ как f(b) — f(а), если найти неопределенную сумму или антиразностную функцию f, такую, что g(x) = f(x+1) — f(x). Один из способов понять этот принцип заключается в том, чтобы записать Иа<к<ь 90е) в развернутом виде, используя запись с троеточием: Это и есть обещанная кульминация?! Y_ (f(k+i)-f(k)) a$k<b = (f(a+1) - f(a)) + (f(a+2) - f(a+1 )) + ••• + + (f (b-1) - f (b-2)) + (f (b) - f (b-1)). Все, что находится в правой части (за исключением f(b) — f(a)), сокращается, так что значением суммы является f(b) — f(a). (Суммы вида ]Ta<ic<t,("f(k+ 1) — "f(1с)) часто называются телескопическими, по аналогии со складным телескопом, поскольку толщина стенок сложенного телескопа определяется только радиусами самой большой и самой малой из труб.) И все время моих размышлений ушло на телескопиро- вание очень длинного выражения в очень короткое.
2.6 Исчисление конечного и бесконечного 75 Остальных этот вопрос интересует уже давно... Правило (2.48) применимо только при b ^> а; а что же будет в случае b < а? Согласно (2.47) ^Ъд(х)6х = f(b)-f(a) = * a = -(f(a)-f(b)) = -?°д(х)6х, что аналогично соответствующему уравнению для определенного интеграла. Подобные рассуждения доказывают, что Ла + Лъ = Y_ca— аналог соотношения Ja + Jb = J*a для сумм. Вот его полный вид: -ъ У g(x)6x+V" д(х)6х = У д(х) *—a ^—-Ъ *•—a 6х (2-49) для всех целых a, b и с. Вероятно, сейчас некоторые из читателей начнут интересоваться: а что все это нам дает? Начнем с того, что определенные суммы дают нам простой способ вычисления сумм убывающих степеней: основные правила (2.45), (2-47) и (2А&) приводят к общему правилу Y_ к^ km+l 0^k<n m+1 n- m+1 m+1 при целых ттцп ^ 0. (2.50) Эту формулу легко запомнить, потому что она очень похожа на хорошо известную формулу J0 xm dx = nm+V(tti + 1). В частности, при m = 1 мы получаем к- = к, поэтому исчисление конечных разностей позволяет нам легко запомнить тот факт, что 0^k<n Т|Д п(п-1)/2. Метод определенных сумм, помимо прочего, намекает, что суммы в диапазоне 0 ^ к < тг часто оказываются проще сумм в диапазоне 1 ^ к ^ п; первые равны f(n) — f(0), а последние требуют вычисления f (гг + 1) — f (1). Обычные степени также можно суммировать этим новым способом, если сначала выразить их через убывающие степени. Например, к2 = что Г 0^к<г к2- к2 + kl 1 TV iv з^ _ = -Т- + -У = ?n(n-1)(n-2+f) = = ^n(n-l)(n-l]
76 Суммы Заменяя п на п + 1, мы получим еще один способ вычисления нашего старого знакомого— Пп = Ho<k<n ^2— в аналитичес- Старый друг лучком виде. " " ше новых Авух... Как все просто! Это и правда проще любого из груды способов, которой мы завалили нашу сумму в предыдущем разделе. Давайте не останавливаться на достигнутом и обратимся к кубам. Простые вычисления показывают, что к3 = 1^ + Зк^ + к1. (Обычные степени всегда можно преобразовать в факториаль- ные и обратно при помощи чисел Стирлинга, с которыми мы познакомимся в главе 6.) Таким образом, г l3 ki l3 k^ a^k<b Убывающие степени, как видно, отлично подходят для вычисления сумм. Но нет ли у них иных качеств, оправдывающих их введение в математику? Должны ли мы преобразовывать обычные степени в убывающие перед суммированием, а затем выполнять обратное преобразование перед тем, как двигаться дальше, или можно поступать как-то иначе? Да, зачастую можно работать непосредственно с факториальными степенями, обладающими дополнительными свойствами. Например, точно так же, как (х + у)2 = х2 -f 2ху + у2, справедливо и (х + у)- = х- + 2х-у-+у-, причем та же аналогия имеется и между (х+у)т и (х-Ь у)—. (Эта "факториальная биномиальная теорема" доказывается в упр. 5.37.) До сих пор мы рассматривали убывающие степени только с неотрицательными показателями. Чтобы распространить аналогию с обычными степенями и на отрицательные показатели, необходимо подходящее определение х— при га < 0. Глядя на последовательность х2 = х(х - 1), х- = X, ** = 1, можно заметить, что для перехода от х- через х- и х- к х- выполняется деление на х—2, затем на х—1, затем на х. Представляется разумным (если не необходимым) очередное деление на х +1 для перехода от х- к х—, получая, таким образом, х— = 1/(х + 1).
2.6 Исчисление конечного и бесконечного 77 Продолжая эту последовательность делений, мы получим следующие первые отрицательные убывающие степени: 1 х+Г х^ = х^ = 1 (х+1)(х + 2)' 1 (х+1)(х + 2)(х + 3)' и в общем случае определение отрицательных убывающих степеней имеет вид 1 х—— = (х+1)(х + 2)...(х + тп) при га > 0. (2-5i) (Можно определить убывающие степени и для действительных, Но вы не комплек- и даже для комплексных га, но это мы отложим до главы 5.) сУите- • • При таком определении убывающие степени обретают дополнительные замечательные свойства. Вероятно, наиболее важным является обобщенный закон степеней, аналогичный закону для обычных степеней. Убывающая версия имеет вид Законы обладают и положительными, и отрицательными сторонами. х-т целые тип. Например, х^^- = х- (х — 2)-; а при отрицательном п .2-3 х^(х- х+1 • 2)=± = х(х-1] 1 (x-i)x(x+i; = X- (2.52) Если бы мы определили х— как 1/х, а не как 1/(х + 1), то закон степеней (2.52) не выполнялся бы в случаях наподобие га = — 1 и п = 1. В действительности можно было бы использовать (2.52) для определения убывающих степеней с отрицательными показателями, положив га = —п. Когда существующее обозначение расширяется на большее количество случаев, всегда лучше формулировать определения таким образом, чтобы общие правила оставались справедливыми. Убедимся теперь, что ключевое разностное свойство справедливо и для вновь определенных убывающих степеней. Действительно ли Ах— = гах^^- при га < 0? Если, например, га = —2,
78 Суммы то разность равна Дх^ 1 1 (х + 2)(х + 3) (х+1)(х + 2) (х+1)-(х + 3) (х + 1)(х + 2)(х + 3) = -2х^. Да, все верно! Аналогичные рассуждения применимы для всех та < 0. Следовательно, правило суммирования (2.50) выполняется как для положительных, так и для отрицательных убывающих степеней, пока отсутствует деление на нуль: У х^бх +— а ,пг+1 т+1 при т/-1. А что делать при га = — 1? Вспомним, что в случае интегрирования при га = — 1 Ъ -1 1ь х dx = In х . Неплохо бы получить конечно-разностный аналог Inx; другими словами, мы хотим найти функцию f(x), такую, что 1 х+1 = Af(x) = f(x+1)-f(x). Несложно увидеть, что такой функцией является f(x) = j + l 1 + - X при целом х, и эта величина представляет собой гармоническое число Нх из (2.13). Таким образом, Нх— дискретный аналог континуального Inx. (Мы определим Нх для нецелых х в главе б, а пока что для наших целей достаточно целочисленных значений. В главе 9 мы также увидим, что при больших х значение Нх — Inx приближенно равно 0.577 + 1/(2х). Следовательно, Нх и Inx— не просто аналоги, раз их значения обычно отличаются меньше чем на 1.) Ровно 0.577 ? Может, это 1/\/з. А может и нет...
2.6 Исчисление конечного и бесконечного 79 'Таблица 80'— это та, которая на странице 80. Уловили? Теперь мы можем дать полное описание сумм убывающих степеней: х- m+l У х^бх т+1 |Ь при т^-1; при га — —1. (2-53) Эта формула указывает, почему так гармонично при решении дискретных задач наподобие анализа быстрой сортировки возникают гармонические числа— так же, как натуральные логарифмы весьма натуральны для континуальных задач. Теперь, когда найден аналог 1пх, давайте поищем аналог для ех. Какая функция f (х) обладает тем свойством, что Af (х) = f (х), соответствующая тождеству Dex = ех? Это просто: f(x+1)-f(x) = f(x) f(x + l) = 2f(x), так что мы имеем дело с простои рекуррентностью и можем принять f (х) = 2х в качестве дискретной экспоненты. Разность функции сх для произвольного с также достаточно проста, а именно д(сх) = сх+1 -сх - (с-1)сх. Следовательно, антиразностью сх является сх/(с — 1), если с ф 1. Этот факт наряду с фундаментальными законами (2.47) и (2.48) дает нам компактный способ получения общей формулы для суммы геометрической прогрессии: L <ь = I сх6х с-1 с-1 при с ф 1. a^k<b Всякий раз, когда мы сталкиваемся с функцией f, которая может быть полезна в аналитическом виде, мы можем вычислить ее разность Af = g; так мы получаем функцию д, неопределенная сумма которой Y. 9М &х нам известна. Таблица 80 представляет собой начало большой таблицы перечня пар "разность/антиразность" полезных для вычисления сумм. Несмотря на все параллели между континуальной и дискретной математикой некоторые континуальные понятия не имеют дискретных аналогов. Например, "правило цепочек" в исчислении бесконечно малых— удобное правило для вычисления производной функции от функции; однако соответствующего правила в исчислении конечных разностей нет, так как нет красивой формулы для Af(g(x)). В дискретном случае затруднена и замена переменных, за исключением некоторых случаев наподобие замены х на с ± х.
80 Суммы Таблица 80. Суммы и разности f = Ig Af = g f = Ig Af- x? = 1 0 xl = x 1 x- = x(x — 1) 2x x^ mx^bziL хДЬ±1/(т+1) x^ Hx x=l=1/(x+1) 2X cx сх/(с-1) cf f + g fg 2x (c-1)cx Cx cAf Ai + Ag f Дд + EgAf Однако A(f (x) g(x)) имеет красивое выражение, которое предоставляет нам правило для суммирования по частям — конечно-разностный аналог того, что в исчислении бесконечно малых именуется интегрированием по частям. Вспомним, что в исчислении бесконечно малых формула D(uv) = uDv + vDu приводит к правилу интегрирования по частям u Dv = uv — v Du = uv — V 1 после интегрирования и подстановки членов; то же самое можно сделать в исчислении конечных разностей. Начнем с применения разностного оператора к произведению функций и(х) и v(x): A(u(x)v(x)) = u(x+1)v(x+1)-u(x)v(x) = = u(x+1)v(x+1)-u(x)v(x+1)+ + u(x)v(x+l)-u(x)v(x) = = u(x) Av(x) + v(x+l) Au(x). (2.54) Эту формулу можно привести к более удобному виду, воспользовавшись оператором сдвига Е, определяемым как Ef(x) = f(x+1). Подставляя Ev(x) вместо v(x+l), получим компактное правило для разности произведения: A(uv) = uAv + EvAu. (2.55) (Наличие Е представляет определенное неудобство, но при этом В исчислении делает уравнение корректным.) Беря неопределенную сумму от бесконечно малых 1 —) 0, и Е обеих частей этого уравнения и переставляя члены, мы получаем попросту исчезает.
2.6 Исчисление конечного и бесконечного 81 Я все понял: ех = 2х при малых значениях 1... обещанное правило суммирования по частям: У~ u Av = uv — У" Ev Au. (2.56) Как и в исчислении бесконечно малых, ко всем трем членам можно добавить пределы суммирования, делая неопределенные суммы определенными. Это правило полезно, когда сумму слева вычислить сложнее, чем сумму справа. Рассмотрим конкретный пример. Интеграл J* хех dx обычно вычисляется путем интегрирования по частям; его дискретным аналогом является сумма ]Г х2х бх, с которой мы уже сталкивались в этой главе. Тогда она была записана в виде ?1к=о k^k- Аля суммирования по частям положим и(х) = х и Av(x) = 2х; отсюда Аи(х) = 1, v(x) = 2х и Ev(x) = 2X+1. Подстановка в (2.56) дает ]Г х2х5х = х2х - J^2X+1 6х = х2х - 2Х+1 + С. Теперь можно использовать эту формулу для вычисления ранее упоминавшейся суммы, добавив пределы суммирования: Выть может, сверхцель математики— избавить человечество от размышлений? 2>k = L п+1 х2х6х = k=0 = x2x-2x+1 n+1 = ((n+1)2n+1-2n+2)-(0.2°-21) = - (n-1)2n+1 +2. Найти сумму таким способом проще, чем при помощи метода приведения, поскольку при этом не надо ни о чем задумываться. Ранее в главе мы наткнулись на формулу для Ло<к<п^^ и прыгали от радости. Но формулу (2.36) можно было бы обнаружить закономерно, зная о суммировании по частям. Продемонстрируем это утверждение, взявшись за вычисление еще более сложной на вид суммы Х.о<к<п^Нк- Решение оказывается несложным, если исходить из аналогии с интегралом Jxlnxdx: положим и(х) = Нх и Av(x) = х = х-, так что Аи(х) = х—, v(x) = х-/2, Ev(x) = (х + 1 )-/2 и мы получаем 2>Нх6х = ^-Нх-}~ ^х-6х = ТНх-т + с.
82 Суммы (При переходе от первой строки ко второй мы объединили две убывающие степени (х + 1 )-х—, используя правило показателей (2.52) с m = — 1 и п = 2.) Теперь можно добавить пределы и заключить, что (H.-i). Y_ kHk = ]Г^хНх6х = IL(Hn-I). (2.57) 2.7 Бесконечные суммы Определяя обозначение Y. в начале этой главы, мы схитрили в вопросе о бесконечных суммах, по сути, заявив: "Отложим этот вопрос на потом, а пока будем считать, что все суммы состоят только из конечного количества ненулевых членов'! Пришло время расплаты — мы обязаны признать тот факт, что суммы могут быть и бесконечными. Истина заключается в том, что бесконечные суммы — как и все в этом мире — имеют свои хорошие и плохие стороны. Начнем с плохих новостей: оказывается, что методы, которыми мы пользовались при работе с суммами, не всегда применимы к бесконечным суммам. Хорошая же новость заключается в том, что имеется большой, простой в понимании класс бесконечных сумм, для которых все рассмотренные операции вполне применимы. Причины, лежащие в основе обеих новостей, станут понятны после того, как мы более близко познакомимся с суммированием. Все знают, что такое конечная сумма: мы добавляем к общему результату все новые и новые слагаемые, пока они не иссякнут. Но определять бесконечную сумму следует более аккуратно, чтобы не столкнуться с парадоксами. Например, представляется естественным считать, что бесконечная сумма равна 2, поскольку при ее удвоении мы получим - 2 + S. С другой стороны, применяя те же рассуждения к сумме 2S = 2 + 1 + l + l + l + 1L + . Т = 1 +2 + 4 + 8 + 16 + 32 + -.., мы получаем, что она равна —1, поскольку при ее удвоении мы получаем 2Т = 2 + 4 + 8 + 16 + 32 + 64 + -.• = Т-1. И это — хитрость? Вполне логично: 1+2+4+8+ не что иное, как "бесконечно точное" представление числа —1 в двоичном компьютере с неограниченным размером слова.
2.7 Бесконечные суммы 83 Множество К может даже быть несчетным. Но если существует ограничивающая константа А, то только счетное количество членов может быть отлично от нуля, поскольку самое большее пА членов ^ 1/п. Забавно, не правда ли, получить отрицательное число, суммируя положительные значения? Пожалуй, лучше оставить сумму Т неопределенной, или, быть может, следует считать, что Т = со, поскольку слагаемые суммы становятся больше любого заранее заданного фиксированного конечного числа. (Заметим, что со представляет собой второе "решение" уравнения 2Т = Т — 1; она же "решает" и уравнение 2S = 2 + S.) Давайте попробуем сформулировать хорошее определение значения обобщенной суммы Икек а^, где множество К может быть бесконечным. Для начала предположим, что все члены die неотрицательны. В таком случае подходящее определение найти нетрудно: если для любого конечного подмножества F С К существует ограничивающая постоянная А, такая, что Х.а^ ^ Л> k€F то мы определяем сумму 2IkeK а.к как равную наименьшему такому А. (Как следует из хорошо известных свойств действительных чисел, множество всех таких А всегда содержит наименьший элемент.) Но если такой константы А не существует, мы говорим, что 2ZkGK а^ = оо; это означает, что если А— некоторое действительное число, то имеется множество из конечного количества членов а^, сумма которых превосходит А. Определение в предыдущем абзаце сформулировано достаточно аккуратно, чтобы не зависеть от порядка, который может иметься у множества индексов К. Поэтому аргументация, которая будет приведена далее, будет справедливой не только для сумм по множеству целых чисел, но и для кратных сумм со многими индексами ki, k2, В частном случае, когда К— множество неотрицательных целых чисел, наше определение для неотрицательных членов ак приводит к Lak = lim У~ ak. п.—Упа f k$>0 k=0 И вот почему: любая неубывающая последовательность действительных чисел имеет предел (возможно, равный оо). Если этот предел равен А и если F— некоторое конечное множество неотрицательных чисел, все из которых ^ п, то XlkGFQk ^ YJ\i=o Qk ^ ^' слеАовательно> либо А = оо, либо А— ограничивающая постоянная. И если А'— некоторое число, меньшее установленной границы А, то существует такое п, что YX=o а^ >
84 Суммы А'; следовательно, конечное множество F = {0,1,... ,11} свидетельствует о том, что А' ограничивающей постоянной не является. Теперь можно легко вычислить величины конкретных бесконечных сумм в соответствии с только что данным определением. Например, если а^ = хк, то 1-Xn+1 lim — п—>оо | — X 1/(1 — х), если 0 $С х < 1; со, если х >. 1. В частности, бесконечные суммы S и Т, которые рассматривались минуту назад, имеют значения соответственно 2 и со, как мы и предполагали. Другой интересный пример: к>0 1 (к + 1)(к + 2) -L^ = к^О TL-1 = lim У к^ П.—»-00 ' к=0 lim —— п—юо —I 1. Рассмотрим теперь случай, когда сумма наряду с неотрицательными членами может содержать и отрицательные. Чему, например, равна сумма X>nv 1 -1 + 1 -1 + 1 -1 + ...? k^O Если сгруппировать члены попарно, можно получить (1-1) + (1-1) + (1-1) + -.. =0 + 0 + 0 + .-., Таким образом, сумма равна нулю; но если начать группирование по парам на шаг позже, то можно получить 1 П-Г (1-1)-(1-1)-- 1 -0-0-0- т.е. сумма равна 1. Можно, конечно, попробовать подставить значение х = — 1 в формулу ^k>0*k — V0 ~x)i которая, как мы доказали, справедлива при 0 ^ х < 1; но тогда придется заключить, что сумма (пусть и бесконечная) целых чисел равна ^! Еще один занимательный пример — "дважды бесконечная" сумма 22k аь в К0Т0Р°й ак = 1/(к+1) при к ^ 0 и а^ = 1/(к— 1) при к < 0. Ее можно записать как "Aggregation quantitation а — а + а — а + а — а etc. nunc est = а, nunc = 0, adeoque continuata in infinitum serie ponendus = a/2, fateor acumen et veritatem animadversionis tux". — Г. Гранки (G. Grandi) [163] • • • + (-1) + (-4) + (-4) + 1 + KW + -- (2.58)
2.7 Бесконечные суммы 85 Если вычислить эту сумму, начиная с "центрального" элемента и двигаясь наружу, - + (-* + Н + И + 0) + *) + *) + *) + -. то мы получим значение 1; то же значение 1 будет получено, если мы сдвинем все скобки на один элемент влево, - + (-* + Н + И + (-*) + 1) +*) + *) + -, так как сумма всех чисел в п внутренних скобках равна 11 1,1 1 + 1 + - + ••• + п+1 п 2 2 п-1 п п + 1 Аналогичные рассуждения показывают, что величина суммы остается равной 1 и при сдвиге на любое фиксированное число элементов влево или вправо. Это заставляет нас решить, что данная сумма действительно равна 1. Но, с другой стороны, если сгруппировать члены следующим образом: то п-я пара внутренних скобок будет содержать числа 11 1,1 11 ^ + 1 + -+•••+- 7 + Т- = п+1 п 2 2 2п-1 2п = 1 + Н2п — Нп+1 . В главе 9 будет доказано, что limn_>00(H2n — Hn+i) = In 2; следовательно, такое группирование предполагает, что дважды бесконечная сумма должна быть равна 1 + In 2. Есть нечто бессмысленное в сумме, которая дает разные значения при сложении ее членов разными способами. В современных руководствах по анализу имеется целый ряд определений, с помощью которых таким патологическим суммам приписываются осмысленные значения; но если мы позаимствуем эти определения, то не сможем оперировать ^-обозначениями так же свободно, как делали это до сих пор. Цели этой книги таковы, что нам не нужны рафинированные уточнения понятия "условной сходимости" — мы будем придерживаться такого определения бесконечных сумм, которое оставляет в силе все использованные нами в настоящей главе операции. В действительности наше определение бесконечных сумм достаточно простое. Пусть К— некоторое множество и пусть а^ —
86 Суммы действительный член суммы, определенный для каждого k е К. (Здесь 'к' может на самом деле означать несколько индексов ki, k2, ..., так что множество К может быть многомерным.) Любое действительное число х можно записать как разность его положительной и отрицательной частей, Х+ — X где х+ = х• [х>0] их -х-[х<0]. (Либо х+ = 0, либо х~ = 0, либо оба.) Мы уже объясняли, как определять величины бесконечных сумм Икек aic и Икек ak > поскольку а? и ak неотрицательны. Поэтому наше общее определение таково: Y_ ak = 52 ak - Yi ak > кек кек кек (2.59) если только обе суммы в правой части не равны со. В последнем случае сумма Икек cik остается неопределенной. Пусть А+ = 21 кек aic и ^~ = Икек ak • Если обе суммы, А4" и А~, конечны, то говорят, что сумма XIкек а^ абсолютно сходится к значению А = А+ — А-. Если А+ = со, а А- конечна, то говорят, что сумма Y.keKa^ Расходится к +со. Аналогично, если А~ = со, а А+ конечна, то говорят, что Икек ак расходится к —со. Если А+ = А~ = со, то не говорят ничего. Мы начали с определения, которое работало для неотрицательных членов, затем распространили его на действительные члены с любыми значениями. Если члены суммы ak являются комплексными числами, наше определение можно очевидным способом расширить еще раз: сумма ^LkGK ak определяется как Икек 9tok+i Икек ^ak, где ^Яа^ и Ja^ — действительная и мнимая части ak при условии, что обе эти суммы определены. В противном случае сумма Лк(ЕК ak не определена (см. упр. 18). Плохие новости, как упоминалось ранее, заключаются в том, что некоторые бесконечные суммы приходится оставлять неопределенными, поскольку операции, которые мы выполняем с ними, могут приводить к несуразностям (см. упр. 34). Хорошие же новости заключаются в том, что что все операции из настоящей главы совершенно справедливы всякий раз, когда мы имеем дело с абсолютно сходящимися в только что установленном смысле суммами. Мы можем убедиться в последнем, продемонстрировав, что каждое из наших правил преобразования сохраняет величину любой абсолютно сходящейся суммы неизменной. Более точно это означает, что мы должны доказать дистрибутивный, ассоциативный и коммутативный законы, а также правило, соглас- Другими словами, абсолютная сходимость означает сходимость суммы абсолютных величин.
2.7 Бесконечные суммы 87 Когда вы окажетесь здесь впервые, лучше просто бегло просмотрите эту страницу. — Сочувствующий ассистент но которому можно начинать суммирование по любой индексной переменной. Все остальное, что делалось в данной главе, может быть выведено из этих четырех фундаментальных операций с суммами. Дистрибутивный закон (2.15) можно сформулировать более строго следующим образом: если сумма XlkeK а^ абсолютно сходится к А и если с— некоторое комплексное число, то сумма 2^kGK caic абсолютно сходится к сЛ. Это можно доказать, разбив сумму сначала на действительную и мнимую, а затем на положительную и отрицательную части, как делалось выше, и доказывая частный случай, когда с > 0 и каждый член а^ неотрицателен. Доказательство в этом частном случае работает в силу того, что HkeF caic = c^kGF Qk А^я всех конечных множеств F; последний же факт доказывается индукцией по размеру F. Ассоциативный закон (2.16) можно сформулировать следующим образом: если ^kGK Qk и Икек ^к абсолютно сходятся соответственно к А и В, то Л]сеК^а^ + bic) абсолютно сходится к А + В. Оказывается, это является частным случаем более общей теоремы, которую мы вскоре докажем. Коммутативный закон (2.17) в действительности доказывать не обязательно, так как при рассмотрении (2.35) было показано, как вывести его в качестве частного случая более общего правила изменения порядка суммирования. Главное, что требуется доказать,— это фундаментальный принцип кратных сумм: абсолютно сходящиеся суммы с двумя или более индексами всегда можно начинать суммировать по любому из этих индексов. Формально мы должны доказать, что если J и элементы {Kj | ) Е J}— некоторые множества индексов, такие, что Y~ Qj^ абсолютно сходится к А, то для каждого j Е J существуют комплексные числа Aj, такие, что 2~ CL)yk абсолютно сходится к Aj и k€Kj У" Aj абсолютно сходится к А. Достаточно доказать это утверждение для случая, когда все члены суммы неотрицательны, так как в общем случае все можно разбить на действительную и мнимую, положительную и отрица-
88 Суммы тельную части, как это делалось прежде. Поэтому предположим, что a^ic ^ 0 для всех пар (j, k) G М., где М.— основное индексное множество {(j,k) | j G J,k G Kj}. Дано, что сумма Ц^к)ем а^к конечна, а именно, что для всех конечных подмножеств F С М, и что Л является наименьшей из таких верхних границ. Если j — некоторый элемент множества J, то каждая сумма вида Цк(Ер. а^к, где Fj— конечное подмножество множества Kj, ограничена сверху числом А. Следовательно, эти конечные суммы имеют наименьшую верхнюю границу Aj ^ 0 и по определению Х^кек- ah^ = ^-у Нам все еще надо доказать, что А является наименьшей верхней границей 2IjGG Aj для всех конечных подмножеств G С J. Предположим, что G — конечное подмножество множества J, такое, что Л}есА}=А;>А. Мы можем найти конечные подмножества Fj С Kj, такие, что XlkeF- ai>k > (A/A')Aj для каждого j G G, для которого Aj > 0. Имеется как минимум одно такое j. Но тогда LjeG,kGF. aj)k > (A/A')LjGgAj = А> что противоречит тому факту, что H(j,k)eFai>k ^ А АЛЯ всех конечных подмножеств F С М. Следовательно, для всех конечных подмножеств G С J справедливо JljGG Aj ^ А. Наконец, пусть А'— некоторое действительное число, меньшее А. Наше доказательство будет завершено, если мы сможем найти конечное множество G С J, такое, что ^jGG Aj > А'. Мы знаем, что существует конечное множество F С М, такое, что 2I(j>k)eF aj>k > А'; ПУСТЬ G— множество индексов j в этом F и пусть Fj = {к | (j,k) G F}. Тогда Ji]eG Aj ^ HjGG LkGF^ <4,к = L(j,k)GF^,k>A/. QED Итак, теперь все законно. Все, что мы делали с бесконечными суммами, оправданно постольку, поскольку для любой конечной суммы абсолютных величин ее членов существует конечная граница. Так как "дважды бесконечная" сумма (2.58) давала нам два разных ответа при вычислении ее двумя разными способами, ее положительные члены 1 + \ + \ Л должны расходиться к со; в противном случае нами был бы получен один и тот же ответ, не зависящий от способа группирования ее членов. Тогда почему я в последнее время только и слышу о "гармоничной сходимости"?
2.7 Бесконечные суммы 89 Упражнения Разминка 1 Объясните, что означает следующая запись: Уделим внимание возрастающим степеням. 2 3 к=4 Упростите выражение х • ([х > 0] — [х < 0]). Продемонстрируйте свое понимание ^-обозначения, записав суммы У ак 0^к^5 0^к2<^5 в развернутом виде. (Осторожно: вторая сумма— с подвохом.) Где ошибка в следующем выводе? п. \ / rL 1 \ п. п. п. п. j = l k=1 j = l k=1 k=1 k=1 = У" n — n2 k=1 5 Выразите тройную сумму Ц aijk 1^i<j<k^4 в виде троекратной суммы (с тремя ]Г): а суммируя сначала по к, затем по j, затем по г; б суммируя сначала по г, затем по j, затем по к. Запишите также свои троекратные суммы в полном виде, без применения ^-обозначений, с использованием скобок для того, чтобы показать, что именно суммируется вначале. 6 Выразите значение суммы 2Zk[1 ^j^k^n] в виде функции от j и п. 7 Пусть Vf(х) = f(х) - f(х-1). Чему равно У(хж)? 8 Чему равно значение 0—, где m— некоторое заданное целое число? 9 Как выглядит правило показателей для возрастающих фак- ториальных степеней, аналогичное (2.52)? Воспользуйтесь им для определения х~п.
90 Суммы 10 В тексте была выведена следующая формула для разности произведения: A(uv) = uAv + EvAu. Как может быть верной эта формула, если ее левая часть симметрична относительно и и v, а правая— нет? Обязательные упражнения 11 Общее правило суммирования по частям (2.56) эквивалентно следующему: У~ (cik+1 - ak)bk = anbn - a0b0- - Y_ ak+i(bk+1 -bk) при n ^ 0. 0^k<n 0^k<n Докажите эту формулу непосредственно с применением дистрибутивного, ассоциативного и коммутативного законов. 12 Покажите, что функция р(к) = к+ (—1 )кс является перестановкой множества всех целых чисел, когда с— целое число. 13 Воспользуйтесь методом наборов для поиска суммы п k=0 в аналитическом виде. 14 Вычислите сумму J^k=1 k2k, переписав ее в виде кратной суммы LUj^n2k. 15 Вычислите (Юп = Y-k=-\ ^3 методом 5 из текста главы: сначала запишите СзРп + Пп = 2Xli^i^k^n jk; затем примените (2.33). 16 Докажите, что х—/(х — п)— = х—/[х — т)—, если только ни один из знаменателей не равен нулю. 17 Покажите, что следующие формулы могут быть использованы для преобразования убывающих степеней в возрастающие и наоборот для всех целых т: хт = (_-|)т(_х)т = (х + т_-,р = 1/(х_1):=т; х^ = (-1)^(-х)ж = (х-т+1Г = 1/(х+1Г™. (Степень х m определена в ответе к упр. 9.)
2 Упражнения 91 18 Пусть 9lz и 3z— действительная и мнимая части комплексного числа z. Модуль \z\ равен >/(*Rz)2 + [3z)2. Говорят, что сумма Х!кек а^ комплексных членов ак сходится абсолютно, если сходятся абсолютно обе действительные суммы X^kGK<Hak и HkGK3ak. Докажите, что 2ZkGK ak сходится абсолютно тогда и только тогда, когда существует ограничивающая константа В, такая, что 2IkGF |ak| ^ В для всех конечных подмножеств F С К. Домашние задания 19 Воспользуйтесь суммирующим множителем для решения рекуррентности То = 5; 2ТП = nTn_i +3 -п! при п > 0. Трудно доказать тождественность умершего около двух веков тому назад. Это обозначение введено Якоби (Jacobi) в 1829 году 20 Попробуйте, вычисляя сумму Лк=0 кНк методом приведения, получить вместо этого значение суммы ]Гк=0 ^к. 21 Вычислите суммы Sn = Ц?=0(-1 )n~\ Tn = L?=0(-1)n-kk и Un = X.k=o(—^)n-kk2 методом приведения, считая, что тОО. 22 Докажите тождество Лагранжа (не прибегая к индукции): J^ (азЪк-акЪз)2 = 1^j<k^n ^к=1 7 чк=1 7 хк=1 Докажите тождество для более общего случая: Y_ (ajbk - акЪз)(АзВк - AkBj). 1^j<k^n 23 Вычислите сумму ]Г k=i (2к + 1 )/к(к + 1) двумя способами: а заменяя 1/к(к+ 1) "элементарными дробями" 1/к—1/ (к+1); б суммируя по частям. 24 Чему равна сумма YLo<k<n ^к/(к + 1)(к + 2)? Указание: обобщите вывод (2.57)- 25 Обозначение Пкек а^ означает произведение чисел ak для всех k G К. Предположим для простоты, что ак ф 1 лишь
92 Суммы для конечного числа к, так что нам не надо определять бесконечные произведения. Каким законам, аналогичным дистрибутивному, ассоциативному и коммутативному законам для ^-операции, удовлетворяет подобная fj-операция? 26 Выразите двойное произведение Пк]<к<тга)а^ "Р11 пом°- щи манипуляций с ^-обозначением через одинарное произведение Пк=т а^- (Это упражнение дает нам произведение элементов верхней треугольной матрицы по аналогии с их суммой (2.33)•) 27 Вычислите величину А (с-) и используйте ее для получения значения X!k=i (~""2)—/к. 28 Где следующий вывод свернул с пути истинного? i = У—— = г(—- — = LL(jB=lt+1]-i[j=ic-i]) = k^lj^l Х) 7 j^l k^l = LL (^=i-i]-i[k=j+1]) = j^l k^l = -1 Контрольные работы 29 Вычислите сумму ??=1 (-1 )кк/(4к2 - 1). 30 Игроки в криббедж хорошо знают, что 15 = 7+8 = 4+5 + 6 = 1+2 + 3 + 4 + 5. Найдите количество способов представления числа 1050 в виде суммы последовательных положительных целых чисел. (Тривиальное представление 1050 в виде самого себя считается одним из таких способов; следовательно, имеется четыре, а не три способа представления числа 15 в виде суммы последовательных положительных целых чисел. Кстати, для решения этой задачи знание правил игры в криббедж не требуется.) 31 Дзета-функция Римана С (к) определяется как бесконечная сумма
2 "Упражнения 93 Закон джунглей. Совершенная власть развращает совершенно. (Игра слов, основанная на том, что слово "power" переводится и как "степень" и как "власть" — Переводчик) Докажите, что ^^^(^(к) ~~ 1) — 1- Найдите, чему равна сумма Hic^i (C(2k) - 1). 32 Пусть а — Ъ = max(0, а — b). Докажите, что ^mm(k,x-k) = ]T(x-(2k+1)) k^O k^O при любом действительном х ^ 0, и вычислите эту сумму в аналитическом виде. Дополнительные задачи 33 Пусть Лкек Qic обозначает минимальное из чисел а^ (или их наибольшую нижнюю границу, если К бесконечно) в предположении, что каждое а^— либо действительное число, либо ±со. Какие законы справедливы для Д-операции, аналогичные тем, которые имеют место для ]Г и YI (см- УПР- 25)? 34 Докажите, что если сумма Л\сека^ не определена в соответствии с определением (2.59)) то она расслаивается в следующем смысле: если А- и А+— любые заданные действительные числа, то можно найти последовательность конечных подмножеств Fi С F2 С F3 С • ¦ • множества К, такую, что 2__ O-k ^ А-, если п нечетное, kGFn / ак ^ А4", если п четное. kGFn 35 Докажите теорему Гольдбаха 1 1 - 1 1 ] ] ] ] ] 1 №• к<=Р где Р — множество "совершенных степеней" рекурсивно определяемое как т" т ^ 2, п ^ 2, т ? Р}. 36 "Самоописывающая последовательность" Соломона Голом- ба (Solomon Golomb) (f (1), f (2), f (3),...) — единственная неубывающая последовательность положительных целых чисел, основным свойством которой является то, что она содержит ровно f (к) вхождений каждого к. Немного подумав,
94 Суммы можно прийти к выводу, что эта последовательность должна начинаться следующим образом: п f(n) 123456789 10 122334445 5 11 5 12 6 Пусть д(п) — наибольшее целое га, такое, что f (m кажите, что a g(u) = n=if(k); б g(g(u)) = n=1kf(k); -п-1 п. По- L^i9W(g(ic) + i). в д(д(д(п))) = ?пд(п)(д(п) + 1) Исследовательская проблема 37 Можно ли уложить все прямоугольники размером 1 /к х 1 / (к+ 1) при к ^ 1 в квадрат размером 1x1? (Вспомните, что сумма их площадей равна 1.) <^ 5 и т 1 щ 4 Ж
3 Целочисленные функции ЦЕЛЫЕ ЧИСЛА составляют костяк дискретной математики, и нам часто требуется преобразовывать дробные или произвольные действительные числа в целые. В этой главе наша цель — познакомиться с такого рода преобразованиями и приобрести навыки работы с ними, а также немного изучить их замечательные свойства. 3.1 Полы и потолки Начнем с настила пола (floor) и перекрытия потолка (ceil), а именно— с функций "пол" (наибольшее целое) и "потолок" (наименьшее целое), которые определены для всех действительных чисел х следующим образом: |xj = наибольшее целое, не превышающее х; г 1 (3'1} | х | = наименьшее целое, не меньшее х. Эти обозначения (и названия) были введены Кеннетом Айверсо- ном (Kenneth Е. Iverson) в начале 1960-х годов [191, с. 12]. Он обнаружил, что наборщики вполне могли бы справиться с этими символами, срезав верхушки и основания символов ' [' и (]'. Его обозначения стали настолько распространенными, что сейчас они используются в технических статьях без каких-либо пояснений. До недавнего времени для наибольшего целого ^ х часто использовалось обозначение ([x]J при этом эквивалентное обозначение для наименьшего целого отсутствовало. Некоторые авторы пы- )Вррр... ( тались использовать 4]х[' (понятно, что из этого ничего не могло получиться). Помимо разных вариантов обозначений, имеются разные варианты самих функций. Например, некоторые калькуляторы имеют функцию INT, определенную как |_xj при положительном
96 Целочисленные функции х и [~х] при отрицательном х. Вероятно, разработчики этих калькуляторов хотели, чтобы их функция INT удовлетворяла тождеству INT(-x) = -INT(x). Но мы остаемся приверженцами наших пола и потолка, поскольку у них имеются свойства гораздо более привлекательные. Один из способов поближе познакомиться с функциями пола и потолка— взглянуть на их графики, напоминающие ступеньки над и под прямой f (х) = х: f (х) = X Из этого графика, например, видно, что LeJ=2, L-eJ = -3, М=3, Г-е"1=-2, поскольку е = 2.71828.... Взглянув на эту иллюстрацию, можно заметить ряд фактов относительно полов и потолков. Начнем с того, что, поскольку функция пола лежит под диагональю f (х) = х, справедливо соотношение |_*J ^ Щ аналогично |~х] ^ х. (Конечно, эти факты следуют непосредственно из определения функций.) В целых точках эти две функции совпадают: ш х целое М = X. (Здесь символ 'ф=>' означает "тогда и только тогда'.') Если же они не совпадают, то потолок ровно на 1 выше пола: М — W — Iх не целое1 ¦ (3-2) Если сдвинуть диагональ вниз на 1, то она окажется полностью под функцией "пол" так что х — 1 < [х\\ аналогично х + 1 > [~х]. Объединив эти наблюдения, получаем Красивое применение обозначений, введенных Айвер- соном! 1 < |_xj ^ х ^ |Y| < х +1 (3.3)
3.1 Полы и потолки 97 Наконец, эти функции являются отражениями друг друга относительно обеих осей: L-xJ = -М; НО = -W- (34) На следующей неделе обещали подвезти стены... Таким образом, каждая функция легко выражается через другую, что помогает объяснить, почему функция "потолок" раньше не имела собственного обозначения. Тем не менее потолки встречаются так часто, что заслуживают отдельного обозначения, так же как отдельные обозначения были введены для возрастающих и убывающих степеней. Математики издавна имеют синус и косинус, тангенс и котангенс, секанс и косеканс, максимум и минимум, а теперь у нас есть пол и потолок. Для настоящего доказательства свойств этих функций (а не просто разглядывания картинок) особенно полезны следующие правила: L*J=n Lxj=n n <C x < n + 1 , (a) x— 1 < n ^ x, (6) n— 1 < x ^ n, (в) x ^ n < x + 1 . (r) (3-5) На радость ослику На... — Переводчик (Во всех случаях считается, что п— целое, ах— действительное.) Правила (а) и (в) следуют непосредственно из определения (3.1); правила (б) и (г)— те же самые, просто неравенства преобразованы так, что в средине оказывается п. Целочисленное слагаемое можно свободно вносить и выносить в/за скобки пола/потолка: [х + n\ — [xj + п, п— целое. (3-6) (Правило (з-5>а) гласит, что это утверждение эквивалентно неравенствам |_xj +п ^ х + п < [х\ 4-п-Ь 1.) Но аналоги этой операции типа вынесения за скобки постоянного множителя в общем случае недопустимы. Например, |_nxj ф n|_xj при п = 2 и х = 1/2. Это означает, что скобки пола и потолка сравнительно негибки. Обычно мы счастливы, если удается от них избавиться или что- то доказать при их наличии. Оказывается, что имеется масса ситуаций, когда скобки пола и потолка избыточны, так что их можно удалять или вставлять, как вам угодно. Например, любое неравенство между действительным и целым числами эквивалентно неравенству с полом
98 Целочисленные функции или потолком между целыми числами: X < п п < X X ^ п n <J X ф=> <(=> <^=> ф=ф W <п> п < М , W < п > п ^ W • (а) (б) (в) (г) (3-7) Эти правила легко доказать. Например, если х < п, то, конечно же, [х\ < п) поскольку |_*J ^ х. И наоборот, если |_xj < п, то должно выполняться х < п, поскольку х < [xj + 1 и |_xj + 1 ^ п. Было бы хорошо, если бы эти четыре правила в (3.7) так же легко запоминались, как и доказывались. Каждое неравенство без пола или потолка соответствует такому же неравенству с полом или с потолком; но нужно дважды подумать, прежде чем решить, какое из них подходит. Разность между х и |_xj называется дробной частью х и встречается в приложениях достаточно часто, чтобы заслужить собственное обозначение: М W- (3-8) Иногда |_*J называют целой частью х, поскольку х = [xj + {х}. Если действительное число х можно записать в виде х = п + 0, где п— целое число, а 0 ^ 0 < 1, то согласно (з-5>а) можно заключить, что п = [х\ и Q = {х}. Равенство (3.6) не выполняется, если п— произвольное действительное число. Но в общем случае для [х + у\ имеются две возможности. Если записать х = [xj +{х} и у = [у\ +{у}, то получим |x + yj = Ш + 1у\ + К*ЖУ}_1- А поскольку 0 ^ {х} + {у} < 2, оказывается, что иногда [х + у\ равно [xj + [yj> а. в остальных случаях это |_*J + [у\ + 1 • 3.2 Применения пола и потолка Итак, базовый инструментарий для работы с полами и потолками у нас есть. Опробуем их на деле, начав с простой задачки: что такое [lg 35]? (Следуя предложению Эдварда М. Рейнгольда (Edward М. Reingold), мы используем 'lg' для обозначения логарифма по основанию 2.) Ну а поскольку 25 < 35 ^ 26, взятие логарифма дает нам 5 < lg35 ^ 6, откуда согласно (3-5, в) \lg35^=6. Заметим, что число 35 при записи в двоичной системе счисления состоит из шести битов: 35 = (100011)2- Всегда ли верно, что [lg п] представляет собой длину п в двоичном виде? Не всегда. Нам нужны те же 6 бит и для записи 32 = (100000)2, так Лучше все же не записывать дробную часть как {х} в случаях, когда есть шанс спутать ее с множеством, состоящим из единственного элемента х. Второй случай реализуется тогда и только тогда, когда выполняется "перенос" за десятичную точку при сложении дробных частей {х} и {у}.
3.2 Применения пола и потолка 99 Ну конечно, первые действительные числа, приходящие на ум, — это п, е и ф, разве не так? Скептицизм полезен для здоровья только до определенной степени. Скептическое отношение к намерениям и планам (особенно своим), вероятно, избавит вас от волнений и обеспечит спокойную жизнь. Но проявление слишком скептического отношения наверняка заставит вас все время быть прикованным к работе, вместо того чтобы позволить себе выкроить время для физических упражнений что [lgn] — неверный ответ на поставленный вопрос. (Он неверен, только когда п представляет собой степень 2, но это означает, что он неверен в бесконечном числе случаев.) Правильный ответ можно найти, заметив, что для записи числа п, такого, что 2m_1 ^ n < 2т, требуется m бит; (з-5>а) говорит нам, что га — 1 = |_lg п\, так что га = [lgn\-\-]. То есть для записи любого п > 0 требуется |_lgnj + 1 бит. Аналогичные рассуждения дают другой вариант ответа [~lg(n + 1)]; эта формула справедлива и для п = 0, если считать, что для записи п = 0 в двоичном виде требуется 0 бит. Давайте теперь рассмотрим выражения с несколькими полами или потолками. Что такое |~|_х_|~|? Это просто: поскольку [х\ — целое число, |~|_х_|] — это просто |_х_|. Этому же равно любое другое выражение, в котором наиболее глубоко вложенный [xj окружен любым количеством полов и потолков. Вот более сложная задача: докажите или опровергните утверждение (3-9) [ vW J — L\/xJ для действительного х ^ 0. Очевидно, что равенство достигается, когда х— целое число, так как х = [х\. Равенство выполняется и для частных случаев тг = 3.14159..., е - 2.71828... и ф = (1 + л/5)/2 = 1.61803..., поскольку во всех этих случаях мы получаем 1=1. Безуспешные попытки найти контрпример наводят на мысль, что равенство справедливо в общем случае, так что давайте попытаемся его доказать. Кстати, когда мы сталкиваемся с задачей "доказать или опровергнуть" то обычно начинаем с попыток опровержения при помощи контрпримера по двум причинам: опровержение потенциально проще (достаточно одного опровергающего контрпримера), а его поиски будят спящие творческие силы. Даже если утверждение истинно, поиски контрпримеров зачастую приводят к доказательству— как только скептик понимает, почему контрпример невозможен. И вообще, скептицизм полезен для здоровья. Вели бы мы пытались доказать, что [л/1*Т] = L\/*J ПРИ помощи анализа, то для этого можно было бы начать с разбиения х на целую и дробную части |_xj +{х} = п + 0 с последующим разложением квадратного корня, применяя биномиальную теорему: (п + 9) 1/2 П 1/2 + п"1 /29/2 - п-3/292/8 + • • •. Но это слишком громоздкий, непрактичный подход. Гораздо проще воспользоваться имеющимся инструментарием. Вот возможная стратегия: разобрать наружный пол и ква-
100 Целочисленные функции дратный корень в [\/ |_xj J, затем удалить внутренний пол, после чего собрать разобранное, чтобы получить |_\/xj. Положим m — |_a/L*JJ и воспользуемся правилом (з-5>а)> получая m ^ \/[xJ < та + 1. Тем самым мы избавляемся от скобок наружного пола, ничего при этом не теряя. Применим возведение в квадрат, поскольку все три выражения неотрицательны. При этом мы получим та2 ^ LXJ < (та+ I)2- Так мы избавляемся от квадратного корня. Затем мы удаляем пол, воспользовавшись правилом (3-7>г) Для левого неравенства и (з-7>а) Для правого: та2 ^ х < (та+ I)2. Теперь восстановить проделанное не составляет особого труда: извлечь квадратные корни, получив та <J у/х < та + 1, и воспользоваться правилом (з-5>а)> чтобы получить m = [у/х\. Таким образом, |_\/|_xjJ = m = |_VxJ> т-е- утверждение оказалось истинным. Аналогично доказывается, что и восстановления сил. Чрезмерный скептицизм— это прямая дорога к состоянию "конченного человека" когда вы становитесь настолько озабочены соблюдением строгости и законченности, что уже никогда не можете ничего довести до конца. — Скептик р\/Гх"11 = ГV*l А^я действительного х ^ 0. Только что найденное доказательство не так сильно полагается на свойства квадратных корней. Более пристальный взгляд показывает, что можно обобщить лежащие в основе доказательства идеи и доказать более общее утверждение. Пусть f(x) — некоторая непрерывная монотонно возрастающая функция, обладающая тем свойством, что fM целое число х = целое число . (Символ {=^>' означает "отсюда следует'.') Тогда |f(x)J = |f(W)J и [f(x)l = №1)1 (3.10) всякий раз, когда определены функции f(x), f([xj) и f(|~x]). Поскольку до этого мы занимались полами, давайте докажем это общее свойство для потолков, тем более что для полов доказательство почти такое же. Если х = [х], то доказывать нечего. В противном случае х < |"х], a f(x) < f(|~x]), поскольку f — возрастающая функция. Следовательно, ff(x)] ^ Г^(ГХ1)1> так как П— функция неубывающая. Если pf(x)] < |"f([Y|)], то, поскольку функция f непрерывна, должно существовать число у, такое, что х ^ у < \х] и f(y) = [f(x)]. Это у является целым числом в силу специального свойства f. Но между [xj и \х] не может быть никакого целого числа. Это противоречие означает, что должно выполняться [f(x)l = [f(|"x])]. Это наблюдение было сделано Р.Д. Мак-Элисом (R. J. МсЕНесе), когда он заканчивал университет.
3.2 Применения пола и потолка 101 В других моих книгах "доказать или опровергнуть" в 99.44% случаев означает то же самое, что и "доказать" К данной книге это утверждение не относится. Важный частный случай этой теоремы заслуживает того, чтобы быть явно упомянутым: х + m п LxJ +m n и x + m n |У| + m" u (3-ii) если га и n— целые числа, а знаменатель п положителен. Например, пусть m = 0; тогда [[[x/IOj/lOj/IOj = Lx/1000j. Троекратное деление на 10 и отбрасывание цифр остатка— это то же, что и деление на 1000 с последующим отбрасыванием всего остатка. Попробуем теперь доказать или опровергнуть следующее утверждение: Гч/Г Г^1 при действительном х ^ 0. Оно справедливо при х = п и х = е, но не выполняется при х = ф. Этого достаточно, чтобы утверждать, что в общем случае оно неверно. ОТСТУПЛЕНИЕ Перед тем как идти дальше, давайте на минуту прервемся и рассмотрим различные уровни задач, которые могут предлагаться в математических книгах. Уровень 1. Для явно указанных объекта х и свойства Р(х) надо доказать истинность Р(х). Например, "докажите, что \п\ = 3" Задача требует доказательства некоторого предполагаемого факта. Уровень 2. Для явно указанных множества X и свойства Р(х) надо доказать истинность Р(х) для всех х ? X. Например, "докажите, что |_*J ^ х ДЛЯ всех действительных х" Задача вновь состоит в поиске доказательства, которое в этот раз имеет общий характер. Мы работаем уже не с арифметикой, а с алгеброй. Уровень 3. Для явно указанных множества X и свойства Р(х) надо доказать или опровергнуть истинность Р(х) для всех х ? X. Например, "докажите или опровергните, что [\/[xJ] = Гл/*1 АЛ51 всех действительных х ^> 0'.' Здесь в задачу добавляется дополнительный уровень неопределенности— результат может оказаться как тем, так и другим. Это ближе к реальным ситуациям, с которыми постоянно сталкивается математик: утверждения в книгах обычно истинны, но в реальной исследовательской работе к новому надо относиться непредвзято. Если утверждение ложно, задача состоит в том, чтобы найти контрпример. Если утверждение истинно, следует доказать его, как и в случае задачи второго уровня.
102 Целочисленные функции Уровень 4. Для явно указанных множества X и свойства Р(х) надо найти необходимое и достаточное условие Q(x) того, что Р(х) истинно. Например, "найдите необходимое и достаточное условие того, что [xj ^ [х~|'.' Задача состоит в том, чтобы найти Q, такое, что Р(х) <=> QM- Конечно, всегда имеется тривиальный ответ Q(x) = Р(х), но задача подразумевает поиск настолько простого условия, насколько это возможно. Для поиска работающего простого условия необходимо творчество. (Например, в нашем случае ответ— "|xj ^ [У] <=> х является целым числом") Дополнительный элемент исследования, необходимый для поиска Q(x), делает эту разновидность задач более сложной, но и более типичной для математика, работающего в "реальной жизни'.' Ну и, конечно же, должно быть доказано, что Р(х) истинно тогда и только тогда, когда истинно Q(x). Уровень 5. Для явно указанного множества X найти интересное общее свойство Р(х) его элементов. Это область чистой науки, где, по мнению студентов, царит полный хаос. Это настоящая математика, которую авторы учебников крайне редко допускают в свои книги. КОНЕЦ ОТСТУПЛЕНИЯ Давайте вернемся к нашему вопросу и переведем его с уровня 3 на уровень 4: какое условие является необходимым и достаточным для того, чтобы [\/[хЦ = Г\/*~1? Мы уже выяснили, что равенство выполняется при х = 3.142, но не при х = 1.618; дальнейшие эксперименты показывают нам, что оно не выполняется и при х, лежащем между 9 и 10. Более того, можно обнаружить, что условие не выполняется при т2 < х < т2 + 1, поскольку при этом в левой части мы получаем т, а в правой— т + 1. Во всех прочих случаях, где определен \/х, а именно при х = 0 или т2 + 1 ^ х ^ (т + 1 )2, мы получаем равенство. Таким образом, для выполнения равенства необходимым и достаточным является следующее условие: либо х— целое число, либо \J\x\— не целое число. Для следующей задачи рассмотрим сначала новое удобное обозначение, предложенное Ч.Э.Р. Хоаром (С. A. R. Ноаге) и Аайлом Рэмшоу (Lyle Ramshaw), для интервалов действительной прямой: [а.. |3] означает множество действительных чисел х, таких, что ос ^ х ^ [3. Это множество называется замкнутым интервалом, поскольку он включает обе конечные точки а и (3. Интервал [ос.. (3), не включающий ни одной из конечных точек, состоит из всех х, таких, что а < х < (3; такой интервал называется открытым интервалом. Интервалы [ос.. (3) и (ос..(3], содержащие только по одной конечной точке, определяются аналогично и называются полуоткрытыми. Но не проще. —А. Эйнштейн (A. Einstein) Пессимисты называют их полузамкнутыми.
3.2 Применения пола и потолка 103 О мнемонических правилах: знаете, как запомнить первые знаки числа п ? Они соответствуют количеству букв в словах стишка "это я знаю и помню прекрасно, пи многие знаки мне лишни, напрасны" Сколько целых чисел содержится в таких интервалах? Полуоткрытые интервалы проще, так что начнем с них. Фактически полуоткрытые интервалы почти всегда удобнее открытых или закрытых. Например, они аддитивны— при объединении полуоткрытых интервалов [ос..(3) и [(З..у) получается полуоткрытый интервал [ос. .у). В случае открытых интервалов это не получается, так как точка (3 оказывается исключенной; для замкнутых интервалов проблема иная— точка (3 оказывается включенной дважды. Вернемся к нашей задаче. Если а и (3 — целые числа, ответ прост: интервал [ос.. (3) содержит (3 — ос целых чисел ос, а + 1, ..., (3 — 1 при условии, что ос ^ (3. Аналогично интервал (а.. (3] содержит (3 —а целых чисел при том же условии. Но наша задача более трудная, так как по условию а и (3 — произвольные действительные числа. Но эту задачу можно свести к более простой, поскольку для целых п согласно (3.7) а ^ п < (3 ос < п ^ (3 LcxJ ^ п < < п ^ ГЭ1> LPJ. Интервалы справа имеют целые конечные точки и содержат столько же целых чисел, что и интервалы слева с действительными конечными точками. Поэтому интервал [а.. (3) содержит ровно [(3] — \ос] целых чисел, а (ос..|3]— |_(3J — [ocj. Это один из случаев, когда нам надо не избавляться от скобок пола или потолка, а, напротив, добавить их. Кстати, имеется мнемоническое правило для запоминания, когда следует применять полы, а когда— потолки: полуоткрытые интервалы, которые включают не правую, а левую конечную точку (такие, как 0 ^ 9 < 1), используются несколько чаще тех, которые включают правую точку, а не левую, так же как полы используются чаще потолков. Но по закону Мэрфи правило противоположно ожидаемому — потолки соответствуют интервалам [ос.. (3), а полы — интервалам (а.. (3]. Аналогичный анализ показывает, что закрытый интервал [ос.. (3] содержит ровно |_[3J — [ос] + 1 целых чисел, а открытый интервал (ос.. (3) — ровно [(3] — [ос\ — 1, но в последнем случае мы налагаем дополнительное ограничение ос ф (3, чтобы эта формула не смущала нас заявлением о том, что пустой интервал (ос.. ос) содержит —1 целых чисел. Подытожим найденные факты:
104 Целочисленные функции интервал количество целых чисел ограничение [а..р] LPJ-M+1 <*0> [а..(3) ГЭ1-М сх^ (3, (3.12) (а..р] LPJ-W сх^ (3, (а..|3) [Pl-L^J-1 сх < (3. А вот задача, от которой мы не сможем отказаться. В "Клубе конкретной математики" есть казино (только для покупателей этой книги), в котором имеется рулетка с колесом на тысячу гнезд, пронумерованных от 1 до 1000. Если при вращении колеса выпадает номер п, который делится на пол своего кубического корня, т.е. если L^J \ п, то это номер выигрышный, и казино платит нам 5 долларов; в противном случае это проигрышный номер, и мы платим 1 доллар казино. (Обозначение 'а\Ь', которое читается как "а делит Ъ" означает, что Ъ в точности кратно а; это отношение детально рассматривается в главе 4.) Можно ли "сделать деньги" играя в казино? Можно вычислить средний выигрыш— т.е. сумму, которую мы выигрываем (или теряем) за одну игру, — подсчитав сперва количество W выигрышных номеров и L = 1000 — W проигрышных. Если каждый номер выпадет по одному разу в серии из 1000 игр, мы выиграем 5W долларов и проиграем L долларов, так что средний выигрыш составляет 5W-L _ 5W-(1000-W) _ 6W-1000 юоо ~ Тооо " Тооо ' Если имеется не менее 167 выигрышных номеров, мы получаем прибыль, в противном случае выигрывает казино. Но как же нам подсчитать количество выигрышных номеров среди 1000? Несложно обнаружить закономерность. Номера от 1 до 23 — 1 —7 выигрышные, так как для каждого из них [y/ri\ = 1. Среди номеров от 23 = 8 до З3 — 1 =26 выигрышными являются только четные номера. Среди номеров от З3 = 27 до 43 — 1 =63— только те, которые делятся на 3, и т.д. Систематический анализ задачи возможен при помощи методов суммирования из главы 2 с привлечением записи Айверсона для логических выражений: Опрос в аудитории дал следующие результаты: 28 студентов отказались играть, 13 захотели рискнуть, остальные решили не отвечать на вопрос.
3.2 Применения пола и потолка 105 1000 Вот именно! Где, вы говорите, находится это казино? W = 2__ Еп— выигрышный номер] = Ц [L^J\n] = ?>=№][Пп][1^п^1000] = п=1 l^n.^1000 k,n = Y_ [k3^u<(k-H)3][n = km][1^u^1000] = k,m,n = 1 + ^[k3^km<(k+1)3][l^k<10] = k,m = l+^[me[k2..(lc+1)3A)][1^lc<lO] = k,m -1+ Y_ (Гк2 + Зк + 3 + 1/к]-Гк21) = 1^k<10 7 + 31 = 1+ ]T (3k + 4) = l + ^L_-9 - 172. 1<$k<10 Этот вывод заслуживает внимательного изучения. Обратите внимание, что в шестой строке использована наша формула (3-12) для количества целых чисел в полуоткрытом интервале. Единственная "сложность" состоит в рассмотрении при переходе от третьей строки к четвертой п = 1000 как отдельного случая. (Неравенство к3 <С п < (к+ I)3 нелегко объединить с неравенством 1 ^ п ^ 1000 при к = 10.) В общем случае граничные условия— одно из наиболее критичных мест при работе с суммами. В последней строке выясняется, что W = 172; следовательно, наш средний выигрыш в одной игре равен (6-172 — 1000)/1000 долларам, т.е. 3.2 цента. Можно ожидать, что, сделав 100 ставок по доллару, вы станете богаче примерно на 3.20 доллара (если, конечно, казино не сделает так, что одни числа будут более равны, чем другие). Задача о казино, которую мы только что так благополучно решили, представляет собой приукрашенную версию сухого вопроса "сколько целых чисел п, где 1 ^ п ^ 1000, удовлетворяют отношению Lv^vJ \ п?" Математически это два одинаковых вопроса. Однако иногда стоит приукрасить задачу. Мы воспользовались более богатым словарем ("выигрышные номера" и "проигрышные номера"), что помогло нам лучше понять происходящее. Обобщим задачу. Предположим, мы изменили 1000 на 1000000 или на еще большее число N (считаем, что у казино большие связи, и достать колесо побольше для него не проблема). Сколько выигрышных номеров имеется теперь? В этом случае вполне приемлемы те же рассуждения, что и ранее, но надо быть поосторожнее с самым большим значени-
106 Целочисленные функции ем к, которое мы для удобства обозначим как К: К = L^NJ • (Ранее К было равно 10.) Общее количество выигрышных номеров для произвольного N становится равным W = ?_ (3k + 4) + ^[K3^Km^N] = = l(7 + 3K + l)(K-1) + ^[mG[K2..N/K]] - m = §K2 + fK-4 + ^[™e[K2..N/K]]. m Мы знаем, что оставшаяся сумма равна |_N/KJ — [К2] + 1 = [N/KJ — К2 + 1; следовательно, формула W = |N/KJ + lK2 + §K-3, К = L^NJ (3.13) дает общий ответ для колеса с N гнездами. Первые два члена этой формулы приближенно равны N2/3 + 1]\]2/3 = |N2/3, а остальные члены при большом N оказываются гораздо меньшими. В главе 9 мы научимся выводить выражения наподобие W = fN^ + CKN1/3), где 0(N1//3) означает величину, не превосходящую некоторой константы, умноженной на N1/3. Какой бы ни была константа, мы знаем, что она не зависит от N; так что при большом N вклад О-члена в W будет мал по сравнению с |N2/3. Например, в следующей таблице показано, насколько значения |N2//3 близки к значениям W: N 1000 10000 100000 1000000 10000000 100000000 1000000000 §N2/3 150.0 696.2 3231.7 15000.0 69623.8 323165.2 1500000.0 W 172 746 3343 15247 70158 324322 1502497 Погрешность, % 12.791 6.670 3.331 1.620 0.761 0.357 0.166 Вполне нормальное приближение.
3.2 Применения пола и потолка 107 ...без нахождения общности... "Если х есть некоторое иррациональное число, меньшее единицы, то можно взять один из двух рядов величин т/х, т/(1 -х),где т — целое число; каждое число, принадлежащее к тому или иному ряду, и только оно одно, будет заключено между любыми двумя заданными последовательными числами" — Рэлей (Rayleigh) [304] Приближенные формулы полезны постольку, поскольку они проще формул с полами и потолками. Однако зачастую важна абсолютная точность, в особенности при малых значениях N, с которыми обычно приходится иметь дело на практике. Например, владелец казино может опрометчиво предположить, что при N = 1000 имеется только |N2/3 = 150 выигрышных номеров (в этом случае доход казино составил бы 10 центов). Завершим раздел рассмотрением так называемых спектров. Определим спектр действительного числа а как бесконечное мультимножество целых чисел Spec(oc) = {[_aj, |_2aJ, [Зое], ...}. (Мультимножество— это то же самое, что и множество, но оно может содержать повторяющиеся элементы.) Например, спектр 1 /2 начинается следующим образом: {0,1,1,2,2,3,3,...}. Легко доказать, что двух одинаковых спектров не существует, т.е. из а ф (3 следует Spec (ос) ф Spec(|3). Предположим без потери общности, что a < (3. Существует такое положительное целое число т, что тп(|3 — a) ^ 1. (В действительности таковым является любое целое m ^ [1/(|3 — сх)~|; но не будем постоянно хвастать нашим знанием полов и потолков.) Следовательно, т(3 — та ^ 1 и [m(3j > [maj. Таким образом, Spec((3) содержит менее га элементов ^ [mocj, в то время как Spec (ос) содержит их как минимум га. Спектры обладают рядом красивых свойств. Рассмотрим, например, мультимножества Spec(\/2) = = {1,2,4,5,7,8,9,11,12,14,15,16,18,19,21,22,24,...}, = {3,6,10,13,17,20,23,27,30,34,37,40,44,47,51,...}. Спектр Spec[\/l) легко вычислить на калькуляторе, а n-й элемент спектра согласно (з-б) ровно на 2п больше п-го элемента спектра Spec(\/2). Более внимательное рассмотрение показывает, что эти два спектра связаны гораздо более удивительным образом: похоже, что любое число, которого нет в одном спектре, имеется в другом, но никакое число не содержится одновременно в обоих спектрах! И это на самом деле так: положительные целые числа представляют собой объединение непересекающихся множеств Spec(\/2) и Spec(2 + у/2). Говорят, что эти спектры образуют разбиение (partition) положительных целых чисел.
108 Целочисленные функции Для доказательства этого факта подсчитаем, сколько элементов в множестве Spec (л/2) не превышают п и сколько таких же элементов в множестве Spec (2 + \/l). Если для любого п в сумме их окажется п, то эти два спектра и в самом деле образуют разбиение всех целых положительных чисел. Пусть а положительно. Количество элементов в Spec(oc), таких, что они ^ п, равно Верно: при возрастании п на 1 должно возрастать только одно из этих чисел. N(a,n) = ^[|kaj^n] = k>0 = H[l>aJ<* + i] = k>0 = Jjkoc<n+1] = k>0 = ^T[0<k<(n+1)/cx] k = r(n+1)/al-1. (3.14) Два момента в этом выводе особенно интересны. Во-первых, в нем для замены (^' на '<' используется правило га ^ п га < п+1, тип— целые, (3.15) так что в соответствии с (3.7) можно убрать скобки пола. Во- вторых, и это более тонкий момент, суммирование выполняется по всем к > 0, а не к ^ 1, поскольку величина (п + 1 )/ос может быть меньше 1 при определенных тг и а. Если попытаться применить (з-12) для определения количества целых чисел в интервале [1 .. (п + 1 )/ос), в отличие от количества целых чисел в интервале (О .. (п+1 )/а), то получится верный ответ, но вывод при этом окажется неверен в силу несоблюдения условий его применимости. Итак, у нас есть формула для N(a,n). Теперь можно проверить, образуют ли Spec(\/2) и Spec(2 + \/1) разбиение положительных целых чисел, путем проверки, выполняется ли соотношение М(л/2,п) + N(2 + л/2,п) = п для всех целых чисел п > О, используя для этого (з-14): п+1 у/1 1 + п+1 ~7Г п+1 2 + х/2 + п+1 2 + х/2. п = п согласно (3.2)
3.2 Применения пола и потолка 109 п+1 Ш+ п+1 Г п+1 1 , пЧ Н т= — ^ т= г = п- согласно (з-о). 2 + ^/2 l2+>/2J V ^ Все упрощается благодаря изящному равенству 1 1 ~7= + 7= = 1 ) л/2 2 + л/2 так что наше условие сводится к проверке, верно ли, что Ш+{??}- для всех п > 0. А это верно, потому что перед нами дробные части нецелых чисел, которые в сумме дают целое число п + 1. Значит, мы действительно имеем дело с разбиением. 3.3 Рекуррентности с полом и потолком Полы и потолки добавляют новое интересное измерение в изучение рекуррентных соотношений. Давайте для начала рассмотрим рекуррентность К° = ] ; (3-16) Кп+1 = 1 + min(2K|_n/2j,3KLn/3j) при п^О. Так, например, Ki равно 1 +min(2Ko,3Ko) = 3, а начало последовательности имеет вид 1, 3, 3, 4, 7, 7, 7, 9, 9, 10, 13, ... . Один из авторов этой книги с присущей ему скромностью решил назвать эти числа числами Кнута. В упр. 25 требуется доказать или опровергнуть, что Кп ^ п при всех п ^> 0. Первые несколько перечисленных чисел К удовлетворяют этому неравенству, так что, похоже, оно может выполняться и в общем случае. Давайте попробуем доказать его по индукции. База индукции при п = 0 непосредственно следует из определения рекуррентности. Для шага индукции предположим, что неравенство выполняется для всех значений до некоторого фиксированного неотрицательного п, и попытаемся показать, что КпЧ_1 ^ п + 1. Из рекуррентного соотношения нам известно, что Kn+i = 1 +min(2K|_n/2j,3K|_n/3j). Гипотеза индукции гласит, что 2K^n/2j ^ 2\_п/2\ и 3K|_n/3j ^ 3|_п/3_|. Однако 2|n/2J может быть равным самое меньшее п — 1, а 3 |_n/3J может быть равным самое меньшее п—2. Самое большее, что нам удается заключить из гипотезы индукции,— это то, что Kn+i ^ 1 + (п — 2), но этого чуть-чуть не хватает до Kn+i ^ п + 1.
110 Целочисленные функции Теперь у нас есть причины усомниться в верности неравенства Kn ^ п, так что давайте попробуем его опровергнуть. Если нам удастся найти такое п, что либо 2K|_n/2j < п, либо ЗК^п/з] < п, — другими словами, такое, что KLn/2j < ti/2 или KLn/3J < п/3, то мы получим Kn+i < п + 1. Возможно ли это? Ответ мы пока что не дадим, чтобы не портить впечатление от упр. 25. Рекуррентные соотношения с полами и/или потолками часто возникают в информатике; это связано с тем, что масса алгоритмов основана на принципе "разделяй и властвуй" которые часто сводят задачу размера п к решению аналогичных задач меньших размеров, являющихся долями п. Например, один из способов отсортировать п записей (где п > 1) состоит в разделении их на две примерно равные части, одну — размером |"п/2] и вторую — размером [п/2\. (Между прочим, формула п = Гп/21 + [п/2\ (3.17) часто оказывается очень кстати при решении такого рода задач.) После того, как каждая из частей отсортирована по отдельности (тем же рекурсивно примененным методом), их можно объединить в требуемом порядке, выполняя не более п — 1 сравнений. Таким образом, общее количество сравнений не превышает f(n), где f (n) - f (Гп/21) + f (Ln/2J) + n - 1 при n > 1. l3<1 J Решение этой рекуррентности приводится в упр. 34. Задача Иосифа из главы 1 содержит подобную рекуррентность, которую можно привести к виду Ю) = 1; J(n) = 2J(|n/2J)-(-1)n прип>1. Теперь мы уже оснащены гораздо большим количеством методов по сравнению с главой 1, так что давайте рассмотрим более приближенную к реальности задачу Иосифа, в которой убивают каждого третьего, а не второго. Если применить методы из главы 1 к этой более сложной задаче, то мы придем к рекуррентности вида b(n) = ([fj3(LfnJ)+an] modn)+1,
3.3 Рекуррентности с полом и потолком 111 где 'mod'— это функция, с которой мы вскоре познакомимся, aQn = —2, +1 или — j соответственно при n mod 3 = 0, 1 или 2. Но на эту рекуррентность страшно даже смотреть, не то что ее решать. Есть и другой подход к задаче Иосифа, который приводит к более благоприятной ситуации. Всякий раз, когда счет пропускает человека, оставляя его на этом круге в живых, ему можно присваивать новый номер. Таким образом, 1-й и 2-й человек становятся n+1-ми п + 2-м, затем 3-го казнят; 4-й и 5-й становятся п + З-м и п + 4-м, затем 6-го казнят; ...; Зк+ 1-й и Зк + 2-й становятся п + 2к+1-м и п + 2к+2-м, затем Зк+З-го казнят; ...; затем Зп-го казнят (или он остается в живых). Например, при п = 10 перенумерация имеет следующий вид: 123456789 10 11 12 13 14 15 16 17 18 19 20 21 22 25 27 4 13 19 23 26 28 29 30 5 14 20 24 Казнимый k-м человек прекращает существование вместе с номером Зк. Так что можно вывести, кто спасется, если определить исходный номер человека с номером Зп. Если N > п, то жертва с номером N должна была иметь некоторый предыдущий номер, найти который можно следующим образом: поскольку N = п + 2к + 1 или N = п + 2к + 2, то к = |_(N— п— 1 )/2\. Предыдущий номер был соответственно Зк+1 или Зк + 2. То есть он был равен Зк + (N — п — 2к) = к + N — п. Следовательно, номер спасшегося }з(тг) можно вычислить следующим образом: N := Зтг; х, ,N-n-1 пока N > тг, выполнять N := Ь(п) := N. + N-u; "Not too slow, _ _ , , not too fast" ^то не аналитическая запись |з(тг) и даже не рекуррентное соот- — Л. Армстронг ношение. Но как минимум это алгоритм, который при большом п (L. Armstrong) позволяет достаточно быстро получить интересующий нас ответ.
112 Целочисленные функции К счастью, имеется возможность упрощения этого алгоритма путем использования переменной D = Зп + 1 — N вместо N. (Это изменение соответствует присвоению номеров, уменьшающихся от Зп до 1 вместо увеличивающихся от 1 до Зп.) Тогда усложненное правило присвоения значений N приобретает вид D := Зп+1 - = n+D- ( 1 (Зп+1-D)- a-D 2 2 = D- а-1 -D \ 4- 1 Зп 4- 1 Г = D+ "D" У т Ы!°1> и алгоритм можно переписать следующим образом: D := 1; пока D ^ 2п, выполнять D }з(п) := Зп+1 -D. [ID]; Ага! Это уже гораздо лучше, так как п очень просто входит в вычисления. Фактически, при помощи аналогичных рассуждений можно показать, что если уничтожается каждый q-й человек, то номер уцелевшего Jq(n) можно вычислить следующим образом: D := 1; пока D ^ (q — 1)п, выполнять D := |"-^yD] ; (з^Э) Jq(n) := qn+1-D. В случае q = 2, который хорошо нам знаком, D растет до 21тН~1 прип = 2m+l; следовательно, }2(n) = 2(2m+l) + l-2m+1 = 21+1. Отлично. В (3.19) вычисляется последовательность целых чисел, которая может быть определена при помощи следующего рекуррентного соотношения: (я) _ о D(q) D^=1 -D(q) при n > 0. (3.20) Непохоже, чтобы эти числа были как-то связаны с известными функциями простым образом, за исключением q = 2; следовательно, вряд ли удастся найти для них приемлемую аналитическую запись. Но если принять последовательность Dnq как "известную" то решение обобщенной задачи Иосифа очень легко описать: номер спасшегося Jq(n) равен qn + 1 — Dj^ , где к— наименьшее возможное число, такое, что DJ^ > (Ч ~~ "I )п- Знакома ли вам так же хорошо оценка 2 ? "Известную", как, например, гармонические числа. Э. М. Одлыжко (А. М. Odlyzko) и Г. С. Вильф (И. S. Wilf) показали [283], что Di,3) = Lt!)ncj, где Си 1.622270503.
3.4 'MOD': бинарная операция 113 3.4 'MOD': бинарная операция Откуда взялось название «'mod': бинарная операция» ? Вы узнаете это в следующей главе. Остерегайтесь языков программирования, в которых используется иное определение. (В частности, это относится к языкам программирования С и C++. — Переводчик) Может, назвать его мофигом?* Если га и п — целые положительные числа, то частное от деления п на га равно |_n/mj. Полезно ввести простое обозначение и для остатка от этого деления. Обозначим его 'n mod га'. Основная формула п = га |_n/raj + n mod га частное остаток гласит, что можно выразить n mod та как п — m|_n/mj. Можно обобщить эту формулу и на отрицательные целые числа, а фактически и на произвольные действительные числа: х mod и = х - у [х/у\ при у ф 0. (3-21) Тем самым 'mod' определяется как бинарная операция, такая же, как сложение или вычитание. Неформально математики давно пользуются mod, вычисляя различные величины по модулю 10, по модулю 2тг и т.д., но формально это обозначение утвердилось только в последние десятилетия. Так что это— новое обозначение для старого понятия. Можно легко уловить смысл х mod у для положительных действительных чисел х и у интуитивно. Представим себя бегуном по окружности длиной у, точкам которой назначены действительные значения из интервала [0..у). Если пройти по окружности расстояние х, начиная с точки 0, то мы окажемся в точке х mod у. (При этом мы |_x/uj раз пройдем через точку 0.) При отрицательных х или у следует внимательно рассмотреть определение операции, чтобы точно понять, что же в этом случае означает операция 'mod'. Вот некоторые примеры с целыми значениями: 5 mod 3 5 mod —3 —5 mod 3 ¦5 mod —3 = = = = 5- 5- -5 -5 3L5/3J (-3)L5/(-3)J -3L-5/3J -(-3)L-5/(- ¦3)J = = = = 2, -1, 1, -2. Число после 'mod' называется модулем; как называть число перед 'mod', пока что не придумали. В приложениях модуль * В оригинале— "modumor" Непереводимая игра слов, основанная на созвучии второй части слова "модуль" (modulus) слову "less" (меньше), а второй части слова "modumor"— слову "more" (больше).— Переводчик
114 Целочисленные функции обычно положителен, но данное выше определение сохраняет смысл и при отрицательных значениях. В обоих случаях значение х mod у находится между О и модулем: О ^ х mod у < у О ^ х mod у > у при у > О, при у < 0. Но что делать с у = 0? Определение (3*21), чтобы избежать деления на 0, оставляет данный случай неопределенным, но для полноты можно определить х mod 0 = х. (3.22) Нет модуля—нет Это соглашение сохраняет то свойство, что х mod у всегда отличается от х на величину, кратную у. (Может показаться более естественным сделать эту функцию непрерывной в 0 при помощи следующего определения: х mod 0 = lim^^o х. mod у = 0. Но в главе 4 мы увидим, что это сделало бы ее менее полезной. Непрерывность— не самый важный аспект операции mod.) Мы уже сталкивались с одним замаскированным частным случаем операции mod, когда записывали число х в виде суммы его целой и дробной частей: х = [х\ + {*}. Дробная часть может быть записана также как х mod 1, потому что х = |_х] + х niod 1 . Обратите внимание, что в этой формуле круглые скобки не нужны: считается, что знак связывает операнды сильнее, чем знаки сложения и вычитания (т.е. приоритет этого оператора выше приоритетов операторов сложения или вычитания.— Примеч. пер.). При определении операции mod использовалась функция "пол" в то время как функция "потолок" такого внимания не была удостоена. Возможно, стоило бы воспользоваться функцией "потолок" для определения аналога операции mod наподобие х mumble у = у [х/у] — х. ("Mumble" — нечленораздельное бормотание (англ.).— Примеч. пер.) В случае нашей аналогии с бегом по кругу это соответствует расстоянию, которое осталось пробежать бегуну, преодолевшему расстояние х, чтобы попасть в исходную точку 0. Но, конечно же, требуется более подходящее название, чем 'mumble'. Впрочем, если бы нашлось применение этой операции, за названием дело бы не стало... и операции1. — Переводчик В 1970-е годы был популярен стиль "mod" Может, стоит назвать новую функцию не "mumble'; a "punk" (панк)? Нет— я автор, как хочу, так и называю! Мне нравится "mumble".
3.4 'MOD': бинарная операция 115 Дистрибутивный закон представляет собой наиболее важное алгебраическое свойство операции mod: c(xmody) = (ex) mod (су) (3-23) Заметим, что х mumble у (—х) mod у. для всех действительных с, х и у. (Если кто-то предпочитает считать, что оператор mod связывает операнды слабее умножения, он может убрать скобки из правой части равенства.) Этот закон легко доказать, исходя из определения (3-2i), так как с(х mod у) = с(х —у [x/yj) = сх — су [cx/cyj = ex mod су , А попросту- в остатке? если су ф 0; случаи с нулевыми модулями тривиальны. Приведенные ранее четыре примера с ±5 и ±3 дважды иллюстрируют этот закон при с = — 1. Тождество типа (3-23) действует успокаивающе, ибо оно позволяет надеяться, что операция 'mod' определена надлежащим образом. В оставшейся части этого раздела мы рассмотрим приложение операции 'mod', в котором она оказывается весьма полезной, хотя и не играет центральной роли. Рассматриваемая задача часто возникает в многочисленных ситуациях, когда надо максимально равномерно разбить п предметов на га групп. Предположим, например, что у нас есть п коротких строк текста, которые надо разместить в m столбцах. По эстетическим соображениям желательно, чтобы столбцы располагались в убывающем по высоте порядке (фактически— в неубывающем порядке) и чтобы высота столбцов была примерно одинакова — никакие два из них не должны отличаться по высоте более чем на одну строку текста. Если 37 строк текста разбиваются на пять столбцов, то предпочтительно такое их размещение, как показано справа: 8 8 8 7 line 1 1 Ппе2 1 НпеЗ 1 line 4 1 line 5 1 line6 1 line 7 1 line8 1 inc9 1 ine 10 1 inell 1 ine12 1 ine 13 1 ine 14 ] ine 15 1 ine 16 1 ine 17 1 ine 18 1 ine 19 1 ine20 1 ine21 1 ine22 1 ine 23 1 ine24 1 ine 25 li ine26 li ine 27 li ine28 li ine 29 li ine 30 ine31 ine32 ne33 ne34 ne35 пеЗб ne37 line 1 1 line 2 1 НпеЗ 1 line 4 1 Hne5 1 HneG 1 line 7 1 line 8 1 ine 9 ine 10 ine 11 ine 12 ine 13 ine 14 ine 15 ine 16 ine17 1 ine 18 1 ine 19 1 ine 20 1 ine21 1 ine22 1 ine23 1 ine 24 li ine 25 li ine 26 li ine 27 li ine28 li ine29 li ine 30 li 7 ne31 ne 32 ne33 ne34 ne35 пеЗб ne37 Кроме того, хотелось бы распределить строки текста "постолбцо- во" т.е. вначале решается, сколько строк будет в первом столбце, затем— во втором, третьем и так далее в соответствии с порядком чтения текста человеком. Построчное распределение автоматически приведет к требуемому размещению, но порядок чтения строк при этом окажется нарушенным (мы получили бы нечто
116 Целочисленные функции подобное размещению справа, но в первом столбце были бы строки 1, 6, 11, ..., 36, а не 1, 2, 3, ..., 8, как должно быть). Построчную стратегию распределения использовать нельзя, но она позволяет определить,сколько строк разместится в каждом столбце. Если п не кратно га, то в процессе построчного размещения выясняется, что длинные столбцы должны содержать по |~тг/га~| строк, а короткие— по Ltl/ttlJ . Длинных столбцов будет ровно тг mod га (и, как выясняется, ровно тг mumble га коротких). Давайте обобщим терминологию и поговорим о 'предметах' и 'группах' вместо 'строк' и 'столбцов'. Только что мы выяснили, что первая группа должна содержать [п/га] предметов; следовательно, можно попробовать такую схему последовательного распределения: для распределения п предметов по га группам при га > 0 поместим [п/га] предметов в одну группу, а затем рекурсивно применим ту же процедуру к остальным п' = п— [п/га] оставшимся предметам для их размещения в га' = га — 1 прочих группах. Например, если п = 314, а га = 6, то распределение выполняется следующим образом: Оставшиеся Оставшиеся предметы группы [ Предметов в группе] 314 6 53 261 5 53 208 4 52 156 3 52 104 2 52 52 1 52 Как видите, схема работает— мы получаем группы практически неизменного размера, несмотря на то, что делитель изменяется. Почему она работает? В общем случае можно предположить, что n = qra+r, где q = [тг/raj и г = тг mod га. Если г = 0, процесс размещения прост: мы помещаем |~тг/га] = q предметов в первую группу и заменяем тг на тг' = тг— q, оставляя тг' = qm' предметов для размещения в остальных га' = га— 1 группах. Если же г > 0, мы помещаем |~u/m] = q + 1 предметов в первую группу и заменяем тг на тг' = тг — q — 1, оставляя тг' = qra' + г — 1 предметов для последующих групп. Новый остаток г' = г — 1, a q остается тем же самым. Отсюда следует, что получится г групп с q + 1 предметами, за которыми следуют та — г групп с q предметами. Сколько предметов окажется в k-й группе? Для ответа на этот вопрос нам нужна формула, которая давала бы [п/га] при
3.4 'MOD': бинарная операция 117 к ^ n mod га и |_n/mj в противном случае. Нетрудно убедиться, что требуемым условиям отвечает формула п-к+1 га поскольку она сводится к q + \{т — к -Ь 1 )/ra], если, как и в предыдущем абзаце, записать п = qra + r (здесь q = |_n/mJ)- Получаем, что \{r — k+ 1)/ra] = [к^г], если 1 ^к^ттги0^г<ттг. Следовательно, можно записать следующее тождество, которое выражает разбиение тг на га как можно более равных частей в не- возрастающем порядке: тг = тг" ттг + Гтг-11 ттг + ¦ • + "тг — ттг+ 1" ттг (3-24) Это тождество справедливо при любом целом положительном ттг и при любом целом тг (положительном, отрицательном или нуле). Мы уже сталкивались со случаем га = 2 в (з-17)> хотя и записанном в несколько ином виде: тг = |"тг/2] + [п/2\ • Если бы мы пожелали, чтобы все части располагались в неубывающем порядке— когда меньшие группы предшествуют большим,— можно было бы действовать тем же способом, но с |_n/raj предметами в первой группе, получая соответствующее тождество Некоторые утверждают, что слишком опасно заменять что-либо на тах. (Имеются в виду ракеты MX. — Переводчик) п = п — m + п+1 ттг + ¦ • + тг + га— 1 га (3-25) Тождества (3-25) и (3-24) можно преобразовывать друг в друга, пользуясь либо соотношением (34)1 либо тождеством из упр. 12. Теперь, если в (3-25) заменить п на [rrixj и применить правило (з-и) АЛЯ удаления полов внутри полов, то получится тождество, выполняющееся при всех действительных х: [mxj = L*J + х + 1 ra + ••• + х + ra— 1 ra (3.26) Это в некоторой степени удивительный результат, так как функция "пол" является целочисленной аппроксимацией действительной величины, и тем не менее единственное приближение слева оказывается равным сумме целого набора приближений справа. Если считать, что |_xj — это, грубо говоря, в среднем х — \, то левая часть в грубом приближении равна rax— А, а правая оказывается равной [х- 1 + (х- 1 + 1 + ••• + (*- 1 + т-1 тх- 2)~г\^ 2^т^пг^ 2 И вот— сумма этих грубых приближений оказывается точной величиной!
118 Целочисленные функции 3.5 Суммы с полами и потолками Уравнение (з-2б) демонстрирует, что в аналитическом виде можно получить по крайней мере один вид сумм со скобками |_ J • Есть ли другие виды? Есть. Обычно применяемая в таких случаях уловка состоит в том, чтобы избавиться от пола или потолка, введя новую переменную. Рассмотрим, например, можно ли получить сумму 0^k<u в аналитическом виде. Идея заключается во введении переменной га = [у/к\; это можно сделать чисто "механически" действуя так же, как в задаче с рулеткой: Y_ [Vk\ = Y_ rn[k<n][m=[y/k\] = 0^k<n k,m^0 = Y_ m[k<n][m^\/k<m+l] = k,m^0 = Y_ m[k<n][m2^k<(m+1)2] = k,m^O = ^T m[m2^k<(m+1)2^u] + k,m^0 + Y_ m[m2^k<n<(m+l)2] . k,m^O И вновь определенные трудности вызывают граничные условия. Допустим сначала, что п = а2 — точный квадрат. Тогда вторая сумма равна нулю, а первая может быть вычислена по обычному правилу: Y_ m[m2^k<(m+1)2^a2] = k,m^O - ^m((m+1)2-m2)[m+1^Q] = = ^m(2m+1)[m<a] = = Y_ (2m^ + 3mi)[m<a] - = ^.Q(2m^ + 3m1)6m = = §a(a-1)(a-2) + fa(a-1) = l(4a+1)a(a Убывающие степени убивают сумму.
3.5 Суммы с полами и потолками 119 В общем случае можно положить а = [v^Jj тогда нужно всего лишь сложить члены при а2 ^ к < п, причем все они равны а, так что сумма оказывается равной (п — а2)а. Это дает нам искомый аналитический вид L L^J 1 „2 Ь a=h/nj. (3-27) 0^k<n Другой подход к вычислению таких сумм состоит в замене выражения вида |_х_| на ]ГЛ1 ^ j ^х]; это всегда законно при х ^> 0. Вот как работает этот метод при вычислении суммы [квадратных корней], если для удобства считать, что п = а2: Y_ Lv^J = Х[1^^л/^ио^к<а2] = 0^к<п ЗЛ = Y. Цо2^к<а2] = 1^j<a к = х_ (q2-j2) = а3 la(a+l)(a+1] 1^j<a Вот другой пример, в котором замена переменной приводит к преобразованной сумме. Примерно в одно и то же время в 1909 году независимо друг от друга три математика— Боль (ВоЫ) [34], Серпиньски (Sierpinski) [326] и Вейль (Weyl) [368] — обнаружили замечательный факт: если а иррационально, то при п —> со числа {not} в высшей степени равномерно распределены между 0 и 1. Одна из формулировок звучит следующим образом: lim — n—>оо 1Т ?_ f({k«}) Н 0^к<п f (х) dx (3-28) Внимание: это достаточно сложный материал. При первом чтении лучше бегло проскочить следующие пару страниц: они не так существенны. — Сочувствующий ассистент На взлет! при любом иррациональном а и любой ограниченной функции f, которая непрерывна почти везде. Например, среднее значение {па} можно найти, положив f(x) = х. Мы получим значение \. (Именно этого и следовало ожидать; но приятно знать, что это верно независимо от того, чему именно равно иррациональное число ос.) Теорема Боля, Серпиньски и Вейля доказывается путем аппроксимации f (х) сверху и снизу "ступенчатыми функциями" которые являются линейными комбинациями простых функций fv(x) = [0^x<v] при 0 ^ v <^ 1. Наша цель состоит не в том, чтобы доказать теорему, — это дело других книг по матанализу. Мы же попробуем
120 Целочисленные функции выяснить фундаментальные причины, по которым она справедлива, рассмотрев частный случай f (х) = fv(x). Другими словами, давайте попытаемся выяснить, насколько близка сумма Y_ [{ka}<v] 0$ck<n к "идеальному" значению nv при большом п и иррациональном ос. Для этой цели мы определим отклонение D(a,n) как максимальное абсолютное значение по всем 0 ^ v ^ 1 суммы sla,TLV = ? ([{ka}<v]-v). (3.29) 0^k<n Наша задача— показать, что D(a,n) "не слишком велико" по сравнению с п, показав, что величина IsCoc, rt, v)| всегда достаточно мала при иррациональном ос. Без потери общности можно считать, что 0 < ос < 1. Сначала можно переписать sfa^v) в более простом виде, а затем ввести новую индексную переменную у. Y_ ([{ka}<v]-v) = ?_ ([kaj-[kcx-vj-v) - 0^k<n 0^k<n = —nv + У~ У" [ka — v < j ^ ka] = 0^k<n j = -TLV+ Y_ X. Da_1 ^k< 0 +V)a_1] ' 0^j<|"n<x] k<n Если нам повезет, мы сможем просуммировать по к. Но прежде стоит ввести некоторые новые переменные, чтобы привести эту формулу к приличному виду. Положим a = |a_1J, Ъ = [voT1!, a va a + a , а V Таким образом, a' = {a-1}— это дробная часть a-1, mumble-дробная часть va-1. И вновь единственный источник неприятностей— это граничные условия. Давайте пока забудем об ограничении 'к < п' и вычислим сумму по к без него: ^[kefja-^.O+v)*"1)] = [0+v)(a+a')l-[j(a+a')l = = b+na'-v'l-rja'l- Знакомо: именуй и властвуй. Главное здесь — замена переменной к на j. — Сочувствующий ассистент
3.5 Суммы с полами и потолками 121 Запись {0 или 1} означает нечто, равное О либо 1 ; нет смысла связывать себя деталями, не имеющими никакого значения. Все просто; теперь выполняем подстановку s(a,n,v) — = -nv+[na]b + Y_ (rJa-v'l-rJa'lJ-S, (З-Зо) 0^j<|"ncxl где S — поправка для случаев к ^> п, которые мы не смогли исключить. Величина ja' будет целой только при j = 0, поскольку а (а значит, и ос') иррационально; величина ja' — v' будет целой не более чем для одного значения j. Так что можно заменить "потолочные" члены "половыми": = -uv+[ua]b- Y_ (1]к'l-ljot'-v'\)-S+{0 жли 1}. 0^j< [net] Интересно. Вместо аналитического вида мы получаем сумму, которая имеет вид, похожий на s(a,n,v), но с иными параметрами: а' вместо а, [па] вместо п и v' вместо v. А что если получить рекуррентное соотношение для s{a)n^v)1 которое, как мы надеемся, приведет к рекуррентному соотношению для отклонения D(a,n)? Это означает, что мы хотим ввести в действие сумму s(a\\na\,v') = Y. (Ua'J-LJa'-v'J-v'), 0^j<fnal получая рекуррентность s(a,n,v) = = — nv-f [na]b — [na]v' — s(a', [na],v') — S + {0 или 1}. Вспоминая, что b— v' = va_1, мы обнаруживаем, что все прекрасно упростится, если мы заменим [па] (Ъ— v') на na(b— v') — nv: s(a>n,v) = — s(a', [nocljv') — S + e + {0 или 1}. Здесь e— положительная ошибка, меньшая va_1. В упр. 18 доказывается, что подобно ей S лежит в пределах от 0 до [va_1]. Можно также удалить из суммы член j = [na] — 1 = [_rtcxj, поскольку его внесение в сумму— либо v', либо v' — 1. Следовательно, если мы берем максимум абсолютных значений по всем v, то получаем D(a,n) ^ D(a', [ocn\)-\-оГ^ + 2. (3-31) Методы, которые мы будем изучать в последующих главах, позволяют сделать из этого рекуррентного соотношения вывод
122 Целочисленные функции о том, что D(oc,n) всегда гораздо меньше п, если п достаточно велико. Следовательно, теорема (з-28) справедлива; однако сходимость к пределу не всегда очень быстрая (см. упр. 9.45 и 9.61). Ну вот, это было всего лишь небольшое упражнение по работе с суммами, полами и потолками. Читателям, не приученным "доказывать, что погрешности невелики" трудно поверить в то, что у кого-то хватает смелости не отступать перед такими страшными суммами. На самом деле второй взгляд показывает, что все это вычисление пронизывает одна простая мысль. Основная идея в том, что некоторая сумма slot,nyv) из п членов может быть сведена к аналогичной сумме из не более чем [an] членов. Все остальное сводится на нет, за исключением небольшого остатка, образованного из близких к граничным членов. Вдохните поглубже — сейчас мы вычислим еще одну сумму, которая, несмотря на свою нетривиальность, обладает тем преимуществом (по сравнению с только что вычисленной), что выражается в аналитическом виде, так что можно легко проверить полученный ответ. Теперь наша задача будет состоять в обобщении суммы в (з-2б). Нам требуется найти выражение для uk + x m m, n— целые, m > 0. Посадка Поиск этой суммы в аналитическом виде— крепкий орешек, разгрызть который потруднее, чем те, с которыми мы имели дело до сих пор (за исключением, возможно, задачи об отклонении, с которой только что расправились). Но эта задача настолько поучительна, что мы провозимся с ней до конца главы. Как обычно, особенно при решении трудных задач, начнем с рассмотрения простых крайних случаев. Частный случай п = 1 представляет собой тождество (з-2б), в котором х заменено на х/тп: ш И, как в главе 1, имеет смысл получить дополнительную информацию, обратившись к случаю п = 0: X — ra J + 1+х га + • • + га— 1 +х т X — raJ + X — LmJ + ¦ • + X — LmJ = т X — Lm У задачи два параметра— тип; давайте рассмотрим малые случаи для параметра т. При га = 1 сумма состоит из единственного члена [х\. Если же m = 2, сумма равна |_x/2J + |_(х + n)/2J. Можно избавиться от взаимодействия х и п, если вынести п за Это более твердая сумма полов или сумма более твердых полов? Предупреждаем: это только начало тянущегося до конца главы решения длинной и сложной задачи, для решения которой нет других поводов, кроме любопытства. — Студенты Можно согласиться. Но что это за поколение, которому всегда требуются практическая польза и прибыль? Неужели в вас умерла любознательность ?
3.5 Суммы с полами и потолками 123 Эта сумма возникает, например, при изучении и тестировании генерации случайных чисел. Но математики рассматривали эту сумму задолго до появления компьютеров, поскольку считали совершенно естественным поинтересоваться, нет ли способа просуммировать арифметическую прогрессию, "поставленную на пол" — Преподаватель "Пытливый ум требует приносящей удовлетворение умственной деятельности как необходимого условия его совершенствования. "Необходимость— источник открытий" — бесхитростная поговорка. "Необходимость— источник бесплодных усилий"— это гораздо ближе к истине. Основой роста современных открытий является наука, а наука почти целиком произрастает на почве удовлетворения собственного любопытства" — А.Н. Уайтхед (А. N. Whitehead) [371] знак функции "пол" но, чтобы сделать это, надо по отдельности рассмотреть случаи четного и нечетного п. Если тг четное, п/2 — целое число, так что можно вынести его за знак пола: + + п + п Если же п нечетное, то (п — 1 )/2— целое число, и мы получаем И х+1 + п- 1 W + п- 1 Последний шаг следует из (з-2б) при vn = 2. Эти формулы для четного и нечетного п немного напоминают формулы для п = 0 и 1, но ясной закономерности пока что не видно. Поэтому давайте продолжим рассмотрение малых случаев. При m = 3 сумма равна X и\ + х + п [ 3 J + х + 2п L з J и возможны три варианта для п: либо оно кратно 3, либо оно на 1 или на 2 больше кратного, т.е. n mod 3 = 0, 1 или 2. Если n mod 3 = О, то тг/3 и 2тг/3— целые числа, так что сумма равна циник + 2тг + п. Если тг mod 3 = 1, то (тг — 1 )/3 и (2п — 2)/3— целые числа, так что х L3J + х+1 + - п- 1 + х+2 2п-2 LxJ+n-1 Последний шаг опять следует из (з-2б), на этот раз при га = 3. И наконец, если n mod 3 = 2, то х L3J х+2 + - тг- + х+1 2п — Г. . . + —^— 1 = |л1+тг-1 Наши левые полушария мозга уже разобрались с га = 3, но правые пока отстают, так что рассмотрим случай ттг = 4: I? X 4J + х + п [ 4 \ + х + 2тг L 4 J + х + Зтг L 4 J Как минимум теперь мы знаем достаточно, чтобы рассмотреть случаи, основываясь на значении тг mod m. Если тг mod 4 = 0, то ш+(1?нК1а+тИ1а+т)-< х | Зтг
124 Целочисленные функции А если n mod 4 = 1, то х+1 х L4J + п-1 , + ^ 1 + 4 + 2п-2ч + —г- + х+3 х+2 4 Зп—3\ . . Зп. 3 + — =W + T-2 Случай п mod 4 = 3, оказывается, дает тот же ответ. Наконец, в случае п mod 4 = 2 мы получаем нечто несколько иное, оказывающееся важным ключом к установлению поведения в общем случае: + х+2 п-2 , +^ ) + = 2 4 х L4~J + 2п\ /Iх+2 L4J+TJ4[— х+2 |\ Зп_, _ 7 I * 2 1.2. Зп-2 +— Зп , +т-1. На последнем шаге выполняется упрощение выражения, имеющего вид |_y/2J 4- |_(У + 1 )/2J, что опять представляет собой частный случай (з«2б). Вот сводка значений нашей суммы при малых значениях га: га 1 2 3 4 п 2 mod га = X .2. п + 2 3Ш+» 4 X Л. Зп + т 0 п. mod m = 1 , . n 1 W + 2-2 LxJ + n - 1 . . 3n 3 n mod та = 2 LxJ + n - 1 2 X .2. Зп 1 n mod та . . 3n W + -y" = 3 3 2 Это выглядит так, как если бы у нас было нечто, имеющее вид х -<lJ а + bn + с, где а, b и с некоторым образом зависят от га и п. Даже близорукие могут увидеть, что Ъ, вероятно, равно (га— 1)/2. Труднее разглядеть выражение для а; но случай п mod 4 = 2 подсказывает нам, что, вероятно, а представляет собой НОД(т, п) — наибольший общий делитель га и п. Это не лишено смысла, так как НОД(га> п) — это тот множитель, который мы убираем из га и п при приведении дроби п/т к несократимой, а наша сумма включает в себя дробь п/т. (Операции с наибольшим общим делителем будут детально рассматриваться в главе 4.) Значение с кажется более загадочным, но будем надеяться, что оно получится при доказательстве наших предположений об а и Ь.
3.5 Суммы с полами и потолками 125 Вычисляя сумму при малых га, мы, по сути, переписали каждый ее член в виде x + kn m x + kn mod га га + kn kn mod га га га поскольку (kn — kn mod m)/m— целое число, которое может быть вынесено за скобки пола. Таким образом, исходную сумму можно развернуть в следующую таблицу: + 1 х 1 LmJ хН 1 х + n mod m 1 [ m J x + 2n mod m m (- (m— 1)nmod m m + + + + 0 m n m 2n m (m— 1)n m 0 mod m m n mod m m 2n mod m m (m— 1)n mod m m + При экспериментах с малыми значениями m эти столбцы приводили нас соответственно к а|_х/а_|, Ъп и с. В частности, теперь можно понять, откуда берется Ъ. Второй столбец представляет собой арифметическую прогрессию с известной нам суммой, которая равна среднему первого и последнего членов, помноженному на число членов: О- (га— 1)п га га (га— 1)п Так что наша догадка о том, что Ъ = (га— 1 )/2, проверена и подтверждена. Первый и третий столбцы так легко не сдаются; чтобы определить а и с, надо повнимательнее рассмотреть последовательность чисел О mod ra, n mod ra, 2n mod ra, (ra— l)n mod ra. Предположим, например, что ra = 12 и n = 5. Если представить эту последовательность в виде циферблата, то эти числа представляют собой 0 часов (примем 12 часов за 0), затем— 5 часов, 10 часов, 3 часа (= 15 часов), 8 часов и т.д. Оказывается, что каждый час встречается только один раз. Предположим теперь, что m = 12 и п = 8. Тогда данные числа представляют собой 0 часов, 8 часов, 4 часа (= 16 часов), но
126 Целочисленные функции затем 0, 8 и 4 повторяются. Поскольку 8 и 12 кратны 4 и числа начинаются с 0 (тоже кратного 4), вырваться из этого замкнутого круга невозможно— все числа должны быть кратны 4. В этих двух случаях мы имеем НОД(12,5) = 1 и НОД(12, 8) = 4. Общее правило, которое будет доказано в следующей главе, гласит, что если d = НС^ттцп), то мы получаем числа 0, d, 2d, ..., га— d в некотором порядке, за которыми следует еще d— 1 копий той же последовательности. Например, при га = 12 и п = 8 набор 0, 8, 4 встречается четыре раза. Первый столбец нашей суммы приобретает смысл. Он содержит d копий членов |_x/mJ > |_(х + d)/mj > • • •» 1_(х + m"~ d)/mj в некотором порядке, так что их сумма равна (Is m d d + x+d m x/d + ••• + x + m— d m/d LhJ- + x/d+ 1 m/d TTL + ••• + x/d + m/d - 1 m/d Здесь последний шаг заключается в еще одном применении (3.26). Наша догадка относительно а также проверена и подтверждена: а = d = НОД(ттцп). Как мы и предполагали, теперь мы можем вычислить с, поскольку третий столбец становится понятен — он содержит d копий арифметической прогрессии О/га, d/m, 2d/m, ..., (m— d)/m, так что их сумма равна Сначала лемма, затем дилемма. т- Поскольку в третьем столбце члены не складываются, а вычитаются, получаем d — га с = Чудеса и приключения закончены. Вот искомый аналитический вид: 0^k<m nk + x m = d x Ld m—1 d — m + -^^n 4- —-—.
3.5 Суммы с полами и потолками 127 где d = НОД(ттцп). Для проверки можно убедиться, что эта формула работает для частных случаев п = 0 и. п = 1, с которыми мы встречались ранее. При п = 0 мы получаем d = НОД(ггцО) = га; два последних члена обращаются в нуль, так что формула дает верный ответ га|_х/га_|. При п = 1 мы получаем d = НОД(ггц 1) = 1; два последних члена сокращаются, и сумма равна просто |_*J • Немного повозившись с аналитической записью, ее можно даже сделать симметричной относительно тип: пк + х т = d т-1 d —та 2 2 га—1)(п—1) га—1 d —га + (m-1)(n-1) d-1 + ^ + —zr- (3-32) Все, я повержен на Это немного неожиданно, поскольку нет никаких алгебраичес- пол- • • ких причин подозревать такую симметрию. Мы доказали "закон взаимности" 0^k<m nk + x га z 0^k<n rak + x n целые vn^n > 0. Например, если ra = 41 и n = 127, левая сумма состоит из 41 члена, а правая— из 127; но они остаются равными при любом действительном х. Упражнения Разминка 1 Анализируя задачу Иосифа в главе 1, мы представляли произвольное положительное целое число п в виде n = 2т 4-1, где 0 ^ I < 2т. Приведите явные формулы для I и га как функций от п с использованием скобок пола и/или потолка. 2 Какой вид имеет формула для ближайшего целого к данному действительному числу х? Приведите формулы, которые в случае "равновесия" когда х находится ровно посредине между двумя целыми числами, округляют результат (а) в сторону увеличения, до |"х]; (б) в сторону уменьшения, до |xj • 3 Вычислите [|_raajn/aj, где тип — положительные целые числа, а a— иррациональное число, большее п.
128 Целочисленные функции В главе описаны задачи с первого по пятый уровень. А что собой представляет задача нулевого уровня? (Кстати, это упражнение— задача не нулевого уровня.) Найдите необходимое и достаточное условие того, что |_nxj = п|_х_|, где п— положительное целое число. (Ваше условие должно включать {х}.) Что интересного можно сказать об [f (x)J, где f (х) — непрерывная монотонно убывающая функция, которая принимает целые значения, только когда х— целое число? Решите рекуррентное соотношение Хп = п при 0 ^ п < т; Хп = Хп_т + 1 при n ^ га. Докажите принцип ящиков Дирихле: если п предметов размещаются в га ящиках, то некоторый ящик должен содержать ^ |~n/m] предметов, а другой— ^ Ln/mJ предметов. Египетские математики в 1800 г. до н.э. представляли рациональные числа между 0 и 1 как сумму "единичных дробей" 1/хН Ы/xic, где все х— различные положительные целые числа. Например, они записывали ^ + -^ вместо |. Докажите, что всегда имеется возможность систематической записи следующим образом: если 0 < га/п < 1, то га 1 Г га 1 — = —Ь < представление n q ^ n q (Это алгоритм Фибоначчи, открытый Леонардо Фибоначчи (Leonardo Fibonacci) в 1202 году.) Обязательные упражнения 10 Покажите, что выражение "2х + Г 2 - "2х + Г 4 + 2х+1 4 всегда равно либо |_*J, либо |~х]. При каких условиях получается тот или иной случай? 11 Приведите детали представленного в тексте доказательства того, что открытый интервал (а.. (3) содержит ровно |~|3] — |_cxj — 1 целых чисел при а < (3. Почему для корректности доказательства нужно исключить случай ос = (3?
3 Упражнения 129 12 Докажите, что п + т—1 I т J при любом целом п и любом положительном целом та. (Это тождество дает другой способ превращения потолков в полы и обратно вместо применения рефлексивного закона (з-4)-) 13 Пусть ос и (3 — положительные действительные числа. Докажите, что Spec(oc) и Spec(|3) образуют разбиение всех положительных целых чисел тогда и только тогда, когда а и (3 иррациональны и 1/а+ 1/(3 = 1. 14 Докажите или опровергните: (х modny) mod у = xmodij при целом п. 15 Имеется ли тождество, аналогичное (з-2б), в котором вместо полов используются потолки? 16 Докажите, что n mod 2 = (1 — (—1 )п)/2. Найдите и докажите аналогичное выражение для п mod 3 вида а -Ь Ьшп + сси2п, где ш— комплексное число (—1 -Ы\/3 )/2. Указание: си3 = 1 и 1 + си + си2 = 0. 17 Вычислите сумму Xlo<k<ml_x + k/raj в случае х ^ 0 путем подстановки XI j П ^ j ^х + k/та] вместо |х 4- k/raj с последующим суммированием сначала по к. Согласуется ли ваш ответ с (3.26)? 18 Докажите, что остаточный член S в (з-3°) не превышает [ot_1v]. Указание: покажите, что малые значения ) не существенны. Домашние задания 19 Найдите необходимое и достаточное условие для действительного числа b > 1, такое, что [logbxJ = [logb|xJJ справедливо для всех х ^ 1. 20 Найдите сумму всех кратных х чисел в замкнутом интервале [ос.. (3] при х > 0. 21 Сколько чисел вида 2т, где 0 ^ га ^ М, начинаются в десятичной записи с цифры 1 ? 22 Вычислите суммы Sn = _]Lk>i Ln/^k + 1_| и ~ГП = ГП1 I ra I
130 Целочисленные функции 23 Покажите, что n-й элемент последовательности 1 22333444455555 равен [>/2n+ ^J • (Последовательность включает каждое число та ровно m раз.) 24 В упр. 13 установлено интересное соотношение между мультимножествами Spec (а) и Spec (а/(а — 1)), когда а— иррациональное число > 1, поскольку 1/а + (а — 1)/а = 1. Найдите (и докажите) другое интересное соотношение между мультимножествами Spec(a) и Spec(a/(oc+ 1)), где a— произвольное положительное целое число. 25 Докажите или опровергните, что числа Кнута (з«1б) удовлетворяют условию Кп ^ п для всех неотрицательных п. 26 Покажите, что вспомогательные числа Иосифа (з-2о) удовлетворяют неравенству 27 Докажите, что среди чисел D^ \ определенных в (з«2о), бесконечно много как четных, так и нечетных. 28 Решите рекуррентное соотношение ао = 1 ; an = an_i + U/an-iJ при n>0. 29 Покажите в дополнение к (з-З1)» что D(a,n) ^ D(aM_anJ) -a-1 -2. 30 Покажите, что рекуррентное соотношение Эта формула отклоняется от (З-З*)- Хо m /2 Х?_-, -2 при п>0 имеет решение Хп = \сс2 ], если m— целое число, большее 2, где a 4- a-1 = та и ос > 1. Например, если m = 3, то решением является хп = ГФ2 1, Ф = 1+V5 a Ф2 31 Докажите или опровергните, что [xj + [уJ + |_x + yJ ^ |2*J + L2yJ.
3 Упражнения 131 32 Обозначим расстояние от х до ближайшего целого как ||х|| = min(x — [xJ> М "~ х)- Чему равно значение kll2- JL*\\*/*\\ (Обратите внимание, что эта сумма может быть дважды бесконечной (в обе стороны). Например, при х = 1/3 члены ненулевые как при к —> —оо, так и при к —* +оо.) Контрольные работы 33 На шахматной доске размером 2n х 2п симметрично начерчена окружность диаметром 2тг — 1; вот какой вид это имеет при тг = 3: I I а Через сколько клеток проходит такая окружность? б Найдите функцию f (гц к), такую, что внутри данной окружности полностью помещается Ц^ f(n,k) клеток доски. 34 ПустьПп) = П=1Г^к1. а Найдите аналитический вид f (тг) для тг ^ 1. б Докажите, что f(n) = тг — 1 + f(|"тг/2"|) + f(|n/2J) для всех тг ^ 1. Упростите, но при 35 Упростите формулу [(п + 1 )2тг! ej mod тг. этом не измените ее значение. 36 В предположении, что тг— неотрицательное целое число, найдите аналитическое выражение суммы L 1 2Ligfcl4Ligig*J ' 1<k<2*n 37 Докажите тождество m + k | | к vj-i min(m mod тг, (—m) mod тг)'' тг для всех положительных целых чисел тип.
132 Целочисленные функции 38 Пусть хт, дество действительные числа, такие, что тож- Y_ Lm*kJ k=l та Y_ х* l^k^n выполняется для всех положительных целых чисел та. Докажите какое-нибудь интересное свойство xi, ..., хп. 39 Докажите, что двойная сумма Y_ Y. Г(х+л>к)/ък+11 O^k^logbx 0<j<b равна (b — 1) ([k>gb xj +1) + [x] — 1, для всех действительных чисел х ^ 1 при любом целом b > 1. 40 Спиральная функция ст(тг), схематически показанная ниже, отображает целое неотрицательное число п на упорядоченную пару целых чисел (х(тг),у(тг)). Например, она отображает п = 9 на упорядоченную пару (1,2). < 1 1 1 1 1 < » 1 » 1 > 1 > 1 > < > < > < - 2< > i 3 1 1 i > i 4 1 < > ' i < > i ¦1 > i 0 5 > i > < > < ,9 ¦ ¦8 ¦ 1 ( 7 6 1 1 » < 1 ( > ( 1 1 1 « 1 1 i 1 > > 1 > > > а Докажите, что если та = [y/ri\, то х(тг) = = (-1)m((n- та(та+ 1)) • [\1у/п\ четное] + \±т\) , и найдите аналогичную формулу для у(п). Указание: разбейте спираль на сегменты Wic, S^, Е^, N^ в зависимости от значения |_2\/i\j = 4k — 2, 4k — 1, 4k, 4k + 1. б Докажите, что, наоборот, можно установить значение п из значения а(п) при помощи формулы вида В южном полушарии люди используют спираль, закрученную в обратную сторону.
3 Упражнения 133 n = (2k)2±(2k + x(n) + y(n)), к = max(|x(n)|)|y(n)|). Укажите правило, когда вместо ± должен использоваться знак +, а когда— знак —. Дополнительные задачи 41 Пусть f и g— возрастающие функции, обладающие тем свойством, что множества {f(1)^(2),...} и {g(1), g(2),...} образуют разбиение всех положительных целых чисел. Предположим, что f и g связаны условием g(n) = f (f(n)) + 1 при всех п > 0. Докажите, что f(n) = |пф] и g(n) = |_пф2_|, где ф = (1+л/5)/2. 42 Существуют ли действительные числа а, (3 и у, такие, что Spec(a), Spec((3) и Spec(y) совместно образуют разбиение множества положительных целых чисел? 43 Найдите интересную интерпретацию чисел Кнута, разворачивая рекуррентное соотношение (з-1б). 44 Покажите наличие целых чисел а^4 и dn , таких, что a^4J = — = при n > 0, где Dn является решением рекуррентного соотношения (3-2о). Воспользуйтесь этим фактом для решения обобщенной задачи Иосифа: Jq(n) = l+d^ + qtu-a^) AA*aiqUn<a[q+V 45 Примените прием из упр. 30 для нахождения решения рекуррентного соотношения V0 = m, Yn = 2Y^_i - 1 при n > 0 в аналитическом виде, если га— положительное целое число. 46 Докажите, что если п = , где та и I — неотрицательные целые числа, то У2п[п+])\ = [(у/1 + л/2 ) raj. Используйте это замечательное свойство для поиска решения рекуррентного соотношения
134 Целочисленные функции Lq = а, целое а > 0; U = |_\/2Ln-i(U-i + 1)J дляп>0 в аналитическом виде. Указание: [^2x1(11 + 1)] = [V2(n+l)J. 47 Говорят, что функция f (х) репликативна, если она удовлетворяет условию f(mx) = f(x)+f(x+-)+..- + ffx+^zl>) \ та/ \ та / для любого положительного целого числа та. Найдите необходимые и достаточные условия, которым должно удовлетворять действительное число с, чтобы следующие функции были репликативны: a f(x) =х + с, б f(х) = [х + с целое], в f(x) = max([xj>c), г f (х) = х + с |_xj — \ [х не целое]. 48 Докажите тождество х3 = 3x[xLxJJ + 3{x}{x[xJ} + {х}3 - 3LxJ [xLxJJ + |xJ3 и покажите, как можно получить подобные формулы для хп при п > 3. 49 Найдите необходимое и достаточное условие, которому должны удовлетворять действительные числа 0^а<1и|3^0, так чтобы можно было определить а и (3 из бесконечного мультимножества значений { [пос\ + [tl(3J | п > 0 } . Исследовательские проблемы 50 Найдите необходимое и достаточное условие, которому должны удовлетворять действительные числа а и (3, чтобы а и (3 можно было определить из бесконечного мультимножества величин {[LnaJ(3j | п>0}.
3 Упражнения 135 Пусть х— действительное число ^ ф = ^(1 + у/5). Тогда решение рекуррентного соотношения Z0(x) = х, Zn(x) = Zn_i(x)2-1 нрип>0> может быть записано в виде Zn(x) = [f(x)2n], если х— целое число, где f(x) = lim Zn(x)1/2", П->00 так как в этом случае Zn(x) — 1 < f(x)2n < Zn(x). Какими другими интересными свойствами обладает функция f (х)? Для заданных неотрицательных действительных чисел а и (3 положим Spec(a;(3) = {[а+ |3J, |_2<х+ 0J, |_3а+ |3J,... }. Spec(a;(3)— мультимножество, которое обобщает мультимножество Spec(a) = Spec(a;0). Докажите или опровергните, что если m ^ 3 мультимножеств Spec(ai; |3i), Spec(oc2; (З2), ..., Spec(am; |3m) образуют разбиение всех положительных целых чисел и при этом параметры ои < <Х2 < - - < ост представляют собой действительные числа, то 2т -1 , , aic = 2к_ч при 1 ^ к ^ т. Алгоритм Фибоначчи (см. упр. 9) является "жадным" в том смысле, что на каждом шаге он выбирает как можно более малое q. Известен более сложный алгоритм, с помощью которого любая дробь тп/п с нечетным п может быть представлена как сумма различных базовых дробей 1/qi Н Ь 1/qic с нечетными знаменателями. Всегда ли заканчивается жадный алгоритм при поиске такого представления?
4 Теория чисел ЦЕЛЫЕ ЧИСЛА ЗАНИМАЮТ ЦЕНТРАЛЬНОЕ МЕСТО в дискретной математике, на которую делается особый упор в данной книге. Поэтому мы хотим рассмотреть теорию чисел— важный раздел математики, работающий со свойствами целых чисел. Мы немного заплывали в воды теории чисел в предыдущей главе, когда имели дело с бинарными операциями 'mod' и 'ИОД7. Другими словами, Теперь пришло время окунуться в них с головой... "не тратьте, куме, сили, спускайтеся на Ано!" 4.1 Делимость Говорят, что та делит п (или п делится на га), если m > 0 и отношение n/m представляет собой целое число. Это свойство лежит в основе всей теории чисел, так что стоит обзавестись для него специальным обозначением. Поэтому мы будем записывать m\n 4=? та > 0 и п = так при некотором целом к. (4.1) (В настоящее время в математической литературе более распространено обозначение 'mln', а не 'mXix'. Но вертикальная черта и так употребляется без меры— и для абсолютного значения, и для разделителей множеств, и для условных вероятностей и т.д., в то время как обратная косая черта явно недооценена. Помимо прочего, 'таХт^ создает впечатление, что та представляет собой знаменатель некоторого подразумеваемого отношения. Так что наклоним символ делимости немного влево.) Если та не делит п, мы пишем (mXTi\ Имеется аналогичное отношение "п кратно та" которое означает почти то же самое, за исключением того, что та не обязано быть положительным. Это просто означает, что тг = так для некоторого целого к. Так, например, существует только одно число, кратное 0 (а именно— 0), но ничто не делится на 0. Любое
138 Теория чисел целое число кратно —1, но, строго говоря, ни одно целое число не делится на — 1. Эти определения применимы, когда тип— произвольные действительные числа; например, 2я делится на п. Но мы почти всегда будем использовать их, когда тип представляют собой целые числа. В конце концов, мы занимаемся теорией чисел. Наибольший общий делитель двух целых чисел тип— наибольшее целое, которое делит их оба: НОД(ггцп) = max{k | к\т и к\п}. (4.2) Например, НОД(12,18) = 6. Это хорошо знакомое всем понятие, поскольку оно представляет собой не что иное, как общий множитель, который еще в младших классах учат выделять из дроби m/n, приводя ее к несократимому виду: 12/18 = (12/6)/(18/6) = 2/3. Обратите внимание, что если п > 0, то мы имеем НОД(0,п) = п, так как любое положительное число делит 0, an является наибольшим делителем самого себя. Значение НОД(0, 0) не определено. Еще одно хорошо знакомое понятие— наименьшее общее кратное HOK(m,n) = min{k | k > 0, m\k и n\k}; (4.3) при та ^ 0 или n ^ 0 оно не определено. Изучающие арифметику знают эту величину как наименьший общий знаменатель, к которому приводятся при сложении дроби со знаменателями тип. Например, НОК(12,18) = 36, так что даже ученики начальных классов знают, что -^ Ч- ^g = ^ + ^ = ^. Понятие НОК в чем-то похоже на понятие НОД, но мы не будем уделять ему такое же внимание, как и НОД, так как последний обладает рядом красивых свойств. Одним из наиболее привлекательных свойств НОД является простота его вычисления при помощи известного более 2300 лет метода под названием алгоритм Евклида. Для вычисления НОД(тгцп) для заданных значений 0 ^ m < п в алгоритме Евклида используется рекуррентность НОД(0,п) = п; НОД(тгцп) = НОД(п mod та, та) при та > 0. (4.4) Так, например, НОД(12,18) = НОД(6,12) = НОД(0,6) = 6. Указанная рекуррентность корректна, поскольку любой общий делитель тип должен быть общим делителем как та, так и п mod m, которое представляет собой n — |_n/mj та. Вряд ли имеется иная рекуррентность для НОК (та, п), которая хотя бы отчасти была столь же простой, как эта. (См. упр. 2.) В Великобритании он называется 'псГ (highest common factor), в США — lgcd' (greatest common divisor), в отечественной литературе- 'HOA1. Не пытайтесь искать наибольшее общее кратное.
4.1 Делимость 139 Алгоритм Евклида дает нам больше, чем просто НОД: его можно расширить так, что он будет вычислять целые числа та' ип', удовлетворяющие уравнению m'm+ п'п = НОД(ттцп). (4.5) (Не забывайте, что Вот как это делается. Если та = 0, мы просто выбираем та' = О тип могут ип' = 1. В противном случае мы полагаем г = п mod та и приме- быть отрицатель- ньши j няем метод рекурсивно — подставляя т и та вместо та и п и вычисляя f и та, такие, что тт +mm = НОД(т,та). Поскольку г = п — [тг/та]та и НОД(т,та) = НОД(ттцтг), это уравнение гласит, что т (п — |_n/mj та) + та та = НОД (та, п) Левую часть можно переписать, чтобы показать ее зависимость от та и п: (та— |n/mjr) та + гп = НОД(та,п); следовательно, та' = та— |n/mjr ип' = т— те целые числа, которые нужны в (4-б)- Например, в нашем любимом случае та = 12, п = 18 этот метод дает 6 = 0-0 + 1-6 = 1.6 + 0-12 = (-1) -12+1 -18. Но чем же так привлекательно уравнение (4-5)? Главным образом тем, что числа та' и п' фактически доказывают, что алгоритм Евклида дает правильный результат в каждом конкретном случае. Предположим, компьютер сообщил нам, что НОД (та, n) = d и что та'та + n'n = d, но мы относимся к этому с изрядной долей скепсиса и полагаем, что на самом деле имеется больший общий делитель, пропущенный машиной. Однако этого не может быть, так как любой общий делитель та и п должен делить та'та+n'n, а раз так, он должен делить и d; следовательно, он должен быть ^ d. Кроме того, легко убедиться, что d делит как та, так и п. (Алгоритмы, предоставляющие собственные доказательства верности результата, называются самоподтверждающими (self- certifying).) Мы будем много раз использовать (4.5) в оставшейся части этой главы. Одним из важных следствий этого уравнения является следующая мини-теорема: k\m и k\n 4=^ к\НОД(т,п). (4.6)
140 Теория чисел (Доказательство: если к делит и та, и п, то оно делит и m/m + n/n, а значит, оно делит и НОД (та, п). Обратно, если к делит НОД(тгцп), то оно делит делитель m и делитель п, так что оно делит и та, и п.) Мы всегда знали, что всякий общий делитель чисел та и п должен быть меньше или равен их НОД— по определению наибольшего общего делителя. Теперь мы знаем, что любой общий делитель является делителем их НОД. Иногда требуется просуммировать по всем делителям числа п. В этом случае зачастую полезно воспользоваться удобным правилом Y_ am = Y_ Qn/m) Целое n > 0, (4.7) m\n m\n которое выполняется, потому что n/та пробегает те же делители числа п, что и та. Например, при п = 12 это правило гласит, что а.1 + а2 + а3 + а4 + ав + а^ = аи + ав + а4 + а3 + а2 + си. Имеется также несколько более общее равенство X. Qm = X! Л am[n = mk], (4.8) m\n k m>0 которое является непосредственным следствием определения (4.1). Если п— положительное число, то правая часть (4.8) представляет собой X!k\n an/ki следовательно, из (4.8) вытекает (4-7)- Равенство (4.8) работает и при отрицательных п. (В таких случаях ненулевые члены справа появляются только тогда, когда к является отрицательным делителем п.) Кроме того, двойная сумма по делителям может быть "переставлена" по правилу m\n k\m k\n t\(n/k) Например, это правило при п = 12 приобретает следующий вид: ai,i + (а1>2 + а2|2) + (си,з + а3,з)+ + (а1>4 + а2,4 + 04,4) + (ai,6 + а2,б + а3,б + а6,6)+ + (ai,i2 + U2,12 + 0.3,12 + 04,12 + ^6,12 + CL12J2) = = (aij + а1)2 + ат,з + ai,4 + ai,6 + а1>12)+ + (а2,2 + а2,4 + а2,б + a2,i2) + (а3,з + а3>6 + а3,12)+ + (а4>4 + CL4,12) + Ыб,6 + 06,12) + ai2,i2 . Можно доказать (4.9) при помощи обозначения Айверсона.
4.1 Делимость 141 Левая сторона равенства представляет собой Y_ Ц ak,m[n = jm][m = kl] = ]Г X. ak,ki[n = j1cl], j,l k,m>0 j k,l>0 а правая — Y Y ak>kl[n = jk][n/k = ml] = ^ X. ak,ki[n = mlkb j>m k,l>0 m k,l>0 что то же самое, если не считать переименования индексов. Этот пример указывает, что изученные в главе 2 методы пригодны и при изучении теории чисел. 4.2 Простые числа Положительное целое число р называется простым, если оно имеет только два делителя, а именно— 1 и р. Везде до А 'р' в слове 'прос- конца данной главы буква р будет обозначать простое число, да- тое'? же если это не оговаривается явно. По соглашению 1 не является простым, так что последовательность простых чисел начинается так: 2,3,5,7, 11, 13, 17, 19,23,29,31,37,41, .... Некоторые числа кажутся простыми, но таковыми не являются, наподобие 91 (= 7-13) и 161 (= 7-23). Эти и другие числа, которые имеют нетривиальные делители, называются составными. Каждое целое число, большее 1, является либо простым, либо составным, но не тем и другим одновременно. Простые числа очень важны, так как они представляют собой "кирпичи" из которых строятся все положительные целые числа. Любое положительное целое число п может быть записано как произведение простых чисел: та П = pi...pm = J^Pk) Pi ^ ••• ^ Pm. (4-Ю) k=1 Например, 12 = 2-2-3; 11011 = 7-11 -11 -13; 11111 = 41 -271. (Произведения, обозначаемые при помощи П, аналогичны суммам, обозначаемым при помощи ^, в том смысле, как это поясняется в упр. 2.25. Если m = 0, то такое произведение считается пустым, а его значение равным 1 по определению; именно таким образом число п = 1 оказывается представленным при помощи (4-ю).) Такое разложение на множители всегда возможно, так как если п > 1 — не простое число, то оно имеет делитель ги,
142 Теория чисел такой, что 1 < ги < п; таким образом, можно записать п = ги -тг2, а (по индукции) мы знаем, что ги и п2 могут быть записаны как произведения простых чисел. Кроме того, разложение (4-ю) единственно: возможен только один способ записи тг в виде произведения простых чисел в неубывающем порядке. Это утверждение называется ОСНОВНОЙ ТЕОРЕМОЙ АРИФМЕТИКИ, и оно представляется настолько очевидным, что возникают сомнения— а надо ли его доказывать? Как два разных множества простых чисел могут дать одно и то же произведение? Да, не могут, но причина— не просто "по определению простых чисел" Например, если рассмотреть множество всех действительных чисел вида та -f- п\/Т0, где тип— целые числа, то произведение любых двух таких чисел будет числом того же вида, и можно назвать число "простым" если оно не может быть разложено на множители нетривиальным способом. Число 6 имеет два представления, 2-3 = (4 4- л/ТО )(4—\/Т0), и тем не менее в упр. 36 показано, что и 4 — \/Т0 являются в этой системе "простыми*! Следовательно, требуется строго доказать, что разложение (4.10) единственное. Определенно, имеется только один способ при п = 1, поскольку в этом случае произведение должно быть пустым. Так что предположим, что п > 1 и что все меньшие числа разлагаются на множители единственным образом. Предположим, что у нас есть разложения n = pi...pm = qi ... qic> Pi^---^Pm и qi^-":$qk> где все числа р и q— простые. Докажем, что pi = qi- Если это не так, то можно считать, что pi < qi, т.е. pi меньше любого из q. Так как pi и qi простые, их НОД должен быть равен 1; следовательно, самоподтверждающий алгоритм Евклида дает нам целые числа а и Ь, такие, что api + bqi =1. Тогда apiq2...qic + bqiq2...qk = q2...qk- Итак, pi делит оба члена в левой части, поскольку qi q2 ... Цк = п; следовательно, pi делит правую часть q2...qic. Тогда число q2 ... qic/pi целое, а q2 ... qk— разложение на простые множители, в котором присутствует рь Но q2... qi<. < п, так что оно допускает единственное разложение на множители (по индукции). Это противоречие показывает, что в конце концов pi должно быть равно qi. Таким образом, можно разделить оба разложения п на pi, получая р2 ... pm = q2 ... q^ < п. По индукции должны быть равны и остальные множители, так что наше доказательство единственности разложения завершено.
4.2 Простые числа 143 Единственное— разложение, а не теорема. Иногда более полезно сформулировать основную теорему иначе: любое положительное целое число может быть единственным образом записано в виде п = ТТрПр , где каждое пр ^ 0. (4.11) Правая часть представляет собой произведение по бесконечно многим простым числам; но для конкретного п все показатели степени, за исключением небольшого количества, равны нулю, так что соответствующие множители равны 1. Следовательно, на самом деле это конечное произведение, так же как многие "бесконечные" суммы на самом деле являются конечными, поскольку в основном их члены нулевые. Формула (4-и) однозначно представляет п, так что последовательность (ri2 ^"n^ns, •..) можно рассматривать как систему счисления положительных целых чисел. Например, представление в виде степеней простых чисел числа 12 имеет вид (2,1,0,0,...), а представление в виде степеней простых чисел числа 18— (1,2,0,0,...). Чтобы перемножить два числа, надо просто сложить их представления. Другими словами, к = ran <=> кр = гПр+Пр при всех p. (4-12) Отсюда вытекает, что m\n <=> rrip ^ пр при всех р, (4-13) а отсюда непосредственно следует, что к = НОД(ттцп) к = HOK(m,n) кр = min(mp> пр) при всех р} (4-14) кр = тах(тр)Пр) при всех р. (4-15) Например, поскольку 12 = 22 -З1 и 18 = 21 -З2, можно получить их НОД и НОК, беря минимумы и максимумы соответствующих степеней: НОД(12,18) = 2min(2>1).3min(1>2) = г^з1 = 6, НОК(12,18) = 2тах(2'1).Зтах(1'2) = 22-32 = 36. Если простое число р делит произведение тип, то оно делит либо число т, либо п, а возможно, и оба в силу теоремы о единственности разложения на простые множители. Но составные числа таким свойством не обладают. Например, составное число 4 делит 60 = 6-10, но не делит ни 6, ни 10. Причина проста: в разложении 60 = 6-10 = (2-3) (2-5) два простых сомножителя
144 Теория чисел числа 4 = 2-2 оказываются разделенными по разным частям, так что 4 не делит ни одну из них. Но простое число неразделимо, так что оно должно делить один из исходных сомножителей. 4.3 Простые примеры простых чисел Сколько всего простых чисел? Много. Очень много. Бесконечно много, как давным-давно доказал Евклид в своей теореме 9:20. И вот как он это сделал. Предположим, что имеется конечное количество простых чисел, скажем, к чисел 2, 3, 5, ..., Pic. Тогда, как говорит Евклид, мы должны рассмотреть число М = 2-3-5-...-Рк + 1. Ни одно из к простых чисел не может делить М, поскольку каждое из них делит М. — 1. Таким образом, должно иметься некоторое другое простое число, которое делит М; возможно, число М. само является простым. Это противоречит нашему предположению о том, что только 2, 3, ..., Р^ являются простыми числами, так что на самом деле их должно быть бесконечно много. Доказательство Евклида наводит на мысль об определении числа Евклида при помощи рекуррентного соотношения еп = eie2...en_i +1 прип^1. U-1^) Последовательность этих чисел начинается следующим образом: е1 = 1+1 = 2, е2 = 2 + 1 = 3, е3 = 2-3 + 1 = 7, е4 = 2-3-7+1 = 43, причем все приведенные числа— простые. Но уже следующее число, е5, представляет собой 1807 = 13-139. Далее, число е^ = 3263443 простое, в то время как е7 = 547-607-1033-31051, е8 = 29881-67003-9119521-6212157481. Известно, что е$>, ..., %w— составные числа, так же, как, вероятно, и все остальные числа еп. Однако числа Евклида являются взаимно простыми друг по отношению к другу, т.е. "OL 7ГрШТОЬ арьвро! TvXeiovq euri txolvto^ rov -кротевеитос; тгХг}воуя ттритилу арьв puis" — Евклид [98] (Перевод: "Простых чисел больше, чем в любом заданном множестве простых чисел") НОД(ет>еп) = 1, когда т ф п.
4.3 Простые примеры простых чисел 145 Алгоритм Евклида (какой же еще?) подтверждает это за три коротких шага: поскольку en mod em = 1 при п > га, то НОД(ет)еп) = НОД(1,ет) = НОД(0,1) = 1. Следовательно, если положить q^ равным наименьшему множителю ej для каждого j ^ 1, то все простые числа qi, q2, q3> • • • будут различны — они образуют бесконечную последовательность простых чисел. Давайте сделаем небольшое отступление и рассмотрим числа Евклида с точки зрения главы 1. Нельзя ли записать еп в аналитическом виде? Рекуррентное соотношение (4.16) можно упростить, удалив троеточие: если п > 1, то мы имеем еп = е-\ ...erL_2en_1 + 1 = = (en_i - 1 )en_! + 1 = г\_л - en_-| + 1 . Таким образом, в еп примерно вдвое больше десятичных цифр, чем в en_i. В упр. 37 доказывается существование константы Е « 1.264, такой, что еп = [Е2" + \\ . (4-17) А в упр. 60 доказывается подобная формула, Vn = [P3nJ > (4.18) которая дает только простые числа при некоторой константе Р. Однако уравнения наподобие (4-17) и U-1^) не могут в действительности рассматриваться как аналитическая запись, поскольку константы Е и Р вычисляются по числам еп и рп, образуя замкнутый круг. Неизвестно (и его существование маловероятно) соотношение, которое бы связывало эти константы с другими независимыми математическими значениями. На самом деле никто не знает никакой полезной формулы, которая давала бы произвольно большие простые и только простые числа.* Однако несмотря на это, кибернетики из компании Chevron Geosciences в 1984 году вместо нефтяного открыли * Однако бесполезные формулы существуют. Так, например, в книге Г. Уоррен, Алгоритмические трюки для программистов.— М.: Издательский дом "Вильяме" 2003, приводится несколько формул для п-го простого числа наподобие рп = 1 + E^i L ^(Lxm=, Lcos2 niS=mij)-1 /nj. - Переводчик.
146 Теория чисел "математический источник" Используя программу Дэвида Словински (D. Slowinski), они при тестировании нового суперкомпьютера Cray Х-MP обнаружили наибольшее известное на тот момент времени простое число 2216091 _ 1 Это число легко вычислить на персональном компьютере за несколько миллисекунд, поскольку современные компьютеры работают в двоичной системе счисления, а это число— просто (11 ...1)2- Все 216 091 его битов равны 1. Но гораздо труднее доказать его простоту. Практически любая операция с этим числом выполняется очень долго из-за его размера. Например, даже интеллектуальный алгоритм требует на персональном компьютере нескольких минут только для перевода 2216091 — 1 в десятичную запись* Пересылка распечатки такого числа, состоящего из 65 050 цифр, требует 78 центов. Кстати, 2216091 — 1— это количество переносов, необходимых для решения задачи о Ханойской башне из 216 091 диска. Числа вида 2р_1 (где р, как и везде в этой главе,— простое число) называются числами Мерсенна, в честь преподобного Марина Мерсенна (Marin Mersenne), который изучал некоторые их свойства в XVII веке [269]. Известные к настоящему времени простые числа Мерсенна получаются при р = 2, 3, 5, 7, 13, 17, 19, 31, 61, 89, 107, 127, 521, 607, 1279, 2203, 2281, 3217, 4253, 4423, 9689, 9941, 11213, 19937, 21701, 23209, 44497, 86243, 110503, 132049, 216091, 756839, 859433, 1257787, 1398269, 2976221, 3021377, 6972593, 13466917, 20 996011, 24036583, 25 964951, 30402457, 32 582 657, 37156 667 и 43 112 609** * Это во многом зависит от представления числа в компьютере. Так, при использовании библиотеки для работы с большими числами МАРМ Майкла Ринга (Michael С. Ring) на компьютере с процессором Pentium 4 с тактовой частотой 3 ГГц для вычисления этого числа требуется около 15 мс, а для его превращения в десятичную запись— менее миллисекунды (для наибольшего известного на момент перевода книги простого числа 243112609 — 1 соответствующие значения равны соответственно около 15 с и 100 мс).— Переводчик. ** (В оригинальном издании книги были приведены известные простые числа Мерсенна по состоянию на начало 1998 года. На Ко времени, когда вы это прочтете,— наверняка еще больше.
4.3 Простые примеры простых чисел 147 Число 2П — 1 не может быть простым при составном п, так как 2km — 1 имеет одним из сомножителей 2т — 1: 2кт — 1 = (2т — i)(2m(k_1^ +2m^k-2^ Н hi). Однако 2Р — 1 — не всегда простое при простом р; так, 21 ] — 1 = 2047 = 23-89— первое из составных чисел Мерсенна (и Мерсенн знал о нем). В настоящее время разложение на множители и проверка простоты больших чисел— тема многочисленных исследовательских работ. Сводка того, что было известно об этом вплоть до 1981 года, приведена в разделе 4.5.4 книги [208], и с того времени появилось много новых результатов. На с. 391-394 этой же книги (с. 459-461 русского перевода) поясняется метод проверки чисел Мерсенна на простоту. На протяжении последних пяти столетий наибольшим известным простым числом оказывалось, по большей части, простое число Мерсенна, хотя известно лишь несколько десятков этих чисел. Многие пытаются найти большие простые числа, но это не так просто. Те, кто хотят оказаться в Книге рекордов Гиннесса заслуженно, а не просто из-за везения, могут попытать счастья и поискать простые числа вида 2nk + 1 при малых значениях к, например, 3 или 5. Проверка простоты этих чисел почти такая же быстрая, как и чисел Мерсенна (детали см. в упр. 4.5.4-27 в книге [208]). Но мы пока что так и не ответили полностью на первоначальный вопрос о том, сколько же всего простых чисел. Их бесконечно много, но одни бесконечные множества "плотнее" других. Например, среди положительных целых чисел имеется бесконечно много четных чисел и бесконечно много полных квадратов, но при этом в определенных важных смыслах четных чисел больше, момент перевода этой книги известно 46 простых чисел Мерсенна; последние два открыты в 2008 году, причем проведена исчерпывающая проверка до 39-го числа Мерсенна; так что возможно наличие других простых чисел Мерсенна, кроме известных, между 213466917 — 1 и 243112609 — 1 (эвристические оценки показывают, что в интервале для р от 10 000 000 до 80 000 000 ждут своего открытия еще два неизвестных простых числа Мерсенна). Последние 12 простых чисел Мерсенна найдены в рамках проекта GIMPS (Great Internet Mersenne Prime Search)— широкомасштабного Интернет-проекта распределенных вычислений по поиску простых чисел Мерсенна (http: //www. mersenne. org/). — Переводчик.)
148 Теория чисел чем полных квадратов. Один из таких "смыслов" — сравнивать n-е значения: п-е четное число равно 2n, а n-й полный квадрат равен п2; так как 2п гораздо меньше п2 при больших п, n-е четное целое число встречается гораздо раньше п-го полного квадрата, так что можно сказать, что имеется гораздо больше четных целых чисел, чем полных квадратов. Похожая точка зрения заключается в том, чтобы сравнить количество искомых величин, не превосходящих х. Имеется [х/2\ таких целых четных чисел и [у/х\ таких полных квадратов; поскольку х/2 гораздо больше, чем л/х при больших х, снова можно говорить о том, что целых четных чисел гораздо больше, чем полных квадратов. Что же можно сказать о простых числах в этих двух смыслах? Оказывается, что n-е простое число Р^. примерно в п раз больше натурального логарифма п: ?п ~ nlnn. Странно. Поскольку существует взаимно однозначное соответствие четных чисел и квадратов, я думал, что и тех, и других— одинаковое количество... (Символ (~* можно читать как "асимптотически равно" что означает, что предел отношения Pn/nlnn равен 1 при п, стремящемся к бесконечности.) Аналогично для количества простых чисел 7т(х), не превышающих х, имеется "теорема о распределении простых чисел": тфс) х lnx Доказательство этих двух фактов выходит за рамки нашей книги, хотя можно легко показать, что каждый из них влечет за собой другой. В главе 9 мы рассмотрим скорости роста данных функций и увидим, что функция nlnn, наше приближение для Рп, асимптотически лежит между 2п и п2. Следовательно, простых чисел меньше, чем четных, но больше, чем полных квадратов. Эти формулы, справедливые только в пределе при п или х —> со, можно заменить более точными оценками. Так, Россер (Rosser) и Шёнфельд (Schoenfeld) [312] установили следующие удобные границы lnx- < 7Г(Х) < In х — А при х ^ 67; (4-19) n(lnn-Hnlnn— |) < Ртг < < n(lnn + lnlnn— \) при n ^ 20. U-20) Если взять "случайное" целое число п, то шансы, что оно окажется простым, составляют примерно один к Inn. Например, если выбирать числа вблизи 1016, то придется проверить примерно 16 In 10 « 36.8 из них, прежде чем будет найдено простое
4.3 Простые примеры простых чисел 149 "Je те sers de la notation tres simple n! pour designer le produit de nombres decroissans depuis n jusqu'a 1'unite, savoir n{n — 1) (n-2).... 3.2.1. Uemploi continuel de Г analyse combi- natoire queje fais dans la plupart de mes demonstrations, a rendu cette notation indispensable" — X. Крамп (Ch. Kramp) [228] число. (Оказывается, что между 1016 — 370 и 1016 — 1 имеется ровно 10 простых чисел.) Тем не менее в распределении простых чисел много нерегулярностей. Например, все числа между Pi ?2 • • • Рп+2 и Pi ?2 • • • Рп+Рп-н —1 включительно— составные. Известно много примеров "простых близнецов" р и р + 2 (5 и 7, 11 и 13, 17 и 19, 29 и 31,..., 9999999999999641 и 9999999999999643, ... ), но никому не известно, бесконечно ли много пар таких близнецов. (См. Харди (Hardy) и Райт (Wright) [181, §1.4 и §2.8].) Один из простейших способов вычислить все п[х) простых чисел ^ х — так называемое "решето Эратосфена" Сначала выписываются все целые числа от 2 до х. Затем обводится кружок вокруг числа 2, помечающий его как простое число, и вычеркиваются все числа, кратные 2. Затем последовательно обводятся наименьшие из невычеркнутых и необведенных чисел и вычеркиваются все кратные им. Когда останутся только обведенные или вычеркнутые числа, все обведенные числа— суть простые. Например, при х = 10 выписываются числа от 2 до 10, обводится 2, затем вычеркиваются кратные 2 числа 4, 6, 8 и 10. Очередное наименьшее невычеркнутое необведенное число— 3, так что оно обводится, и вычеркиваются кратные ему числа 6 и 9. Теперь наименьшим необведенным становится 5, так что мы обводим его и вычеркиваем 10. И наконец мы обводим 7. В результате обведенными оказываются числа 2, 3, 5 и 7, так что имеется 7г(10) =4 простых числа, не превосходящих 10. 4.4 Факториальные факты Давайте теперь посмотрим, как выглядит разложение на простые множители самых составных чисел— факториалов: п! l-2-...-n = ТТк> целое п ^ 0. (4-21) к=1 В соответствии с нашим соглашением о пустом произведении факториал 0! определяется как равный 1. Таким образом, для каждого положительного целого числа п справедливо соотношение п! = (п — 1)! п. Это число равно количеству перестановок п различных объектов, т.е. количеству способов разместить в ряд п предметов: первый предмет можно разместить п способами; для каждого размещения первого предмета второй предмет можно разместить п— 1 способом; для каждого из п(п— 1) вариантов размещения первых двух предметов третий можно разместить п — 2 способами; и т.д., что дает нам п(тг — 1 )(тг — 2)... (1) вариантов размещения в целом. Вот несколько первых значений
150 Теория чисел функции "факториал": п п! 0 12 3 4 5 1 1 2 6 24 120 6 720 7 5040 8 40320 9 362880 10 3628800 Полезно знать несколько фактов о факториалах— например, первые шесть или около того значений, что 10! равно Ъ\ миллиона с небольшим, или что количество цифр в п! превышает п при n ^ 25. Можно доказать, что п! очень велико, воспользовавшись уловкой наподобие гауссовой из главы 1: п n!2 = (1.2.....n)(n.....2.1) - JJk(n+l-k). k=1 Имеем n ^ k(n+1 —k) ^ ^(п+1 )2, поскольку квадратный полином к(п+1— к) = ^(тг+1)2 — (к— ^(тг+1)) принимает наименьшее значение при к=1 и при к = тг, а наибольшее значение— при к = j (тг + 1). Поэтому к=1 к=1 т.е. ^'г ^ п! ^ Щ^. (4-22) Это соотношение указывает, что факториальная функция обладает экспоненциальным ростом!! Более точное приближение тг! при больших тг дает формула Стирлинга, которая будет выведена в главе 9: тг! ~ Vbmi — j . (4-23) Еще более точное приближение говорит нам об асимптотической погрешности формулы Стирлинга, которая дает заниженные значения п! на множитель, примерно равный 1/(12н). Это более точное приближение вполне неплохо работает даже при достаточно малых п. Например, приближение Стирлинга (4.23) при п = 10 дает значение, близкое к 359&696, что примерно на 0.83% « 1/120 меньше точного значения. Замечательная вещь — асимптотика! Но вернемся к простым числам. Хотелось бы для каждого заданного простого числа р определить наибольшую степень этого числа, которая делит тг!, т.е. показатель степени при р в единственном разложении тг! на простые множители. Обозначим это
4.4 Факториальные факты 151 число как ер(п!) и начнем наше исследование с малых случаев р = 2 и п = 10. Поскольку 10!— произведение десяти чисел, величину €2(10!) можно найти, суммируя вхождения степеней 2 в эти числа; это вычисление соответствует суммированию столбцов в следующем массиве: Делится на 2 Делится на 4 Делится на 8 Степени 2 1 23456789 10 X X X X X X X X 0 1020 1030 1 Степени 2 5 = L10/2J 2=|.10/4| 1 = L10/8J 8 (Суммарные значения столбцов образуют то, что иногда называют линеечной функцией (ruler function) p(k) из-за ее^сходст- ва с линейкой Г,',',',",',','1',,",'г,",",'1, деления которой отмечают доли А может быть, сан- дюйма.) Сумма этих десяти значений равна 8; следовательно, 2е тиметра или пар- делит 10!, а 29 — нет. Есть и другой способ: можно сосчитать вклады строк. Впервой строке отмечены числа, которые вносят степень 2 (и, таким образом, делятся на 2): таких чисел IJ0/2J = 5. Во второй строке отмечены числа, которые вносят дополнительную степень 2; таковых [10/4J = 2. В третьей строке помечены числа, которые вносят еще кое-что; их [10/8J = 1. Тем самым подсчитываются все вклады, так что мы получаем €2(10!) = 5 + 2 + 1 = 8. Для произвольного п данный метод дает Эта сумма в действительности конечна, поскольку при 2к > п общий член суммы превращается в нуль. Следовательно, в ней только [lgnj ненулевых членов, и ее очень легко вычислить. Например, при п = 100 мы получаем е2(Ю0!) = 50 + 25 + 12 + 6 + 3 + 1 = 97. Каждый член этой суммы представляет собой пол от половины предыдущего члена. Это справедливо для всех п, так как в качестве частного случая (з-и) мы имеем |_rt/2k+1J = |_ |_n/2k J/2_|. Все особенно просто при записи чисел в двоичной системе счисления: 100 = (1100100)2 = 100 [100/2J = (110010)2= 50
152 Теория чисел L100/4J = L100/8J = Lioo/i6j = L100/32J = |Ш/64| = (11001)2 = (1100)2 = (110)2 = (11)2 = (1)2 = 25 12 6 3 1 Мы просто отбрасываем младший бит члена для получения следующего. Двоичное представление одновременно показывает нам, как вывести еще одну формулу: e2(n!) = n-V2(n), (4.24) где V2 (п) — количество единиц в двоичном представлении п. Такое упрощение работоспособно, поскольку каждая 1, которая дает вклад 2т в значение п, обеспечивает вклад 2m_1 -f 2m_2H h 2° = 2m — 1 в значение б2(тг!). Обобщая наши рассуждения для произвольного простого числа р, мы получаем ер(п!) п _р_ + тг _р\ + п .Р1. + • к$>1 П l_Pk J (4-25) Насколько велико значение ер(п!)? Можно получить простую (но хорошую) верхнюю границу, просто удалив пол в общем члене суммы и просуммировав бесконечную геометрическую прогрессию: ер(п!) < тг Р тг Р тг Р тг V 0+ ^ гг + 1 Р т рз 1 + — р2 ^ = J + • р-1 При р = 2 и тг = 100 это неравенство дает оценку 100 (точное значение— 62(100!) = 97 < 100). Таким образом, верхняя граница 100 не только верна, но и достаточно близка к точному значению 97. Фактически истинное значение тг—УгЫ) в общем случае ~ тг, так как V2(n) ^ |~lgTi] асимптотически гораздо меньше п. При р = 2 и 3 наши формулы дают ez (п!) ~пи ез (тг!) ~ тг/2, так что представляется правдоподобным, что время от времени
4.4 Факториальные факты 153 значение ез (тг!) должно быть ровно в два раза меньше ez (тг!). Например, так и есть при тг = 6 и тг = 7, поскольку 6! = 24 • З2 • 5 = 7\/7. Но еще никто не доказал, что такое совпадение встречается бесконечно часто. Граница для ер (тг!), в свою очередь, дает границу для р?р (п!\ которая представляет собой вклад р в тг!: ep(n!) < п/(р-1) ^ Можно упростить эту формулу (рискуя сильно ослабить верхнюю границу), заметив, что р ^ 2Р_1; следовательно, рп/^-1) <: (2?-1 )п/(р-1) = 2П. Другими словами, вклад любого простого числа в п! меньше 2П. Можно использовать это наблюдение для другого доказательства существования бесконечного количества простых чисел. Действительно, если бы имелось только к простых чисел 2, 3, ..., Pic, то мы имели бы тг! < (2п)к = 2пк для всех тг > 1, поскольку каждое простое число может внести в разложение тг! множитель, не больший 2П — 1. Но получить противоречие с неравенством тг! < 2nk очень легко, выбрав тг достаточно большим, например тг = 22к. Тогда тг! < 2пк - 222кк = тгп/2, что противоречит неравенству тг! ^ тгп/2, полученному в (4.22). Значит, имеется бесконечно много простых чисел. Можно еще немного повозиться с этим рассуждением и получить грубую оценку для тс(тг) — количества простых чисел, не превышающих тг. Каждое такое простое число вносит в разложение тг! множитель, меньший 2П; поэтому, как и ранее, тг! < 2П7Г(тг). Если заменить тг! приближением Стирлинта (4-23), которое представляет собой нижнюю границу, и прологарифмировать, то можно получить пя(тг) > nlg(n/e) + \ lg(27m), а следовательно, тг(тг) > lg(n/e). Эта нижняя граница очень слабая по сравнению с действительным значением я(п) ~ n/lnn, так как logn гораздо меньше n/logu при больших п. Но зато нам почти не пришлось трудиться при ее получении— в конце концов, граница есть граница.
154 Теория чисел 4.5 Взаимная простота Если НОД(ттцп) = 1, то целые числа та и п не имеют общих простых сомножителей, и мы говорим, что они взаимно простые. Эта концепция настолько важна на практике, что следовало бы ввести для нее специальное обозначение. Увы, специалисты в области теории чисел никак не могут прийти к согласию. Поэтому мы умоляем: выслушайте нас, о математики всего мира! Ждать больше нельзя! Множество формул немедленно станет понятнее при введении такого обозначения! Давайте остановимся на записи 'mln' и будем говорить, что "т просто с п" (по отношению к п), если тип взаимно просты. Другими словами, объявим, что та _L п т,п— целые и НО&[т,п) = 1. (4.26) Дробь та/п несократима тогда и только тогда, когда mln. Поскольку мы сводим дроби к несократимым, сокращая на наибольший общий множитель числитель и знаменатель, можно предположить, что в общем случае Подобно тому, как перпендикулярные линии не имеют общего направления, так и перпендикулярные числа не имеют общих множителей. т/НОД(т, n) _L n/НОД(т, п), (4-27) и это действительно так— это вытекает из доказанного в упр. 14 более общего правила НОД(клтцкп) = кНОД(та,п). Отношение _L имеет простую формулировку при работе с представлением чисел в виде степеней простых чисел, так как в силу правила (4-14) Для НОД mln min(mp,Tip) = 0 при всех р. (4-28) Более того, поскольку тар и пр неотрицательны, это можно переписать следующим образом: та _L и О при всех р. (4-29) Теперь можно доказать важный закон, согласно которому можно объединять и разъединять два отношения _1_ с одной и той же левой частью: Нуль, как и при скалярном произведении ортогональных векторов. k J_ та и к _L п к _1_ тап. (4-30) Ввиду соотношения (4-29) это правило представляет собой другой вариант следующего утверждения: кртар = 0 и крпр =0 тогда и только тогда, когда кр(тр + тгр) =0 при неотрицательных тар и п v
4.5 Взаимная простота 155 Интересно, что математики говорят "открыт" там, где все остальные сказали бы "придуман" Существует красивый способ построения множества всех неотрицательных дробей m/n с m J_ п, называемый деревом Штерна-Броко, потому что он был открыт независимо друг от друга немецким математиком Морицем Штерном (Moritz Stern) [339] и французским часовщиком Ахиллом Броко (Achille Вго- cot) [40]. Суть этого способа в том, чтобы начать с двух дробей (у, ^), а затем повторять необходимое количество раз следующую операцию: m + m/ вставить ;—г между двумя соседними дробями п + п' m га — и — п п1 Я думаю, что 1 /0 — это бесконечность "в несократимом виде" Новая дробь [m-\-vn,)/{n-\-nf) называется медиантой (mediant) дробей m/п и т'Дь'. Например, первый шаг дает одну новую запись между уи J: oil- 1 > 1 > о > следующий шаг добавляет две записи: oilli 1 > 2> 1 > 1 > о Очередной шаг добавляет четыре дроби: 011213231. 1 > 3> 2> 3> 1 > 2> 1 > 1 > 0 ' затем получаются 8, 16 и т.д. новых дробей. Весь массив можно представить в виде бесконечного бинарного дерева, верхние уровни которого имеют следующий вид: /\ /\ /\ /\ /\ /\ /\ /\ 1233455457877875 5787787545543321 Каждая дробь имеет вид ™+™ , где ^— ближайший предок вверху слева, а ^т— вверху справа. ("Предок" представляет
156 Теория чисел собой дробь, достижимую при следовании по ветвям вверх.) В таком дереве можно найти массу интересных закономерностей. Но почему такое дерево работает? Почему, например, каждая медианта (га + т')/{п -f п') на таком дереве оказывается несократимой? (Если бы все числа га, га', пип' были нечетными, то мы получили бы дробь вида "четное/четное" но построение дерева гарантирует, что дроби с нечетными числителями и знаменателями никогда не появятся рядом.) И почему все возможные дроби т/п встречаются ровно по одному разу? Почему какая-нибудь дробь не может встретиться дважды (или не встретиться вообще)? Все эти вопросы имеют на удивление простые ответы, основанные на следующем фундаментальном факте: если т/п и т'/п' — последовательные дроби на, любом шаге их построения, то m'n — ran/ = 1 (4-3i) Это отношение изначально справедливо (1-1 —0-0 = 1); а когда мы вставляем новую медианту (ra + m')/{n + п'), то можем проверить новые соотношения: (ra + ra^n —га(тг + п/) = 1; mf{n + n')-{m + m')n' = 1. Оба эти уравнения эквивалентны исходному условию (4-31)) ко~ торое они заменяют. Поэтому условие (4-31) представляет собой инвариант на всех этапах построения. Кроме того, если ra/n < m'/n' и если все эти величины неотрицательны, то легко убедиться в том, что ra/n < (m + ra')/(n + n/) < m'/n'. Медианта лежит где-то между своими предшественниками, хотя и не точно посредине между ними. Следовательно, наше построение сохраняет порядок, и мы не можем получить одну и ту же дробь в разных местах. Остается еще один вопрос. Может ли какая-нибудь положительная дробь a/b с a 1 b оказаться пропущенной? Ответ — нет, поскольку можно ограничить наше построение непосредственными соседями a/b, а в этой области поведение дерева легко поддается анализу. Изначально мы имеем Бесплатный совет: если в каком-то месте у вас застряла АР°бь, покажитесь врачу!
4.5 Взаимная простота 157 где скобки у дроби § указывают, что на самом деле ее здесь нет. Затем, если на некотором этапе ?<(§)< ?. построение образует дробь (та + т7)/(п + п7) и имеются три разные ситуации. Либо (га + т')/{п 4- п7) = а/b и искомая дробь имеется в дереве; либо (та + т7)/(т1 + т17) < а/b и мы можем положить та <— га + та', п <— тг + тг7; либо (та + та7)/(тг + п7) > а/Ь и мы можем положить та' <— та + та7, тг7 <— тг + тг7. Этот процесс не может продолжаться до бесконечности, поскольку условия ?-? > 0 и ^т-§ > О означают, что an — Ьта ^> 1 и Ьта7 — атг7 ^ 1 ; следовательно, (та7 + п7)(ап —Ьта) + (та + тг)(Ъта7 — an7) ^ ^ та7 + тг7 + та + тг; а это то же самое, что и a + b ^ та7 + тг7 + ттг + тг согласно (4-31)- На каждом этапе возрастает либо та, либо п, либо та7, либо п7, так что мы должны получить искомую дробь не более чем через a + b шагов. Последовательность Фарея (Farey) порядка N (обозначается jFn ) представляет собой множество всех несократимых дробей между 0 и 1, знаменатели которых не превосходят N и которые расположены в возрастающем порядке. Например, при N = 6 мы имеем Ф — 0111121323451 J6 — 1'6'5Ч'3'5'2'5'ЗЧ'5'6'Т В общем случае можно получить jFn , начав с jFi = у > | и вставляя медианты везде, где это возможно сделать, не нарушив условия, что знаменатель дроби не должен превосходить N. При этом ни одна дробь не будет пропущена, поскольку известно, что построение Штерна-Броко этого не допускает, а медианта со знаменателем ^ N не может получиться из дроби с знаменателем > N. (Другими словами, jFn определяет в дереве Штерна-Броко поддерево, получающееся путем обрезки ненужных ветвей.) Отсюда следует, что та7п — тап7 = 1 всегда, когда та/n и та7/п7 представляют собой последовательные элементы последовательности Фарея.
158 Теория чисел Этот метод построения показывает, что последовательность Un может быть легко получена из последовательности Sn-i : мы просто вставляем дробь (m + m')/N между последовательными дробями m/п и т'/п' последовательности З^-ъ сумма знаменателей которых равна N. Например, легко получить SV из элементов $6 путем вставки у, |, ..., | в соответствии с указанным правилом: <Т — 0111121231432534561 J7 — 1 > 7> 6> 5> 4> 7> 3> 5> 7> 2> 7> 5> 3> 7» 4> 5> 6> 7М ' Если N — простое число, то появится N — 1 новых дробей; в противном случае их будет меньше N — 1, так как этот процесс генерирует только дроби, числители которых взаимно просты с N. В (4.5) мы доказали (правда, другими словами), что если т1_пи0<т<^п, то можно найти целые числа а и Ь, такие, что та — пЪ = 1 . (4-32) (На самом деле мы говорили, что m'm 4- п'п = НОД(тгцп), но вместо НОД(ггцп) можно подставить 1, вместо та'— а, и вместо —и'— Ъ.) Последовательность Фарея дает нам другое доказательство (4-32)> поскольку мы можем положить b/а равной дроби, предшествующей m/n в последовательности 7п. Таким образом, (4.5) снова есть просто (4-31)- Например, одним из решений уравнения За —7Ъ = 1 является а = 5, b = 2, поскольку дробь | предшествует дроби | в последовательности Э^- Из построения последовательности следует, что всегда можно найти решение (4-32) с 0^Ъ<а^п, если 0 < та ^ п. Аналогично, если 0^п<тит1п, то уравнение (4-32) cO<a^b^m можно решить, полагая a/b равной дроби, следующей за п/тп в Последовательные тройки дробей в последовательности Фарея обладают удивительным свойством, которое доказывается в упр. 61. Но лучше прекратить обсуждение последовательности Фарея, поскольку дерево Штерна-Броко намного интереснее. В действительности дерево Штерна-Броко можно рассматривать как систему счисления для представления рациональных чисел, поскольку каждая положительная несократимая дробь встречается в нем только один раз. Воспользуемся символами L и R для обозначения левой и правой ветвей при продвижении от корня вниз к определенной дроби. Тогда строка символов L и R однозначно определяет местоположение дроби в дереве. Например, строка LRRL означает, что мы идем влево
4.5 Взаимная простота 159 от ]¦ к ^, затем— вправо к |, снова вправо к | и влево к |. Мы можем рассматривать LRRL как представление дроби |. Таким образом можно однозначно представить любую положительную дробь в виде строки из символов L и R. Имеется и небольшая проблема: дробь у соответствует пустой строке, так что для нее требуется особое обозначение. Давайте обозначать ее I, поскольку этот символ напоминает цифру 1 и с него начинается слово "identity" (единица). Такое представление вызывает два естественных вопроса. (1) Если заданы два положительных целых числа m и n, m 1 п, то какой будет строка символов L и R, соответствующая га/тг? (2) Если задана некоторая строка символов L и R, то какая дробь ей соответствует? Вопрос 2 кажется более простым, так что начнем с него. Пусть f(S) = дробь, соответствующая S, где S— строка символов L и R. Например, f(LRRL) = |. В соответствии с построением f(S) = (m + rn/JAn-fn/), если m/n и mZ/ri/ являются ближайшими предшествующими и следующими за S дробями на верхних уровнях нашего дерева. Изначально m/n = 0/1 и га'/и' = 1/0; затем по мере продвижения по дереву соответственно влево или вправо мы последовательно заменяем медиантой (m + m')/{n + nf) либо т/n, либо т'/п'. Как выразить это поведение при помощи математических формул? Несколько проведенных экспериментов показывают, что наилучший способ — поддержка матрицы 2x2 M(S) = (п п'Х которая содержит все четыре величины, входящие в дроби га/тг и ттг'/тг7, охватывающие f(S). Подобно записи дробей можно было бы поместить величины та вверху, an— внизу, но расположение "кверху ногами" оказывается более подходящим, так как изначально М(1) = (01), а матрица (0 ^ — ни что иное, как единичная матрица I. Шаг влево заменяет п7 на n + nf и та' на m + га7; следовательно,
160 Теория чисел (Это частный случай более общего правила, w х _ f aw + by ax + bz cw + dy ex + dz умножения матриц 2x2.) Аналогично оказывается, что M(SR) = TL + TL7 TV m' = M(S) 1 О m + m' m/ У "~v"' V 1 1 Поэтому, если определить L и R как матрицы 2x2, 1 1 О 1 R (4-33) то индукция по длине S дает простую формулу M(S) = S. Правда красиво? (Буквы L и R исполняют две роли: матриц и символов в строковом представлении.) Например, M(LRRL) = LRRL = ('])({?)({?)(J{) = (?{)(Ц) = (It); так что дроби-предки, которые охватывают дробь LRRL 5 7> представляют собой | и |. Это построение дает нам ответ на m + m' вопрос 2: f(S) : п п га т' п + п' (4-34) А как насчет вопроса 1? Теперь, когда мы понимаем фундаментальную связь между узлами дерева и матрицами 2x2, все просто. При заданной паре положительных целых чисел тип, с т ± п, положение дроби т/п в дереве Штерна-Броко можно найти "бинарным поиском": S := I; пока т/п ф f (S) выполнять если m/n < f(S) то (вывод (L); S := SL) иначе (выводе); S := SR) . Выводом этого алгоритма является искомая строка символов L и R. Имеется и другой способ добиться того же результата— изменяя тип вместо использования S. Если S— некоторая матрица 2 х 2, то мы имеем Если вы не знакомы с матрицами, не волнуйтесь: больше в этой книге их нет. f(RS) - f(S) + l,
4.5 Взаимная простота 161 поскольку матрица RS подобна матрице S с тем отличием, что в матрице RS верхняя строка добавлена к нижней. (Немного медленнее: S= (m m'J ' RS = \т + п m' + n'J ; следовательно, f(S) = (та + т')/(тг + n') и f(RS) = ((та + n) + (га' + n/))/(n + n/).) Если алгоритм бинарного поиска применяется к некоторой дроби та/п с га > п, то первый вывод этого алгоритма— R; следовательно, дальнейшая работа алгоритма даст f(S) ровно на 1 больше, чем если бы мы начали с дроби (га —n)/n, а не с та/n. Аналогичное свойство выполняется и для L, так что мы имеем f(RS) 4=> т~П = f(S) прита>п) п f(LS) <(=> Ш = f(S) при та < п. п — та Это означает, что алгоритм бинарного поиска можно преобразовать в следующую процедуру без использования матриц: пока та ф п выполнять если та < п то (вывод(1_); п := п —та) иначе (вывoд(R); та := та — п) . Например, если дано та/п = 5/7, то при помощи этого алгоритма мы получаем та- 5 5 3 11 п= 7 2 2 2 1 Вывод L R R L В дереве Штерна-Броко нет иррациональных чисел, но зато имеются "близкие" к ним рациональные. Например, если попытаться выполнить бинарный поиск для числа е = 2.71828... вместо дроби та/п, мы получим бесконечную строку из символов L и R, которая начинается следующим образом: RRLRRLRLLLLRLRRRRRRLRLLLLLLLLRLR .... Эту бесконечную строку можно рассматривать как представление числа е в системе счисления Штерна-Броко, так же как число е можно представить в виде бесконечной десятичной дроби 2.718281828459045... или в виде бесконечной двоичной дроби та п та п
162 Теория чисел (10.101101111110... )2- Кстати, оказывается, что представление числа е в системе счисления Штерна-Броко обнаруживает определенную закономерность: е = RL°RLR2LRL4RLR6LRL8RLR10LRL12RL ... , что эквивалентно частному случаю одного открытия, сделанного Эйлером (Euler) [105] в 24 года. Из этого представления можно вывести, что дроби RRLRRLRLLLL R L R R R R 1 П 5 8 Д 19 30 49 68 87 106 Г93 299 492 685 878 1'1Ч'2'3' 4 > 7 > 11 48' 25 > 32 > 39 > 71 ' 11 0 М 81 ' 252 > 323 > ' * * служат простейшими рациональными верхним и нижним приближениями к е. Действительно, если дробь m/п отсутствует в списке, то между m/п и е находится некоторая дробь из списка, числитель которой ^ га, а знаменатель ^ п. Например, у^ нет в списке, так что эта дробь не является таким же простым приближением, как дробь Ц- — 2.714..., которая имеется в списке и которая ближе к е. Можно убедиться в этом на основании того, что дерево Штерна-Броко не просто включает все рациональные числа, но включает их в упорядоченном виде, а также на основании того, что все дроби с малыми числителем и знаменателем располагаются выше всех менее простых дробей. Так, например, дробь у^ = RRLRRLL меньше дроби Щ- = RRLRRL, которая, в свою очередь, меньше е = RRLRRLR Этот способ позволяет находить превосходные приближения. Например, Щ « 2.718266 « .999994 е; эта дробь получается из первых 16 символов представления е в системе счисления Штерна-Броко, а точность при этом примерно такая же, как и при 16-битовом двоичном представлении числа е. Бесконечное представление произвольного иррационального числа <х можно получить путем простой модификации безматричной процедуры бинарного поиска: Это замечательное двоичное представление было продемонстрировано Германом Минковским (Hermann Minkowski) на Международном конгрессе математиков в Гейдельберге в 1904 году. если а < 1 то (вывод(1_); а := а/(1 — а)) иначе (выводе); а := а—1). (Эти действия должны быть повторены бесконечное количество раз— ну, или пока вам не надоест...) Если число сх рациональное, бесконечное представление, получающееся таким образом, оказывается тем же, что и ранее, но к (конечному) представлению а справа добавляется строка RL°°. Например, если а = 1, мы получим представление RLLI , соответствующее бесконечной последовательности дробей у, у, |, |, §,..., стремящейся
4.5 Взаимная простота 163 "Numerorum congru- entiam hoc signo, =, in posterum denotabimus, mod- ulum ubi opus erit in ciausulis adiun- gentes, —16 = 9 (mod. 5), -7 = 15 (mod. 11)? — К. Ф. Гаусс (С. F. Gauss) [142] в пределе к 1. Эта ситуация аналогична обычному двоичному представлению, если рассматривать L как 0 и R как 1: точно так же, как каждое действительное число х из [0 .. 1) имеет бесконечное двоичное представление (.bi ЪгЪз ... Ь, не завершающееся одними цифрами 1, так и каждое действительное число а из [0.. со) имеет бесконечное представление Штерна-Броко В1В2В3..., не завершающееся одними символами R. Таким образом, имеется взаимно однозначное, сохраняющее порядок соответствие между [О .. 1) и [0 .. со), если исходить из соответствия OhLh 1 *-> R. Существует тесная связь между алгоритмом Евклида и представлением Штерна-Броко рациональных чисел. Для данного ос — га/п мы получаем Lm/nJ символов R, затем — |u/(m mod n)J символов L, затем— [(га mod п)/(п mod (m mod n))J символов R и т.д. Приведенные выше числа га mod п, n mod (га mod п), ... представляют собой значения, фигурировавшие в алгоритме Евклида. (Требуется небольшая изобретательность, чтобы обеспечить отсутствие в конце бесконечного числа символов R.) Эту связь мы будем рассматривать в главе 6. 4.6 4MOD': отношение сравнимости по модулю Модулярная арифметика представляет собой один из главных инструментов, которым располагает теория чисел. Мы бегло коснулись ее в главе 3 при использовании бинарной операции 'mod'— как правило, в качестве одной из операций наряду с другими в составе некоторого выражения. В этой главе 'mod' будет использоваться в качестве самостоятельного выражения, в связи с чем более удобна несколько иная форма записи: а = b (mod m) а mod га = b mod га. (4.35) Например, 9 = —16 (mod 5), так как 9 mod 5=4 = (—16) mod 5. Формула 'а = b (mod га)' читается как "а сравнимо с b по модулю га" Это определение имеет смысл, когда a, b и га— произвольные действительные числа, но мы почти всегда будем использовать его только с целыми числами. Поскольку х mod га отличается от х на величину, кратную га, можно истолковать понятие сравнимости иначе: а = b (mod га) а — b кратно т. (4-36)
164 Теория чисел Действительно, если a mod га = Ъ mod m, то определение 'mod' в (3-2i) говорит нам, что a—b = а mod та+кта—(b mod m+lm) = (к—l)m при некоторых целых к и I. И наоборот, если a—b = km, то а = b при га = 0; в противном случае a mod га — а— |_а/т_|га = b + km— [(b + кга)/т_|т = = b — [Ь/raJ га = b mod m. Зачастую проще применять толкование = из (4-36)1 чем из (4-35)- Например, 8 = 23 (mod 5), так как 8 — 23 = —15 кратно 5; при этом нам не надо вычислять ни 8 mod 5, ни 23 mod 5. Знак сравнения по модулю (=' выглядит очень похоже на (=', что удобно, поскольку сравнения очень похожи на равенства. Например, сравнение по модулю является отношением эквивалентности] т.е. оно обладает свойствами рефлексивности (а = а', симметричности {а = b => b = а' и транзитивности ?a = b = с =Ф> а = с\ Все эти свойства легко доказать, поскольку любое отношение *=', удовлетворяющее соотношению 4 a = b <=> f(a) = f(b)' для некоторой функции f, является отношением эквивалентности (в нашем случае f (х) = х mod та). Кроме того, сравнимые элементы можно складывать и вычитать без потери их сравнимости: a = Ъ и с = d =? a + с = b + d (mod m); a = b и с = d => a — с = b — d (mod m). Действительно, если a — b и с — d оба кратны та, то же можно сказать и о (a + c) —(b + d) = (a —b) + (c —d) и (а —с) —(b —d) = (а — b) — (с — d). Кстати, не обязательно писать '(mod та)' после каждого знака ' = \ Если модуль представляет собой константу, достаточно упомянуть его однократно для указания контекста. В этой возможности состоит большое удобство понятия сравнения по модулю. То же самое справедливо и для умножения, если только мы работаем с целыми числами: a = b и с = d ==> ас = bd (mod m), целые Ъус. Доказательство: ac — bd = (a — b)c + b(c — d). Многократное применение этого свойства умножения позволяет нам получить степени: a = b =Ф> an = bn (mod m), целые a, b; целое n^>0. "Сегодня я чувствую себя отлично по модулю небольшой головной боли" — Словарь хакера [337]
4.6 'MOD': отношение сравнимости по модулю 165 Например, поскольку 2 = —1 (mod 3), имеем 2П = (—1 )n (mod 3); это означает, что 2П — 1 кратно 3 тогда и только тогда, когда п четное. Таким образом, большинство обыкновенно выполняемых с равенствами алгебраических операций можно выполнять и со сравнениями по модулю. Большинство, но не все. Операция деления отсутствует как класс. Если ad = bd (mod та), это не означает, что всегда a = Ъ. Например, 3-2 = 5-2 (mod 4), но 3 ф 5. Однако свойство сократимости сравнений по модулю можно сохранить в часто встречающемся случае, когда d и га взаимно просты: ad = bd <Ф=^ a = b (mod m), (4-37) целые a, b, d, ra и d JL ra. Например, из того, что 15 = 35 (mod та) вполне закономерно следует вывод, что 3 = 7 (mod ra), если только модуль та не кратен 5. Для доказательства этого свойства снова воспользуемся расширением правила (4.5) АЛЯ НОД, находя d' и та7, такие, что d'd + m'm = 1. Тогда, если ad = bd, можно умножить обе части сравнения по модулю на d', получая ad'd = bd'd. Поскольку d'd = 1, получаем ad'd = а и bd'd = b; следовательно, a = b. Это доказательство показывает, что при рассмотрении сравнений (mod та) число d' действует наподобие числа 1/d; так что будем называть его "обратным к d по модулю та'.' Другое применение операции деления к сравнению по модулю заключается в делении модуля наряду с другими числами: ad = bd (mod Tad) 4=> a = b (mod та) при d Ф 0. (4-3&) Это правило справедливо для всех действительных чисел a, Ь, d и та, поскольку оно зависит только от дистрибутивного закона (a mod m)d = ad mod Tad: имеем a mod та = b mod та 4=> (a mod m)d = (b mod m)d 4=Ф ad mod Tad = bd mod Tad. Так, например, из 3-2 = 5-2 (mod 4) заключаем, что 3 = 5 (mod 2). Можно объединить (4-37) и (4-38)> чтобы получить общее правило, изменяющее значение модуля как можно в меньшей степени: ad = bd (mod та) 4=Ф а = Ъ (mod —r^-j , целые а,Ъ, d,m. (4.39)
166 Теория чисел Чтобы получить это правило, можно умножить ad = bd на d', где d'd 4- m'm = HOA(d, m); это даст нам сравнение по модулю а-НОД^га) = b-HOA(d>m) (mod га), которое можно разделить на HOA(d,m). Давайте немного разовьем идею изменения величины модуля. Если известно, что a = b (mod 100), то должно выполняться и a = b (mod 10) или по модулю любого делителя 100. Утверждение, что a —b кратно 100, более сильное, чем утверждение, что оно кратно 10. В общем случае a = Ъ (mod md) => a = b (mod m), целое d, (440) поскольку величина, кратная rad, кратна и m. И наоборот, если мы знаем, что a = b по некоторым двум малым модулям, можно ли на этом основании сделать вывод, что Модуляшкам? a = Ъ и по некоторому большему модулю? Да, можно: соответствующее правило гласит, что a = b (mod m) и a = b (mod n) 4=4> a = b (mod НОК{т,п)), целые га,n > 0. (441) Например, если мы знаем, что a = b по модулю 12 и 18, мы можем с уверенностью заключить, что a = b (mod 36). Основанием для такого заключения служит то, что если разность a —b кратна как га, так и п, то она кратна и НОК(ггцп). Это следует из принципа единственности разложения на простые множители. Частный случай этого правила— га _1_ п— чрезвычайно важен, поскольку HOKfra^n) = ran, если га и п взаимно просты. Сформулируем его в явном виде: а = Ъ (mod ran) 4=4> а = b (mod m) и а = Ъ (mod п), если ra _L п. (442) Например, а = b (mod 100) тогда и только тогда, когда a = Ь (mod 25) и а = b (mod 4). Иначе говоря, если мы знаем, что х mod 25 и х mod 4, то имеем достаточно информации для того, чтобы определить, что х mod 100. Это— частный случай китайской теоремы об остатках (см. упр. 30), которая называется так потому, что была открыта в Китае Сунь Цзы (Sun Tsu) примерно в 350 г. н. э. Модули типв (442) могут быть далее разложены на взаимно простые множители, пока не будут выделены все различные простые числа. Следовательно, а = Ъ (mod ra) <=> а = b (mod pmp) при всех р ,
4.6 'MOD': отношение сравнимости по модулю 167 если разложение (4-и) числа га на простые множители представляет собой Y\v Pmp • Сравнения по модулю степеней простых чисел— это те строительные блоки, из которых строятся все сравнения по модулю целых чисел. 4.7 Независимые остатки Одно из важнейших приложений сравнений по модулю— система счисления в остатках (residue number system), в которой целое число х представляется в виде последовательности его остатков (или вычетов) по взаимно простым модулям: Res(x) = (х mod гги ,..., х mod mr), если raj _L rrijc при 1 ^ j < k ^ г. Знание x mod mi , ..., x mod mr ничего не говорит о х, но позволяет определить х mod га, где га— произведение mi ... mr. Поскольку в практических приложениях часто известно, что х находится в определенном диапазоне, то можно узнать об х все, если известно, что х mod га и если га достаточно велико. Рассмотрим, например, малый случай системы счисления в остатках, когда имеются только два модуля, 3 и 5: х mod 15 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 х mod 3 0 1 2 0 1 2 0 1 2 0 1 2 0 1 2 xmod5 0 1 2 3 4 0 1 2 3 4 0 1 2 3 4 Все упорядоченные пары (х mod 3,х mod 5) различны, поскольку х mod 3 = у mod 3 и х mod 5 = у mod 5 тогда и только тогда, когда х mod 15 = у mod 15.
168 Теория чисел Согласно правилам сравнений обе компоненты можно складывать, вычитать и умножать независимо. Например, если мы хотим умножить 7 = (1,2) на 13 = (1,3) по модулю 15, то вычисляем 1 • 1 mod 3 = 1 и 2 • 3 mod 5 = 1 и получаем окончательный ответ (1,1) = 1; следовательно, 7-13 mod 15 должно быть равно 1. Само собой, так оно и есть. Этот принцип независимости полезен в компьютерных приложениях, поскольку разные компоненты могут обрабатываться раздельно (например, на разных компьютерах). Если каждый модуль mic представляет собой простое число р^, несколько меньшее 231, то компьютер, выполняющий базовые арифме- Например, хорошо тические операции с целыми числами в диапазоне [—231 ..231), подходит простое число Мерсенна может легко вычислять суммы, разности и произведения по мо- 231 - 1 дулю pic. Набор из г таких простых чисел позволяет складывать, вычитать и умножать "числа многократной точности" состоящие почти из 31 г бит, а система остатков дает возможность сделать это быстрее, чем при выполнении тех же действий другими способами. В определенных ситуациях можно выполнять и деление. Предположим, например, что мы хотим вычислить точное значение большого определителя, состоящего из целых чисел. Результатом будет целое число D, а границы для |D| можно получить на основе размера его элементов. Все известные быстрые способы вычисления определителей требуют выполнения деления, что приводит к дробям (и потере точности, если довольствоваться двоичными приближениями). Выход заключается в вычислении D mod pic = Die для разных больших простых чисел р^. Мы можем безопасно выполнять деление по модулю pi<, если только делитель не окажется кратным р^. Это очень маловероятно, но если такое и случится, то можно выбрать другое простое число. Наконец, зная D^ для достаточно большого количества простых чисел, мы можем определить и само значение D. Мы пока что не объяснили, как от заданного набора остатков (х mod mi,..., х mod mr) вернуться к х mod га. Мы показали, что такой переход, в принципе, может быть выполнен, но вычисления могут оказаться такими громоздкими, что на практике окажутся неприемлемыми. К счастью, имеется относительно простой способ выполнить эту работу, который мы можем проиллюстрировать на примере набора (х mod 3, х mod 5) из нашей таблицы. Ключевая идея состоит в разрешении проблемы для случаев (1,0) и (0,1); действительно, если (1,0) = аи (0,1) =Ь, то (х,у) = (ах + try) mod 15, поскольку сравнения могут умножаться и суммироваться.
4.7 Независимые остатки 169 В нашем случае таблица дает а = 10иЪ = 6;но как найти а и Ь, когда модули огромны? Другими словами, если га _1_ п, то где тот путь, который позволит найти числа а и Ь, такие, что будут выполняться уравнения a mod га = 1, а mod п = О, Ъ mod га = О, Ъ mod п = 1 ? И вновь нас спасает (4.5): с помощью алгоритма Евклида можно найти такие числа т' и п', что m'm+ п'п = 1 . Поэтому можно взять а = п'п и Ъ = m'm, при необходимости приводя их по mod ran. При больших модулях для уменьшения количества вычислений могут понадобиться и другие хитрости; и хотя подробности выходят за рамки данной книги, их можно найти в [208, с. 274]. Переход от остатков к соответствующим исходным числам— операция, в принципе, выполнимая, но достаточно медленная, так что выигрыш во времени выполнения можно получить, только если можно выполнить сразу некоторую последовательность операций в системе счисления в остатках перед обратным преобразованием. Попробуем подкрепить эти идеи путем решения небольшой задачи: сколько решений имеет сравнение по модулю х2 = 1 (mod m), (4.43) если решения хих' считаются одним и тем же при х = х'? В соответствии с поясненными ранее общими принципами сначала мы должны рассмотреть случай, когда та представляет собой степень простого числа рк при к > 0. Тогда сравнение х2 = 1 может быть записано в виде (х-1)(х + 1) = 0 (modpk)> так что р должно делить либо х — 1, либо х+1, либо оба. Но р не может делить и х — 1, и х + 1, если только оно не равно 2 (оставим этот случай на потом). Если р > 2, то рк\(х — 1 )(х + 1) 4=> рк\(х — 1) или рк\(х +1); поэтому имеется ровно два решения: X = +1 и х = — 1. Случай р = 2 немного отличается. Если 2к\(х — 1 )(х -f 1), то либо х — 1, либо х + 1 делится на 2, но не на 4, так что другое число должно делиться на 2к~1. Это означает, что при к ^ 3
170 Теория чисел имеется четыре решения, а именно х = ±1 ихе 2k_1 ± 1. (Например, если рк = 8, то эти четыре решения представляют собой х = 1, 3, 5, 7 (mod 8); кстати, часто полезно знать, что квадрат любого нечетного числа имеет вид 8тг + 1.) Итак, х2 = 1 (mod га) тогда и только тогда, когда х2 = 1 (mod р171^) для всех простых чисел р с гар > 0 в каноническом разложении га на простые множители. Каждое простое число не зависит от других, и для х mod pmp (за исключением случая р = 2) имеется ровно две возможности. Поэтому, если га имеет ровно г различных простых делителей, общее количество решений сравнения по модулю х2 = 1 равно 2Г (за исключением поправки на четное га). В общем случае точное количество решений равно 2T+[8\m] + [4\m]-[2\m] (444) Так, имеется четыре "квадратных корня единицы по модулю 12" а именно 1, 5, 7 и 11. При га = 15 данная четверка— это числа, которые дают остатки ±1 по mod 3 и mod 5, а именно (1,1), (1,4), (2,1) и (2,4) в системе счисления в остатках. В обычной (десятичной) системе счисления это числа 1, 4, 11 и 14. Все простые числа нечетны, кроме 2, которое нечетнее всех. 4.8 Дополнительные приложения С главы 3 за нами небольшой должок: мы обещали доказать, что га чисел О mod га, n mod га, 2n mod га,..., (га — 1 )n mod га (4-45) состоят в точности из d наборов ra/d чисел О, d,2d,.. .,ra— d в некотором порядке, где d = НОД(га,п). Например, при га = 12 и п = 8 имеем d = 4, и эти числа представляют собой 0, 8, 4, О, 8, 4, 0, 8, 4, 0, 8, 4. Первая часть доказательства— показать, что мы получаем d наборов первых ra/d значений— теперь тривиальна. Согласно Любят математики (aoS) говорить, что то jn = kn (mod га) j(n/d) = k(u/d) (mod m/d), или иное тривиально. .. откуда мы получаем d наборов значений, полученных при 0 ^ k < ra/d. Теперь мы должны показать, что эти ra/d чисел представляют собой {0, d, 2d,..., га — d} в некотором порядке. Положим
4.8 Дополнительные приложения 171 га = ra7d и n = n'd. Тогда по дистрибутивному закону (3-23) kn mod m = d(kn7 mod m/), так что величины, которые получаются при 0 :$ к < та7,— это взятые по d раз числа О mod га7, л/ mod га7,2n7 mod га7,..., (га7 — 1 )n7 mod га7. Но на основании (4-27) известно, что га7 _L п7,— они уже поделены на их НОД. Поэтому надо рассмотреть только случай d = 1, а именно— когда тип взаимно просты. Итак, допустим, что га _1_ п. В этом случае при помощи "принципа голубиных гнезд" легко видеть, что числа (445) — это просто {0, 1, ..., га— 1} в некотором порядке. Этот принцип гласит, что если га голубей рассаживаются по га гнездам, то пустое гнездо имеется тогда и только тогда, когда в каком-то другом гнезде будет находиться больше одного голубя. (Это аналог принципа ящиков Дирихле, доказанного в упр. 3.8.) Известно, что числа (4-45) различны, поскольку jn = kn (mod m) 4=> j = k (mod та), если m 1 n (это свойство (4.37)). Следовательно, все гнезда с номерами 0, 1, ..., та — 1 должны заполниться та различными числами. На этом доказательство завершается и наши долги из главы 3 оплачиваются. Доказательство завершено, но можно доказать большее, если использовать прямой метод, а не полагаться на косвенную "птичью" аргументацию. Если m 1 пи если задано значение j G [0 .. та), можно явно вычислить число k G [0 .. та), такое, что kn mod та = j, решая сравнение по модулю kn = j (mod та) относительно к. Мы просто умножаем обе части на п7, где та7га+ п'п = 1, и получаем к = jn7 (mod та); следовательно, к = jn7 mod та. Только что доказанные факты можно использовать для получения одного важного результата, открытого Пьером де Ферма (Pierre deFermat) в 1640 году. Ферма был великим математиком, внесшим огромный вклад в создание дифференциального исчисления и многие другие разделы математики. После него остались рукописи, содержащие множество теорем без доказательств, и все они были впоследствии подтверждены. Лишь одна из них
172 Теория чисел противостояла усилиям лучших математиков мира более 350 лет и стала потому самой знаменитой теоремой. Эта "большая теорема Ферма" гласит, что an + bn ф с71 (446) для всех положительных целых чисел а, Ъ, сип, если п > 2. (Само собой, уравнения a + b = с и а2 + Ъ2 = с2 имеют бесконечное количество решений.) Эндрю Уайльс (Andrew Wiles) окончательно разрешил вопрос, опубликовав эпохальное доказательство (44^) в Annals of Mathematics 141 (1995), с. 443-551. Однако проверить теорему Ферма выпуска 1640 года гораздо проще. Сейчас она называется "малая теорема Ферма" (или для краткости просто "теорема Ферма") и гласит, что п р-1 1 (mod р), если п ±тр. (447) Доказательство. Как обычно, полагаем, что р— простое число. Мы знаем, что р — 1 чисел n mod р, 2n mod р, ..., (р — 1 )n mod р представляют собой числа 1,2, ...,р — 1 в некотором порядке. Таким образом, перемножив их все, получим n.(2n).....((p-l)n) = = (тг mod р) • (2n mod р) • ... • ((р — 1 )тг mod р) = (Р-1)!, где выполняется сравнение по модулю р. Это означает, что (р_1)!пР-1 = (р-!)! (modp), и можно выполнить сокращение на множитель (р—1)!, поскольку он не делится на p. QED Иногда удобнее работать с альтернативной формулировкой теоремы: nv = п (mod р), целое п. (448) Это сравнение по модулю имеет место при любом целом п. Доказательство этого факта очень простое: если п _1_ р, мы просто умножаем (447) на п- Если нет, то р\п, так что пр = 0 = п. В том же году, когда была открыта теорема (447)» Ферма написал письмо Мерсенну, в котором высказал предположение о том, что числа СЕНСАЦИЯ Эйлер [115] предположил, что a4+b4+c4^d4, но Наум Элшс (Noam Elkies) [92] в августе 1987года обнаружил, что существует бесконечно много решений. Роджер Фрай (Roger Frye) выполнил исчерпывающий компьютерный поиск и выяснил, затратив около ПО часов работы суперкомпьютера Connection Machine, что единственным решением при d < 1000000 является 958004 +2175194 + 4145604 = 4224814. 22 +1
4.8 Дополнительные приложения 173 "... laquelle proposition, si elle est vraie, est de tres grand usage" — П.де Ферма RdeFermat[121] И это— всего лишь малая теорема Ферма! должны быть простыми при всех п ^ 0. Он знал, что первые пять таких чисел— простые: 21 +1 - 3; 28 + 1 = 257; 22 +1 216 + 1 5; 65537; 24 + 1 17; однако он не мог сообразить, как доказать простоту следующего числа 232 + 1 = 4294967297. Интересно, что Ферма смог бы доказать, что 232 + 1 не является простым, если бы воспользовался собственной только что открытой теоремой и потратил немного времени для нескольких десятков умножений. Подставим п = 3в (4-47)) что Аает нам З232 ЕЕ 1 (mod 2iZ +1 если 232 + 1 - простое число. Это соотношение можно проверить вручную, начиная с 3 и возводя его в квадрат 32 раза, сохраняя при этом только остатки по модулю 232 + 1. Сначала мы получим З2 = 9, затем— З2 = 81, затем— З2 = 6561, и так далее, пока не доберемся до З232 = 3029026160 (mod VL + 1). Результат не равен 1, так что 232 + 1 - составное число. Этот метод опровержения не дает нам никакой информации о сомножителях составного числа, но доказывает, что они существуют. (Это 641 и 6700417, найденные Эйлером в 1732году [102].) Если бы число З2 оказалось равным 1 по модулю 232 +1, то вычисления не доказывали бы, что 232 + 1 — простое; они всего лишь не опровергали бы это. Но в упр. 47 рассматривается обращение теоремы Ферма, с помощью которого моэюно доказать простоту больших чисел, не прибегая к громоздким арифметическим вычислениям. Мы доказали теорему Ферма, сокращая обе части уравнения на (р — 1)!. Оказывается, величина (р — 1)! всегда сравнима с —1 по модулю р; это— часть классического результата, известного как теорема Вильсона: (п-1)! = -1 (modn) п простое, если п > 1. (4-49) Половина этой теоремы тривиальна: если п > 1 — не простое число, то у него есть простой делитель р, который появляется в качестве множителя в разложении (п — 1)!, так что (п — 1)! не может быть сравнимо с —1. (Если бы (п— 1)! было сравнимо с —1
174 Теория чисел по модулю п, то оно было бы сравнимо и с — 1 по модулю р, но это не так.) Вторая половина теоремы Вильсона гласит, что (р —1)! = — 1 (mod р). Ее можно доказать, объединяя попарно числа с обратными к ним по модулю р. Если n _L р, то известно, что существует и', такое, что п п 1 (mod р); здесь п'— обратное к п, а п, в свою очередь, обратное к п''. Любые два обратных к п числа должны быть сравнимы друг с другом, поскольку из тт/ = тт" вытекает, что п' = п". Теперь предположим, что каждое число между 1 и р — 1 образует пару со своим обратным. Поскольку произведение некоторого числа и обратного к нему сравнимо с 1, произведение всех пар обратных чисел также сравнимо с 1; по-видимому, (р — 1)! также сравнимо с 1. Проверим это, например, для р = 5. Получаем 4! = 24, но это число сравнимо с 4, а не с 1, по модулю 5. Ой! Значит, мы ошиблись, но где? Давайте посмотрим на обратные числа повнимательнее: Г = 1, 2' = 3, 3' = 2, 4' = 4. Вот оно в чем дело: 2 и 3 образуют пару, но 1 и 4— нет (они являются обратными сами себе). Чтобы исправить наш анализ, надо определить, какие числа являются обратными сами себе. Если х обратно самому себе, то х2 = 1 (mod р). Мы уже доказали, что это сравнение имеет ровно два корня при р > 2. (Если р = 2, то очевидно, что (р — 1)! = —1, так что беспокоиться об этом случае не надо.) Эти корни равны 1 и р — 1, а все остальные числа (между 1 и р — 1) благополучно разбиваются на пары; следовательно, (р_1)! = Ь(р-1) = -1, что и требовалось. К сожалению, мы не умеем эффективно вычислять факториалы, так что в качестве практического инструмента проверки теорема Вильсона бесполезна— это всего лишь теория. Если р — простое, то р' — произвольно простое или просто производное? 4.9 Фи и мю Сколько среди целых чисел {0,1,..., та — 1} взаимно простых с та? Эта важная величина называется <р(та), то- тиентой та (это название придумано британским математиком
4.9 Фи и мю 175 "Si fuerit N ad х numerus primus et n numerus partium ad N primarum, turn potestas xn unitate minuta semper per numerum N erit divisibilis" —Л.Эйлер [HI] Дж. Дж. Сильвестром (J.J.Sylvester) [347], которому нравилось вводить новые термины). Итак, имеем ф(1) = 1, Ц){у) = р — 1, и ф(га) < га— 1 для всех составных чисел т. Функция ф называется фи-функцией Эйлера, так как Эйлер был первым, кто ее изучал. Эйлер открыл, например, что теорема Ферма (4-47) может быть обобщена на составные модули следующим образом: п ср(т) = 1 (mod га), если п J_ т. (4-50) (Теорему Эйлера предлагается доказать в упр. 32.) Если m— степень простого числа рк, то вычислить ф(т) легко, поскольку n 1 рк 4=> р\п. Кратными р среди чисел {О, 1,..., рк — 1} являются числа {0, р, 2р,..., рк — р}; следовательно, всего их рк_1, а ф(рк) подсчитывает то, что остается: ф(Р* ,1с-1 Обратите внимание, что эта формула при к = 1 корректно дает (р{р) =р-1. Если га > 1 не является степенью простого числа, то можно записать га = mi таг, где mi J_ mz. Тогда числа 0 ^ п < та могут быть представлены в системе остатков как (п mod mi, n mod 1П2). Согласно (4.30) и (4.4) n _L m n mod mi 1 mi и n mod m2 _L m.2. "Si sint A et В лишен inter se primi et numerus partium ad A primarum sit = a, numerus vero partium ad В primarum sit = b, turn numerus partium ad productum AB primarum erit = ab'! —Л.Эйлер[111] Следовательно, n mod m является "хорошей" тогда и только тогда, когда "хорошими" являются и n mod rai, и n mod 1П2 (если считать хорошим качеством взаимную простоту). Общее количество хороших величин по модулю m теперь может быть вычислено рекурсивно как ф(т1 )ф(т-2), поскольку имеется ф(т,1) хороших способов выбора первой компоненты n mod mi и ф(т2) хороших способов выбора второй компоненты n mod iri2 в модульном представлении. Например, ф(12) = ф(4)ф(3) =2-2 = 4, поскольку п взаимно простое с 12 тогда и только тогда, когда п mod 4 = (1 или 3) и n mod 3 = (1 или 2). Вот четыре величины в системе остатков, взаимно простых с 12: (1,1), (1,2), (3,1), (3,2); в обычной десятичной записи это 1, 5, 7, 11. Теорема Эйлера гласит, что п4 = 1 (mod 12) при п _1_ 12. Функция f(m) положительных целых чисел называется мультипликативной, если f(1) = 1 и f(mim2) = f(rai)f(m2) для любых mi _L ra2- U-51)
176 Теория чисел Мы только что доказали, что ф(т) — мультипликативная функция. Мы уже встречались с примером такой функции в этой главе: количество несравнимых решений сравнения по модулю х2 = 1 (mod га) мультипликативно. Еще одним примером мультипликативной функции служит функция f (га) = гаа при любом показателе степени а. Мультипликативная функция полностью определяется ее значениями на множестве степеней простых чисел, поскольку любое положительное целое число га может быть разложено на степени простых сомножителей, которые взаимно просты друг с другом. Общая формула f (m) = П f (pm*), если m = ]J P"P > (4-52) p p выполняется тогда и только тогда, когда f— мультипликативная функция. В частности, эта формула дает нам значение фи-функции Эйлера для произвольного числа та: Ф(ш) = П (рт> - р™»"1) = m П (l - 1) . (4.53) p\m p\m Например, <р(12) = (4-2)(3- 1) - 12(1 - 1)(1 - 1). Рассмотрим теперь применение ср-функции для изучения рациональных чисел по модулю 1. Говорят, что дробь га/п— правильная, если 0 ^ га < п. Следовательно, ф(п)— это количество несократимых правильных дробей со знаменателем п, а все несократимые правильные дроби со знаменателем п или меньшим и неправильная дробь | входят в состав последовательности Фарея. Множество всех правильных дробей со знаменателем 12 до их приведения к несократимым имеет вид 12' 12' 12' 12> 12' 12' 12' 12' 12' 12' 12' 12" Приведение дает 0J_111JL1_Z_115H 1' 12' 6' 4' 3' 12' 2' 12' 3' 4' 6' 12' и эти дроби можно сгруппировать по знаменателям: о. 1. 12. 13. 15. j_ А. 1_ И 1 ' 2' 3' 3' 4' 4' 6' 6> 12' 12' 12' 12* И что нам это дает? Ну, например, то, что среди знаменателей встречаются все делители d числа 12 вместе со всеми (p(d) своими числителями. Все знаменатели являются делителями 12.
4.9 Фи и мю 177 Таким образом, ф(1) + ф(2) + ф(3) + (р(4) + ср(6) + ср(12) = 12. Очевидно, что то же самое получится, если начать с несокращенных дробей ^-, ^, ..., Л^- для любого т, следовательно, Y_ cp(d) = m. (4.54) d\m В начале этой главы говорилось, что в задачах теории чисел часто приходится вычислять суммы по делителям некоторого числа. Формула (4-54)— пример такой суммы, а далее мы встретимся и с другими примерами. Вот один забавный факт: если f— некоторая функция, такая, что сумма g(m) = YL f№ d\m представляет собой мультипликативную функцию, то и сама f является мультипликативной функцией. (Этот результат вместе с (4.54) и тем фактом, что g(m) = та— очевидно мультипликативная функция, дает другое объяснение тому, почему ф(т) — функция мультипликативная.) Этот забавный факт можно доказать по индукции по га: база индукции устанавливается просто, так как f(1) = g(1) = 1. Пусть га > 1, и допустим, что f (mi таг) = f(mi )f(m.2) для любых mi _L mz и mim2 < га. Если та = mi m,2 и mi _L та2, то g(mim2) = ?. f(d) = ?. Y. f(dld^ d\rai таг di \тги d2\TTi2 и di -L d2, так как все делители mi взаимно просты со всеми делителями ТП2. Согласно гипотезе индукции f(di d2) = f (di )f (d2), за исключением, возможно, случая, когда di = тти и d2 = та2; следовательно, мы получаем ( Y_ f(di) Y. f(d2))-f(mi)f(m2)+f(m1m2) - di\m, d2\m2 = g(mi)g(m2)-f(mi)f(m2)+f(mim2). Но это равно g(mim2) = g(mi)g(m.2), так что f(miTU2) = f(m1)f(m2).
178 Теория чисел Обратно, если f (m) является мультипликативной функцией, то соответствующая ей функция суммы по делителям g(m) = 2Id\m"f(d) всегда мультипликативна. На самом деле, как показано в упр. 33, справедливо даже большее. Следовательно, наш забавный факт и обратный ему— непреложные факты. Функция Мёбиуса ц(та), названная в честь математика XIX века Августа Мёбиуса (August Mobius), известного также своей лентой, определяется для всех целых га ^ 1 уравнением X>(d) = [m=1]. (4-55) d\m Это уравнение на самом деле представляет собой рекуррентное соотношение, поскольку его левая часть является суммой из ц(тп) и некоторых значений \i[d) при d < га. Например, если последовательно подставлять га = 1, 2, ..., 12, то можно вычислить первые двенадцать значений данной функции: та \х{т) 1 1 2 -1 3 -1 4 0 5 -1 6 1 7 8 9 -10 0 10 1 11 -1 12 0 Ричард Дедекинд (Richard Dedekind) [77] и Жозеф Аиувилль (Joseph Liouville) [251] в 1857 году заметили следующий важный "принцип обращения": f(m) = 2>(d)g(^ d\m (4.5б) g(m) = 52 f№ d\m Согласно этому принципу функция \i обеспечивает нас новым способом понять, что же собой представляет функция f(m), для которой известна сумма Нахт"^). Для доказательства (4-5^) воспользуемся приемами (4.7) и (4.9)) которые описанны в начале этой главы. Если g(m) = Ld\mf(d).T0 d\m d\m -Z-(t)Z«4- "\d Klcd d\m z Z KS)™- k\m d\(m/k) k\m d\(m/k) 2jm/k = 1]f(k) = f(m) k\m Сейчас самое время размяться с помощью упр. 11.
4.9 Фи и мю 179 Точное время зависит от скорости чтения книги. Вторая половина (4-56) доказывается аналогично (см. упр. 12). Соотношение (4.56) дает нам полезное свойство функции Мёбиуса, и мы уже протабулировали первые двенадцать ее значений. Но что собой представляет ц(т) при больших т? Как разрешить рекуррентное соотношение (4-5б)? Очевидно, что функция g(m) = [m=1] мультипликативна— в конце концов, она равна нулю при всех га, за исключением m = 1. Так что функция Мёбиуса, определенная уравнением (4-5б)> должна быть мультипликативной в соответствии с забавным фактом, доказанным пару минут назад. Таким образом, можно выяснить, что из себя представляет |х(т), если вычислить ц(рк). Когда m = рк, (4-55) гласит, что ц(1) + ц(р) + ц(р2) + ... + ц(рк) = О при всех к ^ 1, поскольку делителями рк являются 1, ..., рк. Отсюда следует, что ц(р) = -1; ^(рк) =0 прик>1. Поэтому в силу (4-52) получаем общую формулу ц(тп) = П^Ртр) = р\т (-I)1", если т = р!р2...рг; 0, если га делится на квадрат (4-57) некоторого простого р2. Вот что такое \х. Если рассматривать (4-54) как рекуррентное соотношение для функции ф(т), то его можно разрешить при помощи правила Дедекинда-Лиувилля (4-56)- Мы получим ф(т) = Y_ ^^"d ' (4.58) d\m Например, Ф(12) = ^x(l).12+^(2).6+ц(3)-4+ц(4).3+^1(6).2+ц(12).1 = 12-6-4+0+2+0 = 4. Если га делится на г различных простых чисел, скажем, на {pi,... ,рг}, то сумма (4.58) имеет только 2Г ненулевых членов, так как функция \i часто равна нулю. Так, можно убедиться, что (4.58) согласуется с формулой (4-53)> записанной в виде ф(т) m(l--L)...(l-l); V ул) \ рг/
180 Теория чисел если перемножить все г сомножителей (1 — 1/pj), мы получим в точности 2Г ненулевых членов (4-58)- Достоинство функции Мёбиуса заключается в том, что она применима и во многих иных ситуациях, а не только в рассмотренной. Например, попробуем выяснить, сколько дробей насчитывается в последовательности Фарея jFn. Это количество равно числу несократимых дробей из [0.. 1 ], знаменатели которых не превосходят п, так что оно на 1 больше, чем величина Ф(п), которая определяется как ф(х) = Y- ^м- (4-59) l^k^x (Мы вынуждены прибавить 1 к Ф(тг) из-за последней дроби у.) Сумма (4-59) выглядит сложной, но Ф(х) можно определить косвенно, заметив, что 5>(z) = ^xJL1+xJ (4.бо) d^l при всех действительных х ^ 0. Почему выполняется это тождество? Несмотря на его несколько пугающий вид, на самом деле его доказательство не выходит за рамки наших возможностей. Всего имеется \ |_xj [_1 + xj правильных дробей m/n сО ^ т< n ^ х, с учетом как сокращенных, так и не сокращенных дробей; это дает нам правую часть тождества. Число таких дробей с НОД(ттг, n) = d равно 0(x/d), потому что такие дроби суть т'/а' с 0 ^ т/ < п' ^ x/d после замены га на m/d и п на n'd. Таким образом, левая часть подсчитывает те же дроби иным способом, и это тождество должно быть истинным. Давайте более внимательно рассмотрим ситуацию, чтобы уравнения (4-59) и (4-6о) стали более понятными. Из определения Ф(х) вытекает, что Ф(х) = Ф(|_х_|); однако удобнее считать функцию Ф(х) определенной для произвольных действительных чисел, а не только для целых. Для целых значений мы получаем таблицу: п Ф(п) Ф(п) 0 1 2 - 1 1 0 1 2 3 2 4 4 2 6 5 4 10 6 2 12 7 6 18 8 4 22 9 6 28 10 4 32 11 10 42 12 4 46 и можем проверить тождество (4.60) при х = 12: Ф(12) + Ф(б) + Ф(4) + Ф(3) + Ф(2) + Ф(2) + 6- Ф(1) = 46+12 + 6 + 4 + 2 + 2 + 6 = 78 = ?.12-13. Такое распространение на действительные числа — полезный прием для решения многих рекуррентных соотношений, возникающих в ходе анализа алгоритмов. Удивительно!
4.9 Фи и мю 181 В действительности Мёбиус [273] изобрел свою функцию из-за свойства (4-61), а не (4.56). Тождество (4.60) можно рассматривать как неявную рекуррентность относительно Ф(х); например, мы только что видели, как при вычислении Ф(12) использовались некоторые значения Ф(т) при га < 12. Разрешать такие рекуррентные соотношения можно при помощи еще одного красивого свойства функции Мёбиуса: g(x) = J^i(x/d) fW = ?>(d)g(x/d). d$>i (4.61) d^l Это правило обращения выполняется для всех функций f, таких, что Y.]c d>i |"f(x/kd)| < 00. Это можно доказать следующим образом. Предположим, что g(x) = Y.d>i f(x/d). Тогда d^i ?>d)g(x/d) = ^(d)^f(x/kd) = = ]T f(x/m) J~ ^(d)[m = kd] = ?f(x/m)J>(d) = m^l d\m ?f(x/m)[m=1] = f(x). m>A Доказательство в обратном направлении по сути такое же. Теперь мы в состоянии разрешить рекуррентное соотношение (4.60) относительно Ф(х): Ф(х) = -X.^d)Lx/dJLi+x/dj. (4.62) d$>l Это всегда конечная сумма, например Ф(12) = ^(12.13-6.7-4.54-0-2-3 + 2.3- -1.2 + 0 + 0 + 1-2-1.2 + 0) = = 78-21-10-3 + 3-1+1-1 = 46. Из главы 9 вы узнаете, как использовать (4-62) для получения хорошего приближения Ф(х); фактически мы докажем результат, полученный в 1874 году Мертенсом (Mertens) [270]: 3 Ф(х) = -Tx2 + 0(xlogx).
182 Теория чисел Следовательно, функция Ф(х) растет "плавно" усредняя изменчивое поведение ср(к). Придерживаясь начатой в предыдущей главе традиции, завершим данную главу задачей, которая иллюстрирует многое из того, с чем вы уже познакомились, и что, кроме того, имеет отношение к следующей главе. Предположим, что у нас имеется п бусинок разных цветов; наша цель— подсчитать, сколькими способами из них можно составить ожерелье длиной га. Можно попробовать применить принцип "именуй и властвуй" обозначив количество возможных ожерелий через N(ttl,ti). Например, из бусинок цветов R и В ожерелье длиной 4 можно собрать N (4,2) = 6 различными способами: R R R R г*л R В Ч^ г*-л В В ^ г*л В в Чз^ гв^ в в ^ Все остальные способы эквивалентны одному из приведенных, так как вращение ожерелья новое ожерелье не дает. Однако отражения считаются различными; так, например, для случая m = 6 гв^ R R 1 1 R В ^в-^ отличается от гвл R R 1 1 В R ^ Задача подсчета таких конфигураций была впервые решена П. А. Мак-Мэханом (P. A. MacMahon) [264] в 1892 году. Явного рекуррентного соотношения для 1М(тгцп) нет, но количество ожерелий можно подсчитать, разрывая и вытягивая в нить га способами каждое из них и рассматривая получающиеся обрывки. Например, при m = 4 и п = 2 мы получим следующие наборы: RRRR RRBR RBBR RBRB RBBB ВВВВ RRRR RRRB RRBB BRBR BRBB ВВВВ RRRR BRRR BRRB RBRB BBRB ВВВВ RRRR RBRR BBRR BRBR BBBR BBBB Каждый из nm возможных шаблонов встречается в этом массиве из raN(m>n) строк по крайней мере один раз, а некоторые— и более того. Сколько раз встречается конкретный набор do ... am_i ? Все просто: это количество циклических сдвигов строки die... am_i do ... Qic-i, приводящих к исходной строке
4.9 Фи и мю 183 ao...am_i. Например, строка BRBR встречается дважды, так как четыре способа разрезать ожерелье BRBR дают четыре циклических сдвига (BRBR, RBRB, BRBR, RBRB), два из которых совпадают с самим BRBR. Это рассуждение показывает, что mN(m,n) = = / / [a0 ...ат_т =ak...am_ia0 ...ак_т] = Qo,...,am-iGSn 0^k<m = У У [a0 ... am_i = ak ... am_i a0 ... ak_i ] . 0^k<m Q0,...,Qm_i6Sn Здесь Sn — множество из n различных цветов. Выясним, сколько шаблонов удовлетворяют условию do ... am_i = ak... am_i ao ... ak_i при заданном к. Например, если га = 12 и к = 8, нужно подсчитать количество решений вида aoaia2a3a4a5a6a7Ci8CL9aiociii — = a8a9aioaiiaoaia2a3a4a5a6a7 * Это означает, что ao = as = сц; ai = a9 = as; &i = Qio = О-в и аз = an =0.7. Таким образом, ao, ai, a2 и аз могут быть выбраны п4 способами, а остальные а зависят от выбранных. Вам это ничего не напоминает? В общем случае решение щ = a(j+k) mod m при 0 ^ j < m заставляет нас уравнять aj с ci(j+ki) modm ПРИ I — ^ 2, ...; нам известно, что кратными к по модулю га являются числа {О, а, 2d,..., m — а}, где d = НОД(к, т). Поэтому общее решение состоит в независимом выборе ao, ..., a^-i и последующем присвоении aj = aj_d при d ^ j < га. Всего решений nd. Мы доказали, что mN(m,u) = ]Г пНОД(к,т) 0^к<т Эта сумма может быть упрощена, поскольку она включает только члены вида nd, где d\m. Подстановка d = НОД(к, га) дает N(m,n) = — У nd У [а = Н0Д(к,т)1 = та L— л ^— d\m 0^k<m = — У_ nd y_ [k/d_Lm/d] = d\m 0^k<m ^L^ L [ic-Lm/d]. m d\m 0^k<m/d
184 Теория чисел (Мы можем заменить k/d на к, так как к должно быть кратно d.) Наконец, по определению ^0^k<m/d[k_Lm/d] = (p(m/d), так что мы получаем формулу Мак-Мэхана: N(m,n) = -Цп<1ср(т) = -L<rtd)nm/d- (4.6з) та А— \ а / га А— d\m d\m Например, при та = 4 и п = 2 количество ожерелий, как и следовало ожидать, равно ^ (1 • 24 + 1 • 22 + 2 • 21) = 6. Не очевидно, что значение N(Ta,n), определяемое суммой Мак-Мэхана, представляет собой целое число! Давайте попробуем доказать непосредственно, что ^Г (p(d)nm/d = 0 (modm), (4.64) d\m не связывая наши рассуждения с ожерельями. В частном случае, когда та— простое число, это сравнение по модулю сводится к пр + (р — 1)п = 0 (mod р), т.е. к сравнению пр = п. Мы уже видели в (448), что это сравнение представляет собой иную формулировку теоремы Ферма. Поэтому сравнение (4.64) справедливо при та = р; мы можем рассматривать его как обобщение теоремы Ферма на случай, когда модуль не является простым. (Обобщение Эйлера (4-5°)— это АРУгое обобщение.) Мы доказали (4-64) АЛЯ всех простых модулей, так что рассмотрим наименьший из оставшихся случаев— та = 4. Мы должны доказать, что n4+n2+2n = 0 (mod 4). Доказательство будет проще, если рассматривать четные и нечетные случаи по отдельности. Если п четно, то все три члена в левой части сравнимы с 0 по модулю 4, так что их сумма также сравнима с 0. Если же п нечетно, то п4 и п2 сравнимы с 1, а 2п сравнимо с 2; следовательно, левая часть сравнима с 1 + 1 + 2, а значит, сравнима с 0 по модулю 4, и мы получили то, что хотели. Давайте теперь замахнемся на та = 12. Это значение та должно быть интересным, так как у него масса множителей, включая квадрат простого числа (при том что само значение достаточно мало). (Кроме того, мы надеемся на возможность обобщить доказательство для 12 на произвольное значение та.) Сравнение, которое мы должны доказать,— п12 + п6 + 2п4 + 2п3 + 2п2 + 4п = 0 (mod 12).
4.9 Фи и мю 185 И что дальше? Согласно (4-42) это сравнение выполняется тогда и только тогда, когда оно выполняется по модулю 3 и по модулю 4. Поэтому вначале докажем, что оно выполняется по модулю 3. Наше сравнение по модулю (4-64) выполняется для простых чисел, так что п3 + 2п = 0 (mod 3). Подумав, этот факт можно использовать для группирования членов большей суммы: пи +п6 + 2п4 + 2п3 + In1 + An = = (u12+2n4) + (n6+2n2)+2(u3+2u) = = 0 + 0 + 2-0 = 0 (mod3). Так что по модулю 3 все получается. Полдела сделано. Для доказательства сравнения по модулю 4 воспользуемся тем же трюком. Мы уже доказали, что п4 + п2 + 2п = 0 (mod 4), так что воспользуемся этим при группировании: u12+n6+2n4 + 2u3+2n2+4n = = (u12+u6+2n3)+2(n4+n2+2ri) = = 0 + 2-0 = 0 (mod 4). QED для случая та = 12. Пока что наше сравнение по модулю доказано для простого та, та = 4 и та = 12. Теперь попробуем доказать его для степеней простого числа. Для конкретности можно предположить, что та = р3 при некотором простом р. Тогда левая часть (4-64) представляет собой пр3 + ч>{р)пр2 + 4>iV2)nV + 4>lV3)n = = пР3 + (р-1)пр2 + (р2-р)пр + (р3-р2)т1 = = (np3-Tip2)+p(Tip2-TiT?)+p2(TiP-Ti)+p3Ti. Можно показать, что это выражение сравнимо с 0 по модулю р3, если мы сумеем доказать, что пр —тгр делится на р3, что тгр —пр делится на р2 и что тгр — п делится на р, потому что тогда все это вместе будет делиться на р3. Согласно альтернативной формулировке теоремы Ферма np =п (mod р), так что р делит пр — п; следовательно, существует целое q, такое, что np = n + pq . Теперь возведем обе части в р-ю степень, разложим правую часть в соответствии с биномиальной теоремой (с которой мы познако-
186 Теория чисел мимся в главе 5) и после перегруппирования получим п?2 = (n + pq)p - = n^ + tpqj^^-^^+lpq)2^-2^^-.- = = np+p2Q при некотором другом целом Q. Мы в состоянии выделить множитель р2, потому что во втором слагаемом (^) =ри потому что множитель (pq)2 присутствует во всех последующих членах. Итак, мы нашли, что р2 делит пр — пр. Снова возведем обе стороны уравнения в р-ю степень, разложим в ряд и перегруппируем, получив пр3 = (np+p2Q)p = = np2+p3Q при еще одном целом Q. Итак, р3 делит пр — пр . Этим завершается доказательство для га = р3, так как мы показали, что р3 делит левую часть (4.64)- Более того, мы можем доказать по индукции, что npk = npk_1 + pkO при некотором последнем целом П (последнем потому, что мы исчерпали все варианты шрифта для вывода этой буквы); следовательно, npk = npk_1 (modpk) прик>0. (4.65) Таким образом, левая часть (4-64), которая представляет собой (npk-npk"1)+p(npk"1-npk~2) + --.+pk-1(np-n)+pkn> делится на рк и потому сравнима с 0 по модулю рк. Почти все завершено. Теперь, когда мы доказали (4-64) АЛЯ степеней простых чисел, все, что осталось сделать,— это доказать его при га = гги га2, где mi _L га2, в предположении, что данное сравнение истинно при rai и Ш2. Наше рассмотрение случая m = 12, который распадался на отдельные случаи га = 3 и га = 4, дает основание считать, что такой подход сработает.
4.9 Фи и мю 187 Мы знаем, что функция ф мультипликативна, так что можно записать ]Г (p(d)nm/d = Y_ cp(did2)nm,m2/d,d2 = d\m di \тги , d2\m.2 di\mi 4d2\m2 Но внутренняя сумма сравнима с 0 по модулю rri2, так как мы полагаем, что (4-64) выполняется при vnz] так что вся сумма сравнима с 0 по модулю rri2. Из соображений симметричности находим, что вся сумма сравнима с 0 по модулю тти . Таким образом, в силу (4-42) она сравнима с 0 по модулю га. QED Упражнения Разминка 1 Чему равно наименьшее положительное целое число, имеющее ровно к делителей (1 ^ к ^ 6)? 2 Докажите, что НОД(ггц п) • НОК(ггц n) = rn-n, и воспользуйтесь этим тождеством для того, чтобы выразить НОК(ггцп) через HOK(n mod га, га) при n mod га ф 0. Указание: воспользуйтесь правилами (4-12), (4-14) и (4-15)- 3 Пусть п[х)— количество простых чисел, не превосходящих х. Докажите или опровергните, что п[х) — п[х — 1) = [х— простое число]. 4 Что произошло бы, если бы построение Штерна-Броко начиналось с дробей (f, 1, •^т> ^-, f), а не с (f, 1)? 5 Найдите простые формулы для Lk и Rk, когда L и R представляют собой матрицы 2 х 2 из (4-33)- 6 Что означает запись 1а = Ъ (mod 0)'? 7 Десять человек, пронумерованных от 1 до 10, выстроены в круг, как в задаче Иосифа, и казнят каждого га-го человека (значение га может быть гораздо больше 10). Докажите, что первые три казненных не могут быть 10, к и к+1 (в указанном порядке) при любом к. 8 Система счисления в остатках (х mod 3,х mod 5), рассмотренная в тексте, обладает тем забавным свойством, что числу 13 соответствует пара (1,3), которая выглядит почти так же.
188 Теория чисел Объясните, как найти все такие совпадения без вычисления всех пятнадцати пар остатков. Другими словами, найдите все соответствующие решения сравнений 10х + у = х (mod 3), Юх + у = у (mod 5). Указание: воспользуйтесь тем, что 10u-f6v = u (mod 3) и 1 Ои + 6v = v (mod 5). 9 Покажите, что (З77 —1)/2— нечетное составное число. Указание: чему равно З77 mod 4? 10 Вычислите ср(999). 11 Найдите функцию сг(п), обладающую тем свойством, что g(n) = Y. fW O^k^n Ф^ f(n) = Y, cr(k)g(n-k). O^k^n (Это аналог функции Мёбиуса; см. (4-56)-) 12 Упростите формулу Hd\m Lk\d MM 9(dA)- 13 Положительное целое число п называется свободным от квадратов, если оно не делится на т2 ни при каком га > 1. Найдите необходимое и достаточное условие того, что п свободно от квадратов: а через представление (фи) числа п в виде показателей простых чисел; б через функцию ц(п). Обязательные упражнения 14 Докажите или опровергните: а НОД(km, kn) = к НОД(m, n); б HOK(km,kn) =kHOK(m,n). 15 Встречается ли каждое простое число в качестве сомножителя некоторого числа Евклида еп? 16 Чему равна сумма величин, обратных первым п числам Евклида? 17 Пусть fn— "число Ферма" 1?^ + 1. Докажите, что fm _L fn, если m < п. 18 Покажите, что если 2П + 1 — простое число, то п представляет собой степень 2.
4 Упражнения 189 19 Докажите следующие тождества при целом положительном п: Похоже, это проверка на косоглазие. Никто не увлекается нумерологией ?.. 22 Z 1^k<n L <p(k + i) L Y_ [(m/k)/[m/klj -1 (k-1 )! + 1]' 1 <ra^n L x1 ^k<m n k=1 Указание: это хитрый вопрос, но ответ на него достаточно прост. 20 Для каждого положительного целого числа п найдется такое простое число р, что п < р ^ 2тг. (Это, по сути, "постулат Бертрана" который Жозеф Бертран (Joseph Bertrand) проверил в 1845 году для значений тг < 3 000000, а Чебышев доказал для всех п в 1850 году.) Воспользуйтесь постулатом Бертрана для доказательства существования константы b « 1.25, такой, что все числа [2bj, L22bJ, L2224 ••• являются простыми. 21 Пусть Рп — n-е простое число. Найдите константу К, такую, что [(10n2K)mod10nJ = Рп. Число 1111111111111111111 — простое. Докажите, что при любом основании системы счисления Ъ число (11 ... 1 )ь может быть простым, только если количество единиц— простое. 23 Укажите рекуррентное соотношение для р(к)— линеечной функции из обсуждения б2(тг!) в этой главе. Покажите существование связи между р(к) и диском, перемещаемым на шаге к при перемещении Ханойской башни из п дисков за 2П - 1 переносов (1 ^ к <С 2П - 1). 24 Выразите ер(п!) через функцию ^р(п), которая представляет собой сумму цифр представления числа п в системе счисления с основанием р, обобщая тем самым формулу (4-24)- 25 Будем говорить, что га напросто делит (exactly divides) п, записывая это как m\\n, если m\n и га _1_ n/та (например, для рассмотренных в тексте факториальных делителей рер(п!)\\п!). Докажите или опровергните следующее:
190 Теория чисел а к\\п и тп\\п ф=> кт\\п, если к _L га; б для всех ггцп > 0 либо НОД(ттцп)\\т, либо НОД(т, п)\\п. 26 Рассмотрим последовательность 9n всех неотрицательных несократимых дробей m/n, таких, что ran ^ N, например G -011111111П21325345678910 У1° ~~ 1 >10>9>8>7>6>5>4>3>5>2>34 >2>1 >2>1 Ч Ч Ч Ч Ч >1 > 1 * Верно ли, что т'п — тп' = 1 всегда, когда ra/n непосредственно предшествует дроби т'/п' в 9n? 27 Приведите простое правило сравнения рациональных чисел, основанное на их представлениях с использованием символов L и R в системе счисления Штерна-Броко. 28 Представление Штерна-Броко числа п имеет вид 7Г = R3L7R15LR292LRLR2LR3LR14L2R... . Используйте его для поиска всех простейших рациональных приближений я, знаменатели которых меньше 50. Входит ЛИ у вих число? 29 В этой главе описано соответствие между двоичными действительными числами х = (.ЪтЬгЪз ... h из [0..1) и действительными числами Штерна-Броко a = В1В2В3... из [О..оо). Если х соответствует а и х ф 0, то какое число соответствует 1 — х? 30 Докажите следующее утверждение (китайскую теорему об остатках): пусть mi, ..., rar— положительные целые числа с raj _L raic при 1 <J j < k ^ г; пусть m = mi ... rar; и пусть си , ..., ar, А— целые числа. Тогда существует ровно одно целое число а, такое, что a = cik (mod raic) при l^k^r и A ^ a < A + m. 31 Число в десятичной записи делится на 3 тогда и только тогда, когда сумма его цифр делится на 3. Докажите это общеизвестное правило и обобщите его. 32 Докажите теорему Эйлера (4-5°)» обобщив доказательство теоремы Ферма (4-47)- 33 Покажите, что если f(m) и g(m)— мультипликативные функции, то таковой же будет и функция h(m)=?f(d)g(m/d). d\m Почему "Euler" произносится как "Эйлер" а "Euclid" — как "Евклид"?
4 "Упражнения 191 34 Докажите, что (4-5^) представляет собой частный случай (4-61). Домашние задания 35 Пусть I(m,n)— функция, удовлетворяющая соотношению 1(ттц n)m+ 1(гцт)п = НОД(т,п), когда тип— неотрицательные целые числа ит^п. Таким образом, в соотношении (4.5) 1(тп,п) = та' и 1(п, та) = п.'; значение Цта^)— обращение та относительно п. Найдите рекуррентное соотношение, определяющее I(m,n). 36 Рассмотрим множество Z(\/T0) = {m + riVT0 | целые та, и}. Число та + п\/Т0 называется обратимым, или единицей, если та2 — 10п2 = ±1, поскольку оно имеет обратное (т.е. поскольку (та+п\/Т0)-±(та—п\/Т0 ) = 1). Например, 3+л/ТО — обратимое, как и 19 —6\А0. Пары взаимно сокращаемых обратимых чисел могут быть вставлены в любое разложение на множители, так что будем их игнорировать. Необратимые числа множества Z(\/T0) называются простыми, если они не могут быть записаны как произведение двух необратимых чисел. Покажите, что 2, 3 и 4± \/Т0 являются простыми числами множества Z(\/T0). Указание: если 2 = (k + l\/T0) х (т + лд/ТО), то 4 = (к2 - 10l2)(m2 - 10u2). Кроме того, квадрат любого целого числа по модулю 10 равен 0, 1, 4, 5, 6 или 9. 37 Докажите формулу (4-17)- Указание: покажите, что 6-^ \ = (en_i — j)2 + 1, и рассмотрите числа 2_nlog(en — ^). 38 Докажите, что если а_1_Ъиа>Ъ>0, то НОД(ат-Ьт> ап-Ьп) = аНОД(т,тг)_ьНОД(т,п) ^ 0 ^ т < п. (Здесь все переменные—целые числа.) Указание: воспользуйтесь алгоритмом Евклида. 39 Пусть S(m)— наименьшее положительное целое число п, для которого существует возрастающая последовательность целых чисел та = си < az < - • - < at = п, такая, что си а2 ... at — полный квадрат. (Если та само является полным квадратом, можно положить t = 1 и тг = та.)
192 Теория чисел Например, S(2) = 6, поскольку наилучшей из таких последовательностей является си = 2, az = 3, аз = 6. Имеем: и S(n) 12 3 4 5 1 6 8 4 10 6 12 7 14 8 9 10 11 15 9 18 22 12 20 Докажите, что S(m) ф S(m') для любых 0 < га < та7. 40 Докажите, что если представление числа п в системе счисления с основанием р имеет вид (ат ... си ао)Р, то n,/pep(n!) = (_1)ep(n!)am,i<>ai!ao, (mod р) . (Левая часть представляет собой просто п!, из которого удалены все множители р. При n = р данное утверждение сводится к теореме Вильсона.) 41 а Покажите, что если р mod 4 = 3, то не существует целого числа п, такого, что р делит п2 + 1. Указание: воспользуйтесь теоремой Ферма. б Покажите, что, с другой стороны, если р mod 4 = 1, то такое число существует. Указание: попробуйте записать (р — 1)! как Пк=^1 ^(р — к) и вспомните теорему Вильсона. 42 Рассмотрим несократимые дроби т/п и т' /п'. Докажите, что если сумма т/п+т1 /п' приведена к несократимому виду, то ее знаменатель будет равен пп' тогда и только тогда, когда п _1_ п'. (Другими словами, (ттт/ + т'п)/пп' будет сразу несократимой тогда и только тогда, когда п и п/ не имеют общего множителя.) 43 На k-м уровне дерева Штерна-Броко имеется 2к узлов, соответствующих последовательности матриц Lk, Lk_1 R, ..., Rk. Покажите, что эта последовательность может быть получена, начиная с матрицы Lk, путем последовательного умножения на 0 -1 1 2р(п) + 1 при 1 ^ n < 2к, где р(п)— линеечная функция. 44 Докажите, что бейсболист с коэффициентом бэттера .316 должен отбить мяч как минимум 19 раз. (Если у него та удачных ударов за п выходов на биту, то т/п Е [0.3155.. 0.3165).) Радиокомментатор: "... питчер Марк Лешиффр дошел до второй базы!
4 Упражнения 193 У Марка, коэффициент бэттера которого .080, это второй удачный удар в этом сезоне" Что-то не так? А что такое корень из раз-ницы? 45 Число 9376 обладает интересным свойством самовоспроизводимости: 93762 = 87909376. Сколько четырехзначных чисел х удовлетворяют уравнению х2 mod 10000 = х? Сколько n-значных чисел х удовлетворяют уравнению х2 mod 10П = х? а Докажите, что если гО = 1 и nk = 1 (mod та), то 46 пнодо,к) = 1в б Покажите, что 2П ф 1 (mod п), если п > 1. Указание: рассмотрите наименьший простой множитель п. 47 Покажите, что если тгт_1 = 1 (mod га) и если тг^т-1^р ф 1 (mod та) для любого простого числа р, такого, что р\(та— 1), то та— простое число. Указание: покажите, что если это условие выполняется, то при 1 ^ к < та все числа nk mod та различны. 48 Обобщите теорему Вильсона (4-49) > установив величину выражения (Пт <;n<m>п±ш п) mod та при та > 1. 49 Пусть R(N)— количество пар (та,™,) целых чисел, таких, что 1 ^ та ^ N, 1 ^n^N ита_1_п. а Выразите R(N) через Ф-функцию. б Докажите, что R(N) = Ц^-, |N/d_|2|i(d). 50 Пусть та— положительное целое число и пусть ш = e27ti/m = cos(27T/m)+isin(2TC/m). Говорят, что ш представляет собой корень из единицы степени та, поскольку аг r,27ti 1. В действительности ка- шт 1 является ждое из та комплексных чисел cv0, w^, корнем та-й степени из единицы, так как (шк)т = е27Гкг = 1; таким образом z — шк — один из сомножителей полинома zm — 1 при 0 ^ к < та. Поскольку эти сомножители различны, полное разложение zm — 1 над полем комплексных чисел должно быть таким: 1 П (> 0^k<m CU Пусть Vm(z) = По ^k<m, k±m(Z ~~ ^ )• (ЭТОТ ПОЛИНОМ степени (р(т) называется круговым полиномом порядка та.) Докажите, что zm-^ - *[[4!d{z). d\m
194 Теория чисел б Докажите, что Vm(z) = ГЦт^ - 1)^(m/d). Контрольные работы 51 Докажите теорему Ферма (448) путем разложения (1 + 1 + Ь 1 )р посредством мультиномиальной теоремы. 52 Пусть тг и х— положительные целые числа, такие, что х не имеет делителей ^ п (за исключением 1), и пусть р — некоторое простое число. Докажите, что по меньшей мере |_n/pJ чисел {х — 1 , х2 — 1,..., xn_1 — 1} кратны р. 53 Найдите все положительные целые числа п, такие, что п\Г(п-1)!/(п + 1)1. 54 Вычислите значение 1000! mod 10250 вручную. 55 Пусть Рп— произведение первых п факториалов, Пк=1 ^!. Докажите, что при любом положительном целом числе п отношение Р2п/Рп является целым числом. 56 Покажите, что выражение f JJ k«in(k,2n-k)>\ Д J^(21c+1)2n-2k-A ^ k=1 '' ^k=1 ' представляет собой степень 2. 57 Пусть S(m,u)— множество всех целых чисел к, таких, что та mod k + n mod к ^ к. Например, 5(7,9) = {2,4,5,8,10,11,12,13,14,15,16}. Докажите, что У~ ф(к) = mn. keS(m,n) Указание: сначала докажите равенство сумм Y_ Y_<p{d) = Y_q>[d)[n/d\. Затем рассмотрите разность |_(Ta + n)/dJ — |_m/dJ ~~ Ln/^J- 58 Пусть f (га) = 2Id\m &• Найдите необходимое и достаточное условие того, что f (га) является степенью 2. Дополнительные задачи 59 Докажите, что если xi, ..., хп— положительные целые числа и 1/xi + ••• + 1/хп = 1, то max(xi,... ,хп) < еп.
4 "Упражнения 195 Указание: докажите по индукции следующий более сильный результат: "если 1/х-\ + • • • + 1/хп + 1/сх = 1, где хт, ..., хп — положительные целые числа, а ос— рациональное число ^ max(xi) ..,,хп), то ос+ 1 ^ en+i и xi .. .хп(а+ 1) ^ г\ ... enen+i" (Доказательство этого факта нетривиально.) 60 Докажите, что существует константа Р, такая, что (4-i8) дает только простые числа. Можно воспользоваться следующим (в высшей степени нетривиальным) фактом: при любом достаточно большом р между р и р + ре имеется простое число, если 9 > pp. 61 Докажите, что если та/n, т'/п' и т"/п"— последовательные элементы jFn , то m" = L(n + N)/n,Jm/-m, n" = [(n + NVu'Ju'-n. (Это рекуррентное соотношение позволяет вычислить все элементы jFn по порядку, начиная с у и ^.) 62 Какое двоичное число соответствует числу е, исходя из соответствия "двоичная система <-> система Штерна-Броко" ? (Выразите свой ответ в виде бесконечной суммы; вычислять ее в аналитическом виде не требуется.) 63 Покажите, используя только методы из данной главы, что если большая теорема Ферма (446) неверна, то наименьшее п, которое ее опровергает, должно быть простым числом. (Можно считать, что (446) выполняется при п = 4.) Кроме того, если ар + Ьр = ср — наименьший контрпример, покажите, что для некоторого целого та fmp, если р\с, а + Ъ = < _ [рр 'тр, если р\с. Таким образом, число с ^ тпр/2 должно быть действительно огромным. Указание: положите х = а + Ъ и заметьте, что НОД(х, (аР + (х- а)Р)/х) = НОД^раР"1). 64 Последовательность Пирса CPisj порядка N представляет собой бесконечную строку дробей, разделенных знаками '<' или *=', которая содержит все неотрицательные дроби m/n cm^Onu^N (включая несокращенные дроби). Она определяется рекурсивно, начиная с последовательности Ф, = 0<1<2<3<4<5<6<7<8<9<10<...
196 Теория чисел При N ^ 1 последовательность Tn+i образуется путем вставки двух символов непосредственно перед kN-м символом СРм при всех к > 0. Эти вставляемые символы представляют собой к-1 — = , если kN нечетное; ^N,kN т-j г > если kN четное. Здесь T^j обозначает j-й символ последовательности Ум, который представляет собой знак '<' либо с=' при четном j и дробь— при j нечетном, например (Одинаковые элементы выстраиваются в довольно своеобразном порядке.) Докажите, что знаки '<* и 1=\ определенные приведенными выше правилами, корректно описывают отношения соседних дробей в последовательности Пирса. Исследовательские проблемы 65 Являются ли все числа Евклида еп свободными от квадратов? 66 Являются ли все числа Мерсенна 2Р — 1 свободными от квадратов? 67 Докажите или опровергните, что maxi^j<ic^n а^/ НОД(dp elk) ^ п для любой последовательности целых чисел 0 < di < • • • < dn. 68 Существует ли константа Q, такая, что число |_Q2 J простое для всех n ^ 0? 69 Пусть Рп обозначает n-е простое число. Докажите или опровергните, что Рп+1 —?п = 0(logPn)2. 70 Справедливо ли соотношение ез(п!) = €2(тг!)/2 для бесконечно большого количества п? 71 Докажите или опровергните следующее утверждение: если к ф 1, то существует п > 1, такое, что 2n = k (mod п). Существует ли бесконечно много таких п?
4 Упражнения 197 72 Докажите или опровергните следующее утверждение: для любого целого а существует бесконечно много таких тг, что ср(п)\(п+а). 73 Если бы Ф(п) + 1 членов последовательности Фарея 2п = (Уп(0),Уп(1),.-.,Уп(Ф(п))) были распределены достаточно равномерно, то следовало бы ожидать, что Jn(k) « к/Ф(тг). Таким образом, мерой "отклонения Jn от равномерности" служит сумма D(n) = Lkiol^nOO -к/Ф(тг)|. Верно ли, что D(n) = 0{п^2+е) при любом е > О? 74 Оцените, сколько в множестве {0! mod р, 1! mod р,..., (р — 1)! mod р} содержится различных значений при р —> со?
5 Биномиальные коэффициенты ПЕРЕВЕДЕМ ДЫХАНИЕ. В предыдущих главах нам пришлось нелегко со всеми этими суммами с полами, потолками, модулями, фи- и мю-функциями. Сейчас мы перейдем к изучению биномиальных коэффициентов, которые оказываются (а) более важными чи/ ми в приложениях и (б) более простыми в работе, чем все прочие величины. 5.1 Основные тождества Символ (?) используется для обозначения биномиального коэффициента, названного так из-за важного свойства, которое будет рассмотрено нами в следующем разделе, — биномиальной теоремы. А читается этот символ как "выбор к из п'! Это заклинание берет свое начало из комбинаторной интерпретации — это количество способов выбора k-элементного подмножества из п-элементного множества. Например, выбрать два элемента из множества {1,2,3,4} можно шестью способами, а именно как {1,2}, {1,3}, {1,4}, {2,3}, {2,4}, {3,4}; так что (2) = 6. Чтобы выразить значение (?) в более привычных терминах, проще начать с определения количества k-элементных последовательностей, а не подмножеств, выбираемых из п-элементного множества; в последовательностях учитывается порядок следования их элементов. Воспользуемся теми же соображениями, которые применялись в главе 4, чтобы показать, что п!— количество перестановок п объектов. Имеется п вариантов выбора первого элемента последовательности; для каждого из них имеется п— 1 вариантов выбора второго элемента последовательности; Известные также как к-элементные сочетания из п элементов.
200 Биномиальные коэффициенты и так до тг — к + 1 вариантов выбора к-го элемента последовательности. Это дает нам общее количество последовательностей п[п — 1)... (п — к + 1) = тг—. Поскольку каждое к-элементное подмножество может быть упорядочено к! разными способами, данное число последовательностей учитывает каждое подмножество ровно к! раз. Для получения окончательного ответа надо просто разделить полученное количество последовательностей на к!: /п\ _ тг(тг-1)...(тг-к+1) \к) ~ к(к-1)...(П Например, что согласуется с нашим предыдущим перечислением. Назовем п верхним индексом^ а к— нижним индексом. Комбинаторная интерпретация накладывает на индексы требование быть неотрицательными целыми числами, поскольку множества не могут иметь отрицательного или дробного количества элементов. Однако биномиальные коэффициенты применяются не только в комбинаторике, так что мы уберем некоторые из ограничений. Оказывается, что полезнее всего, когда верхний индекс может быть произвольным действительным (или даже комплексным) числом, а нижний— произвольным целым числом. Таким образом, наше формальное определение принимает следующий вид: r(r-1)...(r-k+1) тЬ k(k-l)...(1) = Й' *елоек^ (5Л) О, целое к < 0. Это определение обладает рядом заслуживающих внимания свойств. Во-первых, верхний индекс обозначен как г, а не тг; буква г указывает на тот факт, что биномиальный коэффициент имеет смысл и тогда, когда здесь оказывается любое действительное число. Так, например, ("^ ) = (—1)(—2)(—3)/(3-2-1) = —1. Здесь нет никакого комбинаторного смысла, но г = — 1 является одним из важных частных случаев. Полезны и нецелые индексы наподобие г = —1/2. Во-вторых, (?) можно рассматривать как полином k-й степени от г. Как мы увидим, такая точка зрения часто оказывается полезной. В-третьих, мы оставили не определенными биномиальные коэффициенты для нецелых нижних индексов. Можно дать при-
5.1 Основные тождества 201 Биномиальные коэффициенты были хорошо известны в Азии за много веков до рождения Паскаля [90], но он никоим образом не мог об этом знать. емлемое определение и в этом случае, но на практике такие приложения встречаются редко, так что мы отложим данное обобщение и займемся им немного позже в данной главе. Последнее замечание. В правой части определения перечислены ограничения 'целое к ^ 0' и 'целое к < 0'. Такие ограничения будут приводиться во всех рассматриваемых нами соотношениях, чтобы яснее представлять область их применения. В общем случае чем меньше ограничений, тем лучше, так как соотношения без ограничений более широко применимы; имеющиеся ограничения представляют собой важную часть соотношения. При работе с биномиальными коэффициентами проще на некоторое время забыть о сложных для запоминания ограничениях, а позже проверить, не нарушаются ли какие-либо из них. Такая проверка должна быть выполнена в обязательном порядке. Например, почти всегда, когда мы встречаем коэффициент (?), он равен 1, так что легко впасть в заблуждение, что он всегда равен 1. Но внимательное рассмотрение определения (5.1) показывает, что (?) равно 1, только когда п ^ 0 (в предположении, что п целое); при п < 0 мы получаем (?) = 0. Такие ловушки могут (и будут) делать жизнь интереснее. Прежде чем приступить к соотношениям, которыми мы будем пользоваться для укрощения биномиальных коэффициентов, давайте познакомимся с некоторыми их малыми значениями. Числа в табл. 201 образуют начало треугольника Паскаля, названного так по имени Блеза Паскаля (Blaise Pascal) (1623-1662), написавшего о них основополагающий трактат [285]. Пустые ме- Таблица 201. TL 0 1 2 3 4 5 6 7 8 9 10 (Л \о) (Л w 1 2 3 4 5 6 7 8 9 10 Треугольник Паскаля 7л _Ы 1 3 6 10 15 21 28 36 45 (П\ м 1 4 10 20 35 56 84 120 /п\ _W 1 5 15 35 70 126 210 (Л (Л У [б) 1 6 1 21 7 56 28 126 84 252 210 (Л Ы 1 8 36 120 (П\ _W 1 9 45 (П\ _w 1 10 (п\ ш 1
202 Биномиальные коэффициенты ста в таблице на самом деле представляют собой О, поскольку в числителе в (5.1) имеется нулевой множитель; так, например, (2) = (1 -0)/(2-1) = 0. Эти места оставлены пустыми просто для того, чтобы выделить остальную часть таблицы. Стоит запомнить формулы для первых трех столбцов: Они справедливы для произвольных действительных чисел. (Вспомним, что (""J]) — ^п(п+ 1) — это формула для треугольных чисел, выведенная в главе 1; эти числа сразу же бросаются в глаза в столбце (™) табл. 201.) Неплохо также запомнить первые строк пять треугольника Паскаля: наличие набора чисел 1, 4, б, 4, 1 при решении какой-нибудь задачи должно наводить на мысль о том, что дело тут не обойдется без биномиальных коэффициентов. Числа в треугольнике Паскаля удовлетворяют практически бесконечному множеству соотношений, так что не удивляйтесь тому, что при более близком знакомстве с ним мы найдем кое-что интересненькое. Например, интересное "свойство шестиугольника" иллюстрируемое шестью числами, 56, 28, 36, 120, 210, 126, которые окружают число 84 в правой нижней части табл. 201. Два варианта чередующегося перемножения чисел из этого шестиугольника дают одно и то же произведение: 56-36-210 = 28-120-126 = 423360. Это свойство выполняется для любого такого шестиугольника из любой части треугольника Паскаля. А теперь— о различных соотношениях. В этом разделе наша цель заключается в том, чтобы изучить несколько простых правил, которые позволяют решать подавляющее большинство практических задач с биномиальными коэффициентами. Определение (5.1) можно переписать с применением факториалов в обычном случае, когда верхний индекс г представляет собой некоторое целое число п, большее или равное нижнему индексу к: (к) = щё^.» целые п ^к * °- (5-з) Чтобы получить эту формулу, мы просто умножаем числитель и знаменатель (5.1) на (п — к)!. Иногда полезно выразить биномиальный коэффициент в таком факториальном виде (например, при доказательстве свойства шестиугольника). Но зачастую приходится работать в обратном направлении, заменяя факториалы биномиальными коэффициентами. Итальянцы называют его треугольником Тартальи (Tartaglia). "C'est une chose estrange combien il est fertile en proprietez" — В.Паскаль (В. Pascal) [285]
5.1 Основные тождества 203 Факториальное представление указывает на симметрию треугольника Паскаля: каждый ряд читается одинаково как слева направо, так и справа налево. Соотношение, отображающее это свойство симметрии, получается путем замены к на п — к: целое n ^ О, целое к. (5.4) Эта формула имеет комбинаторный смысл, поскольку, указывая к выбранных предметов из п, мы тем самым указываем тг — к невыбранных предметов. Ограничения, гласящие, что п и к в (5.4) должны быть целыми, очевидны, поскольку каждый нижний индекс должен быть целым числом. Но почему п не может быть отрицательным? Предположим, например, что п = — 1. Верно ли равенство Нет. В частности, при к = 0 мы получим 1 слева и 0 справа. В действительности при всяком целом k ^ 0 левая часть равна т.е. либо 1, либо —1; правая же часть равна 0, так как нижний индекс отрицателен. При отрицательном к левая часть равна О, а правая представляет собой (_г!к) - <-'>-'-к. т.е. равна 1 или —1. Таким образом, равенство ((~)с1) = (_7_к)' всегда неверно! Соотношение симметрии не выполняется и при всех прочих отрицательных п. Но, к сожалению, это ограничение легко забывается, поскольку выражение в верхнем индексе бывает отрицательным при некоторых малозаметных (но вполне законных) значениях его переменных. Всякий, кто много раз имел дело с биномиальными коэффициентами, попадался на эту удочку не менее трех раз. Этот недостаток соотношения симметрии с избытком компенсируется существенным достоинством: оно выполняется при всех значениях к, даже при к < 0 или к > п (поскольку в таких случаях обе стороны равны нулю). В противном случае п n-k Надеюсь, что я не попадусь на эту удочку на коллоквиуме.
204 Биномиальные коэффициенты О ^ k ^ п, и симметрия следует непосредственно из (б-3): 'п\ п! п! / п V к!(тг-к)! (п_(п_к))! (n-к)! \п-к Следующее важное тождество позволяет внесение под знак биномиального коэффициента и вынесение из-под него: .0 = Kfc-i)' целоек^°- (55) Данное ограничение на к предохраняет нас от деления на 0. Назовем (5.5) тождеством внесения (absorption), поскольку мы часто будем использовать его для внесения переменной в биномиальные коэффициенты, если снаружи она мешает. Это равенство следует из определения (5-i)> так как г- = г(г — 1)^1 и к! = к(к — 1)! при к > 0; обе части равны нулю при к < 0. Если умножить обе стороны (5.5) на к, то получим правило внесения, которое выполняется даже при к = 0: kW =TU-l)' 4eAoek- (5-6) У этого соотношения есть компаньон, который сохраняет нижний индекс неизменным: (г-кнМ =гГк Ь целоек. (5.7) Вывести (5.7) можно, сделав "бутерброд" из (5.6) между двумя правилами симметрии: (г — к) I 1 = (г — к) f J = (в силу симметрии) г г-1 г-к-1 (в силу (5-6)) = rl J . (в силу симметрии) Но погодите минутку! Мы сказали, что данное тождество справедливо для всех действительных г, но наш вывод верен, только когда г— положительное целое число. (Если мы не хотим использовать свойство симметрии (5.4) се^е во вРеА> то верхний индекс г— 1 должен быть целым неотрицательным числом.) Может, мы "схимичили" ? Нет. Да, данный вывод справедлив толь- Ну, по крайней ме- ко для положительных целых чисел г; но можно утверждать, что Ре не в этот Раз-
5.1 Основные тождества 205 это тождество выполняется при всех значениях г, поскольку обе стороны (5.7) представляют собой полиномы от г степени к+ 1. Ненулевой полином степени d или меньшей может иметь не более d различных нулей; таким образом, разность двух таких полиномов, которая также имеет степень d или меньшую, не может быть нулем более чем в d точках, если только она не тождественно равна нулю. Другими словами, если два полинома степени d или меньшей совпадают более чем в d точках, они должны совпадать везде. Мы показали, что (г — к)(?) = г(г~ ), когда г — положительное целое число, так что эти два полинома совпадают в бесконечном числе точек, а значит, тождественно равны. Метод доказательства из предыдущего абзаца, который мы будем называть полиномиальным доказательством, часто полезен при распространении многих соотношений, справедливых для целых чисел, на действительные числа,— мы будем встречаться с ним снова и снова. Некоторые равенства наподобие соотношения симметрии (54) не являются тождествами для полиномов, так что этот метод пригоден не всегда. Тем не менее многие соотношения имеют нужный вид. Например, вот еще одно полиномиальное тождество— быть может, самое важное среди биномиальных тождеств,— известное как формула слоэюения: (к) = (VMk-l)' ^ЛОек- ^8) Если г— положительное целое число, то формула сложения показывает, что каждое число в треугольнике Паскаля представляет собой сумму двух чисел из предыдущего ряда— расположенного непосредственно над ним и того, что слева от него. Эта формула применима при отрицательных, действительных и даже комплексных г; единственное налагаемое ограничение— к должно быть целым (чтобы были определены биномиальные коэффициенты). Один из способов доказать формулу сложения состоит в том, чтобы предположить, что г— положительное целое число, и воспользоваться комбинаторной интерпретацией. Вспомним, что (?) — это количество возможных k-элементных подмножеств г- элементного множества. Если у нас есть множество из г яиц, среди которых одно тухлое давно пора выбросить, то имеется (?) способов выбрать из них к яиц. (r ^ ) из этих способов выбирают только хорошие яйца; a (?Zi) из них дают подмножество, содержащее тухлое яйцо, так как каждое такое подмножество выбирается как тухлое яйцо и к — 1 -элементное подмножество из
206 Биномиальные коэффициенты г — 1 хороших яиц. Суммирование этих двух величин дает нам формулу (5-8). Этот вывод предполагает, что г— положительное целое число, a k ^ 0. Но обе стороны тождества равны нулю при к < 0, и полиномиальное доказательство говорит о том, что соотношение (5.8) справедливо и во всех остальных случаях. Можно вывести (5.8) и путем сложения двух тождеств внесения-вынесения (5.7) и (б-6): здесь левая часть равна т(?), так что можно разделить обе части равенства на г. Этот вывод справедлив для всех значений, кроме г = 0, но этот случай легко проверить отдельно. Те, кому не по душе все эти хитрости и кто предпочитает идти прямым курсом, могут предпочесть вывод (5.8) путем работы непосредственно с определением. Если к > О, к ) Vk-V W (к-1)! (t-1)?zJ_(t-1c) (r-l)^l к! к! (г — 1)^—1г г- /г к! к! Vk> И вновь случаи с к ^ 0 можно легко проверить. Мы только что видели три разных способа доказательства формулы сложения. В этом нет ничего удивительного; биномиальные коэффициенты обладают массой полезных свойств, которые могут приводить к различным способам доказательства интересующего нас соотношения. Формула сложения по сути представляет собой рекуррентное соотношение для чисел из треугольника Паскаля, и мы еще увидим, насколько она полезна при доказательстве других тождеств по индукции. Новое тождество можно получить немедленно, просто разворачивая рекуррентное соотношение, например, + 37 13/ V2 ым м+м sMM+GM-,
5.1 Основные тождества 207 Поскольку (_-,) = О, последний член исчезает, и мы можем остановиться. Этот метод приводит нас к общей формуле 1 , целое п. (5.9) Обратите внимание, что нет необходимости в нижней границе к ^> 0 для индекса суммирования, так как все члены с к < 0 равны нулю. Эта формула выражает один биномиальный коэффициент в виде суммы других, верхний и нижний индексы которых остаются "равноудаленными" Мы нашли ее путем многократного разложения биномиального коэффициента с наименьшим нижним индексом: сначала— (3), затем— (2), (^), (0). Что получится, если выполнить разворачивание другим образом— разлагая коэффициенты с наибольшим нижним индексом? Мы получим ЗУ \Ъ) \1 НИМ кмнк зКИММН* Теперь нулю равен коэффициент (3) (так же, как и (2) и (2), но они придают соотношению определенную привлекательность). Мы можем заметить определенную закономерность: O^k^n П+1 TTL+1 целые ггцп ^ 0. (б-10) Это тождество, которое мы назовем суммированием по верхнему индексу, выражает один биномиальный коэффициент в виде суммы других, нижние индексы которых представляют собой константу. В данном случае сумма нуждается в нижней границе к ^ 0, поскольку члены суммы с к < 0 не нулевые. Кроме того, та и п в общем случае не могут быть отрицательными.
208 Биномиальные коэффициенты Тождество (б-ю) имеет интересную комбинаторную интерпретацию. Если мы хотим выбрать т+ 1 билетов из множества п + 1 билетов, пронумерованных от 0 до п, то это можно сделать (т) способами, если наибольший номер выбранного билета равен к. Доказать соотношения (5.9) и (б-ю) можно по индукции, используя формулу сложения, но можно также получить одно соотношение из другого. Например, докажем, что (б-9)> на основании (б-ю); наше доказательство проиллюстрирует некоторые распространенные методы работы с биномиальными коэффициентами. Общий план действий таков: преобразовать левую часть J2 (Г^ ) соотношения (5.9) так? чтобы она приняла вид левой части YL (т) соотношения (б-ю); затем воспользоваться этим соотношением для замены суммы одним биномиальным коэффициентом; наконец, привести этот коэффициент к виду правой части соотношения (б-9)- Для удобства будем считать, что тип— неотрицательные целые числа; общее соотношение (5.9) будет получено из этого частного случая при помощи полиномиального доказательства. Вместо г будем писать та, чтобы эта переменная напоминала нам о том, что мы имеем дело с неотрицательным целым числом. Теперь систематическое выполнение нашего плана протекает следующим образом: L(m;k)= l сг k^n ч 7 -m^k^n х _ у /та + к' , V т = г С O^k^m+n х т + п + 1 \ _ /т + п + 1 т+1 ) ~ V п Давайте проанализируем вывод пошагово. Ключевой является вторая строка, в которой мы применяем правило симметрии (5.4) для замены (т^ ) на (™j^ ). Это можно сделать только при m + k ^ О, так что наш первый шаг ограничивает область изменения к, отбрасывая члены с к < —та (что законно, поскольку отброшенные члены равны нулю). Теперь мы почти готовы применить (б-ю); третья строка готовит нас к этому, заменяя к на к—та и приводя в порядок диапазон суммирования. Этот шаг, подобно первому, — просто игра с ^-обозначениями. Теперь к появляет-
5.1 Основные тождества 209 "Когда ему [Мори- арти] исполнился двадцать один год, он написал трактат о биномиальной теореме, завоевавший ему европейскую известность. После этого он получил кафедру математики в одном из наших провинциальных университетов. .." — Ш.Холмс (S. Holmes) [84] ся в верхнем индексе, и пределы суммирования приведены в надлежащий вид, так что в четвертой строке применяется (б-ю). Завершает работу еще одно применение правила симметрии. Некоторые суммы, с которыми мы имели дело в главах 1 и 2, на самом деле являются либо частными случаями соотношения (5-ю), либо скрытыми вариантами этого соотношения. Например, случай та = 1 дает сумму неотрицательных целых чисел до п включительно: :к + ••• + = 0 + 1 +--- + П (п + 1 )п тг+1 2 Общий случай эквивалентен правилу (п + 1 )ЛЬ±1 }2 к- - O^k^n та+1 целые та, п ^ 0 из главы 2, если мы разделим обе части этой формулы на та!. Фактически формула сложения (5-8) говорит нам, что А та х + 1 та х m-W' если заменить тик соответственно на х + 1 и та. Следовательно, методы главы 2 дают нам удобную форму неопределенного суммирования L 6х = m+1 + С. (5-11) Биномиальные коэффициенты получили свое название от биномиальной теоремы, которая имеет дело со степенями биномиального выражения х + у. Вот малые случаи данной теоремы: (х + у)° = U + y)1 = (Х + У)2 = (Х + У)3 - (х + у)4 = Х°У° xV + lxV х2у° + 2хУ +1х°у2 х3у°+3х2у1 +3х1у2 + 1х°у3 х4у° +4х3у1 +бх2у2 +4х1у3 + 1х°у4 . Нетрудно понять, почему эти коэффициенты совпадают с числами из треугольника Паскаля. Когда мы расписываем произ-
210 Биномиальные коэффициенты ведение П сомножителей (х + у)п = (х + у)(х + у)...(х + у), то каждый его член представляет собой произведение п сомножителей, каждый из которых может быть либо х, либо у. Количество таких членов с к сомножителями хип-к сомножителями у представляет собой коэффициент при xk-yn_k после приведения подобных членов. Эта величина в точности равна количеству способов выбора к из п биномов, из которых в произведение войдет х, т.е. (?). В некоторых учебниках величина 0° считается неопределенной, поскольку функции х° и 0х имеют разные пределы при х, стремящемся к 0. Но это ошибка. Мы должны определить х° = 1 при любом х, чтобы биномиальная теорема была верна при х = 0, у = 0, и/или х = — у. Эта теорема слишком важна, чтобы произвольно ее ограничивать! Функция же 0х, напротив, особой ценности не представляет (см. дальнейшее обсуждение этого вопроса в [220]). Но что именно представляет собой биномиальная теорема? Во всей красе она предстает, будучи записанной в следующем виде: Это сумма по всем целым к; но в действительности при целом неотрицательном г это конечная сумма, поскольку все ее члены равны нулю, за исключением тех, у которых 0 ^ к ^ г. С другой стороны, биномиальная теорема верна и при отрицательном г, и даже когда г— произвольное действительное или комплексное число. В этих случаях данная сумма действительно бесконечна и для гарантии абсолютной сходимости суммы требуется выполнение условия \х/у\ < 1. Два частных случая биномиальной теоремы достойны особого внимания, несмотря на их исключительную простоту. Если х = у = 1 иг = п— неотрицательное, то Это равенство говорит о том, что сумма чисел тг-й строки треугольника Паскаля равна 2П. Если х вместо +1 равен —1, то мы
5.1 Основные тождества 211 получим Смысл О-обозна- чения раскрывается в главе 9. 0П = + --- + (-1)п целое п ^ 0. Например, 1 —4+6—4+1 = 0; т.е. если дать элементам n-й строки чередующиеся знаки, то их сумма равна нулю (за исключением верхней строки, когда п = 0 и 0° = 1). Если г не является неотрицательным целым числом, то биномиальная теорема чаще всего используется в частном случае у = 1. Рассмотрим этот случай явно, записав z вместо х, чтобы подчеркнуть тот факт, что здесь может использоваться произвольное комплексное число: ..+..--lG> |г|<1. (5-13) При подстановке z = х/у и умножении обеих частей на уг получается общая формула (5-12). Мы доказали биномиальную теорему при помощи комбинаторной интерпретации только для неотрицательных целых г. Мы не можем вывести общую формулу из случая для неотрицательных целых чисел при помощи полиномиального доказательства, так как в общем случае сумма бесконечна. Но при произвольном г можно воспользоваться рядом Тейлора и теорией функций комплексного переменного: f(z) = Mz0 + fflz1 + ™z2 + ... = 0! 1! 2! k^O k! Производные функции f(z) = (1 + z)r легко вычисляются: f(k)(z) = r-(1 + z)r_k. Подстановка z = 0 дает нам (5.13). Кроме того, нам надо доказать, что бесконечная сумма сходится при |z| < 1. Это действительно так, потому что (?) = 0(k~1_r) согласно равенству (б-8з)> приведенному ниже. Теперь рассмотрим более пристально значения (?) при отрицательных целых п. Один из подходов к этим величинам состоит в использовании правила сложения (5.8) для заполнения табл. 201 числами, получая таким образом табл. 212. Например, (-1) = 1, поскольку (°) = (-1) + (:]) и (:]) = 0; затем (-1) = -1, поскольку (°) = ("/) + ("q1); и т.д. Все эти числа нам знакомы. Строки и столбцы табл. 212 оказываются столбцами табл. 201 (минус знак "минус"). Так что
212 Биномиальные коэффициенты Тае "П -4 -3 -2 -1 0 (ЛИЦ. (Л (о) а 212. (Л и -4 -3 -2 -1 0 Треугольник (Л (Л W Ы 10 -20 6 -10 3 -4 1 -1 0 0 (Л и 35 15 5 1 0 Паскаля: продолжение вверх (Л ы -56 -21 -6 -1 0 (Л W 84 28 7 1 0 !^Л W -120 -36 -8 -1 0 М (Л W W 165 -220 45 -55 9 -10 1 -1 0 0 (Л W 286 66 11 1 0 целое к, (5-14) между величинами (?) при отрицательных и положительных п должна иметься некоторая связь. Общее правило таково: что легко доказать, поскольку r^ = r(r-1)...(r-k+l) = - (-l)k(-r)(l-r)...(k-1-r) = (-1)k(k-r-1)^ при k ^ 0, а при к < 0 обе части равны нулю. Особенно ценно то, что соотношение (5-14) выполняется безо всяких ограничений (конечно, нижний индекс должен быть целым, чтобы были определены биномиальные коэффициенты). Преобразование (5-14) называется обращением верхнего индекса или просто верхним обращением. Но как запомнить эту важную формулу? Прочие соотношения, с которыми мы имели дело— симметрии, внесения, сложения и т.д.,— были достаточно простыми, то это выглядит весьма замысловато. Тем не менее имеется мнемоническое правило, что уже не так плохо. Для обращения верхнего индекса начнем с записи (—1 )к, где к— нижний индекс (который не должен изменяться). Затем мы сразу же записываем к дважды: на места нижнего и верхнего индексов. Затем мы обращаем исходный верхний индекс путем его вычитания из нового верхнего индекса. Завершается работа еще одним вычитанием 1 (всегда выполняется вычитание, а не сложение,— в конце-концов, ведь это процесс обращения). Давайте для практики обратим два раза подряд верхний индекс. Мы получим О-<-<-;-' = (-1) 2k/k-(k-r-1)-1 Мнемоническое? Скорее, пневматическое— просто сотрясение воздуха. Тем не менее мне оно помогло. Можно размяться и при помощи упр. 4.
5.1 Основные тождества 213 И грустно, если мы хотели добиться чего-то другого. (Здесь двойное обращение помогает, поскольку между обращениями выполняется еще одна операция.) так что мы вернулись к тому, с чего начинали. Вряд ли мы стремились именно к этому, но зато это доказывает, что мы все сделали верно, что приятно! Конечно, есть и более полезные приложения (5-14)) чем показанное. Можно использовать верхнее обращение, например, для перемещения величин между верхним и нижним индексами. Это соотношение имеет симметричный вид: (-1) —п- m (-D -m- n целые га, п ^> 0. (5-15) Оно справедливо, поскольку обе его части равны (m*n). Верхнее обращение может также использоваться для вывода интересной формулы суммирования: L(l k^m -1: 0+-+'-'r; (-DT г-1 га целое та. (5-16) Идея заключается в том, чтобы обратить верхний индекс, применить (5.9) и вновь выполнить верхнее обращение: EQ'-'i'-zfT'HT1)- k^m ч 7 k^m ч / \ / k^m (-1) Т-1 m Эта формула дает частичную сумму r-й строки треугольника Паскаля в случае, когда элементам строки приписаны чередующиеся знаки. Например, при г = 5 и га = 2 формула дает 1—5 + 10 = б = (-1)2й). Заметим, что, если m ^ г, (б-1б) дает знакочередующуюся сумму всей строки, а она равна нулю, если г представляет собой положительное целое число. Мы уже доказывали это ранее, когда раскладывали (1 — 1 )г в соответствии с биномиальной теоремой. Интересно, что частичные суммы такого разложения вычисляются в аналитическом виде. А что можно сказать о более простой частичной сумме Z(v k^ra >Г' + • + (5-17)
214 Биномиальные коэффициенты Наверняка, если мы в состоянии вычислить знакочередующуюся сумму, то справимся и с этой? Увы, это не так: для частичной суммы строки треугольника Паскаля нет соответствующего аналитического выражения. Можно посчитать суммы элементов столбцов (формула (5.10)), но не строк. Забавно, однако, что если умножить элементы на их расстояние до центра строки, то частичные суммы можно вычислить аналитически: ?(0G-k)- та+1 г т+1 целое га. (5-18) (Эта формула легко проверяется при помощи индукции по та.) Взаимосвязь между этими частичными суммами— со множителем (г/2—к) в общем члене и без него— напоминает взаимосвязь между интегралами хе "dx = 2С И "dx. Кажущийся более сложным интеграл слева, с множителем х, выражается в аналитическом виде, в то время как выглядящий более просто интеграл справа аналитического вида не имеет. Внешность обманчива! Ближе к концу этой главы мы изучим метод, позволяющий определить, выражаются ли в аналитическом виде частичные суммы некоторого ряда с биномиальными коэффициентами, в достаточно общей постановке задачи. Этот метод в состоянии обнаружить формулы (5-i6) и (б-iS), а также позволяет выяснить, что нет смысла тратить время на поиск аналитической записи (5-17). Частичные суммы биномиального ряда приводят к еще одному занимательному соотношению: k^m (tr)Alm-k ? k$m (-x)k(x+y) та—k целое та. (5-19) Это тождество нетрудно доказать по индукции: обе части равны нулю при та < 0 и 1 — при та = 0. Если обозначить сумму в левой части через Sm, то можно применить формулу сложения (5-8), а это позволяет легко показать, что На самом деле он равен \у/п{\ + erf а) — константе плюс величине, кратной "функции ошибок" от а — если это можно считать аналитическим видом. L k<m та- 1+Г xkym-k + L k<m m- 1+r k-1 xkym-k
5.1 Основные тождества 215 Существует красивое комбинаторное доказательство этой формулы [247]. L к^т т-к1+т)х-ч,—= yS_1+(m-ii;+TV та — 1 + г к-1 Z(T.:.)xV-k = xSm_ TTL-1 k^m при га > 0. Следовательно, а этой рекуррентности удовлетворяет и правая часть (5.19)- По индукции обе части должны быть равны. QED Но есть и более тонкое доказательство. Если т— целое число в диапазоне 0 ^ г ^ —та, то биномиальная теорема гласит, что обе части (5-19) равны (x + y)m+r'y-r. А поскольку обе части представляют собой полиномы от г степени m или меньшей, то их совпадения в т+ 1 разных точках достаточно (но едва-едва!) для доказательства равенства в общем случае. Может показаться глупым получать соотношение, в котором одна сумма равна другой, причем эти суммы к тому же не выражаются в аналитическом виде. Но иногда вычислить одну сумму проще, чем другую. Например, если положить х = — 1 и у = 1, то можно получить альтернативную форму соотношения (5-i6): L (m,+TVi)fc = k^m А если положить х '2т+1 к^т целое т ^ 0. 1 и т = та -|-1, то мы получим к^т ч = У -z jtn—к В левой части просуммирована только половина биномиальных коэффициентов с верхним индексом 2т+1, а эти коэффициенты равны своим двойникам в правой половине, поскольку треугольник Паскаля обладает лево-правосторонней симметрией. Следовательно, левая часть— это просто ^22m+1 = 22m. Это дает нам формулу, которую мы никак не ожидали получить: ? fm+^2_k = 2Г k^m целое та ^ 0. (5-20) Давайте проверим ее при та = 2: (o) + l(i) + H2) = 1+f + | = 4- Поразительно!
216 Биномиальные коэффициенты До сих пор мы рассматривали либо отдельные биномиальные коэффициенты, либо суммы, в члены которых входило только по одному биномиальному коэффициенту. Но многие задачи, с которыми приходится сталкиваться, включают в себя произведения двух или более биномиальных коэффициентов, так что мы посвятим оставшуюся часть главы рассмотрению случаев такого рода. Вот удобное правило, которое зачастую помогает упростить произведение двух биномиальных коэффициентов: т) ( к ) = (к) (т - к J ' ЦеЛЫе т' к- (5'21) Мы уже знакомы с частным случаем этого правила к = 1; это — правило внесения (б-6). Хотя обе части (5-2i) представляют собой произведения биномиальных коэффициентов, одна часть зачастую суммируется значительно проще другой из-за взаимодействия с остальной частью формулы. Например, в левой части дважды используется та, в то время как в правой оно встречается только один раз. Поэтому при суммировании по та мы обычно стремимся заменить (J (™) на (О^)- Равенство (5.21) выполняется, в первую очередь, из-за сокращения та! в факториальных представлениях (TJx) и (™). Если все переменные— целые числа ит^та^к^О, то т \ /та\ т! та! та! (т- к!(та- г! -та)! к! (та-к)! т! -к)!(т-та)! (г-к)! ЛЛ/т-к к!(т-к)! (т-к)Цт-т)! \kj \™-к Это просто. Кроме того, если та < к или к < 0, то обе час- Даже очень. ти (5-2i) равны нулю; так что это соотношение справедливо для всех целых m и к. Наконец, полиномиальное доказательство распространяет его на все действительные т. Биномиальный коэффициент (?) = т\/{х — к)! к! после соответствующего переобозначения переменных можно записать в виде (а+Ъ)!/а! Ъ!. Аналогично величину т!/к! (та—к)! (т—та)! в средине приведенного выше вывода можно записать как (а + b + с)!/а!Ь!с!. Это— "триномиальный коэффициент" появляющий-
5.1 Основные тождества 217 ся в триномиальной теореме "Excogitavi autem olim mirabilem regulam pro nu- meris coefRcientibus potestatum, поп tantum a binomio x + y, sed et a trinomio x + y +z, imo a polynomio quocunque, ut data potentia gradus cujuscunque v. gr. decimi, et potentia in ejus valore comprehensa, ut x5y3z2, possim statim assignare numerum coef- ficientem, quem habere debet, sine ulla Tabula jam cakulata" — Г.Лейбниц (G.W.Leibniz) [245] Положите здесь закладку или загните уголок страницы, чтобы быстро найти эту таблицу. Она еще не раз вам понадобится! (x + y+z)n = Y. a+b+c=n а!Ъ!с! 9 L а+Ъ+с=п Г+Т)(ГУ^ Так что (^J (™) на самом деле представляет собой триномиальный коэффициент в ином обличьи. Триномиальные коэффициенты время от времени возникают в разных приложениях и обычно записываются как a + b + с а, b, с (a + b + c)! a!b!c! ' чтобы подчеркнуть наличие симметрии. Обобщением биномиальных и триномиальных коэффициентов являются мультиномиальные коэффициенты, которые всегда выражаются как произведения биномиальных коэффициентов: CI! + С12 + aba2)., ¦ + a (си + a2 + --- + am)! i ai!a2! ... am ai + a2 H + am\ /am_i + am a2 + • • • + am J " \ am Таким образом, при встрече с таким ужасом нам помогут наши стандартные методы. Так мы добрались до табл. 218, в которой перечислены наиболее важные из рассмотренных стандартных методов. Это те методы, на которые мы опираемся при работе с суммами, включающими произведение биномиальных коэффициентов. Каждое из приведенных равенств представляет собой сумму по к, где к входит по одному разу в каждый биномиальный коэффициент; кроме того, имеются четыре почти независимых параметра, обозначаемые как та, п, г и т.д., по одному в каждом индексе. В зависимости от того, входит ли к в верхний или нижний индекс и с каким знаком, мы получаем различные случаи. Местами имеется дополнительный множитель (—1)к, необходимый для вычислимости суммы в аналитическом виде. Табл. 218 слишком сложна, чтобы всю ее запомнить; ее назначение— служить для справок. Первое соотношение в таблице запоминается гораздо легче других, и его стоит запомнить. Оно
218 Биномиальные коэффициенты Таблица 218. Суммы произведений биномиальных коэффициентов ? (m + k) (n-k) = (mtn) ' ЦеЛЫ6 т,П (5-22) У ( l \( S \ = ( l + S ^ ЦеЛ°е l ^ 0> (21 ^-\т. + к)\п + к) \\- m + п) ' целые ттцп (5'23' гцо (*;к)н)- - н)-(г-т) • sr^s <-> г- /l-k\/q + k\ _ / l+q+1 \ целые тгцп ^ О, , . ^-ДгггД n ) ~ lm+n+1 Г целое 1 +q ^0 ^5"2 ' гласит, что сумма (по всем целым к) произведения двух биномиальных коэффициентов, у которых верхние индексы постоянны, а нижние при любом к имеют одну и ту же сумму, представляет собой биномиальный коэффициент, получающийся суммированием нижних и верхних индексов. Это тождество известно как свертка Вандермонда, поскольку Александр Вандермонд (Alexandre Vandermonde) написал о нем важную статью в конце XVIII века [357]; однако оно было известно Чу Ши-цзе в Китае в 1303 году. Все остальные соотношения в табл. 218 могут быть получены из свертки Вандермонда аккуратным обращением верхних индексов или применением правил симметрии и т.п.; таким образом, свертка Вандермонда— наиболее фундаментальное соотношение среди приведенных. Доказать свертку Вандермонда можно исходя из красивой комбинаторной интерпретации. Если заменить к на к — та и п на п — та, можно считать, что та — 0; следовательно, требуется доказать zd n-k) = Г Г i' целоеп- (5-27) Пусть т и s — неотрицательные целые числа (общий случай получается при помощи полиномиального доказательства). В правой части (r^s) — количество способов выбрать п человек среди т
5.1 Основные тождества 219 Феминисткам может не понравиться то, что мужчины упомянуты первыми... Им точно так же может не понравиться, если первыми будут упомянуты женщины... мужчин и s женщин. В левой части каждый член суммы представляет собой количество способов выбрать к мужчин и п — к женщин. Суммирование по всем к учитывает каждую возможность ровно по одному разу. Чаще всего эти правила применяются слева направо, поскольку упрощение выполняется именно в этом направлении. Однако бывает и так, что оправданно движение и в обратном направлении, даже если приходится временно идти на усложнение. При этом обычно образуется двойная сумма, в которой можно изменить порядок суммирования, а после выполнить упрощение. Перед тем как идти дальше, посмотрим, как доказываются еще два соотношения из табл. 218. Легко доказать соотношение (5.23); все, что нам надо для этого,— заменить первый биномиальный коэффициент на (l_m_k), а затем применить свертку Вандермонда (б-22). Следующее соотношение (5.24) несколько сложнее. Путем последовательных преобразований его можно свести к свертке Вандермонда, но можно доказать его столь же просто, прибегнув к методу математической индукции. Зачастую индукция — первое, к чему мы прибегаем, если не можем придумать ничего лучшего; однако здесь индукция по I подходит как нельзя лучше. В качестве базиса индукции берем случай 1 = 0, когда все члены равны нулю, за исключением к = —т; таким образом, обе части равенства равны (—1)m(s~m). Теперь предположим, что соотношение выполняется при всех значениях, меньших некоторого фиксированного I > 0. Мы можем воспользоваться формулой сложения, чтобы заменить (m+k) на (^V) + (m+k-i)> Т0ГАа исходная сумма разбивается на две, каждая из которых может быть вычислена на основе гипотезы индукции: ?(~0( s+k\ (-1)4 У( l_1 Z— V m-L-V_ s+k = (-1) I—1+m s—vn \ n-l+lj \m+k— 1/ \ n 's —m+1 (-Dk = +(-D l+m П-1+1 Если применить формулу сложения еще раз, то выражение упрощается и получается правая часть (5-24)- В этом выводе заслуживают упоминания две вещи. Во-первых, мы снова убедились в удобстве суммирования по всем целым к, а не только в определенном диапазоне, поскольку при этом нам не надо беспокоиться о граничных условиях. Во-вторых, формула сложения хорошо работает вместе с математической индукцией, поскольку она представляет собой рекуррентное соотношение для биномиальных коэффициентов. Биномиальный
220 Биномиальные коэффициенты коэффициент, верхний индекс которого I, выражается через два биномиальных коэффициента, верхние индексы которых равны I — 1, и это именно то, что нам надо для применения математической индукции. Пожалуй, на этом оставим табл. 218 в покое. А что можно сказать о суммах с тремя и более биномиальными коэффициентами? Если индекс суммирования имеется во всех коэффициентах, то шансы получить решение в аналитическом виде малы: для сумм такого рода известны лишь несколько аналитических выражений, так что интересующая нас сумма вполне может не соответствовать предъявленным требованиям. Один из таких раритетов (о котором говорится в упр. 43) перед вами: у /та — г + s\ /п + г — s\/r + k 4- V к )\ n-k Дт + n J ( J , целые га, п. (б-2^) Вот еще один, несколько более симметричный, пример: (а + Ъ + с)! а!Ъ!с! ' У него есть двойник с двумя коэффициентами: целые сц Ъ, с ^ 0. (б-29) и: а + Ъ\ /Ъ + а к = (а + Ь)! а!Ь! (-1 \Ъ целые а,Ь^0, (б-3°) которого, кстати, нет в табл. 218. Аналогичная сумма с четырьмя коэффициентами в аналитическом виде не выражается, но зато можно выразить другую подобную ей сумму: v- k/a+b\/b+c\/c+d\/d+a\ //2a+2b+2c+2d\ = ^-l J U+V \b+V \c+k) U+V/ V a+b+c+d+ky ~ _ (a+b+c+d)! (g+b+c)! (a+b+d)! (a+c+d)! (b+c-fd)! ~ (2a+2b+2c+2d)! (a+c)! (b+d)! a! b! c! d! ' целые a, b, c, d ^ 0. Это выражение следует из соотношения с пятью параметрами, открытого Джоном Дугаллом (John Dougall) [82] в начале XX века.
5.1 Основные тождества 221 Но и тождество Дугалла— не самое пышное из известных сумм биномиальных коэффициентов. Пальму первенства пока что удерживает сумма = ( 1 )> целые аь a2,...,cin ^0. (5.31) Это сумма по (П2 ^ индексным переменным ktj при 1 ^ г < j < п. Уравнение (5-29) представляет собой частный случай данного равенства при п = 3; случай п = 4 может быть записан при подстановке (а, Ь, с, d) вместо (си > СЦ) &з> щ) и (i, j, к) вместо (^12)к13>1с2з) в следующем виде: у f и+,+к/а+Ь\ /а+с\ (Ъ+с\ ( а+d \ / b+d \ / c+d \ = (-? ] \ЪН) Vc+j) WV \d-H>/ W^-Ч Vd+j+V (a + b + c + d)! = , целые a, b» с» d ^ 0. Левая часть (5.31) представляет собой коэффициент при т?лт?г ...z^ после полного разложения произведения тг(тг — 1) дробей п по положительным и отрицательным степеням z. Предположение о правой части (б-З1) было высказано Фриманом Дайсоном (Freeman Dyson) в 1962 году и вскоре доказано сразу несколькими исследователями. В упр. 86 приведено "простое" доказательство (5.31)- Заслуживает внимания еще одно тождество, включающее массу биномиальных коэффициентов: B-i.-pG)(9Ctr' (-1-1 I Т*\ / С "I* \ n+i) 1 m-n-l) ' целые l>m> n; n ^ °- (5*32) У данного тождества, доказанного в упр. 83, есть шанс встретиться в практическом приложении. Но мы отклоняемся от нашей темы "основные тождества" так что лучше остановиться и подвести итоги.
222 Биномиальные коэффициенты Таблица 222. (п) ы о (0 (0 (0 ОС) ?(D'v"k ? (?) k^n х 7 Е О ?(0U) Десять главных тождеств с биномиальными КОс = = = = = = = = = )ффициентами п! k!(n-k)! ' to- &0- (?)< <-<т WU-v («+«)', (Т1)- \ ,L / (::-)• (?)• целые целое тг ^ 0, целое к целое к 7^ 0 ] , целое к ) > целое к , целые та, к целое г ^ 0, или \х/у\ < 1 целое п целые тгцп ^ 0 целое п Факториальное ПрсДС 1аВЛсНИ6 Симметрия Внесение/ вынесение Сложение/ разложение Верхнее обращение Триномиальный вариант Биномиальная теорема Параллельное суммирование Верхнее суммирование Свертка Вандермонда Мы убедились, что биномиальные коэффициенты удовлетворяют такому разнообразию тождеств, которое способно сбить с толку и привести в изумление. К счастью, некоторые из них несложно запомнить, и этим можно воспользоваться, чтобы выводить остальные за несколько шагов. В табл. 222 приведены десять наиболее полезных формул; это именно те формулы, которые стоит запомнить. 5.2 Необходимые навыки В предыдущем разделе мы вывели ряд соотношений, работая с суммами и подставляя их в другие соотношения. Это
5.2 Необходимые навыки 223 Алгоритм самообучения: 1 прочесть задачу 2 попытаться решить 3 взглянуть на решение в книге 4 if попытка неудачна goto 1 else goto следующая задача К сожалению, этот алгоритм может привести к зацикливанию. Предлагаемое исправление: О set с f- О За set с <— с + 1 3bifc = N goto преподаватель — Э.Дейкстра (Е. W. Dijkstra) ...но этот подраздел называется "НЕОБХОДИМЫЕ навыки" было не слишком сложное занятие, так как мы знали, что именно хотим доказать, так что можно было сформулировать общий план и наполнить его конкретным содержимым без особых сложностей. Однако обычно в реальном мире мы сталкиваемся не с необходимостью доказать некоторое соотношение, а с необходимостью упростить некоторую сумму. При этом мы не знаем, как должна выглядеть эта упрощенная сумма (и даже существует ли она). В этом и следующем разделах мы поработаем с такими суммами и тем самым отточим свое мастерство в обращении с биномиальными коэффициентами. Для начала попытаемся поработать с несколькими суммами, содержащими по одному биномиальному коэффициенту. Задача 1: сумма отношений Мы хотим найти аналитический вид суммы L к=0 целые п ^ m ^ 0. Первый взгляд, брошенный на эту сумму, вызывает панику, потому что до сих пор мы не работали с соотношениями, в которых присутствовало бы отношение биномиальных коэффициентов. (Более того, сумма включает два биномиальных коэффициента, что вроде бы противоречит утверждению, предшествующему этой задаче.) Однако точно так же, как мы использовали факториальные представления, чтобы представить одно произведение биномиальных коэффициентов в виде другого произведения (именно так было получено соотношение (5.21)), можно поступить и в случае отношения биномиальных коэффициентов. На самом деле мы можем избежать факториальных представлений, положив г = п и разделив обе части равенства (5-21) на (k) (т) 5 ЭТ0 дает нам п-к т —к Таким образом, мы заменяем отношение слева отношением справа, и сумма приобретает вид L к=0 п — к т —к У нас все еще остается отношение биномиальных коэффициентов, но в знаменателе уже нет индекса суммирования к, так что его можно удалить из суммы (мы вернем его позже).
224 Биномиальные коэффициенты Можно упростить и граничные условия, суммируя по всем k ^ 0; члены с к > m равны нулю. Оставшаяся сумма уже не так страшна: k^O n —k га —k Она аналогична сумме из тождества (5.9)» поскольку индекс к присутствует в двух местах с одним и тем же знаком. Но здесь он —к, а в (5.9) — нет- Поэтому следующий шаг очевиден, и другого пути у нас нет: у (п~к\ = у /n-(m-k) f— Vm-кУ 4" л W- (™-к) к^О х 7 m-k^O х v ; L к^т п — т + к к Теперь можно применить соотношение параллельного суммирования по обоим индексам (б-9): k^m n —m + k^ f[n — m) +m+ 1\ _ /n+1 ra / \ m В заключение мы восстанавливаем знаменатель (™), который был удален из суммы ранее, и затем применяем (б-7)> чтобы получить требуемый аналитический вид: п+ 1\ //п\ п+ 1 га ) I \та/ п + 1 — га Этот вывод на самом деле справедлив для любого действительного п, если только не выполняется деление на нуль, т.е. если п не является одним из целых чисел 0, 1, ..., га—1. Чем сложнее выкладки, тем важнее проверка получившегося результата. Хотя наш вывод был не слишком сложен, все же проверим его. При малых значениях га = 2 и п = 4 мы получаем 9/©+G)/(0+©/G)-'+H-f. что совпадает с величиной (4 4- 1)/(4 + 1 — 2), вычисленной по полученной нами формуле. Задача 2: из литературы по методам сортировки Следующая сумма относится к седой древности — прошлому тысячелетию (а точнее, к началу 1970-х годов), когда навыки ра-
5.2 Необходимые навыки 225 Ох, не напоминайте о коллоквиуме, пожалуйста... боты с биномиальными коэффициентами не были столь распространены среди исследователей. Одна статья, посвященная улучшенному методу слияния [196], завершалась следующим примечанием: "можно показать, что ожидаемое количество сэкономленных пересылок данных... дается выражением t = L -г—1 l~m—п— 1 т=0 Величины тип определены выше, а тСп представляет собой обозначение количества сочетаний из га элементов по п... Автор благодарит рецензента за приведение более сложного выражения для среднего количества пересылок к приведенному здесь виду" Как мы увидим, это, определенно, не окончательный ответ на поставленную задачу, и не годится даже для коллоквиума. Сначала следует привести эту сумму к виду, с которым можно работать. Одного обозначения m_r-i Cm_n_i достаточно для того, чтобы остановить любого, кроме разве что энтузиаста-рецензента (не стоит благодарности). В наших обозначениях сумма имеет вид к=0 та — к— 1 га —п— 1 целые га > п ^ 0. Биномиальный коэффициент в знаменателе не содержит индекс суммирования, так что можно его удалить и рассматривать новую сумму k=0 ч Что же дальше? Индекс суммирования входит только в верхний индекс биномиального коэффициента. Так что, если бы в формуле у нас не было еще одного к, мы могли бы упростить данную сумму и применить суммирование по верхнему индексу (5.10). Но дополнительное к не позволяет нам так поступить. Если бы мы могли каким-то образом внести к в биномиальный коэффициент, воспользовавшись одним из наших соотношений внесения, то затем можно было бы выполнить суммирование по верхнему индексу. К сожалению, имеющиеся у нас правила здесь не работают. Но если бы вместо к было та — к, то можно было бы воспользоваться соотношением внесения (б-б): (га-к) га- к-1 та —п- (та —п) та —к та — п
226 Биномиальные коэффициенты Вот он, ключ: перепишем к как га — (га — к) и разделим сумму S на две: к=0 х 7 к=0 (та—к) к=0 ч 7 к=0 5> -Z v I—л \ / V—л v = -z(m_k~!Vi>--)fm_k) k=0 ч 7 k=0 ч 7 = гаЛ— (га—n)B , где v~ /m —к—1\ „ А /га — к k=0 x 7 k=0 ч Суммы А и В — наши старые знакомые, в которых изменяется верхний индекс, в то время как нижний остается неизменным. Давайте разберемся сначала с суммой В, которая имеет более простой вид. Для того чтобы привести общий член данной суммы к виду левой части (б-ю), надо немного ее преобразовать: Y~ /m —k\ _ у /та—(га —к) л *— \т — п) ^— V та —тг *— \т — п m—n^k^m х - L ( к ' л L— Vm —тг Ha последнем шаге в сумму включаются члены с 0 ^ k < m — тг, которые все равны нулю, поскольку верхний индекс у них оказывается меньше нижнего. Теперь, используя (б-ю), просуммируем по верхнему индексу и получим в = V ( к ) = ( m + 1 oim^m-n/ W-n+i Другая сумма Л почти такая же, с тем отличием, что та в ней заменено на та — 1. Так мы получаем аналитическое выражение для суммы S, которое можно еще немного упростить:
5.2 Необходимые навыки 227 S = mA-(m-n)B = / m \ / m+1 = m - m-n \vn — nj \m — n + I m+1 \ / m m-(m-n) — ra — n + I J \m — n n \ / ra ч m — n + 1 / \m — nj Это дает нам аналитическое выражение для исходной суммы: т\ п / та \ //та' n J та — п + 1 \та — tl// \п п та —тг+ 1 Даже рецензент не смог бы его упростить! Для проверки полученного результата вновь обратимся к малому случаю. При та = 4 и тг = 2 получаем что вполне согласуется с вычисленной по нашей формуле величиной 2/(4 - 2 + 1). Задача 3: из старого домашнего задания Вот еще одна сумма с единственным биномиальным коэффициентом. Данная сумма, в отличие от последней, родилась в университетских стенах: это задача из одного из домашних за- Да смертны ли во- даний. В ней предлагалось вычислить величину Qioooooo, где обще старые зада- чи?! v- /2n-k\ Qn = ?_ f k )(-1)\ целоеп^О. Эта задача потруднее прочих: к ней неприменимо ни одно из известных нам к этому времени соотношений. К тому же мы имеем дело с суммой из 21000000 + 1 членов, так что просто просуммировать их нельзя. Индекс суммирования к имеется в обоих индексах биномиального коэффициента, и в верхнем, и в нижнем, но с противоположными знаками. Обращение верхнего индекса также ничего нам не дает— оно удаляет множитель (—1)к, но вносит в верхний индекс 2к. Как всегда, когда ничего не получается, лучшее, что можно сделать,— это рассмотреть малые случаи. Даже если мы и не найдем закономерность, которую можно будет доказать по индукции, то хотя бы получим данные для проверки результатов
228 Биномиальные коэффициенты нашей работы. Вот все ненулевые члены и их суммы для первых четырех значений п. п 0 1 2 3 Со) ®- Q- ($)- -(!) - (?) + © - (0 + (1) - = i = i -1 =1-3+1 "© + 0=1-7 + 15- Qn = 1 = 0 = -i -10 + 1 = 0 За следующий случай, п = 4, лучше не браться, чтобы не запутаться и не допустить арифметическую ошибку. (Вычислением членов типа (4 ) и (5 ) вручную, не объединяя их с другими, стоит заниматься лишь в безвыходной ситуации.) Итак, значения Qn начинаются с 1, 0, —1, 0. Даже если бы мы посчитали еще одно-два значения, вряд ли бы аналитический вид Qn оказался очевидным. Но если бы мы обнаружили и доказали рекуррентное соотношение для Qn, то тогда, вероятно, мы бы могли предложить и доказать аналитическую формулу. Для поиска рекуррентного соотношения надо связать Qn с Qn-i (или с (^меньшие значения); но для этого нам надо связать член на- подобие ( 13 3), который получается при п = 7 и к = 13, с членом типа ( j~3 ). Многообещающим этот путь не назовешь — мы не знаем никаких более-менее простых соотношений между элементами треугольника Паскаля, разделенными 64 строками. Формула сложения— наш основной инструмент при доказательствах по индукции— связывает элементы, отделенные друг от друга одной строкой. Но это приводит нас к ключевому наблюдению: на самом деле нет необходимости работать с элементами, разделенными 2n_1 строками. Переменная п никогда не фигурирует сама по себе, а только в контексте 2П. Вот оно: 2П — это просто ловушка для отвода глаз! Если мы заменим 2П на га, то все, что нам надо будет сделать,— это найти аналитическое выражение для более общей (но и более простой) суммы О преподаватель, придумавший эту задачу! Коварство — вот имя твое! rale (-1)' целое ra ^ 0; тем самым мы получим аналитическое выражение и для Qn = R2n. И у нас неплохие шансы на то, что формула сложения приведет к рекуррентному соотношению для Rm.
5.2 Необходимые навыки 229 Это знает каждый выполнивший раз- миночное упр. 4. Значения Rm для небольших та можно найти в табл. 201, если поочередно складывать и вычитать величины, располагающиеся на диагонали, идущей с юго-запада на северо-восток. Вот что мы получаем: m Rm. 0 1 1 1 2 0 3 -1 4 -1 5 6 0 1 7 1 8 0 9 -1 10 -1 Похоже, дальше будет масса сокращений. Давайте теперь обратимся к формуле для Rm и посмотрим, нельзя ли записать для нее рекуррентное соотношение. Наша стратегия состоит в применении формулы сложения (5.8) и поиске в результирующем выражении сумм, имеющих вид R^,— похоже на то, что мы делали в методе приведения в главе 2: Rr га—к к га—1—к га—1—к к = Z к^т = Z к^т = L к^т-1 - L (т1"к)<-'>1 к^т-2 V / = Rm_1+(-1)2--Rm_2-(-1)2(--1 (-Dk = 7 к^т х 7 )(-i)4 Ц (т"2_к)(-1 ' к+1<пЛ К ' к+1 """Лн^Гт)'-1)"- -1 т-1 \т— 1 Rm_i— Rm_2 • (На предпоследнем шаге использована формула (~^) = (—1)т, которая, как мы знаем, справедлива при та ^ 0.) Сам вывод корректен при та ^ 2. Из этого рекуррентного соотношения можно быстро генерировать значения Rm и не менее быстро убедиться в периодичности этой последовательности. В самом деле, Rm = < 1 1 о -1 -1 0 если та mod 6 = < (0 1 2 3 4 5 Доказательство по индукции выполняется путем простой проверки. Но если требуется более академичное доказательство,
230 Биномиальные коэффициенты то можно развернуть данное рекуррентное соотношение на один шаг, получив Rm. — (Rm-2 — Rm-з) — ^m-2 = — ^m-3 > при та ^ 3. Следовательно, Rm = Rm_6 при га ^ 6. Наконец, поскольку Qn = R2^, можно найти Qn, определяя 2n mod 6 и используя выражение для Rm. При п = 0 мы получаем 2° mod 6 = 1; умножая на 2 (mod 6), мы получим повторения чисел 2 и 4. Таким образом, Qn = = R2~ = (Ri=1, < R2 = 0, U4=-1, если n = 0, если n > 0 нечетное если n > 0 четное. Это выражение для Qn согласуется с первыми четырьмя значениями, вычисленными в начале решения данной задачи. Поэтому мы можем заключить, что Qioooooo = R4 = —1- Задача 4: сумма с двумя биномиальными коэффициентами Наша следующая задача заключается в поиске аналитического выражения для суммы A , /m-k-1\ > k , целые m > n ^ 0. k=0 ч 7 Стоп! А где же второй обещанный биномиальный коэффициент? И почему мы должны упрощать сумму, которую мы уже упрощали? (Это же сумма S из задачи 2.) Это сумма, которую проще упростить, простите за каламбур, если рассматривать ее общий член как произведение двух биномиальных коэффициентов, а затем воспользоваться одним из общих соотношений из табл. 218. Второй биномиальный коэффициент материализуется, если переписать к как (^): A /m-k-l\ _ v /k\/m-k-1 2_4m_n_i;- 2- hlL-n-i k=0 ч 7 O^k^n ч 7 ч Далее надо воспользоваться соотношением (б-2б), поскольку в нем переменная суммирования входит в оба верхних индекса, и при этом с разными знаками. Но наша сумма еще не приведена к нужному виду. Чтобы достичь полного соответствия формуле (б-2б), верхний предел суммирования должен быть та — 1. Без проблем: при n < k ^
5.2 Необходимые навыки 231 m—1 члены равны нулю, поэтому можно выполнить подстановку (1,-ггцгц q) <— (га— 1,т — п— 1,1,0); ответ равен s = ( т 1 \т - п + 1 Это несколько аккуратнее, чем полученная ранее формула. Мы можем преобразовать эту формулу в выведенную ранее, воспользовавшись (б-7): m \ п / га га — п + 1 / га — п + 1 \га — п Аналогично можно получить интересные результаты, подставляя в общее соотношение определенные значения. Предположим, например, что мы подставляем в (5-26) га = п = 1 и q =0. Тогда это соотношение принимает вид ^-*-СГ)- Левая часть представляет собой l((l+ 1 )1/2) — (I2 +22 Н Ы2), так что мы получили еще один способ решения задачи о сумме последовательных квадратов, которую до смерти замучили в главе 2. Мораль данной истории такова: частные случаи важных сумм иногда лучше приводить к общему виду. После изучения сумм в общем виде разумно рассмотреть их простые специализации. Задача 5: сумма с тремя сомножителями Вот еще одна неплохая сумма. Мы хотим упростить сумму X. (k) u)k> Целое п^О. Индекс суммирования к имеется в обоих нижних индексах с одним и тем же знаком; таким образом, тождество (5.23) из табл. 218 очень похоже на то, в чем мы нуждаемся. После небольших манипуляций мы должны суметь им воспользоваться. Наибольшее отличие между (5.23) и тем, что у нас есть, заключается в лишнем к в нашей сумме. Но можно внести к в один из биномиальных коэффициентов при помощи соотношения внесения: Ш(Й- LOG:!)—zOG::)-
232 Биномиальные коэффициенты Нам не надо беспокоиться об s, которое появляется вместо к, поскольку это константа. Теперь мы готовы применить тождество и получить аналитический вид 'n\/s-1\ _ /rt + s-Г ЛЛк-lJ " Ч тг-1 L Если бы на первом шаге мы внесли к в (?), а не в (?), то не могли бы применить (б-2з) непосредственно, так как величина п— 1 могла бы оказаться отрицательной, а данное тождество требует неотрицательного значения как минимум в одном из верхних индексов. Задача 6: очень страшная сумма Следующая сумма выглядит еще более вызывающе. Требуется найти аналитическую запись для суммы ^n + k\ /2k\(-1)k 2k Д W k+1 ' k^O целое n ^ 0. Одной из полезных мер сложности суммы служит количество вхождений в нее индекса суммирования. Здесь эта мера повергает в уныние— к встречается шесть раз. Кроме того, ключевой прием, сработавший в предыдущей задаче— внесение чего- то за пределами биномиальных коэффициентов в один из них, — в данном случае не сработает. Если мы внесем к + 1, то получим вместо него новое вхождение к. И дело не только в этом: наш индекс к дважды входит в биномиальные коэффициенты с коэффициентом 2. Обычно мультипликативные константы удалять гораздо труднее, чем аддитивные. Но в этот раз нам повезло. Двойки находятся именно там, где следует для применения тождества (5.21), так что мы получаем у- /n + k\/2k\(-1)^ = у- /n + k\/n\(-Dk ^-V2JcAkJlc+1 ^-V к ДкУ k+1 ' k^O x / \ / ' k^0 ч / \ / Двойки исчезли, прихватив с собой одно вхождение к. Итак, мера сложности снизилась до пяти. Самая большая из оставшихся неприятностей— наличие к + 1 в знаменателе, но теперь эту величину можно внести в (?) при помощи тождества (5-6): к^О ч / \ / ¦ к п + к к п+1 к+1 п+1 1 п + т^ п + к к п+1 к+1 :-п Так что, надо шесть раз отказаться от решения этой задачи? (Вспомним, что п ^ 0.) Итак, осталось четыре к.
5.2 Необходимые навыки 233 Для удаления прочих к у нас есть два перспективных пути. Можно воспользоваться симметрией (n?k), а можно обратить верхний индекс п + к, тем самым удалив и к, и множитель (—1)к. Давайте испытаем оба варианта, начав с симметрии: hL п+1 п + к\ /п + 1 к Дк+1 Г-1Г = -^L(n+n%++>^ Пора делать ставки! Попробуйте применить бинарный поиск: вначале повторите среднюю формулу, чтобы понять, произошла ошибка раньше или позже. Остается только три к. Теперь можно продолжить с использованием (5.24): заменив (^тгцп, s) на (п+ 1, ^гцп), получаем 1 т^+Т г /п+к\ /п+1 п V к+1 (-1) 1 п+1 Н)п п-1 -1 0. Как— нуль?! После стольких трудов?! Давайте проверим при б i б 2 "Г 3 0. Таки нуль. -2:Q0{-©(!)1 + 0(1)} = 1 Давайте для интереса испробуем второй вариант, с обращением верхнего индекса (п? ): k v ' ч ' к Теперь применим (5.23) с заменой (I, тгцтг, s) f 1 х- /-п-Л /п+1\ 1 /0 -п-1 \ /п+1 к Дк+1 (п+1,1,0,-п-1): п + 1 L -п-1 к п+1 к+1 тг + 1 \п Стоп-стоп-стоп! Да, это нуль при п > 0, но при п = 0 это 1! А предыдущее решение давало нам нуль для всех случаев! Что же произошло? Ведь сумма на самом деле равна 1 при тг = 0, так что верный ответ— ([тг = 0]'. Мы где-то ошиблись в нашем первом выводе. Вернемся и повторим наш вывод при тг = 0, чтобы увидеть, где же возникло такое расхождение. Ну вот— оказывается, мы попались в ловушку, о которой говорилось ранее: мы попытались применить симметрию там, где верхний индекс может оказаться отрицательным! Мы не имели права заменять (n?k) на (n^k), когда диапазон к представляет собой все целые числа, поскольку это превращает нулевую величину в ненулевую при к < —п. (Простите за это.) Другой множитель суммы, (?+]), превращается в нуль при к < — п, за исключением тг = 0 и к = — 1. Следовательно, наша ошибка при тг = 2 остается невыявленной. В упр. 6 поясняется, как следует поступить.
234 Биномиальные коэффициенты Задача 7: новое затруднение Примемся за еще более трудную задачу — найти в аналитическом виде сумму / ^ , -, т > целые га, п > 0. ^-Дт + 2кДк;к + 1 При га = 0 получается сумма из предыдущей задачи, но в этой задаче га может быть любым, и мы не в состоянии применить здесь что-либо из использовавшегося при решении задачи 6. (В частности, решающий первый шаг.) Однако если бы удалось избавиться от т, то мы бы могли воспользоваться только что полученным результатом. Итак, наша стратегия состоит в следующем: заменить (^^с) сУмм°й членов вида (l^~kk) для некоторого неотрицательного целого I; тогда общий член суммы будет выглядеть аналогично общему члену суммы из задачи б, и мы сможем изменить порядок суммирования. Но чем заменить (^^к)^ Тщательное изучение ранее выведенных соотношений выявляет только одну подходящую кандидатуру, а именно— выведенное ранее соотношение (б-2б) из табл. 218. Единственный способ его использования— заменить параметры (l^m,!!, q,k) соответственно на (n + k — 1,2k, га — 1, 0,j): у /n+k\/2k\(-1 2-{m+2]cJ\kJ k+ k k+f -Ee.Z ,Г-Н)(-)(№- k^O 0scj^n+k-1 ч 7 v / \ / j^O x 7 k^j-n-fl x / \ / k^O Ha последнем шаге мы изменяем порядок суммирования, работая с граничными условиями под знаками Y. в соответствии с правилами главы 2. Нельзя просто так заменить полученную внутреннюю сумму результатом решения задачи 6, поскольку в ней имеется дополнительное условие k ^ j — п + 1. Но это дополнительное условие не является излишним, только если j — п + 1 > 0, т.е. если j ^ п. А если j ^ п, то первый биномиальный коэффициент внутренней суммы равен нулю, поскольку верхний индекс находится между 0 и к — 1 и, таким образом, строго меньше нижнего индекса 2к.
5.2 Необходимые навыки 235 Следовательно, на внешнюю сумму может быть наложено дополнительное ограничение j < п, которое не оказывает влияния на то, какие ненулевые члены в нее включены. Это делает ограничение k ^ j — п + 1 излишним, и можно воспользоваться результатом задачи 6. Двойная сумма распадается на две: j^O х 7 k^j-n+1 к^О 2к Мк7к+1 0^j<n ч 7 к^О х / \ / ' j V . п /п—1 И L-iP-1-*^] га — 1 у \m— 1 Внутренняя сумма обращается в нуль при всех j, кроме j = п— 1, так что мы получаем в качестве ответа простое аналитическое выражение. Задача 8: еще одно затруднение Давайте расширим задачу по-другому, рассмотрев сумму v /n + k\/2k\ (-!)*_ k^O x / \ / Если m = 0, мы снова получим сумму, с которой имели дело ранее, но теперь та находится в другом месте. Эта задача немного труднее задачи 7, но (к счастью) у нас теперь больший опыт в поиске решений, чем раньше. Начнем так же, как и в задаче 6: Z n + k\/n\ (-1) ч к у\кУк+1+т к^О х / \ / Теперь (как и в задаче 7) попытаемся разложить ту часть, которая зависит от га, на члены, с которыми мы уже умеем обращаться. Когда га было равно нулю, мы вносили к+ 1 в (?); при m > 0 можно сделать то же самое, если разложить 1/(к+ 1 + т) на допускающие такое внесение члены. Нам все еще везет: в задаче 1 нами было доказано подходящее тождество V" (Ш\ (rY~ — Г + ^ целое т^О, , . ?зи/W ~ r+1-™' r?{0,1,...,m-1}. (5'33) Замена г на —к — 2 дает нам желаемое разложение
236 Биномиальные коэффициенты Теперь (к+1 )-1 можно внести в (?), как и планировалось. В действительности эту величину можно внести и в (~kj_2)~1 • Наличие двух вариантов упрощения наводит на мысль о существовании за сценой еще больших возможностей по сокращению. И это так— представление всего, что входит в новый общий член, с использованием факториалов и возвращение к биномиальным коэффициентам дает нам формулу, которую можно просуммировать по к: ^ттъ — -п-1 к т!п! у— . /m+n+Л у- /n+1+j (m+n+1)! f^[~ ' \ n+1+j ) + 1^+j+i т!п! у(_1у(т+п+Л()\ Сумма по всем j равна нулю согласно (5.24)- Следовательно, —Sm представляет собой сумму по j < 0. Для вычисления —Sm при j < 0 заменим j на —к — 1 и просуммируем по к ^ 0: Они думают, что это можно проверить на клочке бумаги на коленке? m!n! (m + m!n! (m + m!n! n+1^!4-0 v n-k д n ; m + n+l\/k-n-l к A n (m + n+1)! k^n ^m + n+1\/2n- m!n! (m + n + _ ? (m+.+1)(v) k^2n Наконец, применяя (5.25), мы получим окончательный ответ: т! п! /тЛ sm = (-Dn- = (-1)nm^m- -n-1 (m + n+1)! \n/ Такое просто необходимо проверить. При п = 2 находим, что 1 6 6 m(m—1) S — m+1 m + 2 m + 3 (m+l)(m + 2)(m + 3) Наш вывод требует, чтобы m было целым числом, но результат справедлив для всех действительных т, поскольку (т+1 )n+1 Sm представляет собой полином от m степени ^ п.
5.3 Специальные приемы 237 Этот прием следовало бы пронумеровать как "прием 1" 2 ' 5.3 Специальные приемы Давайте теперь рассмотрим три приема, которые значительно усиливают ранее изученные нами методы работы с биномиальными коэффициентами. Прием 1: уполовинивание Многие из наших соотношений включают произвольное действительное число г. Когда г имеет специальный вид "целое минус j] биномиальный коэффициент (?) можно записать в виде совершенно непохожего произведения биномиальных коэффициентов. Это приводит к новому семейству тождеств, работать с которыми можно с удивительной легкостью. Один из способов увидеть, как это работает,— начать с формулы удвоения ГЛ(Г_ |)]с = (2г)^/2 2k/92k целое k ^ 0. (5-34) Это тождество становится очевидным, если разложить убывающие степени и расположить множители в левой части в чередующемся порядке: r(r-l)(r-1)(r-f)...(r-k+1)(r-k+l) = _ (2т)(2г-1)...(2г-2к + 1) 2-2-...-2 Теперь можно разделить обе части на к!2 и получить 0Г/2 Если положить к •¦ п-1/2 п 2г 2к 72к целое к. г = п, где п— целое число, это даст п i2n целое п. (5-35) (5-36) Обращение верхнего индекса приводит к еще одной полезной формуле: -1/2 п 2п п целое п. (5-37) ПОЛОВИНИМ. . Например, при п = 4 получаем -1/2 4 (-1/2) (-3/2) (-5/2) (-7/2) 4! -,у,.3.5 2 ) 1-2-3 -1\4 1-3-5 4 ) 1-2-3 7-2-4-6-8 4-1-2-3-4
238 Биномиальные коэффициенты Обратите внимание на замену произведения нечетных чисел факториалом. Тождество (б-Зб) имеет забавное следствие. Положим г = \п и возьмем сумму по всем целым к. Результат согласно (5.23) будет следующим: гШ^-г(яГ(п-,,/* 'п-1/2\ л ПЧ In/21 J ' Целое п^ 0, (5.38) поскольку либо п/2, либо (п — 1 )/2 равно |_n/2J — целому неотрицательному числу! Можно воспользоваться сверткой Вандермонда (5-27) и вывести гита- СО-<-"-• —»• Подстановка значений из (б-37) А^ет -1/2^-1/2^ _ (-^(2к\ ^-l\n_k^2(n-k) к J \n-kj \ 4 J \кJ \ 4 J \n- (-l)n/2k\/2n-2k> 4n Vk/Vn-1c что в сумме дает (—1)п. Следовательно, мы получили замечательное свойство "средних" элементов треугольника Паскаля: Ц (^ ) (^ I if) = 4" ' ЦеЛОе П ^ °* (5-39) Например, Q ®Щ) («) + (<) (])Щ) Q = 1.20+2-6+6-2+20Л = 64 = 43. Эти иллюстрации к нашему первому приему показывают, что разумно попытаться заменить биномиальные коэффициенты вида ( ^) биномиальными коэффициентами вида (n_k' ), где п— некоторое подходящее целое число (обычно 0, 1 или к); получающаяся при этом формула может оказаться существенно более простой. Прием 2: разности высших порядков Ранее мы видели, что частичные суммы ряда (?)(—1)к вычислимы, в то время как для ряда с общим членом (?) — нет.
5.3 Специальные приемы 239 Оказывается, что имеется множество важных приложений биномиальных коэффициентов с чередующимися знаками, (?)(—1)к. Одной из причин этого является то, что такие коэффициенты тесно связаны с разностным оператором А, определенным в разделе 2.6. Разность Af функции f в точке х есть Af(x) = f(x+l)-f(x); если применить оператор А еще раз, получим вторую разность, A2f(x) = Af(x+1)-Af(x) = = (f(x+2)-f(x+1))-(f(x+1)-f(x)) = = f(x + 2)-2f(x+1)+f(x), подобную второй производной. Аналогично получаются A3f(x) = f(x + 3)-3f(x + 2)+3f(x+1)-f(x), д4 f (х) = f (х + 4) - 4f (х + 3) + 6f (х + 2) - 4f (х + 1) + f (х), и т.д. Биномиальные коэффициенты в эти формулы входят с чередующимися знаками. В общем случае n-я разность представляет собой An f (х) = ^ С^\ (-1 )n"kf (х + к), целое n ^ 0. (540) Эта формула легко доказывается по индукции, но есть красивое доказательство, опирающееся на элементарную теорию операторов. Вспомним, что в разделе 2.6 был определен оператор сдвига Е: Ef(x) = f(x+l); следовательно, оператор А представляет собой Е—1, где 1 — тождественный оператор, определяемый правилом 1f(x) = f(x). По биномиальной теореме Ап = (Е-1Г - Х.(ЙЕк(-Г n-k Это равенство, элементами которого выступают операторы; оно эквивалентно (б4°)> поскольку Ек— это оператор, который переводит f(х) в f(х + к). Интересный и важный случай возникает при рассмотрении отрицательных убывающих степеней. Пусть f (х) = (х — 1)— =
240 Биномиальные коэффициенты 1/х. Тогда по правилу (2.45) имеем Af(x) = (—1)(х— 1)—, A2 f(x) = (—1)(—2)(х — 1)—, и в общем случае -1\ ( л\п /¦_, л\— п— 1 - *¦" 'L' An((x-l)^i) = (-l)ib(x-1)=2=l = (_1)т х(х+1)... (х+п) Равенство (5-4°) Дает нам 'n\(-11k п! L к к J x+k х(х+1)... (х+п) = ^_1(Х^П) 1 х*{0,-1,...,-п}. (541) Например, 14 6 4 1 + - г + - х + 1 х + 2 х + 3 х + 4 4! л I {х + 4 1 /х х(х+1)(х + 2)(х + 3)(х + 4) / V 4 Сумма в (5-41) представляет собой разложение п!/(х(х + 1)... (х + п)) на простейшие дроби. Важные результаты могут быть получены и из положительных убывающих степеней. Если f (х) представляет собой полином степени d, разность Af (х) является полиномом степени d— 1; таким образом, величина Ad f (х) представляет собой константу, a Anf(x) = 0 при n > d. Этот исключительно важный факт упрощает многие формулы. Более пристальный взгляд дает дальнейшую информацию. Пусть f (х) представляет собой некоторый полином степени d: f(x) = adxd + ad_1xd"1 +-.- + СИХ1 + a0x°. В главе 6 мы увидим, что обычные степени можно выразить в виде суммы убывающих степеней (например, х2 = х-+х-); следовательно, существуют коэффициенты bd, bd_i, ..., bi, bo, такие, что f(x) - bdx^ + bd_1x-^l+..- + b1x1 + b0x^. (Оказывается, что bd = ad и bo = a.o> но коэффициенты между ними связаны более сложным образом.) Пусть с^ = k!bi< при О ^ k ^ d. Тогда fW = Cd(d)+Cd-1(d-1)+-- + Cl(i)+Co(o)i
5.3 Специальные приемы 241 таким образом, любой полином может быть представлен в виде суммы величин, кратных биномиальным коэффициентам. Такое разложение называется рядом Ньютона для f (х), поскольку оно широко использовалось Исааком Ньютоном (Isaac Newton). Ранее в этой главе мы заметили, что формула сложения приводит к формуле Таким образом, по индукции n-я разность ряда Ньютона определяется очень просто: A"fW = 4d!n)+C4d-l-n)+-' + +"(,In)+c°(_>:n Если положить х = 0, то все члены Ck(k* ) в правой части будут равны нулю, за исключением члена с к — п = 0; следовательно, Anfr0) = |сп> еслип^ d; i 0, если п > d. Ряд Ньютона для f(x), таким образом, представляет собой f(%) = Л" f(0) (*\ + Л""1 f(0) (d 1 ,)+¦¦¦ + + Af(0)(;)+.(0)(J Предположим, например, что f(x) = х3. Легко вычислить, что f(0)=0, f(1) = 1, f(2)=8, US) =27; Af(0) = 1, Af(1)=7, Af(2) = 19; A2f(0)=6, A2f(1) = 12; A3f(0)=6. Так что ряд Ньютона имеет вид х3 = 6(1) + 6(1) + 1 (*) + 0(*). Формулу Anf(0) = сп можно переписать следующим образом с применением (5-4°) ПРИ х = 0: ?(;)н)'(с»0Н*Н5)+..) = нгс„, целое n ^ 0.
242 Биномиальные коэффициенты Здесь (co,ci,C2,...)— произвольная последовательность коэффициентов; бесконечная сумма Co(q) 4- Ci (^) + 02(2) Н в Действительности оказывается конечной при любом k ^ О, так что вопрос о сходимости не стоит. В частности, можно доказать важное тождество U> -1)k(a0+a1k+---+ajcn) = (-1)nn!an, целое п ^> О, (б42) поскольку полином do + а-\ к Н Ь ankn всегда можно записать в виде ряда Ньютона с0 (?) + <И (*) Н Ь cn(?) ccn=n! an. Многие суммы, которые, на первый взгляд, представляются безнадежными, в действительности могут быть просуммированы почти тривиально при помощи идеи n-х разностей. Например, рассмотрим соотношение X (к) С nSk) М )к = $П ' ЦеЛ°е П ^ °* (543) Оно выглядит очень впечатляюще, потому что совершенно отличается от всего, с чем мы до сих пор имели дело. Но в действительности его легко понять; стоит только обратить внимание на проясняющий дело множитель (?)(—1)к в общем члене, так как функция f(k) = (r~Sk) = l(_|)-snkn+... = (-l)-snQ+--- представляет собой полином от к степени п, старший коэффициент которого равен (—])Tisri/nl. Таким образом, (543)— это не более чем приложение (542)- Ряд Ньютона рассматривался в предположении, что f (х) — полином. Но мы видели, что бесконечный ряд Ньютона f(x) = co(;)+c1(;)+c2Q+... также имеет смысл, поскольку такие суммы всегда конечны, если х— неотрицательное целое число. Наш вывод формулы Anf(0) = сп работает в бесконечном случае точно так же, как и в случае полинома; так что общее соотношение таково: f(x) = f(0)Q+Af(0)^+A2f(0)Q+A3f(0)Q+..., целое х ^ 0. (544)
5.3 Специальные приемы 243 Эта формула справедлива для любой функции f (х), которая определена при целых неотрицательных х. Более того, если правая часть этого соотношения сходится при других значениях х, то она определяет некоторую функцию, которая "интерполирует" f (х) в некотором естественном смысле. (Существует бесконечное количество способов интерполяции значений функции, так что нельзя утверждать, что соотношение (544) истинно для всех х, которые делают бесконечный ряд сходящимся. Например, если положить f(x) = sin(7tx), то получим f(x) = 0 во всех целых точках, так что правая часть (б-44) тождественно равна нулю; но левая часть отлична от нуля при всех нецелых х.) Ряд Ньютона представляет собой конечно-разностный аналог ряда Тейлора из исчисления бесконечно малых. Так же, как ряд Тейлора можно записать в виде 9(a) о 9;(а) л g"(a) 2 д'"(а) з 9(а + х) = ^х° + ^^хЧ ^^х2 + 2_-L2x3 + ... у Так как Е = 1+Д, ряд Ньютона для f (х) = д(а + х) может быть записан как (Это то же, что и (5-44)> так как An f (0) = An g(a) АЛ51 всех n ^ 0> если f(x) = g(a + х).) И ряд Тейлора, и ряд Ньютона конечны, если g — полином или если х = 0; кроме того, ряд Ньютона конечен, если х— положительное целое число. В противном случае суммы могут как сходиться, так и расходиться при определенных значениях х. Если ряд Ньютона сходится, когда х не является целым неотрицательным числом, то он может в действительности сходиться к величине, отличной от g(a + x), потому что ряд Ньютона (54б) зависит только от дискретных значений функции g(a), g(a+l), g(a + 2), ... . Один из примеров сходящегося ряда Ньютона предоставляет биномиальная теорема. Пусть д(х) = (1 + z)x, где z— фиксированное комплексное число, такое, что |z| < 1. Тогда Ад(х) = (1 +z)x+1 -(1 +z)x = z(1 +z)x, следовательно, A71 g(x) = zn(1 +z)x. В этом случае бесконечный ряд Ньютона g(a + x) = X>n9(a)(*) = V+^Lfy^ сходится к "корректному" значению (1 +z)a+x при всех х.
244 Биномиальные коэффициенты Джеймс Стирлинг (James Stirling) пытался использовать ряд Ньютона для обобщения факториальной функции на нецелые числа. Сначала он нашел коэффициенты Sn, такие, что *-Р-СО-*>(;;)+*(?)+S2(i)+"- (мб) представляет собой тождество при х = 0, х=1,х = 2и т.д. Однако он обнаружил, что получающийся в результате ряд не сходится при целых неотрицательных х. Он предпринял новую попытку, записав на этот раз lnx! L' п sou) +si(? ) + s2(*) + ••• . (547) Так как А(1пх!) = 1п(х + 1)! — lnx! = 1п(х + 1), в соответствии с (54°) получается = И (Ьх!)| V } 1х п-1 к кп-1 (-1 m-1-k (ln(x+1] 1п(к+1). 1х=0 Искомыми коэффициентами являются So = Si = 0; S2 = In2; S3 = 1пЗ — 21n2 = ln|; S4 = In4 — 31n3 + 31n2 = 1п|| и т.д. Так Стирлинг получил сходящийся ряд (хотя и не доказал этого). В действительности найденный им ряд сходится при всех х > — 1. Таким образом, он оказался в состоянии вычислить j\. Остальная часть истории— в упр. 88. Прием 3: обращение Частный случай только что выведенного правила (б45) &ля ряда Ньютона можно переписать следующим образом: ы = х_ :-i)kf(k) f(n) = y_ 71 (-i)kgW, (548) "Постольку, поскольку эти члены возрастают очень быстро, их разности будут образовывать расходящуюся прогрессию, что препятствует приближению ординаты параболы, поэтому в данном и подобных ему случаях я интерполирую логарифмы этих членов, разности которых составляют быстро сходящийся ряд" —Д. Стирлинг (J. Stirling) [343] (До XIX века доказывать сходимость было необязательно.) Это дуальное соотношение между f и g называется формулой обращения, которая напоминает формулы обращения Мёбиуса (4.56) и (4-6i), с которыми мы встречались в главе 4. Формулы обращения говорят нам, как разрешить "неявные рекуррентные соотношения" в которых неизвестная последовательность встроена в сумму. Например, пусть g(n)— известная функция, f(n)— неизвестная и при этом можно показать, что g(n) = 21 k (?) (—1 )kf(k).
5.3 Специальные приемы 245 Обратите: Тогда (548) позволяет нам выразить f (тг) в виде суммы извест- lzmb рро\ ных значений. (См ответ на еле- Мы можем доказать (548) непосредственно, с применени- дующей странице.) ем основных методов из начала данной главы. Если g(n) = Lk (?)M)kfOO при всех п ? 0, то Есть и другой вариант постановки задачи— когда п изрядно подвыпивших на вечеринке гостей берут шляпы с вешалки в случайном порядке. Выбирайте, что кому больше по душе. — Переводчик -l™lG:)h>™C) = = L«J>Z [-1)k+ifkIj IH! П-) k = Lfw(*)[n-j=0] = f(n)- Доказательство в обратном направлении, разумеется, такое же, поскольку связь между f ид симметрична. Давайте проиллюстрируем (54$), применив ее к "задаче о победе футбольной команды" Группа из п фанатов выигрывающей футбольной команды на радостях подбрасывает свои шляпы в воздух. Шляпы падают в случайном порядке— по одной к каждому болельщику. Сколькими способами Н(гц к) ровно к болельщиков получат назад собственные шляпы? Например, если п = 4 и и болельщики обозначены буквами А, В, С, D, то 4! =24 возможных способа приземления шляп дают следующие количества попаданий в руки законных владельцев: ABCD ABDC ACBD ACDB ADBC ADCB 4 2 2 1 1 2 BACD BADC BCAD BCDA BDAC BDCA 2 0 1 0 0 1 CABD CADB CBAD CBDA CDAB CDBA 1 0 2 1 0 0 DABC DACB DBAC DBCA DCAB DCBA 0 1 1 2 0 0 Таким образом, Н(4,4) - 1, Н(4,3) = О, Н(4,2) = 6, Н(4,1) = 8 иН(4,0)=9. Можно определить Н(гцк), заметив, что это количество способов выбора к счастливых обладателей шляп, а именно (?), умноженное на количество способов упорядочения оставшихся n—к
246 Биномиальные коэффициенты шляп так, что ни одна из них не попадет к владельцу, а именно на H(n—к,0). Перестановка называется беспорядком (derangement), если в ней перемещен каждый предмет, а само число беспорядков из п объектов иногда обозначается как 'nj' (читается как "п субфакториал"). Таким образом, Н(п — k,0) = (n — k)j, а общая формула имеет вид п Н(гцк) = , h(n-k,0) = и (n-k)j. (Обозначение для субфакториала не является стандартным, и не ясно, насколько удачно наше; тем не менее попробуем пока что использовать его и посмотрим, насколько оно нам понравится. В конце концов, всегда можно воспользоваться чем-то наподобие 'DV, если 'rij' не будет нас устраивать.) Наша задача была бы решенной, если бы мы получили аналитическое выражение для nj, так что попробуем его найти. Поскольку сумма Н(гц к) по всем к— это общее количество перестановок п шляп, можно легко записать рекуррентное соотношение п! = 5-4n,k) = H(vVn"k)i = k k ^ ' = X. (к)к|' целое n ^0в ^549^ (На последнем шаге мы заменяем к на п — к и (п™к) на (?).) С помощью данного неявного рекуррентного соотношения можно вычислить любые требуемые значения Тг(гц к): п 0 1 2 3 4 5 6 h{n, 0) Т 0 1 2 9 44 265 Н(п,1) 1 0 3 8 45 264 h(n,2) 1 0 6 20 135 h(n, 3) 1 0 10 40 h(n,4) h(n,5) h(n,6) 1 0 1 15 0 1 Например, вот как можно вычислить строку для тг = 4. Два крайних справа элемента очевидны — имеется только один вариант того, что все шляпы попадут к своим хозяевам, и ни одного варианта того, что ровно три болельщика получат свои шляпы (чью шляпу тогда поймал бы четвертый болельщик?). При к = 2 и к = 1 можно воспользоваться нашим уравнением для Н(гцк) и получить Н(4,2) = (^Н&О) - 6-1 = 6 и h(4,1) = (?)Н(3,0) = 4-2 = 8. Это уравнение нельзя использовать для вычисления Повернув "zmb рро" на 180° ,мы получим "odd quiz" т.е. "странную шутку" — Переводчик
5.3 Специальные приемы 247 Искусство математики, как и жизни, состоит в выяснении, какие из истин бесполезны. (Вспоминается анекдот о том, как заблудившийся в тумане на воздушном шаре пилот опускается к земле и спрашивает прохожего: — Где я?! — На воздушном шаре!— слышит он в ответ и решает, что перед ним математик, ибо кто еще в состоянии дать такой совершенно точный и совершенно бесполезный ответ? —Переводчик) 11(4,0). Вернее, можно, но оно даст нам 11(4,0) = (0)h(4,0), что, конечно, верно, но бесполезно. Пойдем другим путем и используем для вычисления 11(4,0) = 9 соотношение 11(4,0)4-8 + 6 + 0 + 1 = 4!. Найденное Н(4,0) = 9 и есть значение 4|. Аналогичным образом nj зависит от других значений kj при к < п. Но как разрешить рекуррентность вида (5-49)? Просто: она имеет вид (548), с g(n) = п! и f(k) = (—1)kkj. Следовательно, ее решением является тч = (-UnH(?)(-1),tW. Ну, на самом деле это не решение, а сумма, которую по возможности следует записать в аналитическом виде. Но это уже лучше, чем рекуррентное соотношение. Сумму можно упростить, поскольку к! сокращается со скрытым к! в (?), так что попробуем это сделать и получить Щ У П! (-1)"+" = п! У М)к О^к^п (п-к)! О^к^п к! (5-50) Оставшаяся часть суммы быстро сходится к числу Xlk>o(—1)кА-- — е_1- В действительности члены, исключенные из суммы, дают п!? к>тг (-1) к! (-Dn+1 п+1 (~1)n+1 п+1 5>i: к^О 1- 1 , (п+1)! (к+п+1) 1 : + п+2 (п+2)(п+3) где заключенная в скобки величи на лежит между 1 и 1 — -^^ — ^j^. Следовательно, абсолютная величина разности nj и п!/е грубо равна 1/п; точнее, она лежит между 1/(п+ 1) и 1/(п + 2). Но щ— целое число, поэтому оно должно быть равно числу, которое мы получаем при округлении п!/е до ближайшего целого при п > 0. Итак, вот решение в аналитическом виде, которое мы искали: Щ п! 1 7 + 2 + [п = 0]. (5-5i) Это число вариантов того, что ни один из болельщиков не получит назад свою шляпу. При большом п более важно знать вероятность, с которой это происходит. Если предположить,
248 Биномиальные коэффициенты что каждый из п! исходов равновероятен— так как шляпы подброшены очень высоко,— то данная вероятность равна nj _ n!/e + Q(1] П! - = .367.. е Так что, когда п становится достаточно велико, вероятность, что все шляпы будут перепутаны, составляет почти 37%. Кстати, рекуррентное соотношение (549) АЛ51 субфакториалов точно такое же, как и (546), первое рекуррентное соотношение, рассмотренное Стирлингом, когда он пытался обобщить факториальную функцию. Следовательно, S^ = kj. Эти коэффициенты настолько велики, что неудивительно, что бесконечный ряд (546) расходится при нецелых х. Перед тем как покончить с данной задачей, рассмотрим вкратце две интересные закономерности, которые так и выпирают из таблицы начальных значений h[n,к). Во-первых, числа 1, 3, 6, 10, 15, ..., находящиеся под диагональю из нулей, представляют собой треугольные числа. Это наблюдение легко доказать, поскольку данные элементы таблицы являются числами Н(гцп—2), а Бейсбольные болельщики: .367— это еще и коэффициент бэтте- ра Тая Кобба (Ту Cobb) за всю его карьеру— никем не превзойденный рекорд. Совпадение? (Ну коэффициент Кобба был 4191/11429 » .366699, вто время как 1 /е и .367879. Но если бы Вэйд Воггс (Wade Boggs) провел несколько удачных сезонов, то...) 11(11,11-2) = 71 п-2 2i - Кроме того, похоже, что числа в первых двух столбцах отличаются друг от друга на ±1. Всегда ли это так? Да, поскольку Н(гц 0)—Н(тг, 1) = nj—tl(tl— l)j = (-nk k! n. ?¦ n (-i)n nfn-1)! n (-1)". L 0^k^n-1 k! Другими словами, nj = n(n— 1)j + (—1 )n. Это гораздо более простое рекуррентное соотношение для числа беспорядков, чем то, которое мы рассматривали раньше. Теперь попробуем обратить что-нибудь еще. Если применить инверсию к формуле L тЛ(-1] к/ х + к 1_ /х + п х V п -1 Но инверсия— источник смога.
5.3 Специальные приемы 249 выведенной в (5-41)) то мы найдем, что ^-?©'-<Г)"- Это интересно, но в действительности не ново: если обратить верхний индекс в (х^к), то мы просто вновь получим уже открытое соотношение (б-ЗЗ)- 5.4 Производящие функции Вот мы и добрались до самой важной идеи всей книги — понятия производящей функции (generating function). Представляющую интерес бесконечную последовательность (do, си, d2>...) удобно представить в виде степенного ряда относительно вспомогательной переменной z, A(z) = a0 + aiz-ba2z2 + --- = ^ akzk. (5.52) Использование для обозначения переменной буквы z связано с тем, что зачастую под z подразумевается комплексное число. Теория функций комплексного переменного традиционно использует в своих формулах lz\ а степенные ряды (известные также как аналитические или голоморфные функции) занимают в этой теории одно из центральных мест. В следующих главах мы будем много раз сталкиваться с производящими функциями; так, глава 7 будет полностью посвящена им. В настоящий момент наша цель состоит в том, чтобы ввести основные понятия и продемонстрировать уместность использования производящих функций при изучении биномиальных коэффициентов. Основная польза производящей функции в том, что одной ею можно представить целую бесконечную последовательность. Зачастую при решении тех или иных задач можно сначала обратиться к производящим функциям, а затем, поработав с ними как следует, вновь вернуться к их коэффициентам. При определенном везении можно узнать о функции достаточно, чтобы выяснить все, что надо знать о ее коэффициентах. Если A(z)— некоторый степенной ряд 21к>0 aicZk, то его удобно записать в виде [zn]A(z) - an; (5.53) другими словами, [zn] A(z) означает коэффициент при zn в A(z). (См. в [223] рассмотрение истории и пользы данного понятия.)
250 Биномиальные коэффициенты Пусть A(z) — производящая функция для последовательности (do, си, 0.2,...), как в (б-52)) и пусть B(z)— производящая функция для последовательности (bo, bi, b2,...). Тогда произведение A(z)B(z) представляет собой степенной ряд (a0+a1z+a2z2+- • • )(b0+biz+b2z2+- • •) = = aobo + (a0bi+a1bo)z+(a0b2+aib1+a2bo)z2H ; коэффициент при zn в этом произведении равен п a0bn + си bn_i Н h anb0 = 2_ akbn-k • k=0 Таким образом, если мы хотим вычислить сумму, которая имеет общий вид п Сп = YL акЬп-к > (5-54) k=0 и при этом известны производящие функции A(z) и B(z), то cn = [zn]A(z)B(z). Последовательность (сп), определяемая правилом (5-54)» на_ зывается сверткой последовательностей (an) и (bn); эти две последовательности "свертываются" образуя суммы произведений всех тех элементов последовательностей, нижние индексы которых при сложении дают некоторую определенную величину. Суть предыдущего абзаца состоит в том, что свертка последовательностей соответствует умножению их производящих функций. Производящие функции обеспечивают нас мощными средствами обнаружения и/или доказательства тождеств. Например, биномиальная теорема гласит, что (1 +z)r— это производящая функция для последовательности ((о)> (i)> Q)> • • • )• Аналогично k^O ч 7 Если перемножить эти производящие функции, то получится другая производящая функция: (1+z)T(1+z)s = (1+z)r+s.
5.4 Производящие функции 251 (5-27)! = (5.27X4.27) (3.27X2.27) (1.27X0.27)!. Если у вас есть цветной маркер, можете подчеркнуть эти два равенства — они того заслуживают. И вот самый важный момент: приравнивание коэффициентов при zn в обеих частях этого равенства дает п к=0 S п-к Г + S п Мы заново открыли свертку Вандермонда (5.27) ! Это было так просто и красиво, что очень хочется попробовать еще. В этот раз мы воспользуемся выражением (1 — z)r, которое представляет собой производящую функцию для последовательности ((—1)п(^)) = ((о)'-(I)> (D> • *•)• Умножение на (1 -\-z)r дает другую производящую функцию, коэффициенты которой нам известны: (1-zni+zr = (1-z2)\ Приравнивание коэффициентов при zn приводит к равенству ! (О (u i о <-' I- = |-'»"" и) ¦" —* ¦ <•¦»> Следует проверить это соотношение при одном-двух малых случаях. При п = 3, например, получается + = 0. Каждый положительный член сокращается с таким же отрицательным. То же самое получается при любом нечетном п, так что в этих случаях сумма не представляет собой особого интереса. Но если п четное, например когда п = 2, мы получаем нетривиальную сумму, отличную от свертки Вандермонда: + Таким образом, при п = 2 равенство (б-бб) подтверждено. Оказывается, что (5-3°) представляет собой частный случай нашего нового тождества (б-55)- Биномиальные коэффициенты появляются и в некоторых других производящих функциях. Особенно примечательны следующие важные соотношения, в которых нижний индекс фиксирован, а верхний— изменяется: 1 d-z) п+1 (1 -z)n+1 k^O n + k n k n целое n ^ 0 целое п ^ 0. (5-56) (5-57)
252 Биномиальные коэффициенты Здесь второе тождество— это всего лишь первое тождество, умноженное на zn, т.е. "сдвинутое вправо" на п позиций. Первое тождество представляет собой всего лишь немного замаскированный частный случай биномиальной теоремы: если разложить (1 — z)_n_1 согласно (5-13)> то коэффициент при zk равен (~r|c_1)(—1)к, что можно переписать как (k^n) или (n^k) путем обращения верхнего индекса. Эти частные случаи заслуживают явного упоминания, поскольку очень часто возникают в приложениях. При п — 0 получаем частный случай частного случая— геометрический ряд: = 1 + z + z2 + z3 + • • • = У zk . I —z L— k^O Это производящая функция последовательности (1,1,1,...), и она особенно полезна потому, что свертка любой другой последовательности с ней представляет собой последовательность сумм: если Ь^ = 1 при всех к, то (б-54) сводится к п cn = у Qk- k=0 Таким образом, если A(z)— производящая функция для членов суммы (ао, си, CL2,...), то A(z)/(1 —z) — производящая функция для сумм (Co,Ci,C2,...). Задача о беспорядках, связанная со шляпами и болельщиками, которую мы решили путем обращения, может быть решена при помощи производящих функций еще одним интересным способом. Основное рекуррентное соотношение этой задачи ^! = L(?)(n-k)l может быть представлено в виде свертки, если выразить (?) через факториалы и разделить обе части на п!: 1 = У ] (n~k)i ^— к! (п-к)! " к=0 ^ ; Производящей функцией для последовательности (^, уу, jj,...) является ez; следовательно, если положить k^O
5.4 Производящие функции 253 Обобщенный биномиальный ряд St(z) открыт в 1750-х годах Дж. X. Ламбертом (J. Н. Lambert) [236, §38/, который несколькими годами позже заметил [237], что его степени удовлетворяют первому тождеству в (s>6o). В упр. 84 поясняется, как вывести ($.6i) из (5.6о). то данная свертка/рекуррентность указывает на то, что 1 ezD(z). 1 -z Решение относительно D(z) дает 1 _. 1/1 D(z) = 1-z ¦е " = 1 -zVO! тт? TTZ 1 ? 2!Z + Приравнивание коэффициентов при zn показывает, что п - = У тч V М)к П! к=0 к! это та же формула, которая была получена ранее путем обращения. До сих пор исследование производящих функций давало нам доказательства того, что мы знали и так, благодаря иным методам. Мы не использовали производящих функций для получения новых результатов, за исключением (б-55)- Теперь мы готовы к поиску нового и неожиданного. Существуют два семейства степенных рядов, которые порождают особенно широкий класс тождеств с биномиальными коэффициентами. Определим обобщенный биномиальный ряд !Bt(z) и обобщенный экспоненциальный ряд ?t(z) следующим образом: к к St(z) = JjtlO—^; ?t(z) = L(tk+1)k"1|[- (5-58) к^О ' к^О В разделе 7.5 мы покажем, что данные функции удовлетворяют тождествам Btto^-Bttz)-* = z; fitter1 h?t(z) = z. (5-59) В частном случае t = 0 имеем S0(z) = 1+z; fio(z) = e2; это объясняет, почему ряды с произвольным параметром t называются "обобщенными" биномиальными и экспоненциальными рядами. Следующие пары соотношений справедливы при любом действительном г: St(z) L k^O tk + т\ г k /tk + r" ?t(z)r xytk+r)k"V k^O k! (5.60)
254 Биномиальные коэффициенты l-t + tStfz)-1 L z ?t(z)r (tk + r)* k - 2_ й z • (5-6i) i-ztet(z)* ?-0 k! (Если tk + r = 0, следует проявить осторожность относительно того, как интерпретировать коэффициент при zk; каждый такой коэффициент представляет собой полином относительно г. Например, постоянным членом ряда ?t(z)r является r(0+r)_1, а это равно 1 даже при г = 0.) Поскольку уравнения (б-6о) и (5.61) справедливы при любом г, мы получаем очень общие соотношения путем перемножения рядов, соответствующих различным степеням г и s, например St(z) l-t+tBt(z)-i =1-Д к Jtfc** ХД , J v zn y Лк+Л — A(n-k)+s +, Г-Л к /tt+Л тг—к Этот степенной ряд должен быть равен Bt(z)r+S = v- /tn + r + s 1-t + tSt(z)-i " ^-Д п следовательно, можно приравнять коэффициенты при zn и получить тождество v- /tk+r\ /t(u-k)+s\ г /tn+r+s\ 1Л k A n-k J^T^ = i n J' целоеп> корректное при всех действительных г, s и t. При t = 0 это тождество сводится к свертке Вандермонда. (Если же в этой формуле tk+r случайно равен нулю, то множитель tk+r в знаменателе надо рассматривать как сокращающийся с tk + г в числителе биномиального коэффициента. Обе части соотношения представляют собой полиномы от г, s и t.) Аналогичные соотношения выполняются при умножении 23t(z)r на ?t(z)s и т.д. (табл. 255). Мы уже знаем, что рассмотрение частных случаев общих результатов— идея обычно неплохая. Например, что получится, если положить t = 1? Обобщенный бином Ъ*\&) очень прост — это 2,(2) = У_гк = -!-;
5.4 Производящие функции 255 Таблица 255. Общие соотношения свертки, справедливые при целых п^ 0 у /tk + Л /tn - tk + s\ г /tn + г + s\ 2.Д k Д n-k Дк + r ~ { n J y- /tk + r\ /tn - tk + s\ r s ^-\ k Д n-k /tk + r tn - tk + s ~ ^tn -f r + s^ r-\-s \ n ytn + r + s V 1 HtV 1 rlk/4n tk 1 ->\rL-k Г - ftn 1 r 1 -1п / I . \ {IK \ Г) llll Uv 1 о J — 1 Lll | Г 1 Ь) L— Vk/ ч ' tk + r к ч ' У~ f^lttc. 1 r)kCtTi tk 1 -)n~k Г S к ч ' = (tn + r + s)n——-— tn + r + s (5-62) (5-63) (5-64) (5-65) Xa! Это итерированная степенная функция ?(lnz)=zzZ , которая всегда приводила меня в изумление. ZzZzzz. . . Степенной ряд дляЪу2№г = (^/?T4 + z)2r/4r тоже весьма поучителен. таким образом, Ъ^ (z) не дает нам ничего, что мы бы не получили из свертки Вандермонда. Но ?i (z)— важная функция к! Г ' Ъ~ ' 24 ?(z) = ^Jk+I)1^ = 1+z+|z2+|z3+^z4+---, (5.бб) которую мы пока что не видели. Она удовлетворяет базовому соотношению ?(z) = ez?(z) (5.67) Эта функция, впервые изученная Эйлером (Euler) [117] и Эйзенштейном (Eisenstein) [91], возникает во многих приложениях [193, 204]. Частные случаи t = 2 и t = — 1 обобщенного бинома представляют особый интерес, поскольку их коэффициенты все время возникают в задачах с рекурсивной структурой. Таким образом, имеет смысл явно указать эти ряды — для возможности последующих ссылок: *•>-?(?) 2к^ кУ1+к = L 2к + 1 1+2к 1 — VI -4z 2z (5-68)
256 Биномиальные коэффициенты -«-да 1-к = L(v к Jr32k = 2 ' (5'б9) к ч ' Коэффициенты (TJ1) ^у из 232 М называются числами Каталана Сп, по имени Эжена Каталана (Eugene Catalan), который написал о них основополагающую работу в 1830-х годах [52]. Последовательность этих чисел начинается следующим образом: п Сп 0 12 3 4 1 1 2 5 14 5 42 6 132 7 429 8 1430 9 4862 10 Ш% Коэффициенты !B_i (z) по сути те же самые, за исключением дополнительной единицы в начале и чередования знаков у других чисел: (1,1, — 1, 2> —5,14,...). Таким образом, !B_i (z) = 1 + z?2(-z). Кроме того, S_i (z) = Ъ2{-ъ)-Л. Завершим этот раздел выводом важного следствия из (б-72) и (б-73)> а именно— соотношения, которое показывает дальнейшие связи между функциями S_i (z) и 232(—z): Ъ^{г)п+'-{-ъГ+'Ъ2{~гГ+' ^_/ll-,.k VT + 4z = L(V k^n Данное соотношение выполняется потому, что коэффициенты при zk в (-z)n+1?2(-z)n+1/\/1 +4z имеют вид (-I)n+V >/T+4z >/l-Hz m+1 = (_i )n+i (_-, )k-n-i [zk-n-i] Ъ2{гУ* =
5.4 Производящие функции 257 f_lllc/2(k-n-1)+n+1\ J ^ k-n-1 J = Ml = m: 2k-n-1 k-n-1 2k-n-1 k n-k k при k > п. Эти члены отлично сокращаются друг с другом. Теперь можно воспользоваться (5-68) и (б-6д) для получения аналитического выражения L u-k 1 zk = VUAi 1+x/T+4^\n+1 1->/l+fe\n+1 целое n ^> 0. (5-74) (Частный случай z = — 1 возникал в задаче 3 раздела 5.2. Поскольку числа \ (1 =Ь л/—3 ) являются корнями шестой степени из единицы, суммы 2Zk<n (n^k)(—1)k имеют периодическое поведение, что и наблюдалось в указанной задаче.) Аналогично можно объединить (б-7°) с (5-71) АЛЯ сокращения больших коэффициентов и получить z(" k<n П n —k zk = целое n > 0. (5-75) Они даже изменчивее хамелеонов: их можно расчленить, а затем сочленить разными способами. 5.5 Гипергеометрические функции Методы, которые мы применяли к биномиальным коэффициентам, очень эффективны в тех случаях, когда они работают, но следует иметь в виду, что зачастую они оказываются слишком специфичными, предназначенными для конкретных задач, т.е. по сути они представляют собой приемы, а не технологии. При работе над той или иной задачей мы часто движемся одновременно в нескольких направлениях, и иногда выясняется, что это — движение по кругу. Биномиальные коэффициенты подобны хамелеонам: они очень легко меняют свою внешность. Таким образом, представляется естественным вопрос— нет ли
258 Биномиальные коэффициенты некоего унифицирующего принципа, который работал бы со всем многообразием сумм биномиальных коэффициентов единым систематическим способом? К счастью, ответ на этот вопрос положительный. Такой единый принцип основан на теории определенных бесконечных сумм, именуемых гипергеометрическими рядами. Изучать гипергеометрические ряды много лет назад начали Эйлер (Euler), Гаусс (Gauss) и Риман (Riemann); эти ряды и по сей день остаются предметом обширных исследований. Однако гипергеометрическая форма записи выглядит несколько устрашающе, и к ней надо привыкнуть. Обобщенный гипергеометрический ряд— это степенной ряд от z с m + п параметрами, который определяется через возрастающие факториальные степени следующим образом: То, что пронесло свою форму записи через века, должно быть и вправду полезным. си, • ьь. • > cim • •> ьп ¦) = У^- ^— bk (5-76) Чтобы избежать деления на нуль, ни одно b не может быть нулем или целым отрицательным. В остальном все а и b могут быть любыми. В качестве альтернативы двустрочной записи (б-7б) может использоваться запись Т(сп,..., am; bi,..., Ъп; z)\ которая более удобна как минимум с типографской точки зрения. Величины а называются верхними параметрами и входят в числитель членов суммы F. Величины b называются нижними параметрами и входят в знаменатель. Последняя величина, z, называется аргументом. В стандартных справочниках для обозначения гипергеометрического ряда с га верхними параметрами и п нижними вместо 'F' часто используется 'mFn'. Однако эти лишние нижние индексы обычно только загромождают формулу и отнимают время на их переписывание. Всегда можно просто пересчитать параметры, так что эти индексы являются избыточными. Многие важные функции представляют собой просто частные случаи гипергеометрической функции — ив этом их сильная сторона. Например, простейший случай получается при та = п = 0: здесь параметров нет вовсе, и мы получаем знакомый ряд = У- = к^О Вообще-то, когда га или п равно нулю, запись имеет несколько обескураживающий вид. Чтобы этого избежать, можно добавить
5.5 Гипергеометрические функции 259 дополнительные единицы вверху и внизу: '1 В общем случае функция не меняется при сокращении параметра из числителя и знаменателя, как и при добавлении двух одинаковых параметров в числитель и знаменатель. Очередной простейший случай получается при m = 1, ai =1 и п = 0; однако мы заменим параметры на га = 2, си = а.2 = 1, п = 1 и bi = 1, чтобы было п > 0. Этот ряд также нам знаком, поскольку 1k = к!: 1 Ъ z\ = У zk 1 к^О Это наш старый знакомый— геометрический ряд. Гипергеометрическая функция F(ai,..., am; bi,..., bn; z) называется так потому, что включает геометрический ряд F(1,1; 1;z) в качестве весьма частного случая. Общий случай m = 1 и п = 0 в действительности легко вычисляется в аналитическом виде при использовании (5-13) и (б-14): и";1 k^O k v 7 у } Если заменить а на —а и z на —z, то мы получим биномиальную теорему F('-a,1 0+z)Q. Отрицательное целое число в качестве верхнего параметра превращает бесконечный ряд в конечный, поскольку(—a)k = 0 при к > а ^ 0 и целом а. Общий случай га = 0, п = 1 представляет собой еще один знаменитый ряд, хотя он и не столь известен в литературе по дискретной математике: 1 l\ у- (b-1)! zk ,-, г, (Ь-1)! = L(b=Hk)!k! = Ib-1(2^)^TT7I- (5-78) k^O v ; b,1 Эта функция lb—1 называется "модифицированной функцией Бесселя" порядка b — 1. Частный случай b = 1 дает нам функцию F( -,1-, |z) = 1о(2у^), которая представляет собой интересный РЯД LkiozkA!2.
260 Биномиальные коэффициенты Частный случай га = п = 1 называется конфлюэнтным (вырожденным) гипергеометрическим рядом и часто обозначается буквой М: (5-79) Эта функция, имеющая важные применения в технике, введена Эрнстом Куммером (Ernst Kummer). Возможно, некоторые из читателей удивлены, почему мы не рассматриваем вопрос о сходимости бесконечного ряда (б-7б). Дело в том, что сходимость можно игнорировать, если использовать z просто как формальный символ. Несложно убедиться, что формальные бесконечные суммы вида Z[k>n(X^zk с —°° < п < со образуют поле, если их коэффициенты а^ лежат в некотором поле. Такие формальные суммы можно суммировать, вычитать, умножать, делить, дифференцировать и выполнять их композицию, не беспокоясь о сходимости; все выведенные тождества формально будут справедливыми. Так, гипергеометрический ряд F(л»],] \z) — Hk>o ^' ?k не сходится ни при каком ненулевом z; но, как мы увидим в главе 7, его можно использовать для решения задач. С другой стороны, заменяя z конкретным числовым значением, мы должны быть уверены в том, что бесконечная сумма хорошо определена. Очередное усложнение дает нам самый знаменитый гипергеометрический ряд. В действительности именно он был собственно гипергеометрическим рядом примерно до 1870 года, когда все было обобщено для произвольных га и п. У этого ряда два верхних параметра и один нижний: а,Ь с akbk zk ckk! (5.80) Его часто называют гауссовым гипергеометрическим рядом, поскольку многие его тонкие свойства были впервые доказаны Гауссом (Gauss) в его докторской диссертации в 1812 году [143], хотя Эйлер (Euler) [118] и Пфафф (Pfaff) [292] уже открыли к тому времени некоторые замечательные свойства этого ряда. Одним из важных частных случаев является ряд ln(1 +z) = zF 1,1 2 k>0 k!k! k! ъг z3 + Впрочем, вопрос о сходимости (5.56), (5-57), (5-58), • • • тоже не рассматривался. "Пожалуй, 95% (если не все 100%) функций, изучаемых в настоящее время в университетах студентами-физиками, инженерами и даже математиками, могут быть охвачены одним-един- ственным символом F(a,b; с;х)" — У У Сойер (W.W.Sawyer) [318]
5.5 Гипергеометрические функции 261 Обратите внимание, что z_1 1п(1 + z) представляет собой гипергеометрическую функцию, на сама функция ln(1 + z) гипергеометрической не является, так как гипергеометрический ряд всегда равен 1 при z = 0. До сих пор гипергеометрические ряды не дали нам ничего, кроме повода упомянуть пару громких имен. Но мы увидели, что несколько очень различных функций могут рассматриваться как гипергеометрические ряды; именно это и будет основным предметом нашего интереса в дальнейшем. Мы увидим, что большой класс сумм может быть записан как гипергеометрический ряд "каноническим" способом; следовательно, мы получим удобную систему учета фактов о биномиальных коэффициентах. Какие же ряды являются гипергеометрическими? На этот вопрос легко ответить, если рассмотреть отношение последовательных членов гипергеометрического ряда: F/ab...,am|X=Ltk) f^j|^ Vb,,...,bni; ^-0 bk...bkk! Первый член — to = 1, и прочие члены дают отношения tic+i = ap-aF _bj---b|_ k! zk+ tk af.-.a* bk+1...bk+1 (k+1)! zk _ (k + ai)...(k+am)z ~ (k + b1)...(k + bT1)(k + 1)- Это рациональная функция от k, т.е. отношение двух полиномов от к. Согласно основной теореме алгебры любая рациональная функция от к может быть разложена на множители над полем комплексных чисел и приведена к указанному виду. Величины а в числителе представляют собой корни полинома в числителе, взятые с обратным знаком, а b— взятые с обратным знаком корни полинома в знаменателе. Если в знаменатель не входит отдельный множитель (к+ 1), то его можно включить и в числитель, и в знаменатель. Остается постоянный множитель, который можно обозначить через z. Таким образом, гипергеометрические ряды— это в точности те ряды, первый член которых равен 1, а отношение членов t^+i /t^ представляет собой рациональную функцию от к. Предположим, например, что у нас есть бесконечный ряд с отношением членов tk+i _ k2 + 7k+10 tk 4к2 + 1 ' (5-8i)
262 Биномиальные коэффициенты которое является рациональной функцией от к. Полином в числителе разделяется на множители (к + 2) (к + 5), а знаменатель представляет собой произведение 4(к + г/2)(к — г/2). Поскольку в знаменателе отсутствует необходимый множитель (к + 1), запишем отношение членов в виде tk+1 (к + 2)(к + 5)(к+1)(1/4) tic (к + г/2)(к-г/2)(к+1) и получим окончательный результат: заданный ряд— это X tk = t0 F k>0 2,5,1 г/2, -г/2 1/4 Таким образом, установлен общий метод нахождения гипер- геометрического представления некоторой заданной величины S, если такое представление возможно. Вначале S записывается в виде бесконечного ряда, первый член которого отличен от нуля. Выберем такие обозначения, чтобы это был ряд Hk>0"tk с to ф 0. Затем вычисляется tic+i/tk. Если отношение членов не является рациональной функцией от к, значит, нам не повезло. В противном случае мы выражаем его в виде (б-Si); это дает нам параметры си , ..., am, bi, ..., bn и аргумент z, такой, что S = to F(gli,..., am; Ъь ..., bn; z). Гауссов гипергеометрический ряд при необходимости подчеркнуть важность отношения членов может быть записан и в рекурсивном виде: 'a,b | z = = 1+--z 1 с - а+1Ь+1 2 с+1 , a+2b+2 м 1+—^2(1+-} Давайте попробуем переформулировать тождества с биномиальными коэффициентами, выведенные ранее в этой главе, в гипергеометрическом виде. Например, давайте выясним, как выглядит правило параллельного суммирования (сложения по диагонали) Z k^n r + k k г+ n- n целое гц в гипергеометрической записи. Для этого надо записать данную сумму в виде бесконечного ряда, начинающегося с к = 0, так что заменим к на п — к: L к^О гт + п - к . тг — к 2— г!(тг к^О г + тг-к)! 2>. (Сейчас самое время размяться с помощью упр. 11.) к$>0
5.5 Гипергеометрические функции 263 Формально данный ряд бесконечный, но на самом деле он конечен, потому что (п — к)! в знаменателе делает t^ = 0 при к > п. (Позже мы увидим, что 1 /х! определено при всех х и что 1 /х! = О при целом отрицательном х. Ну а пока махнем рукой на все формальности до тех пор, пока не наберемся побольше гипергеометрического опыта.) Отношение членов в данном случае равно tk+1 (r + n-k-1)!r!(n-k)! n-k tk r! (n-k-1)! (г + n-k)! r + n-k (k+1)(k-n)(1] (k-n-r)(k+1) Кроме того, to = (r^Ln) • Следовательно, правило параллельного суммирования эквивалентно гипергеометрическому тождеству г + п\ ( 1, -п п / V —n—г 1] _ ' г + п+! U Деление на (7 ^п) дает несколько более простую версию 1,-п F —и—г „ . г + п + 1 /г + п\ , л 1) = -—г, если( п )^0. (5.82) Давайте попробуем еще. В тождестве (б-1б), Г(0(-1)к = (-1Г(Тт)' Ц6ЛОет' к<$т после замены к на га — к отношение членов принимает вид (к — m)/(r-m + k+1) = (k+1)(k-m)(1)/(k-m + r+1)(k+1); следовательно, (5.16) выражает в аналитическом виде функцию 1, —га -m+r+1 По сути это то же, что и гипергеометрическая функция в левой части (5-82), но с га вместо пиг+1 вместо —г. Поэтому тождество (б-1б) могло бы быть выведено из (5-82)— гипергеометрической версии (б-9)- (Не удивительно, что (б-1б) оказалось легко доказать, воспользовавшись (б-9)-) Мало нам беспо- Перед тем как идти дальше, мы должны подумать о вырож- рядков—теперь ^ денных случаях, поскольку гипергеометрические функции не определены, когда нижний параметр равен нулю или представляет собой отрицательное целое число. Тождество, соответствующее правилу параллельного суммирования, обычно применяется при целых положительных г и п; но тогда — п — г— отрицательное еще и вырождение.
264 Биномиальные коэффициенты целое число, и гипергеометрический ряд (5.76) не определен. Как тогда можно считать тождество (5-82) законным? Ответ в том, что мы можем перейти к пределу F( _]^~^le 11) при е —> 0. Позднее в этой главе подобные вещи будут рассмотрены более обстоятельно, а пока просто отдадим себе отчет в том, что некоторые знаменатели могут быть "взрывоопасными" Интересно, однако, что первая сумма, которую мы пытались выразить гипергеометрически, оказалась вырожденной. Возможно, другим больным местом в выводе (5-82) является представление (r^^k) в виде (г + п — к)! /г! (п — к)!. Такое представление некорректно при отрицательном целом г, поскольку (—га)! должно быть равным со, если следовать правилу 0! 0 •(-!)• (-2) (-m+1)-(-m)L И вновь для получения целочисленных значений нам надо рассматривать предел г + е при е —> 0. Но факториальное представление (?) = г!/к! (г —к)! определено только при целом г. Если же мы хотим работать с гипер- геометрическими представлениями, то нам нужна такая факто- риальная функция, которая была бы определена при всех комплексных числах. К счастью, такая функция имеется и может быть определена несколькими способами. Вот одно из наиболее полезных определений z! (точнее— 1/z!): ]_ z! lim п—юо П + Z n n (5.83) (См. упр. 21. Эйлер [99, 100, 72] открыл это определение в 22 года.) Можно показать, что данный предел существует для всех комплексных z, и что он равен нулю тогда, когда z— отрицательное целое число. Другое важное определение — ъ\ tze_tdt, если <Rz> -1. (5-84) Этот интеграл существует только тогда, когда действительная часть z больше — 1, но можно воспользоваться формулой z! = z(z-1)!, (5-85) чтобы распространить определение на все комплексные z (за исключением отрицательных целых чисел). Еще одно определение следует из приближения Стирлинга для lnz! из (547)- Все эти подходы приводят к одной и той же обобщенной факториальной функции. Сначала мы доказывали тождества для целого г и использовали полиномиальную аргументацию, чтобы показать их справедливость в общем случае. А теперь мы сначала доказываем их для иррационального г, а затем используем предельную аргументацию, чтобы показать их справедливость для целых чисел!
5.5 Гипергеометрические функции 265 Как вы записываете z в степени w, когда w — комплексно сопряженное с w число? Какт! (w) Имеется еще одна очень похожая функция, именуемая гамма-функцией, которая связана с обычными факториалами примерно так же, как возрастающие степени связаны с убывающими. В стандартных справочниках факториалы и гамма-функции часто используются совместно, и при необходимости удобно переходить от одних к другим, используя следующие формулы: Г(г+1) = z!, -z)! T(z) = Ti sm7tz (5-86) (5-87) Эти обобщенные факториалы можно использовать для определения обобщенных факториальных степеней, когда z и w представляют собой произвольные комплексные числа: Z! Z— = z-w T(z + w) T(z) (5-88) (5.89) Единственная оговорка состоит в том, что если эти формулы дают неопределенность типа оо/оо, то надо использовать соответствующие пределы. (Эти формулы никогда не приводят к неопределенности вида 0/0, так как факториалы и гамма-функции никогда не обращаются в нуль.) Биномиальный коэффициент можно записать как w С! lim lim t-+z cu->w си! (с, — cuj! (5.90) Понятно, ЧТО НИЖНИЙ индекс достигает своего предела первым. Вот почемУ (w) о6" ращается в нуль при отрицательном целом w. Это значение бесконечно, когда z — отрицательное целое, a w не является целым. где z и w — произвольные комплексные числа. Вооружившись такими инструментами, как обобщенные факториалы, мы можем вернуться к нашей цели— выявить гипергеометрическую сущность выведенных ранее тождеств. Биномиальная теорема (б-13)> как и следовало ожидать, оказывается ни чем иным, как суммой (б-77)- Так что следующее наиболее интересное для исследования соотношение— это свертка Ван- дермонда (5.27): Z(l n —к r + S п целое п. Здесь к-й член представляет собой г! s! tic = (r-k)!k! (s-n + k)!(n-k)!'
266 Биномиальные коэффициенты и больше не надо избегать использования в этих выражениях обобщенных факториалов. Всякий раз, когда t^ содержит множитель наподобие (а + к)! со знаком 'плюс' перед к, в соответствии с (5.85) мы получаем (а+к+1 )!/(<х+к)! = к+а-Н в отношении tic+i /t]cj это дает 'а+1'в соответствующем гипергеометрическом представлении— в качестве верхнего параметра, если (а + к)! был в числителе t^, или в качестве нижнего параметра в противном случае. Аналогично множитель типа (а —к)! приводит к (а —к— 1)!/(а —к)! = (—1)/(к— а); это дает '—ос' в другой совокупности параметров (с измененными ролями верхнего и нижнего параметров) и меняет знак аргумента гипергеометрической функции. Множители наподобие г!, не зависящие от к, входят в to, но исчезают из отношений членов. Используя такие трюки, можно без дальнейших вычислений показать, что отношение членов в (б-27) представляет собой tk+i п tk k+lk+s — тг+Г умноженное на (—I)2 = 1, и свертка Вандермонда приобретает вид -г, -п s-n+1 г -\- S п (5.91) Это равенство можно использовать для определения F(a>b;c;z) в общем случае, когда z = 1, а Ъ— отрицательное целое число. Перепишем (5-91) в таком виде, который облегчит нам просмотр таблицы, если потребуется вычислить некоторую новую сумму. В результате оказывается, что сцЬ с 1 = Г(с-а-Ь)Г(с) целое b ^ О Г(с - а) Г(с - Ъ) ' или <Нс> <Ra + Jftb. (5-92) Свертка Вандермонда (5-27) охватывает только тот случай, когда один из верхних параметров, скажем, Ь, представляет собой целое не положительное число; но Гаусс (Gauss) доказал [143], что (5-92) справедливо и тогда, когда a, b и с— комплексные числа, действительные части которых удовлетворяют условию 9Яс > 9\а + 9ЯЬ. В остальных случаях бесконечный ряд F(а^ 11) не сходится. При b = — п соотношение можно переписать в более удобном виде с факториальными степенями вместо гамма- функций: а, — п 1 = [с-а (а-с)* -с^ целое п ^ 0. (5.93) Несколько недель назад мы изучали то, что Гаусс сделал в детсадовском возрасте. Теперь мы изучаем материал, выходящий за рамки его диссертации. Что же с нами делают?!
5.5 Гипергеометрические функции 267 Оказывается, все пять соотношений из табл. 218 являются частными случаями свертки Вандермонда; все они охватываются формулой (5-93)> если уделить должное внимание вырожденным случаям. Обратите внимание, что (5.82) представляет собой просто частный случай соотношения (5-93) ПРИ cl = 1. Таким образом, на самом деле незачем запоминать соотношение (5-82); более того, на самом деле нам не надо тождество (5.9)> которое привело нас к (5-82), несмотря на то что в табл. 222 его предлагалось запомнить. Компьютерная программа для формульных преобразований, столкнувшись с задачей вычисления суммы X!k<n С^)» могла бы преобразовать ее в гипергеометрическую форму и подставить в общее выражение для свертки Вандермонда. В задаче 1 из раздела 5.2 требовалось найти значение суммы Для этой задачи естественным является гипергеометрическое представление, и, немного попрактиковавшись, любой гипергеометр сможет тут же записать эту сумму как F(1 > —га; —п; 1). Да, эта задача— еще одно жалкое подобие Вандермонда! Сумма в задачах 2 и 4 дает функцию F(2,1 — п; 2 — га; 1). (Сначала следует заменить к на к + 1.) А "страшная" сумма из задачи б оказывается всего лишь функцией F(n + 1} — п;2; 1). Получается, что, кроме скрытых версий свертки Вандермонда, суммировать больше нечего? Ну зачем же так? Задача 3 несколько иная. В ней мы имеем дело с частным случаем суммы общего вида ?Lk (n^ )zk, рассмотренной в (б-74)> и она приводит нас к аналитическому выражению для -z/4 1+2Гп/2"|,-п 1/2 Мы также доказали нечто новое в (б-55)> когда рассматривали коэффициенты функции (1 — z)r(1 +z)r: 1— с—2гц — 2п с .(2п)! (с-Г -1 = M)n^r \_ П|> Целое п^О. п! (с+тг—I)! При обобщении на комплексные числа эта формула называется формулой Куммера: а, Ъ 1+Ъ-а -1)=Ш1(Ъ-а)Ь?. (5.94) (Эрнст Куммер (Ernst Kummer) [229] доказал ее в 1836 году.)
268 Биномиальные коэффициенты Интересно сравнить две эти формулы. Заменяя с на 1 — 2п — а, находим, что результаты согласуются тогда и только тогда, когда Лп(2п)! (Ъ/2)! х! -1 г = .1иЧ "ТГ" = lim гГ^Т (5-95) TU Ъ->—2п Ъ! х->-п (2х)! при целом положительном п. Предположим, например, что п = 3; тогда должно быть — 6!/3! = Нтх^_зх!/(2х)!. Мы знаем, что и (—3)!, и (—6)! равны бесконечности. Мы могли бы игнорировать это затруднение и сделать вид, что (—3)! = (— 3)(— 4)(— 5)(—6)!, так что два имеющихся [—6)1 сократятся. Но на этот соблазн следует ответить решительным отказом, так как он приводит нас к неверному результату! Пределом х!/(2х)! при х —-> — 3 согласно (5.95) является не (-3)(-4)(-5), а -6!/3! = (-4)(-5)(-6). Правильный способ вычисления предела в (б-95) состоит в применении уравнения (5-87)» которое связывает факториалы с отрицательным аргументом и гамма-функции с положительным аргументом. Если заменить х на — п —ей положить е —> О, то двойное применение (5-87) дает (— п— е)! Г(п+е) sin(2n-f 2е)7Г (-2п-2е)! Г(2п + 2е) sin(n+е)тс Поскольку sin(x + y) = sin х cos у + cos х sin у, получившееся отношение синусов приводится к виду сов2шг.Ь2вп = (_1)П(2+0(е)) cos пп sin етс ч J при помощи методов из главы 9. Таким образом, согласно (5-86) мы, как и требовалось, имеем lim/Tn-?)-, =2(-1ГГ™ e^o(-2n-2e)! v ; Г(п) = 2( цп(2п-1)! = , п(2п)! 1 ] (n-1)! l J п! ' Завершим наш обзор тем, что установим заново все прочие соотношения, с которыми мы имели дело в этой главе, нарядив их в гипергеометрическое платье. Сумма с тремя биномиальными коэффициентами в (5-29) может быть записана как /1 — а—2гц 1 — Ъ—2гц —2ni \ V а> b I У v- (2п)!(а + Ь + 2п-1Г ^п = м ] ~7й ^ъ^ ' целое п ^ °'
5.5 Гипергеометрические функции 269 Историческая справка: За- альшютц (Sa- alschiitz) [315] независимо открыл эту формулу почти через 100 лет после первой ее публикации Пфаффом (Pfaff) [292]. Взятие предела при п —> оо дает уравнение (5-92)- Если обобщить эту формулу на комплексные числа, то получится формула Диксона: а, Ь> с 1+с — сц 1 + с —b (с/2)! (с-а)сЛ(с-Ъ)сЛ 11 =^ (с-a-b)^ ' (5'9б) <Иа+<НЬ< 1+9tc/2. Одной из наиболее общих формул из числа встречавшихся является сумма с тремя биномиальными коэффициентами (5-28), которая приводит к тождеству Заалъшютца: а, Ь, — п с, а+b — с—п+1 1 = (с-а)- (с-Ь) сп (с-а-Ь)п (а-с)^(Ь-с)^ (5-97) целое п ^ 0. (_с)2!(а+Ь-с)^' Эта формула дает при z = 1 значение обобщенного гипергеометрического ряда с тремя верхними и двумя нижними параметрами при условии, что один из верхних параметров является целым неположительным ЧИСЛОМ И ЧТО bi +Ь2 = СИ +0.2 + 0-3 + 1. (Если сумма нижних параметров больше суммы верхних параметров не на 1, а на 2, то формула из упр. 25 может быть использована для выражения F(ai, 0.2, аз; bi, b2j 1) через две гипергеометрические функции, удовлетворяющие тождеству Заалыпютца.) Доставшееся нам ценой большого труда соотношение из задачи 8 раздела 5.2 сводится к 1 1+х х+1, п+1, — п 1,х+2 1 = f-l)nx^x- -п-1 Эх... это всего лишь частный случай тождества Заалыпютца (5.97)) когда с = 1, так что можно было бы сберечь массу усилий, перейдя к непосредственному гипергеометрическому представлению! А как насчет задачи 7? Та сверхтрудная сумма дает формулу п+1, га—гц 1, j im+1, im+i, 2 m n целое n ^ m > 0, которая представляет собой первый случай, когда нам встретились три нижних параметра. Так что выглядит это довольно ново. Но на самом деле ничего нового здесь нет: если воспользоваться упр. 26, то левая часть может быть заменена на п, тп- -ttl га 1.-* 1 2 i-i. 2..h 2. и мы снова получим тождество Заалыпютца.
270 Биномиальные коэффициенты Что ж, еще один опыт дефляции, но одновременно еще один повод оценить силу гипергеометрических методов. Соотношения свертки из табл. 255 не обладают гипергеометрическими эквивалентами, ибо их отношения членов являются рациональными функциями от к только тогда, когда t— целое число. Равенства (5-64) и (5-65) не являются гипергеометрическими, даже когда t = 1. Но можно принять во внимание (5.62) для случая, когда t принимает небольшие целочисленные значения: r+1, —n-js) — n—is + i (r+T)/(T) lr lr-u ] !- 1 2 3"> 3 2r+2> 2 3' 3r+!> ~n> -n-is> -n-^s-h^ 'r+^r- ¦1, —n—is, —n—is + i, -n- 3b^3 1 = en s+3n\ Историческая справка: исключительная уместность применения гипергеометрических рядов к тождествам с биномиальными коэффициентами впервые была отмечена Джорджем Эндрюсом (George Andrews) в 1974 году [9, разд. 5]. Первая из этих формул вновь дает решение задачи 7, если заменить величины (г, s, тг) на (1, га — 2п — 1, п — га) соответственно. Наконец, "неожиданная" сумма (б-2о) дает нам неожиданное гипергеометрическое соотношение, которое оказывается весьма поучительным. Рассмотрим это не спеша. Сначала превратим ее в бесконечную сумму: Y_ fm+kVk = 2* k$cm UJ' Отношение членов (2m—k)! 2k/m! (m—k)! равно 2(k—m)/(k—2m), так что получается гипергеометрическое тождество cz = 2: 2m га 1, —m -2m 2 = 2 2m целое га ^ 0. (5-98) Но взгляните на нижний параметр '—2га'. Целые отрицательные числа запрещены, так что данное тождество не определено! Теперь самое время тщательно рассмотреть подобные предельные случаи, как и было обещано ранее, поскольку гипергеометрические функции в точках "вырождения" зачастую могут быть вычислены путем приближения к ним из ближайших "невырожденных" точек. Поступая так, следует быть осторожным, поскольку если пределы берутся разными способами, то и результаты могут получиться разными. Например, вот два предела, которые оказываются совершенно разными, если один
5.5 Гипергеометрические функции 271 из параметров увеличен на е: -1+6,-3 lim F . е->о V — 2+е е-чо У-2+е lim (Л I (~1+е)(-3) , (-1+е)(в)(-3)(-2) i™^ (-2+е)1! "^ (-2+е)(-1+е)2! v _ 1 _i_ ^ н <=• Н 1 _j_ с' (-2+е)(-1+е)(е)3' -f+0+i = 0; 1-f+0+0 - -i. Аналогично мы определили (_]) = 0 = lime_>.o ( It6)' это не то же самое, что lim^o (l]+e) = ^ Чтобы правильно трактовать (5.98) как предел, следует понимать, что верхний параметр —га использован для того, чтобы обратить в нуль все члены ряда 2Ik>o (riv-kO^ ПРИ k > mi это значит, что данному соотношению надлежит придать следующую более точную формулировку: 2Щ) Нш F ( \ ~т т I е^-о V — 2т+е 2Zm , целое т ^ 0. (5.99) Каждый член этого предельного соотношения вполне определен, так как множитель (— 2m)k в знаменателе не обращается в нуль до тех пор, пока к > 2т. Поэтому данный предел дает именно ту сумму (б-2о), с которой мы начали. 5.6 Гипергеометрические преобразования Теперь должно быть ясно, что база данных известных гипергеометрических представлений в аналитическом виде представляет собой полезный инструмент для суммирования биномиальных коэффициентов. Мы просто преобразуем заданную сумму к ее каноническому гипергеометрическому виду и ищем ее в таблице. Если она там есть— прекрасно, решение найдено. Если нет — ее можно добавить в базу данных, если она окажется выражаемой в аналитическом виде. Можно также включить в таблицу записи, которые гласят "эта сумма в аналитическом виде в общем случае не выражается'.' Например, сумма 2Lk<m (к) соответствует гипергеометрической функции —1 ) , целые п ^ га ^ 0, (б-100) гЛ/ 1,-тп га/ уп—т-Н которая выражается в аналитическом виде тогда и только тогда, когда га близко к 0, in или п.
272 Биномиальные коэффициенты Но это не конец истории, поскольку гипергеометрические функции подчиняются и собственным тождествам. Это означает, что каждая аналитическая запись гипергеометрической функции приводит к дополнительным аналитическим формулам и новым записям в базе данных. Например, тождества из упр. 25 и 26 говорят о том, как преобразовать одну гипергеометрическую функцию в две другие с похожими, но отличными параметрами. В свою очередь, эти функции также могут быть преобразованы. В 1797году И. Ф. Пфафф (J. F. Pfaff) [292] открыл удивительный закон отражения^ 1 (1- а,Ь с —z T^z = F а, с—b (5-ioi) который служит примером преобразования другого типа. Это формальное тождество относительно степенных рядов, если величина (— z)k/(1 — z)k+a заменена бесконечным рядом (—z)k(l + ( "|a)z+( +2+ )z2H ), полученным при разложении в ряд левой части (см. упр. 50). Этот закон можно использовать для вывода новых формул из уже известных при z ф 1. Например, формула Куммера (5-94) может быть объединена с правилом (5.101), если параметры выбраны так, что применимы оба тождества: На самом деле это не база данных, а "база знаний" сц 1 —а 1+Ъ-а а> Ъ J+b-a (b/2)! b! (b-a)^ b/2 (5.102) Теперь можно положить а = — п и перейти от данного равенства к новому тождеству относительно биномиальных коэффициентов, которое может понадобиться в один прекрасный день: L (-n)k(1+n)k 2"k k^o (1+b+n)k k! k = 2_n(b/2)!(b+n)! ШШ n+k\ /At+b+k\ k/ \2 ) V k )/\ целое n^> 0. b!(b/2+n)! Например, при n = 3 данное тождество гласит, что 4 _ 4-5 4-5-6 (5-юз) 1-3 2(4 + Ь) + 3 4(4 + Ь)(5 + Ъ) 8(4 + Ъ)(5 + Ъ)(6 + Ъ) = (b + 3)(b + 2)(b + 1) (b + 6)(b + 4)(b + 2)'
5.6 Гипергеометрические преобразования 273 В это почти невозможно поверить, но это так при всех Ъ (за исключением случаев, когда какой-нибудь из сомножителей в знаменателе обращается в нуль). Неплохо. Давайте попробуем еще? Может, нам удастся найти формулу, которой и в самом деле можно будет похвастать перед друзьями? Что даст нам закон Пфаффа, если применить его к выражению несколько странного вида (б-99)> гАе z — 2? В этом случае мы полагаем а = —т, Ъ = 1 ис = —2т + е и получаем (-1)mlimF -ггц 1 е->о V—2т+е - HmF е->-0 = lim У е->0 к^О -ггц— 2т— 1 +е —2т+е [-т)к(-2т-1+е)к 2* к! -2т+е)к . L f^i^w, к^т к У (2т)к Истерическое примечание: если у вас получается Аругой результат, см. упр. 51. поскольку ни один из предельных членов не близок к нулю. Это приводит к другой удивительной формуле, k^m m\ 2m+1 , „ч1с пт12т 2m+1-k (-2)к = (-1)m2z -1/2 т 2т т целое т ^ 0. (5-104) При га = 3, например, сумма равна 84 16 ,_7+Т_,4_-Т, а (~з ) действительно равно —j%. Когда мы рассматривали тождества с биномиальными коэффициентами и приводили их к гипергеометрическому виду, мы не придали значения соотношению (5-19)» поскольку это было соотношение между двумя суммами, а не аналитическое выражение. Однако теперь (б-19) можно рассматривать как соотношение между гипергеометрическими рядами. Если продифференцировать его п раз по у, а затем заменить к на m — п — к, то получим к^О m + r та — п — к п + к п га—п—к к _ л. у — L к^О -Г \(П + к т —п —к/ \ п -х)т"п-к(х + у)к,
274 Биномиальные коэффициенты Это приводит к следующему гипергеометрическому преобразованию: а, — п с (а- i-cY- а, -п 1 —п+а- целое (б-юб) Обратите внимание, что при z = 1 это сводится к свертке Ван- дермонда (5-93)- По-видимому, в дифференцировании что-то есть, если данный пример сколь-нибудь показателен,— оно оказалось полезным и в главе 2 при суммировании х + 2х2 + • • • + пхп. Посмотрим, что получится при дифференцировании обобщенного гипергеометрического ряда по z: ^ си,. Ъъ • )bn ^— i~k k^ i Ъ^--.Ъ^(1с—1)! k+l ^- uk+1 • • ak+1 zk m bk+ .b5.+1k! a1(a1+1)4..am(am+lgzk ?r0 bl(b,+1)k...bn(bn+1)kk! L ai ... an ai+1,...,am+1 bi+1,...,bn+1 (5.106) Параметры выносятся и увеличиваются на 1. Дифференцирование можно также применить для того, чтобы "отщипнуть" только один параметр, не трогая остальные. Для этого воспользуемся оператором д = z— , dz который дифференцирует функцию и умножает полученный результат на z. Этот оператор дает д? си,. ъь. •>CLm ¦) _ у- kak.. ¦¦<^ 1 .bk(k-1)! .bkk! Как вы произносите д? (Не знаю, как вы, a TgX называет ее 'vartheta'.) что само по себе не представляет особой ценности. Но если умножить F на один из верхних параметров, скажем, на си , и добавить
5.6 Гипергеометрические преобразования 275 ОТ, то получится 'ai,...,am (« + ai)F bi,...,bn у (k+ai)a^...a^zk k^O = L b*...b?k! ,1c .k k^O = aiF Мат+ТГа^ ...a^z1 b^... b? k! bi, •••> br При этом на 1 увеличивается только один параметр. Аналогичный трюк срабатывает и с нижними параметрами, но в этом случае они уменьшаются, а не увеличиваются: .bi,...,bn L (к+Ът-lX...a^z1 к ,к к>о Ч...Ъ?к! 4-0(bi-D?b^...bkk! = (bl-1)F(b Tb'"amb Можно объединить все эти операции и выразить одну и ту же величину двумя разными способами, сыграв математическую "шутку": (# + СИ)...(« + a m-Jr — Q-i . . . CLra г ai+1, ..., am+1 Ьь bn (« + bi -1)...(fl + bn-1)F = = (b1-1)...(bn-1)F Ьт-1, ..., bn-1 где F = F(ai,..., am; bi,..., bn; z). Ho (5.106) гласит, что верхняя строка является производной от нижней. Следовательно, обобщенная гипергеометрическая функция F удовлетворяет дифференциальному уравнению D(S+bl_|)...(*+bn_|)F = (fl+ai)...(*+am)F, (5.107) где D представляет собой оператор — dz' Это следует подтвердить примером. Давайте найдем дифференциальное уравнение, которому удовлетворяет стандартная
276 Биномиальные коэффициенты гипергеометрическая функция с двумя верхними и одним нижним параметрами F(z) = F(a>b;c;z). В соответствии с (5-107) имеем D(« + c-1)F = (? + a)(? + b)F. Что это означает в обычной записи? Ну, (d+c—1 )F— это zF'(z) + (с — 1 )F(z), а производная от этой величины дает левую часть, F'(z)+zF"(z) + (c-1)F'(z). В правой части имеем (d+a)(zF'(z)+bF(z)) - z-^(zF,(z)+bF(z)) + a(zF,(z)+bF(z)) = = zF/(z)+z2F/,(z)+bzF/(z)+azF/(z)+abF(z). Приравнивание обеих частей дает z(1 -z)F//(z) + (c-z(a + b + l))F/(z)-abF(z) = 0. (5.108) Это уравнение эквивалентно (5.107), записанному в форме произведения. Обратно, от дифференциального уравнения можно вернуться к степенному ряду. Допустим, что F(z) = Цк>0 "Ь^к— степенной ряд, удовлетворяющий уравнению (5.107). Непосредственное вычисление показывает, что tk+i = (k+ai)...(fc+am) tk (k + b1)...(k + bn)(k+l)' следовательно, функцией F(z) должна быть to F(ai,..., am; bi,..., bn; z). Мы доказали, что гипергеометрический ряд (5-7^) представляет собой единственный формальный степенной ряд, который удовлетворяет дифференциальному уравнению (5.107) и имеет постоянный член 1. Было бы неплохо, если бы гипергеометрические функции позволяли решать все на свете дифференциальные уравнения, но это далеко не так. Правая часть уравнения (5-107) всегда разлагается на сумму членов вида akZkF^k^ (z), где F^ (z) — k-я производная DkF(z); левая часть всегда разлагается на сумму членов вида (3icZk-1F^k^(z) при к > 0. Так что дифференциальное уравнение (5-Ю7) всегда принимает специальный вид zn-1(Pn-zan)F(n)(z) + --- + (|31 -zai)F'(z)-aoF(z) = 0.
5.6 Гипергеометрические преобразования 277 Функция F(z) = (1-z)T удовлетворяет d? = z(d-r)?. Это дает еще одно доказательство биномиальной теоремы. Уравнение (5-ю8) иллюстрирует это в случае п = 2. И обратно, как будет показано в упр. 6.13, любое дифференциальное уравнение данного вида может быть разложено относительно -^-оператора так, чтобы получить уравнение типа (5.107). Таким образом, это дифференциальные уравнения, решениями которых являются степенные ряды с рациональными отношениями членов. Умножение обеих частей уравнения (5-107) на z позволяет обойтись без оператора D и дает примечательное выражение с д во всех сомножителях: fl(fl+b1-1)...(a+bn-1)F = z(fl+cn)...(e+am)F. (5-109) Первый сомножитель д = (-9+1—1) слева соответствует сомножителю (к+1) в отношении членов (5-81), который, в свою очередь, соответствует к! в знаменателе к-го члена обобщенного гипергеометрического ряда. Остальные сомножители (Ф + bj — 1) соответствуют сомножителям (k + bj) в знаменателе, которые, в свою очередь, соответствуют bj0 в_(5-7б)- Справа же z соответствует zk, а (-Э + dj) соответствует аК Одно из приложений данной дифференциальной теории состоит в поиске и доказательстве новых преобразований. Например, легко убедиться в том, что гипергеометрические функции 2a, 2Ь а+Ь + ^ и a, b a+b + ^ 4z(1- удовлетворяют дифференциальному уравнению z(1 - z)F"(z) + (a + b + 1)(1 - 2z)F'(z) - 4abF(z) 0; следовательно, должно выполняться тождество Гаусса [143, уравнение 102] 2a, 2Ь а+Ь + 1 = F a, b a+b + 4z(1- (5-ио) Внимание: нельзя безопасно использовать (5-но) в случае \z\ > 1/2, если только обе части соотношения не полиномы; см. упр. 53. В частности, 2a, 2Ь а+Ь + ^ 2I=F a, b a+b + ^ (б-iii) всякий раз, когда обе бесконечные суммы сходятся. И в самом деле, эти суммы всегда сходятся, за исключением вырожденного случая, когда a + b + j представляет собой неположительное целое число. Каждое новое тождество для гипергеометрических функций влечет за собой новое тождество для биномиальных коэффици-
278 Биномиальные коэффициенты ентов, и последнее соотношение не является исключением. Рассмотрим сумму j- /m-k\/m + n + 1\/-l\ ^ целыет^и^0. к^т ч 7 ч / \ / Ее члены отличны от нуля при 0 ^ к ^ та — тц и, соблюдая, как и ранее, известную осторожность при переходе к пределу, эту сумму можно выразить в гипергеометрическом виде: Г /та\ /п—т, —п—т—1+осе е->-о \п/ V —та-Ье 2 Величина а не влияет на предел, поскольку неположительный верхний параметр п — та обрывает сумму раньше. Можно положить ос = 2, так что становится применимым (5.111). Теперь данный предел можно вычислить, поскольку правая часть этого соотношения представляет собой частный случай (б-92)- Результат может быть выражен в упрощенном виде ^- /та—к\ /та-Иг+1 \ (—1Ч k^m u ) \ к ) V 2 / та+тг/2\ целые = 2П т[т+п четное, . ^л 5-пз как показано в упр. 54. Например, если та = 5 и п = 2, получаем (!)(2) - G)(?)/2+ (1)0/4- (22)©/8 = Ю-24Н-21 -7 = 0; если же та = 4 и тг = 2, то обе части равны |. Можно также указать случаи, когда соотношение (б-но) при z = — 1 приводит к суммам биномиальных коэффициентов, но эти суммы, честно говоря, жутковаты. Если положить а = \ — у иЬ = —п, то получается монстроидальная формула 1_2 3 3 п, —2п 2_4 -..-м'Лт -8 з з'1- / \ 3 3' Эти гипергеометрические функции являются невырожденными полиномами, если п ф 2 (mod 3), а их параметры подбираются так искусно, что левую часть выражения можно вычислить по формуле (5-94)- Так мы приходим к умопомрачительному результату и: _2 п ) I \ п '2п\ //fn-з целое п ^ 0, п ф 2 (mod 3). (б-нз)
5.6 Гипергеометрические преобразования 279 Единственная польза (5.113) — демонстрация существования бесполезных тождеств. Это самое поразительное тождество с биномиальными коэффициентами, которое мы видели. Даже малые случаи такого тождества недостаточно просты для проверки вручную. (Оказывается, обе части в действительности дают Ц- при п = 3.) Это тождество совершенно бесполезно, поскольку наверняка не встретится ни в одной практической задаче. Таково наше представление о гипергеометрических представлениях. Мы убедились в том, что гипергеометрические ряды обеспечивают нас высоконаучным способом обращения с суммами биномиальных коэффициентов. Масса дополнительной информации содержится в классической книге Бейли (Bailey) [18] и ее продолжении Гаспера (Gasper) и Рахмана (Rahman) [141]. 5.7 Частичные гипергеометрические суммы Большинство сумм в этой главе вычислялось по всему промежутку изменения индекса k J> 0, но иногда нам удавалось найти аналитическое выражение, работающее и в случае интервала общего вида а ^ к < Ъ. Например, из (5.16) известно, что k<m х 7 \т— 1 TL-1 т-1 целое т. (5-114) Теория из главы 2 обеспечивает нас замечательным способом трактовки подобных формул: если f(k) = Ag(k) = g(k + 1) — g(k), то мы условились писать, что Y. f М 6k = д(к) + С, и ?_\к)Ьк = g(k)\ba = g(b)-g(a). Кроме того, если а и b— целые числа и а <$ Ъ, то Y_\k)bk = Y_ fM = 9(b)-д(а). а^к<Ь Поэтому тождество (5-114) соответствует формуле вычисления неопределенных сумм и формуле вычисления разностей + С л (-1Г П (-D к+1 П+1 к+1 Начав с функции g(k), можно легко вычислить Ад (к) = f(k)— функцию, суммой которой будет g(k) + С. Но гораздо труднее, начав с f(k), найти ее неопределенную сумму
280 Биномиальные коэффициенты ^f(k) 6k = g(k) + С; функция g может вообще не выражаться в аналитическом виде. Например, похоже, не существует простой формы записи для Y. (к) ^; в противном случае мы могли бы вычислять суммы типа Х.к<п/з (к)' пеРеА которыми мы беспомощны. Но, может быть, все же существует простая формула для суммы Y. (к) 5к, которую мы просто пока что не нашли? Как мы можем быть уверены в том, что ее не существует? В 1977 году Р. У. Госпер (R.W.Gosper) [154] открыл замечательный способ вычисления неопределенных сумм ]Г f (k) 6к = д(к) + С, когда f и g принадлежат обширному классу функций, именуемых гипергеометрическими членами. Обозначим через ab...,am,\ = a\al^ b,,...,bj Л Ък...Ьк k! (Ь Ь) k-й член гипергеометрического ряда F(ai,..., am; bi,... > bn; z). Будем рассматривать ?(<!*[,... }ат]Ъ1У.. .^b^z)]*: как функцию от к, а не от z. Во многих случаях оказывается, что существуют параметры с, Ai, ..., Ам, Bi, ..., В^ и Z, такие, что у /ab...,am. \ 5k = cF(rAb-,AM| \ bb ..., br к при заданных ai, ..., am, bi, ..., bn и z. Будем говорить, что заданная функция F(ai,..., am; bi,..., bn; z)k суммируема в гипергеометрических членах, если такие константы с, Ai, ..., Ам, В], ..., Bn, Z существуют. Алгоритм Госпера либо находит такие константы, либо доказывает, что они не существуют. В общем случае мы говорим, что t(k) представляет собой гипер геометрический член, если t(k+1)/t(k) представляет собой рациональную функцию от к, не тождественную нулю. Это по сути означает, что t(k) кратно с постоянным множителем члену вида (5.115)- (Здесь возникают некоторые технические детали, связанные с нулями, поскольку мы бы хотели, чтобы t(k) имело смысл при отрицательных к, а также когда одно или несколько значений b в (5.115) были нулевыми или отрицательными целыми числами. Строго говоря, наиболее общий гипергеометрический член получается путем умножения (5.115) на ненулевую константу и некоторую степень 0 с последующим сокращением нулей в числителе и знаменателе. Это общее правило поясняется примерами из упр. 12.) Предположим, мы хотим найти ^Г t(k) 6k, где t(k)— гипергеометрический член. Алгоритм Госпера состоит из двух шагов, каждый из которых достаточно прямолинеен. Шаг 1 состоит
5.7 Частичные гипергеометрические суммы 281 в том, чтобы выразить отношение членов в специальной форме Делимость полиномов аналогична делимости целых чисел. Например, (k+a)\q(k) означает, что отношение q(k)/(k + a) представляет собой полином. Легко видеть, что (k+a)\q(k) тогда и только тогда, когда q(-a)=0. t(kH-l) _ p(k+1) q(k) t(k) p(k) r(k+1)' (5-ii7) где p, q и r— полиномы, подчиняющиеся следующему условию: (k+a)\q(k) и (k+|3)\r(k) =Ф ==> a — (3 не положительное целое число. (5-118) Это условие легко достижимо: начнем с того, что предварительно положим р(к) = 1, а q(k) и г (к + 1) положим равными числителю и знаменателю отношения членов, и разложим их на линейные множители. Например, если t(k) имеет вид (5-115)1 то мы начинаем с разложения q(k) = (к + ai)... (к + am)z и г (к) = (k+bi — 1)... (k+bn — 1 )к. Затем мы проверяем, не нарушено ли условие (5.118). Если q и г имеют множители (к + ос) и (к+ (3), где a — (3 = N > 0, мы выделяем их из q и г и заменяем р(к) на р(к)(к+а-1} N-1 p(k)(k+a-1)(k+a-2)...(k+(3+1). (5.119) Новые р, q и г по-прежнему удовлетворяют (5.117)» и этот процесс можно повторять до тех пор, пока не будет выполнено условие (5.118). Вскоре мы увидим, почему (5.118) так важно. Шаг 2 алгоритма Госпера завершает работу— он состоит в поиске гипергеометрического члена Т(к), такого, что t(k) = T(k+1)-T(k), (5.120) В упр. 55 поясняется, почему нам хотелось бы найти эту загадочную подстановку. если это возможно. Однако совсем не очевидно, как это сделать. Перед тем как двигаться дальше, требуется разработать какую- то теорию. Госпер путем анализа множества частных случаев заметил, что разумно записать неизвестную функцию Т(к) в виде Т(к) r(k)s(k)t(k) Р(1с) (5-i2i) где s(k)— некая секретная функция, которую надо каким-то образом найти. Подставив (5.121) в (5.120) и применив (5.117)) получаем t(k) T(k + 1)s(k+l)t(k + 1) T(k)s(k)t(k) P(k+1) g(k)s(k+1)t(k) P(k) pflc) r(k)s(k)t(k) pOO '
282 Биномиальные коэффициенты так что должно выполняться p(k) = q(k)s(k+1)-r(k)s(k). (5.122) Если мы сможем найти функцию s(k), удовлетворяющую этому фундаментальному рекуррентному соотношению, то мы найдем и Y. ~t(k) 6k. Если же не сможем, то Т не существует. Мы предполагаем, что Т(к)— гипергеометрический член, а это означает, что Т(к+ 1)/Т(к) представляет собой рациональную функцию от к. Таким образом, согласно (5.121) и (5.120), r(k)s(k)/p(k) — T(k)/(T(k+ 1) — T(k))— рациональная функция от к, а сама функция s(k) должна быть отношением полиномов: s(k) = f(k)/g(k). Но на самом деле можно доказать, что функция s(k) сама является полиномом. Действительно, если g(k)— не константа и если f (к) и д(к) не имеют общих множителей, положим N равным наибольшему целому числу, такому, что и (к+(3), и (k+(3+N —1) входят как сомножители в g(k) при некотором комплексном числе |3. Величина N положительна, поскольку N = 1 всегда удовлетворяет данному условию. Уравнение (5.122) можно переписать как p(k)g(k+1)g(k) = q(k)f(k+1)g(k)-r(k)g(k+1)f(k), и если мы положим к = — (3 и к = — (3 — N, то получим r(-P)g(l-P)f(-p) = 0 = q(-p-N)f(1-p-N)g(-p-N). Теперь f(—(3) ^Onffl — (3 — N) ^ 0, потому что f и дне имеют общих корней. К тому же д(1 — (3) ф 0 и д(—(3 — N) ^ О, так как в противном случае функция д(к) содержала бы множитель (к + (3 — 1) или (к + (3 + N), что противоречит предположению о максимальности N. Поэтому r(-(3) = q(-P-N) 0. Но это противоречит условию (5.118). Следовательно, функция s(k) должна быть полиномом. Наша задача в настоящее время— найти полином s(k), удовлетворяющий (5.122), если p(k), q(k) и г(к)— заданные полиномы, или доказать, что такой полином не существует. Это легко сделать, если s(k) имеет какую-либо определенную степень d, поскольку можно записать Теперь понятно: Госперу потребовалось условие (5-и8), чтобы это доказательство работало. s(k) ocdkd + ad_ikd_1 +--- + a0> cxd ф 0, (5-123)
5.7 Частичные гипергеометрические суммы 283 с неизвестными коэффициентами (ад,..., схо) и подставить данное выражение в базовое рекуррентное соотношение (5.122). Полином s(k) будет удовлетворять этому рекуррентному соотношению тогда и только тогда, когда все <х удовлетворяют линейным уравнениям, получаемым в результате приравнивания коэффициентов при каждой степени к в (5.122). Но как определить степень s? Оказывается, что в действительности имеется не более двух возможностей. Можно переписать (5-122) в виде 2p(k) = Q(k)(s(k+1)+s(k))+R(k)(s(k+1)-s(k)), (5.124) где Q(k) = q(k)-r(k) и R(k) = q(k)+r(k). Если s(k) имеет степень d, то сумма s(k+ 1) + s(k) = 2aakd Н также имеет степень d, в то время как разность s(k+ 1) — s(k) = As(k) = daakd_1 H имеет степень d— 1. (Можно считать, что нулевой полином имеет степень —1.) Обозначим через deg(P) степень полинома Р. Если deg(Q) ^ deg(R), то степень правой части равенства (5-124)— deg(Q) + d, так что мы должны получить d = deg(p) — deg(Q). С другой стороны, если deg(Q) < deg(R) = d', то можно записать Q(k) = А^'""1 Н и R(k) = Akd' Н , где Л ф 0. Правая часть уравнения (5-124) имеет вид (2A/ad + Adad)kd+d/-1 + ••• . Итак, вот каковы две возможности: либо 2A'-|-Ad^0Hd = deg(p) - deg(R) + 1, либо 2А' + Ad = 0 и d > deg(p) - deg(R) + 1. Второй случай требует проверки только тогда, когда —Ih'fX является целым числом d, большим, чем deg(p) — deg(R) + 1. Теперь у нас достаточно фактов для того, чтобы выполнить второй шаг алгоритма Госпера: испытав не более двух значений d, мы можем найти s(k), если только уравнение (5.122) имеет полиномиальное решение. Если s(k) существует, то можно подставить его в (5.121) и получить Т. Если же нет, то тем самым доказано, что t(k) не суммируется в гипергеометрических членах. Пора рассмотреть конкретный пример: попробуем вычислить частичную сумму (5.114)- Метод Госпера должен быть в состоянии вывести величину для любого фиксированного п, так что мы будем искать сумму *<*>-©'-»" = &
284 Биномиальные коэффициенты Шаг 1 состоит в представлении отношения членов в требуемом виде (5.117); t(k+1) = k-n = p(k+1)q(k) t(k) k+1 p(k)r(k+1)' т.е. мы просто выбираем р(к) = 1, q(k) — к — п и г (к) = к. Этот выбор р, q и г удовлетворяет (5.118), если только п не является отрицательным целым числом; предположим, что п таковым не является. Теперь перейдем к шагу 2. Согласно (5-124) мы должны рассмотреть полиномы Q(k) = — п и R(k) = 2k — п. Поскольку R имеет большую степень, чем Q, нам надо рассмотреть два случая. Либо d = deg(p) — deg(R) + 1, что равно О, либо d — —1К'/\ где Л' = — п иА = 2; следовательно, d = п. Первый случай лучше, поскольку не требует, чтобы п было положительным целым числом, так что займемся сначала именно им. Нам надо будет рассмотреть вторую возможность для d, только если первый случай не приведет к успеху. В предположении, что d = 0, значение s(k) равно просто осо, и уравнение (5-122) сводится к 1 = (к — п)осо — косо • Следовательно, мы выбираем olq = —1/п. Это удовлетворяет требуемым условиям и дает точно тот результат, который мы рассчитывали подтвердить: Почему не r(k) -k + 1? Л, понятно... т(Ю r(k)s(k)t(k) к-( — п п-1 к-1 п к -1)ы (-1)к = , если пф 0. Если применить тот же метод к вычислению неопределенной суммы Y- (к) ^, без (—1)к, то все будет почти таким же, однако функция q(k) будет равна п — к; следовательно, Q(k) = п — 2к будет иметь степень, большую, чем степень R(k) = п, и мы придем к заключению, что d имеет невозможное значение deg(p)—deg(Q) = — 1. (Полином s(k) не может иметь отрицательную степень, так как не может быть нулевым.) Таким образом, функция (?) не суммируется в гипергеометрических членах. Однако раз уж мы избавились от невозможного, все оставшееся — каким бы невероятным оно ни казалось — должно быть
5.7 Частичные гипергеометрические суммы 285 "Превосходно, Холмс!" "Элементарно, мой дорогой Ватсон!" истинным (как утверждал Ш.Холмс (S.Holmes) [83]). Когда мы определяли р, q и г на шаге 1, то решили игнорировать возможность того, что п может быть отрицательным целым числом. А что если это так? Давайте положим п = —N, где N положительно. Тогда отношение членов для ]Г (?) 6 к есть t(k+1] t(k) -(k+N) р(к+1) q(k) (lc+1) p(k) r(k+1) и согласно (5.119) его следует представлять при помощи р(к) = (к + 1 )N_1, q(k) = —1, г (к) = 1. Шаг 2 алгоритма Госпера говорит нам о том, что мы должны поискать полином s(k) степени d = N — 1 (а вдруг нам повезет?). Например, при N = 2 рекуррентное соотношение (5-122) говорит о том, что нам надо решить уравнение к+1 = -((к+1)ат+о0)-(к(х1+ао). Приравнивание коэффициентов при к и 1 показывает, что 1 = —oii — &i; 1 = —<*i — осо — схо; следовательно, s(k) = — ^k— ^ является решением, а Т(к) = 1.(-1к- i) • (-к2) = (-1 ,*-i2k+1 к+1 1 ' 4 Может ли это быть искомой суммой? Да, все получается: (-D k2k + 3 (-D k-l 2k+ 1 (-inic+i: Кстати, можно записать формулу суммирования и в другом виде, с верхним пределом: k<m (-1 vk-l 2k+1 i™ 4 lo -l)m"1 / 1 = H) m-1 m + m T целое m ^ 0. Такое представление скрывает тот факт, что биномиальный коэффициент ("^ ) является суммируемым в гипергеометрических членах, так как [га/2] не является гипергеометрическим членом. (См. упр. 12.)
286 Биномиальные коэффициенты Со знаменателем (5-121) могут возникнуть проблемы, если р(1с) — 0 для некоторого целого к. Упр. 97 помогает понять, что можно сделать в такой ситуации. Заметим, что нет никакой необходимости собирать каталог гипергеометрических членов, суммируемых в неопределенном виде, аналогичный базе данных определенных гипергеометрических сумм, о которой мы говорили ранее в этой главе, поскольку алгоритм Госпера предоставляет быстрый регулярный метод, работающий во всех суммируемых случаях. Марко Петковшек (Marko Petkovsek) [291] нашел красивый способ обобщения алгоритма Госпера на более сложные задачи обращения. Он показал, как найти все гипергеометрические члены Т(1с), удовлетворяющие рекуррентному соотношению 1-го порядка t(k) = pl(ic)T(k+l)+.-.+pi(k)T(k+1)+po(lc)T(lc), (5.125) если даны гипергеометрический член t(k) и полиномы pi(k), ..., pi (к), р0(к). 5.8 Механическое суммирование Алгоритм Госпера, замечательный сам по себе, находит аналитический вид только для некоторых биномиальных сумм из числа встречающихся на практике. Но мы не должны останавливаться на достигнутом. Дорон Зайльбергер (Doron Zeilberger) [384] показал, как расширить алгоритм Госпера так, чтобы он стал еще замечательнее и позволял справиться в еще большем количестве случаев. Расширение Зайльбергера позволяет не только находить частичные суммы, но и выполнять суммирование по всем к, так что у нас появляется альтернатива гипергеометрическим методам из разделов 5.5 и 5.6. Более того, как и в оригинальном методе Госпера, вычисления могут выполняться компьютером практически механически— не требуются ни рассуждения, ни удача. Основная идея заключается в том, чтобы рассматривать наше слагаемое как функцию t(u, к) от двух переменных пик. (В алгоритме Госпера мы писали просто t(k).) Если неопределенная сумма t(n, к) по к не выражается в гипергеометричес- ких членах— и давайте считать, что так оно и есть, исключение составляют лишь немногие суммы,— то, как заметил Зайльбергер, часто удается так видоизменить -Ь(гцк) (используя пионерскую идею 1940-х годов сестры Селины Фейсенмайер (Celine Fasenmyer) [382]), чтобы получить новые слагаемые, которые уже
5.8 Механическое суммирование 287 суммируются в неопределенном виде. Например, на практике зачастую (30(71)1(71, k) + |3i (n)t(n + 1,к) может быть неопределенно просуммировано по к для подходящих полиномов (Зо(п) и Р1 (п). А вычислив сумму по к, мы получаем рекуррентное соотношение по п, которое и решает нашу задачу. Чтобы познакомиться с общим подходом, начнем с рассмотрения простого случая. Предположим, что мы забыли биномиальную теорему и хотим вычислить ?^k (k)zk- Как получить А страница 222 ответ, если мы не ясновидящие и никаких догадок у нас нет? Ра- вырвана из книги. нее в этой главе, например, в задаче 3 из раздела 5.2, мы научились заменять (?) на (п^ ) + (?".,) и легко получать требуемый результат. Но есть и более систематический путь. Пусть t(n, к) = (?)zk— величина, которую мы хотим просуммировать. Алгоритм Госпера говорит нам, что мы не можем вычислить частные суммы Х1к<т^(п>^) в гипергеометрических членах для произвольного п, за исключением случая z = — 1. Так что давайте вместо этого рассмотрим более общее слагаемое t(n,k) = &0{n)t{nyk) + fa{n)t{n+lyk). (5.126) Попробуем найти значения (Зо(п) и Pi (п)> ПРИ которых алгоритм Госпера успешно сработает. Во-первых, мы хотели бы упростить (5.126) при помощи соотношения между t(n + 1,k) и 1:(гцк) для исключения t(n + 1, к) из выражения. Поскольку t(n + 1,k) _ (n + 1)izk (n-k)!k! _ t(n,k) " (n + 1-k)!k! n!zk = n+1 n+1 -k' имеем t(n,k) t(n,k) = p(n,k)- n+1-k' где p(n,k) = (n+1-k)(30(n) +(71+1)13! (n). Теперь применим алгоритм Госпера к ?(гцк) с фиксированным п. Сначала запишем t(n,k + 1) _ p(n,k+1) q(n,k) t(n,k) " p(n,k) т(п,к+1)' (5"127j как в (5.117). Метод Госпера нашел бы такое представление, начав с р^к) = 1, но в расширении Зайльбергера лучше начать с р(гц к) = р(п,к). Заметим, что если положить t(n,k) =
288 Биномиальные коэффициенты t(n,k)/p(n,k) ир(п,к) = p(n,k)/p(n,к), то уравнение (5-127) будет эквивалентно t(n,k+1) _ p(n,k+1) q(n,k) t(n,k) p(n>k) r(n,k+V (5.128) Таким образом, мы можем найти р, q иг, удовлетворяющие (5.127), если найдем р, q и г, удовлетворяющие (5.128), начав с р(гц к) = 1. Это упрощает жизнь, потому что t(n, к) не включает неизвестные величины (Зо(тг) и |3i (п), которые входят в ?(тг, к). В нашем случае t(n,k) = t(n,k)/(n+1 —к) = п\zk/{п + 1 —к)!к!, так что t(n,k+1) (n+1-k)z t(n,k) к+1 и мы можем взять q(n,k) = (тг + 1 — k)z и г(гцк) = к. Предполагается, что эти полиномы от к удовлетворяют условию (5.118). Если же нет, то мы должны удалить из q и г некоторые множители и включить соответствующие множители (5.119) в Р(п>^)| но это надо делать, только когда величина ос— (3 в (5.118) представляет собой положительную целую константу, не зависящую от п, поскольку мы хотим, чтобы наши вычисления были справедливы для произвольного п. (Формулы, которые мы выведем, в действительности будут справедливы, даже когда п и к не являются целыми (с применением обобщенных факториалов (5-83))-) Наш начальный выбор q и г удовлетворяет в указанном смысле условию (5.118), так что можно переходить прямо к шагу 2 алгоритма Госпера. Мы хотим решить уравнение, аналогичное (5.122), с использованием (5.127) вместо (5.117)- Таким образом, мы хотим решить р(гцк) = q(n)k)s(n,k+ 1) — r(n>k)s(n>k) (5-129) Теперь я уже помню, почему г(п, к) не равно к + 1. относительно секретного полинома s(n,k) = <x.d[n)kd + ctd^[n)kd-} + --- + a0(n). (5.130) (Коэффициенты s рассматриваются не как константы, а как функции от п.) В нашем случае уравнение (5-129) имеет вид (п+1-к)Ро(п)+ (11+1)13! (п) = = (п+ 1 — k)zs(n,k+ 1) — ks(n,k), и мы рассматриваем его как полиномиальное уравнение по к с коэффициентами, которые представляют собой функции от п. Как
5.8 Механическое суммирование 289 и ранее, находим степень d полинома s, рассматривая (^(гцк) = Функция deg(Q) q(n,k) -r(n,k) и R(n,k) = q(n,k) +r(n,k). Поскольку deg(Q) = означает степень deg(R) = 1 (в предположении z ф ±1), имеем d = deg(p) — по k; п считается deg(Q) =0и s(n,k) = oco(n) не зависит от к. Наше уравнение константой. превращается в (n+1-k)[30M+(n+1)Mn) = (n+1-k)za0(u)-k(Xo(n); приравнивая коэффициенты при равных степенях к, мы получаем эквивалентную систему уравнений, не содержащую к: (п + 1) (Зо(п) + (п + 1) (Зт (п) - (п + 1 )zoo(n)= 0, -Ро(п) + (z+1)ao(n)=0. Следовательно, мы имеем решение (5-129) с Ро(п) = z+1, РНп) = -1, ао(п) = s(n,k) = 1. (По случайному совпадению п исчезло.) Чисто механическим методом мы установили, что t(n,k) = (z-f-1 )t(n, k) — t(n+1, k) суммируется в гипергеометрических членах. Другими словами, t(n,k) = T(n,k+1)-T(n,k), (5.131) где 7(11, к) представляет собой гипергеометрический член относительно к. Чему равно 7(гцк)? В соответствии с (5.121) и (5-128) имеем г(гц к) s(n, к) t(n, к) _ 7(гцк) = -—— = r(n,k)s(n,k)t(n,k), (5-132) pin, к) поскольку р(гцк) = 1. (На практике р(тцк) почти всегда оказывается равным 1.) Следовательно, ™ = ^Ч".ч - ^ь(:у - („:,)•'• Все получается— равенство (5.131) истинно: n\ v Л1+1\ k /V\ к+1 ( п Но в действительности нам не требуется точно знать 7(11, к), поскольку мы собираемся выполнять суммирование 1:(гцк) по всем целым к. Все, что нам надо знать,— это то, что 7(гцк) не равно нулю только для конечного множества значений к, когда
290 Биномиальные коэффициенты п— произвольное заданное неотрицательное целое число. Тогда сумма Т(гц к + 1) — Т(гц к) по всем к должна телескопически свернуться в 0. Пусть Sn = ^к"Ь(гцк) = 2Ik (?)zk; это сумма, с которой мы начинали и теперь готовы вычислить ее, поскольку уже много знаем о t(n,к). При помощи процедуры Госпера-Зайльбергера установлено, что ^((z+1)t(n,k)-t(n+1,k)) = 0. Но эта сумма равна (z+1) Ит^гцк) — ^2к t(n+1, к) = (z+1)ST Sn+i. Таким образом, имеем Sn+1 = (z+1)Sr (5.133) Ага! Мы знаем, как решать это рекуррентное соотношение, если нам известно So- Очевидно, однако, что So = 1. Следовательно, мы заключаем, что Sn = (z + 1 )п для всех целых n ^ 0. QED Посмотрим еще раз на проделанные вычисления и подытожим наши действия в виде, применимом и для других слагаемых t(n,k). Алгоритм Госпера-Зайльбергера (считая, что t(n,k) задано) можно сформулировать следующим образом. 0 Положим I := 0. (Мы будем искать рекуррентное соотношение по п порядка I.) 1 Пусть{(п,к) = Po(n)t(n,k) + .-- + (3l(n)t(TH-l,k),rAe |30(n), ..., |3i(n)— неизвестные функции. Используя свойства t(n,k), найдем p(n,k)— линейную комбинацию |Зо(п), ..., Pi(n), коэффициентами которой являются полиномы от п и к, такую, что t(n,k) может быть записана в виде р(п, к)"Е(гцк), где t(n, к) представляет собой гипергеометрический член от к. Найдем полиномы р(гцк), q(n,k), г(гцк), так чтобы отношение членов t(n, к) выражалось в виде (5.128) и при этом q(n,k) и г(гцк) удовлетворяли условию Госпера (5.118). Положим р(гц к) = p(n,k)p(n,k). 2, а Положим dq> := deg(q — г), cIr := deg(q + г) и d •= i deg^ ~ dQ> если dQ ^ dR; \ deg(p) - dR + 1 > если dQ < dR. 2, б Если d ^ 0, то определим s[n, к), как в (5-13°)» и рассмотрим линейные уравнения относительно осо, ..., ад, |Зо> ... Pi, получаемые приравниванием коэффициентов при степенях к в основном уравнении (5.129). Если эти уравнения имеют На самом деле lim Т(тг,к) =0 к—>оо при \z\ < 1 и произвольном комплексном п. Поэтому (5.133) справедливо для всех п, и, в частности, Sn = (z+m когда п — отрицательное целое число.
5.8 Механическое суммирование 291 решение, в котором все (Зо, ..., Pi не равны одновременно нулю, то переходим к шагу 4. В противном случае, если cIq < cLr и если —1К'/\ представляет собой целое число, большее d (где Л— коэффициент при kdR в q + г, а А' — коэффициент при kdR_1 в q — г), положим d := —2Л'/А и повторим шаг 2,6. 3 (Слагаемое {(гцк) не суммируется в гипергеометрических членах.) Увеличим I на 1 и вернемся к шагу 1. 4 (Успех.) ПоложимТ(гцk) := r(rL>k)s(rL)k):t(n>k)/p(n>k). Алгоритм нашел, что t(n,к) = Т(гцк + 1) — Т(гцк). Ниже мы докажем, что этот алгоритм успешно завершается для всех t(n>k), принадлежащих большому классу выражений, именуемых подходящими членами. Биномиальную теорему можно вывести многими способами, так что наш первый пример применения алгоритма Госпера- Зайльбергера в большей степени дидактичен, чем впечатляющ. Давайте теперь попробуем поработать со сверткой Вандермонда. Смогут ли Госпер и Зайльбергер алгоритмически вывести, что Ик (к) (п-к) имеет простой вид? Алгоритм начинается с I = О, что по сути представляет собой повторение исходного алгоритма Госпера. Мы пытаемся проверить, суммируется ли (?) ( ^ к) в гипергеометрических членах. Небольшой сюрприз: это слагаемое суммируется, если а + b — некоторое специальное неотрицательное целое число (см. упр. 94). Но нас интересуют произвольные а и Ь, и алгоритм быстро обнаруживает, что неопределенная сумма в общем случае гипергеометрическим членом не является. Так что I увеличивается с 0 до 1, и алгоритм теперь пробует t(n,k) = |Зо(п)1;(гцк) + (3i(n)t(n + 1,к). На следующем шаге, как и при выводе биномиальной теоремы, запишем t(n,k) = p(n,k)t(n,k), где р(п,к) получается путем сокращения дробей в t(n+1, k)/t(TL, к). В этом случае— мы настоятельно рекомендуем читателю повторить все вычисления на листе бумаги (они не такие страшные, как кажется на первый взгляд) — все происходит почти так же, как и ранее, но теперь с pin, к) = (n+1-k)3o(n)+(b-n+k)Pi(n) = р(п,к), t(n,k) - t(n,k)/(n+1-k) = a!b!/(a-k)!k!(b-u+k)!(n+1-k)!, q(n,k) = (n+1-k)(a-k), r(n,k) = (b-n+k)k. Шаг 2, а находит, что deg(q—г) < deg(q+r) и d = deg(p)—deg(q + r) + 1 = О, так что s[ny k) опять не зависит от к. Фундаментальное уравнение Госпера (5.129) эквивалентно системе двух уравнений
292 Биномиальные коэффициенты от трех неизвестных (n+1)Mn) + (b-u)|3i(^) -(n+l)aao(n)=0, -Po(n) +(31(n) + (a + b + l)a0(n)=0) которая имеет решение (30(п) = a + b-n, Pi(n) =—11—1, осо(п) = 1. Мы заключаем, что (a + b — n)t(Ti,k) — (n+1)t(n+1,к) суммируется по к; следовательно, если Sn = ]Гк (?) (n-к)' то имеет место рекуррентное соотношение Этг+1 a + b — п п+1 Таким образом, Sn = (a^ ), поскольку So = 1. Замечательно! А что можно сказать о тождестве Заалыпютца (5.28) с тремя биномиальными коэффициентами? Доказательство (5.28) в упр. 43 интересно, но требует определенного озарения. Превращая искусство в науку, мы хотим заменить озарение освещением, т.е. методичной работой в поте лица. Давайте посмотрим, сможет ли метод Госпера-Зайльбергера обнаружить и доказать (5.28) чисто механическим путем. Для удобства выполним подстановки m = b + d, n = a, r = a + b + c + d, s = a + b + с, так что (5.28) принимает более симметричный вид ^ (a + b + c + d + k)! (a-k)!(b-k)!(c + k)!(d + k)!k! (a + b + c + d)!(a + b + c)!(a + b + d)! a! b! (a + c)! (a + d)! (b + c)! (b + d)! (5.134) Чтобы сумма была конечной, будем полагать, что либо а, либо b— неотрицательное целое число. Положим t(n,k) = (n + b + c + d + k)!/(n-k)!(b-k)!(c + k)!(d + k)!k! и!(гцк) = М^Н(гцк) + (Зт (™Н(п+1,k). Двигаясь по хорошо известному пути, положим Р(гцк) t(n,k) q(n,k) г(п, к) (n+l-kJPoW+Cn+l+b+c+d+kJpnn) - рКк), t(n, к) _ (n+b+c+d+k)! n+1-k " (n+1-k)! (b-k)! (c+k)! (d+k)! k! ' (n+b+c+d+k+1) (n+1 -k) (b-k), (c+k)(d+k)k и попытаемся решить (5.129) относительно s(n,k). Снова оказывается, что deg(q — г) < deg(q + г), но в этот раз deg(p) — Принципиально важно то, что меток Госпера-Зайльбергера всегда приводит к линейным уравнениям относительно неизвестных а и (3, так как левая часть (5-12Q) линейна относительно (3, а правая часть — относительно ос. Единственная немеханическая часть работы — выбрать, какой параметр назвать п.
5.8 Механическое суммирование 293 Обратите внимание, что Л' не является старшим коэффициентом Q несмотря на то, что Л — старший коэффициент R. Число Л' представляет собой коэффициент при kdeg(RVl BQ deg(q + г) + 1 = — 1, так что здесь мы, кажется, застопорились. Однако шаг 2, б предоставляет еще один важный выбор для степени s— d = —1К'/Х\ давайте испробуем его. Здесь Rfn^k) = q(n, k) +r{n, k) = 2k3 H , так что Л = 2, в то время как полином Q(n>k) = q(n> к)— г(гц к) каким-то чудом имеет степень 1 относительно к— коэффициенты при к2 сокращаются! Таким образом, Л7 = 0; метод Госпера позволяет взять d = 0zs(n,k) = схо(п). Уравнения, которые предстоит решить, имеют вид (n+1)Po(n)+(n+1+b+c+d)P!(n)- -(n+1)(rH-1+b+c+d)ba0(ri) = 0, -PoW+PHn)- -((n+1)b-(n+l+b)(n+H-b+c+d)-cd)a0(n) = 0; Пот течет, а тождество вытекает. и мы находим РоЫ = (n+1 +b + c)(n+1 +b + d)(n+1 +b + c + d), Pi(n) = -(n+l)(n+l + c)(n+1+d)> ao(n) = 2n + 2 + b + c + d, пролив совсем немного пота. Отсюда немедленно вытекает тождество (5-134)- Аналогичное доказательство (5.134) можно получить при работе с n = d вместо п = а. (См. упр. 99.) Подход Госпера-Зайльбергера помогает вычислять не только неопределенные суммы по всем к, но и определенные суммы по ограниченному диапазону. Например, рассмотрим сумму j-fn + lcy к=0 (5-135) При z = j мы получили "неожиданный" результат (б-2о); может быть, для Госпера и Зайльбергера здесь нет ничего неожиданного? Обозначив t(n,k) = (n?k)zk, получим р(п,к) - (n + IJPoW + fn + l+kJPHn) = р(п,к), t(n,k) = t(n,k)/(n + 1) = (n + k)!zk/1c!(n+1)!, q(n,k) = (n+1 +k)z, r(n,k) = к и deg(s) = deg(p) — deg(q — r) =0. Решением уравнения (5.129) будет Po(tl) = 1, Pi(n) = z— 1, s(u,k) = 1. Таким образом мы находим t(n, k) + (z - 1 )t(n + 1, k) = T(n, k + 1) - T(n, k), (5-136)
294 Биномиальные коэффициенты где Т(гцк) = r(rL)k)s(n>k)t(n>k)/p(rL>k) = (?^)zk. Теперь можно просуммировать (б-Э-Зб) АЛЯ 0 ^ к ^ п + 1 и получить Sn(z)+t(n,nH-1)H-(z-l)Sn+1(z) = Т(гцп+2)-Т(гц0) = Но t(n,n+ 1) = (^Jz^1 = (2n+1)zn+1, так что Sn+1(z) = ^—z (sn(z) + (1 -Iz)^^^ . (5.137) Сразу ясно, что случай z = \ — частный и что Sn+i (\) — 2Sn (\). Более того, можно упростить рекуррентное соотношение (5-137) путем умножения обеих частей на суммирующий множитель (1 — z)n+1; это приводит к общему тождеству k=0 Ч J k=1 Ч J которое мало кто мог ожидать до появления Госпера с Зайльбер- гером. Сейчас же получение таких тождеств— чисто рутинная работа. А что можно сказать насчет аналогичной суммы Sn(z) = L(nvky> (5-139) k=0 ^ ' которая встретилась нам в (б-74)? Полные уверенности, мы полагаем -Ь(гцк) = (n^k)zk и вычисляем р(гцк) = (n+l-2k)(30(n)+(n+l-k)(3i(n) = ?(п,к), t(n,k) - t(n,k)/(n+1-2k) = (n-k)!zk/k!(rH-1-2k)!, q(n,k) = (n+1-2k)(n-2k)z, г(гцк) - (n+l-k)k. Но увы— уравнение (5.129) не решается, если z ^ — ^, так как Sn(—?) равно степень s должна быть равна deg(p) — deg(q — г) = — 1. (и +1 )/2п. Никаких проблем. Мы просто добавляем еще один параметр 02(тг) и испытываем t(n,k) = Po(n)t(n,k) + |3i (n)t(n + 1,k) + P2(n)t(n + 2,k): p(n,k) = (n+1-2k)(rL+2-2k)(30(n)+ +(n+l-k)(n+2-2k)(31 (n)+
5.8 Механическое суммирование 295 +(n+1-k)(n+2-k)(32(n) = p(n,k), t(n,k) = t(n,k)/(n+1-2k)(n+2-2k) - (n-k)!zk/k! (n+2-2k)!, q(n,k) = (n+2-2k)(n+1-2k)z, r(n,k) = (n+l-k)k. Теперь можно взять sfn^k) = oto(n), и (5.129) имеет решение Po(n) - z, Pt(ti) = 1, p2(n) = -1, cx0(n) = 1. Мы обнаружили, что zt(n,k) + t(n+1,k)-t(n + 2,k) = Т[п)к+])-Т{пук)) где T(n,k) = T(n,k)s(n,k)t(n,k)/P(n,k) = n +1 — k\ k - (n+1-k)kt(n,k) = I k_1 Jz Суммирование от k = 0 до k = n дает zS„(z) + (S„+,(z)-(„°,)z"+')- -<S««W-(n°2)'"+2-Ul)^'» = = T(n,n+1)-T(n,0). Ho (n+1)zn+1 = (^)zn+1 = 1(11,11+ 1) для всех п ^ О, так что мы получаем Решения таких рекуррентных соотношений мы будем изучать в главах 6 и 7; методы этих глав позволяют немедленно перейти от (5-14°) к аналитическому виду (5-74) Щ311 условии So(z) = Si(z) = 1. Еще один знаменитый пример завершает картину. В 1978 году французский математик Роже Апери (Roger Apery) решил задачу, которая долго не поддавалась усилиям математиков, доказав, что число С(3) = 1 + 2_3 + 3_3 + 4_3 + • • • иррационально [14]. Одна из важнейших частей его работы включает вычисление биномиальной суммы
296 Биномиальные коэффициенты Объявленное им рекуррентное соотношение для этой последовательности в то время другие математики проверить не могли. (А числа Лп с тех пор стали называться числами Апери; Ао = 1, Ai = 5, А2 = 73, А3 = 1445, А4 = 33001.) Наконец, Дон Загиер (Don Zagier) и Генри Коэн (Henri Cohen) [356] нашли доказательство предположения Апери, и это их доказательство для данной частной (но сложной) суммы стало одним из ключевых моментов, которые привели Зайльбергера к открытию общего метода, который мы сейчас рассматриваем. В действительности мы уже увидели достаточное количество примеров, чтобы сумма (5-141) стала почти тривиальной. Полагая t(n,k) = (k)2(nkk)2 и ^n>k) = Po(n)t(n,k) + Mn)t(n + 1, k) + (32(n)t(n + 2, k), попытаемся решить (5.129) с Сначала мы попробовали обой- p(n,k) = (n+1-k)2(n+2-k)2Mn) - +(n+l+k)2(n+2-k)2Mn) +(u+l+k)2(n+2+k)2|32(n) t(n,k) = t(u>k)/(n+l-k)2(n+2-k)2 q(n,k) = (n+1+k)2(n+2-k)2, r(n,k) = k4. (Можно не беспокоиться о том факте, что q имеет множитель (k + п + 1), а г— множитель к; это не нарушает (5.118), потому что мы рассматриваем п как переменную, а не как фиксированное целое число.) Поскольку q(п, к) — г(тц к) = —2к3 Н , можно положить deg(s) = —1\'/\ = 2, так что получим s(n,k) = ct2(n)k2 + ct*\ (n)k+ ао(тг). При таком выборе s рекуррентное соотношение (5-129) превращается в пять уравнений относительно шести неизвестных (Зо(тг), Pi (тг), (З2(n), oto(n), oti (тг), агОп). Например, приравнивание коэффициентов при к0 приводит к уравнению, которое упрощается до Ро + Pi + Р2 - схо - ои - <х2 = 0; уравнение, получающееся для коэффициентов при к4,— Po + Pi +Р2 + СХ1 +(6 + 6тг + 2п2)<х2 = 0. Три других уравнения более сложны. Но главное здесь то, что эти линейные уравнения— как все уравнения, появляющиеся на этой стадии алгоритма Госпера-Зайльбергера, однородны (их = (u+k)!2/k!4(rH-2-k)!2, тись оез р2, но эта попытка провалилась.
5.8 Механическое суммирование 297 правые части равны нулю). Поэтому они всегда имеют ненулевое решение, если только число неизвестных превышает число уравнений. В нашем случае решением оказывается Ро(п) Мп) Мп) осо(п) cxi(n) а2(п) = = = = = = (п+1)3, -(2n + 3)(17n2+51n + 39), (п + 2)3, -16(n+1)(n + 2)(2n -12(2п + 3), 8(2п + 3). + 3), "Профессор Литтл- вуд (Littlewood), когда ему приходилось использовать какое-либо алгебраическое тождество, никогда не утруждал себя его доказательством; он утверждал, что алгебраическое тождество, если оно справедливо, может быть проверено в несколько строк любым сомневающимся, который достаточно туп, чтобы ощущать необходимость в такой проверке. Моя цель на протяжении следующих страниц — опровергнуть это утверждение" — Ф.Дайсон (F.J.Dyson) [89] Следовательно, (n + l)3t(n,k) -(2n + 3)(17n2+51n + 39)t(n + 1,k)+ + (11 + 2)4(11 + 2,10) = T(n,k+1)-T(n,k), rAeT(n>k)=k4s(n)k)t(n)k) = (2n + 3)(8k2-12k-16(n+1)(n + 2))(n + k)!2/(k— l)!4(n + 2 —k)!2. Суммирование по k дает немыслимое рекуррентное соотношение Апери (п+1)3Ат + (u + 2)3An+2 = = (2тг + 3)(17тг2+51п+39)Ап+1 (5-142) Но работает ли метод Госпера-Зайльбергера со всеми суммами, которые встречались нам в этой главе? Нет. Он непригоден в случае, когда t(n,k) равно (?)(к+ 1)к_1(п — к+ 1)п-к~1 Из (б-бб)» поскольку отношение членов t(n, k + 1 )/t(n> к) не является рациональной функцией от к. Он также не в состоянии справиться со случаем наподобие -Цтцк) = (?)т1к, поскольку другое отношение членов t(n + 1 > kj/tfn, к) не является рациональной функцией от к. (Мы можем, однако, получить решение в этом случае, просуммировав (?)zk и затем положив z = n.) И наконец, этот метод терпит неудачу для удивительно простого слагаемого, наподобие t(n,k) = 1/(nk+ 1), несмотря на то что оба отношения, t(n,k+ l)/t(n,k) и t(n + 1,к)/1:(гцк), представляют собой рациональные функции от п и к. Вместе с тем алгоритм Госпера-Зайльбергера гарантированно приводит к успеху в огромном числе случаев, а именно— когда слагаемое t(n, к) является так называемым подходящим членом, т.е. членом, который может быть записан в виде t(n,k) f(n,k) "V. (cnn+ajk+g;')! ... (apn+a^k+a^ (bm+bjk+b;7)! ...(bqn+b'k+b") -wnzk. (5.143)
298 Биномиальные коэффициенты Здесь f (гц к) — полиномы от п и к; коэффициенты си , а\, ..., ар, dp, bi, Ъ\, ..., bq, bq — определенные целочисленные константы; параметры w и z ненулевые; остальные величины а", ..., dp, b", ..., bq— произвольные комплексные числа. Мы докажем, что если t(n,k) является подходящим членом, то найдутся такие полиномы |Зо(п), ..., |3i(n), не все равные нулю, и подходящий член Т(гц к), такой, что Что случится, если t(n,k) не зависит Po(n)t(n,k)+...+pl(n)t(n+l,k) = T(n,k+1)-T(n,k). (5.144) отп? Приведенное далее доказательство принадлежит Вильфу и Зай- льбергеру [374]. Обозначим через N оператор, который увеличивает п на 1, а через К— оператор, увеличивающий к на 1, так что, например, N2K3t(n,k) = t(n + 2,k + 3). Мы будем изучать линейные разностные операторы от N, К и п, а именно — операторные полиномы вида i J H(N,K,n) = ?Х>л(п)>Н<*, (5-145) i=0 j=0 где каждый коэффициент 0Cij(ri) представляет собой полином от п. Наше первое наблюдение состоит в том, что если t(n,k)— произвольный подходящий член и HtN^n)— произвольный линейный разностный оператор, то H(N,K,n)t(n,k) является подходящим членом. Предположим, что t и Н задаются соответственно равенствами (б-НЗ) и (5-145)i тогда мы определим "базовый член" -, „ nLi(^+^+^nal<0]+a{J[a{<0]+a{/)! пк t(n,k)ij = wnzk. Ш=1 (btn+b^k+btl[bt > 0]+b{J[Ъ[ > 0]+bt")! Например, если t(n,k) есть (п~к2к) = (п—2к)!/к! (п—Зк)!, то базовым членом, соответствующим линейному разностному оператору степеней I и J, будет t(n, к) ij = (n-2k-2J)!/(k+J)!(n-3k+I)L Главное то, что aij(n)N1KH(TL,k) равно -[(гц k)ij, умноженному на некоторый полином от п и к, если O^i^InO^j^J. Конечные суммы полиномов представляют собой полиномы, так что H(N,K,Ti)t(Ti, к) имеет требуемый вид (б-НЗ)- На следующем шаге требуется показать, что если t(n, к) — подходящий член, то всегда найдется такой линейный разностный оператор H(N,K,n), что H(N,K,n)t(n,k) = 0.
5.8 Механическое суммирование 299 Примененный здесь трюк основан на представлении Н в виде полинома от К с последующей заменой К на Д+1. Если O^i^InO^j^J, то сдвинутый член 1МгКН(гцк) есть произведение t(n, k)ij на полином от п и к, степень которого по к не превышает Di,, - deg(f) + |a1|I + |a1'|J + --- + |aP|I + |a;iJ + |b1|I + |b{|J + --- + lbq|I + |b^|J. Следовательно, требуемый оператор Н существует, если мы сможем решить систему из Dij + 1 однородных линейных уравнений с (I + 1)(J + 1) переменными atjfn), коэффициентами которых являются полиномы от п. Все, что нам надо,— это выбрать I и J достаточно большими, чтобы выполнялось неравенство (I + 1 )(J + 1) > Dij + 1. Например, можно взять I = 2А' + 1 и J = 2A + deg(f),rAe Д = |ai| + ... + |ap| + |b1| + ... + |bq|; А' = |a1,| + ... + |a;| + |b1/| + ..- + |b;|. Последний шаг доказательства заключается в переходе от уравнения ЬЦМ^п^гцк) =0к решению (5.144)- Пусть Н выбран таким образом, чтобы минимизировать J, т.е. так, что Н имеет наименьшую возможную степень по К. Можно записать для некоторого линейного разностного оператора G(N>K)n) H(N,K,n) = H(N,l,n)-(K-l)G(N,K,n). Пусть H(N,1,n) = (30(n) + (3i(n)N + ... + (3l(n)Nl и T(n,k) = G(N>K)n)t(n, k). Тогда Т(тцк) является подходящим членом и (5-144) выполняется. Доказательство почти завершено. Нам осталось убедиться, что оператор Н^^п)— не просто нулевой. Если это так, то Т(тцк) не зависит от к. Поэтому найдутся такие полиномы (Зо(п) и Pi(n), что (Эо(тг) + Pi(n)N)T(n,k) = 0. Но тогда (|3o(ti) + |3i(n)N)G(N,K,n)— ненулевой разностный оператор степени J — 1, который аннулирует t(n,k); это противоречит предположению о минимальности J, и наше доказательство (5.144) на этом завершено. Теперь, зная, что (5-144) выполняется для некоторого подходящего члена Т, мы можем быть уверены, что алгоритм Госпера успешно найдет Т (или Т плюс константу). Хотя мы доказали корректность алгоритма Госпера только для случая гипергеометрических членов t(k), зависящих от одной переменной к, наше доказательство может быть распространено на случай двух переменных следующим образом. Существует бесконечно много комплексных чисел п, для которых выполняется условие (5.118)
300 Биномиальные коэффициенты при разложении q(n, к) и г(гцк) как полиномов от к и для которых вычисление степени d на шаге 2 дает тот же результат, что и в алгоритме Госпера для одной переменной. Для всех таких п наше предшествующее доказательство устанавливает существование подходящего полинома 5(гцк) от к; таким образом, существует и требуемый полином s(u, к) от п и к. QED Мы доказали, что алгоритм Госпера-Зайльбергера сможет найти решение (5-144) АЛЯ некоторого (как можно меньшего) I. Это решение дает нам рекуррентное соотношение по п для вычисления суммы по к любого подходящего члена t(n, к) при условии, что t(n, к) отлично от нуля только для конечного множества значений к. И, разумеется, можно поменять ролями пик, поскольку определение (б-143) подходящего члена симметрично относительно пик. Упр. 98-108 дают еще несколько дополнительных примеров использования алгоритма Госпера-Зайльбергера, иллюстрируя его разносторонность. Вильф и Зайльбергер [374] существенно расширили эти результаты и получили метод, который справляется с обобщенными биномиальными коэффициентами и кратными суммами. Упражнения Разминка 1 Чему равно 114 ? Почему это число легко вычислить тому, кто знаком с биномиальными коэффициентами? 2 При каком значении (значениях) к величина (?) максимальна, если п— заданное положительное целое число? Обоснуйте свой ответ. 3 Докажите "свойство шестиугольника" (rO^^HVX;:;)^)- 4 Вычислите ("^ ), обратив (т.е. сделав положительным) верхний индекс. 5 Пусть р— простое число. Покажите, что (?) mod р = 0 при О < к < р. Что следует отсюда относительно биномиальных коэффициентов (р^1)? 6 Исправьте решение задачи б в разделе 5.2, правильно при- Случай ошибочно- менив симметрию. сти тождества. 7 Справедлива ли формула (5-34) Щ311 к < 0?
5 Упражнения 301 8 Вычислите ^(к)(_1)к(1_к/п) Чему приближенно равно значение этой суммы при очень больших значениях п? Указание: сумма равна Anf(0) для некоторой функции f. 9 Покажите, что обобщенные экспоненциальные ряды из (5-5^) подчиняются правилу ?t(z) = ?(tz)v\ если t^ О, где ?(z) представляет собой сокращение для ?i (z). 10 Покажите, что —2(ln(1 — z) -\-z)/z2 является гипергеометрической функцией. 11 Выразите функции sinz arcsinz = z — = Z + Z3 3! + 1-Z3 2-3 Z5 5! + Z7 -7!+- l-3-z5 Т^5 + через гипергеометрические ряды. и ЬЗ-5-z7 2Ч-6-7 + 12 Какая из приведенных далее функций от к является гипер- геометрическим членом в смысле раздела 5.7? Обоснуйте свой ответ. a nk. б kn. в (k! + (k+l)!)/2. г Нк, т.е. т + 1 + '" + ^ Д VO- Здесь t и Т яе е t(k)T(k), где t и Т— гипергеометрические члены. обязательно связа- ж t^j _j_ T(k), где t и Т— гипергеометрические члены. ны между собой, ,, . л как / ) з t(n — к), где t— гипергеометрическии член. и at(k)+bt(k+1) + ct(k+2), где t— гипергеометрический член. й рс/21. к k[k>0]. Обязательные упражнения 13 Найдите связь между суперфакториальной функцией Рп = Пк=1 ^! из У11?- 4.55, гиперфакториальной функцией Qn = Пк=1 ^к и произведением Rn = Пк=о (к)-
302 Биномиальные коэффициенты 14 Докажите тождество (5-25), обратив верхний индекс в правиле свертки Вандермонда (5-22). Затем покажите, что еще одно обращение приводит к (б-2б). 15 Чему равна сумма ]Гк (к) (—1)к? Указание: см. (5-29). г (Л)(Л) (Л)<-"" 16 Вычислите сумму к ча + к/ \Ь + V \с + к при неотрицательных целых сцЪ и с. 17 Найдите простое соотношение между ( п~ ) и (2п^п )• 18 Найдите альтернативный вид выражения, аналогичный (б-Зб)) АЛЯ произведения orncr 19 Покажите, что обобщенные биномиальные ряды из (5-5^) подчиняются правилу Bt(z) - Ъл-г{-г. -1 20 Определим "обобщенный инфрагеометрический ряд" формулой аь ...,ат = У ^ к к ат... Qm Z1 к к^о Ьу...Ьп к! используя в определении (5.76) убывающие степени вместо возрастающих. Объясните, как ряд G связан с рядом F. 21 Покажите, что определение факториалов Эйлера согласуется с обычным определением, показав, что предел в определении (б-8з) Равен Vm!> если z = га— положительное целое число. 22 Воспользуйтесь определением (5-83) для доказательства факториалъной формулы удвоения: Кстати, х!(х-1)! = (2х)!(-1)!/22х. 23 Чему равно значение F(—тц 1;; 1)? 24 Найдите величину ]Гk (т+к) ("г^И^ воспользовавшись ги- ±У. = у/п. пергеометрическим рядом.
5 Упражнения 303 25 Покажите, что (ai-bi)F( ь"1'Гь""' h Ъ^ + \y b2> ..., bn = qtF -biF СИ, CL2 1+1,1 cii+1, a2, .-., am bi+1, b2, ..., bn ab a2, ..., am bi, Ьг, ..., bn z - Найдите подобную зависимость между гипергеометрическими функциями си, Q2, а3, bi, ..., bn 'си+1, а2, а3, ..., аг bi, ..., bn 'аь аг + 1, а3, ..., am | bi, ..., bn I 26 Выразите функцию G(z) из формулы СИ, 1+G(z) .bi, ..., br в виде кратного некоторому гипергеометрическому ряду. 27 Докажите, что ab ai+5, •••> am, am + ^ vbi, bi + 2, ..., bn> bn+2, 2 (2 = 1/p /2ab...,2am 2V Ubb...>2bn 28 Докажите тождество Эйлера z +F m—n— 1 ^2 2ab...)2aTI 2bb...,2bT —z a,b d-z) c—a—b - c —a, c—b путем двойного применения закона Пфаффа (5.101). 29 Покажите, что вырожденные гипергеометрические функции удовлетворяют соотношению 'Ъ-а| b ezF = F 30 Какой гипергеометрический ряд F удовлетворяет уравнению zF'(z) + F(z) = 1/(1-z)?
304 Биномиальные коэффициенты 31 Покажите, что если f(k)— любая функция, суммируемая в гипергеометрических членах, то f сама по себе является гипергеометрическим членом. Например, если 22 f (k) 6к = cF(Ai,..., Ajvi;Bi, .. .jBisjjZJk + C, то существуют константы си , ..., am, bi, ..., bn и z, такие, что f (к) кратно (5.115)- 32 Найдите величину Y. ^2 6к методом Госпера. 33 Воспользуйтесь методом Госпера, чтобы найти J^ 5k/(к2 — 1). 34 Покажите, что частичная гипергеометрическая сумма всегда может быть представлена в виде предела обычных гипергеометрических функций: 4 Vbb-мЬп z) = HmF' с>аь--->ат k e->0 \e — c, bi, ..., bn если с— неотрицательное целое число. (См. (5.115)-) Воспользуйтесь этой идеей для вычисления Ц]С<т (^)(—1 )к- Домашние задания 35 При отсутствии контекста запись Hk<n (к)^к_П неоАнознач- на. Вычислите ее а как сумму по к; б как сумму по п. 36 Пусть рк— наибольшая степень простого числа р, которая делит (m*n), если тип— неотрицательные целые числа. Докажите, что к представляет собой количество переносов, которые происходят при сложении m с п в системе счисления по основанию р. Указание: вам поможет упр. 4.24. 37 Покажите, что для факториальных степеней справедлив аналог биномиальной теоремы, т.е. докажите тождества n~k и k ^ ' (х + уГ = H(?)xV=* для всех неотрицательных целых чисел п. 38 Покажите, что все неотрицательные целые числа п могут быть представлены единственным образом в виде п = (^) + (2) + (з)> где а> ^ и с— Целые числа 0 ^ a < b < с. (Это называется комбинаторной системой счисления.)
5 "Упражнения 305 39 Покажите, что если ху = ах + Ъу, то хпуп = Y_ r2n"^~kVanbn-kxk + an-kbnijk) при всех п > 0. Найдите подобную формулу для более общего произведения xmyn. (Эти формулы полезны при нахождении представления в простых дробях, например при x = 1/(z-c)Hy = 1/(z-d).) 40 Запишите сумму |>1 )j+1 (J) X (Н ** + S)' Челые m, n ? О, в аналитическом виде. 41 Вычислите ]Гк (к)^/(п + ^ + к)! ПРИ Целом неотрицательном п. 42 Найдите неопределенную сумму 21 ((—1 )х/(х)) ^х и воспользуйтесь ею для записи суммы Ц?=0(—1)к/(к) в аналитическом виде. 43 Докажите трехчленное биномиальное тождество (5.28). Указание: сначала замените (^) на ?. (m+Tn_,)(J). 44 Воспользуйтесь тождеством (5-32) Для записи в аналитическом виде двойных сумм Г)ШГГ-Г Jj-i)j+k|- .11.11.11 : 1 и :ж7)Ш/(?;;у I(-i),+k при заданных целых т^а^Оип^Ъ^О. 45 Запишите в аналитическом виде сумму Xlk<n (^И"1^ 46 Выразите в аналитическом виде при положительном целом п сумму '2к - 1 \ /4п - 2к - Л Г-11к"] L к ч к J\ 2п-к У(2к-1)(4п-2к-1) ' Указание: вам помогут производящие функции.
306 Биномиальные коэффициенты 47 Сумма у- /rk + s\ /га — rk — s представляет собой полином от г и s. Покажите, что она не зависит от s. 48 Тождество Y-k=o (Ппк)^_к = ^ может быть объединено с формулой Х!к$>о (Ппк)гк — V(1 — г)п+1, что приводит к ?(ТУ k>n ч 7 Тс Какой вид имеет гипергеометрическая форма последнего соотношения? 49 Воспользуйтесь методом гипергеометрических функций для вычисления *<ж: х + п — к к ) у+ п — к 50 Докажите закон отражения Пфаффа (5.101), сравнивая коэффициенты при zn в обеих частях данного равенства. 51 Вывод формулы (5.104) показывает, что lme->oF(-m,-2m--1 +e;-2m+e;2) = l/(~^2). В этом упражнении мы увидим, что немного отличающиеся предельные переходы приводят к существенно разным ответам для вырожденного гипергеометрического ряда F(—га, —2га— 1;— 2га; 2). а Покажите, что lime-^o F(—m-f е, —2га—1; —2та+2е; 2) = О, воспользовавшись законом отражения Пфаффа для доказательства тождества Р(а> — 2ra— 1; 2а; 2) = 0 при всех целых ra ^ 0. б Чему равен lime-».o F(—та + е, — 2га — 1; —2га + е; 2)? 52 Докажите, что если N — неотрицательное целое число, то bNpf ab...,am,-N bi,...,!^ z\ = (-DT -Ql •••a-(-z) 4 1-arN 1-G.-N 53 Если в тождестве Гаусса (5.но) положить Ъ = — \ и ъ = 1, то левая часть сведется к —1, в то время как правая часть равна +1. Почему это не доказывает, что —1 = +1?
5 Упражнения 307 54 Объясните, как была получена правая часть соотношения (5-112). 55 Покажите, что если гипергеометрические члены t(k) = F(ai, ...,am; bi,..-,bn; z)knT(k) = F(Ab ..., AM; Bb • • • >BN; Z)k удовлетворяют соотношению t(k) = c(T(k+ 1) — T(k)) при всех k^O, toz = Zhiti-n = M — N. 56 Используя метод Госпера, найдите общую формулу для 21 (~к) Ьк. Покажите, что (—1)k_1 [^^\ [^^J также является решением. 57 Используя метод Госпера при заданных п и z, найдите константу 0, такую, что ^(?)zk(k + e)5k суммируется в гипергеометрических членах. 58 Если тип— целые числа, такие, что 0 ^ m ^ п, то положим Ттл . ? (")' л , \™7 п - к 0^k<n ч 7 Найдите соотношение между Tm>n и Tm_i )TL_i, а затем решите полученное рекуррентное соотношение, применив суммирующий множитель. Контрольные работы 59 Найдите аналитический вид п k^VUogmkj при положительных целых m и п. 60 Воспользуйтесь для вычисления (m^n) при одновременно больших тип приближением Стирлинга (4-23)- К чему сводится ваша формула при га = п? 61 Докажите, что если р— простое число, то /п\ _ / [n/pj \ /nmodp V - VLm/pJAmmodp; (m°dp) при любых неотрицательных целых числах тип.
308 Биномиальные коэффициенты 62 В предположении, что р— простое число, а га и п— положительные целые числа, определите величину (™р) mod р2. Указание: при желании можете воспользоваться следующим обобщением свертки Вандермонда: k1+k2 + ---+km=n ГЛ/Г2\ /Гт\ = /ГТ+Г2+--+ГП 63 Найдите аналитический вид суммы D-4)t2+kk) k=0 при заданном целом n ^ 0. 64 Вычислите Л^=0 (к)/|"^"1 Щ311 заданном целом тг ^ 0. 65 Докажите, что H(V)n~k(k+1)! = п- 66 Вычислите "двойную сумму Гарри" i-Lv^HJ/WzJ' как функцию от га. (Это сумма как по j, так и по к.) 67 Запишите в аналитическом виде Х_ ( 2 ) (2Пп J ' ЦеЛ°е П ^ °" 68 Запипште в аналитическом виде ^~ I j minfk, тг — к), целое тг ^ 0. 69 Запишите в аналитическом виде mm )_ ( ] kb...,icm^o i=1 \z lci+ +km=n как функцию от m и тг.
5 Упражнения 309 70 Запишите в аналитическом виде ? (к) (1к) (т) ' целое п>°- 71 Пусть ~ , m + 2к > S- = Г(*+^К> где га и п— неотрицательные целые числа, a A(z) = YLk^o a^zk— производящая функция для последовательности (a0,ai,a2,...)- а Выразите производящую функцию S{z) = Цтг>0 ^n^n через A(z). б Воспользуйтесь этим приемом для решения задачи 7 из раздела 5.2. 72 Докажите, что если та, тг, и к— целые числа и п > 0, то ™/n\2k_v(k) целое> где v(k) — количество единиц в бинарном представлении к. 73 Воспользуйтесь методом наборов для решения рекуррентного соотношения Хо = а; Хт = Р; Хп = (п-1)(Хп_! + ХП_2) прип>1. Указание: этому рекуррентному соотношению удовлетворяют как тг!, так и п\. 74 Эта задача связана с "нестандартным вариантом" треугольника Паскаля, стороны которого состоят из чисел 1, 2, 3, 4, ..., а не из единиц, но при этом числа внутри треугольника по-прежнему удовлетворяют формуле сложения: 1 2 2 3 4 3 4 7 7 4 5 11 14 11 5 Если ((?)) обозначает k-е число в тг-й строке при 1 ^ k ^ тг, «О = О = - * О = (Г*1)) + ((?!)) при 1 < к < п. Выразите величину ((?)) в аналитическом виде.
310 Биномиальные коэффициенты 75 Найдите соотношение между функциями S..U, - Z (I) , к и величинами |2n/3J и |~2П/3~|. 76 Решите следующее рекуррентное соотношение для гц k ^ 0: Qn,o = 1; Qo,k = [к = 0]; п 2т2 Qn,k = Qn-i ,к + Qn-i ,k-i + ( к J при п, к > 0. 77 Чему равно значение Z П (кГ) *р*->1? 78 Выразите в аналитическом виде ^- / к niod га ^- l(2k+1)mod(2m+1" k=0 х в предположении, что га— положительное целое число. 79 а Чему равен наибольший общий делитель чисел ( 1п), (23п), ..., (2n-i)? Указание: рассмотрите сумму всех этих п чисел. б Покажите, что наименьшее общее кратное чисел (?), (7), .... С) равно L(n + l)/(n+1), где Цп) = НОК(1,2, ...,п). 80 Докажите, что (?) ^ (en/k)k для всех целых k,n ^ 0. Это стоит запомнить. 81 Докажите неравенство H)~~'z(i)C:++ky><> при 0<9<1и0^х^1и если 1,ттцп— неотрицательные целые числа, такие, что та < п. Указание: попробуйте взять производную по х.
5 Упражнения 311 Дополнительные задачи 82 Докажите, что треугольник Паскаля обладает при 0 < к < п еще более удивительным свойством шестиугольника, чем упоминавшееся в тексте главы: нод(а:11)>(к:1),ГГ)) - нод(г-1)>(-1)>(к-1)). Например, НОД(56,36,210) = Н ОД (28,120, 126) =2. 83 Докажите удивительное соотношение с пятипараметричес- кой двойной суммой (б-З2)- 84 Покажите, что вторая пара формул свертки (б-бо.) следует из первой пары (б-бо). Указание: продифференцируйте по z. 85 Докажите, что 1^1=1 1 ^k^ <k2< • <km^n ^ = (-1)nn!3- I (Левая часть представляет собой сумму 2П — 1 членов.) Указание: на самом деле справедливо гораздо большее. 86 Пусть си, ..., an— неотрицательные целые числа и С (си, ..., an) — коэффициент при постоянном члене z° ... z°, когда n(n — 1) множителей произведения п (i-? <i i<n ^ 5 полностью разложены на положительные и отрицательные степени комплексных переменных z\, ..., zn. а Докажите, что С(си,..., an) равно левой части (б-З1)- б Докажите, что если zi, ..., zn — различные комплексные числа, то полином fw = Y_ П Zv k=1 l^j^n к тождественно равен 1. Умножьте исходное произведение п(п—1) сомножителей на f (0) и выведите, что С (си , а2>..., ап) равно C(ai - 1, a2)..., an) + С(си, a2 - 1,..., an)+ + --- + C(aba2)...>an-1).
312 Биномиальные коэффициенты (Это рекуррентное соотношение определяет мультиномиальные коэффициенты, так что С(си,..., ап) должно совпадать с правой частью (б-З1)-) 87 Пусть га— положительное целое число и пусть С = ет^т. Покажите, что ) •B_m(zmr+1 (1+m)3_m(zm)-m _ v- (C2i+1z31+1/m(^+1z)1/m)n+1 o?m (m+1)B, + Vm(C4+1z)-1-1 (В частном случае га = 1 это сводится к (5-74)0 88 Докажите, что коэффициенты Sk в (5-47) равны И! 'СО J. e-t(1_e-t)k-i « о t при всех к > 1; следовательно, |sk| < 1/(к— 1). 89 Докажите, что соотношение (s-ig) имеет бесконечный аналог L (m*rVkym-k = L (~rV-*)k(*+y)T k>m ^ ' k>m ^ ' целое m, если |x| < \y\ и |x| < |x + y|. Продифференцируйте это соотношение n раз по у и выразите в гипергеометрическом виде. Какое соотношение вы при этом получите? 90 В задаче 1 раздела 5.2 рассматривается сумма ]Гк>0 (к)/(к) при целых г и s, таких, что s ^ г ^ 0. Чему равно значение этой суммы при нецелых г и s? 91 Докажите тождество Уиппла (Whipple), -4z p/la, 1q+?, 1+a-b-c V 1+a-b, 1+a-c (1-z)2 a> b, с 1+a—b,1+a—с показав, что обе его части удовлетворяют одному и тому же дифференциальному уравнению.
5 "Упражнения 313 92 Докажите тождества произведений Клаузена (Clausen) ?( а,Ъ |_V = ?( 2a,a+b,2b i \ Va+b+11 J \2а+2Ъ, a+b + 11 J ' 4 i «-> 4 1+a+b 1-a-b F 1, ^ + a-b, 1-a+b 1+a+b, 1-a-b Какие тождества получатся, если приравнять коэффициенты при zn в обеих частях этих формул? 93 Покажите, что при произвольной заданной функции f и произвольной константе a ^ 0 бесконечная сумма г(гош + «)/Шо))<* имеет (достаточно) простой вид. 94 Найдите YL (?) (т^-k) ^ ПРИ положительном целом числе п. 95 Какие условия должны быть наложены в дополнение к (5.118), чтобы полиномы р, q, г из (5-И7) стали однозначно определенными? 96 Докажите, что если алгоритм Госпера не находит решения (5.120) при данном гипергеометрическом члене t(k), то не имеет решения и более общее уравнение t(k) = (T1(k+l)+.-.+Tm(k+l))-(T1(k)+...+Tm(k))) где Ti (k), ..., Tm(k) — гипергеометрические члены. 97 Найдите все комплексные числа z, для которых к!2/ ГЪ=1 О2 + )z + "О суммируется в гипергеометрических членах. 98 Какое рекуррентное соотношение дает метод Госпера-Зайльбергера для суммы Sn = Y.\c (zic)? 99 Воспользуйтесь методом Госпера-Зайльбергера для поиска аналитической записи ^kt(n>k), где 1:(гцк) = (n + a + b + с + к)!/(п + к)! (с + к)! (Ь — к)! (а — к)! к!, в предположении, что а— неотрицательное целое число.
314 Биномиальные коэффициенты 100 Найдите рекуррентное соотношение для суммы ^ k=0 и воспользуйтесь им для того, чтобы найти другую формулу для Sn. 101 Найдите рекуррентное соотношение, которому удовлетворяют суммы • ww-L(T)C>' = б Sn(z) = Sn>n(z) = W?) zk. 102 Используйте процедуру Госпера-Зайльбергера для обобщения "бесполезного" тождества (5.113)- найдите еще какие- нибудь значения а, Ъ и z, такие, что z(i 3n-a\z* /(1п~Ъ имеет простую аналитическую запись. 103 Пусть t(n, к) — подходящий член (5-143)- Какие степени будут иметь полиномы р(гцк), q(n,k) и г(гцк) относительно переменной к, когда процедура Госпера-Зайльбергера применяется к t(n,k) = (Зо(г1)1:(гцк)Н h|3i(n)t(TL+l,k)? (Редкие, исключительные случаи можно игнорировать.) 104 Воспользуйтесь процедурой Госпера-Зайльбергера для проверки замечательного тождества Цы: г—s—к\ /г—2к 1 п—к у г—п—к+1 1 п/ г—2п+1 Поясните, почему для этой суммы не найдено простейшее рекуррентное соотношение. 105 Покажите, что если си = е2тиг/3, то 2 L k+l+m=3n Зп k, I, m си l-m 4п гцгц2тг/ ' целое n ^ 0. 106 Докажите удивительное тождество (5-32)> положив t(r,j,k) равным результату деления слагаемого на правую часть Для этого и нескольких последующих упражнений имеет смысл воспользоваться компьютерной алгеброй.
5 "Упражнения 315 и показав затем, что найдутся функции Tfr^k) и Utrjjk), для которых t(T+l,j,k)-t(r,j,k) = T(Tj + 1,k)-T(T,j,k)+ + U(T,j,k+1)-U(r,j,k). 107 Докажите, что 1/(nk + 1) не является подходящим членом. 108 Покажите, что числа Апери Лп из (5-141) представляют собой диагональные элементы Ап>п числовой матрицы, определенной следующим образом: х- /m\ /т\ /2т + п — i — к Докажите, что эта матрица симметрична и что /m + n_k\2 /m + n-2^2 *---?( k ) ( m_k 109 Докажите, что числа Апери (5.141) удовлетворяют сравнению An = A|_n/pjAnmodp (modp) для всех простых р и всех целых n ^ 0. Исследовательские проблемы 110 При каких п справедливо сравнение ( пг) = (—1 )n (mod (2п+ I»? 111 Пусть q(n)— наименьший нечетный простой множитель среднего биномиального коэффициента (пг). Согласно упр. 36 нечетными простыми числами р, которые не делят (пг), являются те, все цифры которых в представлении тг в системе счисления с основанием р не превышают (р — 1)/2. Вычислительные эксперименты показали, что q (тг) ^ 11 для 1 < тг < 1010000, за исключением q (3160) = 13. а Верно ли, что q(n) $ 11 для всех тг > 3160? б Достигается ли q(n) = 11 для бесконечного количества тг? За решение любой из частей данного упражнения предлагается вознаграждение в 7 • 11 -13 долларов.
316 Биномиальные коэффициенты 112 Верно ли, что (2т[г) делится на 4 или 9 при всех тг > 4 за исключением тг = 64 и тг = 256? 113 Если t(n + 1, k)/t(n, к) и t(n, k + 1 )/t(n, k) — рациональные функции от тг и k и если существует линейный разностный оператор H(N, К^тг), такой, что H(N>K>n)t(n,k) = 0, то следует ли отсюда, что t(n,k)— подходяпщй член? 114 Пусть га— положительное целое число; определим последо- (т) вательность с^ при помощи рекуррентного соотношения Являются ли числа с\^п) целыми? Ш(Г)
6 "... par cette notation, les formules deviennent plus symetricpies" — И. Карамата [199] Специальные числа НЕКОТОРЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ чисел возникают в математике так часто, что узнаются с первого взгляда и получают собственные имена. Например, каждый, кто изучал арифметику, знаком с последовательностью квадратов (1,4,9,16,...). В главе 1 мы сталкивались с треугольными числами (1,3,6,10,...); в главе 4 изучали простые числа (2,3,5,7,...); в главе 5 бегло рассмотрели числа Каталана (1,2,5,14,...). В настоящей главе мы познакомимся с другими важными последовательностями. Первым пунктом повестки дня будут числа Стирлинга {?} и [?] и числа Эйлера (?). Они образуют треугольники коэффициентов аналогично биномиальным коэффициентам (?) из треугольника Паскаля. Затем мы тщательно изучим гармонические числа Нп и бросим беглый взгляд на числа Бернулли Вп; они отличаются от других ранее рассматривавшихся последовательностей чисел тем, что являются дробными, а не целыми числами. Наконец, мы исследуем очаровывающие числа Фибоначчи Fn и некоторые из их важных обобщений. 6.1 Числа Стирлинга Начнем с достаточно близких родственников биномиальных коэффициентов— чисел Стирлинга, которые названы так в честь Джеймса Стирлинга (James Stirling) (1692-1770). Эти числа имеют две разновидности, традиционно именуемые "числами Стирлинга первого и второго рода" Несмотря на долгую историю и многочисленные применения для этих чисел до сих пор нет общепринятого обозначения. Следуя Иовану Карамате (Jovan Karamata), мы будем записывать числа Стирлинга второго рода как {?}, а числа Стирлинга первого рода— как [?]; эти обозначения являются более дружественными и удобными по сравнению со многими другими предлагавшимися обозначениями.
318 Специальные числа Таблица 318. Треугольник Стирлинга для числа подмножеств п 0 1 2 3 4 5 6 7 8 9 {;} {;} {"} {;} {:} ш {;} {;} {;} {;} 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 1 3 7 15 31 63 127 255 1 6 1 25 10 1 90 65 15 1 301 350 140 21 1 966 1701 1050 266 28 1 3025 7770 6951 2646 462 36 1 В табл. 318 и 319 показано, как выглядят числа {?} и [?] при малых пик. Задача, которая включает в себя числа "6, 11, 6, 1" скорее всего, должна быть связана с числами [?], так же как задача, в которой встречаются числа "1, 4, 6, 4, 1" скорее всего, имеет отношение к (?); это "фирменные знаки" последовательностей при п = 4. Числа Стирлинга второго рода встречаются гораздо чаще, чем числа Стирлинга первого рода, так что первыми будут рассмотрены числа второго рода. Обозначение {?} используется Кстати, сам Стироля количества способов разбиения множества из п элементов лшг тоже Рассмат- , тт ^ ривал их первыми на к непустых подмножеств. Например, имеется семь способов свое~ КНИре шз] разбиения четырехэлементного множества на две части: {1,2,3}U{4}, {1,2,4}U{3}, {1,3,4}U{2}, {2,3,4}U{1}, {1,2}U{3,4}, {1,3}U{2,4}, {1,4}U{2,3}; (6.x) таким образом, {2} = 7. Обратите внимание, что фигурные скобки используются для обозначения как множеств, так и чисел {?}. Это сходство помогает запомнить смысл записи {?}, которую можно прочесть как "к подмножеств из п" Давайте рассмотрим малые значения к. Имеется только один способ разместить п элементов в единственном непустом множестве; следовательно, {^} = 1 для всех п > 0. С другой стороны, {°} = 0, потому что 0-элементное множество пусто. Случай к = 0 немного хитрее. Все получается как нельзя лучше, если согласиться с тем, что существует только один способ разбиения пустого множества на нулевое количество непустых частей; следовательно, {°} = 1. Но непустое множество
6.1 Числа Стирлинга 319 Таблица 319. Треугольник Стирлинга для числа циклов Т1 0 1 2 3 4 5 6 7 8 9 In [о 1 0 0 0 0 0 0 0 0 0 п 1 1 1 2 6 24 120 720 5040 40320 п .2 1 3 11 50 274 1764 13068 109584 п 3 1 6 35 225 1624 13132 118124 п 4 1 10 85 735 6769 67284 п 5 1 15 175 1960 22449 п. 6 п 7 п 8 п1 91 1 21 1 322 28 1 4536 546 36 1 требует наличия по крайней мере одного подмножества, так что {?} = 0 при п > 0. А что же будет при к = 2? Конечно же, {2} = 0. Если множество из п > 0 объектов разделяется на две непустые части, то одна из них содержит последний объект и некоторое подмножество из первых п — 1 объектов. Существует 2n_1 способов выбрать последнее подмножество, поскольку каждый из первых п — 1 объектов либо входит в него, либо не входит. Но мы не должны помещать в него все эти объекты, потому что мы хотим получить две непустые части. Поэтому вычтем 1: ;}- 7П-1 — 1 , целое п > 0. (6.2) (Это согласуется с приведенным выше перечислением способов разбиения: {^} = 7 = 23 — 1.) Модификация данных рассуждений приводит к рекуррентному соотношению, с помощью которого можно вычислить {?} для любого к. Если задано множество из п > 0 объектов, которое должно быть разбито на к непустых частей, то мы помещаем последний объект либо в отдельный класс ({?!-,} способами), либо в некоторое непустое множество из первых п — 1 объектов. В последнем случае имеется kj11"1} возможных вариантов, потому что каждый из j11"1} способов распределения первых п— 1 объектов по к непустым частям дает к подмножеств, с которыми можно объединить п-й объект. Следовательно, [k} = k{V}+{?-ib *елое1г>°- (6-3)
320 Специальные числа Это именно то правило, в соответствии с которым строится табл. 318; без множителя к оно сводится к формуле сложения (5-8), которая генерирует треугольник Паскаля. А теперь перейдем к числам Стирлинга первого рода. Они отчасти похожи на числа Стирлинга второго рода, но [?] подсчитывает количество способов представления п объектов виде к циклов вместо подмножеств. Произносить обозначение '[?]' можно как "к циклов из п" Циклы— это циклические представления, аналогичные ожерельям, рассматривавшимся в главе 4. Цикл D В можно записать более компактно как '[А, B,C,D]', понимая при этом, что [A,B,C,D] = [В, C,D, А] - [CD, А,В] - [D,A,B,C]; цикл "зацикливается" т.е. его конец соединяется с его началом. С другой стороны, цикл [А, В, С, D] — не одно и то же, что и цикл [A,B,D,C] или [D,C,B,A]. Существует одиннадцать различных способов составления двух циклов из четырех элементов: [1,2,3] [4], [1,2,43 га, [1,3,41га, [2,3,4] [1], [1,3,2] [4], [1,4,2] [3], [1,4,35 га, [2,4,3] [1], [1,2] [3,4], [1,3] [2,4], [1,4] [2,3]; (6.4) следовательно, [2] =11. Единичный цикл (т.е. цикл, состоящий из одного элемента)— это по сути то же самое, что и единичное множество (т.е. множество, состоящее из одного элемента). Аналогично 2-цикл подобен 2-множеству, потому что [А, В] = [В,А], так же как и {А, В} = {В, А}. Однако имеется два разных 3-цикла, [А, В, С] и [А, С, В]. Заметим, например, что одиннадцать пар циклов в (6.4) можно получить из семи пар множеств в (6.i), составив из каждого 3-элементного множества по два цикла. В общем случае из любого n-элементного множества можно составить тг!/п = (п — 1)! различных n-циклов, если только п > 0. (Имеется п! перестановок, и каждый п-цикл соответствует п из них, потому что цикл может начинаться с любого из своих элементов.) Таким образом, = (п — 1)!, целое п> 0. (6-5) "Есть девять и еще шестьдесят способов сложить песнь племени, и-каждый-из-них- по-отделъности- правильный" — Р.Киплинг (R. Kipling) Это значительно больше величины {Y} = 1, которая была получена для количества подмножеств Стирлинга. В самом деле,
6.1 Числа Стирлинга 321 легко убедиться в том, что число циклов должно быть по меньшей мере таким же, как и число подмножеств: > ;}• целые п,к^> О, (6.6) потому что каждое разбиение на непустые подмножества приводит как минимум к одному представлению в виде циклов. Равенство в (6.б) имеет место тогда, когда все циклы с необходимостью являются либо единичными, либо двойными— в силу того, что в таких случаях циклы эквивалентны подмножествам. Это происходит при к = тгик = п— 1; следовательно, , лег п п-1 В самом деле, легко увидеть, что п п-1 {»-.}¦ (Количество способов представления п объектов в виде п— 1 циклов или подмножеств равно количеству способов выбора двух объектов, которые окажутся в одном и том же цикле или подмножестве.) Треугольные числа Q") = 1, 3, 6, 10, ... имеются как в табл. 318, так и в табл. 319. Рекуррентное соотношение для [?] можно вывести путем видоизменения рассуждений, использовавшихся при выводе {?}. Каждое представление п объектов в виде к циклов либо помещает последний объект в отдельный цикл ([?Z-J способами), либо вставляет этот объект в одно из [п^]] циклических представлений первых п— 1 объектов. В последнем случае существует п— 1 различных способов выполнения такой вставки. (Это требует определенной сообразительности, однако нетрудно убедиться, что имеется j способов размещения нового элемента в j-цикл для получения (j + 1 )-цикла. Так, например, когда j = 3, цикл [А, В, С] приводит к [А, В, 0,0], [А, В, 0,0] или [A,D,B,C] при вставке нового элемента D, и никаких других возможностей не существует. Суммирование по всем j дает в итоге п— 1 способов вставки n-го объекта в циклическое разбиение п — 1 объектов.) Таким образом, искомое рекуррентное соотношение имеет вид = п- V тг-1 к + тг-1 к-1 целое тг > 0. (6.8) Это аналог формулы сложения, с помощью которой строится табл. 319.
322 Специальные числа Сравнение (6.8) и (6.3) показывает, что первый член в их правых частях умножается на его верхний индекс (тг — 1) в случае чисел Стирлинга первого рода и на нижний индекс к в случае чисел Стирлинга второго рода. Таким образом, при выполнении доказательства при помощи математической индукции можно осуществить "внесение" в членах типа п[?] и к{?}. Каждая перестановка эквивалентна некоторому множеству циклов. Рассмотрим, например, перестановку, которая переводит строку цифр 123456789 в 384729156. Для наглядности ее можно представить в виде двух строк, 123456789 384729156, ясно показывающих, что 1 переходит в 3, 2 переходит в 8 и т.д. Возникает циклическая структура, потому что число 1 переходит в 3, которое переходит в 4, которое переходит в 7, которое переходит обратно в 1; таким образом, мы имеем дело с циклом [1,3,4,7]. Другим циклом в данной перестановке является [2,8,5]; еще один цикл— [6^9]. Таким образом, перестановка 384729156 эквивалентна циклическому представлению [1,3,4,7] [2,8,5] [6,9]. Если имеется некоторая перестановка щ 7i2 ... яп множества {1,2, ..., п}, то каждый элемент входит только в один цикл. Действительно, если начать с то = га и рассматривать тти = 7tmo, rri2 — 7rmi и т.д., то в конце концов мы будем должны вернуться к mic = mo- (Числа раньше или позже должны будут повториться, и первым числом, которое появится вновь, будет то, потому что мы знаем, что у других чисел mi, 1П2, ..., mi<_i имеются собственные уникальные предшественники.) Таким образом, каждая перестановка определяет некоторое циклическое представление. И обратно, каждое циклическое представление очевидным образом определяет перестановку (для этого достаточно лишь обратить построение), и это взаимно однозначное соответствие показывает, что перестановки и циклические представления по сути являются одним и тем же. Следовательно, [?] — количество перестановок тг объектов, содержащих ровно по к циклов. Если просуммировать [?] по всем к, то должно получиться общее количество перестановок: = тг!, целое тг J> 0. (6.9) Например, 6 + 11 + 6 + 1 = 24 = 4!. L
6.1 Числа Стирлинга 323 Числа Стирлинга полезны потому, что рекуррентные соотношения (б.з) и (6.8) возникают в множестве разных задач. Например, если мы решим представить обычные степени хп через убывающие степени х—, то обнаружим, что несколько первых значений дают х° х1 х2 х3 = - = = х^; х1; х2- + х-1-; х^ + Зх2- + *1; х = х- - + 6х- 4- 7х- + х1 Эти коэффициенты подозрительно похожи на числа из табл. 318, только прочитанные не слева направо, а справа налево; таким образом, можно быть почти уверенным, что общая формула имеет вид Лучше было бы хъ = у j^U^S целое n ^ 0. (б.ю) определить ^г~ 1^ К- J при к < 0 Действительно, простое доказательство по индукции разрешает ип^О. все сомнения: х• х- = х^±1 + кх-, потому что х^±1 = х-(х — к); следовательно, x-xn_1 есть х*. Другими словами, числа подмножеств Стирлинга— это коэффициенты при факториальных степенях, которые дают обычные степени. Можно пойти и по другому пути, потому что числа циклов Стирлинга представляют собой коэффициенты при обычных степенях, которые дают факториальные степени: х° = х°; х^ = х1 ; х2 = х2 + х1 ; х3 = х3 + Зх2 + 2Х1 ; х? = х4 + бх3 + 11х2+бх1.
324 Специальные числа Мы имеем (x-f-n—1 )-хк = хк+1 + (п—1 )хк, так что доказательство, подобное только что проведенному, показывает, что (x + n-ljx11-1 = (х + п-1)^~ п-1 к L Это приводит к доказательству по индукции общей формулы = И целое п^> 0. (6.И) (Подстановка х = 1 вновь дает (б.д).) "Минутку! — можете сказать вы. — Это равенство включает возрастающие факториальные степени хп, в то время как (б.ю) включает убывающие факториальные степени х—. Что если нам потребуется выразить х— через обычные степени или хп через возрастающие степени?" Легко: достаточно добавить несколько знаков "минус" и получить = Г{?}н)п-к*1Г. m-k^k целое n ^ 0; целое п^> 0. (6.12) (6.13) Это срабатывает; например, формула х± = х(х-1)(х-2)(х-3) = х4- 6х3 + 11х2-6х почти такая же, как и х4 = х(х+1)(х + 2)(х + 3) = х4 + 6х3 + 11х2 + 6х, за исключением чередующихся знаков. Общее тождество х^ = (-1Н_хГ (6.14) из упр. 2.17 превращает (б.ю) в (6.12), а (б.и) в (6.13), если изменить знак х. Достаточно легко запомнить, когда следует вставлять множитель (—1)n-k в формулу наподобие (6.12), поскольку при большом х имеет место естественное упорядочение степеней: > x,L > х^ для всех х > п > 1. (6-15) Числа Стирлинга [?] и {?} неотрицательны, так что знаки "минус" следует использовать при выражении "малых" степеней через "большие"
6.1 Числа Стирлинга 325 Таблица 325. Основные тождества для чисел Стирлинга при целом п ^ О Рекуррентные соотношения смгк::} п к = ( Частные случаи {:} {?} Ш {.-.} Ю { = = [ п- -1) Гп-1" L k + п — к- п 0 = [п = 0] п>0] = (2й-1 -1)[п>0] = = = п п-1 U п п л. ¦G) -Ю- = С) = о, 11 1J п 1 п 2 = (п-1)![п>0] I = (п-1)!Нп_1[п>0] если к > п Преобразования степеней к ^ )п-кхк ХП = ]Г к Формулы обращения да:}<- да к] |т \п-к in- к = [т = п\ \т = п
326 Специальные числа Таблица 326. Дополнительные тождества для чисел Стирлинга при целых I, та, п ^ О с:1,} П+1 т+1 Е п та п та SG)№ к L П+1 к+1 in-k тп—к lm+l/ = ^(¦;;)кп(_1Г-к п+1 т+1 m + n+1 та m + n+1 та 'п та nn=2IL[n^m] EH к=0 'т+1 п-к \тг-к nl? к=0 L /к! к=0 ^ J к=0 ДО} п + к к (-D га—к П+1 к+1 & (-1) та — n\ /та + п m—к (n-m) +U + VV та + к/ V п + к m + k' к n п — т п 1 /I + та l + mJV I n l + m l + m ^- /та — n\ /m + n\ Jm + kl дапло n —к m rrt/¦ i m-m [u"| nm(-1 к (6.16) (6.17) (6.i8) (6.19) (б.20) (6.21) (6.22) (6.23) (6.24) (6.25) (6.26) Также (m)("-U— (6'27) = Lk[?]{mb обобщение (б.д). (6.28) (б.2д) (6-30)
6.1 Числа Стирлинга 327 Формулу (б.и) можно подставить в (6.12) и получить двойную сумму: ^к~ ^-LfflM^-Lft} m \п—к m Это справедливо при всех х, так что коэффициенты при х, х1, в правой части должны быть равны ,п-1 ^п+1 „TL + 2 нулю, и мы получаем тождество "к] |m Ш t-DT = m = n целые ггцп ^ 0. (6.31) Числа Стирлинга, подобно биномиальным коэффициентам, удовлетворяют многим удивительным тождествам. Однако эти тождества не столь гибки, как тождества из главы 5, а потому применяются не столь часто. Таким образом, лучше всего просто перечислить простейшие из них для будущих ссылок в случаях, когда придется колоть какой-нибудь не в меру крепкий стирлин- гов орешек. В табл. 325 и 326 содержатся наиболее часто применяющиеся формулы; уже выведенные нами тождества также повторены здесь. При изучении биномиальных коэффициентов в главе 5 мы обнаружили, что выгодно определить (?) для отрицательных п таким образом, чтобы тождество (?) = (п^ ) + (?"-,) оставалось корректным без ограничений. Используя это тождество для распространения (?) за пределы комбинаторики, мы обнаружили (в табл. 212), что треугольник Паскаля при его продолжении вверх, в сущности, воспроизводит себя в перевернутом виде. Давайте попробуем сделать то же и с треугольниками Стирлинга. Что произойдет, если принять, что базовые рекуррентные соотношения {;мг№;} п к = (тг— 1) "п-1" к + п к ¦1 справедливы при любых целых пик? Решение становится однозначным, если добавить дополнительные разумные соглашения, что Ш = [к = 0] И {:}- = [п = 0]. (6-32) В самом деле, вырисовывается удивительная и красивая картина: треугольник Стирлинга для циклов оказывается над треугольником Стирлинга для подмножеств, и наоборот! Оба рода чисел
328 Специальные числа Таблица 328. Треугольники Стирлинга в тандеме п -5 -4 -3 -2 -1 0 1 2 3 4 5 {-пз}И{Д}{:2}{->}ЙП{"}{з}йй 1 10 1 35 6 50 11 24 6 0 0 0 0 0 0 0 0 0 0 0 0 1 3 2 0 0 0 0 0 0 1 1 0 0 0 0 0 0 1 0 1 0 0 1 0 0 11 0 0 13 1 0 0 17 6 1 0 0 1 15 25 10 1 Стирлинга связаны исключительно простым законом [220, 221]: целые к, п. (б-ЗЗ) Мы получили "дуальность" напоминающую взаимоотношения между min и max, между [х\ и |~х~|, между х— и хп, между НОД и НОК. Легко проверить, что при таком соответствии рекуррентные соотношения [?] = (п — 1)[п^ ] + [?Z]] и {?} — kj™"1} + {?"]} означают одно и то же. 6.2 Числа Эйлера Время от времени возникает еще один треугольник чисел, которым мы обязаны Эйлеру [104, §13; 110, с. 485] и элементы которого мы обозначаем как '(?)'• Угловые скобки в данном обозначении напоминают знаки "меньше" и "больше" ведь (?) — это количество перестановок тх*\ пг ... яп множества {1,2,..., п}, имеющих к подъемов, т.е. к мест, где щ < П}+-\. (Предупреждение. Это обозначение еще менее стандартизовано, чем наши обозначения [?], {?} для чисел Стирлинга. Но мы увидим, что в этом обозначении есть свой резон.) Например, одиннадцать перестановок множества {1,2,3,4} содержат по два участка подъема: Кнут [209, первое издание] вместо '?) использовал п ) k+l/ • 1324, 1423, 2314, 2413, 3412; 1243, 1342, 2341; 2134, 3124, 4123.
6.2 Числа Эйлера 329 Таблиц п 0 1 2 3 4 5 6 7 8 9 /п\ \о/ а 329 >/П\ 'W 0 1 4 11 26 57 120 247 502 . Треугольник Эйлера М \2/ 0 1 11 66 302 1191 4293 14608 > /П\ * \з/ 0 1 26 302 2416 15619 88234 /П\ \4/ 0 1 57 1191 15619 156190 ЛЛ \5/ 0 1 120 4293 88234 /п\ W 0 1 247 14608 /nY W' 0 1 502 /Л \8/ 0 1 /П\ W 0 (В первой строке перечислены перестановки с щ < п^ > ттз < тц; во второй— перестановки с щ < пг < тез > Щ и щ > пг < п$ < 714.) Следовательно, (2) = 11. В табл. 329 перечислены небольшие числа Эйлера; на этот раз "фирменным знаком" служит последовательность 1, 11, 11, 1. При п > 0 в наличии может быть не более п — 1 подъемов, так что на диагонали треугольника мы имеем (?) = [п = 0]. Треугольник Эйлера, подобно треугольнику Паскаля, симметричен слева направо, но в данном случае закон симметрии несколько иной: п n-1-k целое п> 0. (6-34) Перестановка щ tlz ... 7tn имеет п — 1 — к подъемов тогда и только тогда, когда ее "отражение" 7tn ... Я2Я1 имеет к подъемов. Давайте попробуем найти рекуррентное соотношение для (?). Каждая перестановка р = pi ... pn_i множества {1,..., п—1} приводит к п перестановкам множества {1,2, ...,п}, если вставлять новый элемент п во все возможные места. Предположим, что мы вставляем п в позиции j, получая перестановку я = pi ... pj i n pj ... pn_i. Количество подъемов в п такое же, как и в р, если j = 1 или если pj i < pjj если же pj i > Pj или если j = п, то оно на единицу больше, чем в р. Таким образом, перестановка я с к подъемами получается (к + 1 )(п^ } способами из перестановок р, которые содержат к подъемов, плюс ((п - 2) - (к - 1) + 1) (?-]) способами из перестановок р, которые имеют к — 1 подъемов. Искомое рекуррентное соотношение
330 Специальные числа имеет вид (1с+1) п-1 (тг-к)( ) , целое п > 0. (6.35) Начать вычисления по рекуррентному соотношению можно, положив [Тс = 0], целое к, (6-36) и считая, что (?} = 0 при к < 0. Числа Эйлера полезны, в первую очередь, потому, что они предоставляют необычные связи между обычными степенями и последовательными биномиальными коэффициентами: хп = y_ пЛ /х + к п целое n ^ 0. (6-37) (Это так называемое тождество Воропицкого (Worpitzky) [378].) Например, х2 = х4 = ;wxr зИтм*;2 ;ьч*:>Чх:2Их;3 и т.д. Тождество (6.37) легко доказать по индукции (упр. 14). Кстати, (6-37) дает еще один способ вычисления суммы первых п квадратов: к2 = (*)(?) + (?)(к^) - (*) + С^1). следовательно, 1Ч2Ч---+П2 = ((!)+©+•-+(5))+(®+®+-+гГ)) = Гз^+Гз2) = *(n+1)n((n-1)+(n+2)). Рекуррентное соотношение Эйлера (6.35) несколько сложнее рекуррентных соотношений Стирлинга (6.3) и (6.8), так что не приходится ожидать, что числа (?) будут удовлетворять такому же количеству простых тождеств. Тем не менее кое-что имеется: Западные ученые недавно узнали о выдающейся китайской книге Ли Сянь-Ляня (Li Shan-Lan) [249; 265, с.320-325], опубликованной в 1867году, в которой впервые упоминается формула (6.37)- 'п L^^Hm+l-kH-l)^ k=0 (6.38)
6.2 Числа Эйлера 331 Таблица 331. Треугольник Эйлера второго порядка п 0 i 2 3 4 5 6 7 8 //П\ \\о/ \//П\ Л\1/ 0 2 8 22 52 114 240 494 \//П\ /V/ 0 6 58 328 1452 5610 19950 N //п\\ //пХ У \\3// \\4/ 0 24 0 444 120 4400 3708 32120 58140 195800 644020 \ //П\\ У \\5// 0 720 33984 , /л\\ ' \W/ 0 5040 785304 341136 ,//n\V '\\7/Л 0 40320 /П\\ W/ 0 (;)-L{;}(n;k)H)--». (6,о, Если умножить (6.39) на z71-™ и просуммировать по тп, то получим ?m {^}m!zn"m = ?k (kMz + ^k- Заменяя z на z - 1 и приравнивая коэффициенты при zk, получим (6.40). Таким образом, два последних тождества по сути эквивалентны. Первое тождество, (6.38), дает нам частные случаи при малых га: 1; 2п-п-1; Зп-(п + 1)2п+(П+1у Больше нам незачем задерживаться на числах Эйлера— достаточно просто знать о том, что они существуют, и располагать основными тождествами, чтобы иметь возможность при необходимости прибегнуть к ним. Однако, прежде чем оставить эту тему, следует упомянуть еще об одном треугольнике коэффициентов, показанном в табл. 331. Мы назовем эти числа ((?)) "числами Эйлера второго порядка" потому что они удовлетворяют рекуррентному соотношению, подобному (6.35)) но с заменой п на 2п — 1 в одном месте: 0 = №+1'«п"»+(—С:.'»- ^ С) С)
332 Специальные числа Эти числа имеют одну интересную комбинаторную интерпретацию, впервые замеченную Гессель (Gessel) и Стенли (Stanley) [147]: если образовать перестановки мультимножества {1,1,2,2, ..., п, п} с тем особым свойством, что все числа между двумя встречающимися m больше этого га, где 1 ^ га ^ п, то ((?)) представляет собой количество таких перестановок, которые содержат к подъемов. Например, имеется восемь подходящих "одно- подъемных" перестановок множества {1,1,2,2,3,3}: 113322, 133221, 221331, 221133, 223311, 233211, 331122, 331221. Таким образом, ((^)) = 8. Мультимножество {1,1,2,2,..., п, п} имеет всего L = (2п-1)(2п-3)...(1] (2п)* (642) соответствующих перестановок, потому что оба появления п должны быть смежны, и имеется 2п — 1 мест их вставки в перестановку мультимножества {1,1,2,2,..., п — 1, п — 1}. Например, при п = 3 перестановка 1221 имеет пять точек вставки, что дает 331221, 133221, 123321, 122331 и 122133. Рекуррентное соотношение (6.41) может быть доказано путем распространения на него аргументации, использовавшейся для обычных чисел Эйлера. Числа Эйлера второго порядка важны в основном в силу своей связи с числами Стирлинга [148]: индукцией по п получаем, что {.-»} ¦ ШС х х — п = Г + п - 1 - к' 2п тЛ\ /х + к 2п Г , целое п^ 0] (6.43) целое n ^ 0. (6.44) Например, W ¦ ш ¦ ш - ТК X х-1 X х-1 x:2Hf)< X х-3 ;нт ;Их:>е;21
6.2 Числа Эйлера 333 Полином ли 1/х? (А жаль...) (Мы уже сталкивались со случаем п = 1 в (6.7).) Эти тождества выполняются, когда х— целое и п— неотрицательное целое число. Поскольку правые части этих тождеств являются полиномами от х, можно воспользоваться (6.43) и (6-44) ДЛЯ определения чисел Стирлинга {х*п} и [х*п] при произвольных действительных (или комплексных) значениях х. Если п> 0, полиномы {х*п} и [ *п] равны нулю при х = О, х = 1, ... и х = п; следовательно, они делятся на (х — 0), (х — 1), ... и (х — п). Интересно взглянуть на то, что остается после деления на эти множители. Определим полиномы Стирлинга сгп(х) при помощи правила ОпМ X х — п /(х(х-1] ¦*))¦ (6-45) (Полином <тп(х) имеет степень п— 1.) Несколько первых случаев таковы: °оМ = 1/х; а, (х) - 1/2; ст2(х) = (Зх-1)/24; азМ = (х2-х)/48; сг4М = (15х3-30х2+5х + 2)/5760. Они могут быть вычислены через числа Эйлера, например <гз(х) = ((х-4)(х-5) + 8(х-4)(х+1) + 6(х+2)(х+1))/6! Оказывается, что эти полиномы удовлетворяют двум весьма привлекательным тождествам: 2JBT е*-1 = х]Г crn(x)zn; {llUT^l) = *I>n(x + n)zn. (6.46) (6.47) В общем случае, если степенной ряд St (z) удовлетворяет тождеству то ln(l-zSt(z)t_1) = -zSt(z)\ §t(z)x = x^crn(x + tn)zn. (6.48) (6-49)
334 Специальные числа Таблица 334. Формулы сверток Стирлинга п rs У g1c(r+tk) an_k(s+t(n-k)) = (r+s)crn(r+s+tn) (6.50) n s У" kgic(r+tk)gn-k(s+t(n—k)) = nan(r+s+tn) (6.51) k=0 i^T)!Cr"-m|n) (653) Таким образом, можно вывести общие формулы сверток для чисел Стирлинга, как это делалось для биномиальных коэффициентов в табл. 255; результаты приведены в табл. 334. Если сумма чисел Стирлинга не соответствует тождествам из табл. 325 или 326, то табл. 334 может оказаться как раз тем, что нужно. (Такой пример приводится позже в этой главе, после уравнения (б.юо). В упр. 7.19 обсуждаются общие принципы сверток, основанных на тождествах типа (6.46) и (6.49).) 6.3 Гармонические числа Теперь пришла пора вплотную заняться гармоническими числами, с которыми мы впервые встретились еще в главе 2: 11 1 п 1 Нп = 1 +- + - + ••• + - = У~г, целое п ? 0. (6.54) Эти числа возникают в процессе анализа алгоритмов так часто, что специалистам потребовалось для них специальное обозначение. Мы воспользуемся обозначением Нп, где 'Н' происходит от слова "harmonic" (гармонический), при этом тон с длиной волны 1 /п называется n-й гармоникой тона, длина волны которого равна 1. Вот несколько первых значений Нп: п нп 0 0 1 1 2 3 2 3 11 6 4 25 12 5 137 60 6 49 20 7 363 140 8 761 280 9 7129 2520 10 7381 2520 В упр. 21 показано, что при п > 1 числа Нп никогда не являются целыми. Ниже описан один карточный фокус, основанный на идее Р.Т.Шарпа (R.T.Sharp) [325], который иллюстрирует, насколь-
6.3 Гармонические числа 335 ко естественно гармонические числа возникают даже в простых ситуациях. Пусть у нас имеется п игральных карт и стол, на который мы хотим выложить эти карты стопкой с максимально возможным выступом над краем стола с учетом действия гравитации: Карта 2 КаРта 1 Карта ти -d3 — Стол -Иг+1 Для большей определенности задачи будем считать, что карта к располагается на карте к-И (1 ^ к < п), и потребуем, чтобы края карт были параллельны краю стола; в противном случае величину выступа можно было бы увеличить, разворачивая карты так, чтобы их уголки выступали немного дальше. Для упрощения ответа будем считать, что длина каждой карты равна 2 единицам. В случае единственной карты выступ максимален, когда ее центр тяжести находится ровно над краем стола. Поскольку центр тяжести однородной карты находится в ее центре, мы получаем выступ длиной в половину карты, т.е. длиной в 1 единицу. В случае двух карт нетрудно убедиться, что максимальная величина выступа получается тогда, когда центр тяжести верхней карты находится ровно над краем второй карты, а общий центр тяжести обеих карт — ровно над краем стола. А поскольку общий центр тяжести двух карт находится посредине их совмещенных частей, то мы в состоянии увеличить величину выступа еще на пол-единицы. Рассмотренные случаи подсказывают общий метод, в соответствии с которым карты размещаются так, чтобы центр тяжести к верхних карт располагался над краем к + 1 -й карты (которая находится под этими к верхними картами). Стол играет роль п+ 1-й карты. Чтобы выразить это условие алгебраически, можно обозначить через d^ расстояние от выступающего края самой верхней карты до соответствующего края k-й карты сверху. Тогда di = О, a dic+i следует положить равным центру тяжести к первых карт: , (di+1)+(d2+1)+-..+(dk+1) dk+1 = при 1 ^ k ^ п. (6.55) (Центр тяжести к объектов, которые имеют веса wi, ..., wk и центры тяжести которых находятся соответственно в точках pi, ... pic, располагается в точке (wipi Н bwicPk)/(wi Н bwic)-)
336 Специальные числа Это рекуррентное соотношение можно переписать двумя эквивалентными способами: kdk+1 = k+di +... + dk-i + dk, k^O; (k-1)dk = k-1 +d] +-.. + dk_i , k^1. Вычитание одного уравнения из другого показывает, что kdk+1 -(lc-1)dk = 1+dk, k^l; следовательно, dk+i = dk + 1/k. Вторая карта будет сдвинута на половину единицы длины относительно третьей карты, которая сдвинута на треть единицы длины относительно четвертой карты, которая сдвинута на... Словом, по индукции получается общая формула dk+i Н к> (6-56) и, положив к = п, мы получим полную величину выступа при укладке п карт описанным способом, равную dn+i = Нп. Нельзя ли достичь большего, воздерживаясь сначала от сдвига каждой карты на предельно возможное расстояние и накапливая "потенциальную энергию гравитации" для последующего решающего сдвига? Нет: любое устойчивое расположение карт должно удовлетворять неравенству (1+dl) + (1+d2) + ... + (l+dk) dk+i ^ к 1 ^ к ^ п. Кроме того, di = 0. Отсюда по индукции следует, что dk+i ^ Нк. Заметим, что для того, чтобы верхняя карта полностью выступала за край стола, вовсе не требуется много карт. Нам нужно столько карт, чтобы величина выступа немного превышала длину одной карты, которая равна 2 единицам. Первым гармоническим числом, превышающим 2, является ЬЦ = у§, так что нам достаточно всего лишь четырех карт. Если у нас полная колода из 52 карт, то мы получаем выступ величиной Н52 единиц, что равно Н52/2 « 2.27 длин карт. (Вскоре мы изучим формулу, которая показывает, как вычислять приближенное значение Нп при больших п, не складывая кучу дробей.) Еще одна занятная задачка— "о червяке на резинке" — демонстрирует еще один облик гармонических чисел. Медленный, но чрезвычайно упорный червяк W начинает движение от одного конца метровой полоски резины к другому и ползет со скоростью 1 сантиметр в минуту. В конце каждой минуты столь же упорный держащий резинку некто К, единственная цель жизни которого состоит в доставлении неприятностей W, растягивает ее Всякий, кто действительно пытается выложить 52 карты, похоже, имеет дело с неполной колодой...
6.3 Гармонические числа 337 Ценители виниловых дисков должны помнить это число (оборотов в минуту). на метр. Таким образом, после минуты ползания W находится в 1 сантиметре от начала и в 99 сантиметрах от конца, после чего К растягивает ее на метр. В процессе растягивания W сохраняет свое относительное положение на резинке (в 1 % от ее начала и в 99% от конца), так что теперь W находится в 2 сантиметрах от начала резинки и в 198 сантиметрах от цели. После еще одной минуты ползания на счету W 3 пройденных сантиметра и 197 сантиметрах впереди; но К в очередной раз растягивает резинку, и они превращаются в 4.5 и 295.5. И так далее... Доползет ли когда-нибудь червяк до финиша? Чем дальше он движется, тем больше удаляется от него цель. (Считается, что терпение (и время жизни) К и W, растяжимость резинки и крохотность червяка беспредельны.) Напишем несколько формул. Когда К растягивает резинку, та ее часть, которую прополз W, остается неизменной. Таким образом, за первую минуту он проползает 1/100 ее часть, за вторую— 1/200, за третью— 1/300 и т.д. После п минут часть резинки, которую проползет червяк, составляет 1/111 1 100 Т + 2 + 3+-'- + п Нп 100 (6-57) Итак, червяк достигнет цели, когда Нп превысит 100. Вскоре мы узнаем, как оценивать значение Нп при больших п, а пока что просто проверим наш анализ, рассмот в той же ситуации "суперчервяка" который в отличие от W в состоянии проползти за одну минуту 50 сантиметров. В соответствии с только что рассмотренным рассуждением за п минут он проползет Нп/2 длины резинки. Если наши рассуждения верны, то суперчервяк доберется до цели, прежде чем п достигнет 4, поскольку ЬЦ > 2. И это так: простой подсчет показывает, что после трех минут путешествия суперчервяку останется проползти всего 331 сантиметров. Он закончит свое путешествие через 3 минуты и 40 секунд. Гармонические числа появляются и в треугольнике Стир- линга. Попробуем найти аналитический вид для [™] — количества перестановок п объектов, содержащих ровно два цикла. Рекуррентное соотношение (6.8) гласит, что + (п-1)! при п > 0; и это рекуррентное соотношение является естественным кандидатом для метода суммирующего множителя из главы 2: 1 Гп+11 1 М 1 "п+1" 2 = п п _2_ + п 1 = п "п~ _2_
338 Специальные числа Развертывание этого рекуррентного соотношения приводит к птГг"1] = ^п> следовательно, п+Г 2 = nIH, (6.58) В главе 2 мы доказали, что гармонический ряд Цк 1 /к расходится, что означает, что Нп неограниченно возрастает при п —> со. Наше доказательство носило косвенный характер— мы нашли, что некоторая бесконечная сумма (2.58) дает разные результаты при перестановке ее членов, так что сумма ]Гк 1/к не может быть ограниченной. Тот факт, что Нп —» оо, представляется противоречащим здравому смыслу, поскольку, помимо прочего, это означает, что достаточно большая стопка карт может образовывать километровый выступ над краем стола и что в конце концов червяк W сможет отдохнуть, добравшись до цели своего путешествия. Давайте внимательнее посмотрим на величину Нп при больших п. Простейший путь увидеть, что Нп —> оо, вероятно, состоит в группировании членов ряда в соответствии со степенями 2. Поместим один член в группу 1, два члена в группу 2, четыре члена в группу 3, восемь членов в группу 4 и т.д.: 1 11 1111 7 + ч + э + 7 + F + 7+7 + 1 2 3 4 5 6 7 группа 1 группа 2 группа з 11_1JLJLJ_J__L + 8 + 9 +10 + n+12 + 13 + 14 + 15 + ¦" ' группа 4 Оба члена группы 2 находятся между \ и \, так что сумма группы лежит между 2-^ = ^и2-^ = 1. Все четыре члена группы 3 лежат между \ и \, так что их сумма также находится между \ и 1. И вообще, каждый из 2k_1 членов группы к находится между 2_к и 21-к; следовательно, сумма каждой отдельной группы находится между \ и 1. Такая процедура группирования показывает, что если п-й член находится в группе к, то Нп > к/2 и Hn ^ к (по индукции по к). Таким образом, Нп —> со, а в действительности Lignj + i < нп ^ LignJ + 1 (6.59) Итак, мы выяснили значение Нп с точностью до множителя 2. Хотя гармонические числа растут до бесконечности, делают они это всего лишь логарифмически, т.е. крайне медленно. Так и хочется назвать их "червячными" в честь никуда не торопящегося червяка из рассматривавшейся задачи.
6.3 Гармонические числа 339 "Теперь я вижу также способ найти. .. сумму из уе членов гармонического ряда... с помощью логарифмов, но [проделать] уе вычислений для нахождения этих правил было бы слишком затруднительно" — И.Ньютон (I. Newton) [280] Более точные границы можно получить, если приложить немного больше усилий. Как мы выяснили в главе 2, Нп представляет собой дискретный аналог непрерывной функции Inn. Натуральный логарифм определяется как площадь области под некоторой кривой, так что напрашивается следующее геометрическое сравнение: f(x) = 1/x О 1 2 3 ... п п+1 Площадь области под данной кривой от 1 и п, равная Jj1 dx/x = Inn, меньше площади указанных п прямоугольников, которая, в свою очередь, равна ?lk=i 1А = Нп. Таким образом, Inn < Нп; это более точный результат по сравнению с тем, что мы имели в (6.59)- Разместив те же прямоугольники немного по-другому, мы получим аналогично и верхнюю границу: f(x) = 1/x О 1 2 3 ... n х В этот раз площадь п прямоугольников, равная Нп, меньше площади первого прямоугольника плюс площадь области под данной кривой. Тем самым доказано, что Inn < Нп < lnn+1 прип>1. (б.бо) Итак, теперь мы знаем величину Нп с ошибкой, не превосходящей 1. (2) Гармонические числа "второго порядка" Н^ возникают при суммировании квадратов чисел, обратных натуральным, вместо суммирования просто обратных натуральных чисел: Н{?> = 1+1 + 1 + ... + J- = у 1 п 4 9 п2 ^— к2 к=1 Аналогично определяются гармонические числа r-го порядка- путем суммирования (—г)-х степеней: п 1 Н(г) = У — . (6.61) k=1
340 Специальные числа Если г > 1, то при п —> оо эти числа стремятся к некоторым соответствующим пределам; в упр. 2.31 говорилось, что этот предел обычно называют дзета-функцией Римана (Riemann): СМ Н(г) = У — (6.62) k^l Эйлер [103] открыл изящный способ использования обобщенных гармонических чисел для приближения ими обычных гармонических чисел Ил. . Рассмотрим бесконечный ряд In k-1 - 1 _L _L 1 (6.63) который сходится при к > 1. Левая его часть равна Ink—1п(к—1); таким образом, при суммировании обеих частей по 2 ^ k ^ тг левая сумма телескопируется, и мы получаем In n—In 1 А/1 1 k=2 1 1 k' 2k2+3k3+4k4+' = (Hn-i)+iK2,-i)+iK3)-i)+l(Hk4)-i)+--.. После перестановки получается выражение для разности между Нп и Inn: Hn_lnn = 1-1(н12,-1)4(н[3|-1Н(н[4)-1)--. При тг -4 со правая часть стремится к предельному значению 1 - 1(а2ы) - 1(аз)-1) - 1(с(4)-1)-•••, известному как константа Эйлера и обычно обозначаемому греческой буквой у. Поскольку С(т) — 1 приближенно равно 1/2г, этот бесконечный ряд сходится достаточно быстро, и мы можем вычислить десятичное значение у - 0.5772156649... . (6.64) Рассуждения Эйлера приводят к предельному соотношению lim (Hn-lnn) = у; (6.65) п-»оо таким образом, на Нп приходится примерно 58% длины между обеими границами из (б.бо)— так мы постепенно приблизились к его истинному значению. "Huius igitur quan- titatis const ant is С valorem detex- imus, quippe est С = 0,577218" — Л. Эйлер [103]
6.3 Гармонические числа 341 Увы: червяк не доберется до конца резинки, так как гораздо раньше— как только будет полностью перемещена башня Брахмы— наступит конец света... Как будет видно из главы 9, можно продолжить уточнения. Например, будет доказано, что 1 1 Н, In п + у + + 0< еп < 1. (6.66) 2п 12п2 120п4 ' Эта формула позволяет, не прибегая к сложению миллиона дробей, заключить, что миллионное гармоническое число есть Нюооооо « 14.3927267228657236313811275. Кроме прочего, это означает, что стопка из миллиона карт может выступать над краем стола на длину более чем семи карт. А что формула (6.66) позволяет сказать о судьбе червяка на резинке? Поскольку значение Нп не ограничено, червяк обязательно доберется до конца ленты— как только Нп превысит 100. Наше приближение Нп утверждает, что это произойдет при п, приближенно равном ,100-у 099.423 В действительности в упр. 9.49 доказывается, что переломное значение п есть либо |_е100-у_|, либо |~е100-т~|. Можно представить, с каким триумфом червяк W пересечет финишную черту к большому неудовольствию К, который поймет, что 287 децил- лионов (287 с 33 нулями) веков растягивания резинки до длины более 1027 световых лет (при этом соседние атомы резинки окажутся на межзвездных расстояниях друг от друга) потрачены впустую... 6.4 Гармоническое суммирование Рассмотрим теперь некоторые суммы, в которых содержатся гармонические числа. Начнем с небольшого повторения того, о чем мы узнали в главе 2. В (2.36) и (2.57) мы доказали, что п; (6.67) (6.68) 0^k<n Давайте рискнем и возьмемся за общую сумму, которая включает обе указанные суммы в качестве частных случаев: чему равна сумма L (>. 0^k<n х у если m— отрицательное целое число?
342 Специальные числа Метод, который лучше всего работал для вычисления (6.67) и (6.68) в главе 2, назывался суммированием по частям. Мы записывали общий член суммы в виде u(k)Av(k) и применяли общее правило Lu(x)Av(x)6x = u(x)v(x)|b-Y~ v(x+1)Au(x)6x. (6.69) а ®- * а. Вспомнили? Сумма YLo<k<n (m)^, которая теперь перед нами, тоже вполне подходит для этого метода, поскольку можно положить u(k) = Hk, Au(k) = Hk+1-Hk ] k+1 ' (Другими словами, гармонические числа имеют простую А, а биномиальные коэффициенты— простую А-1, так что мы на верном пути.) Подстановка в (б.бд) дает l ("К-ПСН* кт/ z—о \тп 0^k<n m + I ^-rt/x+1\ 6x 0 ~^-o Vm+Vx+1 m+Vn Jr U+lJk+Г Оставшаяся сумма проста, поскольку можно внести (к + I)-1 под знак биномиального коэффициента, пользуясь нашим старым проверенным равенством (б-б): ?— \ т + 1 / V -и 1 Z_ чт + 1 / к + 1 л ^— \т/ т + 1 0^к<п ч 7 0^к<п ч 7 п \ 1 чт + 1 / т + 1 Таким образом, вот искомый ответ: .lO-U,)^-^)- <*•> (Что чудесно согласуется с (6.67) и (6.68) при га = 0 и та = 1.) В следующем примере вместо умножения используется деление: давайте вычислим сумму S - У ^ k=1
6.4 Гармоническое суммирование 343 Если раскрыть Н^ согласно его определению, можно получить двойную сумму L 1$j$k$n 1 Теперь нам на помощь приходит еще один метод из главы 2: равенство (2.33) говорит нам, что ^ = \((l.{)2 + t^) =5(H* + Hj?>). (6.71) \ 4=1 7 k=1 / Оказывается, что этот ответ можно получить иначе, если прибегнуть к суммированию по частям (см. упр. 26). Теперь испытаем свои силы на более трудной задаче [354], которая суммированию по частям не поддается: Un = XL)^ (n-k)n, целое n?l. Чтобы не было и (В этой сумме нет и намека на гармонические числа; но как намека на ответ. знать— вдруг они появятся позже?) Мы будем решать эту задачу двумя способами: в одном случае трудом и потом вымучивая ответ, а во втором — полагаясь на смекалку и/или удачу. Сначала помучаемся. Разложим (п — к)п согласно биномиальной теореме, так чтобы объединить мешающее нам к в знаменателе с числителем: ^-г(Э^гС>-«'""-- к^1 ч 7 j XJ/ гЮ'-ч'-п-Е (Ji-w k^l Это не такая путаница, как может показаться на первый взгляд, потому что k^_1 во внутренней сумме является полиномом от к, а равенство (5-4°) подсказывает, что мы просто берем n-ю разность этого полинома. Оно-то так, но не совсем: сначала нам надо внести ясность в некоторые детали. Прежде всего, к^-1 не является полиномом, если j = 0; так что нам надо отделить этот член и работать с ним отдельно. Кроме того, нам не хватает члена с к = 0 из формулы для п-й разности. Этот член отличен от нуля при j = 1, так что лучше восстановить его (и тут же снова
344 Специальные числа вычесть). В результате получается Un = Отлично! Теперь верхняя строка (единственная, в которой осталась двойная сумма) равна нулю: это сумма величин, кратных тг-м разностям полиномов степени, меньшей п, а такие п-е разности равны нулю. Вторая строка тоже равна нулю за исключением случая j = 1, когда она равна — пп. Таким образом, единственное оставшееся затруднение— это третья строка. Мы свели исходную задачу к гораздо более простой сумме: Ur nn(Tn-i; где Тп = У k^l п\Н)ы к к (6.72) ^;Т3 ем т+ип-11- б» Например, U3 = (?)f - (*){ - т , ,6 - Vl Л следовательно, Из = 2.7{Is — 1), как и требовалось. Как вычислить Тп? Один способ состоит в том, чтобы заменить (?) на (п^ ) + (?ZJ)i получив простую рекуррентную зависимость Тл, от Tn_i. Однако имеется более поучительный способ: мы уже сталкивались с аналогичной формулой в (5-41)j а именно L п\(-1)* П! к/ х + к х(х + 1)... (х + п) Если вычесть член при к = 0и положить х = 0, то можно получить —Тп. Давайте так и сделаем: Тп I п! х х(х+1)... (х+п) /(х+1)...(х+п)-п! V х(х+1)... (х+п) х=0 х=0 п+11-п1 ^nK:i]+-+xr?1]+rr1]-ni х(х+1)... (х+п) х=0 тй п+1 2 (Мы использовали разложение (б.и) для выражения (х + 1)... (х + п) = хп+1/х; а в числителе можно выделить х потому, что
6.4 Гармоническое суммирование 345 I™}"1] = nl.) Но из (6.58) нам известно, что pj ] = п! Нп; следовательно, Тп = Нп, и мы получаем ответ: Un = nn(Hn-1). (6.73) Это один подход. Другой подход— попробовать вычислить значительно более общую сумму J^ (x+ky)n, целое n^O; (6.74) величина исходной суммы Un будет тогда представлять ее частный случай ип(тц—1). (К приданию большей общности нас подталкивает то, что гфедыдущий вывод "отбросил" большую часть деталей данной задачи; так или иначе те детали не должны иметь отношения к делу, ибо п-я разность их ликвидирует.) Можно было бы воспроизвести предыдущий вывод с небольшими изменениями и выяснить величину Un (х, у). Можно также заменить (х + ky)n на (х + ky)n_1 (х + ку), а затем заменить (?) на (п~ ) + (?Z-|)i что приводит к рекуррентному соотношению Un(x>y) = xlln-TfoyJ+xVn + yx11-1 ; (6.75) которое благополучно решается с помощью суммирующего множителя (упр. 5). Но проще воспользоваться другим приемом, который сослужил нам добрую службу в главе 2: дифференцированием. Производная Un(x,y) по у привносит к, которое сокращается с к в знаменателе, и мы получаем тривиальную сумму: |-lln(x,y) - ^(^(-D^nfx+lcyr-1 = ^ к^1 ^ ' TL-1 ^.^П-1 = пх (И снова п-я разность полинома степени < п обращается в нуль.) Мы доказали, что производная Un(x,y) по у равна uxn_1 независимо от у. В общем случае, если f'(у) = с, то f(у) = f(0) + су; таким образом, мы должны получить Unfoy) = Un(x,0) + nxn ] у. Остается последнее— найти Un(x, 0). Но U^^O)— это просто хп, умноженное на сумму Тп = Нп, которую мы уже рассматривали в (6.72); таким образом, общая сумма (6.74) имеет
346 Специальные числа аналитический вид Un(x,y) = xnHn + nxn-V (б-7б) В частности, решением исходной задачи является Un(n, — 1) = nn(Hn-1). 6.5 Числа Бернулли Очередная важная последовательность чисел в нашей повестке дня носит имя Якоба Бернулли (Jakob Bernoulli) (1654- 1705), открывшего любопытные соотношения при работе с формулами для сумм т-х степеней [26]. Положим п-1 Sm{n) = 0m+1m+---+(n-1)m = ?2 km - ^Пхт6х. (6.77) (Таким образом, Sm(n) = H^"!™ при m > 0 при использовании обозначений для обобщенных гармонических чисел.) Рассматривая ряд приведенных ниже формул, Бернулли обнаружил в них некоторую закономерность: So(n) Si(n) S2(n) S3(n) S4(n) S5{n) S6(n) Sy(n) S8(n) S9(n) Sio(n) = = = = = = = = = = = n X X X X X X ln8 8п 9n _Lnio _Lnii 11 rL "in -X -X -X -In5 -In6 -X -In8 -X -In10 + + + + + + + + ' + А вы ее не видите? Коэффициент при пт+1 в Sm(ti) всегда равен 1/(т+ 1). Коэффициент при nm всегда равен —1/2. Коэффициент при nm_1 всегда равен... посмотрим... да, т/12. Коэффициент при nm~2 — всегда нуль. Коэффициент при nm~3 всегда. .. посмотрим... ну-ка, ну-ка... да, конечно, это —m(m—1) х (т — 2)/720. Коэффициент при nm~4 всегда равен нулю. Похоже, что если эту закономерность продолжить, то коэффициент In X х- _5_п4_ 12 rL 1п5- 12ri 3ri fn8- I-9- з> w b3 24 n 15 Fl _ZLn6 n7 + + + + + iin 12n X ^4 n5
6.5 Числа Бернулли 347 при nm_k всегда будет представлять собой некоторую константу, умноженную на га-. Именно это эмпирически нашел Бернулли. (Доказательства он не дал.) В современной записи мы записываем эти коэффициенты в виде -ssTZCtV-'-'- (в78) Числа Бернулли определяются неявным рекуррентным соотношением У" ( . jBj = [m = 0] для всех m ^ 0. (6-79) j=o ^ ' ' Например, (0)Во + (-,)Bi = 0. Несколькими первыми числами Бернулли являются п Вп 0 1 1 1 2 2 1 6 3 0 4 -1 30 5 0 6 1 42 7 0 8 -1 30 9 0 10 5 66 11 0 12 -691 2730 (Все надежды на простой аналитический вид Вп улетучиваются при появлении странной дроби —691/2730.) Формулу Бернулли (6.78) можно доказать по индукции по га, с помощью метода приведения (один из способов, применяя который, мы нашли в главе 2 сумму Sz[n) = Пп)' п-1 m+l _ Sm+1(n)+u™+1 = ?(k+1 k=0 п-1 m+1 = L(mr)s'(n)- (6-8o) j=o ^ ' ' Обозначим через Sm(n) правую часть (6.78); мы хотим показать, что Sm(n) = Sm(n) в предположении, что Sj(n) = Sj(n) при 0 ^ j < m. Начнем так, как мы делали в главе 2 для га = 2, вычитая Sm+i (п) из обеих частей (6.8о). Затем распишем каждое Sj(n) с использованием (6.78) и перегруппируем члены так, чтобы коэффициенты при степенях п в правой части оказались
348 Специальные числа рядом и упростились: n--f(Y)w-f(T)^0- = L (т+,)(н1)%г-к+,+(-+,>д ,к+1 - i^i(T)(1)w*- 0§к$т k«:j$m ч "" у ч 7 v- Пк+1 /т+1\ v- Лп+1-к\ ,, ... = L ^Т( к J L { j jBl+(m+1)A = O^k^m x 70^j^m-k4 J 7 = z w(mk1)[m-k=01+(m+1)A = O^k^m П m+1 /m+1 +(m+1)A = m+1 \ та = пт+1+(т+1)Д, где A = Sm(n)-Sm(n). (Этот вывод представляет собой хороший обзор стандартных методов, изученных в главе 5.) Таким образом, А = 0 и Sm(n) = Бш(п). QED В главе 7, применяя производящие функции, мы докажем Далее речь пойдет (6.78) гораздо проще. Ключевая идея этого доказательства в том, ° несколько более ^ _. ,- о 1 тонких материях. чтобы показать, что числа Бернулли представляют собой коэф- с котошми вы ве_ фициенты степенного ряда роятно, на первый раз предпочтете z ^— zn просто бегло озна- z _ 1 = 2— тт7 ' (6.81) комиться. п^о ' —Сочувствующий ассистент Пока же давайте просто считать, что (6.8i) действительно выполняется, так что мы можем вывести из него некоторые удивительные следствия. Если к обеим частям прибавить ^z, избавляясь тем самым от члена B-\z/M = —\z в правой части, можно Начало ознакомления
6.5 Числа Бернулли 349 "Действительные" функции получаются при использовании мнимых чисел... получить Z Z ez - 1 + 2 = = 2 е*-1 z е z/2 + е -г/2 /т /V — ^ cth — 2 ez/2 - е-*/2 2 2 (6.82) Здесь cth означает "гиперболический котангенс" функцию, известную также как отношение chz/shz, где shz г*- — е ez + e" 2 , chz = . (6.83) Замена z на —z дает (z^n) cth(^) = | cth|; следовательно, каждый коэффициент с нечетным номером в разложении | cth | должен быть нулевым, и мы имеем В3 = В5 = В7 = В9 = B^^ = В13 = ••¦ = 0. (6.84) Кроме того, равенство (6.82) приводит к аналитическому виду для коэффициентов разложения cth: zcthz 2z p2z. 1 2z 2 2n" (2z ,2n (2n) = ^4"B2n r2n nJjO (2n)! (6.85) Однако особым спросом на рынке функций гиперболические функции не пользуются; более популярны "реальные" тригонометрические функции. Обычные тригонометрические функции можно выразить через их гиперболические аналоги при помощи правил sinz = —ishiz, cosz = chiz; (6.86) соответствующие степенные ряды представляют собой z1 z3 z5 ShZ= ТТ+3!+5!+---; Z° Z2 Z4 Chz= 0! + 2!+4!+---- cosz/sinz = ichiz/shiz = icthiz, и мы Z1 smz = - z° cosz = - z3 z5 3! + 5! z2 z4 2! + 4! Следовательно, ctgz получаем zctgz = Y" В 2тг- (2iz; i2n n^O (2n) Jj-4)nB2n n^O ^2n (2n)! (6.87) Другая замечательная формула для zctgz была найдена Эйлером (см. упр. 73): ZCtgZ = 1 - 2 Y_ ь2.2 .2 • (б'88) к>1 к27Т2 - Z2
350 Специальные числа Формулу Эйлера можно разложить по степеням z2, получив : ctg z = 1 — 2 2__ к^1 2 + + к2я2 tfrf к6п6 + = 1-2 ±-Н?> + ^Н^ + ±* н# + 71' 2 со 7I4 71° Приравнивая коэффициенты при z2n с соответствующими коэффициентами в другой формуле, (6.87), получаем почти волшебное аналитическое выражение для бесконечного количества бесконечных сумм: С(2п) - Н?п> - (-1) Например, п_^22^п2пВ2п (2п)! целое п > 0. (6.8д) С(2) = Н%] = 1+i+fH" = тт2В2 = тт2/6; (6.9о) С(4) = Нй> = 1+11,+?+... = -тг4В4/3 = 7^/90. (б.дх) Формула (6.8д) не только представляет собой аналитический вид для НооП , но и дает информацию о приблизительной величине чисел В2п, поскольку Ноо очень близко к 1 при больших п. А еще она говорит о том, что (—1)п_1В2П > 0 для всех п > 0; таким образом, отличные от нуля числа Бернулли являются знакочередующимися. И это еще не все. Числа Бернулли появляются и в коэффициентах разложения тангенса, tgz smz cosz ^(_1)n-i4n{4n_1)B2n: n.30 ,2n-1 (2n) (6.92) а также других тригонометрических функций (упр. 72). Формула (6.92) приводит к другому важному факту о числах Бернулли, а именно, что 12п-1 = (-V x-i4n(4"-1) 2n Вт — положительное целое, (б.дз) Например, п Тп 1 3 1 2 5 16 7 272 9 7936 11 353792 13 22368256 Отсюда можно вообще не читать (Числа Т называются тангенциальными числами.)
6.5 Числа Бернулли 351 Когда х = tgw, это дает tg{z + w). Следовательно, по теореме Тейлора, тг-я производная tgw равна Tn(tgw). Один из способов доказательства утверждения (6.93), следуя идее Б. Ф. Логана (В. F. Logan), состоит в рассмотрении степенного ряда sin z+x cos z cos z—x sin z - x+(1+x2)z+(2x3+2x)—+(6x4+8x2+2)—+... = Цтп(х) n^O Z,u (6.94) где Tn(x) — полином от x. Подстановка x = О дает Tn(0) = Tn, n- e тангенциальное число. Если продифференцировать (6.94) по х, можно получить 1 ~п 1 ZTnW- (cosz — xsinz)2 TL^O n! но если продифференцировать no z, то будет получено 1+х2 _ -п"1 in 7.I2 cosz —х sin z 1тп(> (n-1)! X T*+1 (* n^O n! (Попробуйте сами— здесь получается очень красивое сокращение.) Таким образом, мы имеем Тп+1(х) - (1+х2)Т;(х), То(х) (6-95) простое рекуррентное соотношение, из которого следует, что коэффициенты Тп (х) — неотрицательные целые числа. Кроме того, можно легко доказать, что полином Тп(х) имеет степень п+1 и что его коэффициенты попеременно нулевые и положительные. Поэтому T2n+i (0) = T2n+i являются положительными целыми числами, что и утверждалось ранее в (6.93). Рекуррентное соотношение (6.95) предоставляет нам простой способ вычисления чисел Бернулли через тангенциальные числа с использованием только простых операций над целыми числами; определяющее же числа Бернулли рекуррентное соотношение (6.79)) напротив, требует сложных вычислений с дробями. Вычислить сумму n-х степеней от а до b — 1, а не от 0 до п— 1, как гласит теория из главы 2, можно следующим образом: ъ-i b У km - У xm6x = Sm(b)-Sm(a). (6.96) ' * a Это тождество имеет интересные следствия, если рассматривать отрицательные значения к. Имеем -1 тг-1 ^Г кт = (-1 )т ?_ кт , когда т > 0, k=-n+1 k=0
352 Специальные числа следовательно, Sm(0)-Sm(-n+1] -iP(Sm(n)-Sm(0)) Но поскольку Sm(0) =0, мы получаем соотношение Sm(l-n) = (-1)m+1Sm(n), m>0. (6-97) Таким образом, Sm(1) = 0. Если мы разложим полином Sm(rL) на множители, то среди них всегда будут множители п и (п— 1), потому что этот полином имеет корни 0 и 1. В общем случае Sm(n) представляет собой полином степени га + 1 со старшим членом _1_птч-1 Более того, можно подставить п = ^ в (6.97) и получить, что Sm(^) = (—l)m+1Sm(^); если га четное, то Sm(^) = 0, так что еще одним множителем будет (п — \). Эти наблюдения поясняют, почему в главе 2 нам удалось найти такое простое разложение, как S2(n) = ln(n- l)(n-1); там можно было воспользоваться подобным рассуждением для выяснения величины Szin) без ее вычисления! Кроме того, из (6.97) вытекает, что полином с остальными множителями, Sm(Ti) = Sm(n)/(n — j), всегда удовлетворяет соотношению §т(1 — тг) = S-mXri), га четное, га > 0. Отсюда следует, что Sm(n) всегда можно записать в виде произведения 1 Гт/21 т+1 ТТ (п— j—(Х]с)(тг— j+ot^), га нечетное; Sm(n) = < k=l (n_l) m/2 —tV П (n~i~aic)(n-i+aic) > m четное. (6.98) k=1 Здесь oci =|,aa2,..., a Гт/21 — соответствующие комплексные числа, значения которых зависят от га. Например, Иоганн Фаулха- бер (Johann Faul- haber) неявно использовал (6.qy) в 1631 году [119] при поиске простых формул, выражающих Sm{n) в виде полиномов от тг(тг + 1)/2 при т^ 17; см. [222]. S4(n) S5(n) S6(n) n2(n-1)2/4; п(п-1)(п-1)(п4+У77Т2)(п4-У77Т2)/5; n2(n-l)2(n-l+y374)(n-l-v^74)/6; n(n-l)(n--1)(n-l+a)(n"^--a)(n-l+oc)(n-l-a)/7, где а-2-3/23"1/4(\/\/зТ+\/27+г\/\/зТ-\/27).
6.5 Числа Бернулли 353 Конец пропускаемого , текста Если га нечетное и больше, чем 1, то Вт = 0; следовательно, Sm(n) делится нап2 (ина (тг-1)2). В противном случае корни полинома Sm(n), по-видимому, не должны подчиняться какому- то простому правилу. Завершим изучение чисел Бернулли выяснением того, как они связаны с числами Стирлинга. Один из способов вычисления суммы Sm(n) состоит в замене обычных степеней убывающими, поскольку убывающие степени просто суммируются. После вычисления подобных простых сумм можно опять вернуться к обычным степеням: п-1 тг-1 Sm(Tl) П.— I /• n /• -ч П.— I k=0 k=0j^0 У)) j^O k J J k=0 )>o ?{?}пртГ< -Dj + 1-k j + 1 k TV Таким образом, приравнивая коэффициенты к соответствующим коэффициентам в (6.78), мы должны получить тождество \^0 К } J J + 1 k j + l 1 m+1 m+1 k Bm+i-k> k > 0. (6.99) Было бы неплохо доказать это соотношение непосредственно, получая тем самым другой способ определения чисел Бернулли. Однако ни правила табл. 325, ни правила табл. 326 не дают нам сколь-нибудь явного повода рассчитывать на доказательство по индукции, что сумма слева в (6.99) представляет собой константу, умноженную на га—-. Если к = га + 1, то сумма в левой части равна {™} [™+i]/(Tn+1) = 1/(ттН-1), так что в этом случае все просто. А если к = та, то сумма в левой части сводится «{m-i}G3™-,-{™}rm](^ + 1)-1=i(m-1)-im = -J. так что и этот случай достаточно прост. Но при k < m сумма в левой части выглядит ужасно. Вряд ли Бернулли открыл бы свои числа, пойдя таким путем. Единственное, что можно сделать,— это заменить {т} на {™^~., } — (] + 1 ){j+i}• Тогда (j + 1) отлично сокращается с мешающим нам знаменателем и левая часть превращается в ?&'} 3+1 к j+1 ш j+1 к -1)'+1-\
354 Специальные числа При к < га вторая сумма равна нулю в соответствии с (6.31). Это оставляет нас наедине с первой суммой, которая требует смены декораций: переименуем все переменные так, чтобы индексом суммирования было к и чтобы остальными параметрами были та и п. Тогда тождество (6.99) будет эквивалентно тождеству Ш (-1) k—m 1 /п п \ та Bn_m + [m = n-1], m > 0. (б.100) Неплохо— мы получили нечто более привлекательное, хотя табл. 326 все еще ничего не подсказывает насчет очередного шага. Теперь на помощь приходят формулы сверток из табл. 334: можно воспользоваться формулами (6.53) и (б-52) ДЛЯ того, чтобы выразить общий член суммы через полиномы Стирлинга: к/[ 3 к' та (-l)b-m = (-1) п-к+1 П.! (Тс—1)! стп_к(-к)- к! (гя-1)! о\-т(к); (-1 \п+1 — га п! ап_к(-к)сгк_т(к), к v "' (т-1)! Ситуация улучшается; свертка в (6.50) при t = 1 дает Y_ an_k(-k) ak_m(k) = Y_ cjn_m_k(-TL+(n-m-k)) ak(m+k) = an_m(m-n+(n-m)). k=0 k=0 m—n (m)(-n) Формула (б.юо) проверена, и мы установили, что числа Бернул- ли связаны с постоянными членами полиномов Стирлинга: Вт т! = -mam(0). (6.101) Конец беглого г ознакомления 6.6 Числа Фибоначчи Теперь перейдем к особой последовательности чисел — быть может, самой приятной из всех— последовательности чисел Фибоначчи (Fn): п Fn 0 12 3 4 5 6 7 8 9 10 11 12 13 14 0 1 1 2 3 5 8 13 21 34 55 89 144 233 377 В отличие от гармонических чисел и чисел Бернулли, числа Фибоначчи представляют собой обычные бесхитростные целые чис-
6.6 Числа Фибоначчи 355 ла, определяемые рекуррентным соотношением Противоестественная природа этого примера возмутительна! Комиссии по защите общественной морали следует немедленно запретить эту книгу! Fo = 0; Ft = 1; Fn = Fn_i + Fn_2 при n > 1. (6.102) Простота этого правила— простейшего из всех рекуррентных соотношений, в которых каждое число зависит от предыдущих двух— служит пояснением того, почему числа Фибоначчи так часто встречаются в самых разных ситуациях. Наглядным примером естественного возникновения чисел Фибоначчи являются "пчелиные деревья'.' Давайте рассмотрим родословную самца пчелы. Каждый самец пчелы (именуемый трутнем) появляется на свет непарным путем от самки (именуемой маткой); но каждая самка имеет двух родителей— самца и самку. Вот несколько первых уровней такого дерева: сг- -? 9 9 <$- -9 -9 '9 9 & У трутня один дед и одна бабка, один прадед и две прабабки, два прапрадеда и три прапрабабки. В общем случае, как легко установить по индукции, у него ровно Fn+i прап-дедушек и Fn+2 прап-бабушек. Числа Фибоначчи часто обнаруживаются в природе— возможно, по причинам, аналогичным закону образования родословного дерева пчел. Например, в цветке типичного подсолнуха плотно упакованные семечки располагаются по спиралям; обычно это 34 спирали, закручивающиеся в одном направлении, и 55— в другом. Меньшие цветки содержат 21 и 34 спирали, или 13 и 21 спираль; в Англии однажды демонстрировался гигантский подсолнух с 89 и 144 спиралями. Аналогичные закономерности обнаруживаются и в некоторых видах сосновых шишек. Вот пример другого рода [277]. Предположим, что одна на другую наложены две стеклянные пластинки. Сколько сущест-
356 Специальные числа вует способов ап прохождения луча света через пластинки или отражения от них после изменения его направления п раз? Вот несколько первых случаев: Когда п четное, получается четное число преломлений и луч проходит сквозь пластинки; когда п нечетное, луч отражается и выходит с той же стороны, с которой вошел. Похоже, что ап представляют собой числа Фибоначчи, и непродолжительное разглядывание рисунка показывает, почему: при n ^ 2 преломляющиеся п раз лучи либо претерпевают первое отражение от внешней поверхности и продолжают прохождение an_i способами, либо начинают с отражения от внутренней поверхности и затем снова отражаются в обратном направлении, чтобы закончить an_2 способами. Таким образом, мы получаем рекуррентное соотношение Фибоначчи aTI = an_i + an_2. Начальные условия отличаются, но не слишком сильно, потому что ао = 1 = У2 и ai = 2 = F3; так что все просто сдвигается на две позиции, и an = Fn+2. Эти числа были введены Леонардо Фибоначчи (Leonardo Fibonacci) в 1202 году, и математики стали выявлять все новые и новые интересные факты об этих числах. Эдуард Люка (Edou- ard Lucas), причастный к головоломке о Ханойской башне (которая рассматривалась нами в главе 1), активно работал над ними "La suite de Fi- во второй половине XIX века (кстати, именно с легкой руки Люка bonacci possede эти числа стали именоваться "числами Фибоначчи"). Одним из удивительных результатов, полученных Люка, стало применение свойств чисел Фибоначчи для доказательства того, что 39-знач- ное число Мерсенна 2127 — 1 является простым. Одной их старейших теорем, связанных с числами Фибоначчи, было тождество, впервые опубликованное итальянским астрономом Джованни Доменико Кассини (Gian Domenico Cassini) в 1680 году [51]: des proprietes nombreuses fort interessantes" — Э. Люка [259] Fn+i Fn-i —Fn = (~1> при n > 0. (6.103) При п — в^ например, тождество Кассини совершенно справедливо утверждает, что 13-5—82 равно 1. (Иоганну Кеплеру (Johannes Kepler) это тождество было знакомо еще с 1608года [202].) Полиномиальная формула, которая включает числа Фибоначчи вида Fn±k при малых значениях к, может быть преобразована в формулу, которая включает в себя только Fn и Fn+i,
6.6 Числа Фибоначчи 357 Парадокс объясняется тем, что.. впрочем, кто же будет объяснять волшебство? потому что можно воспользоваться правилом • m — ' m+2 — ' т+1 (6.104) для выражения Fm через большие числа Фибоначчи при т < п и формулой Fm = F т-2 "Г гт-1 (6.105) для замены Fm меньшими числами Фибоначчи при т > п + 1. Так, например, можно заменить Fn_i на Fn+i — Fn в (6.103), чтобы получить тождество Кассини в виде -1 — fn+i rn ¦ -Dn. (6.106) Кроме того, если заменить п на п+1, тождество Кассини примет вид Fn+2Fn-F^+1 = (-1)n+1; это то же самое, что и (Fn+i +Fn)Fn—Fn+ ^ = (—1 )n+1, что, в свою очередь, совпадает с (б.юб). Таким образом, "Кассини(тг)" истинно тогда и только тогда, когда истинно "Кассини(гН-1)", так что по индукции (6.юз) выполняется для всех п. Тождество Кассини лежит в основе геометрического парадокса, который был одной из любимых головоломок Льюиса Кэр- рола (Lewis Carroll) ([63], [319], [364]). Суть его в том, чтобы разрезать шахматную доску на части, из которых затем составить прямоугольник: Исходный квадрат из 8 х 8 = 64 клеток превращается в прямоугольник из 5 х 13 = 65 клеток! Аналогичное построение разбивает любой квадрат размером Fn х Fn на четыре части с размерами сторон Fn+i, Fn, Fn-i и Fn_2 вместо соответственно 13, 8, 5 и 3 в нашем примере. В результате получается прямоугольник размером Fn_i х Fn+i; в соответствии с (6.103) одна клетка либо прибавляется, либо утрачивается— в зависимости от того, четное или нечетное п. Строго говоря, правило (6.105) можно применять только при га ^ 2, потому что мы не определили Fn для отрицательных п.
358 Специальные числа Большую свободу действий можно получить, если избавиться от этого условия и использовать (6.104) и (6.105) для определения чисел Фибоначчи с отрицательными индексами. Например, F_i оказывается равным Fi — F0 = 1, a F_2 — равным F0 — F_i = —1. Таким способом мы выводим значения п Fn 0 -1 0 1 -2 -1 -3 2 -4 -3 -5 5 -6 -7 -8 13 -8 -21 -9 34 -10 -55 -11 89 и вскоре становится ясно (по индукции), что F_n = (—1)n_1Fn> целое п. (6.107) Тождество Кассини (6.103) ПРИ таком обобщении последовательности Фибоначчи становится справедливым при любых целых п, а не только при п> 0. Процесс сведения Fn±k к комбинации гп и гтг+1 с применением правил (6.105) и (6.104) приводит к последовательности формул Ftl+2 = Ьг+1 + Fn Fn_i = Fn+i — Fn Fn+з = 2Fn+i + Fn Fn_2 = —Fn+i +2Fn Fn+4 = 3Fn+i +2Fn Fn_3 = 2Fn+i — 3Fn F-tl+5 = 5Fn+i +3Fn Fn_4 = — 3Fn+i H-5Fn из которой становится очевидной еще одна закономерность: Fn+k = Wn+i +Fk_iFn. (6.108) Это легко доказываемое по индукции тождество справедливо при любых целых кип (положительных, отрицательных или равных нулю). Если в (6.ю8) положить к = п, то можно получить, что Ъп = FnFn+1+Fn-iFn; (6.109) следовательно, F2n кратно Fn. Аналогично и можно заключить, что F3n также кратно Fn. По индукции Fic-n. кратно Fn , (6.110) при любых целых кип. Это поясняет, например, почему Fis (равное 610) кратно как F3, так и F5 (которые равны соответственно 2 и 5). На самом деле истинно даже большее— в упр. 27 доказывается, что HOA(Fm,Fn) =FH0A(m)U). (6.111)
6.6 Числа Фибоначчи 359 Например, HOA(F12>F18) = НОД(144,2584) = 8 = F6. Теперь можно доказать обращение свойства (6.но): если п > 2 и если Fm кратно Fn, то га кратно п. Действительно, если FnYFm, то Fn\HOA(Fm,Fn) = РНод(т)П) ^ Fn. Это возможно только тогда, когда ^HOA(mn) = ^п> и наше допущение, что п > 2, приводит к необходимости того, что НОД(тгцп) = п. Следовательно, п\т. Обобщение этих идей было использовано Юрием Матиясе- вичем в его знаменитом доказательстве [266] того, что не существует алгоритма, позволяющего выяснить, разрешимо ли в целых числах заданное полиномиальное уравнение относительно многих неизвестных с целыми коэффициентами. Лемма Матиясеви- ча утверждает, что при п > 2 число Фибоначчи Fm кратно F2 тогда и только тогда, когда m кратно nFn. Докажем это путем рассмотрения последовательности (FkrL mod F^) при k = 1, 2, 3, ..., и выяснения, когда Fkn mod F2 = 0. (Мы знаем, что га должно иметь вид kn, если Fm mod Fn = 0.) Вначале мы имеем Fn mod F2 = Fn, что не равно нулю. Затем согласно (6.ю8) получаем Ьп = FnFn+i+Fn_iFn = 2FrLFTL+1 (modF2), поскольку Fn+i = Fn_i (mod Fn). Аналогично F2n+i = Fn+1+F^ = F^+1 (modF2). Это сравнение позволяет вычислить ^зп = F2n+iFn + F2nFn-i = = F721+1 Fn + (2FnFn+1 )Fn+1 = 3F^+1 Fn (mod F2); F3n+i = F2n+iFn+i+F2nFn = = F^+1 + (2FnFn+1 )Fn = F^+1 (mod F2). В общем случае по индукции по к находим, что Fkn = kFnF^;] и Fkn+1 = F*+1 (modF2). Поскольку Fn+i взаимно простое с Fn> то Fkn = 0 (mod F2) <Ф=> kFn ее 0 (mod F*) Ф=> <=^ k = 0 (modFn). Лемма Матиясевича доказана. Одно из наиболее важных свойств чисел Фибоначчи— особый способ представления целых чисел с их использованием. Будем писать j > к <=> j $> к + 2. (6.И2)
360 Специальные числа Тогда каждое положительное целое число имеет единственное представление вида п = Fkl + Fk2 + • • • + Fkr, кт > к2 > • • ¦ » kr > 0. (6.113) (Это "теорема Цеккендорфа (Zeckendorf)" [246], [381].) Например, один миллион можно представить следующим образом: 1000000 = 832040 + 121393 + 46368 + 144 4-55 = = F30 + F26 + F24 +F12+ Fio- Такое представление всегда может быть найдено с применением "жадного" алгоритма, когда в качестве Fkl выбирается наибольшее возможное число Фибоначчи ^ п, затем в качестве Fk2 выбирается наибольшее число ^ n — Fkl, и т.д. (Более строго, предположим, что Fk ^ n < Fk+i; тогда 0 ^ n — Fk < Fk+i — Fk = Fk_i. Если n— число Фибоначчи, то представление (6.113) справедливо при г = 1 и ki = к. В противном случае индукция по п показывает, что n — Fk имеет фибоначчиево представление Fk2 + • • • + Ficr, и представление (6.113) справедливо, если положить ki = к, потому что из неравенства Fk2 ^ п — Fk < Fk_i вытекает, что к ^> кг.) И обратно, всякое представление вида (6.из) означает, что Fki ^ п < Ffci+i > потому что наибольшим возможным значением Fk2 Н hFkr при к > кг > • • • > кг > 0 является Fk-2+Fk-4+- • •+Fkmod2+2 = Fk-i-1 , если к ^ 2. (6.114) (Эта формула легко доказывается индукцией по к; ее левая часть обращается в нуль при к, равном 2 или 3.) Поэтому ki представляет собой описанную выше "жадно" выбранную величину, и это представление должно быть единственным. Любая система однозначного представления чисел является системой счисления; следовательно, теорема Цеккендорфа приводит к фибоначчиевой системе счисления. Любое неотрицательное целое число п может быть представлено в виде последовательностей нулей и единиц следующим образом: та п = (ЪтЪт_-| ...b2)F <=> п = ^TbkFk. (6.115) k=2 Эта система счисления отчасти похожа на двоичную (с основанием 2), с тем отличием, что в ней никогда не встречаются две
6.6 Числа Фибоначчи 361 единицы подряд. Например, вот как выглядят числа от 1 до 20, представленные по Фибоначчи: 1 = (000001 )F 2 = (000010)F 3 = (000100)F 4 = (000101 )F 5 = (001000)F 6 = (ooi ooi ь 7 = (001010)F 8 = (010000) F 9 = (010001 )F 10 = (010010)F 11 = 12 = 13 = 14 = 15 = = (010100)f = (010101)F = (100000)F = (100001)f = (100010)f 16 = (iooioo)F 17 = (100101)F 18 = (101000)f 19 = (101001)F 20 = (101010)f Фибоначчиево представление миллиона, показанное ранее, может быть сопоставлено с его двоичным представлением 219+218 + 217+216 + 214 + 29+26: (ЮООООО)ю - (10001010000000000010100000000)F - (11110100001001000000)2. Фибоначчиево представление требует несколько большего количества битов, потому что соседние единицы в нем не допускаются; в остальном эти представления аналогичны. При добавлении 1 в фибоначчиевой системе счисления возникают два случая. Если "разряд единиц" равен 0, мы заменяем его на 1, т.е. добавляем F2 = 1, поскольку разряд единиц связан с ?2 • В противном случае двумя младшими цифрами оказываются 01, и мы заменяем их на 10 (тем самым добавляя F3 — ?2 = 1). Наконец, мы должны выполнить необходимое количество "переносов" заменяя набор цифр (01 Г на Ч 00', пока в строке не будут отсутствовать две подряд идущие цифры 1. (Это правило переноса эквивалентно замене Fm+i + Fm на Fm+2.) Например, для перехода от 5 = (ЮОО)р кб = (1001 )f или от 6 = (1001 )р к7 = (1010)р переносы не требуются; но для перехода от 7 = (1010)]= к 8 = (10000)f следует выполнить два переноса. Несмотря на обилие рассмотренных нами свойств чисел Фибоначчи, мы пока не сталкивались с их аналитической записью. И хотя выражения в аналитическом виде не были найдены ни для чисел Стирлинга, ни для чисел Эйлера или Бернулли, для гармонических чисел нам все же удалось получить аналитическое выражение Hn = [nJ ]/п!. А нет ли какой-нибудь связи между Fn и другими известными нам величинами? Можно ли "разрешить" рекуррентное соотношение, которое определяет Fn? Ответ утвердительный: действительно, существует простой способ решения этого рекуррентного соотношения, если воспользоваться понятием производящей функции, вкратце рассматри-
362 Специальные числа вавшейся в главе 5. Рассмотрим бесконечный ряд F(z) - Fo + FTZ + F^-f... = ^Fnzn. (6.116) n^O Если мы найдем простую формулу для F(z), то появятся шансы найти простую формулу и для его коэффициентов Fn. В главе 7 мы полностью сосредоточимся на производящих функциях, но к тому времени, когда мы до них доберемся, полезно будет иметь в запасе этот пример. Степенной ряд F(z) имеет одно замечательное свойство, которое обнаруживается при его умножении на z и z2: Hz) zF(z) = z2F(z) = F0 + Ftz + F2z2 + F3z3 + F4z4 + F5z5 + F0z + Ftz2 + F2z3 + F3z4 + F4z5 + F0z2 + Ftz3 +F2z4 + F3z5 + Если теперь вычесть два последних равенства из первого, то члены, включающие z2, z3 и более высокие степени z, исчезнут в силу рекуррентного соотношения Фибоначчи. Кроме того, постоянный член Fo на самом деле никогда не оказывается первым, потому что Fo = 0. Таким образом, все, что остается после вычитания,— это (Fi — Fo)z, т.е. просто z. Другими словами, F(z)-zF(z)-z2F(z) - z, и решение относительно F(z) дает нам компактную формулу z Hz) 1 ¦z — z^ (6.117) Итак, вся информация, содержащаяся в последовательности Фибоначчи, свернута в несложное (хотя и непонятное) выражение z/(1 — z — z2). Поверите вы в это или нет, но это прогресс, потому что теперь мы можем разложить знаменатель на множители и воспользоваться элементарными дробями для получения формулы, которую легко разложить в степенной ряд. Коэффициенты этого степенного ряда дадут нам выражение для чисел Фибоначчи в аналитическом виде. Набросанный план может оказаться понятнее, если подойти к нему с другого конца. Если имеется какая-нибудь более простая производящая функция (скажем, 1/(1 — ocz), где а— константа), то нам известны коэффициенты при всех степенях z, потому что 1 1 — otz 1 + ocz + oTzz + cCz5 + .3^3 "Sit 1 + x + 2xx + 3x3 4- 5x4 + 8x5 + 13x6 +21x7 + 34x8 &c Series nata ex divisione Unit at is per Trinomium 1 — x — xx " —А.деМуавр (A.deMoivre) [76] "Величины r, s, t, показывающие отношения членов, совпадают с аналогичными величинами в знаменателе дроби. Г-ндеМу- авр был первым, кто применил это свойство, каким бы очевидным оно ни казалось, к решению задач о бесконечных рядах, решить которые по-другому было бы весьма затруднительно" — Дж. Стирлинг (J.Stirling) [343]
6.6 Числа Фибоначчи 363 Как обычно, авторы не могут устоять перед хитростями. .. Аналогично, если у нас есть некоторая производящая функция А/(1 — otz) 4- В/(1 — (3z), то коэффициенты также легко вычисляются, потому что otz + В 1-[3z A^(az)n + B^((3z)n 2jActn + Bpn)zn. (6.118) n^O Таким образом, все, что от нас требуется, — это найти константы А, В, а и (3, такие, что А В z + 72 > 1 — (XZ 1 — (3z 1 — z — z^ и тогда мы получим выражение в аналитическом виде Аап+В(Зп для коэффициента Fn при zn в F(z). Левую часть можно переписать как А В _ A-A(3z + B-Bcxz 1 - otz + 1 - (3z " (1-cxz)(1 -|3z) ' так что интересующие нас четыре константы являются решениями двух полиномиальных уравнений: (1-az)(1-|3z) = 1-z-z2; (A + B)-(A(3 + Ba)z = z. (6.119) (6.120) Мы хотим представить знаменатель F(z) в виде (1 — az)(1 — (3z); тогда мы сможем выразить F(z) в виде суммы двух дробей, в которых сомножители (1 — cxz) и (1 — (3z) удачно отделены друг от АРУга. Обратите внимание, что в знаменателе уравнения (6.119) сомножители записаны в виде (1 — <xz)(1 — |3z), а не в более привычной форме c[z— pi )(z— Р2), где pi и р2— корни уравнения. Причина этого в том, что запись (1 — cxz)(1 — |3z) приводит к более привлекательным разложениям в степенные ряды. Найти а и (3 можно разными способами, в одном из которых используется тонкая уловка. Введем новую переменную w и поищем разложение w ¦ wz- (w — cxz)(w— |3z), Тогда мы сможем просто положить w — 1 и получить разложение 1 —z—z2. Корни уравнения w2—wz—z2 — О можно найти при помощи обычной формулы для корней квадратного уравнения — они равны z ± \Д2 + 4z2 1 ± \/5
364 Специальные числа Таким образом, w ¦ wz- w- 1+х/5 w- 1 -у/Ь и искомые константы а и (3 найдены. Число (1 +V5)/2« 1.61803 играет важную роль во многих разделах математики, а равно и в мире искусства, где с античных времен оно считается эстетически наиболее благоприятным. Оно даже получило собственное имя, отношение золотого сечения, и обозначается греческой буквой ф в честь Фидия, который, как утверждается, сознательно использовал его в своих скульптурах. Второй корень, (1 — л/5)/2 = — 1/ф « —.61803, обладает многими свойствами числа ф, так что у него тоже есть собственное имя — ф, "фи с крышей" Оба эти числа являются корнями уравнения w2 — w — 1 =0, так что ф + 1 ; ф2 = $ + 1 . (6.121) (Ниже вы узнаете о числах фиф больше.) Итак, константы а = ф и (3 = ф, требующиеся в (6.119), найдены; теперь надо лишь установить А и В в (6.120). Приравнивая z = 0b этом уравнении, получим В = —Л, так что (6.120) сводится к уравнению -фА + фА = 1, решением которого является А = 1/(ф - ф) = 1/л/5. Таким образом, разложение (6.117) на элементарные дроби представляет собой F(z) = ^f_i___J_y (6.122) Неплохо— F(z) получено в том виде, в котором мы и хотели его получить. Разложение дробей в степенные ряды, как в (6.и8), дает нам выражение для коэффициента при zn в аналитическом виде: Fn = J_ V5 (Фп-Фп). (6.123) (Эта формула впервые была опубликована Даниэлем Бернулли (Daniel Bernoulli) в 1728 году, после чего о ней благополучно забыли до 1843 года, когда ее вновь открыл Жак Вине (Jacques Biiiet) [31].) Прежде чем замереть в восторге от нашего вывода, следует убедиться в его правильности. При п = 0 формула совершенно верно дает Fq = 0; при п = 1 она дает Fi = (ф—ф)/л/5, что, конеч- В соответствии с обширными эмпирическими наблюдениями европейских исследователей [136] отношение роста человека к высоте расположения пупка составляет примерно 1.618.
6.6 Числа Фибоначчи 365 но же, равно 1. При больших степенях уравнения (6.121) показывают, что числа, определенные формулой (6.123), удовлетворяют фибоначчиевому рекуррентному соотношению, так что по индукции они обязаны быть числами Фибоначчи. (Можно также разложить фп и фп в соответствии с биномиальной теоремой и избавиться от различных степеней л/5, но это громоздко и приводит к путанице. Смысл выражения в аналитическом виде не в том, чтобы обеспечить способ быстрого вычисления, а в том, чтобы указать связь Fn с другими математическими величинами.) Проявив некоторую смекалку, можно было бы просто угадать формулу (6.123) и доказать ее по индукции. Однако метод производящих функций является действенным способом именно ее нахождения— в главе 7 мы увидим, что тот же самый метод приводит к решению куда более трудных рекуррентных соотношений. Между прочим, мы нисколько не беспокоились, сходятся ли бесконечные суммы в нашем выводе формулы (6.123); оказывается, что большинство операций с коэффициентами степенного ряда может быть строго обоснованно независимо от того, сходятся ли данные суммы в действительности [182]. Тем не менее скептически настроенные читатели, подозрительно относящиеся к действиям с бесконечными суммами, могут найти успокоение в том факте, что после того, как уравнение (6.123) найдено с использованием бесконечного ряда, оно может быть проверено путем надежного доказательства по индукции. Одним из интересных следствий формулы (6.123) является то, что целое число Fn чрезвычайно близко к иррациональному числу фп/\/5 при большом п. (Поскольку ф по абсолютной величине меньше 1, величина фп экспоненциально убывает и ее влияние становится почти несущественным.) Например, числа Fio = 55 и F] 1 = 89 очень близки к ф10 ф11 ^V ~ 55.00364 и ^-=г « 88.99775. л/5 л/5 Этим можно воспользоваться для другого выражения в аналитическом виде, Fn = фп 1 7! + 2 Фп округленное до (к \ ^5* ближайшего целого, ^ -124J потому что |фп/\/5 | < \ при всех n ^ 0. Когда п четное, Fn немного меньше фпД/5; в противном случае оно немного больше. Тождество Кассини (6.103) можно переписать как Fn+1 _ Jn_ = (~1)П Fn Fu-i Fn-i Fn
366 Специальные числа При большом п величина l/F^-i Fn весьма мала, так что отношение Fn+i/Fn должно быть очень близким к Fn/Fn_i, а (6.124) указывает, что это отношение приближает ф. На самом деле Fn+1 = фрп + $т (6.125) (Это тождество проверяется при п = 0ип = 1 непосредственно, а для п > 1 оно доказывается по индукции; оно может быть также доказано непосредственно подстановкой в формулу (6.123).) Отношение Fn+i/Fn очень близко к числу ф, которое оно приближает то с избытком, то с недостатком. В силу простого совпадения ф достаточно близко к количеству километров в одной миле. (Точное значение равно 1.609344, поскольку 1 дюйм равен в точности 2.54 сантиметра.) Это дает удобный способ перевода в уме километров в мили и обратно, поскольку расстояние в Fn+i километров равно (довольно близко) расстоянию в Fn миль. Предположим, что мы хотим преобразовать некоторое число (не являющееся числом Фибоначчи) километров в мили. Сколько будет 30 км по-американски? Это легко: мы просто прибегаем к фибоначчиевой системе счисления и переводим в уме число 30 в его фибоначчиевое представление 21+8 + 1 при помощи описанного выше жадного алгоритма. Теперь можно сдвинуть каждое число на одну позицию вправо и получить 13 + 5 + 1. (Первоначальная единица была числом F2, поскольку kr ^> 0 в (6.113); новая единица соответствует Fi.) Сдвиг вправо практически равносилен делению на ф. Следовательно, наша оценка— 19 миль. (Что достаточно точно; правильный ответ— около 18.64 миль.) Аналогично для перехода от миль к километрам можно осуществить сдвиг на одну позицию влево; 30 миль— это примерно 34 + 13 + 2 = 49 километров. (Эта оценка менее точная; правильное значение— около 48.28.) Оказывается, что подобное правило "сдвига вправо" дает правильно округленное число миль в п километрах для всех п <^ 100, за исключением случаев п = 4, 12, 54, 62, 75, 83, 91, 96 и 99, когда оно отличается меньше чем на 2/3 мили. Правило "сдвига влево" дает либо правильно округленное число километров в п милях, либо на 1 км больше при всех n ^ 113. (Единственный действительно нарушающий данное правило случай — это п = 4, когда отдельные ошибки округления для п = 3 + 1 накладываются друг на друга, вместо того, чтобы компенсировать друг друга.) Если США когда- нибудь все же перейдут на метрическую систему, то американские знаки ограничения скорости изменятся с 55 миль/ч на 89 км/ч. А может, полиция будет столь великодушна, что разрешит ездить со скоростью 90 миль/ч? Правило сдвига вправо заменяет п на fin/ф), а правило сдвига влево заменяет п на ^пф),где^х) = [х + ф-Ч-
6.7 Континуанты 367 6.7 Континуанты Числа Фибоначчи обнаруживают важные связи с деревом Штерна-Броко, которое мы рассматривали в главе 4, и допускают важные обобщения на последовательность полиномов, которую обстоятельно изучал Эйлер. Эти полиномы называются континуантами, или Y^-полиномамщ потому что представляют собой ключ к изучению непрерывных дробей вида а0 + . (6.126) си + а2 + а3 + а4 + а5 + 1 1 а6 И а? Континуантный полином Kn(xi, Х2,... > хп) имеет п параметров и определяется следующим рекуррентным соотношением: Ко() = 1; Ki(xt) = X] ; Kn(xb...,xn) = Kn_1(xi,...,xn_1)xn+ + Kn_2(xi,..., xn_2). (6.127) Например, три следующих за Ki (xi) случая таковы: K2(xi,x2) = хтх2 + 1 ; Кз(х1,х2,х3) = хтхгхз+х!+х3; К4(Х1,Х2,Хз,Х4) = XiX2X3X4 +Х]Х2 +Х]Х4 +Х3Х4 + 1 . По индукции легко убедиться, что количество членов в Кп равно числу Фибоначчи: Kn(1,1,...,l) = Fn+i. (6.128) Если число переменных ясно из контекста, можно писать вместо {КП' просто 'К', так же, как можно было опускать число параметров, имея дело с гипергеометрическими функциями F из главы 5. Например, K(xi,X2) = K2(xi,X2) = Х1Х2 + 1. Конечно же, в формулах наподобие (6.128) нижний индекс п необходим. Эйлер [112] заметил, что полином K(xi,X2,. ..,хп) может быть получен, если начать с произведения xiX2...xn и затем
368 Специальные числа вычеркивать соседние пары х^х^-ц всеми возможными способами. Правило Эйлера можно представить графически, образуя всевозможные слова длиной п из точек и тире в "азбуке Морзе" где каждая точка дает длину 1, а каждое тире — длину 2; вот слова длиной 4 из азбуки Морзе: Эти слова из точек и тире соответствуют членам K(xi > х2) Хз, Х4); точка означает переменную, которая включена, а тире означает пару переменных, которая исключена. Например, • - • соответствует Х1Х4. Слово длиной п в азбуке Морзе, которое содержит к тире, содержит п—2к точек, а всего n—к знаков. Эти точки и тире могут быть расставлены (n^k) способами; поэтому, если заменить каждую точку на z, а каждое тире — на 1, то можно получить Kn(z,z,...,z) = L(nkk)Z"~2k- (б-129) Кроме того, известно, что общее количество членов в континуан- те равно некоторому числу Фибоначчи. Следовательно, установлено тождество pn+i =Z(nkk)- (в-130) (Аналитическая запись для (6.129), обобщающая формулу Эйле- ра-Бине (6.123) для чисел Фибоначчи, приведена в (б-74)0 Связь между континуантами и последовательностями азбуки Морзе показывает, что континуанты обладают зеркальной симметрией: К(хП)...)х2>х1) = К(хьх2)...,хп). (6.131) Поэтому в дополнение к правосторонней рекуррентности из определения (6.127) они подчиняются рекуррентности, которая пристраивает переменные слева: Kn(xi,...,xn) = х1Кп_1(х2>...)х1г) + Кп_2(хз)...,хп). (6.132) Обе эти рекуррентности представляют собой частные случаи более общего правила: l^m+nlXi, . . . ,Хт,Хт_|-1, . . . jXm+nJ = — l^mlXi ) . . . , XmJ КттДХттх-)-! , . . . , Xm+nJ + + Кт-1 (Xi , . . . , Xm_i ) Кг,.-] (хт+2, . . . , )• (6.133)
6.7 Континуанты 369 Это правило легко истолковать, исходя из аналогии с азбукой Морзе: первое произведение KmKn дает те члены Km+n, в которых нет тире в позиции [га, га + 1 ], в то время как второе произведение дает те члены, в которых в этой позиции тире присутствует. Если же положить все х равными 1, то данное тождество показывает, что Fm+n+i = Fm+iFn+i +FmFn; таким образом, (6.ю8) является частным случаем (6.133)- Эйлер [112] обнаружил, что континуанты подчиняются еще более замечательному правилу, которое является обобщением тождества Кассини: Km+nlX-l > • • • > Xm+nJ Kk(Xm+l > • • • > X-m+k) = = Km+k(Xl , . . . )Xm+ic) Kn(xm_(_i, . . . >Xm+TLJ + + (-1 )kKm_! (xb . . . , Xm_! ) X X Kn_k_i (xm+]c+2)---)^m+n) • (6.134) Это правило (доказанное в упр. 29) справедливо тогда, когда индексы при всех К неотрицательны. Например, при к = 2, га = 1 и п = 3 имеем К(Х1,Х2,Хз,Х4)К(Х2,Хз) = К(х], х2, х3) К(х2> х3, х4) + 1 . Континуанты тесно связаны с алгоритмом Евклида. Предположим, например, что вычисление НОД(т, п) завершается за четыре шага: га, п-\ = п; 4^2 — Tio mod ni = no — q i П] ; п-\ mod ri2 = tli — c|2Ti2 ; П2 mod П3 = П2 — Язтгз ; пз mod n4 = П3 — c\4Ti4 . Тогда n4 = n4 = K()n4; n3 = q4n4 = K(q4)n4; n2 = q3n3+n4 = K(q3,q4)n4; ni = q2rL2+n3 = K(q2)q3,q4)n4; n0 = qin1+n2 = K(qbq2)q3>q4)n4. В общем случае, если алгоритм Евклида находит наибольший общий делитель d за к шагов, после вычисления последовательности частных qi, ..., qk, то начальными числами являются K(qi, q2,..., qk)d и K(q2,... > qk)d. (Этот факт был замечен еще 7ТЦП) = - НОД(п0,тп) = = НОД(пьп2) = = НОД(тг2)тг3) = = НОД(тг3,тг4) = = НОД(тг4>0) = тг4. по п2 тг3 п4 0
370 Специальные числа в начале XVIII века Тома Фанте де Ланьи (Thomas Fantet de Lagny) [232], который, по-видимому, был первым, кто непосредственно рассматривал континуанты. При этом Ланьи отмечал, что последовательные числа Фибоначчи, которые фигурируют в качестве континуантов, когда q принимают свои минимальные значения, являются теми наименьшими числами на входе, при которых алгоритму Евклида требуется выполнить некоторое заданное число шагов.) Континуанты тесно связаны также с непрерывными дробями, от которых они получили свое название. Например, I IN^U-0, Ll], U-2, U-3J , v Q0 + = —J77 г" • (6.135) 1 1 а1+ г а2 + — а3 К(а0)аьа2>аз) К(аьа2)а3) Та же картина наблюдается для дробей любой глубины. Это легко доказать по индукции; например, К(а0> си, а2> а3 + 1 /а4) К(а0> а], а2> а3, а4) К(сц, а2, а3 + 1 /а4) К(си, а2, а3) а4) в силу тождества Kn(xi,...,xn_i,xn+y) = = Kn(xi,...,xn_bXn) + Kn_1(x1,...,xn_1)y. (6.136) (Это тождество доказано и обобщено в упр. 30.) Кроме того, континуанты тесно связаны и с деревом Штер- на-Броко, которое обсуждалось в главе 4. Каждый узел в этом дереве может быть представлен в виде последовательности L и R, скажем, в виде RaoLa1Ra2La3e>eRan-2Lan-i ) (6.137) где а0 ^ 0, а] ^ 1, а2 ^ 1, а3 ^ 1, ..., an_2 ^ 1, an_i ^ О, а п четное. Используя 2 х 2-матрицы L и R из (4-33)> нетрудно доказать по индукции, что матричным эквивалентом (6.137) является Kn-2(ai,..., an_2) Kn_i (си,..., an_2) an_i) \ , . Kn_1(a0>ab...)an_2) Kn(a0> ab..., an_2> an_i) J (Доказательство этого является частью упр. 87.) Например, Ъс + 1 bcd + b + d \ abc + a + c abed + ab + ad + cd + 1 J
6.7 Континуанты 371 В силу этого можно воспользоваться (4-34)) чтобы записать, наконец, в аналитическом виде дробь из дерева Штерна-Броко, L- R-представлением которой является (б.137): f(R- ... 1>- ) = Wi^ab-.an-bl) _ (6 139) (Это теорема Халфена (Halphen) [174].) Например, чтобы найти дробь для представления LRRL, полагаем do = О, ai = 1, az = 2, аз = 1 и п = 4; тогда равенство (6.139) дает К(0,1,2,1,1) = К(2,1,1) = К(2,2) = 5 К(1,2,1,1) К(1,2,1,1) К(3,2) 7' (Для поглощения единиц спереди и сзади в списках параметров мы воспользовались правилом Kn(xi,..., xn_i, xn + 1) = Kn+i x (xi,..., xn_i, xm 1), которое получается, если подставить у = 1 в (6.136).) Сравнение (6.135) и (6.139) показывает, что дробь, соответствующая произвольному узлу (6.137) в Дереве Штерна-Броко, допускает представление в виде непрерывной дроби f(Rao...La—М = а0 + — . (6.14о) ai + а2 + 1 + 1 an-i + у Таким образом, можно без проволочек переходить от непрерывных дробей к соответствующим узлам дерева Штерна-Броко. Например, f(LRRL) = 0+ . 1 + 2+ ' 'П В главе 4 мы отмечали, что иррациональные числа определяют бесконечные пути в дереве Штерна-Броко и могут быть представлены в виде бесконечной строки букв "L" и "R" Если такой бесконечной строкой для числа а является Ra° Lai Ra2 Las ...,
372 Специальные числа то ей соответствует непрерывная дробь 1 ос = а0-\ си + 1 (6.141) а2 + • 1 а3 + Q4 + а5 + — Эта бесконечная непрерывная дробь может быть получена и непосредственно. Пусть схо = ос, и при k ^ 0 положим cik = L^J; оск 0-к + 1 (6.142) <Хк+1 Числа О-к называются неполными частными числа а. Если а рациональное, скажем, m/n, то этот процесс перебирает обнаруживаемые с помощью алгоритма Евклида частные и затем останавливается (при otjc+i = со). Рациональна или иррациональна константа Эйлера у? Никто не знает. Некоторую информацию об этой нерешенной задаче можно получить, поискав число у в дереве Штерна-Броко: если оно рационально, мы найдем его, а если иррационально, то мы найдем все наилучшие рациональные приближения к нему. Непрерывная дробь для числа у начинается со следующих неполных частных: к Qk 012345678 0 112 12 14 3 Поэтому представление Штерна-Броко для этой дроби начинается со строки LRLLRLLRLLLLRRRI ; никакой очевидной закономерности здесь не наблюдается. Вычисления Ричарда Брен- та (Richard Brent) [38] показывают, что если у— рациональное число, то его знаменатель должен насчитывать более 10 тысяч десятичных цифр. Поэтому никто не верит в то, что число у рационально; тем не менее никто не смог доказать, что оно таковым не является. Завершим эту главу доказательством одного замечательного тождества, которое связывает воедино многие из подобных понятий. В главе 3 было введено понятие спектра— спектром числа а называется мультимножество чисел [пос\, где а— заданная константа. Поэтому бесконечный ряд п$>1 ,|пф] = Z + Z° -z4 + z6+z8+z9 + . Или знает, но не говорит об этом. Ну, у должно быть иррациональным в силу малоизвестного изречения Эйнштейна: "Бог не загромождает Вселенную большими знаменателями"
6.7 Континуанты 373 может быть назван производящей функцией для спектра числа ф, где ф = (1 + \/5)/2— отношение золотого сечения. Тождество, которое мы докажем (открытое в 1976 году Дж. Л. Дейвисо- ном (J.L.Davison) [73]), представляет собой бесконечную непрерывную дробь, которая связывает эту производящую функцию с последовательностью Фибоначчи: = (1-z)^zLn<t>J. (6-143) 1 + zF2 п>1 1 + ZF3 1 + ZF4 Интересны обе части (6.143)» но вначале рассмотрим числа |_ПФ_1- Если представление Фибоначчи (6.113) числа п есть Fki Н Ь Fkr, то ожидается, что пф будет приблизительно равным Fid+i Н h Fkr+i — числу, которое получается, если сдвинуть фибоначчиево представление влево (как при переводе миль в километры). В действительности из (6.125) известно, что пф = Fkl+1+... + Fkr+1-@kl +..- + $k'). Поскольку ф = — 1/ф и к] ^> • • • ^> кт ^> 0, то |$fc, +... + фкт| < ф-^+ф-кг-2 + ф-кг-4 + ... = ф"к- 1-ф"2 ф'"^ ^ ф-1 < 1; и, рассуждая аналогично, $kl Н Ь $кг имеет тот же знак, что и (—1)кг. Следовательно, [пф] = Fkl +1 + ¦ ¦ • + Fkr+1 - [кг(п) четное] . (6.144) Условимся называть число п фибоначчиево-нечетнъш (или, для краткости, F-нечетным), если младший бит фибоначчиево- го представления равен 1 (что то же самое, что и кг(п) = 2). В противном случае п фибоначчиево-четное (F-четное). Например, наименьшими F-нечетными числами являются 1, 4, 6, 9, 12, 14, 17 и 19. Если кг(п) четное, то число п — 1 является F- четным в силу (6.114); аналогично, если кг(п) нечетное, то п— 1 является F-нечетным. Поэтому кг(п) четное <!==$ п—1 F-четное. Кроме того, если кг(п) четное, то из (6.144) следует, что кг([пф_|) = 2; если кг(п) нечетное, то (6.144) утверждает, что
374 Специальные числа кг(|_пф_|) = kr(n) + 1. Таким образом, кг(|_пф_|) всегда четное, и доказано, что [пф\ — 1 всегда F-четное. Обратно, если га— некоторое F-четное число, то можно провести это вычисление в обратном порядке и найти п, такое, что т+ 1 = [пф\. (Сперва прибавляется 1 в F-записи, как объяснялось выше. Если переносов не происходит, то число п оказывается равным (тп+2), сдвинутому вправо; в противном случае число п равно сдвинутому вправо (га + 1).) Поэтому сумма в правой части (6.143) может быть записана в виде Y_ zLn<frJ = z Y_ zm[m— F-четное]. (6.145) А как насчет дроби слева? Перепишем (6.143) так, чтобы данная непрерывная дробь выглядела как (6.141), с 1 во всех числителях: 1 1 -z Y_ z^J . (6.146) z~F° + rL^1 z~"+—]— (Это весьма тонкое преобразование! Числитель и знаменатель исходной дроби, имеющей в числителе zFn, нужно поделить на zFn_1.) Если оборвать эту новую непрерывную дробь на элементе 1/z_Fn, то ее величина будет равна отношению континуантов Kn+2(0,z-F%z-FV..,z-F~) Kn(z-FV..,z-F") Kn+1 (z"Fo, z"Fi,..., Z"Fn ) Kn+1 (z"Fo, z"Fi,..., Z"Fn ) ' как и в (6.135). Вначале рассмотрим знаменатель, в надежде на его податливость. Полагая Qn = Kn+i (z-F°,... ,z_Fn), находим, что Q0 = 1, Qi = 1 +z~\ Q2 = 1 +Z"1 +z"2, Q3 = 1 + z-1 + z-2 + z-3 + z-4 и вообще все продолжается как нельзя лучше и получается геометрический ряд Qn = 1+z"1 +z-2 + ...+z-(Fn-b2-l)< Соответствующий этому знаменателю числитель Pn = Kn(z_Fl) ..., z~Fn) оказывается подобным Qn, но с меньшим числом членов. Например, имеем Р5 = z"1 + z"2 + Z"4 + z"5 + Z"7 + z"9 + z"10 + z"12 ,
6.7 Континуанты 375 в сравнении с Q5 = 1 + z~1 + • • • + z~12. Более внимательное рассмотрение выявляет закономерность, определяющую, какие члены присутствуют. Вот она: _ 1 +z2+z3+z5+z7 + z8+z10+zn _ ZIZ 12 = z-12 V" zm [m— F-четное]; m=0 и вообще, можно доказать по индукции, что Fn+2-l Pn = z1_Fn+2 ^ zm[m— F-четное]. m=0 Поэтому Р^ = Lm^o"1 zm [™~ Четное] Z-m=0 z Взяв предел при п —> со, получаем (6.146) в силу (6.145)- Упражнения Разминка 1 Каковы [2] =11 перестановок множества {1,2,3,4}, содержащих ровно два цикла? (Используйте обычную запись перестановки наподобие 2314, а не разложение на циклы, как в (6.4).) 2 Всего имеется mn функций, отображающих множество из п элементов на множество из га элементов. Сколько из них принимают ровно к различных значений? 3 Те, кто складывали стопку карт в реальной жизни, знают, что это следует делать с небольшим запасом прочности, чтобы стопка не опрокинулась при малейшем колебании воздуха. Предположим, что центр тяжести верхних к карт должен находиться по меньшей мере в е единицах от края (к + 1)- й карты. (Таким образом, первая карта, например, может выступать над второй самое большее на 1 — е единиц.) Можно ли при этом получить сколь угодно большой выступ, располагая достаточным количеством карт? 4 Выразите 1/1 -Ь 1/3 Ч Ь 1 /(2п+1) через гармонические числа.
376 Специальные числа 5 Поясните, как получить рекуррентное соотношение (6.75) из определения (6.74) величины UtJx^ij), и решите это рекуррентное соотношение. 6 Некий исследователь оставил на острове пару кроликов. Если они становятся способны к размножению через месяц и если каждая пара половозрелых кроликов способна производить новую пару крольчат ежемесячно, то сколько пар кроликов будет в наличии через п месяцев при полном отсутствии смертности среди кроликов? (Через два месяца будет две пары, одна из которых— новорожденная.) Установите связь между этой задачей и "пчелиным деревом" из настоящей главы. 7 Покажите, что тождество Кассини (6.103) представляет собой как частный случай соотношения (б.ю8), так и частный случай соотношения (6.134)- 8 Воспользуйтесь фибоначчиевой системой счисления, чтобы перевести скорость 65 миль/ч в приблизительное число км/ч. 9 Сколько примерно квадратных километров в 8 квадратных милях? 10 Каково представление ф в виде непрерывной дроби? Обязательные упражнения 11 Чему равна сумма 2Zk(—1)k[?] — сумма знакочередующихся чисел ряда треугольника Стирлинга для числа циклов, если п— неотрицательное целое число? 12 Докажите, что числа Стирлинга обладают правилом обращения, которое аналогично правилу (б-4^): Если гармонические числа— червячные, то числа Фибоначчи— точно кроличьи! gin) L -1ГОД f(n) = X (-DkgOc). 13 Дифференциальные операторы D = -^ и Ь = zD упоминались в главах 2 и 5. Имеем Ь2 = z2D2 ¦ zD, потому что d2i{z) = flzf '{z) = z?zf'{z) = z2f"{z)+zf'{z), что равносильно (z2D2 +zD)f(z). Аналогично можно показать, что д3 = z3D3 + 3z2D2 + zD. Докажите общие формулы дт znDT Dk (-1 \n—kok
6 Упражнения 377 для всех n ^ 0. (Эти формулы могут быть использованы для перехода от дифференциального выражения вида ]Гк aicZkf(k)(z) к выражению вида Y.^ Pk"&k"f(z)> как это делалось в (5.109).) 14 Докажите степенное тождество (6.37) ДЛЯ чисел Эйлера. 15 Докажите тождество Эйлера (6.39)) взяв m-ю разность (6.37)- 16 Каково общее решение двойного рекуррентного соотношения Ап,о = an[n^0]; A0,k = 0, если k> 0; An,k = kAn_1>k + An_-|)k_-| , целые к,гц когда кип пробегают множество всех целых чисел? 17 Решите следующие рекуррентные соотношения, считая, что |?| есть нуль при п < 0 или к < 0: п к п к = п-1 к | = (п-к) +п п -1 к-1 |тъ—1 1 к + +[п п-1 к-1 П к = к п-1 к +к п-1 к-1 +[п = к = 0] +[п = к = 0] при n,k ^ 0. при п, к ^ 0. при п, к ^ 0. 18 Докажите, что полиномы Стирлинга удовлетворяют соотношениям (x+1)an(x+1] [x-n)(jTl{x)-{-x(jlx^{x) 19 Докажите, что обобщенные числа Стирлинга удовлетворяют соотношениям к=0 Гх+к" х 17 к=0 к ' п L к=0 X х—п+к х х—п+к ¦1Г х+к п+1 0, целое п > 0. - = 0, целое п> 0. п+1/ 20 Выразите 2Zk=i ^к в аналитическом виде. 21 Покажите, что если Hn = an/bn, где an и bn— целые, то знаменатель Ъп кратен 2^lgn-l. Указание: рассмотрите число 2^пЬ1нп - \. 22 Докажите, что бесконечная сумма k^l k + z
378 Специальные числа сходится при любом комплексном числе z, за исключением случаев, когда z— отрицательное целое число, и покажите, что она равна Hz, когда z— неотрицательное целое число. (Таким образом, эту формулу можно использовать для определения гармонических чисел Hz при комплексных z.) 23 Коэффициенты разложения z/{ez — ^ по степеням z задаются равенством (6.8i). А каковы коэффициенты разложения z/(ez + 1)? Указание: рассмотрите тождество (ez + 1 )(ez — 1) = e2z-1. 24 Докажите, что тангенциальное число Т2П+1 кратно 2П. Указание: докажите, что все коэффициенты TinM и T2n+iM кратны 2П. 25 Равенство (6.57) доказывает, что в конце концов в некоторый момент времени N червяк достигнет конца резинки. Поэтому сначала должен наступить такой момент времени п, когда он будет ближе к концу резинки по истечении п минут, чем он был по истечении п — 1 минут. Покажите, что n < ^N. 26 Воспользуйтесь правилами суммирования по частям для вычисления суммы Sn = 2Zk=i ^k/k- Указание: рассмотрите, кроме того, похожую сумму XLk=i ^k-i/k. 27 Докажите НОД-правило (б.ш) для чисел Фибоначчи. 28 Числа Люка Ln определяются как Fn+i + Fn_i. Таким образом, согласно (6.log) имеем F2n = FnLn. Вот таблица нескольких их первых значений: п I 0 1 2 3 4 5 6 7 8 9 10 11 12 13 Ln| 2 1 3 4 7 11 18 29 47 76 123 199 322 521 а Воспользуйтесь методом наборов, чтобы показать, что решение Qn обобщенного рекуррентного соотношения Qo = a; Qt = Р; Qn = Qn-1 + Qu-2 , n>1 может быть выражено через Fn и Ln. б Выразите Ln через ф и $ в аналитическом виде. 29 Докажите тождество Эйлера для континуантов— равенство (6.134). 30 Обобщите (6.136) с тем, чтобы найти выражение для конти- нуанта с приращением К(хт,..., хт_т, хт + у, хт_и,..., хп) при 1 ^ т ^ п.
6 Упражнения 379 Домашние задания 31 Найдите аналитический вид коэффициентов |?| в представлении возрастающих степеней через убывающие: х-, целое n ^ 0. (Например, х4 = х- + 12х- + 36х- + 24х-, следовательно, 142|-зб.) 32 В главе 5 мы получили формулы v- /n+k\ /n+m+1\ v" /k\ /т+1\ k^m \ / \ / О^к^т х 7 \ ' / развертывая рекуррентное соотношение (?) = (n^1) + (?Z]) двумя способами. А какие получатся тождества при развертывании аналогичного рекуррентного соотношения {?} = 33 В табл. 325 приведены значения [™] и {2}. Как выглядят выражения в аналитическом виде (не включающие чисел Стир- линга) для последующих величин [™] и {3}? 34 Чему равны (~^ } и (~к }, если считать, что основное рекуррентное соотношение (6.35) справедливо при любых целых к и п, и если (?) = 0 при всех к < 0? 35 Докажите, что для любого е > 0 существует целое п > 1 (зависящее от е), такое, что Hn mod 1 < е. 36 Можно ли сложить стопку из п кирпичей так, чтобы самый верхний кирпич полностью выступал над самым нижним кирпичом, и при этом человек, вес которого равен весу 100 кирпичей, мог находиться на средине верхнего кирпича, не обрушивая всю стопку? 37 Выразите Лън (^ то<^ ттг)/к(к + 1) через гармонические числа, считая, что тип— положительные целые числа. Какова предельная величина данной суммы при п —> со? 38 Вычислите неопределенную сумму YL (?) (—1 )kHk 6k. 39 Выразите сумму ?lk=i ^k чеРез п и Нп. 40 Докажите, что 1979 делит числитель суммы ?lk=i (—1)k_1/k, Aral Это все— и укажите аналогичную сумму для 1987 (и 2011). Указа- простые года! ние. воспользуйтесь уловкой Гаусса для получения суммы дробей, числители которых равны 1979. (См. также упр. 4.) хп = y.
380 Специальные числа 41 Вычислите сумму в аналитическом виде, если п— целое (возможно, отрицательное) число. 42 Бели S — некоторое множество целых чисел, то пусть S +1 представляет собой "сдвинутое" множество {х + 1 | х е S}. Сколько подмножеств множества {1,2,..., п} обладают тем свойством, что S U (S + 1) = {1,2,..., п + 1}? 43 Докажите, что бесконечная сумма .1 + .01 + .002 + .0003 + .00005 + .000008 + .0000013 сходится к рациональному числу. 44 Докажите обращение тождества Кассини (б.юб): если к и га— целые числа, такие, что |т2 — km — k2| = 1, то существует целое п, такое, что k = ±Fn и га = ±Fn+i • 45 Воспользуйтесь методом наборов для решения обобщенного рекуррентного соотношения Х0 = а; X^ = (5; Хп = Хп_т + Хп_2 +уп + 6 . 46 Чему равны cos 36° и cos 72°? 47 Покажите, что / п \ ¦^-ГШ5"' и воспользуйтесь данным соотношением для установления величин Fp mod р и Fp+i mod р при простом р. 48 Докажите, что нулевые параметры континуантов могут быть удалены путем стягивания их соседей: ImiI^I ) • • • ) ^-TTL— 1 ) Ц Xm_|_1 ) . . . } XnJ = — I^tl—21^1 > • • • ) X-m—2> X-m— 1 +*m.-H > ^-ra+2> • • • > *n J > 1 < m < n.
6 Упражнения 381 49 Найдите представление числа ^п>1 2 LncN в виде непрерывной дроби. 50 Определим функцию f (п) для всех положительных целых чисел п при помощи рекуррентного соотношения f(1) = 1; f (2n) = f (n); f(2n+1) = f(n)+f(n+1). а При каких n значение f (n) четное? б Покажите, что функция f (п) может быть выражена через континуанты. Контрольные работы 51 Пусть р— простое число. а Докажите, что {?} = [?] = 0 (mod р) при 1 < к < р. б Докажите, что [р~]] = 1 (mod р) при 1 ^ к < р. в Докажите, что {2р~2} = [2рр-2] = О (mod р), если р > 2. г Докажите, что если р > 3, то [^] = 0 (mod р2). Указание: рассмотрите р?. 52 Пусть Нп записано в виде несократимой дроби ап/Ьп. а Докажите, что p\bn <=> р\а|_п/р_|, если р— простое. б Найдите все п > 0, такие, что an делится на 5. 53 Найдите аналитический вид суммы Иъ=о (k) (—^ )к^к при О ^ m ^ п. Указание: в упр. 5.42 имеется сумма без множителя Н]с. 54 Пусть п > 0. Цель данного упражнения— показать, что знаменатель числа В2п представляет собой произведение всех простых чисел р, таких, что (р—1)\(2п). а Покажите, что Sm(p) + [(р—1)\m] кратно р, когда р — простое и m > 0. б Используйте результат части (а) для того, чтобы показать, что , ^ [(р-1)\(2п)] D2n + / - = Izn — целое число. Р Указание: достаточно доказать, что еслир— некоторое простое число, то знаменатель дроби В2П+ [(р_ 1 )\(2п)] /р не делится на р. в Докажите, что знаменатель числа Bin всегда является нечетным кратным 6 и что он равен 6 для бесконечного количества п.
382 Специальные числа 55 Докажите (6.70) как следствие некоторого более общего тождества, суммируя 0^k<n ч 7 х и дифференцируя по х. 56 Вычислите XLwm (?) (—1 )kkn+1/(k—m) в аналитическом виде как функцию целых чисел га и п. (Это сумма по всем целым к, за исключением к = та.) 57 "Обернутые биномиальные коэффициенты порядка 5" определяются как ")) = (СП) + ((ft-Via»))' п>0' и ((?)) = [к = 0]. Пусть Qn.— разность между наибольшим и наименьшим из этих чисел в тг-й строке: Qn = max (( ]) - min (( ^ 0<:k<5\\k// 0^k<5\\k Найдите и докажите соотношения между числами Qn и числами Фибоначчи. 58 Запишите суммы XLn>o ^nzTL и 21п>о ^пгП в аналитическом виде. Что можно сказать о величине F^+1 — 4F^ — F^_-,? 59 Докажите, что если тип— положительные целые числа, то существует целое х, такое, что Fx = m (mod 3n). 60 Найдите все положительные целые числа п, такие, что либо Fn + 1, либо Fn — 1 являются простыми числами. 61 Докажите тождество У -— =3 , целое тг ^ I. L— F71C F?™ k=0 z z Чему равна сумма YLk=o 1 Аз 2k? 62 Пусть Ап = фп + ф"п и Вп = фп - ф"п. а Найдите константы аир, такие, что An = cxAn_i + (ЗАП_2 и Вп = аВп_т + (ЗВП_2 для всех n J> 0. б Выразите Ап и Вп через Fn и Ln (см. упр. 28). в Докажите, что ??=1 V(hk+i + 1) = Bn/An+1. г Выразите в аналитическом виде сумму ?lk=i 1 /(^2k+i—1 )•
6 "Упражнения 383 Лишние задачи? Дополнительные задачи Запасные задачи? ^0 ~ м -> i 63 Сколько перестановок 7ti 7t2 ... тгп множества {1,2,..., п) содержат ровно к индексов j, таких, что а щ < щ для всех г < j? (Такие j называются "левосторонними максимумами") б 7ij > j? (Такие j называются "превышениями'.') 64 Чему равен знаменатель дроби [wY^J, если привести ее к несократимому виду? 65 Докажите тождество ...J f(Lx1+.--+xnJ)dx1...dxn = ^^)^Г- 66 Чему равна сумма чисел п-й строки треугольника Эйлера с чередующимися знаками Лк(—^к(к)^ 67 Докажите, что г{;;,,}(П)н)"-'и-(; 68 Покажите, что ((7)) = 2(™)> и наЙАите аналитический вид О- 69 Запишите ?lk_i k2Hn+k в аналитическом виде. 70 Покажите, что комплексные гармонические числа из упр. 22 раскладываются в степенной ряд Hz = ]ГП>2(—1 )nHo? zn_1 • 71 Докажите, что обобщенный факториал из уравнения (5.83) может быть записан как )е'*'* k^l рассмотрев предел при п —> со первых п сомножителей данного бесконечного произведения. Покажите, что ^(z!) связано с обобщенными гармоническими числами из упр. 22. 72 Докажите, что функция "тангенс" раскладывается в степенной ряд (6.92), и найдите соответствующие ряды для z/sinz Hln((tgz)/z). 73 Докажите, что zctgz равно 2^ — 1 1 z z z z V— z / z+kn Л z—кя к=1 Ч при любом целом п ^> 1, и покажите, что при фиксированном к и п —» со предел к-го общего члена равен 2z2/(z2 — к2тг2).
384 Специальные числа 74 Найдите соотношение между числами Тп(1) и коэффициентами разложения 1 /cos z. 75 Докажите, что тангенциальные числа и коэффициенты разложения 1/cosz располагаются по сторонам бесконечного треугольника, который начинается следующим образом: 1 О 1 1 1 О 0 12 2 5 5 4 2 0 0 5 10 14 16 16 61 61 56 46 32 16 0 Каждая строка содержит частичные суммы предыдущей строки, поочередно слева направо и справа налево. Указание: рассмотрите коэффициенты степенного ряда для (sin z + cos z)/ cos (w + z). 76 Выразите сумму I(-Dk{"}rt! в аналитическом виде и покажите, что она равна нулю при четном п. 77 При целых та и п, п ^ 0, формула (6.52) дает значение сгп(та) при та < 0, формула (6.53)— при та > п, а формула (б-ioi)— при та = 0. Покажите, что в остальных случаях имеет место равенство о\г m = (_nm+n-1 m-1 L m!(n-m)!k=o та та —k B^_ тг-k тг- lc' целые тг ^ та > 0. 78 Докажите следующее соотношение, которое связывает числа Стирлинта, Бернулли и Каталана: Ш'К. 2n \(-Dk R f2n\ 1 = DT п-Ькук+1 Vnyn+l 79 Покажите, что части шахматной доски из парадокса "64 = 65" можно разместить так, что получится парадокс "64 = 63"
6 Упражнения 385 80 Последовательность чисел, определяемая рекуррентным соотношением Ai = х, А 2 = у и An = Ап-1 + Ап_2, содержит Ат = 1000000 при некотором га. Какие положительные целые числа х и "у приводят к максимально возможному га? 81 В этой главе описан способ сведения формулы, содержащей числа Fniic, к формуле, содержащей только числа Fn и F^+i . Естественно заинтересоваться, могут ли такие "приведенные" формулы быть равными, если они отличаются внешним видом. Пусть Р{х,у) — полином от х и у с целочисленными коэффициентами. Найдите необходимое и достаточное условие того, что P(Fn+i, Fn) =0 для всех п~^> 0. 82 Объясните, как выполняется сложение положительных целых чисел в фибоначчиевой системе счисления. 83 Возможно ли, чтобы последовательность (Ап), удовлетворяющая рекуррентному соотношению Фибоначчи An = An_i + Ап_2, не содержала простых чисел, если Ао и А] — взаимно простые числа? 84 Пусть га и п — нечетные положительные целые числа. Выразите в аналитическом виде S+ п = Y_ - ; S" п = ^~ - . k>0 ' 2mk+n "г г m ' г 2mk+n ' m Указание: суммы из упр. 62— это S^~3 ~~ $tт+з и ^7з — ^1,2тг+3- 85 Охарактеризуйте все N, такие, что вычеты чисел Фибоначчи Fn mod N для п ^ 0 образуют полное множество {0,1,..., N-1}. (См. упр. 59.) 86 Пусть Ci, С2, ...— последовательность ненулевых целых чисел, такая, что HOA(Cm>Cn) = сНОд(т>п) для всех положительных целых чисел га и п. Докажите, что все обобщенные биномиальные коэффициенты /'пЛ _ CnCn-i ... Cn-ic+i \k/ е CkC]c_i ... Ci являются целыми числами. (В частности, "коэффициенты Фибоначчи" образованные таким способом из чисел Фибоначчи, целые ввиду (б.ш).)
386 Специальные числа 87 Покажите, что К-полиномы представимы в виде произведения матриц 0 1 1 х. 1 Х2 1 и в виде определителя det /XI -1 О 1 *2 -1 О 1 х3 О О 1 V О о -1 о 7 88 Обобщая (6.146), найдите непрерывную дробь, связанную с производящей функцией ]ГП>1 zLnoc-l, где ос— некоторое положительное иррациональное число. 89 Пусть а— некоторое иррациональное число из интервала (О.. 1) и пусть а.1, а2, аз, ... — неполные частные в его представлении в виде непрерывной дроби. Покажите, что |D(a,n)| < 2, где п = К(си,..., am), а D— отклонение, определенное в главе 3. 90 Пусть Qn — наибольший знаменатель на п-м уровне дерева Штерна-Броко. (Таким образом, в соответствии со схемой из главы 4 (Qo,QbQ2>Q3)Q4>...) = (1,2,3,5,8,...).) Докажите, что Qn = Fn+2. Исследовательские проблемы 91 Как лучше всего распространить определение {?} на произвольные действительные значения пик? 92 Пусть число Нп записано в виде несократимой дроби an/bn, как в упр. 52. а Бесконечно ли много таких п, что p\an при некотором фиксированном простом р? б Бесконечно ли много таких п, что Ъп = НОК(1,2,..., п)? (Двумя подобными п являются п = 250 и п = 1000.) 93 Докажите, что числа у и еу иррациональны. 94 Разработайте общую теорию решения двухпараметрического рекуррентного соотношения |п-1| (an+(3k+y) к + +(a,n+|3,k+Y/) п-1 к-1 +[п = к = 0] прип,к^0
6 Упражнения 387 в предположении, что |?| = 0 при п < 0 или к < 0. (Биномиальные коэффициенты, числа Стирлинга, числа Эйлера и последовательности чисел из упр. 17 и 31— это все частные случаи данного рекуррентного соотношения.) Какие специальные значения (а, (З^у, ос', |3',у') дают "фундаментальные решения" через которые может быть выражено общее решение? 95 Найдите эффективный способ распространения алгоритма Госпера-Зайльбергера с гипергеометрических членов на члены, содержащие числа Стирлинга.
7 Производящие функции НАИБОЛЕЕ МОЩНЫЙ МЕТОД работы с числовыми последовательностями, как известно, заключается в преобразовании бесконечных рядов, "генерирующих" эти последовательности. Мы уже изучили большое количество последовательностей и встречались с некоторыми производящими функциями; теперь мы готовы к более глубокому исследованию производящих функций, которое покажет нам их исключительную полезность. 7.1 Теория домино и размен Производящие функции достаточно важны, а для многих из нас достаточно новы, чтобы оправдать небольшой отдых перед тем, как заняться ими вплотную. Поэтому попытаемся в начале главы развить интуицию в отношении производящих функций при помощи игр и забав. Рассмотрим два приложения производящих функций— одно, связанное с домино, и второе, связанное с монетами. Каково количество Тп способов покрытия прямоугольника размером 2 х п костями домино размером 2x1? Считаем, что все кости домино идентичны (например, потому что они лежат лицевой стороной вниз или потому что кто-то сделал их неразличимыми, выкрасив в красный цвет); следовательно, имеет значение только ориентация костяшки— вертикальная или горизонтальная; мы можем просто представить себе, что работаем с одинаковыми плитками в форме домино. Например, существует три покрытия прямоугольника размером 2 х 3, а именно ED, СВ, и ED; так что Тз = 3. Чтобы найти общее выражение для Тп в аналитическом виде, как обычно, начнем с рассмотрения малых значений. При п = 1 существует, очевидно, только одно покрытие, D; при п = 2 имеется два покрытия, Ш и В. "Сочти пути" — Е. Б. Браунинг (Е. В. Browning)
390 Производящие функции А что можно сказать о случае п = 0? Сколько существует покрытий прямоугольника размером 2x0? Сразу не ясно, как понимать этот вопрос, но раньше мы уже встречались с подобными ситуациями. Так, существует одна перестановка нуля объектов (а именно— пустая перестановка), так что 0! = 1. Существует единственный способ выбрать нуль предметов из п (а именно — не выбрать ничего), поэтому (?) = 1. Существует единственный способ разбить пустое множество на нуль непустых подмножеств, но нет ни одного такого способа для разбиения непустого множества; так что {?} — [п = 0]. Рассуждая аналогично, можно сделать заключение, что существует единственный способ покрыть костями домино прямоугольник размером 2 х 0, а именно— не использовать домино вообще; таким образом, То = 1. (Это противоречит простой формуле Тп = п, которая выполняется при п = 1, 2 и 3; по-видимому, придется эту простую формулу отвергнуть, поскольку То должно быть равно 1 в соответствии с логикой ситуации.) Правильное понимание нулевого случая— залог верного решения задачи перечисления. Давайте рассмотрим еще один малый случай, п = 4. Имеются две возможности покрытия левого конца прямоугольника — там можно положить либо одну кость домино вертикально, либо две горизонтально. В случае вертикальной кости домино получается частичное решение [О, и остающийся прямоугольник размером 2x3 может быть покрыт Тз способами. Если выбрать две горизонтальные кости домино, то частичное решение ВЦ можно завершить Т2 способами. Таким образом, Т4 = Тз + Тг = 5. (Вот эти пять покрытий: ЕШ, ИВ, СИ, ЕШ и ЕВ.) Теперь нам известны пять первых значений Тп: п Тп 0 1 1 1 2 2 3 3 4 5 Все это подозрительно похоже на числа Фибоначчи, и нетрудно сообразить, почему. Рассуждения, с помощью которых мы доказали, что Т4 = Тз +Т2, легко обобщаются на Tn = Tn_i +ТП_2 для п ^ 2. Таким образом, здесь получается то же самое рекуррентное соотношение, что и для чисел Фибоначчи, но с немного иными начальными значениями То = 1 и Ti = 1. Но эти начальные значения представляют собой последовательные числа Фибоначчи Fi и F2, так что Т являются числами Фибоначчи, сдвинутыми на одну позицию: Тп = Fn+1 при п^О.
7.1 Теория домино и размен 391 (Это выражение можно рассматривать как аналитический вид Тп, потому что числа Фибоначчи достаточно важны для того, чтобы рассматривать их как "известные" Кроме того, сами Fn имеют выражение в аналитическом виде (6.123), использующее алгебраические операции.) Заметим, что это равенство подтверждает мудрость принятия То = 1. Но какое отношение имеет все это к производящим функциям? Мы как раз приближаемся к тому, чтобы ими воспользоваться (и это будет еще один способ вывода Тп). Этот новый способ Смело вперед по основан на одной весьма смелой идее. Рассмотрим "сумму" всех дороге, вымощен- возможных расположений костей домино в (2 х п)-прямоугольной желтыми АО- . л — , нике при всех п^Ои назовем ее Т: Т = l + D + Ш + В + ШИ-Н + БЛ---- . (7-i) (Первый член, Ч\ в правой части означает пустое покрытие прямоугольника размером 2x0.) Сумма Т содержит массу информации. Ее польза в том, что можно доказать некоторое свойство Т в целом, вместо того, чтобы выполнять доказательство (по индукции) для отдельных слагаемых. Членами данной суммы являются покрытия, которые представляют собой комбинаторные объекты. Не будем задумываться над вопросом, насколько допустимо суммирование бесконечного числа покрытий. Все можно сделать совершенно строго, но в настоящий момент цель состоит в том, чтобы выйти в своем сознании за рамки привычных алгебраических формул. Мы сложили покрытия, но их можно и умножать, приписывая одно за другим. Например, можно умножить покрытие D на покрытие В и получить покрытие [В. Заметьте, однако, что умножение некоммутативно, т.е. следует учитывать порядок умножения: [В отличается от ED. При использовании таких обозначений для умножения нетрудно увидеть, что пустое покрытие играет особую роль— оно представляет собой мультипликативную единицу, например |хВ = Вх| = В. Теперь можно использовать "доминошную арифметику" для работы с бесконечной суммой Т: т = i + d + ш + в + ши-н + ни---- = = l + D(l + D + m + B+---)+B(l + D + [D + B+---) = = l + DT+BT. (7.2) В правых частях этих равенств каждое правильное покрытие содержится ровно по одному разу, так что выполненные преобразо-
392 Производящие функции вания вполне осмысленны, несмотря на предостережение из главы 2 об "абсолютной сходимости'.' Последняя строка уравнения гласит, что любое покрытие в Т представляет собой либо пустое покрытие, либо вертикальную кость домино, за которой следует что-то из Т, либо две горизонтальные кости домино, за которыми следует что-то из Т. Давайте теперь попытаемся разрешить это уравнение относительно Т. Заменим Т в левой части на IT и вычтем два последних члена справа, мы получим (l-D-B)T = I. (7.3) Для проверки раскроем скобки: l + D + m + B + [ID + [B + B]+--- -п — т — гт — гн — ггт — itr - п=п — •¦• — В — И-ВИ — НЕЗ — ВШ - НВ — ЕИ - ••• I Каждый член верхней строки, за исключением первого, сокращается с каким-либо членом второй или третьей строки, так что наше уравнение вполне корректно. До сих пор нам было сравнительно легко придавать комбинаторный смысл уравнениям, с которыми мы работали. Однако теперь, чтобы получить компактное выражение для Т, выполним комбинаторное деление. Если слепо положиться на алгебраические преобразования, можно поделить обе части уравнения (7.3) на I — D — В и получить Нутром чую, что эти суммы должны сходиться, если кости домино будут достаточно малых размеров! Т I-D-B (74) (Умножение, как уже говорилось, некоммутативно, так что, не различая правое и левое деления, мы практически жульничаем. Но в данном случае это неважно, поскольку I коммутирует с чем угодно. Не будем слишком придирчивы, пока наши заумные идеи не привели к парадоксу.) Следующий шаг состоит в развертывании этой дроби в степенной ряд с использованием правила 1 1 1 + z + z2 + z3 + ¦ Пустое покрытие I, являющееся мультипликативной единицей в нашей комбинаторной арифметике, играет роль обычной мультипликативной единицы 1; a D + В играет роль z. Так что мы
7.1 Теория домино и размен 393 получаем разложение ' l+(D+B) + (D+B)2 + (D+B)3 + - I-D-B = i+(D+B) + (m+[B+B]+ffl) + + (ш]+[1в+[В]+[т+в]]+вв+ш]+вщ) + ---. Это Т, но теперь покрытия расположены в ином порядке, не так, как ранее. Каждое покрытие встречается в этой сумме ровно один раз; так, ih-hihi содержится в (D + B)7. Можно извлечь из этой суммы полезную информацию, если сжать ее, игнорируя детали, не представляющие интереса. Например, можно представить себе, что отдельные кости домино не склеены друг с другом и коммутируют между собой; тогда покрытие IHHIHI превращается в D4o6, потому что оно содержит четыре вертикальные и шесть горизонтальных костей домино. Приведение подобных членов дает ряд Т = l+D + D2 + o2 + D3+2Do2 + D4+3D2o2 + o4 + --- . Здесь слагаемое 2 Do2 представляет два члена старого разложения, СВ и В], имеющих по одной вертикальной и по две горизонтальные кости домино; аналогично 3D2а2 представляет три члена, СЕВ, ЕВ] и ЕШ. По сути, мы рассматриваем D и о как обычные (коммутативные) переменные. Выразить коэффициенты в коммутативной версии Т в аналитическом виде можно, воспользовавшись биномиальной теоремой: I (0 + п2) = 1+ (D + о2) + (D + а2)2 + (? + о2)3 + = ?> + °2)к = = L (^W-. (7.5) (На последнем шаге к — j заменяется на га; это корректная замена, потому что Q) = 0 при 0 ^ k < j.) Таким образом, мы заключаем, что (3+,т) есть число способов покрытия прямоугольника размером 2 х (j + 2m) с помощью j вертикальных и 2т горизонтальных костей домино. Например, мы только что рассматривали покрытие 2x10 прямоугольника размером ii-hihi, которое включает четыре вертикальные и шесть горизонтальных
394 Производящие функции костей домино; всего имеется ( + ) = 35 таких покрытий, следовательно, одним из членов в коммутативном варианте Т является 35D4o6. Можно отбросить еще некоторые детали, если не обращать внимания на ориентацию костей домино. Предположим, что нас не интересуют вертикальные и горизонтальные кости домино и мы хотим знать только общее количество покрытий 2 х п. (Это как раз и есть то самое число Тп, с которого мы начинали наше исследование.) Необходимую информацию можно получить путем простой подстановки одной величины z вместо D и ?. Можно также заменить I на 1 и получить 1 1 (7-6) Теперь, когда нас не интересует ориентация, я дезориентирован. .. Это— производящая функция (6.117) для чисел Фибоначчи, за исключением того, что в числителе отсутствует множитель z; поэтому мы заключаем, что коэффициент при zn в Т равен Fn+i. Компактные представления 1/(1—D—В), 1/(1—D —о2) и 1/(1 — z — z2), выведенные нами для Т, называются производящими функциями, потому что они генерируют интересующие нас коэффициенты. Кстати, наш вывод позволяет заключить, что количество покрытий прямоугольника размером 2хп ровно га парами горизонтальных костей домино равно (n^Lm). (Действительно, в покрытии будет j = п — 2т вертикальных костей домино, следовательно, в соответствии с нашей формулой найдется (1+,т) = Сm"") = ("т™") спос°бов осуществить покрытие.) В главе 6 мы видели, что (TL^lm) представляет собой число букв азбуки Морзе длиной п, содержащих m тире; действительно, нетрудно увидеть прямое соответствие между (2 хп)-покрытиями и буквами азбуки Морзе. (Покрытие ii-hihi соответствует • — ••-•.) Таким образом, покрытия костями домино тесно связаны с континуантами, которые мы изучали в главе 6. Мир тесен... Задачу вычисления Тп мы решили двумя способами. Первый способ, заключающийся в том, чтобы угадать ответ и доказать его по индукции, проще; второй способ— использовать бесконечную сумму покрытий и извлечь из нее интересующие нас коэффициенты— более изощренный. Почему же нам понадобился второй способ? Неужели только потому, что с костями домино очень интересно играть, представляя их алгебраическими переменными? Конечно, нет; истинная причина использования второго способа в том, что метод бесконечных сумм обладает существенно большими возможностями. Он применим к гораз-
7.1 Теория домино и размен 395 до большему количеству задач, потому что не требует от нас сверхъестественных догадок. Давайте поднимемся еще на одну ступень обобщения, занявшись задачей, угадать ответ которой будет выше наших сил. Каково количество Un способов покрытия костями домино прямоугольника размером Зхп? Первые несколько случаев дают нам мало пищи для размышлений. Пустое покрытие дает Uo = 1. При п = 1 допустимых покрытий не существует, поскольку одна кость домино размером 2 х 1 не заполнит прямоугольник размером 3 х 1, а для двух в нем не хватит места. Следующий случай, п = 2, легко разрешить вручную: имеется три покрытия, Щ, Щ и §, так что U2 = 3. (Кстати, из решения предыдущей задачи мы уже знаем, что Тз =3, а количество способов покрытия прямоугольника размером 3x2 такое же, как и количество покрытий прямоугольника размером 2x3.) При п = 3, как и при п = 1, покрытий не существует. В этом можно убедиться, перебрав все возможные варианты... или перейдя на более высокий уровень и просто сообразив, что площадь прямоугольника размером 3x3 нечетная, и никак не может быть покрыта костями домино с четной площадью. (Очевидно, что те же соображения применимы в случае любого нечетного п.) Наконец, когда п = 4, имеется около дюжины покрытий; чтобы найти точное число, надо потратить изрядное количество времени, проверяя полноту списка. Поэтому попробуем подход с бесконечной суммой, который успешно сработал в прошлый раз: u = |+н+н+@+щ+и+щ+0+щ+.... (7.7) Каждое непустое покрытие начинается либо с Ь, либо с f или §; но, к сожалению, в первых двух из них нельзя просто вынести множитель и снова прийти к U. Сумма всех членов в U, начинающихся с fc, может быть записана в виде Ь V, где V = о + щ + щ + [@ + д+... есть сумма всех покрытий "выщербленного" прямоугольника размером 3 х п, в котором отсутствует левый нижний квадратик. Аналогично члены U, начинающиеся с (j1, можно записать как Ер Л, где л = а + й + й + е + й+--- состоит из всех покрытий прямоугольника без верхнего левого угла. Ряд Л представляет собой зеркальное отражение V. Эти
396 Производящие функции разложения позволяют записать U = Ц-bV + FA + gU. Точно так же разлагаются сами V и А, потому что входящие в них покрытия могут начинаться лишь двумя способами: V = DU+^V, А = dU + ^A. Теперь у нас есть три уравнения с тремя неизвестными (U, V и А). Их можно решить, выразив сначала V и А через U, а затем подставив результаты в уравнение для U: v = (l-ar^u, Л = (1-iVaU; u = l + bU-^r^u + Fd-eT^u + gu. Последнее уравнение можно разрешить относительно U, получив компактную формулу U = fc(l-^)-ia-F(|-^)-iD (7-8) Это выражение определяет бесконечную сумму U, так же как (7.4) определяет Т. Следующий шаг состоит в использовании коммутативности. Все прекрасно упрощается, если рассоединить все кости домино и использовать только степени D и ?: U 1 1 - D2o(1 - a3)-1 - D2a(1 - о3)-1 1-о3 (1-o3)2-202a 1 -2D2o(1-a3)-2 1 + 2W + 4D4o2 S*1 3 (1-o3)3 ' (1 2kQ2kak n3^5 + 8D 6 3 (1 .317 + '•• = 3l2k+l m + 2k\ 2k Q2k _ k+3m m Из другого курса я узнал о "регулярных выражениях'! Если я не ошибаюсь, то на языке регулярных выражений можно записать поэтому должна существовать связь между регулярными выражениями и производящими функциями. (Этот вывод заслуживает тщательной проверки. На последнем шаге использована формула (1 —w)_2k-1 = ^Tm (m*2k)wm, тож-
7.1 Теория домино и размен 397 дество (б-бб)-) Посмотрим внимательно на нижнюю строку и попытаемся понять, что она может нам сказать. Она говорит, что любое покрытие размером 3 х п использует четное количество вертикальных костей домино. Кроме того, если имеется 2к вертикальных костей домино, то горизонтальных костей домино должно быть не менее к, и общее количество горизонтальных костей домино должно равняться k+3m для некоторого га ^ 0. Наконец, количество возможных покрытий с 2к вертикальными и к + Зга горизонтальными костями домино равно (m* k)2k. Теперь мы можем проанализировать Зх4-покрытия, которые вызвали затруднения в начале рассмотрения задачи о покрытии прямоугольника размером 3 х п. При п = 4 общая площадь равна 12, так что всего нам потребуется шесть костей домино. Из них 2к вертикальных и k+3m горизонтальных для некоторых кит; следовательно, 2к+к+3га = 6. Другими словами, к+т = 2. Если мы не используем вертикальные кости домино, ток = 0ита = 2; количество вариантов равно (22°)2° = 1. (Здесь учтено покрытие @Ё].) Если использовать две вертикальные кости домино, то к = 1 и m = 1; всего имеется ( * )2] = 6 таких покрытий. А если использовать четыре вертикальные кости домино, то к = 2 и га = 0; таких покрытий имеется (°^ )22 = 4, так что общее количество покрытий — 1Ц = 11. В общем случае при четном п те же рассуждения показывают, что к + та = ^п, следовательно, (m^n2k) = (?/2^) и общее количество (3 х п)-покрытий равно к ч ' та ч 7 Как и ранее, можно заменить символы D и п на z, получив при этом производящую функцию без дискриминации костей домино за их убеждения. Результатом будет функция 1 1-z3 U = l-z^l-z^^-z^l-z3)"1^3 = 1-4z3+z6 * (7*10) Если разложить эту дробь в степенной ряд, получится U = 1+U2z3+U4z6 + U6z9 + U8z12 + --- , производящая функция для чисел Un. (Любопытное несовпадение индексов и показателей степеней в формуле легко объяснимо. Коэффициент при z9, например, есть 11б, отвечающий за покрытия прямоугольника размером 3x6. Это именно то, чего мы хотели, потому что каждое такое покрытие содержит девять костей домино.)
398 Производящие функции Можно продолжить анализ (7-ю) и получить коэффициенты в аналитическом виде, но лучше отложить это занятие, пока мы не наберемся опыта. Так что временно отложим домино и возьмемся за следующую задачу, посвященную "размену'.' Сколькими способами можно заплатить 50 копеек, если платить копейками ®, пятаками ©, гривенниками ®, четвертаками © и полтинниками @. Пойа (Polya) [298] популяризовал эту задачу, продемонстрировав поучительный способ ее решения с применением производящих функций. Запишем бесконечную сумму, которая представляет все возможные способы размена, так же, как ранее в задаче о домино бесконечные суммы представляли все возможные покрытия. Начать проще всего со случая, когда имеется меньше разновидностей монет, поэтому положим для начала, что у нас нет никаких монет, кроме копеек. Сумма всевозможных способов уплаты некоторого количества копеек (и только копеек) записывается в виде Р = /+®+®©+®®®+©®®® + •¦• = /+© + ®2 + ®3 + ®4 + --- . А ведь я помню времена, когда на копейку можно было купить коробку спичек или стакан газировки, а за пятак проехаться в метро... — Переводчик Первый член означает не платить ничего, второй— заплатить одну копейку, третий— две копейки и т.д. Если, кроме копейки, допускается плата еще и пятаками, то сумма всех возможных способов уплаты принимает вид N = Р + ®Р + ®®Р + ©®©Р + ®©©®Р + .-- = (/+© + ©2 + ®3 + ®4 + ---)Р, поскольку каждый вариант выплаты включает некоторое количество пятаков, выбираемых из первого множителя, и некоторого количества копеек, выбираемого из Р. (Обратите внимание, что N не равно сумме /+® + ® + (® + ®)2 + (® + ©)3 Н , потому что такая сумма включает многие варианты выплат более чем по одному разу. Например, член (® + ©)2 = ®® + ®® + @® + ®® рассматривает ®® и ©© как разные варианты, но мы хотим перечислить все множества монет по одному разу безотносительно к их порядку.) Аналогично, если допустить к оплате еще и гривенники, то получится бесконечная сумма D = (^ + ® + ®2 + ®3 + ®4 + ---)N, которая при полном раскрытии будет содержать слагаемые вида ®3®3®5 = ®@@®®®®®®®®. Каждый из этих членов
7.1 Теория домино и размен 399 А многие ли помнят, что трехкопеечная монета называлась "ал- Переводчик представляет собой какой-то из способов размена. Добавление к допустимым монетам четвертаков и полтинников дает IQ. Наша задача заключается в поиске количества членов С, которые стоят ровно 50 копеек. Эта задача красиво решается при помощи следующего трюка. Заменим ® наг, © на г5, ® на г10, © на z25 и @ на z50. Тогда каждый член заменяется на zn, где п— стоимость каждого исходного члена в копейках. Например, член @@©©@ превращается в z50+10+5+5+1 = z71. Четыре способа выплаты 13 копеек, а именно @®3, ®®8, ®2®3 и ®13, сводятся к z13; следовательно, коэффициентом при z13 после z-подстановки будет 4. Пусть Pn, Nn, Dn, Qn и Сп обозначают количество способов заплатить п копеек при использовании монет не старше соответственно 1,5, 10, 25 и 50 копеек. Наш анализ говорит нам, что эти числа представляют собой коэффициенты при zn в соответствующих степенных рядах Р N D Q С 1 + z + z2 + z3 + z4 + • • • , (l+z5+z10+z15+z20 + . + zzu+zDU+z4U + . •)Р> ¦¦)N, (l+z25+z50+z75+z100 + ..-)D, (1+Z50+Z100+Z150+Z200 + ...)Q Интересно, сколько всего существует копеек в реальности? Если п больше, скажем, 1010, то готов держать пари, что "в реальном мире" Рп=0. Очевидно, что Рп = 1 для всех п ^ 0. Небольшое размышление позволяет убедиться, что Nn = |_u/5j + 1: чтобы заплатить п копеек копейками и пятаками, мы должны взять 0 или 1, или ..., или Ln/5J пятаков, после чего останется единственный способ выбрать необходимое количество копеек. Таким образом, Рп и Nn очень просты, чего не скажешь о значениях Dn, Qn и Сп. Один из подходов к этим формулам состоит в том, чтобы заметить, что 1 + zm + z2m + • • • есть просто 1/(1 — zm). Следовательно, можно записать Р N D Q С = Vd -z), = P/0-z5), = N/0-z10), = D/(1-z25h Q/0 .50 л
400 Производящие функции Умножая на знаменатель, получаем (l-z)P = 1, (1-z5)N = Р, (1-z10)D = N, (1-z25)Q = D, (l-z50)C = Q. Теперь, приравнивая коэффициенты при zn в этих уравнениях, получаем рекуррентные соотношения, из которых легко вычисляются интересующие нас коэффициенты: Рп = Рп_! +[п = 0], Nn - Nn_5 + Pn , Dn = Dn_10 + Nn, Qn = Qn-25 + Dn> Cn = Cn_5o + Qn • Например, коэффициент при zn в D = (1 — z25)Q равен Qn — Qn_25; так что мы должны получить Qn — Qn-25 = Dn, как и ожидалось. Можно раскрыть эти рекуррентные соотношения и найти, например, что Qn = Dn + Dn_25 + Dn_5o + Dn_75 H , где сумма обрывается при отрицательных индексах. Однако неитеративная форма удобнее, потому что каждый коэффициент вычисляется при помощи единственного сложения, как в треугольнике Паскаля. Давайте воспользуемся полученными рекуррентного соотношениями для поиска С5о- Начнем с того, что С50 = Со + Qso, так что нам надо найти Qso- Далее, Q50 = Q25 + D50 и Q25 = Qo + D25; так что нам требуется также знать D50 и D25. Эти Dn, в свою очередь, зависят от D40, D30, D20, D15, Dio и D5 и от N50, N45, •••, N5. Таким образом, для определения всех требуемых коэффициентов достаточно выполнить простые вычисления: п Рп Nn Dn Qn Сп 0 1 1 1 1 1 5 1 2 2 10 1 3 4 15 1 4 6 20 1 5 9 25 1 6 12 13 30 1 7 16 35 1 8 40 1 9 25 45 50 1 1 10 11 36 49 50
7.1 Теория домино и размен 401 Последнее значение таблицы и есть искомый ответ Cso- имеется (Не считая оплаты ровно 50 способов заплатить 50 копеек. (Ответ верен для набора кредитной карточ- монет США; нетрудно подсчитать, что российский набор монет К0Й-) 1 С 1Л СП достоинством 1, 5, 10 и 50 копеек позволяет выплатить ту же сумму 37 способами, украинский (1, 2, 5, 10, 25 и 50 копеек) — 407 способами, а советский (1, 2, 3, 5, 10, 15, 20 и 50 копеек) — 2956 способами.— Примеч. пер.) А что можно сказать об аналитическом виде Сп? Перемножение всех уравнений дает компактное выражение r = J 1 1 1 ]_ , , 1 -z 1 -z5 1 -z10 1 -z25 1 -z50 ' l7>llj но как извлечь из него коэффициенты при zn, сразу не понятно. К счастью, это возможно, и позже в этой главе мы еще вернемся к данной задаче. Более элегантные формулы получаются, если размен выполняется в стране, где чеканятся монеты любого положительного достоинства (®, ©, ©, ... ), а не только пять рассмотренных ранее. Соответствующая производящая функция представляет собой бесконечное произведение дробей 1 (1-z)(1-z2)(l-z3)...> и коэффициент при zn в этом выражении после перемножения и раскрытия скобок называется pin), количество разбиений п. Разбиение п— это представление п в виде суммы положительных целых чисел без учета их порядка. Например, имеется семь различных разбиений 5, а именно 5=4+1= 3+2 = 3+1+1 = 2+2+1 - 2+1+1+1 = 1+1+1+1+1 ; следовательно, р(5) = 7. (Кроме того, р(2) = 2, р(3) = 3, р(4) =5 и р(6) = 11; начало выглядит так, как будто р[п)— всегда простые числа. Увы, ip{7) = 15 не оставляет от этой гипотезы камня на камне.) Выражение в аналитическом виде для у[п) неизвестно (хотя имеются приближенные формулы, например РШ) епу/2т\'/3 4п'л/3 1 П"24- И^)(,+°(е-"^»' — Примеч. пер.), но теория разбиений представляет собой захватывающую область математики, в которой было сделано не-
402 Производящие функции мало замечательных открытий. Например, Рамануджан (Rama- nujan) доказал, что р(5п + 4) = О (mod 5), р(7п + 5) = 0 (mod 7) и р(1 In+ 6) = 0 (mod 11), выполнив остроумные преобразования производящих функций (см. Эндрюс (Andrews) [11, глава 10]). 7.2 Основные манипуляции Рассмотрим теперь более внимательно некоторые методы, благодаря которым о степенных рядах можно говорить в превосходной степени. Сначала— несколько слов о терминологии и обозначениях. Обобщенная производящая функция имеет вид G(z) = g0 + giz+g2z2 + --- = J^gnZ71, (7.12) n^O и мы говорим, что G[z) (или, для краткости, просто G) является производящей функцией для последовательности (go, gi > Э2> • • • )> которую мы также записываем как (дп)- Коэффициент дп при zn в G(z) часто обозначается [zn] G{z)y как в разделе 5.4. Сумма в (7-12) берется по всем n ^ 0, но часто более удобно распространить ее на все целые п. Это можно сделать, просто положив g_i = g_2 = • • • = 0. В таких случаях можно по-прежнему говорить о последовательности (go, gi, дг, • • • )> как если бы дп не существовали для отрицательных п. При работе с производящими функциями можно говорить о двух типах выражений в "аналитическом виде" Возможно выражение G(z) в аналитическом виде как функции от z, а возможно выражение в аналитическом виде gn как функции от п. Например, производящая функция для чисел Фибоначчи имеет аналитический вид z/(1 — z — z2); сами числа Фибоначчи в аналитическом виде записываются как (фп — фп)/\/5. Какой именно аналитический вид имеется в виду, будет понятно из контекста. Теперь несколько слов о перспективах. Производящая функция G(z) может являться в двух ипостасях в зависимости от точки зрения. Иногда это функция комплексной переменной z, обладающая всеми стандартными свойствами, доказываемыми в учебниках по анализу. В других случаях производящая функция представляет собой формальный степенной ряд, в котором z— не более чем формальная переменная. В предыдущем разделе, например, мы воспользовались второй интерпретацией; мы встречались с несколькими примерами, в которых z подставлялось вместо некоторого свойства комбинаторного объекта в "сумму" таких объектов. Коэффициент при zn после этого от- Если физики вовсю используют корпускулярно- волновой дуализм, то и математикам не пристало от них отставать.
7.2 Основные манипуляции 403 Даже если превысим скорость, забыв пристегнуться ремнем безопасности из-за выпитого. .. вечал количеству комбинаторных объектов, имеющих это свойство в количестве п. При рассмотрении G{z) в качестве функции комплексного переменного встает вопрос о сходимости ряда. В главе 2 мы говорили, что бесконечная сумма Xln>o 9п^п сходится (абсолютно) тогда и только тогда, когда существует ограничивающая константа А, такая, что конечные суммы H0^n^N lgn?nl никогда не превосходят Л, ни при каком N. Таким образом, легко увидеть, что если сумма Y.n>o Яп^71 сходится для некоторого значения z = zo, то она сходится и для всех z, для которых \z\ < \zq\. Кроме того, должно выполняться limn_^oo |gnZQ | = 0; следовательно, в обозначениях главы 9, gn = O(|1/zo|n), если имеется сходимость в точке zq. И обратно, если gn = 0(М.П), то ряд YLn>o 9n^n сходится при всех \z\ < 1/М. Таковы основные факты о сходимости степенных рядов. Однако для наших целей сходимость — скорее отвлекающий фактор, не играющий особой роли, если только мы не изучаем асимптотическое поведение коэффициентов. Почти каждая операция над производящими функциями может быть строго обоснована как операция над формальными степенными рядами, и такие операции являются корректными, даже если ряды расходятся. (Соответствующую теорию можно найти, например, у Белла (Bell) [23], Найвена (Niven) [282] и Хенричи (Henrici) [182, глава 1].) Кроме того, даже если мы отбросим все предосторожности и выведем формулы без строгого обоснования, то в общем случае окажется возможным доказать результаты вывода по индукции. Например, производящая функция для чисел Фибоначчи сходится только при \z\ < 1/ф « 0.618, но нам не требуется это знать при доказательстве формулы Fn = (фп — фп)/\/5. Будучи найденной, эта формула может быть доказана непосредственно, если не доверять теории формальных степенных рядов. Таким образом, в этой главе мы будем игнорировать вопросы сходимости; сейчас они для нас послужат не помощью, а помехой. До сих пор речь шла о перспективах. Теперь же рассмотрим инструментарий, т.е. набор приемов преобразования производящих функций— сложения, сдвига, замены переменных, дифференцирования, интегрирования и умножения. В последующем изложении мы примем, если не оговорено противное, что F(z) и G(z)— производящие функции последовательностей (fn) и (gn)- Будем также считать, что fn и gn нулевые для отрицательных п, поскольку такое предположение позволит в некоторых случаях не заботиться о пределах суммирования.
404 Производящие функции Совершенно очевидно, что получится, если умножить каждую из производящих функций F и G на константу и сложить получившиеся произведения: ccF(z) + [3G(z) - a]Tfnzn + (3 ^ gnzn = n n = ]Г (cxfn + (3gn)zn. (7-13) Мы получаем производящую функцию для последовательности (afn + |3gn). Сдвиг производящей функции ненамного сложнее. Чтобы сдвинуть G{z) вправо на m позиций, т.е. для образования производящей функции для последовательности (0,..., 0, до, дь • • •) — (gn_m), начинающейся с m нулей, ее просто надо умножить на z" zmGfz) Л9т У gn-m zn > целое m ^ 0. (7.14) Это та операция, которую мы дважды использовали вместе со сложением для вывода уравнения (1 — z — z2)F(z) = z при поиске чисел Фибоначчи в аналитическом виде в главе б. Чтобы сдвинуть G(z) на m позиций влево, т.е. для получения производящей функции для последовательности с отброшенными первыми m элементами (gm, gm+1, gm+2,...) = (gn+m), вычтем из G(z) первые m членов и разделим результат на zm: G(z)-g0-giz- -iz m-1 = Y_ gn+m^ (7.15) (Последнюю сумму нельзя распространять на все п, если только не оказывается, что д0 = • • • = gm_i = 0.) Умножение z на константу представляет собой еще один из наших трюков: G(cz) = J^gAczr = ХсП9^п; (7.16) это дает нам производящую функцию для последовательности (cngn)- Особенно полезен частный случай с = —1. Зачастую к коэффициентам следует добавить множитель п. Сделать это позволяет дифференцирование: G'(z) = gi+2g2Z+3g3Z2+--- - ^Jn+1)gn+1 zn, (7-17) He нравится мне это -г-: так и ка- Q.Z жется, что оно не генерирует, а Сгенерирует последовательность. ..
7.2 Основные манипуляции 405 Выполняя сдвиг на одну позицию вправо, получаем формулу, которая иногда оказывается даже более полезной: zG'(z) = ^ng^z71. (7.18) Это— производящая функция последовательности (ngn). Повторное дифференцирование позволяет умножить gn на любой требуемый полином от п. Обратная операция, интегрирование, позволяет разделить элементы последовательности на п: " 11 1 G(t)dt = g0z+-giz2+-g2z3+--- = Y_ -gn_-,zn. (7.19) (Обратите внимание, что постоянный член равен нулю.) Если вместо (gn_i /п) нам нужна производящая функция для последовательности (gnAi)i то сначала надо выполнить сдвиг на одну позицию влево, заменив под знаком интеграла G(t) на (G(t) — go)Л- Наконец, вот как выполняется умножение производящих функций: F(z)G(z) = = (f0+flZ+f2z2+---)(go+giz+g2z2+"-) = = (fogo) + (fogi+figo)z+(f0g2+figi+f2go)z2 + --- = = Z(Lfk9n-k)zn. (7.20) П k Как мы видели в главе 5, полученная сумма представляет собой производящую функцию последовательности (Нп), свертки (fn) и (gn)- Сумму hn = Xlk^9n-k можно записать и как Нп = Zk=ofi<9n-k, потому что fk = 0 при к < 0, a gn-k = О при к > п. Умножение/свертка немного сложнее других операций, но при этом очень полезна— настолько, что мы посвятим примерам ее использования целый раздел 7.5. Имеется несколько частных случаев умножения, которые заслуживают рассмотрения в качестве отдельных операций. Один из таких случаев мы уже видели: если F(z) = zm, то мы получаем операцию сдвига (7-14)- В этом случае сумма hn превращается в единственный член gn_m, потому что все коэффициенты fk равны 0, за исключением fm = 1. Еще один полезный частный случай имеет место, когда F(z)— хорошо известная нам функция 1/(1 — z) = 1 +z+z2-\ ;
406 Производящие функции Таблица 406. Преобразования производящих функций cxF(z) + (3G(z) = Jjaf^ + P9^zn n zmG(z) = Y" gn-m ?n > целое m ^ О G(z) - g0 - gi z gm_-| z m-1 = Y_ gn+m zn , целое m ^ 0 n^O G(cz) = ]^cngnzn П G'(z) = ^(n+1)gn+1zn П zG'(z) = }^n9nzn TL ZG(t)dt = V" -gn_,zn F(z)G(z) = W^f^.^" П Ч k — G(z) = X(X> 1-z TL 4k^TL тогда все f k (при k ^ 0) равны 1, и мы получаем важную формулу T3iGw = L(L9n-ky = L(L9 n xk^0 n xk^n k Z (7.2l) Умножение производящей функции на 1/(1 — z) дает нам производящую функцию для последовательности частичных сумм исходной последовательности. В табл. 406 собраны все рассмотренные к настоящему моменту операции. Для эффективного их использования полезно иметь в запасе достаточно большой набор производящих функций. В табл. 407 перечислены некоторые простейшие из них; используя приведенную в таблицах информацию, мы уже в состоянии решать некоторые задачи.
7.2 Основные манипуляции 407 Таблица 407. Простые последовательности и их производящие функции Последовательность (1,0,0,0,0,0,...) (0,...,0,1,0,0,...) (1,1,1,1,1,1,...) (1,-1,1,-1,1,-1,...) (1,0,1,0,1,0,...) (1,0,...,0,1,0,...,0,1,0,. (1,2,3,4,5,6,...) (1,2,4,8,16,32,...) (1,4,6,4,1,0,0,...) О.'.®. (!)>•••> (1.с,(сПС12).-) (1,с,с2,с3,...) (i.rrj.r^.cr3).- (0 1 J- J- 1 ) \и' '» 2> 3' 4' ••• / \0> ') 2' 3' 4>- • •/ (1 1 1 1 1 ± \ \ ' > ' > 2 ' 6 ' 24 > 1 20 ' • • - / ...) -> Производящая функция У [n = 0]zn ^—п^О У" [u = m]zn ^—п^О У (-1)nzn •^— п;г0 Г J2\n]zn У" fm\n]zn ^—тг^О У" (n+1)zn У" 2nzn L (V У (c+n~V У" cnzn Г (т+П) z™ *—n^o n! Аналитический вид 1 zm 1 T^z 1 T+z" 1 1^2 1 1-zm 1 fTz]1 1 T=2z" 0+z)4 d+z)c 1 fPzl^ 1 1—cz 1 (1-z)™+1 1—z ln(1+z) ez Каждая производящая функция из табл. 407 сама по себе достаточно важна, чтобы потратить время на ее запоминание. Многие из них представляют собой частные случаи других, а другие
408 Производящие функции могут быть легко получены при помощи основных операций из табл. 406; таким образом, перенапрягать память не придется. Например, рассмотрим последовательность (1,2,3,4,...), производящая функция которой 1/(1 — z)2 часто оказывается полезной. Эта производящая функция находится примерно в средине табл. 407 и представляет собой частный случай m = 1 последовательности (1, (ш^), (mr^2)> (Шт3)> • • • )i которая располагается ниже в таблице; это также частный случай с = 2 родственной последовательности (1, с, (°^ ), (°з )>•••)• Вывести нужную формулу можно из производящей функции последовательности (1,1,1,1,...), взяв ее частичные суммы, как в (7-2i), т.е. поделив 1/(1 — z) на (1 — z). Можно также вывести ее из (1,1,1,1,...) путем дифференцирования, воспользовавшись (7-17)- Последовательность (1,0,1,0,...) представляет собой еще один пример последовательности, производящая функция которой может быть получена разными способами. Очевидно, что можно просто вывести формулу 2Znz2n = 1/(1 — z2) путем подстановки z2 вместо z в тождество ^Zn zn = 1 /(1 — z); можно также применить накопительное суммирование к последовательности (1,-1,1,-1,...), производящая функция которой равна 1/(1 +z), что дает 1/(1 + z)(l — z) = 1/(1 — z2). Имеется и третий путь, основанный на общем методе извлечения членов с четными номерами (до> 0, д2> 0, д4,0,...) из любой последовательности: если сложить G(— z) с G{+z), можно получить G(z) + G(-z) = ^gn(l+(-l)n)zn = 2^ 9п[тг четное]zn п п следовательно, G(z) + G(-z) v 2n 2 = 2_^2nZ тг Аналогично можно извлечь члены с нечетными номерами: G(z)-G(-z) тг- 2п+1 2 = 2_92n+i zzn+l . (7.23) п В частном случае дп = 1 и G{z) = 1/(1 — z) получаем, что производящая функция для (1,0,1,0,...) есть ^(G(z) + G(—z)) = 2U-z ^ *\+z) ~ 1-z2 • Попробуем применить этот трюк к производящей функции для чисел Фибоначчи. Мы знаем, что ^n Fnzn = z/(l — z — z2); Подсказка: если последовательность состоит из биномиальных коэффициентов, то производящая функция обычно включает биномы 1 ±z. Ну все, все— уговорили! (7.22)
7.2 Основные манипуляции 409 следовательно, *— 2\\ —z — zl 1 + z — z1 I _ 1 /z + z2-z3 -z + z2+z3\ _ z2 " 2 V (l-z2)2-z2 J " 1 - 3z2 + z4 ' Эта функция генерирует последовательность (Fo> 0) ^2> 0> ^4> • • •); значит, последовательность чисел Фибоначчи с четными индексами (Fo> ^2, ^4) ^б> • • •) = (0,1,3,8,...) имеет простую производящую функцию: 1 — 3z + z2 п 7.3 Ре1пение рекуррентных соотнонсений Займемся теперь одним из наиболее важных применений производящих функций— решением рекуррентных соотношений. Нас интересует поиск выражения в аналитическом виде как функции от п для элементов gn последовательности (gn), которая удовлетворяет некоторому рекуррентному соотношению. Решение этой задачи при помощи производящих функций выполняется за четыре шага, настолько механических, что их почти можно запрограммировать на компьютере. 1 Запишите одно уравнение, выражающее gn через другие элементы последовательности. Это уравнение должно быть корректным для всех целых п с учетом того, что g_i = g_2 = • • • = 0. 2 Умножьте обе части уравнения на zn и просуммируйте по всем п. В левой части получится сумма Цп gn^n, которая представляет собой производящую функцию G(z). Правую часть следует преобразовать таким образом, чтобы она превратилась в некоторое другое выражение, включающее G(z). 3 Решите получившееся уравнение, получив для G(z) выражение в аналитическом виде. 4 Разложите G(z) в степенной ряд и возьмите коэффициент при zn; это и будет аналитический вид gn. Этот метод работает, потому что единая функция G(z) представляет всю последовательность (gn) способом, допускающим выполнение большого количества преобразований. (7-24)
410 Производящие функции Пример 1: еще раз о числах Фибоначчи Попробуем в качестве примера повторить вывод формулы для чисел Фибоначчи из главы 6. Там мы нащупывали путь, изучая новый метод; теперь же будем действовать более систематически. Нам дано рекуррентное соотношение до = 0; дт = 1 ; дп = дп_т + дп_2 при п ^ 2. Найдем выражение для gn, выполнив приведенные выше четыре шага. Шаг 1 гласит, что мы должны записать рекуррентное соотношение в виде "одного уравнения" для gn. Мы можем написать {0, если тг <J 0; 1, если тг = 1; дп_1 +дп-2> еслитг > 1; но это самообман. В действительности на шаге 1 требуется формула, не содержащая конструкций с перечислением случаев. Одно уравнение 9п = gn-i + 9п-2 имеет место для п ^ 2 и выполняется для тг ^ 0 (потому что до = 0 и дотриц = 0). Но при тг = 1 мы получим 1 в левой части и 0 в правой. К счастью, ситуацию легко исправить, поскольку можно добавить в правую часть член [п = 1]; тем самым будет добавлена 1 при тг = 1, а при тг -ф 1 уравнение останется неизменным. Итак, имеем gn = gn_] +gn_2 + [тг = 1]; это и есть то уравнение, которое требуется получить на шаге 1. На шаге 2 мы должны преобразовать уравнение для (gn) в уравнение для G[z) — ]ГП Яп^- Это нетрудно: G(z) =^д^ = ^gn_izn+^gn_2zn+^[n = 1]zn = п п n n n n = zG(z)+z2G(z)+z. Шаг 3 в нашем случае тоже прост; имеем G(z) = Z 2, I — z — zz что, конечно, неудивительно.
7.3 Решение рекуррентных соотношений 411 Вся загвоздка в шаге 4. В главе б выполнить этот шаг помогло внезапное озарение; здесь же мы будем двигаться медленнее, чтобы затем, в более сложных задачах, уверенно справляться с этим шагом. Итак, что же представляет собой 1 J1-z-z2> коэффициент при zn в разложении z/(1 — z—z2) в степенной ряд? Как в общем случае, имея некоторую рациональную функцию им РЫ QM' где Р и Q— полиномы, найти коэффициент [zn] R(z)? Имеется один вид рациональных функций с особо хорошими коэффициентами, а именно 'тп + п й^-Ш"К («> (В табл. 407 содержится данная формула при р = 1; общую формулу, показанную здесь, можно получить подстановкой pz вместо z и умножением на а.) Коэффициенты конечной суммы функций вида (7-25), <w > = Qi 02 (l-Piz)T + -+м.П1У,т1 + 1> (Г^в) также неплохи: [zn]S(z) = ai I )ру- + а2( 1 p2 + Мы покажем, что любая рациональная функция R(z), такая, что R(0) ф со, может быть выражена в виде R(z) = S(z) + T(z), (7.28) где S[z) имеет вид (7-26), а T(z) представляет собой полином. Таким образом, для коэффициентов [zn] R(z) имеется выражение в аналитическом виде. Поиск S(z) и T(z) эквивалентен поиску "разложения на элементарные дроби" функции R(z).
412 Производящие функции Обратите внимание, что S(z) = со для значений z, равных 1/pi, ..., 1/pi. Следовательно, числа р^, которые нам надо найти, если мы хотим представить R(z) в виде S(z) +T(z), должны быть обратны числам сх^, для которых Q(otk) = 0. (Вспомните, что R(z) = P(z)/Q(z), где Р и Q— полиномы; R(z) = со, только если Q(z) =0.) Предположим, что Q{z) имеет вид Q(z) = q0 + qiz+--- + qmzm> где q0 ф 0 и qm ф 0. "Обращенный" полином QR(z) = q0zm + q1zm-1+--- + qm имеет важную взаимосвязь с Q(z): QR(z) = q0(z-p1)...(2:-Pm) Q(z) = q0(1 -piz)...(l -pmz). Таким образом, корни QR обратны корням Q и наоборот. Следовательно, для нахождения нужных нам чисел р^ надо разложить обращенный полином QR(z) на множители. Например, в случае последовательности Фибоначчи имеем Q(z) = 1 -z-z2\ QR(z) = z2-z-1. Корни QR можно найти при помощи общей формулы для корней квадратного уравнения (-b±Vb2-4ac)/2a, положив (а, Ь,с) = (1,-1,-1); они оказываются равными 1+V5 ж 1 -л/5 Ф = —2— и ф = —-—. Следовательно, QR(z) = (z— ф)(z — ф) и Q(z) = (1 — §z){\ — $z). После того как найдены числа р, можно перейти к построению разложения на элементарные дроби. Сделать это проще всего в случае различных корней, поэтому сначала рассмотрим именно этот частный случай. Мы можем сформулировать и доказать общий результат. Теорема о разложении рациональных функций в случае различных корней Если R(z) = P(z)/Q(z), где Q(z) - q0(1 - Piz)...(1 - Piz) и числа (pi,..., pi) различны, и если P{z) является полиномом степени меньше I, то [zn]R(z) = cnp^ + ... + агрГ, -pkP(VPk) , , rAeQk= Q'(VPic) ' (?-29)
7.3 Решение рекуррентных соотношений 413 Сразите своих родителей, оставив книгу открытой на этой странице, когда уйдете гулять. (Скорее всего, они будут сражены не формулами, а единственным, что им будет понятно на этой странице, — данным советом... — Переводчик) Доказательство. Пусть си, ..., cti— константы с указанными выше значениями. Формула (7-29) справедлива, когда R(z) = P(z)/Q(z) равно S(z) = си 1 -Ptz + .-.+ ai 1 -piZ Можно доказать, что R(z) = S[z), показав, что функция T(z) = R(z) — S(z) не бесконечна при z —> 1/pk. Отсюда будет следовать, что рациональная функция T(z) никогда не обращается в бесконечность; следовательно, функция T(z) должна быть полиномом. Можно также показать, что T(z) —> 0 при z —> 00; следовательно, T(z) должна быть нулем. Пусть otic = 1/pic. Чтобы доказать, что limz_^a]c T(z) / со, достаточно показать, что limz^ak (z — aic)T(z) =0, потому что T(z)— рациональная функция от z. Таким образом, мы хотим показать, что lim (z- z-+<xk ocic)R(z) = lim (z- z-*-ak ock)S(z) Предел в правой части равен limz_^ak ak(z — aic)/(1 — pkz) -ak/pk, потому что (1 -pkz) = -pk(z-ak) и (z-ak)/(1 -pjz) - для j ф k. Предел в левой части равен lim {z-ock)—-- = P(cxk) hm = ——- z->ak Q(z) z->ak Q(z) Q (ock) по правилу Аопиталя. Таким образом, теорема доказана. Возвратимся к примеру с числами Фибоначчи. Здесь ?{z) zh Q(z) - -1-2zh 1 (1 — фг)(1 — $z); следовательно, Q'(z) = -рР(Ур) Q'd/P) -1 -1-2/р р + 2 Согласно (7.29) коэффициент при фп в [zn] R(z) равен ф/(ф+2) = 1Д/5; коэффициент при фп равен ф/(ф + 2) = —1Д/5- Таким образом, теорема гласит, что Fn = (фп — фп)/\/5, как в (6.123). Если Q(z) имеет кратные корни, вычисления становятся сложнее, но мы можем усовершенствовать доказательство и установить справедливость следующего, более общего результата. Общая теорема о разложении рациональных функций Если R(z) = P(z)/Q(z), где Q(z) - q0(1 -piz)dl ... (1 -Plz)d^ и числа (pi>...,pi) различны, и если P(z) является полиномом степени меньше di Н Ь di, то [zn]R(z) = ^(^р^ + .-. + ^^р!1 для всех п^О, (7.30)
414 Производящие функции где все fk(n) являются полиномами степени dk — 1 со старшим коэффициентом = (-pk)dkP(1/Pk)dk Qk Q(dk)(VPk) P(VPk) (dic-1)!qon^k(l-Pj/Pk) (7-3i) Это можно доказать по индукции по max(di,..., dj.), используя тот факт, что cntdT-l)! aildi-l)! (1 -P!z)di (1 -PiZ)d^ является рациональной функцией, в знаменателе которой находится полином, не делящийся на (1 — pk^)dk ни при каких к. Пример 2: достаточно случайное рекуррентное соотношение Теперь, познакомившись с более общими методами, мы готовы взяться за новые задачи. Попробуем найти аналитическое решение рекуррентного соотношения 9о = 9л = 1 ; gn = gn_! + 2gn_2 + (-1 )п при п ^ 2. (7.32) Всегда неплохо иметь таблицу нескольких малых случаев, и рекуррентное соотношение легко позволяет это сделать: п (-1Г 9п 0 1 1 1 -1 1 2 1 4 3 -1 5 4 1 14 5 -1 23 6 1 51 7 -1 97 Простая формула не просматривается, и этой последовательности нет даже в Справочнике [330] Слоана (Sloane); так что нам не избежать четырехходового процесса, если нам действительно надо решить это рекуррентное соотношение. Шаг 1 прост, поскольку все, что нам надо,— это придумать дополнительные члены для коррекции ситуации при п < 2: уравнение gn - gn-i +2gn_2 + (-1)n[n^0] + [n = 1]
7.3 Решение рекуррентных соотношений 415 выполняется для всех целых п. Теперь можно выполнить шаг 2: G(z) = ^gnzn = П = Y_ 9n-i *n + 2 Y_ 9n-2Zn + Y_ (-1 Tzn + ? *n = = zG(z)+2z2G(z) + - + z. 1 + z (Кстати, можно было использовать ("^ ) вместо (—1 )n[n ^ 0], тем самым по биномиальной теореме получив ^1п ("^ )zn = (1 +z)-1.) Шаг 3 требует лишь элементарной алгебры и дает rf , = 1+z(1+z) = 1+z + z2 lZJ (1 + z)(1 -z-2z2) (1 -2z)(1 + z)2 ' Теперь остается только шаг 4. Определенную сложность представляет множитель в квадрате в знаменателе, поскольку, как мы знаем, в случае кратных корней анализ выполняется труднее, чем когда корни различны. Но ничего не поделаешь— нам попался именно этот случай. У знаменателя два корня, pi = 2 и р2 = — 1; общая теорема о разложении (7-3°) гласит, что gn = ai2n + (a2n + c)(-1)n с некоторой константой с, где _ 1+1/2+1/4 _ 7 _ 1 -1+1 _ ^ Ql ~ (1+1/2)2 ~ 9' а2 " 1-2/(-1) ~ 3' (Когда знаменатель имеет простые множители, удобнее использовать для вычисления а^ вторую формулу в (7-31)» а не первую. Нам нужно лишь подставить z = 1 /pi< везде в R(z), за исключением множителя, обращающегося в нуль, и поделить результат на (die — 1)!; это даст нам коэффициент при ndk_1 р?.) Подстановка п = 0 показывает, что неизвестная пока константа с должна быть равна |; следовательно, искомый ответ — 9п = ?2"+(?п+|)(-1Г\ (7.33) Несложно проверить случаи п = 1 и 2, просто чтобы убедиться в том, что мы не ошиблись. Возможно, следует проверить и случай п = 3, поскольку формула выглядит несколько странно. Но на самом деле все в порядке. N.B.: верхний индекс в ]ГП=1 zn не пропущен!
416 Производящие функции Можно ли было угадать формулу (7-33)? Ну, протабулиро- вав значения далее, можно было бы заметить, что gn+i ~ 2gn при больших п. При большой наблюдательности и удаче можно было бы додуматься до константы |. Но, конечно, гораздо проще и надежнее использовать в качестве инструмента производящие функции. Пример 3: взаимно рекуррентные последовательности Иногда встречаются два или более рекуррентных соотношений, зависящих одно от другого. В таких случаях можно образовать производящие функции для обеих последовательностей и решить их, немного расширив наш четырехходовый метод. Например, вернемся к задаче о покрытии костями домино прямоугольника размером 3 х п, с которой мы уже работали в этой главе. Если мы хотим узнать только U^ — общее количество вариантов покрытия прямоугольника 3 х п костями домино, не разделяя случаи вертикальных и горизонтальных костей домино, то нет необходимости вдаваться в такие подробности, как раньше. Можно просто записать рекуррентные соотношения U0 = 1, U1=0; Vo=0, V1=1; Un = 2Vn_! + Un_2 , Vn = Un_! + Vn_2 при n ? 2. Здесь Vn— количество покрытий прямоугольника размером 3 х п без угла с использованием (Зп — 1 )/2 костей домино. Эти рекуррентные соотношения легко вывести, если рассмотреть возможные расположения костей домино на левой стороне прямоугольника, как мы делали ранее. Вот значения Un и Уп при малых п: п Un Vn 0 1 2 1 0 3 0 1 0 3 0 4 4 11 0 5 0 15 6 41 0 7 0 56 Найдем за четыре шага выражение в аналитическом виде. Сначала (шаг 1) запишем Un = 2Vn_! + Un_2 + [11 = 0], Vn = Un_! + Vn_2 для всех п. Следовательно (шаг 2), U(z) = 2zV{z) + z2U(z) + 1 , V(z) = zU(z) + z2V(z). Теперь (шаг 3) мы должны решить два уравнения с двумя неизвестными; это легко сделать, получив из второго уравнения
7.3 Решение рекуррентных соотношений 417 V(z) = zli(z)/(1 — z2); далее находим UU) ^ 1-47+z4 ; V(Z) = 1-4z'+z4 • (7'35) (Мы уже видели эту формулу для U(z) в (7-ю), но тогда в ней вместо z2 было z3. В том выводе п представляло собой количество костей домино, а здесь это ширина прямоугольника.) Знаменатель 1 — 4z2 + z4 является функцией от z2; это обеспечивает U2n+i = 0 и Vzn — 0, как и должно быть. Можно извлечь выгоду из этого свойства, сохранив z2 при разложении знаменателя на множители: нам вовсе не обязательно разлагать 1 — 4z2 + z4 в произведение четырех множителей вида (1 — p^z), поскольку двух множителей вида (1 — рк?2) будет достаточно для определения коэффициентов. Другими словами, рассмотрев производящую функцию W^ = 1 А\ 2 = W0+W1z + W2z2 + ..- , (7.36) I — 4z + z^ получим V(z) = zW(z2) и U(z) = (1 — z2)W[z2)\ следовательно, V2n+i = VVn и llzn = Wn — Wn_i. Мы сохраним время и силы, работая с более простой функцией W{z). Полином 1 — 4z + z разлагается на множители (z — и (z — 2 + л/3 ), их также можно записать в виде (1 — (2+л/З )z) и (1 — (2—\/3 )z), потому что этот полином обратен сам себе. Таким образом, получаем V2n+1 = Wn = ^(2+V3)^^(2_^)n. U2n = Wn-Wn„, = ?±^(2+V3)n+^^(2-V3)n = = PW5r (2-V5)" ( } Это и есть искомое выражение для количества покрытий прямоугольника размером 3 х п костями домино. Кстати, формулу для U2R можно упростить, заметив, что второе слагаемое всегда лежит между 0 и 1. Число llin целое, так что U2n (2 + х/ЗГ З-л/3 при п ^ 0. (7.38) В действительности второй член (2 — >/3 )п/(3 + л/3 ) исчезающе мал при больших п, потому что 2 — у/Ъ « 0.268. Это следует
418 Производящие функции иметь в виду при использовании формулы (7-3&) для расчетов. Например, достаточно дорогой калькулятор, выпускаемый фирмой с хорошей репутацией, при вычислении (2 + \/3)10/(3 — у/3) дает 413403.0005. Этот ответ точен до девятой значащей цифры; однако точное значение немного меньше 413403, а не чуть-чуть больше. Таким образом, было бы ошибкой вычислять потолок от 413403.0005; точный ответ, U20 = 413403, получается округлением до ближайшего целого. Потолки могут быть опасными. Как и полы... Пример 4: выражение в аналитическом виде для задачи размена Мы оставили задачу размена, подсчитав только количество способов выплаты 50 копеек. Давайте попробуем найти то же число для одного рубля (или миллиона), при том же способе оплаты — копейками, пятаками, гривенниками, четвертаками и полтинниками. Производящая функция, которую мы вывели ранее, имеет вид гм = J ] 1 1 1_ [Z} 1 -z 1 -z5 1 -z10 1 -z25 1 -z50 ' это рациональная функция от z, знаменатель которой имеет степень 91. Таким образом, можно разложить знаменатель на 91 множитель и выразить Сп— количество способов выплаты п копеек— в "аналитическом виде" из 91 слагаемого. Но это слишком грустное решение. Нельзя ли в данном конкретном случае найти что-то более красивое? Первый проблеск надежды появляется, когда мы замечаем, что знаменатель почти является функцией от z5. Тот же трюк, использованный нами для упрощения вычислений в случае знаменателя 1 — 4z2 + z4, который представлял собой функцию от z2, можно применить и к C(z), заменив 1/(1 — z) на (1 + z + z2 + z3+z4)/(l-z5): l+z + z2+z3+z4 1111 1 -z5 1 -z5 1 -z10 1 -z25 1 -z50 ~ (1+z + z2+z3+z4)C(z5h _J 1111 1 -z 1 -z 1 -z2 1 -z5 1 -z10 ' Знаменатель "сжатой" функции C(z) имеет степень, равную всего лишь 19, так что эта функция гораздо лучше исходной. Новое выражение для C(z), кстати, показывает, что С5П = Csn+i = С5п+2 = С5п+з = С5П+4; и Действительно, это соотношение легко объяснить: количество способов выплаты 53 копеек такое же, C(z) C(z)
7.3 Решение рекуррентных соотношений 419 как и количество способов выплаты 50 копеек, потому что количество копеек по модулю 5 предопределено. О сжатой функции Но даже для C(z) не существует простого выражения, осно- говорим сжато. ванного на корнях знаменателя. Вероятно, простейший способ вычисления коэффициентов C(z) получится, если заметить, что каждый сомножитель в знаменателе является делителем 1 — z1 °. Следовательно, можно записать Afz) CW = nolens > где A(z) = ao+Atz+. . -+A3iz31. (7-39) Для полноты картины вот как выглядит A(z): (1+z+... + z9)2(1+z2 + -.- + z8)(1+z5) = = 1 + 2z + 4z2 + 6z3 + 9z4 +13z5 + 18z6 + 24z7 + 31z8+ + 39z9 + 45z10 + 52z] 1 + 57z12 + 63z13 + 67z14+ + 69z15 + 69z]6 + 67z17 + 63z18 + 57z19 + 52z20+ + 45z21 + 39z22 + 31z23 + 24z24 + 18z25 + 13z26+ + 9z27 + 6z28+4z29+2z30+z31. В завершение, поскольку 1/(1 — z10)5 = X!k>o (k44)z10k> можно определить коэффициент Cn = [zn] C(z) следующим образом: Cioq+r = 21 A, (fc+4) [1 Oq+r = 10k+j] = Ar(^4)+Ar+10(q:3)+Ar+2o(q:2)+ +Аг+зоГ4 J> (740) где n = 10q+rn0^r< 10. Это дает нам десять случаев, по одному для каждого значения г; но это все же неплохая формула по сравнению с другими альтернативами, включающими степени комплексных чисел. Например, это выражение можно использовать для определения значения Csoq = Cioq. Тогда г = 0, и мы имеем Количество способов оплатить 50 коп. равно (4)+45(4) = 50; один рубль можно заплатить (4) +45 (4) +52(4) = 292 способами, а для 1 000 000 рублей это количество составляет /2000004\ лг /2000003\ гп /2000002\ „ /2000001\ ( 4 М 4 М 4 )+2( 4 )" = 66666793333412666685000001.
420 Производящие функции Пример 5: расходящийся ряд Попытаемся теперь найти выражение в аналитическом виде для чисел gn, определяемых соотношениями 9о = 1; gn = rign_i при п>0. Поразмышляв несколько наносекунд, легко сообразить, что gn — От нанотехнологий это просто п!; метод суммирующих множителей из главы 2 даст не спрятаться даже ^ ^ в математике. этот ответ едва ли не еще быстрее. Но попробуем найти решение при помощи производящих функций хотя бы для того, чтобы посмотреть, что же у нас получится. (Действительно мощный метод должен работать и для простых соотношений наподобие приведенного, и в сложных случаях, когда угадать ответ представляется невозможным.) Уравнение 9ix = ngn_i +[n = 0] справедливо при всех п и приводит к G(z) - 2_gnzn = ^ngn_1zn + ^zn. R П 71 = 0 Для завершения шага 2 надо выразить Цпп9тг-1 ?п через G(z); табл. 406 (основных методов преобразования) подсказывает, что здесь должна помочь производная: G'(z) = ^nTLgn^n_1 • Подгоним наше выражение к сумме требуемого вида: G(z) = l+2jn + 1)gnzn+l = П П П = 1+z2G'(z)+zG(z). Проверим это уравнение, подставляя значения gn для малых п. Поскольку G = 1 + z + 2z2 + 6z3 + 24z4 + • • • , G' = 1 +4z -H8z2 + 96z3 + --- , имеем Z2G' = z2+4z3 + 18z4+96z5 + ... ^ zG = z + z2 + 2z3 + 6z4 + 24z5 + • • • , 1=1. Суммирование этих строк дает нам G, так что пока все в порядке. Кстати, зачастую удобнее писать (G' вместо 'G(z)'; лишнее
7.3 Решение рекуррентных соотношений 421 "Это будет быстро"— утешал меня доктор, втыкая в меня настоящий гипершприц... '(z)' только загромождает формулу, если мы не заменяем z чем- нибудь еще. Теперь идет шаг 3, и он отличается от того, что мы делали раньше, поскольку в данном случае нам предстоит решить дифференциальное уравнение. С этим дифференциальным уравнением мы можем справиться при помощи гипергеометрических рядов из раздела 5.6 — эти методы не так уж плохи. (Если вы не знакомы с гипергеометрическими функциями— не тревожьтесь, все будет сделано очень быстро.) Начнем с избавления от константы 1, для чего возьмем производную от обеих частей: G' = (z2G' + zG + 1] = (2zG' + z2G") + (G+zG') = z2G" + 3zG' + G. Теория из главы 5 требует от нас переписать все это с применением оператора ?, а из упр. 6.13 мы знаем, что dG zG', d2G = z2G" +zG'. Итак, дифференциальное уравнение в требуемом нам виде выглядит следующим образом: dG = z?2G+2z?G+zG = z(fl + 1)2G. В соответствии с (5-109) решением при до = 1 является гипергеометрический ряд F(1,1;; z). Шаг 3 оказался сложнее, чем мы ожидали; но теперь, когда мы знаем функцию G, шаг 4 очень прост— определение гипергеометрического ряда (5-7^) дает требуемое разложение: Gfz) 1J п>0 П! J^ n! zn, п>0 Мы подтвердили выражение, которое знали все время: gn = п!. Обратите внимание, что метод производящих функций дал правильный ответ несмотря на то, что G(z) расходится при всех ненулевых z. Последовательность тг! растет настолько быстро, что член |n!zn| стремится к оо при п —> со, за исключением точки z = 0. Это показывает, что с формальными степенными рядами можно выполнять алгебраические действия, не заботясь о сходимости. Пример 6: рекуррентное соотношение с возвратом В завершение этого раздела рассмотрим применение производящих функций к задаче из теории графов. Фан порядка п —
422 Производящие функции это граф с вершинами {О,1,..., п} и 2п— 1 ребрами, определяемый следующим образом: вершина 0 соединяется ребрами с каждой из остальных п вершин, а вершина к соединяется с вершиной к+1 для 1 ^ к < п. Ниже, например, приведен фан порядка 4, имеющий пять вершин и семь ребер. Л Интересующая нас задача состоит в следующем: сколько в таком графе остовных деревьев fn? Остовным деревом называется подграф, содержащий все вершины и такое количество ребер, чтобы этот подграф был связным, но не настолько много, чтобы в нем появился хоть один цикл. Оказывается, что любое остовное дерево в графе с п+ 1 вершинами имеет ровно п ребер. Подграф менее чем с п ребрами не будет связным, а если число ребер превысит п, в подграфе появится цикл; это доказывается в книгах по теории графов. Существует ( п~ ) способов выбрать п ребер из 2п— 1, имеющихся в фане порядка п, но не любой такой выбор дает остовное дерево. Например, подграф Л имеет четыре ребра, но не является остовным деревом; в нем есть цикл 0 — 4 — 3 — Ои нет связи между вершинами {1,2} и остальными. Мы хотим подсчитать, сколько из (2n~'i) вариантов дают остовное дерево. Рассмотрим несколько начальных случаев. Можно легко перечислить все остовные деревья при п = 1, 2 и 3: . АЛЛА •^——• „ л _j Л л л л f 1 = 1 f 2 = 3 f3 = 8 (Можно не указывать метки у вершин, если всегда рисовать вершину 0 слева.) Что можно сказать о случае п = 0? На первый взгляд, кажется разумным положить fо = 1; но мы примем
7.3 Решение рекуррентных соотношений 423 fo = 0, потому что существование фана порядка 0 (который должен иметь 2п— 1 = — 1 ребро) вызывает серьезные сомнения. Наша четырехходовая процедура предписывает найти рекуррентное соотношение для fn, которое выполняется при всех п. Для получения такого соотношения рассмотрим, как самая верхняя вершина (вершина п) соединяется с остальной частью остовного дерева. Если она не соединена с вершиной О, то она должна быть соединена с вершиной п — 1, поскольку эта последняя должна соединяться с остальным графом. В этом случае любое из fn_i остовных деревьев для остающегося графа (фана с вершинами от 0 до п — 1) вместе с новым ребром образует остовное дерево для всего графа. В противном случае вершина п соединена с вершиной О, и найдется некоторое число k ^ п, такое, что вершины п, п—1, ..., к непосредственно соединены между собой, но ребро между вершинами к и к — 1 не входит в поддерево. Тогда в дереве не может быть ребер между 0 и {п — 1,..., к}, иначе получится цикл. Следовательно, для к = 1 остовное дерево полностью определено. Если же к > 1, то для завершения остовного дерева достаточно добавить любое из f^-i остовных деревьев на вершинах {0,1,..., к — 1}. Например, вот что дает этот анализ для п = 4: к = 4 к = 3 к = 2 к=1 •А'Л U h h h fi 1 Общее уравнение, справедливое для п ^ 1, имеет вид + fn-l + fn-2 + fn-3 + • ' ' + f 1 + 1 • (Выглядит все так, как будто Ч' в конце есть fo, так что нам следовало бы принять fо = 1; но мы останемся при своей точке зрения.) Небольшое изменение делает уравнение справедливым при всех целых п: fn = fn-i + Xfk + [n>0]. (741) k<n Это рекуррентное соотношение как раз содержит "возврат к началу" от fn_i через все предшествующие значения, и в этом главное отличие данного рекуррентного соотношения от всех рекуррентных соотношений, с которыми мы имели дело ранее в этой главе. Чтобы избавиться от аналогичной суммы в правой части
424 Производящие функции рекуррентного соотношения (2.12), в главе 2 был применен специальный прием, а именно— вычитание одного экземпляра соотношения из другого (fn+1 — fn)- Здесь этот способ тоже годится; но, как будет показано далее, метод производящих функций позволяет непосредственно работать с суммами такого рода. (И это хорошо, потому что вскоре нам придется иметь дело с гораздо более сложными рекуррентными соотношениями.) Шаг 1 завершен; на шаге 2 нам придется применить новый прием: F(z) - ^fnzn = ^fn_1zn+^fkzn[k<n]+^[n>0]zn = n n k,n n = zF(z)+Y"fkzkY"[n>k]zn-4T^ = k n = zF(z)+F(z) }~ *m+T^- = m>0 = zF(z)+F(z) т^+т^ • I —z I — z Ключевой трюк заключается в замене zn на zkzn_k, что позволяет выразить двойную сумму через F(z), как и требуется на шаге 2. Шаг 3 сводится к простой алгебре, и мы находим Обладатели хорошей памяти узнают в этом выражении производящую функцию (7-24) для чисел Фибоначчи с четными номерами. Так что шаг 4 оказывается лишним; мы уже нашли несколько неожиданный ответ задачи о количестве остовных деревьев фанов: fn = hn прип^О. (742) 7.4 Специальные производящие функции Пройти шаг 4 нашей четырехходовой процедуры будет проще, если мы будем знать коэффициенты большого количества разных степенных рядов. Разложения в табл. 407 достаточно полезны, если они применимы, однако имеется масса других типов выражений в аналитическом виде. Таким образом, следует дополнить эту таблицу еще одной, в которую будут включены степенные ряды, соответствующие "специальным числам" рассматривавшимся в главе 6.
7.4 Специальные производящие функции 425 Таблица 425. Производящие функции для специальных чисел (1^Tlni = Z^+n-Hm)(m+n)zM7.43) n^O ez-1 *•— n I u^O FmZ 1-(Fm-i +Fm+1 )z+(-1 )™z* ? ?™: Ш k!zk (1-z)k+1 (--1) 1\-m z(:k (l-z)(l-2z)...(l-mz) ^- [m zm = z(z+l)...(zH-m-1) = У" m 2— imj vJ. (e*-l)T,t - m! 1 \™ z,u 1-e~z m ~n = 5" — m m—n m-1 n m.n^O W — m/ n! ,w(ez-1) _ L,T1^0 Ч 1 (1-z) 1—w 71! e(w-1)z_.y г С ТТЦП^О та/ n! (744) (7-45) (746) (747) (748) (749) (7-50) fe) =?nS{m-n}/(V) (7'51) (7-52) (7-53) (7-54) (7-55) (7-56)
426 Производящие функции Табл. 425 представляет собой требующуюся нам базу данных. Тождества из этой таблицы нетрудно доказать, так что не будем задерживаться на этом вопросе; данная таблица предназначена, в первую очередь, служить справочником, когда мы столкнемся с некоторой новой задачей. Однако для первой формулы (7-43) имеется красивое доказательство, на котором хочется остановиться. Начнем с тождества 1 _ у /х + П> (1 -z)**1 " ^- V n U и продифференцируем его по х. В левой части выражение (1 — z)-x_1 равно е^*4-1)11^1^1-2^, так что d/dx внесет множитель ln(1/(1—z)). В правой части числитель (х^п) равен (х+п)... (х+ 1), и d/dx разобьет его на сумму п слагаемых, что эквивалентно умножению (х^п) на _1_... _| __ = Нх+П — Нх . х + п х+ 1 Замена х на m дает (743)- Заметьте, что Нх+п — Нх имеет смысл даже при нецелом х. Кстати, при дифференцировании сложных произведений, как оказывается, лучше оставлять их в виде произведений, а не записывать производную как сумму. Например, правая часть тождества А((х+п)»...(х+1)') - (x+n)-...(x+l)'(j2s + ... + jiT) была бы менее наглядна, если бы была записана в виде суммы. У общих тождеств из табл. 425 имеется много важных частных случаев. Например, формула (7-43) ПРИ m = 0 упрощается до производящей функции для чисел Нп: rThrT = 1Н^' (7-57) I — z I — z *— n Это уравнение можно вывести и иначе; например, можно взять степенной ряд для 1п(1/(1 — z)) и поделить его на 1 — z, получив тем самым производящую функцию для частичных сумм. В тождествах (7-51) и (7-52) встречаются отношения {m™n}/ (m~ ) и [^^Д™^ ) соответственно, которые для п ^ m превращаются в неопределенности вида 0/0. Однако имеется способ придания им смысла с использованием полиномов Стирлинга
7.4 Специальные производящие функции 427 из (6.45)) потому что m га — п га га — п т-1 п га— 1 п -1)n+1n!mo\Jn-m); n!man(m) (7-58) (7.59) Так, например, при га = 1 формулу (7.5*) следует записывать не как степенной ряд Ип^о^Л^К^}/^), а как = -^(-^)П^(п-1) - 1+1Z-^Z2 + . ln(1+z) п>0 Тождества (7-53), (7-54), (7-55) и (7-56) представляют собой двойные производящие функции, или суперпроизводящие функции, потому что они имеют вид G(w,z) = 2Im n 9m,nWmzn. Коэффициент при wm представляет собой производящую функцию относительно переменной z; коэффициент при zn представляет собой производящую функцию относительно переменной w. Уравнению (7-56) можно придать более симметричный вид: we* — zev rrun^O m + n+V m /fm + n+1)! (7.60) А я всегда думал, что свертка — это то, что происходит с моими мозгами при решении задач. .. 7.5 Свертки Свертка двух последовательностей, (fo, fi,...) = (fn) и (go> 9i > • • •) — (9п)у представляет собой последовательность (fo9o, fo9i +figo) ...) = (Lkfi<9n-k). В разделах 5.4 и 7.2 мы видели, что свертка последовательностей соответствует умножению их производящих функций. Этот факт позволяет легко вычислить многие суммы, с которыми было бы трудно справиться другими методами. Пример 1: фибоначчиевы свертки Попробуем, например, найти аналитическое выражение для суммы Л?=о ^к^тг-к- Это— свертка последовательности (Fn) с самой собой, поэтому интересующая нас сумма должна быть коэффициентом при zn в F(z)2, где F(z)— производящая функция для последовательности (Fn). Все, что требуется от нас,— это вычислить значение указанного коэффициента. Производящая функция F(z) есть z/(1 — z—z2)— отношение полиномов; так что, как нам известно из общей теоремы о разложении рациональных функций, ответ можно получить, найдя
428 Производящие функции разложение в правильные дроби. Можно воспользоваться общей теоремой о разложении (7-3°) и проделать требуемые вычисления. А можно использовать представление F(z ,2 1/1 1 .( У5\1-фг 1-фг 2 1/1 2 1 г + 5 V(1—Ф^)2 (1-фг)(1-фг) (1-фг = ^ XI (n+1 )ФП^-^ Ц Fn+i zn+^ X (n+1 )$П*П ' Вместо того чтобы записать ответ через фиф, давайте попробуем найти аналитический вид в терминах чисел Фибоначчи. Вспомнив, что ф + ф = 1, получим ф^+ф* = [Z4 (—!_ + ] 1—фг 1— $z, 2-(Ф+Ф)г = n 2-z 1-фг)(1-фг) LZ J 1-z-z2 fen] „ ,.w7, , ^ knh у = 2Fn+i-Fn. Следовательно, Hz)2 = i^(n + l)(2Fn+1-Fn)zn-| ^Fn+1zn, и мы получаем искомый ответ: A 2uFn+1 -(n+1)Fn 2_FkFn_k = . (7.61) к=о * Например, прип = 3 эта формула дает F0F3 + F1F2 + F2F1 + F3F0 = 0 + 1+1 + 0 = 1 в левой части и (6F4-4F3)/5 = (18-8)/5 = 2 — в правой. Пример 2: гармонические свертки Эффективность работы некоего компьютерного алгоритма "сортировки по образцу" определяется значением суммы Tm,n = У" ( ) , целые m, n ^ 0. *— \т/п—к В упр. 5.58 эта сумма вычисляется при помощи довольно хитроумной двойной индукции с использованием суммирующих множителей. Получить результат можно гораздо проще, если заметить, что Tm>n представляет собой n-й член свертки ((°г)> ( ),
7.5 Свертки 429 (m)>...) с (0, у, ^,...). Обе последовательности в табл. 407 имеют простые производящие функции: V (п\ * - z™ V ъ— - 1 _L n^O x y K J n>0 Следовательно, согласно (7.43) = (H„-Hra)f n \n—m В действительности имеется гораздо большее количество сумм, сводящихся к сверткам такого вида, поскольку для любых г и s ¦ In • tz. гтт = vz г-;—гт m ¦ (1 - z)T+1 1 - z (1 - z)s+1 (1 - z)r+s+2 1 - z* Приравнивание коэффициентов при zn дает нам общее тождество Е(т)ег_>—> r+s+n+1V irir+s+n+1 - rir+s + 1 J . (7-02) n / Оно такое гармо- Оно выглядит слишком хорошо, чтобы быть правдой. Но ироничное. .. верка, по крайней мере при п = 2, проходит успешно: г+ЛЛ + Л 1 fr + 2Vs + 0V_L_ ] 1 У V 1 Уг+1 V 2 ) \ 0 у Vr + 2 т+1 + 2 yVr + s + 3 r + s + 2/ Частные случаи наподобие s = 0 столь же замечательны, как и общее тождество. И это еще не все. Можно воспользоваться тождеством для свертки у- /г + k\ /s + п - к\ _ /г + s + п + 1 и перенести Нг в другую часть, поскольку Нг не зависит от к: 'г + к\ /s + п - к> к А п~к ! (Hr+s+n+i — Hr+S+1 + нг). (7-63) n lt ¦:::>« =
430 Производящие функции Но и это не все. Если г и s представляют собой неотрицательные целые числа I и га, то можно заменить (r ~?к) на (l^k) и (s^^k) на (m+r^_k) i затем, заменив к на к — I и п на п - т — I, получим Шп;>-(,+п::,К'-н—+HiK целые I, т, n ^ 0. (7-64) к=0 Даже частный случай этого тождества I = га = 0 вызывал у нас трудности в главе 2! (См. (2.36).) Мы проделали немалый путь. Пример 3: свертки сверток Если образовать свертку последовательностей (fn) и (gn)> а затем свернуть результат с третьей последовательностью (Нп), то можно получить последовательность, n-й член которой равен X f) 9k Ы . j + k+l=n Производящей функцией этой тройной свертки будет, разумеется, произведение F(z)G(z)H(z). Аналогично га-кратная свертка последовательности (gn) с самой собой имеет n-й член вида / 9k, дк2 ... дкт, ki +к2+ • -fkm=n а ее производящая функция равна G(z)m. Эти соображения можно применить к рассмотренной ранее задаче об остовных деревьях фана (пример б в разделе 7.3). Оказывается, существует и другой способ вычислить количество остовных деревьев в п-фане fn, основанный на анализе конфигураций ребер дерева, соединяющих вершины {1,2,..., п}. Ребро между вершинами к и к + 1 может быть включено в поддерево или не включено в него; и каждый способ выбора таких ребер задает разбиение множества вершин на блоки соединенных сосед- Железобетонные них вершин. Например, если п = 10, можно соединить вершины блоки. {1,2}, {3}, {4,5, б, 7} и {8,9,10}: *10 Г ±8 |7 Тб Т5 • 3 Т2 о» li
7.5 Свертки 431 Сколько же можно получить остовных деревьев, добавляя ребра в вершину 0? Нам нужно соединить вершину 0 с каждым из четырех блоков; существует два способа соединения 0 с {1,2}, один способ соединения с {3}, четыре способа— с {4,5,6, 7} и три способа— с {8,9,10}, что дает в итоге 2-1 -4-3 = 24 способа. Суммирование по всем способам разбиения на блоки дает следующее выражение для общего числа остовных деревьев: fn = Y. Z klk2...1Cm. (7.65) m>0 k1+k.2+ ••+кт=тг ki,k2,...,km>0 Например, f4 =4+3-1+2.2+1.3+2.1-1+1.2-1+1-1.2+1.1-1-1 =21. Это— сумма га-кратных сверток последовательности (0,1, 2,3,...) для m = 1, 2, 3, ...; следовательно, производящей функцией для (fn) будет F(z) = G(z) + G(z)2 + G(z)3 + ... = G(*) 1 -G{z) где G (z) — производящая функция последовательности (0,1,2, 3,...), а именно— z/(1 — z)2. Таким образом, имеем lj (1-z)2-z 1-3z + z2) как и ранее. Такой подход к вычислению (fn) симметричнее и привлекательнее хитроумного рекуррентного соотношения, с которым мы имели дело ранее. Пример 4: рекуррентное соотношение со сверткой Наш следующий пример особенно важен. Это на самом деле классический пример, иллюстрирующий полезность производящих функций при решении рекуррентных соотношений. Предположим, что у нас есть п + 1 переменных хо, *i, ..., хп и мы хотим вычислить их произведение при помощи п умножений. Сколько имеется способов (Сп) расставить скобки в произведении хо • xi ..... хп так, чтобы порядок умножений был полностью определен? Например, для п = 2 имеется два способа: хо • (xi -хг) и (хо -хт) • Х2. При п = 3 имеется пять способов: xo'(xv(x2-x3)), хо-((х1-х2)-хз), (хо-хтМхг-хз), (x0-(xi -Х2))-х3) ((xo-xi)-x2)-x3. Таким образом, С2 = 2, Сз = 5; имеем также Ci =1 и Со = 1. Попробуем применить четырехходовую процедуру из раздела 7.3. Какому же рекуррентному соотношению удовлетворяет
432 Производящие функции последовательность Q? Ключевым моментом здесь является то наблюдение, что для п > 0 ровно одна операция ' •' лежит вне всех скобок; это последнее умножение, которое связывает все в единое целое. Если эта операция ' •' располагается между хк и Xk+i, то имеется Ск способов расстановки скобок в произведении хо*.. .-xic и Cn-jc-i способов— в xic+i •.. .-хп; следовательно, Cn = CoCn_i 4- Ci Сп_2 + hCn_iCo> если п > 0. В этом выражении мы легко распознаем свертку, и формулу нетрудно подправить так, чтобы она оставалась справедливой при всех целых п: Сп = ^CkCn_!_k + [п = 0]. (7-66) к Шаг 1 на этом завершен. Шаг 2 предписывает уможение на zn и суммирование: C(z) = ^Cnzn = n = ^CkCn_,_kzn + ^zn = к,тг n=0 = ^Ckzk^Cn-i-kZn-k + 1 = к тг = C(z)-zC(z) + 1. Подумать только— свертка стала произведением! В мире производящих функций бывает и не такое. Жизнь полна сюрпризов. Авторы шутят. Шаг 3 тоже прост. Функцию C(z) мы находим по формуле для корней квадратного уравнения: 2z Но какой знак следует выбрать, + или —? Обе функции удовлетворяют уравнению C(z) = zC(z)2 + 1, но решение задачи дает только одна из них. Можно выбрать знак + просто на том основании, что всегда следует поступать положительно; но мы быстро выясним, что при этом С(0) = оо, что противоречит фактам. (У правильной функции C(z) должно быть С(0) = Со = 1.) Таким образом, мы приходим к выводу, что ад - 1^1.
7.5 Свертки 433 Наконец, шаг 4. Чему равен коэффициент [z11] C(z)? Биномиальная теорема говорит, что k^O v 7 k^l v 7 следовательно, используя (5-37)> получаем 1- 2z -4z "51С t-D' -1/2\(- n / n -4Z)11-1 -4z)n .+ 1 = Li (2:) 'n+1 Количество способов расстановки скобок Сп равно (т^1) —^. Мы предвосхитили этот результат в главе 5, введя последовательность чисел Каталана (1,1,2,5,14,...) = (Сп). Она встречается в десятках задач, на первый взгляд никак не связанных между собой [46], потому что во многих ситуациях рекурсивная природа задачи отвечает рекуррентному соотношению со сверткой (7-66). Например, рассмотрим такую задачу: каково количество последовательностей (ai, a2,..., a2n), состоящих из +1 и — 1, обладают тем свойством, что ai + а2 + • • • + а2п = 0, а все их частичные суммы сп» си+а2, ..., ai+a2H h a2n неотрицательны? В последовательности п раз должно встречаться +1 ип раз— — 1. Графически эту задачу можно представить, нарисовав график последовательности частичных сумм sn = Xlk=i ak как функцию от п. Так, пять возможных решений при п = 3 есть , /WV Это "горные хребты" шириной 2п, которые можно изобразить при помощи отрезков двух видов: /и*\. Оказывается, имеется
434 Производящие функции ровно Cn способов сделать это, и каждая последовательность может быть связана с некоторой расстановкой скобок следующим образом: добавьте к формуле внешнюю пару скобок, так, чтобы получилось п пар скобок, соответствующих п умножениям. Затем замените каждый знак ' •' на 4-1 и каждый *)' на — 1 и удалите все остальное. Например, по этому правилу формула Хо• ((xi -хг)• (хз • Х4)) соответствует последовательности (+1,+1>—1>+1)+1) —1,-1,-1). Пять способов расстановки скобок в выражении хо • xi • Х2 • хз соответствует пяти показанным выше горным хребтам для тг = 3. Небольшая переформулировка нашей задачи подсчета количества последовательностей позволяет получить удивительно простое комбинаторное решение, не использующее производящих функций. Новая задача заключается в поиске числа последовательностей (ао,си,а2,...,а2п) из +1 и —1, обладающих тем свойством, что а0 + а] 4- а2 Н Ь а2п = 1 , и при этом все частичные суммы ao, do + ai, do 4-ai+0.2, ..., a0 4- си H \-o-in должны быть полооюительными. Очевидно, что это в точности последовательности из предыдущей задачи, к которым спереди приписан элемент ao = +1. Однако последовательности в новой задаче можно просто сосчитать, если воспользоваться замечательным фактом, открытым Джорджем Рени (George Raney) [302] в 1959 году: если (xi, Х2,..., хт) — произвольная последовательность целых чисел, сумма которых равна 4-1, то ровно у одного из ее циклических сдвигов \Xl > Х2, • • . ) Хт/, \Х2, • • • > Хт, Xi /, . . . , \Хт, Xi , . . . , Хт_1 ) все частичные суммы положительны. Например, рассмотрим последовательность (3,-5,2,-2,3,0). Ее циклическими сдвигами являются (3,-5,2,-2,3,0) (-2,3,0,3,-5,2) (-5,2,-2,3,0,3) (3,0,3,-5,2,-2) V (2,-2,3,0,3,-5) (0,3,-5,2,-2,3) и только отмеченная последовательность имеет лишь положительные частичные суммы.
7.5 Свертки 435 Лемма Рени может быть доказана при помощи простых геометрических рассуждений. Продолжим нашу последовательность периодически до бесконечной последовательности (хьх2,. > ^-тп.) Х-1 ) ^2> • • • ) ^m> Х-1 > ^-2) •) таким образом, мы полагаем xm+ic = х^ для всех к > 0. Если теперь изобразить график частичных сумм sn = xi Н Ьхп как функции от п, то получившийся график будет иметь "средний наклон" 1/га, потому что sm+n = sn + 1. Например, график, соответствующий нашей последовательности (3, —5,2, —2,3,0,3, —5, 2>...), начинается следующим образом: Эх, если бы цены росли так же медленно. .. (о снижении не приходится и мечтать). Вниманию кибернетиков: частичные суммы в этой задаче показывают изменение размера стека как функции от времени при вычислении произведения п + 1 сомножителей, поскольку каждая операция внесения операнда в стек увеличивает его размер на +1, а каждое умножение — на — 1. Весь график может быть заключен между двумя прямыми с наклоном 1 /га, как показано на рисунке, где га = 6. В общем случае ограничивающие прямые касаются графика только один раз на каждом периоде из га точек, поскольку прямые с наклоном 1 /га могут проходить через точки с целыми координатами лишь один раз на га единиц. Единственная нижняя точка касания есть как раз то единственное место в цикле, начиная с которого все частичные суммы будут положительными, поскольку справа от любой другой точки на расстоянии меньше m имеются точки касания. С помощью леммы Рени можно легко сосчитать последовательности (ао,..., Ci2n) из чисел +1 и — 1, все частичные суммы которых положительны, а общая сумма равна +1. Всего имеется (2л^ь1) последовательностей с п элементами —1 и п+1 элементами +1, и лемма Рени говорит нам, что ровно у 1/(2п + 1) части этих последовательностей все частичные суммы положительны. (Выпишите все N = (2л^~1) последовательностей и все 2п + 1 их циклических сдвигов в виде массива N х (2п + 1). Каждая строка содержит ровно одно решение. Каждое решение встречается в каждом столбце ровно один раз. Поэтому во всем массиве содержится N/(2n + 1) различных решений, и каждое из них встречается ровно (2тг+ 1) раз.) Общее количество последовательностей
436 Производящие функции с положительными частичными суммами равно ^2п+1\ 1 = (2п\_\_ п У2п+1 \nJn + ^ Пример 5: рекуррентное соотношение с m-кратной сверткой Только что рассмотренную задачу можно обобщить, если рассмотреть последовательности (ао,..., amn) из +1 и (1 —га), все частичные суммы которых положительны, а общая сумма равна +1. Такие последовательности можно назвать т-после- довсопельностями Рени. Если в последовательности элемент (1 — т) встречается к раз, а +1 встречается ran Н- 1 — к раз, то к(1 -m) + (mn+1 -к) = 1 и, следовательно, к = п. Всего имеется (т™+ ) последовательностей с п вхождениями (1 — т) и ran + 1 — п вхождениями +1, а лемма Рени говорит нам, что количество таких последовательностей со сплошь положительными частичными суммами составляет ровно /mn+1\ 1 V п J ran + 1 \n/ 1га- 1 1)п+1 (7-67) Это и есть количество m-последовательностей Рени. Назовем его числом Фусса-Каталана Сп , потому что последовательность (Сп ) была впервые исследована Н.И.Фуссом [135] в 1791 году (за много лет до Каталана). Обычные числа Каталана представляют собой Сп = Сп • Теперь, когда мы знаем ответ (7-67), попробуем сформулировать вопрос к этому ответу. В случае га = 2 вопрос был такой: "Какие числа Сп удовлетворяют рекуррентному соотношению Cn = 2IkCicCn_i_k + [п = 0]?" Попробуем найти аналогичный вопрос (аналогичное рекуррентное соотношение) в общем случае. Тривиальная последовательность (+1) длиной 1, очевидно, является га-последовательностью Рени. Если поместить число (1 — га) справа от любых га последовательностей, каждая из которых является га-последовательностью Рени, то мы снова получим га-последовательности Рени; частичные суммы остаются положительными— сначала они возрастают до +2, +3, ..., +га, а окончательная сумма равна +1. И обратно, можно показать, что все га-последовательности Рени (do,...> атп) при п > 0 получаются этим способом: последний член amn должен быть равен (1 —га). Частичные суммы Sj = ao + - • - + Qj_i положительны Вниманию кибернетиков: стековая интерпретация применима и в этом случае, но с m -арными, а не бинарными операциями.
7.5 Свертки 437 для 1 ^ j ^ ran И Smn — TTL, ПОТОМу ЧТО S^jltx "Ь CLmn — 1 • ПуСТЬ к] означает наибольший индекс ^ ran, такой, что SiCl =1; пусть 1<2 — наибольший индекс, такой, что Sic2 = 2; и т.д. Таким образом, Skj = ) и Sk > j для kj < k ^ ran и 1 <J j <J m. Отсюда следует, что km = ran, и можно легко проверить, что каждая из подпоследовательностей (do,..., a^ _i), (a^, >..., ai<2-i), • • •, (сЦст_! > • • • > akm-i} является ra-последовательностью Рени. При этом должно выполняться ki = rani + 1, k2 — ki = ran2 +1, ..., km — km_i = ranm + 1 для некоторых неотрицательных целых чисел ri], П2, ..., n1TL. Следовательно, (т™+ ) тт|+1 является ответом на следующие два интересных вопроса: "Чему равны числа Сп , определяемые рекуррентным соотношением С{^=( X С(г7)С^'...С<1-»]+[п = 0] (7.68) \П1+П2+ +Пт=П—1 / при всех целых п?" и "Если G (z) — степенной ряд, удовлетворяющий уравнению G(z) = zG(z)m + 1, (7-69) то каковы коэффициенты [zn] G(z)?" Заметим, что это непростые вопросы. В случае обычных чисел Каталана (га = 2) мы решили уравнение (7-6д) для G{z) и его коэффициентов при помощи формулы для корней квадратного уравнения и биномиальной теоремы; однако для га = 3 ни один из стандартных методов не дает ни малейшего намека на то, как решить кубическое уравнение G = zG3 + 1. Таким образом, оказывается проще сначала ответить на вопрос, а затем задать его. Теперь, однако, мы знаем достаточно, чтобы поставить еще более сложные вопросы и получить на них ответы. Вот пример такого вопроса: "Чему равен коэффициент [zn]G(z)1, если I — положительное целое число, а G[z) — степенной ряд, определяемый соотношением (7.69)?" Рассуждая так, как ранее, получим, что [zn] G(z)1 представляет собой количество последовательностей длиной ran + I со следующими свойствами: • каждый элемент равен либо +1, либо (1 — га); • все частичные суммы положительны; • общая сумма равна I. Действительно, все такие последовательности можно единственным образом получить, приписав друг за другом I последова-
438 Производящие функции тельностей, обладающих свойствами га-последовательности Ре- ни. Количество способов выполнения этих действий равно Y_ С^С&'.-.С^' = [z4G(z]1. Рени доказал обобщение своей леммы, которое говорит, каким образом подсчитать эти последовательности: если (xi,X2> • • • > Хщ) — произвольная последовательность целых чисел, такая, что Xj ^ 1 для всех ), и х*\ + хг + • • • + хт = I > 0, то ровно I из циклических сдвигов \Х] , Х2) • • • > Х-nx/, \Х2> • • • > ^т> *1 /> • • • > \*-тт *1 > • • • > Х-т— 1 / имеют сплошь положительные частичные суммы. Например, можно проверить это утверждение на последовательности (—2,1, — 1, 0> 1,1, — 1,1,1,1). Вот все ее циклические сдвиги: (-2,1,-1,0,1,1,-1,1,1,1) (1,-1,1,1,1,-2,1,-1,0,1) (1,-1,0,1,1,-1,1,1,1,-2) (-1,1,1,1,-2,1,-1,0,1,1) (-1,0,1,1,-1,1,1,1,-2,1) (1,1,1,-2,1,-1,0,1,1,-1) V (0,1,1,-1,1,1,1,-2,1,-1) (1,1,-2,1,-1,0,1,1,-1,1) (1,1,-1,1,1,1,-2,1,-1,0) V (1,-2,1,-1,0,1,1,-1,1,1) Только два из них, помеченные V, обладают тем свойством, что все их частичные суммы положительны. Эта обобщенная лемма доказывается в упр. 13. Последовательность из элементов +1 и (1 — т) длиной тп+1 с общей суммой I должна включать ровно п элементов (1 — га). Обобщенная лемма говорит нам, что l/(mn + I) из этих (m™+l) последовательностей имеют только положительные частичные суммы; следовательно, наш трудный вопрос имеет удивительно простой ответ: [z4G(z)i=(™ + l)-L- (7.7о) \ n J ran + L для всех целых I > 0. Читатели, не забывшие главу 5, вполне могут подумать что- нибудь вроде: "У меня deja vu или эта формула встречалась ранее?" Да, она действительно уже встречалась; уравнение Ламберта (б-бо) гласит: k»]Bt(zr = Лп + Г n I tn + r
7.5 Свертки 439 Следовательно, производящая функция G(z) из (7.69) должна совпадать с обобщенным биномиальным рядом Sm(z). И действительно, из уравнения (5-59) имеем Ът{г)'~т -Ът(гГт = z, что эквивалентно 3m(z)-1 - z!Bm(z)m. Теперь, когда мы знаем, что имеем дело с обобщенным биномиальным рядом, давайте переключимся на обозначения из главы 5. В ней без доказательства были сформулированы некоторые тождества. Частично восполним этот пробел, доказав, что степенной ряд Bt(z), определяемый как обладает тем замечательным свойством, что 'tn + г\ г zn w-z(\+') tu + r если только t и г— положительные целые числа. Можно ли распространить эти результаты на произвольные значения t и г? Да, можно, потому что коэффициенты (tr^"r) tnr+r представляют собой полиномы от t и г. Общая г-я степень, определяемая как Bt(z)r = erln3tW = ?.(^n^(z))n n.Sf-z: Q-^t(z))T имеет в качестве коэффициентов некоторые полиномы от t и г; эти полиномы совпадают с (tT1^~r) tnr+r для бесконечно многих значений t и г. Таким образом, эти две последовательности полиномов должны тождественно совпадать. В главе 5 упоминается также обобщенный экспоненциальный ряд
440 Производящие функции который, как утверждается в (б-6о), обладает не менее замечательным свойством: тм-.^а±^. (7.7!) п! Можно доказать это как предельный случай формулы для St(z), потому что, как нетрудно показать, ?t(z)r = limBxl(z/x)x,r. х—юо 7.6 Экспоненциальные производящие функции Иногда производящая функция последовательности (gn) очень сложна, в то время как связанная с ней последовательность (gn/n!) имеет достаточно простую производящую функцию. В таких случаях мы, естественно, предпочтем работать с (gn/n!) и в самом конце выполнить умножение на п!. Этот трюк срабатывает столь часто, что степенной ряд G(z) = X.9U-7 (7-72) п^О получил собственное название— экспоненциальная производящая функция последовательности (до> 9ь 92> • • • )• Такое имя возникло из-за экспоненциальной функции ez, которая представляет собой экспоненциальную производящую функцию последовательности (1,1,1,...). Многие производящие функции в табл. 425 на самом деле являются экспоненциальными производящими функциями. Например, уравнение (7-5°) гласит, что (lny3^)m/m! представляет собой экспоненциальную производящую функцию последовательности ([^], [^], [^] ,...)• Обычная производящая функция для этой последовательности существенно сложнее (да еще и расходится). У экспоненциальных производящих функций имеются собственные приемы работы с ними, аналогичные рассматривавшимся в разделе 7.2 операциям. Например, если умножить экспоненциальную производящую функцию (gn) на z, можно получить Zn"M ?П ?П
7.6 Экспоненциальные производящие функции 441 а это не что иное, как экспоненциальная производящая функция последовательности (О, go> 2gi,...) = (ngn_i). Дифференцирование экспоненциальной производящей фун- Здорово, правда? кции последовательности (д0, дь 92> • • •) по z дает Ln9*V - Цэп^Т)! = Z9n+i^i (7-73) n^O п^1 п^О а это— экспоненциальная производящая функция (gi, g2>.. • )• Таким образом, дифференцирование экспоненциальной производящей функции соответствует операции сдвига влево (G{z) — go)/z для обычных производящих функций. (Это свойство экспоненциальных производящих функций мы использовали при изучении гипергеометрических рядов (5.106).) Интегрирование экспоненциальной производящей функции дает Lsn^dt = ZcjnT^T = L9n-i^; (7.74) т.е. сдвиг вправо, экспоненциальную производящую функцию последовательности (О, до> Эъ • • • )• Наиболее интересной операцией над экспоненциальными производящими функциями, как и в случае обычных производящих функций, является умножение. Если F(z) и G(z) представляют собой экспоненциальные производящие функции последовательностей (fn) и (gn), то F(z)G(z) = H(z)— экспоненциальная производящая функция последовательности (Кп), которая называется биномиальной сверткой (fn) и (gn)- Нп = Х- (k)fk9T1-k- (7'75) Биномиальные коэффициенты появляются здесь из-за того, что (?) = n!/k! (n — к)!, следовательно, Ь-п _ \- fk 9n-k L п! ^- к! (n-k)! ' к=0 v J другими словами, (hn/n!) — это обычная свертка последовательностей (fn/n!) и (gn/n!>. Биномиальные свертки часто встречаются в приложениях. Так, в (6.79) мы определили числа Бернулли при помощи неявного рекуррентного соотношения та / I 1 \ У ( . )Bj = [m = 0] при всех m ^ 0;
442 Производящие функции это соотношение можно переписать в виде биномиальной свертки, если заменить га + 1 на п и добавить к обеим сторонам член Вп: У" f ) Вк = Вп + [п = 1 ] при всех п ^ 0. (776) Теперь можно перевести это соотношение на язык степенных рядов (как было обещано в главе 6), если ввести в рассмотрение экспоненциальную производящую функцию для чисел Бернул- ли B(z) = Xln>o Bnzn/nL Левая часть (7.76) представляет собой биномиальную свертку (Вп) с константной последовательностью (1,1,1,...); следовательно, экспоненциальная производящая функция левой части равна B(z)ez. Экспоненциальная производящая функция правой части имеет вид Y_ (Вп + [п = 1 ])zn/n! = B(z) + z. Таким образом, должно выполняться равенство B(z) = z/(ez — 1); мы доказали равенство (6.8i), которое встречается также в табл. 425 как формула (7-44)- А теперь вернемся к сумме, неоднократно появлявшейся в нашей книге: Sm(n) = 0m + 1m + 2m + ..- + (u-1)m = ]Г кШ- 0^k<n В этот раз мы попытаемся применить к ней производящие функции: вдруг это упростит дело. Будем считать п фиксированным, am— переменным. Таким образом, наша задача заключается в том, чтобы понять, как ведут себя коэффициенты степенного ряда S(z) = S0(u) + Si (n)z + S2(n)z2 + --- - ^Sm(n)zm. Мы знаем, что производящая функция последовательности (1,к, к2,...) равна 1 ^kmzm, 1 -kz следовательно, s(z) = ? ? k-z- = Y_ т^к? m^O 0^k<n 0^k<n
7.6 Экспоненциальные производящие функции 443 если поменять местами порядок суммирования. Эту сумму можно записать в аналитическом виде: 1 ( 1 1 1 S(z) = -\—л х + ^1 т-Ь-" + z\z~^ -0 z"1-! z~1-n+l = ^(Hz-i-Hz-i_n); (7.77) но мы ничего не знаем о разложении такой суммы по степеням z. Нам на помощь приходят экспоненциальные производящие функции. Для последовательности (Sq(ti), Si (n), Siin), -..) экспоненциальная производящая функция равна ^ z Z^ Z11*1 S(z,n) = S0(n)+S1(n)-+S2(n)-+.-. = V" Sm(n) — . 1! 2! z— га! ra^O Для получения коэффициентов Sm(n) можно воспользоваться экспоненциальной производящей функцией последовательности (1,1с,к2,...), а именно e*z = Y_ * kz __ m!> что дает z kz m^O 0^k<n " 0^k<n Последняя же сумма является суммой геометрической прогрессии, которая в аналитическом виде записывается как - enz — 1 Эврика! Все, что нам надо сделать,— выписать коэффициенты этой сравнительно простой функции, и мы получим выражение для Sm(n), потому что Sm(n) = m! [zm]S(z,n). Здесь в игру вступают числа Бернулли. Совсем недавно мы заметили, что экспоненциальной производящей функцией для чисел Бернулли является B(z) = ?; Bk zk k! ez - Г k^O следовательно, можно записать enz-1 S{zyn) = B(z) z rO Л Jl ч , Л „1 ^2 = (80^+8,^^+...)(п^-Иг2|г+пЗ|г+...)
444 Производящие функции Сумма Sm(Ti) равна коэффициенту при zm в этом произведении, умноженному на т!, например So(n) =0!(ВОТ^) =п; s1(n) = i!(B0^i+B1JiT) =К-Ь; S2(n) = ^(Во^+В^+В^) = 1пЗ-1пЧ1п. Таким образом, в очередной раз оказалась выведена хорошо знакомая формула Пп = S2(ti) — ^п(п — \){п — 1), и это самый простой вывод из всех: при помощи нескольких строк найдено поведение Sm(n) при любых га. В общем случае формула имеет вид Бш^(п) = — (Bm(n)-Bm(0)), (779) где Вт(х)— полином Бернулли, определяемый как Вт(х) = Ц(?)В^т"к- (7-8о) Вот почему это так: полином Бернулли является биномиальной сверткой последовательности (Во, В], В2,...) с (1, х, х2,...); следовательно, экспоненциальная производящая функция для (Во(х), В] (х), ВгМ,...) представляет собой произведение экспоненциальных производящих функций этих последовательностей, B(z,x)= J_Vm{x)Z— = -^-Yx™Z— = ?^-. (7.8i) *— m! ez—1 ^— m! ez—1 Отсюда вытекает равенство (7.79), потому что экспоненциальная производящая функция для (0, So(n), 2Si (n),...) согласно (7-7&) представляет собой enz - 1 B(z,n)-B(z,0). ez-l Обратимся еще к одной задаче, в которой экспоненциальная производящая функция— как раз то, что нужно: каково количество остовных деревьев в полном графе с п вершинами {1,2,..., п}? Обозначим это число как tn. Полный граф содержит in(n — 1) ребер, по одному ребру между каждыми двумя
7.6 Экспоненциальные производящие функции 445 вершинами; так что мы, по существу, ищем полное число способов соединить п данных объектов при помощи п — 1 линий между ними. Имеем ti = tz = 1. Кроме того, t3 = 3, потому что полный граф с тремя вершинами представляет собой фан порядка 2, а мы знаем, что f2 = 3. В случае п = 4 имеется шестнадцать остовных деревьев: XXX ПХХ NXX ии XX XX X (тл) Следовательно, t4 = 16. Наш опыт решения аналогичной задачи для фанов подсказывает, что наилучший способ справиться с этой задачей состоит в том, чтобы выделить одну вершину и посмотреть на те связные компоненты или блоки, на которые разобьется остовное дерево, если проигнорировать все ребра, проходящие через выделенную вершину. Если невыделенные вершины образуют m компонентов размером ki, кг, ..., кт, то можно соединить их с выделенной вершиной к] к2... km способами. Например, в случае п — 4 можно считать выделенной нижнюю левую вершину. В верхнем ряду (7.82) показано ЪХз, случаев, когда три остальные вершины соединены между собой одним из t3 способов и затем соединены с левой нижней вершиной одним из трех способов. В нижнем ряду изображено 2-1 х t2ti х Q решений, в которых остальные три вершины разбиты на компоненты размером 2 и 1 одним из (2) способов; там же показан случай J/, когда три остальные вершины полностью изолированы. Эти рассуждения приводят к рекуррентному соотношению -Li L п-1 га! L— Vkbk2,...,kr m>0 k,+ +km=n-1 ч и z> ' ь x k1k2...kmtk]tk2 ...tkm для всех n > 1. Вот почему: имеется (k k™~ k ) способов представить n — 1 элементов в виде последовательности из га компонентов размером соответственно ki, k2, ..., km; имеется "tki tk2 • • • tkm способов соединить вершины внутри этих компонентов какими-то остовными деревьями; есть к] к2 ... кт способов соединить вершину п с этими компонентами; и мы должны выполнить деление на га!, потому что порядок компонентов не
446 Производящие функции учитывается. Например, для п = 4 это рекуррентное соотношение дает ..=3t3 + I((,;2)2t,t2+(^)2t2t,) + i((1j1).f) = = 3t3 + 6t2ti +1] . Рекуррентное соотношение для tn, на первый взгляд, выглядит устрашающе, но на самом деле оно не так уж плохо, просто слегка свернуто. Обозначим un = Tltn> и тогда все существенно упростится: ^п _ у J_ V" uki llk2 ukm m>0 k]+k2 + +km=n-1 ' z m если n > 1. (7-83) Внутренняя сумма представляет собой коэффициент при zn_1 в экспоненциальной производящей функции U(z), возведенной в т-ю степень; формула будет правильной и для п = 1, если добавить слагаемое U(z)°, отвечающее случаю m = 0. Итак, Ъ. = [zn-]] У ^-U{z)m = [*n_1]eQ(z) = [zn]zeQ(z) n! ^— т! при любом п > 0, и мы получаем уравнение U(z) = zeQ(z). (7.84) Прогресс! Уравнение (7-84) выглядит почти так же, как и уравнение ?(z) = ez?(z), которое определяет обобщенный экспоненциальный ряд ?(z) = ?1 (z) в (б-59) и (7-71)» и Действительно, между этими функциями имеется связь: U(z) = z?(z). Таким образом, можно просто прочитать ответ к нашей задаче: tn = — = ~[zn]U(z) = n n = [n-1)l[zn-4?[z) = nn"2. (7.85) Полный граф с вершинами {1,2,..., n} (n > 0) имеет ровно nn-2 остовных деревьев.
7.7 Производящие функции Дирихле 447 7.7 Производящие функции Дирихле Помимо рассмотренных, возможны и другие способы порождения последовательностей по рядам; здесь можно использовать, по крайней мере в принципе, любую систему "ядер" Kn(z), такую, что ^ГдпКп(г) = О => дп = 0 для всех п. п Для обычных производящих функций мы использовали ядра Kn(z) = zn, а для экспоненциальных производящих функций — Kn(z) = zn/n\; можно также попробовать использовать убывающие факториальные степени z— или биномиальные коэффициен- ТЫ2*/п! = (*). Наиболее важная альтернатива производящим функциям и экспоненциальная производящая функциям получается, если использовать ядра 1/nz; они рассчитаны на последовательности (9ь 92) • • •)» начинающиеся сп = 1,анесп = 0: GM = L{?- (7'86) Эта функция называется производящей функцией Дирихле, поскольку огромный вклад в ее изучение был сделан немецким математиком Густавом Дирихле (Gustav Dirichlet) (1805-1859). Например, производящая функция Дирихле для константной последовательности (1,1,1,...) равна Li = «zb (7-87) Это— дзета-функция Римана, которую мы называли также об- (z) общенным гармоническим числом Ноо для z > 1. Произведение производящих функций Дирихле соответствует специальному виду свертки: F(z)G(z) = Lt7^ = L^L fi9m[l-m = n]. Таким образом, F(z)G(z) = H[z) есть производящая функция Дирихле последовательности ^п = 2_ f d 9n/d • d\n (7.88)
448 Производящие функции Например, из (4-55) мы знаем, что Xld\n M-(d) — fn— 1]» это свертка Дирихле последовательности Мёбиуса (|i(1), ц(2), |х(3),...) с последовательностью (1,1,1,...), значит, M(z)t(z) = Г ^^ = 1- (7-89) Другими словами, производящая функция Дирихле последовательности (|li(1 ), |х(2), ц(3),...) равна C(z)_1 • Производящие функции Дирихле особенно полезны, когда последовательность (дъ д2> • • •) является мультипликативной функцией, а именно — когда 9mn = 9m gn При Ш _L П. В таких случаях значения gn для всех п определяются значениями gn для п, являющихся степенями простых чисел, и производящую функцию Дирихле можно разложить в произведение по простым числам: sw-n(i + ? + ^ + ^ + -)- <™°> Если, например, положить gn = 1 для всех п, то получится представление дзета-функции Римана в виде произведения: Для функции Мёбиуса ц(р) = — 1 и ц(рк) = 0 при к > 1, следовательно, ее производящая функция Дирихле равна M(Z) = П(1-р-*); (7.92) Р что, само собой, согласуется с (7-89) и (7-91)- Для функции Эйлера ф имеем ф(рк) = рк — рк-1, следовательно, ее производящая функция Дирихле в виде произведения записывается как Отсюда можно сделать вывод, что Ф(г) = C(z— 1 )/C(z).
7 Упражнения 449 Упражнения Разминка 1 Некий эксцентричный коллекционер покрытий (2 х п)-прямоугольников костями домино платит 4 доллара за каждую вертикальную кость домино и 1 доллар за горизонтальную. Каково количество покрытий, оцененных таким образом в m долларов? Например, для m = 6 имеется три покрытия: СВ, Ии^. 2 Запишите производящую функцию и экспоненциальную производящую функцию для последовательности (2,5,13, 35,...) = (2П + Зп) в аналитическом виде. 3 Чему равна сумма Y-n>o H^/IO*1? 4 Общая теорема о разложении рациональной функции P(z)/ Q{z) не вполне общая, поскольку имеется ограничение, что степень Р должна быть меньше степени Q. Что произойдет, если степень Р окажется больше? 5 Найдите производящую функцию S(z), такую, что ""'*'- II (О (п- Обязательные упражнения 6 Покажите, что рекуррентное соотношение (7-32) можно решить методом наборов, не прибегая к производящим функциям. 7 Решите рекуррентное соотношение 9о = 1 ; gn = дп_т + 2дп_2 Л 4- пд0 при п > 0. 8 Вычислите [zn] (ln(1 -z))2/(1 -z)m+1? 9 Воспользуйтесь результатом предыдущего упражнения для вычисления Hk=o ^kHn_ic. 10 Положите в тождестве (7-62) г = s = — 1 /2 и затем избавьтесь от всех вхождений 1/2 с помощью трюков наподобие (б-З^)- Заблудившееся, Какое удивительное тождество вы вывели? должно быть? 11 Эта задача, состоящая из трех независимых частей, позволяет попрактиковаться в работе с производящими функциями. Полагаем, что A(z) = 2Ln anzn, B(z) = ^Гп^лг1"1, C(z) = г 2k
450 Производящие функции J^n c-aZ71 и что при отрицательных п коэффициенты равны 0. а Выразите С через А и В, если сп = X%+2k^n ajbk. б Выразите А через В, если пЬп = Л?=0 2катс/(тг — к)!. в Выразите А через В, если an = Ль=о Ск^^п-к, ГА-е г — действительное число; затем используйте вашу формулу для поиска коэффициентов fkM, таких, что bn = 12 Сколько существует способов разместить числа {1,2,..., 2п} в массиве размером 2 х п так, чтобы и строки, и столбцы массива были упорядочены по возрастанию слева направо и сверху вниз? Например, одним из решений при п = 5 является 12 4 5 8 3 6 7 9 10 13 Докажите обобщенную лемму Рени, сформулированную непосредственно перед (7-7°) • 14 Решите рекуррентное соотношение до = 0, gi = 1 , gn = -2ngn_i + 2~ ( ) дкдп-к при п > 1, воспользовавшись экспоненциальной производящей функцией. 15 Число Белла CDn представляет собой количество способов разбиения множества из п предметов на подмножества. Например, СОз = 5, потому что множество {1,2,3} можно разбить на следующие подмножества: {1,2,3}; {1,2}U{3}; {1,3}U{2}; {1}U{2,3}; {1}U{2}U{3}. Докажите, что CDn+i — X!k Ю^тг-Ь и используйте это рекуррентное соотношение для того, чтобы записать экспоненциальную производящую функцию ?{z) = Y-n^rtZ^/nl в аналитическом виде. 16 Последовательности (an) и (Ъп) связаны между собой формулой свертки b у- /си +к! -1\ /а2+к2-Г ап + кп - Г 1Сп
7 Упражнения 451 Что значит "в общем случае"? Если f, = f2 = •• ¦ = fm_i = 0, степень fn(x) не превосходит [n/m\. кроме того, ао = 0 и bo = 1. Докажите, что соответствующие производящие функции удовлетворяют уравнению lnB(z) = A(z) + ^A(z2) + lA(z3) + • • •. 17 Покажите, что экспоненциальная производящая функция G(z) связана с обычной производящей функцией G(z) той же последовательности соотношением G(zt)e~ldt - G(z), если этот интеграл существует. 18 Найдите производящие функции Дирихле для последовательностей a gn = Утг; б gn=lnn; в gn = [ti свободно от квадратов]. Выразите свои ответы через дзета-функции. (Свойство свободы от квадратов определено в упр. 4.13.) 19 Любой степенной ряд F(z) = Hn>o ^п?п с "fo = 1 определяет последовательность полиномов fn(x) по правилу F(z)x = ?_fn(x)zn, ъ>0 где fn(l) = fn и fn(0) = [n = 0]. В общем случае fn(x) имеет степень п. Покажите, что такие полиномы удовлетворяют формулам свертки J2fk(x)fn-k(y) = fn(x + y); k=0 n (х + у)^Г kfk(x)fn_k(y) = xnf n(x + y) . k=0 (Тождества в табл. 255 и 334 являются частными случаями этого приема.) 20 Степенной ряд G{z) называется дифференцируемо конечным, если найдется конечное число полиномов Ро (z), ..., Pm(z), среди которых не все равны нулю, и такие, что P0(z)G(z) + P1(z)G'(z) + --- + Pm(z)G(m>(z) = 0. Последовательность чисел (до, дь 92> • • •) называется полиномиально рекурсивной, если найдутся полиномы po(z),
452 Производящие функции ..., pm(z) (в конечном количестве), среди которых не все равны нулю, и такие, что Po(n)gn+Pi(n)gn+1 +---+pm(n)gn+m = О для всех целых п ^ 0. Докажите, что производящая функция дифференцируемо конечна тогда и только тогда, когда ее последовательность коэффициентов полиномиально рекурсивна. Домашние задания 21 Грабитель врывается в банк и требует 500 долларов десяти- и двадцатидолларовыми банкнотами. Он также желает знать, сколькими способами кассир может дать ему эти деньги. Найдите производящую функцию G(z), у которой это количество представляет собой коэффициент [z500] G(z), а также более компактную производящую функцию G(z), у которой это число является коэффициентом [z50] G(z). Используйте для решения (а) элементарные дроби; (б) метод, аналогичный (7-39)- 22 Пусть Р— сумма всех возможных способов "триангуляции" многоугольников: +<&+&+ (Первый член представляет вырожденный многоугольник с двумя вершинами; все остальные слагаемые представляют собой многоугольники, разбитые на треугольники. Например, пятиугольник можно триангулировать пятью способами.) Определите операцию "умножения" АЛВ триангулированных многоугольников А и В так, чтобы было справедливо уравнение Р = _ + ?АР. Затем замените каждый треугольник на lz\ Что после этого можно сказать о количестве разбиений п-угольника на треугольники? 23 Сколькими способами можно построить колонну размером 2 х 2 х п из кирпичей размером 2x1 х 1 ? 24 Сколько остовных деревьев имеется в n-колесе (графе с циклом из п "внешних" вершин, каждая из которых соединена с (п + 1 )-й вершиной "оси") при п ^ 3? Он что, хочет заняться покрытием прямоугольника размером 2 х п? Где п определяется ценами на кирпичи и цемент и содержимым вашего кошелька.
7 Упражнения 453 Пусть га ^ 2— целое число. Выразите в аналитическом виде, как функцию от z и га, производящую функцию последовательности (n mod га). Используя эту производящую функцию, запишите выражение (n mod га' в терминах комплексного числа си = е27Гг/т. (Например, для га = 2 будем иметь си = — 1 и nmod 2 = \ — \{—1)п.) Числа Фибоначчи второго порядка (Зп) определяются рекуррентным соотношением Зо = 0; Si = 1; Зп = #тг-1 + Зп-2 + Fn При П > 1. Выразите Зп через обычные числа Фибоначчи Fn и Fn+1. Каждое покрытие прямоугольника размером 2 х п костями домино можно рассматривать как некоторый способ нарисовать п несоприкасающихся отрезков в массиве точек размером 2 х п: i г: n i rr 11 Если наложить друг на друга две подобные схемы, можно получить несколько циклов, поскольку с каждой точкой связаны два отрезка. Если, например, приведенная выше картинка объединяется с то в результате получается Такой же набор циклов получается и при объединении Однако можно однозначно восстановить исходные схемы по результату их объединения, если приписать каждому вертикальному отрезку некоторую ориентацию при помощи стрелок. Стрелки расставим поочередно вверх/вниз/вверх/вниз/ • • • в первой схеме и вниз/вверх/вниз/вверх/- • • во второй, например !~~*::н+н:::::::: =ta:n . Количество таких ориентированных циклических схем должно быть, следовательно, равно Т^ = F^+1, и мы должны быть способны доказать это при помощи алгебры. Пусть Qn
454 Производящие функции представляет собой количество ориентированных циклических схем размером 2 х п. Найдите рекуррентное соотношение для Qn, решите его при помощи производящих функций и получите алгебраическое доказательство того, что Qn = гп+1* 28 Коэффициенты A(z) в (7-39) удовлетворяют соотношению Аг + Аг_но + Аг+2о + Аг+зо = ЮО для 0 $: г < 10. Найдите "простое" пояснение этого. 29 Чему равна сумма фибоначчиевых произведений Y_ Y_ b,Fk2...F km? m>0 ki+k2 + +km=n к] ,k2,...,km>0 30 Если производящая функция G(z) = 1 /(1 — cxz)(1 — (3z) имеет разложение на элементарные дроби а/(1 — otz) +b/(1 — |3z), то каково разложение на элементарные дроби функции G(z)n? 31 Какая функция g(n), определенная на положительных целых числах п, удовлетворяет рекуррентному соотношению ]Tg(d)<p(n/d) = т, d\n где ф— функция Эйлера? 32 Арифметическая прогрессия представляет собой бесконечное множество целых чисел {ап + Ъ} = {Ь,а + Ъ,2а + Ь,3а + Ь,...}. Множество арифметических прогрессий {сип + bi}, ..., {amu + Ьт} называется точным покрытием, если всякое неотрицательное целое число встречается в одной и только одной прогрессии. Например, точное покрытие образуют три прогрессии: {2п}, {4п + 1}, {4п + 3}. Покажите, что если {сцп + bi}, ..., {ашп + bm}— точное покрытие, такое, что 2 <^ ai ^ ••• ^ am, то am_i = am. Указание: воспользуйтесь производящими функциями. Контрольные работы 33 Чему равно [wmzn] (ln(1 + z))/(1 - wz)? 34 Найдите аналитический вид производящей функции X;n^0Gn(z)wn, если Gn(z) = Ц ( k j zmk. k^n/m (Здесь m— фиксированное положительное целое число.)
7 Упражнения 455 35 Вычислите сумму Ио<к<п 1/к(п ~ к) двумя способами: а разложив слагаемые на простейшие дроби; б рассмотрев указанную сумму как свертку и использовав производящие функции. 36 Пусть A(z) — производящая функция для (do, си, а.2, аз>...}. Выразите 22 n a^/^z™ через A, z и га. 37 Пусть ап обозначает количество способов записи положительного целого числа п в виде суммы степеней 2 без учета порядка. Например, сц = 4, поскольку 4 = 2 + 2 = 2 + 1+1 = 1 + 1 + 1 + 1. Положим по определению ао = 1. Обозначим через Ъп = Y. k=o Qk частичные суммы последовательности а. а Составьте таблицу чисел ап и Ъп до п = 10. Какое замечательное соотношение можно усмотреть в таблице? (Пока что не доказывайте его.) б Представьте производящую функцию A(z) в виде бесконечного произведения. в Воспользуйтесь выражением из п. (б), чтобы доказать результат из п. (а). 38 Найдите аналитический вид двойной производящей функции M(w,z) = Y_ nun(m,n) wmzn. m,n^0 Обобщите свой ответ таким образом, чтобы при фиксированном га ^ 2 получить аналитическое выражение для M(zi,...,zm) = ^Г min(nb...,nm)z7'1...z^m. ги ,...,nm^0 39 Для заданных положительных целых чисел тип найдите аналитический вид выражений Y кт к2 ... km и 1^ki<k.2< <km^n Y_ к] к2 ... km . l^k] ^к2^ • ^km^n (Например, при m = 2 и п = 3 суммы представляют собой соответственно 1 -2 + 1 -3 + 2-3 и 1 -1 +1 -2+1-3+2-2+2-3+3-3.) Указание: какие коэффициенты при zm будут в производящих функциях (1 +ciiz)... (1 +anz) и 1/(1 — aiz)... (1 —anz)? 40 Выразите 21k (kM^Fk-i — FkH™ — k)j в аналитическом виде.
456 Производящие функции 41 В о зрастающе-у бывающей перестановкой порядка п называется перестановка ai <i2 ... an чисел {1,2,..., п}, которая поочередно возрастает и убывает: си < а-2 > аз < сц > • • • . Например, 35142 есть возрастающе-убывающая перестановка порядка 5. Пусть Ап обозначает количество возрастающе-у бывающих перестановок порядка п. Покажите, что экспоненциальной производящей функцией (Ап) является (1 + sin z) /cos z. 42 Космический зонд обнаружил, что органика на Марсе имеет ДНК, в состав которой входят пять аминокислот (a, b, с> d, е), а не четыре, как на Земле. В марсианской ДНК никогда не встречаются пары cd, се, ed и ее; все цепочки, в которых нет запрещенных пар, возможны. (Таким образом, цепочка bbcda запрещена, а bbdca разрешена.) Сколько всего цепочек ДНК длиной п возможно на Марсе? (Для п = 2 ответ— 21, потому что мы различаем левый и правый концы цепочки.) 43 Производящая функция Ньютона последовательности (gn) определяется как gw = J>(;) Найдите формулу свертки, которая устанавливает соотношение между последовательностями (fn), (gn) и (Нп), производящие функции Ньютона которых удовлетворяют соотношению F(z)G(z) = H(z). Постарайтесь, чтобы ваша формула была как можно более простой и симметричной. 44 Пусть qn обозначает количество возможных исходов при попарном сравнении п чисел {xi,... jX-n.}. Например, q3 = 13, потому что возможны следующие исходы: Х1<Х2<хз; Х1<Х2=хз; Х]<хз<Х2; хт=Х2<хз; Xl=x2=x3; xi=x3<x2; x2<xi<x3; Х2 < xi = хз ; Х2 < хз < xi ; Х2 = хз < xi ; х3<Х!<х2; x3<xi=x2; x3<x2<xi. Найдите аналитический вид экспоненциальной производящей функции Q(z) = YLn Чп^Л1- Найдите также последовательности (an), (bn), (сп), такие, что k^O k ^ J k X ' при всех n > 0.
7 Упражнения 457 О четных, нечетных и почетных степенях. 45 Вычислите ]Tm n>0[m J_u]/m2u2. 46 Вычислите 0$к^п/2 п - 2к к -4 27 в аналитическом виде. Указание: z3 — z2 + 4f = (z+ \)(z — f)2- 47 Покажите, что приведенные в (7-34) числа Un и Vn из задачи о покрытии костями домино прямоугольника размером 3 х тг тесно связаны с дробями в дереве Штерна-Броко, сходящимися к л/3. 48 Некоторая определенная последовательность (gn) удовлетворяет рекуррентному соотношению agn + bgn+1 + cgn+2 + d = 0, целое тг ^ О, для некоторых целых чисел (а, Ь, с, d) с НОД(а, Ь, с, d) = 1. Она также имеет аналитический вид 9n = [а(1 + V2)n\ , целое n ^ О, для некоторого действительного числа а между 0 и 1. Найдите a, Ь, с, d и а. 49 Задача о степенях и четности. а Рассмотрим последовательность (do, сц , d2,...) = (2,2, 6,...), определяемую формулой an = (1+У2)п + (1-л/2)п. Найдите простое рекуррентное соотношение, которому удовлетворяет эта последовательность. б Докажите, что [(1 + \/2)n] = n (mod 2) для всех целых п>0. в Найдите число а вида (р + y/q )/2, где р и q — положительные целые числа, такие, что |_a-nJ = n (mod 2) для всех целых тг > 0. Дополнительные задачи 50 В продолжение упр. 22 рассмотрим сумму всех способов разбиения многоугольников на многоугольники:
458 Производящие функции Найдите символическое уравнение для Q и используйте его для нахождения производящей функции для количества способов проведения непересекающихся диагоналей в выпуклом п-угольнике. (Требуется найти выражение производящей функции в аналитическом виде как функции от z; находить аналитический вид коэффициентов не нужно.) 51 Докажите, что произведение '-" п (н^к+(-2^у)"4 является производящей функцией для покрытий костями домино прямоугольника размером га х п. (Входящие в формулу ran сомножителей можно представлять выписанными в тп клетках прямоугольника. Если ran нечетное, то средний сомножитель нулевой. Коэффициентом при D^ak является количество способов покрытия прямоугольника с помощью j вертикальных и к горизонтальных костей домино.) Указание: это сложная задача, выходящая за рамки дан- Так это указание ной книги, поэтому можно ограничиться простой проверкой или предостереже- справедливости формулы в случае m = 3, п = 4. 52 Докажите, что полиномы, определяемые рекуррентным соотношением ^1-(*-1)"-1:®(тГ»'""- 1с=0 ч ' ч 7 целое п ^> О, имеют вид pn(y) = Z.m=o lm|ym> гАе |т|— положительное целое число при 1 ^ m ^ п. Указание: это упражнение очень поучительное, но не очень простое. 53 Последовательность пятиугольных чисел (1,5,12,22,...) является очевидным обобщением треугольных и квадратных чисел: Пусть Тп = п(п+1 )/2— n-е треугольное число; Рп = п(3п— 1)/2— n-е пятиугольное число; и, наконец, пусть Un— количество покрытий прямоугольника размером 3 х п костя-
7 Упражнения 459 ми домино, определенное в (7-3^)- Докажите, что треугольное число Тщ4п+2-1)/2 является одновременно пятиугольным числом. Указание: 311^ = (V2n-i + Vin+i )2 + 2. 54 Рассмотрим следующую интересную конструкцию: 2 2 3 3 4 4 5 3 3 6 6 10 4 4 10 5 6 7 8 6 7 8 16 23 31 16 23 31 26 49 80 26 49 31 80 31 32 9 9 40 10 11 11 51 51 131 131 211 211 243 12 13 12 13 63 76 63 76 194 270 194 405 14 14 90 15 16 . 16 . 106 . 106 . 376 . 376 . 781 . 781 . 1024 . (Начните со строки, содержащей все положительные целые числа. Затем удалите каждый m-й столбец; здесь га = 5. Замените оставшиеся элементы их частичными суммами. Удалите каждый (т — 1 )-й столбец. Вновь замените элементы частичными суммами и т.д.) Используя производящие функции, покажите, что в конце концов получится последовательность т-х степеней. Например, для тп = 5 получается, как показано на рисунке, последовательность (15)25,35> 45,...)- 55 Докажите, что если степенные ряды F(z) и G(z) обладают свойством дифференцируемой конечности (определенной в упр. 20), то тем же свойством обладают F(z)+G(z) и F(z)G(z). Исследовательские проблемы 56 Докажите, что в некотором большом классе "простых аналитических выражений" не существует "простого аналитического выражения" для коэффициента при zn в (1 +z+z2)n в виде функции от п. 57 Докажите или опровергните: если все коэффициенты ряда G(z) равны 0 или 1 и при этом все коэффициенты G{z)2 меньше некоторой константы М, то у G(z)2 бесконечное количество коэффициентов равно нулю.
8 Дискретная вероятность ЭЛЕМЕНТ СЛУЧАЙНОСТИ привлекается практически всегда, когда мы пытаемся объяснить окружающий нас мир. Математическая теория вероятностей позволяет вычислять вероятности сложных событий в предположении, что эти события подчиняются некоторым аксиомам. Она имеет важные приложения во всех областях науки и тесно связана с методами, изучавшимися в предыдущих главах. Вероятности называются дискретными, если можно вычислить вероятности всех событий путем суммирования, а не интегрирования. Мы уже умеем работать с суммами, так что нет ничего удивительного в применении наших знаний на практике для вычисления ряда интересных вероятностей и средних значений. Читатели, не знакомые с теорией вероятностей, с большой вероятностью получат пользу от изучения классического введения в этот предмет, принадлежащего перу Феллера (Feller) [120]. 8.1 Определения Теория вероятностей начинается с идеи пространства вероятностей (или вероятностного пространства), которое представляет собой множество О. всего, что может случиться в рассматриваемой задаче, в совокупности с правилом, которое назначает каждому элементарному событию ш Е О. вероятность Рг(си). Вероятность Рг(си) должна быть неотрицательным действительным числом, и при этом должно выполняться условие Y_ Рг(си) 1. (8.1) соео. Таким образом, каждое значение Рг(ш) должно находиться в диапазоне [0 .. 1 ]. Мы называем Рг распределением вероятностей, потому что функция Рг распределяет суммарную вероятность 1 между событиями си. Вот пример: в случае пары игральных костей множество элементарных событий О представляет собой D2 = {Г*1Г*~|>
462 Дискретная вероятность ? ИЗ,...,00}, где D = {0,0,0,0,0,0} представляет собой множество всех шести способов выбрасывания игральной кости. Исходы Q|73 и ИЗ И рассматриваются как различные; следовательно, всего данное пространство вероятностей состоит из б2 = 36 элементов. Обычно игральные кости считаются "честными" т.е. все шесть вариантов выпадения одной игральной кости имеют одинаковую вероятность ^, а каждый из 36 вариантов выпадения двух игральных костей из D. имеет вероятность jg. Но можно рассмотреть и "фальшивые" игральные кости, у которых распределение вероятностей неоднородно. Например, пусть РГ1(0) = Рг,(0) = I; Рг,0 = Рг,(0) = Рг,(0) = Рп(0) = 1. Тогда 2ZdGD Ргт (d) = 1, так что Pri является распределением вероятностей на множестве D, и мы можем присвоить вероятности элементам О = D2 посредством правила Pm(dd') = PnlcDPrHd7). (8.2) Например, Ргц ([ГЦЕЗ) = \' \ ~ з1- Это корректное распределение, потому что ^Ргц(ш)= JL Prn(dd/) = Z. Pri(d)Pn(d') = сиЕП dd'GD2 d,d'GD = 22Pri(d) y_ Pr^d/) = i-i = i. dGD d'GD Мы можем рассмотреть и случай выбрасывания честной и фальшивой игральных костей, Proi(dd') = Pr0(d)Pr1(d,)> rAePr0(d) = l; (8.3) в этом случае Proi ([ГЦЕЗ) = 1И ' Ъ ~ Т8* ^ реальном мире грани игральных костей не могут быть совершенно одинаковы, но значение | обычно весьма близко к реальности. Событием называется подмножество С В игре в кости, например, множество (НИ. 00,00,00,00,00} Учтите— пристрастие к азартным играм может плохо кончиться! Если бы все грани были совершенно одинаковы, как бы мы могли их различить?
8.1 Определения 463 представляет собой событие "выпадение дубля" Отдельные элементы си множества О называются элементарными событиями, потому что они не могут быть разложены на более мелкие подмножества; си можно рассматривать как одноэлементное событие {си}. Вероятность события А определяется формулой Рг(сиеА) = ]Г Рг(си); (8.4) сибА и в общем случае, если R(tu)— некоторое утверждение относительно си, записываем Tr(R(cu))' для суммы всех Рг(си), таких, что R(cu) истинно. Таким образом, например, вероятность выпадения дубля в случае честных игральных костей равна j& + J& + 3^ + j6 + 3^ + je = ^; но если обе игральные кости несимметричны и имеют распределение вероятностей Pri, то вероятность выпадения дубля составит ^ + ^4 + ^4^~^4~^^4'^Тб = Тб>1' Смещение центра тяжести игральных костей приводит к повышению вероятности выпадения дубля. (Использованное здесь обозначение ]Г носит более общий характер, чем определенное в главе 2: суммы в (8.i) и (8.4) распространяются на все элементы си произвольного множества, а не только на целые числа. Однако это расширение в действительности не вызывает никаких проблем; можно условиться использовать под знаком ]Г специальное обозначение, когда подразумеваются не целые числа, так что никаких коллизий с обычными обозначениями не возникнет. Остальные определения из главы 2 остаются корректными; в частности, определение бесконечной суммы из главы 2 дает подходящую интерпретацию для наших сумм в случае бесконечного множества П. Каждая вероятность неотрицательна, а сумма их всех ограничена, так что вероятность события А в (8.4) корректно определена для всех подмножеств ДСП.) Функция, определенная на элементарных событиях си из пространства вероятностей, называется случайной величиной (случайной переменной, random variable). Например, если О. = D2, можно определить S(cu) как сумму очков на выпавших гранях для события си, так что S([Ts][y]) =6 + 3 = 9. Вероятность того, что сумма очков составит 7, есть вероятность события S(cu) = 7, а именно рг(Н0) + рг(ОЕЗ) + рг(0[С]) + Рг(ОЕЗ) + Рг([хЮ + Рг(0Н) •
464 Дискретная вероятность В случае честных игральных костей (Рг = Ргоо) это событие происходит с вероятностью ^; но если игральные кости фальшивые (Рг = Рп 1), то вероятность будет Tg + ^ + ^ + ^ + ^ + Tg^^, т.е. такой же, как и найденная ранее для выпадения дубля. При рассмотрении случайных величин принято опускать обозначение 1[ш)\ потому что обычно в каждой задаче имеется только одно пространство вероятностей. Таким образом, можно говорить просто lS = 7' для обозначения того, что выпало 7 очков, или *S = 4' для обозначения события {0ЕЗ> E3EZL [***1Г*~1}- Случайная величина характеризуется распределением вероятностей ее значений. Так, например, S принимает одиннадцать возможных значений {2> 3,..., 12}, и можно протабулировать вероятность каждого события S = s для всех s из этого множества: S Ргоо (S-s) Prn(S = s) 2 1 36 4 64 3 2 36 4 64 4 3 36 5 64 5 4 36 6 64 6 5 36 7 64 7 6 36 12 64 8 5 36 7 64 9 4 36 6 64 10 3 36 5 64 11 2 36 4 64 12 1 36 4 64 Если мы работаем над задачей, которая включает только случайную величину S, но не другие характеристики игральных костей, то можно получить ответ, основанный только на этих вероятностях, безотносительно к деталям множества О. = D2. Фактически можно определить пространство вероятностей как меньшее множество Q. = {2,3,..., 12} с желаемым распределением вероятностей Pr(s). Тогда 'S = 4' будет элементарным событием. Таким образом, зачастую можно игнорировать пространство вероятностей D. и работать непосредственно со случайными величинами и их распределениями. Если на одном и том же пространстве вероятностей О определены две случайные величины X и Y, то, чтобы охарактеризовать их поведение, не зная ничего об О, требуется знать их "совместное распределение" Рг(Х = хиУ = -у) для каждого х из X и каждого у из Y. Будем говорить, что X и Y— независимые случайные величины, если Рг(Х = хиУ = у) = Pr(X = x)-Pr(Y = y) (8.5) для всех х и у. Интуитивно это означает, что значение X не влияет на значение Y. Например, если D. есть множество бросаний игральных костей D2, то можно определить Si как количество очков на первой игральной кости и Sz — как количество очков на второй игральной кости. Тогда случайные величиныЗ] и S2 независимы по
8.1 Определения 465 отношению к каждому из рассмотренных ранее распределений вероятностей Proo, Pri 1 и Proi, потому что мы определяли вероятность каждого элементарного события dd/ как произведение вероятностей событий Si = d и S2 = d'. Эти вероятности можно определить и иначе, скажем, так, чтобы Костлявое неравен- Рг(ЕШ / Рг(НЮ1) Ф Рг(ЕЗ|х]) / Рг(ЕШ; но мы не сделали этого, поскольку обычно игральные кости не влияют друг на друга. В наших обозначениях оба эти отношения равны друг другу и Pr(S2 = 5)/Pr(S2 =6). Мы определили S как сумму двух чисел очков, Si + S2. Рассмотрим другую случайную величину Р— произведение SiS2. Являются ли S и Р независимыми? Рассуждая неформально, нет; если нам сказали, что S = 2, то мы знаем, что Р может быть равным только 1. Но и формально ответ отрицателен, потому что условие независимости (8.5) не выполняется (как минимум для честных игральных костей): для всех допустимых значений s и р имеем 0 < Proo(S = s) • Proo(Р=р) ^ \ • ^, что не может равняться значению Proo(S = snP=p), которое кратно jg. Желая понять типичное поведение некоторой случайной величины, мы часто интересуемся ее "средним" значением. Однако понятие среднего неоднозначно; обычно, говоря о последовательности чисел, люди подразумевают под средним три разных значения: • среднее арифметическое (сумма всех значений, деленная на их количество); • медиана (средний элемент упорядоченной последовательности); • мода (значение, встречающееся чаще других). Например, среднее арифметическое последовательности (3,1,4, 1,5) равно 3+1+^+1+5 = 2.8; медиана равна 3, а мода— 1. Однако обычно теория вероятности имеет дело не с последовательностями чисел, а со случайными величинами, так что надо определить понятие среднего для случайной величины. Предположим, что мы многократно повторяем эксперимент, производя независимые испытания таким образом, чтобы каждое значение X появлялось с частотой, примерно соответствующей его вероятности. (Например, мы могли бы много раз бросать игральные кости, наблюдая за значениями S и/или Р.) Мы хотели бы так определить среднее значение случайной величины, чтобы последовательность чисел, полученная в результате таких экспериментов, имела, как правило, приблизительно те же значения
466 Дискретная вероятность среднего арифметического, медианы и моды, что и соответствующие значения для случайной величины X, согласно нашим определениям. Вот как это можно сделать: среднее случайной величины X с действительными значениями на пространстве вероятности П. определяется как Y_ х-Рг(Х = х), (8.6) хЕХ(О) если эта (потенциально бесконечная) сумма существует. (Здесь Х(П) означает множество всех значений, которые может принимать X.) Медиана X определяется как множество всех таких х, что Рг(Х<Сх) :> 1 и Рг(Х^х) ? 1. (8.7) Наконец, мода X определяется как множество всех таких х, что Рг(Х = х) ^ Рг(Х = х') для всех х' е X(Q). (8.8) В нашем примере с бросанием игральных костей среднее значение S оказывается равным 2-j6+3-^ + --- + 12-j6 =7 для распределения Ргоо, для распределения Ргц среднее значение то же — 7. И медианой, и модой для обоих распределений также оказывается {7}. Таким образом, S имеет одно и то же среднее значение по всем трем определениям. С другой стороны, случайная величина Р при распределении Ргоо имеет среднее арифметическое ^ = 12.25; ее медианой является {10}, а модой— {6,12}. Среднее значение Р остается тем же и при переходе к игральным костям с распределением Pri i, но медиана при этом уменьшается до {8}, а модой становится единственный элемент {6}. Для среднего арифметического случайной величины в теории вероятностей имеется специальное название и обозначение: оно называется математическим ожиданием и записывается как ЕХ - ]Г Х(ш)Рг(ш). (8.9) В нашем примере с бросанием игральных костей эта сумма содержит 36 членов (по одному для каждого элемента П), в то время как (8.6) представляет собой сумму всего лишь 11 чисел. Но обе суммы имеют одно и то же значение, потому что обе равны Y_ хРг(ш)[х = Х(ш)]. сибП хех(п)
8.1 Определения 467 Итак, в среднем "среднее" означает "среднее арифметическое" В приложениях среднее арифметическое случайной величины оказывается полезнее других средних, так что мы практически не будем встречаться с медианами и модами, и термины "ожидаемое значение" "математическое ожидание" "среднее арифметическое" и "среднее" до конца главы являются взаимозаменяемыми. Если X и Y— две произвольные случайные величины, определенные на одном и том же пространстве вероятностей, то X + Y также является случайной величиной на этом пространстве. По формуле (8.д) средним суммы случайных величин является сумма их средних: E(X + Y) = Y_ (Х(ш) + У(ш))Рг(ш) - EX + EY. (8.Ю) шеп Аналогично, если <х— произвольная константа, то справедливо простое правило Е(осХ) аЕХ. (8.11) Но соответствующее правило для произведения случайных величин оказывается в общем случае более сложным; математическое ожидание определяется как сумма по элементарным событиям, а сумма произведений обычно не имеет простого выражения. Несмотря на эту сложность в частном случае произведения независимых случайных величин работает очень простая и красивая формула: E(XY) = (EX)(EY), если X и Y независимы. (8.12) Это правило можно доказать при помощи дистрибутивного закона для произведений: E(XY) = Y_ X(cu)Y(cu).Pr(cu) сиеп = Y_ ху-Рг(Х = хи Y = y) xex(ci) yeY(ci) = Y_ xy.Pr(X = x)Pr(Y = y) xex(O) = YL **MX = x) • Y_ yW = y) = (tX)(EY). xex(d) yeY(Q) Например, мы знаем, что S = Si + S2 и P = S1S2, где Si и Si — числа очков на первой и второй игральных костях. Имеем ESi = ES2 = |, следовательно, ES = 7; кроме того, Si и S2
468 Дискретная вероятность независимы, так что ЕР = | • \ = ^, как и утверждалось ранее. Имеем также E(S + Р) = ES + ЕР = 7 + ^. Но S и Р не являются независимыми, так что мы не можем утверждать, что E(SP) 7 4? ' ' 4 343 Фактически ожидаемое значение SP равно ^ при распределении Ргоо и ровно 112- Ргц. при распределении 8.2 Математическое ожидание и дисперсия Следующим по важности свойством случайной величины после математического ожидания является ее дисперсия, определяемая как средний квадрат отклонения от среднего: VX = Е((Х-ЕХ)2). (8.13) Если обозначить ЕХ через щ то дисперсия VX представляет собой ожидаемое значение (X — \л)2. Это мера "разброса" распределения X. В качестве простого примера вычисления дисперсии предположим, что нам сделали предложение, от которого невозможно отказаться: некто подарил нам два билета для участия в некоторой лотерее. Организаторы лотереи продают еженедельно по 100 билетов, участвующих в отдельном тираже. В тираже выбирается равномерным случайным образом один из билетов, и обладатель счастливого билета получает сто миллионов долларов. Остальные 99 владельцев билетов не получают ничего. Подарком можно воспользоваться двумя способами: либо использовать оба билета в одной лотерее, либо по одному — в двух лотереях. Какая стратегия лучше? Попробуем провести анализ. Обозначим через X] и Xz случайные величины, представляющие размер нашего выигрыша по первому и второму билетам. Ожидаемое значение X] в миллионах составляет EXi ШГ°+ШГ100 1> и то же самое справедливо и для Xz- Ожидаемые значения аддитивны, так что средний суммарный выигрыш составит E(Xi +Х2) = EX] + ЕХ2 = 2 миллиона долларов независимо от выбранной стратегии. Тем не менее стратегии различны. Выйдя за рамки ожидаемых значений и рассмотрев распределение вероятностей Xi +Х2, мы получим Тут есть тонкость: в зависимости от выбранной стратегии следует использовать разные пространства вероятностей, но EXi и ЕХ2 в обоих случаях одни и те же.
8.2 Математическое ожидание и дисперсия 469 Один тираж Разные тиражи Выигрыш (миллионы) 0 100 200 .9800 .0200 .9801 .0198 .0001 Если использовать оба билета в одной лотерее, то шансы не выиграть ничего составят 98%, а шансы выиграть 100 миллионов — 2%. Если же билеты играют в разных тиражах, то шансы не выиграть ничего составляет 98.01%, что несколько больше, чем раньше; шансы выиграть 200 миллионов составляют 0.01%, что тоже больше, чем было раньше; шансы же выиграть 100 миллионов равны теперь 1.98%. Таким образом, во втором случае распределение случайной величины Xi + Х2 несколько более разбросано; среднее значение, 100 миллионов, в этом случае менее вероятно, зато немного более вероятны крайние значения. Дисперсия призвана отразить именно эту "разбросанность" случайной величины. Мерой разброса служит квадрат отклонения случайной величины от ее математического ожидания. В первом случае дисперсия равна .98(0М-2М)2 + .02(100М-2М)2 = 196М2; во втором — .9801 (0М-2М)2 + .0198(100М-2М)2+.0001 (200М-2М)2 = = 198М2. Как и ожидалось, последняя величина несколько больше, так как распределение вероятностей во втором случае более разбросано. При работе с дисперсиями все числа возводятся в квадрат, долларах. сленной шкале часто из дисперсии извлекается квадратный корень, что дает стандартное отклонение, которое обычно обозначается греческой буквой а: а = VVX. (8.14) Стандартные отклонения случайной величины Xi + Х2 для двух рассмотренных стратегий равны \/196М2 = 14.00М и \/198М.2 « 14.071247М.. В некотором смысле вторая стратегия на 71 247 долларов рискованнее. Чем дисперсия может помочь при выборе стратегии? Ясного ответа на этот вопрос нет. Стратегия с большей дисперсией рискованнее, но что лучше для кошелька— риск или безопасность?
470 Дискретная вероятность Предположим, что можно купить не два билета, а все сто. Тогда выигрыш в одной лотерее был бы гарантирован, а дисперсия была бы равна нулю. Можно было бы сыграть в сотне тиражей, ничего не получая с вероятностью .99^°° « .366, но с ненулевой вероятностью выиграть 10000000000 долларов. Какую из стратегий выбрать — этот вопрос выходит за рамки данной книги, в которой все, что мы можем сделать,— это объяснить, как выполнить необходимые расчеты. В действительности имеется и более простой способ вычисления дисперсии, чем прямое использование определения (8.13). (Есть все основания предполагать здесь наличие какой-то скрытой математики, ведь дисперсия в лотерейных примерах оказалась кратной М2.) Имеем Е((Х-ЕХ)2) = Е(Х2-2Х(ЕХ) + (ЕХ)2) - = Е(Х2)-2(ЕХ)(ЕХ) + (ЕХ)2, поскольку (ЕХ)— константа; следовательно, VX = Е(Х2)-(ЕХ)2. (8.15) "Дисперсия есть среднее значение квадрата минус квадрат среднего значения" Например, в "лотерейной" задаче среднее (Xi + Х2)2 равно .98(0М)2 + .02(100М)2=200М2или.9801(0М)2 + .0198(100М)2 + .0001 (200М)2 = 202М2. Вычтя 4М2 (квадрат среднего), мы получим те же результаты, которые ранее заставили нас потрудиться. Есть еще более простая формула, применимая при вычислении V(X + Y) для независимых X и Y: E((X + Y)2) = E(X2+2XY + Y2) = - E(X2) + 2(EX)(EY) + E(Y2), поскольку мы знаем, что в случае независимых величин справедливо соотношение E(XY) = (EX)(EY). Следовательно, V(X + Y) = E((X + Y)2)-(EX + EY)2 = = E(X2)+2(EX)(EY) + E(Y2) = -(EX)2-2(EX)(EY)-(EY)2 = = E(X2)-(EX)2 + E(Y2)-(EY)2 = = VX + VY. (8.16) "Дисперсия суммы независимых случайных величин равна сумме их дисперсий" Один из способов снижения риска состоит в подкупе комиссии, но, по моему мнению, при этом вероятность превращается из дискретной в дискредитирующую. (N.B.: замечания на полях не всегда совпадают с точкой зрения администрации.)
8.2 Математическое ожидание и дисперсия 471 Например, дисперсия суммы, которую можно выиграть на один лотерейный билет, равна E(Xf)-(EX02 = .99(0М)2 + .01(100М)2-(Ш)2 = 99М2. Следовательно, дисперсия суммарного выигрыша по двум лотерейным билетам в двух отдельных (независимых) лотереях равна 2 х 99М2 = 198М2. Соответствующее значение дисперсии для п независимых лотерейных билетов равно п х 99М2. Дисперсия суммы S очков, выпавших на двух игральных костях, может быть получена по той же формуле, поскольку S = Si +S2 есть сумма двух независимых случайных величин. Имеем VS^ = 1(12 + 22+32+42 + 52 + 62)- 6 для честной игральной кости; следовательно, VS — Щ + Щ = Щ-. Для фальшивой игральной кости VS, = 1(2.12 + 22 + 32+42 + 52 + 2.62)-(02 = fr следовательно, VS = ^Д = 7.5, когда обе игральные кости фальшивые. Заметим, что в последнем случае дисперсия S больше, хотя S принимает значение 7 чаще, чем в случае фальшивых игральных костей. Если наша цель — выбросить побольше приносящих удачу семерок, то дисперсия— не лучший показатель успеха. Мы знаем, как вычислить дисперсию. Но зачем это делать? Основная причина заключается в неравенстве Чебышева ([29] и [57]), которое устанавливает важное свойство дисперсии: Pr((X-EX)2^cx) ^ VX/a для всех a > 0. (8.17) (Это неравенство отличается от неравенств Чебышева для сумм, с которыми мы встречались в главе 2.) Грубо (8.17) гласит, что случайная величина X редко принимает значения, далекие от своего среднего ЕХ, если ее дисперсия VX мала. Доказательство неравенства на удивление простое. Имеем VX - ^_ (Х(си)-ЕХ)2 Рг(ш) ^ сивО. ^ Y_ (Х(си)-ЕХ)2 Рг(ш) ^ сиеп (Х(си)-ЕХ)2^а ^ Y_ ocPr(w) = a-Pr((X-EX)2^a); а>еп (Х(си)-ЕХ)2^а деление на сх завершает доказательство. 35 12
472 Дискретная вероятность Если ввести обозначение \х для математического ожидания и а— для стандартного отклонения и заменить а на c2VX в (8.17), то условие (X — EX)2 ^ c2VX превратится в (X — ц)2 ^ (с а)2; следовательно, (8.17) гласит, что Pr(|X-^co-) ^ 1/с2. (8.18) Таким образом, X будет лежать в пределах с-кратного стандартного отклонения от своего среднего значения, за исключением случаев, вероятность которых не превышает 1/с2. Случайная величина будет лежать в пределах 2а от ц как минимум в 75% случаев, а в пределах между ц-Юаи |а -Ь 10о~— по крайней мере для 99%. Это случаи а — 4VX и а = 100VX неравенства Чебышева. При бросании пары честных игральных костей п раз общая сумма очков во всех п бросаниях при больших п почти всегда будет близка к 7п. Вот в чем причина: дисперсия п независимых бросаний равна ^п. Дисперсия Щ-п означает, что стандартное отклонение составляет w^n. Поэтому неравенство Чебышева говорит нам, что сумма очков будет лежать между 7п-10у^Ы и 7n+]0\ff^L как минимум в 99% всех экспериментов по бросанию п раз пары честных игральных костей. Например, можно держать пари 99 к 1, что результат одного миллиона бросков пары честных игральных костей окажется между 6.975 миллиона и 7.025 миллиона. В общем случае пусть X— любая случайная величина на пространстве вероятностей П, имеющая конечное математическое ожидание \i и конечное стандартное отклонение ст. Тогда можно рассмотреть пространство вероятностей Пп, элементарными событиями которого являются n-последовательности (сит, CU2>..., сип), где каждое ш^ ? П, а вероятности определяются как Рг(ш1,ш2,...,шп) = Pr(a>i)Pr(cD2)...Pr(u)n). Если теперь определить случайные величины Хк по формуле Хк(ш1)ш2)...,штг) = Х(шк), то величина Хт + Х2 + • • • + Х-
8.2 Математическое ожидание и дисперсия 473 будет суммой п независимых случайных величин, которая соответствует взятию п независимых "образцов" X на (1 и их суммированию. Математическое ожидание X] + Х2 + • • • + Хп равно пц, а стандартное отклонение равно y/ri а; следовательно, среднее значение п образцов, 1 п (Xi+X2 + хг То есть среднее окажется в указанных пределах в как минимум 99% всех случаев, когда мы рассматриваем набор из п независимых образцов для любого фиксированного п. Не распространяйте это утверждение на среднее бесконечной последовательности X], Xz, Х3, ... с меняющимся п. будет лежать в пределах от \х— ЮаД/п до ц.+ ЮаД/п как минимум в 99% случаев. Другими словами, если выбрать достаточно большое п, то среднее арифметическое п независимых испытаний почти всегда окажется очень близким к ожидаемому значению EX. (В учебниках по теории вероятности доказывается более строгая теорема, называющаяся усиленным законом больших чисел; но нам будет достаточно и простого следствия только что выведенного неравенства Чебышева.) Иногда нам неизвестны характеристики пространства вероятностей, но требуется оценить математическое ожидание случайной величины X при помощи многократных наблюдений ее значения. (Например, нам могла бы понадобиться средняя полуденная температура января в Киеве или средняя продолжительность жизни на Украине.) Если в нашем распоряжении имеются независимые эмпирические наблюдения Xi, Х2, ..., Хп, то можно предположить, что истинное математическое ожидание приближенно равно ЕХ = Хт + Х2 + • • • + Хп п (8-19) Можно оценить и дисперсию — по формуле VX = X? + Х\ + • • • + Х\ (Хт + х2 + • • • + Хп)2 п-1 п(п-1) (8.20) Возникает ощущение, что (п — 1) в этой формуле— опечатка и здесь должно быть п, как в (8.ig), потому что истинное значение дисперсии определяется в (8.15) через ожидаемые значения. Однако использование п — 1 вместо п дает лучшую оценку, поскольку из определения (8.2о) вытекает, что E(VX) - VX. (8.21)
474 Дискретная вероятность Вот почему: 1 п л ' ¦%*-{ k=1 )^ к=1 E(VX) = ^(^Х^-ЦХ^) = к=1 )^ к=1 k=l j=1 к=1 к=1 -. п п -^^(t(X)2[J5«k] + E(X2)[j = k])) : = —!— fnE(X2)-l(nE(X2)+n(n-1)E(X); п — I V п = Е(Х2)-Е(Х)2 - VX. (Этот вывод при замене E(XjXk) на (EX)2[j /к] + E(X2)[j =к] использует независимость наблюдений.) На практике для оценки результатов эксперимента со случайной величиной X обычно вычисляются эмпирическое среднее р = ЕХ и эмпирическое среднее отклонение 6" = v VX и ответ представляется в виде ' ft ± а/^/тг'. Например, пусть результаты выбрасываний двух (предположительно правильных) игральных костей выглядят следующим образом: Щ?\ Ш\Е\ \Z\E\ ЕШ езо тш ои тв oio (сиз Эмпирическое среднее суммы очков S равно р. = (7+П+8 + 5 + 4 + 6 + 10 + 8 + 8 + 7)/10 - 7.4; эмпирическая дисперсия равна (72+П2+82+52+42+62+102-|-82+82+72-10р2)/9 « 2.12. Таким образом, из этого эксперимента мы получаем следующую оценку суммы очков игральных костей: 7.4 ± 2.1 /л/ТО « 7.4 ± 0.7. Давайте рассмотрим еще один пример и разберемся, как вычислять математическое ожидание и дисперсию теоретически, а не эмпирически. Одной из рассмотренных в главе 5 задач была задача о п футбольных болельщиках, бросавших свои шляпы в воздух, в результате чего они случайным образом перепутывались. В (б-б1) было показано, что с вероятностью nj/n! « 1/е
8.2 Математическое ожидание и дисперсия 475 никто не получит свою шляпу назад. Была также выведена формула Р(„,ц = J^V-,,, . li^l (8.22) Не путайте с числом Фибоначчи. вероятности того, что ровно к шляп вернутся к своим владельцам. Для переформулировки этих результатов с использованием только что изученного формализма можно рассмотреть пространство вероятностей Пп, состоящее из всех п! перестановок я множества {1,2, ...,п}, где Рг(я) = 1/п! для всех я е Пп. Случайная величина ^п(тг) — количество неподвижных точек в перестановке я ? Пп отвечает числу правильных "шляпопадений" в задаче о футбольной победе. Уравнение (8.22) дает Pr(Fn=k); но мы пока забудем, что нам известны такие формулы. Мы хотим просто найти среднее значение величины Fn и ее стандартное отклонение. Среднее значение можно легко вычислить, избежав всех сложностей главы 5. Достаточно просто заметить, что FnN = Fn>1(^)+Fn>2N + ..- + Fnin(^), Fn,k(7t) — [позиция k— неподвижная точка перестановки я Е Пп]. Следовательно, EFn - EFnJ + EFn>2 + • • • + EFn,n . А ожидаемое значение Fn^ есть просто вероятность события Fn,k = 1, равная 1/п, потому что ровно (п — 1)! из п! перестановок я = 7ti 7Т2 ... яп Е ГТП имеют я^ = к. Следовательно, EF. п/п = 1 для п > 0. (8.23) Средняя шляпа. В среднем на свое место попадает одна шляпа. "Случайная перестановка имеет в среднем одну неподвижную точку" А как насчет стандартного отклонения? Этот вопрос труднее, потому что величины Fn>ic не являются независимыми друг от друга. Но дисперсию можно вычислить, проанализировав их
476 Дискретная вероятность взаимозависимость: E(F?) = E((^Fn,k)2) = е(? ^F^F^) = ^ k=1 ' j=1 k=1 n n = HE(Fn,jFn,k) = j=1 k=l = Y. E(?n,k)+2 Y- E(Fn,j Fn,k). l^k^n 1^j<k^u (Подобный трюк нами использовался при выводе (2.33) в гла_ ве 2.) Далее, F2 k = Fn,k, поскольку Fn>k равен либо 0, либо 1; следовательно, E(F2 k) = EFn>k = 1/п, как и ранее. Кроме того, если j < к, то E(Fnj Fn>iJ = Рг(в перестановке п точки j и к неподвижны) = (п — 2)!/п! = 1/п(п— 1). Следовательно, H(F^) = -+(^-7-Цт = 2 Мяп^2. (8.24) п \2/п(п—I) (В качестве проверки при п = 3 имеем |02 +112 + §22 +132 = 2.) Дисперсия равна E(F2) — (EFn)2 = 1, так что стандартное отклонение (как и математическое ожидание) равно 1. "Случайная перестановка п ^ 2 элементов имеет 1 ± 1 неподвижных точек'! 8.3 Вероятностные производящие функции Если X— случайная величина, принимающая только целые неотрицательные значения, то ее распределение вероятностей можно компактно представить с применением методов из главы 7. Производящей функцией случайной величины X называется ряд Gx(z) = ?>r(X = k)zk. (8.25) k^O Этот степенной ряд относительно z содержит всю информацию о случайной величине X. Его можно записать двумя другими способами: Gx(z) = ]Г Pr(o>)zx(cu) = E(zx). (8.26) сиеп Коэффициенты Gx(z) неотрицательны, а их сумма равна 1; последнее условие можно записать как СхП) = 1. (8.27)
8.3 Вероятностные производящие функции 477 И обратно, любой степенной ряд G(z) с неотрицательными коэффициентами и обладающий тем свойством, что G(1) = 1, является производящей функцией некоторой случайной величины. Самое приятное свойство производящих функций случайных величин заключается в том, что обычно они упрощают вычисление средних и дисперсий. Например, вот как просто выражается математическое ожидание: EX - ^k-Pr(X = k) = k^O = ^Pr(X = k)-kzk-1|z==1 = k^O = GxOb (8.28) Надо просто продифференцировать производящую функцию случайной величины по z и подставить z = 1. Вычислить дисперсию лишь немногим сложнее: Е(Х2) = ^k2-Pr(X = k) = k^O = ^_Pr(X = k)-(k(k-1)zk-2-hkzk-1)|z=1 = k^O = G?(1) + Gi(1). Следовательно, VX = G2(l) + Gi(1)-Gi(1)2. (8.29) Уравнения (8.28) и (8.29) гласят, что мы можем вычислить среднее и дисперсию, если сумеем найти две производные, G^(1) и Gx(1). Нет необходимости знать аналитический вид выражений для вероятностей; нам даже не требуется знать аналитический вид самой функции Gx(z). Удобно ввести обозначения Mean(G) = G'(1), (8.30) Var(G) = G"n) + G'(1)-G'(1)2 (8.31) для произвольной функции G, поскольку нам часто придется вычислять именно указанные комбинации производных. Еще одно приятное свойство производящих функций случайных величин заключается в том, что во многих важных случаях они являются сравнительно простыми функциями от z. Например, рассмотрим равномерное распределение порядка п, когда случайная величина принимает каждое из значений {0,1,...,
478 Дискретная вероятность п— 1} с вероятностью 1 /п. В этом случае производящая функция случайной величины равна Un(z) = In+z+.-.+z^1) - n 1 1 -zn = --,—- дляп2>1. (8.32) n I — z Мы легко получили аналитический вид Un(z), потому что это простая геометрическая прогрессия. Однако это аналитическое выражение несколько обманчиво: при подстановке z = 1 (самого важного значения производящей функции случайной величины) мы получим неопределенное отношение 0/0, хотя сама функция Un(z) представляет собой полином, вполне определенный при любых значениях z. Значение Un(1) = 1 очевидно из исходного выражения (1 +zH (-zn_1 )/n, хотя, конечно же, можно прибегнуть к правилу Лопиталя и найти с его помощью limz_>i Un(z). Определение значения U^(1) по правилу Лопиталя еще сложнее, потому что в знаменателе окажется множитель (z—1 )2; вычисление U^(1) создаст еще большие трудности. К счастью, есть простой выход из этого положения. Если степенной ряд G(z) = Y.n>o 9п^п сходится по крайней мере в одной точке z, такой, что \z\ > 1, то степенной ряд G'(z) = ^n>on9n?n-1 также обладает указанным свойством, а также ряды G"{z), G/;/(z) и т.д. Поэтому по формуле Тейлора можно записать G(1+t) = GdJ+^Ht+^t^+^Pt^... ; (8.33) и все производные G(z) при z = 1 появятся в качестве коэффициентов разложения G(1 +t) по степеням t. Например, таким образом легко вычислить производные для равномерной производящей функции случайной величины Un(z): u.d+0 . I(,+t|"-' "/"V(«Wi(?W--+i(n'i. 11.11-11*. . 1 'ьп_1 n\1/ n\2j п\3/ п\п Сравнение с (8.33) дает Und) = 1; U;(1) = ==1; ВД) = fr-1^-2); (8.34) и в общем случае Un (1) = (п — 1 )—/(га +1), хотя для вычисления среднего и дисперсии нам достаточно случаев га = 1 и га = 2.
8.3 Вероятностные производящие функции 479 Среднее равномерного распределения есть u;o) = =yi, а дисперсия равна u^(i) + u;(i)-u;(i)2 = (n_1)(n_2) , ,(n-1) = 4 12 + 6^2~ = п2~] 12 ' Третье место среди свойств производящих функций случайных величин занимает то свойство, что произведение производящих функций случайных величин соответствует сумме независимых случайных величин. Из глав 5 и 7 мы знаем, что произведение производящих функций соответствует свертке последовательностей; однако для приложений даже более важно то, что свертка вероятностей отвечает сумме независимых случайных величин. Действительно, если X и Y представляют собой случайные величины, принимающие только целочисленные значения, то вероятность события X + Y = п равна Pr(X + Y = n) = ^Pr(X = knY = n-k). k Если X и Y независимы, получаем Pr(X + Y = n) = ^Pr(X = k) Pr(Y = n-k), k т.е. свертку. Следовательно, у нас есть эффектная формула Gx+y{z) = Gx{z)Gy[z)) если X и Y независимы. (8.37) Ранее в этой главе мы выяснили, что V(X + Y) = VX + VY, если X и Y независимы. Пусть F(z) и G(z)— производящие функции случайных величин X и Y и пусть H(z) — производящая функция случайной величины X + Y. Тогда H(z) = F(z)G(z), и из наших формул (8.28)-(8.3i) для среднего и дисперсии можно сделать вывод, что Mean(H) = Mean(F) + Mean(G); (8.38) Var(H) = Var(F)+Var(G). (8.39) (8-35) (n-1)2 = 12 (8.36)
480 Дискретная вероятность Эти формулы, являющиеся свойствами производных, Меап(Н) = Н'(1) и Var(H) = Н"(1) + Н'(1) -Н'(1 )2, не выполняются для произведения произвольных функций H(z) = F(z)G(z); вместо этого мы имеем H'(z) - F'(z)G(z)+F(z)G'(z), H"(z) = F,/(z)G(z)+2F,(z)G,(z)+F(z)G,,(z). Но если подставить z = 1, то можно увидеть, что (8.38) и (8.39) будут справедливы в общем случае, если выполняется условие F(1) = G(1) = 1 (8.40) и требуемые производные существуют. Для справедливости этих формул не требуется, чтобы "вероятности" лежали в диапазоне [0..1]. Чтобы удовлетворить необходимому условию, можно нормализовать функции F(z) и G[z) путем их деления соответственно на F(1) и G(1), если только F(1) и G(1) не равны нулю. На среднем и дисперсии история не заканчивается. Эти характеристики— всего лишь первые из бесконечного ряда так называемых кумулянтов, введенных датским астрономом Тор- вальдом Николаи Тиеле (Thorvald Nicolai Thiele) [351] в 1903 году. Первые два кумулянта случайной величины, К] и К2, представляют собой то, что до сих пор мы называли "математическое ожидание" и "дисперсия"; вдобавок к ним имеются кумулянты и более высоких порядков, выражающие более тонкие свойства распределений. Если имеется производящая функция случайной величины G(z), то кумулянты всех порядков выражаются с помощью формулы lnG(et) = TTt + St2 + ft3 + ?t4 + "-- (841) Давайте познакомимся с кумулянтами поближе. Если G(z) представляет собой производящую функцию случайной величины X, то "ьтп.4.га G{el) = ]TPr(X = k)ekt = ]Г Pr(X = k) m! k^O k,m^0 = l+^t+|t4|t3+...,(8.42) где Цт = ^kmPr(X = k) - E(Xm). (8.43) k^O
8.3 Вероятностные производящие функции 481 Эта величина— цт— называется m-м моментом X. Можно взять экспоненту от обеих частей (8.41) и получить другую формулу для Gte1): Gle1) = 1+- Klt+^K2t2+- • •) (K!t+^K2t2+- • • )2 1! -+ 2! +••• = l+KTt+^Kz+Kfjt2^--- Приравнивание коэффициентов при одинаковых степенях t приводит к следующему ряду формул Kl К2 КЗ К4 к5 = Ш > = Ц2- = ^з- = Ц4- = М-5- -и?, - Зщ \ix + l\i] , - 4щ \13 + 12^i m - 3^2 - бр-t, - 5щ ц4 + 20|xf ц3 - Юм.2цз+ + 30^1^-60^|х2+24^, (8.44) (8-45) (8.4б) (8-47) (8-48) "Для этих семиинвариантов высших порядков мы не предлагаем никаких специальных имен'! — Т.Н.Тиеле[351] которые определяют кумулянты через моменты. Обратите внимание, что К2 действительно представляет собой дисперсию Е(Х2) — (ЕХ)2, как и утверждалось выше. Из уравнения (8.41) ясно, что кумулянты, порождаемые произведением F(z)G(z) двух производящих функций случайных величин, будут суммами соответствующих кумулянтов F(z) и G(z), потому что логарифм произведения представляет собой сумму логарифмов. Следовательно, все кумулянты суммы независимых случайных величин аддитивны, так же, как математическое ожидание и дисперсия. Это свойство делает кумулянты более важными, чем моменты. Если пойти несколько иным путем и записать г(л , дл 1 , а1 * , а2-,2 , а3 .з , G(l+t) = 1+7!" 2Г ЗГ ' то уравнение (8.33) показывает, что числа ос— это "факториаль- ные моменты" ctm = G<m>0) = }2Pr(x = k)k-zk" lz=1 k>0 = 21k-Pr(X = k) = E(X^ (8-49) k>0
482 Дискретная вероятность Отсюда вытекает, что = 1 + Tf(t+K + ...) + ^f(t2 + t3 + ...) + ' = 1 +^t+±{ot2 + oc])t2 + --- , и мы можем выразить кумулянты через производные G^H): кт = ai , (8.5о) К2 = ос2 + ой - а? , (8.51) кз = аз+3а2 + ост — 3oc2(Xi — 3ocf+ 2af , (8.52) Эта последовательность формул порождает "аддитивные" тождества, которые распространяют (8.38) и (8.39) на все кумулянты. А теперь спустимся с небес на землю и применим рассмотренные идеи к простым примерам. Простейшей случайной величиной является "случайная константа": случайная величина X принимает определенное фиксированное значение х с вероятностью 1. В этом случае Gx(z) = zx и lnGxle*) = xt; следовательно, математическое ожидание равно х, а все остальные кумулянты равны нулю. Отсюда следует, что операция умножения любой производящей функции случайной величины на zx увеличивает математическое ожидание на х, но при этом оставляет неизменными дисперсию и другие кумулянты. Как применить производящие функции к игральным костям? Распределению числа очков на одной игральной кости соответствует производящая функция случайной величины п( z + z2+z3+z4 + z5+z6 G{z) = = zU6(z), где Ив представляет собой производящую функцию случайной величины для равномерного распределения порядка 6. Множитель 'z' добавляет к математическому ожиданию 1, так что оно оказывается равным 3.5 вместо 1!^- = 2.5, которое дает (8.35); однако это *z* не влияет на дисперсию (8.36), которая равна Щ. Производящая функция случайной величины суммы очков на двух независимых игральных костях представляет собой квадрат производящей функции случайной величины для одной игральной кости, т.е. ^ , л z2+2z3+3z4+4z5+5z6+6z7+5z8+4z9+3z10+2z11+z12 Gs(z) = - = = z2U6(z)2.
8.3 Вероятностные производящие функции 483 При бросании пары игральных костей п раз вероятность получения к очков аналогично равна [zk]Gs(z) [zkl z2n U6(z ,2n ,к-2щ U6(z ,2n Распределение шляя представляет собой разновидность равномерного распределения. В рассмотренной ранее задаче о подбрасывании шляп футбольными болельщиками, известной также как задача подсчета неподвижных точек случайной перестановки, производящая функция случайной величины известна из (5-49): Fn(z) O^k^n (n-Tc)jzk (n-k)!k! для n ^ 0. (8-53) Следовательно, Fifz) = L l^k^n 0^k^n-1 (n-k)j zk~] (u-k)!(k-1)! (n-1 -k)jzk (n-1 -k)!k! Fn-iW Даже не зная никаких подробностей о коэффициентах, из рекуррентного соотношения F^(z) = Fn_i(z) можно заключить, что (z); следовательно, Flm,(z)=Fn F^(1) = Fn_m(1) = [n^m]. (8-54) Эта формула упрощает вычисление математического ожидания и дисперсии; мы находим, как и ранее (но быстрее), что обе эти характеристики равны 1 при п ^ 2. На самом деле сейчас мы можем показать, что и m-й кумулянт кт этой случайной величины равен 1 при п ^ га. Действительно, га-й кумулянт зависит только от F^(1), F^(1), ..., Fn (1), а все они равны 1; следовательно, для m-го кумулянта ответ не изменится, если заменить Fn(z) предельной производящей функцией случайной величины ,2-1 такой, что Foo (I (8-55) 1 для производных всех порядков. Кумулянты Fqo тождественно равны 1, потому что lnFG = lne ех^ t -i L L L = e*-1 =TT+2! + 3!+---
484 Дискретная вероятность 8.4 Бросание монет Обратимся теперь к процессам, имеющим ровно два исхода. Если мы бросаем монету, то имеется некоторая вероятность р, что монета упадет вверх орлом, и вероятность q, что она упадет вверх решкой, причем p + q 1 (Мы считаем, что монета не останется стоять на ребре, не провалится в щель, не зависнет в воздухе и т.п.) На протяжении этого раздела числа р и q всегда дают в сумме 1. Если монета правильная, то р = q = j] в противном случае монета называется несимметричной. Производящая функция случайной величины для числа выпадений орла в результате одного бросания монеты есть H(z) = q+pz. (8.56) Если монета брошена п раз, в предположении, что все бросания монеты независимы, количество выпавших орлов порождается функцией H(z)n = (q+pz)n = LfvVq k^n-k^k (8.57) в соответствии с биномиальной теоремой. Таким образом, вероятность выбросить ровно к орлов в п бросаниях равна (?)pkqn-k- Эта последовательность вероятностей называется биномиальным распределением. Предположим, что мы подбрасываем монету до тех пор, пока впервые не выпадет орел. Какова вероятность, что нам потребуется ровно к бросаний? С вероятностью р мы получим к = 1 (поскольку это вероятность того, что в первом броске выпадет орел); вероятность события к = 2 равна qp (поскольку это вероятность того, что в первый раз выпадет решка, а затем орел); а для произвольного к вероятность равна qk_1p. Таким образом, производящая функция есть pz+ qpz2 + q2pz3 + pz 1-qz- (8'58) Повторение этого процесса до выпадения п орлов дает производящую функцию случайной величины ?f+J"'W>k к - l (,k:l')pv-n*k ¦п (8-59) Мошенники знают, что p«0.1, если закрутить новое американское пенни на гладком столе (распределение масс в этой монете таково, что голова Линкольна перетягивает и падает вниз.)
8.4 Бросание монет 485 Это, кстати, умноженная на zn функция 1-qz/ 4-V к .^f^-'VqV (8.бо) Орел — я выигрываю, решка — ты проигрываешь. Нет? Ладно: решка — ты проигрываешь, орел— я выигрываю. Опять не так? Ну ладно, орел — ты проигрываешь, решка— я выигрываю. которая является производящей для отрицательного биномиального распределения. Пространство вероятностей в примере (8.59)) в котором мы бросаем монету до выпадения п орлов, отличается от пространств вероятностей, с которыми мы встречались ранее в этой главе, потому что оно содержит бесконечное количество элементов. Каждый элемент представляет собой конечную последовательность орлов и решек, содержащую ровно п орлов и заканчивающуюся орлом; вероятность такой последовательности равна pnqk_n, где к — п— количество решек. Таким образом, если записывать О при выпадении орла и Р при выпадении решки, то, например, при п = 3 последовательность P0PPP00 является элементом рассматриваемого пространства вероятностей, а его вероятность равна qpqqqpp=p3q4. Пусть X — случайная величина с биномиальным распределением (8.57)) а Y— случайная величина с отрицательным биномиальным распределением (8.бо). Эти распределения зависят от параметров пир. Математическое ожидание X равно пН'(1) =щ>, поскольку ее производящая функция случайной величины есть H(z)n; дисперсия же равна n(H"(1) + H'(1)-H'(1)2) = n(0 + p-p2) = npq. (8.61) Таким образом, стандартное отклонение составляет \/npq : если подбросить монету п раз, следует ожидать выпадения орла примерно nip ± у/щ>Ц раз. Математическое ожидание и дисперсию Y можно найти аналогично. Положим G(z) = Тогда имеем G'(z) = G"(z) = 1 — qz pq d-qz)2 2yq2 (1-q^)3 следовательно, G'(1) = pq/p2 = q/p и G"(1) = 2pq2/p3 = 2q2/p2. Поэтому математическое ожидание Y равно nq/p, а дисперсия — nq/p2.
486 Дискретная вероятность Более простой способ получения среднего и дисперсии Y заключается в использовании обратной производящей функции Ffz) и записи 1 qz 1 Р (8.62) G(z)n = F(z) (8.63) Этот полином F(z) не является производящей функцией, потому что у него есть отрицательный коэффициент. Однако он удовлетворяет главному свойству— F(1) = 1. Таким образом, формально F(z) представляет собой бином, отвечающей монете, у которой "вероятность" выпадения орла равна — q/p; a G[z) формально соответствует выбрасыванию такой монеты —1 раз (!). Таким образом, отрицательное биномиальное распределение с параметрами (гцр) можно рассматривать как обычное биномиальное распределение с параметрами (пДр') = (— гц— q/p). Действуя формально, получаем, что математическое ожидание должно быть равно п'\)' = {— п)(—q/p) = nq/p, а дисперсия должна равняться n'p'q' = (—n)(—q/p)(1 + q/p) = nq/p2. Этот формальный вывод, включающий отрицательные вероятности, тем не менее, справедлив, поскольку наши предыдущие рассуждения для обычных биномиальных распределений были основаны на тождествах для формальных степенных рядов, в которых нигде не использовалось предположение 0 ^ р ^ 1. Перейдем к другому примеру: сколько раз надо выбросить монету, чтобы орел выпал два раза подряд? Пространство вероятностей теперь состоит из всех последовательностей 0 и Р, заканчивающихся на 00, в которых нет двух последовательных 0 до последней позиции: Q = {OOjPOOjPPOOjOPOOjPPPOOjPOPOC^OPPOO,...}. Вероятность любой заданной последовательности можно получить, заменяя 0 на р, а Р на q; например, последовательность P0P00 встречается с вероятностью Pr(POPOO) = qpqpp = p3q2. Теперь можно поиграться с производящими функциями, как мы делали это в начале главы 7, обозначив через S бесконечную сумму Вероятность того, что я становлюсь моложе, явно отрицательна. .. Ой! Но тогда вероятность того, что я старею, больше единицы?! 00 + Р00 + PP00 + 0Р00 + PPP00 + P0P00 + 0PP00 +
8.4 Бросание монет 487 всех элементов П. Если заменить каждое 0 на pz, а каждое Р на qz, то можно получить производящую функцию случайной величины для количества бросаний до появления двух последовательных орлов. Имеется довольно неожиданная связь между S и суммой всех покрытий костями домино Т = l + D + m + B + (ID + [B + B]+.-- в уравнении (7-i)- Оказывается, что можно получить S из Т, если заменить каждую кость домино D на Р, а каждую кость домино В на ОР, и затем приписать 00 в конце. Это соответствие легко доказать, потому что каждый элемент О. имеет вид (Р + 0Р)П00 для некоторого п ^ 0, а каждый член Т имеет вид (D + B)n. Следовательно, из (74) имеем S = (1 -Р-ОРр^О, а производящая функция случайной величины для нашей задачи равна G(z) = (1-qz-(pz)(qz))_1(pz)2 - p2z2 = , ~ J- (8-64) 1 — qz — pqz2 Наш опыт работы с отрицательным биномиальным распределением подсказывает, что проще всего подсчитать математическое ожидание и дисперсию функции (8.64), если записать Gfz) z2 F(z)' где и подсчитать "математическое ожидание" и "дисперсию" этой псевдо-производящей функции случайной величины F(z). (Эта вновь введенная функция обладает свойством F(1) — 1.) Имеем F'(l) = (-q_2pq)/p2 = 2-р"1 -р"2; ?"(]) = -2pq/p2 = 2-гр-1.
488 Дискретная вероятность Таким образом, поскольку z2 = F(z)G(z), Mean(z2) = 2 и Var(z2) = 0, математическое ожидание и дисперсия распределения G(z) таковы: Mean(G) = 2-Mean(F) = V +V (8.65) Var(G) = -Var(F) = p"4 + 2p~3 -2p"2 -p"1 . (8.66) Для p = \ математическое ожидание и дисперсия составляют соответственно 6 и 22. (В упр. 4 обсуждается вычисление средних и дисперсий путем вычитания.) Представим себе более хитроумный эксперимент: будем бросать монету до тех пор, пока не встретится последовательность РОРРО. Теперь сумма выигрышных позиций имеет вид S = РОРРО + 0P0PP0 + РРОРРО + 00P0PP0 + 0PP0PP0 + P0P0PP0 + РРРОРРО + • • • ; описать эту сумму сложнее, чем предыдущую. Возвращаясь к методам, использовавшимся при решении задачи о домино в главе 7, можно получить формулу для S, рассматривая множество слагаемых как "язык конечных состояний" определяемый следующим "конечным автоматом": v0 0MD Элементарными событиями в пространстве вероятности являются такие последовательности символов 0 и Р, которые переводят автомат из состояния О в состояние 5. Предположим, например, что мы только что выбросили POP; тогда мы окажемся в состоянии 3. Если теперь выпадет решка, мы перейдем в состояние 4; если выпадет орел— в состояние 2 (но не в начальное состояние 0, поскольку последние РО могут быть продолжены последовательностью РРО). В этой постановке задачи можно обозначить через Sk сумму всех последовательностей 0 и Р, которые приводят в состояние к; тогда So Si s2 S3 s4 s5 = = = = = = 1 +S00 + S20, S0P + S, S10 + S3 S2P, S3P, S40. P + S4 P, 0, "Вы просто автомат, вычислительная машина. i— воскликнул я. — Временами в вас есть что-то нечеловеческое" —Дж. X. Ватсон (J. Н. Watson) [83]
8.4 Бросание монет 489 Теперь искомая сумма S— это сумма S5; найти ее можно, решая выписанную систему из шести уравнений с шестью неизвестными So, Si, ..., S5. Заменяя 0 на pz, а Р на qz, получим производящую функцию, причем коэффициент при zn в Sk представляет собой вероятность того, что мы окажемся в состоянии к после п бросков. Подобным образом любая диаграмма переходов между состояниями, в которой переход из состояния j в состояние к происходит с заданной вероятностью р^к, дает систему линейных уравнений, решениями которой являются производящие функции для вероятностей состояний после п переходов. Объекты такого типа называются марковскими процессами, и теория их поведения тесно связана с теорией линейных уравнений. Однако задачу о бросании монеты можно решить гораздо проще, не прибегая к сложной общей процедуре с построением конечного автомата. Вместо шести уравнений с шестью неизвестными So, Si, ..., S5 для полного описания S достаточно всего двух уравнений с двумя неизвестными. Трюк состоит в том, чтобы ввести в рассмотрение вспомогательную сумму N = So + Si + S2 + S3 + S4 всех последовательностей результатов бросания, не содержащих заданную последовательность РОРРО: N = 1+0 + Р + 00 + --- + РОРОР + РОРРР + • • • . Имеем 1+N(0 + P) = N+S, (8.67) потому что любой член в левой части либо заканчивается на РОРРО (и принадлежит S), либо нет (и принадлежит N); обратно, любое слагаемое из правой части либо пустое, либо принадлежит N 0 или N Р. Кроме того, мы имеем еще одно важное уравнение N РОРРО = S + SPP0, (8.68) потому что любое слагаемое из левой части содержит в себе член S, который либо оканчивается первой 0 из добавленной к N последовательности РОРРО (и в этом случае за ним следует РРО), либо заканчивается последней 0. Любое слагаемое из правой части, в свою очередь, имеется в левой. Эта система легко решается. Из соотношения (8.67) получаем N = (1 — S)(1 — 0 — Р)-1, следовательно, (1 -S)(l -Р-Ор1 РОРРО = S(l-fPPO).
490 Дискретная вероятность Как и ранее, для получения производящей функции случайной величины G(z) для количества бросаний монеты следует заменить 0 на pz и Р на qz. После упрощений, вытекающих из тождества р + q — 1, получаем I — Z следовательно, решение имеет вид G(Z) = p2q3z5 + (^+pq2z3)(1_z)- (8-69) Обратите внимание, что G(1) = 1, если pq ф 0; мы с вероятностью 1 дождемся последовательности P0PP0, если, конечно, монета не настолько несимметричная, что всегда выпадает только одной стороной— только орлом или только решкой. Для вычисления математического ожидания и дисперсии распределения (8.6д) инвертируем G(z), как мы уже делали это раньше, и запишем G(z) = z5/?[z), где F— полином: = pVzS + q+pqVm-^ p2q3 Соответствующие производные равны F'(1) = 5-(1+pq2)/p2q3, F"(1) = 20-6pq2/p2q3; и если X— требуемое число бросаний, то мы получаем EX = Mean(G) = 5-Mean(F) = p-2q-3+p-1q_1 ; (8.71) VX = Var(G) = -Var(F) = = -25+p~2q~3+7p_1q_1+Mean(F)2 = = (ЕХ)2-9р-2я-3-Зр-^_1. (8-72) Для V — \ математическое ожидание и дисперсия равны 36 и 996. Попробуем действовать более общо. Уже решенная задача в достаточной степени "случайна" чтобы показать, как следует анализировать случай появления произвольной последовательности орлов и решек А. Вновь обозначим через S сумму всех выигрышных последовательностей 0 и Р, а через N — сумму всех последовательностей, в которых подпоследовательность А пока что не встречалась. Уравнение (8.67) остается тем же самым; уравнение (8.68) превращается в NA = S(l+A(1)[A(m-1^A(m_1]]+A(2)[A(m-2^=A(m_2)] + ... + A(m-1)[Am=A(1)]), (8.73)
8.4 Бросание монет 491 где га— длина А и где и А (к) обозначают соответственно последние к и первые к символов А. Например, если А представляет собой уже рассмотренную последовательность РОРРО, то А(1) = О, А(2) = РО, А(3) = РРО, А(4) = ОРРО; A(i) = Р, А(2) = Р0> А(3) = POP, А(4) = РОРР. Поскольку единственное точное совпадение А^ = А(2), уравнение (8.73) сводится к (8.68). Обозначим через А результат подстановки р-1 вместо 0 и q-1 вместо Р в последовательность А. Тогда нетрудно обобщить наш вывод уравнений (8.71) и (8.72) и получить математическое ожидание и дисперсию в общем случае (упр. 20): m EX = ?A(10[A<k>=A(k)]; (8.74) k=1 TTL VX = (EX)2-^(2k-l)A(k)[A(k'=A(k)]. (8.75) k=1 В частном случае p = \ имеется особенно простая интерпретация этих формул. Если дана последовательность А из га орлов и решек, то положим га А:А = ^2к-'[А^=А{]с)]. (8.76) к=1 Очень легко выписать двоичное представление данного числа. Для этого надо записать Ч' под каждой позицией, обладающей тем свойством, что данная последовательность, если ее начало сдвинуть в эту позицию, в точности совпадет с первоначальной последовательностью в их общей части: А= 0P0P00P0P0 А:А = (1000010101)2 =512 + 16 + 4 + 1 =533 0P0P00P0P0 V 0P0P00P0P0 0P0P00P0P0 0P0P00P0P0 0P0P00P0P0 0P0P00P0P0 V 0P0P00P0P0 0P0P00P0P0 V 0P0P00P0P0 0P0P00P0P0 V
492 Дискретная вероятность Уравнение (8.74) утверждает, в сущности, что ожидаемое число бросаний до появления подпоследовательности А есть в точности 2(А:А) для правильной монеты, поскольку A(k) = 2к для р = q = \. Этот результат, найденный советстким математиком А.Д.Соловьевым в 1966году [331], на первый взгляд выглядит парадоксальным: несамосовмещающиеся последовательности появляются раньше, чем самосовмещающиеся! Появления последовательности 00000 придется ждать почти вдвое дольше, чем последовательности 0000Р или Р0000. Давайте теперь рассмотрим забавную игру, которую придумал Уолтер Пенни (Walter Penney) [289] в 1969 году. Алиса и Билл бросают монету до тех пор, пока не встретится последовательность 00Р или 0PP; Алиса выигрывает, если первой встречается последовательность 00Р, Билл побеждает, если первой выпадет последовательность 0PP. Эта игра— сейчас ее называют "Penney ante"— определенно, выглядит справедливой при использовании правильной монеты: ведь последовательности 00Р и 0PP имеют одинаковые характеристики, если рассматривать каждую из них по отдельности. Производящая функция случайной величины для времени ожидания последовательности 00Р имеет вид "Чем больше периодов у нашего слова, тем позже оно появляется" —А. Д. Соловьев Glz) = z3-8(z-l)> и точно такая же производящая функция случайной величины соответствует последовательности 0PP. Следовательно, ни Алиса, ни Билл не имеют никакого преимущества при игре в одиночку. Но если рассматривать обе подпоследовательности вместе, то между ними возникает крайне интересное взаимодействие. Обозначим через Sa сумму конфигураций, выигрышных для Алисы, а через Sb — сумму конфигураций, выигрышных для Билла: SA = OOP + 000Р + POOP + 0000P + 0P00P + P000P + • • • ; SB = 0PP + P0PP + 0P0PP + PP0PP + P0P0PP + PPP0PP + • • • . Вспоминая наш трюк, использованный в случае одной подпоследовательности, снова обозначим через N сумму всех последовательностей, для которых пока ни один из игроков не выиграл: Конечно, нет! Перед кем они могут иметь преимущество, играя в одиночестве? N = 1+0+Р+00+0Р+Р0+РР+000+0Р0+Р00+--- (8-77)
8.4 Бросание монет 493 Можно легко убедиться в справедливости следующих уравнений: 1+N(0 + P) = N + Sa + Sb; NOOP = SA; (8.78) NOPP = SAP + SB. Если теперь положить 0 = Р = ^, то получающееся значение Sa будет вероятностью выигрыша Алисы, a Sb — вероятностью выигрыша Билла. Наши три уравнения сводятся к следующим: 1+N = N + Sa + Sb; ?N = SA; ?n = ^Sa + Sb; и мы находим Sa = §, Sb = 3. Алиса побеждает в два раза чаще Билла! В обобщенной игре Алиса и Билл выбирают последовательности орлов и решек А и В и бросают монету до тех пор, пока в последовательности результатов выбрасываний не встретится одна из подпоследовательностей А или В. Эти две подпоследовательности не обязательно одинаковой длины, однако мы будем считать, что А не входит в В и В не входит в А. (В противном случае игра вырождается. Например, если А = ОР и В = РОРО, то у бедного Билла нет никаких шансов на победу; а если А = 0Р0 и В = РО, то игра может закончиться вничью.) Тогда можно записать три уравнения, аналогичные (8.73) и (8-78): 1+N(0 + P) = N + Sa + Sb; 1 NA = SAXA{l"k)[A(k)=A(*)]+ k=l min(l,m) + SB X A(l-k4BW=A(lc)]; k=1 min(l,m) NB = SA ?_ B(m-k)[A(k»=B(k)]+ k=l + sB2_B<m-k>[B(k> = B(k)]. k=1 (8.79) Здесь I— длина A, a m— длина В. Например, если A=0PP0P0P0 иВ = P0P0PP0, то два последних уравнения, зависящие от А и В, будут иметь вид N0PP0P0P0 = SA PP0P0P0 + SA + SB PP0P0P0 + SB РОРО; NP0P0PP0 = SA РОРРО + SA РРО + SB РОРРО + SB .
494 Дискретная вероятность Для выяснения вероятности победы при игре правильной монетой следует положить 0 = Р = ^; это приведет два решающих уравнения к виду l min(l,m) N=SAX2ktA(k)=A(k)J+SB ?_ 2k[B<k'=A(k)]; k=1 k=1 (8.80) min(l,m) m N=SA ^~ 2k[A(k)=B(k)]+SB?2k[B(^=B(k)]. k=1 k=1 Для дальнейшей работы нам надо обобщить операцию Л:А из (8.76) на случай двух независимых последовательностей А и В: min(l,m) А:В = ]Г 2k_1 [A(k)=B(k)]. (8.81) k=1 Уравнения (8.8о) упрощаются до SA(A:A) + SB(B:A) - SA(A:B) + SB(B:B); преимущество Алисы выражается отношением Sa _ В:В-В:А S^" " А:А-А:В (8.82) (Эту красивую формулу открыл Джон Хортон Конвей (John Ног- ton Conway) [137].) Например, если, как и ранее, А = 0PP0P0P0 и В = P0P0PP0, то А:А = (10000001)2 = 129, А:В - (0001010)2 = 10, В:А = (0001001)2 = 9иВ:В = (1000010)2 = 66; так что отношение SA/Sв равно (66—9)/( 129—10) = 57/119. Алиса будет выигрывать в среднем только 57 раз из каждых 176. В игре Пенни встречаются всякие странности. Например, последовательность 00Р0 выигрывает у последовательности 0Р00 с преимуществом 3/2, а последовательность 0Р00 выигрывает у последовательности Р000 с преимуществом 7/5. Казалось бы, последовательность 00Р0 должна быть существенно лучше, чем последовательность Р000. Но на самом деле последовательность РООО выигрывает у последовательности 00Р0 с преимуществом 7 /5\ Отношение последовательностей в этой игре нетранзитив- СтРаннО и &аже но. В упр. 57 доказывается, что, какую бы последовательность ОРигинальни... Ti Т2 ... та длиной I ^ 3 ни выбрала Алиса, Билл всегда может повысить свои шансы на победу, выбирая последовательность Т2Т-1Т2 .. .Ti_i, где Т2— противоположный к Т2 символ (орел, если Т2— решка, и решка, если т2— орел).
8.5 Хеширование 495 8,5 Хеширование ... хотя глагол «хешировать» (to hash) стал стандартным термином в средине 60-х годов, никто не решался использовать в печати столь недостойное слово до 1967года!" —Д. Э. Кнут 1209] Завершим эту главу приложением теории вероятностей к программированию. Некоторые важные алгоритмы хранения и выборки данных в компьютерах основаны на методе, носящем название "хеширование'.' Общая задача заключается в хранении некоторого множества записей, каждая из которых содержит значение "ключа" К и некоторые данные D(K), связанные с этим ключом. Мы хотим иметь возможность быстро находить D(K) по заданному К. Например, каждый ключ может представлять собой имя студента, а связанные с ним данные— оценки за домашние задания. На практике компьютеры не настолько оснащены памятью, чтобы можно было выделить по отдельной ячейке для каждого возможного ключа. Возможны миллиарды ключей, но в каждом конкретном приложении их присутствует не так уж и много. Одно из решений проблемы заключается в том, чтобы поддерживать две таблицы— KEY[j] (для ключей) и DATA[j] (для данных), 1 ^ j ^ N, где N — общее количество записей, которые могут быть размещены в памяти; еще одна переменная п указывает, сколько записей размещено на самом деле. Тогда поиск заданного ключа К можно выполнять при помощи очевидного последовательного сканирования. 51 Установить j := 1. (Уже просмотрены все позиции < j.) 52 Если j > п, остановиться. (Неудачный поиск.) 53 Если KEY[j] = К, остановиться. (Поиск успешно завершен.) 54 Увеличить j на 1 и вернуться к шагу S2. (Пробуем дальше.) После успешного поиска нужная запись с данными D(K) находится в DATA[j]. После неудачного поиска можно вставить К и D(K) в таблицу путем установок п j, KEY[n] := К, DATA[n] := D(K) в предположении, что таблица еще не заполнена до предела. Этот метод работает правильно, но может быть ужасающе медленным. Так, при неудачном поиске шаг S2 приходится выполнять п + 1 раз, а п может быть очень большим. Хеширование было разработано для того, чтобы ускорить поиск. Основная его идея, в одном из популярных вариантов, заключается в использовании га отдельных списков вместо одного огромного. "Хеш-функция" преобразует каждый возможный ключ К в номер списка Н(К) в диапазоне от 1 до та. Вспомогательная таблица FIRST [г] для каждого 1 ^ г ^ та указывает на первый элемент в списке г; еще одна вспомогательная таблица
496 Дискретная вероятность NEXT[j] ,1 ^ j ^ N, указывает на запись, следующую за записью j в том списке, которому эта запись принадлежит. Будем считать, что FIRST [г] = -1 , NEXT[j] = О, если список г пуст; если запись j последняя в своем списке. Как и ранее, имеется переменная п, которая говорит о том, сколько всего записей сохранено. Например, пусть ключи представляют собой имена и имеются га = 4 списка, основанные на первой букве имени: h(name) = 1, для A-F; 2, для G-L; 3, для M-R; 4, для S-Z. Поначалу у нас имеются четыре пустых списка ип = 0. Если, скажем, ключ первой записи— имя Nora, то H(Nora) = 3, так что Nora становится ключом первого элемента списка 3. Если следующими двумя именами будут Glenn и Jim, то оба они попадут в список 2. Теперь таблица в памяти имеет следующий вид: FIRST [1 ] = -1, FIRST [2] = 2, FIRST [3] = 1, FIRST [4] = -1. KEY[1] = Nora, NEXT[1] = 0; KEY [2] = Glenn, NEXT [2] = 3; KEY[3] = Jim, NEXT[3] = 0; n = 3. (Значения DATA [1 ] , DATA [2] и DATA [3] содержат конфиденциальную информацию и здесь не показаны.) После вставки 18 записей списки могли бы содержать следующие имена: Список 1 Dianne Ari Brian Fran Doug Список 2 Glenn Jim Jennifer Joan Jerry Jean Список 3 Nora Mike Michael Ray Paula Список 4 Scott Tina Здесь увековечены имена студентов, сидевших в первых рядах на занятиях по конкретной математике и предоставивших свои имена для этого эксперимента. Эти имена в массиве KEY записаны вперемешку, но записи массива NEXT позволяют разделить списки. Теперь, чтобы найти имя John, нам потребуется просканировать шесть имен второго списка (который оказался самым длинным); но даже этот длинный список все равно существенно короче общего количества 18 имен.
8.5 Хеширование 497 Вот точное описание алгоритма, который ищет ключ К в соответствии с данной схемой: HI Установить г := Н(К) и j := FIRST [i]. Н2 Если j ^ О, остановиться. (Поиск неудачен.) НЗ Если KEY[j] = К, остановиться. (Поиск успешен.) Н4 Установить г := j, затем установить j := NEXT [г] и вернуться к шагу Н2. (Очередная попытка.) Например, для поиска имени Jennifer из приведенного примера на шаге HI будет установлено г := 2 и j := 2; на шаге НЗ выяс- Готов спорить, что нится, что Glenn ф Jennifer; на шаге Н4 будет установлено j := 3; их родители рады на шаге НЗ выяснится, что Jim ф Jennifer. Еще одна итерация шагов Н4 и НЗ обнаружит Jennifer в таблице. После успешного поиска искомые данные D(K) содержатся в DATA [j] , как и в предыдущем алгоритме. После неудачного поиска можно внести в таблицу К и D(K) путем следующих операций: п := тг+ 1; Если j < 0 то FIRST [г] := п иначе NEXT [г] := п; KEY[n] := К; DATA[n] := D(K); NEXT[n] := 0. (8.83) Теперь таблица соответствует имеющимся данным. Мы надеемся, что все списки будут примерно одинаковой длины, поскольку это делает поиск примерно в та раз быстрее. Обычно значение m гораздо больше 4, так что множитель 1 /т— это значительное улучшение. Заранее неизвестно, какие именно ключи будут храниться в таблице, но обычно можно выбрать хеш-функцию Н так, чтобы значения Н(К) были случайной величиной, равномерно распределенной между 1 и m и независимой от хеш-кодов других присутствующих ключей. При этом вычисление хеш-функции подобно бросанию игральной кости с m гранями. Может случиться, что все записи попадут в один список, так же, как на игральной кости всегда может выпадать |jj]; но теория вероятностей говорит нам, что списки почти всегда будут достаточно хорошо сбалансированы. Анализ хеширования: введение "Анализ алгоритмов" — это раздел информатики, занимающийся получением количественной информации об эффективности компьютерных методов. "Вероятностный анализ алгоритмов" изучает время работы алгоритмов, рассматриваемое в качестве случайной величины, зависящей от предполагаемых характеристик исходных данных. Хеширование особенно хорошо
498 Дискретная вероятность подходит для вероятностного анализа, потому что метод хеширования очень эффективен в среднем, при том что наихудший его случай просто ужасен. (В наихудшем случае все ключи имеют один и тот же хеш-код.) Так что программисту, использующему хеширование, лучше бы верить в теорию вероятностей... Пусть Р — количество выполнений шага НЗ при работе описанного ранее алгоритма. (Каждое выполнение шага НЗ называется "испытанием'.') Если мы знаем Р, то можем узнать и количество выполнений каждого шага в зависимости от успешности поиска: Шаг HI Н2 НЗ Н4 Неудачный поиск 1 раз Р + 1 раз Р раз Р раз Успешный поиск 1 раз Р раз Р раз Р — 1 раз Таким образом, главная характеристика, определяющая время работы процедуры поиска, есть число испытаний Р. Чтобы представить себе работу алгоритма, можно вообразить, что у нас имеется адресная книга, организованная некоторым специальным образом, заключающимся в том, что на каждой странице имеется только одна запись. На обложке книги имеется номер страницы первой записи для каждого из га списков; каждое имя адресата К определяет список Н(К), которому он принадлежит. На каждой странице книги имеется ссылка на следующую страницу списка, которому принадлежит текущая страница. Число испытаний, требующееся для поиска адреса в такой книге,— это количество страниц, которые нам придется просмотреть. Если в таблицу внесено п элементов, то их расположение зависит только от соответствующих хеш-кодов (hi, h^ ..., Hn). Все mn возможных последовательностей (Hi, h,2,..., Нп) считаются равновероятными, случайная величина Р зависит от этой последовательности. Случай 1: ключ отсутствует Загляните под ков- Рассмотрим сначала поведение Р при неудачном поиске в рик у двери. предположении, что в таблицу внесено п записей. В этом случае пространство вероятностей состоит из mn+1 элементарных событий ш = (Hi,h2,...,Hn>Hn+i)>
8.5 Хеширование 499 где Hj — хеш-код для j-ro ключа в таблице, a Hn+i — хеш-код ключа, который не удалось найти. Мы полагаем, что хеш-функция Н корректно выбрана, так что Pr(tu) = 1/mn+1 для любого си. Например, для га = п = 2 имеется восемь равновероятных возможностей: Hi Н2 Н3: Р 1 1 1:2 1 1 2: О 1 2 1:1 1 2 2: 1 2 1 1:1 2 1 2: 1 2 2 1:0 2 2 2: 2 Если Hi = Н2 = Нз, то мы делаем два неудачных испытания, прежде чем обнаружим, что новый ключ К в таблице отсутствует; если hi = Н2 ф Нз, то нам не надо делать ни одного испытания; и т.д. Этот список всех возможностей показывает, что распределение вероятности Р описывается при га = п = 2 производящей функцией случайной величины (f + fz+fz2) == (l-|_lz)2. Неудачный поиск требует по одному испытанию для каждого элемента списка Hn+i, так что общая формула имеет вид Р = [Hi=Hn+i] + [Н2=Нп+1] + ... + [Нп = Нп+1]. (8.84) Вероятность того, что Hj = Hn+i, равна 1/m для 1 ^ j ^ п; поэтому ЕР = E[H1=Hn+1]+E[H2=Hn+1]+-..+E[Hn=Hn+1] = — . m Может быть, следует действовать помедленнее. Итак, пусть Xj — случайная величина Xj = Xj(w) = [Hj=Hn+1]. Тогда Р = Xi + • • ¦ + Хп, и EXj = 1/m для всех j ^ п; следовательно, ЕР = ЕХт +-.. + ЕХп = п/т. Хорошо: как мы и надеялись, среднее количество испытаний в га раз меньше, чем без хеширования. Более того, случайные вели-
500 Дискретная вероятность чины Xj независимы и имеют одну и ту же производящую функцию случайной величины ед = ^^; m следовательно, производящая функция случайной величины для общего количества испытаний при неудачном поиске будет P(z) = X,(z)...Xn(z) = (m~^ + Z)n. (8.85) Это биномиальное распределение с р = 1/rrt и q = (га — 1)/та; другими словами, количество испытаний в безуспешном поиске ведет себя точно так же, как и число выпавших орлов при бросании несимметричной монеты с вероятностью выпадания орла в каждом бросании 1/т. Уравнение (8.6i) говорит нам, что дисперсия Р равна n(m— 1) При большом га дисперсия Р приближенно равна п/т, так что стандартное отклонение примерно равно д/n/m. Случай 2: ключ присутствует Рассмотрим теперь успешный поиск. Пространство вероятностей для этого случая несколько более сложное, в зависимости от рассматриваемого приложения. Выберем в качестве О множество элементарных событий ш = (Нь...,^;^, (8.86) где hj представляет собой хеш-код для j-ro ключа, как и ранее, а к есть индекс искомого ключа (хеш-код которого— Н^). Таким образом, 1 ^ Kj ^ m для 1 ^ j ^ пи 1 ^ к ^ п; всего имеется mn -п элементарных событий си. Пусть Sj — вероятность того, что выполняется поиск j-ro помещенного в таблицу ключа. Тогда Рг(си) = Sfc/m11, (8.87) если си— событие (8.86). (В некоторых приложениях чаще осуществляется поиск ключей, вставленных в таблицу первыми (или наоборот, последними), так что мы не будем полагать, что все Sj = 1/тг.) Заметим, что Ишен^1^) = Hk=i sk — 1> следовательно, (8.87) определяет конкретное распределение вероятностей.
8.5 Хеширование 501 По-моему, где-то я уже видел эту последовательность. .. Уравнение (8.43) ~ тоже небольшое отступление. Количество испытаний Р при успешном поиске равно р, если ключ К был вставлен в список р-м. Следовательно, Pfhb.^hajlc) - [hi=hk]H-[h2=Hk]+-..+[Hk = hlc]; (8.88) или, если обозначить случайную величину [hj = Hk] как Xj, Р = Xl+X2 + --. + Xk. (8.89) Предположим, например, что m = 10, п = 16 и что хеш-значения образовали такую "случайную" последовательность: (hb...,h16) =3141592653589793; (РЬ...,Р16) =1112111122312133. Количество испытаний Pj, требующихся, чтобы найти j-й ключ, показано под hj. Уравнение (8.8д) представляет Р в виде суммы случайных величин, но мы не можем вычислить ЕР как ЕХ] + • • • + EXk, потому что значение к само по себе является случайной величиной. Какова же производящая функция случайной величины Р? Для ответа на этот вопрос нам придется ненадолго отвлечься от нашей задачи и поговорить об условной вероятности. Если А и В — события пространства вероятности, то мы говорим, что условная вероятность А при условии В есть Рг(ше А | ше В) = Рг(сиеАПВ) Рг(сиеВ) (8.90) Например, если X и Y— случайные величины, то условная вероятность события X = х при условии Y = у равна Pr(X = x|Y = y) Рг(Х = хи Y = y) Pr(Y = y) (8.91) Для любого фиксированного у, принадлежащего диапазону изменения Y, сумма всех этих условных вероятностей по всем х в диапазоне изменений X составит Pr(Y = у )/Pr(Y = у) = 1; следовательно, (8.91) определяет распределение вероятностей, и можно определить новую случайную величину 'Х|у', такую, что Pr((X|y)=x)=Pr(X = x|Y = y). Если X и Y независимы, то случайная величина Х|у по сути совпадает с X независимо от значения у, потому что Pr(X=x | Y=y) равно Рг(Х = х) в силу (8.5); это и есть условие независимости. Но если X и Y зависимы, то случайные величины Х|у и Х|у' могут быть совершенно не похожи одна на другую при у ^у'.
502 Дискретная вероятность Если X принимает только неотрицательные целые значения, ее производящую функцию случайной величины можно разложить на сумму условных производящих функций случайных величин по отношению к любой другой случайной величине Y: Gx(z) = Y_ Pr(Y = xj)GX|y(z). yGY(O) (8.92) Это соотношение справедливо потому, что коэффициент при zx в левой части есть Рг(Х = х) для всех х Е Х(П), а в правой части он равен Y_ Pr(Y = -y)Pr(X = x|Y = y) = Y_ Рг(Х = хиУ = у) = yeY(CL) DEY(n) - Рг(Х = х). Например, если X— произведение очков, выпавших на двух правильных игральных костях, a Y— сумма очков, то производящая функция случайной величины Х|6 есть 3Х|6 м - 2,5 1 ^9 5*" + !z + iz потому что условные вероятности для Y = 6 содержат пять равновероятных событий {[тщ |711111)00)1П1ЕЗ>[!!ЗЕ]}- "Ур^- нение (8.92) в этом случае сводится к Gx(z) = ^GX|2(z)+^Gx|3(z)+^Gx|4W+^Gx,5(z)+ + ^Gx|6(z) + ^Gx|7(z) + ^Gx|8(z) + ^GX|9(z) + +^Gx|io(z)+^Gxm(z)+^GX|i2(z), формуле, которая, будучи один раз понятой, становится совершенно очевидной. (Конец отвлечения.) В случае хеширования (8.92) говорит нам о том, как записать производящую функцию случайной величины для количества испытаний при успешном поиске, если положить X = Р и Y = К. Для любого фиксированного к между 1 и п случайная величина Р|к определяется как сумма независимых случайных величин Xi + • • • + Xicj это в точности равно (8.89)- Поэтому ее производящая функция случайной величины равна m-1 +z\*-^ >P|k м - (^) z. Теперь мне ясно и очевидно, что имеют в виду математики, говоря "очевидно" "ясно" или "тривиально" (Аспирант: — Шеф, я подготовил статью, но из сорока страниц выкладок потерял все, кроме первой и последней... Руководитель: — Ерунда! Просто напишите в конце первой: "путем тривиальных преобразований получаем..." — Переводчик)
8.5 Хеширование 503 "Это очевидно, и я полагаю, что хороший первокурсник должен быть в состоянии это сделать, хотя это и не тривиально" — Поль Эрдёш (Paul Erdos) [94]. Очевидно, что производящая функция случайной величины Р может быть записана как GP(z) = ]TskGP|k(z) = k=l Х>( та k=l та «(Nr1)* где S{z) = St + s2z + S3Z Л hSxxZ' n-1 (8.93) (8.94) есть производящая функция случайной величины для вероятностей поиска Sk (для удобства разделенная на z). Хорошо. У нас есть производящая функция случайной величины Р; теперь можно найти математическое ожидание и дисперсию путем дифференцирования. Вычисления несколько упрощаются, если убрать множитель z, как мы делали ранее, и найти таким образом математическое ожидание и дисперсию Р — 1: F(z) = GP(z)/z = S( та— 1 +z m- 1+z m )¦• m 1 nv Следовательно, F'(z) = -S'( m V F"(z) = -U"( )= m m— 1 +z m EP = H-Mean(F) = 1+F'(1) - 1 + m"1 Mean(S); VP = Var(F) = F"(1) + F/(1)-F/(1)2 = (8.95) ¦та -2c/ s4i: = m-zVar(S) + (m-' - m"z) Mean(S). (8.96) Эти общие формулы выражают математическое ожидание и дисперсию количества испытаний Р через математическое ожидание и дисперсию заданного распределения искомых ключей S. Например, предположим, что s^ = 1/тг для 1 ^ k ^ п. Это означает, что мы выполняем чисто "случайные" поиски с равной вероятностью для всех ключей в таблице. Тогда S{z) представляет собой равномерное распределение вероятности Un(z) из (8.32),
504 Дискретная вероятность и мы получим Mean(S) = (п — 1 )/2, Var(S) = (п2 — 1 )/12. Следовательно, ^^ п—1 ЕР = 2^+1 ; (8-97) n2-1 (m-IKn-1) (n-1)(6m+n-5) W = П^+ 2m? = 12^ • (8'98) Мы вновь получили ускорение в m раз. Если та « n/lnn и п —> со, среднее количество испытаний при успешном поиске будет примерно равно \ In п, а стандартное отклонение асимптотически равно (Inn)/л/12. С другой стороны, можно принять sic = (kHn)-1 для 1 ^ к ^ п; это распределение называется "законом Зипфа" Тогда Mean(S) = n/Hn - 1, Var(S) = \п{п + 1 )/Hn - п2/Н^. Среднее количество испытаний для m « n/lnn при п —> оо примерно равно 2 со стандартным отклонением, асимптотически равным л/Ып/Vl. В обоих случаях проведенный анализ позволяет спокойно спать пессимистам, опасающимся наихудшего случая: неравенство Чебышева говорит нам о том, что списки будут хорошими и короткими, за исключением крайне редких случаев. Случай 2, продолжение: разные дисперсии Мы только что вычислили дисперсию количества испытаний в случае успешного поиска, рассматривая Р как случайную величину на пространстве вероятности из mn • п элементов (hi,..., hn;k). Но мы могли бы принять и другую точку зрения. Каждый набор хеш-кодов (Hi,..., hn) определяет случайную величину Р| (hi,..., hn), которая представляет собой количество испытаний при успешном поиске в данной конкретной хеш-таблице с п заданными ключами. Среднее значение Р| (hi,..., hn), тг A(hb...,hn) = ^p.Pr((P|(hb...,hn))=p)) (8.99) p=i как можно считать, представляет время успешного поиска. Величина A(hi,..., hn) является случайной величиной, которая зависит только от (hi,..., hn), но не от последнего компонента к. Ее можно записать в виде А(Нь...,Нп) = ^skP(hb...)hn;k)> к=1
8.5 Хеширование 505 VP (Vox Populi, глас народа) не ноль только во время выборов. "И не безлики вы, и вы— не тени, Коль надо в урны бросить бюллетени!" — В. С. Высоцкий (Доб. пер.) где P(Hi,.. .jhnik) определено в (8.88), поскольку PKhi,..., Нп) = р с вероятностью n=iPr(p(hb--->Hn;k)=p) = Lk=iPr(Hi,...,Hn;k) Lk=i™~nSk[P(Hb-..,Hn;k)=p] m-^Sk s]c[?{ln:y...)hrx;k)=ip] Среднее значение A (Hi,..., Hn), полученное суммированием по всем ran возможным наборам (Hi,..., Нп) и делением на гап, будет тем же, что и ранее найденное в (8.95). Однако дисперсия A(Hi,..., Нп) несколько отличается; это дисперсия гап средних, а не ran -п отдельных значений количества испытаний. Например, если га = 1 (так что у нас имеется только один список), "среднее" значение A (Hi,..., Нп) = А(1,..., 1) на самом деле представляет собой константу, так что ее дисперсия VA равна нулю; однако количество испытаний в успешном поиске не постоянно, и его дисперсия VP— не нуль. Можно проиллюстрировать это различие между дисперсиями, выполнив вычисления для произвольных га и п в простейшем случае, когда s^ = 1/п для 1 ^ k ^ п. Другими словами, мы временно полагаем, что ключи поиска распределены равномерно. Любая данная последовательность хеш-кодов (Hi,..., Нп) определяет га списков, которые содержат соответственно (ги ,112,..., nm) записей для некоторых чисел rij, где Hi + п2 Н \-nv п. Успешный поиск, в котором каждый из п ключей в таблице равновероятен, потребует в среднем A(Hb...,hn) = (1+- - -+ги )+(!+• • -+п2)+- • -+(1+- • -+ТЦ п Tii (tii +1 )+тг2(тг2+1 )+• • •+пш{пш+1) 2тг i2,+n22n щ+щ-h-j-n^-n испытаний. Наша цель заключается в вычислении дисперсии величины A (Hi,..., Нп) на пространстве вероятности, состоящем из всех гап последовательностей (Hi,..., Нп).
506 Дискретная вероятность Как оказывается, проще вычислить дисперсию несколько иной величины B(hb...,hj = (n21) + (n22)+•••+("; Имеем A(hb...,hn) - 1+B(hb...,hn)/n, следовательно, математическое ожидание и дисперсия Л удовлетворяют соотношениям т- * -I ЕВ VB , ч ЕА = 1 + —; VA = -у. 8.Ю0 Вероятность того, что размеры списков составят ги , П2, ..., nm, равна биномиальному коэффициенту n \ п! ni,Ti2,...,nm/ ni!n2! ...nm! деленному на mn; следовательно, производящая функция случайной величины В (Hi,..., Нп) представляет собой Bn(z)= У" ( П У^Ь-ГУН +(^)m-. Til +TL24 |-Пт=:П Для неискушенного глаза эта сумма выглядит жутковато, но наш опыт, приобретенный в главе 7, помогает распознать в ней га- кратную свертку. Действительно, если определить экспоненциальную суперпроизводящую функцию G(w,z) = ^Bn(z) П! то можно легко убедиться, что G(w,z) есть просто m-я степень: Vk^0 ' / Для проверки подставим z = 1; мы получим G(w,1) = (ew)m, так что коэффициент при m^w^/nl равен Вп(1) = 1. Если бы мы нашли значения В^(1)иВ^(1),то могли бы вычислить Var (Вп). Возьмем поэтому частную производную G (w, z)
8.5 Хеширование 507 по ъ\ -G(W)z) = XBnW-^ к\™~1 АЛ ,ьх лл,к М w \ \— /М rk)_i wK к^О 7 к^О L^ir L = ml, *„_. ^, ,г w З2 ,., V- „/// ^nw" к \ ttl—2 / /-, \ v \ 2 Да, это действительно сложные выражения. Но все значительно упрощается, если положить ъ—\. Например, ^- nl ] п! 2_2(к-2)! п^О к^2 ^ ; -l)w V" W к+2 mw2e(m-1)w 2к! 2 к^О _ у- (mw)n+2 _ ^- n(n-l)mnwn ^— 2га п! ^-— 2mu! -еК откуда следует, что в;(1) = 01. (8.Ю1) Выражение для ЕА в (8.юо) в полном согласии с (8.97) теперь дает ЕА = 1 + (п - 1 )/2т. Формула для В^(1) включает похожую сумму LG)(G)-0^4L'k+'|k(k;',№-2)w>- k^O \ / \\ / / * к^О 4 4 (к-з)! 44ь к! j
508 Дискретная вероятность следовательно, находим, что лплл.п ZBnO п^О = m(m-1)ew(m-2)(lw2ew) + + mew(m-1)(lw4+w3)ew = = mewm(lmw4 + w3); вд-Ш*)-')^ (8"о2) Теперь можно собрать все вместе и вычислить искомую дисперсию VA. При этом сокращается масса членов, и результат оказывается на удивление простым: VA = vb в?(п + в;(1)-в;(1] п^ IVй п{п- 1) ((n+1)(n-2) m _ n(n-i; 4 +Т 4 (m-1)(n-1) (8.103) 2m2n Встретив такое "совпадение" мы можем заподозрить какую- то математическую причину этого; может существовать и другой подход к решению поставленной задачи, поясняющий, почему ответ выглядит так просто. И действительно, такой подход имеется (в упр. 61), и он показывает, что в общем случае дисперсия среднего успешного поиска имеет общий вид VA т- 1 т/- Y^^-v (8.104) k=1 где Sic— вероятность поиска элемента, вставленного k-м по счету. Уравнение (8.103) представляет собой частный случай s^ = 1 /п для 1 <J к ^ п. Помимо дисперсии среднего, можно рассмотреть и среднее дисперсии. Другими словами, каждая последовательность (Hi, ...,НП), задающая хеш-таблицу, определяет также распределение вероятностей для успешного поиска, и дисперсия этого распределения вероятностей показывает, насколько сильно будет разбросано количество испытаний в различных успешных поисках. Например, вернемся к случаю, когда мы размещали п = 16 элементов в m = 10 списках: (Нь...,Тпб) -3141592653589793 (Pi,...,Pi6) =1112111122312133 По-моему, где-то я уже видел эту последовательность. ..
8.5 Хеширование 509 По-моему, где-то я уже видел это замечание... "Это я знаю и помню прекрасно, пи многие знаки мне лишни, напрасны". .. 7Т «3.1415926535 8979323846264338 3279502884197169 3993751058209749 4459230781640628 6208998628034825 3421170679821480 8651328230664709 3844609550582231 7253594081284811 1745028410270193 8521105559644622 9489549303819644 2881097566593344 6128475648233786 7831652712019091 4564856692346034 8610454326648213 3936072602491412 7372458700660631 5588174881520920 9628292540917153 6436789259036001 1330530548820466 5213841469519415 1160943305727036 5759591953092186 1173819326117931 0511854807446237 9962749567351 ... Успешный поиск в результирующей таблице имеет производящую функцию случайной величины 16 G(3,1,4,1,...,3) = Ls*z P(3,1,4,1,...,3;k) _ k=1 = SiZ+ SiZ-\- S3Z+ S4Z2 H hSi6Z3. Только что мы занимались средним числом проб для успешного поиска в этой таблице, а именно А(3,1,4,1,..., 3) = Mean(G(3, 1, 4,1,..., 3)). Можно также рассмотреть дисперсию s1.12 + S2-12 + s3-12 + s4-22 + --. + si6-32- -(si -1 +s2-1 +s3-1 +s4-2 + ... + si6-3)2. Эта дисперсия является случайной величиной, зависящей от (hi,..., hn), так что рассмотрение ее среднего значения вполне закономерно. Другими словами, имеются три естественных вида дисперсии, которые могут быть полезны при изучении поведения успешного поиска. Это общая дисперсия количества испытаний, взятая по всем (hi,..., hn) и к; дисперсия среднего числа испытаний, где среднее берется по всем к, а затем дисперсия берется по всем (hi,... ,hn); и среднее дисперсии количества испытаний, где дисперсия берется по всем к, а затем среднее— по всем наборам (hi,..., hn). В символьном виде общая дисперсия записывается как VP L Z^P^b...>Hn;k)2 1 ^Нт ,...,hn^TR k=1 4^hi ,...,hn^m k=1 дисперсия среднего— как VA = .,hn;k) .,hn;k) Vl^h, ,...,hn^m k=l 7 и среднее дисперсии— как 1 AV Z 1 ^K] ,...,Hn ^TTL m" J2skP(hb...,hn;k)2- k=1 -(?slcP(hb...,hn;k)) J
510 Дискретная вероятность Оказывается, что эти три величины связаны между собой простым соотношением: VP = VA + AV. (8.105) В самом деле, условные распределения вероятностей всегда удовлетворяют тождеству VX = V(E(X|Y))+E(V(X|Y)), (8.106) если X и Y— случайные величины в произвольном пространстве вероятностей, причем X принимает вещественные значения. (Это тождество доказывается в упр. 22.) Уравнение (8.105) является частным случаем, когда X— количество испытаний при успешном поиске, a Y— последовательность хеш-кодов (hi,..., hn). Общее уравнение (8.1 об) требует внимательного рассмотрения, поскольку в нем скрыто несколько различных случайных величин и пространств вероятностей, в которых надлежит вычислять математические ожидания и дисперсии. Для каждого у из диапазона изменения Y в (8.gi) определена случайная величина Х|у, и эта случайная величина имеет ожидаемое значение Е(Х|у), зависящее от у. Далее, E(X|Y) обозначает случайную величину, принимающую значения Е(Х|у) при у, принимающем все возможные для Y значения, a V(E(X|Y)) есть дисперсия этой случайной величины по отношению к распределению вероятностей Y. Аналогично E(V(X|Y)) представляет собой среднее значение случайной величины V(X|y) при изменении у. В левой части (8.юб) находится VX, безусловная дисперсия X. Поскольку дисперсии неотрицательны, мы всегда будем иметь VX ^ V(E(X|Y)) и VX ^ E(V(X|Y)), (8.107) Случай 1, еще раз: пересмотр неудачного поиска В завершение нашего микроскопического изучения хеширования выполним еще одно вычисление, типичное для анализа алгоритмов. На этот раз рассмотрим более подробно общее время работы неудачного поиска в предположении, что компьютер вставляет в память до этого отсутствовавший там ключ. В процессе вставки (8.83) возможны два случая в зависимости от того, какое значение принимает переменная j— отрицательное или нулевое. При этом j < 0 тогда и только тогда, когда Р = 0, поскольку отрицательное значение может появиться только из элемента FIRST для пустого списка. Таким образом, если список был пуст, то Р = 0 и следует установить FIRST [hn+i] := п+1 (новая запись будет помещена в позицию п+1). В противном Сейчас самое время размяться упражнением 6. Р по-прежнему обозначает количество испытаний.
8.5 Хеширование 511 случае Р > 0 и значение записи NEXT должно быть установлено равным п + 1. Выполнение алгоритма в этих двух случаях может отнять различное время; поэтому общее время работы для неудачного поиска можно записать в виде Т = а+|ЗР + 6[Р = 0], (8.108) где ос, (3 и 5— некоторые константы, зависящие от компьютера и от того, каким образом алгоритм хеширования закодирован в машинных командах компьютера. Было бы неплохо найти математическое ожидание и дисперсию случайной величины Т, поскольку данная информация более важна для практики, чем математическое ожидание и дисперсия Р. До сих пор мы использовали производящие функции случайных величин только для тех случайных величин, которые принимают неотрицательные целые значения. Оказывается, однако, что с выражением Gx(z) = Y_ Pr( cu)zx(cu) сибО для произвольной случайной величины X, принимающей действительные значения, можно работать ничуть не хуже, потому что все существенные характеристики X зависят только от поведения Gx вблизи z = 1, где все степени z вполне определены. Например, время работы неудачного поиска (8.ю8) является случайной величиной, определенной на пространстве вероятности из равновероятных последовательностей хеш-кодов (hi,..., hn> Кп+1) с 1 ^ hj ^ га; можно считать, что ряд Gt(z) 1 ML ML ML 1 *~~ *~~ *~" ra+|3P(h,,...,hn+, )+5[P(h, ,...,hn+i )=0] Hi =1 Hn = 1 hn + i =1 представляет собой производящую функцию случайной величины даже в тех случаях, когда сх, (3 и 6— не целые. (Фактически параметры а, (3, 6— физические величины, имеющие размерность времени; это не просто числа! Тем не менее их можно использовать в показателе степени z.) Можно по-прежнему вычислять математическое ожидание и дисперсию Т, находя G|(1) и Gj (1) и комбинируя эти значения обычным образом. Производящая функция для Р (а не Т) представляет собой ?(z) = (^^)n = Z*(r=V)S. р^О
512 Дискретная вероятность Таким образом, имеем GT(z) = ^Pr(P=p)za+(3p+6[p=0] = р^О = za((z6-1)Pr(P = 0) + ^Pr(P=p)zPp) = р^О Подсчет Mean(Gy) и Var(Gy) оказывается теперь рутинной операцией: п /т-]\п Mean(GT) = G^(1) = ot+|3—+6( ) ; (8.iog) га \ m / G^l) = а(а-1)+2а(3-+(3((3-1)-4-(32П(пТ1) + га га mz +2<хб(—) +6(8-1)(—) ; var(GT) = g;'(i)+g;(i)-g;(i)2 = га2 V га / га В главе 9 мы научимся оценивать подобные величины при больших га и п. Если, например, га = п и п —> со, то с помощью методов главы 9 можно показать, что математическое ожидание и дисперсия Т равны соответственно сх+ (3 -Ь бе-1 -f 0(п-1) и (32-2(36е-1 + 62(е"1 - е"2) + Ofa"1). Бели m = u/lnn + 0(1) и п —> со, то соответствующие величины составят Mean{GT) = (31nn+ а+ О ((log n)2/n) ; Var(GT) - (32lnn + 0((logn)2/n). Упражнения Разминка 1 Какова вероятность выпадения дубля при распределении вероятностей Ргси из (8.з), когда одна из игральных костей правильная, а у другой центр масс смещен? Какова вероятность выбросить сумму S = 7?
8 Упражнения 513 Почему приведено только десять чисел? Либо остальные студенты чистые теоретики, либо забросили монету подальше... 2 Какова вероятность того, что в перетасованной колоде карт верхняя и нижняя карты окажутся тузами? (Все 52! перестановки карт имеют вероятность 1/52!.) 3 В 1979 году студентов Станфорда, изучающих конкретную математику, попросили подбрасывать монету до тех пор, пока не выпадут два орла подряд, и сообщить, сколько бросаний потребовалось. В результате получилось 3,2,3,5, 10,2,6, 6,9,2. В 1987 году в Принстоне студентов попросили сделать то же самое, и они получили такие результаты: 10,2, 10, 7,5,2, 10,6, 10,2. Оцените математическое ожидание и дисперсию на основе данных (а) из Станфорда; (б) из Принстона. 4 Пусть H(z) = F(z)/G(z), где F(1) — G(1) = 1. Докажите, что аналогично (8.38) и (8.39) Mean(H) = Mean(F)-Mean(G), Var(H) = Var(F)-Var(G), если указанные производные существуют при z = 1. 5 Предположим, что Алиса и Билл играют в игру (8.78) фальшивой монетой, вероятность выпадения орла у которой равна р. Существует ли значение р, при котором игра станет справедливой? 6 К чему сведется закон дисперсии для условных распределений (8.юб), если X и Y представляют собой независимые случайные величины? Обязательные упражнения 7 Покажите, что если у обеих игральных костей смещен центр масс, причем распределение вероятностей у них одинаковое, то вероятность дубля будет всегда не меньше |. 8 Пусть Л и В — события, такие, что A U В = О. Докажите, что Рг(шеАПВ) = Pr(cuGA)Pr(cuGB)-Pr(cu^A)Pr(cu^B). 9 Докажите или опровергните: если X и Y— независимые случайные величины, то таковыми же являются и F(X) и G(Y), где F и G — любые функции.
514 Дискретная вероятность 10 Каково максимальное количество элементов, которые могут быть медианами случайной величины X в соответствии с определением (8.7)? 11 Постройте случайную величину, имеющую конечное математическое ожидание и бесконечную дисперсию. 12 а Пусть ?{z)— производящая функция случайной величины X. Докажите, что Рг(Х ^ г) ^ х_гР(х) для 0 < х ^ 1; Рг(Х ^ г) ^ х"гР(х) для х ^ 1. (Эти важные соотношения называются неравенствами хвоста.) б В частном случае ?{z) = (1 +г)п/2п воспользуйтесь первым неравенством хвоста для доказательства того, что Lk^n (k) ^ Vaan0 - а)(1-а)п при 0 < а < 1. 13 Докажите, что если Xi, ..., Хщ— независимые случайные величины с одинаковыми распределениями, а а— произвольное действительное число, то Рг Xi+--- + X2n а 2п ? Xi+--- + Xn а п 1 > - ^ 2 14 Пусть F(z) и G(z)— производящие функции случайных величин и пусть H(z) = PF(z) + qG(z), где р + q = 1. (Такая функция называется смесью функций F и G; соответствующая ей случайная величина получится, если подбросить монету и затем выбрать распределение F или G в зависимости от того, какой стороной упадет монета.) Выразите математическое ожидание и дисперсию Н через р, q и математическое ожидание и дисперсию F и G. 15 Бели F(z) и G(z) — производящие функции случайных величин, то можно определить новую производящую функцию случайной величины H{z) при помощи их "композиции": H(z) = F(G(z)). Выразите Меап(Н) и Var(H) через Mean(F), Var(F), Mean(G) и Var(G). (Уравнение (8.93) будет тогда частным случаем.)
8 Упражнения 515 Распределение рыб в единице объема океана. (Учел ли автор, что рыбы часто ходят косяками?... — Переводчик) 16 Найдите аналитическое выражение для суперпроизводящей функции YLn>o FnWw71, где Fn(z)— "футбольная" производящая функция, определенная в (8.53)- 17 Пусть Хп>р и Yn>p имеют соответственно биномиальное распределение и отрицательное биномиальное распределение с параметрами (тг,р). (Эти распределения определены в (8.57) и (8.6о).) Докажите, что Pr(Yn>p^m) = Рг(Х ттН-тцр 3*п). Какое тождество для биномиальных коэффициентов отсюда вытекает? 18 Говорят, что случайная величина X имеет распределение Пуассона с математическим ожиданием ц, если Pr(X = k) = е_м-|ак/к! для всех к ^ 0. а Какова производящая функция этой случайной величины? б Чему равны ее математическое ожидание, дисперсия и прочие кумулянты? 19 Продолжая предыдущее упражнение, допустим, что случайная величина Xi имеет распределение Пуассона с математическим ожиданием \Х], а случайная величина Xi независима от X] и имеет распределение Пуассона с математическим ожиданием \±2- а Чему равна вероятность того, что Xi + Х2 = тг? б Чему равны математическое ожидание, дисперсия и прочие кумулянты 2Xi + ЗХ2? 20 Докажите (8.74) и (8.75)— общие формулы для математического ожидания и дисперсии времени до появления заданной последовательности орлов и решек. 21 Что выражает значение N, если и 0, и Р в (8.77) равны j? 22 Докажите (8.ю6)— закон условного математического ожидания и дисперсии. Домашние задания 23 Пусть Ргоо — распределение вероятностей двух правильных игральных костей, а Ргц— распределение вероятностей двух игральных костей со смещенным центром масс, определенное в (8.2). Найдите все такие события А, что Ргоо(А) = Ргт 1 (А). Какие из этих событий зависят только от случайной величины S? (Пространство вероятностей c() = D2 имеет 236 событий; лишь 211 из них зависят только от S.) 24 Игрок } бросает 2п + 1 правильных игральных костей и убирает те из них, на которых выпало [П]. Затем игрок К называет число от 1 до 6, бросает оставшиеся игральные кости
516 Дискретная вероятность и убирает те, на которых выпало названное им число очков. Этот процесс повторяется до тех пор, пока в игре не останется ни одной игральной кости. Выигрывает игрок, убравший в совокупности большее число игральных костей (т.е. п + 1 или более). а Чему равно математическое ожидание и дисперсия общего числа игральных костей, убранных игроком J? Указание: игральные кости независимы. б С какой вероятностью выигрывает игрок J при п = 2? 25 Рассмотрим следующую азартную игру. Вы ставите определенную сумму А и бросаете правильную игральная кость. Если выпало к очков, то ваша ставка умножается на 2(к — 1 )/5. (В частности, ставка удваивается, если выпадет [П], но вы проигрываете все, если выпадет [•].) В любой момент вы можете остановиться и потребовать текущую сумму ставки. Чему равно среднее значение и дисперсия суммы ставки после п бросков? (Пренебрегите эффектами округления суммы до целого числа.) 26 Найдите математическое ожидание и дисперсию количества циклов длиной I в случайной перестановке п элементов. (Задача о победе футбольной команды, ответ к которой дан в (8.23), (8.24) и (8-53)> представляет собой частный случай i=i.) 27 Пусть Xi, Х2, ..., Хп— независимые значения случайной величины X. Уравнения (8.ig) и (8.2о) говорят нам, как оценить математическое ожидание и дисперсию X по результатам этих наблюдений. Приведите аналогичную формулу для оценки третьего кумулянта кз. (Ваша формула должна давать "несмещенную" оценку в том смысле, что ожидаемое значение оценки должно быть равно Кз.) 28 Какова средняя продолжительность игры в монету (8.78) а при условии, что выигрывает Алиса; б при условии, что выигрывает Билл? 29 Алиса, Билл и Компьютер бросают правильную монету до тех пор, пока не появится одна из последовательностей Л = 00Р0, В = 0Р00 или С = Р000. (Если в игре принимают участие только две из этих последовательностей, то, как мы знаем из (8.82), А, вероятно, выиграет у В, В, вероятно, выиграет у С и С, вероятно, выиграет у Л; но в данной игре участвуют все три последовательности одновременно.) Каковы шансы каждого игрока на выигрыш?
8 Упражнения 517 30 В тексте главы мы рассматривали три вида дисперсии, связанные с успешным поиском в хеш-таблице. На самом деле есть еще два вида: можно рассмотреть среднее (по к) дисперсий (по hi, ..., hn) количества испытаний P(hi,..., hn; k); и можно рассмотреть дисперсию (по к) средних (по hi, ..., hn). Вычислите эти величины. 31 В вершине А пятиугольника ABCDE находится яблоко, а на расстоянии двух ребер, в вершине С, находится червяк. Каждый день червяк переползает в одну из соседних вершин с равной вероятностью. Так, через один день червяк окажет- Червяк Шредин- ся в вершине В или вершине D с вероятностью оказаться в геРа- каждой из вершин, равной \. Через два дня червяк может вернуться в С, потому что он не запоминает предыдущего местоположения. Достигнув вершины А, он останавливается на обед. а Чему равно математическое ожидание и дисперсия количества дней, прошедших до обеда? б Пусть р — вероятность того, что это количество дней не менее 100. Что говорит о значении р неравенство Чебы- шева? в Что позволяет сказать о р неравенство хвоста (упр. 12)? 32 Алиса и Билл в армии, и их части дислоцируются в пяти штатах: Канзасе, Небраске, Миссури, Оклахоме и Колорадо. Изначально Алиса находится в Небраске, а Билл— в Оклахоме. Каждый месяц их переводят в соседний штат, причем любой из соседних штатов выбирается с равной вероятностью). (Вот диаграмма "соседства" штатов: Колорадо Небраска Канзас\Миссури Оклахома Нештатная штат- Начальные штаты обведены кружками.) Например, Али- ная ситуация. са через один месяц будет переведена с вероятностью 1 /3 в любой из штатов Колорадо, Канзас и Миссури. Найдите математическое ожидание и дисперсию количества месяцев, которое потребуется, чтобы Алиса и Билл встретились. (Возможно, вы захотите прибегнуть к помощи компьютера.) 33 Независимы ли случайные величины Xi и Х2 из (8.8д)?
518 Дискретная вероятность 34 Джина играет в гольф и на каждом ударе с вероятностью р = .05 имеет "супершот" и выигрывает один удар, с вероятностью q = .91 имеет обычный "шот" и с вероятностью г = .04— "субшот" который стоит ей одного удара в сравнении с расчетным числом. (Для не играющих в гольф: на каждом круге она делает 2, 1 или 0 шагов к цели с вероятностями соответственно р, q и г. В игре с m-ударной лункой ее результат есть минимальное п, такое, что она продвигается на га или более шагов за п кругов. Маленький результат лучше большого.) а Покажите, что Джина выигрывает игру с 4-ударной лункой чаще, чем проигрывает, когда она играет с игроком, делающим всегда обычные удары. (Другими словами, вероятность получения результата меньше 4 выше, чем вероятность получения результата больше 4.) б Покажите, что ее средний результат в игре с 4-ударной лункой больше 4. (Таким образом, в среднем она проигрывает "стабильному" игроку по общей сумме очков, хотя в среднем выигрывает в матче с зачетом по лункам.) Контрольные работы 35 Центр масс игральной кости смещен так, что получается следующее распределение вероятностей: Pr(H)=pi; РгЮ=Р2; •••; Рг(Ю1) = Ре- Пусть Sn обозначает сумму очков после п бросаний этой игральной кости. Найдите необходимые и достаточные условия, которым должно удовлетворять распределение вероятностей, чтобы две случайные величины, Sn mod 2 и Sn mod 3 , были независимы друг от друга при всех п. 36 На шести гранях некоторой игральной кости вместо обычных [•], ..., |ТТ] нанесены следующие метки: И ЕЗ 0 № Ю Ц. Для выполнения расчетов воспользуйтесь калькулятором. Покажите, что можно так расставить очки на шести гранях второй игральной кости, что сумма очков при бросании этих двух игральных костей будет иметь то же распределение вероятностей, что и при бросании пары обычных игральных костей. (Все 36 комбинаций граней равновероятны.)
8 Упражнения 519 Неужели эта вероятность не зависит и от экономического кризиса? — Переводчик 37 38 39 б Обобщая предыдущий пункт, найдите все способы расстановки очков на 6п гранях п игральных костей, такие, что распределение суммы очков будет совпадать с распределением суммы очков у п обычных игральных костей. (На каждой грани должно быть положительное целое число очков.) Пусть рп — вероятность того, что правильную монету придется бросить ровно п раз, прежде чем два раза подряд выпадет орел, и пусть qn = Цк>Т1Рк- Найдите аналитическое выражение рп и qn через числа Фибоначчи. Чему равна производящая функция случайной величины для количества бросаний правильной игральной кости, требуемых для выпадения всех шести граней? Рассмотрите общий случай правильной "игральной кости" с га гранями и найдите аналитическое выражение для количества бросаний, требуемых для появления I из m граней. Чему равна вероятность, что потребуется ровно п бросаний? Производящая функция Дирихле случайной величины имеет вид 40 41 42 PU) У" En n^l Таким образом, ?{0) — 1. Пусть X— случайная величина, для которой Рт[Х = п) = рп. Выразите Е(Х), V(X) и Е(1пХ) через P(z) и ее производные. Для биномиального распределения (8.57) vn-й кумулянт кт имеет вид nfm(p), где fm— полином степени га. (Например, fi (р) = р и fiiv) = V ~V2> потому что математическое ожидание и дисперсия равны пр и npq.) а Найдите аналитическое выражение для коэффициента прирк в fm(p). б Докажите, что fm(^) = (2m — 1)Bm/m + [m=1], где Bm— m-e число Бернулли. Пусть случайная величина Хп представляет собой количество бросаний правильной монеты до появления в совокупности п орлов. Покажите, что Е(Х~|.1) = (—1)п(1п2 + Н^п/2] — Нп). Используя методы главы 9, оцените это значение с абсолютной погрешностью 0(п_3). Некоторый человек испытывает трудности с устройством на работу. Если он является безработным утром любого дня, то с некоторой вероятностью рк, независимой от предыдущих событий, он нанимается на работу в течение дня; но если он
520 Дискретная вероятность имеет работу в начале дня, то с постоянной вероятностью pf он будет уволен к вечеру. Найдите среднее число вечеров, когда его ожидает работа на следующий день, в предположении, что первоначально он принят на работу и что этот процесс продолжается п дней. (Например, если п = 1, то искомый ответ— 1 — Pf.) 43 Найдите аналитический вид производящей функции случайной величины Gniz) = 2I]C>oPk>n^k} где pk>Ti есть вероятность того, что случайная перестановка п объектов имеет ровно к циклов. Чему равны математическое ожидание и стандартное отклонение количества циклов? 44 Спортивный клуб проводит среди своих членов турнир по теннису с выбыванием. В турнире участвуют 2П игроков. В первом круге игроки случайным образом разбиваются на пары, так что любое разбиение равновероятно, и играется 271-1 матчей. Победители переходят на следующий круг, где с помощью такого же процесса выявляется 2П_2 победителей. И так далее; на k-м круге играется 2n_k случайно выбираемых матчей между 2n_k+1 непобежденными игроками. На п-м круге определяется чемпион. Хотя устроители турнира этого и не знают, все игроки в действительности оказались упорядочены по силе игры, так что х-\ играет лучше всех, %2 второй по силе игры, ..., Х2^ играет хуже всех. Когда игрок Xj играет с игроком Xj< и j < к, то Xj побеждает с вероятностью рис вероятностью 1 — р побеждает х^, причем результат их игры не зависит от других игр. Мы считаем, что для всех j и к действует одна и та же вероятность р. Странные, однако, а С какой вероятностью игрок xi победит в турнире? игроки... б С какой вероятностью в n-м круге (финале) встретятся два лучших игрока— Xi и Х2? в С какой вероятностью в k-м от конца круге (2~^k_1 ^-финале) будут соревноваться 2к лучших игроков? (Предыдущие вопросы представляют собой частные случаи данного вопроса при к = 0 и к = 1.) г Пусть N(n) обозначает количество существенно различных результатов турнира; два турнира считаются по сути совпадающими, если в них все матчи играются между одними и теми же игроками с одними и теми же результатами. Докажите, что N(n) =2п\. д Какова вероятность того, что турнир выиграет Х2? е Докажите, что если \ < р < 1, то вероятность выигрыша турнира игроком Xj строго больше, чем игроком xj+1 (1 ^j<2^).
8 Упражнения 521 Настоящий херес производят в Испании в соответствии с многостадийной системой, именуемой "Солера" Для простоты будем считать, что у винодела имеется всего три бочки, А, В и С. Каждый год третья часть вина из бочки С бутилируется и заменяется вином из бочки В; затем бочка В доливается доверху вином из бочки А; и наконец, в бочку А доливается новое вино. Пусть A(z), B(z), C(z)— производящие функции случайных величин, в которых коэффициентом при zn служит доля вина n-летней выдержки в соответствующей бочке сразу же после переливаний. а Считаем, что описанные операции производятся с незапамятных времен, так что достигнуто установившееся состояние, и производящие функции случайных величин A(z), B(z) и C(z) одни и те же в начале каждого года. Найдите аналитические выражения для этих производящих функций случайных величин. б При тех же предположениях найдите математическое ожидание и стандартное отклонение возраста вина в каждой бочке. Каков средний возраст бутилируемого вина? Какая доля вина имеет выдержку 25 лет? в Теперь примите во внимание конечность времени. Пусть во все три бочки в начале нулевого года залили новое вино. Каким будет средний возраст вина, бутилируемого в начале года п? 46 Стефан Банах (Stefan Banach) имел обыкновение носить с собой две коробки спичек, в каждой из которых изначально находилось по п спичек. Когда ему нужен был огонь, он случайным образом с вероятностью \ независимо от предыдущего выбора выбирал одну из коробок. Взяв из нее спичку, он клал коробку обратно в карман (даже если она была пустой — именно так и поступают великие математики). Если выбранная коробка оказывалась пустой, Банах выбрасывал ее и доставал другую. а Однажды он обнаружил, что обе коробки пусты. Какова вероятность такого события? (При п = 1 это происходит в половине случаев, а при п = 2— с вероятностью 3/8.) Для ответа на заданный вопрос найдите аналитическое выражение для производящей функции случайной ВеЛИЧИНЫ P(W,Z) = Lm,nPm,nWmZn, ГДе pm,n — вероятность, начав с m спичек в одной коробке и п в другой, получить обе пустые коробки, когда первой выбирается пустая коробка. Затем найдите аналитическое выражение для Ръ,п- "Une rapide operation arithmetique montre que, grace a cette ingenieuse cascade, les xeres ont toujours au moins trois ans. Pousser plus loin le calcul de leur age donne le vertige" —Revue du vin de France (Nov 1984)
Дискретная вероятность б Обобщая ответ к части (а), найдите аналитическое выражение для вероятности того, что в момент выбрасывания первой пустой коробки в другой будет ровно к спичек. в Найдите выражение для среднего количества спичек в этой другой коробке в аналитическом виде. Несколько физиологов в сотрудничестве с несколькими физиками открыли недавно две разновидности микробов с очень странным способом размножения. Мужской микроб, дифаг, имеет на своей поверхности два рецептора; женский микроб, трифаг, имеет три рецептора: А также для количества спичек в пустой коробке. дифаг: /"~~Х (-1 трифаг: ?4-п п рецептор: ? При облучении культуры дифагов и трифагов "ф-частицами, каждая частица поглощается ровно в одном рецепторе одного из фагов (при этом все рецепторы равновероятны). Если частица попадает в рецептор дифага, то дифаг превращается в трифаг; если же частица попадает в рецептор трифага, то этот трифаг делится на два дифага. Так, если в начале эксперимента имеется один дифаг, то первая ф-частица вызовет его превращение в трифаг, вторая разделит его на два дифага, третья превратит одного из дифагов в трифаг. Четвертая "ф-частица попадет либо в дифаг, либо в трифаг, и в результате получится либо два трифага (с вероятностью |), либо три дифага (с вероятностью |). Найдите аналитическое выражение для среднего числа дифагов, если начать с одного дифага и облучить культуру п одиночными "ф-частицами. Пять человек стоят в вершинах пятиугольника и бросают друг другу летающие диски. Если этот пятиугольник— Пентагон, они перебрасываются ракетами. У них имеется два диска, первоначально расположенных в соседних вершинах, как показано на рисунке. В очередной отрезок времени каждый диск бросают либо влево, либо
8 Упражнения 523 вправо с одинаковой вероятностью. Этот процесс продолжается до тех пор, пока в одного человека не бросят два диска одновременно, и в этом случае игра заканчивается. (Все броски независимы от предыдущих.) а Найдите математическое ожидание и дисперсию количества пар бросков. б Найдите аналитическое выражение с использованием чисел Фибоначчи для вероятности того, что игра продлится более 100 шагов. 49 Аюк Снегоход проводит зимний отпуск в своей хижине в горах. На передней веранде хижины стоит га пар ботинок, а на задней— п пар. Каждый раз, отправляясь на прогулку, Люк бросает (правильную) монету и решает, идти ли ему с передней или с задней веранды. На выбранной веранде он обувается и выходит из дому. Возвращается он равновероятно к передней или задней веранде с вероятностью j независимо от того, с какой веранды началась прогулка. Так, после первой прогулки на передней веранде будет га + [—1,0, или+1] пар ботинок, а на задней— п — [—1,0, или+1] пар. Если все ботинки окажутся на одной веранде, а Люк соберется выйти с другой, то он пойдет босиком, обморозит ноги и на этом его отпуск заканчивается. Считая, что он продолжает свои прогулки до такого печального конца, обозначим через Рм (га, п) вероятность завершения ровно N прогулок без обморожения, если изначально на передней веранде было га пар, а на задней— п. Тогда, если числа m и п положительны, имеем PN(m,n) = lpN_i(m-1)n+1) + ^PN-i(m>u)+ + lpN_1(m+l,n-1), поскольку первая прогулка является передне-задней, передне-передней, задне-задней или задне-передней с вероятностью \ в каждом случае, и еще остается N — 1 прогулок. а Дополните рекуррентное соотношение для Рм(та,п) формулами для га = 0 или п = 0. Используя данное рекуррентное соотношение, найдите уравнения для производящих функций случайных величин 9m,nW = 21 PN(™>Tl)zN. б Продифференцируйте свои уравнения и положите в них z = 1, получив тем самым соотношения относительно
Дискретная вероятность величин д^ п(1). Решите полученные уравнения и найдите среднее количество прогулок до обморожения. в Покажите, что для gm,n имеется выражение в аналитическом виде, которое можно получить, заменяя z = 1/cos29: x'nwe) sin(2m+1)8 + sin(2n+1)8 sin(2m + 2n + 2)9 cos 9. Рассмотрим функцию H(z) = 1 + ^(z-3 + v/(l-z)(9-z)). Цель данного упражнения— доказать, что H{z)= Лк>0 Hkzk является производящей функцией случайной величины, и выяснить некоторые ее фундаментальные свойства. а Положим (1 — z)3/2(9 — z)1/2 = Hk>0ck^k- Докажите, что со = 3, ст = -14/3, с2 = 37/27 и c3+i = 3 2Lk (*) х (з+к)(1)к+3 (Л^ЛЯ всех ^ ^ ®- Указание' воспользуйтесь тождеством (9- \У2 3(1-z)1/2(l+fz/(1-z))1/2 и разложите последний множитель по степеням z/( 1 — z). б Используя решение п. (а) и упр. 5.81, покажите, что все коэффициенты функции H(z) положительны. в Докажите удивительное тождество 9-H(z) 1 - Щг) 9-z + 2. г Чему равны математическое ожидание и дисперсия Н? В государственной лотерее в Эльдорадо используется описанное в предыдущей задаче распределение выигрышей Н. Каждый лотерейный билет стоит 1 дублон, а выплата по этому билету составляет к дублонов с вероятностью Н^. Шансы на выигрыш по каждому билету никоим образом не зависят от выигрышей по другим билетам; иными словами, выигрыш или проигрыш по одному билету не оказывает влияния на вероятность выигрыша по любому другому билету, который вы, возможно, приобрели для участия в том же тираже. а Предположим, что вы начинаете игру, имея один дублон. Если вы выигрываете к дублонов, то покупаете к билетов следующего тиража. Затем весь выигрыш "... у меня сдали нервы, когда я убедился, что Федеральных Штатов Эльдорадо нет На Земле, я имею в виду'! — Р.Артур (R.Jay Arthur), "Марки страны Эльдорадо" (Добав. пер.)
8 Упражнения 525 во второй игре целиком вкладывается в третий тираж, и т.д. Если не выиграл ни один билет, игра вынужденно прекращается. Докажите, что производящая функция случайной величины вашей суммы после п кругов игры имеет вид 1- -+ V(9-2s)/(1-z)+2ti-1 ^(9-^/(1-^+211+1 Дубл 2 он. A, J, Q и К означают туза, валета, даму и короля соответственно. — Переводчик б Пусть gn— вероятность того, что вы впервые проигрываете все свои деньги на п-й игре, и пусть G(z) = giz + gzz2 Н . Докажите, что G(1) = 1. (Это означает, что рано или поздно вы все равно проиграете с вероятностью 1, хотя в процессе игры можете временно стать миллиардером.) Чему равны математическое ожидание и дисперсия G? в Сколько в среднем билетов вы купите, если продолжите играть до полного разорения? г Чему равно среднее количество игр до разорения, если вначале у вас был не один дублон, а два? Дополнительные задачи 52 Покажите, что определенные в тексте медиана и мода случайных величин соответствуют в некотором разумном смысле медиане и моде последовательностей, если пространство вероятностей конечно. 53 Докажите или опровергните: если X, Y и Z— случайные величины, обладающие тем свойством, что все три пары, (X, Y), (X, Z) и (Y, Z), независимы, то независимы X + Y и Z. 54 Уравнение (8.2о) доказывает, что среднее значение VX равно VX. Чему равна дисперсия VX? 55 В обычной колоде игральных карт 52 карты, по четыре карты каждого из возможных значений {А, 2, 3,4,5, 6,7, 8, 9,10, J, Q, К}. Пусть X и Y обозначают соответственно значения верхней и нижней карт в колоде. Рассмотрим следующий алгоритм тасования. 51 Перемешать колоду случайным образом, так, чтобы любая перестановка появлялась с вероятностью 1/52!. 52 Если X ф Y, подбросить несимметричную монету с вероятностью выпадения орла р, и вернуться к шагу S1, если выпал орел. В противном случае остановиться. Все бросания монеты и все перемешивания колоды предполагаются независимыми. При каком значении р после оста-
526 Дискретная вероятность новки описанной процедуры значения X и Y будут независимыми случайными величинами? 56 Обобщите задачу о дисках из упр. 48 на случай га-угольника. Чему в общем случае равны математическое ожидание и дисперсия количества бросаний без коллизий, если первоначально диски находятся в соседних вершинах? Покажите, что если m нечетное, то производящая функция случайной величины для числа бросаний может быть записана в виде произведения распределений для бросания монеты: (ш-1)/2 . 2 (2к-1)7Г 2 (2к-1)тг где рк = sin — , qk = cos — . Указание: попробуйте выполнить подстановку z = 1/cos2 0. 57 Докажите, что в игре Пенни последовательность Т1Т2... Ti_iTi всегда уступает последовательности Т2Т1Т2 .. .Ti_i, если I ^ 3, а монета правильная. 58 Существует ли последовательность А = т^ Т2 ... Ti_i Ti из I ^ 3 орлов и решек, такая, что и последовательность 0т-|Т2 ... Т]._1, и последовательность РТ1Т2 .. .Ti_i дают одинаковые результаты при сравнении с А в игре Пенни? 59 Существуют ли последовательности А и В из орлов и решек, такие, что А длиннее В, но А встречается ранее, чем В, более чем в половине случаев при бросании правильной монеты? 60 Пусть кип— фиксированные положительные целые числа и к < п. а Найдите аналитический вид производящей функции случайной величины -. ТП. TTL G(W,Z) = — V" ... У wP(Hb...,hnik)zP(Hb...,hn,n hi=1 Hn = 1 для совместного распределения количества проб, требуемых для поиска k-го и п-го элементов, вставленных в хеш-таблицу с m списками. б Хотя случайные величины P(hi ,..., Нп; к) и P(hi,..., Hn;n) зависимы, покажите, что в некотором смысле они независимы: Е(Р(Нь...,Нп;к)Р(Нь...,Нп;т1)) = = (EP(hb...,hn;k))(EP(hb...,Hn;n)).
8 Упражнения 527 61 Используя результат предыдущего упражнения, докажите (8.104). 62 Продолжая упр. 47, найдите дисперсию количества дифагов после облучения п "ф-частицами. Исследовательская проблема 63 Нормальное распределение представляет собой недискретное распределение вероятностей, характеризуемое тем свойством, что все его кумулянты равны нулю, за исключением математического ожидания и дисперсии. Имеется ли простой способ, позволяющий определить по заданной последовательности кумулянтов (кт, К2, кз,...), не проистекает ли она из дискретного распределения? (Все вероятности в дискретном распределении должны быть "атомарными'.')
9 Асимптотика ТОЧНЫЕ ОТВЕТЫ, если их удается найти,— это замечательно; они вызывают чувство глубокого удовлетворения и повышают самооценку. Но не относитесь к приближенным значениям свысока— они тоже могут пригодиться. Имея дело с некоторой суммой или рекуррентным соотношением, которое, как нам кажется, невозможно представить в аналитическом виде, мы наверняка предпочтем получить хотя бы приближенный ответ, чем остаться вовсе без информации о поведении функции или суммы. Да и в случае, когда у нас имеется аналитическое решение, наши знания могут оказаться неполными, поскольку не всегда ясно, как сравнить полученный ответ с другими формулами в аналитическом виде. Например, аналитического выражения для суммы похоже, не существует. Приятно, однако, узнать, что if3n\ Ьп ~ 21 1 при п —» со; мы говорим, что сумма "асимптотически стремится к" 2(?). Еще приятнее получить более детальную информацию наподобие Мп)Н+0Ш)> которая дает нам "относительную ошибку порядка 1/п2'.' Но даже этого недостаточно для того, чтобы сказать, как Sn соотносится с другими величинами. Что больше— Sn или число Фибоначчи F4n? Ответ: при п = 2 имеем S2 = 22 > ?g = 21, но в конечном (9-1)
530 Асимптотика счете ?4п больше, потому что F4r время как ф47\/5иф4 ^ 6.8541, вто s--l/s'«5K,-5S + °(i)) (9-2) Наша цель в данной главе— научиться понимать и получать подобные результаты без чрезмерных усилий. Слово асимптотика имеет греческое происхождение и означает "не сходящиеся вместе" Изучая конические сечения, древнегреческие математики рассматривали, в частности, гиперболы наподобие графика функции у = л/1 + х2, От того же греческого корня происходят такие слова, как "симптом" и "птомаин" для которого прямые у = х и у = —х являются асимптотами. При х —> со кривая бесконечно приближается к асимптотам, но никогда не соприкасается с ними. В наши дни термин "асимптотика" имеет более широкий смысл и означает любую приближенную величину, которая становится все более и более точной по мере приближения некоторого параметра к предельному значению. Для нас "асимптотика" означает "почти соприкасающиеся'.' Вывод некоторых асимптотических формул очень сложен и не укладывается в рамки данной книги. Мы удовольствуемся введением в эту тему, полагая, что на данном базисе можно будет построить более сложные методы. В особенности нас будут интересовать определения символов '~', 'О' и им подобных; мы также изучим основные способы преобразования асимптотических соотношений. 9.1 Иерархия Встречающиеся на практике функции от п имеют разные "асимптотические скорости роста"; одни из них стремятся к бесконечности быстрее других. Формализуем это понятие при помощи определения f(n) -< g(n) lim П—ЮО f(n) = 0. (9-3)
9.1 Иерархия 531 Это отношение транзитивно: если f(n) -< g(n) и g(n) -<: К(тг), то f(n) -< Н(п). Можно также записать g(n) >- f(n), если f(n) -< g(n). Эти обозначения были введены в 1871 году Полем Дюбуа- Раймоном (Paul du Bois-Reymond) [85]. Например, п ^ п2] неформально мы говорим, что п растет медленнее, чем п2. Фактически па -< пр <=^ а < (3, (9.4) для произвольных действительных чисел а и (3. Конечно, помимо степенных, имеется множество иных функций. Отношение -< можно использовать, чтобы упорядочить множество функций. Каждая функция будет "клевать" другую в соответствии с асимптотическим ростом. В этой цепочке могут встретиться, например, такие члены: 1 -< loglogn -< logn -< пе -< пс -< nlogn -< с71 -< пп -<: ссП . (Здесь е и с— произвольные константы, для которых выполняется условие 0 < е < 1 < с.) Все перечисленные выше функции, за исключением 1, стремятся к бесконечности при п —¦» со. Таким образом, пытаясь вставить в данную иерархию новую функцию, мы будем выяснять не то, стремится ли она к бесконечности, а насколько быстро она это делает. Занимаясь асимптотическим анализом, не следует мелочиться: работая со стремящейся к бесконечности переменной, следует думать по-большому. Например, из приведенной иерархии вытекает, что logn -< rt0,0001; может показаться, что это не так, если ограничиться крохотными числами вроде гугола п = 10100. В этом случае logn = 100, в то время как и0,0001 равно всего лишь 100,01 « 1.0233. Но если рассмотреть гуголплекс п = 101о10°, то logn - 10100 бледнеет в сравнении с и0-0001 = Ю10'6. Даже если е чрезвычайно мало (меньше, чем, скажем, 1/1010 ), значение logn будет гораздо меньше значения пе, если взять п достаточно большим. Действительно, если положить и = 1010 , где к достаточно велико, чтобы выполнялось условие е ^ 10~к, то мы получим logn = 102к, но пе ^ 1010 . Отношение (logп)/пе, таким образом, стремится к нулю при п —> со. Приведенная выше иерархия относится к функциям, стремящимся к бесконечности. Однако зачастую нас интересуют функции, стремящиеся к нулю, так что было бы неплохо иметь ана- Малорархию? логичную иерархию и для бесконечно малых функций. Построить ее легко, потому что если f (п) и д(п) никогда не обращаются Ловись, функция, большая и маленькая.
532 Асимптотика в нуль, то Пп) ч g(n) ^ ^ -< ?1у. (9-5) Так, например, все приведенные далее функции стремятся к нулю (за исключением 1): 1111111 1 —п -< < < —i < < < ; < 1—i < 1 • сс nn cn nl0sn nc ne logn log log n Давайте рассмотрим еще несколько функций и попробуем вставить их в иерархию. Число п[п) простых чисел, не превосходящих п, как известно, приближенно равно n/lnn. Поскольку 1/пе -< 1/1пп -< 1, умножение на п дает н1-е -< я(п) -< п. Соотношение (9.4) можно обобщить, если заметить, например, na,(logn)a2(loglogn)a3 -< и'31 (logn)132(bglogn)133 (аьа2,аз) < (Ръ Р2, Рз) • (9-6) Здесь Ч^ъ <*2> а-з) < (Ръ Р2> Рз)' означает лексикографический порядок (порядок слов в словаре); другими словами, это неравенство означает, что либо ai < Pi, либо ос-\ = Pi и <xz < Р2, либо ост = Pi и осг = Р2 и аз < Рз- А что можно сказать о функции ev logn? Где ее место в иерархии? Ответить на подобные вопросы можно с помощью правила е f(n) ^ ед(п) ^ Ит (f(n)_g(n)) = -со, (9.7) которое в два шага следует из определения (9.3) путем логарифмирования. Следовательно, 1 -< f(n) -< g(n) => e|f(n)l -< e^(n)l. А поскольку 1 -< log logn -< ^/logn -< elogn, получаем logn -< Если две функции, f (п) и д(п), имеют одинаковую скорость роста, мы записываем {f(n) ж д(н)'. "Официальное" определение в данном случае таково: f(n) ж g(n) <^> |f(n)| sj С|д(п)| и |д(п)| ^ C|f(n)| для некоторого С и всех достаточно больших п. (д.8)
9.1 Иерархия 533 Это имеет место, например, если f(n) — cosn-f- arctgn, a д(п)— ненулевая константа. Вскоре мы докажем справедливость данного соотношения для случая, когда f(n) и д(п) представляют собой полиномы одинаковых степеней. Имеется и более сильное соотношение, определяемое правилом f(n) - g(n) Ф=^ lim ^ = 1 . (9.9) п-+оо g(n) В этом случае мы говорим, что "f (п) есть асимптотика для д(тг)\' Г.Г.Харди (G.H.Hardy) [179] ввел интересную и важную концепцию, называемую классом логарифмически-экспоненциальных функций, рекурсивно определяемым как наименьшее семейство ? функций, удовлетворяющих следующим свойствам. • Постоянная функция f (тг) = ос принадлежит ? для всех действительных ос. • Тождественная функция f (тг) = тг принадлежит ?. • Если f(u) и д(тг) принадлежат ?, то f(n) — д(тг) также принадлежит ?. • Если f(n) принадлежит ?, то ? принадлежит и ef^n^. • Если f (тг) принадлежит ? и является "существенно положительной" то lnf(n) принадлежит ?. Функция f (тг) называется существенно положительной, если существует такое число tlq, что f(n) > 0 при тг ^ по. Эти правила можно использовать, например, для того, чтобы показать, что f(n) + g(n) принадлежит ?, если ? принадлежат f(n) и д(п), потому что f(n) + д(тг) = f(n) — (0 — д(тг)). Если f(n) и д(тг)— существенно положительные члены ?, то их произведение f(n)g(n) = elnf(n)+ll^(rL) и частное f(n)/g(n) = einf(n)-ing(n) также принадлежат ?; то же справедливо и для функций наподобие \Д(тг) = е* lnf(n) и т.п. Харди доказал, что всякая логарифмически-экспоненциальная функция является существенно положительной, существенно отрицательной или равной нулю. Следовательно, произведение и частное любых двух ?-функций принадлежат ?, за исключением случая деления на тождественно нулевую функцию. Основная теорема Харди о логарифмически-экспоненциальных функциях заключается в том, что эти функции образуют асимптотическую иерархию: если f (тг) и д(тг) — любые функции из ?, то либо f(n) -< д(тг), либо f(n) >- д(тг), либо f(n) ж д(тг). В последнем случае существует константа а, такая, что f(n) - ад(тг).
534 Асимптотика Доказательство теоремы Харди выходит за рамки данной книги; но полезно знать о существовании этой теоремы, потому что почти все функции, с которыми нам придется встречаться, принадлежат ?. На практике в большинстве случаев можно без особого труда вставить заданную функцию в иерархию. 9.2 О-обозначения В 1894 году Пауль Бахман (Paul Bachmann) придумал замечательное обозначение для асимптотического анализа. В последующие годы его популярности немало поспособствовали Эдмунд Ландау (Edmund Landau) и др. Мы встречали его в формулах наподобие Нг lnn + Y + 0(1/n) (9-ю) которая говорит нам, что n-е гармоническое число равно натуральному логарифму п плюс константа Эйлера, плюс некоторая величина, которая составляет "О большое от одной n-й" Эта последняя величина точно не определена, однако какой бы она ни была, обозначение позволяет утверждать, что она не превосходит некоторую константу, умноженную на 1 /п. Красота 0-обозначений в том, что они скрывают несущественные детали и позволяют сконцентрироваться на главных особенностях поведения: величину 0(1/п) можно считать пренебрежимо малой, если только нас не интересуют величины, отличающиеся от 1 /п постоянным множителем. Более того, символ 'О' удобно использовать внутри формул. Если мы хотим выразить соотношение (д.ю) с применением обозначений из раздела 9.1, то нам надо перенести Inn + у в левую часть и указать более слабый результат, например Hn —Inn —у -<: log log n n или более строгий результат Нп — In п — у х — . п При помощи О можно указывать необходимое количество деталей на месте, без перестановки членов. Идея неточно определенных величин может стать более понятной, если мы рассмотрим некоторые другие примеры. Иногда мы пишем '±1' для обозначения чего-то, что есть либо +1, либо —1; мы не знаем (или нам не важно), чему именно равна эта величина; тем не менее мы можем работать с ней в формулах. "... wenn wir durch das Zeichen 0(n) eine Grosse ausdriicken, deren Ordnung in Bezug auf u die Ordnung von n nicht uberschreitet; ob sie wirklich Glieder von der Ordnung n in sich enthalt, bleibt bei dem bisherigen Schlussverfahren dahingestellt" —П.Вахман (P. Bachmann) [17]
9.2 О-обозначения 535 Оно не бессмысленно, а просто бесполезно. Н. Г. де Брейн (N. G. de Bruijn) начал свою книгу Асимптотические методы в анализе [74] с рассмотрения обозначения "большого L" которое помогает понять "большое О'.' Если записать L(5) для обозначения числа, абсолютное значение которого меньше 5 (не говоря, что именно это за число), можно выполнять определенные вычисления, не обладая полной информацией. Например, можно вывести формулы наподобие 1+L(5) = L(6);L(2) + L(3) - L(5); L(2)L(3) - L(6); eL(5) = L(e5) и т.д. Но нельзя заключить, например, что L(5)—L(3) = L(2), поскольку левая часть может оказаться 4 — 0. Фактически лучшее, что можно сказать в этом случае,— это L(5) — L(3) = L(8). Обозначение 'О' Бахмана похоже на L-обозначение, но оно еще менее точное: О (ос) означает число, абсолютное значение которого не превосходит некоторую константу, умноженную на |а|. Мы не говорим, что это за число и даже что это за константа. Разумеется, понятие "константы" бессмысленно, если нет чего-либо переменного; так что мы используем О-обозначение только в контексте, где имеется по крайней мере одна величина (скажем, п), значение которой меняется. Формула f(n) = 0(g(n)) для всех n (9-и) в этом контексте означает, что существует такая константа С, что |f(n)| ^ C|g(n)| для всех п; (9-12) а если обозначение 0(g(n)) использовано внутри формулы, то оно означает функцию f(n), удовлетворяющую условию (9.12). Значения f (п) неизвестны, но мы знаем, что они не слишком велики. Аналогично введенная выше величина L(n) представляет неопределенную функцию f(n), значения которой удовлетворяют неравенству |f(n)| < |п|. Основное отличие между L и О заключается в том, что О-обозначение включает неопределенную константу С; каждое вхождение О может подразумевать свое значение С, но все эти С не зависят от п. Например, мы знаем, что сумма первых п квадратов равна ?п = ln(n+l)(n+1) = \ъ 1п2 + Ь. Можно записать ?п О (IVs потому что |-j ln3 + ln2 + ln| ^ ^|n|3 + l|n|2 + l|n| $ 1|тг3| + 1|п3| + z|rr | = |rr| для всех целых п. Аналогично можно получить более
536 Асимптотика точную формулу ?п = 1п3 + 0(п2); можно также небрежно отбросить часть информации и сказать, что ? п = 0(п10). Ничто в определении О не требует от нас давать наилучшую возможную оценку. Но минутку! А что если переменная п не целочисленная? Что если у нас имеется формула наподобие S(x) = ^х3 4- \х2 + |х, где х— действительное число? Тогда мы не можем сказать, что S(x) = 0(х3), потому что отношение S(x)/x3 = \ + ^х-1 + \х~г становится неограниченным при х —> 0. Нельзя также сказать, что S(x) = О(х), потому что отношение S(x)/x = ^х2 + \х + ^ неограниченно растет при х —> со. Так что мы, судя по всему, не можем использовать 0-обозначения для оценки S(x). Эта дилемма разрешается путем наложения определенных условий на переменные, используемые с О. Например, если поставить условие |х| ^ 1 или х ^ е, где е— произвольная положительная константа, или что х— целое число, то можно записать S(x) = 0(х3). Если же наложить условие |х| ^ 1 или |х| ^ с, где с— произвольная положительная константа, то можно записать S(x) = О(х). Обозначение 'О' зависит от контекста, от ограничений, наложенных на используемые переменные. Эти ограничения часто задаются в виде предельных соотношений. Например, мы могли бы сказать, что f(n) = 0(g(n)) при п —> со. (9-13) Это означает, что условия, накладываемые обозначением 'О', предполагаются выполненными, когда п "близко" к со; нас не волнует, что происходит при не слишком больших п. Более того, мы даже не определяем, что значит "близко"; в такой ситуации каждое вхождение О подразумевает существование двух констант С и по, таких, что |f(n)| ^ C|g(n)| при n ^ по- (9-14) Значения С и по могут быть разными для разных О, но они не зависят от п. Аналогично запись f(x) = 0(g(x)) прих->0 Ты лучше всех! Я так тебя люблю! Я люблю, как единица на f, при f стремящемся к нулю. Сверху
9.2 О-обозначения 537 означает, что существуют две константы, Сие, такие, что |f(*)| ^ С|д(х)| при|х|^е. (9.15) Предельное значение не обязано быть равным со или 0; можно записать lnz = z-1 +0((z- I)2) приг^ 1, потому что можно доказать, что |lnz — z + 1| ^ \z — 1|2, если |z-1|^^. Мы постепенно, на протяжении нескольких страниц развили наше определение О, начав со вполне очевидных вещей, и получили в итоге нечто, представляющееся ужасно сложным; теперь у нас О представляет неопределенную функцию и одну или две неопределенные константы, зависящие от контекста. Все это может показаться слишком сложным для сколь-нибудь разумного обозначения, но это еще не все! Есть еще одна тонкость, пока что ускользнувшая от нас. А именно, следует осознавать, что запись \пъ + \п2 + \п = 0(п3) "And to auoide the tediouse repetition of these woordes: is equalle to: I will sette as I doe often in woorke use, a pake of paralleles, or Gemowe lines of one lengthe, thus: ===== , bicause noe .2. thynges, can be moare equalle" — P. Рекорде (R. Recorde) [305] вполне корректна, но в этом равенстве нельзя менять местами левую и правую части. В противном случае можно прийти к нелепым выводам наподобие п = п2, исходя из верных тождеств п = 0(п2) и п2 = 0(п2). При работе с О-обозначением и любыми другими формулами с не полностью определенными величинами мы имеем дело с односторонними равенствами. Правая часть уравнения содержит не больше информации, чем левая, и фактически может содержать меньше информации; правая часть представляет собой "огрубление" левой. Со строго формальной точки зрения запись '0(д(п))' означает не единственную функцию f(n), а мноэюество всех функций f(n), таких, что |f(n)| ^ C|g(n)| для некоторой константы С. Обычная формула g(n), не включающая символа 'О', обозначает множество, состоящее из одной функции f(n) = g(n). Если S и Т представляют собой множества функций от п, то запись 'S + T' обозначает множество всех функций вида f (n) + g(n), где f (n) Е S и g(n) Е Т; другие обозначения наподобие S — Т, ST, S/T, >/S, es, InS определяются аналогично. Тогда "равенство" между двумя такими множествами функций есть, строго говоря, теоретико-множественное включение] знак =} на самом деле означает 'С'. Эти формальные определения подводят под все наши манипуляции с О твердый логический фундамент.
538 Асимптотика Например, "уравнение" Ofn3) ^n3 + 0(n2 означает, что Si С S2, где S-\ представляет собой множество всех функций вида ^п3 + fi (п), для которых найдется константа Ci, такая, что |f 1 (n) | ^ С] |п2|, и где Sz есть множество всех функций f2(n), для которых найдется константа С2, такая, что ^2(тг)| ^ С2|тг3|. Можно строго доказать это "равенство" взяв произвольный элемент из левой части и показав, что он принадлежит правой части: пусть |n3 + f 1 (п) таково, что |fi(n)| ^ Ci|n2|; мы должны доказать, что существует такая константа С2, что |^тг3 + fi(n)| ^ С2|тг3|. Константа С 2 = \ + Ci решает проблему, поскольку тг2 ^ |п3| для всех целых п. Если с=* на самом деле означает 'С', то почему мы не используем 1С' вместо некорректного знака равенства? Тому есть четыре причины. Во-первых, традиция. Начали использовать символ 'О' со знаком равенства теоретики-числовики, и эта практика получила распространение. Мы давно убедились, что пытаться изменить привычки математического сообщества— безнадежное занятие. Во-вторых, традиция. Программисты привыкли к неверному применению знака равенства — многие годы при программировании на FORTRAN и BASIC программисты записывали присваивания вида 'N = N + Т. Одной некорректной трактовкой больше, одной меньше— какая разница! В-третьих, традиция. Мы часто читаем с=* как слово 'есть'. Например, формулу Нп = O(logn) можно произнести как "Нп есть О большое от logn" Но слово 'есть' несимметричное. Мы говорим, что птица есть животное, но не можем сказать, что животное есть птица; понятие "животное" есть огрубление понятия "птица". В-четвертых, для наших целей такое обозначение весьма естественно. Если ограничиться только ситуациями, в которых символ 'О' полностью занимает правую часть формулы— как в аппроксимации гармонических чисел Нп = О (logn) или в описании времени работы алгоритма сортировки Т(п) = О(пlogn),— то не важно, какой знак используется, *=' или какой-то иной. Однако если использовать О внутри выражений, как часто делается в асимптотическом анализе, то нашей интуиции отвечает трактовка знака 1— как равенства, а величины наподобие 0(1/п) — как чего-то очень маленького. Поэтому мы и дальше будем использовать '=' и считать, что 0(д(п)) обозначает не полностью определенную функцию, имея "Очевидно, что знак « = » не подходит для таких отношений, поскольку он подразумевает симметрию, которой на самом деле нет. [...] Однако после такого предупреждения использование знака « = » не принесет большого вреда, и мы будем использовать его просто потому, что так принято" — Н.Г.деВрейн (N.G.deBruijn)[74]
9.2 О-обозначения 539 в виду, что в случае необходимости мы всегда сможем вернуться к теоретико-множественным определениям. Всесторонне рассматривая определение, мы обязаны отметить еще одну техническую деталь. Если в формуле используется несколько переменных, то символ О представляет множество функций от двух или более переменных, а не только от одной. В область определения каждой функции входят все переменные, которые в данном контексте "свободны" для изменений. Здесь есть определенная тонкость ввиду того, что переменные могут иметь смысл только в части выражения, если они связаны знаком 21 или чем-то подобным. Например, посмотрим внимательно на соотношение ^(k2 + 0(k)) = ^n3 + 0(n2), целое n^O. (9.16) k=0 Выражение k2+0(k) в левой части отвечает множеству всех функций от двух переменных вида k2 + f (к, п), для которых найдется константа С, такая, что |f(k,Ti)| ^ Ск для 0 ^ к ^ п. Сумма таких множеств функций для 0 ^ k ^ п есть множество всех функций д(п) вида п ^T(k2+f(lc,n)) = ln3+ln2+ln+f(0)n)+f(l)n)+---+f(n>n)) k=0 где f обладает указанным свойством. Поскольку \\п2 + ln + f(0,n) + f(l,n) + • ¦ • + f(n,n)| ^ ^ in2 + ^u2-bC-0 + C-1 +... + С-П < < п2 + С(п2+п)/2 < (С + 1)п2, Самое время заняться разминоч- ными упражнениями 3 и 4. все такие функции g(n) принадлежат правой части (g.i6); следовательно, (g.i6) справедливо. Иногда О-обозначения понимают неправильно, считая, что символ (0' указывает точный порядок роста, и используют его так, как будто наряду с верхней границей он указывает и нижнюю. Так, можно услышать, что некоторый алгоритм сортировки п чисел неэффективен, "потому что время его работы — 0(п2)" Но время работы 0(п2) не означает, что это время не есть одновременно О(тг). Для указания нижней границы имеется другое обозначение— "большая «омега»": f(n) = Q(g(n)) |f(n)| ? C|g(n)| для некоторого С > 0. (9-17)
540 Асимптотика Мы имеем f(n) = П(д(п)) тогда и только тогда, когда g(n) = 0(f(n)). При достаточно больших тг алгоритм сортировки со временем работы П(п2) неэффективен по сравнению с алгоритмом, время работы которого составляет O(nlogn). Наконец, символ "большая «тета»" указывает точный порядок роста: f(n) = 9(д(п)) *=»¦ Цп) = 0(д(п)) f(n) = П(д(п)) (9-18) Соотношение f(n) = в(д(п)) справедливо тогда и только тогда, когда f(n) ж д(п) в обозначениях, введенных в (д.8). Эдмунд Ландау (Edmund Landau) [238] изобрел символ о малое, f(n) = о(д(п)) |f(n)| ^ е|д(п) для всех п^по(е) и для всех констант е > 0. (9-19) Это есть, по сути, отношение f(n) -< д(п) из (э-з)- Кроме того, f(n) - д(п) «=> f(n) = д(п) + о(д(п)). (д.2о) Многие авторы используют в асимптотических формулах 'о', однако всегда предпочтительнее более явное выражение с 'О'. Например, среднее время работы алгоритма "пузырьковой сортировки" зависит от асимптотического значения суммы ?{п) = XikUo кп-кк!/п!. Элементарных асимптотических методов достаточно, чтобы доказать формулу Р{п) ~ ^пп/2, которая означает, что Р(п)/у/7пг/2 стремится к 1 при п —> оо. Однако для того, чтобы лучше понять поведение Р(тг), следует рассмотреть не отношение, а разность Р(тг) — у/тпг/7: тг 1 10 20 30 40 50 P(u)/vW2 0.798 0.878 0.904 0.918 0.927 0.934 P(n) - v^V2 -0.253 -0.484 -0.538 -0.561 -0.575 -0.585 Числовые значения в среднем столбце не очень убедительны и едва ли могут считаться аргументом в пользу быстрой сходимости Р(п)Д/7пг/2 к 1, если таковая сходимость вообще имеет место. Поскольку О. и 6 — заглавные греческие буквы, О на самом деле должно быть заглавной греческой буквой "омикрон"— в конце концов, именно греки придумали асимптотику.
9.2 О-обозначения 541 Но правый столбец показывает, что значение Р{п) действительно весьма близко к л/тхп/2. Таким образом, мы гораздо лучше охарактеризуем поведение Р(п), если сможем вывести формулы наподобие ?(п) = vW2 + 0(1) или даже более точную оценку вида Р(п) - VW2-| + 0(1Д/п"). Для доказательства результатов с О требуются более сильные методы асимптотического анализа, но затраченные на их изучение усилия сторицей окупаются лучшим пониманием асимптотики, которое дают О-оценки. Более того, время работы многих алгоритмов сортировки имеет вид T(n) = Anlgu + Bn + O(logn) для некоторых констант А и В. Бели анализ останавливается на T(n) ~ Anlgn, то мы получаем только ограниченную информацию; выбор алгоритма сортировки только на основе значения А— плохая стратегия. Хорошее 'А' в алгоритмах часто достигается ценой ухудшения 'В'. Поскольку nlgn растет только немного быстрее п, асимптотически более быстрый алгоритм (с несколько меньшим значением А) может оказаться быстрее только для таких значений п, которые никогда не будут достигнуты на практике. Таким образом, для правильного выбора необходим асимптотический метод, позволяющий пойти дальше первого члена и оценить В. Перед тем как продолжить изучение обозначения 'О', поговорим об одном небольшом аспекте математического стиля. В этой главе для обозначения логарифма используются три разные записи: lg, In и log. Мы часто используем lg в связи с вычислительными методами, в которых наиболее подходящим оказывается именно двоичный логарифм. В чистой математике чаще используется In, поскольку формулы с натуральным логарифмом проще и изящнее. Но что такое log? Неужели это "обычный" логарифм по основанию 10, с которым вы сталкивались в старших классах— тот самый "обычный" логарифм, который так необычен для математики и информатики? Да, это он; вместе с тем многие математики вносят путаницу в этот вопрос, используя log для обозначения натурального или двоичного логарифма. Здесь
542 Асимптотика нет единого соглашения, но можно вздохнуть с облегчением, если логарифм встречается внутри 0-обозначения, потому что для О мультипликативные константы несущественны. При п —> со между O(lgn), О (Inn) и O(logn) нет никакой разницы, как нет никакой разницы и между O(lglgn), О (In Inn) и О (log log п). Мы можем выбрать тот вариант, который нам больше нравится; log кажется наиболее подходящим, потому что его легче произносить. Таким образом, мы, как правило, будем использовать log во всех контекстах, где удобочитаемость не привносит неоднозначности. Заметьте, что log log log n неопределен при u? 10. 9.3 Работа с о Как и для любого математического формализма, в случае 0-обозначений имеются свои правила работы с ними, которые освобождают нас от необходимости прибегать всякий раз к громоздкому определению. Доказав единожды справедливость этих правил с применением определения, мы можем в дальнейшем подняться на более высокий уровень и забыть о проверке включения одного множества функций в другое. Нам даже не придется вычислять константы С, подразумеваемые каждым О, поскольку мы будем применять правила, гарантирующие существование таких констант. Например, можно раз и навсегда доказать, что nm = 0(nm') прит^т'; (9.21) 0(f(n)) + 0(g(n)) = 0(|f(n)| + |g(n)|) . (9.22) Тогда мы сможем сразу сказать, что \пъ + \п2 + \п = 0(п3) + 0(п3) + 0(п3) = 0(п3), без трудоемких вычислений из предыдущего раздела. Вот еще несколько правил, которые точно так же легко можно получить из определений: f(n) c-0(f(n)) 0(0(f(n))) 0(f(n))0(g(n)) 0(f(n)g(n)) 0(f(n)); 0(f(n)), 0(f(n)); 0(f(n)g(n)) f(n)0(g(n)) если c- константа; (9 (9 (9 (9 (9 23) 24) 25) 26) 27) В упр. 9 доказывается (9-22); доказательство остальных правил выполняется аналогично. Всегда можно заменять что-либо, имеющее вид одной из левых частей, тем, что записано справа, безотносительно к ограничениям, накладываемым на переменную п. Секрет, как стать занудой, заключается в том, чтобы говорить обо всем. — Вольтер (Voltaire)
9.3 Работа с О 543 Замечание. Формула 0(f(n)r не означает множество всех функций g(n)2, где g(n) принадлежит 0(f(n)); такие функции g(n)2 не могут принимать отрицательные значения, тогда как множество 0(f(n))2 включает отрицательные функции. В общем случае, если S — множество, то S2 обозначает множество всех произведений s^S2, где S] и S2 принадлежат S, а не множество всех квадратов s2, где s G S. Уравнения (9-27) и (9-23) позволяют доказать тождество 0(f(n)2) = 0(f(n))2. Это свойство позволяет иногда сэкономить скобки, поскольку теперь можно записать O(logn)2 вместо 0((logn)2). Оба эти варианта предпочтительнее записи О (log п), которая двусмысленна из-за того, что некоторые авторы используют О (log п) для обозначения О (log log n). Можно ли также записать О (log п) ~] вместо О ((log п) ~1) ? Нет! Это некорректно, так как множество функций 1/0(logn) не является ни подмножеством, ни надмножеством для 0(1 /logп). Правильно будет заменять 0((logn)_1) на O(logn)-1, но это выглядит нелепо. Поэтому "возведение О в степень" будем использовать только в тех случаях, когда показатель степени представляет собой положительное целое число. Степенные ряды дают нам одну из самых полезных операций. Если сумма S(z) = X^anzn сходится абсолютно для некоторого комплексного числа z = zo, то S{z) = 0(1) для всех \z\ ^ |zo|. Это очевидно, поскольку |S(z)| ^ ^\an\\z\n ^ ^|an||z0|n = С < оо. п^О п^О В частности, S(z) = 0(1) при z —> 0 и S(l/n) = 0(1) при п —> оо, при том только условии, что S(z) сходится хотя бы для одного ненулевого значения z. Этот принцип можно использовать для того, чтобы, отбрасывая хвост степенного ряда с любого удобного места, оценить этот хвост через О. Например, не только S(z) = 0(1),hoh S(z) = a0 + O(z), S(z) = a0 + aiz+O(z2), и т.д., потому что S(z) = 21 Qkzk + zm Y_ Qnzn-m, а последняя сумма, как и сама S[z), абсолютно сходится при z = zo и есть 0(1). В табл. 545 перечислены наиболее полезные
544 Асимптотика асимптотические формулы, половина из которых получена просто путем отбрасывания членов степенного ряда в соответствии с указанным правилом. Аналогично можно укорачивать ряды Дирихле, представляющие собой суммы вида 2Ik>i а^/^: если РЯА Дирихле сходится абсолютно для некоторого z = Zq , то можно отбросить его хвост, начав с любого члена, и получить аппроксимацию Y_ ak/kz + 0(m- 1^k<m справедливую для 9iz ^ *Rzo. В табл. 545 этот принцип иллюстрируется асимптотической формулой для чисел Бернулли Вп. С другой стороны, асимптотические формулы для Нп, п! и тс(п) в табл. 545 не являются начальными отрезками сходящихся рядов; если неограниченно продолжить эти формулы, то полученные ряды будут расходиться при всех п. Особенно легко просматривается это в случае тфг), поскольку, как мы уже видели в разделе 7.3, пример 5, степенной ряд Hk>o W(mrL)k всюду расходится. И тем не менее эти отрезки расходящихся рядов дают полезные аппроксимации. Говорят, что асимптотическая аппроксимация имеет абсолютную погрешность 0(д(п)), если она имеет вид f(n) + 0(9(п))> ГАе f(n) не включает О. Приближение вида f(n)(l + 0(g(n))) имеет относительную погрешность 0(д(п)), если f(n) не включает О. Например, аппроксимация Нп в табл. 545 имеет абсолютную погрешность 0(п-6); аппроксимация п! имеет относительную погрешность 0(п-4). (Правая часть (9.29) не такая, как требуется, f(тг)(1 + 0(п-4)), но при желании ее можно переписать как ^)"(, + ^ + 28Ь-5Ш^)('+°(П~4)); аналогичное преобразование рассматривается в упр. 12.) Абсолютная погрешность этой аппроксимации составляет 0(пп-3-5е-п). Абсолютная погрешность соотносится с числом верных десятичных цифр справа от десятичной точки, которые сохраняются после отбрасывания члена О; относительная погрешность связана с количеством верных "значащих цифр" Воспользовавшись сокращением степенных рядов, можно доказать общие правила ln(l+0(f(n))) = 0(f(n)), eO(f(n)) = 1+0(f(n)), если f(n) -<; 1; (9-36) ecлиf(n) = 0(1). (9.37) Напомним, что 9Я означает "действительная часть" Относительная погрешность удобна при вычислении обратных величин, так как 1/(1 + 0(е)) = 1+0(е).
9.3 Работа с О 545 Таблица 545. Асимптотические аппроксимации, справедливые при U^OOHZ^O нп = mn+Y+l.-TIL_+TIl7+o(J?) (9.28) п! = У2^(^)П(1+^+^-^з+0(^)) (9.29) Bn =2[n HeTHoeJt-l)-/2-1 -^-(l+2—+3-n+0(4—))(9.3о) [1пух , л п и 2! u 3!n _/ n \ , N 71 п = i + п 72+71 ТТ+п й+0 71 ^ (9-31) Inn (lnn)z (Inn)3 (Inn)4 V(logn)5/ z2 z3 z4 eZ = 1+Z+2!+ 3!+4!+°(z5) (9'32) ln(1+z) =z-y+y-^+0(z5) (9.33) -!- - 1+z+z2+z3+z4+0(z5) (9.34) I—z (1+z)« = i+az+ Z4 Iz4(, z4+0(z>) (9.35) (Здесь мы полагаем, что п —* со; аналогичные формулы справедливы для ln(l -Ь 0(f(x))) и e°(fW) при х —> 0.) Например, пусть 1п(1 + д(п))— некоторая функция, принадлежащая множеству, описываемому левой частью (д-З^)- Тогда найдутся такие константы С, по и с, что |g(n)| ^ C|f(n)| ^ с < 1 для всех п^ по. Отсюда следует, что бесконечная сумма 1п(1 + д(п)) = д(п) • (1 - 1д(п) + 1д(п)2 - • • •) сходится при всех n J> По и ряд в скобках ограничен константой 1 + \с -\- ^с1 + • • • • Это доказывает (9-3^); доказательство (д-37) аналогично. Скомбинировав (д-Зб) и (9-37)> получим полезную формулу 0+o<f(„,)P*» = ,+o(f(n)9w), ™^Lo(i". <s-38)
546 Асимптотика Задача 1: вновь о рулетке Давайте теперь попытаем счастья в некоторых асимптотических задачах. В главе 3 мы вывели уравнение (з-З-З) АЛЯ количества выигрышных позиций в некоторой игре: W - |_N/K| + 2K2 + fK-3, К= L^NJ. Мы обещали, что асимптотическое значение W будет получено в главе 9. Сейчас мы находимся именно в этой главе, так что самое время оценить W при N —> оо. Основная идея состоит в том, чтобы избавиться от скобок функции "пол" заменив К на N1/3 + 0(1). Далее можно записать К = N1/3(1 +0(N"1/3)); эта операция называется "вынесение за скобки главной части" (Мы часто будем пользоваться этим методом.) Теперь из (9.38) и (9.26) мы имеем К2 = N2/3(1+0(IST1/3))2 = = N2/3(1+0(N-1/3)) - N2/3 + 0(N1/3). Аналогично [N/KJ = N1"1/3(l+0(N~1/3))-1+0(1) - = N2/3(1 +0(NT1/3))+0(1) - N2/3 + 0(N1/3). Отсюда следует, что количество выигрышных позиций равно W - N2/3+0(N1/3)+l(N2/3+0(N1/3))+0(N1/3)+0(l) = = fN^+OtN1/3). (9.39) Обратите внимание, как члены с О поглощают друг друга, пока не остается только одно О. Это типичная ситуация и еще одна иллюстрация полезности применения О внутри формул. Задача 2: метаморфозы формулы Стирлинга Несомненно, самая знаменитая асимптотическая формула— приближение Стирлинга для п!. Мы докажем ее позже в этой главе; пока же попробуем лучше познакомиться с ее свойствами. Одна из версий приближения может быть записана в виде Торстен Силлке (Torsten Sillke) в 1996 году нашел, что W = (3/2)N2/3 + (5/2)N1/3-R, где 3 ^ R < 121/24 (причем последняя оценка— наилучшая возможная). п! у/1 ,тсп (?) 1+-+—^(~ 3 п ТТЛ 7+0 (П при п —> со, (94°)
9.3 Работа с О 547 для некоторых констант а и Ь. Поскольку это приближение справедливо при всех больших п, оно будет справедливо и при замене п на п — 1: , /п — 1 ч11--1 (п-1)! = у/2п{п-Ц(—^-} х x(l+^ + ^ + 0((n-1)-3)). (941) Мы, конечно, знаем, что (п— 1)! = п\/п\ следовательно, правая часть последней формулы должна приводиться к правой части (9.40), деленной на п. Давайте попробуем упростить (9-41)- Из первого сомножителя можно вынести главную часть: у/2п{п- 1) - ^/Ъ^{^ -гГ1)1/2 1 1 ^(]-ы-^ + 0{п~5])- Здесь использовано соотношение (д-Зб)- Аналогично имеем П-п 1)"1 = - + _ + 0(п 3) п-1 (п-1)2 0((п-1)"3) = O^-^l-n-1)"3) - 0(п"3). Единственная часть (9.41), преобразование которой требует некоторой изобретательности,— это множитель (п — 1 )п-1, который равен n^Vl-n"1)11"1 = nn-1(l-n-1)n(l+n-1+n-2+0(n-3)). (Мы выписываем члены до тех пор, пока не получим относительную погрешность 0(п_3). Дело в том, что относительная погрешность произведения равна сумме относительных погрешностей сомножителей и все члены 0(п-3) объединяются.) Чтобы раскрыть (1 — п-1 )п, сначала вычислим 1п(1 — п-1) и затем образуем экспоненту, enln^1_n ^: (l-n"1)11 - exp(nln(l-n-1)) = = ехр(-]-±п-]-1п-2+0{п-3)) =
548 Асимптотика = ехр(—1 )-ехр(—\п 1)-ехр(—\г\ 2)-ехр(0(п 3)) = = exp(-1)-(l-|n-4|n-2+0(n-3))x x(l-ln-2+0(n-4))-(1+0(n-3)) = = e-^l-ln-^^n^+Oln-3)). Здесь вместо ez мы использовали обозначение expz, поскольку это позволяет записывать сложный показатель степени в основной строке, а не в позиции верхнего индекса. Чтобы получить в конечном итоге относительную погрешность 0(п~3), нам приходится раскрывать 1п(1 — п-1) с абсолютной погрешностью 0(п-4), потому что этот логарифм умножается на п. Итак, правая часть (д-41) приведена к виду "л/2яп умножить на nri~]/eri умножить на произведение нескольких членов": (1 -V -|п-2 + 0(п"3))х х (1 +П"1 +п-2 + о(п-3)) xO-^n-'-^n^ + Otn-3)) х (1 -ban-1 -Ь(а + Ъ)п-2 + 0(п-3)) . Перемножение скобок и включение всех малых асимптотических членов в один 0(п-3) дает 1 + an"1 + (a + b - ±)п~2 + 0(n~3). Гм... Мы надеялись получить 1 +an_1 +bn~2 + 0(n-3), поскольку именно это требуется для соответствия правой части (94°) • Мы где-то ошиблись? Нет, все правильно; следовательно, a + b — Хотя это рассуждение не доказывает справедливость аппроксимации Стирлинга, кое-что все-таки доказано, а именно— то, что формула (д-4°) не может быть корректной, если а не равно У2. Если заменить 0(п~3) в (94°) на сп~3 + 0(п~4) и выполнить все вычисления с относительной погрешностью 0(п-4), то можно заключить, что b должно быть равно ^g, как и утверждается в табл. 545. (Это не самый простой путь найти а и Ь, но вполне работоспособный.) Задача 3: n-е простое число Уравнение (9-31) представляет собой асимптотическую формулу для niri), количества простых чисел, не превосходящих п. Заменяя п на р = Рп, n-е простое число, получим 7г(р) = п; следовательно, Ti = r^ + oL Р ,Л (942) lnp V(logp)2; vy4;
9.3 Работа с О 549 при п —> со. Попробуем "решить" это уравнение относительно р; тогда мы найдем приблизительную величину п-го простого числа. Первый шаг состоит в упрощении члена О. Поделив обе части на р/lnp, мы обнаружим, что ulnp/p —> 1; следовательно, р/lnp = О(п) и V(logp)2/ Vlogp/ Vlogn/ (Имеем (logp)-1 ^ (logn)-1, потому что р ^ п.) Второй шаг состоит в перестановке двух частей (942)> за исключением члена О. Эта процедура корректна ввиду общего правила + О(f(п)) Ф^ bn = an + О(f(n)). (9.43) (Любое из этих соотношений следует из другого, если умножить обе части на —1 и прибавить an + bn.) Следовательно, а значит, р - nlnp(1+0(1/logn)). (9.44) Это уравнение— "приближенное рекуррентное соотношение" для р = Рп, выражающее его через самого себя. Наша цель заключается в преобразовании его в "приближенный аналитический вид" и мы сможем это сделать, раскрыв рекуррентное соотношение асимптотически. Итак, попытаемся раскрыть (944)- Логарифмируя обе части, получаем lnp = lnn + lnlnp + 0(1/logn). (945) Это значение можно подставить вместо lnp в (944)) но хотелось бы, прежде чем выполнять подстановку, полностью избавиться от р в правой части. Где-то в ходе преобразований последнее р должно исчезнуть; но от него нельзя избавиться обычным для рекуррентных соотношений способом, потому что в (944) не определены начальные условия для малых р. Один из подходов к решению состоит в том, чтобы сначала доказать более слабый результат р = О (и2). В нем можно убедиться, если возвести в квадрат (944) и разделить на уп2, ? = ^(l+0(1/logn)),
550 Асимптотика поскольку правая часть стремится к нулю при п —> со. Прекрасно, теперь мы знаем, что р = 0(п2); следовательно, logp = O(logn) и log logp = О (log log n). Теперь из (9.45) можно получить lnp = lnn + O(loglogn); эта оценка позволяет заключить, что In lnp = In In n+О (log log n/ logn), и (9.45) теперь дает lnp = lnn + lnlnn + 0(loglogn/logn). Это выражение можно подставить в правую часть (9-44) и получить р = nlnn + nlnlnn + О(п). Это и есть приближенная величина n-го простого числа. Эту оценку можно улучшить, использовав вместо (д-42) более точное приближение п[п). Следующий член (д-З1) говорит нам, что п = 1^ + 0^ + о((ь|^); ^> действуя, как и ранее, получим рекуррентное соотношение А теперь, как и ранее, выбросьте \-i\-4i _i_nn л—^2\ / _ч эту исписанную V = nlnpO + dnp)"1) (l+OH/logn)2), (9.47) бумажку относительная погрешность которого— 0(1/logn)2 вместо щум свист 0(1/logn). Прологарифмировав и сохранив члены до нужной точности (но не чересчур много), получим lnp = lnn + lnlnp + 0(1/logn) = = lnn(l+^+0(1/logn)2); lnlnp=lnlnn+^ + o№^)\ Inn V logn / Наконец, подставив полученные результаты в (9-47) > находим ответ: In Inn mlnn ъ( n \ Pn = n Inn + n mlnn —n + n — hO . (9.48) Inn Vlogn/ Например, при n = 106 эта оценка дает 15 631 363.6 + 0(n/logn); на самом деле миллионное простое число— 15485 863. В упр. 21
9.3 Работа с О 551 Мысль о том, что экзамен завален, будем рассматривать как нулевую инстинктивную реакцию. — Переводчик показано, что можно получить еще более точное приближение к Рп, если начать с более точного приближения 7t(n), чем имеющееся в (946). Задача 4: сумма из старого выпускного экзамена Когда в Станфордском университете в 1970-1971 учебном году началось преподавание конкретной математики, студентам было предложено найти сумму 1 1 1 п2 + 1 + TV + ••• + rV+n (949) с абсолютной погрешностью 0(п-7). Представим, что мы получили такое задание на выпускном экзамене. Какова наша первая инстинктивная реакция? Нет, не паниковать. Первая реакция— думать по-большому. Если положить п равным, скажем, 10100 и посмотреть на сумму, то можно увидеть, что она состоит из п слагаемых, каждое из которых немного меньше 1/п2; следовательно, сумма будет немного меньше 1 /п. В общем случае обычно можно получить неплохую отправную точку для асимптотического анализа, если рассмотреть ситуацию в целом и получить оценку ответа "на глазок'.' Давайте попытаемся улучшить эту грубую оценку, выписав главные члены каждого слагаемого. Имеем к к2 к3 ^4 1 1 n2+k п2(1+к/п2) 1 / к к2 к3 ^/к4\\ так что вполне естественно попробовать просуммировать все эти оценки: 1 п2 + 1 1 п2 + 2 1 TV TV 22 23 24 n( \ тТ4 + ^6 " ^S + °{n^J TV + П TV П П2 П3 ' "4 1 (- I n4 n6 n8 ¦°(?) n n(n+1] TV 2n4 + ••¦ -1 Выглядит так, как будто мы приходим к результату Sn = п ^п-2 + 0(п-3), полученному из суммы первых двух столбцов, только вот вычисления что-то очень разрастаются.
552 Асимптотика Придерживаясь этого подхода, в конце концов мы получим искомый ответ; но мы не будем так поступать по двум причинам. Во-первых, в последнем столбце появятся члены порядка 0(п_б), когда n/2 ^ k <J п, так что погрешность вырастет до 0(п-5); этого слишком много, и нам надо добавить еще несколько столбцов (неужели экзаменатор может быть таким са- Может ли птица дистом?). Надо думать, есть способ решения и получше. Во-вто- летать. рых, такой способ получше и в самом деле есть, и он прямо у вас перед глазами. А именно, мы знаем выражение для SnB аналитическом виде: это просто Hn2+n — Нп2. И мы знаем хорошее приближение для гармонических чисел, которое и применим дважды: Нг 1 1^/1 п2+п Щп2+п]+у+2ЫЧ^-Ш^Т^+0Ь); Hn2=lnn4y+^-^+oQ. Теперь можно вынести большие члены и выполнить упрощения, как мы делали в процессе анализа приближения Стирлинга. Имеем ln(u2+n) = lnu2+ln(l+-) = lnn2+ т-г+т-т ; V n/ n In1 3n3 1 J 1_ J n2+n 1 12 3 (n2+n)2 После ряда успешных сокращений получим Sn = n-1 - In"2 + In-3 - In-4 + In"5 - ln-6- - In"3 + in"4 - In"5 + \n~6 + плюс члены вида 0(n-7). Немного арифметики— и мы свободны: Sn = n-'-\n-2-\n-4\n-*-^n-4±n-G+0{n-7). (9.50) Было бы здорово, если бы можно было проверить этот ответ численно, как в предыдущих главах, когда мы получали точные результаты. Асимптотические формулы проверять труднее— в О может скрываться произвольно большая константа, так что числовой тест не дает окончательный ответ. Но на практике у нас нет причин думать, что нам противостоит хитрый и изощренный противник, так что априори можно надеяться, что
9.3 Работа с О 553 неизвестная константа в О достаточно мала. Калькулятора достаточно, ЧТОбы быстро ВЫЧИСЛИТЬ S4 = Т7 + Т8"*"Т9+^ = 0.2170107; а наша асимптотическая оценка для п = 4 дает iO + ?(-I + ?(-S + i(? + 7(-^ + i-Tz))))) = 0-2170125. Если мы допустили ошибку, скажем, величиной -^ в члене с п_б, то разность у2 ioW Аолжна проявиться в пятой десятичной цифре; так что, скорее всего, полученная нами асимптотическая формула верна. Задача 5: бесконечная сумма Теперь рассмотрим еще одну асимптотическую задачу, сформулированную Соломоном Голомбом (Solomon Golomb) [152]: чему равно приближенное значение S- = ZkN^]2> (9-51) где Nn(k)— количество цифр, требуемых для записи числа к в системе счисления с основанием п? Начнем с попытки найти грубую оценку. Количество цифр Nn(k) приближенно равно lognk = logk/logn; так что слагаемые грубо равны (logn)2/k(logk)2. Суммирование по к дает « (logn)2 Х1к>2 VMl°gk)2, а эта сумма сходится к константе, так как ее можно сравнить с интегралом dx 1 x(lnx)2 lnx 1 Ь2 Таким образом, мы ожидаем, что величина Sn примерно равна С (logn)2 для некоторой константы С. Такой беглый анализ полезен для общей ориентации, но не для решения задачи— здесь нужна лучшая оценка. Одна из возможных идей заключается в точном выражении Nn(k): Nn(k) = |k>gnkj + 1. (9.52) Так, например, для записи к в системе счисления по основанию п требуются три цифры, если n2 <J к < п3, а это выполняется в точности тогда, когда |k>gnk] = 2. Таким образом, Nn(k) > logn к, следовательно, Sn = XLk>i VkNn(k)2 < 1+(logn)2?k>21/k(logk)2. Действуя так же, как в задаче 1, можно записать Nn(k) = lognk+ 0(1) и подставить это выражение в формулу для Sn. Слагаемое, записанное здесь как 0(1), всегда находится между
554 Асимптотика О и 1 и в среднем близко к \, так что, вероятно, оно ведет себя достаточно хорошо. Тем не менее это приближение недостаточно точное, чтобы сказать что-нибудь о Sn; оно дает нуль значащих цифр (т.е. большую относительную погрешность) при малых к, а именно эти слагаемые вносят основной вклад в сумму. Нужна другая идея. Ключ к решению (как и в задаче 4) — применить наше искусство преобразования выражений и, прежде чем переходить к асимптотическим оценкам, привести сумму к более удобному виду. Можно ввести новую переменную суммирования га = Nn(k): _ v [m = Nn(k)] _ ь- - 2_ km2 = L [nm_1 ^k<nm] km2 = / T(Hnm_-| — Hnm-l_-l) . L— mr Это выражение может показаться еще худшим, чем исходная сумма, но в действительности сделан шаг в правильном направлении, поскольку мы располагаем очень хорошим приближением для гармонических чисел. Но пока что придержим его при себе и попытаемся упростить еще кое-что. Не надо спешить к асимптотическим оценкам. Суммирование по частям позволяет сгруппировать члены с одинаковыми значениями Hnm_i, которые нам придется аппроксимировать: Sn - ^Y^_^--^—^ Например, Нп2_-| сначала умножается на 1/22, а затем— на —1/32. (Мы использовали тот факт, что Нпо_-| = Но = 0.) Теперь мы готовы подставить выражение для гармонических чисел. Наш опыт оценки (п — 1)! подсказывает, что проще будет аппроксимировать Hnk, а не Hnk_1, поскольку в случае (nk — 1) появится масса лишних членов. Так что мы пишем Hn._, = Hnt-^ = lnnk+y+^ + 0(^)-^ =
9.3 Работа с О 555 шии О. Теперь наша сумма сводится к Sn = g(kbn + Y-^ + 0(^))(^-^) = = (lnn)U+yL2-^L3(n) + 0(L3(n2)). (9.53) Осталось расписать четыре суммы: Ii, I2, ?з(п) и Ls{n2). Начнем с ?з, поскольку 1з(п2) входит в О; таким образом, сразу будет видно, какую погрешность мы получим. (Нет смысла выполнять остальные вычисления с высокой точностью, если Большим-боль- эти члены все равно будут поглощены О.) Эта сумма— просто степенной ряд z3W = I.(i?-(kTTF)x",t' и этот ряд сходится при х ^ 1, так что мы можем оборвать его в любом желаемом месте. Если оборвать 1з(п2) на члене к = 1, то получим Ls{n2) = 0(п-2); следовательно, (9.53) имеет абсолютную погрешность 0(п-2). (Для уменьшения этой абсолютной погрешности можно использовать более точное приближение для Нпк; но пока что точности 0(п-2) нам вполне достаточно.) Если оборвать 1з (п) на члене к = 2, можно получить 1з(п) = fn^+Otn"2); это как раз та точность, которая нам нужна. Совсем просто вычислить 2-2- Это телескопический ряд (1— \) + [\ — \) + [\ — jg)-\ =1. Наконец, L-\ дает нам главный член суммы Sn, коэффициент при Inn в (д.53): 1 1 \ HKi Это (1-}) + (§-f) + (f-^) + ..- =1 + 1 + 1 + ... = н?} = я2/6. (Не примени мы ранее суммирование по частям, мы бы непосредственно увидели, что Sn ~ XIic>i (1пп)/к2, потому что Hnk_1 — Hnk-i_i ~ Inn; так что суммирование по частям не помогает в оценке главного члена, хотя и упрощает кое-что другое.) Итак, мы оценили каждую из сумм в (9-53)> так что теперь можно объединить все части и получить ответ к задаче Голомба: Sn = ZLlnn + Y_i. + o(A-). (9.54)
556 Асимптотика Обратите внимание, что это выражение растет медленнее, чем наша исходная прикидочная оценка C(logn)2. Иногда дискретные суммы не отвечают непрерывной интуиции. Задача 6: Ф большое В конце главы 4 мы нашли, что количество дробей в последовательности Фарея Зп равно 1 + Ф(п), где Ф(п) - <р(1) + ф(2) + -.. + ср(п); и в (4-62) мы показали, что Ф(п) = 1 Y- ^№AJ L1 +n/kj. (9.55) Давайте попробуем оценить Ф(п) при больших п. (В первую очередь, именно суммы такого вида и привели Бахмана (Bachmann) к введению символа 'О'.) Размышления по-большому говорят нам о том, что Ф(п), вероятно, пропорционально п2. Действительно, если бы последний множитель был равен [п/КЬ а не [1 + n/kj, то мы имели бы верхнюю границу |Ф(п)| ^ \ Zjc>i LnAJ2 ^ \ 2Ik>i (ПА)2 = У2П > потому что функция Мёбиуса \i[k) принимает значение только —1,0 или +1. Слагаемое Ч + ' в последнем множителе добавляет X!k->i H-(k)[n/kJ; но для k > п это нуль, так что сумма по абсолютной величине не может быть больше, чем пНп = O(nlogn). Этот предварительный анализ показывает, что, вероятно, будет удобно записать »мЧ^Ч©НЧ?^(©Ч?)Ь k=1 х 7 к=1 х ' -i?*)©2+i:°(=) = к=1 к=1 к=1 Таким образом мы убрали функцию "пол"; теперь нам остается оценить сумму \ Ик=1 М-(к)п2/к2 с точностью O(nlogn); другими словами, мы хотим вычислить X!k=i мМ"1/к2 с точностью 0(п-1 logn). Но это уже легко; можно просто распространить сумму на все значения к до со, потому что вновь добавляемые
9.3 Работа с О 557 члены составляют f -о(ЕЙ-о(Е_! к>п к>п к(к-1 i) чк>п 7 Мы доказали в (7-8д), что X^k>i M-MAZ — VCM. Итак, XLk>i Н-МД2 — l/(XIk>i V^2) — ^M2) и мы получаем окончательный ответ: Как было показано Салтыковым в 1960 году [316], погрешность этой формулы не превосходит 0(n(logn)2/3x (loglogn)1+e). С другой стороны, она не столь мала, как o(n(loglogn)1/2), согласно Монтгомери [275]. Ф(п) = -уп2 + O(nlogn) 7Г^ (9-56) 9.4 Два асимптотических приема Теперь, приобретя некоторую легкость в обращении с О, попробуем взглянуть на сделанное, имея в виду более далекую перспективу. Тогда наш арсенал асимптотических методов пополнится новыми важными боевыми средствами, которые понадобятся нам для борьбы с более трудными задачами. Прием 1: раскрутка При оценке п-го простого числа Рп в задаче 3 раздела 9.3 мы решали асимптотическое рекуррентное соотношение вида Pn = nlnPn(l+0(1/logn)). Мы доказали, что Pn — nlnu + nlnnlnn + О(п), сначала использовав рекуррентное соотношение для получения более слабого результата 0(п2). Это частный случай общего метода, именуемого раскруткой (bootstrapping), при котором для нахождения асимптотического решения рекуррентного соотношения мы начинаем с грубой оценки и подставляем ее в рекуррентное соотношение; таким способом часто удается получать все лучшие и лучшие оценки, как бы, подобно барону Мюнхгаузену, "поднимая себя за волосы'.' Следующая задача очень хорошо иллюстрирует метод раскрутки: каково асимптотическое значение коэффициента дп = [zn] G(z) в производящей функции G(z) ехр (Ф (9-57) кЗ=1
558 Асимптотика при п —> со? Продифференцировав это выражение по z, мы найдем ОО fc_1 g'(z) = X.n9n^n_1 = (Lnr)G^; u=0 k^l приравнивание коэффициентов при zn-1 в обеих частях дает рекуррентное соотношение *9n = L ^ • (9-58) 0<ck<n Наша задача эквивалентна поиску асимптотической формулы для решения (9.58) с начальным условием до = 1 - Первые несколько значений п 9тх 0 1 1 1 2 3 4 3 19 36 4 107 288 5 641 2400 6 51103 259200 мало что дают для выявления закономерности, а целочисленная последовательность (n!2gn) в справочнике Слоана [330] отсутствует; так что об аналитическом виде gn, похоже, не стоит и мечтать, и лучшее, на что можно надеяться,— вывод асимптотики. Нашим первым шагом на пути решения задачи будет наблюдение, что 0 < gn ^ 1 для всех п ^> 0; это легко доказать по индукции. Итак, для начала имеем gn = 0(1). Это уравнение можно использовать в качестве отправной точки для раскрутки: подставив его в правую часть (9.58), получим п9п = У ^Щ: = HnO(1) = O(logn); тт к 0^k<n следовательно, / log п \ 9п = О^ J дляп> 1. Можно сделать еще один шаг раскрутки: 1 ^ 0((1+logk)/k) пдъ = - + > — п л ^—- п —к 0<к<п = 1, у O(logn) = п 2- lc(n-k)
9.4 Два асимптотических приема 559 -+ У_ г + - п *— \к п 0<k<n 1 \0(logn) -k) n - + -Hn_10(logn) = -O(logn) n n n что дает 9n = °(^/- <"•> Продолжится ли это до бесконечности? Может быть, мы получим дп = 0(п-1 logn)m для всех га? На самом деле не получим; мы уже достигли поворотного пункта. Попытка продолжить раскрутку приведет к сумме 2— k2(n-k) " ^- Ink2 + n2k + n2(n-k)J 0<k<n v J 0<k<n ^ ; 1 i_i(2) , 2 i_i П n ' П2 которая представляет собой 0(n_1); таким образом, мы не сможем получить для дп оценку, меньшую П(п-2). В действительности сейчас мы уже знаем о дп достаточно, чтобы применить наш старый прием выделения наибольшей части: п9п = У — + У дк( ; ) = 0^к<п 0^к<п = - Удк—У"дк + - У" —V- (9-б°) к^О к^п 0^к<п Первая сумма здесь— G(1) = ехр(у + ^ + ^Н ) = еп /6, потому что G (z) сходится для всех |z| ^ 1. Вторая сумма представляет собой хвост первой; можно получить верхнюю оценку, воспользовавшись (9.59): }-^ = °(2_ -^-) = °С—^—; • k3m кЗ=п Эта последняя оценка следует, например, из у- (log к)2 у у (lognm+1)2 v- (m+1)2(logn)2 *— к2 *- 2_ k(k-1) ^- п™ k>n т.^1 nm<k^nm + 1 m^l (В упр. 54 рассматривается более общий способ оценки остатков подобных рядов.)
560 Асимптотика Третья сумма в (g-бо) равна О 0<k<n (logn)2 k(n-k) О (logn] n что устанавливается при помощи уже знакомых нам аргументов. Таким образом, (д.бо) доказывает, что Ж/б 9п = nz + О (log n/n)3 (9.6i) Наконец, мы можем вновь подставить эту формулу в рекуррентное соотношение, выполнив еще один шаг раскрутки; в результате получим л/ + О (log п/п3 (9-62) (Упр. 23 "заглядывает внутрь" оставшегося О.) Прием 2: кручение хвостов Вывод (9.62) в чем-то похож на вывод асимптотического значения (9.56) для Ф(п): в обоих случаях мы начинали с конечной суммы, но к асимптотическому выражению подходили через рассмотрение бесконечной суммы. При этом нельзя было просто получить бесконечную сумму, добавив О к слагаемым; вместо этого приходилось действовать аккуратно и использовать один подход для малых к и другой— для к больших. Эти выводы были частными случаями важного трехшаго- вого асимптотического метода суммирования, который мы сейчас обсудим с большей общностью. Чтобы оценить значение ]Tk aic(n), можно применить следующий прием. 1 Сначала разбить весь диапазон суммирования на два непересекающихся диапазона, Dn и Тп. Сумма по Dn должна быть "доминантной" частью в том смысле, что она включает достаточно членов, чтобы верно представлять наиболее значащие цифры всей суммы при больших п. Суммирование по диапазону Тп должно представлять собой только "хвост" вносящий в общий итог незначительный вклад. 2 Найти асимптотическую оценку aic(n) = bk(n) + 0(ck(n))> справедливую при k е Dn. Не требуется, чтобы эта оценка имела место при k G Тп. Этот важный метод был впервые применен Лапласом (Laplace) [240].
9.4 Два асимптотических приема 561 3 Наконец, доказать, что все три приведенные ниже суммы малы: ?q(ti) = Y- а^м; 1ь(п) = YL b^n); kG~Tn kGTn Ic(n) = X |ck(n)|. (9.63) kEDn Если все три шага успешно завершаются, то в итоге получается хорошая оценка: Y_ aic(n) = X. bk(n) + 0(la(n))+0(lb(n))+0(lc(n)). kGDnUTn kGDnUTn И вот почему. Можно "обрубить" хвост у данной суммы, получив хорошую оценку в диапазоне Dn, там, где такая оценка действительно необходима: ^ ak(n) = ^Г (bk(n)+0(ck(n))) = ?_ bk(n) + 0(lc(n)). kGDn kGDn kGDn Хвост же можно заменить другим, даже весьма плохо аппроксимирующим первый, поскольку ни один из них не играет заметной Асимптотический роли: анализ— искусство знать, когда можно быть небрежным, а когда— предельно точным. Y_ ak{n) = Y_ (bk(n)-bk(n) + ak(n)) = kGTn kGTn = Y- b*M + °(LbW) + 0(ZQ(n)) . kGTn Например, вычисляя сумму в (д.бо), мы имели ak(n) = [0^k<n]gk/(n-k)) Ьк(тг) = gic/n, ск(тг) = kgk/n(n - к); диапазонами суммирования были Dn = {0,1,...,11-1}, Тп = {тг,п+1,...}; и мы нашли, что La{n) = 0, Ib(n) = 0((logn)2/n2), Ic(n) = О ((log n)3/n2). Это привело к (g.6i).
562 Асимптотика Аналогично, оценивая Ф(п) в (9.55)> мы имели ak(n) - ^i(k)Ln/kJLl+n/kJ , bk(n) = ц(к)п2/к2, ck(n) = n/k; Dn = {1,2,...,n}, Tn = {71+1,11+2,...}. Мы вывели (9.56), заметив, что La[n) = 0, 1ь("п) = О(п) и Lc[n) = Ofnlogn). Вот другой пример, где такое "кручение хвостов" оказывается эффективным. (В отличие от предыдущих примеров, этот пример иллюстрирует рассматриваемый прием в его максимальной общности, когда La[n) ф 0.) Мы ищем асимптотическое значение . _ у- ln(n + 2k) Ln _ 2- k! • Наибольший вклад в эту сумму вносят малые к, потому что в знаменателе имеется к!. В диапазоне малых к ln(n + 2k) = Inn+--^ + oy. (9.64) Можно доказать эту оценку для 0 ^ k < |_lgnj, поскольку члены, включенные в О, ограничены сходящимся рядом (В этом диапазоне 2k/n ^ 2^п^/п ^ ?.) Следовательно, можно применить описанный трехшаговый метод, положив aic(n) = ln(n + 2k)/k!, bk(n) = (lnn + 2k/n-4k/2n2)/k!, ck(n) = 8k/n3k!; Dn = {0,1,...,^п]-1}, Tn = UlgnJ,LlgnJ+1,...}. Все, что остается сделать,— это найти хорошие оценки для трех величин I в (9.63)) и мы узнаем, что Лк>0 ak(n) « 2Zk>o ^ic(ti). Погрешность в доминантной части суммы, 1с(п) = ][_ 8k/n3k!, k<EDr
9.4 Два асимптотических приема 563 очевидным образом ограничена суммой ?1к>о 8к/п3к! = е8/п3, так что ее можно записать как 0(п-3). Погрешность, вносимая новым хвостом, составляет < |lb(n)| = Y. Ь^ v- lnn + 2k + 4k < ? id < k^LlgnJ Inn + 2^^+4^^ v- 4k < — Iw k^O ten! 0(li^Ii) Поскольку |_lgn_|! растет быстрее, чем любая степень п, эта маленькая погрешность поглощается слагаемым Lc[n) = 0(п~3). Погрешность, вносимая хвостом исходного ряда ?a(n) = Y_ ак(тг) < ^ k^UgTiJ ic^ Lis txJ k + lnn k! еще меньше. Наконец, можно легко вычислить сумму Xlk>o ^k('rt) в аналитическом виде, и мы получаем желаемую асимптотическую формулу: v- ln(n + 2k) л е2 е4 2_—Ч"1— = е1птг+ Ч~2 + ^— к! тг 2п2 к$>0 °(hY (9-65) Из использованного метода совершенно ясно, что на самом деле 1 т-1 —'— = elnn + 2_(-^ - к^О к=1 кпк + 0Ы) (9'66) для любого фиксированного га > 0. (Это начальный отрезок ряда, расходящегося для всех фиксированных п при m —> со.) В нашем решении имеется только один недостаток: мы были слишком осторожны. Мы вывели (9.64) в предположении k < |_lg tiJ , но упр. 53 доказывает, что эта оценка в действительности справедлива для всех значений к. Если бы мы знали этот более сильный результат, нам бы не пришлось использовать трюк с двумя хвостами— мы могли бы сразу прийти к конечному результату! Однако позже мы еще встретимся с задачей, в которой замена хвостов оказывается единственным доступным методом.
564 Асимптотика 9.5 Формула суммирования Эйлера А теперь в качестве очередного трюка (который фактически является последним важным приемом, рассматривающимся в данной книге) мы обратимся к общему методу аппроксимации сумм, опубликованному Леонардом Эйлером [101] в 1732 году. (Идею метода иногда связывают с именем Колина Маклорена (Colin Maclaurin), профессора математики в Эдинбурге, независимо открывшего этот метод несколько позднее [263, с. 305].) Вот основная формула: ГЪ пг Y_ f(k)= I fWdx+^^f1""1^ a^k<b k! k=1 b +Rm> (9.67) где Rm = (-1Г+1 f M^ffnO(x)dX| ДелыеаО; J a m! целое m ^ I. Слева находится типичная сумма, оценка которой нам может понадобиться. Справа— другое выражение для той же суммы, включающее интегралы и производные. Если f (х) — достаточно "гладкая" функция, то она будет иметь m производных f '(х), ..., f(m)(x), и эта формула окажется тождеством. Выражение в правой части зачастую оказывается превосходной аппроксимацией суммы в левой части, в том смысле, что остаток Rm мал. Например, мы увидим, что приближение Стирлинга для п! является следствием формулы суммирования Эйлера; то же справедливо и для нашей асимптотической аппроксимации для гармонических чисел Нп. Числа Bic в (9.67) представляют собой числа Бернулли, с которыми мы уже встречались в главе 6; функция Вт({х}) в (9-68) представляет собой полином Бернулли из главы 7. Запись {х} означает дробную часть, х — [х\, как в главе 3. Формула суммирования Эйлера сводит все эти понятия вместе. Вспомним значения нескольких первых чисел Бернулли; всегда удобно иметь этот список недалеко от общей формулы Эйлера: Во = 1 , Bi = —j, &2 = -?) ®4 = —30 ) ^6 = 42 ) В8 = —30 ' В3 = В5 = В7 = В9 = Вц = ••• = 0. Якоб Бернулли (Jakob Bernoulli) открыл эти числа при изучении сумм степеней целых чисел, и формула Эйлера объясняет, почему: если положить f(x) = xm_1, то f(m)(x) = 0; следовательно,
9.5 Формула суммирования Эйлера 565 m = 0, и (9.67) сводится к у km-1 = L_ а^к<Ъ b m R а k=1 ' к=0 ч 7 Например, при га = 3 мы получаем наш любимый пример суммирования: lt* = 5lloJbon-'+liJBin'+r 0^k<n Хорошего поне- (Здесь мы в последний раз в этой книге вывели эту формулу.) множку. Перед тем как приступить к доказательству формулы Эйлера, рассмотрим соображения высшего порядка (принадлежащие Лагранжу (Lagrange) [234]) о том, почему такая формула должна иметь место. В главе 2 был определен разностный оператор А и объяснялось, что оператор ]Г— обратный к А, так же как / обратен оператору дифференцирования D. Можно выразить А через D при помощи формулы Тейлора: л f/W f"M 2 f(x+e) = f(x) + -^e + -^e2 + -.. . Подстановка e = 1 дает Af(x) = f(x+1)-f(x) = = f,(x)/1!+f,/(x)/2!+f,,,(x)/3!+... = = (D/1!+D2/2!+D3/3!+---)f(x) = (eD-1)f(x). (9.69) Здесь eD обозначает дифференциальный оператор 1 + D/1! + D2/2! + D3/3! + • • •. Поскольку A = eD — 1, обратным оператором должен быть 1 = 1/A 1/(eD — 1); а из табл. 425 мы знаем, что z/{ez — 1) = X!k>o Bk?k/k!— степенной ряд, включающий числа Бернулли. Таким образом, k^l Применив это операторное уравнение к f (х) и добавив пределы, получим (9-7l)
566 Асимптотика что в точности представляет собой формулу суммирования Эйлера (9.67) без остаточного члена. (Ни Эйлер, ни кто-либо иной на самом деле не рассматривал остаток до тех пор, пока С. Д. Пуассон (S. D. Poisson) [295] не опубликовал в 1823году важную работу о приближенном интегрировании. Остаточный член играет важную роль, поскольку бесконечная сумма JjBkAOf^-^M k^l часто оказывается расходящейся. Наш вывод (9.71) был чисто формальным, мы не касались вопросов сходимости.) Докажем теперь формулу (9-67), включающую остаточный член. Достаточно провести доказательство только для случая а = 0 и Ъ = 1, а именно— доказать, что f(0) Bv fMd*+LT7f(k-1)(x k=1 -(-1)т Bm(x) m! f(m)(x)dx, потому что затем можно заменить f (х) на f (х + I) для любого целого I, получив f(l) i-i+i fMdx+^^f^'M k=1 1+1 "(-1)Т ¦1+1 Bm({x}) m! f(m)(x)dx Общая формула (9.67) представляет собой просто сумму этих тождеств по диапазону а ^ I < Ь, потому что промежуточные члены благополучно сокращаются. Доказательство при а = 0 и Ъ = 1 будем проводить индукцией по т, начиная с т = 1: f(0) = | f(x)dx-l(f(1)-f(0)) + (x-l)f'(x)dx. (Полином Бернулли Вт(х) в общем случае определяется уравнением Вт(х) тХВоХ-+(^В1х-1+--.+ (т>|Втх0- т (9-72) в частности Вт (х) = х—\.) Другими словами, мы хотим доказать, что f(0) + f(1] f (х) dx + x-?)f'(x)dx.
9.5 Формула суммирования Эйлера 567 Но это всего лишь частный случай формулы интегрирования по частям u(x)v(x)|0 = Н u(x) dv(x) + v(x) du(x) (973) для u(x) = f (x) и v(x) г. Таким образом, случай га = 1 оказался простым. Чтобы перейти от га — 1 к га и завершить индукцию при га > 1, нам надо показать, что Rm_i = (Bm/ra!)f^m_1)(x)|0 + Rm, а именно — что выполняется равенство -i: ' ^i^f^)(x)dx о (m-1)! 5mf(m-l)(x)| ra! -(-1] m! f(m)(x)dx. Оно приводится к уравнению (-1)mBmf т-1Ъ = ra + >m-1 fx)f(m-1)(x)dx+ Bm(x)f(m)(x)dx. И снова к этим двум интегралам применимо соотношение (д-73)> Авторы хотя бы в с u(x) = f ^m_1 ^ (х) и v(x) = Bm(x), потому что производная поли- конце книги станут нома Бернулли (9.72) есть серьезными? ra dx^- Vk k Bkx m—k = L k ra ra [ra —k)Bkx m-k-1 Z(n\~1Wm-1-,e = тВтп-^х). (9-74) (Здесь полезно тождество поглощения (б-7)-) Таким образом, требуемая формула будет иметь место в том и только в том случае, когда (-IPB^^'MIJ = Bm(x)f<m-1>(x)|„. Другими словами, необходимо, чтобы (-1РВт = Вт(1) = Вт(0) длят>1. (9.75) Это может слегка смутить, потому что ясно, что Вт(0) равно Вт, а не (—1)тВт. Но на самом деле здесь все в порядке, поскольку ra > 1; мы знаем, что Вт для четных ra равно нулю. (Но опасность была близка.)
568 Асимптотика Для завершения доказательства формулы суммирования Эйлера осталось показать, что Вт(1) = Вт(0), а это то же самое, что сказать ^- ( к ) Вк = Вт ДЛЯ т > 1 * Но это просто определение чисел Бернулли, (6.79)) так что доказательство завершено. Тождество B1/TI(x) = mBm_i (х) означает, что о ггь+1 втМс1х = Ь+'П)-вт+1(0) а мы знаем, что этот интеграл равен нулю при m ^ 1. Следовательно, в остаточном члене формулы Эйлера _ (-D^+i Km — ; m! Bm({x})f<m>(x)dx множителем при f^m^(x) стоит функция Bm({x}), среднее значение которой равно нулю. Это означает, что Rm, скорее всего, окажется малым. Давайте более внимательно посмотрим на функции Вт(х) при 0 ^ х ^ 1, поскольку Вт(х) управляет поведением Rm. Ниже приведены графики Вт(х) для первых двенадцати значений га: m = 2 т = 3 т = 4 Э4+т. М Вв+тМ /\ Хотя полиномы от Вз(х) до Вс>(х) достаточно малы, в конечном итоге полиномы и числа Бернулли сильно растут. К счастью, Rm содержит компенсирующий множитель 1/т!, позволяющий усмирить стихию. График Вт(х) при га ^ 3 начинает выглядеть очень похоже на волну синуса; в упр. 58 доказывается, что и на самом деле функция Вт(х) может быть аппроксимирована отрицательным кратным cos(2rcx— jTim) с погрешностью 0(2~mmaxx Bm({x})).
9.5 Формула суммирования Эйлера 569 В общем случае функция B4k+i М отрицательна при 0 < х < j и положительна при ^ < х < 1. Следовательно, ее интеграл B4k+2M/(4k + 2) убывает при 0 < х < \ и возрастает при 2 < х < 1. Более того, имеет место равенство B4k+i (1-х) = -B4k+i (х) для 0 ^ х ^ 1, откуда следует В4к+2(1-х) = В4к+2(х) для0^х^1. Постоянное слагаемое В4к+2 обеспечивает нулевое значение интеграла J0 В4к+2(х) dx; следовательно, В4к+2 > 0. Интеграл от В4к+2(х) представляет собой функцию В4к+з(х)/(4к+3), которая, таким образом, должна быть положительна при 0 < х < \ и от~ рицательна при ^ < х < 1; кроме того, В4к+зП — х) = —В4к+з(х), так что В4к+з(х) обладает всеми свойствами, указанными для B4k+i(x), но с обратным знаком. Следовательно, В4к+4(х) имеет свойства функции В4к+2(х), но с обратным знаком. Следовательно, В4к+5(х) имеет свойства функции B4k+i М; на этом цикл завершен, и индуктивно установлена справедливость указанных свойств для всех к. В соответствии с выполненным выше анализом максимальное значение В2т(х) должно достигаться либо при х = 0, либо при х = 2- В упр. 17 доказывается, что В2тф - &-2п-т2ш; (9.7б) следовательно, имеем |B2m({x})| ^ |В2т|. (9-77) Это неравенство можно использовать для получения полезной оценки верхней границы остатка в формуле суммирования Эйлера, потому что из (б.8д) нам известно, что T^Nl = 7т4у- У гг~ = 0((2я)-2т) при m > 0. 2m ! 2тт 2m *— k2m \у ) ) f v J y J k$>1 Следовательно, формулу суммирования Эйлера (9.67) можно переписать следующим образом: asck<b ja k=1 UKJ- fb + 0((2тг)-2т) |f(2m)(x)|dx. (9.78)
570 Асимптотика Например, при f (х) = ех все производные одинаковы и последняя формула гласит, что Ла<к<ь ек ~ (еЪ — е<1)0 ~~ \ + ^/2! + В4/4! + - • •+В2т/(2т)!)+0((2тс)-2т). Конечно, мы знаем, что на самом деле это сумма геометрической прогрессии, равная (еь — e")/(e-1) = (eb-eo)?k^0Bk/k!. Если f(2m)(x) ^ 0 при а ^ х ^ Ь, то интеграл \\ |f(2m)(x)l dx представляет собой просто f(2m_14x)|Qi так что мы имеем IRlml ^ В2т f(2m-1)M|b (2т) Г [)1а другими словами, в этом случае остаточный член ограничен величиной последнего члена (находящегося непосредственно перед остаточным). Можно дать еще лучшую оценку, если известно, что f(2m+2)(x) ? 0 и f(2m+4)(x) ^0 дляа<:хО. (9-79) Оказывается, отсюда вытекает соотношение R9 _ A B2m+2 f(2m+1W л|Ь для некоторого 0 ^ 0т ^ 1; (9-8°) т.е. остаточный член лежит между 0 и первым отброъиенным членом в (9-78)— членом, который мы добавили бы вслед за последним при увеличении т. Вот доказательство: формула суммирования Эйлера справедлива при всех га, и B2m+i = 0 при га > 0; следовательно, ^2т — ^2т+1 > и первый отброшенный член должен быть ^2m — ^2т+2 • Таким образом, нам надо доказать, что R2m лежит между 0 и ^2m — R2m+2i а это имеет место тогда и только тогда, когда R2m и R2m+2 имеют противоположные знаки. Мы утверждаем, что f(2m+2)(x) ^ 0 для а^х^Ъ влечет (-1)mR2m ^ 0. (g.8i) Вместе с (9-79) это доказывает, что R2m и R2m+2 имеют противоположные знаки, так что на этом доказательство (9.80) завершается. Доказать (дЯг) нетрудно, если вспомнить определение R2m+i и доказанные ранее факты о графике B2m+i (х). А именно, имеем
9.5 Формула суммирования Эйлера 571 причем f(2m+1)(x) возрастает, потому что ее производная .f(2m+2)^xj положительна. (Говоря более точно, f^2m+1^(x)— неубывающая функция, так как ее производная неотрицательна.) График B2m+i (М) выглядит как умноженная на (—1)m+1 синусоида, так что из геометрических соображений ясно, что вторая половина каждой волны синусоиды, будучи умноженной на возрастающую функцию, оказывает большее влияние на интеграл, чем первая. Это делает (—1)mR2m+i ^ 0> что нам и требовалось. В упр. 16 этот результат доказывается формально. 9.6 Завершающее суммирование Перед тем как завершить книгу, просуммируем все и подведем итоги. Рассмотрим несколько важных и интересных примеров и применим к ним формулу суммирования Эйлера. Сумма 1: слишком простая Но начнем мы с рассмотрения интересного и не важного примера, а именно— с суммы, которую мы уже умеем вычислять. Давайте посмотрим, что скажет нам формула суммирования Эйлера при ее применении к телескопической сумме Sn = ?- WTT) = Л]- (к"кТт) = 1_п- Наверное, не помешает предварить серьезные применения формулы суммирования Эйлера анализом асимптотического эквивалента матрешки. Начать можно с записи функции f (х) = 1/х(х+ 1) через простейшие дроби, f (х) = - - -^т , X х + 1 поскольку это упрощает интегрирование и дифференцирование. Итак, мы имеем f '(х) = -1 А2 + 1/(х+1 )2 и f "(х) = 2/х3 -2/(х + 1 )3; в общем случае f м М = (-1Щ (-jL- - (x + 11)k+1) для к ? 0. Далее, f (х) dx = lnx — ln(x + 1) | = In- n+1
572 Асимптотика Подставляя эти выражения в формулу суммирования (9-67)) получаем ** = b&-D-4kTGhdiF-14)+M,° B-.(M)(^T-(x+|1)n,->Oli>- где Rm(n) = - Например, при m = 4 правая часть равна 2п 1/1 1 1 \ 1/1 In In l/l I I \ I / I I i\ n + 1 -2\n~n+1 ~~2У~ 12 W "~ (n + 1)2 ~4/ 1 /1 1 15\ n , . + T2ofe-hTm~T6) + R4(n) Ox, похоже, тут что-то не так— что-то не видно ничего общего с правильным ответом 1 — п-1. Но не будем останавливаться; пойдем дальше и посмотрим, что здесь можно сделать. Мы знаем, как расписать слагаемые правой части через отрицательные степени п до, скажем, 0(п-5): = -п"1 + 1п~2 - \п~ъ + \п~4 + 0(п"5) гГ1 - п-2+ п"3- п-4 + 0(гГ5) In П 1Пп+1 1 п+1 1 (п + 1)2 1 п -2-2ттГ3 +3п"4 +0(п-5) Следовательно, сумма членов в правой части приближения дает Ь2+1+^-т1з + (-1-1+1)п-Ч(ЬЬ^+^)п-2+ + (-i+b^)^3+(bi+^+Tio-Tio)^4+^(n) = = ln2+^-n-4R4(n)+0(n-5). Коэффициенты при п-2, п~3 и п~4, как им и положено, прекрасно сократились. Если бы все в мире шло как надо, то мы должны были бы суметь доказать, что R4(ti) асимптотически мало, может быть, О (и-5), и в результате получили бы аппроксимацию нашей суммы. Только вот мы не сможем этого сделать, потому что мы знаем, что правильный постоянный член равен 1, а не In 2 + j^g (что, хотя и близко к 1, но все же не равно ей, а примерно равно
9.6 Завершающее суммирование 573 0.9978). Таким образом, R4(tl) в действительности равно Щ^ — 1п2-Ь 0(п-5), только вот формула суммирования Эйлера ничего нам об этом не говорит. Другими словами, нас постигла неудача. Один из способов справиться с проблемой заключается в том, чтобы заметить, что постоянное слагаемое в аппроксимации по мере роста га следует определенной схеме: In2 - ^Bi + \ • |В2 - \ • \В3 + \ • ЦВ4 - \ • §^В5 + • • • . Может быть, мы покажем, что этот ряд сходится к 1 при бесконечном количестве слагаемых? Нет— числа Бернулли становятся очень большими. Например, В22 = 85-|4з58 3 > 6192; следовательно, |^22 (тъ) | будет гораздо больше, чем |R4(n)|. И тут тоже неудача. Тем не менее выход есть, и этот обходной путь, оказывается, очень полезен и в других приложениях формулы Эйлера. Ключевой момент здесь— заметить, что R4(tl) стремится к некоторому пределу при п —> со: lim R4(tl) = — B4^})(i"UTTp)dx = МооЬ Интеграл J^° Bm({x})f(mHx) dx существует, если f^m)(x)=0(x~2) при x —> со, и это несомненно так в случае f(4^(x). Кроме того, имеем Г°° / 1 1 \ R4(n) = R4(oo) + j^ B4(W)(^-^TT]5)dx = /Г°° \ = R4(oo) + OM x"6dxj = R4(oo) + 0(rL-5). Таким образом, мы доказали с помощью формулы Эйлера, что I- wiTTTT =b2+^-n-1+R4(oo) + 0(n-5) = = C-n"1 +0(n"5) для некоторой константы С. Мы не знаем, какова эта константа— для ее определения требуются другие методы,— но формула суммирования Эйлера позволила нам установить ее существование. Предположим, что мы выбрали гораздо большее значение т. Тогда те же рассуждения покажут, что Rm(n) = Rm(oo) + 0(n -m-1>
574 Асимптотика и мы получим формулу X. HV+n = C-n~1+c2^"2+c3n-3-f---+cmn-m+0(n- 1<ck<u для некоторых констант С2, Сз, ... . Мы знаем, что в нашем случае все константы с оказываются нулевыми; тем не менее докажем это, хотя бы для того, чтобы восстановить репутацию (если не свою, то по крайней мере формулы Эйлера). Член In ^у вносит в ст слагаемое (—1)т/т; член (—1 )т+1 (Вт/т)п-т вносит (—1)m+1Bm/m, а вклад члена (—1 )k(Bic/k)(n + 1)~k составляет (-l)m(1^ri1)Bk/k. Следовательно, m m ^— V 1с—1 I к к=1 ч 7 = ^4?(ТК = io-B™+Bm(D-i). m га га ^— \ к/ га к=1 ч 7 Совершенно ясно, что это нуль для га > 1. Мы доказали, что И lcflc+Л = C~n_1+0(n"m_1) для всех m^l. (9.82) Этого недостаточно, чтобы доказать, что сумма точно равна С — п-1; она может быть равна С—п-1 + 2_п или чему-то еще в этом роде. Но формула суммирования Эйлера все же дала нам точность 0(n_m_1) для произвольно большого та, даже несмотря на то, что мы не оценивали явно ни одного остаточного члена. Опять сумма 1: выводы и обобщения Перед тем как окончательно разделаться с нашим тренировочным примером, попробуем вновь взглянуть на сделанное в более широком аспекте. Мы начинали с суммы Sn = X f(k) 1^k<n и, воспользовавшись формулой суммирования Эйлера, получили га Sn - F(n) - F(1) + ?_ (Tlc(n) - Tk(1)) + Rm(n), (9.83) k=1 где F(x) есть Jf(x) dx, a Tk(x) — определенное выражение, включающее Bic и f(k_1 ^ (x). Мы также заметили, что существует константа с, такая, что f<m)(x) - 0(xc~m) при х —> со для всех достаточно больших т.
9.6 Завершающее суммирование 575 (А именно, у нас было f(k) = 1/к(к + 1); F(x) = ln(x/(x + 1)); с = -2 и Тк(х) = (-1)к+1(Вк/к)(х-к - (х+ 1)-к).) Это означает, что для всех достаточно больших га остаточные члены имеют маленький хвост, RmW = Rm(00)-Rm(u) = ^m)(x)dx = 0(nc+1-m). (9.84) -1 |TTL+1 m! Следовательно, можно заключить, что существует константа С, такая, что та Sn = F(n) + С + Y_ J^ ~ Rm(n) • (9.85) k=1 (Заметьте, что С, к нашему счастью, вобрала в себя неприятные члены Tic(1).) Можно сэкономить усилия в будущих задачах, сразу утверждая существование константы С в тех случаях, когда Rm(oo) существует. Предположим, что f(2m+2)(x) ^ 0 и f(2m+4)(x) ^ 0 для 1 ^ х ^ п. Мы доказали, что отсюда следует простая оценка (9-8о) остаточного члена: ^2т(тг) = 0т,п(Т2т+2('п) -Т2т+2(1)) > где 0m,n лежит где-то между 0 и 1. Но на самом деле нас не интересует оценка, содержащая R2m(r0 и Т2т+20); мы, в конце концов, избавились от "Tk(l) путем введения константы С. Что нам действительно нужно, так это оценка вида -R2m(n) = Фт,тгТ2т+2(Т1), где 0 < фттцп < 1; она позволила бы вывести из (9-85) соотношение га Sn = Р(п) + С + Т1(п) + ^Т2^(П) + Фт,пТ2т+2(п), (9.86) к=1 и здесь остаточный член действительно будет лежать между нулем и первым отброшенным членом. Незначительное изменение наших предыдущих рассуждений полностью исправляет положение. Допустим, что f(2m+2)(x) ^ 0 и f(2m+4)(x) ^0 прих->оо. (9.87)
576 Асимптотика Правая часть (9.85), если рассматривать только остаточные члены, имеет точно такой же вид, как формула суммирования Эйлера (9.67) для а = пиЬ = оо, взятая с обратным знаком, и последующие остаточные члены получаются индукцией по га. Следовательно, в этом случае можно применить наши предыдущие рассуждения. Сумма 2: гармония гармонических чисел Теперь, научившись столь многому на тривиальном (но надежном) примере, мы легко справимся с нетривиальным. Используем формулу суммирования Эйлера для вывода уже известной нам аппроксимации чисел Нп. В этом случае f (х) = 1 /х. Мы уже изучили интеграл и производные f, разбираясь с суммой 1; f ^m^ (х) = 0(x~m-1) при х —> со. Следовательно, можно сразу же использовать формулу (9-85)" Y_ - =]nn + C + B^-^^k-R'2m(n) для некоторой константы С. Сумма слева есть Hn_i, а не Нп; однако более удобно работать с Hn_i и добавить 1/тг позже, чем возиться с (п+1) в правой части. Тогда Bin-1 станет (Вт +1)п~1 = 1/(2п). Обозначим константу буквой (у' вместо 1С\ поскольку константа Эйлера у фактически определяется как limn_^00(Hn — Inn). С помощью только что разработанной теории можно хорошо оценить остаточный член, потому что f^2m^(x) = (2m)!/x2m+1 ^ О для всех х > 0. Следовательно, из (9-86) получаем Н" = ЫП + У + I - | 2^ - 9^ (2m^m+2 » (9^) где 0m>n— некоторая дробь между 0 и 1. Первые члены этой общей формулы приведены в табл. 545. Например, для га = 2 получаем н- = Ып+у+^-^ + ш^-^- (9-89) Это уравнение, кстати, дает хорошее приближение у даже при п = 2: у = Н2-1п2-| + 4^-^20+6 = 0.577165...+ е, где е лежит между 0 и 1б]28. Взяв п = 104 и та = 250, получим значение у с 1271 верным десятичным знаком, начинающееся как у = 0.57721566490153286060651209008240243.... (g.go)
9.6 Завершающее суммирование 577 Но константа Эйлера встречается и в других формулах, которые позволяют вычислять ее еще эффективнее [345]. Сумма 3: приближение Стирлинга Если f(x) = lnx, то f'(x) = 1/х, так что можно оценить сумму логарифмов, используя практически те же вычисления, что и для суммы обратных величин. Формула суммирования Эйлера дает Inn L-, , i ILL I l Ink = n In n—n-ba —h B 1 ^k<n у D2k P2m+2 ;^ 2k(2k-l)n2k-1+(Pm'n(2m+2)(2m+l)n2^+1 ' где a— некоторая "константа Стирлинга" и 0 < фт>п < 1. (В этом случае f(2m)(x) не положительна, а отрицательна; но можно по-прежнему утверждать, что остаточный член подчинен первому отброшенному, потому что можно начать с функции f(x) = — lnx вместо f(x) = lnx.) Добавление к обеим частям Inn при га = 2 дает Inn 1 1 ф2- Inn! = nlnn-n-f—+а+—-360nT+— 1260п5' (9-9i) Не занимался ли Гейзенберг математикой? Аппроксимацию из табл. 545 можно получить, применив 'ехр' к обеим частям. (Значение еа оказывается равным ч/2тг, но пока что мы не готовы вывести эту формулу. В действительности сам Стирлинг не знал точного значения константы еще несколько лет после того, как деМуавр [76] доказал ее существование.) Если та фиксировано, an —> со, то общая формула дает все лучшие и лучшие приближения Inn! в смысле абсолютной погрешности, а следовательно, эти приближения являются все улучшающимися приближениями п! в смысле погрешности относительной. Но если п фиксировано, а та возрастает, то оценка погрешности |В2т+2|/(2та + 2)(2m -h 1 )n2m+1 убывает только до некоторой точки, после чего начинает расти. Таким образом, у данной аппроксимации п! имеется некоторый порог точности, переступить который мешает что-то вроде принципа неопределенности. В главе 5, в соотношении (5-83), мы обобщили факториалы на произвольные действительные ос при помощи определения 1 = lim (n+0V« a! n->oo V n
578 Асимптотика предложенного Эйлером. Предположим, что ос— большое число; тогда п In а! = lim (oclnn + lnn! — 5~ ln(oc + k)) , п—юо \ ^— / к=1 и для оценки этой суммы можно применить формулу суммирования Эйлера с f(х) = 1п(х + ос): п ^ln(k+oc) = Fm(a>n)-Fm(a)0) + R2m(a)n)) k=1 rm(a,x) = (х + ос)1п(х + ос) — хН Ь + Х В2к гкЦк-ТНх + схр-1 ' рП В2т(М) dx 2т (х + ос)2т (Здесь мы воспользовались (9-67) с a = 0 и b = п, а затем добавили к обеим частям 1п(п + ос) — In а.) Если вычесть это приближение суммы X!k=i 1п(к+ ос) из приближения Стирлинга для Inn!, добавить a Inn и перейти к пределу при п —> со, то можно получить In a In ос! = ocmoc— ос И—-—h сг+ + Z В 2k poo B2m(W) dx — {2k){2k-])oc2*-i J0 2m (x + ot)2m> потому что oclnn + nlnn — n + j Inn — (n + oc) ln(n + oc) + n — \ ln(n + a) —> —a, а остальные, не показанные здесь члены, стремятся к нулю. Таким образом, аппроксимация Стирлинга для обобщенных факториалов (и для гамма-функции Г(ос+ 1) = а!) выглядит точно так же, как и для обычных факториалов. Сумма 4: колоколообразные слагаемые Обратимся теперь к сумме совершенно иного характера: вп = ?>-k2/n = (9.92) к = ...+е-9/^+е-4/п+е-1/тг+1+е-1/п+е-4/п+е-9/п+... . Это дважды бесконечная сумма, члены которой достигают максимального значения е° = 1 при к = 0. Мы назвали ее Вп, потому что это степенной ряд, содержащий величину е_1/п в степени
9.6 Завершающее суммирование 579 р(к), где р(к)— полином степени 2; такие степенные ряды традиционно называются тета-функциями. Если п = 10100, то -к2/п г"-01 ^0.99005 прик=1049; е"1 ъ 036788 прик=1050; е"100 < 10"43 прик-1051. Таким образом, слагаемые остаются очень близки к 1, пока к не достигнет значений порядка у/п} когда слагаемые уменьшаются и становятся очень близки к нулю. Можно предположить, что 9П будет пропорционально л/п. Вот как выглядит график е_к /п для п = 10: При больших значениях п график просто растянется по горизонтали в y/ri раз. Чтобы оценить Вп с помощью формулы суммирования Эйлера, положим f(x) = е -х7п и а = —со, Ъ = +оо. (Если бесконечности вас пугают, то возьмите а = —А и Ъ = +В, а затем перейдите к пределу Л, В —> со.) Интеграл от f(x) равен ,-Х /П Jv - dx = Vn е u du = v^C, если заменить x на Uy/й. Значение J_^ e_u du хорошо известно, но пока что мы обозначим его буквой С с тем, чтобы вернуться к нему после того, как закончим разбирательство с формулой суммирования Эйлера. Следующее, что нам нужно знать, — это последовательность производных f '(х), f "(х), ...; для их нахождения удобно воспользоваться заменой fM = g(xA/S), g(xj = е Тогда правило замены переменной из дифференциального исчисления говорит нам, что df(x) dg(y) dy dx dij dx' а это то же самое, что f'(x) = -Lg'(xA/R-) У = /n
580 Асимптотика По индукции fM(x) = п-к/2д(к)(хД/^). Например, g'(x) = —2хе_х и д"(х) = (4х2 — 2)е~х ; следовательно, ™ - Ж-ЪУ* Чтобы было легче увидеть, что произойдет в дальнейшем, лучше работать с более простой функцией д(х). Нам не понадобится точно вычислять производные д(х), потому что нас интересуют только предельные значения при х = ±со. Нам достаточно заметить, что любая производная функции д(х) есть произведение е~х и некоторого полинома от х: д^(х) = ?]С{х)е~х ) где Р^— полином степени к. Это доказывается по индукции. Экспонента е~х стремится к нулю при х —> ±оо гораздо быстрее, чем Pic(x) стремится к бесконечности, поэтому мы делаем вывод, что f(k)(+oo) = f(k)(-oo) = О для всех k ^ 0. Следовательно, все члены в m R n|ff(fc~1)(x)i- k=1 исчезают, и остается лишь слагаемое с J" f (х) dx и остаточный член: en = cVH+(-i)m+1 = Су/п + +"Bm(W)f(m {х)йх = пт/2 ( = Су/п + М)т+1 Г°°Вт({х}) fml/ х , glm) — dx = [X = Ui/n n(m-1)/2 m! CVn + 0(n(1-m)/2).
9.6 Завершающее суммирование 581 Выписанная О-оценка остаточного члена вытекает из того факта, что |Вт({гц/п})| ограничено и интеграл J_^|P(u)|e_u du существует, если Р— полином. (Константа в этом О зависит от га.) Мы доказали, что Вп = Сл/rL + 0(п-м) для сколь угодно большого М; разность между Вп и Cy/ri "экспоненциально мала'.' Займемся теперь определением константы С, играющей столь важную роль в значении Gn. Один из способов найти С состоит в поиске значения интеграла в таблице; однако предпочтительно самостоятельно вычислить это значение, чтобы в будущем уметь подсчитать и те интегралы, которых нет в таблицах. Для вычисления С достаточно элементарных знаний, если догадаться рассмотреть не одинарный, а двойной интеграл С1 = ¦+оо -*2dx dy -boo е-(х +у )dxdy. Переход к полярным координатам дает р2п С1 rdrde г2тг de о >2тг du = d9 = п. Ы = г2) Следовательно, С = у/п. Тот факт, что х2 + у2 = г2 есть уравнение окружности длиной 2тгг, в какой-то мере объясняет, откуда здесь берется п. Еще один способ вычисления С состоит в замене х на у/\ и dxHa ^t"1/2dt: С = dx = 2 dx t-^e-Mt. Этот интеграл равен Г(^), поскольку в соответствии с (5.84) Г(сс) = J^°ta_1e-t dt. Таким образом, мы показали, что Г(^) = >/я. Итак, наша окончательная формула такова: в, 5> к y/mi+0{n-M) для любого фиксированного М.. (9.93)
582 Асимптотика Константа в О зависит от М; вот почему мы говорим о том, что М. "фиксировано'.' Например, при п=2 бесконечная сумма 02 равна 2.506628288; это уже отличное приближение к у/Ъп « 2.506628275, несмотря на малость п. Значение же вюо совпадает с Ю^/тг до 427-й десятичной цифры! В упр. 59 при помощи более совершенных методов получается быстро сходящийся ряд для Вп; оказывается, что Вп/У^ = 1 + 2е~™2 + 0(e-w). (9.94) Сумма 5: завершающий удар Теперь займемся последней суммой, которая позволит нам найти значение константы Стирлинга а. Эта последняя сумма иллюстрирует также многие другие методы из настоящей главы (да и из всей книги), так что это вполне уместный пример в завершение нашего исследования конкретной математики. Последняя задача выглядит абсурдно простой: мы попытаемся найти асимптотическое значение суммы с помощью формулы суммирования Эйлера. Здесь мы вновь сталкиваемся с ситуацией, когда заранее известен ответ (так ли?); однако всегда интересно применить новые методы в старых задачах, чтобы сравнить результаты и, может быть, открыть что-нибудь новое. Так что мы думаем по-большому и обнаруживаем, что основной вклад в Ап вносят средние члены, вблизи к = п. Почти всегда удобно выбрать такие обозначения, чтобы основной вклад в сумму происходил вблизи к = 0, потому что в таком случае можно воспользоваться приемом замены хвоста, чтобы избавиться от членов с большими |к|. Таким образом, заменим к на п + к: к чП + кУ ^-(п + 1с)!(п-к)! Дела идут неплохо, поскольку мы знаем, как аппроксимировать (n ± к)! при больших п и малых к. Теперь мы хотим применить трехходовую процедуру, подразумеваемую приемом замены хвоста. А именно, мы хотим записать (1 \\ = ak(n) = bk(n)+0(ck(n)) длякеОп (n+к)! (п-к)!
9.6 Завершающее суммирование 583 с тем, чтобы получить оценку An = ^bk(n) + 0( Y. a^n)) + k k^Dn + 0( ^T bk(n)) + ]T 0(ck(n)). k?Dn kGDn Таким образом, попробуем оценить (n+k) в области малых |к|. Можно было бы использовать аппроксимацию Стирлинга, как она представлена в табл. 545, но проще работать с ее логарифмическим эквивалентом в виде (д-91): lnak(n) = ln(2u)!-ln(n+k)!-ln(u-k)! = = 2п1п2п-2п+±1п2п+о+0{п-1)- -(n+k) ln(n+k)+n+k-^ in(n+k)-a+0((n+k)-1 )- -(n-k) ln(n-k)+n-k-l lnfn-kj-a+ofln-k)-1) . (9-95) Хотелось бы преобразовать это в простую и красивую О-оценку. Метод замены хвоста позволяет использовать оценки, спра- Я не из тех, кто ведливые только для к из "доминирующего" множества Dn. Но доминирует... Как нам определить Dn? Мы должны сделать Dn достаточно малым, чтобы можно было получить хорошую оценку; так, например, не стоит допускать приближения к к п, в этом случае член О ((и — к)-1) в (9-95) "взрывается" С другой стороны, Dn должно быть достаточно большим, чтобы остаточные члены (члены с к ^ Dn) были пренебрежимо малы в сравнении со всей суммой. Обычно для определения подходящего множества Dn требуется действовать методом проб и ошибок; в данной задаче вычисления, которые мы вскоре проделаем, покажут, что разумно определить множества следующим образом: k G Dn 4=* |к| <С п1/2+е. (9.96) Здесь е — небольшая положительная константа, значение которой будет выбрано позже, после того как мы получше изучим данную местность. (Наши О-оценки будут зависеть от е.) Уравнение (9-95) можно теперь сократить до lnQk(n) = (2п+^)1п2-а-11пп+0(тг-1)- -(n+k+l)ln(l+k/n)-(n-k+l)ln(l-k/n). (9.97) (Мы вынесли основные части логарифмов, записав ln(n±k) = lnn + ln(1 ±k/n), в результате чего многие члены, содержащие Inn, сократились.)
584 Асимптотика Теперь нужно разложить члены ln(1 ±к/п) асимптотически, так, чтобы погрешность стремилась к нулю при п —> со. Мы умножаем ln(1 ± k/n) на (n ± к + ^), так что мы должны разложить логарифм до членов о(п-1), с учетом предположения Ikl^n1/24"6: ln(l±-) = ±--^ + 0(п-3/2+3е). V n/ n 2nz Умножение на n ± k + \ дает к2 к2 ik-^ + ^ + Otn"1/2^) 2п п плюс другие члены, которые поглощаются слагаемым 0(п-1/2+3е). Таким образом, (9.97) превращается в lnak(n) - (2n+^)ln2-o--^lnn-k2/n + 0(n-1/2+3e). Взяв экспоненту, получим 22тг+1/2 ak(n) = -——e^^O+Ofn-1^36)). (9.98) Это и есть наша аппроксимация с 72п+1/2 bk(n) = =-e"k/l\ ck(n) = 22nn-1+3ee-k/n. eaVn Заметьте, что k входит в bk(n) и Ск(тг) очень простым образом. Это явная удача, потому что мы будем выполнять суммирование по к. Прием замены хвоста говорит нам, что ]Гк ak(n) приближенно равна ]ГкЬк(п), если грамотно выполнить оценку. Давайте вычислим 72п+1/2 L— eavrL L— e k ~ v '" k eavn e (И снова удача: можно использовать сумму Gn из преды дуще- Удивительное сов- то примера.) Это радует, поскольку, как нам известно, исходная падение. сумма в действительности равна An = H(2kn) = v + v2n = l2n- Таким образом, похоже, что ест = \72я, как и было объявлено.
9.6 Завершающее суммирование 585 Я очень устал, продираясь через длинные, тяжелые книги. И ни в одной я не встретил ни слова поощрения и благодарности от автора. А как было бы приятно прочесть: "Благодарим за время, затраченное на чтение этой книги, и надеемся, что оно было затрачено не зря" вместо того чтобы после длинного сухого доказательства обнаружить холодную и твердую картонную обложку. Вы согласны? Но не торопитесь радоваться. Надо еще доказать, что наши оценки достаточно точны. Посмотрим сначала на погрешность, вносимую Сь(п): 1с(п) = 21 22nn-1+3ee-k2/n <С 22пп |k|^n1/2+e - 0(22nn-i+3e). -1+3евп = Хорошо; эта величина асимптотически меньше предыдущей суммы, если Зе < \. Теперь следует проверить хвосты. Имеем 22 e"k2/n < exp(-Ln1/2+eJ2/n)(l+e-1/n+e-2/n+...) - lOnl/2 + e --n2e)-0(n), = Ofe" a это есть 0[n~M) для любого M; так что X.k?Dn bk(n) асимптотически пренебрежимо мала. (Мы выбрали границу п1//2+е как раз так, чтобы е-к /п было экспоненциально малым вне Dn. Вполне подошли бы и другие выражения, наподобие nJ^logn, и оценки были бы тогда несколько точнее, зато формулы оказались бы сложнее. Нам совсем не обязательно находить наиболее точную оценку, поскольку главная наша цель — найти значение константы а.) Аналогично другой хвост, L к>п1/2 + е 2п п + кГ ограничен 2п-кратным максимальным слагаемым, получаемым в разделительной точке к « п1 /1+е. Это слагаемое, как известно, приближенно равно bjjn), что, в свою очередь, экспоненциально мало в сравнении с Ап; экспоненциально малый множитель перевешивает множитель 2п. Итак, мы успешно применили метод замены хвоста и доказали оценку 22- = 2~ 2п 22n + 0(22nn-i+3e), если 0 < е < \. Благодарим за время, затраченное на Можно вы6рать е = 1 и сделать вывод, что чтение этой книги, с 8 " ™ и надеемся, что оно было затрачено не зря. — Авторы QED (9-99) а = ^1п2я.
586 Асимптотика Упражнения Разминка 1 Докажите или опровергните: если fi (п) -<; gi(n) и f2(Ti) -< g2(n), то f i (n) + f2(n) -< gi (n) + g2(n). 2 Какая из функций растет быстрее: a n(lnn) или (lnn)n, б n(lnlnllin) или (Inn)!, в (п!)! или ((n-1)!)!(n-1)!n', г ?ГНп1 или Н^? 3 Что неверно в следующих рассуждениях: "Поскольку п = О(п), 2п - О(п) и т.д., то ]Г?=1 kn = ??=1 О(п) = 0(п2)" 4 Приведите пример верного соотношения, содержащего символ 'О' в левой части, но не в правой. (Не используйте умножение на нуль; это слишком просто.) Указание: рассмотрите переход к пределу. 5 Докажите или опровергните: 0(f(n) + g(n)) = f(n) + 0(g(n)), если f(n) и g(n) положительны для всех п. (Сравните с (9-27)0 6 Умножьте (inn + у + 0(1/п)) на (п + 0(-у/п)) и выразите ответ в О-обозначениях. 7 Оцените Х!к>о е_к^п с абсолютной погрешностью 0(п-1). Обязательные упражнения 8 Приведите пример функций f(n) и g(n), таких, что ни одно из отношений f(n) -<; g(n), f(n) >- g(n) и f(n) x g(n) не выполняется, несмотря на то что обе эти функции монотонно стремятся к со. 9 Строго докажите (9.22), показав, что левая часть является подмножеством правой части в соответствии с теоретико- множественным определением О. 10 Докажите или опровергните: cosO(x) = 1 + 0(х2) для всех действительных х. 11 Докажите или опровергните: 0(х + у)2 = 0(х2) + О (у2). 12 Докажите, что 1+^ + 0(n-2) = (l+^(l+0(n-2)) при П —> 00.
9 Упражнения 587 13 Вычислите (п+2 + 0 (п-1)) с относительной погрешностью 0(п-'). 14 Докажите, что (n + a)n+|3 = пп+|3еа(1 + а(|3 - \ос)п~^ + 0(п-2)). 15 Укажите асимптотическую формулу для "среднего" триномиального коэффициента (n TJxn), относительная погрешность которой равна 0(п-3). 16 Покажите, что если В(1 — х) = — В(х) ^ 0 для 0 < х < \, то B({x})f(x)dx ^ О J а при дополнительном условии ff[x) ^ О для а ^ х ^ Ь. 17 Используя производящие функции, покажите, что Вт(^) = (21_т-1)Вт для всех т^О. 18 Найдите значение суммы Ик (iT) ПРИ а > ^ с относительной погрешностью 0(п-1//4). Домашние задания 19 Воспользуйтесь компьютером для сравнения левой и правой частей аппроксимаций из табл. 545, положив п = 10, z = а = 0.1 и 0(f(n)) = 0(f(z)) - 0. 20 Докажите или опровергните следующие оценки при п —> со: - °(УЫ"2) - °<^ б е(1+0^/п))2 = е + 0(1/п); в n! = 0(((1-1/n)nu)n). 21 Уравнение (9.4S) дает n-е простое число с относительной погрешностью O(logn)-2. Использовав в (9.46) еще один член (9.31), улучшите относительную погрешность до O(logn)-3. 22 Улучшите (9-54) А° 0(п~3). 23 Сделайте еще один шаг в улучшении (9-62), получив абсолютную погрешность 0(п~3). Указание: пусть дп = с/(п + 1 )(п + 2) + Кп; какому рекуррентному соотношению удовлетворяет Кп? 24 Предположим, что an = 0(f(n)) и bn = 0(f(n)). Докажите или опровергните то, что свертка 2Lk=o akbn-k также есть 0(f(n)), в следующих случаях: a f(n) = п_(Х, а> 1; б f(n) = оГп, а> 1.
588 Асимптотика 25 Докажите формулы (g.i) и (д.2). 26 Уравнение (g.gi) показывает, как вычислить In 10! с абсолютной погрешностью < -|2боооооо- Следовательно, взяв экспоненту, мы получим 10! с относительной погрешностью, меньшей, чем е1/12600000° — 1 < Ю-8. (Фактически эта аппроксимация дает 3628799.9714.) Округлив полученный результат до ближайшего целого (зная, что 10!— целое число), мы получим точный ответ. Всегда ли можно вычислить п! подобным методом, взяв достаточное количество членов приближения Стирлинга? Оцените значение га, дающее наилучшее приближение к Inn! для фиксированного (большого) целого п. Сравните абсолютную погрешность этого приближения с самим значением п!. 27 Воспользуйтесь формулой суммирования Эйлера для поиска асимптотического значения Н^- = Ц?=1 ка, где а— любое фиксированное действительное число. (Ваш ответ может включать константу, значение которой в аналитическом виде вам неизвестно.) 28 В упр. 5.13 определена функция "гиперфакториал" Qn = 1122 ... nn. Найдите асимптотическое значение Qn с относительной погрешностью 0(п-1). (Ваш ответ может включать константу, значение которой в аналитическом виде вам неизвестно.) 29 Оцените функцию 1] ^ 21 /2 ... п1 /п, как в предыдущем упражнении. 30 Найдите асимптотическое значение Y-k>o kle-k /n с абсолютной погрешностью 0(п-3), если I— фиксированное неотрицательное целое число. 31 Вычислите ]Гк>0 1/(ск + ст) с абсолютной погрешностью 0(с~3т), если с > 1, а т— положительное целое число. Контрольные работы 32 Вычислите еНтг+Нп с абсолютной погрешностью 0(п-1). 33 Вычислите Ик>о (k)/nk с абсолютной погрешностью 0(п-3). 34 Определите значения коэффициентов от Л до F, такие, что (1 +1/n)nH- равно г,.-, ч2 ^ т-ч E(lnn)2 Finn _, _, Au + B(lnn)2 + ClnTi + D + — J— + + 0(n ]). n n 35 Вычислите ]Г?=1 V^k с абсолютной погрешностью 0(1).
9 Упражнения 589 36 Вычислите сумму Sn = XLk=i "I/fa2 -fk2) с абсолютной погрешностью 0(п-5). 37 Вычислите ]Г k=i fa m°d к) с абсолютной погрешностью O(nlogn). 38 Вычислите Ц1с>0^к(к) с относительной погрешностью о(п-М. 39 Вычислите ^0<k<nln(n —k)(lnu)k/k! с абсолютной погрешностью 0(п-1). Указание: покажите, что члены при k ^ 10 Inп пренебрежимо малы. 40 Пусть га— (фиксированное) положительное целое число. Вычислите Л^=1 (—1 )kHJJ1 с абсолютной погрешностью 0(1). 41 Вычислите "факториал Фибоначчи" Пк=1 ^к с относительной погрешностью 0(п-1) или меньшей. Ваш ответ может включать константу, значение которой в аналитическом виде вам неизвестно. 42 Пусть а— константа в диапазоне О < а < \. Из предыдущих глав мы знаем, что общего выражения в аналитическом виде для суммы ]Tk<an (к) не существует. Покажите, однако, что имеется асимптотическая формула у ЛЛ = 2nH(a)~ilgn+0(1)> где Н(ос) = oclg-^ + (1 — cx)lg(y^). Указание: покажите, что (к-,)<Т^ЮприО<к^ап. 43 Покажите, что Сп, количество способов размена п копеек (рассмотренное в главе 7) асимптотически равно сп4 + 0(п3) для некоторой константы с. Чему равна эта константа? 44 Докажите, что 1/0 |+0(х-5/2) х±1± = х1/2 1/2 .1/2 _х-1/2 1/2 -1/2 +Х-3'2 1/2' -3/2 при х —» со. (Вспомните определение х-^- = х!/(х — j)\ из (5.88) и определение обобщенных чисел Стирлинга из табл. 334.) 45 Пусть a— иррациональное число между 0 и 1. В главе 3 рассматривалась величина D(a, тг), измеряющая максимальное отклонение множества {ka} для 0 ^ к < п от равномерного
590 Асимптотика распределения. В (з-З1) было доказано рекуррентное соотношение D(o,n) ^ D({cx-1}>LanJ)+a-1 +2; кроме того, имеются очевидные границы О ^ D(ct,n) ^ п. Докажите, что Ит^^оо D(a, п)/п = 0. Указание: в главе б рассматриваются непрерывные дроби. 46 Покажите, что числа Белла Сд-п = е-1 2Ik>0 кпД! из упр. 7.15 асимптотически равны m(n)nem(n)-n-1/2/v/ln^> где m(n) In m(n) =п— j. Оцените относительную погрешность этой аппроксимации. 47 Пусть га— целое число ^ 2. Проанализируйте суммы п п k=1 k=1 Какая из них асимптотически ближе к logm п! ? 48 Рассмотрим таблицу гармонических чисел Н^ для 1 ^ k ^ п в десятичной записи. В ней к-й элемент Н^ корректно округлен до dk значащих цифр, где d^ выбрано ровно таким, чтобы можно было отличить этот элемент от H]c_i и H^+i. Например, вот как выглядят пять строк этой таблицы в месте, где Н]с преодолевает рубеж 10: к 12364 12365 12366 12367 12368 нк 9.99980041- 9.99988128+ 9.99996215- 10.00004301- 10.00012386+ нк 9.9998 9.9999 9.99996 10.0000 10.0001 dk 5 5 6 6 6 Оцените общее количеств цифр в таблице ?lk=i d^ с абсолютной погрешностью О(п). 49 В главе 6 мы рассмотрели историю червяка на резинке, который достигнет ее конца через п минут, где Hn_i < 100 ^ Нп.
9 Упражнения 591 Докажите, что если п— положительное целое число, такое, что Hn_i ^ а ^ Нп, то Lea"^J ^ n ^ Геа"у1 • Рисковые капиталисты из Кремниевой долины получили предложение, дающее шанс на экспоненциально большую прибыль по их инвестициям: консорциум ГКП обещает в случае вклада в размере п миллионов долларов, где п ^ 2, выплатить через год сумму в N миллионов долларов, где N = 10п. Конечно, есть определенный риск; на самом деле ГКП платит к миллионов долларов с вероятностью ЧДк2}-^ ) для целых к в диапазоне 1 ^ к ^ N. (Все платежи осуществляются в мегадолларах, т.е. в точных кратных миллиону долларов; выплата определяется истинно случайным процессом.) Обратите внимание, что вкладчик всегда получает назад по крайней мере один миллион долларов. а Чему равен асимптотический ожидаемый результат через год, если было вложено п миллионов долларов? (Другими словами, какова средняя сумма выплаты?) Ваш ответ должен быть точен в пределах абсолютной погрешности 0(10_п) долларов. б С какой асимптотической вероятностью вы будете иметь прибыль, вложив п миллионов? (Другими словами, какова вероятность, что вы получите назад больше, чем вложили?) Здесь допускается абсолютная погрешность ответа 0{п~3). Дополнительные задачи 51 Докажите или опровергните: J^°0(x_2)dx = 0(n_1) при п —* со. 52 Покажите, что существует степенной ряд A(z) = 2Iic>o an?n, сходящийся при всех комплексных z, такой, что А(п) >- пп" К 53 Докажите, что если f(x)— функция, производные которой удовлетворяют условиям f'(x)<:0, -f"(xKO, f'"(xKO, ..., H)mf(m+1)(x)^0 50 Как-то раз я заработал 0(10"п) долларов.
592 Асимптотика для всех х ^ 0, то f'«>L , , fim-'4o)_.m-i f(x) = f(o) + ^x, , (m_1}1 для x ^ 0. В частности, в случае f(x) = — ln(l 4-х) получается доказательство (9.64) для всех k,n > 0. 54 Пусть f (х) — положительная, дифференцируемая функция, такая, что xf '(х) -<; f(x) при х —» со. Докажите, что 2_^ = °(^г)> еслиа>0. Указание: рассмотрите величину f(к — ^)/(к — ^)а — f(к + 55 Улучшите (э-99)> уменьшив относительную погрешность до 0(п-3/2+5е). 56 Величина Q(n) = 1 + n=I + n=ln=2 + ... = ^ пЛ/пк встречается при анализе многих алгоритмов. Найдите ее асимптотическое значение с абсолютной погрешностью о (1). 57 В (9-54) получена асимптотическая формула для суммы Го- ломба YL]c>i V^U + l°gn^J2- Найдите асимптотическую формулу для аналогичной суммы без округления для целых Лк>1 1/k(1+lognk)2. Указание: рассмотрите интеграл J^ue-uVtudu=1/(1 +tlnk)2. 58 Докажите, что о л i\ п m! V соБ(2якх-^ят) Вт ({х}) = -27^-— 2. j~ для т ^ 2. Для этого вычислите с помощью теории вычетов интеграл 1 2т 2nie2nizQ dz e27riz _ -| ^ по квадратному контуру z = x + uj, где max(|x|, |у|) = М+ ^, и устремите целое М. к со. 59 Пусть 0n(t) = Jlke_^k+t^/n— периодическая функция от t. Покажите, что разложение 0n(t) в ряд Фурье выглядит следующим образом: 9n(t) = V^m(l +2e-7T2n(cos2nt)+2e-47l2n(cos4^t)+ + 2e-97r2n(cos67it)+ •••).
9 Упражнения 593 (Эта формула дает быстро сходящийся ряд для суммы Вп = вп(0) из уравнения (э-ЭЗ)-) 60 Объясните, почему у всех коэффициентов в асимптотическом разложении 2п\ 4П / 1 1 5 21 ^( _ п) Утт V 8тг 128п2 1024тг3 32768тг4 знаменатели являются степенями 2. 61 В упр. 45 доказывается, что отклонение от равномерного определения D(a,n) есть о(п) для всех иррациональных чисел а. Предъявите иррациональное <х, такое, что D(a,n) не является 0(п1-е) ни для какого е > 0. 62 Для данного п пусть {т^пЛ = тах^ {?}— максимальный элемент строки п треугольника Стирлинга (для количества подмножеств). Покажите, что для всех достаточно больших п выполняется одно из равенств та(тг) = |Ta(n)J или ттг(п) = [т(тг)],где m(n)(m(n)+2)b(m(n)+2) = n(m(n) + 1). Указание: это трудно. 63 Докажите, что самоописывающая последовательность Го- ломба из упр. 2.36 удовлетворяет соотношению f(n) = ф^п*-1 +0(n<|,"1/logn). 64 Найдите доказательство тождества V— cos 2птхх ?, 7 т v 21 —^2— = п (х ~х+б) ДляО^х^Т, которое использует только "Эйлерову" математику (т.е. не более того, что было известно во времена Эйлера). 65 Чему равны коэффициенты асимптотического ряда 11 1 си U2 п—1 (п— 1)(п—2) (п— 1)! п п/ Исследовательские проблемы 66 Найдите "комбинаторное" доказательство аппроксимации Стирлинга. (Обратите внимание на то, что пп есть число отображений множества {1,2,..., п} в себя, тогда как п! — количество отображений множества {1,2,..., тг} на себя.)
594 Асимптотика 67 Рассмотрим решетку точек размером п х п, n ^ 3, в которой каждая точка имеет четырех соседей. (На краях мы "перескакиваем" на противоположную сторону по модулю п.) Пусть Хп означает количество способов раскрасить эти точки в три цвета— красный, белый и синий— так, чтобы никакие две соседние точки не были окрашены в один цвет. (Так, Хз = 12.) Докажите, что Хп ~ (f)3n2/V*/<\ 68 Обозначим через Qn наименьшее целое га, такое, что Нт > п. Найдите наименьшее целое п, для которого Qn ф |_еп-у + ^J, или докажите, что такого п не существует. Ура, это коне-е-е-е-ец
А Ответы к упражнениям КАЖДОЕ УПРАЖНЕНИЕ сопровождается (по крайней мере кратким) ответом, причем некоторые ответы выходят за рамки вопроса. Читатели извлекут куда больше пользы из упражнений, если попытаются найти собственные ответы, прежде чем заглянут в данное приложение. Авторам будет интересно узнать о любых (даже частич- Первому нашедше- ных) решениях исследовательских задач, как и о любых более му любую ошибку простых (или более правильных) способах решения других за- в оригинальном издании книги вы- Аач" плачивается премия в 2.56 дол- 1-1 Доказательство вполне корректно, если не считать случая лара. п = 2. Если все множества из двух лошадей содержат лошадей одной и той же масти, то данное утверждение справедливо для любого количества лошадей. 1.2 Если обозначить количество переносов как Хп, то Хо = О иХп = Xn_i + 1 + Xn_i + 1 + Xn_i для и > 0. Отсюда следует (например, путем прибавления 1 к обеим частям уравнения), что Хп = Зп — 1. (После ^Хп перемещений вся башня оказывается на среднем шпиле— полпути пройдено!) 1сЗ Всего имеется Зп разных размещений, поскольку каждый диск может находиться на любом из шпилей. Мы должны повстречаться с каждым из них, поскольку кратчайшее решение требует Зп — 1 переносов. (Эта конструкция эквивалентна "тернарному коду Грея" который проходит все числа от (0... 0)з до (2.. .2)з, изменяя каждый раз только одну цифру.) 1.4 Нет. Если самый большой диск не требуется перекладывать, то достаточно 2n_1 — 1 переносов (доказывается по индукции); в противном случае будет достаточно (2n_1 — 1 ) + 1 +(2n_1 — 1) переносов (также доказывается по индукции).
596 Ответы к упражнениям 1.5 Нет. Различные окружности могут пересечься не более чем в двух точках, так что четвертая окружность может увеличить количество областей не более чем до 14. Однако это вполне возможно, если воспользоваться овалами: Главное— в количестве точек пересечения; выпуклость играет роль отвлекающего момента. Венн (Venn) [359] утверждал, что не существует способа проиллюстрировать случай пяти множеств при помощи эллипсов, но Грюнбаум (Griinbaum) [167] сумел найти такое построение. 1.6 Если тг-я прямая пересекает предыдущие в к > 0 различных точках, мы получим к — 1 новых ограниченных областей (в предположении, что взаимно параллельных прямых среди уже имеющихся нет) и две новые бесконечные области. Следовательно, максимальное количество конечных областей равно (п-2) + (п-3) + • • • = Sn_2 = (n-1)(n-2)/2 = Ln-2n. 1.7 Не доказано основание индукции; и в самом деле, Н(1) ф2. 1.8 Q2 = (1 + Р)/а, Q3 - (1 + а+ Р)/аР, Q4 = (1 + а)/р, Qs = ex, Q& = р. Данная последовательность периодична! 1.9 (а) Утверждение Р(п — 1) получается из неравенства 'хт +---+хп_1>\ ^ (ху +--- + xn_i' *i .Xn_] п-1 < п-1 (б) X] ...ХпХп+1 ...Х2п ^ (((х1+---+Хп)/п)((хтг+1+---+Х2п)/п))П в силу Р(тг); произведение внутри ^ ((xi Н Ьх2П)/2п)2 в силу Р(2). (в) Например, Р(5) следует из Р{6), которое, в свою очередь, следует из Р(3), которое следует из Р(4), которое следует из ?{2). 1.10 Сначала покажите, что Rn = Rn-i + 1 + Qn-i + 1 + Rn-i при n> 0. Кстати, методы из главы 7 покажут нам, что 1.11 (а) Лучшее, что мы можем сделать,— это переместить сначала двойную (тг— 1 )-башню, затем— (с изменением их относительного порядка) два наибольших диска, после чего — опять двойную (п — 1 )-башню. Следовательно, An = 2An_i +2 и Лп = Предполагается, что п > 0.
А Ответы к упражнениям 597 Готов спорить, что я знаю ответ для четырех измерений! 2Tn = 2n+1 — 2. При таком решении происходит перестановка местами двух наибольших дисков; относительный порядок остальных 2п — 2 дисков остается тем же, что и ранее. (б) Обозначим минимальное количество переносов как Вп. Тогда Bi = 3, и может быть показано, что не существует стратегии лучшей, чем Вп = А^-т + 2 + An_i + 2 + Bn_i при тг > 1. Следовательно, Bn = 2Ti+1 — 5 для всех тг > 0. Любопытно, что это просто 2АП — 1, и мы также имеем Bn = An_i + 1 + An_i -f 1 +An_! +1 H-An-ь 1.12 Если все m^ > 0, то А(тти >..., mn) = 2А(тги > • • • > Tan_i) -f mn. Это уравнение "обобщенного Иосифова" типа с решением (mi ...mn)2 = 2 тг-1. тти + (- 2mn_i + mn. Кстати, соответствующее обобщение упр. 11,6 удовлетворяет рекуррентному соотношению ....тти), В(ть. >тги = {А(тти,..., тп), если mn = 1, 2тап — 1, если тг = 1, 2А(тти,..., mn_i) + 2mn+ если тг > 1 + B(mb...,mn_i), иттгп > 1. 1.13 Поскольку тг прямых определяют Ln областей, можно заменить их очень узкими загзатами с отрезками, достаточно длинными для того, чтобы каждая пара зигзагов имела девять пересечений. Это показывает, что ZZn = ZZn_i + 9n — 8 при всех тг > 0; следовательно, ZZ,, - 9Sr 8тг+1 :тг ^тг+1. 1.14 Количество новых трехмерных областей, определяемых каждым новым разрезом, представляет собой количество двухмерных областей, образованных на новой плоскости линиями ее пересечений с прежними плоскостями. Следовательно, Рп = Pn-i + Ln-i, что дает нам ?5 = 26. (Шесть разрезов кубической головки сыра могут дать 27 сырных кубиков или до Р& = 42 кусков неправильной формы.) Кстати, решение этого рекуррентного соотношения приобретает красивый вид, если выразить его через биномиальные коэффициенты (см. главу 5): X,, = Ln Рп = + + + + +
598 Ответы к упражнениям Здесь Хп— максимальное количество одномерных областей, на которые п точек делят прямую. 1.15 При п > 1 функция I удовлетворяет тому же рекуррентному соотношению, что и функция J, но значение 1(1) не определено. Поскольку 1(2) = 2 и 1(3) = 1, не существует значения 1(1) = а, такого, что оно позволило бы нам воспользоваться обобщенным методом; "исход" развертывания зависит от двух старших битов двоичного представления п. Если п = 2т + 2т_1 + к, где О ^ к < 2т+1 + 2т - (2т + 2т_1) = 2т + 2т-1, то решением является 1(п) = 2к + 1 при всех п > 2. Другой способ записи решения с использованием представления n = 2т + I имеет вид КтО = /Ит0+2™-\ если (К К 2™"\ 1 J(n) - 2™ если 2т~1 $1<2т. 1.16 Пусть g(n) = a(u)a+b(n)Po+c(n)|3i+d(u)Y. Из(1.18)нам известно, что a(n)a + b(n)|30 + c(n)|3i = (a(3bm_! Рът_2 — Ры Рь0)з при п = (1 bm_i .. .bi boh; ЭТ0 определяет a(n), b(n) и с(п). Подставив g(n) = п в рекуррентное соотношение, получим, что а(п) + с(п) — d(n) = п, так что нам известно все, что надо. (Подстановка д(п) = 1 дает дополнительное тождество a(n) — 2b (тг) — 2с(тг) = 1, которое можно использовать для определения b(n) через более простые функции а(п) и а(тг) + с(п).) 1.17 В общем случае Wm ^ 2Wm_ic + Т^ при 0 ^ k ^ та. (Это соотношение соответствует перемещению верхних га — к дисков с последующим использованием только трех шпилей для перемещения нижних к дисков и завершающим перемещением верхних га — к дисков.) Данное соотношение приводит к зависимости от единственного значения к, которое минимизирует правую часть общего неравенства при га = п{п + 1 )/2. (Однако сделать вывод о том, что выполняется равенство, нельзя— могут существовать многие другие приемлемые стратегии перемещения башни.) Если принять Yn = (Wn(n+i )/2 — 1 )/2п, находим, что Yn ^ Yn_i +1; следовательно, Wn(n+i у2 ^ 2п(п — 1) + 1. 1.18 Достаточно показать, что обе линии, выходящие из точки (тг2^0), пересекают обе линии, выходящие из точки (тг2к,0), и что все точки пересечения различны. Линия, выходящая из точки (xj,0) и проходящая через точку (xj — Qj, 1), пересекает линию, выходящую из точки (х^,0) и проходящую через точку (х^ — а\С) 1), в точке (xj — ta^t), где t = (xic—Xj)/(aic—dj). Пусть Xj = n2^ и cij = п^ + (0 или n-n). Тог- да значение отношения t = [п2к — п2^ )/(nk — г0 + (—u~n или 0,
А Ответы к упражнениям 599 Довелось мне покататься на [мото]цикле де Брейна, будучи у него в гостях в голландском городе Нойене. или п_п)) лежит строго между rO + nk — 1 ипЧпк + 1; следовательно, ордината точки пересечения единственным образом определяет j и к. Различны также четыре точки пересечения с одинаковыми j и к. 1.19 Не в случае п > 5. Ломаная линия, полупрямые которой образуют при вершине углы 9 и 0+30°, может пересечься четыре раза с другой ломаной, полупрямые которой образуют углы ф и ф + 30°, только если 30° < |9 — ф| < 150°. Невозможно выбрать более 5 углов, удаленных друг от друга на требуемое расстояние. (5 углов выбрать можно.) 1.20 Пусть h{n) = a(n)a+b(u)f30+c(u)|3i +d(n)y0 + e(n)y1. Из (i.i8) известно, что a(n)oc+b(n)(3o + c(n)(3i = {ос&ъш-1 Рът_2--- (3bl Pbob при п = (1bm_i ...bi boh; это определяет a(n), b(n) и с(п). Подстановка Н(п) =пв рекуррентность дает a(n)+c(n) — 2d(n) — 2e(n) = п; подстановка Н(п) = n2 дает a(n) -f c{n) + 4e(n) = n2. Следовательно, d(n) = (3a(n) -f 3c(n) — n2 — 2n)/4; (n) = (n2 an (n))/4. 1.21 Можно положить m равным наименьшему (или любому иному) общему кратному чисел 2п, 2п — 1, ..., п + 1. (Нестрогие рассуждения приводят к тому, что "случайное" значение га подойдет с вероятностью п п — 1 1 , / /2п\ \/яп 1 2п2п-1 тг+1 '/ \nJ 4г так что можно ожидать, что удастся найти т, меньшее чем 4П.) 1.22 Возьмите правильный многоугольник с 2П сторонами и пометьте стороны элементами "цикла де Брейна" (deBruijn) длиной 2П. (Это циклическая последовательность из 0 и 1, в которой все n-кортежи из смежных элементов различны; см. [207, упр. 2.3.4.2-23] и [208, упр. 3.2.2-17].) Добавьте к каждой стороне, помеченной 1, очень тонкое выпуклое расширение. Требуемые множества представляют собой п таких многоугольников, повернутых "на длину" к сторон при к = 0, 1,...,п— 1. 1.23 Да. (Для решения необходимо знать основные понятия элементарной теории чисел из главы 4.) Пусть L(n) ^НОКП^, ... ,п). Будем считать, что п > 2; тогда в соответствии с постулатом Бертрана между п/2 и п имеется простое число р. Будем также считать, что j > п/2, поскольку q' = L(n) +1 — q оставляет в живых )' = п + 1 — j тогда и только тогда, когда q оставляет в живых j. Выберем q так, что q = 1 (mod L(n)/p) и q = j +1 — n (mod p). В этом случае люди выбывают в порядке 1, 2, ..., п —р, j + 1,j+2, ...,n, n-p + 1,...,j-1.
600 Ответы к упражнениям 1.24 Вот единственные известные примеры: Xn = 2isin7rr + 1/Xn_i, где г— рациональное число и0^г< \ (при изменении г все периоды имеют длину ^ 2); рекуррентность Гаусса (Gauss) с периодом 5 из упр. 8; еще более примечательная рекуррентность Тодда (Н. Todd) Хп = (1 + Xn_i + Хп_2)/Хп_з с периодом 8 (см. [261]); а также рекуррентности, получающиеся из указанных путем замены Хп на Xmn, умноженного на константу. Можно считать, что первый ненулевой коэффициент в знаменателе равен 1 и первый ненулевой коэффициент в числителе (при наличии такового коэффициента) имеет неотрицательную вещественную часть. Компьютерная алгебра позволяет легко показать отсутствие иных решений с периодом ^ 5 при к = 2. Частичная теория была разработана Линессом (Lyness) [261, 262] и Курша- ном (Kurshan) и Гопинатом (Gopinath) [231]. Интересным примером иного типа с вещественными начальными значениями служит рекуррентность Хп = |Хп_-|| — Хп_2 с периодом 9, открытая Мортоном Брауном (Morton Brown) [43]. Получение нелинейных рекуррентностей с любым наперед заданным периодом ^ 5 может основываться на контину- антах [65]. 1.25 Если обозначить минимальное количество переносов, необходимых для перемещения п дисков с к вспомогательными колышками как T(k)(n) (так что Т(1)(п) = Тп и T(2)(n) = Wn), тоТСОЦ^1)) ^П^((1))+Т{к-])((С)). Примеры пар (n,k), для которых это неравенство не является равенством, не известны. Если к мало по сравнению с п, формула 2п+1_к(?~11) дает приемлемую верхнюю границу Т^ ((?)). 1.26 Перестановка "порядка казни" может быть вычислена за O(nlogn) шагов для всех тип [209, упр. 5.1.1-2 и 5.1.1-5]. Бьёрн Поонен (Bjorn Poonen) доказал, что неиосифовы множества ровно с четырьмя "не нашими" существуют при любых п = О (mod 3) и п ^> 9; в действительности таких множеств имеется по меньшей мере е(^) для некоторого е > 0. Он также обнаружил при помощи большого количества вычислений, что единственным среди других п < 24 с неиосифовыми множествами является п = 20, которое имеет 236 таких множеств при к = 14 и два при к = 13. (Одно из последних— {1,2,3,4,5,6,7,8,11,14,15,16,17}; другое— его отражение относительно 21.) При п = 15 и к = 9 имеется единственное неиосифово множество, а именно— {3,4,5, 6,8,10,11,12,13}. 2.1 По этому поводу нет общего согласия— приемлемы три ответа. (1) Можно считать, что Х1к=т Чк всегда эквивалентна
А Ответы к упражнениям 601 Hm^kscn. Як; тогда указанная сумма равна нулю. (2) Можно было бы сказать, что данная сумма равна Ч4 + Чз + Ч2 + Чт +Чо, если суммировать по уменьшающимся значениям к. Но это противоречит общепринятому соглашению о том, что 2Zk=i Ць = 0 при п = 0. (3) Можно считать, что ]T?=m qk = Lk^n ^ ~ Ик<т Як; тогда указанная сумма равна —qi —q2 — Чз- Такое соглашение может показаться странным, но оно удовлетворяет полезному правилу Х.1=а + Lk=b+i = Lk=a ПР11 всех а> Ь>с- Лучше всего использовать обозначение X!k=m> только когда п — та ^ — 1; тогда и (1), и (3) дают одинаковые результаты. 2.2 Это |х|. Кстати, величина ([х>0] — [х<0]) часто называется "знаком х" и обозначается sign(x). Она равна +1 при х > О, О при х = 0 и — 1 при х < 0. 2.3 Первая сумма, конечно, представляет собой do + си + а.2 + аз + а4 + as; вторая— сц + си + ао + сц + сц, так как это сумма по значениям k G {—2,-1,0,+1,+2}. Коммутативный закон в данном случае не применим, поскольку функция р(к) = к2 не является перестановкой. Некоторым значениям п (например, п = 3) не соответствует ни одно к, такое, что р(к) — п; другим (например, п = 4) соответствуют два таких к. 2.4 Один и тот же индекс 'к' использован для обозначения двух разных индексных переменных, хотя к связан с внутренней суммой. Это широко распространенная как в математике, так и в программировании ошибка. Результат будет верен, если dj = cik при всех j и к, 1 ^ j, к ^ п. 2.5 (a) ]Ti=1 Zlj=i+i Hk=j+i aijk=Hi=i 2Zj=t+i 2Ik=j+i ач^= ((аиз + СИ24) + cl134) + a234- (6) Lk=i Lj=i I.i=i ttijk=Lk=3Lj=2 Li=i ciijk=ai23 + (ai24 + (си 34 + CL234)). 2.6 Это [1 ^ j ^n](n — j + 1). Первый множитель необходим здесь потому, что при j < 1 или j > п должен получаться нуль. 2.7 Это mxm_1. Версия разностного исчисления на основе V, а не А, сделала бы факториальные степени неравноправными, особо выделив возрастающие факториальные степени. 2.8 0, если m ^ 1; 1/|т|!, если т ^ 0. 2.9 хт+п = хт (х + т)п при целых тип. Полагая т = — п, получим, что х~п = 1 /(х — п)п = 1 /(х — 1)—. 2.10 Другой возможный вариант записи правой части: Eu Av + vAu.
602 Ответы к упражнениям 2.11 Разбейте левую часть на две суммы и во второй из них замените к на к + 1. 2.12 Еслир(к) =п, топ + с = к+ ((-1)к + 1)с и ((-1)к + 1) четное; следовательно, (—1)п+с = (—1)к и к = п — (—1)п+сс. И обратно, это значение к дает р(к) = п. 2.13 Пусть R0 = cxHRn = Rn_i + (-1)п((3+пу + п26) при п > 0. Тогда R(n) = A(n)a+B(n)(3 + C(n)Y+D(rL)6. Подстановка Rn = 1 дает А(п) = 1. Подстановка Rn = (—1)п дает A(n) + 2B(n) = (-1)71. Подстановка Rn = (-1)nn дает -B(n) +2C(n) = (-1)nn. Подстановка Rn = (-1)nn2 дает B(u)-2C(n)+2D(n) = (-l)nn2. Следовательно, 2D(n) = (—l)n(n2 + n); искомая сумма равна D(n). 2.14 Предложенная запись корректна, поскольку k = Y_-\ <cj<ck ^ при 1 ^ к ^ п. Сначала суммируем по к; в результате кратная сумма сводится к ^^n(2n+1 -V) = n2n+1 - (2n+1 -2). 2.15 На первом шаге заменяем k(k + 1) на 2Jl1^,^kj. Второй шаг дает 6РП + Пп = (?lk=i ^) + Пп- 2.16 х^(х - т)^ = хЯЬ±И = х^(х - п)^ согласно (2.52). 2.17 Воспользуйтесь индукцией для доказательства первых двух равенств и правилом (2.52)— для третьего. Вторая формула вытекает из первой. 2.18 Воспользуйтесь тем, что (9lz) + ^ |z|, (9tz)~ ^ |z|, (3z) + ^ |z|, (3z)" <C |z| и |z| <C (Ш)+ + («Hz)" + (3z)+ + (3z)". 2.19 Умножьте обе части на 2n_1'/п! и положите Sn=2nTn/n! = Бп.т+З^71-1 = 3(2n-1)+S0. Решением будет Тп=3-п1+п1/2п-\ (Как мы увидим в главе 4, Тп является целым числом только тогда, когда п равно 0 или степени 2.) 2.20 Метод приведения дает Sn + (a+1)Hn+1 = Sn+( 21 HkJ+n+1. 2.21 Выделение последнего члена в S^+i дает Sn+i = 1 — Sn; выделение первого члена дает sn+1 = (-Dn+1+ Y. t-i)n+1_k = = (_1)п+т + y_ (-i)n~k = O^k^n = (_1)n+1+Sn.
А Ответы к упражнениям 603 "Глубоко ошибочный трюизм, который повторяется во всех прописях и речах почтенных ораторов, сводится к тому, что мы должны иметь привычку обдумывать свои поступки. В действительности имеет место как раз обратное. Прогресс цивилизации выражается в умножении числа поведенческих актов, которые мы совершаем необдуманно. Мыслительные же акты подобны кавалерийским атакам, число которых весьма ограниченно,— они требуют свежих лошадей и должны совершаться лишь в решающие моменты битвы" — А. Н. Уайтхед (А. N. Whitehead) [370] Следовательно, 2Sn = 1 + (—1)п и Sn = [п четное]. Аналогично находим 'п "г ^п > \ (тг + [тг нечетное]). Tn+1 =n+1-Tn = Jj-l)*-*(k+1] k=0 следовательно, 2ТП = тг + 1 — Sn и Тп Наконец, тот же подход приводит к Un+1 = (n+1)2-Un = Un+2Tn + Sn = = Un + тг 4- [тг нечетное] + [тг четное] = = Un + тг + 1 . Итак, Un— треугольное число ^(тг+ 1)тг. 2.22 Удвоение общей суммы дает "ванильную" сумму по 1 ^ j, k ^ тг, которая раскладывается и дает (Y_ akAk) (]Г bkBk) - (?. akBk) (^ bkAk). k k k k 2.23 (а) Этот подход дает четыре суммы, вычисление которых приводит к 2п + Нп — 2п + (Нп + ^Up — 1). (Было бы проще заменить общий член на 1 /к + 1 /(к + 1).) (б) Пусть и(х) = 2х + 1 и Av(x) = 1/х(х +1) = (х — 1)—; тогда Аи(х) = 2 и v(x) = -(х-1)=1 = -1/х. Ответ: 2НП-^. 2.24 Суммируя по частям, Х>^-Нх6х = х^Ь±1нх/(т + 1) - х™±1/(т + 1 )2 + С; следовательно, Ио^к<п к~Н^ = п™±1(Нп - 1 /(т+1 ))/(т+1) + (№±1/(т+1 )2. В нашем случае т = -2, так что сумма сводится к 1 — (Нп + 1 )/(п + 1). 2.25 Вот некоторые основные аналоги. Y_ cak = с Y_ Qk kGK kGK ГК = ГК kGK kGK kGK kGK kGK Y_ ak = Y. ap(k) kGK p(k)GK kGK У ak = kGK kGK = 11 a'-k jej k€K = ^ак[кеК] k #K kGK ^kGK ' ЧсеК Пак = П avW kGK p(k)GK Пa^ = П Пa^ JGJ JGJ kGK kGK kGK к [kGK] k kGK
604 Ответы к упражнениям 2.26 Р2 = (rii^,k^naJaic)(ni^=k^n^Jaic)- Первый множитель равен (Пк=1 ак)2> а второй— Пк=1 ак- Следовательно, Р - (Пк=1 ак) 2.27 А(с^) п+1 с- с ¦ V .х+2 /(с и уменьшение х на 2 дает А(—(—2)— мая сумма равна (—2)— — (—2)^=1 = (-1) Подстановка с = — 2 ¦2)-/х, так что иско- l)nu!-1. 2.28 Незаконно изменение порядка суммирования при переходе от второй строки к третьей — члены этой суммы не сходятся абсолютно. Все остальное абсолютно корректно, за исключением того, что промежуточный результат ?lk>i [k = j — 1]k/j следовало бы, пожалуй, записать в виде [j — 1 ^ 1](j — 1)/) и упростить. 2.29 Воспользуйтесь элементарными дробями для того, чтобы получить 4к2-1 1 + ¦ 1 2к+1 2к-1 Теперь множитель (—1)к заставляет обе половины каждого члена суммы сократиться с их соседями. Следовательно, искомый ответ равен -1 /4 + (-1 )п/{8п + 4). 2.30 Лъах5х= ±№-с?) = \{Ъ - a)(b + a- 1), поэтому (b-a)(b + a-1) = 2100 - 22-3-52-7. Существует одно решение для каждой записи 2100 в виде х-у, где х четное, а у— нечетное: мы полагаем a = ^|х —у| -Ь ^ и b 1 (х + у) + \. Поэтому искомое число решений равно чи- слу делителей 3-52-7, а именно— 12. В общем случае имеется Пр>2(пр + 1) способов представления \\ рпр, где произведения берутся по простым числам. 2-31 Lj,ic^r,c = Lj3!2Vj2(1-1/j)=2:^2Vj(j-1). Анало- гично находится вторая сумма 3/4. 2.32 Если 2п <J х < 2п + 1, то данные суммы суть 0 -\ + п + (х-п-1) + --- + (х-2п) =п{х-п) = (х-1) + (х-3) + --- + (х-2п+1). Если же 2п — 1 ^ х < 2п, то аналогичным образом обе суммы равны п(х — п). (Забегая вперед, в главу 3, заметим, что оба случая описываются формулой \_j (х + 1)J (х — [^ (х + 1 )J).) 2.33 Если К— пустое множество, то Лкек аь — оо. Вот основные аналоги Y_ cak = с У ak кек kGK Д (c+ak) = с+Д ak kGK kGK Может ли что-то быть корректным не абсолютно?
Перестановка, поглощающая члены одного знака быстрее, чем другого, может сделать сумму равной какому угодно значению. При таком самоописании вряд ли кому-то захочется ее описывать... А Ответы к упражнениям 605 ^Г(ак+Ък) = ^~ак+^Ък <—» Д min(aic,bk) = кек кек кек kGK Y_ ak = Y_ avW kGK p(k)GK Y_ aU^ = X. H ai»k JGJ kGK kGK ^ak = ^ак[1сеК] kGK k = minf Д ak> Д bk j ^kGK kGK ' Д ak = Д ap(k) kGK p(k)GK Л a^ = Л Л a№ JGJ jGjkGK kGK Д ak = Д akoo [k?K] kGK 2.34 Пусть K+={k | ak ^ 0} и K"={k | ak < 0}. Тогда, если, например, n нечетное, мы выбираем Fn равным Fn_i UEn, где подмножество Еп С К- достаточно большое, чтобы HkG(F пк+) а^~ LkGEn(-^)<A". 2.35 То, что сумма Гольдбаха равна можно показать следующим образом. Если развернуть каждый ее член в сумму геометрической прогрессии, то она равна XlkGP i>i k_l 5 таким образом, доказательство будет завершено, если мы сможем найти взаимно однозначное соответствие между упорядоченными парами (га, п) с га, п ^ 2 и упорядоченными парами (к, I) с к 6 Р и I ^ 1, где гап = к1 в случае соответствия этих пар. Если га ^ Р, мы полагаем (га,п) <—> (тап, 1), но если га = ab G Р, то полагаем (га, п) <—> (an,b). 2.36 (а) По определению д(п) — g(n— 1) = f(n). (б) Согласно части (а) g(g(n)) - g(g(n- 1)) = Lkf(k)[g(n- 1) <к<: g(n)] = "^(gM— 9(n — 1)) — Tif (n). (в) Вновь в соответствии с частью (а) g(g(gM)) -g(g(g(n-1))) представляет собой ^f(lc)[g(g(n-1))<k^g(g(n))] = к = }j[j=f(k)][g(g(n-1))<k^g(g(n))] = = 2j[J=fOO][g(n-l)<Kg(n)] = = Zj(9(i)-g(i-i))[g(n-i)<Kg(n)] = j = ^jf(j)[g(n-1)<j^g(n)] = n?j[g(n-1)<Kg(n)].
606 Ответы к упражнениям Колин Мэллоуз (Colin Mallows) заметил, что эта последовательность может быть определена при помощи рекуррентности f(1) = 1; f(n+1) = 1+f(n+1-f(f(n))) прип^О. 2.37 (Грэхем полагает, что, скорее всего, нельзя; Кнут считает, что, скорее всего, можно; Паташник благоразумно не компрометирует себя.) 3.1 m=LlgnJ; 1 = п-2т=п-2^п^. 3.2 (a) [X + 0.5J. (б) [х-0.51. 3.3 Это [ran — {ma}n/aj = ran — 1, поскольку 0 < {тех} < 1. 3.4 Что-то, требующее не доказательства, а удачного предположения (я так предполагаю). 3.5 Имеем |_tx^cJ = [n|_xj + n{x}J = n|_xj + [n{x}\ согласно (3.8) и (з.б). Следовательно, |_nxj = n|_xj <=^> |_n{x}J = 0 4=> 0 ^ п{х} < 1 <=> {х} < 1/п, в предположении, что п— положительное целое число. (Заметим, что в этом случае n|_xj ^ |_nxj при всех х.) з.б |f(*)J = |f(M)J- 3.7 |_n/mJ + n mod m. 3.8 Если в каждом из ящиков содержится < |~п/га~| предметов, топ^ (Гп/т] — 1) т, так что n/m+1 ^ [тг/та], что противоречит (З-б)- Доказательство второго факта выполняется аналогично. 3.9 Имеем m/n — 1/q = (n mumble m)/qn. Данный процесс должен завершаться, поскольку 0 ^ n mumble га < га. Знаменатели в таком представлении строго возрастают, а следовательно, они различны, так как qn/(n mumble га) > q. 3.10 |~х + j\ — [(2х + 1 )/4— не целое] — это ближайшее целое к х, если {х} ф j] в противном случае это ближайшее четное целое число. (См. упр. 2.) Таким образом, данная формула дает "несмещенный" способ округления. 3.11 Если п— целое число, то а < п < (3 <=> |_aJ < п < ГР~|. Количество целых чисел, удовлетворяющих условию а < n < b при целых а и Ь, равно (Ъ — а— 1 )[Ъ > а]. Поэтому, если бы было а = (3 = целое, мы бы получили неверный ответ. 3.12 Вычтем из обеих частей [тг/mj в соответствии с (з«6) и получим |"(n mod га)/га] = [{п mod га + га — 1 )/raJ. Теперь обе части равны [n mod га > 0], поскольку 0 ^ n mod га < га.
А Ответы к упражнениям 607 Более короткое, но менее прямое доказательство состоит в наблюдении, что первый член (3-24) должен быть равен последнему члену в (з-2б)- 3.13 Если они образуют разбиение, то формула для N(a,n) из текста влечет за собой 1 /сх +1/(3 = 1, поскольку коэффициенты при п в уравнении N(<x,n) + N((3,11) = п должны быть согласованы так, чтобы данное уравнение выполнялось при больших п. Следовательно, числа а и (3 либо оба рациональны, либо оба иррациональны. Если они оба иррациональны, то мы получаем разбиение, как показано в тексте. Если же оба они могут быть записаны с числителем га, то значение га — 1 не встретится ни в одном из спектров, a m будет находиться в обоих. (Однако Го- ломб (Golomb) [151] обнаружил, что множества {[naj | п ^> 1} и {|~п|3~| —1 | п ^> 1} всегда образуют разбиение, когда 1/а+1/|3 = 1.) 3.14 При тгу =0 это очевидно из (3-22); в противном случае это истинно на основании (3.21) и (з-6). 3.15 Подставьте [rax] вместо п в (3-24)- |"ttlx] = |~х] + |~х— ^] -+- •••+г*-^1- 3.16 Можно убедиться в справедливости формулы n mod 3 = 1 + ^((си — 1)сип — (си -f 2)си2п), проверив ее при 0 ^ п < 3. Общая формула для п mod m при любом целом положительном га приводится в упр. 7.25. 3.17 Ij)k[0^k<m][1^j^x + k/m] = ?.>1с[0 < k < т][1 <: j <: M][k^m(j -х)] = LKKM Ы° ^ к < т] - ?\=Гх1 ^к[0 <: к < m(j — х)] = т|~х] — |~т([У| — х)] = —1~—rax] = |_гах_|. 3.18 Имеем S = Y_ ^[ja"4lc<(j+v)a-1]. 0^j<|"nal k$m Если j ^ noc — 1 ^ not — v, вклад отсутствует, потому что (j + v)cx_1 ^ п. Следовательно, j = |na|— единственный имеющий значение случай, и искомая величина в этом случае равна |~(|naj +v)ar1] -п^ [voc-1]. 3.19 Данное равенство выполняется тогда и только тогда, когда b— целое число. (Если Ъ целое, logb х— непрерывная возрастающая функция, которая принимает целочисленные значения только в целых точках. Если Ъ не целое, условие не выполняется при х = Ъ.) 3.20 Имеем 2Zkkx[a^kx^ PI = хИкк[ГаА1 ^к^ LPAJ], что в сумме дает ^x(|_(3/xj [РА+ 1J — \ос/х] \<х/х — 1]).
608 Ответы к упражнениям 3.21 Если Ю11 ^ 2м < 10n+1, то имеется ровно п + 1 таких степеней 2, поскольку для каждого к имеется только одна такая степень 2 из к цифр. Так что ответ— 1 + [Mlog2J. Примечание: найти количество степеней 2, начинающихся с цифры I > 1 более сложно; оно равно 21о<п<м(1.п10ё2—loglJ- Luk^ - log(l+1)J). 3.22 Все члены при п и п — 1 одинаковы, за исключением к-го, где п = 2k_1 q и q нечетное; имеем Sn = Sn_i +1 и Тп = Тп_т + 2kq. Следовательно, Sn = п и Tn = п(п + 1). 3.23 Xn = m <=> jm(m-l) < n ^ ^m(m+1) <=> m2-m + \ <2n<m2 + vcl+\ <Ф=Ф m-^ < \/2n < m+^. 3.24 Пусть (3 = a/((x+ 1). Тогда число вхождений целого неотрицательного га в Spec(P) ровно на единицу больше количества его вхождений в Spec(cx). Почему? Потому что N(|3,n) = N(a,n)+n+1. 3.25 Если бы мы могли, продолжая начатое в тексте, найти такое значение га, что Km ^ га, то мы бы нарушили указанное неравенство для п+1, когда п = 2та+1 (а также когда п = Зт+1 и п = Зт+2). Но для существования такого га = п'-И требуется, чтобы 2К|^п//2] ^ п/ или ЗК^П//3] ^ тг;, т.е. чтобы KLn'/2j ^ IV/2J или KLn//3J ^ Ln73J. Ara! Это уводит нас все дальше и дальше, приводя к тому, что К0 ^ 0; но К0 = 1. Что нам действительно нужно доказать, так это то, что Кп строго больше тг для всех тг > 0. Это легко доказывается по индукции, несмотря на то, что это более сильный результат, чем тот, который мы не могли доказать! (Данное упражнение преподает нам важный урок. Это в большей степени упражнение, посвященное природе математической индукции, чем свойствам функции "пол") 3.26 Воспользуйтесь доказательством по индукции с более сильной гипотезой D-qi ^ (ч-Ч(я= тг+1 -1 при тг ^ 0. 3.27 Если D 3mb - а. (3) (3) = 2mb — а, где а равно 0 или 1, то D^_jim = "Когда вы пытаетесь найти доказательство при помощи математической индукции, оно может не удаваться вам по двум противоположным причинам. Оно может не удаваться потому, что вы пытаетесь доказать слишком много: ваше Р(п + 1) — слишком тяжелый груз. Неудача может быть вызвана и тем, что вы пытаетесь доказать слишком мало: ваше ?{п) — слишком слабая опора. В общем случае вы должны сбалансировать утверждение своей теоремы так, чтобы опора была как раз достаточной для груза" — Г. Пойа (G. Polya) [297]
А Ответы к упражнениям 609 3.28 Ключевое наблюдение заключается в том, что an = т2 влечет за собой an+2k+i = (та + к)2 + m — к и an+2k+2 = (та + к)2 + 2га при 0 ^ к ^ га; следовательно, an+2m+i = (2га)2. Решение может быть записано в красивом виде, найденном Карлом Уитти (Carl Witty): an_! = 2l + n- l где21 + 1<Сп<21+1 +1+1. 3.29 Величина D(a/> [ocn\) не превышает максимума абсолютного значения выражения s(oc\[rioc\)v/) = — s(a,n,v) — S + е +{0 или 1} + v' —{0 или 1}. 3.30 По индукции Хг сх2П + ос-2" и X п — целое число. 3.31 Вот "элегантное" "впечатляющее" доказательство (непо- Эта логика просто нятно, каким образом оно было открыто): валит с ног на пол! 1 0 2 1 L*J + M + L* + yJ = L*+Mj + L* + yJ ^ = [2x+L2yJJ = L2xJ + L2yJ. Но есть простое графическое доказательство, основанное на том наблюдении, что требуется рассмотреть только случай 0 ^ х, "у < 1. Тогда соотношение графически можно изобразить следующим образом: < Возможен и несколько более сильный результат, а именно M + M + L* + yJ ^ r2xl + L2yJ; но он сильнее только при {х} = ^. Если заменить [х,у) на (— х, х + у) и применить рефлексивный закон (з«4)> то можно получить LyJ + l* + yJ + |2*J ^ |xJ + |2* + 2yJ. 3.32 Обозначим интересующую нас сумму как f(x). Поскольку f(x) = f(— х), можно считать, что х ^ 0. Члены суммы ограничены величиной 2к при к —> —со и величиной х2/2к при к —> +оо, так что сумма существует при любом действительном х.
610 Ответы к упражнениям Имеем f(2x) = 2?k2k-1 \\х/2^1|2 = 2f(x). Пусть f(x) = 1(х) + г(х), где 1(х)— исходная сумма при k ^ 0, а г(х)— исходная сумма при к > 0. Тогда 1(х + 1) = 1(х) и l(x) ^ 1/2 при всех х. Если 0 ^ х < 1, то г(х) = х2/2 + х2/4 + • • • = х2 и г(х+1) = (х-1)2/2+(х+1)2/4+(х+1)2/8 + ... = х2 + 1. Следовательно, f (х + 1) = f (х) + 1, если 0 ^ х < 1. Теперь по индукции можно доказать, что f (x+n) = f (х)+п при всех целых п ^ 0, когда 0 ^ х < 1. В частности, f (п) = п. Поэтому в общем случае f(x) = 2~mf(2mx) = 2"m[2mxJ + 2"mf({2mx}). Ho f({2mx}) = l({2mx}) +r({2mx}) <C \ + 1; так что |f(x) - x| ^ |2"m|_2mxJ - x| + 2~m • | ^ 2"m • § при любом целом га. Неизбежный вывод заключается в том, что f (х) = |х| для всех действительных х. 3.33 Пусть г = п— j— радиус окружности, (а) Между клетками доски 2п — 1 горизонтальных и 2п — 1 вертикальных линий, причем окружность пересекает каждую из них дважды. Поскольку г2 — не целое число, теорема Пифагора утверждает, что окружность не проходит ни через один угол клетки. Следовательно, окружность проходит через столько клеток, сколько имеется ее пересечений с прямыми, а именно 8п — 4 = 8г. (Эта же формула дает количество клеток по краям доски.) (б) ^гцк) = 4[Vr2-k2J. Из (а) и (б) следует, что ±тгг2-2г <: ]Г [\/r2-k2J <: \ш2, т = п-\. 0<к<г Задача получения более точных оценок этой суммы представляет собой знаменитую проблему теории чисел, которой занимались Гаусс (Gauss) и многие другие; см. Диксон (Dickson) [78, т. 2, гл. б]. 3.34 (а) Пусть m = [lgn]. Можно добавить еще 2т — п членов для упрощения вычислений в граничных точках: f(n) + (2m-n)m = 2jlgl<l = ?j[j = rigkl][1<Ck^2™] - k=l j,k = ^j[2J-i<k^2n[Uj^m] = m = Jj^"1 = 2m(m-1) + 1. Следовательно, f (n) = nm — 2m + 1.
А Ответы к упражнениям 611 (6) Имеем \п/2] = [[п + 1)/2_|, откуда следует, что решение рекуррентного соотношения g(n) = a(n)+g([n/2~|)+g([n/2J) должно удовлетворять соотношению Ag(n) = Aa(u)+Ag(|ri/2J). В частности, если a(n) = п — 1, то соотношению Af(тг) = 1 + Af([n/2J) удовлетворяет количество битов в двоичном представлении тг, а именно [lg(n+ 1)]. Теперь осталось перейти от А к I. Более прямое решение может быть основано на соотношениях flg2jl - TlgJl + 1 и |Tg(2j - 1)1 = llgjl + [j > 1] для j JH. 3.35 (тг + 1 )2п! е = An + (n + 1 )2 + (тг + 1) + Вп, где _ (n+1)2n! (n + 1)2n! (n+1)2n! Лп " 0! + il +'"+ (n-1)! кратно n, а _ (n + 1)2n! (n+1)2n! (n + 2)! + (n + 3)! +'" _ "+1^ + -U+, J, + -K n + 2\ n + 3 (n + 3)(n + 4) n+1( 1 1 < n + 2\ +n + 3 +(n + 3)(n + 3)+' = (n+1)(n + 3) (n + 2)2 меньше 1. Следовательно, искомый ответ— 2 mod п. 3.36 Сумма равна Y_ 2-4"m[m=LlglJ][l=Llg^J][K^<22n] = k,l,m = YL 2-l4-m[2m^l<2m+,][24lc<2l+,][0^m<n] = k,l,ra = ^4-m[2m^l<2m+1][0^m<n] = l,m = ^2"m[0^m<n] - 2(1-2"n). 3.37 Сначала рассмотрите случай m < n, который распадается на подклассы в зависимости от того, меньше ли т, чем \п\ затем покажите, что обе части изменяются одинаково при увеличении га на п.
612 Ответы к упражнениям 3.38 Не более одного х^ может быть нецелым. Отбросим все целые xic и предположим, что остается п чисел. Если {х} ф О, то среднее значение {rax} при га —» со лежит между \ и \; следовательно, {raxi} Н + {raxn} — {raxi Н (- mxn} не может иметь нулевого среднего значения при п > 1. Это доказательство основано на сложной теореме о равномерном распределении. Однако возможно и элементарное доказательство, набросок которого для п = 2 приведен далее. Пусть Рт— точка ({rax},{ray}). Разделим единичный квадрат 0 ^ х, у < 1 на треугольные области А и В, для которых х + у < 1 и х + у J> 1. Мы хотим показать, что Рт Е В при некотором га, если {х} и {у} ненулевые. Если Pi е В, то показывать больше ничего не надо. В противном случае найдется круг D радиусом е > 0 с центром в Рт, такой, что D С А. В соответствии с принципом Дирихле, если N достаточно велико, последовательность Pi, ..., Pn должна содержать две точки с \?^ — Pj| < е и к > j. ?'\f\:l\ Отсюда следует, что Pk-j-i лежит в е-окрестности точки (1,1) — Рт; следовательно, Pk-j-i Е В. 3.39 Замените j на b — j и добавьте к сумме член j = 0, так что для вычисления суммы по j можно воспользоваться упр. 15. В результате члены [x/bkl-[x/bk+1]+b-1 телескопируются при суммировании по к. 3.40 Пусть |_2y/i\| = 4к 4- г, где —2 ^ г < 2, и пусть га = [у/п\. Тогда по индукции можно доказать следующие соотношения. Сегмент wk sk Nk г -2 -1 0 1 m 2k-1 2k-1 2k 2k X тп(та+1)— n— k -k n—тп(т.+1 )+k k У k m(m+1)—n+k -k n—m(m+1)—k тогда и только тогда, когда (2k—1 )(2k—1 Kn^(2k-1 )(2k) (2k-1)(2k)<n<(2k)(2k) (2k)(2kKn^(2k)(2k+1) (2k)(2k+1 )<n<(2k+1 )(2k+1) Таким образом, когда k ^ 1, W^ представляет собой сегмент длиной 2k—1 там, где путь идет на запад и у (n) = k; Sk представляет
А Ответы к упражнениям 613 собой внутренность сегмента длиной 2к там, где путь идет на юг и х(п) = —к; и т.д. (а) Таким образом, искомая формула имеет вид y(n) = (-l)mf(n-m(m+1))-[L24/nJ нечетное] - Г^ттгЛ . (б) На всех сегментах к = тах(|х(п)|>|'у(тг)|). На сегментах W^ и Sk имеем х<-уипН-х + "у= m(m + 1) = (2к)2 — 2к; на сегментах Eic и Nic имеем х^уип — х — у = m(m + 1) = (2к)2 + 2к. Следовательно, знак определяется по формуле (—])^хМ<уМ\ 3.41 Поскольку 1 /ф + 1 /ф2 = 1, указанные последовательности действительно разбивают все положительные целые числа. Поскольку условие g(n) = f(f(n))-f1 определяет f и g единственным образом, нам надо только показать, что |_|_пф]ф] + 1 — |_ПФ2] АЛЯ всех п > 0. Это следует из упр. 3 при а = фип = 1. 3.42 Нет. Рассуждение, подобное приведенному в тексте и в упр. 13, показывает, что разбиение на три части имеет место тогда и только тогда, когда 1 /ос + 1 /|3 + 1 /у = 1 и для всех п > 0. Но по теореме о равномерном распределении среднее значение последовательности {(п + 1)/сх} равно 1/2, если а иррационально. Все параметры не могут быть рациональными, а если у = m/n, то среднее значение равно 3/2 — 1/(2тг). Следовательно, у должно быть целым числом, но это тоже не годится. (Имеется также доказательство невозможности, использующее только простые принципы, без привлечения теоремы о равномерном распределении; см. [155].) 3.43 Один шаг развертывания рекуррентности для чисел Кп дает минимум из четырех чисел 1 + а + а- Ъ • K|_(n_i_a)/(a.b)j, где а и b могут быть равны либо 2, либо 3 каждое. (Это упрощение требует применения правила (з-и) АЛЯ удаления полов внутри полов вместе с тождеством x+min('y) z) = min(x+'y> x-f z). Следует опустить члены с отрицательными индексами, т.е. те, у которых п — 1 — a < 0.) Продолжая в том же духе, мы приходим к следующей интерпретации: Кп — наименьшее число > п в мультимножестве S всех чисел вида 1 + си + си а2 + а] а2а3 Н Ь си а2а3 ... ат,
614 Ответы к упражнениям где m ^ 0 и каждое а^ равно 2 либо 3. Так, в мультимножестве S - {1,3,4,7,9,10,13,15,19,21,22,27,28,31,31,...} число 31 встречается дважды, поскольку оно имеет два представления 1 +2 + 4 + 8 + 16 = 1 +3 + 9 + 18. (Кстати, Майкл Фредман (Michael Predman) [134] показал, что Нп^—юо Kn/ti — 1, т.е. между элементами S нет слишком больших промежутков.) 3.44 Пусть <4Ч) = Dj^J, mumble(q-1), так что D^' = (qD^J, + dkq))/(q-1)HQ^q) = rD^Aq-l)!. Тогда D^', ^ (q-1)n <^ a^ ^ n> откуда вытекает искомый результат. (Это решение найдено Эйлером (Euler) [116], который устанавливал and последовательно, не догадываясь, что можно обойтись одной последовательностью Dn .) 3.45 Пусть a > 1 удовлетворяет условию a+ 1/а = 2т. Тогда Слишком находим, что 2Yn = ос2 + ос-2 , и отсюда вытекает, что Yn = просто... К/21. 3.46 Данное указание вытекает из (з-9)> поскольку 2п(п + 1) = [2(n+l)2J. Пустьп + 9 = (ч/21 + \/21"1)тип, + е/-(ч/21+1 + >/21)т, где 0 ^ 9,9' < 1. Тогда 9' = 29 mod 1 = 29 - d, где d равно 0 или 1. Мы хотим доказать, что п' = [>/2(тг + ^)J; это равенство выполняется тогда и только тогда, когда 0 ^ 9/(2-V/2) + \/2(l-d) < 2. Что касается решения рекуррентного соотношения, то обратите внимание, что Spec(1 + 1 /л/2) и Spec(1 + \/2) образуют разбиение положительных целых чисел; значит, любое положительное целое число а может быть единственным образом записано в виде a = [{у/2 +V2l~,)m\, где I и m— целые числа, причем га нечетное, а I ^ 0. Отсюда вытекает, что L-j-l — [(л/2 + x/2l+n"Vj. 3.47 (а) с = — \. (б) с— целое, (в) с = 0. (г) с— произвольное число. В ответе к упр. 1.2.4-40 в [207] получены более общие результаты. 3.48 Пусть х:0 = 1 и x-(k+1) = x|_x,kJ; а также пусть а^ = {х,к} и bk = |x:kJ. Тогда указанное тождество принимает вид х3 = Зх*3 +3си а2 + а3 — 3bib2 + Ъ3. Поскольку а^ + bi< = x:k = xb^-i для k ^> 0, имеем (1 —xz)(l + biz+b2Z2H ) = 1 — aiz— azz2 .
А Ответы к упражнениям 615 Таким образом, 1 Более интересная (и еще не решенная) задача: выяснить, когда заданное мультимножество определяет неупорядо ценную пару {ос, (3}, если и а, и (3 меньше 1. -XZ 1 +b1z + b2z2 + 1 — СИ Z — Q2Z2 — Возьмем логарифм от обеих частей, чтобы отделить а от Ь. Затем продифференцируем по z и получим XZ CLl +2d2Z + 3ci3Z2 1 — cnz— CL2Z2 - Ъ) +2b2z + 3b3z2 + 1 +b1z + b2z2 + -- Коэффициент при zn_1 в левой части равен хп; в правой части для этого коэффициента имеется формула, совпадающая с нашим тождеством при п = 3. Можно вывести аналогичные тождества и для более общего произведения XoXi ... xn_i [170]. 3.49 (Решение Генриха Роллетчека (Heinrich Rolletschek).) Можно заменить (а, (3) на ({(3), сх+ [(3J) без изменения [noc\ + |_п|3_|. Следовательно, условие a = {(3} является необходимым. Оно же и достаточно: пусть m = [PJ — наименьший элемент данного мультимножества и пусть S— мультимножество, полученное из заданного вычитанием ran из n-го в порядке возрастания элемента при всех п. Если сх = {(3), то последовательные элементы S отличаются либо на 0, либо на 2; следовательно, мультимножество jS = Spec (ос) определяет а. 3.50 Согласно неопубликованным заметкам Уильяма О. Вича (William A.Veech), достаточно, чтобы сх|3, (3 и 1 были линейно независимы над множеством рациональных чисел. 3.51 Как замечает Г. С.Вильф (H.S.Wilf), функциональное уравнение f(x2 — 1) = f(x)2 определяло бы f(x) для всех х ^ ф, если бы функция f (х) была задана на произвольном интервале (ф..ф + е). 3.52 Существует бесконечное количество способов разбиения всех положительных целых чисел на три или более обобщенных спектров при иррациональных ai<, например Spec(2oc; 0) U Spec(4oc; -a) U Spec(4cx; -За) U Spec((3; 0). Но в точном смысле все эти разбиения возникают в результате "расширения" базового Spec(cx) USpec((3); см. [158]. Все известные разбиения с рациональными ос^, например Spec(7; -3) U Spec(?; -1) U Spec(^; 0),
616 Ответы к упражнениям используют параметры, как в сформулированном предположении, которое принадлежит А. С. Френкелю (A. S. Praenkel) [128]. 3.53 Частичные результаты рассматриваются в [95, с. 30-31]. Жадный алгоритм, вероятно, не завершается. 4.1 1,2,4, 6, 16, 12. 4.2 Заметим, что rap+np = min(mp)rLp)+max(mp>rLp). Рекуррентное соотношение НОК(ггцп) = (nmodm) HOK(n mod m, m) корректно, но на практике для вычисления НОК непригодно; лучший известный способ вычисления НОК(ггцп) состоит в вычислении НОД(тгцп) и делении ran на полученное значение. 4.3 Это справедливо для целого значения х, но я(х) определена для действительных чисел х. Правильная формула— тс(х) — 7т(х — 1) = [[xj — простое число] ; в ее корректности очень легко убедиться. 4.4 Между дробями ^ и S\ оказалось бы отраженное слева направо дерево Штерна-Броко с отрицательными знаменателями у всех дробей и т.д. Так что получившееся в результате дерево содержало бы все дроби тп/п с m 1 п. Условие m'n — ran/ = 1 в процессе построения остается справедливым. (Такая конструкция называется венком Штерна-Броко, поскольку для удобства последнюю дробь у можно считать идентичной первой дроби у, соединяя тем самым наверху деревья в замкнутый круг. Венки Штерна-Броко находят интересные применения в машинной графике, поскольку с их помощью можно представить любое рациональное направление на плоскости.) 4.5 Lk = (01) и Rk = (kl); это справедливо даже при к < 0. (Общая формула для любого произведения матриц L и R будет найдена в главе 6.) 4.6 a = b. (В главе 3 определено х mod 0 = х, в первую очередь для того, чтобы это было именно так.) 4.7 Для этого необходимо, чтобы m mod 10 = 0, m mod 9 = k и m mod 8 = 1. Ho m не может быть одновременно и четным, и нечетным. 4.8 Надо, чтобы 10х + 6у = 10х + у (mod 15); следовательно, 5у = 0 (mod 15); откуда у = 0 (mod 3). Должно быть у = 0 или 3 и х = 0 или 1. 4.9 32k+1 mod 4 = 3, так что (32k+1 — 1 )/2 нечетное. Указанное число делится на (З7 — 1 )/2 и (З1 ] — 1 )/2 (и на другие числа).
А Ответы к упражнениям 617 4.10 999(1 -1)(1 -37) =648. 4.11 (т(0) = 1, а(1) = — 1, ст(п) = 0 при п > 1. (Обобщенные функции Мёбиуса, определенные на произвольных частично упорядоченных множествах, обладают интересными и важными свойствами, впервые установленными Вейснером (Weisner) [366] и развитыми многими другими, в особенности Джан-Карло Рота (Gian-Carlo Rota) [313].) 4.12 Ld\mLlc\d^dA)g(lc) = Llc\m2Id\(m/lc)^d)g(lc) = ^kXmg(k)[m/k=l] = g(m) согласно (4.7) и (4.9). 4.13 (a) np ^ 1 при всех p; (6) \i[n) Ф 0. 4.14 Истинно при k > 0. Используйте (4.12), (4.14) и (4.15). 4.15 Нет. Например, en mod 5 = [2илиЗ]; enraodll = [2,3,7 или 10]. 4.16 l/e1+l/e2 + ...+l/en-l-l/(en(en-l))=l-l/(en+1-l). 4.17 Имеем fn mod fm=2; так что HOA(fn, fm)= НОД(2, fm)=1. (Кстати, соотношение fn = fof 1 ... fn-i + 2 очень похоже на рекуррентное соотношение, определяющее числа Евклида еп.) 4.18 Если и = qm и q нечетное, то 2П 4- 1 = (2т + 1 )(2п~т - 2п-2т + 2т + 1). 4.19 Первая сумма равна 7i(n), поскольку ее общий член— [к+ 1 — простое число]. Внутренняя сумма во втором равенстве представляет собой Xj^i^-nJkYra], так что она больше 1 тогда и только тогда, когда m— составное число; и мы снова получаем 7г(п). Наконец, [{m/n}] = [n\m], так что третья сумма представляет собой приложение теоремы Вильсона. Но, конечно же, вычисление 7t(n) по любой из приведенных формул— безумие. 4.20 Пусть pi = 2 и пусть рп— наименьшее простое число, большее, чем 2Рп~1. Тогда 2Pn~1 < pn < 2Pn-1+1, откуда следует, что можно взять b = linin-^oo lg(n) у-п, где lg(n) представляет собой функцию lg, итерированную п раз. Указанное числовое значение получается из р2 = 5 и рз = 37. Оказывается, что Р4 = 237 + 9, что дает более точное значение Ъ « 1.2516475977905 (но не дает ключ к значению ps). 4.21 В силу постулата Бертрана Рп < 10п. Пусть К = ^10-k2Pk = .200300005...
618 Ответы к упражнениям Тогда 10п2К = Рп + дробь (mod Ю271"1). 4.22 (bmn - 1 )/(Ъ - 1) = ((bm - 1 )/(b - 1))(bmn~m + ... + 1). (Числа вида (10p — 1 )/9 являются простыми при р < 49081 только при значениях р = 2, 19, 23, 317, 1031.) Числа такого вида носят название "повторнйцы" ("repunits"). 4.23 p(2k+1) = 0 и р(2к) = р(к) +1 при к ^ 1. Можно показать по индукции, что р(п) = р(п — 2т), если п > 2т и т > р(п). На k-м шаге перекладывается р(к)-й диск башни, если перенумеровать диски как 0, 1,...,п—1. Если к представляет собой степень 2, то понятно, что это так. А если 2m < k < 2т+1, то р(к) < га; к-е и к — 2т-е перемещения соответствуют друг другу в последовательности перекладываний, перемещающей m + 1 дисков за Тт + 1 + Тт шагов. 4.24 Цифра, которая вносит вклад dpm в п, вносит в ер(п!) вклад dpm-1 Н hd = d(pm —1)/(р —1), следовательно, ер(тг!) = (n-vp(n))/(p-1). 4.25 При всех р справедливо тп\\тг <=> гар = 0 или тр = пр. Отсюда следует, что (а) истинно. Однако (б) ложно— например, для нашего любимого примера та = 12 и п = 18. (Это распространенное заблуждение.) 4.26 Да, поскольку последовательность Sn определяет поддерево дерева Штерна-Броко. 4.27 Дополните более короткую строку символами М (поскольку М лежит в алфавите между L и R), пока обе строки не станут одинаковой длины, а затем сравнивайте строки в алфавитном порядке. Например, верхние уровни дерева упорядочены следующим образом: LL < LM < LR < ММ < RL < RM < RR. (Другое решение заключается в добавлении к строкам бесконечной строки RL°° и сравнении до нахождения L < R.) 4.28 Нам надо воспользоваться только первой частью этого представления: RRRLLLLLLLRRRR R R 11147101316192225476991 ЦЗ U5 1ЧЧЧ»2» 3 > 4 > 5 ' 6 > 7 > 8 > 1 5 > 22 > 29 > 36 > 43 > * * * Дробь у имеется здесь потому, что она оценивает значение тс сверху лучше, чем ^, а не потому, что она ближе, чем у. Аналогично ^р- является лучшей нижней границей, чем у. Здесь наличествуют все простейшие верхние и нижние границы, но очередное действительно хорошее приближение не встретится до тех пор, пока строка символов R не перейдет обратно в строку символов L.
А Ответы к упражнениям 619 4.29 1 /ос. Чтобы получить 1 — х из х в двоичной записи, мы заменяем все 0 на 1, и наоборот; чтобы получить 1/а из а в записи Штерна-Броко, мы заменяем все L на R, и наоборот. (Следует также рассмотреть случаи с конечным количеством символов, но они также должны работать, поскольку данное соответствие сохраняет упорядочение.) 4.30 Поскольку m целых чисел х G [А.. А + та) различны по модулю та, то их остатки (х mod mi,..., х mod таг) пробегают все mi ... таг = m возможных значений, одно из которых должно быть равно (си mod mi,..., ar mod mr) в силу принципа "голубиных гнезд'.' 4.31 Число, записанное в системе счисления с основанием Ъ, делится на d тогда и только тогда, когда сумма его цифр делится на d, при условии, что b = 1 (mod d). Это следует из того, что (ат ... а0)ь = атЪт + • • • + а0Ъ° = ат + • • • + а0. 4.32 Система ср(та) чисел {kn mod та | k_LmH0^k<m} представляет собой систему чисел {k | к_1таи0^к<та}в некотором порядке. Перемножьте их и поделите на По<к<т k_Lm^- 4.33 Очевидно, что Н(1) = 1. Если та _1_ п, то h(mn) = X. f(d)g(mn/d) = ^ f(cd) g((m/c)(n/d)) = d\ran c\m,d\n = II*)9Wc)f((i)g(n/d); c\m d\n это равно H(m) h{n), так как в каждом члене этой суммы с JL d. 4.34 g(m) = Ld\mf(d) = Ld\mf(m/d) = Ld^i f(m/d), если функция f (x) равна нулю при нецелом значении х. 4.35 Начальные условия представляют собой 1(0, п) = 0; I(m,0) = 1. При та, п > 0 имеются два правила, первое из которых тривиально при та > п, а второе— при та < п: I(m,n) = I(m,Timod та) — Ln/mJI(n mod та, та); 1(та,тг) = I(mmodn,n). 4.36 Разложение любой из заданных величин на необратимые множители должно содержать та2 — Ютг2 = ±2 или ±3, но это невозможно по модулю 10.
620 Ответы к упражнениям 4.37 Пусть an = 2"nln(en - \) и Ъп = 2"nln(en + \). Тогда еп = L^ + iJ <^> ап <: 1пЕ < bn. Но an_i < ап < bn < bn_i, так что можно взять Е = Цтп_юо eQn. На самом деле оказывается, что представляет собой произведение, которое быстро сходится к значению (1.26408473530530111 ... )2. Но эти наблюдения не позволяют выяснить, чему равно число еп, если только мы не сможем найти другое выражение для Е, не зависящее от чисел Евклида. 4.38 Пусть г = n mod m. Тогда an-bn = (am-bm)(an-mb° + an-2mbm + --- + arbn-m-r)+ + bmLn/mJ(ar-br). 4.39 Если си ... at и bi ... bu— полные квадраты, то таковым же является и число си ...atbi ...bu/c^...c2, где {си,..., at} П {bi,..., bu} = {ci,..., cv}. (Фактически можно показать, что последовательность (S(1),S(2))S(3),...) содержит каждое непростое положительное целое число ровно один раз.) 4.40 Пусть f(n) - rW^n>Pxick = n!/pL-/PJLn/pJ! и g(n) = n!/p?p(n,). Тогда g(n) = f(n)f(Ln/pJ)f(Ln/p2j)... = f(n)g(|n/pj). Кроме того, f(n) = a0!(p - 1)!Ln/pJ = a0!(-1)Ln/pJ (mod p), и ep(n!) = [n/pj + ep(|ri/pJ0- Эти рекуррентные соотношения позволяют легко доказать требуемое по индукции. (Возможны и иные решения.) 4.41 (а) Если п2 = —1 (modp), то (п2)(р_1)/2 = — 1; но теорема Ферма гласит, что это hi. (б) Пусть п = ((р - 1)/2)!; тогда n = (-l)^"1)/2 П^к<Р/2(Р " к) = (р — 1 )!/п, следовательно, п2 = (р — 1)!. 4.42 Для начала заметим, что k JL I <=> к _L 1+ ak для любого целого а, так как НОД(к, I) = НОД(к, 1+ ак) в соответствии с
А Ответы к упражнениям 621 John .316 Такой лозунг можно было видеть на чемпионате 1993 года, когда в игру вступил Джон Крук. Зато коэффициент .333 — всего трех. Но все это мелочь по сравнению с 667 ударами, необходимыми для достижения коэффициента .999 (или .001). — Переводчик алгоритмом Евклида. Итак, m 1 п и n/ _L п <!==$> mn/ _L n nvn/ -f-nm/ _L n. Аналогично m/ _L n' и n _L n' Следовательно, m _1_ n и m/ _L n' и n _L n/ ran/ + nm/ _L n'. mn'+nm/ _L nn'. 4.43 Надо выполнить умножение на L_1R, затем на R_1L_1RL, затем на L_1R, затем на R_2L_1RL2 и т.д.; тг-й множитель равен R_p^n^L_1RLp^rL^, поскольку мы должны сократить р(тг) R. AR—L-'RL- = (?2-;i). 4.44 Можно найти простейшее рациональное число, лежащее в интервале [0.3155.. 0.3165) 631 633 L2000 ' * 2000 ). просматривая представления Штерна-Броко дробей j^ и ^^ и останавливаясь непосредственно перед тем, как в первой из них встречается символ L, а во второй— символ R: (тьги,т2,п2) := (631,2000,633,2000); пока mi > rii или m2 < тг2 выполнять если т2 < п2 то (вывод(Ь); (ги,п2) := (тгьп2)-(mbm2)) иначе (вывод(R); (mbm2) := (mbm2) - (тгьтг2)). Искомый результат— LLLRRRRR = у^ « .3158. Кстати, коэффициент .334 требует по меньшей мере 287 ударов. (Приведенный алгоритм дает неверный результат, когда простейшей дробью оказывается правая граница интервала (рассмотрите, например, значения 0.187 и 0.188— для них приведенный алгоритм даст одно и то же значение LLLLLRR (3/16), в то время как для 0.187 правильным ответом является LLLLLRRLRRR (14/75)). Для получения корректного ответа следует добавить к строке представления правой границы бесконечную строку LRRR... (так как правая граница не может быть решением). Провести коррекцию алгоритма несложно — достаточно в двух местах заменить сравнение т2 < п2 на т2 ^ п2.— Переводчик.)
622 Ответы к упражнениям 4.45 x2=x(mod10n) <^=> х(х- 1) = 0 (mod 2П) и х(х- 1) = О (mod5n) <=> xmod2n = [0или1] и х mod 5П = [0или1]. (Последний шаг оправдан, поскольку х(х — 1) mod 5 = 0 означает, что либо х, либо х— 1 кратно 5; в этом случае другой множитель взаимно прост с 5П и может быть выделен из данного сравнения.) Так что имеется не более четырех решений, (х = 0 и х = 1) нельзя рассматривать как "n-значное число" кроме разве что случая п = 1. Два другие решения имеют вид х и 10п + 1 — х, и как минимум одно из этих чисел ^ 10п-1. При п = 4 вторым решением является трехзначное число 10001 — 9376 = 625. Мы ожидаем, что два п-значных решения будут примерно у 80% всех п, но это предположение еще не доказано. (Подобные самовоспроизводящиеся числа называются ав- томорфными.) 4.46 (а) Если j'j -k'k = НОД(),к), то пк,кпН0А(ьк) = п>'> = 1 и пк к = 1. (б) Пусть и = pq, где р— наименьший простой делитель числа п. Если 2п = 1 (mod п), то 2п = 1 (mod р). Кроме того, 2Р-1 = 1 (modp); следовательно, 2Н0А^"1'п) = 1 (modp). Но НОД(р — 1,п) = 1 по определению р. 4.47 Если nm-1 = 1 (mod m), то должно быть n _L та. Если пк = п) при некоторых 1 ^ j < к < та, то nk~i = 1, так как мы можем выполнить деление на т0. Таким образом, если не все числа п1 mod та, ..., nm_1 mod та различны, существует к < та— 1, для которого nk = 1. Наименьшее такое к делит та — 1 согласно упр. 46, а. Но тогда kq = (та— 1 )/р при некотором простом р и некотором положительном целом числе q; но это невозможно, так как nkq ф 1. Поэтому все числа n1 mod та, ..., nm-1 mod та различны и взаимно просты с та. Таким образом, числа 1, ..., та— 1 взаимно просты с та, и та должно быть простым. 4.48 Попарно объединяя числа с обратными к ним, можно свести произведение (mod m) к rii^n<m,n2modm=i п- Теперь можно воспользоваться нашим умением решать уравнения n2 mod та = 1. С помощью модулярной арифметики выясняется, что искомый результат равен та — 1, если та = 4, рк или 2рк (р > 2); в противном случае он равен +1. 4.49 (а) Либо та < п (Ф(1Ч) — 1 случаев), либо та = п (один случай), либо та > п (вновь Ф(1М) — 1 случаев). Следовательно, R(N) = 2Ф(1Ч) - 1. (б) Из (4.62) получаем 2Ф(1Ч)-1 = -1 + ]Г Li(d)[N/dJL1+N/dJ;
А Ответы к упражнениям 623 следовательно, требуемый результат справедлив тогда и только тогда, когда ^Г |4dHN/dJ =1 при1Ч ?1. А это— частный случай (4-6i), если положить f(x) = [х^ 1]. 4.50 (а) Если f— некоторая функция, то Y_ fM =[ I f(k)[d = HOA(k,m)] = 0^k<m d\m 0^k<m = Y_ Z f(k)[lc/d±m/d] = d\m 0^k<m = YL JL f(kd)[kJLm/d] = d\m 0^k<m/d = X. Y- f(km/d)[kld] . d\m 0<ck<d С частным случаем этого вывода мы знакомы по выводу формулы (4-6з)« Аналогичный вывод выполняется и при замене YL на Y\- Таким образом, имеем zm-i = П(2-ш^ = П П ^-шкт/а) = П^ы, 0^k<m d\m 0^k<d d\m k±d потому что cum/d = e27li/d. Часть (б) следует из части (а) по аналогии с принципом (4.56) для произведений вместо сумм. Кстати, эта формула показывает, что M;m(z) имеет целые коэффициенты, поскольку \Fm(z) получается путем умножения и деления полиномов со старшим коэффициентом 1. 4.51 (х1+.-. + хп)Р=?к1+..+кп=рр!/(к1!...1сп!)х^...^>и коэффициенты делятся на р, за исключением ситуации, когда некоторое kj = р. Следовательно, (xi Н Ь хп)р = х^ Н Ь х? (mod р). Теперь можно положить все х равными 1 и получить тСР = п. 4.52 Если р > п, то и доказывать нечего. В противном случае х _L р, так что xk(p_1 ^ = 1 (mod р); это означает, что по меньшей мере |_(n— 1)/(р — 1)J данных чисел кратны р. А (п—1)/(р —1) ^ п/р, поскольку n^ip.
624 Ответы к упражнениям 4.53 Вначале покажите, что если га ^ 6 и та— не простое число, то (га — 2)! = 0 (mod га). (Если га = р2, то произведение для (га — 2)! включает р и 2р; в противном случае оно включает d и m/d, где d < m/d.) Затем рассмотрите следующие случаи. Случай 0, п < 5. Данное условие выполняется только при п = 1. Случай 1, п^5и п— простое. Тогда (п — 1 )!/(п + 1) — целое число и оно не может быть кратно п. Случай 2, п ^ 5, п— составное и п+1 — составное. Тогда пип+1 делят (п—1)!, ип _L п+1; следовательно, n(n+1)\(n—1)!. Случай 3, п ^ 5, п— составное, а п+ 1 — простое. Тогда (п — 1)! = 1 (mod п + 1) по теореме Вильсона, и |-(n-1)!/(n+1)l = ((n-l)! + n)/(n+1); а это число делится на п. Значит, ответ таков: либо п = 1, либо п ф 4— составное число. 4.54 е2(1000!) > 500 и е5(1000!) = 249, следовательно, 1000! = а • 10249 при некотором целом четном а. Поскольку 1000 = (13000)5, упр. 40 гласит, что а-2249 = 1000I/5249 = -1 (mod 5). Кроме того, 2249 = 2, следовательно, а = 2, а значит, a mod 10 = 2 или 7, так что окончательный ответ— 2-10249. 4.55 Один из способов доказательства— доказательство по индукции того факта, что P2n/Pn(n+^) — целое число. Этот более сильный результат помогает в дальнейшем выполнении индукции. Другой способ основан на доказательстве того, что каждое простое число делит числитель по меньшей мере столько же раз, сколько оно делит и знаменатель. Этот способ сводится к доказательству неравенства 2n п У" [k/mj ^ 4 V" |_V™J > целое m ^ 2, k=1 k=1 которое следует из неравенства I——I + I —I ^ 4| —I + [nmodm = m- 1] - [nmodm = 0]. L ra J LraJ LraJ Последнее неравенство истинно при 0 ^ n < ra, и обе его части увеличиваются на 4 при увеличении п на та. 4.56 Пусть 2п-1 "Die ganzen Zahlen hat der liebe Gott gemacht, alles andere ist Menschenwerk" — Кронекер (Kronecker) [365] f(ra) = ^ nun(k,2n—k)[m\k], k=l
А Ответы к упражнениям 625 п-1 g(m) = ^(2n-2k-1)[m\(2k+1)]. k=1 Количество раз, которое р делит числитель указанного в условии отношения, равно f (р) + f(p2) + f(p3) Н , а число раз, которое р делит его знаменатель, равно д(р) + д(р2) + д(р3) + • • • • Но f (та) = д(та) при нечетном та согласно упр. 2.32. Таким образом, указанное отношение сводится к 2П^П_1^ согласно упр. 3.22. 4.57 Указание предполагает стандартное изменение порядка суммирования, поскольку J2 [d\m] = Y. [m = dk] = [n/d\. I^m^n 0<k^n/d Обозначая сумму в указании через 1(п), получим I(m + n)-I(m)-I(n) = 21 <P(db dGS(m,n) С другой стороны, из (4-54) известно, что 1(тг) = ^тг(тг+1). Следовательно, 1(та 4- тг) — 1(та) — 1(п) = тап. 4.58 Функция f(Ta) мультипликативна, а когда та = рк, она равна 1 +р Н Ьрк. Это значение представляет собой степень 2 тогда и только тогда, когда р — простое число Мерсенна и к = 1. Действительно, к должно быть нечетным, а в этом случае сумма равна (1+р)(1+р2+р4 + ---+рк~1) и (к — 1 )/2 должно быть нечетным и т.д. Необходимое и достаточное условие состоит в том, что та является произведением различных простых чисел Мерсенна. 4.59 Доказательство указания. Если п = 1, то xi = ос = 2, так что нет никаких проблем. Если п > 1, можно считать, что xi <J • • • ^ хп. Случай 1: х^1 Н Нх~11 + (xn —I)-1 ^ 1 и хп > хп_]. Тогда можно найти |3 ^ хп—1 ^ xn_i, такое, что x^j"1 Н Ьх"^ + |3-1 = 1; следовательно, по индукции хп <^ (3 + 1 ^ еп и xi ... xn ^ X] .. .xn_i ((3 + 1) <J г^ ... еп. Существует такое положительное целое число та, что а = xi ...xn/m; следовательно, ос ^ е-\ ... еп = en+i — 1, и мы имеем xi .. ,xn(cx+ 1) ^ е-[ ... enen+i. Случай 2: x^j"1 Н Ьх"^ +(xn — 1)-1 ^ 1 и xn = xn_i. Пусть а = хп и а-1 +(а— I)-1 = (а — 2)-1 + С-1. Тогда можно показать, что а^4и (а — 2)(С + 1) ^ а2- Так что существует некоторое (3 ^ С, такое, что x^j"1 И Ьх~12Н-(а—2)-1 +(3-1 = 1; отсюда по индукции
626 Ответы к упражнениям следует, что xi ...хп ^ x^ .. .хп_2(а - 2)(? + 1)^*1 ...хп_2(а- 2)((3 + 1) ^ е-\ ... еп, и можно завершить доказательство, как и ранее. Случай 3: х^"1 Н Ь*й-1 -h (хп — 1 )-1 < 1. Пусть а = хп и пусть а-1 +а-1 = (а— I)-1 +(3-1. Можно показать, что (а—1)(|3 + 1) > а(а+1), так как это соотношение эквивалентно соотношению аос2 — a2ct + act— а2 + сх+ а > О, которое является следствием неравенства аос(а— а) + (1 + а) а ^ (1 + а) а > а2 — а. Следовательно, можно заменить хп и а на а— 1 и (3, повторяя это преобразование до тех пор, пока не будут применимы случаи 1 или 2. Другим следствием указания является то, что 1/xi Н h 1 An < 1 влечет за собой 1 /х\ И hi/xn ^ 1 /ei Н hi/еп; см. упр. 16. 4.60 Суть дела в том, что 0 < |. Тогда можно выбрать pi достаточно большим (чтобы удовлетворить приведенным ниже условиям), арп— наименьшим простым числом, большим р3_-|. При таком определении рп положим an = 3-nlnpn и Ъп = 3~п 1п(рп +1). Если мы сможем показать, что an_i ^ an < bn ^ bn_i, то сможем взять Р = limn_^oo eQn, как в упр. 37. Но это предположение эквивалентно тому, что р3 _] ^ Рп < (Рп-i +1 )3- Если в этих пределах не найдется простого числа рп, то должно быть простое число р < рп-1, такое, что р + pQ > (pn-i + I)3- Но отсюда вытекает, что ре > Зр2//3, а это невозможно, когда р достаточно велико. Можно почти наверняка взять pi = 2, поскольку все имеющиеся данные указывают на то, что известные оценки для промежутков между простыми числами много слабее по сравнению с истинными промежутками (см. упр. 69). Тогда р2 = 11, рз = 1361, р4 = 2521008887 и 1.306377883863 < Р < 1.306377883869. 4.61 Обозначим через тип правые части; заметим, что frvn/ — m/ft = 1, следовательно, та _1_ п. Кроме того, т/п > т''/п/ и N - ((n-hNJ/n^n'-n ^ п > ((n+NVn'-IJn'-n = N-n' ? 0. Так что мы имеем m/fl ^ т"/п". Если же равенство не выполняется, то получаем, что п" = (fan'—rn/fijri/' = n/(mn//-m//n) + тг(га//тг/ — тгг'тг") J> n7 -h ft > N, т.е. противоречие. Кстати, из этого упражнения следует, что (т + m")/(n-h п77) = т7/п7, хотя первая из этих дробей не всегда сократима. 4.62 Это число 2-Ч2-2+2-3-2-б-2-7 + 2-12+2-13-2-20- 2~21 + 2-30 + 2~31 — 2-42 — 2~43 И можно записать как "Человек создал целые числа; все остальное— Дьё- донне (Dieudonne)" — Р. К. Ги (R. К. Guy) ("От Бога" если переводить фамилию Dieudonne буквально. — Переводчик) ;+з?(2' -4k2-6k-3 _ 2-4k2-10k-7 )• k$>0
А Ответы к упражнениям 627 Я нашел поистине чудесное доказательство большой теоремы Ферма, но поля слишком малы, чтобы привести его здесь. Кстати, эту сумму можно выразить и в аналитическом виде с использованием "тета-функции" 0(г,Л) =^Гке-7гЛк +2lzk; е <"> I + i9(? ln2> 3iln2) ~ tIs9^ ln2> 5iln2) • 4.63 Любое число n > 2 либо имеет простой делитель d > 2, либо делится на d = 4. В любом случае разрешимость уравнения с показателем п влечет разрешимость уравнения (an/d)d + фп/djd — (cn/d)d с показателем d. Поскольку при d = 4 решения не существует, d должно быть простым числом. Указание следует из биномиальной теоремы, поскольку (ар + (х — а)р)/х = pap_1 (mod х) при нечетном р. В наименьшем контрпримере, если (446) неверно, то должно быть a _L х. Если х не делится на р, то х взаимно простое с ср/х; это означает, что всякий раз, когда q — простое и обладает свойствами qe\\x и qf\\c, мы будем иметь е = fp. Следовательно, х = тр для некоторого га. С другой стороны, если х делится на р, то ср/х делится на р, но не на р2, и ср не имеет других общих с х множителей. 4.64 Одинаковые дроби в последовательности Ум появляются в "порядке органных труб": 2т 4т гт та. Зга га ЗтГ' п ' Предположим, что описание Ум корректное; мы хотим доказать, что корректное и описание Tn+i- Это означает, что если kN нечетное, то нужно показать, что к-1 nttt = 1Р*.™; а если kN четное, то нужно показать, что к-1 ?N kN-1 У N,kN N + 1 ?N,kN ^NjkN + l • В обоих случаях полезно знать количество дробей, строго меньших (к — 1 )/(N + 1) в Ум; это число равно ВД«?<^]-Е п=1 та п=1 (k-2)N (k-l)n N + 1 + d-1 + d (k-1)n + N N + 1 согласно (з-32)> гАе d = НОД(к— 1,N + 1). Это сводится к ^(kN- d + 1), поскольку N mod d = d — 1.
628 Ответы к упражнениям Кроме того, количество дробей в Ум, равных (k—1 )/(N+1), которые должны предшествовать ей в Tn+i, равно ^(d — 1 — [d четное]) в соответствии с природой порядка органных труб. Если kN нечетное, то d четное и (k— 1)/(N + 1) предшествуют ^(kN — 1) элементов Ум; это именно то число, которое нужно. Если kN четное, то d нечетное и (k—1 )/(N + 1) предшествуют ^(kN) элементов Ум- Если d = 1, ни один из них не равен (к— 1)/(N + 1) и Ум,к^ представляет собой символ '<'; в противном случае (к— 1)/(N + 1) попадает между двумя равными элементами и Tn^n представляет собой символ '='. (Ч. С. Пирс (С. S. Peirce) [288] независимо открыл дерево Штерна-Броко примерно в то же время, когда он открыл Ум-) 4.65 Аналогичный вопрос для (аналогичных) чисел Ферма fn— одна из знаменитых нерешенных задач. Наш вопрос может оказаться более легким... или более трудным. 4.66 Известно, что ни один квадрат, меньший 36 х 1018, не делит никакое число Мерсенна или число Ферма. Но гипотеза Шницеля (Schinzel) о том, что существует бесконечно много чисел Мерсенна, свободных от квадратов, пока что не доказана. Неизвестно даже, существует ли бесконечно много таких р, для которых р\\(а ± Ъ), где все простые множители чисел а и b не больше 31. 4.67 М. Сегеди (М. Szegedy) доказал эту гипотезу для всех больших п; см. [348], [95, с. 78-79] и [55]. 4.68 Это предположение гораздо слабее по сравнению с результатом из следующего упражнения. 4.69 Крамер (Cramer) [бб] на основе вероятностных соображений показал, что данная гипотеза вполне правдоподобна, и это подтверждается вычислительными экспериментами: Брент (Brent) [37] показал, что Рп+1 -Рп ^ 602 для Рп+1 < 2.686 х 1012. Наилучшее, что известно к 1994 году— это оценка из упр. 60 [255]. Упр. 68 имеет ответ "да" если Pn+i — ?п < 2РП ДЛЯ всех достаточно больших п. Согласно Ги (Guy) [169, задача А8] П.Эрдеш (P. Erdos) предложил $10 000 за доказательство того, что существует бесконечно много п, таких, что "Ни один квадрат, меньший 25 х 10й , не делит никакое число Евклида" — Илан Варди (Пап Vardi) п+1 ~ " > с In п In In n In In In In n (In In Inn)2 для всех с > 0. 4.70 Согласно упр. 24 это выполняется тогда и только тогда, когда V2(n) = л^з(п). Методы из [96] могут помочь расколоть этот орешек.
А Ответы к упражнениям 629 4.71 Если к = 3, то наименьшим решением является п = 4700063497 = 19-47-5263229; другое решение для данного случая неизвестно. 4.72 Известно, что это справедливо для бесконечного количества значений а, включая —1 (очевидно) и 0 (не столь очевидно). Лемер (Lehmer) [244] выдвинул знаменитое предположение, что ф(п)\(п — 1) тогда и только тогда, когда п— простое число. 4.73 Известно, что это эквивалентно гипотезе Римана (согласно которой комплексная дзета-функция C(z) отлична от нуля, когда действительная часть z больше 1 /2). 4.74 Экспериментальные данные дают основания предполагать, что существует около р(1 — 1/е) различных величин— точно так же, как если бы факториалы были случайным образом распределены по модулю р. Чему равно 114в 5.1 (11)* = (14641 )т в любой системе счисления с основанием системе счисления г ^> 7 согласно биномиальной теореме, с основанием 11 ? 5.2 Отношение (k+i)/(?) = (n—k)/(k+l) оказывается ^ 1 при к ^ [_п/2| и ^ 1 при к < [п/2], так что максимум достигается при к = [n/2J и к = [п/2]. 5.3 Выразите его через факториалы. Оба произведения представляют собой f(n)/f(n — k)f(k), где f(n) = (n+ 1)!n! (n— 1)!. 5.4 (-1) = (-Dk(k+k-1) = (-Dk(k) = i-m^o). 5.5 Если 0 < k < p, то в числителе дроби (?) имеется р, которое не сокращается ни с чем в знаменателе. Поскольку (?) = (Р"1) + (^:]), должно быть (Р-1) = (-1)k (modp) при 0 ^ к < р. 5.6 Решающим шагом (после избавления от второго к) должен быть следующий: -^?(\+к)с:;)н.>- =^те(пг)с:;)н)'- В исходном выводе этот дополнительный член, представляющий собой [тг = 0], был забыт.
630 Ответы к упражнениям 5.7 Да, так как г—^ = (—1 )к/(—т — "I )-• Кроме того, гк(г + 1\* (2г)2к/22к. 5.8 Функция f(k) = (k/n — 1)п представляет собой полином степени п, старший коэффициент которого равен п~п. Согласно (54°) эта сумма равна nl/n71. При больших значениях п в соответствии с приближением Стирлинга это значение приближенно равно Vbm/en. (Ч то весьма отличается от значения (1 — 1/е), которое получается, если воспользоваться приближением (1 — k/n)n ~ е~к, справедливым при фиксированном к и п —> со.) 5.9 Stfz)* = Lk^otltk+tJ^^Vk! = L^olk+I)*-1 (tz)k/k! = ?i (tz) в соответствии с (5.60). 5-10 Hk>o2zV(k + 2) = F(2,1;3;z), поскольку tk+1/tk = (k + 2)z/[k + 3). 5.11 Первая функция является бесселевой, а вторая— гауссовой: z-'sinz = Z^o(-1)^2V(2k+1)! = F(l;l,f;-z2/4); z^arcsinz = L^o*2k^)7(2k + Dk! = Н^ЬЬ*)- 5.12 (а) Является, если п ^ О, поскольку отношение членов равно п. (б) Является, если п— целое число; отношение членов равно (к + 1 )п/кп. Обратите внимание, что для получения этого члена из (5-115) мы полагаем m = п + 1, си = • • • = am = 1, bi = • • • = bn = 0, z = 1 и умножаем на 0П. (в) Является. Отношение членов равно (к + 1)(к + 3)/(к 4- 2). (г) Не является. Отношение членов равно 1 + 1/(к + 1 jHk, и Н^ ~ Ink не является рациональной функцией, (д) Является. Обратное к любому гипергеометрическому члену представляет собой гипергеометрический член. Тот факт, что t(k) = 00 при к<0ик>пне исключает t(k) из гипергеометрических членов, (е) Конечно, да. (ж) Не всегда— например, при t(k) = 2k и T(k) = 1 не является. (з) Является. Отношение членов t(n — 1 — k)/t(n — 1 — (k + 1)) представляет собой рациональную функцию (обратное к отношению членов для t при замене к на п — 1 — к) при произвольном п. (и) Является. Отношение членов может быть записано как a t(k+1 )/t(k) + b t(k+2)/t(k) + с t(k+3)/t(k) a + b t(k+l )/t(k) + с t(k+2)/t(k) и t(k+m)/t(k) = (t(k+m)/t(k+m-1)) ... (t(k+1 )/t(k)) представляет собой рациональную функцию от к. (й) Не является. Если Но не бесовской. Любое значение гипергеометрического члена t(k) может быть записано как Oe(k)v(k), где е(к) — целое nv(k) ф 0. Предположим, что отношение членов t(k+1)/t(k) равно p(k)/q(k) и что р и q полностью факторизованы в комплексных числах. Тогда для каждого к е(к+1) равно е(к) плюс количество нулевых множителей в разложении р(к) минус количество нулевых множителей в разложении q(k). v(k+1) равно v(k), умноженному на произведение ненулевых множителей р(к) и деленному на произведение ненулевых множителей q(k).
А Ответы к упражнениям 631 две рациональные функции, pi (k)/qi (к) и P2(k)/q2(k), совпадают в бесконечном количестве значений к, то они совпадают при всех к, поскольку pi(k)q2(k) = qi(k)p2(k)— полиномиальное тождество. Поэтому отношение членов |"(k+1)/2~|/|~к/2] должно быть равно 1, если это рациональная функция, (к) Нет. Отношение членов должно быть равным (к+ 1 )/к, поскольку это так для всех к > 0; но тогда t(—1) может быть нулевым, только если t(0) кратно О2, тогда как t(1) может быть равно 1, только если t{0)=0\ 5.13 Rn = n!n+1/P* = Qn/Pn = Q2 /n!-+1. 5.14 Первый множитель в (5.25) представляет собой (l_l^"_km) при к ^ I, т.е. (—1)1_к_т(1~1^Г7|1)- Сумма при к ^ I представляет собой сумму по всем к, поскольку m ^ 0. (Условие п^Ов действительности не требуется, хотя переменная к должна принимать отрицательные значения при п < 0.) Чтобы перейти от (5-25) к (5-2б), сначала замените s на —1 — n— q. 5.15 Если п нечетное, сумма равна нулю, поскольку к можно заменить на п — к. Если п = 2га, в соответствии с (5-29) при а = b = с = m сумма равна (—1)m(3m)!/m!3. 5.16 Это просто (2а)! (2Ь)! (2с)!/(а + Ъ)! (Ъ + с)! (с + а)!, умноженное на (5-2д), если записать слагаемые через факториалы. 5.17 Поскольку (2п-^2) = (^)/22- и (2п^/2) = 0/24т\ получаем (^/2) = 2^-1/2). 5-18 0(^)/13к- 5.19 CEb-tt-z)-1 =Lic5so('C"k"1) (-V(k-tk- 1))(-z)k согласно (5.6o), а это есть Л^о Ck) (V(tk - k + 1))zk = Bt(z). 5.20 Этот ряд равен F(-ai,..., -am; -bi,..., -bn; (-1 )m+nz); см. упр. 2.17. 5.21 Нтп-юо(п + m)^/nm = 1. 5.22 Умножение и деление отдельных значений (5.83) дает (-1/2)! _ ,._ (п + х\(п + х--\/2\__2х //4-1/2 Нт ' п х!(х —1/2)! п^оо \^ п J\ п ) / \ п = lim (2\+2Х)п-2* п-э-оо \ 2п J согласно (5-34) и (б-Зб). Кроме того, 1/(2х)! = lim f2n.+ 2X)(2n)-2x. тг-э-оо \ In J
632 Ответы к упражнениям Следовательно... и т.д. Между прочим, гамма-функциональным эквивалентом этой формулы является Г(х)Г(х+1) = T[2x)Y{\yi2*-\ 5.23 (-1)nrij, см. (5.50). 5.24 Согласно (б-Зб) и (б-93) эта сумма равна п \ / т—гц —т т) I 1/2 2п 2т 5.25 Это эквивалентно легко доказываемому соотношению (а-Ь) (b + 1)k (g+1)k bak (b + 1 )* b* или, в операторной форме, a — b = (-& + a) — [д + b). Аналогично ai,a2,a3, ..., a. (ai -Q2)F = QtF — Q2 F bi, • ••> bn ai+1,a2,a3,.. bi, ..., bT ai,a2 + 1,a3,...,am bi, ..., bn поскольку си — <i2 = (си + k) — (a2 -f k). Если ai — bi — целое неотрицательное число d, это второе соотношение позволяет выразить F(ai,..., am; bi,..., bn; z) в виде линейной комбинации функций F(a2 + j)a3>...)am;b2>...>brL;z) при 0 ^ j ^ d, тем самым удаляя один верхний параметр и один нижний параметр. Так, например, получается аналитический вид для F(a, b; a—1; z), F(a,b; a —2;z) и т.д. Гаусс [143, §7] вывел аналогичные соотношения между функцией F(a, b; с; z) и любыми двумя "смежными" гипергеометрическими функциями, в которых один из параметров изменен на ±1. Рейнвилль (Rainville) [301] обобщил их на случай нескольких параметров. 5.26 Если отношение членов в исходном гипергеометрическом ряду равно tjc+i/tjc = г (к), то отношение членов в новом ряду есть tjc+2/tk+i =г(к+ 1). Следовательно, си , ..., ат , Ьь ...) bn = 1 си ... ат z F bi ...bn ai+1,...,am + 1,1 bi+1,...,bn + 1,2
А Ответы к упражнениям 633 Приравнивая коэффициенты при zn, получаем формулу Пфаффа-Зааль- шютца (5.97). 5.27 Это— сумма четных членов ряда F(2ai ,..., 2am; 2bi,..., 2bm;z). Имеем (2a)2k+2/(2a)2k = 4(k + a)(lc + a + \) и т.д. 5.28 F(a;b|z)41-z)-QF(a'cc-b|1^)41-z)-aF(c-^a|^) = (1 — z)c_a_b F(c_a^c_ |z). (Эйлер доказал это тождество, показав, что обе его части удовлетворяют одному и тому же дифференциальному уравнению. Закон отражения часто приписывается Эйлеру, но он, похоже, не встречается нигде в опубликованных им работах.) 5.29 В соответствии с правилом свертки Вандермонда коэффициенты при zn равны. (Оригинальное доказательство Кум- мера (Kummer) было иным: он рассматривал limm_>.oo F(m, b — a;b;z/m) в законе отражения (5.101).) 5.30 Продифференцируйте еще раз, получив z(1 — z)F"(z) + (2 — 3z)F'(z) — F(z) = 0. Поэтому согласно (5.108) F(z) = F(1,1;2;z). 5.31 Условие f(lc) = T(k+1)-T(k) означает, что f(k+1)/f(k) = (T(k + 2)/T(k +1) -1)/(1 -T(k)/T(k+1)) является рациональной функцией от k. 5.32 При суммировании полинома относительно к метод Госпера сводится к "методу неопределенных коэффициентов'.' Имеем q(k) = r(k) = 1 и попытаемся решить p(k) = s(k + 1) — s(k). В методе предполагается, что s(k) является полиномом, степень которого d = deg(p) + 1. 5.33 Решением соотношения к = (к — 1)s(k+ 1) — (к+ 1 )s(k) является s(k) = —к + \\ следовательно, искомый ответ— (1 — 2k)/2k(k-1) + C. 5.34 Предельное соотношение выполняется, поскольку все члены при к > с стремятся к нулю, а при вычислении предела остальных членов е — с сокращается с —с. Таким образом, вторая частичная сумма есть lime_>.o F(—ггц —п; е — та; 1) = Y\m.e-+o{e + п - т)ж/(е - т)ж = (-1Г^11"1). 5.35 (a) 2~n3n[п^О]. (б) (1 - l)"*"1 [k^O] = 2k+1 [k^O]. 5.36 Сумма цифр числа та + п является суммой цифр числа та плюс сумма цифр числа п минус р — 1, умноженное на количество переносов, так как каждый перенос уменьшает сумму цифр на р — 1. (См. в [226] распространение этого результата на обобщенные биномиальные коэффициенты.) 5.37 При делении первого тождества на п! получаем свертку Вандермонда (х*у) = Х.к (к)(п-к)* Второе тождество вытекает, например, из формулы хк = (—1)к(— х)к, если обратить как х, так и у.
634 Ответы к упражнениям 5.38 Выберите с как можно большим так, чтобы (3) ^ п. Тогда О ^ п — (3) < (Сз1) — (з) = Ш» замените тг на п — (3) и продолжайте в том же духе. И наоборот, любое такое представление получается тем же способом. (Можно проделать то же самое с представлением П = и) + W7 ^''М^]' 0^Ql <a2<---<am при любом фиксированном га.) 5.39 x"v = ИГ=1 г+^->пьт-^ + п=, (m+^:;-k) х an kbm-yk при любых т>0ип>0по индукции пот + п. 5.40 мг+'П^ГиЛрГ-^й8-1) = (-1)т х 1ы(Гт"$1-г,к":и"')) = (-i)m((m-Tr,_1) - ГТ,)) = (тпГ,)-(А)- 5.41 Гк;гоп!/(п-к)!(п + к+1)! = (п!/(2н+1)!)?к>п(2\+1), что равно 22птг!/(2тг + 1)!. 5.42 Будем рассматривать п как неопределенную действительную переменную. Метод Госпера при q(k) = k+1 и г (к) = к—1 — п дает решение s(k) = 1/(п + 2); следовательно, искомая неопределенная сумма равна (-1)х_1 S+l/O^1). И D-»vG)-'-"-'^/с:')Г - тп+1 г 1 = 2 [п четное]. п + 2 Кстати, из этого упражнения следует формула 1 _ 1 1 которая "дуальна" по отношению к основному рекуррентному соотношению (5.8). 5.43 После выполнения подсказанного первого шага можно применить правило (5-2i) и просуммировать по к. Затем правило (5.21) применяется еще раз, и завершает дело свертка Вандермон- да. (Комбинаторное доказательство этого тождества было дано Эндрюсом (Andrews) [10]. Способ быстрого перехода от этого тождества к доказательству (5-29) поясняется в [207, упр. 1.2.6-62].)
I Заключенное | в рамку | утверждение \ на обороте этой страницы истинно А Ответы к упражнениям 5.44 Сокращение факториалов показывает, что 635 т + п га т + п — j — к га —j j + к\ /т + п так что вторая сумма— это дробь V(mT^n)J умноженная на первую сумму. А первая сумма представляет собой просто частный случай (б-З2) АЛЯ I = 0, п = Ъ, г = a, s = га + п — Ь, так что она равна (°Г)Г+ГГЬ)- 5.45 Согласно (5.9) Lk<cn (k~k/2) = {^У2)- Если это выражение недостаточно "аналитичное" можно применить (б-Зб) и получить (2п+1)(2^)4-п. 5.46 По формуле (5.69) эта свертка противоположна коэффициенту при z2n в разложении Ъ--\&)Ъ--\ (— z). Далее, (213_i (z) — 1)(2$--i(-z) - 1) = \/1 -16z2; следовательно, B_i(z)B_i(-z) = ^[Vl — 16z2 + ^_i (z) + ^!B_i (— z) — ^. По биномиальной теореме (i-ifoV/2 = L(^2)H6)V- = -x(2nn) 2n\ 4nz2n n J 2n - Г так что окончательный ответ — (^)4n V(2tl— 1)+(42П])/(4n—"I)• 5.47 В соответствии с (5-6i), эта сумма представляет собой коэффициент при zn в разложении ('BT(z)s/Qr(z))('BT(z)_s/Qr(z))= Qr (z)"2, где Qr (z) = 1 - г + тЪт(z)"1. 5.48 F(2n + 2,1;n + 2;l) = 22п+У(2^+11) — частный случай соотношения (5- ш). 5.49 Тождество Заалыпютца (5-97) Аает -х, -гц -п-у ч—X —ГЦ 1 — П—1J 5.50 Левая часть представляет собой 1 = (У + 1) у- akbk к>0 *Г v- /к- mSO к! a + m— 1 ra z"L = 5>г—(-и п^О к^О скк! kf'n+a-1 п-к а в соответствии со сверткой Вандермонда (б-92) коэффициент при zn равен n+a—1\/a,b, —n n / \ cy a 1 = ¦b)n П!
636 Ответы к упражнениям 5.51 (а) Отражение дает F(a,— n;2a;2) = (—l)rLF(a>— n;2a;2). (Кстати, из этой формулы вытекает замечательное соотношение Д2т+1 f (Q) = 0j когда f (nj = 2^х^/(2х)^.) (6) Почленный предел равен Lo^k<cm (™) 2m+t-k(-2)k плюс дополнительный член при к = 2т — 1. Этот дополнительный член равен (-m)...(-1H1)...(m)(-2m+1)...(-1)22™+1 = (-1 (-2m)...(-1)(2m-1)! +1m!m!22m+1 -2 (2m)! 1/2\ ¦ m следовательно, согласно (5.104) искомый предел равен —1/( г|^), противоположному значению того, что мы имели. 5.52 При k> N члены обоих рядов равны нулю. Это тождество соответствует замене к на N — к. Обратите внимание, что ,N-k (a + N-k)k = aN-k(Q + N_1)k = aN-k(1_Q_N)k(_1)k 5.53 Если b = —j, то независимо от а левая часть (б-но) равна 1 — 2z, а правая часть равна (1 — 4z + 4Z2)1/2. Правая часть представляет собой формальный степенной ряд который может быть расписан по степеням z и переупорядочен так, чтобы получить 1 — 2z + Oz2 + Oz3 4- • • •; однако такое переупорядочение включает в качестве промежуточного шага расходящийся при z = 1 степенной ряд, так что оно незаконно. 5.54 Если та + п нечетное, скажем, 2N — 1, то нужно показать, что limF е-уО N-m- 1 "2> -та+е -N + e 0. | Заключенное \ в рамку | утверждение | на обороте этой страницы ложно Равенство (б-92) применимо, поскольку —та + е > —та — \ + е, а сомножитель Г(с — Ъ) = T(N— та) в знаменателе бесконечен, поскольку N ^ та; прочие сомножители конечны. В противном случае та + тг четное; подставляя тг = та — 2N, согласно (б-93) получаем limF е-* О -N, N-m-f —m+e + е (N-1/2)^- тпл
А Ответы к упражнениям 637 Остается показать, что m \ (N-1/2)!(m-N)! 4m-2N; (-1/2)! m! а это случай х = N из упр. 22. m-N \2_2N m-2N ' 5.55 Пусть Q(k) = (k+Ai)... (k+AM)Z и R(k) = (k+Bi)... (k+ BN). Тогда t(k+l)/t(k) = P(k)Q(k-l)/P(k-1)R(k), где P(k) = Q(k) — R(k) — ненулевой полином. 5.56 Решением соотношения —(k+1)(k+2) = s(k+1) + s(k) служит s(k) = — jk2 — k— \; следовательно, ^Г {~ь) ^ — |(—"I) (2k2 + 4k + 1) + С. К тому же k-1 (-1 »k-l k + 1 2 k + 2 2 (-I)"-1 4 8 k+1- l+Ml (2k2 + 4k+1) + l k + 2- l-f-Г 5.57 HMeeMt(k+1)/t(k) = (k-n)(k+1+0)(-z)/(k+1)(k + 9). Поэтому можно взять p(k) = k + 8, q(k) = (k —n)(—z), r(k) = k. Секретная функция s(k) должна быть константой ао, и мы получаем к + 9 = (-z(k - п) - к) ао ; следовательно, ао = —1/(1 +z) и 9 = — nz/(1 +z). Сумма равна LC zk|k- nz 6к = - п п-1 zk + C. X) V* 1+zy/~" 1+zVk-l (Частный случай z = 1 упоминался в (5.18).) 5.58 Если га > 0, то можно заменить (^) на ^(^"I1]) и вывести формулу Tm>n = ^Tm_i>n_i -^;(п~1). Таким образом, подойдет суммирующий множитель (™)-1: 'ттцп Tm-1,n-1 L + 2. (п-\) т п \vn— I/ Это можно развернуть и получить 'TTL.n С) ¦и.п—та нТ
638 Ответы к упражнениям Наконец, T0,n-m = Hn_m, так что Тт>71 = (?)(НП - Нт). (Этот результат можно также получить, воспользовавшись производящими функциями; см. пример 2 в разделе 7.5.) 5-59 L^o.^i (?)[j = lbgm1cj] =5Zj3s0>]cSBl (p[m4k<mHi], что равно Lj?o (?)(™i+1 -m» = (m-l)?J>0 (?H = (m-1) x (m + 1)n. 5.60 В случае та = n приближение (m:n)-M^J('^)"0^r сводится к (2TJX) « 4п/\/7пг- 5.61 Пусть |_n/pj = q и n mod p = г. Полиномиальное тождество (x + 1 )p = xp 4- 1 (mod p) означает, что (x+ !)pq+r = (x+1)T(xP + 1jq (modp). Коэффициент при xm слева равен (^). Справа же этот коэффициент равен Lk(m-pk)(k)> ЧТ0 Р^110 ПР°СТ0 (ттГос1р)([т/р])' поскольку 0 <; г < р. 5-62 (-Р) = Lkl+.+len_mp (?)...(?) = (^) (modp2), по- скольку все члены данной суммы кратны р2, за исключением (™) членов, из которых ровно га из ki,..., kn равны р. (Стенли (Stanley) [335, упр. 1.6(d)] показал, что данное сравнение в действительности выполняется по модулю р3 при р > 3.) 5.63 Это Sn = П=о(-4)кЮ = П=о(-4)п-к(2Тк)- Знаме- натель в (б-74) обращается в нуль при z = —1/4, так что просто осуществить подстановку в эту формулу нельзя. Рекуррентное соотношение Sn = — 2Sn_i — Sn_2 приводит к решению Sn = (-Dn(2n+1). 5.64 Это Ц^0((2*) + (2kn+i))/(K+ 1) = L^o №+\)/fr+V, что равно п + 2^о\2к + 2) ~ п + 2 • 5.65 Умножьте обе части на nn_1 и замените к на тг— 1 — к, что даст П )пк(тг-к)! = (п-1)!^(тгк+1/к!-пк/(к-1)!) = г. ' к=о = (n-1)!nn/(n-1)!.
А Ответы к упражнениям 639 I Заключенное в рамку | утверждение на обороте \этой страницьп не является Утверждением] (Частичные суммы на самом деле могут быть установлены с помощью алгоритма Госпера.) С другой стороны, (?)кпп_1~кк! можно интерпретировать как число отображений множества {1,..., п} в само себя при условии, что f (1), ..., f(k) различны, a f (к + 1) Е {f (1),..., f (к)}; суммирование по к должно дать пп. 5.66 Это задача о прогулке по аллеям парка, когда имеется только один "очевидный" способ продолжения на каждом шаге. Сначала заменим к — j на I, затем— |_\Д J на к и получим L j,k;?0 J-К >).*+' га Ъ Бесконечный ряд сходится, потому что все его члены при фиксированном ) не превосходят некоторый полином от j, деленный на 2). Суммируя по к, получим Пз + i m Ъ Внеся в скобки ) + 1 и применив (б-57)> получаем ответ: 4(т+ V 2п+2 . п+5 . Ос+Г 5.67 Согласно (5.26) это 3(21^52), поскольку ел _ = 3 5.68 Используя тот факт, что 1 L k^n/2 щ-1 + П 2 \п/2 [п четное], получаем п(2п 1 - (?/2J)). 5.69 Поскольку (k*1) + (1~^) ^ (*) + Q) 4=> к < I, минимум достигается при как можно более одинаковых к. Следовательно, согласно формуле разбиения на как можно более равные части из главы 3 минимум равен (n mod m) ( j + (m — (n mod m)) '|n/mj [n/mj 2 + (n mod m) Аналогичный результат справедлив при любом нижнем индексе вместо 2.
640 Ответы к упражнениям 1- 1 2> 2" Ik. 1 "2> 2 п;1). п;—1) по 5.70 Это F(-n, 1; 1; 2); но это также и (-2)-n(2^)F(-n,-n; ± - п; ^), если заменить к на п — к. Однако в соответствии с тождеством Гаусса (5.111) F(— тц — п; ^ — n; j) = F(—j,- (С другой стороны, F(—тц — п; ^— п; ^) = 2_rLF(— гц закону отражения (5.101), а формула Куммера (5-94) сводит это к (б-бб)-) Окончательный ответ: 0— при нечетном п, 2-п(п%) — при четном п. (См. [164, §1.2] по поводу другого вывода. Эта сумма возникает при изучении одного простого алгоритма [195].) 5.71 (а) Заметим, что S(z) = I>fcn_zlm+2k+l k>0 [1-z) TA(z/(1-z)2) (6) A(z) = 2Ik?0 (2kk)(-z)k/(lc+1) = (vT + 4z-l)/2z, так что мы имеем A(z/(1 — z)2) = 1 — z. Таким образом, Sn = [zn] (z/(1 — -))m=(n--:)- 5.72 Указанную величину можно представить как m(m — n)... (га— (k— 1 )n)nk~v(kyk!. Любой простой делитель р числа п делит числитель минимум k —v(k) раз и знаменатель— максимум k—v(k) раз, так как именно столько раз 2 делит к!. Простое число р, которое не делит п, должно делить произведение га (га — п)... (га — (к — 1 )п) как минимум столько же раз, сколько оно делит к!, поскольку j сомножителей m(m — п)... (га — (рг — 1 )п) кратны pr-:j при любом г ^ j ^> 1 и любом та. 5.73 Подстановка Хп = п! дает а = (3 = 1; подстановка Хп = щ дает а = 1, (3=0. Таким образом, общее решение таково: Хп = осп\ + (3(п! — TLj). 5.74 (^J-^lDnpHl^k^n. 5.75 Рекуррентное соотношение Sic(n+l)=Sic(rL)+S(]C_i) mod3(n) дает возможность индуктивной проверки того, что два из чисел S одинаковы и что S(_n)mod3("n) отличается от них на (—1)п. Эти три значения разбивают свою сумму So(n)+Si (tl)+S2(tl) = 2П на как можно более близкие по значениям части, так что здесь должно быть 2n mod 3 вхождений величины |~2П/3] и 3 — (2n mod 3) вхождений [2n/3J. 5.76 (2п,1с = (п+ВД -(,?,). 5.77 Все члены суммы равны нулю, за исключением случая ki ^ • ^ km, когда данное произведение представляет собой мультиномиальный коэффициент / km \к~\ ) К-2 М , . . . , K.m K-tr— 1, | Заключенное \ в рамку | утверждение | на обороте \этой страницы\ | не заключено | в рамку
А Ответы к упражнениям 641 Таким образом, сумма по ki, ..., km_i равна mkm, а последняя сумма по km дает (mn+1 — 1 )/(m — 1). 5.78 Расширьте область суммирования до k = 2га2 + m — 1; тогда новые члены представляют собой Q) + (g) Н Ь (^i^1) — О- Поскольку га _L (2га + 1), пары (k mod га, к mod (2га + 1)) различны. Кроме того, числа (2j +1) mod (2m +1), когда j изменяется от 0 до 2га,— это числа 0, 1, ..., 2га в некотором порядке. Следовательно, данная сумма равна L (•)= L 2k = 2~-1. 0^j<2m-H 5.79 (а) Сумма равна 22п-1 так что искомый НОД должен быть степенью 2. Если п = 2kq, где q нечетное, ( 1П) делится на и не делится на 2к+2. Каждое из чисел (?^+i) делится на число 2к+1 (см. упр. 36), так что это число должно быть их НОД. (б) Если pr ^ п + 1 < pr+1, то наибольшее количество переносов при сложении к с п — к в системе счисления с основанием р получается при к = рг — 1. В этом случае количество переносов равно г — ер (п + 1) и г = ер (L(n + 1)). 5.80 Сначала докажите по индукции, что k! ^ (к/е)к. 5.81 Обозначим через fi,m,nM левую часть. Достаточно показать, что fi,m)T1(1) >0zf(mn(x) <0 при 0 <J х <^ 1. Величина fi,m,n(1) равна (—1 j"--™--1 ( *™*е) согласно (5-23) и эта величина положительна, потому что данный биномиальный коэффициент имеет ровно п — га — 1 отрицательных сомножителей. По той же причине это неравенство справедливо и при 1 = 0. Если I > 0, то f{ m n(x) = —lfi_i)1T1)Tl+i (x), а по индукции эта величина отрицательна. 5.82 Пусть ер (а) — показатель степени, в которой простое число р делит а и пусть та = п — к. Тогда доказываемое тождество сводится к min(ep (m)-ep (ттН-k), ер (m+k+1 )-ер (k+1), ер (k)—ер (т+1)) = = min(ep(k)-ep(m+k))ep(m)-ep(k-bl))ep(m+k+l)-€p(m+1)) . Для краткости запишем это как min(xi ,у-\ ,ъ\) = тт(х2>У2>2:2). Обратите внимание, что х-\ + yi Л-ъ\ = Х2 +У2 +^2- Общее соотношение ер(а) < ер(Ъ) =$ ер(а) = ер(|а±Ь|)
642 Ответы к упражнениям позволяет заключить, что х-\ ф хг ==> min(xi,X2) = 0; то же самое справедливо и для ("УьУ2) и [ziyZz). Теперь завершить доказательство не составляет труда. 5.83 (Решение П.Пауле (P. Paule).) Пусть г— неотрицательное целое число. Данная сумма представляет собой коэффициент при xlym в .(1 +x)J+k/г\ /п lH),+k^ d+!j)-'-V = - ^ Vic i-i-y / V П + y)v = (-iHi-xyr+4i+y)s-7*n, так что понятно, что она равна (—1)l(?^) (^L^ljJ. (См. также упр. 106.) 5.84 Следуя указанию, получаем 'tk + r\ kzk z!Bt(z)r-1^(z) = Л С tk + r и аналогичную формулу для ?t(z). Таким образом, формулы (zt^"1 (z)B((z) + 1)Bt(z)r и (zt?-] (z)?{(z) + 1)?tWr дают соответствующие правые части формул (5-6i). Поэтому необходимо доказать, что а это вытекает из (б-59)- 5.85 Если f(x) = anxn Н Ь сих + ao является некоторым полиномом степени ^ п, то по индукции можно доказать, что ?^ (-1)ei+- +e-f(e1x1+..-+enxn) = (-1)nn! anxi...xn. 0^еь...,еп<:1 Предложенное в упражнении тождество является частным случаем данного при an = 1/п! и хк = к3. 5.86 (а) Сначала представьте его с п(п — 1) индексными переменными Uj при хф). Подстановка ktj = \ц — Ijt при 1 ^ г < j < тг и использование ограничений 2Zt^j(Uj — IjO = 0 при всех г < тг позволяет вычислить суммы по ljn для 1 ^ j < п, а затем по Ijt при 1 ^ г < j < тг по правилу свертки Вандермонда. (б) f (z) — 1
А Ответы к упражнениям 643 представляет собой полином степени < п, имеющий п корней, так что он должен быть равен нулю, (в) Рассмотрите постоянные члены в 1<ci,j<cn П i-? -L П k=1 l^ij^n 1-* at-[i=k] 5.87 Согласно (5-6i) первый член представляет собой 21 к (n^k)^mk- Слагаемые во втором члене— это 1у Лп+1)/т+(1+1/т)к\ к+п+1 _ к^О х -kl- т *— к>п 1+1/т)к-п-1 к-п-1 (Cz)k, I Заключенное в рамку | утверждение на обороте \этой страницы ссылается само на себя Поскольку Ио^)<т(^+1 )к = тп(—1 )l[k = ml], эти члены дают в сумме у /(l+l/m)mk-n-1\ к = k>n/m mk—n— 1 У f(m+1)k"n~1>\(-zm)ic = у (n~m1cVmk ¦ k>n/m ^ ' k>n/m ^ ' Кстати, функции ?m(zm) и C2j+1z?i+i/m(C2j+1z)1/m представляют собой m+1 комплексных корней уравнения wm+1 —wm=zm. 5.88 Воспользуемся теми фактами, что J^°(e_t — e_nt) dt/t = 1ппи(1-е-*)Д$ 1. (Согласно (5.83) (?) = 0(k"x-1) прик -> со; так что эта оценка означает, что ряд Стирлинга XLks^(k) схо" дится при х > — 1. Эрмит (Hermitе) [186] показал, что его сумма равна InГ(1 + х).) 5.89 Сложение этого соотношения с (5-19) дает в обеих частях ¦y-r(x + "y)m+r в силу биномиальной теоремы. Дифференцирование дает L(m?r)(m:kVym-k-n k>m П = L("kr)(mnkVx)k(x+yr-k-n k>m ^ ' ^ и можно заменить k на k + m + 1 и применить (5.15), чтобы по-
644 Ответы к упражнениям лучить m + r m+1 + к -п-1 к ( -.\пИ-И-к — 1— к—п _ = L к^О —Г т + 1 + к -п-1 хт+1+к(х + у)-1-к-п, В гипергеометрическом виде это сводится к -тг-1 1-г, тг+1 т+2 —х = 1+- У m+l+r, tl+1 т+2 х+у что является частным случаем закона отражения (5.101) при (a,b,c,z) — (n+ 1,m+ 1 +r)m + 2>— х/у). (Таким образом, преобразование (5-105) связано с законом отражения и формулой из упр. 52.) 5.90 Если г— неотрицательное целое число, сумма конечна и вывод в тексте корректен постольку, поскольку ни в одном из членов этой суммы при 0 ^ k <J г нет нуля в знаменателе. В противном случае данная сумма бесконечна, и согласно (5-83) ее ^-й член (k_^_1)/(k_^_1) приблизительно равен ks_r(—s —1)!/(—г — 1)!. Поэтому для того, чтобы данный бесконечный ряд сходился, необходимо условие г > s + 1. (Если г и s комплексные, то этим условием будет 9Яг > *Ks + 1, поскольку |kz| = k^z.) Согласно (5-92) искомая сумма равна -г, 1 —s 1 = r(r-s-1)r(-s) _ s + 1 r(r-s)r(-s-1) ~ s + 1 - Это та же формула, что и найденная для целых г и s. 5.91 (В этой задаче стоит прибегнуть к помощи компьютера.) Кстати, ввиду закона отражения Пфаффа при с = (а + 1)/2 это тождество сводится к тождеству, которое эквивалентно тождеству Гаусса (5.110). Действительно, если w = — z/(1 — z), то 4w(1 — w)=-4z/(1 -z)2,h I Заключенное в рамку | утверждение на обороте \этой страницьъ | не ссылается само на себя la, ^a+1-b 1+a-b 4w(1-w) == F a, a+l-2b 1+a-b = d-z)aF —z 1^2 a, b 1+a-b 5.92 Эти тождества можно доказать так, как их доказал сам Клаузен (Clausen) более 150 лет назад, показав, что обе части
А Ответы к упражнениям 645 удовлетворяют одному и тому же дифференциальному уравнению. Один из способов записать получающиеся равенства между коэффициентами при zn — в терминах биномиальных коэффициентов: z 0G)U)U0 (2:)(r:xs L г + s - 1/2\ /т + s - 1/2\ /2r + 2s\ /г + s - 1/2 k JV n-k ; V п Д п -"I /4 + Л /-1 /4 + s\ /-1 /4 - Л /-1 /4 - s к А к А п~к А п~к -1 +r + s\ /-1 -r-s к А п~к —1/2\ /-1/2 + r-s\ /-1/2-r + s -1 +r + s\ /-1 -r-s' Другой способ— выразить их в гипергеометрическом виде: сцЬ, \ — а—Ъ—гц— п 2 + а+Ь, 1— а—гц 1 —b—п lt _ (2а)Ма + ЪГЧ2ЪГ i + a> ^+Ь, a+b-гц-п 1+a+b, | + a—гц |+b—n (2a + 2b)nanbn -)- (1/2)n(l/2 + a-b)n(1/2-a + b) (1 + a + b)n (1 /4 - a)n (1/4 - b)n 5.93 Этот вид- а"1 П^ (f()) + a)/f(j). 5.94 Алгоритм Госпера находит ответ — (?Z-|) (^"^ )a/n + С. Следовательно, если m ^ О— целое число, меньшее п, получаем 'т — а\ „, ^- /т\ —а /а — 1 \ / —а — 1 ) Lg(::k>-L(T)^a:,JU-VW+c- 5.95 Старшие коэффициенты риг должны быть единицами, р не должен иметь общих множителей с q или г. Эти дополнительные условия легко выполнимы при помощи перестановки множителей из одного полинома в другой. Предположим теперь, что p(k+1)q(k)/p(k)r(k+1) = P(k+ 1)Q(k)/P(k)R(k+1), причем тройки полиномов {ip^q^r) и (Р, Q,R)
646 Ответы к упражнениям удовлетворяют новым критериям. Пусть po(k) = p(k)/g(k) и р0(к) = Р(к)/д(к), где д(к) = НОД(р(к),Р(к)) представляет собой произведение всех общих множителей р и Р. Тогда po(k+1)q(k)P0(k)R(k+1) = po(k)r(k+1)Po(k+1)Q(k). Предположим, что ро(к) ф 1. Тогда существует такое комплексное число а, что ро(а) = 0; отсюда вытекает, что q(ot) Ф 0, г (ос) ф 0 и Ро(ос) Ф 0. Следовательно, должно быть ро(ос+1 )R(a+1) = 0 иро(сс—l)Q(a—1) =0. Пусть N — положительное целое число, такое, что ро(ос 4- N) ф 0 и ро(ос — N) ф 0. Повторяя те же рассуждения N раз, найдем, что R(a + 1)... R(a + N) = 0 = Q(oc—1)... Q(a—N), а это противоречит (5.118). Таким образом, ро(к) = 1. Аналогично Ро(к) = 1, так что р(к) = Р(к). Далее, из q(cx) =0в силу (б-и8) вытекает г(ос + 1)^0, следовательно, qM\Q(k). Аналогично Q(k)\q(k), так что q(k) = Q(k), поскольку у них один и тот же старший коэффициент. Это влечет за собой г(k) =R(k). 5.96 Если г(к)— ненулевая рациональная функция и Т(к) — гипергеометрический член, то r(k)T(k)— тоже гипергеометрический член, который называется подобным Т(к). (Мы допускаем обращение r(k) в со, а Т(к)— 0 или наоборот для конечного множества значений к.) В частности, Т(к 4-1) всегда подобен Т(к). Если Ti (к) и Тг(к)— два подобных гипергеометричес- ких члена, то Ti (к) + Т2(к) также является гипергеометрическим членом. Если Ti (к), ..., Тт(к) взаимно неподобны и га > 1, то Ti (к) Н h Tm(k) не может быть нулем при всех к, кроме конечного множества. Действительно, если бы это было возможно, мы взяли бы контрпример с минимальным m и положили бы Tj (k) = Tj (к + 1 )/Tj (к). Поскольку Ti (к) Н Ь Тт(к) = 0, имеем TmtfOTi (к) + . • -+гт(к)Тт(к) = 0 и Г! (кГП (к) + -. -+гт(к)Тт(к) = Ti(k+1)H hTm(k+1) = 0; следовательно, (rm(k)—ri (k))Ti (к) + ••• + (rm(k) — rm_i (k))Tm_i (к) = 0. Мы не можем получить rm(k) — Tj(k) = 0 при всех ) < га, поскольку Tj и Тт неподобны. Но га выбрано минимальным, так что выбранный набор не может быть контрпримером; отсюда следует, что га = 2. Но тогда Ti (к) и Тг(к) должны быть подобными, поскольку они оба равны нулю при всех к, кроме конечного множества. Пусть теперь t(k) — любой гипергеометрический член, такой, что t(k-f 1)/t(k) = r(k), и предположим, что t(k) = (Ti (k + 1)Н l-Tm(k+1)) — (Ti (k)H f-Tm(k)), где ra минимально. Тогда Ti, ..., Tm должны быть взаимно неподобны. Пусть Tj (k) —
А Ответы к упражнениям 647 рациональная функция, такая, что Заметьте, любая конечная последовательность тривиально суммируема, потому что можно найти полином, который совпадает с t(k) при 0^ k< d. г(к)(Тз(к+1)-Тз(к))-(Тз(к + 2)-Тз(к+1)) = г5(к)ВД. Предположим, что та > 1. Поскольку 0 = r(k)t(k) — t(k + 1) = Г] (k)Ti (k)H hrm(k)Tm(k), должно быть r-j(k) = 0 при всех j, за исключением не более одного значения. Если Г} (к) =0, функция t(k) = Tj (k+1) — Tj (k) удовлетворяет соотношению t(k+1 )/t(k) = t(k+ 1)/t(k). Поэтому алгоритм Госпера обнаружит решение. 5.97 Предположим сначала, что z не равно — d— 1/d ни при каком целом d > 0. Тогда в алгоритме Госпера мы имеем р(к) = 1, q(k) = (к+ I)2, г(к) = к2 + kz+ 1. Поскольку deg(Q) < deg(R) и deg(p) — deg(R) + 1 = — 1, единственно возможным выбором является z = d 4- 2, где d— неотрицательное целое число. Попытка взять s(k) = otdkd Н h схо терпит неудачу при d = 0, но оказывается успешной при d > 0. (Система линейных уравнений, получаемая приравниванием коэффициентов при kd, kd_1, ..., k1 в (5.122), выражает схд-ь •••> ао как положительные кратные аа, и тогда оставшееся уравнение 1 = ос& 4- • • • 4- ос-\ определяет ad.) Например, для z = 3 неопределенная сумма равна (к 4- 2)к!2/ njtTi1 a2 + 3j + 1) + с. Если, напротив, z — — d— 1/d, то указанные члены t(k) для k ^> d бесконечны. В этой ситуации есть два разумных способа действия. Можно убрать нули из знаменателя, переопределив t(k) = к!2 (d-1/d)!k!2 n-=d+l02-J(d+1/d) + l) (к-1/d)! (к-d)!' и тем самым сделав t(k) = 0 для 0 ^ к < d и положительным для к ^> d. В этом случае алгоритм Госпера дает р(к) = к—, q(k) = к 4- 1, г(к) = к— 1/d, и мы можем решить (5.122) относительно s(k), потому что коэффициент при W в правой части равен (j 4- 1 4- 1/d)a^ плюс кратные {ocj+ь • • • > ad}- Например, когда d = 2, неопределенная сумма равна (3/2)! к! (|к2 — ||к 4- ^)/(к-3/2)! + С. В качестве альтернативного пути можно попытаться суммировать исходные члены, но только в диапазоне 0 ^ k < d. Тогда можно заменить р(к) = к— на р;(ю = X.(-DdHj j=i kj- Эта замена допустима, поскольку (5.117) по-прежнему выполнено для 0 ^ k < d—1; мы имеем р'(к) = lime_^o((^+e)- —к-)/е =
648 Ответы к упражнениям lime_>o(k+ е)—/е, так что этот трюк по сути сокращает нули в числителе и знаменателе (5.117)? ка* в правиле Лопиталя. Метод Госпера после этого вычисляет неопределенную сумму. 5.98 nSn+i = 2nSn. (Будьте осторожны: это рекуррентное соотношение не дает информации о Si /So.) 5.99 Пусть р(гцк) = (n+1+k)Po(Ti) + (TH-1+a+b+c+k)Pi(n) = р(гцк), t(n,k) - t(n,k)/(n + 1 +к), q(n,k) = (u+1+a + b + с + к)(a - k)(b - к), т(тцк) = (п + 1 + к)(с + к)к. Тогда решением (5-i2g) будет (Зо(п) = (n+1+a + b + с){п + 1 + a + Ъ), (З^п) = -(n+ 1 + a)(n+ 1 +b), cxo(n) = s(n,k) = -1. Мы находим (5-134)) заметив, что это равенство истинно при п = —а, и используя индукцию по п. 5.100 Алгоритм Госпера-Зайльбергера легко находит, что тг + 2 2п + 2 _ п - k п + 1 - к Суммирование от к = О доп— 1 дает (n+2)(SrL—1)—(2rH-2)(Sn+i— 1—^у) = —п. Следовательно, (2n + 2)Sn+i = (n + 2)Sn-f 2п + 2. Теперь применение суммирующего множителя приводит к выражению Sn = (п + 1 )2"п XI?=0 2k/(k + 1). 5.101 (а) Если зафиксировать та, то алгоритм Госпера-Зайльбергера обнаруживает, что (n-f2)Sm>n+2(z) = (z— 1)(n+1)Sm>n(z)+ [In + 3 — z[n — m + 1 ))Sm>n+i (z). Можно также применить этот метод к слагаемому |Зо(ттцп)1:(тгцгцк) + |3i (тгцтг)1:(т+1,гцк) + |32(m,n)t(m,ri-|-1,k), что дает более простое рекуррентное соотношение (m+1)Sm+i>n(z)-(n+1)Sm,n+i(;zO = (1 -z)(m-n)Sm,n(z). (б) Здесь нам придется поработать немного больше — у нас пять уравнений с шестью неизвестными. Алгоритм находит (n+1)(z-1)2(?) zk-(2n + 3)(z+1)(n+1) zk+ + (п + 2)(П + Т) zk = T(n,k+1)-T(n,k), s(n,k) = (z-1)k2-2((n+2)z-2n-3)k+(n+2)((n+2)z-4n-5).
А Ответы к упражнениям 649 Таким образом, (п+1 )(z-1 ^S^z) - (2n + 3)(z +1 )Sn+1 (z) + (n + 2)Sn+2(z) = 0. Кстати, это рекуррентное соотношение выполняется и для отрицательных п, и мы имеем S_n_i (z) = Sn(z)/(1 — z)2n+1. Сумму Sniz) можно рассматривать как модифицированный полином Лежандра Pn(z) = X!k (k) (z ~~ 1)n_k(z + 1)k/2n, поскольку можно записать Sn(z) = (1 — z)nPn(J3|). Аналогично сумма Sm>n(z) = (1 — z)nPrb,m_n (yz|) представляет собой модификацию полинома Якоби. 5.102 Эта сумма равна F(a — ^п, — п; Ъ — |п; —z), так что нам не А случай z = 0? надо рассматривать случай z = — 1. Пусть п = Зга. Мы ищем решение (5-129) АЛЯ р(ттцк) = (3m + 3-k)^-(m+l-k)(30 + (4m + 4-b-k)1(31 , q(m,k) = (Зт + З — k)(m-b 1 — a —k)z, r(m,k) = k(4m+1-b-k), s(m,k) = otzk2 + ctik + oto . Получающиеся в результате пять однородных уравнений имеют ненулевое решение (схо, ои, (Х2, |3o> Pi) тогда и только тогда, когда матрица коэффициентов имеет нулевой определитель. Этот определитель, полином от ш, обращается в нуль только в восьми случаях. Один из этих случаев, конечно, (5.113); но теперь мы можем вычислить сумму для всех неотрицательных целых чисел п, а не только для п ф 2 (mod 3): L ъ\(\ъ-\\*1(\--\\ = n,i,4](2;)/(tnn"f Здесь запись [co>Ci,C2] обозначает одно значение сптоаз- Другой случай, (a,b,z) = (^,0,8), дает тождество и№Ш)-***^(т?. (Удивительным образом эта сумма равна нулю, если п не кратно 3; в последнем случае получается тождество zm(?)(?W(?)(?)-'^»
650 Ответы к упражнениям которое может даже оказаться полезным.) Остальные шесть случаев порождают еще более таинственные суммы L n\/ln-a^k /(\п-Ъ к \ к J /V к = [Co,Cl,C2]- ln-a\/ln-a'ULn/3j Ln/3j;y Ln/3j ,x |n-b\ /ln-b\/ln-b' n J V Ln/3J ) \ Ln/3j где значения (a, b, z> Co, Ci, C2, a7, Ъ', x) равны соответственно (?>3» 8'1'-1' 0»i°. б4) (?, §, 8,1, 0,-3, |,0, 64) ( 1, 0,-4,1, 2, 0,1,1,-16) ( 1, 0, 8,1,2, 0,^,1, 64); (Jj, 1, 8,1,3, 0, |,0, 64); ( l,|,-4,1,0,-3, |,0,-16). 5.103 Будем считать, что все а[ и Ь[ ненулевые, поскольку в противном случае соответствующие множители не окажут влияния на степени относительно к. Пусть t(n, к) = р(гц k)t(n, к), где -, л nU{w + <*+*il[ax<0) + al')l t(TL к) = Z П?=1 (bin + b(k + biltbi > 0] + ъ")! В таком случае deg(p)=deg(f)-taax(2l2=1 bt[bt>0]—YX=-\ сц[а1<0], П=1 atlai > 0] - Lt=i bilbt < 0]) :> degff) + ll(|ai | + • • • + \av\ + |bi | H h |bq |), за исключениями случаев, когда в старшем коэффициенте происходит сокращение. Также deg(q) = Хл=1 а^а\. > 0] - П=1 ВД<0], deg(r) = П=1 ВД>0] - П=1 а>{<0], вновь кроме исключительных случаев. (Этими оценками можно воспользоваться для того, чтобы непосредственно показать, что с увеличением I степень р в конце концов становится достаточно большой, чтобы обеспечить существование полинома s(n,k), а количество неизвестных otj и |3j в конце концов становится больше числа однородных уравнений в решаемой системе. Так что мы получаем еще одно доказательство сходимости алгоритма Госпера-Зайльбергера, если, как в тексте, прибегнем к аргументу о существовании решения, в котором не все (Зо(тг), ..., (3].(тг) нулевые.) 5.104 Пусть^гцк) = (-1)k(r- s - к)! (r-2k)!/((r- s - 2к)! (г- тг-к-Н)!(тг-к)!к!). Тогда p0(n)t(n,k) + Mn)t(n+l,lc) не суммируемо в гипергеометрических членах, потому что deg(p) = 1, deg(q-r) =3, deg(q+r) = 4, Л = -8, Л' = -4; но p0(n)t(n,k) +
А Ответы к упражнениям 651 Pi(n)t(n + 1,k) + (32(n)t(n + 2,k) уже суммируемо, в основном потому, что Л' = 0 при я(гцк) = —(г — s — 2к)(г — s — 2к— 1)(п + 2-k)(r-n-k+1)Hr(k) = (r-s-k+l)(r-2k + 2)(r-2k+1)k. Решением является Po(n) = (s-n)(T-n+1)(r-2n+1), Pi(n) - (rs-s2-2rn + 2n2-2r + 2n)(r-2n-1), (32(n) - (s-r + n-H)(n + 2)(r-2n-3), cxo(tl) = т — 2п— 1 , и мы можем заключить, что Po(n)Su + Pi (n)Sn+i + P2(ii)Sn+2 = О, где Sn обозначает указанную сумму. Этого достаточно, чтобы доказать тождество по индукции после проверки случаев п = О и п = 1. Но Sn удовлетворяет также и более простому рекуррентному соотношению Ро("п)$п + Pi(n)Sn+i = 0, где &о[п) — (s — n)(r — 2n + 1) и Pi (n) = — (n + 1)(r — 2n — 1). Почему же наш метод не обнаружил это соотношение? Ну, никто не утверждал, что такое рекуррентное соотношение с необходимостью влечет за собой неопределенную суммируемость членов Ро^Мгцк) + Pi (n)t(n + 1,к). Удивительно то, что метод Госпера-Зайльбер- гера и во многих других случаях не находит простейшего рекуррентного соотношения. Заметим, что найденное нами рекуррентное соотношение второго порядка может быть факторизовано: Po(n) + p1(u)N + p2(u)N2 = = ((r-n+1)N + (r-s-n-1)) (PoW + PHnJN), где N— оператор сдвига из (5.145)- 5.105 Положите а = 1 и сравните коэффициенты при z3n в обеих частях тождества Хенричи (Henrici), "дружественного монстра" f(a,z)f(a, u>z) f(a, uo2z) = ia> ia+i> ia+i> fa-i> fa> ia+i a где f(a,z) = F(l;a,1;z). Это тождество может быть доказано, если показать, что обе части удовлетворяют одному и тому же дифференциальному уравнению.
652 Ответы к упражнениям Питер Пауле (Peter Paule) нашел еще один интересный способ вычислить эту сумму: Л / tvi \2 у( N V-k+2i = rf N Y шк+1 N\2/^2 = Ц('Л Г1шк+1 - .2 = L(k) ">k[zk]((1+z)(cu + z))k = = |zo, у ЛЛ2 /a>(1+z)(m + z = b°iLQ2ffl(a'"+zl"u+'"-i ^(%N-1)Q(^V использовав биномиальную теорему, свертку Вандермонда и тот факт, что [z°]g(az) = [z°]g(z). Теперь можно положить N = Зп, применить алгоритм Госпера-Зайльбергера к данной сумме Sn и получить волшебным образом рекуррентное соотношение первого порядка (п + 1 )2Sn+i = 4(4п + 1 )(4n + 3)Sn; окончательный результат следует отсюда по индукции. Если заменить Зп на Зп+1 или Зп+2, указанная сумма становится равной нулю. В самом деле, Hic+i+m=N t(k)l)m)cul_TTl всегда равно нулю, когда N mod 3 ф 0 и t(k, I, та) = t(l, та, к). 5.106 (Решение Шалоша Б.Экхада (Shalosh B.Bkhad).) Положим _ ((1+n+s)(1+r) - (1+n+r)j + (s-r)k)(j-l)j . 1 ,Ь J " (l-m + n-r + s)(n + r + 1)(j-r-1)(j + k)Ч ,h U U(T,j,lc) = ъ (s + n+1)(lc + l)1c )}) (l-m + n-r + s)(n + r + 1)(j+k) >J' Проверка сформулированного тождества оказывается чисто рутинной работой, а (б-З2) получается путем суммирования по j и к. (Мы суммируем T(r, j + 1,к) — Т(т, j,k) сначала по j, а затем — по к; другие члены U(T>j>k+ 1) — Щт^к) суммируем сначала по к, а затем— по j.)
А Ответы к упражнениям 653 Заметим, что 1 /пк — подходящий член, поскольку он равен (п — 1)!(к-1)!/п!к!. 1/(п2 -к2)- также подходящий член. А вот 1/(п2 + к2)- Кроме того, нам надо проверить (б-З2) ПРИ т = 0. В этом случае после триномиальной перестройки оно приводится к виду Гк(-1)к(п:1)ОГГк) = H)l(u+i)(m-n-i)- Мы считаем, что I, тип— целые числа ип^О. Обе части очевидным образом нулевые, если не выполнено условие n + I ^ 0. В противном случае можно заменить к на п — к и воспользоваться (5-24)- 5.107 Если бы это был подходящий член, то должен был бы найтись линейный разностный оператор, аннулирующий его. Другими словами, мы бы имели тождество с конечными суммами i J J^ J2 cxtJ (n)/((n + i)(k + j) + 1) 1=0 j=0 0, где a— некоторые полиномы от n, не все нулевые. Выберем целые числа i, j и тг так, чтобы было п > ] ж 0Ci^[n) ^ 0. Тогда при к = — 1/(п + г) — j член суммы с индексами (г, j) становится бесконечным, тогда как все остальные члены конечны. 5.108 Заменим в двойной сумме к на та—к, воспользуемся (5.28) для суммирования по к, и получим Am,n — 2^ т\ /т+п—у т после чего триномиальная перестройка (5-2i) даст одну из требуемых формул. Оказывается, достаточно трудно найти прямое доказательство того, что две симметричные суммы для Am?n равны. Можно, однако, доказать равенство косвенным путем, применив алгоритм Госпера-Зайльбергера, чтобы показать, что обе суммы удовлетворяют рекуррентному соотношению (п+1)3А ггцп f(m>n)Am>n+1 +(n + 2)3Am>n+2 = 0, где f(m,rL) = (2u + 3)(n2-b3n + 2m2+2rri + 3). Полагая ti (гцк) = емтт * ъм = r+rk)2(mr.-k2k)2, »вдш (n + 1 )2t, (п, к) - f (m, n)t, (n + 1, к) + (n + 2)2tj (n + 2, k) = Т,(п,к+1)-Т,(п,к), rAeTi(n,k) = -2(2п+3)к4^(тг,к)/(п+1-к)(п+2-к)иТ2(п,к) = -((п + 2)(4тп + п + Зт2 + 8та + 2)-2(ЗпгтЦ-п + т2+6т + 2)к + (2m+1)k2)k2(m. + n+1 -k)2t2(n,k)/(n. + 2-k)2. Это доказывает рекуррентное соотношение, так что остается только проверить
654 Ответы к упражнениям равенство для п = 0 и п = 1. (Можно было бы также использовать более простое рекуррентное соотношение m3Am)n_! -n3Am_-|, (m_n)(m2+n2_mn)Am_l5n_l> к которому можно прийти при помоши методов из упр. 101.) Тот факт, что первое выражение для Am,n равно третьему, влечет за собой замечательное тождество между производящими функциями Hm n Am,nwmzn: wkSk(z)2 2k' wr ky (1-w)2k+1 (1-z)2k+1 ' где Sic(z) = Hi (0 z^- На самом деле оказывается, что L wkSk(x)Sk(i)) (i-x)Mi-y)" L 2k Из (?)2*УН . кУ (1 -w)2k+! (1 -x)k(1 -y)k ' это частный случай тождества, открытого Бейли (Bailey) [19]. 5.109 Пусть Xn - ?k (?)ао (n+k)Q1 ... (ntlk)Ql*k А** лю6ых положительных целых чисел ао, ai, ..., сц и для любого целого х. Тогда если 0 ^ m < р, то мы имеем ^т+р Р-1 /w I ^^\ао j=0 к р-1 j+рку W-H j=0 к ™ \ ао /-V-.X ао т, \ / п> m + pn + l(j+pk)\ai j+pk 3 j+k Соответствующие члены сравнимы (mod р), потому что из упр. 36 следует, что они кратны р при lj + m ^ р, из упр. 61 вытекает, что биномиальные коэффициенты сравнимы при lj + тп < р, а из (448) — что *р = х- 5.110 Сравнение, несомненно, выполняется, если 2п + 1 — простое число. Стивен Скиена (Steven Skiena) нашел также пример п = 2953, где 2п+1 =3-11-179. 5.111 Частичные результаты представлены в [96]. Вычислительные эксперименты были проведены В. А. Высоцким. 5.112 Если п— не степень 2, то из упр. 36 мы знаем, что (2rJT) кратно 4. Для противного случая указанное свойство было проверено для всех значений n ^ 222000 Э. Гранвилем (A. Granville) Илан Варди (Пап Vardi) заметил, что это условие выполняется для 2п+1 =р2, где р — простое, тогда и только тогда, когда 2р"1 modp2 = 1. Это дает еще два примера: п = (10932-1)/2; п = [35112-1)/2.
А Ответы к упражнениям 655 и О. Рамаре (О. Ramare), которые также усилили теорему Саркё- зи (Sarkozy) [317], показав, что ( ™) делится на квадрат простого числа при всех п > 222000. Это подтверждает давно выдвинутую гипотезу о том, что (2т^1) никогда не свободно от квадратов при п >4. Аналогичные предположения для кубов таковы: ( ™) делится на куб простого числа для всех п > 1056 и либо на 23, либо на З3 для всех п > 229 + 223. Эти гипотезы были проверены для всех п < 210000. Поль Эрдёш (Paul Erdos) предположил, что на самом деле тахр ер((2Т[1)) —> со при п —> со; это должно быть справедливо, даже если мы ограничим р значениями 2 и 3. 5.113 Теорема о производящих функциях из упр. 7.20 может помочь в ответе на этот вопрос. 5.114 Штрел (Strehl) [344] показал, что с[2) = ?к (?)3 = ^к (к) (п) пРеАставляют собой так называемые числа Фрейне- ла [132] и что с|г3) = JIk (?)2(^)2(п2_\)- в ДРУГОМ направлении Г. С.Вильф (H.S.Wilf) показал, что Сп — целые для всех га, когда п ^9. 6.1 2314, 2431, 3241, 1342, 3124, 4132, 4213, 1423, 2143, 3412, 4321. 6.2 Ровно {?}та-, потому что область определения всякой такой функции разбивается на к непустых подмножеств, а для каждого разбиения имеется та- способов приписать функции значения. (Суммирование по к дает комбинаторное доказательство формулы (б.ю).) 6.3 В этом случае имеем d^+i ^ (центр тяжести) — е = 1 — е + (di + • • • + dk)/к. Это рекуррентное соотношение подобно (6.55)1 но с 1 — е вместо 1; следовательно, оптимальным решением является dic+i = (1 — eJHfc. Эта величина не ограничена при е<1. 6.4 Н2п+1 - 1НП. (Аналогично J^ (-1 )к"Ук = H2n - Hn.) 6.5 Величина Un(x,y) равна *Lk?, (^(-D^-'ic-Mx+icyr-'+yL^i ©(-D^Mx+icyr-1, и первая сумма есть Un-Tlx.yJ + ^^^^H^k-Vx + lcyr-1. k^l ^ '
656 Ответы к упражнениям Лишнее k ] может быть внесено в биномиальный коэффициент, и мы получим, что г С к$>1 \Jc-1 (х+ку) п-1 .п-1 к^>0 ч 7 к-1 (х+ку) п-1 = X п-1 Тем самым доказывается соотношение (6.75)- Пусть Rn(x,y) = x-nUn(x,y); тогда R0(x,y) = 0 и Rn(x,y) = Rn-i (х,у) + 1/п+у/х, следовательно, Rn(x)y) = Нп +пу/х. (Между прочим, первоначальная сумма Un = ип(гц — 1) не приводит к рекуррентному соотношению, подобному этому, так что проще вычислить индуктивно более общую сумму, которая лишена зависимости х от п, нежели ее частный случай. Вот еще один поучительный пример, когда сильное индуктивное предположение существенно меняет исход дела.) 6.6 Каждая пара крольчат ьь, рожденных в конце одного месяца, становится парой половозрелых кроликов аа в конце следующего месяца; каждая пара аа становится парой аа и ьь. Таким образом, каждая пара ьь ведет себя наподобие трутня в родословном дереве, а каждая пара аа— наподобие матки, за тем исключением, что родословное дерево пчел обращено в прошлое, а родословное дерево кроликов— в будущее. Через п месяцев имеется в наличии Fn+i пар кроликов, из которых Fn— половозрелые, a Fn_i — крольчата. (Именно в этом контексте Фибоначчи ввел в употребление свои числа.) 6.7 (а) Положите к = 1 — п и примените (6.107). (б) Положите m = 1 и к = п — 1 и примените (6.128). 6.8 55 + 8 + 2 превращается в 89 + 13 + 3 = 105; точное значение— 104.60736. 6.9 21. (При возведении единиц измерения в квадрат мы переходим от Fn к Fn+2. Точное значение— приблизительно 20.72.) 6.10 Все неполные частные do, си , <12, ... равны 1, потому что ф = 1 + 1/ф. (Так что представление Штерна-Броко данной величины имеет вид RLRLRLRLRL... .) 6.11 (-1)^=[п = 0]-[п=1]; см. (б.и). 6.12 Это следствие (6.31) и дуальной формулы из табл. 325. 6.13 Согласно упр. 12 эти две формулы эквивалентны. Можно воспользоваться индукцией, а можно заметить, что znDn применительно к f (z) = zx дает х—zx, в то время как Фп применительно Рекуррентное соотношение Фибоначчи— аддитивное, а кролики почему- то множатся... Это "точное значение" представляет собой длину 65 международных миль, но международная миля равна .999998 американской мили. В 3937 американских милях содержится ровно 6336 километров; метод Фибоначчи преобразует 3937 в 6370.
А Ответы к упражнениям 657 к той же самой функции дает xnzx; поэтому последовательность (^°,-а1>-а2>...) должна быть связана с (z°D°,z1D1>z2D2)...) так же, как последовательность (х0, х1, х2,...) связана с (х-> х-, х-,...) 6.14 Имеем потому что (п + 1 )х — (к + 1) (х + к — п) + (п — к) (х + к + 1). (Достаточно проверить последнее тождество при к = 0, к = — 1 и к = п.) 6.15 Поскольку Д((х^к)) = (**^), общая формула такова: k j Положите х = 0 и обратитесь к (6.2о). 6.16 An,k = Zlj^o а) {Пк3}' Аанная сумма всегда конечна. 6-17 (а) \1\ = Ц|1к]. (б) \1\ = лД=* = п! [n?k]/k!. (в) |?| = 6.18 Это эквивалентно правилу (6.3) или рекуррентному соотношению (6.8). 6.19 Воспользуйтесь табл. 334. 6-20 Li^icsn 1/j2 = 51икп(п+ ! -Я/3'2 = (n+ 1)H<,2) -Hn. 6.21 Указанное число— это сумма дробей с нечетными знаменателями, так что оно имеет вид а/Ь с нечетным Ъ. (Между прочим, из постулата Бертрана вытекает, что Ъп также делится по меньшей мере на одно простое число, когда п > 2.) 6.22 |z/k(k + z)| ^ 2|z|/k2 при k > 2|z|, так что эта сумма определена, когда ее знаменатели не равны нулю. Если z = п, то Ик=] О A- 1/(k + n)) = Hm - Hm+n + НП, что стремится к Нп при га —> со. (Величина Hz_i —у часто называется пси-функцией ФИО 6.23 z/(e2 + 1) =z/(ez-1)-2z/(e2z-1) = 2:n>0(1-2-)BnzVn!. 6.24 Если n— нечетное число, то Тп(х) является полиномом от х2, следовательно, когда мы берем производную и вычисляем Tn+i(x) по формуле (6.95), его коэффициенты умножаются на четные числа. (На самом деле можно доказать большее: согласно упр. 54 в знаменателе числа Бернулли Bzn всегда содержится
658 Ответы к упражнениям 2 в первой степени, следовательно, 22n_k \\T2n+i <=^ 2k\\(n+1). Нечетные положительные целые числа (n+1 )T2n+i /22п называются числами Дженоччи (1,1,3,17,155,2073,...) в честь Дже- ноччи (Genocchi) [145].) 6.25 100n-nHn < 100(п - 1) - (п - 1)Hn_-, ^ Hn_! > 99. (Наименьшее такое п приблизительно равно е99-у, в то время как на весь путь червяк затрачивает время N « е100_у, т.е. примерно в е раз больше. Таким образом, червяк становится ближе к цели своего путешествия на протяжении последних 63% пути.) 6.26 Пусть u(k) = Hk_i и Av(k) = 1/k, так что u(k) = v(k). п+1 H* Тогда Sn - H\t] = Lk=i Hk-i /k = H^_1|? 6.27 Заметьте, что если m>n, то HOA(Fm, Fn)= HOA(Fm_n, Fn) согласно (6.io8). Это позволяет доказать требуемое по индукции. 6.28 (a) Qn = ot(Ln — Fn)/2 И- (3Fn. (Решение можно также записать в виде Qn = aFn_i -f- |3Fn.) (б) Ln = фп + $n. 6.29 При k = 0 это правило (6.133)- При к = 1 это, в сущности, соотношение K(xi,... ,xn)xm = K(xi,... ,xm) K(xm,... ,xn)— -K(x1,...,xm_2)K(x на языке азбуки Морзе второе произведение справа отбрасывает те случаи, где первое произведение содержит накладывающиеся тире. При к > 1 достаточно индукции по к с использованием (6.127) и (6.132). (Это тождество справедливо также в тех случаях, когда один или более индексов при К становятся равными —1, если условиться, что K_i = 0. Когда умножение некоммутативно, тождество Эйлера остается в силе для к = п — 1, если записать его в виде Km+n(*1 > • • • >X-m4-n) Kn_i (Х-тп+п—1 > • • • >*m+1 J — — Km+n— 1 1*1 > • • • > X-m+n— 1 J K>nl*m+n> • • • > *m+l )~ -M)nKm_1(x1,...,xm_1). Например, в случае га = 0, n = 3 мы получаем несколько неожиданные некоммутативные разложения (аЪс + а + с)(1 +Ьа) = (аЬ + 1)(сЪа + а + с). 6.30 Производная K(xi,..., xn) по хт представляет собой Само собой, вездесущий Эйлер знал о числах Дженоччи задолго до того, как тот появился на свет: см. [ПО], том 2, глава 7, §181. K(xi,..., xm_i) K(xm+i,..., xn),
А Ответы к упражнениям 659 а вторая производная равна нулю; следовательно, ответ таков: K(xi,...,xn) + K(xi,..., xm_-|) K(xm+1,..., хп)у . 6.31 Поскольку х^ = (х + п - 1 )* = Lk (k)x"(n - ] )—» име" ем |?| = (?) (п — 1 }^—-. Эти коэффициенты, как оказывается, удовлетворяют рекуррентному соотношению = (n-1+k) n-1 k + n-1 k-1 целые n, k > 0. 6.32 L^m4n:k} = r+r1}«io«n{™}(™+irk = {m+i}' они °^a приводятся в табл. 326. 6.33 Если n > 0, то согласно (6.71) [?] = \{n - 1}!(H^_-, - HJ^), а согласно (6.2o) {3} - |(3n - 3-2n + 3). 6.34 Имеем (~^) = 1/(k+1), (~k2) = Hj^ , и вообще при любом целом п величина (?) задается соотношением (6.38). 6.35 Выберите в качестве п наименьшее целое > 1 /е, такое, что LHnJ>LHn-iJ. 6.36 В этом случае dk+i = (l00+(1+d!)+-• •+(1+dk))/(100+k), и решением является dk+i = Н^+юо — Hi от +1 при k J> 1. Это значение превышает 2 при к ^> 176. 6.37 Суммирование (по частям) дает Hmn — (^ + ^ + • • • + 7^) = Hmn — Нп. Поэтому бесконечная сумма равна In га. (Отсюда следует, что LVmM га тт; тт — 7 In. ттъ. k^k(k+1) m-1 потому что vm(k) = (та — 1) Y.\^i 0е m°d та')/тЛ) 6.38 (-1)k((rk1)^-1 - (klDHk) + С. (По частям, с использованием (5.16).) 6.39 Запишите ее в виде XLi^j^rJ-1 XLi<k<n^k и> ИСХ°ДЯ из (6.67), просуммируйте вначале по к, получив (n+1)H* -(2n+1)Hn + 2n. 6.40 Если 6п — 1 — простое число, числитель суммы 4n_1 (—I)*-1 / Г = Н4п-1 — Н2п-1 к=1 К
660 Ответы к упражнениям делится на вп — 1, потому что эта сумма представляет собой 4тг-1 л Зп-1 ]с=2п к=2п Аналогично, если 6п+1 является простым числом, то числитель суммы L?=1(--1)k~1A = Н4п - Н2п кратен 6п + 1. Для 1987 следует суммировать до к = 1324, а для 2011 — до 1340. 6.41 Sn+1 = Lk (^+Vk)/2J) = ?к p+3/2J), следовательно, Sn+i +Sn = Lk р+™2+^) = Sn+2. Ответ: Fn+2. 6.42 Fn. 6.43 Положив z = jq в Цп>о ^n^n = z/П — z — z2)> получим ^. Данная сумма представляет собой периодическую десятичную дробь с длиной периода 44: 0.11235 95505 61797 75280 S9SS7 64044 94382 022471910112359 55+. 6.44 Замените при необходимости (га, к) либо на (—га, —к), либо на (к, —га), либо на (—к, га) так, чтобы было га ^ k ^ 0. Если га = к, то все ясно. Если же га > к, то можно заменить (га, к) на (га — к, га) и воспользоваться индукцией. 6.45 Xn = A(n)a+B(n)P + C(u)Y+D(n)6, где В(тг) = Fn, А(тг) = Fn_!, А(п) + В(тг) - D(n) - 1 и В(тг) - С(п) + 3D(n) - п. 6.46 ф/2 и ф-1/2. Пусть u = cos72° и v = cos36°; тогда и = 2v2 — 1 и v = 1 — 2 sin2 18° = 1 — 2и2. Следовательно, и + v = 2(и + v) (v — и), и 4v2 — 2v — 1 =0. Продолжая, можно найти пять комплексных корней пятой степени из единицы: ф-1 ±г>/2 + ф -ф ±г>/3-ф 2 2 6.47 2n\/5Fn = (1 + л/5)п — (1 — x/S)71, и четные степени л/5 сокращаются. Пусть теперь р — нечетное простое число. Тогда (2k^i) = 0 за исключением случая, когда к = (р—1 )/2, и Qi^) = 0 за исключением случая, когда к = 0 или к = (р — 1 )/2; следовательно, Fp = 5(Р~1)/2 и 2Fp+1 = 1 +5(т-1)/2 (mod р). Можно показать, что 5^р_1 ^2 = 1, когда р имеет вид 10к± 1, и 5^р_1 ^2 = —1, когда р имеет вид 10k ± 3. 6.48 Пусть Ktj = Kj_i+i (xt, ...,Xj). Многократное применение (6.133) сводит обе части к (K1,m_2(xm_1 +xm+1) + K1>m_3) х ^т+2,тг + Ki>TTL_2Km+3,n- 1_ k бтг- = Z г ->_ 6тг-1 k(6n - 1 - k)
А Ответы к упражнениям 661 6.49 Положите z = \ в (6.146); неполные частные— это О, 2F°, 2Fl, 2Fz, ... . (Как отмечал Кнут [206], это число является трансцендентным.) 6.50 (a) f(n) четное <^=> 3\п. (б) Если двоичное представление п есть (1ai0Q2 ... 1 Qm-10am)2, где m четное, то f(n) = K(ai,ci2,...)am_i). 6.51 (а) Комбинаторное доказательство. Представление множества {1,2,..., р} в виде к подмножеств или циклов делится на "орбиты" из 1 или р представлений каждая, если к каждому элементу добавить 1 по модулю р, например {1,2,4}U{3,5} -> {2,3,5}U{4,1} -> {3,4,1}U{5,2} -> -> {4,5,2}U{1,3} -> {5,1,3}U{2,4} -» {1,2,4}и{3,5}. Орбита размером 1 получается только тогда, когда это преобразование переводит представление само в себя; но тогда к = 1 или к = р. С другой стороны, можно дать алгебраическое доказательство: имеем хр = х^-Н-х-их^е хр—х (modр), поскольку согласно теореме Ферма хр —х делится на (х—0)(х—1)... (х—(р—1)). (б) Этот результат следует из п. (а) и теоремы Вильсона; можно также воспользоваться тем, что хр-1 = хр/(х — 1) = (хр — х)/(х - 1 ) = Х?-1 + Хр"2 + • • • + X. (в) Имеем {р^} ее [р+]] = 0 при 3 ^ k ^ р, затем — {р+2} = [р+2] =0 при 4 <: к <: р и т.д. (Аналогично [2рр-1] = Р3 [§] - Р2 И + Р [?] • Но р [р] = р!, так что Р Р 2 Р _2 = Р3 "Р 4 + • • • + рр кратно р2. (Это называется теоремой Вольштенхольма (Wolsten- holme).) 6.52 (а) Заметьте, что Нп = Н^ + Н^/р]/р, где Н^ = ^Г?=1 [k_Lp]/k. (б) Действуя по mod 5, получаем Нг = (0,1,4,1,0) при 0 ^ г ^ 4. Таким образом, первым решением служит п = 4. Из п. (а) известно, что 5\an ==> 5\a^n/5j; поэтому следующим возможным интервалом служит n = 20 + r, 0^г^4, где мы имеем Нп - Н; + 1н4 - Н^0 + ^ЬЦ + Нг - ?*=1 20/к(20 + к). Числитель дроби H^q, как и числитель дроби ЬЦ, делится на 25. Следовательно, в этом интервале есть только два решения: п = 20 и п = 24. Следующим возможным интервалом является п = 100 4- г; в этом случае Нп = Н? + т=-Н2о, что равно
662 Ответы к упражнениям ^Н2о + Нг плюс некая дробь, числитель которой кратен 5. Если ijbbo = та (mod 5), где та— целое число, то гармоническое число Нюо+т будет иметь числитель, который делится на 5 тогда и только тогда, когда m + Нг = 0 (mod 5); следовательно, га должно быть = 0, 1 или 4. Действуя по модулю 5, найдем, что ^Н2о = 5^20 + 15^4=2кН4 = у2=3; следовательно, при 100 ^ n ^ 104 решений нет. Аналогично нет решений и при 120 ^ n ^ 124; итак, мы нашли все три решения. (Согласно упр. 6.51, г мы всегда получаем, что p2\ap_i, р\ар2_р и p\ap2_-|, если р — некоторое простое число ^ 5. Только что приведенное рассуждение показывает, что этим исчерпываются все решения для p\an тогда и только тогда, когда не существует решения для p_2Hp_i + Нг = 0 (mod р) при 0 ^ г < р. Последнее условие справедливо не только при р = 5, но и при р = 13, 17, 23, 41 и 67, а может, и для бесконечного количества простых чисел. Числитель Нп делится на 3, только когда п = 2, 7 и 22; он делится на 7, только когда п = 6, 42, 48, 295, 299, 337, 341,2096,2390, 14675, 16731, 16735 и 102728. См. ответ к упр. 92.) 6.53 Суммирование по частям дает 1 Л-1^т п- (*+2)НО ¦((п + 2)Нт+1-1)-1 Вниманию программистов: вот интересное условие для проверки на стольких простых числах, сколько вы сможете. 6.54 (а) Если га ^ р, то Sm(p) = Sm_(p_i)(p) (modp), поскольку kp_1 = 1 при 1 <J k < p. Кроме того, Sp_i (p) = p — 1 = — 1. Если 0 < m < p — 1, то можно записать, что ^=im*=m\ k=0j=0 itl TT o. (б) Обстоятельство, содержащееся в указании к упражнению, означает, что знаменатель числа Izn не делится ни на какое простое р; следовательно, lin должно быть целым числом. Чтобы доказать утверждение из указания, можно считать, что п>1. Тогда 2п-2 Р *— v k=0 2n+1 k Bi ,2u-k 2n+1 представляет собой целое число согласно (6.78), (6.84) и п. (а). Так что надо убедиться, что ни один из знаменателей ( n^~ ) х Bkp2n-k/(2n + 1) = (2^)Bkp2rL-k/(2n - k + 1) не делится на р. Знаменатель числа ( ^В^р не делится на р, поскольку в знаменателе Вк не содержится р2 (по индукции), а знаменатель ,2n-k-1 /(2тг—к+1) не делится на р, поскольку 2п—к+1 < р 2тг-к ( Числители чисел Вернулли играли важную роль в ранних исследованиях большой теоремы Ферма; см. Рибенбойм (Ri- benboim) [308].)
А Ответы к упражнениям 663 при к ^ 2п—2. QED (Числа Ijn табулированы в [224]. Эрмит (Нег- mite) вычислил \2п вплоть до lis в 1875году [184]. Оказывается, что I2 = 14 = 1б — Is ^Iio — hi — 1; следовательно, на самом деле для чисел Бернулли, приведенных в тексте главы, включая 27зо (•)> все же имеется "простая" закономерность. Но при 2п> 12 числа l2n> похоже, не обладают сколь-нибудь примечательными свойствами. Например, В24 = —86579—\—\ — \ — \~уз> и число 86579— простое.) (в) Числа 2—1 и 3 — 1 всегда делят 2п. Если п— простое число, то делителями 2п являются только 1, 2, п и 2п, так что при простом п > 2 знаменатель числа Bin будет равен 6, если только число 2п + 1 также не является простым. В последнем случае можно испытывать числа 4п + 3, 8п + 7, ... до тех пор, пока в конце концов не попадется непростое число (поскольку п делит 2n_1 n + 2n_1 — 1). (Для этого доказательства не требуется более трудная, но справедливая теорема о том, что существует бесконечно много простых чисел вида 6к+1.) Число 6 также может быть знаменателем В2П и для непростых значений п, таких как 49. 6.55 Указанная сумма равна х^|1 C^Hm+i) согласно правилу свертки Вандермонда. Чтобы получить (6.70), продифференцируйте и положите х = 0. 6.56 Сперва замените kn+1 на ((к — га) + m)n+1 и разложите по степеням к — га; результат упростится, как при выводе (6.72). Если га > п или га < 0, то ответ представляет собой (—1 )пп! — rarL/(n^m)- В противном случае необходимо взять предел (5-41) при х ~^ —m за вычетом члена при к = га; в результате получится (-1 )пп! + (-1 )m+1 (^)mn(n + 1 + mHn_m - mHm). 6.57 Сначала докажите по индукции, что п-я строка содержит самое большее три различные величины Ап ^ Вп ^ Сп; если п четное, то они располагаются в циклическом порядке [СП) Вп> Лп> Вп> Сп], а если п нечетное, то в циклическом порядке [Cn)Bn>AmAn>Bn]. Кроме того, А2п+1 = А2п + B2n ; А2п = 2A2n-i ; В2П+1 = В2п + С2П; B2n = A2n-i + B2n-i; С2п+1 — 2C2n i С2п = В2п-1 +С2п-1 • Отсюда следует, что Qn = Ап — Cn = Fn+i. (Относительно обернутых биномиальных коэффициентов порядка 3 см. упр. 5.75.) 6-58 (a) Ln»oFnZn =z(1 -z)/(1 +z)(1 -3z + z2) = i((2-3z)/ (1 — 3z + z2) — 2/(1 + z)). (Возведите в квадрат формулу Вине
664 Ответы к упражнениям (6.123) и просуммируйте по п, затем сгруппируйте члены так, чтобы фиф исчезли.) (6) Аналогично у 3 = z(1-2z-z2) = 1 ( 2z Ъг ^ n (1-4z-z2)(1+z-z2) 5 \]-4z-z2 ]+z-z2 Отсюда следует, что F^+1 — 4F^ — F^_1 = 3(—1)nFn. (Соответствующее рекуррентное соотношение для т-х степеней включает фибоначчиевы коэффициенты из упр. 86; оно было открыто Джарденом (Jarden) и Моцкиным (Motzkin) [194].) 6.59 Пусть га— фиксированное число. Можно доказать по индукции по п, что в самом деле можно найти такое х с дополнительным условием х ф 2 (mod 4). Если х является таким решением, то можно перейти к решению по модулю 3n+1, потому что F83n-i = 3n, F8.3n-i-i = 3n + l (mod3n+1); подойдет либо х, либо х 4- 8 • 3n_1, либо х + 16 • 3n_1. 6.60 Единственно возможные случаи— Fi + 1, F2 + 1, F3 4- 1, F4 — 1 и Fg — 1. В противном случае в разложениях возникают числа Люка из упр. 28: hm + (" 1)m = Lm+1 ^m-l ] Ьтп+1 + (~ 1 )m = LmFm+iJ bm- (—l)m = Wi-i Fm+i ; F2m+i — (—l)m = Lm+iFm. (В общем случае Fm+n - (-1 )nFm_n = LmFn.) 6.61 1/F /Fm — F2m-i /bm, когда m четное и положительное. Вторая сумма равна 5/4 — Ts.in-i /^s-2n при п ^ 1. 6.62 (а) Лп = у/5 An_i - Ап-2 и Вп = л/5Вп_] - Вп_2. Кстати, кроме того, л/5Ап + Вп = 2An+i и л/5Вп — Ап = 2Bn_i. (б) Таблица начальных значений показывает, что _ fLn> п четное; _ Г >/5Fn, п \\/5Fn> п нечетное; n \ Ln, п: четное; ^ _ J >/5Fn, п четное; нечетное. (в) Bn/An+i - Bn_i/An = 1/(F2n+i + 1), потому что ВПАП - Bn_iAn+i = у/Ъ и АпАп+1 = \/5(F2n+i+!)• Обратите внимание, что Bn/An+i = (Fn/Fn+i )[п четное] + (Ln/Ln+i)[n нечетное]. (г) Аналогично ??=1 1/(F2k+i - 1) = (A0/Bi - Ат/В2) + • • • + (An_i /Вп — An/Bn+i) = 2 — An/Bn+i. Эту величину можно записать и как (5Fn/Ln+i )[п четное] + (Ln/Fn+i )[тг нечетное].
А Ответы к упражнениям 665 6.63 (а) [?]. Всего имеется [?_]] перестановок с яп = п и (п — 1)[п^ ] перестановок с 7ГП < п. (6) (?). Каждая перестановка Pi ... pn_i множества {1,..., п — 1} приводит к п перестановкам 7ti 7Т2 ... яп = pi .., pj_i Т1 pj+i ... pn_i pj. Если pi ... рп_! содержит к превышений, то имеется к + 1 значений j, которые дают к превышений в перестановке щ тс2 ... яп; остальные п — 1 — к значений дают к + 1. Следовательно, общее количество способов получения к превышений в перестановке п-[ гс2 ... тгп равно (k+i)(V) + ((n-i)-(k-i))C:11) = ^). 6.64 В соответствии с доказанным в упр. 5.72 знаменатель дроби (2п) равен 24n_V2^n^. Согласно (6.44) дробь [1/2_п] имеет тот же знаменатель, поскольку ((?)) = 1 и ((?)) четное при к > 0. 6.65 Это равносильно утверждению, что (?)/тг! представляет собой вероятность того, что |xi Н hxnJ = к, если xi, ..., хп — независимые случайные величины, равномерно распределенные между 0 и 1. Пусть tjj = (xi Н Ь Xj) mod 1. Тогда у i, ..., "Уп независимы и равномерно распределены, a [xi + Ь *nj — это количество спадов в последовательности у. Перестановка у также случайна, и вероятность к спадов такая же, как и вероятность к подъемов. 6.66 2п+1(27г+1-1)Вп+1/(тг+1),еслип>0. (См. (7.56) и (6.92); требуемые числа являются, в сущности, коэффициентами разложения 1 — thz.) 6.67 Эта сумма- Ы^М^Чк^Нп^ЫГ-* = LAlM-^m-4C=i)-(n:^k)) = Lk№-ir+1-kx (n-m-i) = (п-ш-i) в соответствии с (6.3) и (6.40). Теперь примените (6.34)- (Это тождество допускает и комбинаторное истолкование [59].) 6.68 Имеет место общая формула аналогичная формуле (6.38). При m = 2 она представляет собой С» - {Г}-^Нп22КГ)П = l3n+2-(2n+3)2n+1+^(4n2+6n+3). 6.69 ^п(п+^)(п+1)(2Н2п-Нтг)-з!бП(10п2+9п-1). (Было бы неплохо автоматизировать вывод подобных формул.)
666 Ответы к упражнениям 6.70 1/k— 1/(k+z) = z/k2—z2/k3H—; этот ряд сходится при И<1. 6.71 Заметьте, что П?=1 П+*А)е-г/к = (ъ+^п^е(\пп-нп)г^ Если f(z) - ?(z!), то f(z)/z!+y = Hz. 6.72 Для tg z можно использовать тождество tg z=ctg z—2 ctg 2z (которое эквивалентно тождеству из упр. 23). Кроме того, функция z/sinz = zctgz+ztg^z раскладывается в степенной ряд Ln^o(-1)n-1(4n-2)B2nz27(2n)!; а tgz sinz In = In In COS z = = Y( ^n^BznZ2- _ Vf 4"(4"-1)B2nz2" ^l J (2n)(2n)! ^ ' (2n)(2n)! v- _,4n(4n-2)B2n^ ^1 (2n)(2n)! ' потому что -^ In sin z = ctg z и -^ In cos z = — tg z. 6.73 ctg(z+7t) = ctgz и ctg(z+^7t) = — tgz; следовательно, тождество эквивалентно тождеству 1 2^] z+кя ctSz = *Г 2_ ctg^~> к=0 которое получается по индукции из случая п = 1. Указанный предел справедлив, поскольку zctgz —> 1 при z —> 0. Можно показать, что допустим почленный переход к пределу, так что справедлива формула (6.88). (Между прочим, имеет место и общая формула 1 г^- . z+кя ctgz = - У" Cti п ^— П ^— П к=0 Она может быть установлена либо из формулы (6.88), либо из формулы 1 1п^ 1 L gnz "J -pL ^— g?+2k7ii/n ] > к=0 эквивалентной разложению l/(zn—1) в элементарные дроби.) 6.74 Поскольку tg2z+sec2z = (sinz+cosz)/(cosz—sinz), подстановка x = 1 в (6.94) даетТп(1) = 2nEn, где 1/cosz = ^n^0 E2n2:2n/ (2n)!. (Коэффициенты En называются в комбинаторике Эйлеровыми числами (не путайте их с числами Эйлера (?)). Имеем (Е0>ЕЬЕ2>...) = (1,1,1,2,5,16,61,272,1385,7936,50521,...).
А Ответы к упражнениям 667 В числовом анализе Эйлеровы числа определяются иначе: здесь они равны (—l)rL//2En[n], где Еп— определенные выше Эйлеровы числа.) 6.75 Пусть G(w,z) = sinz/cos(w+z) и H(w,z) = cosz/cos(w+z) и пусть G(w, z)+H(w, z) = Лшп Em>TIwmzn/TrL! n!. Тогда из уравнений G(w,0) = 0 и (-§?—§^)G(w,z) = H(w,z) вытекает, что Em,o = 0, когда m нечетное, Em>n+i = Em+1,n+Em>n, когда m+n четное; а из уравнений H(0,z) = 1 и (g^j—j^)H(w,z) = G(w,z) вытекает, что Ео>п = [тг = 0] при четном тг, Em+i>n = Em>n+i + Em,n при нечетном m+n. Следовательно, тг-я строка треугольника содержит числа En>o, En_ij, ..., Е0,п. Слева число ЕП)0 представляет собой секансное число Еп [п]; справа имеем число Eo,n=Tn+[n = 0]. 6.76 Пусть Ап обозначает искомую сумму. Заглянув вперед, в (7.49)> мы увидим, что Ln Anzn/n! = X^kMlMk}2"-^1 х zn/nl = i;k(-1)k2-k(e2z-1)k = 2/(e2z+1) = 1-th z. Следовательно, согласно упр. 23 или 72 An = (2n+1-4n+1)Bn+1/(n+1) = (_l)(-+i)/2Tn+[n = 0]. 6.77 Формула доказывается индукцией по га с использованием рекуррентного соотношения из упр. 18. Можно также доказать ее, отталкиваясь от (6.46), с учетом того факта, что (-ir-i(m-l)! ,„11да- 1 = (D+1) (ez-1)m ez-1 -k-i т целое та > 0. m—1 г ... 1 дтп-k-l -J = L m m—к ^zm-k-l ez_] > k=0 L Последнее уравнение оказывается эквивалентным следующему: dm 1 , ,чтт- fm+11 (k-1)! 1 7 = -1 > i , >-г тттг) целоет^О. dzmez-1 v J ^-\ k J(ez-1)k) ^ 6.78 Если p(x) — некоторый полином степени ^ тг, то "м-Г"<-ч(т)(^:). потому что это равенство справедливо при х = 0, —1, ..., —тг. Указанное в упражнении тождество представляет собой частный случай, когда р(х) = хо*п(х) и х = 1. Кстати, мы получаем более простое выражение чисел Бернулли через числа Стирлинга,
668 Ответы к упражнениям положив к = 1 в (6.gg): ?{:}-"¦?"-• 6.79 Сэм Лойд (Sam Loyd) [256, с. 288 и 378] привел конструкцию и утверждал, что еще в 1858 году он изобрел (но не опубликовал) конструкцию "64 = 65'.' (Аналогичные парадоксы восходят по крайней мере к XVIII веку, но Лойд нашел более удачные способы их представления.) 6.80 Можно ожидать Am/Am_i « ф, так что давайте испытаем Am_i = 618034+г и Ат_2 = 381966-г. Тогда Ат_3 = 236068+2г и т.д., и мы найдем, что Am_i8 = 144—2584r, Am_i9 = 154+4181г. Следовательно, г = О, х = 154, у = 144, m = 20. 6.81 Если P(Fn+i,Fn) = 0 при бесконечном количестве четных значений п, то Р(х,у) делится на U(x,y)—1, где U(x,y) = х2—ху—у2. Действительно, если t— совокупная степень полинома Р, то можно записать t Р(*,у) = ^qkxV~k+ Л rhkxiyk = Q(x,y)+R(x,y). k=0 j+k<t Тогда P(Fn+1,Fn) ^- ^ /Fn+14k ^qk(f^±l)+0(1/Fr k=o V hW и, переходя к пределу п —> оо, получаем 2Ik=o ЧкФк = 0. Следовательно, Q(x,y) кратно U(x,y), скажем, A(x>y)U(x,y). Но U(Fn+i,Fn) = (-1)п и п четное, так что Ро(х,у) = Р(х,у)- (U(x>y)—1)А(х,у) представляет собой другой полином, такой, что Po(Fn+i,Fn) = 0. Совокупная степень ?о меньше t, так что по индукции по t полином ?о кратен U—1.
А Ответы к упражнениям 669 Аналогично полином ?{х,у) делится на U(x,y)+1, если условие PfFn+^Fn) = 0 выполняется для бесконечного количества нечетных значений п. Объединение этих двух фактов дает требуемое необходимое и достаточное условие: Р(х,у) делится на U(x,y)2-1. 6.82 Сначала складываем цифры без переноса и получаем цифры 0, 1 и 2. Затем используем два правила переноса, 0(d+1)(e+1) -> ^de) 0(d+2)0e -> 1 d0(e+1), всегда выполняя крайний слева допустимый перенос. Этот процесс завершается, поскольку двоичное значение (bm .. . l^h, получаемое при чтении (bm ... ЪгЬ, увеличивается при каждом переносе. Но перенос мог бы распространиться вправо от "точки Фибоначчи", например (1 )f+(1 )f становится (10.01 )f- Такое распространение вправо захватывает не более двух позиций, и эти две цифровые позиции при необходимости вновь могут быть обнулены при помощи алгоритма "добавления 1" из текста главы. Между прочим, имеется соответствующая операция "умножения" неотрицательных целых чисел. Если га = F^-b —hFjq и n = F]Cl Ч hFkr в фибоначчиевой системе счисления, то по аналогии с умножением двоичных чисел положим топ — Иь=1 XLc=i ^ь+кс- (Это определение означает, что при больших тип значение топ « л/5тп, хотя Топ « ф2п.) Фибоначчи- ево сложение приводит к доказательству ассоциативного закона lo(mon) = (lom)on. 6.83 Да; например, можно взять До - 331635635998274737472200656430763; Ai = 1510028911088401971189590305498785. Получившаяся последовательность обладает тем свойством, что Ап делится на р^ (не будучи ему равно) при n mod mk = rk, где числа (pk> "miotic) соответственно принимают 18 следующих значений: (3,4,1) (2,3,2) (5,5,1) (7,8,3) (17,9,4) (11,10,2) (47,16,7) (19,18,10) (61,15,3) (2207,32,15) (53,27,16) (31,30,24) (1087,64,31) (109,27,7) (41,20,10) (4481,64,63) (5779,54,52) (2521,60,60) Упражнение: топ = тп+ [(т+1)/ф]п+ т[(п+1)/ф].
670 Ответы к упражнениям Каждому целому п соответствует одна из этих троек; например, все нечетные п содержатся в одной из шести троек в первом столбце, а тройки в среднем столбце включают все четные п, которые не делятся на 6. Оставшаяся часть доказательства основана на том факте, что Am+n = Аш?^--\-\-Аш+] Fn, а также на сравнениях Ао = Fmk_Tk modpk) Ai = Fmk_rk + i modpk для каждой из троек (pk> mk> тк). (Возможен "усовершенствованный" вариант решения, в котором Ао и Ai представляют собой числа, состоящие "всего лишь" из 17 цифр каждое [218].) 6.84 Последовательности из упр. 62 удовлетворяют следующим соотношениям: А_т = Ат, В_т = —Вт и ^-тп.'мг = '*-т+п~гА-т—n j ^-m.t>rL — t)m_|_n Dm_n J Пусть fk = Bmk/Amk+l и gk = Amk/Bmk+l, где I = l(n-m). Тогда fk+i-fk = AlBm/(A2mk+n+Am) и gk-gk+1 = AiBm/(A2mk+n— Am); следовательно, Jm,n = -t-w- Ит (fk-fo) AiDm к—юо = T-E- „lim (9o-9k) AiDm k-foo V5 Ф1лат' V5 /2 1 AvLmUi Ф1 = _i s- r T T ^m,n • 6.85 Это свойство выполняется тогда и только тогда, когда N имеет один из семи видов: 5к, 25к, 45к, 3^-5к, 65к, 75к, 145к. 6.86 Для любого положительного целого числа га пусть г (га) будет наименьшим индексом j, таким, что Cj делится на га; если такого j не существует, положим г (га) = оо. В таком случае имеет место следующая цепочка эквивалентностей: Сп делится на m тогда и только тогда, когда НОД(СП) Cr(m)) делится на га тогда и только тогда, когда СнОД(п rfm)) Аелится на m тогда и только тогда, когда НОД(гцг(га)) = г (та) тогда и только тогда, когда п делится на т(та). (И обратно, как легко видеть, сформулированное НОД-ус- ловие вытекает из условия, что последовательность Ci, С2, ...
А Ответы к упражнениям 671 имеет (возможно, бесконечную) функцию r(m), такую, что Отделится на m тогда и только тогда, когда п делится на г (га).) Положим теперь П(п) = С-\ С 2 ... Сп, так что /т+пЛ П(т+п) П(т)П(п) Если р— простое число, то кратность, с которой р делит П(п), равна fp(n) = X!k>i Ln/r(Pk)J) поскольку |_n/pkJ есть количество элементов {Ci,..., Сп}, делящихся на рк. Поэтому fp (m+n) ^ fp (Tn)+fр(п) для всех р и (mTT^n)e— целое число. 6.87 Данное произведение матриц равно Kn-2(*2> • • •, *п-1 ) Kn_-| (х2>..., Это же относится и к произведениям L и R, таким как в (6.137), потому что Г 0 1 1 О 0 1 1 a 0 1 1 О La. Определитель же равен Kn(xi,...,xn); более общий трехдиаго- нальный определитель V2 х2 det 1^ О уз *з ] \ О О Уп Хп/ XnDn_-|-yn X удовлетворяет рекуррентному соотношению DT Dn_2. 6.88 Пусть a-1 = ао+1/(си+1/(а2Н— )) — представление в виде непрерывной дроби. Тогда a a0 +- 1 1-z A0(z)+- Y_ *LnaJ, n^l Ai(z)+- 1 A2(z)+- 1 где [z = ^~4m + 1 ?— Япг — 1 z-qm_i Km(ab...>ar
672 Ответы к упражнениям В доказательстве, аналогичном доказательству (6.146) в тексте главы, используется обобщение теоремы Цеккендорфа (Френкель (Praenkel) [129, §4]). Если z = 1/b, где целое b ^ 2, то это дает представление в виде непрерывной дроби трансцендентного числа (Ь-1) ?п5И b"LnaJ, как в упр. 49. 6.89 Пусть р = К(0, си, а.2,..., am), так что р/п представляет собой m-ю подходящую дробь к данной непрерывной дроби. Тогда a = p/n+(-l )m/nq, где q = К(си,..., ат> (3) и (3 > 1. Поэтому точки {кос} при 0 ^ k < п могут быть записаны в виде О 1 , М)тЯ! П-1 , (-П^п,! > ~г ) • • • > ~г > n n nq n nq где 7ti ... яп_т — перестановка множества {1,..., п—1}. Пусть f (v) — количество таких точек < v; тогда как f (v), так и vn увеличиваются на 1 при возрастании v от k/n до (к+1 )/тг, за исключением случая, когда к = 0 или к = п— 1, так что они никогда не различаются более чем на 2. 6.90 Согласно (6.139) и (6.136) нам нужно максимизировать К (си >... > am) по всем последовательностям положительных целых чисел, сумма которых ^ п+1. Данный максимум достигается тогда, когда все а равны 1, поскольку, если j ^ 1 и а ^ 1, то Kj+k+1(1,...>1>a+1>bb...>bk) = = Kj+k+1(l>...,l,a,b1,...,bk)+Kj(1,...,1)Kk(bb...,blc) ^ ^ Kj+ic+1(1,...,1,a,bi,...,blc)+Kj+ic(1,...>1,a>bi)...,bk) = = Kj+k+2(l,...,1,a,bi,...,bk). (Моцкин (Motzkin) и Штраус (Straus) [278] показывают, как решать более общие задачи максимизации, связанные с континуан- тами.) 6.91 Один из кандидатов для случая п mod 1 = \ представлен в [213, §6], хотя, быть может, лучше всего умножить обсуждаемые там целые числа на некоторую константу, включающую в себя у/п. Элегантное решение этой исследовательской проблемы было найдено Филиппом Флажоле (Philippe Flajolet) и Гельмутом Продингером (Helmut Prodinger) в SIAM Journal on Discrete Mathematics 12 (1999), 155-159. 6.92 (а) Дэвид Бойд (David Boyd) показал, что существует только конечное количество решений при любом р < 500, за исключением, возможно, р = 83, 127, 397. (б) Поведение Ъп достаточно странное: с одной стороны, Ъп = НОК(1, ...,п) при 968 ^ п ^ 1066; с другой стороны, Ь60о = НОК(1,... >600)/(33-
А Ответы к упражнениям 673 Кауэрс нашел решение несмотря на то, что числа Стирлинга не "го- лономны" в смысле [383]. 5243). Эндрю Одлыжко (Andrew Odlyzko) заметил, что р делит НОКП,... >n)/brL тогда и только тогда, когда kpm ^ п < (lc+1)pm при некотором m ^ 1 и некотором к < р, таком, что р делит числитель числа Нк. Поэтому бесконечно много таких п существует в том случае, когда, к примеру, может быть показано, что почти все простые числа имеют только одно такое значение к (а именно— к = р—1). 6.93 (Брент (Brent) [38] обнаружил у числа еу удивительно большое неполное частное 1568705, но, по-видимому, это просто случайное стечение обстоятельств. Например, Госпер (Gosper) обнаружил еще большие неполные частные у числа тс: 453 294-е равно 12996958, а 11504 931-е равно 878783625.) 6.94 Рассмотрите производящую функцию ]Г m n>o Imr^n | wmzn, которая равна ^T^wFta'-fP'+y', а'+|3', a'j+zFfa+y, a-b(3, a))k(1), где FfdjbjC)— дифференциальный оператор a+Mw+d)z. 6.95 Элегантное решение этой исследовательской проблемы найдено Мануэлем Кауэрсом (Manual Kauers), Journal of Symbolic Computation 42 (2007), 948-970. 7.1 Подставим в производящую функцию z4 вместо D и z вместо ? , что даст нам 1/(1—z4—z2). Это похоже на производящую функцию для Т, в которой z заменено на z2. Следовательно, ответом будет 0 для нечетных m и Fm/2+i — для четных. 7.2 G(z) = 1/(1-2z)+1/(1-3z); G(z) = e2z+e3z. 7.3 Положив в производящей функции z = 1/10, получим iolnig 9 ш 9 • 7.4 Поделим ?{z) на Q(z) и найдем частное T(z) и остаток Po(z), степень которого меньше степени Q. Коэффициенты T(z) следует добавить к коэффициентам [zn] Po(z)/Q(z) для малых значений п. (Это— полином T(z) из (7.28).) Это свертка (l+z2)r и (1+z)r, так что S(z) - (1+z+z2+z3)r. 7.5 Кстати, для коэффициентов этой производящей функции не известно никакой простой формулы; следовательно, указанная сумма, скорее всего, не может быть выражена в достаточно простом аналитическом виде. (Производящие функции пригодны и для получения отрицательных результатов.) 7.6 Запишем решение соотношений до = ос, д-\ = (3, дп = gn_i+2gn_2+(-l)ny в виде gn = A(n)a+B(u)|3+C(u)Y. Функция 2П подходит в качестве решения при <х = 1,|3=2,у = 0;
674 Ответы к упражнениям функция (—1 )п подходит в качестве решения при ос = 1, (3 = — 1, у = 0; функция (—1 )пп подходит в качестве решения при а = 0, (3 = -1, 7 = 3. Следовательно, Л(п)+2В(п) = 2П, А(п)-В(п) = (-1)п и -В(п)+ЗС(п) = (-1)пп. 7.7 G(z) = (z/(1—z)2)G(z)-H, следовательно, G(z) 1-2z+z2 1+^ 1-3z+z2 1-3z+z2 ' поэтому имеем gn = F2n+[n = 0]. 7.8 Продифференцировав (1— z -x-1 no x дважды, получим (х+п)((нх+п-нх)2-(н<2+»п-н(2»)). Теперь положим x = m. 7.9 2h -r (n+1)(H2-H^j)-2n(Hr 7.10 Из тождества Hk_1/2-H_1/2 = ^гуН ^f = 2H2k-Hk вытекает, что ?k (2kk) (2^lf )(2H2k-Hk) = 4*Hn. 7.11 (a) C(z) = A(z)B(z2)/(1-z). (6) zB'(z) = A(2z)ez, следовательно, A(z) = §e-z/2B;(§). (в) A(z) = B(z)/(1-z)r+1, следовательно, B(z) = (1-z)r+1 A(z) и поэтому fk(r) = (г^)(-1)к. 7.12 Cn. Числа в верхней строке соответствуют позициям (+Т в последовательности из +1 и — 1, определяющей "горную гряду"; числа в нижней строке соответствуют позициям (—1 \ Например, указанный в условии массив соответствует 7.13 Продолжим последовательность периодическим образом (положив xm+k = xk) и определим sn = хН (-хп. Имеем sm = I, s2m = 21 и т.д. Должен существовать максимальный индекс kj, такой, что skj = j, skj+m = l+j и т.д. Эти индексы ki, ..., к\ (modulo m) определяют требуемый циклический сдвиг. Например, в последовательности (—2,1,-1,0,1,1,-1,1, 1,1) ст=10и1 = 2 имеем ki = 17, k2 = 24. 7.14 Уравнение G[z) = —2zG(z)+G(z)2+z (отнеситесь к последнему слагаемому с должным вниманием!) с помощью формулы для корней квадратного уравнения приводит к Готов спорить, что у сомнительного "фана порядка 0" все же есть одно остовное дерево. Gfz) - 1+2z-vT+4z2
А Ответы к упражнениям 675 Следовательно, д2п-н = 0 и д2П = (—1)n(2n)! Cn_i для всех п>0. 7.15 Существует (?)cDn_ic разбиений, в которых подмножество, включающее п+1, содержит еще к других объектов. Следовательно, P'(z) — ezP(z). Решением этого дифференциального уравнения будет P(z) = ее +с, причем с = — 1, поскольку Р(0) = 1. (Этот результат можно также получить суммированием (749) по т, поскольку ©п = ]Гт {*}.) 7.16 Один из способов состоит в том, чтобы прологарифмировать соотношение B(z) = l/((l-z)Ql(1-z2)a2(l-^3)a3(l-^4)a4...)' а затем использовать формулу для In у^ и поменять порядок суммирования. 7.17 Это следует из того, что J^° tne-t dt = п!. Имеется также обратная формула: 1 G<*> = 2* G(ze-ie)eel d9 7.18 (а) t(z-±); (б) -ОД; (в) ?(z)/t(2z). Любое положительное целое число однозначно представимо в виде m2q, где q свободно от квадратов. 7.19 При п > 0 коэффициент [zn] exp(xlnF(z)) является полиномом степени п от х, который кратен х. Первая формула свертки получается из приравнивания коэффициентов при zn в равенстве F(z)xF(z)y = F(z)x+y. Вторая формула получается из приравнивания коэффициентов при zn_1 в F'(z)F(z)x_1F(z)y = F'(z)F(z)x+y_1, потому что T'WHz)*-1* = x"1^(F(z)x) = X"1 Y.nfMz*-'. (Последующие свертки получаются путем взятия частной производной З/Зх, как в (743)0 Как показано в [221], можно утверждать даже большее, а именно г xfk(x+tk) yfn_k(y+t(n-k)) (x+y)fn(x+y+tn) x+tk у-К(п—k) x+y+tn для произвольных x, у и t. В действительности последовательность полиномов xfn(x+tn)/(x+tn) дает коэффициенты функции ЗчЫх, где Jt(z) = F(z^t(z)t).
676 Ответы к упражнениям (В (б-59) и (6.48) мы встречались с частными случаями этого тождества.) 7.20 Пусть G(z) - Х.^0 9^п. Тогда zlG^(z) = ^^-9n^"kHhl = X>+k-l)*gn+ic-izn n^O ti^O для всех k, I ^ 0, если положить gn = 0 при n < 0. Следовательно, если Po(z), ..., Pm(z)— полиномы с максимальной степенью d, не все равные нулю, то существуют полиномы ро(тг), •-., Рт+а(п), такие, что m+d Po(z)G(z)+---+Pm(z)G(m)(z) = ^_ ^Г P>)9n+j-dZn. Поэтому из условия дифференцируемой конечности функции G(z) следует, что m+d X. Pj(n+d) gn+j = 0 при всех п :> 0. Обратное утверждение доказывается аналогично. (Одно из следствий заключается в том, что производящая функция G(z) дифференцируемо конечна тогда и только тогда, когда соответствующая экспоненциальная производящая функция G (z) дифференцируемо конечная.) 7.21 Это задача размена с номиналами монет 10 и 20, так что G(z) = 1/(1-z10)(1-z20) = G(z'°), где G(z) = 1/(l-z)(1-z2). (а) Разложением G(z) на элементарные дроби является ^(1—z)_2+ l(1-z)-1+i(l+z)-1, так что [zn]G(z) = ?(2n+3+(-1)n). Подстановка n = 50 дает 26 способов выплаты требуемой суммы. (б) G(z) = (1+z)/(1-z2)2 = (1+zH1+2z2+3z4+---), так что [zn] G(z) = [n/2J+1. (Сравните со значением Nn = Ltl/5J+1 в задаче о размене монет в тексте. Задача грабителя эквивалентна задаче размена при помощи копеек и двушек.) 7.22 Каждый многоугольник имеет "основание" (отрезок внизу). Если А и В— триангулированные многоугольники, положим, что ЛЛВ является результатом приклеивания основания А к верхней левой стороне Л, а основания В — к верхней правой стороне. Так, например, Этот медленный способ решения поможет кассиру потянуть время до приезда полиции. В США формально имеется монета Аостоинством два цента, но с 1873года она не чеканится. И А
А Ответы к упражнениям 677 (Исходные многоугольники, возможно, придется слегка искривить для подгонки к нужной форме.) Таким способом можно получить любую триангуляцию, поскольку основание входит ровно в один треугольник, при этом слева и справа от него лежат некоторые триангулированные треугольники А и В. Замена каждого треугольника на z дает степенной ряд, в котором коэффициентом при zn служит число триангуляции с п треугольниками, а именно количество способов разбиений (п+ 2)-угольника на треугольники. Поскольку Р = 1+zP2, это производящая функция для чисел Каталана Co+Ciz+C2Z2H— ; количество триангуляции n-угольника равно Сп_2 = ( ъ-2)/(п~~ ^- 7.23 Обозначим через ап искомое число, а через bn— количество разбиений колонны с выемкой размером 2x1 х1 на вершине. Рассматривая возможные варианты расположения видимых сверху кирпичей, получим an = 2an_1+4bn_i+an_2+[Ti = 0]; Ьп = an_i+bn_i . Следовательно, производящие функции удовлетворяют уравнениям А = 2zA+4zB+z2A+1, В = zA+zB, откуда находим A(z) = 1-z (1+z)(1-4z+z2) "Интересно, что ajn равно Uln, квадрату количества способов покрытия прямоугольника размером Зх2тг костями домино, а Cl2n+1 = 2V2n + 1 '/ — И.Каплански (I. Kaplansky) Эта формула имеет отношение к задаче о покрытии костями домино прямоугольника размером Зхп; имеем an = ^(U2n+ V2n+i+(-1)n) = |(2+л/3)тг+Ч^(2-л/3)п+1+|(-1)п> что есть просто (2+л/З )п+1/6>, округленное до ближайшего целого. 7.24 п? ki + =п к] •.. .-km/m = F2n+i +Ьп-1 -2. (Рассмотрите коэффициент [z TL-1] dz ln(l/(1-G(z))),rAeG(z)=z/(1-z)2.) 7.25 Производящая функция— P(z)/(1—zm), где P(z)=z+2z2+ •+(m— 1)zm_l = ((m-l)z,,u"r,-mz" rm+1_ L+z)/(1- В знаменателе находится полином Q(z) = 1—zm = (1— cu°z)(1— a^z)... (1 — cum_1z). По теореме о разложении рациональных функций для случая различных корней получаем n mod m -i TTL—1 _kn -+E k=1 ОГ -1 7.26 {]-z-z2)${z)=?[z) приводит к ^ как в уравнении (7.61). (2(n+1)Fn+nFn+1)/5,
678 Ответы к упражнениям 7.27 Каждая ориентированная циклическая схема начинается с $ или ", или 2хк-цикла (для некоторого k ^ 2), ориентированного одним из двух способов. Следовательно, Qn = Qn_1+Qn_2+2Qn_2+2Qn_3+---+2Qo для тт. ^ 2; Qo = Qi = 1. Таким образом, производящая функция представляет собой Q(z) = zQ(z)+z2Q(z)+2z2Q(z)/(1-z)+1 = = 1/(l-z-z2-2z2/(1-z)) = = (1~z) = (1-2z-2z2+z3) ф2/5 | ф~2/5 | 2/5 1-ф2г 1-ф-2г 1+z' и Qn = (ф2п+2+ф-2п-2+2(-1)п)/5 = ((фп+1-фп+1)/^5) = 7.28 В общем случае, если A(z) = (1+zH hzm_1)B(z), то мы имеем Аг+Лг+т+Аг+2тН— = В(1) для 0 ^ г < т. В нашем случае т = 10 и B(z) = (1+z+- • -+z9)(l+z2+z4+z6+z8)(1+z5). 7.29 F(z)+F(z)2+F(z)3+-• • = z/(1-z-z2-z) = (1/(1-(1+>/2 )z)- 1/(1—(1—л/2 )г))/л/8, так что искомый ответ— ((1+л/2 )п—(1 — л/2)п)/л/8. 7.30 ??=1 (2nn"_,1~k)(anbn-k/(1-cxz)4an-lcbn/(1-pz)k), согласно упр. 5.39. 7.31 Производящая функция Дирихле будет равна C(z)2/C(z— 1); следовательно, находим, что д(п) представляет собой произведение (k-Н— кр) по всем степеням простых чисел рк, делящим п нацело. 7.32 Можно считать, что все b^ ^ 0. Множество арифметических прогрессий будет точным покрытием тогда и только тогда, когда 1 zbl zbm 1-z 1-zai 1-za™ Вычтем zbm/(1—zQm) из обеих частей и положим z = е2пх^ат. Левая часть обратится в бесконечность, а правая останется конечной, если только am_i не будет равно am. 7.33 (-1 )*-™+i [n > m]/(n-m).
А Ответы к упражнениям 679 7.34 Можно также записать Gn(z) = Y. (k^k^)[z™^ k1+(m+1)km + 1=n ^ m+1 В общем случае, если ki+2k2 + ---+rkr=n Ublcz,...,^ ^ Z2 "^ ' то Gn = ziGn-i+ziGrL-iH hzTGn_r+[n = 0], и производящей функцией будет 1/(1— Ziw—Z2W2 zrwr). В рассматриваемом частном случае ответом является 1/(1—w—zmwm+1). (См. частный случай т=1 в (5-74)0 7-35 (a) l^0<k<n(1/k+1/(n-k)) = lHn_1. (б) [2-](1Пт^)2 = пТ Н ~ п^71--1 из (7-5°) и (6.5S). Еще один способ в п. (б) состоит в использовании правила [zn] F(z) = ^[zn_1] F'(z) с F(z) = 7.36 i^lA(zm). 7.37 (а) В таблице выполняется соотношение a2n. = a2n+i =ЬП: n an bn 0 1 1 1 2 1 2 2 4 3 2 6 4 4 10 5 4 14 6 6 20 7 6 26 8 10 36 9 10 46 10 14 60 (6) A(z) = 1/((1-z)(1-z2)(1-z4)(1-z8)... ). (в) B(z) = A(z)/(1- z), а мы хотим доказать, что A(z) = (l+z)B(z2). Это следует из A(z)=A(z2)/(1-z). 7.38 (1— wz)M(w,z) = Лтуци^! (nun(m,n)—min(m— 1,ri— l))x = У ^л WmZn Z_m.,n^1 ^ M(zb...,zm) = zn = ^m n>1 wmzrL = wz/(l—w)(l—z). В общем случае (1-Zi)...(1-Zm)(1-Z! ...Zm) ' 7.39 Ответами на вопросы из указания будут соответственно X. aki Qk2 • • • Qkm и X akl ak2 ... akm . I^ki <k2<- -<кт^п l^k, ^k2^ ••^km^n Следовательно: (а) нам нужен коэффициент при zm в произведении (l+z)(l+2z)... (1+nz). Этот полином является зеркальным к (z+1)™, поэтому он равен С+^Н-^1]2^ h^^z71 и ответом будет [а+1+_!ттг]. (б) Коэффициент при zm в l/((l-z)(l-2z)... (1- nz)) согласно (747) равен {m^n}-
680 Ответы к упражнениям 7.40 Экспоненциальная производящая функция для (nFn_i — Fn> будет (z-l)F(z), где F(z) = I^0Fnz7n! = (e«>*-e**)A/5. Экспоненциальная производящая функция для (щ) равна e~z/ (1 — z). Их произведение равно 5-1/2(е(ф-1)г_е(ф-1)г) = 5-1/2(е-фг_е-фгЬ Имеем F(z)e~z = — F(— z). Таким образом, ответом будет (—1 )nFn. 7.41 Количество возрастающе-убывающих перестановок с максимальным элементом п в позиции 2к равно (^jc~11)A2k-i Ап_2к- Аналогично количество возрастающе-убывающих перестановок с наименьшим элементом 1 в позиции 2к+1 равно (^ )A2kAn_2k-i i потому что убывающе-возрастающих перестановок столько же, сколько и возрастающе-убывающих. Суммирование по всем возможностям дает 2АП - ^ГП^ЛАкАп-.1_к+2[п = 0]+[т1 = 1]. Следовательно, экспоненциальная производящая функция А удовлетворяет уравнению 2A'(z) = A(z)2-f-1, и А(0) = 1; указанная функция является решением этого дифференциального уравнения. (Следовательно, Ап представляет собой число Эйлера Еп из упр. 6.74, а именно— число секанса при четном п и число тангенса при нечетном п.) 7.42 Пусть ап— количество цепочек марсианских ДНК, которые не заканчиваются на с или е; и пусть bn— количество цепочек, заканчивающихся этими символами. Тогда an = 3an_i+2bn_i+[n = 0], Ъп = 2an_i+bn_1 ; A(z) - 3zA(z)+2zB(z)+1 , B(z) = 2zA(z)+zB(z); , , л 1 —z „, ч 2z A(Z) = T^4^' B(Z] = T^=?; и общее количество цепочек равно [zn](1+z)/(1— 4z—z2) = F3n+2- 7.43 Из (5.45) имеем gn = AnG(0). Можно записать п-ю разность произведения как AnA(z)B(z) - ^^(AkEn-kA(zj)(An-kB(z))) k ^ ' и En"k = (1+A)n-k = ?. (n7k)Aj- Таким образом, находим j,k ^ ' ^ ' '
А Ответы к упражнениям 681 Это сумма по всем триномиальным коэффициентам; ее можно привести к более симметричному виду К^ = X. (i V i)f^k9k+l" j+k+l=n 7.44 Каждое разбиение на к непустых подмножеств может быть упорядочено к! способами, так что Ъ^ = к!. Таким образом, мож- но записать Q(z) = ?n>1^0 {?}k!z7n! = L^o^-^ = 1/(2- ez). Это— сумма геометрической прогрессии Xlk>o ekz/2k+1, следовательно, die = l/2k+1. Наконец, с^ — 2к. Рассмотрите все перестановки для случая различных х, замените каждое отношение (>' между индексами на '<', а если индексы связаны отношением '<', то для значений допускается любое из отношений '<' или с='. (Например, перестановка Х1Х3Х2 порождает два варианта сравнения: xi < хз < xz и xi = Х3 < Х2, потому что 1 <3>2.) 7.45 Эта сумма равна Лп>1 r(n)/n2> гАе г(п)— количество способов записать п в виде произведения двух взаимно простых сомножителей. Бели п делится на t различных простых чисел, то г(п) = 2*. Следовательно, г(п)/п2— мультипликативная функция и интересующая нас сумма равна nO+ih?-)-n(^ 1 2 7.46 Пусть Sn = ]T0^n/2 (n k2k)cxk. Тогда Sn = Sn_1+aSn_3+ [п = 0], и производящая функция равна 1/(1— z—otz3). При a = —57, как рекомендуется в указании, эта функция имеет хорошее разложение на множители 1 / (1 + ^ z) (1 — | z)2. Общая теорема о разложении дает теперь Sn = (|тг+с)(|)п+^(—|)п, и константа с оказывается равной |. 7.47 Представление Штерна-Броко для л/3 есть R(LR2)°°, потому что V^+l = 2+- ] 1 1+- л/3+1 Сами дроби равны у, у, |, |, |, Д^, уу, у|, ...; начиная с некоторого момента они задаются поочередно следующими выраже-
682 Ответы к упражнениям ниями: V2n-1+V2n+1 U2n+V2n+1 U2n+2+V2n-1 V2n+1+V2n+3 U2n V2n+1 U2n+V2n+1 U2n+2 7.48 Имеем go = О, и, если gi = m, производящая функция удовлетворяет уравнению aG(z)+bz-1G(z)+cz-2(G(z)-mz)+-^- = 0. I—z Следовательно, G(z) = P(z)/(az2+bz+c)(1— z) для некоторого полинома P(z). Пусть pi и P2 — корни cz24-bz+a, причем |pi | ^ |p2|. Если b2—4ac ^ 0, то |pi|2 = pip2 = a/c— рациональное число, что противоречит тому факту, что ^/д^ стремится к 1+л/2. Следовательно, pi = (—Ь+л/b2— 4ca)/2c = 1+л/2; а отсюда следует, что a = —с, Ъ = —2с, Р2 = 1—л/2. Производящая функция теперь принимает вид _ z(m-(r+m)z) blZJ ~ (1-2z-z2)(1-z) " -r+(2m+r)z г 2 2(1— 2z—z1) 2(1—z) где r = d/c. Поскольку g2— целое, г также целое. Имеем также gn = a(1+V2)n+S(1-V2)n+iT = [сс(1+л/2)п], а это может быть, только если г = — 1, потому что (1—л/2 )п стремится к нулю, чередуясь в знаке. Следовательно, (a,b,c, d) = ±(1,2,-1,1). Теперь находим a = ^(1+л/2т), которое находится между 0 и 1, только когда 0 ^ m ^ 2. Каждое из этих значений в действительности дает некоторое решение; соответствующие последовательности (gn) представляют собой (0,0,1,3,8,...), (0,1,3,8,20,...) и (0,2,5,13,32,...). 7.49 (а) Общим знаменателем выражения (1/(1—(1+л/2)г)+1/ (1— (1— л/2)г)) является 1— 2z—z2; следовательно, an = 2an_i+ an_2 для n ^ 2. (б) Это верно ввиду того, что an четное и —1 < 1— л/2 < 0. (в) Положим Нас устроило бы, если бы bn было нечетным для всех п > 0 и —1 < [р—у/Ц)/2 < 0. Действуя, как в п. (а), мы находим bo = 2, bi = р и bn = pbn_i+^(q— p2)bn_2 для n ^ 2. Одно из возможных решений получается при р = 3 и q = 17.
А Ответы к упражнениям 683 Дайте мне полиномы Лежандра, и я найду аналитический вид. 7.50 Расширив идею умножения многоугольников из упр. 22, получим q = -+qAq+qDq+qqOV"- Заменим каждый n-угольник на z71-2. Такая замена правильно сочетается с умножением, поскольку операция склейки преобразует т- и n-угольники в (т-Иг—2)-угольник. Таким образом, производящая функция равна zQ2 1+zQz+zzQ4z^Q4+- 1+^ 1-zQ' и формула для вычисления корней квадратного уравнения дает Q = (1 +z— у/1 —6z-\-z2 ) /4z. Коэффициент при zn_2 в этом степенном ряду равняется числу способов провести непересекающиеся диагонали в выпуклом п-угольнике. Эти коэффициенты, по-видимому, не имеют простого выражения в аналитическом виде через другие величины, которые мы обсуждали в этой книге. Однако их асимптотическое поведение известно [207, упр. 2.2.1-12]. Кстати, если заменить каждый n-угольник в Q на wzn_2, можно получить Q = 1+z-Vl-(4w+2)z+z2 2(1+w)z формулу, в которой коэффициент при wmzn представляет собой количество способов разбить n-угольник непересекающимися диагоналями на m многоугольников. 7.51 Ключевой первый шаг состоит в наблюдении, что квадрат интересующего нас количества способов есть количество циклических схем определенного вида, обобщающих упр. 27. Эти схемы могут быть подсчитаны посредством вычисления определителя некоторой матрицы, для которой несложно найти собственные значения. В случае m = 3 и п = 4 оказывается полезным тот факт, что cos 36° = ф/2 (упр. 6.46). 7.52 Несколько начальных случаев таковы: ро(у) = 1, pi (у) =у, Рг(у) = У2+У, Рз(у) = у3+3у2+3у. Пусть pn(y) = q2nM, где у = х(1— х); мы ищем производящую функцию, которая подходящим образом определит q2n+iM- Одна такая функция — это LnqnMzVnJ = 2eix7(eiz+1), откуда следует, что qn(x) = 1 tnixj, где tn (х) называется полиномом Эйлера. Имеем 22(—1)xxn6x = j[—1)х+1Еп(х), поэтому полиномы Эйлера аналогичны полиномам Бернулли и раскладываются на множители, аналогичные (6.д8). Из упр. 6.23 получаем nEn_i (х) =
684 Ответы к упражнениям Hk=o (k)Bkxn_k(2—2к+1); этот полином согласно упр. 6.54 имеет целые коэффициенты. Следовательно, коэффициенты полинома Ч2тгМ> со знаменателями в виде степеней двойки, также должны быть целыми. Значит, рп(у) имеет целые коэффициенты. Наконец, соотношение [4у—1 )р^(у)+2р^("у) = 2тг(2тг— 1)pn-i (у) показывает, что |п-1 2га(2га—1 ] m(ra+1) п тп+1 +2п(2п-1; тп-1 а отсюда вытекает, что числа |^|— положительны. (Подобное доказательство позволяет установить, что аналогичная величина (—1 )n(2n+2)E2n+i (х)/(2х—1), если ее выразить в виде полинома п-й степени от г), имеет положительные целые коэффициенты.) Можно показать, что |^| — число Дженоччи (—1 )n-1 (22rL+1—2) х В2п (см. упр. 6.24) и что |п^| = (5), |n*2| = 2(n+1)+3ft), и т.д. 7.53 Это число P(i+v4^+i+v4n+3)/6- Так, например, Т20 = ?\г = 210;T285=Pi65=40755. 7.54 Пусть Ек означает операцию над степенными рядами, состоящую в обнулении всех коэффициентов при zn, за исключением тг mod га = к. Тогда описанная конструкция эквивалентна операции Е0 S Е0 S (Ео+Ет) S ... S (Е0+Ет +• ¦ -+гш^ ), примененной к 1/(1—z), где S означает "умножить на 1/(1—z)'.' Это выражение содержит га! членов Ео S Ekl S Ek2 S ... S Ekm . Здесь 0 ^ kj < j, и каждый такой член дает zrm/(1—zm)m+1, где г— число мест, где kj < kj-ц. Имеется ровно (™) слагаемых с данным значением г, так что коэффициентом при zmn в соответствии с (6.37) будет YJXo (™)(R+™~T) = (n+1)m. (Тот факт, что операция Ек может быть выражена через комплексные корни единицы, по всей видимости, нисколько не помогает в решении поставленной задачи.) 7.55 Пусть P0(z)F(z) + ... + Pm(z)F<m>(z) - Qo(z)G(z) + ¦-• + Qn(z)G(n)(z) = 0, где Рш{г) и Qn(z)— ненулевые, (а) Пусть H(z) = F(z)+G(z). Тогда найдутся рациональные функции Rk>i(z) для 0 <: I < m + п, такие, что H(k)(z) = Rk)0(z)F(0)(z) + • • • + Rk,m_1(z)F(--1)(z) + Rk,m(z)G(°4z)H---. + Rk,m+n_1(z)G^-1Hz). Векторы (R]C>o(z))...,RiC)m+n_i(z)) в количестве m + n+1 линейно зависимы в (га+ п)-мерном векторном пространстве рациональных функций; следовательно, существуют рациональные
А Ответы к упражнениям 685 функции Si{z), не все нулевые, такие, что So(z)H^(z) + ••• + Sm+n(z)H(m+n)(z) = 0. (6) Аналогично положим H(z)=F(z)G(z). Имеются рациональные функции Rk,i(z) для 0 ^ I < mn, такие, что H<k>(z) = Ulio1 L"=o Rk,W*)F(i)WG^U), следовательно, S0(z)H(0)(z) + • • • + Smn(z)H(mn)(z) = 0 для некоторых рациональных Si(z), не все из которых нулевые. (Аналогичным образом можно доказать, что если (fn) и (gn) полиномиально рекурсивны, то таковы и последовательности (fn + gn) и (fn9n)- Кстати, для частных подобный результат отсутствует; например, cos z является дифференцируемо конечной функцией, тогда как 1/cosz таковой не является.) 7.56 Эйлер [113] показал, что это число есть также [zn] 1/ V1-2Z-3Z2, и дал формулу tn = ?к^0п^/к!2 = ?k (?)(\к)- При исследовании этих чисел он также открыл "достопамятное фиаско индукции": хотя 3tn — tn+i и равно Fn_i (Fn_i + 1) при 0 ^ n ^ 8, этот эмпирический закон таинственным образом нарушается при и, равном 9, или большем! Джордж Эндрюс (George Andrews) [12] разъяснил тайну, показав, что сумма J^k[zn+10k] х (1 + z + z2)^ может быть выражена в аналитическом виде через числа Фибоначчи. Г. С. Вильф (Н. S. Wilf) заметил, что [zn] (а + bz + cz2)n= [zn]1/f(z), где f(z) = ^/U:lЬzTJьт^4acW (см. [373, с. 159]); отсюда следует, что коэффициенты удовлетворяют соотношению (п + 1 )Ап+1 - (2n + 1 )bAn + n(b2 - 4ас)Ап_1 = 0. Применив алгоритм Петковшека (Petkovsek) [291], можно доказать, что это рекуррентное соотношение имеет аналитическое решение в виде конечной суммы гипергеометрических членов тогда и только тогда, когда abc(b2 — 4ac) = 0. В частности, поэтому средний триномиальный коэффициент не имеет такого выражения в аналитическом виде. Следующий шаг должен, вероятно, заключаться в распространении этого результата на более широкий класс аналитических выражений (включая, например, гармонические числа и/или числа Стирлинга). 7.57 (Поль Эрдёш (Paul Erdos) неоднократно предлагал за решение этой задачи 500 долларов.) 8.1 2? + ?8 + 4*8 + 41$ +4^8 "^"14 = \' (На самом Аеле мы всегда получим дубль с вероятностью ^, если хотя бы одна игральная кость правильная.) Любые две грани с суммой 7 имеют одинаковые вероятности в распределении Pri, так что событие S = 7 имеет ту же вероятность, что и выпадение дубля. Дайте мне полиномы Лежандра, и я найду аналитический вид.
686 Ответы к упражнениям 8.2 Имеется 12 способов задать верхнюю и нижнюю карты и 50! способов разместить остальные карты, так что искомая вероятность равна 12-501/52! = 12/(51 -52) = -^ = ^у. 8.3 i^(3+2+. • -+9+2) = 4.8; 1(32+22 + - • -+92+22-10(4.8)2) = ^?, что приближенно равно 8.6. Истинные математическое ожидание и дисперсия для правильной монеты равны 6 и 22, так что Станфордским студентам везет на орлы. Соответствующие числа для Принстона равны 6.4 и ^^ « 12.5. (Это распределение имеет К4 = 2974, что весьма много. Следовательно, стандартное отклонение этой оценки дисперсии для п = 10 также довольно велико, л/2974/10 + 2(22)2/9 «20.1 в соответствии с упр. 54. Студентов нельзя обвинить в жульничестве.) 8.4 Это следует из (8.38) и (8.39)) потому что F(z) = G(z)H(z). (Подобные формулы имеют место для всех кумулянтов, несмотря на то что F(z) и G(z) могут иметь отрицательные коэффициенты.) 8.5 Замените 0 на р и Р на q = 1 — р. Если Sa = Sb = 5, то p2q]SJ = 1и pq2N = lq + -Ь решением будет р = 1/ф2, q = 1/ф. 8.6 В этом случае Х|у имеет для всех у то же распределение, что и X, следовательно, E(X|Y) = EX есть константа, и V(E(X|Y)) = 0. Также V(X|Y)— константа и совпадает со своим ожидаемым значением. 8.7 Имеем 1 = (рт + р2 + • • • + р6)2 ^ 6(р? + р^ + • • • + р|) по неравенству Чебышева для сумм из главы 2. 8.8 Пусть р = Рг(сиеАпВ), q = Pr(w^A) и г = Рг(си^В). Тогда р + q + г = 1 и доказываемое тождество имеет вид р = (p + r)(p + q)-qr. 8.9 Это верно (при очевидном условии, что F и G определены на областях изменения случайных величин X и Y), потому что Pr(F(X)=fzG(Y) = g) = ^Г Pr(X = xnY = i)) = xeF_1(f) yeG-Чд) = Y. Pr(X = x)-Pr(Y = y) = xGF-^f) yeG-4g) = Pr(F(X)=f).Pr(G(Y) = g). 8.10 Два. Пусть X] < хг— медианы; тогда 1 ^ Pr(X^xi) + Pr(X^X2) ^ 1, следовательно, имеет место равенство. (Некото-
А Ответы к упражнениям 687 рые дискретные распределения вовсе не имеют медианы. Пусть, например, О. представляет собой множество всех дробей вида ±1/п с вероятностями Рг(+1/п) = Рг(—1/п) = у2п"2') 8.11 Например, пусть К = к с вероятностью 4/(к+1 )(к+2)(к+3) для всех целых к J> 0. Тогда ЕК = 1, но Е(К2) = со. (Аналогично можно построить случайную величину со всеми конечными кумулянтами до кт, но с кт+1 = со.) 8.12 (а) Пусть pk = Pr(X=k). Если 0 < х ^ 1, имеем Рг(Х^г) = Lk<:rPi< ^ Lk^rxk_rPi< ^ Lkxk_rP^ = х"гР(х). Второе неравенство доказывается аналогично, (б) Положим х = сх/(1 — ос) с целью минимизации правой части. (Более точная оценка данной суммы имеется в упр. 9.42.) 8.13 (Решение Б. Питтеля (В. Pittel).) Положим Y = (Xi + • • • + Xn)/n и Z = (Хп+1 + • • • + Х2п)/п. Тогда Рг Y + Z - ос 2 > Рг ^ Y-oc > Y-a + a ^ |Y-a| = Pr(|Z-a| <с |Y-a|) ? \. Последнее неравенство фактически можно заменить на'>' для любого дискретного распределения вероятностей, поскольку Pr(Y = Z) >0. 8.14 Меап(Н) - р Mean(F) + qMean(G); Var(H) = pVar(F) + q Var(G) + pq(Mean(F) — Mean(G))2. (Смесь на самом деле есть частный случай условного распределения: пусть Y отвечает бросанию монеты, Х|0 порождается функцией F(z), а Х|Р— функцией G(z). Тогда VX = EV(X|Y) + VE(X|Y), где EV(X|Y) = pV(X|0) + qV(X|P), a VE(X|Y) есть дисперсия функцииpzMean(?) + qzMean(G)\ 8.15 Согласно правилу дифференцирования сложной функции H'(z) = G'(z)F'(G(z)); \\"{z) = G"(z)F'(G(z)) + G'(z)2F"(G(z)). Следовательно, Mean(H) = Mean(F)Mean(G); Var(H) = Var(F)Mean(G)2 + Mean(F)Var(G). (Случайную величину, отвечающую распределению Н, можно описать следующим образом: определим неотрицательное целое число п в соответствии с распределением F; затем сложим п независимых случайных величин, имеющих распределение G. Тождество для дисперсии из этого упражнения является частным
688 Ответы к упражнениям случаем (8.юб), где X имеет распределение Н, a Y— распределение F.) 8.16 ew^"1V(1 -w). 8.17 Рг(УП)Р^та) = Pr(YnjP+n^m + n) = вероятность того, что для выпадания п орлов требуется ^ m+п бросаний = вероятность того, что т+п бросаний дадут ^ п орлов = Pr(Xm+rL)P ^ п). Следовательно, к L ,">v-I "7>кя к^ттг ч ' к:>п = L ГГУ+п^к; ч 1С / а это есть тождество (5-19) с п — г> х — Ч> У — Р- 8.18 (a) Gx(z) = e^(z_1). (б) Для всех m ^ 1 m-й кумулянт равен \i. (Случай ц = 1 в (8.55) назван Fqq.) 8.19 (a) GXl+x2(z) = GXl(z)GX2(z) - e<^+»^(*-i). Следовательно, вероятность равна е_Ц1 ~^2 (ц1 + Ц2)п/Пм сумма независимых пуассоновских случайных величин есть пуассоновская случайная величина, (б) В общем случае, если КтХ обозначает га-й кумулянт случайной величины X, то для сц b ^ О имеем Km(aXi + ЬХ2) = am(KmXi) +bm(KmX2). Следовательно, ответом будет 2т^ц +Зтц2. 8.20 В общем случае производящая функция случайной величины имеет вид G{z) = zm/F(z), где F(z) = zm + (l-z) J2A(k)[AW=A(k)]zm-\ k=1 m F'(1) = m-^A(k)[A(k)=A(k)], k=1 та F"(1) - m(m-l)-2^(m-k)A(k)[A(k^A(k)]. k=i 8.21 Это значение есть 2In>o An» гАе An— вероятность того, что игра Алисы и Билла после п бросаний не завершена. Пусть рп означает вероятность окончания игры на п-м бросании; тогда pn + qn = qn-i- Следовательно, среднее время игры равняется X^n^i nPn = (Яо - qi) + 2(qi - q2) + 3(q2 - q3) + ••• = qo + qi + Ц2 H = N, поскольку limn_+oo nqn = 0.
А Ответы к упражнениям 689 Другой способ получить тот же ответ состоит в том, чтобы заменить 0 и Р на \г. Тогда, продифференцировав первое уравнениев (8.78), получим N(1)+N'(1) =N'(1) + S^(1)+S^(1). Кстати, N = Ц-. 8.22 По определению имеем V(X|Y) = E(X2|Y) - (E(X|Y))2 и V(E(X|Y)) = E((E(X|Y))2) - (E(E(X|Y)))2; следовательно, E(V(X|Y)) + V(E(X|Y)) = E(E(X2|Y)) - (E(E(X|Y)))2. Однако E(E(X|Y)) =Лу Pr(Y=y)E(X|y) = ?х,у Pr(Y = y) Pr((X|y) =x)x = EX и E(E(X2|Y)) = E(X2), так что результат представляет собой просто VX. 8.23 Пусть По - { Н) Ю] }2 и Пт = { |7], Е3> & Ш )25 и ПУСТЬ D.2 — множество из остальных 16 элементов П. Тогда Pn i (ш) — Ргоо(ш) = ±Ц, ^, ^|, если си е По, Пь С12. Следовательно, при выборе событий А нужно взять kj элементов из Hj, где (ko>k]>k2)— один из следующих наборов: (0^0,0), (0,2,7), (0,4,14), (1,4,4), (1,6,11), (2,6,1), (2,8,8), (2,10,15), (3,10,5), (3,12,12), (4,12,2), (4,14,9), (4,16,16). Например, имеется (2) ( 6 ) (1 ) событий типа (2,6,1). Общее количество таких событий составляет [z°](1 + z20)4(l + z~~7)16(1 +z2)16, что равно 1304872090. Если ограничиться событиями, зависящими только от S, можно получить 40 решений S G А, где А = 0, {22, *Qy g}, {?,5,9}, {2,12, «, «,5,9}, {2,4,6,8,10,12}, {*, 7, ;j, 4,10}, а также дополнения к этим множествам. (Здесь запись (12' означает 2 или 12, но не оба вместе.) 8.24 (а) Любая игральная кость в конечном счете окажется во владении игрока J с вероятностью р = | +(§)2р; следовательно, р = -pp. Пусть q = pp. Тогда производящая функция случайной величины числа игральных костей у J будет (q -f pz)2rL+1 с математическим ожиданием (2п+ 1 )р и дисперсией (2п+ 1 )pq, как следует из (8.6i). (б) (|)p3q2 + (*)p4q + Ц)р5 = у^ « .585. 8.25 Производящая функция случайной величины суммы ставки после п бросков равна Gn(z), где Go (г) = zA; Gn(z) = LLiGn-i(z2(k"1)/5)/6 длятг>0. (Нецелые показатели степеней не вызывают трудностей.) Отсюда следует, что Mean(Gn) =Mean(Gn_i) и Var(Gn)+Mean(Gn)2 = j|(Var(Gn_i) + Mean(Gn_i )2). Таким образом, математическое ожидание всегда равно А, в то время как дисперсия возрастает до значения ((f§)n - 1)А2. Эту задачу, пожалуй, проще решить без применения производящих функций, чем с ними.
690 Ответы к упражнениям 8.26 Производящая функция случайной величины Fi)Ti(z) удовлетворяет уравнению F{n(z) = Fi)n_i(z)/l; следовательно, MeanfF^n) = F{>n(1) = [n?l]/l и F{yi) = [n^2l]/l2; дисперсия вычисляется очень легко. (Фактически мы имеем 0^k^n/l что стремится при пчоок распределению Пуассона с математическим ожиданием 1/1.) 8.27 Величина (n2I3 -3nI2Ii + 2I?)/n(n-1)(п-2), где Ik = Х\-\ ЬХ?, имеет желаемое значение. Это вытекает из тождеств Е13 = п|х3; E(I2Ii) = п|а3+п(тг-1)м,2Ц1 ; Е(13) = n^3+3u(u-1Wi+п(тг-1)(н-2)ц3. Кстати, третий кумулянт равен к3 = Е((Х — ЕХ)3), но уже для четвертого кумулянта столь простое соотношение не выполняется: k4=E((X-EX)4)-3(VX)2. 8.28 (В упражнении неявно подразумевается, что р = q = 1, но далее для полноты приводится ответ в общем случае.) Замена О на pz и Р на qz дает SA(z) = p2qz3/(l — pz)(1 — qz)(1 — pqz2) и Sb(z) = pq2z3/(l — qz)(l — pqz2). Для условной вероятности выигрыша Алисы после п-го броска, при условии, что она выигрывает, получаем следующую производящую функцию случайной величины: Sa(z) = гъ q Р 1 -РЯ Sa(1) 1 — pz 1 — qz 1 — pqz2 ' Это произведение псевдопроизводящих функций случайных величин, математическое ожидание которого равно 3 + p/q + q/p + 2pq/(1 — pq). Формулы для Билла отличаются отсутствием множителя q/(l — ipz)^ так что математическое ожидание для Билла равно 3 + q/p + 2pq/(l — pq). При р = q = \ ответом в случае (а) будет Ц-\ в случае (б)— ^. Билл выигрывает в два раза реже, но если ему случается выиграть, то это происходит быстрее. Общее среднее число бросаний составляет | • Ц- + \ • Ц- = Ц-, что согласуется с упр. 21. При игре в одиночку для любой последовательности время ожидания равно 8. 8.29 Подстановка 0 = Р = \ в 1 +N(0 + P) = N+Sa + Sb+Sc N00P0 = Sa(0P0 + 1) + Sb(0P0 + P0) + Sc(0P0 + P0)
А Ответы к упражнениям 691 N0P00 = Sa(P00 + 0)+Sb(P00 + 1) + Sc(P00) NP000 = SA(00) + SB(0) + Sc дает вероятности выигрыша. В общем случае будет иметь место Sa + Sb +Sc = 1 и SA(A:A) + SB(B:A) + Sc(C:A) = SA(A:B) + SB(B:B) + SC(C:B) = = Sa(A:B) + Sb(B:C) + Sc(C:C). В частности, уравнения 9Sa + 3Sb + 3Sc = 5Sa + 9Sb + Sq = 2SA +4Sb + 8SC дают SA = ?§. SB = g> Sc - ±§. 8.30 Дисперсия P(Hi,..., hn; k)|k есть дисперсия сдвинутого биномиального распределения ((га— 1 + z)/m)k_1z, которая составляет (к—1)(^)(1 — ^) в силу (8.6i). Следовательно, среднее дисперсий будет равно Mean(S)(m— 1 )/m2. Дисперсия средних — это дисперсия величины (к— 1)/т, а именно Var(S)/m2. В соответствии с (8.ю6), сумма этих двух чисел должна быть равна VP, и это действительно так. Фактически мы в слегка замаскированном виде повторили вывод (8.дб). (См. упр. 15.) 8.31 (а) Действуя методом грубой силы, мы получаем систему из пяти уравнений с пятью неизвестными: Л = i^B + lzE; В = IzC; С = 1 + ^zB + ^zD ; D = |zC + ^zE; E = ^zD. Однако позиции С и D равноудалены от цели, так же как и В и Е, так что их можно объединить друг с другом. Если принять X = B + EhY = C + D, то у нас останется три уравнения: А = \zX] X = IzY; Y = l+lzX + ^zY. Следовательно, A = z2/(4 — 2z — z2); отсюда Меап(А) = 6 и Var(A) = 22. (Слышите звон? Эта задача фактически эквивалентна подбрасыванию правильной монеты до появления двух орлов подряд: орел означает "сделать шаг к яблоку" а решка — "сделать шаг назад") (б) Неравенство Чебышева говорит нам, что Pr(S ^ 100) = Pr((S - б)2 J>942) <С 22/942 « .0025. (в) Второе неравенство хвоста говорит, что Pr(S ^ 100) ^ 1/х98(4 — 2х — х2) для всех х ^ 1; подставив х = (л/49001 — 99)/100, мы получим верхнюю границу 0.00000005. (В действительности эта вероятность равна приблизительно 0.0000000009 согласно упр. 37.)
692 Ответы к упражнениям 8.32 Из соображений симметрии ситуацию в каждом месяце можно свести к одной из четырех возможностей: D, два штата расположены по диагонали; Л, штаты расположены по соседству, и среди них нет Канзаса; К, два штата— это Канзас и какой-то иной; S, два штата совпадают. "Элли... знала, что только Великий Гудвин вернет ее в Канзас" Рассматривая переходы в полученной цепи Маркова, получаем четыре уравнения, D А К S = 1+z(fD + ?K), = z(|A + ^K), = z(iD + fA+?K), = Z(3D + |A+^K), сумма которых равна D + K + A + S является 81z-45z2-4z3 1+z(D + A + K). Решением 243-243z + 24z2 + 8z3 ' но простейший способ найти математическое ожидание и дисперсию, по-видимому, в том, чтобы подставить z = 1 +w и выполнить разложение по степеням w, игнорируя кратные w2: D = А = К = Теперь S'(1 27 , 1593,., , Тб + TfTw + '" 9 , 2Ц5ЛЛ, , 8 + ^56-™+'" 15 , 2661,,, , Т + "256~W + ' ' ' — 2Z ~~ 16 + 1 + 15. _ 75 8 "" 16 Q Ч [Л \ — «593 _|_ 21 15 , 2661 _ ° v'J — 512 "i" 256 "^ 256 — ^1]\5. Математическое ожидание равно у|, а дисперсия- (Есть ли более простой путь?) 256 105 4 • 8.33 Первый ответ: конечно, да, ведь хеш-значения >и, ..., Нп независимы! По здравом размышлении второй ответ— конечно, нет, несмотря на независимость хеш-значений Hi, ..., hn. Имеем Pr(Xj=0) = Lk=iSk([j^W(m-l)/m) = (1 - Sj)(m - 1)/m, но Рг(Хт =X2=0) = ??=1 Sktk>2](m- 1)2/m2 = (1 - Sl - s2)(m- 1)2/m2 ф Pr(X! =0) Pr(X2 =0). 8.34 Пусть [zn]Sm(z)— вероятность того, что Джина продвинется менее чем на га шагов за п кругов. Тогда Sm(1) — ее средний результат в m-ударной игре; [zm]Sm(z)— вероятность ее
А Ответы к упражнениям 693 проигрыша в игре со стабильным партнером; а 1 — [zm ^ ] Sm (z) — вероятность выигрыша. Имеем рекуррентное соотношение So(z) = 0; Sm(z) = (1+pzSm_2(z) + qzSm_i(z))/(1-rz) для m > 0. Для решения п. (а) достаточно вычислить коэффициенты для тгцп ^ 4; при этом удобно заменить z на 100w, чтобы в вычислениях участвовали только целые числа. Получаем следующую таблицу коэффициентов: S0 0 0 0 0 0 St 1 4 16 64 256 52 1 95 744 4432 23552 53 1 100 9065 104044 819808 54 1 100 9975 868535 12964304 Следовательно, Джина выигрывает с вероятностью 1 — .868535 = .131465; проигрывает Джина с вероятностью .12964304. (б) Чтобы найти математическое ожидание количества ударов, вычисляем с m — 25 . cm — 4675 . с m — ^67825 . с г л \ _ 85134475 SHU - 24' ^211J - 2304' ^ЗШ - 221184 ' ^Ш - 21233664 ' (Оказывается, S5O) ~ 4.9995; она выигрывает по обоим критериям— лункам и ударам в игре с пятиударной лункой, но проигрывает обоими способами в игре, рассчитанной на три удара.) 8.35 Как следует из китайской теоремы об остатках, требуемое условие будет выполняться для всех п тогда и только тогда, когда оно выполняется для п = 1. Одно необходимое и достаточное условие— тождество полиномов (Р2+Р4+Р6 + (Pi +P3+P5JW) (рз+Рб + (pi +p4)z + (P2+P5)Z2) = (p1WZ + p2Z2+p3W + P42: + p5WZ2+p6h но это только незначительная переформулировка исходной задачи. Более простым критерием является (Р2+Р4+Рб)(РЗ+Рб) = V6> (Pi +РЗ+Р5)(Р2+Р5) = Р5> что требует проверки всего двух коэффициентов в предыдущем произведении. Общее решение имеет три степени свободы: пусть ао + си = bo + bi + Ъг = 1; тогда можно взять pi = си bi, V2 = aob2, Рз = сиЬо, р4 = а0Ъь P5 = aib2, р6 = а0Ь0.
694 Ответы к упражнениям 8.36 (а) 0 [7] ИЗ \У\ \У\ ИЗ • (б) Если на гранях k-й игральной кости нанесено si, ..., Se очков, то положим pijz) = zSl + • • • + zS6. Мы хотим найти такие полиномы рк, для которых pi (z).. .pn{z) — (z + z2 + z3 -f z4 + z5 + z6)71. Разложение этого полинома в произведение неприводимых множителей с рациональными коэффициентами представляет собой zn(z+ 1)n х (z2 + z + 1 )n(z2 — z + 1 )п; следовательно, pic(z) должен иметь вид zak(z+1)bk(2:2+z+1)Ck(z2-z+1)dk. При этом должно быть ak ^ 1, поскольку pk(0) = 0; и, более того, а^ = 1, поскольку си + • • • + ап = п. Далее, условие Pk(1) = 6 означает, что bk = Cic = 1. Теперь легко понять, что 0 ^ dk ^ 2, поскольку dk > 2 дает отрицательные коэффициенты. Когда d = 0 и d = 2, мы получаем две игральные кости из п. (а); следовательно, все решения исчерпываются к парами игральных костей из п. (а) плюс п — 2к обычных игральных костей для некоторого к^ \п. 8.37 Количество последовательностей длиной п, описывающих возможные результаты бросания монеты, равно Fn_i для п > 0 в силу связи бросаний монеты и покрытий костями домино. Следовательно, вероятность того, что потребуется ровно п бросаний, составляет Fn_i/2n, если монета правильная. Кроме того, qn = Fn+1/2n-\ поскольку Lk^nbzk - (Fnzn+Fn_izn+1 )/(1-z-z2). (Разумеется, возможно и систематическое решение поставленной задачи с применением производящих функций.) 8.38 После появления к граней задача выбрасывания еще одной эквивалентна бросанию монеты с вероятностью успеха рк = (га—к)/га. Следовательно, соответствующая производящая функция случайной величины равна Пк=о Ркг/П ~ Чк^) = Пк=о(т— k)z/(ra — kz). Математическое ожидание равно 2Ik=o Pk ^ ~ m х (Hm-Hm_t); дисперсия равна т2 (Н^} -HJ^_L) -m(Hm-Hm_l); и уравнение (7-47) Аает выражение в аналитическом виде для требуемой вероятности, а именно тп~тгт!{1[1~1 }/(ra— I)!. (Обсуждаемая в этом упражнении задача обычно называется задачей "сбора купонов'.') 8.39 Е(Х)=Р(-1); V(X)=P(-2)-P(-1)2; E(lnX) = -?'{0). 8.40 (а) Имеем кт = п(0!{™}р-1 !{™}р2+2!{™}р3 ) согласно (749)- Кстати, третий кумулянт равен npq(q — р), а четвертый— upq(1 — 6pq). Тождество q-fpe1 = (p+qe_t)et показывает, что fm(p) = (—1)mfm(q) + [тп=1]; следовательно, можно записать fm(p) = gm(pq)(q-p)[m],rAegm— полином степени |m/2J, если только га > 1. (6) Положим р = \ и F(t) = ln(^ + \ех). То-
А Ответы к упражнениям 695 гда ?m^ Kmtm"V(m- 1)! = F'(t) = 1 - ]/(el + 1), и можно воспользоваться упр. 6.23. 8.41 Если G(z) представляет собой производящую функцию случайной величины X, которая принимает только целые положительные значения, то J0G(z) dz/z = Лк>1 Pr(X = k)/k = Е(Х-1). Если X— распределение количества бросаний до получения п+ 1 орлов, то из (8.59) имеем G{z) = (pz/(1 — qz)) , и выписанный интеграл можно преобразовать: 1 — qz n+l ipz \ az wn dw 1 + (q/pK если выполнить замену w = pz/(l — qz). Для p = q подынтегральное выражение можно записать как (—1 )n ((1 +w)-1 — 1 +w— w2H h(—l)nwrL_1), так что интеграл равен (—1)n(ln2—1 + \ — 5+-"+Н)7п). Из (д.28) имеем H2n-Hn = b2-ln-4^n-2+ 0(п~4); отсюда следует, что E(X~^j_1) = ^п-1 — \гС~2 + 0(п-4). 8.42 Пусть Fn(z) и Gn(z) — производящие функции случайных величин для количества рабочих вечеров, если человек первоначально был соответственно безработным или имел работу. Пусть Як = 1 -Рк и qf = 1 -pf. Тогда F0(z) = G0(z) = 1 и Ы*) = PhzGn-т (z) + qhFn-i U); Gn(z) = pfFn_i(z) + qfzGn_i(z). Решение дается суперпроизводящей функцией случайной величины G(w,z) = ^Gn(z)wn = A(w)/(1-zB(w)), rAeB(w) =w(qf-(qf-ph)w)/(l-qhw)HA(w) = (1-B(w))/(1- w). Теперь получаем Y.n>o G^(1)wn = aw/(1 — w)2 + (3/(1 —w) — (3/(1 -(qf-ph)w),rAe a= Ph , P = ^^f-Рк). Рн + Pf ' (Рк+Pf)2 ' следовательно, G^(1) = an + (3(1 — (qf —p^)™). (Аналогично G^(1) = a2n2 + O(n), так что дисперсия равна O(n).) 8.43 В силу (б.и) Gn(z) = Lk^o HzVn! = **№. Это— произведение биномиальных производящих функций случайных величин, Г1к=1 ((^ — 1 +z)A-)> гАе к-я функция имеет математическое ожидание 1/к и дисперсию (к — 1)/к2; следовательно, Mean(Gn) = Нп и Var(Gn) = Нп - Н^2).
696 Ответы к упражнениям 8.44 (а) Чемпион должен пройти без поражений п кругов, так что искомая вероятность равна рп. (б, в) Игроки xi, ..., x2k должны быть случайным образом "рассеяны" по разным подтурни- рам и должны выиграть все 2k(n — к) своих встреч. Игроков можно расположить по 2П листьям дерева турнира 2П! способами; чтобы обеспечить нужное рассеивание, имеется 2k!(2n-k)2 способов размещения 2к лучших игроков и (2n—2к)! способов размещения остальных. Следовательно, искомая вероятность равна (2р)2 (п-кУ(2к)- Для к = 1 это выражение упрощается до (2р2)п-1/(2п — 1). (г) Каждый результат турнира соответствует некоторой перестановке игроков: обозначим через yi чемпиона, через у2— второго финалиста; через уз и у 4— игроков, проигравших ут и у 2 в полуфинале; через (у5>--->У8)— игроков, проигравших в четвертьфинале игрокам (уъ...,У4); и т.д. (Действуя иначе, можно показать, что на первом круге может быть 2П!/2П-1! существенно различных результатов; на втором— 2n_1 !/2п_2! и т.д.) (д) Пусть S^ есть множество всех 2k_1 потенциальных противников Х2 на k-м круге. Условная вероятность того, что Х2 выиграет турнир при условии, что xi принадлежит S]c, равна Рг(хт играет с хгЬр71"1 (1—р)+Pr(xi не играет с хг) -рп = = pk-1pn_1(1-p) + (l-pk~1)pn. Вероятность того, что х-\ ? S^, равна 2k-1/(2n — 1); суммирование по к дает ответ: L?r(pk"1pn-1(i-p)+(i-pk-1)pn) = pn-^rzrV"'- к=1 (е) Каждый из 2П! результатов турнира имеет определенную вероятность; вероятность выигрыша Xj есть сумма этих вероятностей по всем (2П — 1)! результатам, в которых Xj— чемпион. Переставим во всех этих турнирах Xj и Xj+i; такое изменение не влияет на вероятность, если Xj и Xj+i никогда не встречались один с другим, однако в случае их встречи вероятность победы Xj умножается на (1 —^))/р < 1. 8.45 (a) A(z) = 1/(3 - 2z); B(z) = zA(z)2; C(z) = z2A(z)3. Производящая функция случайной величины для бутилируемо- го вина равна z3A(z)3, что есть произведение т? на отрицательное биномиальное распределение с параметрами п = 3, р = \. (б) Меап(А) = 2, Var(A) - 6; Меап(В) = 5, Var(B) = 2Var(A) = 12; Mean(C) = 8, Var(C) = 18. В среднем херес имеет возраст 9 лет. Доля 25-летнего вина составляет (22) (~~2)223-25 =
А Ответы к упражнениям 697 (zi)2223"25 = 23-(|)24 « .00137. (в) Пусть коэффициентом при wn будет производящая функция случайной величины на начало года п. Тогда А = (1 + lw/(1-W))/(1-§zw); В = (1 +lrwA)/(1 -fzw); С = (1 + ?zwB)/(1 - fzw). Продифференцируем по z и положим z = 1; это даст 1/2 3/2 6 С = 1-w (1-fw)3 (1-fw)2 1-fw Средний возраст бутилируемого хереса через п лет после начала процесса на 1 больше коэффициента при wn_1, а именно он равен 9 - (§)п(3п2 + 21 п + 72)/8. (Он превышает 8 уже при п = 11.) 8.46 (a) P(w,z) = 1+?(wP(w,z)+zP(w,z)) = (1 - ?(w + z))_1, следовательно, pm,n = 2-ш-п^п+пу (g) P]c(w>z) = ^(wk + zk)P(w,z); следовательно, pk,m,n = 2-— ((т+^"к) + (т+Гк (в) Lk kp,c,n,n = ZiU ^k-2n (2n"k) = LLo(n - k)2—kО; эту сумму можно вычислить с помощью (б-2о): ь~'(.*+.>(п:к)-(л+Чп:!Г)) = = (2п + 1) - (п + 1 )2"n f2n+1 - 2-n-] ^2n + 2 2n + 1 /2n 22n \п (Методы главы 9 показывают, что это 2л/п/п— 1 + 0(п-1/2).) 8.47 После поглощения п частиц имеется п + 2 равноправных рецепторов. Пусть случайная величина Хп обозначает количество имеющихся дифагов; тогда Xn+i = Xn + Yn, где Yn = — 1, если (п + 1 )-я "ф-частица попадает в рецептор дифага (условная вероятность— 2Хп/(п + 2)); в противном случае Yn = +2. Следовательно, EXn+1 = EXn + EYn = EXn-2EXn/(n+2)+2(l-2EXn/(n+2)).
698 Ответы к упражнениям Рекуррентное соотношение (n+2)EXn+i = (п—4)ЕХп+2п+4 может быть решено, если умножить обе его части на суммирующий множитель (п+1)-; можно также угадать ответ ЕХП = (2п+4)/7 для всех п > 4 и доказать его по индукции. (Оказывается, после пятого шага всегда образуются два дифага и один трифаг независимо от состояния после четвертого шага.) 8.48 (а) Расстояние между дисками (измеряемое так, чтобы всегда получалось четное число) составляет 0, 2 или 4 единицы и изначально равно 4. Соответствующие производящие функции случайных величин А, В, С (где, скажем, [zn] С равняется вероятности расстояния 4 после п бросков) удовлетворяют соотношениям Д = ?ZB, В = ^zB + ^zC, С = 1+lzB + fzC. Отсюда следует, что А = z2/(16 — 20z + 5z2) = z2/F(z), и мы получаем Меап(А) = 2 - Mean(F) = 12, Var(A) = -Var(F) = 100. (Более сложное, но и более интересное решение основано на разложении А следующим образом: д _ Piz Viz _ Р2 Viz Pi Viz 1-qiz \-<\iz p2-pil-qi2: рт -рг 1 - q2* ' где Pl = ф2/4 = (3 + Vb)/&, V2 = Ф2Л = (3 - л/5 )/8 и Pl + qi = P2 + 42 = 1- Таким образом, игра эквивалентна бросанию двух монет с вероятностями выпадания орла pi и р2; монеты бросаются по одной, пока обе они не выпадут орлами вверх. Суммарное количество требуемых бросаний будет иметь то же распределение, что и число бросков дисков. Математическое ожидание и дисперсия времени ожидания для этих двух монет будут соответственно 6 =F 2л/5 и 50 =f 22л/5, следовательно, для общего математического ожидания и дисперсии получаем 12 и 100, как и ранее.) (б) Разложение производящей функции на правильные дроби дает возможность просуммировать вероятности. (Заметьте, что ^5/(4ф) + ф2/4 = 1, так что ответ можно выразить через степени ф.) Игра будет длиться более п шагов с вероятностью 5^п_1^24_тг(фп+2 — ф_п_2); для четного п это равно 5п/24- "nFn+2. Таким образом, окончательный ответ— 550 х 4-,00Fio2«. 00006. 8.49 (a)PN(0,n) = l[N=0] + lpN_l(0,n) + lpN_l(1,n-1)nPH п>0; для Рм (та, 0) имеет место аналогичная формула; Pn (0,0) =
А Ответы к упражнениям 699 [N = 0]. Следовательно, 9m,n — 4Z9m-1,n+1 + 2Z9m,n + 4Z9m+1,n-1 i go,n = i + ^go,n + ^gi,n-i; и т.д. (6) 9m,n = "I + 49m-1,n+1 + 29m,n + 4 9rrx+l ,tl—1 J 9o,n = 2 + ^9о,п + ?9i\n-i; и T-A- Индукцией no m получаем g^n = (2m + ^go.m+n - 2m-2 АЛЯ всех m,n ^ 0. А поскольку g^0 = gf0 должно быть g(rLTL = m + n + 2mu. (в) Данная формула удовлетворяет рекуррентному соотношению при mn > 0, потому что . 1 ^sin(2m-1)9 sm(2m + 1)6 = га' COS 2е sin(2m + 1 )0 sin(2m + 3)9 это следует из тождества sin(x — у) + sin(x + у) = 2 sin х cos у. Таким образом, остается только проверить граничные условия. 8.50 (а) Используя указание, получаем к —%(т- d-z)2-k -«--¦ЕШи k + j-3 zi+k далее следует посмотреть на коэффициент при z3+l. (б) H(z) = ! + uz+ 2Li^oc3+iz2+l. (в) Пусть г = y/tf-z)(9-z). Можно показать, что {% — 3 + r)(z — 3 — т) = 4z, а следовательно, (r/(1 -z)+2)2 = (13-5z + 4r)/(1 -z) = (9-H(z))/(1 -H(z)). (г) Вычисление первой производной при z = 1 показывает, что Меап(Н) = 1. Вторая производная при z = 1 расходится, так что дисперсия бесконечна. 8.51 (а) Пусть Hn(z)— производящая функция случайной величины ваших денег после н кругов игры; Hq(z) = z. Для п кругов имеется распределение Hn+1(z) = Hn(H(z)), так что требуемый результат получается индукцией (с использованием удивительного тождества из предыдущей задачи). (6) gn = Hn(0)-Hn_1(0) =4/n(n+1)(n+2) = 4(n-1)=i. Математическое ожидание равно 2, а дисперсия бесконечна, (в) Среднее количество билетов, которые будут куплены на n-м круге, равно
700 Ответы к упражнениям Меап(Нп) = 1 согласно упр. 15. Поэтому общее количество билетов бесконечно. (Таким образом, в конце концов вы почти наверняка проиграете, и проигрыша можно ждать уже после второй игры, но в то же время приобретете, как можно ожидать, бесконечно много билетов.) (г) В этом случае производящая функция случайной величины после п игр равна Нп(г)2, и метод из п. (б) дает математическое ожидание 16— |тг2 ^2.8. (Здесь появляется сумма ^к>1 1/к2 = 7Т2/6.) 8.52 Если шиш' такие события, что Рг(ш) > Рг(ш'), то в последовательности п независимых экспериментов ш будет встречаться чаще ш', поскольку количество появлений ш будет очень близко к пРг(ш). Следовательно, при п —» со со стремящейся к 1 вероятностью медиана и мода значений X в последовательности независимых испытаний будут медианой и модой случайной величины X. 8.53 Это утверждение можно опровергнуть даже в том частном случае, когда каждая случайная величина принимает всего два значения— 0 и 1. Пусть ро = Pr(X = Y = Z = 0), pi = pr(X = Y = Z = 0), ...,p7 = Pr(X = Y = Z = 0),rAeX = 1-X. Тогда Ро +PH Ьр7 = 1,и случайные величины попарно независимы тогда и только тогда, когда (р4+Р5 +Р6+Р7)(Р2+РЗ+Р6+Р7) = V6+V7, (V4+V5+V6+V7){V^ +РЗ+Р5+р7) = Р5+Р7, (Р2+РЗ +V6+V7){V^ +P3+P5+P7J = РЗ +Р7- Но Pr(X + Y = Z = 0) ф Pr(X + Y = 0)Pr(Z = 0) ^^ р0 ф (р0 + Pi )iVo + Р2 + Р4 + Рб)- Одним из решений является Vo = Рз = Р5 = Vg = V4; pi = р2 = Р4 = Р7 = 0. Эквивалентное определение этих случайных величин, например, таково: бросить две правильные монеты и положить X = (первая монета упала орлом вверх), Y = (вторая монета упала орлом вверх), Z = (монеты упали по-разному). Другой пример, в котором все вероятности ненулевые, может быть таким: ро = 4/64, Р1 = р2 = р4 = 5/64, Рз = Р5 = V6 = Ю/64, р7 = 15/64. По этой причине мы говорим, что тг переменных Xi, ..., Хп независимы, если Pr(Xi=X! и---иХп=хп) = Pr(X1=x1)...Pr(Xn=xn);
А Ответы к упражнениям 701 для выполнения этого условия попарной независимости недостаточно. 8.54 (См. обозначения в упр. 27.) Имеем Е(Х2) = пц4+и(п-1)^; Е(12Х?) = п|х4+2п(тг-1)^зМ'1+тг(п-1)м.|+тг(п~1)(п-2)ц2^; Е(1?) = пщ+4п(п— 1)|хзЦ1+Зтг(п— 1)н|+ +6тг(тг-1)(тг-2)ц2ц?+п(п-1)(n-2) (n-3) ц? ; отсюда следует, что V(VX) = к4/тг + 2к2/(п — 1). 8.55 Всего имеется Л = jy -52! перестановок сХ = УиВ = Ц -52! перестановок cX^Y. После описанной процедуры любая перестановка с X = Y будет встречаться с вероятностью tj/({1 — у|р)А), потому что мы возвращаемся к шагу S1 с вероятностью |ур. Аналогично любая перестановка cXy^Y будет встречаться с вероятностью Щ[\ — р)/((1 — jfp)B). Выбор V — \ делает Рг(Х = хиУ = у) = jgy для всех х и у. (Таким образом, можно дважды бросить правильную монету и вернуться к шагу S1, если оба раза выпадет орел.) 8.56 Если га четное, то диски всегда находятся на нечетном расстоянии друг от друга и игра продолжается до бесконечности. Если га = 21 + 1, то соответствующими производящими функциями являются Gm = ^zAt ; At = ^zAi + \ъКг , Ak - ^zAk_! + ^zAk + ^zAk+1 для 1 < k < I, Аг = \тАХ-л + \zKx + 1 . (Коэффициент [zn] Ak представляет собой вероятность того, что диски после п бросков окажутся на расстоянии 2к.) Вспоминая подобные уравнения из упр. 49, положим z = 1/cos20 и Ai = X sin 29, где X требуется определить. По индукции получаем (не используя уравнение для Ai), что Ак = X sin2k0. Следовательно, нам надо выбрать X так, чтобы О ~ л ^ )Xsin2l0 = 1 + А \ Xsin(2l--2)0. V 4cos20/ 4cos26 Оказывается, что X = 2cos2 0/sin 0 cos(21 +1)0, следовательно, cos0 Gm = . cosm0
702 Ответы к упражнениям Знаменатель обращается в нуль, когда 0 является нечетным кратным 7t/(2m); таким образом, 1 — q^z— корень знаменателя для 1 ^ k ^ I, и указанное в упражнении представление в виде произведения обязано иметь место. Чтобы найти математическое ожидание и дисперсию, можно записать Gm = (i-ie2 + ^e4----)/O-im202 + 27m404----) = = 1 +l(m2-1)92+25(5m4-6m2 + 1)94 + --- = = H-l(m2-1)(tge)2 + ^(5m4-14m2 + 9)(tg9)4 + --- = 24 i + G^(i)(tg0)2 + iG^(i)(tge) + ¦ потому что tg2 Q = z — 1 и tgQ = Q + ^Q3 + • - •. Поэтому имеем Mean(Gm) = \{m2 — 1) и Var(Gm) = |m2(m2 — 1). (Обратите внимание, что отсюда вытекают тождества Опять тригонометрия! Может, дело в том, что броски выполняются вдоль сторон m -угольника? m2-1 m2(m2-r (m-D/2 L k=1 (m-D/2 k=1 1 (m-1)/2 k=1 2m ?¦¦ ctg- (2k-1)7t / . (2k-1W 2m sin- 2m )• Третий кумулянт этого распределения равен з^т2(т2 — 1 )(4т2 — 1); но на этом кумулянты с хорошим разложением заканчиваются. Математическое ожидание можно найти и существенно проще. Действительно, Gm + Ai + • • • + Ai = z(Ai + • • • + A\) + 1, следовательно, для z = 1 мы имеем G^ = Ai + • • • + A\. Поскольку Gm = 1 при z = 1, простая индукция показывает, что Ak=4k.) 8.57 Имеем А:А ^ 21"1, В:В < 21"1 +21"3 и В:А ^ 21"2, следовательно, В:В — В:A J> А:А — А:В возможно только при А:В > 21_3. Это означает, что г2 = Тз, Ti = Т4, Т2 = Т5, ..., Ч\-з = ^\. Но В:А: ?1-2 + тогда А:А « 21"1 +21"4 + - • •, А:В « 21"3+21"6 + 21~5+- • • и В:В « 21"1 +21_4+- • •; следовательно, В:В-В:А в конечном счете меньше, чем А:А — А:В. (Более сильные результаты были получены Гуибасом (Guibas) и Одлыжко (Odlyzko) [168], которые показали, что шансы Билла всегда максимизируются одной из последовательностей Oti ... Ti_i и Pti ... Ti_i. На самом деле выигрышная стратегия Билла единственна— см. следующее упражнение.) 8.58 (Решение Я. Цирика (J. Csirik).) Если А есть О1 или Р1, то одна из двух сравниваемых последовательностей совпадает с А
А Ответы к упражнениям 703 и, следовательно, не может быть использована. В противном случае положим А = Ti ...Ti_i, О = О А и Р = рА. Нетрудно проверить, что 0:А = Р:А = А:А, 0:0 + ?:? = 21"1 + 2(А:А) + 1 и А:0 + А:Р = 1 + 2(А:А) — 21. Поэтому из уравнения 0:0-0:А Р:Р - Р:А А:А-А:0 А:А-А:Р следует, что обе дроби равны 0:0-0:А + Р:Р-Р:А _ 21"1 + 1 A:A-A:0 + A:A-A:P ~ 21 - 1 ' Далее можно записать дроби по-другому и показать, что 0:0-0:А _ А:А-А:0 _ р Р:Р-Р:А ~ А:А-А:Р ~ q ' rAepq ХЗир+q = Н0Д(21-] + 1,2l-1) = НОД(3,21 - 1); так что мы можем считать, что I четное и что р = 1, q = 2. Отсюда следует А:А - А:0 = (21 - 1 )/3 и А:А - А:Р - (2l+1 - 2)/3, значит, А:0 - А:Р = (21 - 1)/3 ^ 21"2. Имеем А:0 ^ 21~2 тогда и только тогда, когда А = (РО)1/2. Но в этом случае 0:0 — О:А = А:А - А:0, так что 21"1 + 1 = 21 - 1 и I = 2. (Цирик [69] пошел дальше и показал, что для I ^ 4 у Алисы нет лучшего выбора, чем играть 0Р1_302. Но даже при этой стратегии Билл выигрывает с вероятностью около |.) 8.59 Согласно (8.82) нам надо, чтобы В:В - В:А > А:А - А:В. Одним из решений является А = РРОО, В = 000. 8.60 (а) Возможны два случая: h^ ф К^ и h^ = h^: m— 1 /m-2 + w + z\k~1 /m— 1 +z\rL-k~1 z+ _, , m- I /m-z + w + z\K-' /m—l+zv G(w,z) = w m V m / V m / 1 /m — 1 + wz\k~1 / — wz m V ra / V 1 /ra — 1+wz\k~1 /ra — 1 +z\rL-k-1 - wz ; m V ra / V ra / (б) Можно обосновать это соотношение алгебраически, вычислив частные производные G (w, z) по w и z и положив w = z = 1; возможно также комбинаторное обоснование. Какими бы ни были значения hi, ..., hn_i, ожидаемое значение P(hi,..., hn_i, hn.; ti) (усреднение по hn) постоянно, потому что хеш-последовательность (hi,..., hn_i) определяет последовательность длин списков (ти )П2>... ,тгт) и указанное среднее значение равно ((ти + 1) + (п-2 + "I) Н f~ (nm + 1 ))/ttl = (n — 1 + та)/та. Таким образом, случайная величина ЕР (hi,..., hn; п) не зависит от (hi,..., hn_i), а следовательно, не зависит от P(hi,..., hn; k).
704 Ответы к упражнениям 8.61 Если 1 ^ k < I ^ п, то, как следует из предыдущего упражнения, коэффициент при s^Si в дисперсии среднего равен нулю. Поэтому остается только рассмотреть коэффициент при s?, который равен т.е. дисперсия функции ((га—1 + z)/m)k-1z; это, в свою очередь, равно (k— 1)(т— 1)/т2, как в упр. 30. 8.62 Производящая функция случайной величины Dn(z) удовлетворяет рекуррентному соотношению D0(z) - z; Dn(z) = z2Dn_!(z) +2(1-z3)D;_1(z)/(n+1) для n > 0. Отсюда можно вывести рекуррентное соотношение D?(l) = (n-njD^nVfn+lJ + CSn-Z)//, которое имеет решение ^^ (тг + 2)(26п + 15) для всех n ^ 11 (независимо от начальных условий). Следовательно, дисперсия оказывается равной ?§f (п + 2) для тг ^ 11. 8.63 (Можно поставить другой вопрос: получается ли предполагаемая последовательность кумулянтов хоть из какого-нибудь распределения? Так, в последовательности кумулянтов к2 должно быть неотрицательно, К4 + Зк2 = Е((Х — fi)4) должно быть не менее (Е((Х — М-)2))2 = к2, и т.д. Необходимые и достаточные условия для этого варианта задачи были найдены Гамбургером (Hamburger) [6,175].) 9.1 Это верно, если все функции положительны. В противном случае можно, например, взять f i (п) = n3 + n2, fi{n) = — п3, gi (п) = п4 + п, g2(n) = -п4. 9.2 (а) Поскольку (Inn)2 -< nine -< n In Inn, получаем nlnn -<; cn -< (lnn)n. (6) nlnlnlnn ~< (Inn)! -< nlnlnn. (в) Прологарифмируйте, чтобы показать, что (п!)! растет быстрее, (г) FrHn-i х ф21пп _ п21пф. j_^ ~ п1пф растет быстрее, потому что ф2 = ф + 1 < е. 9.3 Замена kn на О(п) подразумевает различные С для различных к; нужно же, чтобы все О имели общую константу С. В действительности в данном контексте требуется, чтобы О обозначало множество функций двух переменных, кип. Правильно будет записать Xk=i ^п — Hk=i 0(п2) = 0(п3).
А Ответы к упражнениям 705 9.4 Например, Цтп_юо 0(1/п) = 0. В левой части 0(1 /п) есть множество всех функций f(n), для которых найдутся константы С и по, такие, что |f(n)| ^ С/п для всех п ^ по. Предел любой функции из этого множества равен нулю, поэтому левая часть представляет собой одноэлементное множество {0]. В правой части нет переменных; 0 представляет {0}, множество (из одного элемента) всех "функций без переменных, имеющих нулевое значение" (Понимаете ли вы логику этого высказывания? Если нет, вернитесь к этой задаче через год; вы, вероятно, сможете обращаться с 0-обозначениями, даже если ваша интуиция не втискивается в рамки строгого формализма.) 9.5 Пусть f(n) = п2 и g(n) — 1; тогда п принадлежит левому множеству, но не принадлежит правому, так что утверждение ложно. 9.6 nlnn-h уп + О(>/aInn). 9.7 (l-e-1/71)-1 =пВо-В1+В2п-]/2\ + ---=п+± + 0{п-^). 9.8 Пусть, например, f(n) = [n/2j!2 + n, g(u) = (|~n/2] — 1)! pn/2]! + п. Эти функции, как оказывается, удовлетворяют соотношениям f(n) = 0(ng(n)) и g(n) = 0(nf(n)); разумеется, возможны примеры и с более резким различием. 9.9 (Для полноты предположим существование граничных условий п —> со, так что каждое О подразумевает две константы.) Каждая функция из левой части имеет вид а(п) + b(u), причем существуют константы то, В, По, С, такие, что |а(п)| <J B|f(n)| для п ^ гао и |b(n)| <J C|g(n)| для п ^ по. Следовательно, функция в левой части не превосходит max(B, C)(|f(n)| + |g(n)|) для n ^ max(rao,no), так что она принадлежит правой части. 9.10 Если д(х) принадлежит левой части, так что g(x) = cosy для некоторого у, причем |у| ^ С|х| для некоторого С, то 0 ^ 1 — 9М ~ 2skr(y/2) <С jy2 ^ ^С2х2. Следовательно, множество из левой части содержится в правой, и формула верна. 9.11 Утверждение верно. Действительно, если, скажем, |х| ^ |у|, то (х + у)2 ^ 4у2. Таким образом, (х + у)2 = 0(х2) + 0(у2). Следовательно, 0(х + у)2 = 0((х + у)2) = 0(0(х2) + 0(у2)) = 0(0(х2)) + 0(0(у2)) = 0(х2) + 0(у2). 9.12 l+2/n+0(n-2) = (l+2/n)(l+0(n-2)/(l+2/n)) согласно (д.2б), кроме того, 1/(1 +2/п) = 0(1); теперь используйте (д.2б). 9.13 nR(1 +2П-1 +0(n"2))n = nnexp(n(2n-1 + 0(r-2))) = e2nn + 0(nn-1).
706 Ответы к упражнениям 9.14 Это пп+Р ехр((п + |3)(а/п- ±ос2/п2 + 0(п"3))). 9.15 ln(n^J = Зп1пЗ-1пп+^1пЗ-1п2тс + (^ - ^п"1 + 0(п_3), так что ответом будет ЗЗп+1/2 27ГП (l-fn-^^n-^ + Oln-3)) 9.16 Если I— любое целое число из диапазона а ^ I < Ь, то Интересно сравнить эту формулу с аналогичным результатом /\ля среднего биномиального коэффициента, упр. 9.60. B(x)f(l + x)dx = B(x)f(l + x)dx- 1/2 1 1/2 B(l -x)f(l + x)dx = B(x)(f(l + x)-f(l+1 -x))dx. 1/2 Поскольку l+x^l+1—x при x ^ ^, этот интеграл положителен, если f (х) — неубывающая функция. 9.17 Hm>0Bm{\)zm/in[ = ze2/2/(ez-1) = z/{e^2 - 1) - -z/(e*-1). 9.18 Вывод в тексте для а = 1 можно обобщить, получив 2(2п+1/2)а 2 bk(n) = _e-k сх/тг^ Cijn) = 22nan-(l+a)/2+3ee-k cx/n . (2тт)а/2 ответом будет 22па(тт)(1-а^2а-1/2(Ц-О^"1/2^6)). 9.19 Н10= 2.928968254 «2.928968256; 10! =3628800^3628712.4; В10 = 0.075757576 « 0.075757494; я(10) = 4 и 10.0017845; е0-1 = 1.10517092 « 1.10517083; In 1.1 - 0.0953102 и 0.0953083; 1.1111111... « 1.1111; 1.101 = 1.00957658 « 1.00957643. (Аппроксимация 7г(п) дает больше верных цифр при больших п, например тс(109) = 50847534 « 50840742.) 9.20 (а) Верно; левая часть есть о (п.), тогда как правая часть эквивалентна О(п). (б) Верно; левая часть есть е-е°^^п\ (в) Неверно; левая часть примерно в л/a раз превосходит верхнюю границу для правой части. 9.21 Имеем Pn =р = n(lnp —1 — 1/lnp4-0(1 /logп)2), при этом lnp = lnn + lnlnp-l/lnn + lnlnn/(lnn)2 + 0(l/logn)2; In Inn (lnlnn)2 In Inn _ _ ._ ч2 lnlnp = lnlnn +- ^— -^- + - _ + 0 1/logn2. Inn 2(lnn)2 (Inn)2
А Ответы к упражнениям 707 Отсюда следует, что Pn = n lnn + lnlnu-1 + lnlnn —2 (lnlnn)2/2 — 31nlnn л,„ „ л7 + ; -77 -, + 0(l/logn)2 Inn (Inn) (Можно несколько улучшить аппроксимацию, заменив здесь 0(1/log п)2 величиной — 5.5/(1пп)2 + О (log log n/ log п)3; в этом случае мы получаем Рюооооо ~ 15480 992.8.) Что говорит, утопая, специалист по аналитической теории чисел? log log log log ... 9.22 Заменим в разложении Hnk член 0(п -21о на —f2n -2k + 0(n 4k); в результате 0(Ls{n2)) в (9.53) перейдет в — j^L^ln2)-^ 0(l3(n4)). Имеем Хз(п) тп 36 п 0(гГ следовательно, член 0(п 2) в (9.54) может быть заменен на 144 п-2 + 0(гГ 9.23 nHn = X;0^k<nhk/(n-k)+2cHn/(TH-1)(TL + 2). Выберем с = еп2/6 = XLr^o 9k, так что Lk^oh^ = 0 и Hn = 0(logn)/n3. Развертывание YLo<k<n ^\<./{п—к), как в (д.бо), дает теперь nhn = 2сНп/(п + 1 )(п + 2) + 0(п-2), следовательно, п3 9.24 (а) ЕслиХ1к^оИк)| < oonf(n-k) = 0(f(n)) для 0 ^ к ^ п/2, то п тг/2 п ?>kbn_k = ^0(f(k))0(f(n))+ 21 0(f(n))0(f(n-k)), к=0 к=0 к=тг/2 что составляет 20(f(n) YL\c>o КМ|), так что в этом случае все доказано, (б) В случае ап = bn = а_тг свертка (тг+1)сх_тг не есть 0(а"п). 9.25 5тг/(3г[г) = Цк=оп~/(2п + l)k. Диапазон суммирования можно сузить, скажем, до 0 ^ k ^ (logn)2. В этом диапазоне пк = пк(1 - (k)/n + 0(k4/u2)) и (2п+1)* - (2п)к(1 + (к+1)/2тг + 0(к4Д12)), так что слагаемое равно
708 Ответы к упражнениям Следовательно, суммирование по к дает 2 — 4/п + 0(1/п2). Теперь, чтобы доказать (д-2)> можно применить аппроксимацию Стирлинга к (3^) = (Зп)!/(2п)!п!. 9.26 Минимум достигается на члене B2m/(2m)(2m — 1 )n2m_1, когда 2m « 2тгп+1, и этот член приближенно равен 1 / {ne2nri y/ri ). Следовательно, абсолютная погрешность Inn! слишком велика для точного определения значения п! путем округления до целого, если п больше, чем примерно e27t+1. 9.27 Можно считать, что а ф — 1. Положим f(x) = ха; ответом будет 2_к - С«+ а+1 + 2 +?. 2к U-lJn + к=1 + 0(па-2ш-1> (Оказывается, константа Са равна ?(—а), причем на самом деле эта формула служит определением С(—ос) при а > — 1.) В частности, ао) = -1/2 9.28 В общем случае положим в формуле суммирования Эйле- ^ ] pa f(x) = ха1пх, где a ^ -1. Действуя, как и в предыдущем для целого п > О упражнении, найдем ^kalnk = С^ + na+1 Inn n сс+1 + nalnn -+ k=1 a+l (a+l)2 + L ^f (2k- 1)^a_2k+1 ^ + H« " H«-21c+l )+ k=1 + 0(na-2m-1logn); как можно показать [74, §3.7], константа С^ равна —?/(—а). (Можно исключить множитель logn из О-слагаемого, когда a— положительное целое число ^ 2ra; в этом случае мы также заменяем k-й член суммы в правой части на В2к0с! (2к — 2 — a)! х (—1)?Хпсх_2к+1/(2к)! при а < 2к— 1.) Для решения поставленной задачи положим a = 1 и та = 1 и возьмем экспоненту от обеих частей, что даст нам Qn = A.nn2/2+n/2+1/12e-n2/4(1+0(n-2)), где А = е1/12"^-1) « 1.2824271291 — "константа Глейшера"
А Ответы к упражнениям 709 В этом ответе встречаются три мировые константы: е,пуу. 9.29 Положим f (х) = х ] 1пх. Небольшая модификация вычислений из предыдущего упражнения дает A Ink (Inn)2 Inn 2п В2 Y_ ^n"2k(lnn- H2k_0 + 0(n" 2m-1 k=1 logn), гдеут « -0.07281584548367672486— "константа Стилтьеса" (см. ответ к упр. 9.57). Взятие экспоненты дает вТ.Л=^(, + |= + о(!5=)') 9.30 Положим д(х) = х1е х и f(x) = д(х/у^)- Тогда n l/2 х Ик>0К1е-к2/песть Bkj f(x)dx-^-ff (k-Г k=1 poo (О)- Jo Bm({x}) f(m)(x)dx = m! = n1'2 g(x)dx-^^n(k-1»/2g(k-1»(0) + O(n-m/2). Поскольку g(x) = xl—x2+l/1 !+x4+l/2! — x6+l/3H , производные iNi xj следуют простои схеме, и ответом является 1+1\ _ В1+1 Bt+зп-1 _ В1+5п~2 2'" 4 2/ (1+1)!0! (1 + 3)!1! (1 + 5)!2! 1п(1+1)/2Г + 0(п -з^ 9.31 Несколько неожиданное тождество 1/(cm k + ст) + = 1/ст показывает, что сумма членов для 0 ^ 1/(cm+k + cm к ^ 2тп равна (т + ^)/ст. Остальная сумма равна 1 V- / 1 1 1 Z с2т+к _|_ ^т. -z к^1 c2m+k c3m+2k "" c4m+3k 1 1 qItti+I c2m ^Зта+2 ~3m + ¦ и этот ряд можно оборвать в любом месте, получив погрешность, не превышающую первого отброшенного члена. 9.32 Н^2) = я2/6 - 1/п + 0(тг~2) по формуле суммирования Эйлера, поскольку мы знаем константу; Нп задается формулой (g.8g). Так что ответ таков: пеу+п2/6(\-±п-* + 0(гГ2)).
710 Ответы к упражнениям 9.33 Имеем тг^/тг?=1-к(к-1)п-Ч^к2(к-1)2п-2 + 0(к6п-3); деление на к! и суммирование по к ^ 0 дает е — en-1 + |етг-2 + 0(п-3). 9.34 А = е^; В = 0; С = -\г*\ D - \г*{\ -у); Е = \гЧ\ F = ^(3y + 1). 9.35 Поскольку 1/k(lnk+0(1)) = l/klnk+0(l/k(logk)2), данная сумма равна Лк=2 1/klnk + 0(1). Оставшаяся сумма, по формуле суммирования Эйлера, равна lnlnn + 0(1). 9.36 Здесь замечательно работает формула суммирования Эйлера: V" 1 ] 2- T.2IV2 + тг2 + к2 п2 + х2 0^к<п -Г Jo dx 1 о п В2 -2Х ' +0(п-5), О 0+ 2! (п2+Х2)2 J0 п2 +х2 2п2 +х: Следовательно, Sn = |7пг-1 — ^п-2 — j^n"3 + 0{п~5). 9.37 Эта сумма равна Y_ (n-qk)[n/(q + 1)<k^n/q] = ,2 ^-./YKqJ + Л An/(q + i)j + i 2 пА-]Г q q3=l = n2- V fLn/qJ+1 Оставшаяся сумма подобна (9.55), но без множителя |i(q). Использованный нами метод работает и здесь, но вместо 1/С(2) мы получим С(2), так что ответом является (1 — jj)п2 + O(nlogn). 9.38 Заменим к на п — к и положим aic(n) = (п — к)п-к(?). Тогда Inaijn) = nInn — Ink! — к + 0(кп-1), и можно воспользоваться заменой хвоста с bjjn) = nne~k/k!, Cic(n) = kb^ (n)/n, Dn ={k| к ^ Inn} и получить ]T?=0ak(n) =nne1/e(l+0(n"1)). 9.39 Замена хвоста с bk(n) = (Inn — k/n — ^k2/n2)(lnn)k/k!, C]c{n) = n"3(lnn)k+3/k!, Dn = {k I 0 <c к <c lOlnn}. При к « 10Inn имеем к! x \/k(10/e)k(lnn)k, так что k-й член представляет собой O(n_101n(10/e) logn). Окончательный ответ: nlnn — Inn-^(Inn)(1 +lnn)/n + 0(n"2(logn)3). 9.40 Объединяя члены попарно, получим Н^ — (H2k — j? т i_im- 2кП2к l^m _ yrrHJJ. ] плюс члены, сумма которых по всем k J> 1 равна 0(1).
А Ответы к упражнениям 711 Предположим, что п четное. Из формулы суммирования Эйлера у-2 Н^-1 _ у-2 (ln2e^k)m-1+0(k-1(logk)m-2) га следовательно, сумма равна ^Н™ + 0(1). Ответ для общего случая имеет вид ^(-1)пН™ + 0(1). 9.41 Положим а = ф/ф = — ф-2. Имеем ?jnFk - ^(1пфк-1п\/5+1п(1-ак)) = к=1 к=1 к^1 к>п Последняя сумма есть Цк>пО(ак) = 0(ап). Следовательно, ответ — фп(п+1 )/25-n/2c + Q^n(n-3)/25-n/2^ ^ где С = (1 -а)(1 -а2)(1 -a3)... «1.226742. 9.42 Утверждение из указания следует из того, что (к™ 1) / (?) = Ч=Ьт ^ Н=^+Т < Т^- ПУСТЬ ™ = LanJ = an- е. Тогда : < l : < 7 к^т 'n\ 1 — a < GO(' + tV(t^)2-") т/ 1 —2a Следовательно, Lk<ccm (к) = (т)0^), и остается оценить (™). Из приближения Стирлинга In (™) = —^ Inn — (an — е) ln(a — e/n) - ((l-a)n+e)ln(1 - a 4- e/n) + 0(1) = -^lnn- anlna- (l-a)nln(l -a)+ 0(1). 9.43 Знаменатель содержит множители вида z — си, где си — комплексный корень из единицы. Из них только множитель z—1 входит с кратностью 5. Поэтому из (7-3х) следует, что только один корень имеет коэффициент П(п4), и этот коэффициент есть с = 5/(5!-1-5-10-25-50) = 1/1500000.
712 Ответы к упражнениям 9.44 Приближение Стирлингагласит, что для 1п(х ах!/(х— а)!) имеется асимптотический ряд - а - (х + \ - ос) 1п( 1 - ос/х) - ~ (х"1 - (х - а)"1) - -а) 3) , 4-3 (х-3 - в котором каждый коэффициент при х_к представляет собой полином от ос. Следовательно, х_(Хх!/(х — а)! = Со(ос) + си (сх)х-1 + ¦ • ¦ + cn(a)x~"n -f 0(x_n_1) при х —* со, где сп(а) является полиномом от ос. Мы знаем, что сп(а) = [а*п] (—1 )п, если а— целое, и [ *п] есть полином от а степени 2п; следовательно, Сп{ос) = [а"п] (—1 )п для всех действительных ос. Другими словами, асимптотические формулы k=0 k=0 L ОС г _0С а - а - к 1 к (-1 \к_а—к + 0(х ос—п— 1 ^ ,а-к + 0(Х а—n—1 , обобщают формулы (6.13) и (б.и), имеющие место в целочисленном случае. 9.45 Пусть неполными частными при разложении а в цепную дробь будут (си , ci2)...). Пусть ат означает цепную дробь 1/(ат+ ат+т) для га ^ 1. Тогда для всех га выполняется соотношение D(a,n) = D(cxi,n) < D(cx2, LainJ) + ai +3 < D(a3> |_a2|_(XinJJ) + ai +a2 + 6< ... < D(am+i, [amL--- LainJ ...JJ)+ си +• •- + am + Зга < ост ... am n + ai + • • • + am + Зга. Поделим на n и устремим n к со; предел будет меньше, чем ос-\ ... am для всех га. И, наконец, имеем 1 oc^ ...ocj, K(ab...>am_bam + ал < "m+1 9.46 Для удобства будем вместо тп(тг) писать просто та. Из аппроксимации Стирлинга получаем, что kn/ld достигает максимального значения при к « ra w n/lnn, поэтому заменим к на m + к и найдем, что In (m + k)n (m + k)! nlnra — ralnm + ra (m + n)k2 1п2ят 2m2 + О (k3ra-2 log n) + О (га- Дальнейшее обсуждение см. в [220].
А Ответы к упражнениям 713 На самом деле мы хотим заменить к на [raj + к; это добавит еще О (km-1 logn). Метод замены хвоста с |к| ^ та1/2+е позволяет выполнить суммирование по к и найти довольно хорошую асимптотическую оценку через величины В из (9.93)- em-1mn-m 6>П = (B2m2/fm+nl+0(1)) - y/lnm Отсюда получается требуемая формула, относительная погрешность которой равна О (log logn/ logn). 9.47 Пусть logm n = 1 + 0, где 0 ^ 0 < 1. Нижняя сумма (с функцией "пол") равна 1(п+1 ) + 1 — (ml+1 — 1)/(m— 1); верхняя сумма (с функцией "потолок") равна (I + 1 )п — (ml+1 — 1 )/(та — 1); точная сумма есть (I + 0)n — u/lnm + О (logn). Если пренебречь членами порядка о(п), то разность между верхней и точной суммами будет равна (1 — f (0))п, а разность между точной и нижней суммами будет равна f(0)n, где т1"9 1 f(9) = т + г т — 1 In т Максимальное значение этой функции есть f (0) — f (1) = та/(та — 1) — 1 /In m, а минимальное — In In m/ln m + 1 — (in(та — 1)) /In та. Верхнее значение ближе к точному, когда п близко к степени та, а нижнее точнее, когда 0 лежит где-то между 0 и 1. 9.48 Пусть die = die + bic, где a^— количество цифр перед десятичной точкой. Тогда а^ = 1 + [tog^kj = log log k+ 0(1), где log обозначает log10. Для того чтобы оценить b^, найдем число десятичных цифр, требуемое для различения некоторого числа у от близких к нему чисел у-еиу + е'. Обозначим через 5 = 10_ь длину диапазона чисел, округляемых до у. Тогда имеем |у— "у| ^ ^6, а также у—е < у—^6иу+е' > y+\b. Следовательно, е + е' > 5. А если 5 < min(e> е'), то округление позволяет отличить у йоту—е, йоту+е'. Следовательно, 10-bk < 1/(k— l)+l/k и 101_bk ^ 1/k; получаем поэтому bk = logk+ 0(1). Окончательно находим ^Г?=1 dk = X!k=i U°gk + log log k+ 0(1)), что no формуле суммирования Эйлера есть nlogn + n log logn + 0(n). 9.49 Имеем Hn > lnn + y + ^n_1 — y^n-2 = f(n), где f(x) — возрастающая при всех x > 0 функция; следовательно, если n ^ еа~у, то Нп ^ f(ea_y) > а. Кроме того, Hn_i < Inп+у-^п-1 =
714 Ответы к упражнениям g(n), где д(х) — возрастающая при всех х > 0 функция; следовательно, если п ^ еа_у, то Hn_i ^ д(еа_у) < ос. Таким образом, Hn_i ^ ос ^ Нп означает, что ea"Y + 1 > п > еа+у - 1. (Более точные результаты были получены Боасом (Boas) и Ренчем (Wrench) [33].) 9.50 (а) Ожидаемый результат равен 2Z1<k<N k/(k2H^2)) = Hn/Hj^ , а нам надо асимптотическое значение с точностью 01N-1): InN+Y + OCN-1) 6Ы0 , 6у , 361пЮ п , пмл_Пч -П+-У + —-J— —- + О(10 ). Tt^-N-1 +0(N"2) я2 7t2 тт4 10Л Коэффициент (61п10)/тт2 « 1.3998 говорит, что мы ожидаем приблизительно 40% дохода. (б) Вероятность получения прибыли равна ^n<k<N 1/ (k2H^2)) - 1 -H^VHJsf, и, поскольку Н^2) = ^-п"1 + ^п"2 + О!11""3)) эта вероятность равна п"1 -1п-2 + 0(п-3) 6 _т 3 _2 ^ _3, т^/б + О^"1) я2 я2 l j) т.е. она убывает с ростом п. (Ожидаемое значение в п. (а) велико потому, что оно включает такие огромные выплаты, которые повлияли бы на всю мировую экономику, если бы вдруг их действительно пришлось выплатить.) 9.51 Строго говоря, это неверно, поскольку функция, представленная 0(х~2), может быть неинтегрируемой. (Это может быть, например, функция l[xeS]/x2\ где S— неизмеримое множество.) Но если предположить, что f(x)— интегрируемая фун- Приличная и сим- кция, такая, что f(x) = 0(х~2) при х —> со, то |J^°f(x)dx| ^ патичная. J~|f(x)| dx <С J^° Ox"2 dx = Си"1. 9.52 На самом деле цепочку возведений в п-ю степень можно заменить любой функцией f(n), сколь угодно быстро стремящейся к бесконечности. Определим последовательность (то> гги , га2,...), положив то = 0 и взяв в качестве rriic наименьшее целое число > mic-i, такое, что Пусть теперь A(z) = Ик>1 (^/^)тк- Этот степенной ряд сходится для всех z, потому что члены для к > |z| ограничены геометрической прогрессией. Кроме того, А(п + 1) ^ ((tl+ 1)/n)mn ^ f (тг 4-1 )2, следовательно, limn-^ f (п)/А(тг) = 0.
А Ответы к упражнениям 715 9.53 По индукции О-член представляет собой (га— I)!-1 х J* tm-1f(m)(x — t) dt. Поскольку f(m+1) имеет знак, противоположный f(m), абсолютная величина этого интеграла ограничена значением |f^m^(0)| J^ tm_1 dt; так что погрешность ограничена абсолютной величиной первого отброшенного члена. 9.54 Пусть g(x) = f(x)/xa. Тогда д'М ~ —схд(х)/х при х -4 со. Звучит как "теоре- По теореме о среднем д(х— \) — д(х+ \) = —д'(у) ~ а9(у)/У Аля ма о вредном'! некоторого у между х- \ их+^. Далее, д(у) = д(х)(1 + 0(1/х)), так что д(х — \) — д(х + \) ~ осд(х)/х = otf(x)/x1+?X. Следовательно, Z^-°(Z(9(k-i)-^+i))) =0(g(n-l)) -F(Tc) k^n k^n 9.55 Оценка величины (n + k + ^) ln( 1 + k/n) + (n — k + ^) ln( 1 — k/n) расширяется до k2/u + k4/6n3 + 0(п~3/2+5е), так что нам, по-видимому, придется добавить в bijn) множитель e_k /6n и взять Cic(n) = 22пп~2+5ее~к /п. Лучше, однако, не трогать bjjn) и положить ck(n) - 22nn-2+5ee-k2/n + 22nn-5+5ek4e-k2/n> заменив тем самым е_к /6п на 1 + 0(к4/п3). Сумма ^кк4е~к /п равна 0(п5/2), как показано в упр. 30. 9.56 Если k <J п1 /2+е, то из приближения Стирлинга In (n-/uk) — —^к2/п + ^к/п — ^к3/п2 -Ь 0(п_1+4е), следовательно, п±/пк = e-k2/2n(l+k/2n-fk3/(2n)2 + 0(n-1+4e)). Просуммируем с учетом тождества из упр. 30, и не забывая опускать ЧЛеНЫ С к = 0, И ПОЛуЧИМ —1 + Ощ + ®2П ~" f ®2п + 0{п-^2+4е) = у/^/2-1 + 0{п-^2+4е). 9.57 Если воспользоваться указанием, то данная сумма превратится в J*^° ue-uC(1 +u/lnn) du. Одно из определений дзета-функции— ряд C(1 +z) = z-1 + J_ (-1)mYmZm/m!, где уо = Y) а. ут— константа Стилтьеса [201, 341] lim (у (lnk)m _ (bn)m+1 n^ool^— k m+1 xk= I
716 Ответы к упражнениям Следовательно, наша сумма равна 1пп + у-2у1(1пп}-1 +3у2(1пп)~2 . 9.58 Пусть 0 ^ 0 ^ 1 и f (z) = e2nize/{e2niz - 1). Тогда имеем е-2пув lf(z)l = 1 + е-2пу ^ !> если х mod 1 =1; е-2пув ] lfH ^ |е-2^_ц ^ ! _ е-2тге > если 1У1 ^ е- Следовательно, |f(z)| ограничен на контуре и интеграл есть 0(М1_т). Вычет функции 2nif(z)/z7TL в точке z = к ф 0 равен е27Ггке/кт; вычет в точке z = 0 есть коэффициент при z-1 в разложении e2nize / „ 2mz \ 1 / ,_ „ ,_2niz 7TTL+1 (вв + в1^ + ...) = г^(в.(в) + в,(в)^ + ...). а именно— (2яг)тВт(0)/ггг!. Следовательно, сумма вычетов внутри контура равна ^^Bm(e) + 2yemm/2Cos(2nW-nm/2)^ m! /— km Эта сумма равна интегралу по контуру, т.е. 0(М1_т), и, следовательно, стремится к нулю при М —> со. 9.59 Если F(x) — достаточно хорошо ведущая себя функция, то имеет место общее тождество ^F(k + t) - ^G(2nn)e2nin\ где G{y) = J_^ e~iyxF(x) dx. (Это "формула суммирования Пуассона" которую можно найти в обычных учебниках, таких как учебник Хенричи (Henrici) [182, теорема 10.бе].) 9.60 Согласно упр. 5.22 указанная формула эквивалентна nT?2 = П1/2Л_ J_ + _!_ + _5 21 + 0(п-5 Следовательно, нужный результат вытекает из упр. 6.64 и 9.44.
А Ответы к упражнениям 717 Еще дальше в решении этой задачи продвинулся Жан- Люк Реми (Jean- Luc Remy), Journal of Number Theory, vol. 66 (1997), 1-28. 9.61 Главная идея— сделать а "почти" рациональным. Пусть О-k = 2 — k-e неполное частное в разложении а. Положим п = 2 ^-тгг+1 Ятп.) ГДе Cjm = К(си,..., am), причем m четное. Тогда 0 < {qma}< 1/K(ai,...,am+i) < 1/(2п), и если взять v = am+1/(4n), можно получить отклонение от равномерности ^ \ am+1. Если бы оно было меньше, чем п' е, то мы бы имели at т-И 0(q] но на самом деле am+i > q^ . 9.62 См. Кэнфилд (Canfield) [48]; в работе Дэйвид (David) и Бартона (Barton) [71, глава 16] можно найти асимптотику чисел Стирлинга обоих родов. 9.63 Положим с = ф2_ф. Оценка сп^~^ + о(пф-1) доказана Файном (Fine) [150]. Илан Варди (Пап Vardi) заметил, что сформулированную более точную оценку можно вывести из приближенного рекуррентного соотношения с^п2~^е{п)^— ^^ e(k)[1 ^ к < сп^-^], которому удовлетворяет остаточный член е(п) = f (п) — сп^~}. Этому соотношению асимптотически удовлетворяет функция пф-1и(Ыпп/1пф) km ' если и(х 4-1) = —и(х). (Варди высказал гипотезу, что f(n) = n*-1(c + u(^)(lnnr1+0(aogn)-2) для некоторой такой функции и.) Вычисления для малых п показывают, что f (п) равно ближайшему целому к спф_1 для 1 ^ п ^ 400 с единственным исключением: f (273) = 39 > с • 273ф_1 ~ 38.4997. Однако эта малая погрешность постепенно возрастает из-за результатов, аналогичных приведенным в упр. 2.36, например е(201636503) « 35.73; е{9]9986484788) « -1959.07. 9.64 (Из этого тождества для В2 (х) при помощи индукции по m можно легко вывести тождество из упр. 58.) Если 0 < х < 1, то интеграл Jx sinNTrt dt/sinrct можно записать как сумму N интегралов, каждый из которых есть 0(N~2), так что весь интеграл есть 0(N-1); константа в этом О может зависеть от х. Интегрирование тождества ]Г"=1 cos2n7rt = <H(e27rit(e2N7rit - 1 )/{e2nil - 1)) = — \ + \ sin(2N + 1)7rt/sin7rt и устремление N —> со дает Х1п>1 (sin2nnx)/n = j — тех, соотношение, известное Эйлеру ([107, НО, часть 2, §92]). Очередное интегрирование дает желаемую формулу. (Данное решение предложено Э. М. Э. Вермутом (Е. М. Е. Wermuth) [367]; собственное решение Эйлера не удовлетворяет современным критериям строгости.)
718 Ответы к упражнениям 9.65 Поскольку do + сцп-1 + а2П~2 Н = 1 + (п — 1 )-1 (ао + си (n— 1 )_1 + azin— 1 )-2 Н ), имеем рекуррентное соотношение am+i = Y_k (к")ак, которое совпадает с соотношением для чисел Белла. Следовательно, am = Qm. Несколько более длинное, но и более информативное доказательство основывается на том факте, что в силу (747) V(n — 1)...(n-m) = LkO/nk. 9.66 Ожидаемое количество различных элементов в последовательности 1, f(1), f(f(1)), ..., когда f является случайным отображением множества {1,2,..., п} в себя, есть функция Q(n) из упр. 56, и ее значение равно ^\/2яп + 0(1); это может как-то помочь в установлении множителя у/2тт. 9.67 Известно, что lnXn ~ §п21п|; константа е_7с/6 проверена эмпирически с точностью до восьми значащих цифр. 9.68 Равенство будет нарушено, если, например, еп_у = га + \ + е/та для некоторого целого m и некоторого 0 < е < |; однако ни одного контрпримера не известно. "Сейчас уже твердо установлен тот парадоксальный факт, что самые крайние абстракции как раз и представляют орудия нашего познания конкретных фактов" — А. И. Уайтхед (А. N. Whitehead) [372]
Б Библиография "Эта статья восполняет досадный пробел в литературе" — Math. Reviews 65 ЗДЕСЬ ПРЕДСТАВЛЕНЫ РАБОТЫ, цитировавшиеся в книге. Числа на полях соответствуют номерам страниц, на которых встречаются соответствующие цитаты. Ссылки на опубликованные задачи в основном указывают места, где можно найти решения, а не исходные постановки задач. Где это возможно, фамилии авторов и названия работ приведены на языке оригинала. Библиография упорядочена в соответствии с английским написанием фамилий авторов. 1 N.H. Abel, letter to В. Holmboe (1823), в его (Euvres Completes^ first edition, 1839, volume 2, 264-265. Воспроизведено в second edition, 1881, volume 2, 254-255. 2 Milton Abramowitz and Irene A. Stegun, editors, Handbook of Mathematical Functions. United States Government Printing Office, 1964. Воспроизведено Dover, 1965. (Имеется русский перевод: Абрамовиц М., Стиган И. (ред.) Справочник по специальным функциям.— М.: Наука, 1979.) 3 William W. Adams and J.L. Davison, "A remarkable class of continued fractions" Proceedings of the American Mathematical Society 65 (1977), 194-198. (См. также P. E. Bohmer, "Uber die Transzendenz gewisser dyadischer Briiche" Mathematische Annalen 96 (1927), 367-377.) 4 A.V. Aho and N.J. A. Sloane, "Some doubly exponential sequences" Fibonacci Quarterly 11 (1973), 429-437. 5 W. Ahrens, Mathematische Unterhaltungen und Spiele. Teub- ner, Leipzig, 1901. Second edition, in two volumes, 1910 and 1918. (Имеется русский перевод первого издания: Аренсъ В. Математичесшя игры и развлечетя. — Петроград: Физика, 1914.) 26
720 Библиография 6 Ахиезер Н.И. Классическая проблема моментов и некото- 704 рые вопросы анализа, связанные с нею. — М.: Физматгиз, 1961. Английский перевод: The Classical Moment Problem and Some Related Questions in Analysis, Hafner, 1965. 7 R. E. Allardice and A. Y. Praser, "La Tour d'Hanoi'" Proceedings 19 of the Edinburgh Mathematical Society 2 (1884), 50-53. 8 Desire Andre, "Sur les permutations alternees" Journal de Mathematiques pures et appliquees, series 3, 7 (1881), 167-184. 9 George E. Andrews, "Applications of basic hyper geometric func- 270 tions',' SIAM Review 16 (1974), 441-484. 10 George E. Andrews, "On sorting two ordered sets" Discrete 634 Mathematics 11 (1975), 97-106. 11 George E. Andrews, The Theory of Partitions. Addison-Wesley, 402 1976. (Имеется русский перевод: Эндрюс Г. Теория разбиений.— М.: Наука, 1982.) 12 George Е. Andrews, "Euler's 'exemplum memorabile inductionis 685 fallacis' and q-trinomial coefficients" Journal of the American Mathematical Society 3 (1990), 653-669. 13 George E. Andrews and K. Uchimura, "Identities in combinatorics IV: Differentiation and harmonic numbers" Utilitas Mathematics 28 (1985), 265-269. 14 Roger Apery, "Interpolation de fractions continues et irra- 295 tionalite de certaines constantes" in Mathematiques, Ministere des universites (Prance), Comite des travaux historiques et sci- entifiques, Section des sciences, Bulletin de la Section des Sciences 3 (1981), 37-53. 15 M. D. Atkinson, "The cyclic towers of Hanoi" Information Processing Letters 13 (1981), 118-119. 16 M. D. Atkinson, "How to compute the series expansions of secx and tgx'J American Mathematical Monthly 93 (1986), 387-389. (Этот треугольник был впервые найден L. Seidel, "Ueber eine einfache Entstehungsweise der Bernoulli'schen Zahlen und einiger verwandten Reihen" Sitzungsberichte der mathematisch- physikalischen Classe der koniglich bayerischen Akademie der Wissenschaften zu Munchen 7 (1877), 157-187.) 17 Paul Bachmann, Die analytische Zahlentheorie. Teubner, Leip- 534 zig, 1894. 18 W. N. Bailey, Generalized Нуpergeometric Series. Cambridge 279 University Press, 1935; second edition, 1964.
Б Библиография 721 654 19 W. N. Bailey, "The generating function for Jacobi polynomials" Journal of the London Mathematical Society 13 (1938), 243- 246. 26 20 W.W. Rouse Ball and H.S.M. Coxeter, Mathematical Recreations and Essays, twelfth edition. University of Toronto Press, 1974. (Переработка книги W.W. Rouse Ball Mathematical Recreations and Problems, first published by Macmillan, 1892.) (Имеется русский перевод: Болл У., Коксетер Г. Математические эссе и развлечения.— М.: Мир, 1986.) 21 P. Barlow, "Demonstration of a curious numerical proposition" Journal of Natural Philosophy, Chemistry, and the Arts 27 (1810), 193-205. 22 Samuel Beatty, "Problem 3177" American Mathematical Monthly 34 (1927), 159-160. 403 23 E. T. Bell, "Euler algebra" Transactions of the American Mathematical Society 25 (1923), 135-154. 24 E.T. Bell, "Exponential numbers" American Mathematical Monthly 41 (1934), 411-419. 25 Edward A. Bender, "Asymptotic methods in enumeration" SIAM Review 16 (1974), 485-515. 346 26 Jacobi Bernoulli, Ars Conjectandi, opus posthumum. Basel, 1713. Воспроизведено в Die Werke von Jakob Bernoulli, volume 3, 107-286. (Имеется русский перевод четвертой части (числам Бернулли посвящена вторая часть): Бернулли Я. Искусство предположения(й).— СПб.: Имп. Академия наук, 1913; воспроизведено в сборнике: Бернулли Я. О законе больших чисел.— М.: Наука, 1986.) 27 J. Bertrand, "Memoire sur le nombre de valeurs que peut prendre une fonction quand on у permute les lettres qu'elle renferme" Journal de VEcole Royale Polytechnique 18, cahier 30 (1845), 123-140. 65 28 William H. Beyer, editor, CRC Standard Mathematical Tables and Formulae, 29th edition. CRC Press, Boca Raton, Florida, 1991. 471 29 J. Bienayme, "Considerations a l'appui de la decouverte de Laplace sur la loi de probabilite dans la methode des moin- dres carres" Comptes Rendus hebdomadaires des seances de VAcademie des Sciences (Paris) 37 (1853), 309-324.
722 Библиография 30 J. Binet, "Memoire sur un systeme de Formules analytiques, et leur application a des considerations geometriques" Journal de VEcole Polytechnique 9, cahier 16 (1812), 280-354. 31 J. Binet, "Memoire sur Г integration des equations lineaires aux 364 differences finies, d'un ordre quelconque, a coefficients variables" Comptes Rendus hebdomadaires des seances de VAcademie des Sciences (Paris) 17 (1843), 559-567. 32 Gunnar Blom, "Problem Б 3043: Random walk until no shoes" American Mathematical Monthly 94 (1987), 78-79. 33 R. P. Boas, Jr. and J. W. Wrench, Jr., "Partial sums of the har- 714 monic series" American Mathematical Monthly 78 (1971), 864- 870. 34 P. Bohl, "Uber ein in der Theorie der sakularen Storungen 119 vorkommendes Problem" Journal fur die reine und angewandte Mathematik 135 (1909), 189-283. (Имеется русский перевод: Боль П. Г. "Об одной проблеме в теории вековых возмущений" Собрание трудов.— Рига: Зинатне, 1974, 338-453.) 35 Emile Borel, Lecons sur les series a termes positifs. Paris, 1902. 36 Jonathan M. Borwein and Peter B. Borwein, Pi and the AGM. Wiley, 1987. 37 Richard P. Brent, "The first occurrence of large gaps between 628 successive primes" Mathematics of Computation 27 (1973), 959- 963. 38 Richard P. Brent, "Computation of the regular continued frac- 372, 673 tion for Euler's constant" Mathematics of Computation 31 (1977), 771-777. 39 John Brillhart, "Some miscellaneous factorizations" Mathematics of Computation 17 (1963), 447-450. 40 Achille Brocot, "Calcul des rouages par approximation, nouvelle 155 methode" Revue Chronometrique 3 (1861), 186-194. (He also published a 97-page monograph with the same title in 1862.) 41 Maxey Brooke and С R. Wall, "Problem B-14: A little surprise',' Fibonacci Quarterly 1,3 (1963), 80. 42 Brother U. Alfred (Brousseau), "A mathematician's progress" Mathematics Teacher 59 (1966), 722-727. 43 Morton Brown, "Problem 6439: A periodic sequence" American 600 Mathematical Monthly 92 (1985), 218.
Б Библиография 723 44 Т. Brown, "Infinite multi-variable subpolynormal Woffles which do not satisfy the lower regular Q-property (Piffles)" in A Collection of 250 Papers on Woffle Theory Dedicated to R. S. Green on His 23rd Birthday. Цитировалось в А. К. Austin, "Modern research in mathematics" The Mathematical Gazette 51 (1967), 149-150. 45 Thomas C. Brown, "Problem E2619: Squares in a recursive sequence" American Mathematical Monthly 85 (1978), 52-53. 46 William G. Brown, "Historical note on a recurrent combinatorial problem" American Mathematical Monthly 72 (1965), 973-977. 47 S. A. Burr, "On moduli for which the Fibonacci sequence contains a complete system of residues" Fibonacci Quarterly 9 (1971), 497-504. 48 E. Rodney Canfield, "On the location of the maximum Stirling number(s) of the second kind" Studies in Applied Mathematics 59 (1978), 83-93. 49 L. Carlitz, "The generating function for max(ni ,112, • • • ,nij" Portugaliae Mathematica 21 (1962), 201-207. 50 Lewis Carroll (pseudonym of C.L. Dodgson), Through the Looking Glass and What Alice Found There. Macmillan, 1871. (Имеется русский перевод: Кэрролл Л. Приключения Алисы в Стране чудес. Сквозь зеркало и что там увидела Алиса, или Алиса в Зазеркалье.— М.: Наука, 1979.) 51 Jean-Dominique Cassini, "Une nouvelle progression de nombres" Histoire de VAcademie Royale des Sciences, Paris, volume 1, 201. (В этой работе Кассини собраны математические результаты, представленные Королевской академии наук в 1680 году. Издание вышло в 1733 году.) 52 Е. Catalan, "Note sur une Equation aux differences finies" Journal de Mathematiques pures et appliquees 3 (1838), 508-516. 53 Augustin-Louis Cauchy, Cours d'analyse de VEcole Royale Poly- technique. Imprimerie Royale, Paris, 1821. Воспроизведено в его (Euvres completes, series 2, volume 3. (Имеется русский перевод: Коши О.-Л. Краткое изложение уроков о дифференциальном и интегральном исчислении. — СПб.: Имп. Академия наук, 1831.) 54 Arnold Buffum Chace, The Rhind Mathematical Papyrus, volume 1. Mathematical Association of America, 1927. (Включает великолепный список литературы египетских математиков, подготовленный Р.Арчибальдом (R. С. Archibald).)
724 Библиография 55 М. Chaimovich, G. Preiman, and J. Schonheim, "On exceptions to Szegedy's theorem',' Acta Arithmetica 49 (1987), 107-112. 56 P. L. Tchebichef (Chebyshev), "Memoire sur les nombres premiers" Journal de Mathematiques pures et appliquees 17 (1852), 366-390. Воспроизведено в его (Euvres, volume 1, 51-70. (Имеются русские переводы: Чебышев П. Л. "О простыхъ числахъ" Сочинетя П. Л. Чебышева, томъ 1.— СПб.: Имп. Академия Наукъ, 1899, 51-70; Чебышев П. Л. Полное собрание сочинений, том 1.— М.-Л.: Изд. АН СССР, 1944, 191- 207.) 57 Чебышев П. Л. "О среднихъ величинахъ'.' Математический сборникъ 2 (1867), 1-9. Воспроизведено в: Чебышев П. Л. Полное собрание сочинений, том 2.— М.-Л.: Изд. АН СССР, 1944, 431-437. Французский перевод: "Des valeurs moyennes" Journal de Mathematiques pures et appliquees, series 2, 12 (1867), 177-184; воспроизведено в его (Euvres, volume 1, 685- 694. 58 Чебышев П. А. "О приближенныхъ выражешяхъ одшхъ ин- теграловъ черезъ другие, взятые в тех же пределахъ" Сообщения и протоколы заседаний математическаго общества при Императорскомъ Харьковскомъ Университете 4, 2 (1882), 93-98. Воспроизведено в: Чебышев П. Л. Полное собрание сочинений, том 3.— М.-Л.: Изд. АН СССР, 1944, 191-207, 128-131. Французский перевод: "Sur les expressions approximatives des integrates definies par les autres prises entre les memes limites" в его (Euvres, volume 2, 716-719. 59 F. R. K. Chung and R. L. Graham, "On the cover polynomial of a digraph" Journal of Combinatorial Theory, series B, 65 (1995), 273-290. 60 Th. Clausen, "Ueber die Falle, wenn die Reihe von der Form ex (3 cx.cx+1 (3.(3 + 1 2 у = 1 + - • - x + ——— • —! x2 + etc. y 1 у 1.2 y.y + 1 ein Quadrat von der Form , ос' (37 6' 1.2 y'.y' + l e'.e' + l Journal fur die reine und angewandte Mathematik 3 (1828), 89-91.
Б Библиография 725 61 Th. Clausen, "Beitrag zur Theorie der Reihen" Journal fur die reine und angewandte Mathematik 3 (1828), 92-95. 62 Th. Clausen, "Theorem" Astronomische Nachrichten 17 (1840), columns 351-352. 63 Stuart Dodgson Collingwood, The Lewis Carroll Picture Book. T. Fisher Unwin, 1899. Воспроизведено Dover в 1961 году под новым названием Diversions and Digressions of Lewis Carroll. 64 Louis Comtet, Advanced Combinatorics. Dordrecht, Reidel, 1974. 65 J.H. Conway and R. L. Graham, "Problem E2567: A periodic recurrence" American Mathematical Monthly 84 (1977), 570- 571. 66 Harald Cramer, "On the order of magnitude of the difference between consecutive prime numbers" Acta Arithmetica 2 (1937), 23-46. 67 A. L. Crelle, "Demonstration elementaire du theoreme de Wilson generalise" Journal fiti die reine und angewandte Mathematik 20 (1840), 29-56. 68 D. W. Crowe, "The n-dimensional cube and the Tower of Hanoi" American Mathematical Monthly 63 (1956), 29-30. 69 Janos A. Csirik, "Optimal strategy for the first player in the Penney ante game" Combinatorics, Probability and Computing 1 (1992), 311-321. 70 D.R. Curtiss, "On Kellogg's Diophantine problem" American Mathematical Monthly 29 (1922), 380-387. 71 F.N. David and D.E. Barton, Combinatorial Chance. Hafner, 1962. 72 Philip J. Davis, "Leonhard Euler's integral: A historical profile of the Gamma function" American Mathematical Monthly 66 (1959), 849-869. 73 J.L. Davison, "A series and its associated continued fraction" Proceedings of the American Mathematical Society 63 (1977), 29-32. 74 N. G. de Bruijn, Asymptotic Methods in Analysis. North- Holland, 1958; third edition, 1970. Воспроизведено Dover, 1981. (Имеется русский перевод первого издания: деБрейн Н.Г. Асимптотические методы в анализе.— М.: ИЛ, 1961.) 75 N. G. de Bruijn, "Problem 9" Nieuw Archief voor Wiskunde, series 3, 12 (1964), 68. 357 600 628 703 717 264 373 535, 538, 708
726 Библиография 76 Abraham de Moivre, Miscellanea analytica de seriebus et quad- raturis. London, 1730. 77 R. Dedekind, "Abrifl einer Theorie der hoheren Congruenzen in Bezug auf einen reellen Primzahl-Modulus" Journal fur die reine und angewandte Mathematik 54 (1857), 1-26. Воспроизведено в его Gesammelte mathematische Werke, volume 1, 40-67. 78 Leonard Eugene Dickson, History of the Theory of Numbers. Carnegie Institution of Washington, volume 1, 1919; volume 2, 1920; volume 3, 1923. Воспроизведено Stechert, 1934, and by- Chelsea, 1952, 1971. 79 Edsger W. Dijkstra, Selected Writings on Computing: A Personal Perspective. Springer-Verlag, 1982. 80 G. Lejeune Dirichlet, "Verallgemeinerung eines Satzes aus der Lehre von den Kettenbruchen nebst einigen Anwendungen auf die Theorie der Zahlen" Bericht tiber die Verhandlungen der Koniglich-PreuBischen Akademie der Wissenschaften zu Berlin (1842), 93-95. Воспроизведено в его Werke, volume 1, 635-638. 81 А. С. Dixon, "On the sum of the cubes of the coefficients in a certain expansion by the binomial theorem" Messenger of Mathematics 20 (1891), 79-80. 82 John Dougall, "On Vandermonde's theorem, and some more general expansions" Proceedings of the Edinburgh Mathematical Society 25 (1907), 114-132. 83 A. Conan Doyle, "The sign of the four; or, The problem of the Sholtos" Lippincott's Monthly Magazine (Philadelphia) 45 (1890), 147-223. (Имеется русский перевод: Конан Дойль А. "Знак четырех" Собрание сочинений, том 1.— М.: Правда, 1966, 151-264.) 84 A. Conan Doyle, "The adventure of the final problem" The Strand Magazine 6 (1893), 558-570. (Имеется русский перевод: Конан Дойль А. "Последнее дело Холмса" Собрание сочинений, том 2.— М.: Правда, 1966, 221-240.) 85 P. du Bois-Reymond, "Sur la grandeur relative des infinis des fonctions" Annali di Matematica pur a ed appiicata, series 2, 4 (1871), 338-353. 86 Harvey Dubner, "Generalized repunit primes" Mathematics of Computation 61 (1993), 927-930. 87 Henry Ernest Dudeney, The Canterbury Puzzles and Other Curious Problems. E.P. Dutton, New York, 1908; 4th edition, 362, 577 610 220 285, 488 531 209
Б Библиография 727 Dover, 1958. (Свое первое обобщение ханойской башни Дью- дени опубликовал в The Weekly Dispatch, on 15 November 1896, 25 May 1902 and 15 March 1903.) (Имеется русский перевод четвертого издания: Дьюдени Г. Э. Кентерберийские головоломки. — М.: Мир, 1979.) 88 G. Waldo Dunnington, Carl Friedrich Gauss: Titan of Science. Exposition Press, New York, 1955. 89 F. J. Dyson, "Some guesses in the theory of partitions" Eureka 8 (1944), 10-15. 90 A. W. F. Edwards, Pascal's Arithmetical Triangle. Oxford University Press, 1987. 91 G. Eisenstein, "Entwicklung von ota " Journal fur die reine und angewandte Mathematik 28 (1844), 49-52. Воспроизведено в его Mathematische Werke 1, 122-125. 92 Noam D. Elkies, "On A4 + B4 + C4 = D4',' Mathematics of Computation 51 (1988), 825-835. 11 la 93 Erdos Pal, "Az 1 h • • • H = 7- egyenlet egesz szamu X] %2 xn b megoldasairol" Matematikai Lapok 1 (1950), 192-209. Аннотация на английском языке на стр. 210. 94 Paul Erdos, "My Scottish Book 'problems",' in The Scottish Book: Mathematics from the Scottish Cafe, edited by R. Daniel Mauldin, 1981, 35-45. 95 P. Erdos and R. L. Graham, Old and New Problems and Results in Combinatorial Number Theory. Universite de Geneve, L'Enseignement Mathematique, 1980. 96 P. Erdos, R. L. Graham, I. Z. Ruzsa, and E. G. Straus, "On the prime factors of (™)" Mathematics of Computation 29 (1975), 83-92. 97 Arulappah Eswarathasan and Eugene Levine, "p-integral harmonic sums" Discrete Mathematics 91 (1991), 249-257. 98 Euclid, STOIXEIA. Старинный манускрипт, впервые напечатан в Базеле в 1533 году. Школьный учебник (на греческом и латыни) Гейберга (J.L. Heiberg) в пяти томах, Teub- ner, Leipzig, 1883-1888. (Имеется русский перевод: Начала Евклида, книги I—VI, VII-X, XI-XV.— М.-Л.: Гостехиздат, 1948-1950.) 24 297 201 255 172 503 616, 628 628, 654 144
728 Библиография 99 Leonhard Euler, letter to Christian Goldbach (13 October 264 1729), in Correspondance mathematique et physique de quelques celebres geometres du XVIIIeme siecle, edited by P. H. Puss, St. Petersburg, 1843, volume 1, 3-7. 100 L. Eulero, "De progressionibus transcendentibus seu quarum 264 termini generales algebraice dari nequeunt" Commentarii academiae scientiarum imperialis Petropolitanae 5 (1730), 36-57. Воспроизведено в его Opera Omnia, series 1, volume 14, 1-24. 101 Leonh. Eulero, "Methodus generalis summandi progressiones" 564 Commentarii academiae scientiarum imperialis Petropolitanae 6 (1732), 68-97. Воспроизведено в его Opera Omnia, series 1, volume 14, 42-72. 102 Leonh. Eulero, "Observationes de theoremate quodam Ferma- 173 tiano, aliisque ad numeros primos spectantibus" Commentarii academiae scientiarum imperialis Petropolitanae 6 (1732), 103- 107. Воспроизведено в его Opera Omnia, series 1, volume 2, 1-5. Воспроизведено в его Commentationes arithmeticae col- lectae, volume 1, 1-3. 103 Leonh. Eulero, "De progressionibus harmonicis observationes" 340 Commentarii academiae scientiarum imperialis Petropolitanae 7 (1734), 150-161. Воспроизведено в его Opera Omnia, series 1, volume 14, 87-100. 104 Leonh. Eulero, "Methodus universalis series summandi ul- 328 terius promota" Commentarii academiae scientiarum imperialis Petropolitanae 8 (1736), 147-158. Воспроизведено в его Opera Omnia, series 1, volume 14, 124-137. 105 Leonh. Euler, "De fractionibus continuis, Dissertatio" Commen- 162 tarii academiae scientiarum imperialis Petropolitanae 9 (1737), 98-137. Воспроизведено в его Opera Omnia, series 1, volume 14, 187-215. 106 Leonh. Euler, "Variae observationes circa series infinitas" Commentarii academiae scientiarum imperialis Petropolitanae 9 (1737), 160-188. Воспроизведено в его Opera Omnia, series 1, volume 14, 216-244. 107 Leonhard Euler, letter to Christian Goldbach (4 July 1744), in 717 Correspondance mathematique et physique de quelques celebres geometres du XVIIIeme siecle, edited by P. H. Puss, St. Petersburg, 1843, volume 1, 278-293. 108 Leonhardo Eulero, Introductio in Analysin Inunitorum. Tomus primus, Lausanne, 1748. Воспроизведено в его Opera Omnia,
Б Библиография 729 series 1, volume 8. Перевод на французский (1786), немецкий (1788), русский (1936), английский (1988). (Имеются русские переводы: Эйлер Л. Введение в анализ бесконечных, том 1.— М.-Л.: ОНТИ, 1936; 2-е изд.: М.: Физматгиз, 1961.) 109 L. Eulero, "De partitione numerorum" Novi commentarii academiae scientiarum imperialis Petropolitanae 3 (1750), 125-169. Воспроизведено в его Commentationes arithmetical collects, volume 1, 73-101. Воспроизведено в его Opera Omnia, series 1, volume 2, 254-294. 110 Leonhardo Eulero, Institutiones Calculi Differentialis cum eius usu in Analysi Finitorum ac Doctrina Serierum. St. Petersburg, Academiae Imperialis Scientiarum Petropolitanae, 1755. Воспроизведено в его Opera Omnia, series 1, volume 10. Перевод на немецкий (1790). (Имеется русский перевод: Эйлер Л. Дифференциальное исчисление.— М.-Л.: Гостехиздат, 1949.) 111 L. Eulero, "Theoremata arithmetica nova methodo demon- strata" Novi commentarii academiae scientiarum imperialis Petropolitanae 8 (1760), 74-104. (Also presented in 1758 to the Berlin Academy.) Воспроизведено в его Commentationes arith- meticae collectae, volume 1, 274-286. Воспроизведено в его Opera Omnia, series 1, volume 2, 531-555. 112 L. Eulero, "Specimen algorithmi singularis" Novi commentarii academiae scientiarum imperialis Petropolitanae 9 (1762), 53-69. (B 1757году представлена также в Берлинскую академию.) Воспроизведено в его Opera Omnia, series 1, volume 15, 31-49. 113 L. Eulero, "Observationes analyticae" Novi commentarii academiae scientiarum imperialis Petropolitanae 11 (1765), 124-143. Воспроизведено в его Opera Omnia, series 1, volume 15, 50-69. 114 Leonhard Euler, VoUstandige Anleitung zur Algebra. Erster Theil. Von den verschiedenen Rechnungs-Arten, Verhaltnissen und Proportionen. St. Petersburg, 1770. Воспроизведено в его Opera Omnia, series 1, volume 1. Перевод на русский (1768), голландский (1773), французский (1774), латынь (1790), английский (1797). (Имеются издания на русском языке: Универсальная арифметика Леонарда Эйлера, том 1.— СПб.: 1768, 2-е изд., 1787; Основания алгебры Леонарда Эйлера, том 1.— СПб.: 1912.) 115 L. Eulero, "Observationes circa bina biquadrata quorum sum- mam in duo alia biquadrata resolvere liceat" Novi commentarii academiae scientiarum imperialis Petropolitanae 17 (1772), 64- 69. Воспроизведено в его Commentationes arithmeticae col- 73,328, 658, 717 175 367, 369 685 172
730 Библиография lectae, volume 1, 473-476. Воспроизведено в его Opera Omnia, series 1, volume 3, 211-217. 116 L. Eulero, "Observationes circa novum et singulare progres- 614 sionum genus" Novi commentarii academiae scientiarum impe- rialis Petropolitanae 20 (1775), 123-139. Воспроизведено в его Opera Omnia, series 1, volume 7, 246-261. 117 L. Eulero, "De serie Lambertina, plurimisque eius insignibus 255 proprietatibus" Acta academiae scientiarum imperialis Petropo- litanas 3,2 (1779), 29-51. Воспроизведено в его Opera Omnia, series 1, volume 6, 350-369. 118 L. Eulero, "Specimen transformationis singularis serierum" Nova 260 acta academiae scientiarum imperialis Petropolitanae 12 (1794), 58-70. Submitted for publication in 1778. Воспроизведено в его Opera Omnia, series 1, volume 16(2), 41-55. 119 Johann Faulhaber, Academia Algebrae, Darinnen die miraculo- 352 sische Inventiones zu den hochsten Cossen weiters continuirt und profitiert werden, ... bifl auff die regulierte Zensicubic- cubic Сой durch offnen Truck publiciert worden. Augsburg, 1631. 120 William Feller, An Introduction to Probability Theory and Its 461 Applications, volume 1. Wiley, 1950; second edition, 1957; third edition, 1968. (Имеется русский перевод третьего издания: Феллер У. Введение в теорию вероятностей и ее приложения, том 1.— М.: Мир, 1984.) 121 Pierre de Fermat, letter to Marin Mersenne (25 December 1640), 173 in (Euvres de Fermat, volume 2, 212-217. 122 Leonardo filio Bonacii Pisano (Fibonacci), Liber Abaci. First edition, 1202 (now lost); second edition, 1228. Воспроизведено в Scritti di Leonardo Pisano, edited by Baldassarre Boncom- pagni, 1857, volume 1. 123 Bruno de Finetti, Teoria delle Probability. Turin, 1970. Ah- 45 глийский перевод: Theory of Probability, Wiley, 1974-1975. 124 Michael E. Fisher, "Statistical mechanics of dimers on a plane lattice',' Physical Review 124 (1961), 1664-1672. 125 R. A. Fisher, "Moments and product moments of sampling distributions" Proceedings of the London Mathematical Society, series 2, 30 (1929), 199-238. 126 Pierre Forcadel, L'arithmeticque. Paris, 1557.
Б Библиография 731 42 127 J. Fourier, "Refroidissement seculaire du globe terrestre" Bulletin des Sciences par la Societe philomathique de Paris, series 3, 7 (1820), 58-70. Воспроизведено в CEuvres de Fourier, volume 2, 271-288. 616 128 Aviezri S. Fraenkel, "Complementing and exactly covering sequences" Journal of Combinatorial Theory, series A, 14 (1973), 8-20. 672 129 Aviezri S. Fraenkel, "How to beat your WythofT games' opponent on three fronts" American Mathematical Monthly 89 (1982), 353-361. 130 J.S. Frame, B.M. Stewart, and Otto Dunkel, "Partial solution to problem 3918" American Mathematical Monthly 48 (1941), 216-219. 131 Piero della Francesca, Франческа, Пьеро делла (Francesca, Piero della) Francesca, Piero della Libellus de quinque cor- poribus regularibus. Vatican Library, manuscript Urbinas 632. Перевод на итальянский Луки Пачоли (Luca Pacioli) в виде части 3 в Pacioli Diuine Proportione, Venice, 1509. 655 132 J. Franel, Solutions to questions 42 and 170, in L4ntermediaire des Mathematiciens 1 (1894), 45-47; 2 (1895), 33-35. 133 W.D. Frazer and A. С McKellar, "Samplesort: A sampling approach to minimal storage tree sorting" Journal of the Association for Computing Machinery 27 (1970), 496-507. 614 134 Michael Lawrence Fredman, Growth Properties of a Class of Recursively Defined Functions. Ph.D. thesis, Stanford University, Computer Science Department, 1972. 436 135 Nikolao Fuss, "Solutio quaestionis, quot modis polygonum n la- terum in polygona m laterum, per diagonales resolvi quaeat" Nova acta academias scientiarum imperialis Petropolitanas 9 (1791), 243-251. 364 136 Martin Gardner, "About phi, an irrational number that has some remarkable geometrical expressions" Scientific American 201,2 (August 1959), 128-134. Воспроизведено с дополнениями в его книге The 2nd Scientific American Book of Mathematical Puzzles & Diversions, 1961, 89-103. (Имеется русский перевод: Гарднер М. Математические головоломки и развлечения.— М.: Мир, 1971.) 494 137 Martin Gardner, "On the paradoxical situations that arise from nontransitive relations" Scientific American 231,4 (October
732 Библиография 1974), 120-124. Воспроизведено с дополнениями в его книге Time Travel and Other Mathematical Bewilderments, 1988, 55-69. (Имеется русский перевод: Гарднер М. Путешествие во времени.— М.: Мир, 1990.) 138 Martin Gardner, "From rubber ropes to rolling cubes, a miscellany of refreshing problems" Scientific American 232,3 (March 1975), 112-114; 232,4 (April 1975), 130, 133. Воспроизведено с дополнениями в его книге Time Travel and Other Mathematical Bewilderments, 1988, 111-124. (Имеется русский перевод: Гарднер М. Путешествие во времени.— М.: Мир, 1990.) 139 Martin Gardner, "On checker jumping, the amazon game, weird dice, card tricks and other playful pastimes" Scientific American 238,2 (February 1978), 19, 22, 24, 25, 30, 32. Воспроизведено с дополнениями в его книге Penrose Tiles to Trapdoor Ciphers, 1989, 265-280. (Имеется русский перевод: Гарднер М. От мозаик Пенроуза к надежным шифрам.— М.: Мир, 1991.) 140 J. Garfunkel, "Problem Е1816: An inequality related to Stirling's formula" American Mathematical Monthly 74 (1967), 202. 141 George Gasper and Mizan Rahman, Basic Hypergeometric Se- 279 ries. Cambridge University Press, 1990. (Имеется русский перевод: Гаспер Дж., Рахман М. Базисные гипергеометрпчес- кие ряды.— М.: Мир, 1993.) 142 C.F. Gauss, Disquisitiones Arithmeticad. Leipzig, 1801. Вое- 163 произведено в его Werke, volume 1. 143 Carolo Friderico Gauss, "Disquisitiones generales circa seriem 260, 266, 277, 632 infinitam a(3 a(q+1)[3((3 + l) 1 + i x + "1—i 1—ГТТ" xx+ 1 .y 1.2. y(y + 1) a(q+1)(a + 2)P(P + 1)(P+2) + 1 .2.3.y(y + 1)(y + 2) X +etC* Pars prior" Commentationes societatis regiae scientiarum Got- tingensis recentiores 2 (1813). (Опубликовано Королевским Геттингенским обществом 20 января 1812 года.) Воспроизведено в его Werke, volume 3, 123-163, вместе с неопубликованной частью на с. 207-229. (Имеется русский перевод: Гаусс К. Ф. Труды по теории чисел. Арифметические исследования.— М.: Изд. АН СССР, 1959, 15-583.) 144 С. F. Gauss, "Pentagramma mirificum" написано до 1836 года. Опубликовано в его Werke, volume 3, 480-490.
Б Библиография 733 658 145 Angelo Genocchi, "Intorno all'espressione generale de'numeri Bernulliani" Annali di Scienze Matematiche e Fisiche 3 (1852), 395-405. 146 Ira Gessel, "Some congruences for Apery numbers" Journal of Number Theory 14 (1982), 362-368. 332 147 Ira Gessel and Richard P. Stanley, "Stirling polynomials" Journal of Combinatorial Theory, series A, 24 (1978), 24-33. 332 148 Jekuthiel Ginsburg, "Note on Stirling's numbers" American Mathematical Monthly 35 (1928), 77-80. 149 J.W.L. Glaisher, "On the product I1.22.33 .. .un',' Messenger of Mathematics 7 (1877), 43-47. 717 150 Solomon W. Golomb, "Problem 5407: A nondecreasing indicator function" American Mathematical Monthly 74 (1967), 740-743. 607 151 Solomon W. Golomb, "The 'Sales Tax' theorem',' Mathematics Magazine 49 (1976), 187-189. 553 152 Solomon W. Golomb, "Problem E2529: An application of "ф(х)" American Mathematical Monthly 83 (1976), 487-488. 153 I.J. Good, "Short proof of a conjecture by Dyson" Journal of Mathematical Physics 11 (1970), 1884. 280 154 R. William Gosper, Jr., "Decision procedure for indefinite hyper geometric summation" Proceedings of the National Academy of Sciences of the United States of America 75 (1978), 40-42. 613 155 R. L. Graham, "On a theorem of Uspensky" American Mathematical Monthly 70 (1963), 407-409. 156 R. L. Graham, "A Fibonacci-like sequence of composite numbers',' Mathematics Magazine 37 (1964), 322-324. 157 R. L. Graham, "Problem 5749" American Mathematical Monthly 77 (1970), 775. 615 158 Ronald L. Graham, "Covering the positive integers by disjoint sets of the form { [not 4-13] : n = 1,2,... }" Journal of Combinatorial Theory, series A, 15 (1973), 354-358. 159 R. L. Graham, "Problem 1242: Bijection between integers and composites" Mathematics Magazine 60 (1987), 180. 160 R.L. Graham and D.E. Knuth, "Problem E2982: A double infinite sum for |x|" American Mathematical Monthly 96 (1989), 525-526.
734 Библиография 161 Ronald L. Graham, Donald E. Knuth, and Oren Patashnik, Concrete Mathematics: A Foundation for Computer Science. Addison-Wesley, 1989; second edition, 1994. 162 R. L. Graham and H. O. Pollak, "Note on a nonlinear recurrence related to y/T\ Mathematics Magazine 43 (1970), 143-145. 163 Guido Grandi, letter to Leibniz (July 1713), in Leibnizens 84 Mathematische Schriften, volume 4, 215-217. 164 Daniel H. Greene and Donald E. Knuth, Mathematics for the 640 Analysis of Algorithms. Birkhauser, Boston, 1981; third edition, 1990. (Имеется русский перевод второго издания: Грин Д.Х., Кнут Д.Э. Математические методы анализа алгоритмов.— М.: Мир, 1987.) 165 Samuel L. Greitzer, International Mathematical Olympiads, 1959-1977. Mathematical Association of America, 1978. 166 Oliver A. Gross, "Preferential arrangements" American Mathematical Monthly 69 (1962), 4-8. 167 Branko Grunbaum, "Venn diagrams and independent families 596 of sets" Mathematics Magazine 48 (1975), 12-23. 168 L.J. Guibas and A.M. Odlyzko, "String overlaps, pattern 702 matching, and nontransitive games" Journal of Combinatorial Theory, series A, 30 (1981), 183-208. 169 Richard K. Guy, Unsolved Problems in Number Theory. Sprin- 628 ger-Verlag, 1981. 170 Inger Johanne Haland and Donald E. Knuth, "Polynomials 615 involving the floor function" Mathematica Scandinavica 76 (1995), 194-200. Воспроизведено в Knuth D.E. Selected Papers on Discrete Mathematics, 257-264. 171 Marshall Hall, Jr., The Theory of Groups. Macmillan, 1959. (Имеется русский перевод: Холл М. Теория групп.— М.: ИЛ, 1962.) 172 P. R. Halmos, "How to write Mathematics" UEnseignement 8 mathematique 16 (1970), 123-152. Воспроизведено в How to Write Mathematics, American Mathematical Society, 1973, 19- 48. (Имеется русский перевод: Халмош П. Р. "Как писать математические тексты',' Успехи математических наук, 26 (1971), 243-269.) 173 Paul R. Halmos, I Want to Be a Mathematician: An Automatho- 7 graphy. Springer-Verlag, 1985. Воспроизведено Mathematical Association of America, 1988.
Б Библиография 735 174 G. Н. Halphen, "Sur des suites de fractions analogues a la suite de Farey" Bulletin de la Societe mathematique de France 5 (1876), 170-175. Воспроизведено в его (Euvres, volume 2, 102- 107. 175 Hans Hamburger, "Uber eine Brweiterung des Stieltjesschen Mo- mentenproblems" Mathematische Annalen 81 (1920), 235-319; 82 (1921), 120-164, 168-187. 176 J. M. Hammersley, "On the enfeeblement of Mathematical skills by 'Modern Mathematics' and by similar soft intellectual trash in schools and universities" Bulletin of the Institute of Mathematics and Its Applications 4,4 (October 1968), 66-85. 177 J. M. Hammersley, "An undergraduate exercise in manipulation" The Mathematical Scientist 14 (1989), 1-23. 178 Eldon R. Hansen, A Table of Series and Products. Prentice-Hall, 1975. 179 G.H. Hardy, Orders of Infinity: The TnunitarcalcuT of Paul du Bois-Reymond. Cambridge University Press, 1910; second edition, 1924. 180 G.H. Hardy, "A Mathematical theorem about golf',' The Mathematical Gazette 29 (1945), 226-227. Воспроизведено в его Collected Papers, volume 7, 488. 181 G.H. Hardy and E.M. Wright, An Introduction to the Theory of Numbers. Clarendon Press, Oxford, 1938; fifth edition, 1979. 182 Peter Henrici, Applied and Computational Complex Analysis. Wiley, volume 1, 1974; volume 2, 1977; volume 3, 1986. 183 Peter Henrici, "De Branges' proof of the Bieberbach conjecture: A view from computational analysis" Sitzungsberichte der Berliner Mathematischen Gesellschaft (1987), 105-121. 184 Charles Hermite, letter to С W. Borchardt (8 September 1875), in Journal fur die reine und angewandte Mathematik 81 (1876), 93-95. Воспроизведено в его (Euvres, volume 3, 211-214. 185 Charles Hermite, Cours de M. Hermite. Faculte des Sciences de Paris, 1882. Third edition, 1887; fourth edition, 1891. (Имеется русский перевод четвертого издания: Эрмит Ш. Курс анализа.— М.-Л.: ОНТИ, 1936.) 186 Charles Hermite, letter to S. Pincherle (10 May 1900), in Annali di Matematica pura ed applicata, series 3, 5 (1901), 57-60. Воспроизведено в его (Euvres, volume 4, 529-531. 371 704 65 533 149 365, 403, 716 663 643 7
736 Библиография 187 I.N. Herstein and I. Kaplansky, Matters Mathematical. Harper 26 & Row, 1974. 188 A. P. Hillman and V. E. Hoggatt, Jr., "A proof of Gould's Pascal hexagon conjecture" Fibonacci Quarterly 10 (1972), 565-568, 598. 189 C.A.R. Hoare, "Quicksort',' The Computer Journal 5 (1962), 49 10-15. 190 L. C. Hsu, "Note on a combinatorial algebraic identity and its application" Fibonacci Quarterly 11 (1973), 480-484. 191 Kenneth E. Iverson, A Programming Language. Wiley, 1962. 45, 95 192 C.G.J. Jacobi, Fundamenta nova theorise functionum ellipti- 91 carum. Konigsberg, Borntrager, 1829. Воспроизведено в его Gesammelte Werke, volume 1, 49-239. 193 Svante Janson, Donald E. Knuth, Tomasz Luczak, and Boris 255 Pittel, "The birth of the giant component" Random Structures &: Algorithms 4 (1993), 233-358. Опубликовано с исправлениями в Donald Е. Knuth Selected Papers on Discrete Mathematics, 643-792. 194 Dov Jarden and Theodor Motzkin, "The product of sequences 664 with a common linear recursion formula of order 2" Riveon Le- matematika 3 (1949), 25-27, 38 (На иврите с английской аннотацией). Английская версия опубликована в Dov Jarden, Recurring Sequences, Jerusalem, 1958, 42-45; second edition, 1966, 30-33. 195 Arne Jonassen and Donald E. Knuth, "A trivial algorithm whose 640 analysis isn't" Journal of Computer and System Sciences 16 (1978), 301-322. Опубликовано с дополнениями в Donald Е. Knuth Selected Papers on Analysis of Algorithms, 257-282. 196 Bush Jones, "Note on internal merging" Software — Practice and 225 Experience 2 (1972), 241-243. 197 Flavius Josephus, IETOPIA ЮТЛАЖОТ ПОАЕМОТ ПРОЕ 26 PQMAIOYE. Английский перевод: History of the Jewish War against the Romans, by H. St. J. Thackeray, in the Loeb Classical Library edition of Josephus's works, volumes 2 and 3, Heine- mann, London, 1927-1928. ("Задача Иосифа" взята, возможно, из более ранней рукописи, сохранившейся только в древнерусском варианте; см. том 2, с. xi, и том 3, с. 654.) (См. "История иудейской войны Иосифа Флавия в древнерусском переводе Н. А. Мещерского'.'— М.: Изд. АН СССР, 1958.)
Б Библиография 737 198 R. Jungen, "Sur les series de Taylor n'ayant que des singularites algebrico-logarithmiques sur leur cercle de convergence" Com- mentarii Mathematici Helvetici 3 (1931), 266-306. 199 J. Karamata, "Theoremes sur la sommabilite exponentielle et d'autres sommabilites rattachant" Mathematica (Cluj) 9 (1935), 164-178. 200 I. Kaucky, "Problem E2257: A harmonic identity" American Mathematical Monthly 78 (1971), 908. 201 J. B. Keiper, "Power series expansions of Riemann's ?, function" Mathematics of Computation 58 (1992), 765-773. 202 Johannes Kepler, letter to Joachim Tancke (12 May 1608), в его Gesammelte Werke, volume 16, 154-165. 203 Murray S. Klamkin, International Mathematical Olympiads, 1978-1985, and Forty Supplementary Problems. Mathematical Association of America, 1986. 204 R. Arthur Knoebel, "Exponentials reiterated" American Mathematical Monthly 88 (1981), 235-252. 205 Konrad Knopp, Theorie und Anwendung der unendlichen Rei- hen. Julius Springer, Berlin, 1922; second edition, 1924. Воспроизведено Dover, 1945. Fourth edition, 1947; fifth edition, 1964. Английский перевод: Theory and Application of Infinite Series, 1928; second edition, 1951. 206 Donald Knuth, "Transcendental numbers based on the Fibonacci sequence" Fibonacci Quarterly 2 (1964), 43-44, 52. 207 Donald E. Knuth, The Art of Computer Programming, volume 1: Fundamental Algorithms. Addison-Wesley, 1968; third edition, 1997. (Имеется русский перевод: Кнут Д. Э. Искусство программирования, том 1. Основные алгоритмы, 3-е изд.— М.: Изд. дом "Вильяме" 2000.) 208 Donald Е. Knuth, The Art of Computer Programming, volume 2: Seminumerical Algorithms. Addison-Wesley, 1969; third edition, 1997. (Имеется русский перевод: Кнут Д. Э. Искусство программирования, том 2. Получисленные алгоритмы, 3-е изд.— М.: Изд. дом "Вильяме" 2000.) 209 Donald Е. Knuth, The Art of Computer Programming, volume 3: Sorting and Searching. Addison-Wesley, 1973; second edition, 1998. (Имеется русский перевод: Кнут Д. Э. Искусство программирования, том 3. Сортировка и поиск, 2-е изд.— М.: Изд. дом "Вильяме" 2000.) 317 715 356 255 661 9, 599, 614, 634, 683 147, 169, 599 328, 495, 600
738 Библиография 210 Donald E. Knuth, "Problem E2492: Some sum',' American Mathematical Monthly 82 (1975), 855. 211 Donald E. Knuth, Manages stables et leurs relations avec d'autres problemes combinatoires. Les Presses de l'Universite de Montreal, 1976. Переработанное и исправленное издание, 1980. Английский перевод: Stable Marriage and its Relation to Other Combinatorial Problems, 1997. 212 Donald E. Knuth, The T^Kbook. Addison-Wesley, 1984. Воспроизведено как volume A of Computers Sz Typesetting, 1986. (Имеется русский перевод: Кнут Д. Э. Все про Т^К.— Протвино: АО RDTeX, 1993.) 213 Donald Е. Knuth, "An analysis of optimum caching" Journal of Algorithms 6 (1985), 181-199. Воспроизведено с дополнениями в его Selected Papers on Analysis of Algorithms, 235-255. 214 Donald E. Knuth, Computers & Typesetting, volume D: МЕТЯ FONT: The Program. Addison-Wesley, 1986. 215 Donald E. Knuth, "Problem 1280: Floor function identity',' Mathematics Magazine 61 (1988), 319-320. 216 Donald E. Knuth, "Problem E 3106: A new sum for n2',' American Mathematical Monthly 94 (1987), 795-797. 217 Donald E. Knuth, "Fibonacci multiplication" Applied Mathematics Letters 1 (1988), 57-60. 218 Donald E. Knuth, "A Fibonacci-like sequence of composite numbers" Mathematics Magazine 63 (1990), 21-25. 219 Donald E. Knuth, "Problem E3309: A binomial coefficient inequality" American Mathematical Monthly 97 (1990), 614. 220 Donald E. Knuth, "Two notes on notation" American Mathematical Monthly 99 (1992), 403-422. Воспроизведено с дополнениями в его Selected Papers on Discrete Mathematics, 15-44. 221 Donald E. Knuth, "Convolution polynomials" The Mathematica Journal 2,4 (Fall 1992), 67-78. Воспроизведено с дополнениями в его Selected Papers on Discrete Mathematics, 225-256. 222 Donald E. Knuth, "Johann Faulhaber and sums of powers" Mathematics of Computation 61 (1993), 277-294. Воспроизведено с дополнениями в его Selected Papers on Discrete Mathematics, 61-84. 223 Donald E. Knuth, "Bracket notation for the coefficient-of operator" in A Classical Mind, essays in honour of C. A. R. Hoare, 672 670 45, 210, 328, 712 328, 675 352 249
Б Библиография 739 edited by A. W. Roscoe, Prentice-Hall, 1994, 247-258. Воспроизведено с дополнениями в его Selected Papers on Discrete Mathematics, 45-59. 663 224 Donald E. Knuth and Thomas J. Buckholtz, "Computation of Tangent, Euler, and Bernoulli numbers" Числа Эйлера Mathematics of Computation 21 (1967), 663-688. 225 Donald E. Knuth and Ilan Vardi, "Problem 6581: The asymptotic expansion of the middle binomial coefficient" American Mathematical Monthly 97 (1990), 626-630. 633 226 Donald E. Knuth and Herbert S. Wilf, "The power of a prime that divides a generalized binomial coefficient" Journal fur die reine und angewandte Mathematik 396 (1989), 212-219. Воспроизведено в Knuth D. E. Selected Papers on Discrete Mathematics, 511-524. 12 227 Donald E. Knuth and Hermann Zapf, "AMS Euler —A new typeface for Mathematics" Scholarly Publishing 20 (1989), 131-157. Воспроизведено в Knuth D.E. Digital Typography, 339-365. 149 228 C. Kramp, Elemens d'arithmetique universelle. Cologne, 1808. 267 229 E. E. Kummer, "fiber die hypergeometrische Reihe l.y 1.2.y(y + 1) a(a+1)(q + 2)P(P + 1)(P+2) 3 „ 1.2.3.y(y + 1)(y + 2) X +-" ' Journal fur die reine und angewandte Mathematik 15 (1836), 39-83, 127-172. Воспроизведено в его Collected Papers, volume 2, 75-166. 230 E. E. Kummer, "Uber die Erganzungssatze zu den allgemeinen Reciprocitatsgesetzen" Journal fur die reine und angewandte Mathematik 44 (1852), 93-146. Воспроизведено в его Collected Papers, volume 1, 485-538. 600 231 R. P. Kurshan and B. Gopinath, "Recursively generated periodic sequences" Canadian Journal of Mathematics 26 (1974), 1356- 1371. 370 232 Thomas Fantet de Lagny, Analyse generale ou Methodes nou- velles pour resoudre les problemes de tous les genres et de tous les degres a Vinfini. Опубликовано в volume 11 of Memoires de VAcademie Royale des Sciences, Paris, 1733.
740 Библиография 233 de la Grange (Lagrange), "Demonstration d'un theoreme nou- veau concernant les nombres premiers" Nouveaux Memoires de VAcademie royale des Sciences et Belles-Lettres, Berlin (1771), 125-137. Воспроизведено в его (Euvres, volume 3, 425-438. 234 de la Grange (Lagrange), "Sur une nouvelle espece de calcul 565 relatif a la differentiation & a l'integration des quantites variables" Nouveaux Memoires de VAcademie royale des Sciences et Belles-Lettres, Berlin (1772), 185-221. Воспроизведено в его (Euvres, volume 3, 441-476. 235 I. Lah, "Eine neue Art von Zahlen, ihre Eigenschaften und An- wendung in der Mathematischen Statistik" Mitteilungsblatt fur Mathematische Statistik 7 (1955), 203-212. (Более общая формула опубликована в L. Toscano, Commentationes 3 (Vatican City: Accademia della Scienze, 1939), 721-757, Equations 17 and 117.) 236 I. H. Lambert, "Observationes variae in Mathesin puram" Acta 253 Helvetica 3 (1758), 128-168. Воспроизведено в его Opera Mathematical volume 1, 16-51. 237 Lambert, "Observations analytiques" Nouveaux Memoires de 253 VAcademie royale des Sciences et Belles-Lettres, Berlin (1770), 225-244. Воспроизведено в его Opera Mathematica, volume 2, 270-290. 238 Edmund Landau, Handbuch der Lehre von der Verteilung der 540 Primzahlen} two volumes. Teubner, Leipzig, 1909. 239 Edmund Landau, Vorlesungen uber Zahlentheorie, three volumes. Hirzel, Leipzig, 1927. 240 P. S. de la Place (Laplace), "Memoire sur les approximations des 560 Formules qui sont fonctions de tres-grands nombres" Memoires de VAcademie royale des Sciences de Paris (1782), 1-88. Воспроизведено в его (Euvres Completes 10, 207-291. 241 Adrien-Marie Legendre, Essai sur la Theorie des Nombres. Paris, 1798; second edition, 1808. Third edition (retitled Theorie des Nombres, in two volumes), 1830; fourth edition, Blanchard, 1955. 242 D.H. Lehmer, "Tests for primality by the converse of Fermat's theorem" Bulletin of the American Mathematical Society, series 2, 33 (1927), 327-340. Воспроизведено в его Selected Papers, volume 1, 69-82. 243 D.H. Lehmer, "On Stern's diatomic series" American Mathematical Monthly 36 (1929), 59-67.
Б Библиография 741 629 244 D. Н. Lehmer, "On Euler's totient function" Bulletin of the American Mathematical Society, series 2, 38 (1932), 745-751. Воспроизведено в его Selected Papers, volume 1, 319-325. 217 245 G. W. Leibniz, letter to Johann Bernoulli (May 1695), in Leib- nizens Mathematische Schriften, volume 3, 174-179. 360 246 C. G. Lekkerkerker, "Voorstelling van natuurlijke getallen door een som van getallen van Fibonacci" Simon Stevin 29 (1952), 190-195. 215 247 Tamas Lengyel, "A combinatorial identity and the world series" SIAM Review 35 (1993), 294-297. 248 Tamas Lengyel, "On some properties of the series ^T?L0 knxk and the Stirling numbers of the second kind" Discrete Mathematics 150 (1996), 281-292. 330 249 Li Shan-Lan, Dud Л Bi Lei (Sums of Piles Obtained Inductively). В его Zeguxi Zhai Suanxue (Classically Inspired Meditations on Mathematics), Nanjing, 1867. 250 Elliott H. Lieb, "Residual entropy of square ice" Physical Review 162 (1967), 162-172. 178 251 J. Liouville, "Sur I'expression ф(п), qui marque combien la suite 1, 2, 3, ..., n contient de nombres premiers a n" Journal de Mathematiques pures et appliquees, series 2, 2 (1857), 110-112. 252 B. F. Logan, "The recovery of orthogonal polynomials from a sum of squares" SIAM Journal on Mathematical Analysis 21 (1990), 1031-1050. 253 B.F. Logan, "Polynomials related to the Stirling numbers" AT&T Bell Laboratories internal technical memorandum, August 10, 1987. 254 Calvin T. Long and Verner E. Hoggatt, Jr., "Sets of binomial coefficients with equal products" Fibonacci Quarterly 12 (1974), 71-79. 628 255 Shituo Lou and Qi Yao, "A Chebychev's type of prime number theorem in a short interval-П" Hardy-Ramanujan Journal 15 (1992), 1-33. 668 256 Sam Loyd, Cyclopedia of Puzzles. Franklin Bigelow Corporation, Morningside Press, New York, 1914. 257 E. Lucas, "Sur les rapports qui existent entre la theorie des nombres et le Calcul integral" Comptes Rendus hebdomadaires des seances de VAcademie des Sciences (Paris) 82 (1876), 1303- 1305.
742 Библиография 258 Edouard Lucas, "Sur les congruences des nombres euleriens et des coefficients differentiels des fonctions trigonometriques, suiv- ant un module premier" Bulletin de la Societe mathematique de France 6 (1877), 49-54. 259 Edouard Lucas, Theorie des Nombres, volume 1. Paris, 1891. 356 260 Edouard Lucas, Recreations mathematiques, four volumes. Ga- 17 uthier-Villars, Paris, 1891-1894. Воспроизведено Albert Blan- chard, Paris, 1960. (Ханойская башня обсуждается в томе 3, с. 55-59.) 261 R. С. Lyness, "Cycles'; The Mathematical Gazette 29 (1945), 600 231-233. 262 R.C. Lyness, "Cycles'; The Mathematical Gazette 45 (1961), 600 207-209. 263 Colin MacLaurin, Collected Letters, edited by Stella Mills. 564 Shiva Publishing, Nantwich, Cheshire, 1982. 264 P. A. MacMahon, "Application of a theory of permutations in 182 circular procession to the theory of numbers" Proceedings of the London Mathematical Society 23 (1892), 305-313. 265 J.-C. Martzloff, Histoire des Mathematiques Chinoises. Paris, 330 1988. Английский перевод: A History of Chinese Mathematics, Springer-Verlag, 1997. 266 Матиясевич Ю. В. "Диофантовость перечислимых мно- 359 жеств" Доклады АН СССР 191 (1970), 279-282. Английский перевод с комментариями автора: "Enumerable sets are dio- phantine" Soviet Mathematics — Doklady 11 (1970), 354-357. 267 Z.A. Melzak, Companion to Concrete Mathematics. Volu- 8 me 1, Mathematical Techniques and Various Applications, Wiley, 1973; volume 2, Mathematical Ideas, Modeling & Applications, Wiley, 1976. 268 N.S. Mendelsohn, "Problem E 2227: Divisors of binomial coefficients" American Mathematical Monthly 78 (1971), 201. 269 Marini Mersenni, Cogitata Physico-Mathematica. Paris, 1644. 146 270 F. Mertens, "Ueber einige asymptotische Gesetze der Zahlen- 181 theorie" Journal fur die reine und angewandte Mathematik 77 (1874), 289-338. 271 Mertens, "Ein Beitrag zur analytischen Zahlentheorie" Journal 43 fur die reine und angewandte Mathematik 78 (1874), 46-62.
Б Библиография 743 272 W. Н. Mills, "A prime representing function" Bulletin of the American Mathematical Society, series 2, 53 (1947), 604. 273 A. F. Mobius, "Uber eine besondere Art von Umkehrung der Reihen" Journal fur die reine und angewandte Mathematik 9 (1832), 105-123. Воспроизведено в его Gesammelte Werke, volume 4, 589-612. 274 A. Moessner, "Eine Bemerkung uber die Potenzen der naturlichen Zahlen" Sitzungsberichte der Mathematisch Naturwis- senschaftlichen Klasse der Bayerischen Akademie der Wis- senschaften, 1951, Heft 3, 29. 275 Hugh L Montgomery, "Fluctuations in the mean of Euler's phi function" Proceedings of the Indian Academy of Sciences, Mathematical Sciences, 97 (1987), 239-245. 276 Peter L. Montgomery, "Problem E2686: LCM of binomial coefficients" American Mathematical Monthly 86 (1979), 131. 277 Leo Moser, "Problem B-6: Some reflections" Fibonacci Quarterly 1,4 (1963), 75-76. 278 T. S. Motzkin and E. G. Straus, "Some combinatorial extremum problems" Proceedings of the American Mathematical Society 7 (1956), 1014-1021. 279 B. R. Myers, "Problem 5795: The spanning trees of an n-wheel" American Mathematical Monthly 79 (1972), 914-915. 280 Isaac Newton, letter to John Collins (18 February 1670), в The Correspondence of Isaac Newton, volume 1, 27. Отрывки помещены в The Mathematical Papers of Isaac Newton, volume 3, 563. 281 Ivan Niven, Diophantine Approximations. Interscience, 1963. 282 Ivan Niven, "Formal power series" American Mathematical Monthly 76 (1969), 871-889. 283 Andrew M. Odlyzko and Herbert S. Wilf, "Functional iteration and the Josephus problem" Glasgow Mathematical Journal 33 (1991), 235-240. 284 Blaise Pascal, "De numeris multiplicibus" представлено в Парижской академии в 1654 году и опубликовано вместе с его Traite du triangle arithmetique [285]. Воспроизведено в (Euvres de Blaise Pascal, volume 3, 314-339. 285 Blaise Pascal, "Traite du triangle arithmetique" в его Traite du Triangle Arithmetique, avec quelques autres petits traitez sur la mesme matiere, Paris, 1665. Воспроизведено в (Euvres de 557 355 672 339 403 112 201, 202, 743 181
744 Библиография Blaise Pascal (Hachette, 1904-1914), volume 3, 445-503; латинские издания от 1654году в volume 11, 366-390. 286 G. P. Patil, "On the evaluation of the negative binomial distribution with examples" Technometrics 2 (1960), 501-505. 287 C.S. Peirce, letter to E.S. Holden (January 1901). In The New Elements of Mathematics, edited by Carolyn Eisele, Mouton, The Hague, 1976, volume 1, 247-253. (См. также с. 211.) 288 С. S. Peirce, letter to Henry B. Fine (17 July 1903). In The New 628 Elements of Mathematics, edited by Carolyn Eisele, Mouton, The Hague, 1976, volume 3, 781-784. (См. также "Ordinals" an unpublished manuscript from circa 1905, в Collected Papers of Charles Sanders Peirce, volume 4, 268-280.) 289 Walter Penney, "Problem 95: Penney-Ante" Journal of Recre- 492 ational Mathematics 7 (1974), 321. 290 J.K. Percus, Combinatorial Methods. Springer-Verlag, 1971. 291 Marko Petkovsek, "Hypergeometric solutions of linear recur- 286, rences with polynomial coefficients" Journal of Symbolic Computation 14 (1992), 243-264. 292 J.F. Pfaff, "Observationes analyticae ad L. Euleri institu- 260, tiones calculi integralis, Vol. IV, Supplem. II & IV" Nova acta academic scientiarum imperialis Petropolitame 11, Histoire section, 37-57. (В этом томе, опубликованном в 1798 году, большинство работ относятся к 1793 году, хотя статья Пфаффа на самом деле написана в 1797году.) 293 L. Pochhammer, "Ueber hypergeometrische Functionen nter 72 Ordnung" Journal fur die reine und angewandte Mathematik 71 (1870), 316-352. 294 H. Poincare, "Sur les fonctions a espaces lacunaires" American Journal of Mathematics 14 (1892), 201-221. 295 S.D. Poisson, "Memoire sur le calcul numerique des integrates 566 definies" Memoires de Г Academic Royale des Sciences de lTnsti- tut de France, series 2, 6 (1823), 571-602. 296 G. Polya, "Kombinatorische Anzahlbestimmungen fur Gruppen, Graphen und chemische Verbindungen" Acta Mathematica 68 (1937), 145-254. Английский перевод с комментариями Рональда Рида (Ronald С. Read): Combinatorial Enumeration of Groups, Graphs, and Chemical Compounds, Springer-Verlag, 1987. 685 269, 272
Б Библиография 745 297 George Polya, Induction and Analogy in Mathematics. Princeton University Press, 1954. (Имеются два издания на русском языке: Пойа Д. Математика и правдоподобные рассуждения.— М.: ИЛ, 1957; М.: Наука, 1975.) 298 G. Polya, "On picture-writing" American Mathematical Monthly 63 (1956), 689-697. 299 G. Polya and G. Szego, Aufgaben und Lehrsatze aus der Analysis, two volumes. Julius Springer, Berlin, 1925; fourth edition, 1970 and 1971. Английский перевод: Problems and Theorems in Analysis, 1972 and 1976. (Имеется несколько изданий на русском языке: Полна Г., Сеге Г. Задачи и теоремы из анализа, в 2-х томах.— М.: Наука, 1937-1938; 1956; 1978.) 300 R. Rado, "A note on the BernouUian numbers" Journal of the London Mathematical Society 9 (1934), 88-90. 301 Earl D. Rainville, "The contiguous function relations for pFq with applications to Bateman's J?,v and Rice's Нп(С,р^)" Bulletin of the American Mathematical Society, series 2, 51 (1945), 714-723. 302 George N. Raney, "Functional composition patterns and power series reversion" Transactions of the American Mathematical Society 94 (1960), 441-451. 303 D. Rameswar Rao, "Problem E2208: A divisibility problem" American Mathematical Monthly 78 (1971), 78-79. 304 John William Strutt, Third Baron Rayleigh, The Theory of Sound. First edition, 1877; second edition, 1894. (Цитируемый материал относительно иррационального спектра взят из разд. 92а второго издания.) (Имеется русский перевод: Стретт Дж.В. (лорд Релей). Теория звука, в 2-х томах.— М.: Гостехиздат, 1955.) 305 Robert Recorde, The Whetstone of Witte. London, 1557. 306 Simeon Reich, "Problem 6056: Truncated exponential-type series" American Mathematical Monthly 84 (1977), 494-495. 307 Georges de Rham, "Un peu de mathematiques a propos d'une courbe plane',' Elemente der Mathematik 2 (1947), 73-76, 89-97. Воспроизведено в его (Euvres Mathematiques, 678-689. 308 Paulo Ribenboim, 13 Lectures on Fermat's Last Theorem. Springer-Verlag, 1979. 9, 35, 608 398 632 434 107 537 662
746 Библиография 309 Bernhard Riemann, "Ueber die Darstellbarkeit einer Function durch eine trigonometrische Reihe" Habilitationsschrift, Gottingen, 1854. Опубликовано в Abhandlungen der Mathe- matischen Classe der Koniglichen Gesellschaft der Wissenschaf- ten zu Gottingen 13 (1868), 87-132. Воспроизведено в его Gesammelte Mathematische Werke, 227-264. (Имеются русские переводы: Бернштейн С.Н. (ред.) Разложете функцш в тригонометричесте ряды.— Харьковъ: Харьковское математическое общество, 1914, 25-90; Риман Б. Сочинения.— М.-Л.: ГИТТЛ, 1948, 225-261.) 310 Samuel Roberts, "On the figures formed by the intercepts of a system of straight lines in a plane, and on analogous relations in space of three dimensions" Proceedings of the London Mathematical Society 19 (1889), 405-422. 311 0ystein R0dseth, "Problem E2273: Telescoping Vandermonde convolutions" American Mathematical Monthly 79 (1972), 88- 89. 312 J. Barkley Rosser and Lowell Schoenfeld, "Approximate for- 148 mulas for some functions of prime numbers',' Illinois Journal of Mathematics 6 (1962), 64-94. 313 Gian-Carlo Rota, "On the foundations of combinatorial the- 617 ory. I. Theory of Mobius functions" Zeitschrift fur Wahrschein- lichkeitstheorie und verwandte Gebiete 2 (1964), 340-368. 314 Ranjan Roy, "Binomial identities and hyper geometric series" American Mathematical Monthly 94 (1987), 36-46. 315 Louis Saalschutz, "Eine Summationsformel" Zeitschrift fur Ma- 269 thematik und Physik 35 (1890), 186-188. 316 Салтыков А. И. "О функции Эйлера'.' Вестник Московского 557 государственного университета, серия 1, Математика, механика (1960), №6, 34-50. 317 A. Sarkozy, "On divisors of binomial coefficients, I" Journal of 655 Number Theory 20 (1985), 70-80. 318 W.W. Sawyer, Prelude to Mathematics. Baltimore, Penguin, 260 1955. (Имеются два издания на русском языке: Сойер У. У. Прелюдия к математике.— М.: Просвещение, 1965; 1972.) 319 О. Schlomilch, "Ein geometrisches Paradoxon" Zeitschrift fur 357 Mathematik und Physik 13 (1868), 162. 320 Ernst Schroder, "Vier combinatorische Probleme" Zeitschrift fur Mathematik und Physik 15 (1870), 361-376.
Б Библиография 747 321 Heinrich Schroter, "Ableitung der Partialbruch- und Produkt- Entwickelungen fur die trigonometrischen Funktionen" Zeitsch- rift fur Mathematik und Physik 13 (1868), 254-259. 322 R.S. Scorer, P.M. Grundy, and C.A.B. Smith, "Some binary games'; The Mathematical Gazette 28 (1944), 96-103. 323 J. Sedlacek, "On the skeletons of a graph or digraph" in Combinatorial Structures and their Applications, Gordon and Breach, 1970, 387-391. (В этом томе представлены труды конференции Calgary International Conference on Combinatorial Structures and their Applications, 1969.) 324 J. O. Shallit, "Problem 6450: Two series',' American Mathematical Monthly 92 (1985), 513-514. 325 R. T. Sharp, "Problem 52: Overhanging dominoes',' Pi Mu Ep- silon Journal 1,10 (1954), 411-412. 326 W. Sierpinski, "Sur la valeur asymptotique d'une certaine somme" Bulletin International de VAcademie Polonaise des Sciences et des Lettres (Cracovie), series A (1910), 9-11. 327 W. Sierpinski, "Sur les nombres dont la somme de diviseurs est une puissance du nombre 2" Calcutta Mathematical Society Golden Jubilee Commemorative volume (1958-1959), part 1, 7-9. 328 Waclaw Sierpinski, A Selection of Problems in the Theory of Numbers. Macmillan, 1964. 329 David L. Silverman, "Problematical Recreations 447: Numerical links" Aviation Week & Space Technology 89,10 (1 September 1968), 71. Воспроизведено как Problem 147 в Second Book of Mathematical Bafflers, edited by Angela Fox Dunn, Dover, 1983. 330 N.J. A. Sloane, A Handbook of Integer Sequences. Academic Press, 1973. Sequel, with Simon PloufTe, The Encyclopedia of Integer Sequences, Academic Press, 1995. http: //www. research. att.com/~njas/sequences. 331 Соловьев А. Д. "Одно комбинаторное тождество и его применение к задаче о первом наступлении редкого события" Теория вероятностей и ее применения, 11 (1966), 313-320. Английский перевод: "A combinatorial identity and its application to the problem concerning the first occurrence of a rare event" Theory of Probability and Its Applications 11 (1966), 276-282. 332 William G. Spohn, Jr., "Can Mathematics be saved?" Notices of the American Mathematical Society 16 (1969), 890-894. 334 65, 414, 558 492 7
748 Библиография 333 Richard P. Stanley, "Differentiably finite power series" European Journal of Combinatorics 1 (1980), 175-188. 334 Richard P. Stanley, "On dimer coverings of rectangles of fixed width" Discrete Applied Mathematics 12 (1985), 81-87. 335 Richard P. Stanley, Enumerative Combinatorics, volume 1. 638 Wadsworth & Brooks/Cole, 1986. (Имеется русский перевод: Стенли Р. Перечислительная комбинаторика.— М.: Мир, 1990.) 336 К. G. С. von Staudt, "Beweis eines Lehrsatzes, die Bernoullis- chen Zahlen betreffend" Journal fur die reine und angewandte Mathematik 21 (1840), 372-374. 337 Guy L. Steele Jr., Donald R. Woods, Raphael A. Finkel, Mark R. 164 Crispin, Richard M. Stallman, and Geoffrey S. Goodfellow, The Hacker's Dictionary: A Guide to the World of Computer Wizards. Harper & Row, 1983. 338 J. Steiner, "Einige Gesetze iiber die Theilung der Ebene und 22 des Raumes" Journal fur die reine und angewandte Mathematik 1 (1826), 349-364. Воспроизведено в его Gesammelte Werke, volume 1, 77-94. 339 M. A. Stern, "Ueber eine zahlentheoretische Funktion" Journal 155 fur die reine und angewandte Mathematik 55 (1858), 193-220. 340 L. Stickelberger, "Ueber eine Verallgemeinerung der Kreis- theilung" Mathematische Annalen 37 (1890), 321-367. 341 T. J. Stieltjes, letters to Hermite (June 1885), in Correspondance 715 d'Hermite et de Stieltjes, volume 1, 146-159. 342 T.J. Stieltjes, "Table des valeurs des sommes Sjc = YLT n_k" Acta Mathematica 10 (1887), 299-302. Воспроизведено в его (Euvres Completes, volume 2, 100-103. 343 James Stirling, Methodus Differentialis. London, 1730. Ah- 244, 318, 362 глийский перевод: The Differential Method, 1749. 344 Volker Strehl, "Binomial identities — combinatorial and algo- 655 rithmic aspects" Discrete Mathematics 136 (1994), 309-346. 345 Dura W. Sweeney, "On the computation of Euler's constant" 577 Mathematics of Computation 17 (1963), 170-178. 346 J.J. Sylvester, "Problem 6919" Mathematical Questions with their Solutions from the 'Educational Times' 37 (1882), 42-43, 80.
Б Библиография 749 347 J.J. Sylvester, "On the number of fractions contained in any 'Farey series' of which the limiting number is given" The London, Edinburgh and Dublin Philosophical Magazine and Journal of Science, series 5, 15 (1883), 251-257. Воспроизведено в его Collected Mathematical Papers, volume 4, 101-109. 348 M. Szegedy, "The solution of Graham's greatest common divisor problem',' Combinatorica 6 (1986), 67-71. 349 S. Tanny, "A probabilistic interpretation of Eulerian numbers" Duke Mathematical Journal 40 (1973), 717-722. 350 L. Theisinger, "Bemerkung uber die harmonische Reihe" Monat- shefte fur Mathematik und Physik 26 (1915), 132-134. 351 T. N. Thiele, The Theory of Observations. Charles & Edwin Lay ton, London, 1903. Воспроизведено в The Annals of Mathematical Statistics 2 (1931), 165-308. 352 E. C. Titchmarsh, The Theory of the Riemann Zeta-Function. Clarendon Press, Oxford, 1951; second edition, revised by D. R. Heath-Brown, 1986. (Имеется русский перевод: Титчмарш Е. К. Теория дзета-функции Римана.— М.: ИА, 1953.) 353 F. G. Tricomi and A. Erdelyi, "The asymptotic expansion of a ratio of gamma functions" Pacific Journal of Mathematics 1 (1951), 133-142. 354 Peter Ungar, "Problem E3052: A sum involving Stirling numbers" American Mathematical Monthly 94 (1987), 185-186. 355 J. V. Uspensky, "On a problem arising out of the theory of a certain game" American Mathematical Monthly 34 (1927), 516- 521. 356 Alfred van der Poorten, "A proof that Euler missed ... Apery's proof of the irrationality of C(3), an informal report" The Mathematical Intelligencer 1 (1979), 195-203. 357 A. Vandermonde, "Memoire sur des irrationnelles de differens ordres avec une application au cercle" Memoires de Mathemati- que et de Physique, tires des registres de VAcademie Royale des Sciences (1772), part 1, 489-498. 358 Han Vardi, "The error term in Golomb's sequence" Journal of Number Theory 40 (1992), 1-11. 359 J. Venn, "On the diagrammatic and mechanical representation of propositions and reasonings" The London, Edinburgh and Dublin Philosophical Magazine and Journal of Science, series 5, 9 (1880), 1-18. 628 480, 481 343 296 218 596
750 Библиография 360 John Wallis, A Treatise of Angular Sections. Oxford, 1684. 361 Edward Waring, Meditationes Algebraicae. Cambridge, 1770; third edition, 1782. 362 William С Waterhouse, "Problem E3117: Even odder than we thought',' American Mathematical Monthly 94 (1987), 691-692. 363 Frederick V. Waugh and Margaret W. Maxfield, "Side-and- diagonal numbers" Mathematics Magazine 40 (1967), 74-83. 364 Warren Weaver, "Lewis Carroll and a geometrical paradox" 357 American Mathematical Monthly 45 (1938), 234-236. 365 H. Weber, "Leopold Kronecker" Jahresbericht der Deutschen 624 Mathematiker-Vereinigung 2 (1892), 5-31. Воспроизведено в Mathematische Annalen 43 (1893), 1-25. 366 Louis Weisner, "Abstract theory of inversion of finite series" 617 Transactions of the American Mathematical Society 38 (1935), 474-484. 367 Edgar M.E. Wermuth, "Die erste Fourierreihe" Mathematische 717 Semesterberichte 40 (1993), 133-145. 368 Hermann Weyl, "Uber die Gibbs'sche Erscheinung und ver- 119 wandte Konvergenzphanomene" Rendiconti del Circolo Mate- matico di Palermo 30 (1910), 377-407. 369 F. J. W. Whipple, "Some transformations of generalized hyper- geometric series" Proceedings of the London Mathematical Society, series 2, 26 (1927), 257-272. 370 Alfred North Whitehead, An Introduction to Mathematics. 602 London and New York, 1911. 371 Alfred North Whitehead, "Technical education and its relation 123 to science and literature" chapter 2 in The Organization of Thought, Educational and Scientific, London and New York, 1917* Воспроизведено как глава 4 в The Aims of Education and Other Essays, New York, 1929. (Имеется русский перевод: Уайтхэдъ А. Н. Введение въ математику.— Петроград: Физика, 1916.) 372 Alfred North Whitehead, Science and the Modern World. New 718 York, 1925. Глава 2 воспроизведена в The World of Mathematics, edited by James R. Newman, 1956, volume 1, 402-416. 373 Herbert S. Wilf, generatingfunctionology Academic Press, 685 1990; second edition, 1994.
Б Библиография 751 374 Herbert S. Wilf and Doron Zeilberger, "An algorithmic proof theory for hyper geometric (ordinary and (q') multisum/integral identities" Inventiones Mathematicae 108 (1992), 575-633. 375 H.C. Williams and Harvey Dubner, "The primality of R1031',' Mathematics of Computation 47 (1986), 703-711. 376 J. Wolstenholme, "On certain properties of prime numbers" Quarterly Journal of Pure and Applied Mathematics 5 (1862), 35-39. 377 Derick Wood, "The Towers of Brahma and Hanoi revisited" Journal of Recreational Mathematics 14 (1981), 17-24. 378 J. Worpitzky, "Studien iiber die Вernoulhschen und Eulerschen Zahlen" Journal fur die reine und angewandte Mathematik 94 (1883), 203-232. 379 E.M. Wright, "A prime-representing function" American Mathematical Monthly 58 (1951), 616-618; errata in 59 (1952), 99. collected works, entitled Hermann Zapf Sz His Design 380 Derek A. Zave, "A series expansion involving the harmonic numbers" Information Processing Letters 5 (1976), 75-77. 381 E. Zeckendorf, "Representation des nombres naturels par une somme de nombres de Fibonacci ou de nombres de Lucas" Bulletin de la Societe Royale des Sciences de Liege 41 (1972), 179- 182. 382 Doron Zeilberger, "Sister CelineJs technique and its generalizations" Journal of Mathematical Analysis and Applications 85 (1982), 114-145. См. также Sister Mary Celine Fasenmyer, "A note on pure recurrence relations" American Mathematical Monthly 56 (1949), 14-17. 383 Doron Zeilberger, "A holonomic systems approach to special functions identities" Journal of Computational and Applied Mathematics 32 (1990), 321-368. 384 Doron Zeilberger, "The method of creative telescoping" Journal of Symbolic Computation 11 (1991), 195-204. 298, 300 330 360 286 673 286
в Первоисточники упражнений УПРАЖНЕНИЯ для этой книги собирались из множества источников. Авторы старались проследить происхождение всех задач, которые были опубликованы ранее, за исключением случаев, когда упражнение настолько элементарное, что его автор, вероятно, и не думал о том, чтобы что-то изобрести. Многие упражнения взяты из станфордских экзаменационных задач по курсу конкретной математики. Зачастую новые задачи для этих экзаменов предлагались самими преподавателями и ассистентами. Вот, кстати, отличный повод перечислить их имена. Практические занятия были очень ценными, можно сказать бесценными Оставьте на следующий год того же преподавателя и тех же ассистентов. Конспекты очень полезны. Я никогда не "получал" числа Стирлинга. Год 1970 1971 1973 1974 1975 Преподаватель Дон Кнут (Don Knuth) Дон Кнут (Don Knuth) Дон Кнут (Don Knuth) Дон Кнут (Don Knuth) Дон Кнут (Don Knuth) 1976 Энди Яо (Andy Yao) 1977 Энди Яо (Andy Yao) 1978 Френсис Яо (Prances Yao) 1979 Рон Грэхэм (Ron Graham) 1980 Энди Яо (Andy Yao) Ассистент (ы) Воган Пратт (Vaughan Pratt) Лео Гуибас (Leo Guibas) Хенсон Грейвс (Henson Graves), Ауи Жуайек (Louis Jouaillec) Скот Драйсдел (Scot Drysdale), Том Портер (Tom Porter) Марк Браун (Mark Brown), Луи Трабб Пар до (Luis Trabb Pardo) Марк Браун (Mark Brown), Лайл Рэмшоу (Lyle Ramshaw) Иосси Шилоч (Yossi Shiloach) Иосси Шилоч (Yossi Shiloach) Френк Лианг (Frank Liang), Крис Тонг (Chris Tong), Марк Хайман (Mark Haiman) Андрей Бродер (Andrei Broder), Джим Мак-Грат (Jim McGrath)
Первоисточники упражнений Рон Грэхэм Орен Паташник (Oren Patashnik) (Ron Graham) Эрнст Мейр Джоан Фейгенбаум (Ernst Mayr) (Joan Feigenbaum), Дэйв Хелмболд (Dave Helmbold) Эрнст Мейр Анна Карлин (Anna Karlin) (Ernst Mayr) Дон Кнут (Don Knuth) Орен Паташник (Oren Patashnik), Алекс Шаффер (Alex Schaffer) Андрей Бродер Панг Чен (Pang Chen), Стефан (Andrei Broder) Шаркански (Stefan Sharkansky) Дон Кнут (Don Knuth) Ариф Мерчант (Arif Merchant), Стефан Шаркански (Stefan Sharkansky) Кроме того, свой вклад в данный курс внесли Дэвид Кларнер (David Klarner) (1971), Боб Седжевик (Bob Sedgewick) (1974), Лео Гуибас (Leo Guibas) (1975) и Лайл Рамшоу (Lyle Ramshaw) (1979), каждый из которых принял приглашение прочесть шесть или более лекций. Подробные записи лекций, которые каждый год составлялись ассистентами и редактировались преподавателями, послужили основой этой книги. 754 1981 1982 1983 1984 1985 1986
Первоисточники упражнений 755 1.1 Пойа (Polya) [297, с. 120]. 1.2 Скорер (Scorer), Гранди (Grundy) и Смит (Smith) [322]. 1.5 Венн (Venn) [359]. 1.6 Штайнер (Steiner) [338]; Роберте (Roberts) [310]. 1.8 Гаусс (Gauss) [144]. 1.9 Коши (Cauchy) [53, пример 2, теорема 17]. 1.10 Аткинсон (Atkinson) [15]. 1.11 Предложена Вудом (Wood) [377]. 1.14 Штайнер (Steiner) [338]; Пойа (Polya) [297, глава 3]; Брат Альфред (Alfred) [42]. 1.17 Дьюдени (Dudeney) [87, головоломка 1]. 1.21 Болл (Ball) [20] приписывет задачу Свиндену (В. A. Swinden). 1.22 Основана на идее Питера Шора (Peter Shor).* 1.23 Бьёрн Поонен (Bjorn Poonen).* 1.25 Фрейм (Frame), Стюарт (Stewart) и Данкель (Dunkel) [130]. 2.2 Айверсон (Iverson) [191, с. 11]. 2.3 [207, упр. 1.2.3-2]. 2.4 [207, упр. 1.2.3-25]. 2.22 Вине (Binet) [30, §4]. 2.23 Выпускной экзамен 1982 г. 2.26 [207, упр. 1.2.3-26]. 2.29 Коллоквиум 1979 г. 2.30 Коллоквиум 1973 г. 2.31 Стилтьес (Stieltjes) [342]. 2.34 Риман (Riemann) [309, §3]. 2.35 Эйлер (Euler) [106] привел ошибочное "доказательство" с использованием расходящихся рядов. 2.36 Голомб (Golomb) [150]; Варди (Vardi) [358]. 2.37 Лео Мозер (Leo Moser).* 3.6 Эрнст Мэйр (Ernst Mayr), домашняя работа, 1982. 3.8 Дирихле (Dirichlet) [80]. 3.9 Чейс (Chace) [54]; Фибоначчи (Fibonacci) [122, с. 77-83]. 3.12 [207, упр. 1.2.4-48(а)]. 3.13 Витти (Beatty) [22]; Наивен (Niven) [281, теорема 3.7]. 3.19 [207, упр. 1.2.4-34]. 3.21 Коллоквиум 1975 г. 3.23 [207, упр. 1.2.4-41]. 3.28 Браун (Brown) [45]. 3.30 Ахо (Aho) и Слоан (Sloane) [4]. 3.31 Грайцер (Greitzer) [165, задача 1972/3, решение 2]. 3.32 [160]. 3.33 Коллоквиум 1984 г. 3.34 Коллоквиум 1970 г. 3.35 Коллоквиум 1975 г. 3.36 Коллоквиум 1976 г. 3.37 Коллоквиум 1986г. [215]. 3.38 Коллоквиум 1974 г. 3.39 Коллоквиум 1971г. 3.40 Коллоквиум 1980 г. 3.41 Кламкин (Klamkin) [203, задача 1978/3]. 3.42 Успенский (Uspensky) [355]. 3.45 Ахо (Aho) и Слоан (Sloane) [4]. 3.46 Грэхем (Graham) и Поллак (Pollak) [162]. 3.48 Халанд (Haland) и Кнут (Knuth) [170]. 3.49 Р. Л. Грэхем (R. L. Graham) и Д. Р. Хофштадтер (D. R. Hof- stadter).* 3.52 Френкель (Praenkel) [128]. 3.53 Ш. К. Штайн (S. К. Stein).* 4.4 [214, §526]. 4.16 Сильвестр (Sylvester) [346]. 4.19 [212, с. 148-149]. 4.20 Бертран (Bertrand) [27, с. 129]; Чебышев [56]; Райт (Wright) [379]. 4.22 Брилларт (Brillhart) [39]; Вильяме (Williams) и Дюб- нер (Dubner) [375]; Дюбнер (Dubner) [86].
756 Первоисточники упражнений 4.23 Кроу (Crowe) [68]. 4.24 Лежандр (Legendre) [241, 2-е изд., введение]. 4.26 [208, упр. 4.5.3-43]. 4.31 Паскаль (Pascal) [284]. 4.36 Харди (Hardy) и Райт (Wright) [181, §14.5]. 4.37 Ахо (Aho) и Слоан (Sloane) [4]. 4.38 Люка (Lucas) [257]. 4.39 [159]. 4.40 Стикельбергер (Stickelberger) [340]. 4.41 Лежандр (Legendre) [241, §135]; Харди (Hardy) и Райт (Wright) [181, теорема 82]. 4.42 [208, упр. 4.5.1-6]. 4.44 [208, упр. 4.5.3-39]. 4.45 [208, упр. 4.3.2-13]. 4.47 Лемер (Lehmer) [242]. 4.48 Гаусс (Gauss) [142, §78]; Крелль (Crelle) [67]. 4.52 Коллоквиум 1974 г. 4.53 Коллоквиум 1973г., идея Рао (Rao) [303]. 4.54 Коллоквиум 1974 г. 4.56 Логан (Logan) [252, формула (6.15)]. 4.57 Частный случай представлен в [216]. 4.58 Серпиньски (Sierpinski) [327]. 4.59 Кёртис (Curtiss) [70]; Эрдёгп (Erdos) [93]. 4.60 Миллз (Mills) [272]. 4.61 [207, упр. 1.3.2-19]. 4.63 Барлоу (Barlow) [21]; Абель (Abel) [1]. 4.64 Пирс (Peirce) [287]. 4.66 Рибенбойм (Ribenboim) [308]; Серпиньски (Sierpinski) [328, задача Р^0]. 4.67 [157]. 4.69 Крамер (Cramer) [66]. 4.70 Поль Эрдеш (Paul Erdos).* 4.71 [95, с. 96]. 4.72 [95, с. 103]. 4.73 Ландау (Landau) [239, том 2, формула 648]. 5.1 Форкадель (Forcadel) [126]. 5.3 Лонг (Long) и Хоггатт (Hog- gatt) [254]. 5.5 Курсовой выпускной экзамен 1983 г. 5.13 Коллоквиум 1975 г. 5.14 [207, упр. 1.2.6-20]. 5.15 Диксон (Dixon) [81]. 5.21 Эйлер (Euler) [99]. 5.25 Гаусс [143, §7]. 5.28 Эйлер [118]. 5.29 Куммер (Kummer) [229, формула 26.4]. 5.31 Госпер (Gosper) [154]. 5.34 Бейли (Bailey) [18, §10.4]. 5.36 Куммер (Kummer) [230, р. 116]. 5.37 Вандермонд (Vandermonde) [357]. 5.38 [207, упр. 1.2.6-56]. 5.40 Редеет (R0dseth) [311]. 5.43 Пфафф (Pfaff) [292]; [207, упр. 1.2.6-31]. 5.48 Раньян Рой (Ranjan Roy).* 5.49 Рой (Roy) [314, формула 3.13]. 5.53 Гаусс (Gauss) [143]; Ричард Аски (Richard Askey).* 5.58 Фрейзер (Prazer) и Мак-Келлар (McKellar) [133]. 5.59 Станфордский общеобразовательный экзамен по информатике (зимний семестр 1987г.) 5.60 [207, упр. 1.2.6-41]. 5.61 Люка (Lucas) [258]. 5.62 Коллоквиум 1971г. 5.63 Коллоквиум 1974 г. 5.64 Коллоквиум 1980 г. 5.65 Коллоквиум 1983 г. 5.66 Коллоквиум 1984 г. 5.67 Коллоквиум 1976 г. 5.68 Коллоквиум 1985 г.
Первоисточники упражнений 757 5.69 Лайл Рэмшоу (Lyle Ramshaw), лекция по приглашению в 1986 г. 5.70 Эндрюс (Andrews) [9, теорема 5.4]. 5.71 Вильф (Wilf) [373, упр. 4.16]. 5.72 Эрмит (Hermite) [185]. 5.74 Коллоквиум 1979 г. 5.75 Коллоквиум 1971г. 5.76 [207, упр. 1.2.6-59 (исправленное)]. 5.77 Коллоквиум 1986 г. 5.78 [210]. 5.79 Мендельсон (Mendelsohn) [268]; Монтгомери (Montgomery) [276]. 5.81 Выпускной экзамен 1986г. [219]. 5.82 Хиллман (Hillman) и Хоггатт (Hoggatt) [188]. 5.85 Су (Hsu) [190]. 5.86 Гуд (Good) [153]. 5.88 Эрмит (Hermite) [186]. 5.91 Уиппл (Whipple) [369]. 5.92 Клаузен (Clausen) [60,61]. 5.93 Госпер (Gosper) [154]. 5.95 Петковшек (Petkovsek) [291, следствие 3.1]. 5.96 Петковшек (Petkovsek) [291, следствие 5.1]. 5.98 Ира Гессель (Ira Gessel).* 5.102 Г. С. Вильф (H.S.Wili).* 5.104 Фолкер Штрел (Volker Strehl).* 5.105 Хенричи (Henrici) [183, стр. 118]. 5.108 Апери (Apery) [14]. 5.109 Гессель (Gessel) [146]. 5.110 Р. У. Госпер, мл. (R.William Gosper, Jr.)* 5.111 [95, с. 71]. 5.112 [95, с. 71]. 5.113 Вильф (Wilf) и Зайльбергер (Zeilberger) [374]. 5.114 Штрел (Strehl) [344] указывает А.Шмидта (A. Schmidt). 6.6 Фибоначчи (Fibonacci) [122, стр. 283]. 6.15 [209, упр. 5.1.3-2]. 6.21 Тейзингер (Theisinger) [350]. 6.25 Гарднер (Gardner) [138] приписывает авторство Денису Уилкину (Denys Wilquin). 6.27 Люка (Lucas) [257]. 6.28 Люка (Lucas) [259, глава 18]. 6.31 Лах (Lah) [235]; Р. У. Флойд (R.W.Floyd).* 6.35 Коллоквиум 1977 г. 6.37 Шаллит (Shallit) [324]. 6.39 [207, упр. 1.2.7-15]. 6.40 Кламкин (Klamkin) [203, задача 1979/1]. 6.41 Коллоквиум 1973 г. 6.43 Брук (Brooke) и Уолл (Wall) [41]. 6.44 Матиясевич [266]. 6.46 Франческа Francesca, Piero della (Francesca) [131]; Уоллис (Wallis) [360, глава 4]. 6.47 Люка (Lucas) [257]. 6.48 [208, упр. 4.5.3-9(с)]. 6.49 Дэйвисон (Davison) [73]. 6.50 Коллоквиум 1985г.; Рам (Rham) [307]; Дейкстра (Dijkstra) [79, с. 230-232]. 6.51 Уоринг (Waring) [361]; Ла- гранж (Lagrange) [233]; Воль- штенхольм (Wolstenholme) [376]. 6.52 Эсваратасан и Левайн (Levine) [97]. 6.53 Кауцки (Kaucky) [200] рассматривает частный случай. 6.54 Штаудт (Staudt) [336]; Клаузен (Clausen) [62]; Радо (Rado) [300]. 6.55 Эндрюс (Andrews) и Учимура (Uchimura) [13].
758 Первоисточники упражнений 6.56 Коллоквиум 1986 г. 6.57 Коллоквиум 1984 г., предложено Р. У. Флойдом (R.W.Floyd).* 6.58 [207, упр. 1.2.8-30]; коллоквиум 1982 г. 6.59 Барр (Burr) [47]. 6.61 Выпускной экзамен 1976 г. 6.62 Д. Боруэн (Borwein, J.) и П.Боруэн (P. Borwein) [36, §3.7]. 6.63 [207, раздел 1.2.10]; Стенли (Stanley) [335, предложение 1.3.12]. 6.65 Танни (Таппу) [349]. 6.66 [209, упр. 5.1.3-3]. 6.67 Чанг (Chung) и Грэхем (Graham) [59]. 6.68 Логан (Logan) [253]. 6.69 [209, упр. 6.1-13]. 6.72 Эйлер (Euler) [ПО, часть 2, глава 8]. 6.73 Эйлер (Euler) [108, главы 9 и 10]; Шрётер (Schroter) [321]. 6.75 Аткинсон (Atkinson) [16]. 6.76 [209, ответ 5.1.3-3]; Ленжиель (Lengyel) [248]. 6.78 Логан (Logan) [253]. 6.79 Boston Herald, 21 августа 1904 г., раздел юмора 6.80 Сильверман (Silverman) и Данн (Dunn) [329]. 6.82 [217]. 6.83 [156], по модулю ошибки вычисления. 6.85 Барр (Burr) [47]. 6.86 [226]. 6.87 [208, упр. 4.5.3-2 и 3]. 6.88 Адаме (Adams) и Дэйвисон (Davison) [3]. 6.90 Лемер (Lehmer) [243]. 6.92 Часть (а) из работы Эсварата- сана (Eswarathasan) и Левайна (Levine) [97]. 7.2 [207, упр. 1.2.9-1]. 7.8 Зейв (Zave) [380]. 7.9 [207, упр. 1.2.7-22]. 7.11 Выпускной экз амен 1971г. 7.12 [209, с. 63-64]. 7.13 Рени (Raney) [302]. 7.15 Белл (Bell) [24]. 7.16 Пойа (РоГуа) [296, с. 149; 207, упр. 2.3.4.4-1]. 7.19 [221]. 7.20 Юнген (Jungen) [198, с. 299] указывает в качестве автора А.Гурвица (A. Hurwitz). 7.22 Пойа (РбГуа) [298]. 7.23 Домашняя работа 1983 г. 7.24 Майерс (Myers) [279]; Седлачек (Sedlacek) [323]. 7.25 [208, доказательство Карлитца (Carlitz) леммы 3.3.3В]. 7.26 [207, упр. 1.2.8-12]. 7.32 [95, с. 25-26] указывает в качестве авторов Мирского (L. Mirsky) и Ньюмена (М. Newman). 7.33 Выпускной экзамен 1971 г. 7.34 Томас Федер (Tomas Feder).* 7.36 Выпускной экзамен 1974 г. 7.37 Эйлер (Euler) [109, §50]; выпускной экзамен 1971 г. 7.38 Карлитц (Carlitz) [49]. 7.39 [207, упр. 1.2.9-18]. 7.41 Андрэ (Andre) [8]; [209, упр. 5.1.4-22]. 7.42 Выпускной экзамен 1974 г. 7.44 Гросс (Gross) [166]; [209, упр. 5.3.1-3]. 7.45 деБрейн (de Bruijn) [75]. 7.47 Во (Waugh) и Максфилд (Maxfield) [363]. 7.48 Выпускной экзамен 1984 г. 7.49 Ватерхаус (Waterhouse) [362]. 7.50 Шредер (Schroder) [320; 207, упр. 2.3.4.4-31].
Первоисточники упражнений 759 7.51 Фишер (Fisher) [124]; Пер- кус (Percus) [290, с. 89-123]; Стенли (Stanley) [334]. 7.52 Хаммерсли (Hammersley) [177]. 7.53 Эйлер (Euler) [114, часть 2, раздел 2, глава б, §91]. 7.54 Месснер (Moessner) [274]. 7.55 Стенли (Stanley) [333]. 7.56 Эйлер (Euler) [113]. 7.57 В [95, с. 48] имеется ссылка на П. Эрдёша (Erdos) и П. Турана (Turan). 8.13 Томас М. Ковер (Thomas М. Cover).* 8.15 [207, упр. 1.2.10-17]. 8.17 Патил (Patil) [286]. 8.24 Джон Кнут (John Knuth) (в возрасте 4 лет) и Д.Э.К.; выпускной экзамен 1975 г. 8.26 [207, упр. 1.3.3-18]. 8.27 Фишер (Fisher) [125]. 8.29 Гуибас (Guibas) и Одлыжко (Odlyzko) [168]. 8.32 Выпускной экзамен 1977г. 8.34 Харди (Hardy) [180] ошибся в ходе анализа этой задачи и пришел к противоположным выводам. 8.35 Выпускной экзамен 1981г. 8.36 Гарднер (Gardner) [139] указывает в качестве автора Джорджа Сичермана (George Sicherman). 8.38 [208, упр. 3.3.2-10]. 8.39 [211, упр. 4.3(a)]. 8.41 Феллер (Feller) [120, упр. IX.33]. 8.43 [207, разделы 1.2.10 и 1.3.3]. 8.44 Выпускной экзамен 1984 г. 8.45 Выпускной экзамен 1985 г. 8.46 Феллер (Feller) [120] указывает в качестве автора Гуго Штейнгауза (Hugo Steinhaus). 8.47 Выпускной экзамен 1974г.; задача возникла в ходе анализа 2-3-деревьев. 8.48 Выпускной экзамен 1979 г. 8.49 Блом (Blom) [32]; выпускной экзамен 1984 г. 8.50 Выпускной экзамен 1986 г. 8.51 Выпускной экзамен 1986 г. 8.53 Феллер (Feller) [120] указывает в качестве автора С. Н. Берн- штейна. 8.57 Лайл Рэмшоу (Lyle Rams- haw).* 8.58 Гуибас (Guibas) и Одлыжко (Odlyzko) [168]. 9.1 Харди (Hardy) [179, 1.3(g)]. 9.2 Часть (в) взята у Гарфункеля (Garfunkel) [140]. 9.3 [207, упр. 1.2.11.1-6]. 9.6 [207, упр. 1.2.11.1-3]. 9.8 Харди (Hardy) [179, 1.2(iv)]. 9.9 Ландау (Landau) [238, том. 1, с. 60]. 9.14 [207, упр. 1.2.11.3-6]. 9.16 Кнопп (Кпорр) [205, издание ^2, §64С]. 9.18 Бендер (Bender) [25, §3.1]. 9.20 Выпускной экзамен 1971 г. 9.24 [164, §4.1.6]. 9.27 Титчмарш (Titchmarsh) [352]. 9.28 Глейшер (Glaisher) [149]. 9.29 де Брейн (de Bruijn) [74, §3.7]. 9.32 Выпускной экзамен 1976 г. 9.34 Выпускной экзамен 1973 г. 9.35 Выпускной экзамен 1975 г. 9.36 Семинары 1980 г. 9.37 [208, ф. 4.5.3-21]. 9.38 Выпускной экзамен 1977г. 9.39 Выпускной экзамен 1975г., идея Рейча (Reich) [306]. 9.40 Выпускной экзамен 1977г. 9.41 Выпускной экзамен 1980 г. 9.42 Выпускной экзамен 1979 г.
760 Первоисточники упражнений 9.44 Трикоми (Tricomi) и Эрдейи (Erdelyi) [353]. 9.46 де Брейн (de Bruijn) [74, §6.3]. 9.47 Домашнее задание 1980 г. [209, формула 5.3.1-34]. 9.48 Выпускной экзамен 1980 г. 9.49 Выпускной экзамен 1974г. 9.50 Выпускной экзамен 1984г. 9.51 [164, §4.2.1]. 9.52 Пуанкаре (Poincare) [294]; Борель (Borel) [35, с. 27]. 9.53 Пойа (Polya) и Сегё (Szego) [299, ч. 1, задача 140]. 9.57 Эндрю М.Одлыжко (Andrew M.Odlyzko).* 9.58 Хенричи (Henrici) [182, упр. 4.9.8]. 9.60 [225]. 9.62 Кэнфилд (Canfield) [48]. 9.63 Варди (Vardi) [358]. 9.65 Комте (Comtet) [64, глава 5, упр. 24]. 9.66 М. П. Шюценбергер (М. P. Schiitzenberger).* 9.67 Аиб (Lieb) [250]; Стенли (Stanley) [335, упр. 4.37(c)]. 9.68 Боас (Boas) и Ренч (Wrench) [33]. * Неопубликованное личное сообщение.
Предметный указатель В СЛУЧАЕ, КОГДА УКАЗАТЕЛЬ отсылает к странице, содержащей соответствующее упражнение, из ответа к этому упра- Граффити также жнению (в приложении А) можно извлечь дополнительную ин- следовало бы снаб- формацию; при этом номера страниц с ответами не указываются, дить указателями. - если только указатель не отсылает к понятию, которое не фигурирует в формулировке соответствующего упражнения. 0°, 210 п-я разность, 343 о, 540 х, 533 •••, 41 У, 340 <^>,96 lg, 541 In, 541 log, 541 =>, ЮО ц., 556 v, 659 П, 539 ф, 364, 556 -<, 533 ^-обозначение, 91 а, 469 ~, 533 >-, 533 9, 540 Aaronson, Bette Jane, 13 Abel, Niels Henrik, 719, 756 Abramowitz, Milton, 65, 719 Adams, William Wells, 719, 758 Addison-Wesley, 13 Aho, Alfred Vaino, 719, 755, 756 Ahrens, Wilhelm Ernst Martin Georg, 26, 719 Alfred [Brousseau], Brother Ulbertus, 722, 755 Allardice, Robert Edgar, 720 AMS Euler, 12 Andre, Antoine Desire, 720, 758 Andrews, George W. Eyre, 270, 402, 634, 685, 720, 757 Apery, Roger, 295, 720, 749, 757 Archibald, Raymond Clare, 723 Archimedes of Syracuse, 24 Armstrong, Daniel Louis (= Satchmo), 111 Askey, Richard Allen, 756 Atkinson, Michael David, 720, 755, 758 Austin, Alan Keith, 723 Bohmer, Paul Eugen, 719 Bachmann, Paul Gustav Heinrich, 534, 556, 720 Bailey, Wilfrid Norman, 279, 654, 720, 721, 756 Ball, Walter William Rouse, 721, 755 Banach, Stefan, 521 Barlow, Peter, 721, 756 Barton, David Elliott, 717, 725 BASIC, 538 Bateman, Harry, 745 Beatty, Samuel, 721, 755 Beeton, Barbara Ann Neuhaus Friend Smith, 12 Bell, Eric Temple, 403, 721, 758 Bender, Edward Anton, 721, 759 Bernoulli, Daniel Julius, 364
762 Предметный указатель Bernoulli, Jakob (= Jacobi = Jacques = James), 346, 564, 721 Bernoulli, Johann (= Jean), 741 Bertrand, Joseph Louis Francois, 189, 721, 755 Beyer, 721 Bienayme, 721 Binet, Jacques Philippe Marie, 364, 368, 722, 755 Blom, Carl Gunnar, 722, 759 Boas, Ralph Philip, Jr., 12, 714, 722, 760 Bohl, Piers Paul Felix (= Боль, Пирс Георгиевич), 119, 722 Bois-Reymond, Paul David Gustav du, 531, 726, 735 Boncompagni, Prince Baldassarre, 730 Borel, Emile Felix Edouard Justin, 722, 760 Borwein, Jonathan Michael, 722, 758 Borwein, Peter Benjamin, 722, 758 Brent, Richard Peirce, 372, 628, 673, 722 Brillhart, John David, 722, 755 Brocot, Achille, 155, 722 Broder, Andrei Zary, 12 Brooke, Maxey, 722, 757 Brown Morton, 600, 722 Brown, Roy Howard, 13 Brown, Thomas Craig, 723, 755 Brown, William Gordon, 723 Browning, Elizabeth Barrett, 389 Bruijn, Nicolaas Govert de, 535, 538, 599, 725, 758-760 Buckholtz, Thomas Joel, 739 Burr, Stefan Andrus, 723, 758 Canfield, Earl Rodney, 717, 723, 760 Carlitz, Leonard, 723, 758 Carroll, Lewis (= Dodgson, Rev. Charles Lutwidge), 52, 357, 723, 725, 750 Cassini, Gian (= Giovanni = Jean) Domenico (= Dominique), 356, 723 Catalan, Eugene Charles, 256, 436, 723 Cauchy, August in Louis, 723, 755 Chace, Arnold BufTum, 723, 755 Chaimovich, Mark, 724 Chu Shih-Chieh (=Zhu Shijie), 218 Chung, Fan-Rong King, 13, 724, 758 Clausen, Thomas, 313, 724, 725, 757 Cohen, Henri Jose, 296 Collingwood, Stuart Dodgson, 725 Collins, John, 743 Comtet, Louis, 725, 760 Connection Machine, 172 Conway, John Horton, 494, 725 Cover, Thomas Merrill, 759 Coxeter, Harold Scott Macdonald, 721 Cramer, Carl Harald, 628, 725, 756 Crelle, August Leopold, 725, 756 Crispin, Mark Reed, 748 Crowe, Donald Warren, 725, 756 Csirik, Janos Andras, 702, 725 Curtiss, David Raymond, 725, 756 David, Florence Nightingale, 717, 725 Davis, Philip Jacob, 725 Davison, John Leslie, 373, 719, 725, 757, 758 Dedekind, Julius Wilhelm Richard, 178, 179, 726 Dickson, Leonard Eugene, 610, 726 Dieudonne, Jean Alexandre, 626 Dijkstra, Edsger Wybe, 223, 726, 757 Dirichlet, Johann Peter Gustav Lejeune, 447, 726, 755 Dixon, Alfred Cardew, 726, 756 Dougall, John, 220, 726 Doyle, Sir Arthur Conan, 726 Dubner, Harvey, 726, 751, 755 Dudeney, Henry Ernest, 726, 755 Dunkel, Otto, 731, 755 Dunn, Angela Fox, 747, 758 Dunnington, Guy Waldo, 727 Dupre, Lyn Oppenheim, 13 Durst, Lincoln Kearney, 12 Dyson, Freeman John, 221, 297, 727, 733 Edwards, Anthony William Fairbank, 727 Einstein, Albert, 102, 372 Eisenstein, Ferdinand Gotthold Max, 255, 727 Ekhad, Shalosh В., 652 Elkies, Noam David, 172, 727 Eratosthenes, 149 Erdelyi, Arthur, 749, 760 Erdos, Pal (= Paul), 503, 628, 655, 685, 727, 756, 759 Eswarathasan, Arulappah, 727, 757, 758 Euclid (= ЕйкХеС&щ), 144, 727 Euler, Leonhard, 12, 73, 162, 172, 173, 255, 258, 260, 264, 302, 328, 340, 349, 367, 368, 564, 566, 614, 633, 658, 685, 717, 721, 725, 728, 729, 730, 743, 749, 755, 756, 758, 759 Fasenmyer, Mary Celine, 286, 751 Faulhaber, Johann, 352, 730, 738
Предметный указатель 763 Feder, Tomas, 758 Feller, William, 461, 730, 759 Fermat, Pierre de, 171, 172, 730 Fibonacci, Leonardo, 128, 356, 656, 730, 755, 757 Fine, Henry Burchard, 717, 744 Finetti, Bruno de, 45, 730 Finkel, Raphael Ari, 748 Fisher, Michael Ellis, 730, 759 Fisher, Sir Ronald Aylmer, 730, 759 Flajolet, Philippe Patrick Michel, 672 Floyd, Robert W., 757, 758 Forcadel, Pierre, 730, 756 FORTRAN, 538 Fourier, Jean Baptiste Joseph, 42, 731 Fraenkel, Aviezri S., 616, 672, 731, 755 Frame, James Sutherland, 731, 755 Franel, Jerome, 731 Fraser, Alexander Yule, 720 Frazer, William Donald, 731, 756 Fredman, Michael Lawrence, 614, 731 Frye, Roger Edward, 172 Gardner, Martin, 731, 732, 757, 759 Garfunkel, Jack, 732, 759 Gasper, George, Jr., 732 Gaufl (= Gauss), Johann Friderich Carl (= Carl Friedrich), 24, 51, 150, 163, 258, 260, 266, 600, 610, 632, 727, 732, 755, 756 Genocchi, Angelo, 733 Gessel, Ira Martin, 332, 733, 757 GIMPS, 147 Ginsburg, Jekuthiel, 733 Glaisher, James Whitbread Lee, 733, 759 Goldbach, Christian, 728 Golomb, Solomon Wolf, 93, 553, 592, 593, 607, 733, 749, 755 Good, Irving John, 733, 757 Goodfellow, Geoffrey Scott, 748 Gopinath, Bhaskarpillai, 600, 739 Gordon, Peter Stuart, 13 Gosper, Ralph William, Jr., 280, 286, 673, 733, 756, 757 goto, 223 Gottschalk, Walter Helbig, 9 Griinbaum, Branko, 596, 734 Graham Cheryl, 13 Graham, Ronald Lewis, 8, 13, 606, 724, 725, 727, 733, 734, 749, 755, 758 Grandi, Luigi Guido, 84, 734 Granville, Andrew James, 654 Green, Research Sink, 723 Greene, Daniel Hill, 734 Greitzer, Samuel Louis, 734, 755 Gross, Oliver Alfred, 734, 758 Grundy, Patrick Michael, 747, 755 Guibas, Leonidas loannis (= Leo John), 702, 734, 754, 759 Guy, Richard Kenneth, 626, 734 Haland Knutson, Inger Johanne, 734, 755 Hall, Marshall, Jr., 734 Halmos, Paul Richard, 7, 8, 734 Halphen, Georges Henri, 371, 735 Hamburger, Hans Ludwig, 704, 735 Hammersley, John Michael, 7, 735, 759 Hansen, Eldon Robert, 65, 735 Hardy, Godfrey Harold, 149, 533, 735, 756, 759 Harry, Matthew Arnold, 308 Heath-Brown, David Rodney, 749 Heiberg, Johan Ludvig, 727 Heisenberg, Werner Karl, 577 Henrici, Peter Karl Eugen, 403, 651, 716, 735, 757, 760 Hermite, Charles, 643, 663, 735, 748, 757 Herstein, Israel Nathan, 26, 736 Hillman, Abraham P., 736, 757 Hoare, Sir Charles Antony Richard, 49, 102, 736, 739 Hofstadter, Douglas Richard, 755 Hoggatt, Verner Emil, Jr., 736, 741, 756, 757 Holden, Edward Singleton, 744 Holmboe, Berndt Michael, 719 Holmes, Thomas Sherlock Scott, 209, 285 Hsu, Lee-Tsch (= Lietz = Leetch) Ching-Siur, 736, 757 Hurwitz, Adolf, 758 INT, 95 Iverson, Kenneth Eugene, 45, 95, 736, 755 Jacobi, Carl Gustav Jacob, 91, 736 Janson, Carl Svante, 736 Jarden, Dov, 664, 736 Jonassen, Arne Tormod, 736 Jones, Bush, 736 Josephus, Flavius, 26, 39, 736 Jungen, Reinwald, 737, 758 Kaplansky, Irving, 26, 677, 736 Karamata, Jovan, 317, 737 Kaucky, Josef, 737, 757
764 Предметный указатель Kauers, Manuel, 673 Keiper, Jerry Bruce, 737 Kellogg, Oliver Dimon, 725 Kepler, Johannes, 356, 737 Kipling, Joseph Rudyard, 320 Klamkin, Murray Seymour, 737, 755, 757 Klarner, David Anthony, 754 Knoebel, Robert Arthur, 737 Knopp, Konrad, 737, 759 Knuth, Donald Brvin, 8, 12, 13, 606, 661, 733, 734, 736-739, 755, 759 Knuth, John Martin, 759 Knuth, Nancy Jill Carter, 13 Kramp, Christian, 149, 739 Kronecker, Leopold, 624 Kummer, Ernst Eduard, 260, 267, 633, 739, 756 Kurshan, Robert Paul, 600, 739 Lagny, Thomas Fantet de, 370, 739 Lagrange (= de la Grange), Joseph Louis, comte, 565, 740, 757 Lah, Ivo, 740, 757 Lambert, Johann Heinrich, 438, 730, 740 Landau, Edmund Georg Hermann, 534, 540, 740, 756, 759 Laplace, Pierre Simon, marquis de, 560, 721, 740 Legendre, Adrien Marie, 740, 756 Lehmer, Derrick Henry, 629, 740, 741, 756, 758 Leibniz, Gottfried Wilhelm, Freiherr von, 217, 734, 741 Lekkerkerker, Cornelis Gerrit, 741 Lengyel, Tamas Lorant, 741, 758 Levine, Eugene, 727, 757, 758 Lieb, Elliott Hershel, 741, 760 Lincoln, Abraham, 484 Liouville, Joseph, 178, 179, 741 Littlewood, John Edensor, 297 Logan, Benjamin Franklin (= Tex), Jr., 351, 741, 756, 758 Long, Calvin Thomas, 741, 756 Loyd, Samuel, 668, 741 Lucas, Frangois, 17, 356, 741, 742, 756, 757 Luczak, Tomasz Jan, 736 Lyness, Robert Cranston, 600, 742 Mobius, August Ferdinand, 178, 743 Maclaurin (= Mac Laurin), Colin, 564, 742 MacMahon, Maj. Percy Alexander, 182, 742 Mallows, Colin Lingwood, 606 MAPM, 146 Martzloff, Jean-Claude, 742 Mauldin, Richard Daniel, 727 Maxfield, Margaret Waugh, 750, 758 Mayr, Ernst, 12, 755 McEliece, Robert James, 100 McKellar, Archie Charles, 731, 756 Melzak, Zdzislaw Alexander, 8, 742 Mendelsohn, Nathan Saul, 742, 757 Mersenne, Marin, 146, 172, 730, 742 Mertens, Franz Carl Joseph, 43, 181, 742 Mills, William Harold, 743, 756 Minkowski, Hermann, 162 Mir sky, Leon, 758 mod, бинарная операция, 113 mod, отношение сравнимости, 163 mod 0, 114, 616 Moessner, Alfred, 743, 759 Moivre, Abraham de, 362, 577, 726 Montgomery, Hugh Lowell, 557, 743 Montgomery, Peter Lawrence, 743, 757 Moser, Leo, 743, 755 Motzkin, Theodor Samuel, 664, 672, 736, 743 mumble, 614 Murdock, Phoebe James, 12 Myers, Basil Roland, 743, 758 Newman, James Roy, 750 Newman, Morris, 758 Newton, Sir Isaac, 241, 339, 743 Niven, Ivan Morton, 403, 743, 755 O, 800 Odlyzko, Andrew Michael, 112, 673, 702, 734, 743, 759, 760 Polya, George (= Gyorgy), 9, 35, 398, 608, 744, 745, 755, 758, 760 Pacioli, Luca, 731 Palais, Richard Sheldon, 12 Pascal, Blaise, 201, 202, 743, 756 Patashnik, Amy Markowitz, 13 Patashnik, Oren, 9, 13, 606, 734 Patil, Ganapati Parashuram, 744, 759 Paule, Peter, 642, 651 Peirce, Charles Santiago Sanders, 628, 744, 756 Penney ante, 492 Penney, Walter Francis, 492, 744 Percus, Jerome Kenneth, 744, 759 Petkovsek, Marko, 286, 685, 744, 757 PfafT, Johann Friedrich, 260, 269, 272, 633, 744, 756
Предметный указатель 765 Phidias, 364 Pittel, Boris Gershon, 687, 736 Pochhammer, Leo, 72, 744 Poincare, Jules Henri, 744, 760 Poisson, Simeon Denis, 566, 744 Pollak, Henry Otto, 734, 755 Poonen, Bjorn, 600, 755 Poorten, Alfred Jacobus van der, 749 Pro dinger, Helmut, 672 Remy, Jean-Luc, 717 R0dseth, 0ystein Johan, 746, 756 Rado, Richard, 745, 757 Rahman, Mizanur, 732 Rainville, Earl David, 632, 745 Ramanujan Iyengar, Srinivasa, 402 Ramare, Olivier, 655 Ramshaw, Lyle Harold, 102, 754, 757, 759 Raney, George Neal, 434, 438, 745, 758 Rao, Dekkata Rameswar, 745, 756 Rayleigh, John William Strutt, 3rd Baron, 745 Read, 744 Recorde, Robert, 537, 745 Reich, Simeon, 745, 759 Reingold, Edward Martin, 98 Renz, Peter Lewis, 12 Rham, Georges de, 745, 757 Ribenboim, Paulo, 662, 745, 756 Rice, 745 Riemann, Georg Priedrich Bernhard, 92, 258, 340, 447, 746, 755 Ring, Michael C., 146 Roberts, Samuel, 746, 755 Rolletschek, Heinrich Franz, 615 Roscoe, Andrew William, 739 Rosser, John Barkley, 148, 746 Rota, Gian-Carlo, 617, 746 Roy, Ranjan, 746, 756 Ruzsa, Imre Zoltan, 727 Sarkozy, Andras, 746 Saalschutz, Louis, 269, 292, 633, 746 Sawyer, Walter Warwick, 746 Schinzel, Andrzej, 628 Schonheim, Johanen, 724 Schiitzenberger, Marcel Paul, 760 Schlomilch, Oscar Xaver, 746 Schmidt, Asmus Lorenzen, 757 Schoenfeld, Lowell, 148 Schroder, Ernst, 746, 758 Schrodinger, Erwin, 517 Schroter, Heinrich Eduard, 747, 758 Scorer, Richard Segar, 747, 755 Seaver, George Thomas, 127, 141, 416 Sedgewick, Robert, 754 Sedlacek, Jiff, 747, 758 Shallit, Jeffrey Outlaw, 747, 757 Shan-Lan, Li, 330, 741 Sharp, Robert Thomas, 334, 747 Shor, Peter Williston, 755 Sicherman, George Leprechaun, 759 Sierpinski, Waclaw Franciszek, 119, 747, 756 Silverman, David L., 747, 758 Skiena, Steven Sol, 654 Sloane, Neil James Alexander, 65, 414, 719, 747, 755, 756 Slowinski, David Allen, 146 Smith, Cedric Austen Bardell, 747, 755 Spohn, William Gideon, Jr., 747 Stallman, Richard Matthew, 748 Stanley, Richard Peter, 332, 638, 733, 748, 758-760 Staudt, Karl Georg Christian von, 748, 757 Steele, Guy Lewis, Jr., 748 Stegun, Irene Anne, 65, 719 Stein, Sherman Kopald, 755 Steiner, Jacob, 22, 748, 755 Steinhaus, Hugo Dyonizy, 759 Stengel, Charles Dillon (= Casey), 65 Stern, Moritz Abraham, 155, 748 Stewart, Bonnie Madison, 731, 755 Stickelberger, Ludwig, 748., 756 Stieltjes, Thomas Jan, 735, 748, 755 Stirling, James, 244, 264, 317, 318, 362, 577, 748 Straus, Ernst Gabor, 672, 727, 743 Strehl, Karl Ernst Volker, 655, 748, 757 Sun Tsu (= Sunzi, Master Sun), 166 Swanson, Ellen Esther, 12 Sweeney, Dura Warren, 748 Swinden, Benjamin Alfred, 755 Sylvester, James Joseph, 175, 748, 749, 755 Szego, Gabor, 745, 760 Szegedy, Mario, 628, 724, 749 Tanny, Stephen Michael, 749, 758 Taylor, Brook, 211, 351 Theisinger, Ludwig, 749, 757 Thiele, Thorvald Nicolai, 480, 481, 749 Titchmarsh, Edward Charles, 749, 759 Todd, Horace, 600
766 Предметный указатель Tricomi, Francesco Giacomo Filippo, 749, 760 Turan, Paul, 759 Uchimura, Keisuke, 720, 757 Ungar, Peter, 749 Uspensky, James Victor, 733, 749, 755 Vandermonde, Alexandre Theophile, 218, 726, 746, 749, 756 Vardi, Ilan, 628, 654, 717, 739, 749, 755, 760 Veech, William Austin, 615 Venn, John, 596, 749, 755 Voltaire, de (= Arouet, Francois Marie), 542 Vyssotsky, Victor Alexander, 654 Wall, Charles Robert, 722, 757 Wallis, John, 750, 757 Waring, Edward, 750, 757 Waterhouse, William Charles, 750, 758 Watson, John Hamish, 285, 488 Waugh, Frederick Vail, 750, 758 Weaver, Warren, 750 Weber, Heinrich, 750 Weisner, Louis, 617, 750 Wermuth, Edgar Martin Emil, 717, 750 Weyl, Claus Hugo Hermann, 119, 750 Whidden, Samuel Blackwell, 12 Whipple, Francis John Welsh, 312, 750, 757 Whitehead, Alfred North, 123, 603, 718, 750 Wiles, Andrew John, 172 Wilf, Herbert Saul, 112, 298, 300, 615, 655, 685, 739, 743, 750, 751, 757 Williams, Hugh Cowie, 751, 755 Wilquin, Denys, 757 Witty, Carl Roger, 609 Wolstenholme, Joseph, 751, 757 Wood, Derick, 751, 755 Woods, Donald Roy, 748 Woolf, William Blauvelt, 12 Worpitzky, Julius Daniel Theodor, 330, 751 Wrench, John William, Jr., 714, 722, 760 Wright, Sir Edward Maitland, 149, 735, 751, 755, 756 Yao, Qi, 741 Yao, Andrew Chi-Chih, 12 Yao, Frances Foong Chu, 12 Zagier, Don Bernard, 296 Zapf, Hermann, 12, 739 Zave, Derek Alan, 751, 758 Zeckendorf, Edouard, 360, 672, 751 Zeilberger, Doron, 13, 286, 296, 298, 300, 751, 757 Ааронсон, Бет Джейн (Aaronson, Bette Jane), 13 Абель, Нильс Хенрик (Abel, Niels Henrik), 719, 756 Абрамовиц, Мильтон (Abramowitz, Milton), 65, 719 Абсолютная погрешность, 544 сходимость, 86 Абсолютно сходящиеся суммы, 87 Автоморфные числа, 622 Адаме, Уильям Уэллс (Adams, William Wells), 719, 758 Азбука Морзе, 368, 394 Айверсон, Кеннет Юджин (Iverson, Kenneth Eugene), 45, 95, 736, 755 Алгебраические целые, 191 Алгоритм Госпера, 639 Госпера-Зайльбергера, 286, 387 Евклида, 138, 163, 369 Фибоначчи, 128, 135 Алгоритм, жадный, 135 Алиса, 52 Аллардис, Роберт Эдгар (Allardice, Robert Edgar), 720 Американское математическое общество, 12 Анализ алгоритмов, 497 вероятностный, 497 Аналитическая функция, 249 Аналитический вид, 402 Андрэ, Антуан Дезире (Andre, Antoine Desire), 720, 758 Анекдот, 247, 502 Антиразность, 79 Апери, Роже (Apery, Roger), 295, 720, 749, 757 Аргумент, 258 Арене, Вильгельм Эрнст Мартин Георг (Ahrens, Wilhelm Ernst Martin Georg), 26, 719 Арифметическая прогрессия, 47, 52, 454 Армагеддон, 117 Армстронг, Дэниел Луи (Armstrong, Daniel Louis (= Satchmo)), 111 Архимед из Сиракуз (Archimedes of Syracuse), 24 Арчибальд, Раймонд Клер (Archibald, Raymond Clare), 723
Предметный указатель 767 Асимптотика, 153, 529, 530 Асимптотический метод суммирования, 560 Асимптотическое раскрытие рекуррентности, 549 Аски, Ричард Аллен (Askey, Richard Allen), 756 Ассоциативность, 51, 92 Ассоциативный закон, 87 Аткинсон, Майкл Дэвид (Atkinson, Michael David), 720, 755, 758 Ахо, Альфред Вайно (Aho, Alfred Vaino), 719, 755, 756 База индукции, 20, 390 Базовый член, 298 Банах, Стефан (Banach, Stefan), 521 Барлоу, Питер (Barlow, Peter), 721, 756 Барр, Стефан Андрус (Burr, Stefan Andrus), 723, 758 Бартон, Дэвид Эллиотт (Barton, David Elliott), 717, 725 Бахман, Пауль Густав Генрих (Bachmann, Paul Gustav Heinrich), 534, 556, 720 Башня Брахмы, 17 Вейли, Уилфрид Норман (Bailey, Wilfrid Norman), 279, 654, 720, 721, 756 Белл, Эрик Темпль (Bell, Eric Temple), 403, 721, 758 Венд ер, Эдуард Антон (Bender, Edward Anton), 721, 759 Бернулли, Даниэль Юлиус (Bernoulli, Daniel Julius), 364 Бернулли, Иоганн (Bernoulli, Johann (= Jean)), 741 Бернулли, Якоб (Bernoulli, Jakob (= Jacobi = Jacques = James)), 346, 564, 721 Вернштейн, Сергей Натанович, 759 Вертран, Жозеф Луи Франсуа (Bertrand, Joseph Louis Frangois), 189, 721, 755 Бесконечные суммы, 82 Бесполезное тождество, 279 Бесполезность, 314 Беспорядок, 246, 252 Ветон, 8 Бёхмер, Пауль Юген (Bohmer, Paul Eugen), 719 Виекция, 62 Бинарное дерево, 155 Бинарные разбиения, 455 Бинарный поиск, 160, 233 Вине, Жак Филипп Мари (Binet, Jacques Philippe Marie), 364, 368, 722, 755 Биномиальная свертка, 441 Биномиальная теорема, 209, 259, 277 Биномиальное распределение, 484, 519 Биномиальный коэффициент, 199, 265 обратная величина, 240 обратный, 305 Биномиальный ряд, обобщенный, 253 Витон, Барбара Энн Нойхаус Френд Смит (Beeton, Barbara Ann Neuhaus Friend Smith), 12 Витти, Сэмюэл (Beatty, Samuel), 721, 755 Бицикл, 320 Ближайшее целое, 127 Блом, Карл Гуннар (Blom, Carl Gunnar), 722, 759 Боас, Ральф Филипп, мл. (Boas, Ralph Philip, Jr.), 12, 714, 722, 760 Бог, 18 Болл, Уолтер Уильям Роуз (Ball, Walter William Rouse), 721, 755 Боль, Пирс Пауль Феликс (Bohl, Piers Paul Felix (= Воль, Пирс Георгиевич)), 119, 722 Большая теорема Ферма, 172, 195, 662 Большое О, 106 Ворель, Эмиль Феликс Эдуард Жюстин (Borel, Emile Felix edouard Justin), 722, 760 Боруэн, Джонатан Майкл (Borwein, Jonathan Michael), 722, 758 Боруэн, Питер Бенджамин (Borwein, Peter Benjamin), 722, 758 Браун Мортон (Brown Morton), 600, 722 Браун, Рой Говард (Brown, Roy Howard), 13 Браун, Томас Крейг (Brown, Thomas Craig), 723, 755 Браун, Уильям Гордон (Brown, William Gordon), 723 Браунинг, Элизабет Барретт (Browning, Elizabeth Barrett), 389 Брейн, Николаас Говерт де (Bruijn, Nicolaas Govert de), 535, 538, 599, 725, 758-760 Брент, Ричард Пирс (Brent, Richard Peirce), 372, 628, 673, 722 Брилларт, Джон Дэвид (Brillhart, John David), 722, 755
768 Предметный указатель Вродер, Андрей Зари (Broder, Andrei Zary), 12 Броко, Ахилл (Brocot, Achille), 155, 722 Врук, Макси (Brooke, Махеу), 722, 757 Брюссо Альфред, брат Ульбертус (Alfred [Brousseau], Brother Ulbertus), 722, 755 Букхольц, Томас Джоэль (Buckholtz, Thomas Joel), 739 Быстрая сортировка, 49 Бэйтман, Гарри (Bateman, Harry), 745 Вандермонд, Александр Теофил (Vander- monde, Alexandre Theophile), 218, 726, 746, 749, 756 Варди, Илан (Vardi, Пап), 628, 654, 717, 739, 749, 755, 760 Ватерхаус, Уильям Чарльз (Waterhouse, William Charles), 750, 758 Ватсон, Джон Хамит (Watson, John Hamish), 285, 488 Вебер, Генрих (Weber, Heinrich), 750 Вейль, Клаус Хьюго Герман (Weyl, Claus Hugo Hermann), 119, 750 Вейснер, Луи (Weisner, Louis), 617, 750 Венн, Джон (Venn, John), 596, 749, 755 Венок, 616 Вермут, Эдгар Мартин Эмиль (Wermuth, Edgar Martin Emil), 717, 750 Вероятностное пространство, 461 Вероятностный анализ алгоритмов, 497 Вероятность, 247 Вероятность, теория, 461 Верхнее обращение, 212 Верхний индекс, 200 параметр, 258 Взаимно простые числа, 144, 154 Вильф, Герберт Саул (Wilf, Herbert Saul), 112, 298, 300, 615, 655, 685, 739, 743, 750, 751, 757 Вильяме, Хью Кови (Williams, Hugh Cowie), 751, 755 Вино, 521 Вич, Уильям Остин (Veech, William Austin), 615 Во, Фредерик Вейл (Waugh, Frederick Vail), 750, 758 Возрастающе-убывающая перестановка, 456 Возрастающие факториальные степени, 72 Война, 117 Волков, Александр Мелентьевич, 692 Волшебство, 357 Вольтер, де (Voltaire, de (= Arouet, Francois Marie)), 542 Волыдтенхольм, Джозеф (Wolstenholme, Joseph), 751, 757 Воропицки, Юлиус Даниэль Теодор (Worpitzky, Julius Daniel Theodor), 330, 751 Время работы, 510 Вторая разность, 239 Вуд, Дерик (Wood, Derick), 751, 755 Вудс, Дональд Рой (Woods, Donald Roy), 748 Вульф, Уильям Бловельт (Woolf, William Blauvelt), 12 Выборка данных, 495 Вынесение за скобки главной части, 546 Выпуклость, 22 Вырожденная гипергеометрическая функция, 264 Вырожденный гипергеометрический ряд, 306 Высоцкий, Виктор Александер (Vyssotsky, Victor Alexander), 654 Высоцкий, Владимир Семенович, 505 Гамбургер, Ганс Людвиг (Hamburger, Hans Ludwig), 704, 735 Гамма-функция, 265, 268, 578, 632, 725 Гарднер, Мартин (Gardner, Martin), 731, 732, 757, 759 Гармоническая расходимость, 88 Гармонические числа, 50, 334, 576 аналогия с логарифмом, 78 аппроксимация, 340 второго порядка, 339 комплексные, 378 производящая функция, 425 сумма, 64 Гарри, Мэттью Арнольд (Harry, Matthew Arnold), 308 Гарфункель, Джек (Garfunkel, Jack), 732, 759 Гаспер, Джордж:, мл. (Gasper, George, Jr.), 732 Гаусс, Иоганн Фридрих Карл (Gaufl (= Gauss), Johann Friderich Carl (= Carl Friedrich)), 24, 51, 150, 163, 258, 260, 266, 600, 610, 632, 727, 732, 755, 756 Гейберг, Иоган Людвиг (Heiberg, Johan Ludvig), 727
Предметный указатель 769 Гейзенберг, Вернер Карл (Heisenberg, Werner Karl), 577 Герштейн, Израиль Натан (Herstein, Israel Nathan), 26, 736 Гессель, Ира Мартин (Gessel, Ira Martin), 332, 733, 757 Ги, Ричард Кеннет (Guy, Richard Kenneth), 626, 734 Гинзбург, Джекутель (Ginsburg, Jekuthiel), 733 Гиперболические функции, 349 Гипергеометрические члены, 280, 685 Гипергеометрический ряд, 258 член, 630 Гиперфакториал, 301, 588 Гипотеза Римана, 629 Глейшер, Джеймс Витбред Ли (Glaisher, James Whitbread Lee), 733, 759 Голомб, Соломон Вольф (Golomb, Solomon Wolf), 93, 553, 592, 593, 607, 733, 749, 755 Голоморфная функция, 249 Гольдбах, Христиан (Goldbach, Christian), 728 Гольф, 518 Гопинат, Бхаскарпиллаи (Gopinath, Bhaskarpillai), 600, 739 Гордон, Питер Стюарт (Gordon, Peter Stuart), 13 Госпер, Ральф Уильям, мл. (Gosper, Ralph William, Jr.), 280, 286, 673, 733, 756, 757 Готтшалк, Уолтер Хельбиг (Gottschalk, Walter Helbig), 9 Гравитация, 335 Грайцер, Сэмюэль Луи (Greitzer, Samuel Louis), 734, 755 Гранвиль, Эндрю Джеймс (Granville, Andrew James), 654 Гранди, Луиджи Гвидо (Grandi, Luigi Guido), 84, 734 Гранди, Патрик Майкл (Grundy, Patrick Michael), 747, 755 Граничные условия, 105, 118 Граф, 422, 452 Грин, Дениел Хилл (Greene, Daniel Hill), 734 Грин, Ресеч Синк (Green, Research Sink), 723 Гросс, Оливер Альфред (Gross, Oliver Alfred), 734, 758 Грэхем, Рональд Льюис (Graham, Ronald Lewis), 8, 13, 606, 724, 725, 727, 733, 734, 749, 755, 758 Грэхем, Шерил (Graham Cheryl), 13 Грюнбаум, Бранко (Grunbaum, Branko), 596, 734 Гугол (= 10100), 531 1Л1 00 Гуголплекс (= 1010 ), 531 Гуд, Ирвинг Джон (Good, Irving John), 733, 757 Гудвин, Джеймс (Великий и Ужасный), 692 Гудфеллоу, Джеффри Скотт (Goodfellow, Geoffrey Scott), 748 Гуибас, Леонидас Иоаннис (Guibas, Leonidas Ioannis (= Leo John)), 702, 734, 754, 759 Гурвиц, Адольф (Hurwitz, Adolf), 758 Дайсон, Фриман Джон (Dyson, Freeman John), 221, 297, 727, 733 Данкель, Otto (Dunkel, Otto), 731, 755 Данн, Анжела Фокс (Dunn, Angela Fox), 747, 758 Даннингтон, Гай Уолдо (Dunnington, Guy Waldo), 727 Дарст, Линкольн Кирни (Durst, Lincoln Kearney), 12 Дважды бесконечная сумма, 578 Двоичное представление, 30 Двойная сумма, 56, 140 Гарри, 308 Дедекинд, Юлиус Вильгельм Рихард (Dedekind, Julius Wilhelm Richard), 178, 179, 726 Дейвис, Филипп Джекоб (Davis, Philip Jacob), 725 Дейвисон, Джон Лесли (Davison, John Leslie), 373, 719, 725, 757, 758 Дейкстра, Эдсгер Вайб (Dijkstra, Edsger Wybe), 223, 726, 757 Деление напросто, 189 Делимость, 137 гармонических чисел, 381 полиномов, 281 Делители гармонических чисел, 386 Дерево, 155, 422 Штерна-Вроко, 155, 370, 457, 628 Джарден, Дов (Jarden, Dov), 664, 736 Дженоччи, Анжело (Genocchi, Angelo), 733 Джонс, Буш (Jones, Bush), 736
770 Предметный указатель Дзета-функция, 92, 295, 340, 447, 629 Диаграмма Венна, 37, 40 Диксон, Альфред Кардью (Dixon, Alfred Cardew), 726, 756 Диксон, Леонард Юджин (Dickson, Leonard Eugene), 610, 726 Дирихле, Иоганн Питер Густав Лей- ун (Dirichlet, Johann Peter Gustav Lejeune), 447, 726, 755 Дисперсия, 468, 505, 509 Дистрибутивность, 51, 58, 92, 115 Дистрибутивный закон, 87 Дифференциальное исчисление, 55 уравнение, 275 Дифференциальный оператор, 376 Дифференцирование, 70 Дифференцируемая конечность, 459 Дифференцируемо конечный ряд, 451 ДНК, марсианская, 456 Домино, 389 Дробная часть, 98, 119 Дробь, 176 Дуальность, 328 Дуальные биномиальные коэффициенты, 634 Дугалл, Джон (Dougall, John), 220, 726 Думай по-большому, 18, 390, 531, 551, 582 Дьёдонне, Жан Александр (Dieudonne, Jean Alexandre), 626 Дьюдени, Генри Эрнест (Dudeney, Henry Ernest), 726, 755 Дэйвид, Флоренс Найтингейл (David, Florence Nightingale), 717, 725 Дюбнер, Харви (Dubner, Harvey), 726, 751, 755 Дюбуа-Раймон, Поль Давид Густав (Bois-Reymond, Paul David Gustav du), 531, 726, 735 Дюпре, Лин Оппенгейм (Dupre, Lyn Oppenheim), 13 Евклид (Euclid (= ЕйкХеСбщ)), 144, 727 Египетские математики, 128 Единственное разложение, 142 Жадность, 104, 468 Жадный алгоритм, 135 Заалыпютц, Луи (Saalschiitz, Louis), 269, 292, 633, 746 Загиер, Дон Бернард (Zagier, Don Bernard), 296 Задача Иосифа, 110, 127, 133, 187 обобщенная, 32 о победе футбольной команды, 245, 474 Задачи, уровни, 101 Зайльбергер, Дорон (Zeilberger, Doron), 13, 286, 296, 298, 300, 751, 757 Закон больших чисел, 473 взаимности, 127 Зипфа, 504 Мэрфи, 103 отражения, 306 Замена индекса суммирования, 61 Замкнутый интервал, 102 Запись Айверсона, 53, 56, 104 с троеточием, 74 Зейв, Дерек Алан (Zave, Derek Alan), 751, 758 Золотое сечение, 364 Игральные кости, 461 честные, 462 Изменение порядка суммирования, 56, 234 Именуй и властвуй, 18, 182 Импликация, 100 Инвариант, 156 Индекс биномиального коэффициента, 200 Индексная переменная, 42 Индуктивный скачок, 21 Индукция, 20, 24, 66, 656 Интеграл, 68, 214 Интегрирование по частям, 567 Интервал, 102 Интерполяция, 243 Инфрагеометрический ряд, 302 Иосиф Флавий (Josephus, Flavius), 26, 39, 736 Иосифово подмножество, 40 Иррациональность, 119, 295 Иррациональные числа, 161 Испытание Бернулли, 484 Йонассен, Арне Тормод (Jonassen, Arne Tormod), 736 Калькулятор, 418 Каплански, Ирвинг (Kaplansky, Irving), 26, 677, 736 Карамата, Йован (Karamata, Jovan), 317, 737
Предметный указатель 771 Карлитц, Леонард (Carlitz, Leonard), 723, 758 Кассини, Джованни Доменико (Cassini, Gian (= Giovanni = Jean) Domenico (= Dominique)), 356, 723 Каталан, Эжен Шарль (Catalan, Eugene Charles), 256, 436, 723 Кауцки, Иосиф (Kaucky, Josef), 737, 757 Кауэрс, Мануэль (Kauers, Manuel), 673 Квадратно пирамидальные числа, 66 Квадратный корень по модулю га, 170 Квадраты, сумма последовательности, 64 Кейпер, Джерри Брюс (Keiper, Jerry Bruce), 737 Келлогг, Оливер Даймон (Kellogg, Oliver Dimon), 725 Кеплер, Иоганн (Kepler, Johannes), 356, 737 Кёртис, Дэвид Раймонд (Curtiss, David Raymond), 725, 756 Киплинг, Джозеф Редьярд (Kipling, Joseph Rudyard), 320 Китайская теорема об остатках, 166, 190 Кламкин, Мюррей Сеймур (Klamkin, Murray Seymour), 755, 757 Кларнер, Дэвид Энтони (Klarner, David Anthony), 754 Клаузен, Томас (Clausen, Thomas), 313, 724, 725, 757 Клямкин, Мюррей Сеймур (Klamkin, Murray Seymour), 737 Кнобель, Роберт Артур (Knoebel, Robert Arthur), 737 Кнопп, Конрад (Knopp, Konrad), 737, 759 Кнут, Джон Мартин (Knuth, John Martin), 759 Кнут, Дональд Эрвин (Knuth, Donald Ervin), 8, 12, 13, 606, 661, 733, 734, 736-739, 755, 759 Кнут, Нэнси Джилл Картер (Knuth, Nancy Jill Carter), 13 Ковер, Томас Меррилл (Cover, Thomas Merrill), 759 Код Грея, 595 Коксетер, Гарольд Скотт Макдональд (Coxeter, Harold Scott Macdonald), 721 Колесо, 452 Коллингвуд, Стюарт Доджсон (Colling- wood, Stuart Dodgson), 725 Коллинз, Джон (Collins, John), 743 Комбинаторная интерпретация, 199, 205, 208, 218 система счисления, 304 Коммутативность, 51, 92, 391 Коммутативный закон, 87 ослабленный, 52 Комплексное число, 91 Комплексные гармонические числа, 383 Композиция, 514 Комте, Луи (Comtet, Louis), 725, 760 Конан-Дойл, Артур (Doyle, Sir Arthur Conan), 726 Конвей, Джон Хортон (Conway, John Horton), 494, 725 Конечные разности, 70 Конечный автомат, 488 Конкретная математика, определение, 8 Константа Глейшера, 708 Стилтьеса, 709, 715 Стирлинга, 577 Эйлера, 340, 372, 576 вычисление, 577 Континуанты, 367 Корень из единицы, 193, 711 Коши, Огюст Луи (Cauchy, Augustin Louis), 723, 755 Коэн, Генри Хосе (Cohen, Henri Jose), 296 Коэффициенты Фибоначчи, 385 Крамер, Карл Гаральд (Cramer, Carl Harald), 628, 725, 756 Крамп, Христиан (Kramp, Christian), 149., 739 Кратность, 137 Кратные суммы, 87 Крелль, Огюст Леопольд (Crelle, August Leopold), 725, 756 Криббедж, 92 Криспин, Марк Рид (Crispin, Mark Reed), 748 Кронекер, Леопольд (Kronecker, Leopold), 624 Кроу, Дональд Уоррен (Crowe, Donald Warren), 725, 756 Куммер, Эрнст Эдуард (Kummer, Ernst Eduard), 260, 267, 633, 739, 756 Кумулянт, 480, 516 Куршан, Роберт Пол (Kurshan, Robert Paul), 600, 739 Кэнфилд, Эрл Родни (Canfield, Earl Rodney), 717, 723, 760
772 Предметный указатель Кэрролл, Льюис (Доджсон Чарльз Лют- видж) (Carroll, Lewis (= Dodgson, Rev. Charles Lutwidge)), 52, 357, 723, 725, 750 Лагранж, Жозе Луи (Lagrange (= de la Grange), Joseph Louis, comte), 565, 740, 757 Ламберт, Иоганн Генрих (Lambert, Johann Heinrich), 438, 730, 740 Ландау, Эдмунд Георг Герман (Landau, Edmund Georg Hermann), 534, 540, 740, 756, 759 Ланьи, Тома Фанте де (Lagny, Thomas Fantet de), 370, 739 Лаплас, Пьер Симон, маркиз де (Laplace, Pierre Simon, marquis de), 560, 721, 740 Лах, Иво (Lah, Ivo), 740, 757 Левайн, Юджин (Levine, Eugene), 727, 757, 758 Левосторонний максимум, 383 Лежандр, Адриен Мари (Legendre, Adrien Marie), 740, 756 Лейбниц, Готтфрид Вильгельм, Фрайхерр фон (Leibniz, Gottfried Wilhelm, Preiherr von), 217, 734, 741 Леккеркеркер Корнелис Геррит (LekkerIter ker, Cornelis Gerrit), 741 Лексикографический порядок, 532 Лемер, Деррик Генри (Lehmer, Derrick Henry), 629, 740, 741, 756, 758 Ленжиель, Тома Лоран (Lengyel, Tamas Lorant), 741, 758 Либ, Эллиотт Гершель (Lieb, Elliott Hershel), 741, 760 Линеечная функция, 151, 189 Линейные разностные операторы, 298 Линесс, Роберт Крэнстон (Lyness, Robert Cranston), 600, 742 Линкольн, Абрахам (Lincoln, Abraham), 484 Литтлвуд, Джон Эденсор (Littlewood, John Edensor), 297 Лиувилль, Жозеф (Liouville, Joseph), 178, 179, 741 Ловушка, 201, 277 Логан, Бенджамин Франклин, мл. (Logan, Benjamin Franklin (= Тех), Jr.), 351, 741, 756, 758 Логарифм, 339 Логарифмически-экспоненциальные функции, 533 Лойд, Сэмюэль (Loyd, Samuel), 668, 741 Лонг, Кальвин Томас (Long, Calvin Thomas), 741, 756 Лотерея, 468, 524 Лучак, Томаш Ян (Luczak, Tomasz Jan), 736 Люка, Франсуа Эдуард Анатоль (Lucas, Frangois Edouard Anatole), 17, 356, 741, 742, 756, 757 Майерс, Базил Роланд (Myers, Basil Roland), 743, 758 Мак-Келлар, Арчи Чарльз (McKellar, Archie Charles), 731, 756 Мак-Мэхан, Перси Александер (Мас- Mahon, Maj. Percy Alexander), 182, 742 Мак-Элис, Роберт Джеймс (McEliece, Robert James), 100 Маклорен, Колин (Maclaurin (= Mac Laurin), Colin), 564, 742 Максфилд, Маргарет Bo (Maxfield, Margaret Waugh), 750, 758 Малая теорема Ферма, 172 Малые значения, 201 случаи, 18, 22, 390 Марковские процессы, 489 Марсианская ДНК, 456 Марцлов, Жан-Клод (Martzloff, Jean-Claude), 742 Математическая индукция, 20, 24, 29, 36, 37, 66, 608 Математическое ожидание, 466 Матиясевич, Юрий Владимирович, 359, 742, 757 Мёбиус, Август Фердинанд (Mobius, August Ferdinand), 178, 743 Медиана, 465, 466, 525 Медианта, 155 Мелзак, Здислав Александер (Melzak, Zdzislaw Alexander), 8, 742 Мендельсон, Натан Саул (Mendelsohn, Nathan Saul), 742, 757 Мера сложности, 232 Мердок, Феб Джеймс (Murdock, Phoebe James), 12 Мерсенн, Марин (Mersenne, Marin), 146, 172, 730, 742
Предметный указатель 773 Мертенс, Франц Карл Иосиф (Mertens, Franz Carl Joseph), 43, 181, 742 Месснер, Альфред (Moessner, Alfred), 743, 759 Метод Госпера, 280, 304 наборов, 34, 39, 46, 90, 309, 378, 380, 449 перестановок, 53 приведения, 91, 347 Миллз, Уильям Гарольд (Mills, William Harold), 743, 756 Минимум, 93 Минковский, Герман (Minkowski, Hermann), 162 Мирский, Леон (Mirsky, Leon), 758 Многоугольники, 457 Мода, 465, 466, 525 Модуль комплексного числа, 91 Модулярная арифметика, 163 Мозер, Лео (Moser, Leo), 743, 755 Момент, 481 Монтгомери, Питер Лоуренс (Montgomery, Peter Lawrence), 743, 757 Монтгомери, Хью Лоувелл (Montgomery, Hugh Lowell), 557, 743 Моулдин, Ричард Даниэль (Mauldin, Richard Daniel), 727 Моцкин, Теодор Самуэль (Motzkin, Theodor Samuel), 664, 672, 736, 743 Муавр, Абрахам де (Moivre, Abraham de), 362, 577, 726 Мультимножество, 107 Мультиномиальные коэффициенты, 217, 679 Мультипликативная функция, 175, 448 Мэйр, Эрнст (Mayr, Ernst), 12, 755 Мэллоуз, Колин Лингвуд (Mallows, Colin Lingwood), 606 Мю-функция, 178 Мюнхгаузен, Карл Фридрих Иероним фон (Munchhausen, Karl Priedrich Ieronim von), 557 Наибольшая нижняя граница, 93 Наибольшее целое, 95 Наибольший общий делитель, 124, 138, 143 Наименьшее общее кратное, 143 целое, 95 Наивен, Айвен Мортон (Niven, Ivan Morton), 403, 743, 755 Натуральные логарифмы, 79 Независимые случайные величины, 464 Необходимое и достаточное условие, 102 Неожиданная сумма, 215, 270 Неопределенная сумма, 73 Неопределенное суммирование, 209, 280 Неподвижная точка, 475 Неполное частное, 673 Непрерывные дроби, 367 Неравенство хвоста, 514, 517 Чебышева, 61, 471, 517 Несимметричная монета, 484 Несмещенная оценка, 516 Несмещенное округление, 606 Неявное рекуррентное соотношение, 244, 347 Нижний индекс, 200 параметр, 258 Ноль, совершенный, 45 Нормальное распределение, 527 Нулевой случай, 18, 390, 423, 674 Ньюман, Джеймс Рой (Newman, James Roy), 750 Ньюмен, Моррис (Newman, Morris), 758 Ньютон, сэр Исаак (Newton, Sir Isaac), 241, 339, 743 Ню-функция, 659 Обернутые биномиальные коэффициенты, 382 Обобщение, 30, 32, 35 Обобщенные биномиальные коэффициенты, 385, 633 гармонические числа, 346, 447 Обобщенный биномиальный ряд, 312 факториал, 383 Обозначение, 15, 18, 97, 113, 137, 317, 328, 534, 538 произведения, 91 расширение, 77 Обратное по модулю, 174 Обращение, 191 верхнего индекса, 212 Обращенный полином, 412 Огрубление, 538 Одлыжко, Эндрю Майкл (Odlyzko, Andrew Michael), 112, 673, 702, 734, 743, 759, 760 Однородность, 297 Одностороннее равенство, 537
774 Предметный указатель Ожидание, 510 Ожидаемое значение, 510 Округление, несмещенное, 606 Оператор, 71, 80, 239 сдвига, 239 Оптическая иллюзия, 356, 357, 668 Основная теорема алгебры, 261 арифметики, 142 дифференциального и интегрального исчислений, 72 Остаток, 113 Остин, Алан Кейт (Austin, Alan Keith), 723 Остовное дерево, 422, 430, 452 Ответы, 11 Отклонение, 120, 130, 386, 589, 593 Открытый интервал, 102 Относительная погрешность, 544 Отношение последовательных членов, 261 эквивалентности, 164 Отражение световых лучей, 356 Отрицательное биномиальное распределение, 485 Отрицательные убывающие степени, 239 факториальные степени, 77, 89 Пале, Ричард Шелдон (Palais, Richard Sheldon), 12 Парадокс, 494 нетранзитивности, 494 Парадоксальные суммы, 82 Параллельное суммирование, 207 Паскаль, Влез (Pascal, Blaise), 201, 202, 743, 756 Паташник, Орен (Patashnik, Oren), 9, 13, 606, 734 Паташник, Эми Марковиц (Patashnik, Amy Markowitz), 13 Патил, Ганапати Парашурам (Patil, Ganapati Parashuram), 744, 759 Пауле, Питер (Paule, Peter), 642, 651 Пачоли, Лука (Pacioli, Luca), 731 Пенни, Уолтер Френсис (Penney, Walter Francis), 492, 744 Перенос, 98 Перестановки, 248 Перкус, Джером Кеннет (Percus, Jerome Kenneth), 744, 759 Петковшек, Марко (Petkovsek, Marko), 286, 685, 744, 757 Пи, 673 Пирс, Чарльз Сантьяго Сандерс (Peirce, Charles Santiago Sanders), 628, 744, 756 Питтель, Борис Гершон (Pittel, Boris Gershon), 687, 736 Повесть Кафки, 337 Погрешность абсолютная, 544 относительная, 544 Подсолнух, 355 Подходящий член, 297, 315, 316 Подъем, 328 Поиск в таблице, 495 Пойа, Георг (Polya, George (= Gyorgy)), 9, 35, 398, 608, 744, 745, 755, 758, 760 Пол, 95 Полином, 241 Бернулли, 444, 564, 566 Лежандра, 649 Стирлинга, 333, 354, 377, 427 Эйлера, 683 Якоби, 649, 721 Полиномиально рекурсивная последовательность, 451 Полиномиальное доказательство, 205 Поллак, Генри Отто (Pollak, Henry Otto), 734, 755 Полный граф, 444 Поонен, Вьёрн (Poonen, Bjorn), 600, 755 Поортен, Альфред Якоб ван дер (Poorten, Alfred Jacobus van der), 749 Портланд-цемент, 8 Порядок органных труб, 627 Последовательность Пирса, 195 Рени, 436 Фарея, 157, 176, 180, 195, 196, 556 Постулат Бертрана, 189, 599, 657 Потолок, 95 Похгаммер, Лео (Pochhammer, Leo), 72, 744 Правило Лопиталя, 478, 647 обращения, 181 цепочки, 79 Правильная монета, 484 Превышение, 383 Предок, 156
Предметный указатель 775 Представление Штерна-Броко, 371, 621, 656 Премия, 13 Приближение, 106, 120 Стирлинга, 546 суммы интегралом, 69 Примеч. пер., 8, 9, 22, 23, 26, 42, 93, 97, 113, 114, 117, 145-147, 245, 247, 398, 399, 401, 413, 502, 505, 515, 519, 524, 525, 551, 621, 626 Принцип неопределенности, 577 обращения, 178 ящиков Дирихле, 128, 171 Проверка правильности, 139 простоты, 147 Продингер, Гельмут (Prodinger, Helmut), 672 Произведение, 141 нечетных чисел, 332 последовательных нечетных чисел, 238 Производная, 55 Производящая функция, 249, 361, 394 Дирихле, 447, 451 случайной величины, 519 Ньютона, 456 случайной величины, 476 Производящие функции для производящих функций, 427 Простая дробь, 305 Мерсенна, 625 Пространство вероятностей, 461 Простые делители, 43 числа, 141, 549 наибольшее известное, 146 Процедура Госпера-Зайльбергера, 314 Пуанкаре, Жюль Анри (Poincare, Jules Henri), 744, 760 Пуассон, Симон Дени (Poisson, Simeon Denis), 566, 744 Пузырьковая сортировка, 540 Пустая сумма, 44, 72 Пустое произведение, 72, 141 Пустой случай, 18, 390, 423, 674 Пфафф, Иоганн Фридрих (PfafT, Johann Friedrich), 260, 269, 272, 633, 744, 756 Пчелиные деревья, 355 Пятиугольные числа, 458 Равномерное распределение, 119, 477 Радо, Ричард (Rado, Richard), 745, 757 Разбиение, 107, 115, 401 множества, 318 Разворачивание рекуррентности, 23 Разделяй и властвуй, 110 Разложение на множители, 147 на простейшие дроби, 240 на простые множители, 149 на простые числа, 142 на элементарные дроби, 411 условий суммирования, 59 Размен, 398, 418 большие значения, 419 большие суммы, 589 Размер стека, 435 Разностный оператор, 565 Разность, n-го порядка, 238 Разрез плоскостью, 39 Райт, сэр Эдуард Мэйтланд (Wright, Sir Edward Maitland), 149, 735, 751, 755, 756 Рам, Жорж де (Rham, Georges de), 745, 757 Рамануджан Иенгар, Сриниваса (Ramanu- jan Iyengar, Srinivasa), 402 Рамаре, Оливер (Ramare, Olivier), 655 Pao, Декката Рамсвар (Rao, Dekkata Rameswar), 745, 756 Раскрутка, 557 Распределение вероятностей, 461 Пуассона, 515, 690 Расходимость, 86 Расходящийся ряд, 636 Расширение обозначения, 77 Рахман, Мизанур (Rahman, Mizanur), 732 Рациональная функция, 261, 411 Редеет, Остин Иохан (R0dseth, 0ystein Johan), 746, 756 Рейнвилль, Эрл Дэвид (Rainville, Earl David), 632, 745 Рейнгольд, Эдвард Мартин (Reingold, Edward Martin), 98 Рейч, Симеон (Reich, Simeon), 745, 759 Рекорде, Роберт (Recorde, Robert), 537, 745 Рекуррентность, 17, 19, 46, 48, 65, 109 неявная, 178, 179, 181 приближенная или асимптотическая, 549
776 Предметный указатель Рекурсия, 19 Релей, Джон Уильям Стратт (Rayleigh, John William Strutt, 3rd Baron), 745 Реми, Жан-Люк (Remy, Jean-Luc), 717 Рени, Джордж Нил (Raney, George Neal), 434, 438, 745, 758 Ренц, Питер Льюис (Renz, Peter Lewis), 12 Ренч, Джон Уильям, мл. (Wrench, John William, Jr.), 714, 722, 760 Репликативная функция, 134 Решение в аналитическом виде, 20 Решето Эратосфена, 149 Рибенбойм, Пауло (Ribenboim, Paulo), 662, 745, 756 Рид (Read), 744 Риман, Георг Фридрих Бернгард (Rie- mann, Georg Priedrich Bernhard), 92, 258, 340, 447, 746, 755 Ринг, Майкл (Ring, Michael С), 146 Роберте, Сэмюэл (Roberts, Samuel), 746, 755 Рой, Раньян (Roy, Ranjan), 746, 756 Роллетчек, Генрих Франц (Rolletschek, Heinrich Franz), 615 Роско, Эндрю Уильям (Roscoe, Andrew William), 739 Россер, Джон Бэркли (Rosser, John Barkley), 148, 746 Рота, Джан-Карло (Rota, Gian-Carlo), 617, 746 Рузса, Имре Золтан (Ruzsa, Imre Zoltan), 727 Рэмшоу, Лайл Гарольд (Ramshaw, Lyle Harold), 102, 754, 757, 759 Ряд Дирихле, 544 Ньютона, 241 Тейлора, 243 Фурье, 592 Салтыков, Альберт Иванович, 557, 746 Самоописывающая последовательность, 93 Саркёзи, Андрас (Sarkozy, Andras), 746 Сбор купонов, 694 Свансон, Эллен Эстер (Swanson, Ellen Esther), 12 Свертка, 250, 405, 427 Вандермонда, 218, 238, 251, 254, 265, 291, 308 Стирлинга, 354 биномиальная, 441 Свинден, Бенджамин Альфред (Swinden, Benjamin Alfred), 755 Свини, Дура Уоррен (Sweeney, Dura Warren), 748 Свойство шестиугольника, 311 Сегё, Габор (Szego, Gabor), 745, 760 Сегеди, Марио (Szegedy, Mario), 628, 724, 749 Седжевик, Роберт (Sedgewick, Robert), 754 Седлачек, Иржи (Sedlacek, Jiff), 747, 758 Секансные числа, 666, 667 Серпиньски, Вацлав Франпишек (Sierpinski, Waclaw Pranciszek), 119, 747, 756 Сивер, Джордж Томас (Seaver, George Thomas), 127, 141, 416 Сигма-обозначение, 42 Сильверман, Дэвид Л. (Silverman, David L.), 747, 758 Сильвестр, Джеймс Джозеф (Sylvester, James Joseph), 175, 748, 749, 755 Символ Кронекера, 45 Система счисления, 143, 158, 360, 553 в остатках, 167, 187 Штерна-Броко, 161, 190 Сичерман, Джордж Лепрехаун (Sicherman, George Leprechaun), 759 Скептицизм, 99 Скиена, Стивен Сол (Skiena, Steven Sol), 654 Скобки, 434 Скорер, Ричард Сигар (Scorer, Richard Segar), 747, 755 Слоан, Нейл Джеймс Александер (Sloane, Neil James Alexander), 65, 414, 719, 747, 755, 756 Словарь, 105 Словински, Дэвид Аллен (Slowinski, David Allen), 146 Случайная величина, 463 переменная, 463 Смесь, 514 Смит, Седрик Остин Варделл (Smith, Cedric Austen Bardell), 747, 755 Событие, 462 Совершенные степени, 93 Совместное распределение, 464 Соглашение о скобках, 16 Сойер, Уолтер Уорвик (Sawyer, Walter Warwick), 746
Предметный указатель 777 Соловьев, Александр Данилович, 492, 747 Сортировка, 49, 224, 428, 456, 540 пузырьковая, 540 Составные числа, 141 Сочетание, 199 Спектр, 107, 129, 133, 135, 372 Спиральная функция, 132 Спон, Уильям Гидеон, мл. (Spohn, William Gideon, Jr.), 747 Спуск, см. Подъем, 328 Сравнимость по модулю, 163 Среднее, 466 арифметическое, 465 дисперсии, 509 Средний биномиальный коэффициент, 238, 315 Ссылка на себя, 635, 636 Стандартное отклонение, 469 Станфордский университет, 7 Стенли, Ричард Питер (Stanley, Richard Peter), 332, 638, 733, 748, 758-760 Степени, закон, 77 Степенной ряд, 249 Стиган, Ирен Энн (Stegun, Irene Anne), 65, 719 Стикельбергер, Людвиг (Stickelberger, Ludwig), 748, 756 Стил, Ги Льюис, мл. (Steele, Guy Lewis, Jr.), 748 Стилтьес, Томас Ян (Stieltjes, Thomas Jan), 735, 748, 755 Стирлинг, Джеймс (Stirling, James), 244, 264, 317, 318, 362, 577, 748 Столлман, Ричард Мэтью (Stallman, Richard Matthew), 748 Ступенчатые функции, 119 Стюарт, Бонни Мэдисон (Stewart, Bonnie Madison), 731, 755 Су, Лич Чинг-Сюр (Hsu, Lee-Tsch (= Lietz = Leetch) Ching-Siur), 736, 757 Субфакториал, 246 Сумма, 41 последовательных m-x степеней, 346 квадратов, 64, 76, 231, 330, 347, 352, 444, 535, 565 кубов, 76, 90, 346, 444 целых чисел, 24, 67, 92 по делителям, 447 неопределенная, 73 определенная, 73 Суммирование по верхнему индексу, 207 по частям, 80, 81, 90, 342 асимптотическое, 560 неопределенное, 280 Суммируемость в гипергеометрических членах, 280 Суммирующий множитель, 48, 91, 337 Суммы, кратные, 56 Сунь Цзы (Sun Tsu (= Sunzi, Master Sun)), 166 Суперпроизводящие функции, 427 Суперфакториал, 301 Сходимость, 260, 403, 636 Сянь-Лянь, Ли (Shan-Lan, Li), 330, 741 Тангенциальные числа, 350, 384 Танни, Стефен Майкл (Tanny, Stephen Michael), 749, 758 Тейзингер, Людвиг (Theisinger, Ludwig), 749, 757 Тейлор, Брук (Taylor, Brook), 211, 351 Телескопические суммы, 74 Теннис, 520 Теоория вероятностей, 461 Теорема Вильсона, 173, 192, 193, 617 Волыитенхольма, 661 Гольдбаха, 93 Пифагора, 610 Ферма, 184, 192, 193 большая, 172, 195 малая, 172 обращение, 193 Эйлера, 175, 184, 190 Теоретико-множественное включение, 537 Теория чисел, 137 Тета-функция, 579 Тиеле, Торвальд Николаи (Thiele, Thor- vald Nicolai), 480, 481, 749 Титчмарш, Эдвард Чарльз (Titchmarsh, Edward Charles), 749, 759 Тогда и только тогда, 96 Тодд, Горас (Todd, Horace), 600 Тождества для чисел Стирлинга, 325 Тождество внесения, 204 Гаусса, 277, 644 Кассини, 356-358, 365, 369, 376, 380 Лагранжа, 91 Эйлера, 303 Тотиента, 174
778 Предметный указатель Точное покрытие, 454 Треугольник Паскаля, 201 продолжение вверх, 212 произведения строк, 301 сумма строки, 210, 213 Стирлинга, 327 Эйлера, 329, 383 числа, 24 Треугольный массив, 59 Тригонометрические функции, 349, 383 Трикоми, Франческо Джакомо Филиппо (Tricomi, Francesco Giacomo Filippo), 749, 760 Трином, 217 Триномиальные коэффициенты, 681 Троеточие (•••)> 41 Трутень, 355 Туран, Пауль (Turan, Paul), 759 Уайльс, Эндрю Джон (Wiles, Andrew John), 172 Уайтхед, Альфред Норт (Whitehead, Alfred North), 123, 603, 718, 750 Убывающие степени отрицательные, 78 производная, 72 разность, 77 факториальные степени, 72 Уивер, Уоррен (Weaver, Warren), 750 Уидден, Сэмюэль Блеквелл (Whidden, Samuel Blackwell), 12 Уилкин, Денис (Wilquin, Denys), 757 Уиппл, Френсис Джон Уэлш (Whipple, Francis John Welsh), 312, 750, 757 Уитти, Карл Роджер (Witty, Carl Roger), 609 Унгар, Питер (Ungar, Peter), 749 Уолл, Чарльз Роберт (Wall, Charles Robert), 722, 757 Уоллис, Джон (Wallis, John), 750, 757 Уоринг, Эдвард (Waring, Edward), 750, 757 Уполовинивание, 237 Упражнения, 11 уровни, 11, 101 Условная вероятность, 501 сходимость, 85 Успенский, Джеймс Виктор (Uspensky, James Victor), 733, 749, 755 Учимура, Кейсуке (Uchimura, Keisuke), 720, 757 Файн, Генри Бархард (Fine, Henry Bur- chard), 717, 744 Факториал, 149, 150, 302 Фибоначчи, 589 обобщение, 244 обобщенный, 264, 268 Факториальные степени, 72, 90, 323 возрастающие, 72 комплексные, 265 отрицательные, 77, 89 убывающие, 72 Фан, 422 Фаулхабер, Иоганн (Faulhaber, Johann), 352, 730, 738 Федер, Томас (Feder, Tomas), 758 Фейсенмайер, Мэри Селина (Fasenmyer, Mary Celine), 286, 751 Феллер, Уильям (Feller, William), 461, 730, 759 Ферма, Пьер де (Fermat, Pierre de), 171, 172, 730 Фи-функция, 175 Фи, 364 Фибоначчи, Леонардо (Fibonacci, Leonardo), 128, 356, 656, 730, 755, 757 Фибоначчиева система счисления, 360, 376, 385 Фибоначчиево нечетные и четные числа, 373 Фибоначчиевы коэффициенты, 664 Фидий (Phidias), 364 Фиксированная точка, 31 Философия, 7, 10, 29, 35, 70, 99, 101, 105, 123, 219, 232, 247, 402, 561, 603, 608, 718 Финетти, Бруно де (Finetti, Bruno de), 45, 730 Финкель, Рафаэль Ари (Finkel, Raphael Ari), 748 Фишер, Майкл Эллис (Fisher, Michael Ellis), 730, 759 Фишер, сэр Рональд Айлмер (Fisher, Sir Ronald Aylmer), 730, 759 Флажоле, Филипп Патрик Мишель (Flajolet, Philippe Patrick Michel), 672 Флойд, Роберт У (Floyd, Robert W.), 757, 758
Предметный указатель 779 Форкадель, Пьер (Forcadel, Pierre), 730, 756 Формальный степенной ряд, 260, 402, 636 Формула Диксона, 269 Куммера, 267, 272 обращения, 244 сложения, 205 Стирлинга, 150 суммирования Пуассона, 716 Эйлера, 564 Тейлора, 478, 565 удвоения, 237, 302 Формулы сверток, 334 Фрай, Роджер Эдвард (Prye, Roger Edward), 172 Франческа, Пьеро делла (Prancesca, Piero della), 757 Фредман, Майкл Лоуренс (Predman, Michael Lawrence), 614, 731 Фрейзер, Александер Юл (Praser, Alexander Yule), 720 Фрейзер, Уильям Дональд (Frazer, William Donald), 731, 756 Фрейм, Джеймс Сатерленд (Frame, James Sutherland), 731, 755 Френель, Джером (Pranel, Jerome), 731 Френкель, Авиезри (Fraenkel, Aviezri S.), 616, 672, 731, 755 Функция v, 31 Бесселя, 259 Мёбиуса, 448, 556, 617 ню Vd, 152 ошибок, 214 аналитическая, 249 голоморфная, 249 логарифмически-экспоненциальная ,533 производящая, 249, 361 Фурье, Жан Баптист Жозе (Fourier, Jean Baptiste Joseph), 42, 731 Фусс, Николай Иванович, 436, 728, 731 Хаимович, Марк (Chaimovich, Mark), 724 Хакер, 164 Халанд Кнутсон, Ингер Иоганн (Haland Knutson, Inger Johanne), 734, 755 Халмош, Пол Ричард (Halmos, Paul Richard), 7, 8, 734 Халфен, Джорджес Генри (Halphen, Georges Henri), 371, 735 Хаммерсли, Джон Майкл (Hammersley, John Michael), 7, 735, 759 Ханойская башня, 17, 47, 189 вариации, 36 Хансен, Элдон Роберт (Hansen, Bldon Robert), 65, 735 Харди, Годфри Гарольд (Hardy, Godfrey Harold), 149, 533, 735, 756, 759 Хенричи, Питер Карл Юджин (Henrici, Peter Karl Bugen), 403, 651, 716, 735, 757, 760 Херес, 521 Хеширование, 495 Хиллман, Абрам П. (Hillman, Abraham P.), 736, 757 Хит-Браун, Дэвид Родни (Heath-Brown, David Rodney), 749 Хоар, сэр Чарльз Энтони Ричард (Ноаге, Sir Charles Antony Richard), 49, 102, 736, 739 Хоггатт, Вернер Эмиль, мл. (Hoggatt, Verner Bmil, Jr.), 736, 741, 756, 757 Холден, Эдвард Синглтон (Holden, Edward Singleton), 744 Холл, Маршалл, мл. (Hall, Marshall, Jr.), 734 Холмбой, Берндт Майкл (Holmboe, Berndt Michael), 719 Холмс, Томас Шерлок Скотт (Holmes, Thomas Sherlock Scott), 209, 285 Хофштадтер, Дуглас Ричард (Hofstadter, Douglas Richard), 755 Цапф, Герман (Zapf, Hermann), 12, 739 Цеккендорф, Эдуард (Zeckendorf, Edouard), 360, 672, 751 Целая часть, 98 Целочисленные функции, 95 Цикл, 320, 599 Циклические биномиальные коэффициенты, 310 Циклический сдвиг, 30 Цирик, Янош Андрас (Csirik, Janos Andras), 702, 725 Чанг, Фэн-рон Кинг (Chung, Fan-Rong King), 13, 724, 758 Частичные суммы, 213 Частное, 113 Чебышев, Пафнутий Львович, 61, 189, 724, 755
780 Предметный указатель Чейс, Арнольд Баффум (Chace, Arnold Buftum), 723, 755 Червяк на резинке, 336, 341, 590, 658 Честные игральные кости, 462 Числа, 317 Апери, 296, 315 Белла, 450, 590, 718 Бернулли, 381, 384, 443, 564, 657 вычисление, 351 обобщенные, см. полиномы Стирлин- га, 333 гармонические обобщенные, 447 производящая функция, 425 Дженоччи, 658, 684 Евклида, 144, 188, 196 Иосифа, 112, 130 Каталана, 232, 256, 384, 433 Кнута, 109, 130, 133 Люка, 378 Мерсенна, 146, 196, 356 многократной точности, 168 свободные от квадратов, 188 секанса, 680 Стирлинга, 317, 353, 384, 589 первого рода, 320 как суммы произведений, 679 обобщенные, 333 производящая функция, 426 свертки, 334 тангенса, 680 Ферма, 173, 188 Фибоначчи, 354, 367, 390, 402, 685 второго порядка, 453 производящая функция, 410 Фрейнела, 655 Фусса-Каталана, 436 Эйлера, 330, 680, 739 второго порядка, 331 обобщенные, 379 производящая функция, 426 автоморфные, 622 гармонические, 50, 576 квадратно пирамидальные, 66 свободные от квадратов, 196 треугольные числа, 24 Член, 41 Чу Ши-цзе (Chu Shih-Chieh (= Zhu Shijie)), 218 Шаллит, Джеффри Аутлоу (Shallit, Jeffrey Outlaw), 747, 757 Шарп, Роберт Томас (Sharp, Robert Thomas), 334, 747 Шёнфельд, Лоуэлл (Schoenfeld, Lowell), 148, 746 Шёнхайм, Иоханен (Schonheim, Johanen), 724 Шинцель, Анджей (Schinzel, Andrzej), 628 Шлёмильх, Оскар Ксавье (Schlomilch, Oscar Xaver), 746 Шмидт, Асмус Лоренцен (Schmidt, Asmus Lorenzen), 757 Шор, Питер Уиллистон (Shor, Peter Williston), 755 Шредер, Эрнст (Schroder, Ernst), 746, 758 Шредингер, Эрвин (Schrodmger, Erwin), 517 Шрётер, Генрих Эдуард (Schroter, Heinrich Eduard), 747, 758 Шрифт, 12 Штайн, Шерман Копальд (Stein, Sherman Kopald), 755 Штайнер, Якоб (Sterner, Jacob), 22, 748, 755 Штаудт, Карл Георг Христиан фон (Staudt, Karl Georg Christian von), 748, 757 Штейнгауз, Гуго Донизи (Stemhaus, Hugo Dyonizy), 759 Штенгель, Чарльз Дил-лон (Stengel, Charles Dillon (= Casey)), 65 Штерн, Мориц Абрам (Stern, Moritz Abraham), 155, 748 Штраус, Эрнст Габор (Straus, Ernst Gabor), 672, 727, 743 Штрел, Карл Эрнст Фолкер (Strehl, Karl Ernst Volker), 655, 748, 757 Шюценбергер, Марсель Пауль (Schiitzen- berger, Marcel Paul), 760 Эдварде, Энтони Уильям Фербанк (Edwards, Anthony William Fairbank), 727 Эйзенштейн, Фердинанд Готтхольд Макс (Eisenstein, Ferdinand Gotthold Max), 255, 727 Эйлер, Леонард (Euler, Leonhard), 12, 73, 162, 172, 173, 255, 258, 260, 264, 302, 328, 340, 349, 367, 368, 564, 566, 614, 633, 658, 685, 717, 721, 725, 728-730, 743, 749, 755, 756, 758, 759
Предметный указатель 781 Эйлеровы числа, 666, 667 Эйнштейн, Альберт (Einstein, Albert), 102, 372 Экспоненциальная производящая функция, 440 функция, дискретный аналог, 79 Экспоненциальный ряд, обобщенный, 253 Экхад, Шалош Б. (Ekhad, Shalosh В.), 652 Элементарное событие, 463 Элементарные дроби, 91 Элкис, Наум Давид (Elkies, Noam David), 172, 727 Эндрюс, Джордж У. Эйр (Andrews, George W. Eyre), 270, 402, 634, 685, 720, 757 Эратосфен (Eratosthenes), 149 Эрдейи, Артур (Erdelyi, Arthur), 749, 760 Эрдёш, Поль (Erdos, Pal (= Paul)), 756, 759, 503, 628, 655, 685, 727 Эрмит, Шарль (Hermite, Charles), 643, 663, 735, 748, 757 Эсваратасан, Арулаппах (Eswarathasan, Arulappah), 727, 757, 758 Эффективность, 44 Юнген, Рейнвальд (Jungen, Reinwald), 737, 758 Яблоко и червяк, 517 Ядро, 447 Яйцо, 205 Якоби, Карл Густав Якоб (Jacobi, Carl Gustav Jacob), 91, 736 Янсон, Карл Сванте (Janson, Carl Svante), 736 Яо, Ки (Yao, Qf), 741 Яо, Френсис Фунг Чу (Yao, Prances Foong Chu), 12 Яо, Эндрю Чи-Чи (Yao, Andrew Chi-Chih), 12
Список таблиц Суммы и разности 80 Треугольник Паскаля 201 Треугольник Паскаля: продолжение вверх 212 Суммы произведений биномиальных коэффициентов 218 Десять главных тождеств с биномиальными коэффициентами 222 Общие соотношения свертки, справедливые при целых п~^> 0 255 Треугольник Стирлинга для числа подмножеств 319 Треугольник Стирлинга для числа циклов 318 Основные тождества для чисел Стирлинга при целом n ^ 0 325 Дополнительные тождества для чисел Стирлинга при целых I, ггц n ^ 0 326 Треугольники Стирлинга в тандеме 328 Треугольник Эйлера 329 Треугольник Эйлера второго порядка 331 Формулы сверток Стирлинга 334 Преобразования производящих функций 406 Простые последовательности и их производящие функции 407 Производящие функции для специальных чисел 425 Асимптотические аппроксимации, справедливые при п-)ооигч0 545 Оригинал-макет американского издания подготовлен в Станфордском университете при помощи издательской системы T^jK для технических текстов, разработанной Д. Э. Кнутом. Для набора математических формул использовано новое семейство шрифтов AMS Euler (Version 2.1), разработанное Германом Цапфом по заказу Американского математического общества. Текст набран шрифтами Concrete Roman и Italic— новой версией семейства Computer Modern Д. Э. Кнута, гармонирующей с математическими шрифтами AMS Euler.
АЛГОРИТМЫ ПОСТРОЕНИЕ И АНАЛИЗ ВТОРОЕ ИЗДАНИЕ Томас Кормен Чарльз Лейзерсон Рональд Ривест Клиффорд Штайн АЛГОРИТМЫ ПОСТРОЕНИЕ И АНАЛИЗ www.williamspublishing.com Фундаментальный труд известных специалистов в области кибернетики достоин занять место на полке любого человека, чья деятельность так или иначе связана с информатикой и алгоритмами. Для профессионала эта книга может служить настольным справочником, для преподавателя — пособием для подготовки к лекциям и источником интересных нетривиальных задач, для студентов и аспирантов — отличным учебником. Описание алгоритмов на естественном языке дополняется псевдокодом, который позволяет любому имеющему хотя бы начальные знания и опыт программирования, реализовать алгоритм на используемом им языке программирования. Строгий математический анализ и обилие теорем сопровождаются большим количеством иллюстраций, элементарными рассуждениями и простыми приближенными оценками. Широта охвата материала и степень строгости его изложения дают основания считать эту книгу одной из лучших книг, посвященных разработке и анализу алгоритмов. ISBN 5-8459-0857-4 в продаже
ИСКУССТВО ПРОГРАММИРОВАНИЯ ТОМ1. ОСНОВНЫЕ АЛГОРИТМЫ, 3-Е ИЗДАНИЕ ТОМ 2. ПОЛУЧИСЛЕННЫЕ МЕТОДЫ, 3-Е ИЗДАНИЕ томз. СОРТИРОВКА И поиск, 2-Е ИЗДАНИЕ Дональд Э. Кнут КЛАССИЧЕСКИЙП'УД ИСИРЛИЛШНО!: И Л0П0ЛНШПО1! ШДЛ1И1Г. Искусство программирования ТОМ 1 Основные алгоритмы Третье издание 1Я ДОНАЛЬД э. кнут ,1-1,<J» JL JU UL IU/LX, U4 А IX A J А ДиНАЛЬД^.КНУ! в продаже www.williamspublishing.com На мировом рынке компьютерной литературы существует множество книг, предназначенных для обучения основным алгоритмам и используемых при программировании. Их довольно много, и они в значительной степени конкурируют между собой. Однако среди них есть особая книга. Это трехтомник "Искусство программирования" J\. Э. Кнута, который стоит вне всякой конкуренции, входит в золотой фонд мировой литературы по информатике и является настольной книгой практически для всех, кто связан с программированием. Ценность книги в том, что она предназначена не столько для обучения технике программирования, сколько для обучения, если это возможно, "искусству" программирования, предлагает массу рецептов усовершенствования программ и, что самое главное, учит самостоятельно находить эти рецепты.