Текст
                    ? Ъ ■"* 1
КОЛОСОВ
i и задачи
теории чисел
ательство «Гелиос Ассоциации российских вузов»


В. А. Колосов Теоремы и задачи алгебры, теории чисел и комбинаторики Учебное пособие Москва «Гелиос АРВ» 2001
УДК 512.8 ББК 22.14+22,19 К 26 Колосов В. А, К 26 Теоремы и задачи алгебры, теории чисел и комбинаторики. — М.: Гелиос АРВ, 2001. — 256 с. ISBN 5-85438-021-8 Учебное пособие предлагает введение в теорию чисел и комбинаторику с позиций конкретной математики. Изложены также классические разделы алгебры — теория решения уравнений и исключения неизвестных. Для студентов, специализирующихся по математике и информатике. ББК 22.14+22.19 Издание выпущено в авторской редакции. Учебное пособие Вадим Александрович Колосов ТЕОРЕМЫ И ЗАДАЧИ АЛГЕБРЫ, ТЕОРИИ ЧИСЕЛ И КОМБИНАТОРИКИ Оригинал-макет подготовлен в пакете 1ЛТ£Х2е. Корректор £. Н. Клитина Лицензия ЛР № 066255 от 29 декабря 1998 г. Издательство «Гелиос АРВ». 104140» Москва, Верхняя Красносельская ул., 16. Тел./факс: 264-44-39, e-mail: gelios_arv@pochtamt.ru. Формат 60x84/16. Печать офсетная. Бумага офсетная. Объем 16 п. л. Тираж 3000экз. Зак. № 1548. Отпечатано с готовых диапозитивов в РГУП «Чебоксарская типография №1». 428019, г. Чебоксары, пр. И. Яковлева, 15. О Колосов В. А., 2001 ISBN 5-85438-021-8 О Оформление. Авилкин С. Н., 2001
Предисловие В этой книге дается введение в комбинаторику и теорию чисел. Она представляет собой начальный курс для студентов — математиков и ин- форматиков, решивших специализироваться в этих областях или использовать их в работе. Ныне набирает силу тенденция повышения роли конкретной математики, а принятый здесь элементарный подход находится в русле этой тенденции. Главное место в нашей книге играют примеры и задачи, а не теории и аксиоматика. Для понимания основной части книги не требуется знаний, выходящих за рамки школьной программы. Главными условиями в отборе материала для нас была его нетривиальность и полезность для приложений. Именно поэтому большая часть теорем в этой книге непосредственно связана с разбираемыми вместе с ними задачами. Например, теорему Эйлера из арифметики иллюстрирует не только система шифрования RSA, но и связанные с поиском больших простых чисел тесты Миллера — Рабина и Соловэя — Штрассена. Свойства классов вычетов вводятся как средства, необходимые для «взлома» простейших криптосистем и для построения конечных проективных плоскостей. Группы перестановок изучаются в связи с теорией решениия алгебраических уравнений и подсчетом числа многогранников с окрашенными гранями. В связи с этим подходом пришлось делать лакуны в доказательствах некоторых теорем. Все эти случаи оговариваются в тексте. В основном они связаны с дублированием стандартного материала (линейной алгебры, разложением рациональной функции в сумму простейших дробей и т.п.). Мы не стали занимать место доказательством того, что конечное поле состоит из рп элементов. Вместо этого мы доказали рекуррентную формулу и оценки для числа неприводимых многочленов над полем вычетов, и из существования неприводимого многочлена любой степени вывели существование конечных полей. Приведя процедуру получения линейного представления для НОДа двух целых чисел из строчек алгоритма Евклида, мы не стали выводить из наличия линейного представления однозначность разложения на простые множители. Это доказательство мы провели для случая многочленов над числовым полем в другой главе, оставив, конечно, ссылку на это доказательство. Как нам кажется, при помощи подобных приемов нам удалось сохранить логический каркас алгебраических теорий, стоящих за решением конкретных задач.
В книге не приведены аксиомы для групп, колец и полей. Все эти понятия выступают в своих конкретных вариантах. Группы — как группы перестановок. Поля —■ как поля алгебраических чисел. Кольца — как числовые системы, введенные для изучения решений уравнений в целых числах. Заметим, что мы следуем историческому подходу по введению этих понятий. Мы предпочли дать подробную теорию решения уравнения Пелля и уравнения ж3 + у3 = z3 обсуждению понятий «кольцо» и «обратимый элемент кольца», не указав даже, что это — конкретные (и исторически первые) примеры работы с этим понятиями. В заключение приведем несколько слов в обоснование нашего подхода. Он связан не только с современной ориентацией обучения на приложения математических теорий. Дело в том, что при изложении материала нужно ориентироваться на объекты, которые основательнее всего укореняются в человеческой памяти. Это — отнюдь не системы аксиом и не логические приемы в доказательстве теорем. Изящное решение красивой задачи, формулировка которой ясна и доступна, имеет больше шансов удержаться в памяти студента нежели абстрактная теория. Скажем больше, именно по такому решению, при наличии некоторой математической культуры, студент впоследствии сможет восстановить теоретический материал. Обратное же, как показала практика, совершенно невозможно.
Содержание Многочлены и алгебраические уравнения 9 1.1 Схема Горнера. Теорема Безу 9 1.2 Интерполяция 15 1.3 Решение уравнения третьей степени 18 1.4 Метод Виета 22 1.5 Гиперболическая тригонометрия 24 Комбинаторика 27 2.1 Возрастающие и убывающие степени 27 2.2 Число подмножеств. Бином Ньютона 30 2.3 Полиномиальная формула 34 2.4 Формула «включений и исключений» 39 Комплексные числа 45 3.1 Алгебраическая форма комплексного числа 45 3.2 Тригонометрическая форма комплексного числа 49 3.3 Применение комплексных чисел 54 3.4 Теорема Даламбера — Гаусса 57 Резольвенты уравнений 63 4.1 Резольвенты Лагранжа 63 4.2 Решение общего уравнения четвертой степени 68 4.3 Резольвенты уравнения четвертой степени 71
6 СОДЕРЖАНИЕ 5 Решение уравнений в целых числах 77 5.1 Решение линейного уравнения в целых числах 77 5.2 Свойства цепных дробей 80 5.3 Уравнение Пелля. Существование решения 85 5.4 Циклический метод 88 5.5 Теорема Эйлера — Лагранжа 90 6 Сравнения и диофантовы уравнения 93 6.1 Сравнения и классы вычетов 93 6.2 Латинские квадраты 98 6.3 Основные теоремы 103 6.4 Сравнения по составному модулю 108 6.5 Метод бесконечного спуска 112 6.6 Последняя теорема Ферма 114 7 Квадратичный закон взаимности 119 7.1 Решение квадратных сравнений 119 7.2 Квадратичный закон взаимности 124 7.3 Приложения закона взаимности 129 8 Гауссовы суммы 137 8.1 Простейшие гауссовы суммы 137 8.2 Число решений сравнения 139 8.3 Общие суммы Гаусса и Якоби 145 9 Симметрические многочлены 153 9.1 Перестановки 153 9.2 Симметрические многочлены 160 9.3 Теорема Абеля — Руфини 165 10 Поля алгебраических чисел 171 10.1 Три проблемы древности 171 10.2 Правильные многоугольники 176 10.3 Поля алгебраических чисел 179 10.4 Поля деления круга 187 11 Дополнительные главы алгебры ^ 193 11.1 Исключение неизвестных 193 11.2 Преобразование Чирнгаузена 196
СОДЕРЖАНИЕ 7 11.3 Теорема Лиувилля 199 11.4 Теорема Дюма 200 12 Производящие функции 203 12.1 Числа Стирлинга и Эйлера 203 12.2 Производящие функции 211 12.3 Числа Бернулли и Эйлера 221 12.4 Числа Каталана и Фибоначчи 233 13 Дополнительные главы комбинаторики 237 13.1 Разбиения 237 13.2 Блок-схемы ' 246 13.3 Теорема Рамсея 250
Глава 1 Многочлены и алгебраические уравнения 1.1 Схема Горнера. Теорема Безу Пусть уравнение я3 + а\х2 4- п2Х + аз = 0 имеет корни х\, х2> яз- Тогда его левую часть можно представить в виде (х - Х\){х - Хг)(х - х$). Раскроем скобки и приравняем коэффициенты при одинаковых степенях переменной. Получаем следующую систему уравнений относительно переменных Эта система имеет решение (u,v,w) тогда и только тогда, когда множество {u, v, w} является множеством всех решений исходного уравнения. Таким образом, решения системы будут получаться из множества решений уравнения выписыванием всех элементов этого множества в определенном порядке. Этот факт составляет содержание теоремы Виета для уравнения третьей степени. Разберем следующую классическую задачу.
10 ГЛАВА 1. МНОГОЧЛЕНЫ И АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ Задача. Решить систему: х + у 4- z — а x2+y2 + z2 = а2 х3 + у3 4- z3 = а3 для произвольного значения параметра а. П Чтобы применить теорему Виета в этом случае, нужно преобразовать эту систему в систему Виета для уравнения третьей степени. Первое уравнение уже имеет нужный вид. Со вторым уравнением справиться несложно: х2 + у2 + z2 = {х + у + z)2 - 2{ху + yz + zx) = а2 - 2{ху + yz 4- zx) = а2. Второе уравнение принимает вид ху 4- yz 4- zx = 0. Чтобы преобразовать третье уравнение, придется воспользоваться тождеством: х3 4- 2/3 4- z3 - Зх?/2 = (я + у + г)(х2 4- у2 4- 22 - ху - yz - zx) = = (х 4- у 4- г)((.т 4- у 4- z)2 - 3(яу + yz + zx)) = a3. Отсюда получаем третье уравнение: xyz = 0. Система Виета принимает вид: х 4- у 4- г = а ху + yz + zx = 0 = 0. Она соответствует уравнению третьей степени: t3 — at2 = 0. Множество корней имеет вид: {0,0,а}. Решения системы составляют следующее множество при а ^ 0 : {(а, 0,0), (0, а,0), (0,0, а)}. При а = 0 имеется ровно одно решение системы — (0,0,0).О Совершенно аналогично получается теорема Виета для уравнения четвертой степени хА-\-a\x3-\-а2х2 -\-а^х + аА = 0 с корнями Х\,Х2, язi £4• Левая часть уравнения принимает вид: (х - х{){х - я2)(х - Хз)(ж - 2:4). Раскрыв скобки и приравняв коэффициенты при одинаковых степенях переменной, получим систему Виета: Х\ 4- Х2 + Хз + Х4 = -tli Х1Х2 + Х1Х3 -I- X1X4 4- х2х3 4- Х2Х4 + Х3Х4 = «2 Х1Х2Х3 4- Х1Х2Х4 4- Х1Х3Х4 4- £2X3X4 = ~~аз Х1Х2Х3Х4 = ^4-
1.1. СХЕМА ГОРНЕРА. ТЕОРЕМА БЕЗУ 11 Утверждение теоремы Виета состоит в том, что множество корней уравнения четвертой степени имеет вид {a^b^cyd} тогда и только тогда, когда все решения системы Виета получаются выписыванием всех элементов этого множества в виде четырехчленной последовательности всеми возможными способами. Пример. Решить уравнение хА 4-4ж3 — 2х2 - 12я4-9 = 0, если известно, что оно имеет две пары равных корней. D Пусть корни уравнения записываются в виде: Х\ = Х2 = и, хз = Х4 = v. Тогда система Виета перепишется следующим образом: 2(u + v) = -4 и2 + 4ш; 4- v2 = (и + v)2 4- 2uv = -2 2uv(u + w) = 12 М2 = 9. Из первых двух уравнений получается, что u + v = -2, ш; = -3. Отсюда получаем множество решений исходного уравнения — {1,1, —3, —3}. О Последнее уравнение можно было решить другим способом. Станем искать целые решения. Перенесем свободный член в правую часть с противоположным знаком: х(х3 + Ах2 -2х- 12) = -9. Произведение двух целочисленных множителей равно -9. Значит, для переменной х имеются следующие возможные целые значения: ±1,±3,±9. Подставляя их в уравнение, получим, что только 1 и —3 являются корнями. Для нахождения остальных корней представим левую часть исходного уравнения в виде произведения квадратного трёхчлена х2 4- ах + Ь с неопределёнными коэффициентами на квадратный трехчлен (х~ 1)(л; + 3) = х2 + 2х - 3. В результате получим тот же самый квадратный трехчлен а = 2, Ь — —3. Значит, левая часть исходного уравнения представляла собой квадрат квадратного трех члена. Наблюдение, позволившее нам решить уравнение вторым способом, мож-но оформить в виде следующего утверждения. Утверждение. Все целые корни многочлена со всеми целыми коэффициентами и со старшим коэффициентом, равным единице, находятся среди делителей свободного члена. П Это утверждение можно обобщить на случай произвольного многочлена с целыми коэффициентами — f(x) = аохп + aixn~l 4-... + ап-\Х 4- ап.
12 ГЛАВА 1. МНОГОЧЛЕНЫ И АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ Пусть х = p/q — несократимая дробь — рациональный корень этого многочлена. Тогда, Qnf(p/q) = «0Pn + arf^q + ... + an-lPqn-1 + anqn = 0. Заметим, что р должно быть делителем произведения anqn. Значит, р — делитель ап. Аналогично получим, что q — делитель оо- Таким образом, при помощи перебора делителей коэффициента при старшем члене и делителей свободного члена можно найти все рациональные корни многочлена с целыми коэффициентами. Большую роль в доказательстве и получении разнообразных алгебраических результатов играет деление многочленов с остатком. Разделить многочлен /(х) на многочлен д(х) означает подобрать такую пару многочленов q(x) и г(х), что f(x) — q(x)g(x) + r(x)y причем степень многочлена г(х) меньше степени многочлена д(х). Практический алгоритм нахождения этих q(x) и г(х) ■— деление f(x) на д(х) столбиком. Заметим, что если многочлены f(x) и д(х) были с целыми коэффициентами и старший коэффициент многочлена д(х) равен единице, то многочлены q(x) и г(х) будут иметь только целые коэффициенты. При делении столбиком придется умножать многочлен д(х) лишь на целые кратные степеней переменной х. Отметим также, что при делении на многочлен первой степени остаток является константой. Теорема Безу* Число хо тогда и только тогда является корнем многочлена /(я), когда существует такой многочлен q(x), что f(x) = (х - xo)q(x). Доказательство^ Если имеет место такое представление для /(ж), то, подставляя в него х = хо, получим: /(хо) = 0. Обратно, пусть хо — корень многочлена /(х). Разделим многочлен /(х) на многочлен х-хо: /(х) = g(x)(x-xo)+r. Здесь г — действительное число. Оно равно нулю. В самом деле, подставим в это равенство х = хо : 0 = /(хо) = q(xo)(xo - х0) + г. О Задача. При каких значениях параметра а многочлен х3+ y3+z3+axyz делится на многочлен х 4- у + z. О Рассмотрим это выражение как многочлен от переменной z (x и у будут при этом параметрами). Тогда выделение этого множителя эквава- лентно наличию у многочлена корня z = -х - у. Подставим этот корень в многочлен: я3 + 2/3 - (х + у)3 - аху(х + у) = -(а + 3)(х + у)ху = 0.
1.1. СХЕМА ГОРНЕРА. ТЕОРЕМА БЕЗУ 13 Отсюда следует, что а = -3.D Имеется удобный алгоритм для нахождения частного и остатка при делении с остатком многочлена /(х) = a$xn + a\xn~l + ... + ап на многочлен х - zq: f{x) — q(x)(x - х0) + r. Остаток г равен значению многочлена f(x) в точке х0 (подставим х = xq в эту формулу), так что заодно мы получим способ быстрого подсчета значения многочлена в произвольно взятой точке. Пусть q(x) = boxn~l + bixn~2 + ... + Ьп_ь Приравняем коэффициенты при одинаковых степенях в левой и правой частях равенства: /(х) + xoq{x) = xq{x) + г. аохп + xobo)x n~'1 ... + ап -i = boxn r. Получаем цепочку равенств: = a0, 61 = Одна и та же процедура повторяется многократно. Этот алгоритм называется схемой Горнера. Задача. Вычислить /(4), если f(x) = х4 - За;3 + 6я2 - Юя + 16. О Выпишем таблицу, в которой верхняя строчка будет состоять из коэффициентов многочлена /(х), а нижняя — из коэффициентов многочлена q{x). В самом конце нижней строчки вставим /(4). Нижнюю строчку будем заполнять последовательно слева направо. Первый элемент — это ао = 1. Каждый очередной элемент будет получаться в результате учетверения предыдущего и прибавлением элемента из второй строчки, стоящего над этим элементом. 1 1 -3 1 6 10 -10 30 16 136 Получилось /(4) = 136.□ Схема Горнера позволяет быстро перейти к переменной х — хо от переменной х. Для этого ее нужно применить к многочлену q(x) и ко всем вновь получаемым многочленам. Для этого можно просто приписать новые строчки к полученной таблице. 1 1 1 1 1 5 9 13 10 30 66 — 30 150 — — 136 — — —
14 ГЛАВА 1. МНОГОЧЛЕНЫ И АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ Получилась формула: /(я) = {х- 4)4 4- Щх - 4)3 + Щх - 4)2 + 150(я? - 4) + 136. Если в подобной формуле ровно к штук крайних справа коэффициентов равны нулю, то говорят, что кратность корня хо равна к. По-другому это условие можно сформулировать следующим образом: многочлен f(x) делится на (х - хо)к, но не делится на (х - яго)*+1. Формула для решений квадратного уравнения f(x) = х2 + ах + Ь = О, известная из школьной математики, имеет вид: 31,2 = (-а ± \/а2 - 46)/2. Этой формуле можно придать иной вид. Например, такой: (а + ±у/а2 - 46)тг + 26 Знак здесь выбирается один и тот же в числителе и в знаменателе. Кажется невероятной связь числа 7Г с квадратным трехчленом. Однако конкретные вычисления корней по этой формуле подтверждают ее истинность. Все дело в том, что существует бесконечное множество формул для корней квадратного трехчлена (или бесконечное множество разновидностей этой формулы). Выберем число с произвольным образом. Имеет место следующая формула для корней исходного уравнения: (а + ±у/а2 - Щс + 26 a?i,2 = -* Здесь нужно только, чтобы 2с Ф — а ± у/а2 — 46 (мы избегаем обращения в ноль знаменателя дроби). Для доказательства этой экзотической формулы рассмотрим выражение: f{x, У) = ху + а(х + у)/2 + 6, /(яг, х) = /(яг). Имеет место формула: /2(х,у) - f(x)f(y) = («2/4 - Ь)(х - у)2. В самом деле, (ху + а(х + у)/2 4- б)2 - {х2 + ах + Ь){у2 + ау + Ь) =
1.2. ИНТЕРПОЛЯЦИЯ 15 = х2у2 4- а?(х 4- у)2/4 4- Ь2 + аху(х + у) + аЬ(х + у) + 2Ьху4- -x2j/2 - Ь2 - а2ху - ах2/(х 4- у) - 6(х2 4- у2) - аЬ(х + у) = = а2(х - у)2/4 - Ь(х2 + у2) + 2Ьху = (а2/4 - Ь)(х - т/)2. Подставим в эту формулу х = xit2, У — с. При этом /(ж) = 0. После извлечения квадратного корня получается формула: xii2c + а(ж1,2 + с)/2 + Ь = ±\/а2 - 4fc(zi,2 - c)/2. Из этой формулы легко получается доказываемый факт. Обычная формула для корней квадратного уравнения получается переходом к пределу при с -> оо. Другими словами, если выбрать с большим по модулю и разделить на него числитель и знаменатель полученной формулы, то они будут лишь малыми добавками отличаться от числителя и знаменателя обычной формулы. При помощи теоремы Виета легко выразить дискриминант через корни: D = а2 - 46 = (хг + х2)2 - 4хгх2 = (хг - я2)2. Обобщение этой формулы для уравнений высших степеней позволяет определить дискриминант для них. Упражнения 1. Выписать условие, при котором многочлены делятся друг на друга: а) х3 + рх 4- д, х2 + тпх — 1; Ь) а:4 4- рх2 + <?, х2 4- mz + 1. 2. При помощи схемы Горнера раскрыть скобки и привести подобные слагаемые многочлена f(x + 3), где a) f(x) = х4 - хг + 1; Ь) /(х) = х4 4- 4х3 + 6х2 + Юх + 20. 3. Обозначим через sn сумму xj 4- х£ п-х степеней корней уравнения х2 + ах + b = 0. Выразить sn через sn_i и sn_2. 1.2 Интерполяция Метод математической индукции Важную роль для доказательства многих предложений играет следующий метод проверки некоторое предположение Р(га), зависящее от натурального п. Разберем его на примере. Задача. Доказать неравенство Бернулли:
16 ГЛАВА 1. МНОГОЧЛЕНЫ И АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ для х > — 1 и любого натурального п (1 + х)п > 1 + пх. D Пусть предположение Р(1) истинно (проверку этого называют начальным шагом индукции). Для доказательства исходного предположения для всех натуральных п достаточно доказать следующий факт: из того, что истинны предположения Р(1), Р(2),... , Р(к - 1) (этот факт называют предположением индукции), вытекает истинность предположения Р{к). Обычно из Р(к-1) выводят Р(к). Например, неравенство Бернулли доказывается следующим образом. Начальный шаг индукции очевиден: (1 + х)1 > 1 + 1 • х. Пусть выполняется неравенство (1 + x)fc — 1 > 1 + (fc — 1)х для х > — 1. Умножим обе части этого неравенства на положительное число 1 -f x : (1 + х)к > (1 + х)(1 + (* - 1)х) = 1 + кх + (к - 1)х2 > 1 + кх. Получили доказываемое предположение (последний член (к - 1)х2 неотрицателен) □ Докажем методом математической индукции следующее предложение. Предложение. Пусть xi,X2>... Ухп — различные корни многочлена f(x). Тогда f(x) делится на многочлен (х - xi)(x - Х2)... (х - хп). Доказательство. D Для п = 1 это предложение вытекает из теоремы Безу. Пусть это предложение верно для п = к - 1. Докажем его для п = к. Многочлен /(х) имеет корень х*. Значит, существует такой многочлен <?(х), что f(x) = (х - Xk)g{x). Этот многочлен имеет корни хьх2,... ,x*_i. Действительно, 0 = /(xj = (хг-хк)д(х{) i = 1,2,... , к- 1. Согласно предположению индукции, многочлен <?(х) делится на многочлен (х - Xi)(x - хг)... (х - x*_i). Отсюда следует, что /(х) делится на (x-xi)(x-x2)...(x-xfe). D Следствие. Многочлен степени п имеет не больше чем п корней. Доказательство. D Пусть некоторый многочлен степени п имеет больше чем п корней, тогда он делится на многочлен степени большей чем п. Это невозможно, так как при перемножении многочленов их степени складываются. D Тут полезно отметить, что степень нулевого многочлена неопределена (в некоторых учебных пособиях ее полагают равной -оо). Контрпример. □ Пусть а,Ь,с — различные числа. Тогда многочлен (х - а)(х - Ь) (х-6)(х-с) (х-с){х-а) (с-а)(с-Ь) (а-Ь){а-с) (Ь-с)(Ь-а) имеет по крайней мере три корня — а, 6, с. Противоречие с приведенной
12. ИНТЕРПОЛЯЦИЯ 17 выше теоремой объясняется тем, что этот многочлен — нулевой, его корнем является любое число. □ Теорема. Существует единственный многочлен /(я), который в заданных п +1 точках — So, xi,... , хп — принимает заданные значения — /(zo)> /(si)i • • • 1 /(хп)5 если считать, что его степень не должна превосходить п. Доказательство. D Сначала приведем такой многочлен: Z^ * (2?fc - Х0)(ХА; - Xi) . . . (х* - Zk-l){zk - ICjb+l) •••(x* ~ Х„) ' Теперь докажем, что других многочленов, принимающих в заданных точках заданные значения, не существует. Пусть есть еще один такой многочлен Д (х). В таком случае ненулевой многочлен /(х) - f\{x) принимает в заданных точках нулевые значения. Этот многочлен имеет степень не больше п. Получили противоречие с наличием у него п + 1 корня.□ Выше мы заметили, что (х-а)(х-Ь) (х-Ь){х-с) (х-с)(х-а) = (с - а)(с - Ь) (о - Ь)(а - с) (6 - с)(Ь - а) Значит, приведенный выше многочлен f(x) не всегда имеет степень п. Исаак Ньютон нашел практический способ определения коэффициентов многочлена f{x). Станем искать его в виде: f(z) = ао+ai(x-xo)+a2(x-zo){x-xi)+.. .+an(x-x0)(x-xi)... (z-zn-i). Заметим, что в этой записи не участвует число хп. Однако его необходимо знать для того, чтобы определить коэффициент оп. Коэффициенты последовательно определяются при помощи подстановки х = xiy i — 0,1,... , п. Сначала подставим х = хо- Получим оо = f{xo). Затем подставим х = х\. Получим равенство: а\ — х\~хош Коэффициенты будут получаться последовательно друг за другом. Пример. Найдем многочлен f(x), принимающий в точках 1,2,... ,гс нулевое значение, а в точке х = 0 принимающий значение 1. Найдем его по способу Ньютона: /(х) = а0 + oix + d2x{x - 1) + ... + апх(х - 1)... (х - п + 1). Получим оо = 1, oi = — 1. Легко заметить, что а* = {—\)к/к\. В результате мы получили тождество: 1 - х + х(х - 1)/2! - ... + (- 1)пх(х - 1)... (х - п + 1)/п! =
18 ГЛАВА 1. МНОГОЧЛЕНЫ И АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ Заодно мы решили известную задачу, которая состоит в нахождении корней многочлена, стоящего в левой части.□ Упражнения 1. Найти многочлен степени п, который в точках 1,2,... ,п +1 принимает значения 1, £,... , ^^-, соответственно. итвет. i 12 2. Найти многочлен степени п, который в точках 0,1,2,... , п принимает значения 1,2,4,... ,2й, соответственно. Ответ: 1 + f + ^f^ + ... + х{х'112'{ХпП+1) - 1.3 Решение уравнения третьей степени Общее уравнение третьей степени имеет вид: х3 -\-aiX2 + а2я + а3 = 0, где а1,а2,аз — произвольно заданные параметры. Его можно свести к уравнению z3 + az -f 6 = 0, имеющему более простой вид. Для этого из первых двух слагаемых выделим полный куб: + (3(<*i/3)2s + (oi/3)3) - (а?х/3 + а?/27) + а2х + а3 = 0; (ж + Oi/З)3 + (а2 - а?/3)ж + а3 - а\/27 = 0. Теперь можно переписать уравнение для переменной z = х + ai/3. 2г3 + (а2 - al/3)z - (а2 - aJ/3)ai/3 + а3 - ai/27 = 0. Итак, а = а2 - a?/3, b = а3 - aia2/3 + 2a?/27. Уравнение ^3 ■+■ az -f fe = 0 также называют общим уравнением третьей степени. Для его решения используем метод Гудде, который состоит в представлении переменной z в виде суммы двух частей: z — и + v. На эти части будет наложено дополнительное условие (равенство). Вместе с исходным уравнением дополнительное условие составит систему из двух уравнений с двумя неизвестными. По решениям системы будут строиться
1.3. РЕШЕНИЕ УРАВНЕНИЯ ТРЕТЬЕЙ СТЕПЕНИ 19 решения исходного уравнения. Метод состоит в выборе такого дополнительного условия, чтобы получившаяся система легко решалась. Подставим и + v в уравнение: и3 + v3 + 3uv(u + v) + a(w + «) + 6 = 0. Выберем следующее дополнительное условие: 3uv = -а. Оно обеспечивает равенство нулю двух последовательных членов в левой части получившегося уравнения, которое переписывается в виде: и3 + v3 = —6. В итоге получилась система: Г гг3 + v3 = -6 \ ш/ = -а/3. Если возвести в куб второе уравнение системы, то она превращается в систему Виета относительно переменных и3 и v3 для квадратного трехчлена t2 + Ы — а3/27. Дискриминант последнего имеет специальное обозначение: D/4 = Д = а3/27 + б2/4. Его неотрицательность означает возможность нахождения корня у общего уравнения третьей степени методом Гудде. Корни этого квадратного трехчлена имеют вид: —6/2 ± \fK. Значит, z = и + v = \/-Ь/2 + у/А+ у/-Ь/2 - у/К. Получившаяся формула носит название формулы Кардано. Приведем еще один пример применения метода Гудде. Уравнение zs _ Ъа2г + Ъагг _ 26 = 0 с параметрами а и 6 носит название уравнения Муавра. П Подставим в него z - и + v : иъ + vb + 5uv(u3 + v3) + 10uV(u + v) - 5a(w3 + v3) - 15ativ(u + v)+ Внешний вид слагаемых, имеющих множитель 5(гх3+и3), приводит к идее выбрать в качестве дополнительного условия уравнение uv — a =0. Левая часть этого уравнения получается, если вынести указанный множитель за скобку из этих двух слагаемых. Разобьем слагаемое — 15atxv(u + v) на две части l0auv(u + и) — bauv(u + v). Первую из них сгруппируем со слагаемым l0u2v2(u + v), вынося общий множитель за скобку, получим:
20 ГЛА В А 1. МНОГО ЧЛЕНЫ И АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ \0uv(u + v)[uv - а]. Сгруппируем вторую из них со слагаемым Ьа2(и + и), вынося общий множитель за скобку, получим: Ьа(и + v)[a — uv]. Дополнительное условие обнуляет все слагаемые, кроме выражения u5 + v5 — 26. В результате получилась система: и5 + v5 = 26 uv = а. Возведя второе уравнение в пятую степень, получим систему Виета относительно переменных и5 и Vs для квадратного трехчлена t2 — 2bt + о5. Условие неотрицательности дискриминанта есть условие применимости нашего метода для действительных чисел : Ь2 > а5. При выполнении этого условия, получается корень уравнения Муавра: z — Может показаться, что этот метод не дает всех корней уравнения. Поэтому, общее уравнение третьей степени нуждается в дополнительном исследовании. Проведем это исследование графическим методом. Заметим, что корень общего уравнения третьей степени возникает как абсцисса точки пересечения графиков у = z3 4- az и у = -6 на координатной плоскости {(у,z)}. Если а > 0, то, как легко видеть, функция у = z3 + az монотонно возрастает на всей прямой. Поэтому, горизонтальная прямая у = —6 пересекает ее график в единственной точке. Общее уравнение третьей степени имеет ровно один корень в этом случае. Заметим, что тогда Д > 0, и этот единственный корень дается формулой Кардано. Для а < 0 график у = z3 + az имеет вид:
13. РЕШЕНИЕ УРАВНЕНИЯ ТРЕТЬЕЙ СТЕПЕНИ У 21 В самом деле, производная этой функции имеет вид : у' = 3z2 + о. Нули производной дают точку минимума (zminjymjn) и точку максимума m = 2a>/-a/3/3; Если -Ь > ?/max или -6 < 2/min, то графики пересекаются в одной точке (один корень). Если ymin < -Ь < Ута*, то графики пересекаются в трех точках (три корня). Если — b = ymin или -6 = ymaxi то графики пересекаются в двух точках (два корня). Существование трех различных корней у общего уравнения третьей степени экивалентно выполнению неравенства: |Ь| < -2a^-a/3/3. Заметим, что обе части неравенства неотрицательны. Поэтому возведение их в квадрат будет эквивалентным переходом: Ъ2 < -4а3/27. Однако последнее неравенство можно переписать в виде: Д = а3/27+ Ь2/4 < 0. Уравнения, удовлетворяющие этому условию, относят к так называемому неприводимому случаю. К нему также относятся уравнения, имеющие ровно два различных корня, что эквивалентно условию Д = 0,а2 + Ь2 ф 0. Случай, когда уравнение имеет ровно один корень и о2 + Ь2 ф 0 (эквивалентное условие — Д > Q)f называется приводимым случаем уравнения третьей степени. В приводимом случае формула Кардано дает единственное решение уравнения. Если Д = 0, а2 + Ь2 ф 0, то формула Кардано дает решение: z\ = 2^/—b/2. Второй корень дает точка минимума при b > 0 — 22 =
22 ГЛАВА 1. МНОГОЧЛЕНЫ И АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ Zmin = \/-о/3, и точка максимума при 6 < 0 — z^ = zmax = - у/—a/3. Мы не рассмотрели случай а=Ь=0, когда уравнение имеет единственный корень z = 0. Отнесем это уравнение к неприводимому случаю. Нам не удалось решить общее уравнение третьей степени в случае, когда оно имеет три различных корня (то есть Д > 0). Можно доказать, что для этого случая не существует общих формул, дающих решения, которые бы кроме четырех действий арифметики использовали бы только лишь извлечения арифметических корней произвольных степеней. Упражнения 1. Решить уравнение х3 — ЪаЬх + а3 + Ь3. 2. Решить уравнение х3 - iabcdx + a3c2d + bzcd2. 3. Решить уравнение х + а + Ъ\/аЬх = b. 1.4 Метод Виета Некоторые тригонометрические формулы дают примеры уравнений третьей степени. Рассмотрим пример. Формула косинуса тройного аргумента для угла тг/9 имеет вид: 1/2 = costt/З = 4 cos3 тг/9 - 3costt/9. Эта формула означает, что уравнение 4z3 — 3z — 1/2 = 0 имеет корень z\ — costt/9. Однако в приведенную формулу с тем же успехом можно подставить число cos(7r/9 + 2тгп/3), где п — целое. На первый взгляд может показаться, что уравнение третьей степени получает бесконечную серию решений. Однако периодичность косинуса приводит к тому, что к полученному решению добавится только два новых: %г = cos(tt/9 + 2тг/3) И23= cos(tt/9 4- 47г/3) = cos(tt/9 - 2тг/3). Французский математик Франсуа Виет сумел перенести приведенный выше метод решения на общее уравнение третьей степени. При этом с помощью формулы косинуса тройного аргумента удается решить как раз те уравнения третьей степени , которые не решались методом Гудде. Рассмотрим общее уравнение третьей степени z3 + az + b = 0. Попытаемся Свести его к уравнению 4£3 - it = A> которое решается при помощи замены t = cos0. Последнее уравнение эквивалентно уравнению : £3 - 3/4£ = Л/4. Положим: z — kt, где fc — постоянная, которую
I А. МЕТОД ВИЕТА 23 определим позднее. Подставив это выражение и разделив на А;3, получим уравнение: t3 + a/k2t = —fc/fc3. Теперь понятно, что константу к нужно определить из условия: а/к2 = -3/4. Заметим, что коэффициент а < 0. Данный метод применим только к уравнениям с отрицательным коэффициентом а. Положим: к = 2^/-а/3. Тогда уравнение принимает вид: 4£3—3£ = А = —?ь Подставим £ = cos<£. Получим: А = cos3<^. Отсюда найдем ф. Необходимым условием существования решений у последнего тригонометрического уравнения является условие : \А\ < 1. Эти решения имеют вид: ф = ± arccos А/3 + 27гп/3, где п — целое число. Они дают ровно три значения для t: ti = cos( 1/3 arccos A), t2 = cos(l/3 arccos A + 2тг/3), tz = cos(l/3 arccos A - 2тг/3). В итоге получаем три решения общего уравнения третьей степени: ЗЬ z\ — 2\/-a/3cos(l/3arccos z2 = 2\J—aj3 cos(l/3 arccos Z3 = 1\J— a/3 cos(l/3 arccos 2a/-a/3 Заметим, что условие применимости метода Виета — |Л| < 1 — в точности означает неприводимый случай уравнения третьей степени. Возведя в квадрат данное неравенство, получим эквивалентное неравенство А2 < 1 : -фа3 ~ Умножив на положительное число -4/За3 обе части неравенства, получим неравенство: 962 < -4/За3. Последнее неравенство эквивалентно условию, выделяющему неприводимый случай уравнения третьей степени : Д = ~ + ^- < 0. Итак, уравнение третьей степени решено для всех случаев.
24 ГЛАВА 1. МНОГОЧЛЕНЫ И АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ Упражнения 1. Получить формулы для решения общего уравнения третьей степени в случае, когда Д = 0. 2. Используя формулу синуса тройного аргумента, решить неприводимый случай уравнения третьей степени. 3. Решить уравнение гг - 3(а2 4- \)z - 2о(а2 +1) = 0 при помощи формулы тангенса тройного аргумента. Ответ: z\ = tg(l/3arctga) - a, z2 = tg(l/3arctga + тг/3) - а, 2з = tg(l/3arctga — 7г/3) - а. 1.5 Гиперболическая тригонометрия С классической экспоненциальной функцией ех можно связать несколько функций, свойства которых дублируют свойства тригонометрических функций (за исключением периодичности). Это гиперболические синус, косинус, тангенс, котангенс — sinh z, cosh ж, tanhrr,coth:r (иногда их обозначают через shx,chx,thx,cthx). Положим : sinh а; = 1/2(е* - е"*), cosh я = 1/2(ех +е"х), sinhs . cosh я taiih x = —;—, coth x — ———. cosh x sinh x Первые три функции определены для всех действительных чисел, функция котангенс гиперболический не определена лишь для х = 0. Мы не будем обсуждать здесь их аналитические свойства. Отметим лишь, что синус гиперболический монотонно возрастает и имеет обратную функцию, которая называется ареа-синус и обозначается через Areasin{x). Как легко следует из определения синус гиперболический — нечетная функция, а косинус гиперболический — четная функция. Поэтому тангенс и котангенс гиперболические — нечетные функции. Докажем основное гиперболическое тождество: cosh2 х — sinh2 x = 1. В самом деле, 1/4(е2х + 2 + е"2г) - 1/4(е2* - 2 + е~2х) = 1/2 - (-1/2) = 1. Столь же просто получаются выражения для гиперболических синуса и косинуса двойного аргумента: 2sinh хcosh x = 1/2(ех - е~х)(ех + е~х) = 1/2(е2х - е~2х) = sinh2x.
j.5. ГИПЕРБОЛИЧЕСКАЯ ТРИГОНОМЕТРИЯ 25 cosh2 x + sinh2 x = l/4(e2x + 2 + e~2x) 4- l/4(e2* - 2 + e"2x) = формулы сложения для гиперболических функций имеют вид: sinh х cosh у + sinh j/ cosh x = l/4(ex - e~x)(ev + e~3/)+ coshxcosh у + sinhrrsinhy = l/4(ex + e~x)(ey + e""1')^ - е~х)(еУ - e-y) = l/2(e*+» + e~x~y) = sinh(a; + y). Заменив у на —у в этих формулах, получим: sinh(:r - у) = sinh x cosh у — sinh ж cosh y} cosh(x - у) = cosh a; cosh у — sinh x sinh у. Получим формулы для гиперболических функций тройного аргумента. Можно было бы воспользоваться формулами сложения. Однако проще произвести возведение в куб: cosh3 х = l/8(e3z + eTZx + 3(е* 4- с"*)) = l/4(cosh3x + 3coshx), sinh3 x = l/8(e3x - e~3x - 3(ex - e"x)) = l/4(sinh3x - 3sinhx). Отсюда получаем тождества: cosh Зх = 4 cosh3 x - 3 cosh x, sinh 3x = 4 sinh3 x + 3 sinh x. Первое тождество в точности совпадает с тождеством для косинуса тройного аргумента. Поэтому если использовать первое тождество для решения уравнения третьей степени, то получатся те же самые формулы, что получились при решении методом Виета (только одну формулу вместо трех). Однако при х ф 0 cosh3x > 1. Так что этим способом будут решаться уравнения приводимого случая. Если бы так решались все уравнения приводимого случая, то новую формулу можно было бы использовать вместо формулы Кардано. Однако это не так. Поэтому мы обратимся ко второму из тождеств. В уравнении z3 + az + Ь = 0 сделаем замену переменной: z = kt, где к — постоянная. Разделив на к3, получим: t3 + a/k2t = -b/h*. Выберем к из условия: а/к2 = 3/4.
26 ГЛАВА 1. МНОГОЧЛЕНЫ И АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ Положим: к = 2у/а/3. Этим способом решаются все уравнения, для которых а > 0. В этом случае Д > 0. Так что новая формула будет заменять формулу К ар дано при а > 0. ЗЬ , sinh3x = т= = 4z3 +3z г'/З Отсюда: г = - Здесь мы воспользовались нечетностью ареа-синуса и гиперболического синуса. Упражнения 1. Разобрать все случаи, когда общее уравнение третьей степени решается через формулу гиперболического косинуса тройного аргумента приведенным выше способом. 2. Получить формулы для гиперболического тангенса двойного и тройного аргументов.
Глава 2 Комбинаторика 2Л Возрастающие и убывающие степени Обозначим через п множество из п элементов — {1,2,... , п}. Подсчитаем количество всех функций / : к -> т. Для этого нужно удобным образом представить информацию, которая определяет каждую конкретную функцию. Представим, что у нас имеется к штук ящиков, которые пронумерованы от 1 до fc, и неограниченное количество карточек с числами 1,2,... ,тп. По каждой функции / : к -* m можно разложить карточки по ящикам (по одной карточке в каждый ящик) следующим образом: в ящик с номером г кладем карточку с числом /(г). Ясно, что функция однозначно определяется такой раскладкой карточек. Пересчитаем число возможностей для раскладки карточек. Очевидно, что в каждый ящик мы кладем карточки независимо от других. Поэтому нужно перемножить числа возможностей раскладки карточек для всех ящиков. В любой ящик одну карточку можно положить m способами. Значит, всего возможностей — гпк. Вместо ящиков и карточек можно было рассматривать fc-членные последовательности чисел 1,2,... ,7п. Задача. Сколькими способами можно расставить к различных книг по m полкам, если порядок книг на полке несущественен? О Главная трудность этой задачи состоит в том, что нужно поменять местами ящики и карточки в{ напрашивающемся соответствии: полки — ящики, книги — карточки. Именно полки мы будем разбрасывать подобно
28 ГЛАВА 2, КОМБИНАТОРИКА карточкам по ящикам, а не наоборот. Перенумеруем полки числами от 1 до т, а книги — от 1 до к. Тогда расстановка книг по полкам однозначно определяет функцию / : к -> ш. Число всех возможностей — тк.О Задача. Подсчитать число всех подмножеств n-элементного множества. D Можно считать, что исходным множеством служит множество п. Выделение подмножества X можно задать при помощи некоторой функции fx : ft —> 2. Положим: I, если х € X J, если г $ X. Такие функции однозначно соответствуют подмножествам. Всему множеству X соответствует функция, тождественно равная 1, пустому множеству соответствует функция, тождественно равная 2. Всего таких функций -- 2П.П Напомним, что отображение или функцию называют вложением или инъекцией, если разные элементы имеют разные образы. Можно поставить вопрос о количестве вложений / : к -» т, если, конечно, т > к. Вложению / соответствует А:-членная последовательность элементов из m со всеми различными членами. Приведенное выше рассуждение с ящиками и карточками изменяется следующим образом. Теперь количество карточек не безгранично — имеется ровно m карточек, по одной каждого вида. Поэтому, имеется т возможностей положить одну карточку в первый ящик, т - 1 возможность положить одну карточку во второй ящик (одна карточка уже использов ана), т — 2 возможности положить одну карточку в третий ящик (две карточки уже использованы),... , т - к +1 возможностей положить одну карточку к-й ящик (к этому моменту уже заполнен к - 1 ящик и осталось т - к + 1 карточек). Число возможностей имеет специальное обозначение: mk = т(т - 1)(т - 2)... {т - к + 1). Оно называется к-й убывающей степенью числа т. Это обозначение имеет смысл сохранить и в том случае, когда т — не натуральное и даже не целое число. По аналогии можно определить &-ю возрастающую степень числа т по формуле: тк = т(т 4- 1)(ш + 2)... (т + к - 1).
2.1- ВОЗРАСТАЮЩИЕ И УБЫВАЮЩИЕ СТЕПЕНИ 29 Возрастающая и убывающая степени связаны очевидными соотношениями: (-т)* = (-1)*т*, (-т)* = (-1)*т±. Можно предложить комбинаторную интерпретацию для возрастающей степени тк. Заметим, что это число будет заметно больше числа всех функций / : к-¥ т. Для того чтобы дать комбинаторную интепретацию для возрастающей степени, представим число всех функций указанного вида новым способом. Поменяем местами карточки и ящики в предыдущей интерпретации. Пусть к штук карточек, пронумерованных от 1 до к, раскладываются по m ящикам, пронумерованным от 1 до т. При этом г-я карточка кладется в /(г)-й ящик. После раскладки некоторые ящики могут оказаться пустыми, а некоторые могут содержать по нескольку карточек. Эта интерпретация не позволяет подсчитать число всех функций. Причина этого состоит в том, что в ящиках оказываются подмножества множества всех карточек, и совершенно неважно, в каком порядке мы их туда кладем. Вот если бы в ящики раскладывались не подмножества, а упорядоченные последовательности карточек, то можно было бы организовать процесс пересчета возможностей для раскладок. В результате должно получиться не число всех функций а большее число, так как упорядоченных последовательностей больше, чем подмножеств. Пересчитаем эти возможности. Первую карточку можно положить m различными способами (в любой из m пустующих ящиков). Для укладки второй карточки имеется т + 1 возможность. Ее можно положить в один из т — 1 пустых ящиков (т—1 возможность). В тот ящик, где уже лежит карточка, вторую карточку можно положить двумя способами — поверх лежащей карточки или под нее. Пусть уже разложено i штук карточек, и нужно положить г + 1-ю. Пусть в первом ящике лежит si карточек, во втором ящике лежит $2 карточек, ... , в m-м ящике лежит sm карточек. Имеет место равенство: 5i + 5г +... -f sm = г. В первый ящик (г + 1)-ю карточку можно положить 5i + l способом — есть si — 1 способ положить ее между карточками, кроме того, ее можно положить в самое начало или в конец стопки. Во второй ящик эту карточку можно положить S2 + 1 способом, • • • , в m-й ящик эту карточку можно положить sm + 1 способом. Всего способов положить i + 1-ю карточку — s\ + S2 4-. •. + sm + m = m + г. Очередная карточка кладется независимо от других. Поэтому число всех возможностей равно т(т + 1)... (т + к - 1) = тк.
30 ГЛАВА 2. КОМБИНАТОРИКА Упражнения 1. Проверить равенство: (т + 1)-- т- = fcm^i 2. Пусть множество X содержит к элементов. Доказать, что имеется ровно тк m-членных цепочек вложенных подмножеств вида XDXlDX2D...DXm-l. Указание: По fc-членной цепочке построить функцию / : X -» т. 2.2 Число подмножеств. Бином Ньютона Обозначим через (™) число fc-элементных подмножеств множества т. Мы пока умеем пересчитывать только fc-членные упорядоченные последовательности элементов из т. Решим вспомогательную задачу: Сколькими способами fc-элементное множество можно представить как fc-членную упорядоченную последовательность? Ничего не изменится, если мы вместо данного k-элементного множества возьмем множество fc. В этом случае, как показано в предыдущей секции, ответ имеет вид убывающей степени — fc£ = fc(fc -1)... l ( его обычно обозначают через fc! ). Эта задача облегчает пересчет fc-элементных подмножеств. В самом деле, если по каждому fc-элементному подмножеству множества т строится ровно fc! fc-членных последовательностей с различными членами, то произведение fc!(™) даст число всех fc-членных последовательностей со всеми различными членами. Однако последнее число равно убывающей степени т- : fc!(™) = тп-. Отсюда получаем формулу: = mVfc! = fc!(m-fc)! fc!(m-fc)!* Заметим, что (™) = 1, так как существует ровно одно О-элементное подмножество — пустое множество. Удобно положить: 0! = 1. Легко заметить, что (™) = (W™J. В самом деле, каждому fc-элементному подмножеству множества т однозначно соответствует (п — £)-элементное подмножество — его дополнение. Кроме того, этот факт непосредственно следует из полученной формулы для числа (™). Из этой формулы также следует, что (™) = 1 и (^) = т. Впрочем, это легко следует из определения (существует ровно одно m-элементное подмножество множества т — оно само; существует столько же 1-элементных подмножеств, сколько элементов множества т).
2,2. ЧИСЛО ПОДМНОЖЕСТВ. БИНОМ НЬЮТОНА 31 Сумма всех чисел (™) при 0 > к > т даст число всех подмножеств множества т. Однако последнее число мы находили в первой секции другим способом. Как всегда, решение одной комбинаторной задачи двумя способами приводит к содержательной формуле: ( = 2m. Задача. Доказать тождество: ■Сг)«Ю--Ю- D Для доказательства решим двумя способами следующую комбинаторную задачу: подсчитать число строк в таблице вхождений элементов в подмножества множества т. В этой таблице строки имеют вид: г G {... , г,... }, где справа стоит подмножество, содержащее элемент г. Сначала обратим внимание на правые части строк данной таблицы. Возьмем произвольное fc-элементное подмножество и подсчитаем в скольких строках оно встречается. Очевидно, что оно встречается ровно в к строках — каждая из этих строк определяется одним из элементов этого подмножества. Поэтому, все fc-элементные подмножества дадут fc(™) строк таблицы. Общее число строк таблицы дается левой частью нашего тождества. Теперь пересчитаем строки другим способом. Очевидно, что каждое число встречается одинаковое число раз в левой части строк таблицы (каж дый элемент входит в одно и то же число подмножеств ). Подсчитаем, в какое число подмножеств входит элемент т. Эти подмножества однозначно определяются своими дополнительными элементами к элементу т. Эти элементы составляют подмножество множества m — 1. Число подмножеств множества ш, содержащих элемент ш, равно числу всех подмножеств множества m - 1, то есть числу 2m~l. Осталось умножить это число на число всех элементов, при этом получится правая часть исходного тождества — тп2т~1Л Выделение последнего элемента можно использовать для получения важного тождества для числа подмножеств. Разделим все fc-элементные подмножества множества т на два класса: подмножества, содержащие элемент т, и подмножества, его не содержащие. Последних, очевидно, Г**"1) штук (их можно считать fc-элементными подмножествами множества m - 1). Количество подмножеств из первого класса можно пересчитать, учитывая лишь дополнительные элементы к элементу ш. Выбросим
32 ГЛАВА 2. КОМБИНАТОРИКА изо всех этих подмножеств элемент то. В результате получим все (fc — 1)- элементные подмножества множества т - 1. Их — {™~\) штук. Имеет место тождество: Это тождество можно преобразовывать, последовательно применяя его к первому или второму слагаемому из правой части. Если разлагать первое слагаемое, то получится равенство: Если последовательно разлагать второе слагаемое, то получится равенство: (т\ /т-1\ /т-2\ (т - 3\ /т - к - Г\ (*)■( * )+U-i) + U-»J+-+( о )■ Нужно быть внимательным при получении последних членов в правых частях этих равенств. Стоит также записать их при помощи знака суммирования: Исходное тождество может быть использовано для вычисления чисел (™) при небольших т. Для этого выписывают особую таблицу — так называемый треугольник Паскаля. В этой таблице тп-я строчка имеет вид: С) (т) (?) - С) Первые шесть строчек треугольника Паскаля имеют вид: 1 1 1 2 1 13 3 1
2.2. ЧИСЛО ПОДМНОЖЕСТВ. БИНОМ НЬЮТОНА 33 14 6 4 1 1 5 10 10 5 1 1 6 15 20 15 6 1 В этой таблице каждая следущая строка получается из предыдущей по правилу: сначала между каждыми двумя соседними числами внизу вписывается их сумма, затем получившаяся последовательность окаймляется спереди и сзади единицами. Согласно этому правилу седьмая строка будет иметь вид: 1 7 21 35 21 7 1. Как легко видеть, это правило является прямым следствием исходного тождества. Можно заметить, что строчки этой таблицы являются последовательностями коэффициентов разложения бинома (х + у)т для т=1,2,3,4,5,6. Поэтому числа (™) называют биномиальными коэффициентами. Для любого натурального т можно доказать формулу бинома Ньютона: Можно воспользоваться методом математической индукции. Для т = 1 эта формула очевидна. Пусть она доказана для т = п— 1. Умножим левую и правую части этой формулы для т = п — 1 на х + у: (х+у)" = При раскрытии скобок в правой части при члене хп~хух возникает коэффициент (п~1) Н- ("Гх) = (7)- Предположение проверено по индукции. Заметим, что при подстановке х = 1,у = 1 в формулу для бинома получается формула для суммы всех биномиальных коэффициентов с одинаковым верхним индексом, полученная ранее другим способом. Подставив я = 1,у = — 1в формулу для бинома, получим тождество: При сложении этого тождества с выражением для суммы биномиальных коэффициентов слагаемые с нечетным нижним индексом сокращаются, остальные слагаемые удваиваются. Сократив на два обе части, получим тождество: + ... = 2т-г.
34 ГЛАВА 2. КОМБИНАТОРИКА Если же вычесть одно из этих равенств из другого, то сократятся члены с четным нижним индексом. Имеет место тождество: При помощи биномиальной формулы и свойств комплексных чисел можно получить формулу для суммы т \ ( т Упражнения 1. Доказать тождество: $3*1*-i 2. Доказать равенства: т (т - 1\ (т\ (i\ (т\ (т - 3. Доказать тождество: £*=0 (?)(,!\) = ("+•). Указание: Рассмотреть следующую комбинаторную интерпретацию. Из группы, состоящей из т мужчин и п женшин, выбрали к человек. 4. Доказать, что а)(х + у)— = 2^, ( • l^1?/^"1^; b)(z Н- у)п = i=o ^г' 2.3 Полиномиальная формула Выделение Ar-элементного подмножества в множестве m эквивалентно разделению т на две непересекающиеся части, первая из которых содержит к элементов, а вторая — т — к элементов. Можно обобщить понятие биномиального коэффициента следующим образом. Обозначим через (/i/zm 1л) число представлений множества га в виде объединения п непересекающихся подмножеств, причем первое из них должно содержать ровно 1\ элементов, второе - - ровно 12 элементов, ... , последнее — ровно /п элементов; 1г + 12 + ... + 1п = т. т = Lx U L2 U ... U Ln; \L{\ = liy г = 1,2,... , п
2.3. ПОЛИНОМИАЛЬНАЯ ФОРМУЛА 35 Отметим, что порядок следования подмножеств L» важен, даже если они содержат одинаковое количество элементов. При перестановке местами подмножеств с равным количеством элементов представление множества га в виде объединения изменяется. Биномиальный коэффициент можно записать в виде: (™) = (к £_ft). Для вычисления числа (^т, ) можно воспользоваться следующими соображениями. Станем последовательно выбирать элементы для подмножеств Li,I/2)... ,Ln. Подмножество L\ можно выбрать (™) способами, при этом останется т-1\ элементов. Из них выбирают /г элементов для подмножества L<i (mj~'!) способами. При этом остается m — 1\ — 12 элементов, из них выбирается третье множество. Продолжая этот процесс, можно дойти до последнего множества. Оно выбирается из оставшихся т - 1\ — 1ъ — ... — /n-i = 1п элементов единственным способом (запишем, однако, эту единицу в виде (m-'i~—-Jn-i^ gce подмножества выбираются независимо друг от друга. Поэтому необходимо перемножить получившиеся результаты: Ш \ = ь т\ {m-h)\ (m-fr-b)! (m - h - ... - Ui hl{m - h)\ I2\{m -h- h)\ h\{m - h - l2 - h)\ '" Ы После сокращений получится формула: / т \ _ ш! Эти числа называют полиномиальными коэффициентами. Имеет место формула: называется полиномиальной формулой. Для ее доказательства нужно подробно исследовать процесс раскрытия скобок у т штук одинаковых Сожителей (х\ И- %2 Л-... + жп)- Можно обозначать эти множители натуральными числами от 1 до т. Слагаемое х[* хх£ ... xjj1 возникает всякий Р£Ч когда ровно из /i множителей выбирают первое слагаемое, ровно из 2 множителей выбирают второе слагаемое, ... , ровно из /п множителей
36 ГЛАВА 2. КОМБИНАТОРИКА выбирают последнее слагаемое. Можно дать комбинаторную интерпретацию всем таким ситуациям. Пусть слагаемые из множителей выбраны указанным выше способом. Станем раскладывать карточки с номерами от 1 до т в ящики, пронумерованные от 1 до п, следующим образом. Если из г-го множителя выбрано слагаемое Хк, то в к-й ящик кладем карточку с номером г. В результате получается представление множества т в виде объединения п непересекающихся подмножеств, в первом из которых — li элементов, во втором —12 элементов,... , в последнем — 1п элементов. Так что коэффициентом при члене х[1х12 .. .xl£ будет число (j^™.^)- Подставим в полиномиальную формулу Х{ = l,i = 1,2,... ,п: Эта формула обобщает формулу для суммы всех биномиальных коэффициентов. Интересно узнать количество слагаемых в правой части полиномиальной формулы. Это число совпадает с количеством решений уравнения: h + к + ... + /„= т в целых неотрицательных числах. Для биномиального случая п = 2, и ответ очевиден — т + 1. В общем случае можно применить следующее комбинаторное рассуждение. По решению (/i, /2 > • • • >'п) этого уравнения в целых неотрицательных числах можно построить следующую последовательность из двоек и единиц. Сначала поставим 1\ единиц, затем поставим одну двойку. После этого поставим 1г единиц, затем поставим одну двойку. И так далее. В самом конце поставим 1п единиц. Двойки, таким образом, играют роль разграничителей между п последовательностями, состоящими из единиц. Таких разграничителей всего тг-1 штук. Единиц всего li +/2 -К • .+1п = л* штук. Можно спросить: всякую ли последовательность, состоящую из т единиц ип-1 двоек, можно построить по решению. Некоторые последовательности будут содержать по нескольку двоек подряд. Это просто означает, что в соответствующих местах стоят нулевые компоненты решения. По любой последовательности указанного вида из двоек и единиц можно однозначно построить решение. Осталось подсчитать число последовательностей. Однако подобные объекты нам уже встречались в первой секции при пересчете числа всех подмножеств. Такая последовательность однозначно соответствует функции fx : mf n-1 -> 2, которая выделя-
2.3. ПОЛИНОМИАЛЬНАЯ ФОРМУЛА 37 ет m-элементное подмножество X С т + п — 1. Всего таких функций ■— {т*т~1) ШТУК- Это число можно записать в виде — С"*"^1). Последняя задача допускает несколько комбинаторных формулировок, которые можно использовать на практике. Решение уравнения 1\ 4-/г + - • •+ ln = m в неотрицательных целых числах можно представить следующим образом. Пусть имеется m одинаковых карточек, которые произвольным образом раскладываются по п ящикам, пронумерованным от 1 до п. В первый ящик кладется 1\ карточек, во второй ящик кладется ^ карточек. И так далее. В последний ящик кладется 1п карточек. Порядок следования карточек неважен — они все одинаковые. Эта простая интерпретация позволяет решить следующую задача. Задача. Найти число решений уравнения /i + /2 + ... 4- 1п = "г в натуральных числах. D В терминах нашей интерпретации это означает, что в каждом ящике лежит хотя бы одна карточка. Задача сводится к предыдущей следующим образом. Сначала положим в каждый по одной карточке. Затем оставшиеся т - п карточек разложим как в предыдущем случае. Число возможностей равно {т~£?~1) = ("Г,1). Мультимножеством, состоящим из элементов некоторого множества называется неупорядоченная совокупность, состоящая из элементов данного множества, которые могут в ней повторяться. Например, {1,3,3,3,4,4} - мультимножество элементов множества 4. Типичным примером на подсчет числа мультимножеств является следующая задача. Задача. Имеются пирожные трех сортов. Сколькими способами можно выбрать пять пирожных? □ Можно выбрать все пирожные одного сорта тремя способами. Если выбирается два сорта пирожных, то таких возможностей 12 штук (тремя способами можно два сорта из трех, четырьмя способами можно разделить пять пирожных по сортам). Если используется все три сорта, то это означает, что к трем разным пирожным нужно добавить еще два произвольным образом. Таких возможностей б штук ( тремя способами можно Добавить два одинаковых пирожных, тремя способами можно добавить Два разных). Общее число мультимножеств — 21=Q.О Получается, что число мультимножеств равно числу раскладок пяти одинаковых карточек по трем разным ящикам. Это не случайно — общее число мультимножеств т элементов из множества п равно (m^"f1)- В самом деле, пусть имеется такое мультимножество. По нему однозначно строится раскладка m одинаковых карточек по п разным ящикам: сколько имеется элементов г в мультимножестве, столько карточек кладется
38 ГЛАВА 2. КОМБИНАТОРИКА в i-й ящик. Обратная процедура также имеет место. Пусть имеется раскладка карточек по ящикам. На карточках, лежащих в каждом ящике, поставим номер ящика. Затем высыпим все карточки в одно место — получим мультимножество нужного вида. Разбиению множества т на п непересекающихся подмножеств также можно дать занятную комбинаторную интерпретацию. Пусть в первом подмножестве 1\ элементов. Во втором подмножестве /2 элементов ... В последнем подмножестве 1п элементов. Будем строить m-буквенное слово в алфавите, состоящем из п символов, следующим образом. Элементы множества т будем считать номерами позиций в этом слове, а номера подмножеств — его буквами. Другими словами, в t-й позиции должна стоять буква , имеющая номер подмножества, в которое попало число г при разбиении. Очевидно, что, имея слово, мы сможем разбросать номера позиций его букв по подмножествам, соответствующим номерам букв по счету в алфавитном порядке. Так что, всего таких слов будет {^i™ in) штук. Разберем классическую задачу: Задача. Сколько слов получаются перестановками букв в слове "математика" ? О Это слово имеет т = 10 позиций и п = 6 букв. Буква «а» встречается 1\ = 3 раза, буквы «т» и «м» встречаются по /2 = 'з = 2 раза, буквы «е»,«и»,«к» встречаются однократно — /4 — h = 'б = 1- Общее число таких слов — (3 2 г™ i 1) = 151200.D Упражнения 1. Доказать, что число способов, которыми два человека могут разделить 2п предметов одного вида, 2п предметов другого вида и 2п предметов третьего вида так, чтобы каждый получил Зп предметов, равно Зп2 + Зп + 1. 2. Пусть ао,oi,Q.2,■ • • — коэффициенты в разложении (1-|-:г + х2)п по возрастающим степеням х. Доказать, что a) ttodi - а\а2 4- а2а3 - - • ■ - CL2n-i^2n = 0; b) а0 + а2 + о4 + ... + а2п = £(3П + 1); c) ai + а3 + аъ 4-... + o2n-i = \{$п - 1).
2.4. ФОРМУЛА «ВКЛЮЧЕНИЙ И ИСКЛЮЧЕНИЙ» 39 2.4 Формула «включений и исключений» Хорошо известную формулу для двух конечных множеств X и Y — \Х U у\ — \X\-\-\Y\ — \Х HY\ — можно обобщить на случай нескольких множеств. Имеет место формула «включений и исключений»: \ХХ l)X2 U... U Хп\ = = Е 1*1 - Е №i п*»1+ Е №i пxi2nxi3|-... + +(-i)*~1 E \xixnxi2n...nxik\+...+(-i)n-l\Xinx2n...nxn\ I<ti<i2<...<tfc<n В этой формуле fc-я сумма суммируется по всем наборам из к штук различных множеств. Всего множеств п штук. Значит, число слагаемых в к-й сумме равно (£), а общее число слагаемых в правой части формулы равно 2* — 1. Эту громоздкую формулу можно доказать методом математической индукции. В качестве начального шага индукции можно взять формулу для двух множеств. Предположим, что формула выполняется для п — 1 множеств, и нам нужно доказать ее для п множеств — Х\>Х2, •.. , Хп. Положим Y = Xn-i U Хп. Раскрыв выражение \Xi U X2 U ... U Xn-2 U Y\ по формуле «включений и исключений», получим fc-ю сумму из правой части в виде: ...<*fc<n-2 <ifc~i<n—2 Общий член у второй суммы можно переписать в виде: где X = Xit П ... П Xtfc_,. Последний член можно переписать в виде: \ХПХп-1\ + \ХПХп\-\(ХПХп-г)П(ХпХп)\ = = \XnXn-tl + \ХПХп\ - \ХпХп-гПХп\ Если вставить первые два члена из правой части последнего равенства в исходное равенство, то они дадут все члены из fc-й суммы, оканчивающиеся на Хп-х или на Хпу за исключением членов, оканчивающихся на
40 ГЛАВА 2. КОМБИНАТОРИКА Хп-\ (ЛХп. Последние придут из (к — 1)-го шага. Дело в том, что третий член с минусом из правой части последнего равенства дает слагаемые из (к 4- 1)-й суммы, причем в точности те из них, что оканчиваются на Xn-i П Хп. Формула проверена по индукции. Разберем три важных примера применения формулы «включений и исключений». Задача 1 (число наложений). Функцию f : п -> т назовем налкь жением или сюрьекцией, если всякое кет можно представить в виде к = /(г), для некоторого г € п. При этом, конечно, п>т. Если т = п, то число к однозначно представляется в таком виде , и функция / является также вложением. Найти число наложений. □ Число наложений обозначим через sur(n, m). Для вычисления этого числа найдем число всех функций, не являющихся наложениями. Множество всех таких функций представим в виде объединения X1UX2U.. .UXm, где Xk — множество функций, которые не принимают значения tGm, Заметим, что Xk можно представить как множество всех функций / : п -> то\{А;}. Совершенно аналогично множество Х^ ПXi2 П. ..Г)Xi9 можно представить как множество всех функций / : п -> m\{/i,J2,-«- >M* Поэтому, число его элементов равно (т - s)n. Каждая сумма в формуле «включений и исключений» представляет собой сумму одинаковых слагаемых, указанного выше вида (т - s)n . Поэтому, имеет место формула: Найдем число sur(n,m) как число элементов дополнения множества Х\ U Х2 U ... U Хт до множества всех функций: 5«г(п, т) = тп - \Xi U X2 U ... U -YTO| = = m» - JT(-1)S-1 М (m - зГ = E(-Ds (Ш) (m - a)». 5=1 ^ ' s=0 ^ ' При m = n это число равно числу вложений, то есть убывающей степени па = п!. Получается нетривиальная формула: 5=0 Задача 2 (число беспорядков). Несксшько человек подбросили в воздух свои шляпы во время взятия футбольных ворот. Шляпы вернулись
2.4. ФОРМУЛА «ВКЛЮЧЕНИЙ И ИСКЛЮЧЕНИЙ» 41 я произвольном порядке. Какова вероятность того, что каждый получит чужую шляпу? Под вероятностью понимается отношение числа возможностей распределения шляп указанным выше способом к числу всех возможностей. Ответ этой задачи несколько неожиданный: вне зависимости от того, десять человек бросили шляпы или тысяча, эта вероятность приблизительно равна 1/е. □ Пусть шляпы бросили п человек. Станем обозначать и людей, и шляпы элементами множества п. Тогда распределение упавших шляп задает функцию f '. п-> п, которая является и вложением и наложением (такие функции называются перестановками множества п). Пусть вначале у fc- ix) человека была k-я шляпа, тогда перестановка / обладает следующим свойством: f(k) ф к для к = 1,2,... ,п (такие перестановки называют беспорядками). Подсчитаем количество всех перестановок, не обладающих этим свойством. Обозначим через Л\. множество перестановок /, обладающих свойством: f(k) = к. Объединение всех таких множеств даст множество перестановок, не являющихся беспорядками. Количество элементов множества Xk равно количеству перестановок множества п\{&}. Аналогично число элементов множества Xix П Xi2 О ... П Xia равно числу перестановок множества n\{/i,Z2, • • • ,/*}• Это число равно (п — я)! . В формуле ,включсний и исключений», ему будут равны все слагаемые в 5-й сумме: I*! U Х2 U ... U Хп\ = £(-1Г * (") (п - з)\ = п\ Поэтому число беспорядков равно: п\ - |Xi U X2 U ... U Хп\ = n! 5=0 Значит, искомая вероятность равна Ss=o(~l)V5'- Это — частичная сум- ма ряда, быстро сходящегося к 1/е.О Задача 3 (формула для функции Эйлера). По любому натуральному числу п можно определить число ф(п) следующим образом. Положим: ф(1) = 1. Пусть п > 1, тогда ф(п) определяется как количество всех п#*яимно простых (то есть не имеющих общих делителей, отличных от 1) г: и чисел из множества п. К примеру, для п = 6 имеется лишь два таких числа — 1 и 5, ф(6) = 2. Соответствие п н> ф(п) называют функцией Эйлера.
42 ГЛАВА 2. КОМБИНАТОРИКА Найти формулу для функции Эйлера. D Пусть п = Pilp%2.. -р£г — разложение на простые множители (Pi?P2i • • • ,Рт — различные простые числа). Найдем формулу для числа ф(п). Для этого представим в удобной форме подмножество тех чисел из п, что имеют отличные от единицы общие делители с числом п. Обозначим через Xk подмножество тех чисел из п, которые делятся на р*. Для числа из п не быть взаимно простым с п означает принадлежать к объединению Х\ U X2 U ... U Хт. Несложно подсчитать число элементов в Xk- Для этого заметим, что в точности каждое r-е число из множества п делится на г, когда п делится на г (если числа из п последовательно выписывать по строкам длины г в прямоугольную таблицу, то последний г-й столбец будет состоять изо всех кратных г чисел). Таких чисел — п/г штук. Поэтому, множество Xk содержит n/pk элементов. Если число делится на р^ ,р/2,.. - ,ps> то это означает, что данное число делится на произведение pixpi2 • Pi9 (в силу того, что pk — простые числа для к = 1,2,... , т). Поэтому, в пересечении Xix П Xi2 C\ ...C\ Х\а содержится ровно n{pixpi2.. .pia)~l чисел. Формула «включений и исключений» принимает вид: Поэтому имеет место формула: ф(п) = п - \Х\ U Л"г U ... U Хт\ = 5=1 Эта сумма выглядит громоздко. Однако легко видеть, что она получается в результате раскрытия скобок в произведении: гс(1 — l/pi)(l- 1/рг) ...(1— 1/Рт)- Формула для функции Эйлера имеет вид: ф(п) = П(1 - 1/й)(1 - 1/р2) ... (1 - 1/Рт)-О Упражнения 1. Обобщенная формула «включений и исключений». Пусть на некотором конечном множестве заданы п полмножеств. Принадлежность элемента к подмножеству станем интерпретировать как его наделение некоторым свойством. Обозначим через Л^^2.../,
2Л. ФОРМУЛА «ВКЛЮЧЕНИЙ И ИСКЛЮЧЕНИЙ» 43 количество элементов, обладающих свойствами с номерами 'г»'2> • • ■ >h- Доказать, что количество элементов, обладающих ровно к свойствами N(k)= Заметим, что этой формулой можно пользоваться и при к = 0. 2. Решить задачи из примеров 1 и 2, пользуясь формулой из предыдущей задачи.
Глава 3 Комплексные числа 3.1 Алгебраическая форма комплексного числа При решении уравнения третьей степени методом Гудде остался неисследованным неприводимый случай, когда вспомогательное квадратное уравнение имеет отрицательный дискриминант. Для того, чтобы справиться с этой трудностью, пришлось воспользоваться тригонометрией. В результате получились существенно отличающиеся друг от друга формулы для решения общего уравнения третьей степени в приводимом и неприводимом случаях. Введение комплексных чисел позволяет решать квадратные уравнения с отрицательным дискриминантом и, таким образом, унифицирует решение уравнения третьей степени. Нужно уметь, однако, извлекать корни третьей степени из этих новых чисел, как того требует формула Кардано. Геометрическая интерпретация действительных чисел как точек прямой позволяет по аналогии ввести комплексные числа. Комплексными числами называют точки декартовой плоскости. Множество комплексных чисел обозначается через С. Ось абсцисс отождествляют с действительной прямой, так что имеется вложение К С С. Ось ординат называют мнимой осью. Лежащие на ней точки называют чисто мнимыми числами. Базисный вектор этой оси (то есть вектор (ОД)) обозначают через г и называют мнимой единицей. Действительное число 1 соответствует вектору (1,0), поэтому комплексное число z с координатами (а, Ъ) записывают в виде:
46 ГЛАВА 3. КОМПЛЕКСНЫЕ ЧИСЛА z = а + Ы. Это — так называемая алгебраическая форма комплексного числа. Координаты а и b называют, соответственно, действительной и мнимой частями комплексного числа z. Векторы, соответствующие комплексным числам, можно складывать и умножать на действительные числа. Последнюю операцию можно распространить на комплексные числа, то есть можно определить произведение комплексных чисел. Пусть z\ = а\ 4- b\i, 22 = <*2 + М- Положим: Заметим, что г2 = — 1. Это — ключевая формула. Действительно, произведение z\ 22 определяется при помощи раскрытия скобок и применения этой формулы . Легко показать, что имеют место формулы: Для ненулевого комплесного числа z = а + Ы можно определить обратное по формуле: В самом деле, обозначим z = а — Ы. Это число называют сопряженным к числу 2. Тогда имеет место формула: z~z — а2 + б2, из которой следует формула для обратного числа. Длину вектора, соответствующего комплексному числу г, станем называть его модулем и обозначать через \z\. Докажем, что длина произведения комплексных чисел равна произведению длин множителей. Это легко следует из формулы: \z\2 = zz. Заметим, что 2fz2 = Ж 2J = а\Ь\ — 0262 — (a>ib2 + a,2bi)i. Тогда верны равенства: \ziZ2\2 = ^12:2^1^2 = Z\z>2~z\ ^2 = ki|2|^2|2- Отсюда следует, что длина обратного обратна длине исходного числа. Впрочем, это непосредственно следует из формулы: z~l = 2/|г|2. Заметим, что преобразование плоскости, определяемое переходом к обратному числу, тесно связано с инверсией относительно стандартной единичной окружностью. Эта инверсия задается формулой: z ■-> zj\z|2. Таким образом, взятие обратного есть композиция инверсии и сопряжения. При этом внутренность единичного круга отображается вне круга и наоборот. Единичная окружность отражается относительно оси абсцисс на себя. Неподвижными остаются лишь точки ±1.
3.1. АЛГЕБРАИЧЕСКАЯ ФОРМА КОМПЛЕКСНОГО ЧИСЛА 47 Определение. Корнем tfz n-й степени из комплексного числа z называется множество решений уравнения хп = z. Это множество также называют множеством корней n-й степени из числа z. Например, \/0 = {0}. В самом деле, из равенства хп = 0 вытекает, что \х\п = 0. Задача. Вычислить квадратные корни из комплексного числа а + Ы. О Пусть х = и + ш, тогда u2 - v2 -f 2uvi = a 4- to. Нужно решить систему: \ = Ь. Возведем второе уравнение в квадрат — 4u2v2 = Ь2. Выразив из первого уравнения и2 = и2 4- о, подставим его во второе уравнение. Получим биквадратное уравнение: 4w4 4- 4ov2 - Ь2. Отсюда находим: Перед радикалом у/а2 + Ь2 был выбран знак «плюс», потому что левая часть неотрицательна. Осталось извлечь арифметические квадратные корни из обеих частей и расставить перед ними знаки. Для последнего нужно обратиться к исходному второму уравнению — 2uv = Ь. При возведении этого уравнения в квадрат потерялась необходимая информация. Если Ь = 0, то решения этой системы будут иметь вид: {(±у/а,0)} для неотрицательных о, и вид {(0, ±^/faf)} для отрицательных а. Для ненулевых Ь решения системы примут вид: {{*gn{b)\/l/2(a / J / Ь2))}, где $qn(b) — знак числа Ь. □ Можно рассматривать многочлены и уравнения с комплексными коэффициентами. Многие конструкции, теоремы и формулы остаются верными для этого случая. Например, схема Горнера, теорема Безу, общая теорема Виета, формула для решения квадратного уравнения. Найдем все корни третьей и четвертой степени из единицы. Для этого разложим на множители: х3 - 1 = (х - 1)(х2 + х + 1), х4 - 1 = (х - 1)(х + 1)(х2 + 1).
48 ГЛАВА 3. КОМПЛЕКСНЫЕ ЧИСЛА Квадратное уравнение х2 +х +1 = 0 имеет корни ш — 1/2(-1 + \/3*)i ^ = 1/2(—1 — V3i). При этом, ш = ш2, u>2+w + l = 0. Задача. Решить систему: □ Эта достаточно сложная система легко решается при помощи комплексных чисел. В самом деле, умножим левую и правую части второго уравнения на мнимую единицу и сложим их, соответственно, с левой и правой частями первого уравнения: х i+i2 + i)(Xyi)=_3 + i х2 +у2 Положим z = x+yi. Получим уравнение: z-f (2-f i)/z — -3+г. Умножив его на z, получим квадратное уравнение: z2 + (3-z)z+2+i = 0. Дискриминант имеет вид: D = (3 - г)2 - 4(2 + г) = —Юг. Корни из дискриминанта имеют вид: y/—\0i = {±y/b(—I -f г)* Множество решений системы: {(-1/2(3 + \/5), 1/2(1 + \/5), (1/2(-3 + \/5), 1/2(1 - Можно перенести решение общего уравнения третьей степени методом Гудде на случай комплексных коэффициентов. Решение будет даваться формулой Кардано. В ней нужно выбрать конкретные значения для кубических и квадратных корней. Эта формула содержит два квадратных корня и два кубических. С квадратными корнями разобраться легко — они должны иметь противоположные знаки, и безразлично, в каком порядке они входят в кубические радикалы (последние складываются, а от перестановки слагаемых сумма не изменяется). Кубические радикалы совпадают с выражениями uhv, которые связаны условием uv = — Ь/3. Это условие позволяет отобрать из девяти возможностей для значений кубических корней три возможности. В самом деле, существует ровно три значения для кубического корня из ненулевого комплексного числа z: если xi = <*> х\ = z, то [x\jxi)z = 1. Поэтому, множество кубических корней имеет вид:
32. ТРИГОНОМЕТРИЧЕСКАЯ ФОРМА КОМПЛЕКСНОГО ЧИСЛА49 Таким образом, для первого радикала имеются возможности — {щ, шщ, lj2u\ }, для второго радикала есть также три возможности — {vi,(jjviyu>2vi}. Заметим, что в качестве первого значения можно поставить любое из трех возможных. Выберем и\ и v\ такими, чтобы щу\ = -fr/З. Тогда множество корней общего уравнения третьей степени примет вид: {U\ + V\ , (1)Щ + CJ2V\ ,(л)2Щ 4" U)V\ }. В общем случае нельзя аналогично предыдущему найти формулы для кубического корня \/х + yi из комплексного числа х + yi, если использовать лишь четыре действия арифметики и извлечение арифметических корней из действительных чисел. Для действительного числа х эти формулы имеют вид: Упражнения 1. Доказать тождества: a) х3 4- у3 4- z3 - 3xyz = (х 4- у 4- г)(х 4- а/у 4- а;22;)(ж 4- w2y 4- uz)\ b) {x 4- k>y + uf z) + (x-f u/ у 4- u>z) = = 2(я 4- у 4- z)3 - 9(я 4- у -f z)(zy 4- yz 4- -zz) 4- 27xyz. 2. Найти числа, сопряженные к а) своему квадрату; Ь) своему кубу. 3.2 Тригонометрическая форма комплексного числа На плоскости наиболее употребительны две системы координат — декартовы и полярные. Им соответствуют две формы записи комплексного числа. Как мы видели в предыдущей секции, декартовым координатам комплексного числа соответствует алгебраическая форма записи. Для всех точек плоскости, за исключением начала координат, можно сопоставить по два числа — полярные координаты. Первая координата — это модуль соответствующего комплексного числа (длина радиус-вектора точки). Вторая координата называется аргументом комплексного числа z и обозначается через arg(z). Для точек верхней полуплоскости (включая ось абсцисс) аргумент определяется как угол между радиус-вектором
50 ГЛАВА 3. КОМПЛЕКСНЫЕ ЧИСЛА точки и положительным направлением оси абсцисс. Поэтому для этих точек 0 < arg(z) < ж. Для точек нижней полуплоскости (без оси абсцисс) аргумент определяется как число, противоположное величине угла между радиус-вектором точки и положительным направлением оси абсцисс. Таким образом, для этих точек -тг < arg(z) < 0. Напомним, что против часовой стрелки откладывают положительные величины углов, а по часовой — отрицательные. Аргумент — это наименьший по модулю угол, откладываемый от положительного направления оси абсцисс к радиус-вектору точки. Иногда рассматривают так называемый «большой» аргумент комплексного числа z — Arg(z). Это — множество {arg(z) + 2пп\п € Z}. Если это выражение входит в некую формулу, то мы рассматриваем бесконечное множество формул (по одной для каждого значения п € Z). Пусть комплексное число z задано полярными координатами (гуф). Тогда, от алгебраической формы записи — z = х + уг — можно перейти к записи через полярные координаты. Заметим, что г = \Jx2 + у2, cos</> = -, sin</> = -. г т Поэтому, z = r(cos ф+г sin ф). Это — так называемая тригонометрическая форма комплексного числа z. Подобно тому как алгебраическая форма записи комплексных чисел хорошо согласована с их сложением, тригонометрическая форма записи комплексных чисел хорошо согласована с их умножением. Теорема. При умножении ненулевых комплексных чисел их модули перемножаются, а их аргументы Агд складываются. Доказательство. □ Пусть z1 = n (cos ф\ + г sin ф\ )> Z2 = r2(cos фг + г sin Ф2). Тогда имеет место формула: z\Z2 = rir2(cos</>i + isin<^i)(cos#2 + г sin (^2) = = г 1 г 2 (cos 0i cos Ф2 - sin ф\ sin Ф2 + г (cos ^i sin ф2 4- cos Ф2 sin ф\)) = i + ф2))- О Следствие (формула Муавра). Пусть комплексное число представляется в следующем виде: z = r(cos<£ + г sin 0), г > 0. Тогда имеет место равенство: zn = rn(cosn0 4- i sin пф). □ Эта формула позволяет найти все корни п-й степени из единицы.
3.2. ТРИГОНОМЕТРИЧЕСКАЯ ФОРМА КОМПЛЕКСНОГО ЧИСЛАМ Следствие. Имеет место формула: vT = {1, cos27r/n + г sin2ir/n, cos2(27r/n) + г sin 2(тт/п), cos3(27r/n) + isin3(27r/n),... ,cos(n- 1)(2тг/п) + tsin(n- 1)(2тг/п)}. Доказательство. D Пусть хп = 1. Взяв модуль от обеих частей, получим: \хп\ = \х\п = 1. Значит, |х| = 1. Это число имеет вид: х = cos<j> + ism<f>. Согласно формуле Муавра: cosn^+isinn<£ = 1. Значит, имеет место формула: пф = 2пк. Отсюда вытекает, что ф = &(2тг/п),А; 6 Z. функции синус и косинус периодичны с наименьшим периодом 2тг. Поэтому все возможные значения корней получатся при fc = 0,1,2,3,... , п — 1. □ Обозначим через еп число сов2тг/п Н- isin27r/n. Тогда множество всех корней n-й степени из единицы примет вид: В тех случаях, где не возникает двусмысленности, мы будем опускать нижний индекс после е. Задача. Найти сумму всех корней n-й степени из единицы. D Для этого умножим эту сумму на ненулевое число е - 1 : (е - 1)(1 + е + с2 + ... + е71"1) = еп - 1 = 1 - 1 = 0. Значит, сумма всех корней n-й степени из единицы равно нулю. Заметим, что можно было сразу воспользоваться формулой для суммы геометрической прогрессии, которая автоматически переносится на случай комплексных чисел. D Задача. Найти произведение всех корней n-й степени из единицы. О Воспользуемся формулой Муавра: lxexe2x...xen-1 =el+2+~+n-1 = еп{п-1)/2 = cos7r(n-l)-Nsin7r(n-l) = = cosir(n-l) = (-l)n-1XI При помощи корней n-й степени из единицы можно выразить все корни н-й степени из комплексного числа z через один из таких корней — х: y/z = {х,хе,are2,... ,хеп~~г}. Для доказательства достаточно заметить следующий факт. Если я" = г, xj = г, то имеет место равенство: (ал/яг)" = 1- Пусть z = r(cos0 +
52 ГЛАВА 3. КОМПЛЕКСНЫЕ ЧИСЛА isin^), тогда в качестве корня х удобно выбрать число tfr (cos ф/п + г siu ф/п). Разберем следующую несложную задачу. Задача. Найти все комплексные числа, сопряженные к своей n-й степени. D Аналитически это условие выглядит следующим образом: z = zn. Возьмем модуль от обеих частей: \z\ = \z\ = \zn\ = \z\n. Отсюда вытекает, что \z\ = 0 или \z\ = 1. Первый случай дает решение z = 0. Пусть \z\ = 1. По условию меет место равенство: Argfi) = Arg(zn) Однако Arg(z) = -Arg(z), Arg(zn) = narg(z) + 2nk,k 6 Z. Поэтому выполняются равенства: (n + l)Arg(z) = 2?rfc, fc £ Z. Значит, получается еще множество из (п + 1) решения — п+\/Т. Всего эта задача имеет (п + 2) решения. Вторую часть решения можно оформить по-другому. Умножим исходное равенство на z: zz = zn+1. Однако, zz = \z\2 = l.D Разберем более сложную задачу. Задача. Вычислить суммы S/(m, 3), £ = 0,1,2 (определение см. в конце секции 2 главы 2). □ Определение этих сумм — в конце секции 2 главы 2. Рассмотрим бином: (1+ш)ш = (cos7r/3 + isin7r/3)m = cos тгт/3 + i sin тгш/3. С другой стороны, этот бином представляется в виде: (1 + u))m = 5o(m, 3) 4- Si(m,3)w + 52(m,3)o;2 = = S0(m,3) - S2(m,2) 4- (Si(m,3) - 52(m,3))w. Последнее равенство вытекает из формулы 1 4- ш 4- о;2 = 0. Удобно рассмотреть три случая в зависимости от остатка при делении числа m на три, чтобы избавиться от косинуса и синуса. Случай 1. m=3k costtA; 4-isin7rfc = (~1)Л- Приравняв обе формулы для бинома, получим равенство: (-l)fc = So(3*,3) - 52(3Jfc,3) 4- (5i(3*,3) - 52(3fc,3))u. Это равенство можно рассматривать как равенство двух векторов плоскости, разложенных по базису: 1,ы. Поэтому оно эквивалентно следующей системе: Г SO(3M)-S2(3A:,3) = (-1)* \ 5i(3Jk,3)-52(3A;,3) = 0.
3.2. ТРИГОНОМЕТРИЧЕСКАЯ ФОРМА КОМПЛЕКСНОГО ЧИСЛАМ у нас получились два уравнения и три переменных. Положение спасает evie одно уравнение, которое известно нам из секции 2 главы 2. Сумма трех наших неизвестных — это сумма всех биномиальных коэффициентов с верхним индексом 3fc: S0(3fc,3) + 5i(3A:,3) + S2(3fc,3) = 8fe. В итоге получаются следующие формулы: So(3fc,3) = (8* + 2(-1)*)/3, 5i(3fc,3) = S2(3A;,3) = (8* + (-l)fc+1)/3. Случай 2. m=3k+l cos(tt/3 + пк) + г sin(7r/3 + Trfc) = (-1)*( Получим систему: 50(3fc Ч-1,3) -h 5i(3Jt + 1,3) + S2{3k + 1,3) = 2 • 8* 50(3fc + 1,3) - 52(3Jt + 1,3) = (-1)* 5i(3Jfc + 1,3) - 52(3fc + 1,3) = (-1)*. Решение имеет вид: So(3fc + 1,3) = Si(3*+ 1,3) = (2 • 8к + (-l)fc)/3; 52(3^ + 1 Случай 3. m=3k+2 cos(2?r/3 + тгА;) 4- г sin(27r/3 + ттк) = {-1)ки. Получим систему: So(3ifc + 2,3) + 5i(3fc + 2,3) + S2(3fc + 2,3) = 4 • 8fe Решение имеет вид: 50(3ifc + 2,3) = 52(3fc + 2,3) = (4 . 8fc + (-l)*+1)/3, Si(3fc + 2,3) = = (4-8Л + 2(-1)Л)/З.П Совершенно аналогично можно подсчитать суммы 5/(т, 4), I = 0,1,2,3. Для этого нужно рассмотреть бином: (1+г)т =2m/2(cos7r/4 + isin7r/4)m = 2m/2(cos7rm/4 4- isin7rm/4). С другой стороны, этот бином равен: (1 + г)т = 50(т,4) - 52(т,4) + (й(т,4) - 53(т,4))г.
54 ГЛАВА 3. КОМПЛЕКСНЫЕ ЧИСЛА При этом имеют место равенства: 5o(m,4) + S2(m,4) = 50(m,2) = 2'""1, Si(m,4) + 53(m,4) = г"1-1. Отсюда находим: 5o(m,4) = 2m"2 + 2m/2-1cos7rm/4, Si(m,4) = 2m~2 + г"1/2"1 sin7rm/4, 52(m,4) = 2m"2 - г171/2"1 cos7rm/4, 53(m,4) = 2m"2 - 2m/2^ sin7rm/4. Эти формулы примут более удобный вид, если рассмотреть частные случаи в зависимости от остатка при делении числа та на 4. Упражнения 1. Вычислить сумму всех fc-x степеней всех корней n-й степени из 1. 2. Вычислить сумму: 1 + 2е + Зе2 Н- . . . + пеп~~1, где е = cos 2тг/п + sin 2тг/п. 3. Решить уравнение: ( П Jzcos(</> + a:)+ IП jx2cos(^-f-2a)-h...+ (П j£ncos(</> + na) = 0. Указание: Переписать условие в виде Лг^((соз ф+i sin 0)(1+г:)п = тг/2+7гА;, где fc € Z, 2: = z(cos a + г sin a). 3.3 Применение комплексных чисел Формулы для синуса и косинуса двойного и тройного аргумента могут быть обощены на случай произвольного кратного аргумента. Для этого рассмотрим следующий бином: (cos х + г sin x)n = cos nx 4- г sin rcz. Раскрыв скобки по формуле Ньютона и отделив действительную и мнимую части, получим формулы: cos nx = cosn х - I I cosn~2 x sin2 x + 1 1 cosn~4 x sin4 я — ... sin nx - [ I cos^1 x sin x — ( J <:osn~3 sin3 + ( 1 cosn"5 ж sin5 x - ...
3.3. ПРИМЕНЕНИЕ КОМПЛЕКСНЫХ ЧИСЕЛ 55 Общий член для первой суммы имеет вид: (-1)*(2^) cosn~2* х sin2* х. Общий член для второй суммы имеет вид: (—l)*(2j.+i) cos""2*"1 xsin2fc+1 x. Последние члены этих сумм зависят от четности п, поэтому они не выписаны. Приведем эти формулы для малых п: cos 4х = cos4 х - 6 cos2 x sin2 x + sin4 х, sin 4х = 4 cos3 х sin x — 4 cos x sin3 х; cos 5x = cos5 x - 10 cos3 sin2 4-5 cos x sin4 x, sin 5x = 5 cos4 x sin x - 10 cos2 x sin3 x + sin5 x. Из этих формул можно вывести некоторые интересные факты. Задача. Вычислить сумму ряда, состоящего изо всех обратных квадратов: 1 + 2"2 + 3-2 + ... + А:-2 + .... П Разделим формулу для sin их на sinn x : sinnx Заметим, что левая часть формулы обращается в ноль при х = nl/nj = 1,2,... ,п - 1. Пусть п = 2к + 1. Тогда уравнение /о, ,ч к /2fc+l\ ц /2fc + l V ^ / \ имеет корни уг = сгд2(ж/п),у2 = ctg2(n2/n),... у ctg2(irk/n). Поэтому правую часть уравнения можно переписать в виде: (2к+1)(у-У1)(у-у2)... (y-yk) = Значит, коэффициенты при ук~* совпадают: /2fc + lV , Мы получили тождество: 7г2 , тгА; + + t которое позволяет решить поставленную задачу. В самом деле, для любого угла а из первой четверти имеют место сравнения: sin а < а < tga.
56 ГЛАВА 3. КОМПЛЕКСНЫЕ ЧИСЛА Возведя их в степень -2, получим двойное сравнение: ctg2a < а"2 < sin"2 a = ctg2 + 1. Станем подставлять вместо а числа к1/(2к + 1) для / = 1,2,... ,fc. Получим двойные сравнения вида: у2 < (2к + l)2/(7rf)2 < у2 + 1. Сложив их все, получим следующее двойное сравнение: Учитывая полученное тождество, перепишем его в виде: 7T22fc(2A-l) 2 2 2 ^ Крайние части этого двойного неравенства стремятся к одному и тому же пределу — к тг2/6. Значит, 2"2 + 3~2 АГ2 + ... = тг2/6.а Можно обобщить следующие формулы, выражающие степени синуса или косинуса через косинусы или синусы кратных углов: 2 cos2 х = cos 2x 4- 1, 2 sin2 = 1 - cos 2x; 4 cos3 x = cos Зх + 3 cos x, 4 sin3 = 3 sin x - sin 3x. Для этого рассмотрим бином (uH-v)n, где и = cos а;-И sin х, г> = cos -г sin x. С одной стороны, (и 4- w)n = 2n cosn x. С другой стороны, можно раскрыть этот бином по формуле Ньютона, пользуясь тем, что uv = 1 : (u + v)n = ип + И + Заметим, что tx' + ?/ = 2cos/x. В зависимости от четности п получим формулы: 4fc cos2* x = 2 53 Г2^) cos 2(fc - ^) ,
3.4. ТЕОРЕМА ДАЛАМБЕРА — ГАУССА 57 Совершенно аналогично, рассматривая бином (и—v)n, получим формулы: fc-l ,_,ч 4fcsin2* = 2V(-l)*+s( )cos2(ifc-s)a: - ,=о v s * 4* sin2*+1 x = У"(-1)*+в (2к + Л sin(2Jt + 1 - 2s)x. s v s t Упражнения 1. По индукции проверить формулу: 2cosnx = (2cosrr)n - y( SI Указание: Использовать формулу 2cos(n -h l)x = 4 cosx cosnx — 2cos(n — l)x. 2. Вычислить суммы: а) cos x + f j cos 2x + ... + f j cos(n + l)x; б) sin x + f J sin 2я + ... + f j sin(n + l)x. 3,4 Теорема Даламбера — Гаусса Теорема Даламбера — Гаусса или, как ее еще называют, основная теорема алгебры состоит в следующем. Теорема. Каждое алгебраическое уравнение n-й степени с комплексными коэффициентами имеет ровно п комплексных корней с учетом их кратностей. При помощи теоремы Безу эта теорема легко сводится к более простой формулировке: Теорема. Каждое алгебраическое уравнение положительной степени имеет комплексный корень.
58 ГЛАВА 3. КОМПЛЕКСНЫЕ ЧИСЛА П Выведем исходную теорему из этого предложения, используя индукцию по степени уравнения. Для уравнений первой степени обе формулировки эквивалентны и выполняются очевидным образом. Пусть исходная теорема выполняется для всех уравнений степеней не превосходящих п. Рассмотрим произвольное уравнение f(z) = 0, где degf(z) = п + 1. Согласно второй формулировке теоремы Даламбера — Гаусса, Это уравнение имеет корень zq. По теореме Безу существует многочлен g(z) степени п такой, что f{z) = (z - zq)q(z) = 0. Уравнение g(z) = 0 имеет ровно п корней, согласно предположению индукции. D Эту теорему доказали Даламбер и Гаусс. Мы не станем здесь приводить их доказательства. Вместо этого мы разберем нестрогое доказательство этой теоремы, которое носит название «дама с собачкой». Подчеркнем, что мы рассматриваем уравнения вида f(z) = 0, где f(z) — многочлен с комплексными коэффициентами. Как мы показали в секции 2, уравнение zn = z имеет п + 2 решения. Поэтому нужно рассматривать только стандартные многочлены (без сопряженной переменной). Доказательство. □ Можно положить старший коэффициент многочлена f(z) равным единице: f{z) = zn + aiZn-1 + ... + an; ak € С к = 1,2,... , п. Кроме того, можно считать, что свободный член не равен нулю (в противном случае многочлен имеет очевидный корень z = 0). Пусть f(z) = z11 -f f\(x). Эти два слагаемых называют, соответственно, «дама» и «собачка». Пусть а = тах^а^, |а2|,... , \ап\), zo — корень исходного уравнения. Пусть \zo\ > 1. Тогда, \zq\ = |/i(20)|. При этом выполняется соотношение: Ып = | 1 2 Значит, 1 < a/(\zo\ - 1). Поэтому, |^о| < a + 1. При выполнении условия \z\ > а -Ь 1 «дама» имеет такой большой «поводок», что «собачка» не может достать до нуля, и корней у уравнения нет. Теперь рассмотрим это уравнение при малых по модулю значениях z - \z\ < 1. В этом случае значение исходного многочлена близко к свободному члену — ап. Действительно, \f(z) -an\ = \z\\z n-1
3.4. ТЕОРЕМА ДАЛАМБЕРА — ГАУССА 59 < \z\(a + 1)(кГJ + \z\n~2 + ... + 1) < \z\(a + l)n. В последней строчке мы заменили каждое слагаемое на 1. Для любого, сколь угодно малого е > 0 мы можем выбрать \z\ < S = s(a + l)"1?*"1. При этом будет выполнятся неравенство: \f{z) - ап\ < е. Пусть г £ [6/2, а+2]. Рассмотрим образ окружности z = r(cos t+i sin t)% где — 7Г < t < 7г, при отображении z н> /(z)- Для значений г, близких к правому концу отрезка, этот образ — замкнутая кривая, ограничивающая область, внутри которой лежит начало координат — точка z — 0. При г, близких к левому концу отрезка, этот образ — замкнутая кривая, ограничивающая область, лежащую в е-окрестности точки ап. Точка z = 0 будет лежать вне этой области. При постепенном изменении г от левого до правого концов отрезка замкнутая кривая — образ окружности радиуса г — будет плавно меняться. В силу того что сначала точка z = 0 лежит вне области, ограниченной этой кривой, а в конце эта точка лежит внутри этой области, должно существовать промежуточное значение г, при котором данная кривая пересечет точку z — 0. Точка пересечения будет соответствовать корню исходного уравнения. D Теорема. Всякий многочлен положительной степени с действительными коэффициентами раскладывается в произведение линейных множителей и квадратных трехчленов с действительными коэффициентами. Доказательство. □ Пусть f(x) — многочлен с действительными коэффициентами степени п > 1. Можно считать старший коэффициент равным единице. Пусть х\, хг,... , хп — все его комплексные корни (кратные выписаны столько раз, какова их кратность). Тогда имеет место равенство: f{x) = (х - xi){x - х2)... (х - хп). Для доказательства теоремы достаточно показать, что корни, не являющиеся действительными числами, делятся на пары комплесно сопряженных. Каждая такая пара дает квадратный трехчлен с действительными коэффициентами (с отрицательным дискриминантом): {х - {и + vi))(x -(и- vi)) - х2 - 2их + и2 + V2. Если Xk — корень многочлена /(я), то Щ также корень этого многочлена. В самом деле, f(x) = f(z). Это следует из того, что сопряженное к степени равно степени сопряженного. Поэтому, o = 7fo) = /(s*)-
60 ГЛАВА 3. КОМПЛЕКСНЫЕ ЧИСЛА Исходное утверждение проверяется по индукции. Для п = 2 оно очевидно Предположим, что оно выполняется для всех многочленов не превосходя щей п степени. Пусть degf(x) = п + 1. Многочлен /(х) имеет корень Если этот корень действительный, то f(x) представляется в виде произведения линейного множителя и многочлена степени п с действительными коэффициентами. Если этот корень не действительный, то многочлен f(x) представляется в виде произведения квадратного трехчлена и многочлена степени п — 1 с действительными коэффициентами. В обоих случаях индуктивный переход осуществлен.D Задача. Разложить на множители многочлен хп — 1. О Корни этого многочлена — это корни n-й степени из единицы. Разберем отдельно случаи четного и нечетного п. Пусть п = 2к. Имеется два действительных корня — ±1. Комплексные корни разбиваются на пары комплексно сопряженных: cos(2fc - s)- +isin(2fc - s)— = cos,s- + г sins-, s = 1,2,... ,fc. К К К К Каждая такая пара дает квадратный трехчлен вида: х2 - 2а; cos 5 f + 1. Разложение имеет вид: к-1 х2к-1 = {х2 - 1) Ц(х2 - 2я?соввJ + 1). k Разделив обе части на х2 - 1, получим равенство: Подставив в него х = 1, получим: к-1 s=i Раздолим каждую скобку на четыре и воспользуемся формулой синуса половинного аргумента: ТТ - 2 т -т—Г = I I Sin 8—. 4 "*"^ 2А;
34. ТЕОРЕМА ДАЛАМБЕРА — ГАУССА 61 Извлекая квадратный корень из обеих частей, получим тождество: 7Г . о 7Г 7Г \/к Пусть п = 2к + 1. Имеется один действительный корень — 1. Разложение имеет вид: * -т. Разделив на х - 1 обе части, получим равенство: к Подставив в него х = 1, получим: к Разделив каждую скобку на четыре, взяв квадратный корень от обеих частей и воспользовавшись формулой для синуса половинного аргумента, получим тождество: тг v/2fc+1 m Упражнения 1. Разложить на линейные и квадратные множители с действительными коэффициентами многочлен хп + 1. 2. Доказать, что уравнение = а имеет корни все действительные и различные, если \а\ = 1.
Глава 4 Резольвенты уравнений 4.1 Резольвенты Лагранжа При решении уравнения третьей степени методом Гудде его корень представляют в виде суммы двух частей: х = и + v. Лагранж нашел для и и v такую алгебраическую интерпретацию, которая существенным образом проясняет процесс решения, сводя его к комбинаторным манипуляциям с символами xi, л:2,а:з, обозначающими корни уравнения х3 + ах + b = 0. Положим по определению: Pi = 2 Р2 = где ы = -1/2 + у/Зг/2. Эти выражения называются резольвентами Лагранжа общего уравнения третьей степени. Заметим, что Pi + 9ч = 2zi Это следует из уравнения и2 4- w + 1 = 0. Согласно теореме Виета для общего уравнения третьей степени, х\ + Я2+Я3 = 0. Поэтому pi +/>2 = 3zi. Это как раз те части (утроенные) на которые разбивают корень уравнения В самом деле, их произведение имеет вид:
64 ГЛАВА 4. РЕЗОЛЬВЕНТЫ УРАВНЕНИЙ Однако сумму квадратов можно преобразовать к виду: Поэтому х\ + х\ - + х2х3 + 3:3X1) = -За, так как согласно теореме Виета Х\Х2 + Х2Х3 Найдем теперь сумму кубов резольвент: р\ -f p\ = (pi + /?2)((pi + Р2)2 - Зрхрг) = 3xi(9xi + 9а) = 27(х? + ахх). Вспомним, что xi — корень общего уравнения третьей степени. Значит х\ + axi = -Ь и р\ + р2 = -276. В результате получилась система двух уравнений: Г p?+pi = -27b \ /^1^2 = -За. Эта система совпадает с системой для и и v (для полного соответствия нужно первое уравнение разделить на 27,а второе — на 9). Коэффициенты а и 6 можно считать комплексными числами. р\ = 27(-Ь/2 + л/Д), Рз = 27(-Ь/2 - \/Д). В формулах стоит одно и то же значение квадратного корня. Далее решение такое же, что и раньше с и и v. Впрочем можно лучше объяснить получение второго и третьего корня. Извлечем из двух полученных формул кубические корни таким образом, чтобы выполнялось второе уравнение. Можно составить систему: si + х2 + х3 = О хх 4- u>x2 + w2x3 = Зу-6/2 + у/К х\ + w2x2 + a>x3 = 3у -6/2 - у/А. Эта система легко решается. В самом деле, сложив все три уравнения и воспользовавшись равенством ш2 + и + 1 = 0, получим: 3*1 = 3{y/-b/2 + 'VE+ у/-Ь/2+у/К).
4.1. РЕЗОЛЬВЕНТЫ ЛАГРАНЖА 65 Умножим второе уравнение на о;2, а третье — на а;. Сложив все три равенства, получим: = 3(w2 у/-Ь/2 + у/К + о/\/-Ь/2 - Теперь умножим второе уравнение на о;, а третье — на о;2. Сложив все три равенства, получим: = 3{lj у/-Ь/2 + \/Д + о;2 \/-Ь/2 - Однако резольвенты Лагранжа полезны не только для объяснения метода решения общего уравнения третьей степени. Аналогично квадратному уравнению, для уравнения третьей степени можно определить дискриминант Dz- Положим: D3 = (xi - х2)2(х2 - яз)2(х3 - хг)2, где х\,Х2,хз — корни уравнения. Очевидно, что дискриминант равен нулю тогда и только тогда, когда уравнение имеет кратные корни. Это — основное свойство дискриминанта. При помощи резольвент Лагранжа можно найти выражение дискриминанта через коэффициенты уравнения х3 + ах + Ь = 0. Для этого рассмотрим разность кубов резольвент: Pi - Р\ = (Pi - P2)(Pl ~ Up2){pl - U2p2). Первая скобка в правой части равна ч/3г(я2 - х3). Вторая скобка равна (1 — ш2){х\ — х2). Третья скобка равна (1 — ш)(х\ — атз). Заметим, что (1 - ш)(1 - и>2) = 1 - и> - и1 + 1 = 1 4-1 + 1 = 3. Значит имеет место равенство Однако левую часть последней формулы можно непосредственно выразить через коэффициенты уравнения: (А - Р\? = (Р? + Pi)2 - ЬР\Р% = (-2™)2 + 4(3«)3 = 27(4а3 + 27Ь2). № итоге получаем формулу : D3 = -4о3 - 27Ь2 = -108Д.
66 ГЛАВА 4. РЕЗОЛЬВЕНТЫ УРАВНЕНИЙ Напомним, что уравнение х3 4- ах + b = 0 получилось из уравнения х3 + а\ х2 + а2Х 4- аз = 0 благодаря переходу к переменной х + ai /3, то есть корни первого уравнения получаются из корней второго уравнения путем прибавления к ним одного и того же слагаемого — Oi/З. Поэтому разнос» ти корней и дискриминанты у обоих уравнений совпадают. Подставим формулы а = а2- а?/3, Ь = a3 - <iia2/3 \ в дискриминант: Z)3 = а\а\ - 4а3 - 4aja3 + 18aia2a3 - 27a?;. Z>3 = 0 — необходимое и достаточное условие кратности корней уравнения х3 + а\х2 4- а2х + «з = 0. Разберем классическую задачу на дискриминант уравнения третьей степени: Задача. Решить уравнение (х3 - 3qx + р3 - Зрд)2 - 4(рх 4- q)3 = 0. □ Заметим, что левая часть уравнения сильно напоминает дискриминант уравнения zz + az 4- 6 = 0. Для полного соответствия внесем знак «минус» за скобку второго члена и умножим обе части на -27 : -4(-Зрх - Зд)3 - 27(х3 - 2qx + р3 - Зрд)2 = 0; a = — Зрх — Зд, Ь = х3 — Здх — Зр<7- Это условие выполняется тогда я только тогда, когда уравнение (от неизвестной z) г3 - 3(рх + q)z + х3 - Здх + р3 - 3pq = 0 имеет кратные корни. Как ни странно, это уравнение легко решается разложением на множители. Для этого достаточно сгруппировать члены z3 4- х3 +р3 - З-zхр . Из оставшихся членов Zqz — 3qx — 3qp — выносится множитель z + х 4- р. Такой же множитель выносится из первой группы членов: (г + 1 + p){z2 4- х2 4-7>2 - zx - хр - pz - 3g) = 0. Получаем первый корень — zi = —х - р. Оставшиеся два корня найдем из квадратного уравнения z2 - (х + p)z 4- х2 + р2 - хр - Зд = 0 :
4j. РЕЗОЛЬВЕНТЫ ЛАГРАНЖА 67 2z2 = х + р + у'-Зж2 - Зр2 + багр + 12д, 2z3 = а; + р - \/-Зх2 - Зр2 + бхр + 12д. ^сходное уравнение эквивалентно совокупности: -2х - 2р = х + р + у'-За2 - Зр2 + бхр + -2а; - 2р = х + р - \/-Зз:2 - Зр2 4- бар -f у/-3х2 - Зр2 + бхр . х +р— у/-3х2 - Зр2 + 6а:р + I2q. Первое и второе уравнения совокупности можно переписать в виде: - р) = ±2\/—Зх2 — Зр2 + багр 4- 12д. Возводя в квадрат, получим: 9(х 4- р)2 = -За:2 - Зр2 4- бра: + 12д, а:2 4- рх 4- р2 - q = О, 2a?i?2 = —р± \/4<7 - Зр2. Само собой разумеется, что коэффициенты р и q предполагаются комплексными числами. Третье уравнение совокупности можно переписать в виде: -За:2 - Зр2 + ба:р + 12д = О, х2 - 2рх 4- р2 - 4д = О, гЗ,4 = Р i ^y/q- Мы получили, вообще говоря, четыре различных корня. Это объясняется тем, что первый и второй корни имеют кратность два. В самом деле, исходное уравнение переписывается в виде: = -27(ж2 + рх 4- р2 - q)2(x2 - 2рх + р2 - 4д) = О.П Упражнения 1- Доказать, что для Х1,а:2,хз — корней уравнения а;3 4- ах + b = 0 — выполняются условия: ""* 2 2 2 2 2 2. Пользуясь результатом предыдущей задачи, составить уравнение третьей степени, имеющее следующие корни: a) 2/1 = х2 - xix2 +х\,у2 = х\- х2х3 4- аг§,t/з = ж| - x3xi + х\\ b) Ух = (ал -я2)2,у2 = (^2 -а:3)2,2/з = (^з ~^\)2-
68 ГЛАВА 4. РЕЗОЛЬВЕНТЫ УРАВНЕНИЙ 4.2 Решение общего уравнения четвертой степени Общее уравнение четвертой степени х4 4- агх3 + а2х2 4- агх + а4 = О можно привести к виду х4 + ах2 +Ьх+с = 0, перейдя к переменной х+ах/4 (это удобно сделать, пользуясь схемой Горнера). Второе уравнение также станем называть общим уравнением четвертой степени. Решим его тремя способами. Метод Гудде Представим корень (удвоенный) в виде трех слагаемых: 2х - u+u+w. Умножим уравнение на 16 и подставим эту формулу в уравнение: {2х)А 4- Аа(2х)2 + Щ2х) + 16с = {и2 + v2 + w2 + 2{uv + vw + wu))2+ 4-4a(u2 + v2 + w2 + 2(uv + wtz; + wu)) + 86(u -f v + w) + 16c = = (w2 + w2 4- w;2)2 + 4{u2 4- v2 -h w;2)(?it; + vw + t^w) + 4(u2v2 +v2w2 + ш2и2)+ 222 = 0. У нас три переменные — и, г;, w. Значит, нужно получить систему из трех уравнений. Для этого нужно на слагаемые в последней формуле наложить два условия (сама эта формула даст третье уравнение). Пусть в последней формуле второе и шестое слагаемые в сумме будут равны нулю — 4(и2 4- v2 4- w2)(uv 4- vw 4- wu) 4- 8a(uv 4- vw 4- wu) = 0. Для этого достаточно наложить условие: и2 4- v2 4- ш2 = -2а. Пусть, кроме того, четвертое и седьмое слагаемые в сумме будут равны нулю — &uvw(u 4- v 4- w) 4- 8b(u 4- v 4- ш) = 0. Для этого достаточно наложить условие: uvw — —b. Перепишем исходное уравнение с учетом наложенных условий: (-2а)2 4- 4(u V + v2w2 + w2u2) + 4а(-2а) + 16с = 0. Оно эквивалентно уравнению: u2v2 4- v2w2 4- w2u2 = а2 — 4с. В результате получилась система: и2 4- v2 4- w2 = -2а u2v2 4- v2w2 + w2u2 = а2 — 4с = -Ь.
4.2. РЕШЕНИЕ ОБЩЕГО УРАВНЕНИЯ ЧЕТВЕРТОЙ СТЕПЕНИ 69 Если последнее уравнение системы возвести в квадрат (при этом теряется часть информации), то относительно квадратов переменных получится система из теоремы Виета для уравнения третьей степени» Другими словами, уравнение z3 + 2az2 + (а2 - 4с) z - Ь2 = О имеет корни — z\ = u2,Z2 = v2yz$ — w2. Для решения общего уравнения четвертой степени нужно решить данное уравнение третьей степени, вычислить квадратные корни из корней этого уравнения и положить: 2х = y/z\ + >fz2 + \fzl- Однако таким образом получается восемь решений (знак у каждого из корней можно выбрать двумя способами). Не все эти решения соответствуют решениям системы и, значит, корням исходного уравнения. Здесь играет роль как раз та информация, что была потеряна при возведении в квадрат третьего уравнения системы. Выберем знаки у квадратных корней и = y/z[, v = y/z^, w = yfzi таким образом, чтобы выполнялось условие uvw = -Ь. Это условие будет выполняться, если одновременно у двух корней изменить знак на противоположный. В итоге получаем все четыре корня общего уравнения четвертой степени: Разложение на множители Разложим правую часть общего уравнения четвертой степени в произведение двух квадратных трех членов с неопределенными коэффициентами: х4 + ах2 + Ьх 4- с = (х2 + щх -f v\)(x2 + и2х + v2) = 0. Если нам удастся выразить ^1,^2,^1,^2 через коэффициенты исходного Уравнения, то мы легко найдем все его корни, решив два квадратных Уравнения. Раскрыв скобки, и приравняв коэффициенты при одинаковых степенях, получим следующую систему четырех уравнений:
70 ГЛАВА 4. РЕЗОЛЬВЕНТЫ УРАВНЕНИЙ Первое и последнее уравнения системы дают возможность избавиться от двух переменных: и = щ = -i*2, v = v\ = c/i^- В результате получается система двух уравнений с двумя неизвестными: u + c/v - и2 = а cu/v — uv = b. Выберем такие переменные t\ и £2, чтобы и2 = Мг,^2 = ^гЛь Для этого достаточно положить — t\ — ujv.ti — uv. Тогда первое уравнение системы перепишется в виде yfbzfti 4- c\jt\fti - h^2 = а; второе уравнение системы перепишется в виде tt = ct\ — b. Первое уравнение можно переписать в виде: (мы умножили обе части на х/Мг)- Теперь подставим в него *2 из второго уравнения и возведем обе части в квадрат: {cti -b + cti)2 =ii(c*i — b)(ti(c£i -6) 4-о)2. Здесь удобно перейти к переменной t = 2cii - 6 и умножить обе части на 64с3, тогда уравнение перепишется в виде: 64с3*2 = (* + 6)(* - b)((t - b){t + 6) + 4ас)2 = (i2 - Ь2)(*2 - Ь2 + 4ас)2. Удобно ввести новую переменную z = (£2 - Ь2)/4су тогда уравнение перепишется в виде: 4cz + b2 = z(z + а)2 = z3 4- 2аг2 + а22 (мы разделили обе части на 64с3). У нас получилось точно такое же вспомогательное кубическое уравнение — г3 + 2az2 4- (а2 — 4с)z — b2 = 0 , что и при решении методом Гудде! Метод Феррари Идея этого решения состоит в том, чтобы представить левую часть общего уравнения четвертой степени в виде разности квадратов. Она близка к идее предыдущего метода, так как из разности квадратов возникает разложение в произведение двух квадратных трехчленов. Подберем такой параметр £, чтобы следующее выражение представляло собой разность квадрата квадратного трехчлена и квадрата линейного выражения: хА + ах2 + Ьх + с = (а:2 4-1 + а/2)2 - 2ta2 4- bx 4- с - (t 4- а/2)2.
4.3. РЕЗОЛЬВЕНТЫ УРАВНЕНИЯ ЧЕТВЕРТОЙ СТЕПЕНИ 71 Для этого необходимо и достаточно, чтобы дискриминант квадратного трехчлена 2tx2 -bx + (t + a/2)2 - с равнялся нулю. D = Ь2 - &t[{t + а/2)2 - с] = Ь2 - 2t[(a + 2t)2 - 4с] = 0. Положив z = 2£, получим прежнее вспомогательное уравнение: г3 -h 2az2 + (о2 - 4с)г - Ь2 = 0. Все три метода приводят к одному и тому же вспомогательному кубическому уравнению. Это наводит на мысль, что общее уравнение четвертой степени решается по существу только одним методом, хотя и возможны различные подходы. В следующей секции мы приведем некоторые доводы в подтверждение этой мысли. В заключение отметим, что Феррари (ученик Кардано) первым нашел метод решения общего уравнения четвертой степени. Наиболее удобное решение методом Гудде получил Эйлер. Упражнения 1. Решить биквадратное уравнение ж4 + ах2 + с = 0 всеми тремя приведенными выше методами. 4.3 Резольвенты уравнения четвертой степени Идею найти выражения от четырех корней Х\, х2, Хз, х± общего уравнения четвертой степени, аналогичные резольвентам Лагранжа подсказывает следующая комбинаторная задача. Каким образом можно разделить множество из четырех корней исходного уравнения на два двухэлементных Подмножества, если порядок следования подмножеств неважен? Имеется Ровно три возможности: возможности определяются выделением того подмножества, где ле- элемент х\ (к нему можно добавить или хч, или жз, или Х4).
72 ГЛАВА 4. РЕЗОЛЬВЕНТЫ УРАВНЕНИЙ Оказывается, что те части, на которые делится корень при решении методом Гудде, находятся именно из указанных выше соображений: и = х\ Н- х2, v = Х\ + жз> w = х\ + Х4- В самом деле, u+v+v> — х\ +хг+х\ +x%+x\ +х4 = 2xi (из теоремы Виета для общего уравнения четвертой степени следует, что Х\ +Х2 +хз+я4 = ^). Корни вспомогательного уравнения третьей степени выражаются через корни исходного уравнения следующим образом: z\ = и2 = (xi + х2)2 = (2:1 + х2)(хг + х2) = -{xi -f x2){xz + ж4), z2 = v2 = (хг + аг3)2 = -{xi + хз)(х2 + ж4), z3 = w3 = (ari + х4)2 = -(xi -f x4)(ar2 + x3). Эти выражения являются теми самыми резольвентами, посредством которых решается общее уравнение четвертой степени. Вообще резольвентами называют выражения от корней некотого уравнения, которые являются корнями другого уравнения. При помощи общей теоремы Виета можно выразить коэффициенты последнего уравнения через коэффициенты исходного уравнения. Общая идеология здесь такова: решение исходного уравнения эквивалентно решению связанной с ним системы Виета. Решив вспомогательное уравнение, мы добавляем к этой системе новые уравнения, которые облегчают ее решение. Продемонстрируем этот метод на примере решения общего уравнения четвертой степени. Мы предложили три резольвенты — z\,z2iz^- Они являются корнями некоторого уравнения третьей степени. Это — вспомогательное уравнение из предыдущей секции — z3 4- 2az2 + (a2 — 4c)z-b2 = 0. Предположим, что мы уже доказали этот факт. Тогда мы можем решить вспомогательное уравнение в радикалах и выразить zi,z2,Z3 через коэффициенты а.Ьус. Вместо системы Виета можно рассмотреть следующую систему: i + Х2 + х3 + я4 = 0 \ + х2 = f{ хЛ-хг- i + хА = В ней только первое уравнение из системы Виета. Остальные три уравнения получаются при извлечении квадратных корней из резольвент. Решение этой системы не представляет никаких трудностей (нужно найти
4.3. РЕЗОЛЬВЕНТЫ УРАВНЕНИЯ ЧЕТВЕРТОЙ СТЕПЕНИ 73 .ть сложив последние три уравнения системы. Затем находятся остальные корни перенесением х\ в правую часть в последних трех уравнениях системы). Естественно, что в итоге получились те же самые формулы, что и при решении методом Гудде. Недоказанным остался тот факт, что резольвенты ziyz2,zz являются всеми корнями указанного выше вспомогательного уравнения третьей степени. Это можно доказать непосредственно из общей теоремы Виета. Мы почти так и поступим, только для облегчения технических сложностей разобьем этот процесс на два шага. Обозначим через У1 = ХХХ2 + Я3Х4, 2/2 ~ Х]Хз + Х*Х^ У* = Х*Х* + Х*Х* новые три резольвенты. Они связаны с исходными резольвентами следующим образом: Мы сначала построим уравнение с корнями уi, 2/2> 2/з > и от него перейдем к уравнению с корнями 21,22,23. Пусть уравнение уг + Ь\у2 4-Ь2у + &з = 0 имеет корни у\,у2,Уг- Тогда, согласно общей теореме Виета: ~Ь\ = у\ + т/2 + 2/з = х\Х2 + #3*4 + *1Яз + аг2аг4 + тлхА + x2x3 = о. Мы получили второй коэффициент общего уравнения четвертой степени. h = Z/12/2+ 2/22/3 Многоточием мы обозначаем члены, которые отличаются от непосредственно предшествующего им члена лишь заменой переменных. В последней строчке мы так обозначили одиннадцать похожих членов, чтобы их не выписывать. Такие записи полезно проверять по числу входящих в них членов. Например, в предпоследней строчке трижды перемножаются по два множителя, каждый раз получается по четыре члена. Как раз Двенадцать членов стоит в том выражении в последней строчке, где есть Многоточие (сначала мы выделяем три корня из четырех, затем выделяем один из этих трех, ставя над ним вторую степень). В итоге получилась формула: Ъ2 = -4с (так как х\ + х2 + х3 + ^4 = 0).
74 ГЛАВА 4. РЕЗОЛЬВЕНТЫ УРАВНЕНИЙ Сначала разберемся с выражением х\х2Х^ха + • • • = х\ 4- х\ + х\ Н- х\) Н- Х\Х2ХъХа{(х\ + х2 + Хз + #4)2 — х2х3 + Х2Х4 + х3х4)) = -2ас. Для того, чтобы выразить второе выражение через а, 6, с , рассмотрим выражение: Ь2 - (xix2x3 + •.. )2 = х\х\х\ + ... + 2(^1X2^3X4 + ...) = = х\х\х\ + . . . + 2X1X2X3X4(Xi£2 + * * * ) - Х1Х2Х3 + • • • + 2ас* Значит, х\х\х\ 4-... = Ь2 — 2ас и — Ь3 = Ь2-4ас. Уравнение для резольвен! Уь?/2,Уз имеет вид: у3 - ш/2 - 4q/ + 4ас - б2 = 0. Теперь аналогичным образом найдем коэффициенты уравнения Г'2* + сз = 0 для резольвент zi, Z2,23. -ci = -2(2/1 + 1/2 + 2/з) = 2bi = -2а, / + 2/2 + Уз = ЗЬ2 + Ь\ - 262 = Ъ\ + Ь2 = а2 - 4с, = (j/i + 3/2X1/2 + Ы(2/з + J/i) = У1У2 + ■ • - + 2j/ij/2|/3 = = (j/i + ,V2 + Уъ){У1Уг + I/2J/3 +2t/iy2?y3 = а(-4с) + (-3 + 2)(Ь2 - 4ас) = -б2. Итак, мы получили уравнение г3 + 2а22 + (а2 - 4c)z - Ь2 = 0. Чтобы не возникло впечатления, что резольвенты нужны лишь для того, чтобы лучше понять уже полученные результаты, подсчитаем с их помощью дискриминант общего уравнения четвертой степени ZV £>4 = (xi - x2)2(xi - x3)2(xi - х4)2(х2 - х3)2(х2 - х4)2(х3 - х4)2. Заметим, что = (X2-X3)(Xi+X2+Xi+X3) = (х2 ~
4.3. РЕЗОЛЬВЕНТЫ УРАВНЕНИЯ ЧЕТВЕРТОЙ СТЕПЕНИ 75 Здесь мы воспользовались формулой: х\ + х2 + х$ + #4 = 0. Совершенно аналогично получим: - Х2), zz- zi = (x4 -х2){хг -ягз). Отсюда следует, что дискриминант общего уравнения четвертой степени совпадает с дискриминантом построенного выше вспомогательного уравнения третьей степени. Подставим коэффициенты этого уравнения в формулу для дискриминанта, полученную в конце первой секции: D4 = 4а2(а2 - 4с)2 - 4(а2 - 4с)3 + 32а3Ь2 - Зба62(а2 - 4с) - 2764 = = 1ба4с - 4а362 - 128а2с2 + 144оЬ2с - 27Ь4 + 256с3. Уравнение D\ — 0 задает в координатах а. 6, с замечательную поверхность -- «ласточкин хвост». Упражнения 1. Вычислить дискриминант общего уравнения четвертой степени х4 + aix3 + а2х2 + а3.х + а4 = 0. 2. Выписать уравнение третьей степени для следующих резольвент: У\ = {х\ +х2 -жз ~х4)2, j/2 = (a?i -я2 +х3 -^)2, уз = [х\ -х2-х3 +х4)2. Здесь xi, х2, х3,Х4 — корни уравнения хА н- ах2 + />х + с = 0. Решить это уравнение при помощи указанных резольвент.
Глава 5 Решение уравнений в целых числах 5.1 Решение линейного уравнения в целых числах Для решения уравнения вида + by — с , где а, Ь,с — произвольные целочисленные параметры, прежде всего нужно найти НОД(а, Ь) и проверить делится ли на НОД(а,Ь). Если не делится на НОД(,Ь),то целочисленных решений (ж, у) быть не может, так как левая часть уравнения при этом делится на НОД(а,6), а левая часть — не делится. Если делится на НОД(,Ь), то обе части уравнения можно сократить на НОД(,Ь). При ^том получается новое уравнение с взаимно простыми коэффициентами в левой части. Будем решать именно такое уравнение ах + by = с, НОД(а, Ъ) = 1. В дальнейшем мы покажем, что это уравнение всегда имеет решения ( причем бесконечно много решений). Заметим, что существование одного целочисленного решения приводит к бесконечной серии таких решений. Пусть (яо»2/о) — целочисленное решение, тогда для всякого целого t пара (хо — bt, т/о + o,t) также является решением: а(х0 - Ы) + Ь(уо + at) = ахо 4- буо - abt + bat = с. Более того, всякое решение (жь j/i) можно представить в указанном виде : х\ = хо — bt,yi = уо + Q>ty Для некоторого целого t. Рассмотрим разности
78 ГЛАВА 5. РЕШЕНИЕ УРАВНЕНИЙ В ЦЕЛЫХ ЧИСЛАХ и = х\ — xo,v = у\ - х/0' Пара {u,v) является решением так называемого однородного уравнения ах + by = 0. Однако его решения имеют вид : х = -Ы,у — at, где t — целое. В самом деле, ах = -Ьу- Поэтому Ъ делит ах. Однако по условию числа а и Ь взаимно просты. Значит Ь делит х. Аналогично а делит у. Поэтому и = bt\,v = at<i для некоторых целых t\,<2- Однако аи + 6t; = abt\ + Ьа^2 = 0. Значит t\ = -*2 = t. Таким образом, достаточно найти одно целочисленное решение (жо, Уо)- Тогда все решения будут даваться формулами: х — хо - Ы, у = уо + at, где t — целочисленный параметр. Эти формулы представляют параметрический способ задания прямой ах+by = с. Поэтому, считая t действительным или рациональным, мы получим все, соответственно, действительные или рациональные решения этого уравнения с двумя переменными. Необходимо найти методы для определения отдельного решения (хо, т/о] Линейное представление для НОД(а, Ь) доставляет формулу : ат + Ьп = 1. Для нахождения пары (яо,!/о) достаточно умножить эту формулу на а(тс) 4- Ь(пс) = с. Положим : хо = тс, уо = пс. Линейное представление для НОД(а, Ь) можно получить при помощи алгоритма Евклида. Этот алгоритм может быть описан следующим образом. □ Разделим со остатком а на Ъ: а = bqo -f г0, где 0 < r0 < b. Общие делители чисел а и b совпадают с общими делителями чисел b и го. Значит НОД(я, Ь)=НОД(Ь, г0). Следующий шаг алгоритма состоит в делении с остатком Ь на г0: Ь - roqi -f п, где 0 < rx < го- НОД(Ь,г0)=НОД(г0,Г1). Последовательно деля с остатком числа Т{ и ri+i, мы будем сводить вычисление исходного НОД к вычислению НОД меньших чисел. Остаток г* будет уменьшаться на каждом шаге до тех пор, пока не обратится в ноль: Гп-1 = rnqn+urn+l = 0. НОД(о|Ь)=НОД(г„-ьг11) = гпЛ Для наших нужд важен казалось бы неинтересный случай применения этого алгоритма, когда НОД (а, 6)=1. В этом случае нет нужды находить НОД, однако строчки этого алгоритма несут важную информацию, которая может быть использована для нахождения линейного представления НОД, то есть для нахождения частного решения уравнения ах + by = 1. Как это делается лучше всего разобрав конкретный численный пример. Пример. Решить уравнение 62я + 26у = 6 в целых числах. О Заметим, что число 6 делится на НОД(62,26) = 2. После сокращения на 2 получим уравнение 31ж + 13у = 3. С помощью алгоритма Евклида найдем такие га и п, что 31т + 13п = 1: 31 - 2 х 13 = 5,
rr 1. РЕШЕНИЕ ЛИНЕЙНОГО УРАВНЕНИЯ В ЦЕЛЫХ ЧИСЛАХ 79 13-2 х 5 = 3, 5-3 = 2, 3-2 = 1. Подставляя третье уравнение в четвертое, получим: 1 = 3-(5-3) = -5 + 2 х 3. Теперь подставим второе уравнение в полученное: 1 = — 5 + 2(13- 2 х 5) = 2 х 13 - 5 х 5. Осталось воспользоваться первым уравнением: 1 = 2 х 13 - 5(31 - 2 х 13) = 31 х (-5) 4-13 х 12. Значит т - -5,п = 12. Тогда хо = -5 х 3 = -15, j/o = 12 х 3 = 36. Общее решение имеет вид : я = -15- 13t,i/ = 36 + ЗН.П Мы последовательно подставляем строчки алгоритма Евклида друг в друга, рассматривая их как уравнения для г*. В предпоследней строчке алгоритма равенство имеет вид г„_2 = rn-i<7n + 1 или гп_2 — rn-iqn = 1. Это как раз тот вид равенства, который нужен для получения формулы ах + by = 1. Из предыдущей строчки алгоритма можно выразить rn_i через гп_2 и г„_з. Подставив это выражение в предпоследнюю строчку алгоритма, получим равенство вида гп_зи + гп^2^ = 1. По сравнению с предпоследней строчкой алгоритма мы уменьшили индексы. Двигаясь снизу вверх по строчкам алгоритма, мы будет уменьшать индексы, пока не дойдем до а = г_2 и 6 = r_i. В итоге мы получили следующее утверждение. Утверждение. Для любых целых а и Ь найдутся такие целые хиц/, что выполныется равенство ах 4- Ьу=Н0Ща,Ь).О Из этого утверждения можно вывести однозначность разложения целых чисел на простые множители (с точностью до изменения знаков у множителей и порядка их перемножения). Мы будем пользоваться этим фактом, его доказательство представляет собой важную алгебраическую конструкцию. В секции 3 главы 10 эта конструкция приводится для многочленов, поэтому мы не будем ее приводить здесь для чисел. Упражнения 1. Решить в целых числах уравнение : (а3 +а+ 1)х + (а - а4)у = (а4 + 2а)(1 - а3), где — целое число. 2. Доказать,что для того, чтобы уравнение ах 4- by = с имело ровно п натуральных решений, с должно располагаться в пределах: (п - 1)оЬ + a + 6<c<(n + l)ab -а-Ь.
80 ГЛАВА 5. РЕШЕНИЕ УРАВНЕНИЙ В ЦЕЛЫХ ЧИСЛАХ 5.2 Свойства цепных дробей Последний пример можно использовать для иллюстрации связи алгоритма Евклида с дробями особого вида.Приведенные выше строчки алгоритма Евклида для чисел 31 и 13 можно переписать в следующей форме: 31/13 = 2 + 5/13 13/5 = 2 + 3/5 5/3 = 1 + 2/3 3/2=1 + 1/2. Заметим, что в этих равенствах последний член каждой строчки совпадает с обратным числом для левой части следующей строчки. Поэтому исходную дробь можно представить в виде: = 2+—-: = 2+ г- =2+ :— =2 + ; . i + -L Выражения данного вида называют цепными дробями. Алгоритм Евклида позволяет представить всякое рациональное число в виде конечной цепной дроби. Легко видеть, что иррациональные числа нельзя представить в таком виде, так как конечные цепные дроби — рациональные числа. Для иррациональных чисел существует алгоритм представления в виде бесконечной цепной дроби.Для этого алгоритм деления с остатком заменяют следующей процедурой.Пусть а — действительное число, тогда а = [а] + {а}, где дробная часть {а} лежит в пределах от нуля до единицы, исключая единицу. Поэтому, {а}"1 > 1 для нецелых а. Аналогично разложим {а}"1: а = [а] + l/fa}-1 = [а] + [{o}-t)+({tt}-i}i где 0 < {{я}"1} < 1- Очевидно, что этот процесс разделения целой и дробной частей с переходом к обратному можно продолжать неограниченно долго.
52. СВОЙСТВА ЦЕПНЫХ ДРОБЕЙ 81 фл останавливается лишь с появлением целого числа. Для рационального ч#сла p/q этот процесс совпадает с алгоритмом Евклида. В самом деле, разделим с остатком р = aoq + Ь0- Тогда, p/q = а0 + Ьо/<7> где о0 — целая часть и Ьо/<? — дробная часть. Как уже было отмечено, для иррационального числа процесс разложения в цепную дробь никогда не завершится. В результате получится бесконечная последовательность целых чисел. Станем обозначать цепную дробь 1 1 1 а2 Н через {ao,Oi,a2,... ,оп}. Иррациональному числу будет соответствовать бесконечная последовательность {ао, а\,... , ап,... }. Если оборвать цепную дробь на к-ы месте, то получится дробь где Н0Д(р*,<7*) = 1- Её называют fc-й подходящей дробью данной цепной дроби. Для иррационального числа можно поставить вопрос о сходимости последовательности подходящих дробей к данному числу. Ниже мы докажем эту сходимость. Рассмотрим численный пример. Пример: а = >/2. D Разложение имеет вид: Очевидно, что процесс будет циклически повторяться, поэтому разложение имеет вид: л/2 = {1,2,2,... , 2,... }.□
82 ГЛАВА 5. РЕШЕНИЕ УРАВНЕНИЙ В ЦЕЛЫХ ЧИСЛАХ Для периодических цепных дробей уместно использовать специальное обозначение: Например, л/2 - {1,2}. Теорема. Имеют место следующие рекуррентные формулы для подходящих дробей p*/<7fc цепной дроби а = {ao, oi,... , ап,... }: {Pfc = ClkPk~l + Р*-2 <7fc = a*ft-i +7*-2- Доказательство. D Воспользуемся методом математической индукции. Дополним последовательности {/>*} и {^л} на один шаг влево: p_i = 1,(7-1 = 0. Тогда, в силу того, что ро = во? 9о = 1, выполняются равенства: pi/qri = ao + ^ = a'o°+1iPi =aiao + l = aipo+P-i Hgi=aixl-hO = »i7o + ^-i- Так что начальный шаг индукции проверен. Пусть исходное равенство выполняется для всех дробей на А;+1-значных цепных дробей. Рассмотрим (+2)-значную цепную дробь {ao, ^i > • • • , Gfc+i) Представим ее в виде {ao,oi,... ,0^-1,0^4-^—-^} с нецелым последним элементом. Сначала проверим лишь равенство многочленов от переменных а», так что целочисленность значений не важна. Одна дробь получается приведением исходной дроби к стандартному виду, другая — отношение двух рекуррентно строящихся многочленов. Дробь pk+i/qic+i > будет fc-й подходящей дробью для измененной последовательности соответствующей исходной цепной дроби. По предположению индукции (ак +aj^1)pfc-i +p*-2 (ajfeP*-i + Рк-2) ^ Проверим теперь, что получившиеся отношения многочленов от а^ при подстановке целых значений а* дают несократимые дроби. Это вытекает из следующей леммы.
3>2. СВОЙСТВА ЦЕПНЫХ ДРОБЕЙ 83 Лемма. Для чисел р*,<7ь определяемых рекуррентно по формулам: рк = akpk-i -4-pjt—2 Г рк = \ 9л == имеет место равенство: РкЯк-i -Pk-iQk = (—I)*"1. Доказательство. D Для = 1 имеет место равенство р\Яо - Р0Я1 = (aiao+1) x 1-aoai = 1. Воспользуемся теперь рекуррентными формулами: РкЯк-1 ~Рк-\Як = {йкРк-Х +Рк-2)Як-1 ~ Pk-l(a>kQk-l + <7fc-2) = -(Pk-lQk-2 -Pk-2Qk-l)- Последовательно применяя аналогичный прием к стоящему в скобках выражению, мы придем к выражению (-1)к~1(р\Яо - РоЯг) = (-1)*"1. D Из приведенного в лемме равенства вытекает, что НОД(р/ь, qk) = 1 для любого . В частности, это верно для числителя и знаменателя приведенной выше дроби. Утверждение теоремы проверено по индукции.О Разделив равенство РкЯк-\ - Pk-iQk = (~1)*~1 на <1кЯк-\ и взяв абсолютную величину, получим равенство : \1 1\ ЯкЯк-i Оно означает, что длина отрезка между двумя соседними подходящими дробями равна величине обратной произведению их знаменателей. Для действительного числа а процесс построения цепной дроби позволяет ввести последовательность остатков {ап} от разложения в цепную дробь: а = {ao,ai,... >аП1ап}. Например, для а = \/2 все остатки совпадают : ao = J = \/2 Л- 1 = ос\ — а2 = . -. = ап. Периодичность в последовательности остатков (начиная с некоторого места) в точности означает периодичность цепной дроби. Заметим, что при замене ап на ап + —- подходящая дробь рп/Яп переходит в число а. Легко видеть, что нулевая подходящая дробь от этого увеличилась — к числу по нечто добавили. Однако первая подходящая дробь уменьшается от этой процедуры — слагаемое —- заменили дробью с большим знаменателем. Рассуждая аналогично, получаем неравенства : а > рг/<72> « < Рг/яз^ & > Ра/я^ь а < Ръ/Яь^ -..,<* > Р2к/Я2к, г* < P2fc+i/<?2fc+i> Отсюда вытекает, что число а лежит между любыми
84 ГЛАВА 5. РЕШЕНИЕ УРАВНЕНИЙ В ЦЕЛЫХ ЧИСЛАХ двумя соседними подходящими дробями. Значит, расстояние от а до любого из концов не превосходит расстояния между соседними подходящими дробями: \pk-i/Qk-i - а\ < Якпк_1 - При этом равенство достигается лищь при а = Рк/Як- Отсюда вытекает сходимость последовательности подходящих дробей к числу а (последовательность {qk} монотонно неограниченно возрастает). Утверждение. Для любого действительного а и любого т > 1 можно найти такую несократимую дробь p/q, что q < т и \p/q - а\ < -^. Доказательство. □ Достаточно в последовательности {qk} найти такой номер, что qk < т < gjt+ь и положить р = р*,<7 = Як- Если же дробь конечная, то ее саму можно использовать в качестве приближения, если г не меньше ее знаменателя. D Приведенная выше лемма дает удобный способ для нахождения частного решения линейного уравнения ах -f by = с, где НОД(а, Ь) = 1. Для этого разложим а/b в цепную дробь : а/Ь = {ао,оь • • • >ап}. В полученном разложении п-я подходящая дробь есть а/b, то есть рп = a,qn = 6. Поэтому равенство рпЯп-г - Рп-гЯп = (-l)71"1 можно переписать в виде Щп-i + &(-Pn-i) = (—l)""1. Умножив обе части на (-l)71"1, получим : В частности, для примера из предыдущего пункта имеем : а = 31,6 = 13,с = l,pn-i/Qn-i = {2,2,1,1} = 12/5. Откуда: х = -5,2/ = 12. Для быстрого вычисления подходящих дробей удобно использовать таблицы для них, которые легко заполнять по рекуррентным формулам из доказанной выше теоремы : ак Рк Як 1 0 а0 а0 1 а\ Р\ Я\ (12 Pi Яг ап Рп Яп Например, для числа \/2 таблица подходящих дробей имеет вид: ак Рк Як 1 0 1 1 1 2 3 2 2 7 5 2 17 12 2 41 29 2 99 70 2 239 169 Легко заметить, что подходящие дроби неплохо приближают число \/2 = 1,4142136...: ^/Я2 = 1,4 , рз/^з = 1,4166... , p4/qA = 1,41379...
5.3. УРАВНЕНИЕ ПЕЛЛЯ. СУЩЕСТВОВАНИЕ РЕШЕНИЯ 85 ръ/Яь = 1,41428... , Рб/яб = 1,4142012 Эти приближения для у/2 были известны с древности. Можно показать, что приближение заданного числа подходящими дробями более точное в некотором строгом смысле, нежели приближение любой другой последовательностью рациональных чисел. Упражнения 1. Показать, что для натурального имеет место разложение : а2 = {2а?а,4а}. 2. Доказать, что если квадратное уравнение с целыми коэффициентами имеет корень {а, 6, с}, то второй его корень — а- {с,Ь}. 3. Пусть цепная дробь {ao,ai,... } имеет подходящие дроби Доказать, что: a) Як/Як-i = {вьал-i,... i<*i}; b) РкЯк-2 - Рк-2Як = (-1)*а*; c) jj—■ = {atjufc-i,... ,01,00}- {ajfe,ajfe_i,... ,ai}; d) Рк+2Як-2 ~ Рк-2Як-\-2 = ^11 + + 4. Показать, что {nao,nai5na2,na3,... } = n{oo,n2ai>a2,n203,...}. 5.3 Уравнение Пелля. Существование решения Таблица для подходящих дробей числа \/2 из секции 2 дает примеры для выражений следующего вида — р\ — 2^ = ±1 : I2 - 2 х I2 = -1, 32-2х22 = 1, 72-2х52 = -1, 172 - 2 х 122 = 1, 412 - 2 х 292 = -1, 992-2х702 = 1, 2392 - 2 х 1692 = -1. Это примеры решений уравнений х2 - 2у2 = ±1. Уравнения вида х2 — dy2 = ±1 называются уравнениями Пелля, их решают в целых числах. Мы будем заниматься в основном уравнением х2 - dy2 = 1. У него есть решения (±1,0) при любом d. Будем считать d натуральным числом, не являющимся квадратом.
86 ГЛАВА 5. РЕШЕНИЕ УРАВНЕНИЙ В ЦЕЛЫХ ЧИСЛАХ Пусть (zi,yi) — еще какое-либо решение уравнения Пелля. С ним связаны еще три решения : (-an,t/i), (жь-yi), (-Si,-J/i). Так что мы не потерем информации, если ограничимся случаем, когда х\ > О, yi > о Отметим, по этому решению строится бесконечная серия решений {(^ Для этого достаточно возвести выражение х\ + j/iVa в fc-ю степеней отделить целую часть и часть при y/d: (х\ + у\)к =• Xk + yk>/d. В самом деле, возведем х\ - dy\ в fc-ю степень: (х\ + yi\/d)k(xi - y\\/d)k 1 = {хк +ykVd)(xk - Уку/d) — я\- dy\. Мы воспользовались тем,что (х\ - у\)к = Xk - Ук- Это вытекает из формулы бинома Ньютона: я к складывается из членов вида C\sx\~2sy2sd$ ^ —ук складывается из членов вида C^is+1x\~2s~l{—yi)2s*xds. Из полученных равенств вытекает, что Xk-VkVd = (xi-yiVd)h = (x1+yiy/d)-h. Положим (х-к,У-к) = (жд., -ук) Кроме того, положим (хо,уо) = (1,0). Для любого целого к имеет место формула : Xk + ykVd = {xi + y\\/d)k. Определение. Пусть (rci,yi) — такое натуральное решение уравнения Пелля х2 - dy2 = 1, что х\ — наименьшая абсцисса натурального решения. Тогда это решение называется основной единицей множества решений уравнения. Выразим у через х в равенстве x2-dy2 = \:у = ±y/d~l(x2 - 1). Одна ко при х > 1 функция у = y/d"1(x2 — 1) монотонно возрастает. Поэтому в определении основной единицы, эквивалентным образом, можно было потребовать минимальность ординаты, а не абсциссы, или даже минимальность суммы х\ -f yw/d > 1. Теорема. Пусть (xi, yi) — основная единица множества решений уравнения х2 - dy2 = 1, тогда все целочисленные решения этого уравнения описываются формулой {±(хкУУк)\к — целое число }. Доказательство. D Докажем, что других решений нет. Достаточно показать, что нет других натуральных решений. Пусть (х, у) — натуральное решение, не лежащее в приведенной выше серии. Тогда существует такой номер , что хк + ykVd < x 4- yVd < Xk+x + Ук+iVd. В самом деле, последовательность {хп + ynVd} монотонно неограниченно возрастает. Умножив эти неравенства на положительное число Хк — ykVd, получим: 1 < х' + y'y/d < х\ +j/i\/d- Заметим, (x',t/) — решение исходного уравнения. Кроме того, из первого неравенства вытекает, что это натуральное решение. Из второго неравенства вытекает противоречие с минимальностью решения (xi,t/i). □ Теорема. Если d не является точным квадратом, то уравнение Пелля х2 — dy2 = 1 имеет бесконечно много целочисленных решений.
5 3< УРАВНЕНИЕ ПЕЛЛЯ, СУЩЕСТВОВАНИЕ ГЕШЕНИЯ 87 Доказательство. D Достаточно показать, что существует натураль- |()С решение (£, rj). Станем приближать \fd рациональными числами. Возь- сначала т\ > 1 и найдем пару натуральных чисел (xi,yi) с условием 2/i ~ >/2| < т^7'2/1 - ri согласно утверждению из секции 2. Умножив на j/i, получим неравенство |xi -yi\/2\ < rf1. Из него вытекает, что Vd /d < 2j/i\/d-hl. j/, у р | yi\ f , xi < yiVd+l и х\ +y\\/d < 2j/i\/d-hl. Перемножив последнее неравенство на неравенство с модулем, получим \х\ -dy\\ < 2j/i y/dr"1 + Т"1 < 2\/d+1. Рассмотрим произвольную бесконечно монотонно возрастающую последовательность {тк}. Для каждого т* получим натуральную пару {хкУУк) с условием \х\ - dy^| < 2\/d + 1 приведенным выше способом. В результате получим бесконечно много пар натуральных чисел, удовлетворяющих этому условию. Для каждой пары выражение х2 — dy2 принимает некоторое целое значение из промежутка (—2\fd — 1,2%/d + 1). Некоторое целое значение п принимается для бесконечного множества пар. Среди них обязательно найдутся две пары (£1,771) и (£2**72) такие, что ft = £2 niod n, rji = 7/2 mod п. Положим Тогда fo — ^0 = n2- Однако имеет место сравнение: £о = 66г - Tjityd = £1 - drjl mod n = 0 mod n, 7)o = 0 mod гг. To есть £o = nf и ^o == П7? Для некоторых целых £ и г/. Тогда имеет место доказываемое равенство: f2 - drj2 = 1. При этом т)0 ф О ( иначе пары (£1,771) и (£2,772) пропорциональны). П Итак, мы получили полное описание решений уравнения Пел л я х2 — dy2 = 1. Что же касается уравнения х2 - dy2 = — 1, то для него можно построить аналогичную теорию, если существует хотя бы одно решение. Например, если d — простое число вида 4fc + 1, то у этого уравнения решения существуют. В случае когда d делится на простое вида 4fc — 1, решений нет. Можно показать, что решение существует, если и только осли число \fd при разложении в цепную дробь имеет период нечетной длины. Это сложно определить по заданным d — общая картина сущест- пования решений у уравнения Пелля «с минусом» до сих пор неясна. Упражнения 1. Пусть (р, q) — натуральное решение уравнения Пелля х2 — dy2 = 1. Доказать, что дробь p/q приближает иррациональность y/d
88 ГЛАВА 5. РЕШЕНИЕ УРАВНЕНИЙ В ЦЕЛЫХ ЧИСЛАХ по избытку с точностью не ниже, чем {2q2y/d)~l. 2. Для каждого целого к > 1 найти основную единицу уравнения Пелля а)х2 - (fc - 1)(к + 1)у2 = 1 Ь)х2 - (Л - 1)*2/2 = 1- 3. Доказать, что для простого d = 4fe 4- 1 уравнение я2 — dj/2 = — 1 имеет целочисленные решения. 5.4 Циклический метод Как известно, Пьер Ферма предложил британским математикам следующую задачу: решить в целых числах уравнение х2 - 46у2 = 1. Для этого достаточно найти основную единицу. За год работы британцы разработали метод нахождения основной единицы. Ближайший квадрат к числу 46 -- 72 = 49. Рассмотрим равенство 72 - 46 х I2 = 3. Станем видоизменять это равенство, умножив его на п2 - 46: (72 - 46 х 12)(п2 - 46 х I2) = 3(п2 - 46). Левую часть можно преобразовать к виду: (7п + 46)2 - 46(п 4- 7)2 = 3(п2 - 46). Это легко вытекает из равенства: (7 4- \/46)(п + \/46) = 7п + 46 4- (п 4- 7)\/46- Следующий этап состоит в следующем. Подберем п таким образом, чтобы на 3 делились одновременно п 4- 7 и п2 - 46. Этого легко добиться. Достаточно положить п = 3$ 4- 2 (условие делимости п 4- 7 на 3) и подставить это равенство в п2 — 46. Заметим , что п2 — 46 автоматически делится на 3, так как на 3 должно делиться выражение 7п + 46 (его квадрат - член равенства, в котором все остальные члены делятся на 3). Станем выбирать такое 5, чтобы выражение п2 - 46 принимало наименьшее по модулю значение. В нашем случае это достигается при в = 3, п = 8. Осталось сократить на 9, и первый шаг алгоритма осуществлен: (56 + 46)2 - 46 х 9 х 52 = 3 х 18, 342 - 46 х 52 = 6. Второй шаг алгоритма состоит в умножении исходного равенства на п2 - 46. Получим: (34п + 5х 46)2 - 46(5п 4- 34)2 = 6(п2 - 46). Требуется найти такое п, чтобы выражение Ъп 4- 34 делилось на 6, и выражение п2 - 46 принимало наименьшее по модулю значение. Легко видеть, что это достигается при п = 4 : б2 (26 + 35)2 - 46 х б2(4 4- 5)2 = -6 х 30. Сокращая на 36, получаем : 612 — 46 х 92 = -5. Третий шаг алгоритма имеет вид : (61п 4- 9 х 46)2 - 46(9п 4- 61)2 = -5(п2-46). Получаем : п = 6. Значит, 25(75 + 81)2-46х25(104-13)2 = 50. Сокращая на 25, получаем: 1562 - 46 х 232 = 2. Можно продолжить использование этого алгоритма, но проще возвести полученное выражение в квадрат и сократить на 4: 1562 — 46 х 4(156 х
ЬА- ЦИКЛИЧЕСКИЙ МЕТОД 89 23)2 = 4, 243352 - 46 х 35882 = 1. Итак, следуя историческому пути, мы нашли основную единицу : х = 24335, у = 3588. Интересно отметить, что этот алгоритм был открыт индийским математиком 12 века Бхаскарой Ачарьей. От него остались вычисления для основной единицы уравнения х2 - 67у2 = 1. 82 - 67 = -3, (8п + 67)2 - 67(8 + п)2 = -3(п2 - 67). Выбираем п = 7. После сокращения на 9 получаем 412 — 67 х 52 = 6. Второй шаг: (41п 4- 5 х 67)2 - 67(5п + 41)2 = 6(п2 - 67). Выбираем п = 5. После сокращения на 36 получаем: 902 - 67 х И2 = -7. Третий шаг: (90п + 11 х 67)2 - 67(11п + 90)2 = -7(п2 - 67). Выбираем п = 9. После сокращения на 49 получаем: 2212 - 67 х 272 = -2. Далее Бхаскара возводит обе части выражения в квадрат и сокращает на 4 : (2212 + 67 х 272)2 - 67 х 4(27 х 221)2 = 4. 488422 - 67 х 59672 = 1. Если этого не делать и следовать алгоритму, то далее получаются строчки : 18992 - 35772 90532 - 488422 ■67х -67: -67> -67: 2322 = х 4372 = С 11062 : к 59672 -7, = 6, = 3, = 1. Имеются основания считать, что уже Архимед владел приведенным выше методом для получения основной единицы. Предложенная им задача о быках Гелиоса приводит к уравнению Пелля с гигантской основной единицей, которую нельзя было определить без специальных методов. Приведенные выше уравнения Пелля с d = 46 и d = 67 имеют одни из самых больших основных единиц среди уравнений с двузначным коэффициентом d. Самая большая основная единица для таких уравнений Достигается при d = 61. Леонард Эйлер получил доказательство того, что приведенный выше алгоритм всегда приводит к основной единице. Мы приводить его здесь не будем. Стоит заметить, что циклический метод нахождения основной единицы не самый удобный для вычисления. Гораздо удобнее вычислять основную единицу при помощи цепных дробей. В следующей секции мы
90 ГЛАВА 5. РЕШЕНИЕ УРАВНЕНИЙ В ЦЕЛЫХ ЧИСЛАХ покажем, что квадратические иррациональности разлагаются в периодические цепные дроби. Главный шаг в вычислении основной единицы состоит в вычислении предпоследней перед повторением периода в цепной разложении числа \fd подходящей дроби. Ее числитель и знаменатель дадут основную единицу либо для стандартного уравнения Пел ля, либо для уравнения Пелля «с минусом» (последнее получается как раз, когда когда это решение существует, то есть период цепной дроби имеет нечетнун длину). В последнем случае несложно получить решение стандартного уравнения Пелля — нужно подставить решение в уравнение Пелля «с минусом» и возвести полученное равенство в квадрат. В качестве примера рассмотрим уравнение х2 - 31у2 = 1. Разложение в цепную дробь имеет вид : \/зТ = {5,1,1,3,5,3,1,1,10}. Таблица для подходящих дробей имеет вид: ак Рк Чк 1 0 5 5 1 1 6 1 1 11 2 3 39 7 5 206 37 3 657 118 1 863 155 1 1520 273 Заметим, что 15202 - 31 х 2732 = 1. Так что, х = 1520, у = 273. Упражнения 1. Провести вычисление основной единицы для уравнений Пелля с d = 46 и d = 67 видоизмененным циклическим методом, то есть методом, в котором п выбирают таким, что a) выражение n2 — d принимает наименьшее натуральное значение, b) выражение п? — d принимает наибольшее отрицательное значение. 2. Провести вычисления основной единицы для уравнений Пелля с d = 46 и d = 67 при помощи цепных дробей. 5.5 Теорема Эйлера — Лагранжа Напомним, что действительное число называется квадратичной рациональностью тогда и только тогда, когда оно является корнем квадратного- трехчлена с целыми коэффициентами. Другими словами, квадратичные иррациональности — это числа вида а ± y/b, где а и b — рациональные числа. Теорема. Число а разлагается в периодическую цепную дробь тогда» и только тогда, когда а является квадратической рациональностью.
55. ТЕОРЕМА ЭЙЛЕРА - ЛАГРАНЖА 91 Доказательство. Сначала докажем прямое утверждение. Пусть а разлагается в периодическую цепную дробь. Пусть ап — n-й остаток раз- д0?кения числа а в цепную дробь: а = {ao,ai,... ,an,an}. Тогда имеет мвст() равенство: a = g"^"^^1- Пусть остатки повторяются через 5-1 шагов, начиная с некоторого номера: an+5 = an- Значит, имеют место равенства: _ РпП Р"1 _ Pn+yfl+S + Рп+8-1 _ Рп+8<*П +РП+8-1 ЯпСХп 4- Qn 4n+s<Xii+s + <7п+я-1 Яп+8<*п + Яп+з-1 Равенство первой и третьей дробей приводит к квадратному уравнению с целыми коэффициентами для ап : Чп+s-l) = (Яп<*п +9n Таким образом, остаток ап — квадратичная иррациональность. Отсюда следует, что а — квадратичная иррациональность. В самом деле, подставим ап в равенство: а = 1>ПдП+Р^~11 и освободимся от иррациональности в знаменателе. Обратное утверждение доказывается несколько сложнее. Пусть а — корень квадратного уравнения с целыми коэффициентами: аа2 + Ьа + с = 0. Подставив выражение PnQw^Pn"1 в эту формулу, получим квадратное уравнение для остатка ап: Апа2п + Впап + Сп = 0, где Ап = apl + ЬрпЯп + cql> Вп = 2apnpn-i + Ь(р„д„-1 H-Pn-i^n) + 2cqnqn-u Сп = apl_x + 6pn_i7n_i + сд^х. Заметим, что Сп = Bn_i- Кроме того, дискриминант уравнения для остатка совпадает с дискриминантом исходного уравнения : В2п - 4АпСп = (Ь2 - 4ac)(pngn_1 - pn-Xqn)2 = Ь2- 4ос. Оценим \Ап\. Для этого заметим, что \pn/qn - a| < (gntfn+i)"1 < 9п2- Поэтому имеет место оценка: \рп - aqn\ < g-1, то есть pn = aqn 4- 0n/qn, где |0П| < 1. Подставим это выражение в равенство для л4п: Ап = a(aqn + ^n/^n)2 4- b{aqn 4- ^n/7n) + a& =
92 ГЛАВА 5. РЕШЕНИЕ УРАВНЕНИЙ В ЦЕЛЫХ ЧИСЛАХ (аа2 + ha + c)q2n + 2аавп + авп/д2п + Wn = {2аа + Ь)0Л Отсюда следует, что |ЛП| < \2аа + Ь\ + \а\. Правая часть последнего неравенства не зависит от п. Значит существует лишь конечное число коэффициентов Ап и С„. Отсюда вытекает конечность множества ВПу в силу постоянства дискриминанта В\ — 4АпСп. Поэтому имеется лишь конечное число уравнений для остатков и, значит, лишь конечное число самих остатков ап. Следовательно, некоторые два из них равны: ап = an+t Совпадение двух остатков означает периодичность цепной дроби. D Можно поставить вопрос об особенностях разложения в цепную дробь квадратных корней из натуральных чисел. Этот вопрос решил юный Эва- рист Галуа, доказавший следующую теорему. Теорема. Пусть п — натуральное число, не являющееся полным квадратом.Тогда имеет место разложение в цепную дробь следующего вида у/п = {ao,ai,a2,... ,an,2a0}, при этом п{ — an+i_j, 1 < г < п. П Упражнения 1. Доказать, что при разложении иррациональности у/п} где п — натуральное число, период начинается сразу же после выделения целой части. 2. Доказать, что иррациональность вида \/1 + п2, где п — натуральное число, разлагается в цепную дробь таким образом, что o)2(n2 + l)qk = Pk-i +Pfc+i; Ь)2рк = qk-i ч Р? + V\ + • • ■ + Pi РкРк+i - PoPi с)'- i + ч\ + • • • + Як QkQk+i -
Глава 6 Сравнения и диофантовы уравнения 6.1 Сравнения и классы вычетов Разберем следующую задачу. Задача. Найти все целые х, для которых число 4х2 + 2х + 1 делится на семь. Для задач такого типа используют специальные обозначения. Говорят о решении сравнения Ах2 + 2х + 1 =0 mod 7. Вообще, запись и = v mod m означает, что целые числа и и v дают один и тот же остаток при делении на т, D Можно заметить, что числа 1 и 2 являются решениями. С ними можно связать бесконечные серии решений. Рассмотрим все числа, дающие при делении на семь остаток 1 или 2. Это числа вида In + 1 и In -Ь 2, где ft — целое. Подставим первую серию чисел в исходное выражение: 4(7п 4-1)2 + 2(7п + 1) + 1 = 4(49n2 + Un) + 14п + (4 • I2 + 2 • 1 + 1). Получается, что это число отличается от результата подстановки самого остатка 1 на число кратное семи. Та жа самая картина получается для любого остатка, то есть при подстановке произвольного числа вида In +1 получается число, которое отличается от результата подстановки остатка ' на кратное семи число. Так что для решения этой задачи достаточно перебрать все возможные остатки при делении на семь — подставить
94 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ 0,1,2,3,4,5,6 и отобрать решения. Ответом будут числа вида 7п + 1 и 7п + 2.D Этот пример наводит на мысль, что решения аналогичных задач следует искать не среди бесконечного множества целых чисел, а из некотск рого конечного множества. По любому натуральному числу m можно получить разбиение множества всех целых чисел на m непересекающихся подмножеств: {тпп\п Е Z} U {тпп + 1\п Е Z} U {тпп + 2|п € Z} U ... U {тпп + m - l|n € Ъ\щ Мы в одно подмножество отобрали все числа, дающие один и тот же остаток при делении на т. Такое подмножество называется классом вычета по модулю m и обозначается через /, где / — общий остаток при делении на т. Станем также обозначать это подмножество через s, для любого содержащегося в нем элемента s (s называют представителем класса вычета). Например, для m = 7 имеют место равенства: 2 = -5 = ТВ. Решения сравнений следует искать не среди бесконечного множества целых чисел, а среди конечного множества классов вычетов. Множество классов вычетов по модулю m обозначают через Z/m. Классы вычетов можно складывать и умножать. Положим: $2 = $1 + $2, S\ • $2 = S\ ' $2- Результат не зависит от выбора представителей классов вычетов. Проверим это для операции умножения. Пусть мы выбрали другие представители — s\ + пгт и s2 + n2vfi. Тогда получим по формуле: (si В результате мы получили новую числовую систему с конечным числом элементов. Эти элементы можно складывать и умножать, для всякого элемента а будет противоположный элемент :1а1 который в сумме с элементом а дает нулевой элемент 0. Кроме того, имеется единичный элемент 1. Нулевой и единичный элементы обладают следующими характерными свойствами:
gj. СРАВНЕНИЯ И КЛАССЫ ВЫЧЕТОВ 95 для произвольного элемента а. Интересно узнать описание всех обратимых классов вычетов по модулю т, то есть таких а, что существует Ъ со свойством: а • 6 = 1. Для нулевого элемента не существует класса вычетов Ъ с таким свойством. Действительно, пусть Ъ б = 1. Однако при умножении на нулевой класс вычетов должен получаться нулевой класс вычетов. Значит, 0=1, что возможно только при т = 1 (мы будем исключать этот случай из рассмотрения). Слегка подправив эти рассуждения, можно доказать, что класс вычетов 1 необратим, если / — делитель числа т. Пусть /-ft = 1 и т = Ik. Умножим первое равенство на к: к • / b = к. Однако к • 1 = m = б. Значит, 0 = к, что невозможно, так как 0 < к < т. Теорема. Вычет а по модулю m обратим тогда и только тогда, когда НОД(а,т) = 1. Всего обратимых вычетов ф(т) штук. Доказательство. D Достаточно доказать, что для_любого числа 0 < а<т) НОД(а, ш) = 1 существуют вычет Ь такой, что Ъа — Т. Мы укажем практический способ нахождения такого вычета. При помощи алгоритма Евклида или цепных дробей найдем линейное представление НОД(о,т): 1 =Ь*а + с-т. Тогда 1 = Ьа + ст = Ьа — Ьа. □ Для простого т = р обратимыми будут все вычеты кроме нулевого. В этом случае на множество Z/p переносятся многие свойства действительных и комплексных чисел. Например, можно рассмотреть многочлены с коэффициентами в Z/p. Для них можно выполнять деление с остатком, верны интерполяционные теоремы и формулы — все доказательства дословно переносятся на этот случай. Не стоит упускать из виду, что уравнения с коэффициентами из Ъ/т можно рассматривать просто как сравнения по модулю т: ао * хп + ... 4- а^ГГ • х + а^ Так что для изучения сравнений можно использовать теорию многочленов. Подчеркнем, что теория переносится лишь на случай сравнений по простому модулю. Для сравнений по составному модулю не будут выполняться самые простые теоремы теории многочленов. Например, уравнение х2 = Т второй степени с коэффициентами из Z/8 имеет четыре решения — {Т, 3,5,7}. Легко привести пример двух многочленов с коэффициентами из Z/6, произведение которых имеет степень, меньшую чем сумма степеней многочленов: (2х2 + 3)(3х2+4)=5я2. Вычеты можно использовать при шифровании сообщений. Простей-
96 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ шей системой шифрования служит система, которой пользовался Юлий Цезарь. Он применял циклический сдвиг 23 букв классического латинского алфавита (в нем отсутствовали буквы w, v и j) на три буквы. Вместо буквы а он ставил d, вместо буквы Ь он ставил е, вместо с — /, и так далее. Вместо букв х,у,z он ставил буквы а,Ь,с. Например, сообщение «sapientisafo шифруется как «xdsrnhqymxdy$>. Очевидно, что сдвигать можно на произвольное количество букв. Получается 23 системы шифрования латинских текстов (среди которых будет и прямая запись исходного сообщения — сдвиг на 23 буквы). По сути дела мы заменяем буквы на их порядковые номера, которые рассматриваем по модулю 23. Эта идея замены символов на вычеты весьма полезна и применяется в современных криптосистемах. Обобщением системы Цезаря служит аффинная криптосистема. Рассмотрим шифрование английских текстов при помощи следующего метода. Сначала сопоставим каждой букве английского алфавита вычет по модулю 26: а - 0,6 - Т,... , z - 25. Выберем два числа к и ш, причем НОД(&,26)=1. Шифровать будем по следующему правилу. Вычет г заменяется на вычет г' = Ы + т. Число кг + т может быть довольно большим — мы нуждаемся в формуле, которая бы по целому числу х давала остаток при его делении на п. Эта формула имеет вид: х — [~Jn. Число к может принимать значения 1,3.5,7,9,11,15,17,19,21,23,25 а число m может принимать все значения от 0 до 25. Получается всего 12 • 26 = 312 способов шифрования английских текстов. Каждый такой способ позволяет однозначно дешифровать сообщения по шифровкам — по вычету V восстанавливается вычет г = к (г1 - т) (здесь к — обратный вычет к вычету к). Если НОД(&, 26) > 1, то нарушается однозначность дешифровки. Зашифруем, например, слово «mathematicians при помощи аффинной криптосистемы с к — 4, т = 3. 012345678 910111213141516171819202122232425 3 711151923 1 5 913172125 3 711151923 1 5 913172125 abcdefghijklmnopqrstuvwxyz dhlptxbfjrirvzdhlptxbfjnrvz Получается слово «zdbftzdbjljdd». Однако точно так шифруется и слово «zathezntician». Мы получили наглядное представление о необратимости вычета 4 по модулю 26.
6.1. СРАВНЕНИЯ И КЛАССЫ ВЫЧЕТОВ 97 Можно обсудить проблему дешифровки сообщений, зашифрованных при помощи аффинной системы. Пусть у нас есть перехваченная шифровка: kar Imvlj hkenlj vsr kar pvnhr efs ovts adljvez odljvez ovlj. Нам нужно узнать, каким из 312 шифров пользовался противник. Для этого достаточно правильно дешифровать две буквы. Если бы у нас была большая шифровка, то мы могли бы использовать таблицы средней частоты употребления букв в английском языке (самая употребительная буква «е» имеет частоту — 12,31%, затем идут буквы «£» — 9,59%, «а» — 8,05%, «о» — 7,94%). Подсчитав частоту употребления символов в длинной шифровке, мы бы без труда дешифровали несколько букв. В нашем случае можно догадаться, что дважды употребленнное слово «kar» есть не что иное как определенный артикль «the». Значит, «Л» — 7 шифруется как «а» — 0 и «е» — 4 шифруется как «г» ---17. Получаем систему сравнений для чисел кит: Г 1к + т = 0 mod 26 \ 4А: + т = 17 mod 26. Вычтя из первого сравнения второе, получим сравнение 3fc = -17 mod 26. Легко найти обратный вычет для 3 — 3 • 9 = 27 = 1 mod 26. Умножив обе части этого сравнения на 9, получим: к = (—17) • 9 = 9 • 9 = 3 mod 26. Из первого сравнения системы находим m = — 21 = 5 mod 26. Получаем следующий способ шифрования: 012345678 910111213141516171819202122232425 5 81114172023 0 3 6 91215182124 1 4 7101316192225 2 abcdefghijklmnopqrstuvwxyz filoruxadgjmpsvybehknqtwzc Шифровался детский стишок: the clock struck one the mouse ran down hickory dickory dock.
98 ГЛАВА б. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ 6.2 Латинские квадраты Конечные числовые системы, построенные в предыдущей секции, могут быть использованы в комбинаторных построениях. В частности, с их помощью строят так называемые латинские квадраты. Латинским прямоугольником размеров п х тп называют прямоугольную таблицу, состоящую из п строк длины тп. Каждая строчка состоит из одних и тех же различных тп символов. Строчки отличаются друг от друга лишь порядком этих символов. При этом требуется, чтобы каждый столбец состоял из п различных символов. Так что, в каждой строчке и в каждом столбце все символы разные. Особенно интересен случай п~тп Тогда столбцы состоят изо всех возможных символов, как и строчки. Заметим, что латинских прямоугольников размера п х тп при п > тп не существуют, так как символы в столбцах в этом случае должны повторятся. Рассмотрим в качестве примера два латинских квадрата 3x3: 2 3 1 3 1 2 1 2 3 3 2 1 1 3 2 2 1 3 Интересно было бы узнать число всех латинских прямоугольников. Для уточнения задачи можно унифицировать набор используемых символов и их расположение в последней строчке. Пусть последняя строчка всех таблиц будет иметь вид: 1,2,... ,п. Если были использованы какие-то другие символы или эти, но в другом порядке, то расположение символов в последней строчке дает схему для переобозначения. Для таблиц 2 х тп мы получили ответ в последней секции главы 2. Легко видеть, что латинские прямоугольники 2 х тп однозначно соответствуют беспорядкам из тп элементов. Их число равно m!(l/2!-l/3! + .. . + (-l)m/m!). Несколько сложнее подсчитать число латинских прямоугольников размера 3 х т. общем случае задача не решена до сих пор. Латинские квадраты связаны с некотороми комбинаторными задачами. Примером служит задача о построении в квадратное каре ш2 офицеров. При этом офицеры делятся на представителей тп полков, по тп офи - церов каждого полка. Кроме того, офицеры делятся на представителей f званий, по тп офицеров каждого звания. Если и звания, и полки обозначать числами от 1 до т, то самих офицеров можно обозначать парами вида (i,j), где г — звание, j — полк; 0 < г < ш, 0 < j < тп. Задача состоит в том, чтобы расставить этих офицеров в квадратнее каре таким образом, чтобы в каждой шегенге и каждой колонне ветре-
0. ЛАТИНСКИЕ КВАДРАТЫ 99 чались офицеры всех полков и всех званий. Если рассмотреть отдельно условие на звания или на полки, то оно эквивалентно построению латинского квадрата. Возникает задача о построении двух латинских квадратов, которые связаны между собой следующим образом. При наложении одного квадрата на другой возникает т2 пар (i,j)- Другими словами требуется, что никакая пара не повторялась — невозможно одного и того же офицера поставить на два разных места. Два латинских квадрата, удовлетворяющие этому условию, называют ортогональными друг другу. Так что задача о построении офицеров в квадратное каре эквивалентна задаче о нахождении двух ортогональных латинских квадратов нужного размера. Два приведенных выше ортогональны друг другу и дают решение задачи о 9 офицерах. Наложим их друг на друга: (2, 3) (3,2) (1, 1) (3, (1, (2, 1) 3) 2) (1- (2, (3, 2) 1) 3) Очевидно, что задача о 4 офицерах неразрешима. Можно решить задачи о 16 и о 25 офицерах. Эйлер догадался о неразрешимости задачи о 36 офицерах. Этот факт был доказан лишь в 1900 году. На основании неразрешимости этой задачи для т = 2ит = 6 Эйлер выдвинул гипотезу о неразрешимости этой задачи для любого т = 4&-Ь2. В двадцатом веке эта гипотеза была опровергнута уже для значения m = 10. Приведем решение задачи о 100 офицерах. Для удобства запоминания этой таблицы отступим от стандартных обозначений. Станем пользоваться следующими десятью символами — 0,1,2,3,4,5,6, а, Ь, с. Таблица имеет вид: /(0,0) (6, а) (5,Ь) (4, с) (с,1) (Ь,3) (а, 5) (1,2) (2?4) (3,6)\ (а, 6) (Ь,5) (с, 4) (1,с) (3,6) (5, а) (2,1) (4,2) (6,3) (1,1) (а,0) (6,6) (с, 5) (2, с) (4,6) (3,2) (5,3) (0,4) (0,а) (2,2) (с, 1) (6,0) (с, 6) (3,с) (4,3) (6,4) (1,5) (6,6) (1,о) (3,3) (а, 2) (6,1) (с,0) (5,4) (0,5) (2,6) (5, с) (0,6) (2, а) (4,4) (о,3) (6,2) (6,5) (1,6) (3,0) (с, 2) (6, с) (1,6) (3,а) (5,5) (М) (0,6) (2,0) (4,1) (6,4) (с,3) (0,с) (2,6) (4, а) (6,6) (1,0) (3,1) (5,2) (2,3) (3,4) (4,5) (5,6) (6,0) (0,1) (а, а) (6, с) (с,Ь) (3,5) (4,6) (5,0) (6,1) (0,2) (1,3) (6,6) (с, а) (а, с) (4,0) (5,6) (6,2) (0,3) (1,4) (2,5) (с, с) (о,6) (6, а)
100 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ Теорема. Для любого простого числа р существуют такие р - 1 латинские квадраты размеров рхр, что каждые два из них ортогональны. Доказательство. □ Приведем метод построения р — \ латинского квадрата размеров р х р, где р — простое число. При этом, каждые два квадрата будут ортогональны. Рассмотрим вычеты по модулю р: Z/p — {Т, 2,... ,р}. В квадраты станем записывать именно тех представителей классов вычетов, что приведены выше. Обозначим через a[j число, которое стоит у 1-го квадрата, в г-й строке, в j-м столбце. Положим : d~ = ГТТ7; 1 < i < р, 1 < 3 < Ру 1 < I < V ~ 1- Докажем, что 1-й квадрат является латинским. Пусть в i-й строчке совпадают два элемента: a\u = a\v. Значит имеет место равенство: г •/ + u = i'l + v mod р. Отсюда следует, что u = v mod p. Это был один и тот же элемент. Пусть в j-м столбце совпадают два элемента: a?uj = alvj. Значит, имеет место равенство: u-l+j=v-l + j mod p. Отсюда следует, что ul = vl. Из определения следует, что / ф 0. Так что последнее равенство можно умножить на / .В результате получится равенство: и = v. Итак, мы доказали, что все эти квадраты - латинские. Осталось проверить их попарную ортогональность. Пусть при наложении u-го и u-го квадратов совпали две пары: (dfj, a\J) и о$ j4 Яу j* • Тогда имеет место пара равенств: а" ■ = а" ■, и а\ j = avv j,. Получаем следующую систему: {% • и + j = г' • и + j1 i • v + j = V • v 4- j'. Вычтем из первого равенства второе: г • и — v = V • и - v. В силу того, что квадраты разные, вычет и — v — ненулевой, и на него можно сократить. Поэтому имеет место равенство: i — i*. Отсюда немедленно вытекает, что j = j''. Значит, пара была одна. Квадраты ортогональны.D В дальнейшем мы обобщим эту теорему на случай степеней простых чисел. Возможно ли ее дальнейшее обобщение, неизвестно до сих пор. Приведенные выше два квадрата построены по методу, приведенному в теореме. Рассмотрим в качестве примера построение четырех попарно ортогональных латинских квадратов размеров 5x5:
6.2. ЛАТИНСКИЕ КВАДРАТЫ 101 23451 34512 45123 512 3 4 34512 51234 23451 45123 451 23 23451 5 1234 34512 51234 45123 34512 23451 12345 12345 12345 12345 Интересно было бы узнать построение трех попарно ортогональных квадратов размеров 4x4. Для этого нужна подходящая числовая система из четырех элементов (Z/4 не годится, такая числовая система — GF(4) — строится в предпоследней секции 13 главы). Наборы из т - 1 попарно ортогональных латинских квадратов размеров т х ттг позволяют построить интересный комбинаторный объект — проективную плоскость порядка т. В качестве примера рассмотрим задачу, решение которой приводит к самой маленькой по числу элементов проективной плоскости. Задача. Отряду из семи налоговых полицейских поручено провести проверку семи пунктов обмена валюты. Проверка обменного пункта осуществляется командой из трех полицейских. Требуется, чтобы каждая пара полицейских встречалась при проверке не более одного раза. Нужно написать распределение отряда по командам. D Обозначим полицейских номерами от 1 до 7. В первый обменный пункт пошлем первые три номера — {1,2,3}. В остальные шесть пошлем их по отдельности, каждого в два пункта. Нужно еще заполнить шесть команд парами из оставшихся полицейских — 4,5,6,7. Как мы уже знаем четыре элемента разбить на две пары можно тремя способами — {4,5} U {6,7}, {4,6} U {5,7} и {4,7} U {5,6}. В результате получилось следующее решение задачи: {1,2,3} {1,4,5} {1,6,7} {2,4,6}{2,5,7} {3,4,7} {3,5,6}О Это решение обладает следующими свойствами: 1. каждые две точки принадлежат одному и только одному подмножеству; 2. каждые два подмножества пересекаются ровно по одной точке;
102 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ 3. существуют такие четыре точки, что никакие три из них не лежат в одном подмножестве. Последнему свойству удовлетворяют точки 4,5,6,7. Эти три свойства полученной нами системы подмножеств рассматривают как аксиомы. Такую систему подмножеств называют проективной плоскостью, сами под - множества называют прямыми. Из аксиом можно вывести, что при числе точек в прямой — m 4- 1 общее число точек в проективной плоскости — m2+m + l. Число прямых совпадает с общим числом точек. Число m называют порядком проективной плоскости. В приведенном примере m = 2 Третья аксиома требует наличия четырех различных точек. Поэтому не существует проективной плоскости порядка 1. Конечная проективная плоскость порядка m строится по набору из 771 — 1 попарно ортогональных латинских квадратов размеров тпхтп. Нам нужно из множества {1,2,... ,m2 4- m 4- 1} выбрать т2 + т 4-1 (т 4- 1)- элементных подмножеств. Сначала выбираем подмножество {1,2,... , т+ 1}. Оставшиеся подмножества разбиваются на тп 4-1 группу по m элементов в каждой. Во множествах первой группы присутствует элемент li во множествах второй группы присутствует элемент 2, и так далее, во множествах (in + 1)-й группы присутствует элемент тп + 1. Нам нужно дополнить эти множества m элементами каждое. Выпишем первые две группы: 2,т + 3,... ,2т + 1} {2,т + 2,2т + 2,... ,т2 + 2} {1,2т+ 2,2т 4-3,... ,3m + 1} {2,m +3,2m+ 3,... ,m2 4-3} {I,m2 + 2,m2 + 3,... ,m24-m + l} {2,2m 4- 1,3m + 1,... ,m2 4-m 4-1} Как выписывать оставшиеся m -1 группы, лучше всего пояснить на примере. Пусть m = 3- Выпишем в строчку элементы каждого из двух ортогональных латинских квадратов, столбик за столбиком. Получим таблицу: 3 4 5 3 2 6 2 3 7 1 1 8 1 3 9 3 1 10 2 2 11 2 1 12 1 2 13 3 3 Здесь в верхней строчке таблицы выписаны числа от т4-2 до т2 Н-т+1. В левом столбце стоят первые числа подмножеств — от 3 до m 4* 1. Чтобы получить'все подмножества с первым числом г, нужно взять строчку,
0j. ОСНОВНЫЕ ТЕОРЕМЫ 103 начинающуюся с числа г. В ней будет по m штук единиц, двоек, и т.д.. g одно подмножество выпишем число г и все элементы верхней строки, поя которыми в i-й строке стоит одно и то же число. В нашем примере строка с первым элементом 3 даст следующие подмножества: {3,7,8,12} {3,6,10,11} {3,5,9,13}. Строка с первым элементом 4 даст следующие подмножества: {4,7,9,11} {4,5,10,12} {4,6,8,13}. Получились недостающие т2 -т = 6 прямых. Можно доказать, что задание га - 1 попарно ортогональных латинских квадратов размеров m x m эквивалентно построению конечной проективной плоскости порядка т. Указанное построение задает эту эквивалентность. Упражнения 1. Проверить, что задача о семи налоговых полицейских решается следующей диаграммой: в правильном треугольнике возьмем в качестве точек вершины, середины сторон и центр треугольника; в качестве прямых возьмем стороны, медианы и вписанную окружность. 6,3 Основные теоремы Благодаря конечности полученных числовых систем, можно поставить следующие вопросы: 1. Чему равна сумма всех элементов множества вычетов? 2. Чему равна сумма к-х степеней всех элементов множества вычетов? 3. Чему равно произведение всех ненулевых вычетов? Легче всего ответить на первый вопрос. Для этого нужно рассмотреть арифметическую прогрессию: . + m-l = l + 2 + ... + m-l = m(m - Ответ существенно зависит от четности числа га. Если оно нечетное, то число т — 1 — четное, и число (т - 1)/2 — целое. В этом слечае сумма равна произведению вычетов т(тп- 1)/2 = 0(т - 1)/2 = 0. Для четных m это неверно. Рассмотрим простейший пример: тп =4, 1 + 2 + 3 = 2.
104 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ Для четных m сумма представляется в виде т/2 • т - 1 = -т/2 = т/2. Последнее равенство вытекает из того, что т/2 + т/2 = 0 mod т. Довольно просто разобраться с третьим вопросом для составного тп = s-/;s>l,i>l.B произведении должны встретиться вычеты 5 и 7, которые дадут нулевой вычет, так что произведение в этом случае равно нулю, Приведенное рассуждение представляет собой пример правдоподобных неверных выводов. Рассмотрим пример т=4: 1 2-3 = 6 = 2. К счастью, это — единственное исключение. Докажем правильность нашего вывода для всех остальных случаев. Прокол в рассуждении состоит в том, что множители s и I могут совпасть. Этого не избежать только для чисел m вида р2, где р — простое. Однако для р > 2 среди множителей исходного произведения обязательно встретятся р и 2р, которые дадут нулевой вычет. Мы получили единственное исключение для m = 22. Здесь мы впервые столкнулись с особым, нерегулярным поведением вычетов по модулю, яв>- ляющемуся степенью двойки. Это — их характерная особенность. Она прослеживается и в верхних областях математики, где многие теоремы нужно отдельно доказывать для этого случая. Нам осталось разобрать случай m = р, где р — простое число. Теорема (Вильсон). Для простого числа р имеет место сравнение (р — 1)! = —1 mod р. Доказательство. □ Мы докажем, что l-2-...p—1=р-1. Достаточно доказать, что все вычеты -— 2,3,... ,р- 2 — разбиваются на пары взаимно обратных вычетов, и их произведение равно единичному вычету. Для этого докажем, что эти и только эти вычеты имеют отличающиеся от них обратные вычеты. Пусть некоторый вычет х совпадает со своим обратным: х = х~1. Умножив это равенство на я, получим уравнение: х2 = Т. Перенося единичный вычет в правую часть, получим равенство: (х - Т)(х + I) = 0. Мы получили равенство произведения двух вычетов нулю. Это эквивалентно делимости произведения двух чисел на простое число р. Из него вытекает, что хотя бы один из множителей делится на р. Значит, либо х = 1, либо х = —1 = р—1. Существуют только два» вычета, которые совпадают со своими обратными — Т и р - 1. □ Таким образом, третья задача полностью разобрана. Обозначим через П(т) произведение всех ненулевых вычетов в Ъ/тп. Тогда имеет место
6.3. ОСНОВНЫЕ ТЕОРЕМЫ 105 равенство: {2, если т = 4; 0, если т > 4 - составное; — 1, если m — простое. Вторая задача несколько сложнее разобранных выше. Мы рассмотрим случай т = р — простого модуля. В этом случае множество ненулевых вычетов устроено достаточно просто — это множество степеней одного и того же вычета, который называют примитивным вычетом по модулю р: Z/p={6)T,a1a2)...,a"-2}. Очевидно, что легко найти произведение этой суммы и вычета ак — 1, где к — исходная степень: (а* - Т)(Т + а* + а2* + ... + а^2>*) = о**"1)* - Т. Из этой формулы можно получить значение для искомой суммы при помощи следующей теоремы. Малая теорема Ферма. Для любого целого х имеет место сравнение по простому модулю: хр = х mod р. Доказательство. О Достаточно доказать для натуральных х. Доказательство проведем при помощи индукции по х. Для х = 1 утверждение очевидно. Пусть оно выполняется для х = к. Тогда для х = к +1 получим сравнение: r ^ Это вытекает из делимости биномиальных коэффициентов на р.О Для чисел ж, не кратных р этому утверждению можно придать иную форму. Сократим равенство хр = х на вычет х. Получим равенство: хр~~1 = 1. Применив это равенство к выведенной ранее формуле, получим равенство: а^р~^к — 1 = 1 — 1 = 0. Значит, одна из скобок в левой части равна нулю. Рассмотрим случай степени к, не делящейся на р — 1. В этом месте нужно воспользоваться тем, что а — примитивный вычет. Все его степени дают р - 1 ненулевых вычетов. Для этого достаточно взять степени 0,1,... ,р — 2, потому что возведение в р — 1 степень эквивалентно возведению в нулевую степень. При этом степени вычета а ведут себя как
106 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ вычеты по модулю р — 1. Разделим произвольную степень п на р — 1 с остатком: n = q(p — 1) + г, 0 < г < р - 1. Тогда имеет место равенство: ап = (оР""1)^7" = л1"- Вместо самих степеней можно рассматривать их остатки от деления на р- 1. Вычет а* не может быть единичным, потому что остаток от деления к на р - 1 не равен нулю. Значит, нулевому вычету равна искомая сумма всех к-х степеней вычетов. Осталось найти эту сумму для степеней к, делящихся на р — 1. При этом каждый ненулевой вычет в такой степени даст единичный вычет. Получается сумма, состоящая р - 1 единичного вычета. Она равна ^7. Обозначим через £(р,А) искомую сумму. Мы получили ответ ко второй задаче: 0' еслир-lffc ry еслир-llfc. Нам осталось доказать существование примитивного вычета. Теорема. Существует ровно ф(р - 1) примитивных вычетов по простому модулю р. Доказательство. □ Каждому ненулевому вычету Ь сопоставим натуральное число ord(b), называемое порядком вычета Ь. Определим порядок как наименьшую натуральную степень, в которой данный вычет равен единичному вычету. Это число, как следует из малой теоремы Ферма, не превосходит р — 1. Нам нужно доказать существование вычетов максимально возможного порядка р-1. В самом деле, для вычета Ь порядка к все - г Г2 тк~Х степени 1,6, о ,... ,6 различны. Наличие двух совпадающих вычетов Ъ и Ъ из этой серии эквивалентно равенству V , которое невозможно в силу минимальности порядка А:. Заметим, что к является делителем числа р - 1. Разделим р — 1 на к с остатком: p-l=<j'^ + r> 0 < г < р — 1. Тогда имеют место равенства: Получаем меньшую чем порядок степень, в которой вычет равняется единице. Эта степень должна равняться нулю. Значит порядок — делитель числа р— 1. Пусть для делителя d числа р— 1 имеется ровно 4>'{d) вычетов порядка d. Положим ф'(\) = 1. Число всех неьулевых вычетов можно представить как сумму по всем делителям числе р - 1 :
6.3. ОСНОВНЫЕ ТЕОРЕМЫ 107 Заметим, что число ф'{<1) равно или нулю или ф{й). В самом деле, пусть есть хотя бы один вычет Ъ порядка d. В этом случае, легко описать множество всех вычетов порядка d. Дело в том, что они лежат среди корней уравнения xd = Т. У многочлена степени d корней не больше чем d. Доказательство этого факта дословно переносится на многочлены с коэффициентами из Z/p. Однако мы имеем d различных корней этого уравнения — Т, 6, Ъ ,... , b . Так что, множество вычетов порядка d можно отбирать среди этих вычетов. Мы утверждаем, что при возведении всех приведенных выше корней уравнения xd = 1 в степень 5, где 0 < s < d Н0Д(з, d)=l, они просто переставятся местами. Пусть два из них Ь1 иЬ2 совпали при возведении в степень s. Это эквивалентно равенству V 2 = 1. Рассмотрим линейное представление для НОД(в,d): su + d-v = 1. Возведем обе части полученного равенства для вычетов в степень и : (b )tl "*2 = Т. Однако из равенства Ь = 6 вытекает, что Ь = Ъ. Значит, Ъ 1 2 = 1. Итак, вычеты 6 ! и 6 2 совпадают. Мы доказали, что вычет Ь* имеет порядок d. Получается ф(6) вычетов порядка d. Заметим, что вычет b , где HOfl(s,d) = q > 1, обращается в единичный вычет при возведении в степень d/q. Значит, иных кроме указанных ф(д) вычетов порядка d не существует. Окончание доказательства основано на лемме, принадлежащей К.Ф. Гауссу. Лемма. Имеет место раенство для любого натурального п: 0() = п. d | п Доказательство. D Рассмотрим набор из п дробей: n = i1- - i -} П П П П Некоторые из этих дробей сократимы, некоторые — нет. Разобьем множество N на непересекающиеся части следующим образом. Соберем вместе дроби, сокращающиеся на один и тот же делитель: N = и^пФ(б/), где в Ф$) входят все дроби с числителями, которые имеют наибольший общий делитель со знаменателем п, равный d. Нужно подсчитать число элементов множества Ф(^)- После сокращения на d в него будут входить все дроби с числителями з такими, что 0 < s < n/dy НОД(б,пД1)=1. Таких числителей всего ф{п/д) штук. Значит, |Ф(с?)| = ^(n/d). В результате
108 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ получилась формула: п = \N\ = 5Zd|n^(n/^)- Она отличается от доказываемой формулы всего лишь порядком слагаемых — вместо делителей d можно рассмотреть дополнительные а ним делители n/d.O Осталось подставить в полученнную формулу п = р — 1 и сопоставить результат с формулами р - 1 = £<*|п Ф'(4) и <j>'{d) < ф{А). Мы получили равенство ф'($) — ф{в) для любого делителя числа р — 1.D Следствие. Множество вычетов Z/p для каждого делителя d числа р - 1 содержит ровно ф{в) вычетов порядка d. □ Можно поставить вопрос о существовании примитивного вычета, степени которого давали бы все обратимые вычеты, для составного модуля т. Такой примитивный вычет существует для всех m = р*, где р — нечетное простое число. Кроме этих значений модуля примитивный вычет существует лишь для m = 2рк, где р — нечетное простое число. Мы не станем здесь доказывать эти факты. Обратим лишь внимание на то, что степени двойки опять выделяются среди степеней простых чисел — по этим модулям нет примитивных вычетов. Упражнения 1. Теорема Клемента. Числа р и р + 2 являются простыми тогда и только тогда, когда имеет место сравнение: 4[(р— 1)! +1] + р = 0 mod (p + 2)р. 6.4 Сравнения по составному модулю Рассмотрим следующую задачу: Задача. Найти наименьший натуральный ж, удовлетворяющий системе сравнений: х = 1 mod 2 х = 2 mod 3 х = 4 mod 5 х = 6 mod 7. D Для решения этой задачи достаточно заметить, что все сравнения можно переписать в виде х = — 1 mod p;p = 2,3,5, 7. Общее решение будет иметь в'ид: -l + 2-3-5-7-n;neZ. В самом деле, число х + 1 делится на 2,3,5,7. Наименьшим натуральным решением будет х = 209, п = 1.П
6.4. СРАВНЕНИЯ ПО СОСТАВНОМУ МОДУЛЮ 109 Ничего не стоит привести пример подобной системы, которая не имеет решений. Пусть х удовлетворяет системе: {х = 4 mod 6 х = 5 mod 15. Тогда из первого уравнения следует, что это число дает остаток 1 при делении на 3. Однако из первого уравнения следует, что это число дает остаток 2 при делении на 3. Это получилось потому, что модули, по которым рассматривались сравнения, имели нетривиальный общий делитель -3. Китайская теорема об остатках. Система сравнений х = а\ mod mi х = п2 mod тп2 x = an mod mn. имеет целочисленное решение при любых а»,1 < г < п, если все числа 7Пг, 1 < i < n попарно взаимно простые. Доказательство. D Построим решение в явном виде. Обозначим через Mk произведение всех модулей ш», за исключением модуля rrik, 1 < к < п. Обозначим через М'к какой-либо представитель класса вычетов, обратного к вычету Mk по модулю га*. Другими словами, М'к — некоторое решение сравнения Mk • М'к = 1 mod mjt. Это решение существует, в силу того, что НОД(М*,тл:) = 1. Решение исходной системы сравнений дается формулой: х0 = aiMyM[ + a2M7.Ml1 + ... + апМпМ*п. В самом деле, если рассмотреть это число по модулю т*, то все слагаемые, за исключением /с-го слагаемого, дадут нулевые остатки при делении на ть Однако к-е слагаемое по этому модулю имеет вид: dkMkM'k = ak mod 77ife. D Общее решение этой системы сравнений задается формулой х = аг0 + ... ™>nN\ N € Z. В самом деле, для множества целых чисел 0 < г < ... тп имеется только одно решение — го — остаток от деления хо на mi7П2 • • • Топ- Пусть г\ — какое-либо другое решение из этого множества. Тогда, r\ -ri =0 mod mk, для любого модуля т*. Значит, это число делится на любой из модулей и, следовательно, на их произведение. Это
110 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ может быть, только если это число равно нулю, и г\ = г0. Любое множество из mim2 ... ™>п последовательных целых чисел содержит ровно одно решение исходной системы. Решение сравнения по составному модулю сводится к решению сравнений по модулям равным степеням простых чисел. Для этого достаточно разложить основной модуль на простые множители тп = р^р^2 • • -Рпп> решить сравнение по модулям р*кк, 1 < к < п и «склеить» полученные решения в одно при помощи китайской теоремы об остатках. Теорема (Эйлер). Для любого обратимого вычета а по модулю m имеет место равенство: а^т>} = Т. Доказательство. D Пусть u,v,... ,ш — представители всех обратимых классов вычетов (взятых по одному разу). Если их всех умножить на число а, то получатся также представители всех обратимых классов вычетов. Это утверждение эквивалентно тому, что получатся все разные вычеты, так как обратимость при умножении двух обратимых вычетов сохраняется. Пусть аи = av mod га. Тогда число a(u - v) делится на т. Однако НОД(а,т) = 1. Значит, и - v = 0 mod m. Выходит, что числа и и v принадлежали к одному классу вычетов. Перемножим все обратимые вычеты двумя способами — выбрав две приведеннные выше системы представителей: и-v...w = au-av... aw. Сократив на левую часть, получим искомое равенство 1 = а^т^. Степень, в которой стоит вычет а, равна числу всех обратимых вычетов. D На этой теореме основана современная система шифрования RSA, названная так по первым буквам фамилий первооткрывателей — Ривеста, Шамира и Эдлемана. Сначала стоит объяснить, чем она принципиально отличается от рассмотренной выше аффинной системы и подобных ей старинных систем. В системе RSA шифруются не отдельные символы, а целые фрагменты текста в несколько десятков символов. Выбирается большое целое число т (имеющее несколько десятков или даже сотен десятичных знаков). Текст делится на фрагменты, которые представляются целыми числами 0 < а < п. Пусть, например, используется всего сотня символов. Число т выбрали более чем в сотню десятичных знаков. Тогда выбирается длина фрагмента сообщения в 50 символов (каждый символ занимает две позиции — заменяется двузначным числом). Фрагмент заменяется числом а, которое возводится в некоторую степень d\ и приводится по модулю т, то есть степень заменяется на остаток от деления»
6А. СРАВНЕНИЯ ПО СОСТАВНОМУ МОДУЛЮ 111 на т. Итак, для шифрования нужно знать два числа — di и т. Причем эти числа можно публиковать открыто — противник все равно не сумеет вовремя дешифровать сообщение. Системы, в которых ключ шифрования публикуется открыто, называются системами шифрования с открытым ключом. Они основаны на том, что для дешифрования нужно обладать дополнительной информацией (ее называют секретной лазейкой) — зная только метод шифрования сообщений, невозможно их быстро дешифровать. Объясним, как устроена секретная лазейка в системе RSA. Число т выбирают в виде произведения двух громадных простых чисел: т = pq. Тогда, ф(п) = (р — l)(q - 1). Согласно теореме Эйлера, для любого 0 < а < т имеет место сравнение а^п^ = 1 mod m, если оно было взаимно просто с числом т. Для дешифрования найдем такое число tfe, что имеет место сравнение diflfe = 1 mod ф(т). Значит, d\d,2 = 1 + <£(m)iV;N € Z. Дешифровка будет осуществлятся посредством возведения числа-шифра в степень cfe- Если исходное сообщение а было взаимно просто cm, то шифр, возведенный в степень d.2 имеет вид: adl<i2 = о • a^m^N = a mod m. Значит при приведении по модулю т восстанавливается исходное сообщение. Осталось выяснить, что происходит, если исходное сообщение а не было взаимно просто с числом т. Это может быть, когда а делится ровно на одно из простых чисел р или q. Пусть оно делится на р. Докажем, что число adld2 и по модулю р и по модулю q сравнимо с исходным сообщением а. Отсюда будет следовать, что это число сравнимо с а по модулю pq, то есть исходное сообщение восстанавливается и в этом случае. Что касается модуля р, то ситуация здесь тривиальная: ad\d2 = о = a mod p. По модулю q можно воспользоваться малой теоремой Ферма: adld2 = a-a^1^9"1^ = a mod q. Так что секретной лазейкой, позволяющей быстро дешифровать сообщение, является число cfe- Его легко найти, если известно число ф(т) или известно разложение числа m в произведение простых. Система RSA нуждается в генерировании больших простых чисел. Необходимы методы для определения простоты числа. Теорема Вильсона вроде бы доставляет такой метод. Для определения простоты числа п нужно проверить, делится ли число (п — 1)! на п. Если не делится, то число п — простое. Однако этот метод хуже даже стандартного «решета Эратосфена». Малая теорема Ферма дает нам тест для проверки числа п на простоту. Выберем случайным образом несколько чисел 0 < а < п, вычислим степени ап~~1 по модулю п. Если где-нибудь не получилось единицы, то число п — составное. Другое дело, что получение единицы для
112 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ всех возможных а еще не гарантирует простоту числа п. Встречаются составные числа п, для которых выполняется малая теорема Ферма для всех чисел, взаимно простых с п. Такие числа называются числами Кар- майкла. Самое маленькое число Кармайкла — 561=3 • 11 • 17. Числами Кармайкла являются также числа 1729, 2465, 172081, 294409, 56052361. Недавно была доказана бесконечность множество чисел Кармайкла. Поэтому простейший тест на простоту с использованием малой теоремы Ферма на практике немного видоизменяют (см. окончание секции 3 главы 7). 6.5 Метод бесконечного спуска Сначала решим классическую проблему элементарной теории чисел — перечислим пифагоровы тройки, то есть такие натуральные тройки (я, 2/, z), что х2 + у2 = z2. Заметим, что взаимная простота любых двух чисел из тройки ведет ко взаимной простоте любой пары из тройки, так как общий делитель любых двух чисел из тройки будет делителем третьего числа. Достаточно найти вес попарно взаимно простые пифагоровы тройки, все остальные пифагоровы тройки будут получаться из них умножением на множители. Пусть (л, у, z) — пифагорова тройка с попарно взаимно простыми компонентами. Заметим, что ровно одна из них четна. Это может быть х или у, но не z. В самом деле, если z — четное ,а х и у — нечетные, то правая часть равенства х2 + у2 = z2 делится на 4, а левая имеет вид &п + 2. Это вытекает из того, что всякое нечетное число в квадрате имеет вид 8п +1 (нечетное число имеет вид 4А; -h 1 или 4А: — 1, в квадрате получается 8(2fc2±jfc) + l). Пусть у — четное, ах и z — нечетные. Тогда у2 = (z — x)(z + х). Обе скобки в правой части представляют собой четные числа (как, соответственно, разность и сумма нечетных чисел). Положим : z — х = 2р, z + х = 2q. Отсюда легко вытекает, что z = p + q, x = q - р. Если бы числа р и q имели бы нетривиальный общий множитель, то, как следует из последних равенств, этот же общий множитель имели бы и числа хи z. Поэтому числа р и q взаимно просты. Кроме того, они имеют разную четность (в противном случае, числа х и z были бы четными). Заметим, что имеет место равенство : {у/2)2 = pq. Так что произведение двух взаимно простых чисел равно квадрату натурального числа. Из этого следует, что каждое из этих чисел является квадратом. В самом
6.5. МЕТОД БЕСКОНЕЧНОГО СПУСКА 113 деле, если разложить квадрат в произведение четных степеней простых множителей, то каждая из этих степеней целиком войдет в один из двух взаимнопростых множителей (эти множители разделят четные степени между собой). Пусть р = n2, q = тп2. Тогда пифагорова тройка имеет вид: х = тп2 — п2 у = 2тпп z = пг2 + п2, где тип — взаимно простые натуральные числа разной четности. Легко проверить, что полученная тройка действительно является пифагоровой. Метод бесконечного спуска разработал Пьер Ферма для доказательства несуществования целочисленных решений уравнений. Он основывается на следующем простом наблюдении: Не существует монотонно убывающей последовательности натуральных чисел. Единственное полное доказательство, оставшееся от Ферма, проведено методом бесконечного спуска. Приведем его здесь в качестве иллюстрации метода. Теорема. Уравнение х4 + у4 = z2 не имеет натуральных решений. Доказательство» О Пусть (жо> Усь^о) — натуральное решение. Можно считать, что компоненты решения попарно взаимно простые. Тогда (xq,2/o»zo) — пифагорова тройка с попарно взаимно простыми компонентами. Значит, 9 0 х* = rrr - у2 = 2mn z = m2 + -n2 n2. где тип — взаимно простые числа разной четности. Заметим, что п — четное, а т — нечетное. В противном случае, х2 и п2 имеют вид 8п + 1 как квадраты нечетных чисел, а т2 делится на 4. В таком случае, левая часть первого равенства имеет вид 8п4-1, а правая часть имеет вид \п -1. Пусть п = 2г, где г взаимно просто с т. Подставим это соотношение во второе равенство : (у/2)2 = гт (заметим, что у — четное). Отсюда следует, что гит — квадраты натуральных чисел: г = и2 и т = v2, где и и v взаимно просты. Из первого равенства системы следует, что (хуп:т) — пифагорова тройка с попарно взаимнопростыми компонентами. Поэтому имеют место
114 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ равенства: х = а2-Ь2 п = 2аЬ где а и Ъ — взаимно простые числа разной четности. Из второго равенства полученной системы следует, что и2 = г = ab. Значит числа а и b являются квадратами : а = s2 и b = £2, где 5 и £ — взаимно простые. Поэтому третье равенство последней системы можно переписать в виде: v2 = m = sA + t*. Итак, (s,£,w) — натуральное решение исходного уравнения со взаимно простыми компонентами. При этом, zq > v. Действительно, zq = m2 + n2 > m2 = vA. Нам удалось по одному натуральному решению исходного уравнения построить другое, которое имеет меньшую третью компоненту. Очевидно, что этот процедуру можно повторить с новым решением, можно итерировать этот процедуру неограниченное число раз. При этом возникнет бесконечная последовательность решений с монотонно убывающей третьей компонентой. Последовательность третьих компонент будет монотонно убывающей последовательностью натуральных чисел. Такой последовательности не существует. □ Упражнения 1. Найти все целочисленные решения уравнений: а)х2 + 2у2 = z2; b)x2+y2 = 2z2. 2. Доказать, что уравнение х4 - у4 = z2 не имеет натуральных решений. 3. Найти все целочисленные решения уравнений: а)\ + х + х2 + х3 -у2\ Ь)х2 + 2 = у3. 6.6 Последняя теорема Ферма Попытки построить подобно пифагоровым тройкам нетривиальные целочисленные решения уравнения хп+уп = zn приводят к неудаче. Для п = 4 это вытекает из теоремы предыдущей секции и было доказано самим Пьером Ферма. Если мы докажем этот результат для всех нечетных простых показателей, то будет доказана Последняя теорема Ферма. Не существует натуральных решений уравнения хп -f у11 = zn при п > 2. Она была сформулирована в 1640 году
6.6. ПОСЛЕДНЯЯ ТЕОРЕМА ФЕРМА 115 и полностью доказана в 1995 году. Этапы ее решения за три с половиной века были заметными вехами развития теории чисел. Первый этап соответствует случаю п = 4. Как мы видели, он решается элементарными методами. Для нечетных простых показателей привлекаются неэлементарные понятия. Следующий этап связан с именем Леонарда Эйлера, который в 1763 году доказал случай п — 3. Развитие предложенных им методов позволило доказать эту теорему для п — 5 и п = 7. Приведем доказательство Эйлера. Доказательство. □ Пусть (жо, 3/сь zo) — решение уравнения х3 + у3 = zz с попарно взаимно простыми компонентами. Откажемся от предположения о натуральности решения. Будем рассматривать ненулевое целочисленное решение. Можно считать, что хо — четное, a ^o,t/o — нечетные (иначе (-20)3 + Уо - (-я0)3). Пусть z0 - уо = 2р, zQ + у0 = 2д, тогда г0 = р+<7, уо = q — р, где р и q — взаимно простые числа разной четности. Подставим эти формулы в исходное уравнение: 4 = 4 - »о = (Р + Я)3 - (9 - Р)3 = 2р(р2 + З?2). Заметим, что числор2+3д2 нечетное. Поэтому, НОД(2р,р24-3<72)=НОД(р,р2+ 3<72)=НОД(р,Зд2)=НОД(р,3). Рассмотрим два случая в зависимости от того, делится ли р на 3 или нет. 1) случай: р не делится на 3, НОД(2р,р2 + Зд2) = 1. Тогда числа 2р и р2+3д2 являются кубами. Далее Эйлер делает смелый шаг — разлагает второе число на комлексные множители р2 + Зд2 = (р + л/~3^)(р ~ yf~3q) и рассматривает арифметику чисел вида а + \/-ЗЬ, где а и Ь — целые числа. В этой арифметике он заключает, что каждый из множителей р ± y/^Sq является кубом числа вида а + у/—ЗЬ: р + yf^q = (а + л/^Ь)3 = а3 - 9аЬ2 + у/Ш{За2Ь - ЗЬ3). Значит выполняются равенства: 2р = 2(а3 — 9аЬ2) = 2а(а - ЗЬ)(а + ЗЬ). Заметим, что а и Ь— взаимно простые числа разной четности, и а не делится на 3. Поэтому имеет место равенство НОД(2а,а-ЗЬ)=НОД(2а,а+ЗЬ)=НОД(а- ЗЬ}£4-ЗЬ)=1, Значит каждый из этих множителей является кубом: 2а — и3, а — 36 = v3, а+ 36 = wz. Эти числа связаны между собой: vz +tu3 = w3. Мы получили еще одно решение исходного уравнения с попарно взаимно простыми компонентами. При этом число и — четное, avnw — нечетные. Отметим, что \хЦ > |2р| > |2а| = |и3|. Значит, |хо| > |и|. Итак, по решению с попарно взаимно простыми компонентами нам удалось построить еще одно такое решение с меньшей по модулю четной компонентой. Этот
116 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ процесс можно неограниченно итерировать. В результате получится монотонно убывающая последовательность натуральных чисел — модулей четных компонент решений. Противоречие. 2) случай: р делится на 3, НОД(2р,р2 + 3<?2) = 3. Пусть р = Зг, тогда ж3 = \Sr{q2 + Зг2), где НОД(18г,<?2 + Зг2) = 1. Поэтому, числа 18г и q2 + Зг2 являются кубами. Далее точно так же, как в первом случае, получаем формулу: q+y/^Hr = а3-9аЬ2+\/--3(За26~363). Из нее следует, что г = ЗЬ(а - b)(a + ft), где НОД(ЗЬ,а - ft)=HOfl(3ft,a - Ь)=НОД(а-Ь,а + Ь) = 1. В силу того, что 18г — куб, число г делится на 3, и число 18г/27 = 2г/3 является кубом. При этом, 2г/3 = 2Ь(а — Ь)(а + Ь). Значит, числа 26,а — ft,а + 6 являются кубами: 26 = и3, а — Ь = v3, a-hft = ш3. Эти числа связаны между собой: u3+v3 = w;3. При этом выполняется формула: |хо| > |и|. Как и в первом случае, нам удалось осуществить бесконечный спуск. D Отметим, что в этом доказательстве Эйлер допустил существенную неточность. Он перенес на числа вида а + >/—ЗЬ (а и 6 — целые числа) правило для кубов целых чисел : если произведение взаимно простых множителей равно кубу, то каждый из этих множителей - куб. Это правило существенно опирается на однозначность разложения на простые множители. Однако во введенной Эйлером числовой системе теорема об однозначном разложении на простые неверна. Достаточно рассмотреть пример: 4 = 2x2 = (1- >/-~3)(1 + \/—3)- Этот пример дает два принципиально различных разложения числа 4 на простые множители во введенной Эйлером числовой системе. Однако положение можно спасти, несколько расширив числовую систему. Нужно добавить числа вида: а 4-1/2 + \/^3(Ь + 1/2), где а и ft — целые числа. В новой числовой системе Z(a/--3) обратимых элементов, то есть аналогов знаков ±1, шесть штук: ±1, ±1/2 ± \/-3/2. Приведенный пример дает несущественно различающиеся разложения на простые множители — простые элементы в двух этих разложениях получаются друг из друга умножением на числа 1/2±\/~3/2, являющиеся аналогами знаков. Можно ввести для любого целого числа rf, не являющегося квадратом, аналогичную числовую систему Ъ(у/д). Для чисел вида d — 4п + 1 эта числовая система будет содержать аналогичные добавленным выше элементы с половинами. Изучение обратимых элементов этих числовых систем для натуральных d приводит к уравнениям Пелля. Заметим, что разделение на два случая в доказательстве Эйлера эк-
6.6. ПОСЛЕДНЯЯ ТЕОРЕМА ФЕРМА 117 вивалентно разделению на случай, когда одна из компонент решения делится на 3, и случай, когда ни одна из компонент решения не делится на 3. Вообще, для произвольного простого показателя принято отдельно доказывать теорему для попарно взаимно простых решений, которые ни в одной компоненте не делятся на показатель, и для попарно взаимно простых решений, у которых ровно одна компонента делится на показатель. Так выделяют, соответственно, первый и второй случаи Последней теоремы Ферма. Теорема Софи Жермен. Пусть простое число р таково, что число 2р + 1 — простое, тогда для показателя р выполняется первый случай Последней теоремы Ферма. Докажем эту теорему в частном случае р = 5. Общий случай доказывается совершенно аналогично. Доказательство. D Пусть (х, у, z) - нетривиальное целочисленное решение с попарно взаимно простыми компонентами, которые не делятся на 5. Имеет место разложение: ж5 + уъ = (х + у)(х4 - х3у + х2у2 - ху3 +у4). Пусть простое число q делит наибольший общий делитель этих двух скобок. Тот факт, что q делит первую скобку, означает, что х = — у mod q. Поэтому вторая скобка сравнима с числом by4 по модулю q. С другой стороны, она делится на q. Однако у не может делиться на <7, так как в этом случае НОД(х, у) делится на q (сумма х + у делится на </, следовательно, х также должен делиться на q). Поэтому q = 5. Этот случай исключается в силу того, что произведение скобок равно z5, a z не делится на 5. Поэтому каждая из скобок равна пятой степени натурального числа. В равенстве хь + уъ = z5 переменные х и у можно менять с переменной z вместе с изменением знака. Таким образом, еще две пары скобок равны пятым степеням : х + у = а5,я4 - хгу + х2у2 - ху3 + у4 = as,z = aa; z -у = ЬЪУ +y3z + fz2 + yz3 + z* = р\х = Ь0; z-x-cb,zA + z3x + z2x2 + zx3 + x4 = 75, у = су. Рассмотрим исходное уравнение по модулю 11. Из малой теоремы Ферма следует, что любое число в пятой степени может принимать только три значения по модулю 11 : -1, 0, 1. В самом деле, если г не делится на 11, то
118 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ г10 - 1 = (г5 - 1)(г5 + 1) = 0 mod 11. Значит, г5 = ±1 mod 11. Исходное уравнение может удовлетворяться, лишь когда одна одна из переменных делится на 11. Пусть это будет переменная z (выбор переменной несущественен). Сложим первые равенства из трех приведенных выше строчек : 2z = а5 4- Ь5 + с5. Значит, сумма пятых степеней из левой части делится на 11. Отсюда вытекает, что одна из этих степеней делится на 11. Это не может быть Ь5, так как в этом случае z - у делится на 11, и, поэтому, у делится на 11. Аналогично получим, что с5 не делится на 11. Итак, а делится на 11. Первое равенство из первой строчки приводит к сравнению: х = -у mod 11. Подставляя его во второе равенство из той же строчки, получим сравнение : 5х4 = a3 mod 11. Применяя сравнение z = 0 mod 11 ко второму равенству третьей строчки, получаем сравнение: х4 = 75 mod 11. Значит имеет место условие: 67s = a5 mod 11. Это сравнение возможно только при условии : а = 7 = 0 mod 11. Отсюда и из последнего равенства третьей строчки следует, что у делится на 11. Противоречие со взаимной простотой у и z. О Были получены значительные усиления теоремы Софи Жермен. Однако главная линия исследования Последней теоремы Ферма в прошлом веке была заложена Куммером, который использовал числовые системы, связанные с разложением двучлена zn — xn на линейные множители с комплексными коэффициентами. Сам Куммер доказал Последнюю теорему Ферма для всех простых показателей в пределах сотни. Развитие его методов позволило доказать эту теорему для всех простых показателей в пределах ста тысяч. Однако решение эта проблема получила, благодаря совсем иному подходу — исследованию арифметических свойств кубических кривых. Равенству ап + Ьп = сп поставили в соответствие кубическую кривую у2 = х(х - ап)(х - сп). Математики Фрей и Рибет доказали, что для докаг зательства несуществования этого равенства нужно доказать известную гипотезу Таниямы о свойствах подобных кривых. В 1995 году Уайлс в сотрудничестве с Тэйлором в журнале «Annals of mathematics» опубликовал доказательство этой гипотезы и полностью доказал Последнюю теорему Ферма.
Глава 7 Квадратичный закон взаимности 7Л Решение квадратных сравнений Как мы выяснили в предыдущей главе, решение сравнений по произвольному составному модулю сводится к их решению по модулю вида р*, где р — простое число. Первым шагом для их решения будет нахождение всех решений по модулю р. В этой книге мы на этом и остановимся. Разберем лишь один пример решения квадратного уравнения х2 = 7 во множестве Z/3*. Этот пример показывает, как действовать в общем случае. Сначала найдем решения по модулю три. Это два решения х\ = 1 + 3n;n G Z, х2 = 2 + 3n;n Е Z. Теперь станем искать решения по модулю девять в виде: хг = 1 + 3u + 9n; n G Z, х2 = 2 + 3v + 9n; n G Z, где 0 < и, v < 3. (1 + Зи + 9п)2 = 7 mod 9, 1+ 6гх = 7mod 9, и = 1. (2 + Зи + 9п)2 = 7 mod 9, 4 + Ш = 7 mod 9, V = 1. Затем станем искать решение по модулю 27: х\ = 1 + 3 -I- 9и + 27п, хг = 2 + 3 + 9v + 27п. (4 4- % + 27п)2 = 7 mod 27, 16 + 72u = 7 mod 27, и = 1. (5 + 9t/ + 27n)2 = 7 mod 27, 25 + 90v = 7 mod 27, ti = 1.
120 ГЛАВА 7. КВАДРАТИЧНЫЙ ЗАКОН ВЗАИМНОСТИ Затем станем искать решение по модулю 81: xi = l+3+9+27u+81n, x<i = 2 + 3 + 9 + 27v + 81n. (13 + Пи + 81n)2 = 7 mod 81, 169 + 54u = 7 mod 81, u = 0 (14 + 27t/ + 81n)2 = 7 mod 81, 196 + 27v = 7 mod 81, v = 2. Очевидно, что этот процесс можно продолжать неограниченно долго. Получается запись в троичной системе счисления х\ = 1110..., x<i = 2112.... Пусть мы получили решения по модулю рк : х\ = а + рЛп, хг = Ь + pfcn. Найдем решения по модулю р*+1 : Si = а + up* + р*+1п, Х2 = (а + ирк + р*+1п)2 = 7 mod p*+1, а2 + 2<шр* = 7 mod pk+1. Однако имеет место равенство: а2 = 7 + spk. Значит, нужно решить сравнение: 2aup* = spk modp*+1. Оно эквивалентно сравнению: 2аи = s mod p. Аналогично ищется второе решение. Подобным образом подбираются решения в общем случае. В связи с приведенным примером возникает интересная аналогия. Построение решений по модулям вида 3* чем-то напоминало нахождение последовательных приближений к корню из семи. Хотелось бы придать смысл бесконечной последовательности 1110 Это действительно можно сделать — таким образом получаются так называемые целые р-адические числа. Их изучение выходит за рамки нашего курса. Как мы уже отмечали, свойства многочленов с коэффициентами из множества вычетов по простому модулю р во многом повторяют свойства многочленов. На этот случай можно перенести методы решения уравнений. Рассмотрим квадратное уравнение х2 + ах + Ъ = 0. Старший коэффициент можно считать равным единице (в противном случае, умножим все уравнение на обратный к старшему коэффициенту вычет). Ничего не стоит выделить в этом уравнении полный квадрат — вычет, обратный к 2, равен (р+1)/2 : \ х2 + 2(р + 1)/2ох + Ь = (х + ^-^ ■ а)2 + Ь - ^- ■ а = 0. Уравнение свелось к следующему: z2 = с. Вероятно, подобное перенесение методов с обычных уравнений на уравнения с коэффициентами в Z/p возможно и в других случаях. Нам необходимо исследовать уравнения вида zn = с, для того чтобы понять, что значит корень n-й степени в множестве
7.1. РЕШЕНИЕ КВАДРАТНЫХ СРАВНЕНИЙ 121 вычетов Ъ/р. Мы сразу будем искать ненулевые решения, так как нулевое решение есть лишь у уравнения zn = 0 (при этом оно будет единственным решением). Теорема. Пусть р — простое число. Уравнение zn = с либо имеет ровно НОД(п,р — 1) решений, либо не имеет решений вовсе. Если НОД(п,р- 1) = 1, то уравнение всегда имеет единственное решение. Доказательство. D Воспользуемся существованием примитивного вычета а по модулю р. Пусть z = а8. Уравнение переписывается в виде: а8П = с. Пусть с = 5*. Тогда уравнение сведется к линейному сравнению для степеней: sn = t mod p— 1. Здесь s — переменная, t и п — постоянные. Если НОД(п,р - 1) = d, то все будет определятся следующей альтернативой. Делится ли число t на d, или — нет? Если t не делится на d, то равенство sn = t + (р - 1)N невозможно, и исходное уравнение решений не имеет. Если t делится на d, то это равенство можно сократить на d. Получится равенство sn1 = t1 + ^j^N. При этом имеет место равенство: НОД(п', £р) = 1. Сравнение sn1 = £' mod ^j^- имеет единственное решение - класс вычета по модулю Е^-. В множестве целых чисел этот класс распадется на d классов вычетов по модулю р — 1. Получается d решений у исходного уравнения. Если d = 1, то сравнение имеет единственное решение по модулю р — 1. D Мы получили, что возведение всех вычетов во взаимно простую с р~ 1 степень представляет собой попросту перестановку вычетов. Этот факт можно было получить непосредственно. Достаточно возвести в такую степень примитивный вычет. В результате получится примитивный вычет. Среди натуральных чисел, находящихся в пределах от 1 до р — 1, таких степеней ф(р - 1) штук. Они дадут все возможные примитивные вычеты. Соответствие примитивного вычета а и вновь полученного примитивного вычета Ъ задает перестановку всех вычетов. При этом нулевой вычет переходит в себя, а вычет а8 переходит в вычет Ъ . Исследуем решение квадратного уравнения х2 = с. Если оно имеет решения, то вычет с называется квадратичным. В противном случае, с называют неквадратичным. Для -того чтобы выяснить квадратичность вычета с, нужно представить его в виде а1 и, следуя доказательству теоремы, проверить четность числа t. Если t — четное, то уравнение имеет решения. В противном случае, уравнение решений не имеет. Видимо должны существовать более простые методы для определения квадратич- ности вычета — слишком много дополнительной информации используется при представлении вычета в виде степени примитивного вычета. Од-
122 ГЛАВА 7. КВАДРАТИЧНЫЙ ЗАКОН ВЗАИМНОСТИ нако это представление полезно для легкого доказательства следующих теоретических фактов: 1) произведение двух квадратичных вычетов — квадратичный вычет; произведение двух неквадратичных вычетов — квадратичный вычет; произведение квадратичного и неквадратичного вычетов — неквадратичный вычет. 2) ненулевых квадратичных вычетов столько же, сколько неквадратичных. Интересно было бы узнать, каким образом квадратичные вычеты лежат среди неквадратичных. В следующей секции мы получим важный результат по этой теме — квадратичный закон взаимности. Однако эта тема все еще является предметом серьезных научных исследований. Теорема (Критерий Эйлера). Если ненулевой вычет с — квадратичный, то имеет место сравнение: с^"1^2 = 1 mod р. В противном случае, имеет место сравнение: с^-1)/2 = -1 mod р. Доказательство. D Уравнение х^"1^2 = 1 имеет не более чем (р - 1)/2 решений, так как этому числу равна степень многочлена х^р~1^2 — 1. Однако любой квадратичный вычет а2и является решением этого уравнения (согласно малой теореме Ферма а^"1^ = Т). Ненулевых квадратичных вычетов ровно (р - 1)/2 штук. Значит, неквадратичные вычеты в степени (р — 1)/2 не равны единичному вычету. Имеет место равенство: )/2 + 1) = gP-1 _ I = 0. Если произведение двух вычетов равно нулевому вычету, то хотя бы один из них — нулевой. Однако для неквадратичного с первая скобка — ненулевой вычет. Значит, вторая скобка — нулевой вычет. Имеет место равенство : с(р~1)/2 = ^Т. D Определим символ Лежандра (-) произвольного класса вычета с по модулю простого нечетного числа р по следующей формуле: если р | с; если р \ с , вычет с — квадратичный; если вычет с — неквадратичный . Согласно критерию Эйлера, символ Лежандра можно представить в виде: (|) = с**-1)/2 mod р. Отсюда легко следует формула: (^) = (£)(£)♦ Эта формула* эквивалентна сформулированному выше утверждению 1) о произведении вычетов. Однако формула для символа Лежандра дает и менее очевидные утверждения.
7Л. РЕШЕНИЕ КВАДРАТНЫХ СРАВНЕНИЙ 123 Например, следующее: Если простое число р имеет вид Ак +1, то уравнение х2 + 1 = 0 имеет два решения; если простое число р имеет вид Ак-1, то это уравнение не имеет решений. О В самом деле, (=у) = (—l)^"1)/2. Подставляя сюда формулу для числа р, получим доказываемое утверждение. D В заключение секции докажем утверждение о простых числах при помощи полученных результатов. Нечетные простые числа делятся на два указанных выше класса. Задача. Докажем, что простых чисел вида Ак — 1 бесконечно много, и простых чисел вида 4А; + 1 бесконечно много. D Пусть все простые вида Ак- 1 это — Pi,P2i • • • »Рп- Тогда число N = 4piP2 • • Рп — 1 не может быть простым, ибо превосходит все указанные простые числа, имея тот же вид. Число N — нечетное, кроме того, оно не делится ни на одно из указанных выше простых чисел. Значит это составное число раскладывается в произведение простых чисел вида Ак + 1. Однако это невозможно, так как произведение чисел вида Ак + 1 само имеет такой вид.Противоречие. Докажем, что простых чисел вида 4А: -h 1 бесконечно много. Пусть все такие числа — РьРг^ • • • >JV Тогда число N = Ар\р\ .. .р2 + 1 не может быть простым, ибо превосходит все указанные числа, имея тот же вид. Число N — нечетное, кроме того, оно не делится ни на одно из указанных выше простых чисел. Значит, это составное число раскладывается в произведение простых чисел вида 4А; — 1. Пусть р — одно из них. Тогда сравнение х2 + 1 = 0 mod р имеет решения х = ±2pip2 >.-pn, так как N = 0 mod р. Противоречие с полученным выше равенством (—) = — 1 для простых р = Ак - 1. Упражнения 1. Выписать явные формулы для решений уравнения х2 = -1 для множества вычетов Z/p, где р = Ак + 1 — простое число. Указание: Воспользоваться теоремой Вильсона. 2. Доказать, что для р = 4А: — 1 решениями уравнения я2 = а в . множестве Z/p являются вычеты ±а*, если известно, что оно имеет решения. 3. Доказать, что в натуральном ряду находятся сколь угодно большие участки, состоящие из последовательных составных чисел. Указание: рассмотреть участок вида п! + 2, п! 4- 3,... , п! + п. 4. Пусть р(п) — n-е по порядку простое число. Доказать, что
124 ГЛАВА 7. КВАДРАТИЧНЫЙ ЗАКОН ВЗАИМНОСТИ 2п - 1 < р{п) < 22П'1 для п > 1. Указание: доказать неравенство р(п + 1) < р(1)р(2).. .р(п) + 1. 7.2 Квадратичный закон взаимности Пусть натуральное число п разложено в произведение степеней простых делителей п = р\1р^2.. .ракк. Имеет место формула: °2 Имеют значение лишь нечетные степени простых чисел, так как в четных символ Лежандра равен единице. Задача, таким образом, сводится к вычислению символов Лежандра от простых чисел, меньших р. Теорема (Квадратичный закон взаимности). Для любого простого нечетного числа q имеет место формула: Доказательство. D Найдем представители классов вычетов по модулю р ф q для чисел вида qt,\ < t < (p - 1)/2 в следующей системе представителей: Другими словами, запишем представителя класса вычета числа qt в виде qt = cttt mod р, где et = ±1,1 < rt < {р — 1)/2. Заметим, что все числа rt получатся разными (из этого следует, что это будут все натуральные числа от 1 до (р — 1)/2). В самом деле, пусть rt = rs. Из этого следует, что число qt ± qs = q(t ± s) делится на р. Значит число t ± 5 делится на р, что может быть только при условии равенства этого числа нулю (так как \t ± s\ < р). Перемножив всех этих представителей, получим равенство вычетов: q(p-l)/2 Согласно критерию Эйлера имеет место сравнение: q(p l^2 = (J) mod p- Кроме того,
7.2. КВАДРАТИЧНЫЙ ЗАКОН ВЗАИМНОСТИ 125 Значит для символа Лсжандра получилась формула: Рассмотрим следующую нечетную функцию: f(z) = 2isin27r2, где i — мнимая единица. Она периодична с наименьшим положительным периодом равным единице. Символ Лежандра можно выразить с помощью этой функции. Лемма 1. Для нечетных простых чисел р и q имеет место формула: t~l Доказательство. D Из равенства qt = £trt + ntp следует, что ^ f(ctrt) = €tf(rt). Перемножив равенства по всем t, получим: (p-i)/2 (p-U/2 П /А=^2...,(Р-1)/2 п /(> Лемма 2. Для нечетного натурального числа п имеет место формула: (п-1)/ fc£)= П Доказательство. О Обозначим: 6 = cos 2тг/^ + г sin 2тг/д. Имеет место формула: п-1 s-0 Она вытекает из равенства: п-1 п-1 в=0 5=0 Для доказательства достаточно положить и — х/у и умножить обе части этого равенства на уп. Само это равенство вытекает из того, что множество корней n-й степени из единицы можно представить в виде:
126 ГЛАВА 7. КВАДРАТИЧНЫЙ ЗАКОН ВЗАИМНОСТИ УТ = {e2»\s = 0,1,2,... ,п - 1}, так как НОД(2,п) = 1. Кроме того, Для окончания доказательства подставим в полученнную формулу: х = cos2tt2 + 2sin27T2, у = cos2ttz - г sin27T2r. Левая часть имеет вид: хп - уп = /(п • z). Правая часть имеет вид: П"=о f(z ~ п)- Для ^ < s < п -1 можно записать равенство: f(z-~f-) = f{z + 2=£ - 1) = f[z -f *^p). Поэтому имеет место равенство: Окончим доказательство Квадратичного закона взаимности следующим образом. Для символа Лежандра имеет формула: Tf = П П /(--->/(i + i)- — I AJL А-*- О О О О р' t=i a=i ^ ч ^ * Имеется ровно ^ • ^ множителей /(£/р - e/g). Если такой множитель поменять на множитель f{s/q — t/p), то просто поменяется знак. Если это проделать со всеми такими множителями, то все выражение умножится на (—1)^2""^". При этом числа р и q поменяются ролями, так как во втором множителе слагаемые можно менять местами. В результате получится выражение, которое стоит в правой части доказываемой формулы. D В качестве примера рассмотрим решение уравнения z2 + 3 = 0 во множестве классов вычетов по простому модулю р > 3. Для символа Лежандра имеют место равенства: Задача. Все превосходящие 3 простые числа можно разбить на два класса: имеющие вид 6fe-f 1 и имеющие вид 6А; — 1. Доказать, что в каждом из этих классов бесконечно много простых чисел. □ Подставив р в символ Лежандра, получим: (|) = (^^) = (х) =_^» где везде выбирается один и тот же знак. В самом деле, в Z/3 вычет 1 — квадратичный, а вычет ^Т — неквадратичный. Значит уравнение z2+3 — 0 имеет два решения для р = 6А; + 1, и не имеет решений для р = 6fc — 1. Доказательство бесконечности множества простых чисел вида 6к - 1
7.2. КВАДРАТИЧНЫЙ ЗАКОН ВЗАИМНОСТИ 127 дословно повторяет аналогичное доказательство для чисел вида 4к - 1 из предыдущей секции. Докажем от противного бесконечность множества простых чисел вида 6к +1. Пусть рьР2> - • - ,рп —- все такие числа. Тогда число N = 4pfp^ • Рп + 3 не может быть простым, ибо превосходит все указанные числа и имеет остаток 1 при делении на 6. Оно не делится ни на 2, ни на 3, ни на одно из указанных выше простых чисел. Значит оно разлагается в произведение простых вида 6к — 1. Пусть простое р — один из этих множителей. Тогда N = О mod р. Значит, уравнение z2 + 3 = О имеет решения z = ±2pip2. ..рЛ в Ъ/р. Противоречие с доказанным свойством простого р = 6Л - 1.П Итак, всякий вычет а по модулю 4 или 6 содержит бесконечно много простых чисел, если а взаимно просто с модулем. Этот факт допускает обобщение для произвольного модуля. Теорема Дирихле. Всякий класс вычетов а содержит бесконечно много простых чисел, если а взаимно просто с модулем. П Мы еще не вычислили символ Лежандра (^). Для этого приведем пару общих формул для символа Лежандра (имеющих лишь теоретическое значение) и заодно еще раз докажем квадратичный закон взаимности. Была получена следующая формула для символа Лежандра (|) = б1б2 .. .б(р_1)/2, где at = ctru \<t< (р-1)/2 (с* = ±1,1 < rt < (р = 1)/2). Несложно получить явную формулу для знака: et = (—l)L2iat/p}J. В самом деле, знак плюс получается, когда 0 < {at/p} < 1/2; знак минус получается, когда 1/2 < {at/p} < 1. Полученную формулу можно слегка подправить. Для этого умножим обе части формулы at/p = [at/p\ +{at/p} на два и возьмем от полученного целую часть: [2at/p\ = [2[at/p\\ + [2{at/p}\ = 2[at/p\ + [2{at/p}\. Возведя минус единицу в эту степень, получим формулу: Значит для символа Лежандра имеется формула: ;l)/2L2a*/pJ Из нее можно получить формулу для символа Лежандра от двойки. Пусть a — нечетное число, тогда число а + р — четное. Имеют место формулы:
128 ГЛАВА 7. КВАДРАТИЧНЫЙ ЗАКОН ВЗАИМНОСТИ В самом деле, вычет 4 — квадратический, сумма арифметической прогрессии l-f-2-h.. . + (р-1)/2 равна (^-y^ + l)-1^ = ILf^~- Теперь подставим в полученную формулу а — 1: В самом деле, [t/p\ = 0. Получив формулу для символа Лежандра от двойки, можно сократить обе части этой формулы в формуле для символа Лежандра от 2а: (-) = (—l)^«=i I**/pJ. Последняя формула верна лишь для нечетных а. Сее помощью легко доказать Квадратичный закон взаимности. Для этого достаточно доказать формулу: При возведении минус единицы в правую части этой формулы получается произведение символов Лежандра (а) (£), вместе с левой частью получается формула эквивалентная квадратичному закону взаимности. Левую часть доказываемой формулы представим как число точек множества {(М)| t = 1,2,... ,(р- 1)/2; 5 = 1,2,... ,((/- 1)/2}. Это множество прямая t/ = £х делит на две части. Оказывается, что они содержат как раз столько точек, сколько их в суммах из левой части доказываемой формулы. Сначала докажем, что прямая не пересекает это множество. Предположим, что точка (£, s) лежит на этой прямой: ps = qt. Значит, число qt делится на р. При этом НОД(р, q) = 1. Следовательно, t делится на р. Это невозможно, учитывая границы, в которых изменяется число t. Подсчитаем число точек, лежащих под прямой. Сначала найдем, сколько их в вертикальном отрезке, соответствующем натуральной абсциссе 1 < * < (р ~ 1)/2- Длина отрезка равна qt/p. Целочисленных точек в нем [qt/p\ штук. Складывая эту величину по всем отрезкам, получаем сумму $^t=7X 2[qt/p\- Совершенно аналогично подсчитывается количество точек, лежащих над прямой. Нужно будет рассмотреть горизонтальные отрезки (см. рисунок). Отметим, что при р > q прямая проходит выше точке А((р - 1)/2, (q - l)/2). Требуется обосновать, почему в самых правых вертикальных отрезках не окажется лишних точек с целочисленными координатами. Для доказательства нужно рассмотреть треугольник, у которого две вершины представляет собой точки А и 2?(р/2,д/2), а третья
7.3. ПРИЛОЖЕНИЯ ЗАКОНА ВЗАИМНОСТИ 129 вершина лежит на пересечении указанной прямой и горизонтальной прямой, проходящей через точку А. Этот треугольник не содержит лишних точек с целочисленными координатами, потому что он целиком лежит в горизонтальной полосе между двумя последовательными целыми значениями ординаты. Длина высоты этого треугольника, опущенной из точки В, равна 1/2. У Итак, получено второе доказательство квадратичного закона взаимности. Таких доказательств существует очень много. В дальнейшем мы приведем еще одно доказатество этой теоремы. 7.3 Приложения закона взаимности Коснемся сначала важной для теории чисел темы — представления простых чисел алгебраическими выражениями. Теорема. Простое число р > 3 представляется в виде: 1. Суммы двух квадратов натуральных чисел р = х2 + у2 тогда и только тогда, когда оно имеет вид р = 4А; 4-1; 2. Суммы квадрата и удвоенного квадрата натуральных чисел р = х2 + 2у2 тогда и только тогда, когда оно имеет вид р = 8к + 1 или 8Jk + 3; 3. Суммы квадрата и утроенного квадрата натуральных чисел р = х2 + Зу2 тогда и только тогда, когда оно имеет вид 6& + 1. Доказательство. □ Сначала докажем необходимость этих условий. 1. Пусть р = х2 + у2. Рассмотрим это равенство по модулю р : х2 -f у2 = 0. Умножим обе части на вычет, обратный к у2, получим равенство:
130 ГЛАВА 7. КВАДРАТИЧНЫЙ ЗАКОН ВЗАИМНОСТИ z2 + Т = 0. Здесь z =rf1. Мы построили решение уравнения в Z/p. Значит, р имеет вид 4к + 1. 2. Пусть р = я24-2у2. Как и выше получаем решение уравнения z2-f2 = 0. Значит, (^) = +1. Однако, Подставим в это равенство р, представленное в виде 8fc + /, / = 1,3,5,7. Подходит только / = 1, / = 3. 3. Пусть р = х2+3у2. Как и выше получаем решение уравнения z2+3 = 0. Это возможно лишь для р = 6А; + 1. Теперь докажем достаточность этих условий. Мы построим по решениям уравнений в Z/p нужные х и у. Основным инструментом для этого будет утверждение из секции 2 главы 5. Оно доказывает существование приближения действительного числа а рациональной дробью со знамена- талем, не превосходящим заранее заданного числа г > 1. 1. Пусть Zq + 1 = 0 mod p. Мы будем приближать рациональное число zo/p рациональным числом п/у сг= у/р. При этом должны выполняться неравества: у < у/р, \zo/p - п/у\ < {уу/р)~1. Второе неравенство можно переписать в виде равенства: Умножив это равенство на ру, получим: z$y -np = Оу/р. Левая часть последнего равенства — целое число. Обозначим его через х. Тогда, \х\ — |0\/р1 < \/Р- Кроме того, х = zoy mod p. В таком случае сумма двух квадратов х2 + у2 делится на р. Действительно, х2 + у2 = z\y2 4- у2 = -у2 + у2 = 0 mod p. Значит, можно написать оценку: 0 < х2 + у2 < 2р. Однако, это число делится на р. Отсюда следует, что х2 + у2 = р. 2. Пусть z^ + 2 = 0 mod p. Аналогично предыдущему приблизим дробь zo/p рациональным числом п/у с т = у/р и положим х = ;ад - пр. Сумма квадрата и удвоенного квадрата делится на р: х2 + 2у2 = 2q2/2 + 2y2 S 0 mod р. Кроме того, можно написать оценку:0 < х2Л- 2у2 < Зр. Возникает альтернатива: х2 + 2#v2 = р или х2 + 2у2 = 2р. Во втором случае число X — четное. Подставим х = 2и и сократим на два: 2u2 + j/2 = р. В любом случае, мы получили нужное представление числа р.
7.3. ПРИЛОЖЕНИЯ ЗАКОНА ВЗАИМНОСТИ 131 3. Совершенно аналогично предыдущему получим число х2 4- Зу2, которое делится на р. Причем, \х\ < р, \у\ < р. Из оценки 0 < х2 4- Зу2 < 4р вытекают три возможности: х2 4- Зу2 = р, х2 4- Зу2 = 2р или х2 4- 3$/2 = Зр. Вторая возможность никогда не реализуется. В самом деле, оба слагаемых нечетны (если бы оба слагаемых были четными, то правая часть делилась бы на 4; разную четность они иметь не могут, так как правая часть при этом нечетна). Однако нечетное число в квадрате имеет вид 85 + 1. Пусть х2 = &si 4- 1, у2 = 8s2 + 1. Тогда правая часть делится на 4 — она имеет вид: 8($i 4- 3$г) + 4. Третья возможность легко сводится к первой: х = Зи =*► Зи2 + у2 - p. D Следствие. Простое число р > 3 представляется в виде р = х2 — ху + у2, где х и у — натуральные числа, тогда и только тогда, когда оно имеет вид р = 6А: + 1. Доказательство. □ Пусть р имеет такой вид, тогда его можно представить в виде р = и2 4- 3v2. Положим: х = и + v> у = 2v. Тогда х2 - ху 4- у2 = и2 + Зи2 = р. Пусть р = х2 - ху + у2. Тогда 4р = (2х — j/)2 -f 3j/2. Значит, уравнение z2 4-3 = 0 имеет в Z/p решения ±2ж - у *у~1. Отсюда следует, что р имеет указанный вид. D Закон взаимности облегчает вычисление символа Лежандра. На этом основан метод поиска больших простых чисел при помощи теста Соло- пэя — Штрассена. Этот тест опирается на формулу: а^р~1^2 = (-) mod p, для 0 < а < р и простого р. Дело в том, что и левая, и правая части сравнения легко вычисляются. Для быстрого вычисления левой части степень (р - 1)/2 представляют в двоичном коде. Это позволяет свести возведение в большую степень к многократному возведению в квадрат с последующим приведением к остатку по модулю р. Что же касается левой части, то сразу же возникают вопросы. Как вычислить символ Лежандра по модулю, простоту которого как раз и проверяют? Для этого вводят обобщение символа Лежандра на составные модули — так называемый символ Якоби. Пусть составное нечетное число m раскладывается на множители следующим образом: m = P1P2 • • -Рп- Определим символ Якоби по формуле: \т) \pi)\J)2)\Pn)' Вычисление символа Якоби оказывается легкой алгоритмизуемой задачей, потому что выполняются следующие свойства, которые составляют
132 ГЛАВА 7. КВАДРАТИЧНЫЙ ЗАКОН ВЗАИМНОСТИ квадратичный закон взаимности для символа Якоби: Так что для подсчета символа Лежандра нужно воспользоваться этими свойствами, Сами вычисления не предполагают заранее, известна ли нам простота числа т. Символ Якоби служит вспомогательным вычислительным средством для символа Лежандра. Таким образом, обе части исходной формулы легко вычисляются при помощи компьютера. Пример: /662\ _ /_2\ ЛЗЗП = /331\ = /2001\ = V2001/ " \2001) ' V200lJ ~ \2001У \ 331 / /15\ /331\ /1\ -Ы—Ы—Ы—1Л Докажем закон взаимности для символа Якоби. □ Пусть т = pip2.. .рп и а = qiq2-Qs — разложения на простыв множители двух нечетных чисел. Имеют место равенства: ® Достаточно доказать, что ^гП=1 ^ = (ш-1)/2 mod 2 и £J= 1)/2 mod 2. Это непосредственно следует из пункта 1 следующей леммы. Лемма 1. Для нечетных чисел и и v имеют место сравнения: 1. (и - 1)/2 + (v - 1)/2 = {uv - l)/2 mod 2; 2. (и2 - 1)/8 + (v2 - 1)/8 = (uV - l)/8 mod 2. Доказательство. D 1. Подставим и = 2t/' +1, г; = 2t/-H в сравнение: ix' + vf = ((2tif + l)(2w' -hi)- l)/2 = 2uV + «4v' mod 2. 2. Подставим u = 4x + /i ии = 4y-f/, где Л = ±1 и / = ±1, в сравнение: 2х2 + Лх 4- 2?/2 + /» = ((16х2 + 8Лх + 1)(16у2 + 8/t/ + 1) - 1)/8 = 32хV + I6(x2fy + 2/2Ла;) + 2(х2 + у2) + Shxfy 4- Лх + /у mod 2.
7.3. ПРИЛОЖЕНИЯ ЗАКОНА ВЗАИМНОСТИ 133 а С помощью первого пункта леммы можно доказать равенство (—•) = ()/2 С помощью второго пункта леммы можно доказать равенство (~) = 2 Теорема. Для нечетного составного числа т не более половины взаимно простых с т чисел 0 < а < т удовлетворяют условию aSm~1^2 = (^)modm. Доказательство. □ Пусть квадрат простого числа р2 делит ш, тогда (1+т ) = !• В самом деле, для всякого щ из разложения числа т на простые множители имеет место сравнение: 1 + т/р = 1 mod р{. Значит имеет место равенство: (1-fm/p) = +1. Сравнение (1 + т/р)^771"1^2 = 1 mod m не имеет места. В самом деле, пусть р в s-й степени выносится из числа m : m = р*ш', где НОД(р, т;) = 1. Тогда, (l+m/p)^"1)/2 = (l+p-W)^"1)/2 = l+jf-lm'(m-l)/2mod т. Мы раскрыли бином по формуле Ньютона и заметили, что все члены, за исключением двух первых, делятся на т. Второе слагаемое из правой части не делится на ps, потому что m — 1 не делится на р. Значит для а = 1 + т/р не выполняется условие, указанное в теореме. Нам нужно найти число о с таким же свойством в случае, когда число m не делится ни на какой нетривиальный квадрат (то есть, когда в разложении m = р\рг .. .рп все простые различны). Пусть $ — неквадратичный вычет по модулю р\\ с и Ь — такие числа, что с-гп/рх = 1 mod p\ и bpi = 1 mod т/р\. Положим а = scm/p\ + Ър\. Имеют место равенства: ±) = (£\( = (). ( т) \pij Xjn/pxJ \pij \m/p Итак, для любого составного модуля т мы нашли взаимно простое ним число а, для которого а*™"1)/2 ф (^). Пусть ui,u2>... ,Щ — все
134 ГЛАВА 7. КВАДРАТИЧНЫЙ ЗАКОН ВЗАИМНОСТИ целые числа, удовлетворяющие условиям: 0 < щ < ш, НОД(гц,га) = 1, u{m-i)/2 s ^ mocj т^ для i < i < $. Тогда остатки от деления чисел ащ, Ш22,... , atit на m дадут столько же различных чисел, которые удовлетворяют двум первым условиям, но не удовлетворяют третьему. П Таким образом, для теста Соловэя — Штрассена не возникает препятствий, аналогичных числам Кармайкла для теста, опирающегося на малую теорему Ферма. В любом случае, не менее половины пробных чисел дают отрицательный результат тестирования, если число т было составным. Числа Кармайкла и здесь дают "ложку дегтя в бочке меда" — для чисел Кармайкла т=1729 и т=56052361 указанное сравнение выполняется ровно на половине взаимно простых с модулем чисел 0 < а < т. Так что эту теорему нельзя усилить. Однако, на практике пользуются не тестом Соловэя — Штрассена, а тестом Миллера — Рабина. Он основан на следующей идее. Если р — простое и а2к = 1 mod р, то а* = ±1 mod р. Дадим описание этого теста. Проверяем на простоту нечетное число га. Случайным образом выбираем натуральное число а и убеждаемся в том, что НОД(а, т) = 1. Затем, представляем число т - 1 в виде 2аи, где и — нечетное (достаточно заметить, что в двоичном предстовлении т - 1 оканчивается ровно на з нулей, и, если их стереть, то получится и). После этого последовательно возводим число а в степени и,2т2,4и,... ,2su. Если т простое, то начиная с какого-то места начнет появлятся единица (согласно малой теореме Ферма в самом конце точно будет единица). Если это степень и, то тест окончил работу с итогом: «т, похоже, простое». Если это степень 2ки, то предыдущий шаг должен был дать -1 (конечно, при последовательном возведении в квадрат мы остановимся, как только получим -1). Замечательно, что при составном т не более четверти взаимнопростых с т остатков а могут дать результат «ш, похоже, простое». Так что, выбирая остатки в достаточно большом числе, мы можем с большой вероятностью быть уверены в простоте числа т. При помощи закона взаимности можно доказать следующую теорему. Теорема. Для любого натурального числа п, не являющегося полным квадратом, можно найти бесконечно много простых модулей, по которым вычет п не является квадратичным. Доказательство. D Достаточно рассмотреть случай, когда число п не делится на нетривиальные квадраты, то есть п = 2c(/ig2 • .(fri б € {0,1}, Qi — нечетные различные простые числа % = 1,\2... ,t. Сначала рассмотрим п = 2. Вычет 2 не является квадратичным тог-
7Л ПРИЛОЖЕНИЯ ЗАКОНА ВЗАИМНОСТИ 135 да и только тогда, когда п = 8fc + 3 или п = 8к + 5. Теорема Дирихле утверждает бесконечность множества простых чисел каждого из этих видов. Нам нужно доказать бесконечность объединения этих множеств, то есть более слабое утверждение. Для доказательства мы применим следующий логический прием. Пусть {/ь/г,.-.,/»} — произвольное множество простых чиселj превосходящих число три, по модулям которых двойка — неквадратичный вычет. Мы найдем превосходящее тройку простое число, которое в нем не содержится, по модулю которого двойка является неквадратичным вычетом. Из этого следует, что таких простых чисел бесконечно много. В самом деле, начнем с простого числа 5. Найдем еще одно простое нужного вида, и так далее. Каждый раз мы будем расширять множество при помощи этого факта. Докажем существование нового простого числа. Положим, Ь = 8/1/2 • • U + 3. Тогда (|) = -1. Пусть Ь = РгР2 -Рг — разложение на простые множители. Заметим, что все эти множители больше тройки и не лежат в приведенном выше множестве. Для по крайней мере одного из них двойка будет неквадратичным вычетом, так как (|-) (£) ... (£) = -1. Теперь применим этот прием к случаю, когда п = 2eq\q2 .. .<fr, t > О, е < 1. Пусть {/i,f2> • • • Js} — произвольное множество искомых простых чисел. Пусть число и дает неквадратичный вычет по модулю qt и число Ь — решение системы сравнений: Г х = 1 mod 8<7i?2 . • • qt-ihh -Л \ х = и mod qt. Имеем: (j) = — 1. Значит существует отличный от уже выбранных простой делитель числа 6, по модулю которого исходное число не квадратично. Начая с пустого множества искомых простых чисел, можно наполнять его неограниченно. П Упражнения 1. Доказать, что существует бесконечно много простых модулей р, по которым 2 — неквадратичный вычет, не используя символа Якоби.
Глава 8 Гауссовы суммы 8.1 Простейшие гауссовы суммы Количество квадратичных ненулевых вычетов по простому модулю р равно количеству неквадратичных вычетов. Поэтому сумма всех символов Лежандра равна нулю. Кроме того, сумма всех корней степени р из единицы равна нулю. На этих двух простых фактах основывается теория гауссовых сумм. Гауссовой суммой та, а Е Ъ называется сумма YaZq (p)e°fc> гДе е — cos 2тг/р + i sin 2тг/р. Очевидно, что для нижнего индекса важно лишь, к какому классу вычетов по модулю р принадлежит число а. Если а = О, то получается сумма всех символов Лежандра: т0 = 0. Заметим, что все суммы выражаются через одну: та = (^)п. В самом деле, умножим это равенство на (£) : (^)та = т\. Однако При умножении на ненулевой вычет а вычеты переставляются местами. Поэтому при переходе к новому индексу суммирования t = ak всего лишь Меняется порядок суммирования. Теорема. т\ = (-1)^-1^2р. Доказательство. О Подсчитаем сумму Х)а=о тат-а двумя способами.
138 ГЛАВА 8. ГАУССОВЫ СУММЫ Сначала выразим все гауссовы суммы через первую: (к /£ () - и* a=Q Можно раскрыть каждую гауссову сумму, исходя из определения: Р— 1 р—1 f v р—1 / Ч Р—1 р-1 р-1 , v u,v=0 Ч i р-1 / j^1 р1 ■ Е (= а=0 Здесь мы воспользовались тем, что £а=о £a(u~v) = SUiVp, где если ифь\ если и = v. Значит (-1)(Р-^/2(р- l)^2 = (р- 1)р. D Из доказанной теоремы вытекает, что гауссова сумма т\ равна или ±<</р£, в зависимости от того, какой вид имеет число р — 4п + 1 или An - 1. Возникает вопрос о том, какой знак нужно выбрать — плюс или минус. Этот вопрос занимал К.Ф. Гаусса целый год, пока он не нашел решение. Оказывается всегда нужно выбирать плюс, гауссова сумма равна у/р или у/pi. Мы не станем здесь этого доказывать. Гауссовы суммы дают еще одно доказательство закона взаимности Для этого придется оперировать с числами вида хо + х\Е + х^е2 + ... + Яр-2£р~2, где Х{ € Z. Оказывается, что они единственным образом представляются в таком виде. Мы докажем это в главе 10. При этом сумма разность и произведение двух таких чисел имеют нужный вид. Для доказательства последнего можно понижать степени е при помощи равенства ер~1 = -ер~2 — ... — е — 1. Мы рассмотрим сравнения в множестве таких чисел. Рассмотрим произвольное нечетное простое число q. Тогда mod q. С другой стороны, эту степень суммы можно раскрыть по полиномиальной формуле. Отметим, что коэффициенты 8о\$1^3—-j делятся на простое
8.2. ЧИСЛО РЕШЕНИЙ СРАВНЕНИЯ 139 число q. Так что, после приведения по модулю q в сумме останутся только q-e степени отдельных слагаемых: k=Q Значит имеет место равенство; где а — комплексное число, указанного выше вида. Воспользуемся однозначностью представления таких чисел. Приравнивая целые числа — коэффициенты при одинаковых степенях £, получим, что а = 0 и (а) = 8-2 Число решений сравнения Задача. Вычислить число решений сравнения х2 + у2 = 0 mod р, где p = 4fc+l. D Метод подсчета состоит в том, чтобы представить N — число решений — в виде: о+6=б где N(...) — число решений сравнения Мы попросту представили правую часть в виде суммы двух слагаемых. Теперь можно предложить формулу для числа решений: N(z2 = с) = 1 + (|). Подставим ее в исходную формулу:  К))К)ь а+Ь=О а+6=0 Подставим: Ь — -а, 0 < а < р - 1. Первое слагаемое даст р. Второе и третье слагаемые дадут сумму всех символов Лежандра — 0. Четвертое слагаемое даст сумму:
140 ГЛАВА 8. ГАУССОВЫ СУММЫ Получаем ответ: N = р + (—1)^"*1^2(р— 1). Для р = Ак — 1 получаем одно решение. Это, конечно, точка (0,0). Для р = 4к +1 получается всего 2р — 1 решение. Немного усложним задачу. Пусть в правой части вместо нуля стоит единица, получим уравнение «окружности»: х2 + у2 = Т. Можно сказать, что мы подсчитываем количество точек конечной «окружности» в Z/p. N= Y, Щ )Щу) а+Ь=1 Первое слагаемое даст р. Второе и третье слагаемые дадут сумму всех символов Лежандра — 0. Четвертое слагаемое даст сумму при я = 0,1 получаются нулевые члены у этой суммы, вычет квадратичен тогда и только тогда, когда обратный к нему вычет — квадратичен. Заметим, что t = а\ — а принимает все значения от 1 до р — 2. Действительно, выразим а через t: Получилось взаимно однозначное соответствие между ненулевыми вычетами t и а, причем а ф 1, t ф — 1. В четвертой сумме отсутствует только один символ Лежандра — (—). Значит она равна — {—). Получаем ответ: N = P-(f).a Хотелось бы обобщить этот пример на более высокие степени переменных. Задача. Найти число решений урравнения х3 + у2 = 1 в Z/p, где р — простое вида 6fc + 1. Замечание. Для простых р = 6fc - 1 имеется ровно р решений. Строятся они следующим образом: по кчждому у из уравнения х3 = 1 - у2 находится ровно один х (так так НОД(р - 1,3) = 1). Рассуждая точно так же, можно доказать, что уравнение хс + F{y,... , z) = 0 с п переменными имеет ровно рп~1 решений, если переменная х не входит в F и
8.2. ЧИСЛО РЕШЕНИЙ СРАВНЕНИЯ 141 НОД(р - 1,с) = 1. Будем считать этот случай тривиальным. Сосредоточим внимание на противоположном случае. D Совершенно аналогично предьщущему получим формулу для числа решений: N = Y,a+b=TN(x3 = a)N(y2 = b)- Для содержательных вычислений нужно найти формулу для числа решений уравнения х3 = а в Z/p. Напомним, что все ненулевые вычеты выражаются через примитивный вычет: Z/p = {0,1,и,п2,... ^и?'2}. Обозначим через А функцию Z/p ->- s/Iu {0} = {0, l,u;,u>2}. Пусть А(0) = 0, А(п*) = шь. Эта функция аналогична символу Лежандра для кубических сравнений. Ненулевой вычет а является кубическим тогда и только тогда, когда \{а) = 1. Кроме того, имеет место формула X(ab) = А(а)А(Ь). Такими же свойствами обладает и любая степень этой функции. Заметим, что степени дают еще только две новые функции — А2 и А3. Последняя функция на всех ненулевых вычетах равна единице, а на нулевом вычете она равна нулю. Ее заменяют на тождественно равную единице на всех вычетах функцию. Сумма трех этих функций дает число решений уравнения х3 = а. Если ненулевой вычет а — кубический, то для р = 6А; + 1 НОД(р-1,3) = 3, и ровно три решения имеет уравнение х3 = а. Для некубического вычета сумма трех функций принимает значение 1 + ш+ш2 = 0. Для нулевого вычета есть только одно решение этого уравнения — нулевой вычет. Именно для учета этого случая пришлось переопределить функцию А3. Так что формула для числа решений исходного уравнения принимает следующий вид: N = а+Ь=1 а+5=Т Получилось пять сумм, соответствующих каждому из слагаемых. Первая сумма равна р. Вторая, третья и четвертая суммы равны нулю. Действительно, ровно на 2к вычетах функции А и А2 принимают значения — 1, шиш2. Осталось вычислить сумму 5 = ^lJ(A(a) + A2(a))(^p). Если в первую скобку добавить слагаемое 1, то получится сумма 5 = () a=0 ч у ' а=0 \ У / a^O-кубический Однако утроенную сумму по всем кубическим вычетам можно заменить на сумму по всем кубам вычетов — каждый ненулевой куб встретится
142 ГЛАВА 8. ГАУССОВЫ СУММЫ три раза. Получим сумму: 8=0 Последняя сумма содержит ровно р - 3 ненулевых слагаемых, которые равны ±1 (единица представляется кубом ровно трех вычетов, поэтому ровно трое слагаемых равны нулю). Достаточно найти это число по модулю р. Воспользуемся критерием Эйлера: 5 = Wi_o3Up-l)/2 _ i_l\^i_o3Up-1)/2 = ц_\^ V^ f_nM 2 £-l "i>< s=l Последняя стоящая в скобках сумма не делится на р только для t = 0 и t = (р — 1)/3 = 2А;. Получаем сравнение: Количество решений исходного уравнения равно iV = p -h 5, где 5 = - (3ЛЛ) mod р и это число представляется в виде суммы р - 3 ненулевых символов Лежандра. D Пример, р = 19. DS = -^44 н"84 = П mod 19" 1 ■ Z • о Значит 5 = — 8 или 5=11. Однако второй случай отметается потому, что это число представляется в виде суммы р - 3 = 16 слагаемых , которые равны ±1. Если из них 11 равны 1, то оставшиеся пять не могут в сумме дать ноль. Значит, всего имеется 11 решений. □ Задача. Найти число решений уравнения хА + у2 = f в Z/p, где р — простое число. П Интересным здесь будет случай р = 4к 4- 1. Число решений можно представить в виде: а+Ь=Т
8.2. ЧИСЛО РЕШЕНИЙ СРАВНЕНИЯ 143 Для уравнения х4 = а можно предложить аналог символа Лежандра — функцию А : Ъ/р -> {0,-1, l,t,-t}. Положим: А(и') = г*, А(0) = 0, где п примитивный вычет по модулю р. Заметим, что А2(а) = (-). Как и в предыдущем случае, имеет место равенство: N{xA = а) = 1 + А(а) + А2(о) + А3(а). Значит число решений можно записать в следующем виде: N = £ (1 + Х(а) +(£)+ А3(а))(1 + Q) = 0+6=1 Первая сумма равна р. Каждое значение функции А на ненулевых вычетах принимается одинаковое количество раз (к раз). Поэтому сумма всех значений функции А равна к(1 + i — 1 — г) = 0. Значение А3(а) получается при помощи комплексного сопряжения к значению А (а). Поэтому сумма всех значений функции А3 равна нулю. Так что ненулевыми могут быть только первая, последняя и предпоследняя суммы. Предпоследнюю сумму мы уже вычисляли — она равна —{-j) = — 1. Для вычисления последней суммы заметим, что для а = и2з+1 левая скобка в ней представляет собой сумму чисел г и —г. Так что в сумме остаются лишь члены соответствующие квадратичным вычетам. Все квадратичные ненулевые вычеты мож- —2 —2 2 но представить в виде: 1 ,2 ,... ,(р-1)/2 . Поэтому последнюю сумму можно записать в виде: В силу того что (~) = +1, имеет место равенство: Значит последнюю сумму можно записать в виде: 5 = J2t=i (*7Г" сумма имеет р - 3 ненулевых члена. Для ее вычисления по модулю р
144 ГЛАВА 8. ГАУССОВЫ СУММЫ воспользуемся критерием Эйлера: t=rl Я=0 ^ ' 8=0 \* ' t=l >6*~2s Однако сумму одинаковых степеней всех вычетов мы уже вычисляли. В этом случае она будет отлична от нуля лишь при s = к. Получаем 5 = (-1)*(2Л*)(-1) = (-1)*+1(2Л*). Итак, мы получили ответ: N = р - 1 + 5, где S представляет собой сумму из р - 3 членов, которые равны ±1. При этом число S сравнимо с числом (-1)*+1 (2^) по модулю р.О Пример, р = 29, к = 7. D Тогда Ь = (1} 2-3-4-5-6-7 = 13-11-24= 143 - 24 = (-2) • (-5) = 10 mod 29. Заметим, что 5 ф -19. В самом деле, если из 26 символов Лежандра 19 равны -1, то из суммы оставшихся семи не получится ноль. Значит, 5 = 10, ЛГ = 38.О Можно попробовать найти число решений уравнения я3 + у3 = 1 в Z/p, где р = 6к + 1. ЛГ= 53 N(**=a)N(y* = b)= £ (1 + А(а) + А2(а))(1 +А(Ь) + Л2(6)) = а+Ь=Г а+6=Г 1 + А(о) + Х(Ь) + А2 (а) + А2(Ь) + \(аЬ) + А2(аЬ) + А(а)А2(Ь) + А2(а)А(Ь). Первая сумма равна р. Вторая, третья, четвертая и пятая суммы равны нулю. Легко вычисляются также последние две суммы. Заметим, что А2(6) = X~l(b) = A(6-1) для ненулевого вычета Ь. Значит Х>(5)А2(Т^) = ^ГАСаТ^Г1) = £а(?) = -A(F=1) = -1. а=2 а=2^ *=1 Мы в точности повторили аналогичные рассуждения для символа Лежандра и воспользовались тем, что р — 1 — кубический вычет. Последняя сумма вычисляется точно так же. Осталось подсчитать сумму а+Ь=1
8.3. ОБЩИЕ СУММЫ ГАУССА И ЯКОБИ 145 В силу комплексной сопряженнности слагаемых X2(ab) и А(аЬ), эту сумму можно переписать в виде 5 = 2Де(£а+ь=т Х(аЬ)). Сумма, от которой берется удвоенная действительная часть, называется суммой Якоби. Эти суммы изучаются в следующей секции. Пока мы можем дать ответ в виде: 8.3 Общие суммы Гаусса и Якоби В предыдущей секции мы рассмотрели конкретные примеры вычислений, связанных с характерами и суммами Якоби. Пусть р — простое число. Характерами по модулю р называются степени функции х : Z/p -> Р~УГ U {0}, которая определяется формулами: х(0) = 0, хФ*) = *?*> гДе и — примитивный вычет по модулю р, т} = cos-^~ + «sin-j^y. Для любого характера значение на единичном вычете равно единице. Кроме того значение характера на произведении вычгтоп равно произведению значений. При этом характер х° называют единичным — он равен единице на всех ненулепых вычетах. Для удобства вычислений его переопределяют на нулевом мычете — кладут равным единице, а не нулю. Это связано с определением значения нулевого вычета в нулевой степени. Как мы уже убедились на примерах вычислений числа решений сравнений, формула 0 = Т (жазывается удобной. Легко подсчитать сумму всех значений ха- рактгра. Если это был единичный характер, то эта сумма равна р. Для неединичного характера эта сумма равна нулю: Подсчитаем также сумму значений всех характеров на одном вычете. Если это был нулевой вычет, то сумма равна единице. Если это был единичный вычет, то сумма равна р — 1. Для всех остальных вычетов эта сумма равна нулю: Р-2 р-2 n(p-l)t 1 Заметим, что символ Лежандра — это характер: (|) = Х(р~1)/2(а)- ДлЯ других примеров характеров из предыдущей секции также можно найти соответствующие им степени.
146 ГЛАВА 8. ГАУССОВЫ СУММЫ Для любых двух характеров Ai и Х2 можно определить сумму Якоби: J(AbA2)= £ \г(а)-\2(Ь). а+Ь=Т Гауссовы суммы также можно определить для любого характера А: р-1 t=0 где е равно cos 27г/р + г sin 2тг/р. Легко заметить, что то(А) = 0 для неединичного характера А. Кроме того та(х°) = 0 для не делящегося на р числа а и то(х°) = Р- Все гауссовы суммы с данным неединичным характером выражаются через одну: та(\) = А (а) • Ti(A). Доказательство здесь такое же, как для случая сумм с символом Лежандра. Для а = 1 станем опускать этот индекс из записи гауссовой суммы. Кроме того прямым обобщением получается теорема о том, что модуль гауссовой суммы равен у/р. Теорема. Для неединичного характера А имеет место равенство: г(А)т(А) = А(-1)р. Доказательство. D Вычислим сумму выражений та(А)т_а(А) по всем вычетам а двумя способами. Сначала выразим их через т(А) : _ (А)т_а(А) = £ А(а)А(-а)т(А)т(А) = А(-1)(р- 1)т(А)г(А). а=0 а=1 С другой стороны, можно воспользоваться определением гауссовой суммы: а=0 5=0 t=0 а=0 e=01=0 \(8)Щб.лР = 52Ч'Шр = (р- !)р- я,*=0 о=0 stt=O s=l Приравняв два этих результата и заметив, что А(—1) = ±1, получим доказываемое утверждение. D
8.3. ОБЩИЕ СУММЫ ГАУССА И ЯКОБИ 147 Заметим, что г (Л) = А(-1)т(А). В самом деле, можно записать: р-1р-1 т(А) = Отсюда немедленно получаем: г(А)г(Л) = р =Ф |г(А)| = у/р. Теорема. Пусть для двух характеров Ai и А2 выполняется неравенство: AiA2 Ф х0' Тогда имеет место равенство: T(Ai)r(A2) = J(Ai, A2)r(Ai A2). Доказательство. П Перемножим две суммы Гаусса: 5=0 £=0 m=0 e+i=m Сначала заметим, что внутренняя сумма, соответствующая m = 0, равна нулю: i ()() 2()£ xAaW = 0. s=0 я=0 Оставшиеся внутренние суммы легко выразить через сумму Якоби. Для этого будем считать параметры суммирования вычетами по модулю р. По этому модулю вычет m обратим. Поэтому можно найти однозначное представление: 5 = s'm и 7, = t'm. A1(7m)A2(?m) = A1A2(m) £ ^(^АгЮ = AiA2(m)J(AbA2). 7m+Fm=m e'+fc'=l Исходное произведение можно переписать в следующем виде: A,) = r(A1A2)J(AbA2).D m=l Если один из характеров — единичный, а другой — неединичный, то соответствующая им сумма Якоби равна нулю. Кроме того, J(x°, Х°) = Р< Если два неединичных характера комплексно сопряжены друг другую то соответствующая им сумма Якоби равна р - 1. Из последних двух теорем следует, что модуль суммы Якоби двух неединичных несопряженнных друг другу характеров равен yjp. Следствие. Для произвольного характера А = хт имеет место равенство: rd(A) = J(A, A) J(A2, A)... d2
148 ГЛАВА 8. ГАУССОВЫ СУММЫ Здесь d = ношш1 -i^ — наименьшая натуральная степень, в которой А равен единичному характеру. Доказательство. D Согласно двум приведенным выше теоремам имеют место равенства: rrf"2(A) -т2(А) = rd"2(A) -t(A2)J(A,A) = т*-3(А) • r(A3)J(A2,A)J(A,A) = = ... = т(А) • rfA"-1)J(Ap~2, A)... J(\2, A)J(A, A) = В самом деле, Ap-1 = А.П Теорема. Пусть число т имеет вид: т = 2apip2 .. -Pk, где р8, 1 < s < к различные простые числа Ферма (то есть числа вида 22 + 1). Тогда правильный m-угольник можно построить циркулем и линейкой. Доказательство. □ Достаточно построить правильный р-угольник, где р — простое число вида р = 22 +1. Если число сторон является произведением двух взаимно простых чисел mi и тг, то линейное представление их наибольшего общего делителя единицы — ит\ + vm<i = 1 — дает возможность построить угол т2^2 через углы ^ и ^ : 2тг 2тг 2тг = и • h V • . 77&1Ш2 Ш2 Рассмотрим сумму по всем характерам по модулю р: £ Ф) = Е Е А(п)£П = Е е"(Е AW) = 1+(р - i)e. Л Л n=^0 n=0 A Эта сумма легко вычисляется — благо, что мы заранее подсчитали сумму значений характеров на каждом вычете. Нам нужно найти формулу для е или для cos^jp, использующую лишь четыре действия арифметики и извлечения квадратных корней (комплексные или арифметические корни — безразлично, так как мы ранее (см. задачу из секции 1 главы 3) выразили комплексные корни от комплексных чисел от арифметические). Формула для суммы всех гауссовых сумм показывает, что мы добьемся нужного, если выразим через рациональные числа при помощи указанных операций все гауссовы суммы. Однако согласно доказанному выше следствию, для некоторого делителя d = 2Ь числа р - 1 = 22 для характера А имеет место формула: rd(X) = J(A,A)J(A2,A)... J(Arf-2,A)A(-l)p.
8.3. ОБЩИЕ СУММЫ ГАУССА И ЯКОБИ 149 Однако сумма Якоби выражается через число ц = cos Щ- + sin ~г, действительная и мнимая части которого легко выражаются через указанные операции. Так что мы получили практический метод построения числа cos 2тг/р. D Известны лишь пять простых чисел Ферма: 3,5,17,257,65537. Они соответствуют t = 0,1,2,3,4. Леонард Эйлер заметил, что следующее число Ферма 232+1 делится на 641. В самом деле, 641=54+24 = 5-27+1. Поэтому имеют место сравнения: 54 = -24 mod 641, 5 • 27 =-1 mod 641. Возведем второе из них в четвертую степень: 54 • 228 = 1 mod 641. Заменив первый множитель из левой части при помощи первого сравнения, получим сравнение: —24 • 228 = -232 = 1 mod 641. Оно эквивалентно сравнению: 232 + 1 = 0 mod 641. Несложно проверить равенство: 232 + 1 = 641 • 6700417. Следующее число Ферма также составное: 264 + 1 = 274177-67280421310721. Все последующие проверки чисел Ферма на простоту давали отрицательный результат. Возможно, что других простых чисел Ферма не существует. Если это так, то наша теорема состоит в том, что можно построить 257-угольник и 65537-угольник. При помощи приведенного метода можно попытаться найти формулу для cos 27г/257, аналогичную приведенной в секции 2 главы 10 формуле для cos2tt/17. Задача. Вычислть число решений уравнения х3 4- уг = 1 в Ъ/р для р = 6*+1. П В предыдущей секции мы свели эту задачу к нахождению числа 5 = 2Де J(A, А), где характер А имеет вид А = \2к- Нам известен модуль суммы Якоби: |J(A,A)|2 = р. Пусть J(A,A) = а 4- Ьш, тогда это равенство можно переписать в виде а2 — аЬ + Ь2 = р. Если бы число р однозначно представлялось в таком виде, то из этого представления можно было найти 5 = 2а — Ь. Однако существует несколько представлений такого вида. Исходное представление выделяется следующими свойствами: а = —1 mod 3, b = 0 mod 3. Для доказательства этих свойств рассматривают куб гауссовой суммы: т3(А) = (]Г X(s)esf = £ А3(ф3* = jy* = -1 mod 3. 5=1 *=1 S=l С другой стороны, г3 (А) = J(A,A)p = J(A, A) mod 3. Значит, J(A,A) = — 1 mod 3. Совершенно аналогично получим: J(A, A) = J(A,A) = —I mod
150 ГЛАВА 8, ГАУССОВЫ СУММЫ 3. Итак, получены два сравнения: а + Ьш = — 1 mod 3, а + Ьш = -1 mod 3. Вычтя из первого второе, получим: Ьу/^3 = 0 mod 3. Возводя его в квадрат, получим: —ЗЬ2 = 0 mod 9. В отличие от приведенных выше это — сравнение целых чисел, предыдущие сравнения проводились среди целых алгебраических чисел (см. главу 10). Из этого сравнения следует, что число Ь делится на три. Значит, а = — 1 mod 3. Этими условиями числа а и b определяются однозначно, это представление можно использовать для нахождения числа 5 = 2а — Ь = 1 mod 3. Однако лучше поступить по-другому. Заметим, что (2а - Ь)2 + ЗЬ2 = 4р. Пусть b = ЗВ, тогда 4р = S2 + 27В2. Это единственное представление, если потребовать: 5=1 mod 3, В > 0. Поэтому его можно использовать для нахождения числа S.D Примеры. 1)р = 61; 2)р = 67. Для 1) используем равенство: 4-61 = 244 = 1 + 35 = 12 + 27-32. Значит 5 = 1, ЛГ = 61-2 + 1 = 60. Для 2) используем равенство: 4 • 67 = 268 = 52 + 27 • З2. Значит 5 = -5, N = 67 — 2 - 5 = 60. Обращаем внимание на то, что в последнем случае 5 < 0. Изложенная выше теория позволяет строить неожиданные тригонометрические тождества. Примеры тождеств. Рассмотрим величину гауссовой суммы с характером — символом Ле- жандра. Добавим к ней сумму всех корней р-й степени из единицы. f=o ^у е=о t=o Рассмотрим отдельно случай р = 4к 4-1 от случая р = 4fc — 1. Если р = 4А: + 1, то гауссова сумма — действительное число. Значит последняя сумма представляет собой сумму косинусов: п су 1 + cos I2 + cos 22 + :.. + cos 27гр • (р - I)2 = Jp. р р
8.3. ОБЩИЕ СУММЫ ГАУССА И ЯКОБИ 151 Если р = 4fc — 1, то гауссова сумма — чисто мнимое число. Значит последняя сумма представляет собой сумму синусов, умноженных на мнимую единицу. Имеет место равенство: 2тг « . 27Г л9 . 2тг , _0 _ sin I2 + sin 22 + ... + sin (р - I)2 = Jp. Р Р Р Пусть р = 6А;4-1. Рассмотрим величину г (А) + т(А2), где А = x2fc- Если к ней добавить сумму всех корней р-й степени из единицы, то получится сумма: a v = Е ^*3=*)£t = Е£l3- Заметим, что А2 = А и г (А2) = т(А). Поэтому исходная величина — действительное число. Она равна сумме 27г _ .* 2тг Ло 2тг . vo z = 1 + cos I3 + cos 23 + ... + cos (p - I)3. P P P Для величины z можно составить кубическое уравнение. В самом деле, z3 = г3(А) + г3 (А) + 3r(A)r(A)(r(A) + т(А)) = J(A, А)р + J(A, А)р + pz = 2Де J(A, А)р + pz = рг + Sp. Дискриминант этого кубического уравнения имеет вид Д = р2(52/4 - р/27) и может быть как положительным, так отрицательным (достаточно рассмотреть разобранные выше примеры р = 61 и р = 67). Выпишем явно тригонометрическое равенство, которое получается при р = 67 : 2тг •* 2тг _i 27Г _ * 1 + cos — ■ I3 + cos — • 23 + ... + cos — • 663 =
Глава 9 Симметрические многочлены 9.1 Перестановки Перестановки множества п = {1,2,... , п} были определены в главе 2 как взаимно однозначные отображения п ->• п. Можно рассмотреть композицию двух перестановок а и /3 как функций. Композиция а/3 будет взаимно однозначным отображением, то есть перестановкой. Станем ее называть произведением этих перестановок. Для быстрого нахождения произведения перестановок используют запись перестановки в виде таблицы из двух строчек длины п. В верхней строке по порядку стоят натуральные числа от 1 до п. Под каждым из этих чисел стоит значение перестановки на этом числе. Для нахождения произведения а/3 нужно в верхней строчке перестановки а найти число 0(г) и поставить число, которое стоит под ним, под число г в новой перестановке. Для того чтобы научиться этому, лучше всего разобрать пример. Пример. /1 2345678 9\/1 2345678 9\ V3 2714895 б Д7 5641293 8,/ ~ 1 2345678 9\ 9 4813267 5,/
154 ГЛАВА 9. СИММЕТРИЧЕСКИЕ МНОГОЧЛЕНЫ Заметим, что мы начинаем искать число стоящее под числом i в перестановке, являющейся произведением, с перестановки, стоящей справа, то есть двигаемся справа налево. Возникает вопрос об удобной записи перестановок. Станем обозначать в виде (u,i2,- • • ,ik) перестановку, переводящую стоящие в скобках элементы по кругу друг в друга справа налево: *i •-» t*2i »2 *-> *з> • • • *fc *"* *ь Оставшиеся элементы множества п эта перестановка оставляет на месте. Ее называют циклом длины к. Существует ровно к записей цикла длины А; — на первое место можно поставить любой элемент цикла. Циклы, имеющие непересекающиеся множества переставляемых элементов, называются непересекающимися. Всякую перестановку можно разложить в произведение непересекающихся циклов. Для этого находят тот элемент, в который переходит единица, затем тот элемент, в который переходит указанный элемент, и так далее. После того как первый цикл замкнется, из оставшихся элементов выбирают наименьший и находят содержащий его цикл аналогичным образом. Процесс выделения новых циклов закончится за конечное число шагов, так как имеется всего конечное число элементов. Примеры. □ Приведенные выше три перестановки раскладываются на непересекающиеся циклы следующим образом: Л 2 3 4 5 6 7 8 9\ (,32714895 6J = 1 2 3 4 5 6 7 8 9 ,75641293 /12 3 4 5 6 7 8 9\ \9 4 8 1 3 2 6 7 Ъ) Заметим, что при разложении могут появляться циклы единичной длины. Они соответствуют элементам, которые остаются на месте — переходят в себя. Перестановка, которая соответствует тождественному отображению и оставляет на месте все символы, называется единичной перестановкой и обозначается через е. Разность, между п — числом всех символов и I — числом всех циклов называют декрементом перестановки а и обозначают через d(a) = п — /. Четностью перестановки называют четность ее декремента.
9Л. ПЕРЕСТАНОВКИ 155 Например, из приведенных выше две перестановки четные, а одна — нечетная. Знаком sgn(a) перестановки а называют число (—l)d^QK Заметим, что при умножении перестановки нельзя переставлять местами: а/3 ф &а. Однако непересекающиеся циклы можно расставлять как заблагорассудится. В самом деле, они переставляют разные группы символов. Выясним, что получится, если перемножить два цикла, множества символов которых пересекаются ровно по одному элементу. Легко проверить, что при перемножении этих циклов получается один цикл, а множества переставляемых символов объединяются: (*1<2 • • • tjb)(tjfcJ2J3 • - Зт) = (tll2 • • -ikJ2 • • • jm)- Если длины циклов были к и ш, то длина произведения равна к + т — 1. Циклы длины два принято называть транспозициями. Произведение двух транспозиций с одним общим элементов дает тройной цикл: (ij)(js) = (ijs). Любой цикл длины к раскладывается в произведение к — 1 транспозиции: («1*2 ...**) = (11»2)(Ыз) • • • (tjb-ltJb). Пусть перестановка а раскладывается в произведение непересекающихся циклов длин к\, &2, • - - > к(- Тогда, разложив каждый из этих циклов в произведение транспозиций, мы получим разложение перестановки в произведение *i-l + fe-l + ... + *j-l = (*i+*2 + ... + fc|)-/ = n-/ = d(a) транспозиций. Мы получили практический способ разложения любой перестановки в произведение транспозиций. При этом используется самое большее п -1 транспозиция, когда перестановка представляет собой цикл длины п. Теорема. Для произвольного разложения перестановки а в произведение транспозиций используется всего d(a) + 2t транспозиций, где t — целое неотрицательное число, зависящее от разложения. Таким образом, при стандартном разложении используется наименьшее число транспозиций. Доказательство. П Пусть имеется разложение перестановки а в произведение транспозиций: а = (ikjk)(ik-ijk-i) • • • (*iii)* Станем последовательно умножать справа эту перестановку на транспозиции {i9j3)} 1 <
156 ГЛАВА 9. СИММЕТРИЧЕСКИЕ МНОГОЧЛЕНЫ s < к. При умножении на саму себя транспозиция превращается в единичную перестановку: (i«je)(bj*) = e. В результате получится последовательность перестановок: a,a(iiji),a(»iji)(»2i2), •-• }<*(tiji) ••. {ikjk) = е. Положим: а8 = as-i(isjs) — {ikjk) • • ■ (^s+ijs+i) Эта последовательность начинается перестановкой а, заканчивается единичной перестановкой. При этом она состоит из к + 1 члена. Можно считать, что a = ao- Лемма. d(as) = d(a5_i) ± 1. Доказательство. D Рассмотрим два случая: 1) при разложении перестановки as-i на непересекающиеся циклы числа г8 и j8 попадают в один цикл; 2) эти числа попадают в разные циклы. Найдём произведения: ... ua-ijs)(isjs) = (uiu2 ... ur-ii9){ur+i... Ua-i (uiu2 ... tie_ii,)(t;iV2 ■ • • vb-ijs)(isjs) = (^1^2 .. • ua-iisviv2 • ■ • «ь-i В первом случае один цикл распадается на два. Во втором случае два цикла склеиваются в один. В любом случае, количество циклов изменяется на единицу. □ Декременты перестановок из указанной последовательности образуют числовую последовательность, которая начинается числом d(a) и оканчивается нулем. На каждом шаге число изменяется на единицу. Шагов всего к штук. Они содержат d(a) шагов, понижающих число на единицу. Оставшиеся шаги делятся на равное количество повышающих и понижающих на единицу шагов. Пусть это количество равно t. Тогда имеет место равенство: к = d(a) + 2t. □ Следствие. sgn(a/3) = sgn(a)sgn(/3). Доказательство. П Согласно доказанной теореме, для вычисления знака перестановки можно использовать любое разложение в произведение транспозиций. Перемножив такие разложения для перестановок а и /?, получим разложение для их -произведения. D Перестановку, которая соответствует обратному отображению, называют обратной к данной перестановке а перестановкой и обозначают через а"1. Их произведение в любом порядке равно единичной перестановке. Как можно заметить из доказательства теоремы, разложение в произведение транспозиций для перестановки а"1 получается из разложения перестановки а переписыванием его в обратном порядке. Отсюда следует,
9.1. ПЕРЕСТАНОВКИ 157 что знаки взаимно обратных перестановок совпадают. Впрочем, это непосредственно следует из следствия к теореме. Казалось бы вычисление знака перестановки — легкая задача, и никаких новых методов для ее решения не требуется. Однако следующий пример опровергает это заключение. Пример. Нижняя строчка перестановки а в ее табличной записи получается выписыванием в порядке возрастания сначала всех четных чисел, а затем всех нечетных чисел, от 1 до п. Вычислить sgn(a)> D Попытка разложить эту перестановку на непересекающиеся циклы тонет в исследовании различных частных случаев. Требуются новые методы нахождения знака. Назовем инверсией пару чисел 1 < г < j < п таких, что а(г) > a(j). Число всех инверсий обозначается через /(а). Подсчитаем число инверсий в нашем примере. Для этого будем последовательно слева направо рассматривать числа, стоящие в нижней строчке перестановки а, и подсчитывать сколько меньших чем данное чисел стоит правее него. Двойка даст одно число (единицу), четверка даст два числа (единицу и тройку), и так далее ... число 25 даст s чисел (1,2,... ,s). Все нечетные числа не дадут ничего. Если п = 2к или п = 2к +1, то общее число инверсий дается формулой: 1(а) = 1 + 2 + ... + к = Щ±*1 # Общая формула для обоих случаев получается, если подставить в полученную формулу: fe = [п/2\. Для любой перестановки а знак можно подсчитать по формуле: $дп(а) = (-l/^.D Для доказательства формулы для знака разложим перестановку а в произведение 1(а) транспозиций. При этом мы будем использовать в разложении не все транспозиции, а только транспозиции вида (i, г +1). Это разложение опирается "на тождество (a(i)>a(i + 1))а = a(i,i + 1). Как легко видеть в левой части стоит перестановка, которая отличается от перестановки а лишь тем, что в ее нижней строке (при табличном представлении) переставлены местами г-е и (г + 1)-е числа. Мы будем при помощи домножения справа на транспозиции нужного вида переставлять соседние числа в нижней строке, уничтожая при этом всякий раз по одной инверсии. В конце этого процесса не останется ни одной инверсии, перестановка превратится единичную перестановку. При этом, единичная перестановка запишется в виде произведения перестановки а и дописанной справа композиции 1(а) транспозиций указанного вида. Значит эта композиция — обратная перестановка для а. Отсюда следует, что саму перестановку а можно представить в виде этой композиции, записанной
158 ГЛАВА 9. СИММЕТРИЧЕСКИЕ МНОГОЧЛЕНЫ в обратном порядке. Теперь нужно объяснить, в каком порядке мы будем переставлять числа в нижней строчке перестановки а. Сначала найдем самое большое число п и станем двигать его вправо до тех пор, пока оно не займет крайнего справа места. Затем найдем число п-1и станем его двигать вправо на соседнее с числом п место. Последовательно выбирая все меньшие числа, мы приведем перестановку к единичному виду. Этот алгоритм напоминает известный в программировании способ упорядочивания массивов, называемый методом пузырька. Пример. Разложить на транспозиции перестановку из приведенного выше примера для п = 5,а= (24135)" D Самое большое число — 5 уже стоит на месте. Для того чтобы отправить на место число 4, поменяем второе и третье числа, затем поменяем третье и четвертое. Перестановка а при этом умножится справа на (2,3)(3,4). При этом число 3 автоматически оказывается на своем месте. Для окончания алгоритма нужно поменять местами первое и второе число. Итак, а(2,3)(3,4)(1,2) = е. Значит а = (1,2)(3,4)(2,3). Заметим, что I(a) = 3.D Теорема. Для произвольного разложения перестановки а в произведение транспозиций вида (г, г+1) используется всего I(a) + 2t транспозиций, где t — целое неотрицательное число, зависящее от разложения. Таким образом, при стандартном разложении используется наименьшее число транспозиций вида (г,г + 1). Доказательство. П Пусть имеется произвольное разложение нужного вида: а = TkTk-i .. . п, где rs — транспозиции нужного нам вида. Рассмотрим последовательность перестановок: од = a,as = ots-i^a = Лемма. 1(а8) = 1{а8-\) ± 1. Доказательство. П Пусть т8 = (г, г-hi). Перестановка аа отличается от перестановки a5_i перемещением г-го и (г + 1)-го чисел в нижней строчке. Все инверсии остаются неизменными, за исключением пары г < i + 1- Если эта пара была инверсией, то после перестановки перестала ею быть. Если же эта пара не была инверсией, то после перестановки стала ею. В любом случае число инверсий изменилось ровно на единицу. О Числовая последовательность /(ao),/(ai),... ,/(a*) = /(е) = 0 начинается с /(а), оканчивается нулем и содежит к + 1 член. При этом при переходе к каждому новому члену добавляется или вычетается единица. Значит при этих к переходах /(а) раз вычиталась единица, а при оставшихся переходах ровно в половине случаев добавлялась единица (значит осталось четное число переходов — t штук). D
9Л. ПЕРЕСТАНОВКИ 159 Заметим, что наибольшее число инверсий — (£) — имеет перестановка, у которой в нижней строчке числа стоят по убыванию. Тогда каждая пара г < j является инверсией. Перейдя к транспозициям, которые переставляют соседние числа, мы сократили число перестановок, через произведение которых можно выразить любую перестановку, с (£) до п — 1. Задача. Доказать, что все перестановки можно выразить через всего два цикла — (1,2) и (12... п). □ В самом деле, транспозицию (г, г -Ь 1) можно выразить через эти два цикла по формуле: Это следует из общего тождества: a(ij ... к)а~г = (a(i)a(j)... а(к)).П Перестановку, которая получается из данной умножением слева на перестановку а и умножением справа на обратную к а перестановку, называют сопряженной к данной при помощи перестановки а. Сопряжение цикла дает цикл той же длины. Если цикл длины два, то это тождество эквивалентно следующему: (a(i),a(j))a = a(i, j). Определение* Группой называется множество перестановок, для которых выполняется следующее свойство. Произведение любых двух перестановок из данного множества лежит в данном множестве. Например, множество Sn всех перестановок множества п является группой. Подмножество четных перестановок множества Sn является группой. Эту группу обозначают через Ап. Нечетные перестановки группы не образуют. Задача. Доказать, что \Ап\ = п!/2. □ Нечетных перестановок столько же, сколько четных. В самом деле, умножив каждый элемент множества Ап на транспозицию (1,2), получим все разные нечетные перестановки. Значит нечетных перестановок не меньше чем четных. Совершенно аналогичным образом можно получить, что четных перестановок не меньше чем нечетных. Значит |Л„| = n!/2.D Интересно было бы найти множество перестановок, через произведения которых выражались бы все четные перестановки. Подобные множества называют системой образующих. Одну такую систему можно указать сразу. Это все произведения транспозиций: {(*i, ji)(*2>h)}- Все пары непересекающихся транспозиций можно отбросить, оставив в качестве системы образующих тройные циклы: {(ijk)}. Для всякой такой пары вставим между этими транспозициями
160 ГЛАВА 9. СИММЕТРИЧЕСКИЕ МНОГОЧЛЕНЫ единичную перестановку, записанную в виде: е = (ji»*2)(iii*2)- Так что тройных циклов будет вполне достаточно. Упражнения 1. Пусть перестановка раскладывается в произведение непересекающихся циклов, имеющих длины fci, &2,... , fcj. Доказать, что наименьшая степень, в которой эта перестановка равна единичной, равна НОК(*Ь **,...,*,). 2. Доказать, что множество {(123), (124),... , (12п)} является системой образующих для Ап. 3. Доказать, что знак можно вычислять по формуле: Ч1Л 9.2 Симметрические многочлены Полезно рассматривать перестановки, переставляющие переменные у многочленов. Рассмотрим множество С[#1,Ж2,... ,sn] всех многочленов от п переменных с комплексными переменными. По перестановке a Е Sn и многочлену / Е C[a:i, x2)... , хп] можно определить новый многочлен а/ по формуле: При этом а/?/ = a(0f). Говорят, что перестановки действуют на многочленах. Пример. a=(\\\\)J = хххг 4- х\хА. □ В этом случае а/ = х^х\ + х\х^.и Многочлен при этом изменился. Однако если бы вместо него рассматривали многочлен д = х\ х2+жз^4, многочлен бы не изменился от действия перестановки: ад = д. Можно рассмотреть все перестановки, которые не изменяют многочлен. Они обрадуют группу. Например, квадратный корень из многочлена у/Щ. = n»<?(xt - £j)> который называют дискриминантом, не изменяют все четные перестановки.
9.2. СИММЕТРИЧЕСКИЕ МНОГОЧЛЕНЫ 161 В самом деле, из представление знака через число инверсий можно получить формулу: ay/D^ = sqn(a)y/TJ^. Некоторые многочлены ни одна перестановка не изменяет. Такие многочлены называют симметрическими. Общая теорема Виета дает п штук таких многочленов. Теорема. Пусть xi, х2,... , хп — все корни многочлена хп + aixn~l + ... + ап (с учетом кратностей). Тогда имеют место равенства: О\ = Х\ + Х2 + • • • + Хп = —п\ О2 = Х\Х2 Н- Х\Х-$ + . • • + #n_i£n = U2 ап = xix2..>xn = (-l)nan. Многочлен ex* = xiX2 •. x* + • - называется Ar-м элементарным симметрическим многочленом. Каждое из его (£) слагаемых соответствует к- элементному подмножеству в множестве переменных. О Эта теорема доказывается при помощи раскрытия скобок в произведении (Х - Х\){Х - Х2) • • • (х - Х„).П Элементарные симметрические многочлены занимают особое место среди всех симметрических многочленов. Основная теорема о симметрических многочленах. Для произвольного симметрического многочлена f от п переменных существует ровно один такой многочлен р, что имеет место равенство: f{x\, £2, ■ • • , хп) = Доказательство. D Сначала докажем существование такого многочлена д. Мы предложим алгоритм, при помощи которого выразим / через элементарные симметрические многочлены. Очевидно, что достаточно дать такой алгоритм для выражения суммы одночлена х\1х122... х%£ (ii > *2 > • • • > *п) и всех одночленов, получающихся из него перестановками переменных. Мы поступим следующим образом: выразим эту сумму через элементарные симметрические многочлены и сумму младших (в некотором смысле) по сравнению с данным одночленов. Нужно только объяснить, что значит старшинство среди одночленов указанного вида. Если даны два одночлена — х1^ хг22 ... хг£ и а^1 х^ ... ж£п, то первый ста- ше второго, если i\ > j\. Если у них совпадают все индексы вплоть до 5-го места, то для выяснения старшинства нужно сравнить 5-е индексы. Исходная сумма выражается нужным образом из равенства: 0j &2 • • • °п-1 — Хг Х2 - • • Яп i-....
162 ГЛАВА 9. СИММЕТРИЧЕСКИЕ МНОГОЧЛЕНЫ В правую часть этого равенства входят все одночлены, получающиеся перестановками переменных из исходного одночлена, потому что в левой части стоит симметрический одночлен. Кроме того, все ненаписанные одночлены из правой части этого равенства младше указанного одночлена. Так что выразив исходную сумму из этого равенства, мы сведем ее выражение через элементарные симметрические многочлены к выражению младших одночленов. Таких одночленов конечное число. Поэтому, осуществляя этот прием несколько раз, мы получим нужное представление для многочлена /. Докажем единственность многочлена д от противного. Пусть оказалось два подходящих многочлена — д\ и д2. Тогда их разность — многочлен Л = #1 - </2 тождественно равен нулю как многочлен от переменных xi,X2,... ,хП1 будучи отличен от нуля как многочлен от <ri,<72,... >&п (то есть до выражения «сигм» через «иксы»). По каждому одночлену а™1 а™2. .-сг™п можно определить старший одночлен от «иксов», который получается при раскрытии скобок в этом выражении. Очевидно это — одночлен Выберем среди одночленов с ненулевыми коэффициентами у многочлена Л(<ть02, •. • ,&п) тот одночлен, которому соответствует самый старший одночлен от «иксов». Тогда после раскрытия скобок этому одночлену от «иксов» не с чем будет сократиться. Получено противоречие. □ Заметим, что многочлен д имеет целые коэффициенты, если / имел целые коэффициенты. Рассмотрим примеры применения предложенного в теорема алгоритма. Примеры. Найдем представление через элементарные симметрические сумм одинаковых степеней переменных s* = х\ + х\ + ... + я*. D Нам уже известны выражения для к < 4 : S\ = СГ\ ; 52 = Cf\ - 2(725 $3 = о\ — 3<Ti<72 + З03. Последнее равенство нами доказано только для случая трех переменных. Как мы увидим в дальнейшем этого достаточно для общего случая. Однако применим к этому случаю наш алгоритм. Сначала возведем <У\ в куб: (xi 4- х2 + ... + х„)3 = s ?
9.2. СИММЕТРИЧЕСКИЕ МНОГОЧЛЕНЫ 163 Теперь нужно выразить вторую сумму в правой части через элементарные симметрические многочлены: Подставив выражение для х\%2 в исходную формулу, получим нужное тождество. П Для выражения симметрических многочленов высоких степеней этот алгоритм неудобен. Поэтому он имеет только теоретическое значение. На практике используют метод неопределенных коэффициентов. Продемонстрируем его на примере нахождения формулы для s\. □ Сначала выясним, какие члены содержит эта формула. Она содержит все одночлены от «сигм», которым соответствуют одночлены не старше одночлена х\. Эти одночлены соответствуют следующим одночленам от «иксов» — xfx2, x\x\, х\х2Хъ, х\Х2Хъх±. Значит это следующие одночлены — 0"i<72, <т|> 0"10з> <?4- Старшему одночлену соответствует <tJ, причем он будет входить в формулу с коэффициентом единица. Остальные коэффициенты можно найти, подставляя конкретные числовые значения в формулу: \ \ 1 Для начала подставим х\ = Х2 = 1, жз = • • • = хп = 0. Получим равенство: 2 = 16 + 4ai +a2. Для получения второго равенства подставим х\ = -1, Х2 = 1, х$ = ... = хп = 0. Получим равенство: 2 = аг- Значит а\ = —4. Теперь подставим х\ = Х2 = 1, хз = -1, Х4 = ... = хп = 0 и a?i = ж2 = 1, х3 = Х4 = -1, х5 = ... = хп = 0. Получим равенства: 3 = 1+4 + 2-аз и 4 = 8 + а4. В итоге получилась формула: Заметим, что реально участвовало в расчетах четыре переменные. Аналогично для многочлена к-тл степени в вычислении коэффициентов участвует к штук переменных, так что достаточно получить формулу для многочленов с А: переменными. Приведем общую формулу для выражения многочленов Sk через элементарные симметрические многочлены. Она носит название первой формулы Варинга: (-1)к3к/к = т2 4- . . . + ТПп ~ l)Lma^m, mn а g G mi!m2!...mn!
164 ГЛАВА 9. СИММЕТРИЧЕСКИЕ МНОГОЧЛЕНЫ Пример: п = 5 : Можно представить себе противоположный подход — выражать все симметрические многочлены через s*. Именно так поступал Исаак Ньютон. Он основными считал не элементарные симметрические многочлены, а суммы одинаковых степеней. Можно доказать аналогичную основную теорему. Мы не будем здесь этого делать. Вместо этого приведем формулу, которая выражает элементарные симметрические многочлены через «й- Она носит название второй формулы Варинга: (—1)*<т* = Пример, к = 2,3,4,5. D a3 = s3/3 - .sJ/3 + sxa2 ~ s\/6 - sis2/2 + -s3/3; a4 = 5i/24 - S1S2/4 + Si53/3 + S2/8 - 54/4; = sf/120 - s?52/12 Недостатком выражения симметрических многочленов через многочлены 8k является неайфанение целочисленности коэффициентов. Как мы видели на примере выражения элементарных симметрических многочленов, коэффициенты у нового многочлена могут быть дробными. Станем называть (дробно) рациональной функцией отношение двух многочленов (в некоторых пособиях многочлены называют рациональными функциями, а для последних зарезервировано название дробно-рациона функция). Можно рассматривать симметрические рациональные функции и доказать аналогичную основную теорему о выражении через элементарные симметрические многочлены. Как мы увидим в следующей секции эта теория предпочтительнее в некоторых случаях теории симметрических многочленов, потому что к рациональным функциям можно применять все четыре арифметические операции, включая деление.
9.3. ТЕОРЕМА АБЕЛЯ — РУФИНИ 165 Упражнения 1. Найти рекуррентные формулы для многочленов s*. 2. Вычислить суммы si,s2l... ,5П от корней многочлена: a) хп + (а + Ь)хп'1 + (а2 + аЫ- Ь2)хп~2 + ... + (ап + а^б + ... + Ьп); b) хп + (а + b)*""1 + (а2 + Ь2)хп-2 + ... + {ап + Ьп). 3. Для многочлена ж5 + ах + Ь с корнями хД1 < i < 5) составить уравнение для резольвенты (ххх2 + х2х$ + х3х4 + Ж4Х5 + (Х1Х3 + Х3Х5 + Х5Х2 + Х2Х4 + Х4Х1). Ответ: (у + а)4(у2 + бау + 25а2) + 55Ь4у = 0. 9.3 Теорема Абеля — Руфини Теорема (Руфини, Абель). Не существует формул, которые бы давали решения общего уравнения хп + aixn-1 + ... + an = 0 степени п > 4, если в формулах используются только четыре действия арифметики и извлечение комплексных корней. Доказательство. D Достаточно доказать, что для уравнения пятой степени нет таких формул. Действительно, если бы такие формулы нашлись для общего уравнения 5 + 5-й степени, то мы бы умножили общее уравнение пятой степени на Xs и воспользовались бы этими формулами. Для того чтобы найти доказательство несуществования таких формул, проанализируем, как мы получили эти формулы. Вместилищем всех формул, в которых многократно применяются четыре действия арфметики к коэффициентам общего уравнения n-й степени и произвольным комплексным константам, является множество рациональных функций от переменных а\,а2,... ,an. Оно обозначается через А = C(ai,a2,... ,an)- Его можно считать лежащим во множестве X = С(ж1,а?2,... ,жп) рациональных функций от переменных xi,x2,.-. ,xn в качестве подмножества симметрических функций. Как мы покажем ниже, формулы для решения общего уравнения п-й степени задают цепочку расширяющихся множеств от А до X. Проанализируем решение квадратного уравнения. Корень из дискриминанта представляет собой многочлен от «иксов»: \/а\ — 4а2 = х\ - х2. Мы здесь рассматриваем одно значение корня. Станем обозначать через C(ai, 02,... , an, /1, /2,... 1 Л), где fi € X, множество всех выражений, которые получаются при применении четырех действий арифметики к выражениям, стоящим в скобках, и произвольным комплексным константам.
166 ГЛАВА 9. СИММЕТРИЧЕСКИЕ МНОГОЧЛЕНЫ Говорят, что это множество получается присоединением к симметрическим функциям выражений Л, 1 < i < ■'■ Всякое такое множество лежит в X. Заметим, что C(ai,a2, \Ja\ - 4a2) = C(ai,a2,xi -х2) = C(ai = xl + x2,xi - x2) = C(xbz2) = X. Присоединив к симметрическим функциям корень из дискриминанта, мы получили все рациональные функции, в том числе и сами переменные х\ И Х2. Заметим, что если бы мы присоединили другое значение корня, то получили бы то же самое (эти значения отличаются постоянным множителем). Аналогичная картина получается при анализе решения кубического уравнения. В этом случае множество X из множества А получается в два шага. Сначала присоединяется корень из дискриминанта у/Щ = (xi — х2)(х2 - хз){хг - хз). Затем присоединяется выражение р\ = xi + a;x2 + и2хз- Напомним, что куб этого выражался через коэффициенты исходного уравнения и корень из дискриминанта. Так что мы присоединяем кубический корень из выражения, лежащего в предыдущем множестве. Кроме того произведение р\р2 лежит в А. Поэтому присоединив р\, мы автоматически присоединили и р2 = Xi + u;2x2 + и;хз- Однако C(ai = х\ + х2 + хз, р\, p<i) = X. Так что решение кубического уравнения в радикалах эквивалентно построению цепочки раширяющихся множеств рациональных функций от А до X. Совершенно аналогичная ситуация получается и при решении в радикалах уравнения четвертой степени. Важно отметить, что во всех случаях первое расширение будет присоединением корня из дискриминанта. Лемма. Пусть имеется цепочка расширений А = Хо С Хг С Х2 С ... С Хт = X, каждое расширение в которой получается присоединением одного нового элемента, причем некоторая степень этого элемента лежит в расширяемом множестве. Тогда Xi = C(a2, о2,... , an, у/Щ). Доказательство. D Пусть на первом шаге присоединили элемент /, причем /г Е Л. Заметим, что для любых функций /i и /2 имеют место равенства: a(/i + /2) = a/i + a/2 и a(/i/2) = a/i ■ a/2, для любой перестановки а. Поэтому имеют место равенства: (af)r = a/r = /г. Однако
9.3. ТЕОРЕМА АБЕЛЯ — РУФИНИ 167 из равенства (^)г = 1 следует, что а/и/ отличаются на множитель, который является корнем r-й степени из единицы. Положим: а/ = eQf. Из тождества а/3/ = а(/3/) вытекает равенство £а& = £<*£&• Из последнего равенства немедленно вытекает, что еа = ±1 для любой перестановки а. В самом деле, всякая перестановка раскладывается в произведение транспозиций. Однако равенство е^ = ±1 следует из равенств (ij){ij) = ene2{ij)=e€ = h Теперь нужно выяснить, каким образом выделяются перестановки, для которых корень из единицы равен минус единице. Из тождества a(ij) = (a(i)a(j))a вытекает равенство е^ = е(а(*)ау)). Однако перестановка а может перевести числа г и j в любые другие. Поэтому корни из единицы для всех транспозиций равны одному числу. Если это число единица, то функция / — симметрическая, и никакого расширения на первом шаге не происходит. Значит это число равно минус единице для всех транспозиций. Поэтому а/ = sgn(a)f. Такие функции называют кососимметрическими функциями. Нам уже известен один многочлен, обладающий этим свойством. Это \JTTn — корень из дискриминанта. Легко видеть, что h = -~Lp — симметрическая функция. Поэтому имеет место равенство: Х\ =€(01,02,... ,an>v/#JO = C(oi,o2,... ,an, Для окончания доказательства теоремы достаточно доказать, что при п > 4 в приведенной выше цепочке расширяющихся множеств формул первый шаг будет последним, больше никакое расширение невозможно. Тогда т = 1 и Х\ = А", что невозможно хотя бы потому, что функции из Х\ не изменяются под действием четных перестановок. Однако существуют функции, которые не обладают этим свойством. Например, В этом месте мы должны оговорить важный пробел — лакуну в предлагаемом доказательстве. Мы расширяем множество симметрических функций, последовательно присоединяя радикалы. При решении уравнений степени, не превосходящей четыре, все эти радикалы представлялись многочленами от корней уравнения. Ничто нам не гарантирует, что так будет и дальше, что радикалы из формул, дающих решения, будут представляться элементами множества X, В действительности этот факт можно доказать. Именно в этом и заключается вклад, который внес Абель
168 ГЛАВА 9. СИММЕТРИЧЕСКИЕ МНОГОЧЛЕНЫ в доказательство этой теоремы. Это доказательство имеет технический характер. Поэтому мы не станем его приводить. Докажем, что при п > 4 Х2 = Х\. Доказательство аналогично приведенному в лемме. Пусть Х2 = С(аьа2,... ,ап, у/Щ^д), где gs e Хг. Теперь вместо всех перестановок можно использовать только четные. Поэтому вместо транспозиций нужно рассмотреть тройные циклы, через которые выражается любая четная перестановка. Заметим, что любая пара непересекающихся транспозоций в квадрате равна единичной перестановке: (tiji)(t2i2)(»i.7i)(t2J2) = в. Отсюда следует, что e{ujl){i2h) = ±1. Из этого можно вывести, что для любого тройного цикла £(ijk) = =Ы. При доказательстве этого факта используется неравенство п > 4. Пусть *i)*2»*3j*4,»5 — все разные числа. Тогда для перестановок имеет место равенство: («1*2*3) ' (*3*4)(*1«2) = («2*3*4) • (*4*5)(*1*2) " (*2*з)(*4*5) Из этого равенства получается равенство для корней из единицы, потому что в нем участвовали только четные перестановки. Заметим, что множители £(i2i3i4) и £(j4i3i2) сокращаются: Значит ^(Х1х2*з) — ^l- Для удобства запоминания приведенного тождества для перестановок дадим способ его построения. В тождестве (12345)-(123)-(54321) = (234) нужно разложить на транспозиции все циклы, затем нужно домножить обе части слева и справа на транспозицию (12) и сделать все числа индексами при символе г. Осталось доказать, что все тройные циклы дадут единицу, а не минус единицу. В самом деле, тройной цикл в кубе равен единичной перестановке. Значит корень из единицы, соответствующий тройному циклу, при возведении в куб дает единицу. Так что минус единицей он быть не может. Из разложения произвольной перестановки а в произведение тройных циклов следует, что еа = 1. Получилось, что функция из / не изменяется под действием четных перестановок. Если функция / не изменяется под действием четных перестановок, то ее можно представить в виде / = /i + /г* где /i — симметрическая функция, а /2 — кососимметрическая функция. Положим: /2 = (/ + (12)/)/2
9.3. ТЕОРЕМА АБЕЛЯ — РУФИНИ 169 и /г = (/ — (12)/)/2. В самом деле, при действии на функцию /г четных перестановок, она не изменяется. При действии нечетных перестановок функция / меняет знак. Действительно, всякую четную перестановку а можно представить в виде произведения транспозиции (12) и нечетной перестановки (12)а. Поэтому имеет место равенство: а/2 = (а/ + (12) • (12)а(12)/) = (/ + (12)/)/2 = /2. Аналогичным образом разбираются все остальные случаи. Однако /х + /2 eXi.D Из того, что не существует общих формул для решения уравнений высоких степеней в радикалах, не следует, что не существует вообще таких формул. Математический анализ доставляет нам функции, удовлетворяющие различным тождествам. Может статься, что некоторые из этих тождеств позволят решить уравнения высоких степеней подобно тому, как тождество для косинуса тройного аргумента позволило Виету разобрать неприводимый случай уравнения третьей степени. Это действительно так. Тождества для так называемых тэта-констант позволяют решить общее уравнение произвольной степени. Мы не можем привести в этом курсе это решение, так как в нем проводятся серьезные аналитические исследования функций комплексного аргумента. Это намного превышает уровень доступного для младшекурсников математического анализа.
Глава 10 Поля алгебраических чисел 10.1 Три проблемы древности С древнейших времен задачи на построение циркулем и линейкой считались важным направлением геометрических исследований. Например, построение К.Ф. Гауссом семнадцатиугольника в 1796 году было математическим результатом первостепенной важности. Особое место в этой сфере занимают методы доказательства несуществования построений. Эти методы относятся к алгебре, а не к геометрии. Выделяют три классические проблемы построения, которые невозможно разрешить: 1. построение ребра куба, который имеет объем, вдвое превосходящий объем заданного куба (удвоение куба); 2. деление произвольно заданного угла на три равные части (трисекция угла); 3. построение квадрата равного по площади заданному кругу (квадратура круга).. Мы докажем неразрешимость двух первых проблем, а третью заменим на проблему построения семиугольника. Последняя проблема также имеет древнее происхождение, так как семиугольник был первым по числу сторон многоугольником, который не удавалось построить. Сначала нужно получить критерий возможности построения отрезка заданной длины, если задан отрезок единичной длины. Для этого нужно
172 ГЛАВА 10. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ внимательно проанализировать процесс построения. Прежде всего нужно выделить доступные для нас операции. Это — проведение прямой через две построенные точки и проведение окружности построенного радиуса с центром в построенной точке. Воспользуемся методом координат. Можно выделить начальную точку, провести через нее две перпендикулярные друг другу прямые и отложить на них отрезки произвольной рациональной длины. Таким образом, получатся все точки с рациональными координатами. Теорема. Отрезок длины х можно построить тогда и только тогда, когда число х получается из натуральных чисел при помощи применения четырех арифметических операций и операции извлечения арифметического квадратного корня. Доказательство. □ Сначала докажем достаточность этого условия. Все эти операции можно осуществить при помощи построений циркулем и линейкой, если задан отрезок единичной длины. Соответствующие построения изучаются в элементарной геометрии. Напомним лишь построение отрезка длины у/а по отрезку длины а. Нужно построить окружность радиуса a-hi. Затем нужно отложить перпендикуляр на расстоянии единица от конца диаметра. Окружность высечет на нем отрезок длины 2*/а. Теперь докажем необходимость этого условия. Для этого рассмотрим на плоскости декартовы координаты. Проанализируем, каким образом при построении получаются новые точки. Они получаются в результате пересечения: 1. двух прямых; 2. двух окружностей; 3. прямой и окружности. Найдем координаты точек пересечения при помощи решения соответствующих систем уравнений. Пусть прямая проходит через две точки — (#1 > 2/1), (#2,2/2)1 координаты которых можно построить. Тогда уравнение прямой можно записать в виде: (2/2 - У\)[х - xi) = (х2 - ху){у - уг). Таким образом, получаем уравнение прямой вида ах + by = с с коэффициентами, которые получаются из координат точек при помощи арифметических операций. Точки пересечения являются решениями системы двух таких уравнений. Как легко видеть, эти решения получаются при помощи применения четырех арифметических операций к коэффициентам системы (из одного уравнения выражаем переменную, подставляют ее во второе уравнение и т.д.). Таким образом, пересечение двух прямых не выводит за пределы применения четырех действий арифметики.
10.1. ТРИ ПРОБЛЕМЫ ДРЕВНОСТИ 173 Пересечение двух окружностей можно свести к пересечению прямой и окружности. Пусть радиус окружности равен построенному числу Я, цен- ром является точка с построенными координатами (хо,уо)- Тогда уравнение окружности имеет вид: (х - ж0)2 + {у - 2/о)2 = R2 или х2 + у2 + ах + Ъу+с = 0, где все коэффициенты получаются из исходных чисел при помощи применения арифметических операций. Пусть даны две окружности с уравнениями х2 + у2 + <цх + Ь{у + С{=0, г = 1,2. Заменим второе уравнение системы на разность этих двух уравнений. Получится эквивалентная система: х2 + у2 + aix + Ьгу + сх = О (ai - а2)х + (bi - Ь2)2/ = с2 - ci. Эта система соответствует пересечению окружности и прямой, проходящей через точки пересечения двух окружностей. Отметим, что мы построили уравнение этой прямой, не зная самих точек пересечения. Так что второй случай целиком сводится к третьему. Третий случай разбирается аналогично первому. Пусть даны уравнения прямой и окружности. Выразим одну из переменных через вторую из уравнения прямой. Подставив это выражение в уравнение окружности, получим квадратное уравнение с коэффициентами, которые получаются из коэффициентов системы применением арифметических операций. Так что решения системы получатся применением четырех арифметических операций и операции извлечения арифметического квадратного корня. D Решения трех проблем древности будут получаться из следующей теоремы. Теорема. Если многочлен третьей степени с целыми коэффициентами не имеет рациональных корней, то ни один из его корней нельзя построить. Выведем сначала неразрешимость трех проблем древности из этой теоремы. □ Проше всего разбирается проблема удвоения куба. Будем считать единичным ребро заданного куба. Значит нужно построить число \fl (то есть отрезок такой длины). Однако это число -является корнем многочлена х3 - 2, который не имеет рациональных корней. □ □ Для отрицательного решения проблемы трисекции достаточно предъявить угол, который строится циркулем и линейкой, но угол в одну треть от которого не строится. Его трисекция сводится к построению угла в одну треть от данного. Возьмем угол в тг/3 радиан, он строится, так как costt/З = 1/2. Однако угол в тг/9 радиан не строится. В самом деле,
174 ГЛАВА 10. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ воспользуемся формулой косинуса тройного аргумента: 1/2 = costt/З = 4 cos3 тг/9 - 3 cos тг/9. Значит х = cos тг/9 — корень многочлена 8ж3 - 6х -1. Этот многочлен не имеет рациональных корней. Значит отрезок costt/9 нельзя построить, и нельзя построить угол в тг/9 радиан. □ D Для отрицательного решения проблемы построения семиугольника достаточно доказать невозможность построения отрезка длины 2 cos 2тг/7. Нужно составить многочлен с целыми коэффициентами, имеющий такой корень. Для числа е = cos 2тг/7 + г sin2?r/7 имеется равенство: 1 + е + е2 + е3 + е4 + еъ + е6 = 0. Разделим его на е3 и выразим все через х = е + е~1 : е3 4- б""3 = х3 — Зх, б"2 н- е~2 = х2 — 2. Получилось уравнение х3 + х2 - 2х - 1 = 0. Однако а: = 2cos2tt/7 — корень этого уравнения, и оно не имеет рациональных корней. D Доказательство теоремы. D Пусть многочлен f(x) = uqx3 + a\x2 + a,2X + az не имеет рациональных корней, и х\ — один из его корней можно построить. Пусть Х2, xz — два его других корня. Для описания связей между корнями этого многочлена нужно ввести новые понятия. Определение. Полем (числовым полем) называется множество комплексных чисел, которое содержит все рациональные числа и замкнуто относительно четырех арифметических операций (то есть применение любой арифметической операции к элементам этого множества дает результат, лежащий в этом множестве). Множество рациональных чисел лежит во всех полях, множество комплексных чисел содержит все возможные поля. Замечание.D В математике используют и другие (нечисловые) поля. Для этого понятие поля вводят аксиоматически. Для нас нет в этом необходимости. Возможно, читателю будет полезно знать три основные разновидности этих объектов. Кроме числовых полей рассматривают поля функций, вроде С{а\, аг,... , ап) или его расширений, которые использовались в предыдущей главе для доказательства теоремы Руфини — Абеля, Отметим, что строгое обоснование этих понятий достаточно нетривиально. Кроме того, в математике рассматривают конечные поля — к ним относятся Z/ри так называемые поля Галуа GF(pn (эти объекты рассматриваются в секции 2 главы 13). Из общей теории полей читателю будет полезно знать, что любое поле содержит либо множество рациональных чисел, либо множество Z/p. В первом случае говорят, что поле
10.1. ТРИ ПРОБЛЕМЫ ДРЕВНОСТИ 175 имеет характеристику ноль, во втором случае говорят, что поле имеет характеристику р. Например, поле рациональных функций C(ai,a2,... ,оп) содержит рациональные числа, а поле Галуа GF(pn) содержит Z/p.D Определение. Квадратичным расширением поля К называют множество вида K{y/d) = {a + by/d\ a, b 6 К}, где d € К, Vd $ К. □ Докажем от противного, что каждое число из квадратичного расширения однозначно представляется в указанном выше виде. Пусть имеет место равенство а\ + biVd = 02 4- i>2\/d- Из него вытекает, что \fd = fjzff £ ^• Это противоречит определению квадратичного расширения. Значит указанное представление единственно. D □ Заметим, что всякое квадратичное расширение действительно является полем. Не совсем очевидным является здесь только тот факт, что обратное число к числу а + b\fd лежит в квадратичном расширении. Формула для обратного пишется в полной аналогии с комлекснымии числами — нужно домножить на число, «сопряженное к знаменателю»: а2 - b2d a2 - trd Аналогия с комплексными числами здесь не случайна — поле комплексных чисел является квадратичным расширением поля действительных чисел. □ Тот факт, что корень х\ можно построить, можно представить как принадлежность этого числа последнему члену Кп набора последовательных квадратичных расширений: Q = Ко С Кг С К2 С ... С КП1 Ks+1 = K^Jd^). Необходимость перехода к квадратичному расширению может возникнуть всякий раз, когда при построении рассматривается пересечение двух окружностей или прямой и окружности. Можно считать, что полю ifn-i не принадлежит ни один из корней многочлена f(x) (в противном случае, в качестве Х\ можно взять корень лежащий в квадратичном расширении с наименьшим номером). Пусть хг = и + vy/d^, где u,u € AVi-i- Заметим, что «сопряженное» число щ = u-vy/d^ также является корнем многочлена f(x). Легче всего это доказать, заметив, что для сопряжения — операции изменения знака перед корнем — имеют место равенства: Z\ + z2 = ~z\
176 ГЛАВА 10. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ Из них вытекает, что для любого многочлена f(x) с рациональными коэффициентами имеет место равенство: f{x) = f(x). Пусть Х2 = ~х\. Тогда из теоремы Виета вытекает, что --—-Г }-_^L_2 GK Противоречие. □ 10.2 Правильные многоугольники В этой секции мы будем исследовать построение правильных многоугольников при помощи циркуля и линейки, с заданным единичным отрезком. Эти построения эквивалентны построению отрезка cos 27г/п, где п — число сторон многоугольника. В самом деле, по этому отрезку легко строится угол 2тг/п: проведем единичную окружность, от ее центра отложим данный отрезок и восстановим перпендикуляр к отрезку из второго его конца. Пересечение окружности с перпендикуляром даст нам нужный угол. При помощи указанных инструментов можно выполнять с отрезками четыре арифметические операции, а также извлечение квадратного корня. Поэтому, выражение длины отрезка через целые числа посредством четырех арифметических операций и извлечения арифметического квадратного корня дает способ построения данного отрезка. Например, если п = 2*, то построение можно получить как описательно (через кратное удвоение сторон квадрата), так и при помощи рекуррентной формулы: cos2tt/2*+1 = y^l/2 + 1/2cos2tt/2*. В явном виде получается следующая формула : = у 1/2 где в правой части стоит п знаков, квадратного корня. Построение правильного пятиугольника. D Формула l/2+cosxH- cos2х + ... + cosnx = 28"пху2 имеет важное значение для построение правильных многоугольников. Рассмотрим, например, правильный пятиугольник. Его построение эквивалентно построению отрезка 2cosx, где х = 2тг/5. Эта формула принимает вид : 1/2 -h cos а; 4- cos 2x = 0. Она эквивалентна формуле: 2 cos х 4- 2соз2я; = — 1. Для нахождения каждого
10.2. ПРАВИЛЬНЫЕ МНОГОУГОЛЬНИКИ 177 слагаемого по отдельности достаточно найти их произведение и составить квадратное уравнение по теореме, обратной к теореме Виета. 2cosx х 2cos2x = 2cosx + 2cos3x. Однако имеют место формулы: cos3x = cosGtt/5 = cos47r/5 = cos2x. Так что произведение совпадает с суммой. Уравнение имеет вид: а2 4- a-1 = 0. Один из его корней положителен, другой — отрицателен (в силу того, что свободный член меньше нуля). Положительный корень — искомое число Построение правильного семнадцатиугольника. Совершенно аналогично строится правильный семнадцатиугольник. Для приведенной выше суммы рассмотрим п = 8,х = 2тг/17. Она преобразуется к виду : 2(cosх + cos 2x 4- cosЗх 4- cos4x + cos 5х 4- cos6х 4- cos 7x 4- cos 8х) = —1. Разобьем левую часть на два слагаемых : а\ = 2 (cos х 4- cos 2x4- cos 4x4- cos 8а:), аг = 2(cos3x+cos5x+cos6x4-cos7x). Первое слагаемое легко запомнить — коэффициенты при являются степенями двойки. Аналогично случаю пятиугольника выразим произведение ахаг через сумму косинусов, применяя правило преобразования произведения косинусов в их сумму и формулу coskx = cos(17 — к)х : 2(cos 4x 4- cos 2x 4- cos 4х 4- cos 6x 4- cos 5х 4- cos 7x 4- cos 6x 4- cos 7x4- 4- cos x 4- cos 5x + cos За; 4- cos 7x + cos 4x + cos Sx 4- cos 5x 4- cos 8x4- 4- cos x 4- cos 7x + cos x + cos 8x 4- cos 2x 4- cos 7x + cos 3x + cos 6x+ 4- cos 5x + cos 6x 4- cos 3x 4- cos 4x 4- cos 2x -f cos 3x + cos x 4- cos 2x). Заметим, что каждое слагаемое повторяется ровно четыре раза. Так что = -4. Квадратное уравнение имеет вид: а2 4- а - 4 = 0. Один из его корней положителен, другой — отрицателен. Заметим, что х < тг/4 и 2х < тг/4. Поэтому имеют место неравенства: cosx > cos7r/4 и cos2x > costt/4. Кроме того, cos4x > 0, cos8x < 0. ЗнЬчит ax > \/2/2 4- уД/2 + cos8x = \/24-cos8x > 0. В итоге получим формулы: а\ = (\/Т7-1)/2, аг = / Разобьем первое слагаемое на две части: а\ = /3\ +/92, где /3\ = 2(cosx+ cos4x),/?2 = 2(cos2x + cos8x). Заметим, что = 2(cosx+cos3x+cos7x4-cos8x+cos2x-(-cos6x-(-cos4x+cos5x) = -1.
178 ГЛАВА 10. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ Получается квадратное уравнение /З2 - 1/2(\/17 — 1)/3 -1 = 0. Один из его корней положителен, другой — отрицателен. Значит /?! = 1/4(л/17 - 1 + V 34 - 2>/17),/?2 = 1/4(л/17 - 1 - \/з4-2>/17). Рассмотрим произведение 2cosx x 2cos4x = 2(cos3x + cos5a:). Самый последний шаг в вычислении 2 cos ж привел к неожиданному затруднению — свободный член в квадратном уравнении для этого числа оказался неподсчитанным. Эту трудность легко преодолеть. Разложим с*2 на два слагаемых: с*2 = 7i + 72, где 71 = 2(cos3z + cos5a;),72 = 2(cos6s + cos7x). Тогда имеют место равенства: 7i 72 = 2(cos3a-f-cos8z+cos4x+cos7z+cosx+cos6:r+cos2z+cos5a:) = -1. Получается квадратное уравнение: 72 + 1/2(\/17 + 1)7 - 1 = 0. Один из его корней положителен, другой — отрицателен. Заметим, что cos6a: < 0, cos 7х < 0. Поэтому имеют место неравенства: 72 < 0,71 > 0- Значит 7i = 1/4(\/34 + 2\/17 - >/17 - 1) >0. Уравнение t2 - fat + 71 = О имеет корни — 2 cos x, 2 cos Ах. Углы и 4 лежат в первой четверти. Значит, 2 cos а; > 2cos4x. Поэтому 2 cos ж = l/2(/3i + у//3* - 471). Откуда получаем окончательный результат: cos2?r/17 = 1/16(-1 + л/17 + V34 - 2\/l7+ у 68 + 12л/17 - 16\/з4 + 2n/17 -h Этот результат может быть обобщен на простые числа Ферма 22П +1, первыми из которых являются числа 3,5,17. Кроме них еще известно только два простых числа Ферма — 257 и 65537. Аналогичные явные формулы можно получить при помощи сумм Якоби (см. секцию 3 главы 8). У построенного правильного многоугольника можно удваивать число сторон при помощи серединных перпендикуляров к сторонам. Кроме того по построенным т- и п-угольникам можно построить mn-угольник, если числа тип взаимно простые. Покажем это на примере треугольника и пятиугольника. Мы умеем строить углы 2тг/3 и 2тг/5. Пользуясь этим, построим угол 2тг/15. Для этого выразим единицу через тройку и пятерку: 2x3 — 5 = 1. Умножив это равенство на 27г/15, получим равенство: 2 х 2тг/5 - 2тг/3 = 2тг/15. Для того, чтобы построить угол
10.3. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ 179 2тг/15, нужно взять дважды угол 2тг/5, а затем отложить угол 2тг/3 в противоположном направлении. Кроме того, приведенная формула позволяет легко вычислить cos2tt/15. Итак, наши методы позволяют построить следующие правильные n-угольники для первых двадцати п : п = 3,4,5,6,8,10,12,15,16,17,20. В секции 4 этой главы мы докажем, что остальные n-угольники для первых двадцати п нельзя построить циркулем и линейкой. Упражнения 1. Вычислить cos2n/n и sin27r/n для приведенных выше п-угольников. 2. Вычислить произведение cos 7г/4 cos 7г/8... cosтг/2п. 3. Вычислив площадь правильного 2*-угольника, вписанного в единичную окружность, получить приближенную формулу для числа 7Г, которая не использовала бы тригонометрических функций. 10-3 Поля алгебраических чисел Число а называется алгебраическим, если существует такой многочлен f(x) с целыми коэффициентами, что а является его корнем: /(а) =0. Ясно, что можно взять многочлен с рациональными коэффициентами, так как умножением на целое число из него получается целочисленный многочлен. Теорема. Алгебраические числа составляют поле. Доказательство. □ Сначала докажем, что сумма алгебраических чисел а и /3 является алгебраическим числом. Пусть а = ai,a2,... ,ап — все корни целочисленного многочлена f(x)\ /3 = /?ь/?2» • • • ^Рт — все корни целочисленного многочлена <?(х). Составим многочлен F(x)y имеющий корень a +/3, следующим образом: Заметим, что рассматривал этот многочлен от переменных «альфа» (остальные переменные рассматриваются как параметры), мы получим симметрический многочлен. Выразив его через коэффициенты многочлена /(х), избавляемся от переменных «альфа». При этом получается многочлен с
180 ГЛАВА 10. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ рациональными коэффициентами (элементарные симметрические многочлены представляются в виде частного двух целых чисел, причем в знаменателе стоит свободный член многочлена f(x)). Совершенно аналогичным способом можно избавиться от переменных «бета». В итоге получится многочлен от одной переменной х с рациональными коэффициентами. Для нахождения многочлена для произведения двух алгебраических чисел, рассмотрим выражение: Совершенно аналогично показывается, что этот многочлен имеет рациональные коэффициенты. Осталось найти многочлены для противоположного и обратного числа к данному алгебраическому числу а с многочленом }{х) степени п. Для противоположного числа нужно взять многочлен f{-x). Для противоположного числа нужно рассмотреть так называемый возвратный многочлен xnf(^). У него коэффициенты идут в противоположном порядке по сравнению с многочленом f(x).D Замечание.О Среди всех алгебраических чисел выделяют подмножество так называемых целых алгебраических чисел следующим образом. Целое алгебраическое число является корнем многочлена с целыми коэффициентами и старшим коэффициентом равным единице. Из доказательства приведенной теоремы следует, что это множество замкнуто относительно сложения, вычитания и умножения. Эти числа пересекаются с рациональными по множеству целых чисел, дробные рациональные числа являются алгебраическими числами, но не целыми алгебраическими числами. D Замечание.□ Несложно покачать аналогичным образом (сделайте это в качестве упражнения), что корни многочлена с алгебраическими коэффициентами — алгебраические числа. У читателя могло сложиться впечатление, что алгебраических чисел очень много и, стало быть, неалгебраических чисел мало. Все обстоим как раз наоборот. При обращении с бесконечными множествами часто получаются парадоксальные выводы. Эту область традиционно относят к математическому анализу. Поэтому приведем только факты без доказательств. Оказывается, что все алгебраические числа можно пересчитать, то есть можно однозначно указать для каждого алгебраического числа некоторый порядковый номер. Такая процедура невозможна для всех действительных или комплексных чисел.
ЮЛ ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ 181 Неалгебраические числа (их называют также трансцендентными числами) невозможно пересчитать, настолько их много. Можно показать, что знаменитые константы тг и е трансцендентны. О Хотелось бы думать, что каждому алгебраическому числу соответствует единственный с точностью до умножения на целые числа многочлен наименьшей степени с целыми коэффициентами, корнем которого является данное число. Это действительно так. Чтобы это доказать, проверим однозначность разложения на множители для многочленов с рациональными коэффициентами. Теорема. Многочлены с коэффициентами в произвольном поле К однозначно раскладываются в произведение неразложимых далее множителей (с точностью до умножения на ненулевые элементы из К и порядка множителей) с коэффициентами из поля К. Доказательство. П Эта теорема вытекает из возможности линейного представления uf + vg с многочленами, коэффициенты которых лежат в поле АГ, для наибольшего общего делителя многочленов / и д с коэффициентами из К. В самом деле, при делении с остатком двух многочленов с коэффициентами из поля К и неполное частное, и остаток также имеют коэффициенты из К, Из строчек алгоритма Евклида линейное представление для НОД находится точно так же как в случае целых чисел. Станем называть многочлен с коэффициентами из К, который нельзя разложить в произведение двух многочленов положительных степеней с коэффициентами из К", неприводимым над К многочленом. Лемма. Пусть неприводимый многочлен / делит произведение gh, тогда либо д делится на /, либо h делится на /. Доказательство. О Пусть д не делится на /. Тогда НОД(/, д) = 1, найдем для него линейное представление: 1 = гл/ 4- vg. Умножив это равенство на /г, получим: к = uh • / + v • gh. В левой части последнего равенства оба слагаемых делятся на /. Значит на / делится ft. D Для доказательства однозначности разложения на неприводимые множители воспользуемся методом математической индукции. Пусть все многочлены степени меньшей п однозначно раскладываются на неприводимые множители. Пусть имеются два разложения многочлена степени п на неприводимые множители: /i/2 ... fs = <?Ш ■ • 9t- Неприводимый многочлен /i делит произведение д\д2 -gt- Значит один из множителей делится на /i. Из неприводимости множителей следует, что этот множитель совпадает с точностью до умножения на элемент поля К с многочленом Д. После сокращения обеих частей на /i получим многочлен степени меньшей п, который однозначно раскладывается на неприводимые множители.
182 ГЛАВА 10. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ Так что разложения исходного многочлена степени п ничем существенным не отличались. П Каждому алгебраическому числу а соответствует единственный с точностью до умножения на ненулевые рациональные числа неприводимый многочлен f(x) с рациональными коэффициентами обладающий тем свойством, что f(a) = 0. В самом деле, пусть многочлен f\(x) обладает тем же свойством. Тогда согласно теореме Безу, эти многочлены имеют общий множитель х-а. Значит, они имеют нетривиальный НОД, который имеет рациональные коэффициенты, поскольку может быть найден посредством алгоритма Евклида. Однако нетривиальный НОД с рациональными коэффициентами двух неприводимых над Q многочленов должен быть равен каждому из них по отдельности. Поэтому, / = /1# Производная многочлена. Полезно отметить, что неприводимый над полем К многочлен / не может иметь кратных корней. Для доказательства этого факта нужно перенести определение и некоторые свойства производной на многочлены с комплексными коэффициентами. Определение дается той же формулой, что и в действительном случае: (axn)f = пахп~г на одночленах. Производная суммы одночленов равна сумме производных. Легко проверить, что и в этом случае выполняется формула производной произведения: (FG)1 = F'G + FG1\ Достаточно проверить эту формулу для произведения одночленов. Из последней формулы можно вывести следующий критерий кратности корня хо многочлена F(x). Корень хо имеет кратность большую единицы тогда и только тогда, когда F'(xo) = 0. □ В самом деле, пусть кратность равна к : F(x) = (x-xo)kh(x), h{xo) ф 0. Тогда F'(x) = (x - хо)к~г (nh(x) + (х - xo)h'(x)). Из этого равенства следует, что хо является корнем производной кратности к - 1 (значение второго множителя на этом числе равно nh(xo) ф 0). Пусть число хо является общим корнем многочленов f(x) и f'(x) с коэффициентами из поля К. Из теоремы Безу следует, что НОД этих многочленов нетривиален. Значит он имеет коэффициенты из поля К и равен неприводимому многочлену /(я), что невозможно (так как степень производной меньше степени /(х)). О Конечные расширения. Пусть дано поле К и числа ai, с*2,... ,а*. Обозначим через К (ах, аг,... , а*) множество чисел, которые получаются посредством (многократного) применения четырех арифметических операций к элементам
10.3. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ 183 поля К и числам а*, 1 < i < к. Очевидно, что это поле. Говорят, что оно получается присоединением к полю К чисел с^, 1 < i < к. Пусть К = Q и все at — алгебраические числа. Тогда это поле называют конечным расширением поля Q. Все элементы конечного расширения поля Q — алгебраические числа. Простым расширением поля Q называют поле вида Q(a). Оказывается, что все конечные расширения поля Q являются его простыми расширениями. Прежде чем доказать это утверждение дадим описание простых полей. Если а — корень квадратного трехчлена с целыми коэффициентами, то это поле — квадратичное расширение поля Q, и его описание было дано выше. Следующая теорема является прямым обобщением описания квадратичных расширений. Теорема о простом поле. Пусть a — корень неприводимого над Q многочлена степени п. Тогда всякий элемент поля Q(a) однозначно представляется в виде ao+aia-h.. .+an-ian~~1i где все а* —рациональные числа. Доказательство. D Сначала докажем, что значение любого многочлена с рациональными коэффициентами на числе а можно привести к указанному виду. Разделим этот многочлен F(x) на указанный в теореме многочлен f(x) степени п : F = gf + ry где степень остатка г(х) меньше п. Подставив в это равенство число а, получим: F(a) = г (а). Итак, все числа, которые получаются применением сложения, умножения и вычитания из рациональных чисел и числа а можно представить в указанном виде. Мы докажем это утверждение для любого элемента поля Q(a), если представим в виде значения многочлена с рациональными коэффициентами число -рщ, где многочлен с рациональными коэффициентами F(x) не делится на f(x). Заметим, что эти многочлены взаимно просты. При помощи алгоритма Евклида можно найти линейное предств- ление для их НОДа: 1 = u(x)f(x) + v(x)F(x), где многочлены и и v имеют рациональные коэффициенты. Подставив в это равенство х = о, получим 1 = v(a)F(a). Значит ^^у = v(a). Осталось доказать единственность исходного представления. Пусть Fi(a) = F2(a), и F\{x),F2(x) — разные многочлены с рациональными коэффициентами степеней меньших чем п. Тогда F\ — F2 — многочлен с рациональными коэффициентами имеет корень а, что невозможно, так как его степень меньше чем п, а он обязан делиться на неприводимый многочлен /(#).О Теорема о простом элементе. Пусть а, /3 — алгебраические числа.
184 ГЛАВА 10. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ Тогда существует такое алгебраическое число 7, что Q(a,(3) = Q(7)- Доказательство. □ Пусть неприводимые многочлены f(x) и д(х) с рациональными коэффициентами имеют корни а = а^аг,... ,ап и /3 = /Зь/?2,.. ■ ,/?m, соответственно. Выберем такое рациональное число с, что у = а + с/3 ^ а, + с/3, при i > 1, j > 1. Тогда многочлен /(7 - сх) имеет только один общий с многочленом д(х) корень /3. Заметим, что коэффициенты построенного многочлена лежат в поле Q(7)- Поэтому коэффициенты многочлена х — ft =HOR(f(j — cx)1g(x)) лежат в том же поле. Их можно найти при помощи алгоритма Евклида. Значит 0 £ Q(7)- Тогда а = у - ф £ Q(7)- Из этих двух включений следует, что все поле Q(a,/3) лежит в Q(7)- Обратное включение следует из того, что 7<EQ(a,/3).a Следствие. Всякое конечное расширение поля рациональных чисел является его простым расширением. Доказательство. D Заметим, что для любых алгебраических чисел ai, с*2, • • - ,<*k имеет место равенство: Q(abtt2,... ,aft) = Нужно fc — 1 раз воспользоваться исходной теоремой. D Нормальные поля. Отметим, что можно выделить важный класс конечных расширений. Некоторые конечные расширения обладают следующим свойством. Пусть дано поле Q(a), где а — корень неприводимого многочлена f{x). Если все остальные корни многочлена f(x) принадлежат этому полю, то оно называется нормальным. Таковы, например, все квадратичные расширения поля рациональных чисел. Нормальность — внутреннее свойство поля, не зависящее от его представления в виде Q(a). О В самом деле, пусть выбран иной элемент, присоединяя который к рациональным числам, получаем исходное поле: Q(a) = Q(/3), где /3 = F(a), F(x) — многочлен с рациональными коэффициентами. Пусть a = а\, с*2,... , ап все корни неприводимого многочлена f{x). Тогда можно построить многочлен с рациональными коэффициентами, имеющий корень F(a). В самом деле, возьмем многочлен ПГ=1 (х"~ F(ai))- Его коэффициенты представляют собой симметрические многочлены от а*. Поэтому они — рациональные числа. Все корни этого многочлена лежат в исходном поле, так как в нем лежат числа щ, Неприводимый многочлен с рациональными коэффициентами и корнем /3 будет делителем этого многочлена. Поэтому все корни этого неприводимого многочлена будут лежать в исходном поле. □
ЮЛ ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ 185 Пример. Приведем пример конечного раширения, которое не является нормальным. □ Это поле — Q(^2). Соответствующий неприводимый многочлен я3 - 2 имеет еще два комплексных корня — v^2(-l + >/—3)/2 и v^2(-l — v/-3)/2. Ясно, что они не могут лежат в подмножестве множества действительных чисел. □ Группы Галуа уравнений. С нормальным полем К можно связать интересный комбинаторный объект — его группу Галуа G{K). Представим это поле в виде К = Q(a), где а — корень неприводимого многочлена f(x). Очевидно, что К = Q(<*i), где щ (1 < i < n) все корни этого многочлена. Рассмотрим п отображений К -> К, каждое из которых задается одной из формул Ai(F(a)) = F(a,-), где F — многочлен с рациональными коэффициентами. Легко проверить, что эти взаимно однозначные отображения переводят сумму в сумму образов и произведение в произведение образов. Отображение между двумя полями, которое обладает этими свойствами называется изоморфизмом. Всякий изоморфизм оставляет на месте все рациональные числа. Проверку этого факта оставляем читателю в качестве упражнения. Из того, что при изоморфизме ноль переходит в ноль, следует, что лежащий в К корень х0 произвольного многочлена с рациональными коэффициентами g(x) переходит в корень х\ того же многочлена: О = А(0) = А(д(х0)) = д(А(х0)), А(х0) = хг. Каждый изоморфизм нормального поля К задает перестановку корней многочлена f{x). Из этого следует, что никаких других изоморфизмов, кроме указанных выше, нет. По всем изоморфизмам строится группа перестановок корней G(f) многочлена f(x) (проверьте, что эти перестановки действительно составляют группу). Под группой Галуа G(K) следует понимать множество изоморфизмов, перестановки доставляют лишь удобный способ записи для элементов этого множества. Нормальность поля К требуется для того, чтобы образ произвольного изоморфизма совпадал с К, и можно было рассматривать композиции изоморфизмов (являющиеся в свою очередь изоморфизмами). В общем случае можно считать, что изоморфизм отображает поле в комплексные числа. В этом случае группа перестановок корней не определяется. Однако число изоморфизмов равно степени многочлена f(x) в любом случае. Это число называют степенью поля К и обозначают через deg(K).
186 ГЛАВА 10. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ Для квадратичного расширения поля Q группа Галуа состоит всего лишь из двух изоморфизмов — тождественного отображения и сопряжения. Таким образом, можно считать, что изоморфизм — ничто иное, как обобщение сопряжения. Если взять многочлен /(х) большой степени, то группа G(f) может быть весьма сложно устроена. В теории Галуа доказывается, что свойства группы G(f) определяют возможность решения уравнения / = 0 в радикалах. Теорема. Для того, чтобы поле Q(a) третьей степени было нормальным, необходимо и достаточно, чтобы дискриминант неприводимого многочлена /(я), корнем которого служит а, был квадратом рационального числа. При этом, группа Галуа G(f) циклически переставляет три корня многочлена /(х) и состоит из трех элементов. Доказательство. D Сначала докажем достаточность. Пусть дискриминант D(f) — квадрат рационального числа. Тогда корень из дискриминанта - рациональное число. VD(f) = (&i ~ х2)(х2 - х3)(х3 - хг) = Оз - х2){х\ - (х2 + x3)xi + х2х3), где Xi — корни многочлена f(x) = х3 + ах2 + Ьх + с. Применив теорему Виета, получим равенство Х3 - Х2 = а)х\ - Однако из теоремы Виета следует равенство: хз + х2 = -а - Х\. Отсюда получим представление корней х%, х2 как рациональных функций с рациональными коэффициентами от корня х\. Поэтому Q(xi) = Q{x2) = О(хз). Теперь докажем необходимость. Пусть корень х2 рационально выражается через х\: х2 = F{x\). Тогда имеет место равенство для третьего корня: хз = -а - х\ - -F(xi). Так что нормальность исходного поля эквивалентна возможности рационального выражения одного корня через другой. При этом согласно теореме о простом элементе, выражение F(x) можно считать квадратным трехчленом с рациональными коэффициентами. Рассмотрим многочлен с корнями F(xi),F(x2),F(xz). Этот многочлен имеет рациональные коэффициенты (которые выражаются через а,Ь,с). Кроме того этот многочлен имеет общий корень х2 = F(x\) с неприводимым многочленом /(х). Отсюда немедленно следует, что построенный многочлен делится на исходный многочлен /(х) и имеет с ним все одинаковые корни. Имеет место альтернатива: либо Хз = F{x2) и xi =
10.4. ПОЛЯ ДЕЛЕНИЯ КРУГА 187 либо хз = F(xs) и х\ = F(x2). Однако вторая возможность никогда не выполняется, так как равенство х$ = F(x^) означает, что Жз — корень квадратного трехчлена с рациональными коэффициентами, что невозможно. Покажем, что корень из дискриминанта — рациональное число. \/D(f) = (xi-F(xi))(x2-F(x2)){x3-F(x3))- симметрический многочлен. Исследует теперь группу Галуа G(f). Преобразование хг н-> F(x{) задает изоморфизм поля Q(a). Можно компонировать это преобразование с ним же. Тройная композиция дает тождественный изоморфизм. Больше изоморфизмов быть не может, так как исходное поле третьей степени. D Несложно показать, что группа Галуа неприводимого многочлена переводит произвольный его корень в любой наперед выбранный. 10.4 Поля деления круга Доказательство однозначности разложения на множители целых чисел ничем существенным не отличается от приведенного выше доказательства однозначности разложения многочленов с коэффициентами в поле. Аналогами неприводимых многочленов служат числа, которые могут отличаться от простых лишь знаком. Разложение будет однозначным с точностью до порядка множителей и знаков. Мы имеем однозначность разложения целочисленного многочлена на неприводимые множители с рациональными коэффициентами. Каждый многочлен с рациональными коэффициентами можно умножить на произведение знаменателей всех коэффициентов, а затем вынести наибольший общий делитель новых целочисленных коэффициентов за скобку. В результате многочлен с рациональными коэффициентами будет представлен в виде произведения рационального числа и целочисленного многочлена, который имеет единичный наибольший общий делитель всех коэффициентов. Тогда исходный многочлен с целыми коэффициентами представится в виде произведения целочисленных, неразложимых на множители с рациональными коэффициентами многочленов, у которых наибольший общий делитель коэффициентов равен единице, умноженного на некоторое рациональное число. Если бы это число было бы целым и равным наибольшему общему делителю коэффициентов исходного многочлена, то мы бы получили разложение на неразложимые далее целочисленные множители исходного многочлена.
188 ГЛАВА 10. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ Однако здесь возникает вопрос: Не может ли возникнуть нетривиальный общий делитель коэффициентов при умножении двух целочисленн- ных многочленов, каждый из которых имеет наибольший общий делитель коэффициентов равный единице? Если может, то указанное выше число может быть не целым, и разложение на множители с рациональными коэффициентами не приводит к целочисленному разложению. К.Ф. Гаусс доказал, что эта возможность никогда не реализуется. Лемма (Гаусс). Произведение двух целочисленных многочленов, у которых наибольшие общие делители коэффициентов равны единице, имеет наибольший общий делитель коэффициентов равный единице. Доказательство. D Пусть первый многочлен имеет вид: / = a.kXk + .. .H-aiar + ao, второй многочлен имеет вид: д = bmxm + .. . + b\x + bo. Будем считать, что коэффициенты многочлена, имеющие номер превышающий его степень, равны нулю. Тогда коэффициенты произведения можно записать в виде: сп = ]Ci+/=na*fy- Пусть все коэффициенты произведения делятся на простое число р. Однако у многочленов / и д не все коэффициенты делятся на р. Пусть s и t — самые меньшие номера тех коэффициентов многочленов, соответственно, / и д} которые не делятся на р (то есть все младшие коэффициенты делятся на р). Тогда число asbt не делится на р. Однако оно является членом равенства, в котором все члены кроме него делятся на р : Противоречие. D Заметим, что во множестве целочисленных многочленов неразложимыми на множители будут следующие элементы. Во-первых, неприводимые над полем Q многочлены, у которых НОД коэффициентов равен единице. Во-вторых, простые числа вместе с отличающимися от них знаком числами. Нам эти факты нужны для того, чтобы выработать признаки неприводимости многочленов над Q. Теорема (Признак Эйзенштейна). Пусть старший коэффициент целочисленного многочлена f(x) не делится на простое число р, а все остальные коэффициенты делятся на р. Если свободный член многочлена f{x) не делится на р2, то f(x) — неприводим. Доказательство. П Пусть f(x) = апхп + .. . + aix + a0; р|ап,р|а«(г < гс),р2 \ ао. Пусть имеется разложение f(x) =,д(х) • h(x), где д(х) = bkXk + и h(x) = cmzm + ...+ ci# + cq. Тогдар|ЬоСо ир2 \boCQ. Значит
lOA. ПОЛЯ ДЕЛЕНИЯ КРУГА 189 один из этих множителей делится нар, а другой — не делится. Пусть р|Ьо и pf со. Рассмотрим следующий коэффициент: р\а\ = Ьос\ + Ь\с^. Отсюда следует, что p|bico и р\Ь\. Этот процесс можно продолжать вплоть до к- го коэффициента: р|Ь*. Тогда на р делится ап = bkCm, что противоречит условию. D Задача. Многочлен Фр{х) = хр~1+хр~2+...+х+1 = ^=р неприводим. О Заметим, что он разлагается на нетривиальные множители одновременно с многочленом Легко видеть, что последний многочлен удовлетворяет признаку Эйзенштейна. □ Вообще можно определить n-й многочлен деления круга Фп(х) как произведение Пнод(* n)=i(х~ (cos 2тгА;/п-|-г sin 2жк/п)) степени ф(п). Корнями этого многочлена являются все те корни n-й степени из единицы, которые не являются корнями меньшей степени из единицы. Эти числа называются первообразными или примитивными корнями n-й степени из единицы. Каждый корень n-й степени из единицы является первообразным корнем из единицы степени, которая является делителем числа п. Для получения этой степени нужно сократить число п на НОД(&,п). Соответствующие дроби £ были выписаны при доказательстве формулы п = £<фг ф{<1) в секции 3 главы б. Совершенно аналогично доказывается формула: d\n Поэтому можно легко показать по индукции, что каждый многочлен деления круга является целочисленным многочленом со старшим коэффициентом равным единице. Действительно, для малых степеней это непосредственно очевидно. Индуктивный переход осуществляется при помощи приведенной выше формулы для произведения многочленов деления круга. Многочлен Фп(х) получается как результат деления многочлена хп — 1 на произведение многочленов Ф^(х), находящихся в рамках индуктивного предположения. Поэтому делить придется на целочисленный многочлен со старшим коэффициентом равным единице. Результат деления должен быть целочисленным многочленом со старшим коэффициентом равным единице.
190 ГЛАВА 10. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ Можно показать, что каждый многочлен деления круга неприводим. Мы сделаем это лишь для необходимого для наших целей случая п = рк, где р — простое число. В этом случае легко получить общую формулу: 4^ ^ ^ 8=0 Многочлен Фрк (х + 1) будет удовлетворять признаку Эйзенштейна. В самом деле, рассмотрим одно из его р слагаемых — ((ж + 1)р )в, 0 < 5 < р. При возведении в степень рк"х бинома (х + 1) все члены, кроме хр и 1, будут иметь коэффициенты кратные р. При возведении полученной суммы в степень s таким же свойством будут обладать все члены кроме суммы (хр +1)*. Заметим, что все слагаемые с коэффициентами кратными р имеют х в положительных степенях (то есть не константы). В итоге получим формулу: v^ *-i (хрк^ + 1)р-1 Фрь(х + 1) = Уджр + l)s +pxUk(x) = - -tzy +pxUk(x). Свободный член у этого многочлена равен р, все коэффициенты, кроме старшего делятся на р. Согласно признаку Эйзенштейна, р*-й многочлен деления круга неприводим. Поле Q(£n)i где еп = соз2тг/п + isin27r/n, называется полем деления круга (на п частей). Другие примитивные корни n-й степени из единицы являются степенями этого числа. Поэтому поле деления круга нормальное. Имеет место знаменитая теорема Кронекера, которая утверждает, что многие нормальные поля лежат в полях деления круга. Именно утверждается, что там лежат все поля, у которых перестановки группы Галуа можно перемножать в любом порядке. Так что эти поля представляют важный теоретико-числовой объект. В главе 8 мы доказали, что простейшая гауссова сумма для вычетов по модулю р равна квадратному корню из р или -р, в зависимости от остатка при делении р на 4. Сама гауссова сумма принадлежит полю деления круга Q( </I). Поэтому имеет место вложение Q(y/p) С Q($T) для простого р = 4к + 1 и вложение Qfv^P) С Q(tf\) для простого р = 4А:- 1. Таким образом, мы доказали частный случай теоремы Кронекера.
ЮЛ. ПОЛЯ ЦЕЛЕНИЯ КРУГА 191 Теорема. Правильный m-угольник можно построить при помощи циркуля и линейки тогда и только тогда, когда m = 2°piP2 • • -Рь где ра(1 < s < к) — различные простые числа Ферма. Доказательство. □ Осталось доказать, что необходимым условием построения правильного р6-угольника является условие: Ь = 1, р — простое число Ферма. Построение правильного m-угольника эквивалентно построению отрезка длины 2 cos 2тг/т = ет + е^. Лемма. Пусть дано квадратичное расширение К С AT(\/d), тогда имеет место равенство degK(y/d) = 2degK. Доказательство. □ Пусть А : K(y/d) -* С — изофорфизм поля K(\/d). Если его рассматривать на элементах поля К, то получится изо- мофизм поля К. Станем обозначать его при помощи звездочки. Получается, что этот изоморфизм можно распространить на большее поле. Оказывается любой изоморфизм поля К можно продолжить до изоморфизма квадратичного расширения, причем ровно двумя способами. В самом деле, А(и + vy/d) = и* + v*A(y/d), где u,v € К. Осталось заметить, что (A(y/d))2 = A(d) = d*. Отсюда следует, что A(\/d) = ±y/d*. Выбор знака задает один из двух изоморфизмов. □ Заметим, что расширение Q(em + e^1) С Q(em) является квадратичным. В самом деле, 2ет = 2cos2n/m + г'2sin2тт/ш = (ет + е"1) + \J(ет + еш1)2 - 4. Значит deg(Q{em)) = 2dep(Q(2cos27r/m)). Если m-угольник можно построить, то поле Q(2cos27r/m) является последним звеном цепочки квадратичных расширений. Покажем для дву- кратного квадратичного расширения Q С Q(Vd) С Q(\/d)(\/u + что последнее поле можно представить в виде Q(/), где / = у/и + v\/d. В самом деле, Q(\/d, /) = ($(/), потому что y/d = (/2 - u)/v для v ^ 0 (если v = 0, то вместо поля Q(vd) у/и) будем рассматривать поле Q(^/u), так как нас интересует только число / = у/и в данном случае). Аналогичные приемы можно применять и для длинных цепочек квадратичных расширений. Из доказанной леммы следует, что deg(Q(cos27r/m)) = 2*, где t — длина соответствующей цепочки квадратичных расширений. Значит Для m = pb мы можем подсчитать это число другим способом. В самом деле, степень неприводимого целочисленного многочлена с корнем ерь равна рь~1{р - 1). Значит 6 = 1, р = 2*+1 + 1.D
192 ГЛАВА 10. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ Если бы мы доказали неприводимость многочлена деления круга в общем случае, то в этом доказательстве можно было бы сразу рассматривать произвольное число сторон у правильного многоугольника. Функция Мебиуса. Задача. Представить в замкнутой форме следующий за старшим коэффициент многочлена деления круга. D Оказывается, что многочлен деления круга записывается в стандартном виде следующим образом: Фп{х) = хф{п) - ц(п)хф^~1 + ... + 1. Функция fi(n) представляет собой сумму всех примитивных корней из единицы. Это целочисленная функция натурального аргумента, её называют функцией Мебиуса. Легко по индукции показать, что ц{рк) = 0, для простого числа р и к > 1. Кроме того, ц(р) = — 1. Для получения общей формулы для функции Мёбиуса нужно доказать следующее её свойство (называемое свойством мультипликативности): /i(m • п) = /х(т) • м(п), если НОД(т,п) = 1. Если число п делится на нетривиальный квадрат, то /х(п) = 0. В противном случае, число п представляется в виде произведения различных простых чисел. Пусть таких чисел будет к штук, тогда ji(n) = (-1)*. Доказательство мультипликативности функции Мёбиуса мы оставляем читателю в качестве упражнения. □ Из того, что сумма всех корней n-й степени равна единице, вытекает что 5Zrf|n /2(^) = 0* Хорошим упражнением для читателя на использование последней формулы будет доказательство следующей формулы обращения для произвольной функции /(п) натурального аргумента: d\n d\n У читателя могла возникнуть гипотеза, что у многочленов деления круга все коэффициенты равны либо нулю, либо ±1. Это не так. В качестве опровержения рассмотрите многочлен Фю5(^)- Упражнения 1. Доказать неприводимость произвольного многочлена деления круга. 2. Доказать неприводимость многочлена (х - а\)2(х — аг)2 ... (х — ап)2 +1, где п{ — произвольные различные целые числа.
Глава 11 Дополнительные главы алгебры 11.1 Исключение неизвестных При решении систем алгебраических уравнений часто возникает необходимость исключения неизвестных. Для систем с двумя неизвестными это эквивалентно сведению системы к уравнению, которое получится при исключении одной неизвестной. Если уравнения системы квадратные или линейные, то исключение неизвестных можно проводить, просто выражая одну переменную через другую. Если рассматривать уравнения высоких степеней, то последнее невозможно, и необходимы общие методы. Мы придем к этим методам на примере следующей элементарной задачи. Задача. Найти условие на коэффициенты двух квадратных трехчленов f(x) = а\х2 + Ь\х + С\ и д(х) = а2х2 + Ь2х + с2, чтобы их корни перемежались (то есть ровно один корень одного многочлена лежал между двумя корнями другого). При этом считается, что старшие коэффициенты трехчленов не равны нулю, и их дискриминанты положительны. D Если вычислить корни и выписывать условия в виде совокупности неравенств, то получится слишком громоздкий результат. Нам нужно одно запоминающееся неравенство, а не совокупность систем неравенств (да еще с корнями). На помощь приходит графический подход. С его помощью можно получить условие: g(xi)g(X2) < 0, где х\,х2 — корни многочлена /(х). Корни 7. Заказ № J 548.
194 ГЛАВА 11. ДОПОЛНИТЕЛЬНЫЕ ГЛАВЫ АЛГЕБРЫ перемежаются тогда и только тогда, когда значения одного из многочленов на корнях другого разных знаков. Заметим, что в левой части неравенства стоит симметрический многочлен. Для удобства выражения через коэффициенты многочлена f(x) умножим неравенство на а\ > 0. Согласно теореме Виета, а.\(х\ + х2) = -&i и а\Х\Х2 =с\. = а\а22х\х\ + a\a2b2x\x2{xi + х2) +а\а2с2(х\ + х\) + a\b2c2(xi + х2) + а\с% = а\с\ - В результате мы получили следующее условие: - а2сг)2 < (ai&2 - a2bi){blc2 - Определение. Результантом Res{f,g) двух многочленов /(х) и д(х) называется число а™д{х\)д{х2)... д{хп), где ж,(1 < i < п) — корни многочлена f(x), ап — его старший коэффициент, га — степень многочлена Теорема. Для результанта Res(f,g) имеют место формулы: Res(f,g) = « где yj(l < j < m) — корни многочлена д(х), Ьт — его старший коэффициент. Доказательство. D Для доказательства первого равенства разложим на множители многочлен д(х) = Ьт(х — у\){х — у2)...(х - ут) = Ьт rij=i(x ~ Уз)- Правая часть без труда преобразуется в левую. Для получения второго равенства нужно поменять местами члены разности в каждой из тп скобок. П Из этой теоремы можно получить еще одну формулу для результанта: Результант применяется для исключения неизвестной из системы двух уравнений. Задача. Исключить переменную у из системы ууу 2х3 - ху2 + у3 + 2л 4- у = 3.
11.1. ИСКЛЮЧЕНИЕ НЕИЗВЕСТНЫХ 195 Q Рассмотрим уравнения системы как равенства нулю многочленов от переменной у (переменная х здесь — параметр): д(у) = (2х2 -1)у2 — у + х3 + х - 5 = 0 и /(у) = у3 - ху2 + у + 2а;3 -3 = 0. Равенство нулю результанта Res(f,g) эквивалентно наличию общего корня для двух уравнений. Это следует из первого равенства доказанной выше теоремы. Запишем результант в виде: Res(f,g) = 0(2/1)0(2/2)0(2/3), где уьУг,Уз — корни многочлена f(y). Выразив этот симметрический многочлен через коэффициенты многочлена /(у), получим многочлен двенадцатой степени от х — результат исключения переменной у из исходной системы. Res(f, g) = г-1)у1-у2+х3+х-5)((2х2-1)у1-у3+х3+х-5) = (2х2 - 1)3(2х3 - З)2 + (х3 + х + 5)3 + 2х3 - 3 - (2х2 - 1)(2х3 - 3)+ +(2х2 - 1)2(2х3 - 3)(4х4 - 6х + 1) + (х3 + х - 5)2(2х3 - 2) + х3 + х - 5+ п В более сложных случаях результант вычисляется при помощи определителей. Заметим, что исключение неизвестных (как и другие разделы алгебры девятнадцатого века) требует громоздких вычислений. Мы привели еще очень простой пример. В более сложных случаях следует воспользоваться какой-либо компьтерной системой алгебраических вычислений (AXIOM, MAPLE и т.п.). Если переменных больше двух, то их нужно последовательно исключать одну за другой, рассматривая остальные переменные как параметры. Легко заметить, что Res(f,g\g2) = -Res(/,^i)iJe5(/,^2)- Поэтому особенно важно вычислять результанты для неприводимых многочленов. Пусть дан многочлен /(х) степени п. Заметим, что Res(f(x), f'(x)) = 0 тогда и только тогда, когда многочлен /(х) имеет кратный корень. Этим же свойством обладает еще один симметрический однородный многочлен степени п(п — 1) от корней многочлена /(х) — дискриминант D(f). Равенство D(f) = 0 эквивалентно равенству Res{fJfl) — 0. Так что мы получили новый способ для вычисления дискриминанта. Упражнения 1- Исключить переменные х,у и z из уравнений: xyz = abc,
196 ГЛАВА 11. ДОПОЛНИТЕЛЬНЫЕ ГЛАВЫ АЛГЕБРЫ ах л-yz = Ъс, by + zx = са, cz + ху = ab> 2. Исключить переменные х, у и z из уравнений: ах + by + cz = d, х2 -yz = а, у2 - zx- b, z2 - xy = с 3. Вычислить дискриминант многочлена хъ + ах + 6. 11.2 Преобразование Чирнгаузена Это преобразование состоит в замене переменной в многочлене, при котором переменная заменяется на (дробно) рациональную функцию от нее. Как оно осуществляется легче всего объяснить на примере. Пример. Можно предложить новый метод решения уравнения третьей степени. Для этого в многочлене хг +ах + Ь сделаем замену переменной у = х2 + ux + vy где коэффициенты ииь подбираются такими, чтобы у нового уравнения коэффициенты при второй и первой степенях переменной равнялись нулю. Пусть у исходного многочлена корни хья^яз- Тогда у нового уравнения корни будут иметь вид: yi = я2 + uxi + и; г = 1,2,3. Мы не станем выражать х через у. Вместо этого выразим коэффициенты нового уравнения через а и 6. Чирнгаузен придумал оригинальный метод для этого выражения. Сначала выразим суммы одинаковых степеней корней yi через суммы одинаковых корней Xi. Для удобства станем обозначать первые суммы большими буквами 5, а последние — маленькими 5. Si = s2 + usi + 3v = -2a + 3v. Для нахождения 5г рассмотрим выражение у2 = х\ + 2uzf + (u2 ? Основной прием по экономии вычислений в этом методе состоит в замене получившегося выражения на квадратный трехчлен от я*. В самом деле, разделим полученный многочлен четвертой степени от Х{ на исходный кубический многочлен. При этом значение от числа Х{ будет равно остатку от деления, потому что Х{ — корень исходного кубического многочлена. у2 = (Xi + 2w)(x? + axi + Ь) + {u2 + 2v - a)x] + {2uv - 2au - b)xt +1;2 - 2bu. Для упрощения вычислений положим в новом уравнении коэффициент при второй степени равным нулю: S\ = 0 =>- Т7 = 2а/3. Так что I/? = (u2 + a/3)st2 - (2<ш/3 + b)xi + 4a2/9 - 2bu.
11.2. ПРЕОБРАЗОВАНИЕ ЧИРНГАУЗЕНА 197 В таком случае имеют место равенства: 52 = (и2 - a/3)s2 - (2au/3 + 6)51 + 4a2/3 - 6bu = -2au2 - 6bu + 2a2/3. Однако 5г = 52 — 2<72 = -2<Т2- Равенство нулю второго коэффициента нового уравнения эквивалентно условию: 02 = au2+3bu-a2/3 = 0. Отсюда находим: и = f (-6/2 ± у/Ъ2/4 +а3/27). Мы получили весьма знакомую формулу. Для того чтобы определить свободный член нового уравнения, нужно найти S3. Мы не будем для выражения у3 через xt возводить квадратный трехчлен в куб. Заметим, что у? = у#? = (х? + их; + v)({u2 - а/3)х2 - (2au/3 + b)x{ + 4a2/9 - 2bu). Далее нужно заменить этот многочлен четвертой степени на квадратный трехчлен — остаток от деления на исходный кубический многочлен. Вычислив 5з, найдем свободный коэффициент нового уравнения из формулы: 5з = 3<тз- Новое уравнение имеет вид у3 = сгз- Выразив из него у, мы из квадратного уравнения у = х2 + их + v найдем х. □ Приведенный пример показывает, как действовать в общем случае. Пусть дан многочлен f(x) степени п. Мы хотим вычислить его корни х%0- < i < п)- Для этого мы делаем замену переменной у = F(x)/G(x), где многочлен G(x) не обращается в ноль на корнях многочлена f(x) и взаимно прост с ним. Общность этого вида замен переменной мнимая. В действительности они сводятся к заменам вида у = Л(х), где h(x) — многочлен степени меньшей п. В самом деле, в силу линейного представления для НОД можно найти такие многочлены U(x) и V{x)) что U(x)f(x) + V(x)G(x) = 1. Для любого Xi из этого равенства следует, что V{x{) = l/G(xi). Значит функцию F(x)/G(x) можно заменить на многочлен. Значения этого многочлена на корнях жг равны значениям остатка от деления этого многочлена на f(x). Степень остатка h(x) меньше п. Преобразованный многочлен можно представить в виде ПГ=а (У"~^(хг))* Чирнгаузен предложил удобный способ для нахождения коэффициентов этого многочлена. Сначала последовательно находятся Sk — суммы одинаковых степеней от yi = h(xi). Их выражают через суммы одинаковых степеней корней х;, а затем используют первую формулу Варинга. Экономия вычислений по сравнению с непосредственным выражением симметрических многочленов через коэффициенты /(х) достигается за счет того, что многочлен hk(x) всякий раз заменяется на многочлен
198 ГЛАВА 11. ДОПОЛНИТЕЛЬНЫЕ ГЛАВЫ АЛГЕБРЫ меньшей чем п степени. После нахождения 5*(1 < к < п), при помощи второй формулы Варинга находятся коэффициенты преобразованного многочлена. При помощи преобразования Чирнгаузена у общего уравнения четвертой степени можно обнулить три коэффициента и свести его к виду у4 = А. Это делается совершенно аналогично разобранному выше примеру (оставляем читателю это полезное упражнение). Сам Чирнгаузен надеялся таким образом решать любое уравнение в радикалах. Однако Лейбниц показал, что уравнение пятой степени не решается подобным способом, так как промежуточные уравнения получаются сложнее исходного. Шведский математик Бринг показал, что при помощи решения в радикалах уравнений малых степеней преобразование Чирнгаузена обнуляет три коэффициента у общего уравнения пятой степени. Это уравнение сводится, таким образом, к уравнению вида Уъ + о>У + Ь = 0. В связи с вышесказанным было бы интересно найти условия на а и 6, при которых последнее уравнение решалось бы в радикалах. Галуа дал критерий для разрешимости уравнения пятой степени в радикалах. Для этого необходимо и достаточно, чтобы все корни уравнения выражались бы через какие-либо два его корня при помощи (дробно) рациональных функций. Ясно, что этот критерий имеет лишь чисто теоретическое значение. Удобные условия были найдены британским математиком Кэли. Приведем необходимое и достаточное условие разрешимости уравнения у5 -f ay + b = 0 с рациональными коэффициентами в радикалах, если в правой части стоит неприводимый многочлен: ^ " ~ (u-l)4(u2-6u+25)> где и и v — рациональные числа. Заметим, что уравнение у5 + ay -f Ь = 0 можно привести к виду zb Л- bz = с, если сделать замену переменной у = \Jafbz, Последнее уравнение решается в специальных функциях. Так что можно получить формулу для решения общего уравнения пятой степени. Это сделали Эрмит, Кронекер, Бриоски и Жубер почти через три десятилетия после смерти Галуа.
11.3. ТЕОРЕМА ЛИУВИЛЛЯ 199 11.3 Теорема Лиувилля Алгебраические действительные числа выделяются среди всех действительных тем, что в определенном смысле плохо приближаются рациональными дробями. Нужно, конечно, уточнить смысл этого утверждения. В самом деле, любое действительное число а можно разложить в цепную дробь и приближать подходящими дробями Pk/Qk с точностью, определяемой неравенством: \<*-Рк/Як\ < <2 ЯкЯк+i В теории алгебраических чисел доказывают, что для любой последовательности рациональных приближений {рк/Як}, начиная с некоторого номера, имеет место неравенство |а - Рк/Як\ > Mq^ , для малого положительного числа е и положительного М. Мы не станем доказывать это замечательное неравенство, мы докажем более слабое утверждение. Теорема(Лйувилль). Пусть действительное число а является корнем неприводимого целочисленного многочлена f(x) степени п, тогда, начиная с некоторого номера, имеет место неравенство: |а — Рк/Як\ > Mq^n для любой последовательности рациональных приближений {pk/qk}> где М — положительная константа. Доказательство. □ Заметим, что для некоторой константы т имеет место неравенство \/(Рк/Як)\ < го|а—р*/<7*|, начиная с некоторого номера. При помощи схемы Горнера разложим исходный многочлен по степеням (х-а)': f(x) = ci(я - а) + с2(х - а)2 + ... + сп{х - а)п. В силу того что у неприводимого многочлена нет кратных корней, число d Ф 0. Поэтому в окрестности корня а значение многочлена будет определяться первым членом, и, перейдя к модулям, можно написать указанную оценку, взяв т > |ci|. Пусть f(x) = аоХпЦ-а\хп~1 +... + ап. Тогда имеет место неравенство: \fiPkl4k)\ = Ык + МГ1** + • • • + а*Як\Як П > Як"- В самом деле,-выражение, умноженное на ^Гп, — натуральное число. Оно не может равнятся нулю, потому что в малой окрестности одного корня нет других корней.
200 ГЛАВА 11. ДОПОЛНИТЕЛЬНЫЕ ГЛАВЫ АЛГЕБРЫ Для завершения доказательства достаточно положить М — 1/m.D При помощи теоремы Лиувилля можно доказывать трансцендентность некоторых чисел. Важно, чтобы по ним легко строилась последовательность рациональных приближений. Задача. Доказать, что число 6 = 0,1010010000001... трансцендентное (в десятичной записи в после fc-й единицы идет fc! нулей). D Это число удобно приближать десятичными приближениями — 0* (десятичную запись обрывают после fc-й единицы). В этом случае знаменатель приближающей в дроби имеет вид: qk = 10"(*+1!+2!+--+(*-1)!). Отсюда следует оценка: \в - 0*| < 2 ■ Ю-<*+1 + 11+2! + -+*!> < 10-(*+1!+2!+-+*!) Пусть в является корнем целочисленного неприводимого многочлена степени п. Тогда модуль в левой части последнего неравенства меньше, чем ( )) Для удобства представим константу в виде М = lg(U). Это неравенство невозможно, так как для достаточно большого к имеет место неравенство: к + 1! + 2! + ... 4- fc! > -U + п{к + 1! + 2! + ... + (fc - 1)!). В самом деле это неравенство эквивалентно неравенству: fc! > —U + (п — \)(кЛ-1! + 2! + •.. + (fc - 1)!). Для того чтобы определить нужный номер fc, нужно поделить обе части неравенства на (fc—1)!. В результате получится неравенство к> Второе слагаемое легко оценить как (п — Потребуем, чтобы первое слагаемое было меньше единицы, и, чтобы к> 1+ (п- 1)(е- 1).П 11.4 Теорема Дюма Критерий Эйзенштейна может быть значительно обобщен при помощи специальных приемов представления информации о коэффициентах целочисленных многочленов.
21.4. ТЕОРЕМА ДЮМА 201 Пусть задано простое число р и целочисленный многочлен f(x) = апхп + ... + а\х + clq. Пусть а* = р1ка'к, где HOfl^aJ^l (то есть /* — наибольшая степень, в которой число р выносится из а*). Для нулевого коэффициента эта степень не рассматривается. Ломаная и связка Дюма* На координатной плоскости рассмотрим множество всех точек (&,/&). По этому множеству строится выпуклая вниз ломаная, которая начинается в крайней слева точке этого множества и оканчивается в последней. Построить эту ломаную можно следующим образом. Проведем вертикальную прямую через крайнюю слева точку и станем ее вращать против часовой стрелки вплоть до пересечения с первой точкой исходного множества. Так получается первое звено ломаной. Далее вертикальную прямую переносим в новую точку и повторяем процедуру. Условимся объединять параллельные звенья (они идут последовательно друг за другом). Звенья полученной ломаной можно рассматривать как векторы (направленные по движению слева направо). Полученный набор векторов называют связкой и обозначают через /. Заметим, что ломаная легко восстанавливается по связке. Действительно, каждое следующее звено поворачивается на некоторый угол против часовой стрелки по соотношению к предыущему, так что легко установить, в каком порядке идут звенья. Для наших целей удобно переопределить операцию объединения связок. Если в объединяемых связках встречаются сонаправленные векторы, то при объединении станем их заменять на сумму векторов. Это нужно для того, чтобы объединение связок могло быть связкой для некоторого многочлена. Теорема(Дюма). Связка произведения двух целочисленных многочленов равно объединению их связок: fg — fUg. D Доказательство этой теоремы проводится методом математической индукции. Оно относится к числу тех доказательств, которые легче провести самостоятельно, нежели разобрать по тексту.П Из теоремы Дюма следует, что по связке можнохудить о неприводимых множителях, на которые раскладывается исходный многочлен. Станем называть звено простым, если оно не содержит внутри себя точек с целочисленными координатами. Можно получить следующий признак неприводимости целочисленного многочлена / : Следствие. Если связка /состоит из одного простого звена, то многочлен / неприводим (или равен произведению неприводимого многочлена
202 ГЛАВА 11. ДОПОЛНИТЕЛЬНЫЕ ГЛАВЫ АЛГЕБРЫ на одночлен хп). Доказательство. D В самом деле, простое звено никак не представить в виде суммы двух связок, если ни одна из них не состоит из единственной точки. □ Многочлену /, удовлетворяющему признаку Эйзенштейна, соответ- свует связка, состоящая из одного простого звена: / = {(п, — 1)}, где n=deg(f). Выбирая различные простые звенья, можно строить новые признаки неприводимости целочисленных многочленов. Упражнения 1. Составить три-четыре собственных признака неприводимости целочисленных многочленов, аналогичных признаку Эйзенштейна. 2. Проверить следующее утверждение для целочисленного многочлена /: Если связка / содержит только простые звенья с проекцией на ось абсцисс не меньшей fc, то неприводимые множители, на которые раскладывается многочлен /, имеют степень не меньше к.
Глава 12 Производящие функции 12.1 Числа Стирлинга и Эйлера Определение чисел Стирлинга. Рекуррентная формула для биномиальных коэффициентов может быть слегка модифицирована. В результате получатся новые специальные числа, зависящие от двух целых неотрицательных параметров. Числа Стирлинга [£], {£}(& < п) первого и второго рода определяются при помощи следующих рекуррентных формул: [°] = {£} = 1 При помощи этих формул легко провести следующие вычисления: а=зй+а=60+30+20+0=6+5(0+0)=п. «> = HI) + {?} = 4ф + 41) + {?} + {2} = 4 + 3({}} + {J}) = 7. В отличие от биномиальных коэффициентов для чисел Стирлинга не найдено удобных общих формул. Можно найти такие формулы лишь для некоторых из них. Например, [n"J = {^j} = n(n - 1)/2. В самом деле, имеется рекуррентная формула: [ п - 1 In -
204 ГЛАВА 12. ПРОИЗВОДЯЩИЕ ФУНКЦИИ Для чисел Стирлинга второго рода эта формула получается аналогично. Кроме того, легко найти формулы для ["] и {^}. Из рекуррентных формул получим: Н = (n-l)[V] = ... = (n-l)l и {«} = {V} = -.. = 1. Можно также попробовать найти [£] и {2} : Разделив первое равенство на (п — 1)!, получим: В]/(п-1)1 = М/(»-2)' + ^Г = 1 + * + - + ^- К обеим частям второго равенства добавим единицу: {2} + 1 = 2({»-1} + 1) = 2»-1. Связь чисел Стирлинга с возрастающими и убывающими степенями. Определим возрастающую степень хп по формуле: яг" = а;(яг + 1)(х + 2)... (ж + п - 1). Она связана с убывающей степенью по правилу: х* = х(х - 1){х - 2)... (х - п + 1) = (-1)п(-*)*. Числа Стирлинга позволяют выразить эти выражения через обычные степени и обратно. Докажем формулу: по индукции. Пусть она выполняется для некоторого п. Умножим обе части этой формулы на х -f n: Однако коэффициент при степени хк в последней сумме равен р1^1], что и требовалось доказать. D Совершенно аналогично доказывГ/ется формула:
12.L ЧИСЛА СТИРЛИНГА И ЭЙЛЕРА 205 Эти формулы приводят к тождествам для чисел Стирлинга. Действительно, имеют место формулы: хп = *=0m=0l*J W ff=0 k=s В итоге мы получили тождество: -вв-ч~{;} [*]>»■■ Совершенно аналогично получается тождество: Комбинаторная интерпретация чисел Стирлинга второго рода. Приведем комбинаторную интерпретацию чисел Стирлинга. Особенно просто это сделать для чисел Стирлинга второго рода: Задача. Доказать, что {£} есть число всех разложений множества п в объединение к штук непустых непересекающихся подмножеств (порядок, в котором берутся подмножества, не важен). □ Для доказательства этого факта проверим рекуррентную формулу для чисел Стирлинга второго рода. Выделим элемент п в п. Если он в разложении представляет отдельное множество, то по сути мы раскладывали множество п- 1 на к - 1 подмножеств. Таких разложений {£lj} штук. Подсчитаем все возможности, когда элемент п дополняет собой непустое подмножество. Если его удалить, то получится разложение множества п — 1 на к подмножеств. Такое разложение может возникнуть из исходного разложения к различными способами (мы можем выбросить элемент п из одного из к штук подмножеств). Получается еще fcj*1^1} возможностей. □ Формулы для чисел Стирлинга.
206 ГЛАВА 12. ПРОИЗВОДЯЩИЕ ФУНКЦИИ Заметим, что число Стирлинга второго рода {£} связано с числом sur(n, к) наложений множества п на множество к. В самом деле, наложение разбивает множество п на к непустых частей, которые переходят в различные элементы множества к (каждая из этих частей как бы нумеруется числом 1 < г < к). Поэтому имеет место формула: ■{:}■ sur(nyk). Однако для числа наложений формула «включений и исключений» доставляет общую формулу. Отсюда следует, что: Для к = 3 получим: {3} = (З71"1 + 1)/2 - 2n~i. Однако в общем случае эта формула слишком громоздка. Комбинаторная интерпретация позволяет легко доказать еще одну рекуррентную формулу для чисел Стирлинга второго рода: D Будем рассуждать следующим образом. Выделим то подмножество из разложения множества п +1 на к подмножеств, в котором лежит число п 4- 1. Пусть в нем 5+1 элемент (то есть, мы выбрали дополнительно s элементов). Тогда оставшиеся п — s элементов можно разложить на А; подмножеств {п~^8}- Поэтому таких способов ("H"^5} штук, причем параметр s изменяется от нуля до п — fc (мы должны оставить самое малое А; элементов для оставшихся непустых к подмножеств). В полученной формуле можно заменить параметр суммирования следующим образом — s = п — L В результате получим формулу: Заметим, что мы могли бы в рекуррентной формуле все время разлагать первый член:
12.1. ЧИСЛА СТИРЛИНГА И ЭЙЛЕРА 207 В результате получилась совсем другая формула. Кроме того, мы можем последовательно разлагать второй член рекуррентной формулы: Разлагая первый или второй члены рекуррентной формулы для чисел Стирлинга первого рода, можно получить следующие формулы: :-1 * ■- п — 11 __ к " 2J l=n-k Комбинаторная интерпретация для чисел Стирлинга первого рода. Комбинаторная интерпретация для чисел Стирлинга первого рода связана с разложением перестановок множества п на непересекающиеся циклы. Задача. Доказать, что [JJ] — это число перестановок, которые при разложении дают ровной непересекающихся циклов. D Это очень напоминает разложение п на к непустых подмножеств, только эти подмножества еще выстраивают по циклу. Отсюда следует, что [£] > {£}. Рекуррентная формула доказывается аналогично предыдущему — выделяют последний элемент. Перестановок с к циклами, в которых элемент п представляет отдельный цикл, [£~|] штук. Все остальные перестановки с к циклами можно
208 ГЛАВА 12. ПРОИЗВОДЯЩИЕ ФУНКЦИИ получить, вставляя в один из к циклов перестановки множества п - 1 эле- мснт п. В результате этой процедуры по одной перестановке множества п — 1 получается п - 1 перестановка множества п. Действительно, цикл из s символов дает ровно s возможностей вставить элемент п, а всего символов п - 1 штука. Поэтому перестановок множества пек циклами, в которых элемент п не образует отдельного цикла, (п - l)^1] штук. Формула проверена. □ Для чисел Стирлинга первого рода комбинаторная интерпретация приводит к формуле для суммы всех чисел с одним и тем же верхним индексом. Она равна числу всех перестановок одного и того же множества: Для чисел Стирлинга второго рода аналогичную сумму Ьп вычислить не так просто, и ее называют n-м числом Белла. Это число всех разложений множества п на части. Задача. Проверить следующую рекуррентную формулу для чисел Белла: Ьп+1 = О Для доказательства нужно выделить то подмножество в разложении множества п + 1, в котором лежит число п + 1, и воспользоваться равенством (n",) = (?)-D Определение чисел Эйлера. Леонард Эйлер ввел еще один вид специальных чисел, связанных с перестановками. Обозначим через (£) количество перестановок а множества п, которые обладают следующим свойством. Если a(i) < a(i -Ь 1), то говорят, что на элементе i у а подъем. Пусть у перестановки а будет ровно к подъемов. Ровно одна перестановка (тождественная) имеет наибольшее число подъемов — п - 1. Так что (£) = 0,(п"1) = 1. По определению кладут: (°) = 1. Вообще не имеет подъемов только одна перестановка (в ее нижней строке числа стоят по убыванию): (JJ) = 1. Последний пример наводит на мысль устроить следующее взаимно однозначное соответствие для перестановок. Нижнюю строку можно переписать в противоположном порядке. Если у исходной перестановки было к подъемов, то у переписанной их — п — к — 1 штук (подъемы и спуски
12.1. ЧИСЛА СТИРЛИНГА И ЭЙЛЕРА 209 меняются местами, а их общее число равно п - 1). Таким образом, имеет место равенство {£) = (п_^_1). Несложно получить рекуррентную формулу для чисел Эйлера. Можно получить (к + lX"^1) перестановок, имеющих ровно к подъемов, из перестановок множества п - 1, имеющих ровно к подъемов, вставлением числа п после образов элементов, на которых происходят подъемы, или же в самое начало (каждая такая перестановка дает к + 1 перестанок множества п). Кроме того, можно получить (я —&)(£!}) перестановок, имеющих ровно к подъемов, из перестановок множества п — 1, имеющих ровно к - 1 подъем. Для этого нужно вставить число п после образа элемента, на котором не происходит подъема, или же в самый конец (каждая перестановка даст ровно п — к перестановок множества п). Таким образом, мы полностью исследовали перестановки, которые получаются вычеркиванием элемента п, и получили формулу: Рассмотрим простейшие вычисления по этой формуле: <2> = 3Ф + 2ф = 3 + 2(2® + 20) =3 + 8=11. Связь чисел Стирлинга и Эйлера. По индукции легко проверяется общая формула для чисел Эйлера: Эта формула напоминает формулу для чисел Стирлинга второго рода. Это не случайно — указанные числа имеют близкие интерпретации в качестве коэффициентов некоторых разложений. Числа Эйлера получаются как коэффициенты, при помощи которых обычная степень выражается через убывающую степень (сдвинутых переменных): Эту формулу легко проверить по индукции. Умножив обе части на (п 4-
210 ГЛАВА 12. ПРОИЗВОДЯЩИЕ ФУНКЦИИ 1)х, получим равенство: (n + l)!zn+1 = 5>M(n + W* + к-п + (п- к))(х + *)* = {х + fc)*±i + (n - fc)(n + 1)(яг + к)11. Воспользуемся известным тождеством (см. упражнение 1 к секции 1 главы 2): (ж -Н к + 1) — (х -{- л) = (xi + 1)(ж 4* fc)~ i к=о Задача. Доказать, что числа Эйлера связаны с числами Стирлинга второго рода следующим образом: □ Докажем первое из этих тождеств. Для этого нужно вспомнить формулу бинома Ньютона для убывающих степеней (см. упражнение 4 и упражнение 3 секции 2 главы 2): ШшО Применим ее к формуле, которая выражает обычную степень через сдвинутые убывающие:
12.2. ПРОИЗВОДЯЩИЕ ФУНКЦИИ 211 Заметим, что к^^ = 0 при 5 < п - к. В итоге получается равенство: п п ( к \/п\ С другой стороны, имеется стандартное выражение обычной степени через убывающие: хп = £?=о {д}^"- Приравнивая коэффициенты получаем доказываемое тождество. D 12.2 Производящие функции Перечисление всех fc-элементных подмножеств n-элементного множества позволяет дать один из самых тривиальных примеров производящей функции. В самом деле, всех подмножеств у n-элементного множества 2П = (1 + 1)п штук. Если раскрыть в последнем выражении скобки, то получится сумма, слагаемые которой — числа его ^-элементных подмножеств 0 <к <п. Производящая функция для этих чисел получится, если заменить одну из единиц в этом выражении на переменную х : Производящую функцию для некоторой (возможно, бесконечной) последовательности чисел {c(fc)}fc>o определяют как ряд Y%Loc(k)xk- Обратно, коэффициент при fc-й степени некоторого ряда f(x) от переменной (или функции, которая разлагается в подобный ряд в окрестности нуля) обозначают через [xk]f(x). Например, [хк)(1 + х)п = (£). Чтобы лучше освоить эти обозначения, решим некоторые задачи двумя способами — через производящие функции и из обычных комбинаторных рассуждений. В этих задачах решение через комбинаторные рассуждения легче. Зато во многих сложных задачах подобными рассуждениями не обойдется, но, сочетая их с методом производящих функций, можно найти решение. Задача. Найти число способов распределения к одинаковых жетонов между тремя лицами, при которых первые два человека получают поровну. Первое решение. D Пусть первые два человека получат по s жетонов. Третий человек получит к - 2s жетонов. Это число той же четности,
212 ГЛАВА 12. ПРОИЗВОДЯЩИЕ ФУНКЦИИ что и к. Оно однозначно определяет распределение жетонов, поэтому будем пересчитывать эти числа. Если к — четное, то такие числа это — 0,2,4,... , к. Их — | + 1 штук. Если к — нечетное, то такие числа это — 1,3,... ,/:. Их— *±i штук. D Второе решение. D Если перемножить суммы двух геометрических прогрессий: f(x) = (l+a;2+a:4 + (r64-...-fx24...)(l + a: + a:2+a:3 + ... + ai4...), то члены произведения f(x) имеют вид x2s+t. Подобных членов заданной степени к как раз столько, сколькими способами можно число к представить в виде суммы двух слагаемых, из которых первое — четное. Значит ответ в нашей задаче — [xk]f{x). Дальнейшее — дело алгебры и анализа, а не комбинаторики. Разложим f(x) в простейшие дроби: f(x) = Последние две дроби — суммы геометрических прогрессий. Что касается первой дроби, то читатель, незнакомый с общим биномом Ньютона, может непосредственным приведением подобных членов у произведения двух сумм геометрических прогрессий убедиться в том, что (1 - х)~2 = 1 + 2х + За;2 + ... + (* + 1)хк + ... . Можно продифференцировать почленно ряд для (1 — х)~х и, таким образом, убедиться в правильности приведенной формулы (ее неплохо бы запомнить!). В любом случае, [xk]f(x) = \{к + 1) 4- \{\ + (-1)*). Мы получили ответ для нашей задачи в виде единой формулы. D Задача. Доказать, что разложений заданного натурального числа в сумму (неупорядоченных) различных натуральных слагаемых столько же, сколько разложений его в сумму (неупорядоченных) нечетных натуральных слагаемых. Первое решение. □ Пусть в заданном разложении числа fc в сумму нечетных натуральных слагаемых число г встречается яг* > 0 раз. Тогда разложение имеет вид: 1 • mi + 2 • т2 +... + А; • га* = fc; rrt2i = 0. Рассмотрим двоичное представление числа т^, то есть его представление в виде суммы различных степеней двойки. Заменив г • тп{ на сумму произведений этих степеней двойки и нечетного числа г, получим разложение числа к в сумму различных слагаемых.
12.2. ПРОИЗВОДЯЩИЕ ФУНКЦИИ 213 Обратно, пусть дано разложение числа к на различные натуральные слагаемые. Представим каждое из них в виде произведения степени двойки на нечетное число. После этого у слагаемых с одинаковым нечетным множителем г вынесем этот множитель за скобку — в скобках получится сумма степеней двойки, которую обозначим через т*. Получилось разложение на нечетные слагаемые, в котором нечетное слагаемое i встречается га* раз. □ Второе решение. D Рассмотрим бесконечное произведение: Раскрывая в нём скобки, мы выбираем в конечном числе скобок степень переменной , а в остальных число 1. При этом получится член, который равен переменной в степени, представленной как сумма различных натуральных чисел. Так что это произведение — производящая функция для чисел разложений натуральных чисел в сумму различных слагаемых. Домножим и разделим это произведение на произведение всех множителей вида (1 — хх) и запишем соответствующие разности квадратов: (1 - х)-г{1 - х2)(1 - х2у1(1 - х*)(1 - хг)~1(1 - хв)х х (1 - z4)-1^ - xs)... (1 - х*)-1 (1 - x2i).... В этом произведении сокращаются все скобки с четными степенями переменной , остается произведение: Раскрывая скобки в этом бесконечном произведении сумм геометрических прогрессий, получим степени переменной вида 1 • т\ 4- 2 • гаг + ... + к - т*; т<ц = 0. В самом деле, в скобке (1 - а;*)"1 стоит сумма членов вида xl'mi. Для того чтобы получить Л-ю степень, нужно выбирать члены из таких скобок с г < к. Значит получилась производящая функция для чисел разложений натуральных чисел в сумму нечетных слагаемых. О Простейшим примером производящей функции от многих переменных является формула для перестановок с повторениями, обобщающая бином
214 ГЛАВА 12. ПРОИЗВОДЯЩИЕ ФУНКЦИИ Ньютона на многие переменные: /(хь яг, ■ • • , я*) = Аналогично предыдущему станем обозначать: • • • / п \ nf Число Стирлинга первого рода [£] разлагаются в сумму чисел вида п! которые представляют число перестановок ровно с ti одинарным циклом, г*2 двойными циклами,... , in циклами длины п. Производящая функция для этих чисел обозначается через ii+2t2+...+ntn=n Отметим, что этот многочлен (называемый цикловым индексом симметрической группы) используется при выражении элементарных симметрических многочленов ап через другие симметрические многочлены — суммы одинаковых степеней всех переменных S{. Вторую формулу Варинга можно записать в следующем виде: ап = (-l)nPSn (-sb -52,... , -«„}._ Задача МакМагона. Найти число ожерелий с п бусинами m различных цветов (или типов). Ясно, что ожерелье не меняется при поворотах, переводящих множество бусин в себя. Однако бусины сверху и снизу выглядят по-разному — ожерелье нельзя переворачивать. На число цветов бусин не накладывается никаких условий — нужно учитывать и одно^ цветные ожерелья. Первое решение. D Обозначим искомое число ожерелий через аПуТП. Каждое ожерелье можно разрезать и превратить его в нить, выстроив бусцны против часовой стрелки от места разреза, п способами. Возьмем по п ожерелий каждого вида и получим из них паПут нитей, разрезав их всеми возможными способами.
12.2, ПРОИЗВОДЯЩИЕ ФУНКЦИИ 215 Это множество можно пересчитать по-другому. Станем перекладывать первые t бусин из начала в конец полученных нитей. Этот сдвиг на t бусин может оставить неизменными некоторые из нитей. Если это произошло, то 1-я бусина имеет тот же цвет, что и (/ 4- £)-я, (/ + 2£)-я,..., (/ + st)-x для любого s. Ясно, что здесь следует заменять номера бусин на их остатки при делении на п. Арифметика остатков дает удобное описание для этих инвариантных нитей. Бусины делятся на циклы, состоящие из одноцветных бусин. Если НОД(п,£) = 1, то цикл один, и он содержит всю нить — это одноцветная нить. Если НОД(п, t) = d, то имеется d циклов по n/d бусин одного цвета в каждом. При этом сдвиги на любое число тем же наибольшим общим с п делителем имеют инвариантными одни и те же нити. Для каждого d — делителя числа п, имеется <f>{n/d) таких разных сдвигов. При этом имеется ровно md разных нитей, инвариантных относительно этих сдвигов — достаточно задать цвета первых d бусин в нити. Каждая нить представляет собой n/d кратное повторение начального фрагмента из d бусин. Если выбрать минимальное значение числа d для некоторой нити, то для всякого делителя и числа n/d, эта нить будет также представлять собой ^-кратное повторение начального фрагмента из ud бусин. Она будет встречаться ровно n/d = £u|n/d <l>(n/ud) раз, и только среди нитей, соответствующих одному и тому же ожерелью. Это будут нити, получающиеся из нее кратным применением сдвига на d бусин. Общее число нитей равно сумме Y^d\n <f>(n/d)md. Нить с минимальным начальным фрагментом из d бусин будет входить ф(п/ид)-кра,тпо в члены, соответствующие делителям вида ud, где и — делитель n/d. d\n Отметим, что для простого числа бусин п = р получается комбинаторное истолкование частного двух чисел из малой теоремы Ферма: p, p Второе решение лучше давать для более общей постановки задачи. Требуется найти число ожерелий с к{ бусинами i-ro цвета 1 < г < т, где к\ + к2 + ... + кт = п. Обозначим производящую функцию для этих чисел через ^n(ri,f2,-- ,rm). Эта функция представляет собой однородный многочлен степени п с натуральными коэффициентами. Искомое число есть
216 ГЛАВА 12. ПРОИЗВОДЯЩИЕ ФУНКЦИИ Сразу приведем ответ в этой задаче: Pn(ri,r2l... ,гш) = Р Я! 171 г=1 г=1 г=1 Многочлен Pz/n называется цикловым индексом циклической группы Ъ/п и имеет вид: Pz/nixiix2i - • • >£n) = Sd|n^(^)xd • Заметим, что сумма всех коэффициентов равна /^/п(то,т, • • • >m) и совпадает с полученным ранее ответом (мы подставили Г{ = 1 для 1 < г < т). По сути дела производящие функции позволяют существенно усилить постановку задачи. Доказательство приведенного результата лучше проводить сразу для общего случая. Это требует введения особой системы понятий. Однако общая теорема перечисления унифицирует решение большого количества комбинаторных задач. При этом количество усилий, необходимое для решения задачи МакМагона в общей формулировке, не меньше чем нужно для доказательства общей теоремы перечисления. Так что перейдем к определению основных понятий, иллюстрируя их на примере обобщенной задачи МакМагона. Общая теория перечисления раскрашенных объектов. Пусть дано конечное множество X, на котором действует конечная группа G, перестановками элементов. Можно считать, что элементу д группы G соответствует тг(р) перестановка элементов множества X. При этом ir(gh) = 7r(g)ir(h). Мы не будем применять эти громоздкие обозначения — вместо тг(д) станем писать д. В задаче МакМагона — множество из п бусин. Циклическая группа действует на нём циклическими сдвигами. Раскраску бусин удобно задавать функцией / : X -> Л, где R = {г1,Г2,... Угт} — множество цветов. Всех таких функций тп штук — больше чем раскрашенных ожерелий, т.к. ожерелье можно поворачивать, совмещая при этом одинаково окрашенные бусины из различных раскрасок. Для общей постановки задача состоит в подсчете классов эквивалентности функций указанного вида, если эквивалентными объявляются функции, различающиеся лишь сдвинутым на перестановку из группы G порядком следования элементов — f ~ fg, где для любого элемента и множества fg(x) = f{gx). Реальное ожерелье из окрашенных бусин является как раз таким классом эквивалентности окрашивающих функций. Многие другие реальные объекты удобно представлять именно как классы эквивалентности окрашивающих функций.
12.2. ПРОИЗВОДЯЩИЕ ФУНКЦИИ 217 Производящая функция для числа классов эквивалентности раскрашивающих функций с заданным распределением цветов — к{ элементов г-го цвета (X^Li к{ = п — число элементов множества) можно построить следующим образом. По множеству цветов R строится множество многочленов от m переменных- Последние удобно обозначать так же, как обозначаются сами цвета. Это вместилище всех возможных производящих функций никак не связано с множеством и действующей на нём группой G. Комбинаторная информация о действии G на удобно представляется при помощи циклового индекса действия группы G на множестве (который часто несколько неточно называют цикловым индексом группы G) — некоторого многочлена Pc(xi1x2,... >хп) от п переменных. Теорема перечисления Пойа. Производящая функция для чисел классов эквивалентности раскрашивающих функций получается в результате подстановки многочленов Sj = £™-1 т\ вместо переменной Xj, 1 < j < п в Pq — цикловой индекс группы G. Цикловой индекс действия группы G на n-элементном множестве определяется при помощи разложения перестановок, соответствующих элементам группы G, на непересекающиеся циклы. Пусть перестановка, соответствующая элементу дл имеет циклический тип (<7i,<fc,... jtfn), то есть ровно gi непересекающихся циклов из i элементов, 1 < г < п. Положим по определению: Ясно, что цикловой индекс — инвариант действия группы, то есть больше комбинаторный нежели алгебраический инвариант. Он может совпадать у неизоморфных групп и различаться у разных действий одной и той же группы, даже если эти действия имеют изоморфные группы перестановок. Мы уже приводили цикловой индекс циклической группы Z/n, действующей как группа перестановок, порождённая циклом (1,2,... ,п), и цикловой индекс симметрической группы Sn, стандартно действующей на n-элементном множестве. Приведем три геометрических примера действия группы 54 — группы собственных движений куба. Двадцать четыре движения куба разделяются на: 1. тождественное преобразование; 2. 6 поворотов на тг/2 относительно прямых, соединяющих центры про-
218 ГЛАВА 12. ПРОИЗВОДЯЩИЕ ФУНКЦИИ тивоположных граней; 3. 8 поворотов на 27г/3 относительно прямых, соединяющих противоположные вершины; 4. 6 поворотов на тг относительно прямых, соединяющих середины противоположных ребер. 5. 3 поворота на я* относительно прямых, соединяющих середины противоположных граней. Пример 1. — множество вершин куба, п = 8. □ Рассмотрим перестановки вершин, соответствующие движениям 1- 5: 1. тожественное преобразование дает 8 циклов длины 1; 2. эти повороты дают по два цикла длины 4; 3. эти повороты дают по два цикла длины 3 и по два цикла длины 1; 4. эти повороты дают по четыре цикла длины 2; 5. эти повороты дают по четыре цикла длины 2. Заметим, что 4. и 5. дают подобные члены в цикловом индексе: P ( Заметим, что в циклический индекс не входят переменные ж$,5 < i < 8.D Пример 2. — множество ребер куба, п = 12. D Рассмотрим перестановки ребер, соответствующие движениям 1-5: 1. тожественное преобразование дает 12 циклов длины 1; 2. эти повороты дают по три цикла длины 4; 3. эти повороты дают по четыре цикла длины 3; 4. эти повороты дают по пять циклов длины 2 и по два цикла длины 1; 5. эти повороты дают по шесть циклов длины 2. Ps4 = ^(х\2 + 6х> + 8*34 + Ьх\х\ + 34).О Пример 3. — множество граней куба, п = 6. D Рассмотрим перестановки граней, соответствующие движениям 1-5: 1. тожественное преобразование дает 6 циклов длины 1; 2. эти повороты дают по циклу длины 4 и по двум циклам длины 1; 3. эти повороты дают по два цикла длины 3; 4. эти повороты дают по три цикла длины 2; 5. эти повороты дают по два цикла длины 2 и по два цикла длины 1. Заметим, что 2. и 5. дают подобные члены в цикловой индекс: ^ + 6x1 + 6x1 + Зх1х22)Л
12.2. ПРОИЗВОДЯЩИЕ ФУНКЦИИ 219 Доказательство теоремы перечисления Пойа. □ Заметим, что раскрашивающие функции /, лежащие в одной орбите, имеют одинаковый одночлен, равный произведению всех переменных, представляющих цвета элементов из , задаваемые данной функцией (т.к. количество элементов, окрашенных в данный цвет не меняется у эквивалентных раскрасок). Этот одночлен называют весом орбиты или весом раскрашивающей функции и обозначают через w(f). Множество орбит действия группы G на множестве раскрашивающих функций обозначим через O(G). Перечнем W действия группы G на раскрашивающих функциях назовем многочлен, равный сумме всех весов орбит (засчитываемых однократно). Лемма Бернсайда. W = £ Y!,geG £/=$/ w(/)- Доказательство. □ Для любой функции / множество элементов группы G, сохраняющих /, является подгруппой, которую называют стабилизатором и обозначают через St(f). Для любых двух эквивалентных функции, стабилизаторы имеют одинаковое число элементов, так как являются сопряженными подгруппами. Пусть gf\ = /2,^/2 = /2 => hgfi = /2. Множество элементов, переводящих /i в /2 является правым смежным классом по St(f2). Порядок группы равен произведению числа смежных классов на порядок подгруппы. Число элементов в орбите, умноженное на число элементов в стабилизаторе любого элемента из этой орбиты, равно п — порядку группы G. Отсюда следуют равенства: Е Е «(/) = ЕЕ «(/) = Е geGf=gf f guStif) f E £iw)M/)= E 1жя(/)мя=п Е F£O(G)feF F€O(G) FeO(G) Пусть перестановка, соответствующая некоторому элементу д группы G, имеет циклический тип (<?ь <?2 • ■ • ,<7л), то есть перемещает элементы множества внутри д% циклов длины г. Если раскрашивающая функция не меняется под действием элемента д, то внутри этих циклов элементы окрашиваются одинаково, так как, применяя кратно эту перестановку, можно любой элемент внутри цикла перевести в любой другой. Это поз-
220 ГЛАВА 12. ПРОИЗВОДЯЩИЕ ФУНКЦИИ воляет доказать следующую формулу: ]С/=о/ *"(/) ~ Е »vfa...r,fI)( Е ow.-nj ( 1<гл<т = (п +г2+ ... + гт)»(г? +г22 + ... + г*,)« ...(г? + г2" + ...+r»)*V В самом деле, пусть для некоторого цикла длины s выбран цвет rj, то этот цикл внесет в слагаемое, соответствующее данной раскраске множитель г*. Станем выбирать цвета последовательно для циклов длины 1,2,... ,п, будем получать слагаемые из п перемножаемых выше сумм. Каждая инвариантная относительно д раскраска соответствует выбору одного слагаемого из каждой суммы. Сопоставив полученную формулу с леммой Бернсайда, получаем доказательство теоремы перечисления Пойа. □ Для того чтобы найти общее число раскрасок с т цветами, нужно в полученной формуле положить все переменные равными единице: $j = m, I < j < п. Пример. Найти все раскраски граней куба в три цвета. D Производящая функция для классов эквивалентности раскрасок имеет вид: Получим формулу: Ps4 (3,3,3,3) = 57. Эти раскраски несложно найти простым перебором. В принципе задачи про раскраски куба или (что эквивалентно) про раскраски двойственного ему октаэдра несложно решить простым перебором возможных ситуаций. С икосаэдром и додекаэдром это несколько сложнее. Вычисления с производящими функциями гораздо удобнее в обоих случаях, благодаря систематичности и стандартности производимых действий. D В заключение приведем еще один классический пример. Графом (помеченным графом) называется пара — множество V, элементы которого называются вершинами графа, и множество Д, состоящее двухэлементных подмножеств множества V. Элементы множества R называются ребрами графа. Их удобно изображать линией, соединяющей вершины. Число всех помеченных графов с п вершинами найти несложно. Такой граф — это выбор подмножества ребер R во множестве всех двухэлементных подмножеств множества V, Множество всех возможных ребер имеет п(п - 1)/2 элементов. Значит всех графов 2п(п~1^2 штук.
12.3. ЧИСЛА БЕРНУЛЛИ И ЭЙЛЕРА 221 На множестве помеченных графов действует симметрическая группа Sn. Она переставляет вершины у графов. Всякий класс эквивалентности графов по действию этой группы называется непомеченным графом. Такому объекту соответствует геометрическая фигура, состоящая из непомеченных точек и линий, соединяющих эти точки. Подсчет числа непомеченных графов является в большей степени геометрической задачей и поэтому более сложной задачей. Задача. Найти число всех непомеченных графов. D Удобно задавать помеченный граф как раскрашивающую функцию / : V^ -> {ri,Г2}, где V^ — множество двухэлементных подмножеств множества V. Эта функция переводит ребра графа в г\, а пары вершин, не являющиеся ребрами, — в гг. Непомеченный граф — класс эквивалентности таких раскрашивающих функций. Так что осталось применить теорему перечисления Пойа. Цикловой индекс симметрической группы, переставляющей двухэлементные множества, устроен достаточно сложно. Предлагаем читателю найти явные формулы для производящей функции для непомеченных графов с небольшим числом вершин. □ 12.3 Числа Бернулли и Эйлера Числа Бернулли представляют собой последовательность рациональных чисел {Вп}п>о. Первые члены этой последовательности таковы: 1, 1/2, 1/6, 0, -1/30, 0, 1/42, -1/30, 0, 5/66, 0,-691/2730, 0, 7/6, 0, -3617/510, 0, 43867/798,... Далее четные члены последовательности начинают быстро расти по абсолютной величине, образуя знакопеременную последовательность. Нечетные члены равны нулю. Возникает искушение рассматривать только подпоследовательность четных членов (в некоторых книгах так и поступают). Однако этому мешает первый член Вг = 1/2. Во многих книгах кладут В\ — —1/2, потому что это приводит к самому компактному определению. Мы выбрали другой вариант, потому что он приводит к наиболее удобным формулам, связанным с этими числами. Числа Бернулли определяются при помощи рекуррентной формулы:
222 ГЛАВА 12. ПРОИЗВОДЯЩИЕ ФУНКЦИИ Эта формула очень напоминает формулу для бинома Ньютона, только нужно индексы у чисел Бернулли поднять вверх: (В + 1)п — Вп = п. Получилась удобная мнемоническая формула для запоминания. Заметим, что при переносе числа п в левую часть в исходной формуле возникает член (i)(#i - 1). Если положить Bi = -1/2, то рекуррентная формула примет вид: (В + 1)п = Вп. Мнемонические формулы упрощают записи. Например, рекуррентная формула для чисел Белла принимает вид: 6n+i = (b + l)n. Оперируя с этими мнемоническими формулами можно получать сильные результаты. К сожалению, их необходимо проверять, потому что легко получить неверное утверждение. Покажем на примере, как действовать с такими формулами. Мы будем пользоваться формулой Тейлора: не заботясь о сходимости рядов в духе математиков прошлых веков. С символом В будем обращаться как с параметром, который в формулы разложения входит в целых неотрицательных степенях (эти индексы для придания смысла окончательным формулам нужно опускать вниз). л.+(В+т - /„+»). ± к^тдт^м П=1 П=1 ' П=1 V '' Эту формулу называют основной формулой для чисел Бернулли, из нее можно вывести много интересных фактов. Подставим, скажем, х = к и h = 1, где 0 < к < п — 1. Затем можно сложить полученные результаты. В левой части сократятся все члены, кроме крайних: fW + n)- f(B) = /'(1) + /'(2) + • • • + /'(»)• Полученная формула носит имя Маклорена. Подставив в нее f(x) = xk+1) получим мнемоническую формулу: (к 4- l)Sk(n) = (В + п)к+1 - Вк+\ где Sk = 1* + 2* + ... + п*. Теперь проверим ее по индукции.
12.3. ЧИСЛА БЕРНУЛЛИ И ЭЙЛЕРА 223 D Для малых к она выполняется. Пусть она доказана для всех степеней меньших к. Для проверки этой формулы для степени к выведем следующую рекуррентную формулу. Рассмотрим сумму 5=1 все члены, кроме крайних, сокращаются. С другой стороны, можно раскрыть первый член разности по формуле бинома Ньютона: Добавим и вычтем (к + l)S*(n) = (fc + 1)[(В + n)fc+1 - B*+1] в правой части последнего равенства, кроме того, воспользуемся предположением индукции: n) J+1" Мы проведем шаг индукции, если докажем, что сумма из последней формулы равна (n + l)k+1 -1. Для доказательства мы используем тождество: { s ){u) = { u ){ a-u У Раскроем мнемонические формулы и заменим индекс и на s — и: 0<u<s<k Ч ' Х 7 Теперь заменим (*^)/(s +1) на (*)/(u + 1) и воспользуемся тождеством:
224 ГЛАВА 12. ПРОИЗВОДЯЩИЕ ФУНКЦИИ '~и- Осталось заменить индекс s на s — и и воспользоваться рекуррентной формулой для чисел Бернулли: u+1 u=0 Еще интереснее результаты получатся, если подставить в формулу Маклорена f(x) = Inx или f(x) = xlnx - х. Однако они относятся к математическому анализу, и мы не будем ими заниматься. Отметим только, что первый из них уточняет известное из анализа разложение: Нп = 1 + о + о + ■ • ■ + - = 1 + 1пп + °(Х)' I о П где 7 = 0,577215664901... — постоянная Эйлера. Гармонические числа Нп встречались нам в связи с числами Стирлинга первого рода — ГС1] = нпп\. Иногда оказывается полезным рассматривать обобщенные гармони- ческие числа: #(*) -1 + 2- + -L+ + — Эти ряды сходятся при к > 1. Мы вычислили #£з = тг2/6 в главе 3. Близкими методами можно вычислить еще несколько таких чисел. Вместо этого мы используем более мощные аналитические методы и вычислим сразу все числа вида Я^. Определение. Экспоненциальной производящей функцией для последовательности {<1п}п<о называется ряд Yl^Lo 1$хП' Его часто рассматривают как своего рода вектор с бесконечным числом компонент без учета сходимости.
12.3. ЧИСЛА БЕРНУЛЛИ И ЭЙЛЕРА 225 Основная формула для чисел Бернулли позволяет найти производящую функцию еВх для этих чисел. Подставим в нее х = — Л и f(x) = ех : f(Bx) - f(Bx -х) = еВх - еВх/ех = xf'(0) = х. Откуда имеем: ех - 1 ех - 1 Второе представление этой функции полезно для того, чтобы согласовать определения с теми, кто выбрал в определении чисел Бернулли В\ = -1/2 = 1/2 - 1. Для них производящей функцией будет второе слагаемое. Покажем, как с помощью этой производящей функции найти формулу для Sk{n). О Рассмотрим геометрическую прогрессию со знаменателем ех : ех -1 х ех - 1 7ЛТ Г)кТк-1 ЯоГ2 ЯиГк IЬ Jj to JU . / __ __ LJOAj Ul+JLr В левой части при степени я* коэффициент имеет вид 5jt(n — l)/fc!. Перемножая члены рядов в правой части, получаем вторую формулу для этого коэффициента: Умножив обе части на (А; 4-1)!, мы получим формулу: (к + 1)5а;(п — 1) = (5 + п)Л+1 - JB*+1. Полученная формула преобразуется в уже известную после прибавления слагаемого (fc-H 1)пк к обеим частям. Левая часть преобразуется к виду (к + l)Sfc(n), а в правой части при степени пк будет коэффициент (к+ l)(Bi +1), который призывает нас возвратиться к старому подходу и считать В\ = 1/2.D Как мы уже говорили, имеется третий подход к определению первого числа Бернулли — можно считать, что все числа Бернулли с нечетными номерами равны нулю без исключений. В этом случае производящая функция принимает особенно хороший вид: е -
226 ГЛАВА 12. ПРОИЗВОДЯЩИЕ ФУНКЦИИ Проверять это равенство следует справа налево: ж/2 _ х ех'2 + е~х/2 _х ех + 1 _ х 2ж/2 *Л(яг/2) 2 е*/2 - е~х/2 2 е1 - 1 2 е* - Г Заметим, что мы получили четную функцию. Из этого следует, что все коэффициенты ее ряда Тейлора с нечетными номерами равны нулю. Можно считать, что мы вывели из определения равенство нулю для чисел Бер- нуг*ли с нечетными номерами. Подставим в полученную формулу х = 2nit) где i — мнимая единица, формулу: 8=0 Леонард Эйлер получил для этой функции разложение в виде суммы бесконечного числа дробей, аналогичное разложению рациональных функций на простейшие дроби: 2t2 71=1 из дробей можно представить в виде суммы бесконечной геометрической прогрессии: t2s 71=1 S=l П S=l Приравнивая коэффициенты двух этих разложений при t2s, получаем формулу: Положимв = 2,3,4 : НА0О= п*/90, Н^ = тгб/945, Н^ = 7r8/^450. 0О Наш результат тем более удивителен, что до сих пор не найдено в замкнутой форме Я' = 1,2020569035959428540...
12.3. ЧИСЛА БЕРНУЛЛИ И ЭЙЛЕРА 227 Не найдено ни одного числа Я^+1 для натуральных 5. Заметим, что Н%£ —> 1 при s -» oo. Для доказательства разобьем ряд на последовательные участки по 2Ь членов t = О,1,2,... и заменим все члены в них на самый малый из них: КЯ^ЧИ 2~2s 4- 2"25 + 4Г29 4- 4"25 + 4Г2* + 4"25 4- 8"2* + ... = = 1 + 21"2* + 22<1-2*> + 23»-2'> + ... = \_и -> 1. Отсюда получаем асимптотическую формулу для модулей чисел Бернул- ли: Эту формулу можно упростить, если воспользоваться формулой Стир- линга: it! = у/2пп(к/е)ке^, где 0 < вк < 1. Получается асимптотическая формула: \В28\ = 4y/7rs(s/e7r)2s(l + о(1)), где s -> оо. Так что модуль числа Бернулли растет медленнее факториала, но быстрее любой показательной функции. Кроме того, из формулы для Н2^ следует, что числа Бернулли с четными номерами образуют знакопеременную последовательность. Мы только теперь смогли доказать этот факт. При помощи чисел Бернулли можно вычислить еще один аналогичный Н%£ вид рядов. Хорошо известен ряд Лейбница: Легче всего его получить из разложения в ряд функции арктангенс: х5 х2п+1 Нужно подставить х = 1. Существуют более элементарные (и более трудоемкие) способы вычисления ряда Лейбница.
228 ГЛАВА 12. ПРОИЗВОДЯЩИЕ ФУНКЦИИ Обозначим через G* сумму Для больших номеров п эта сумма незначительно отличается от ряда G^ Мы вычислим этот ряд для к = 2s -f 1. Рассмотрим функцию = 25. Для любого натурального к этот ряд сходится, при к > 1 сходится абсолютно. Можно проверить, что эти ряды при к > 1 можно дифференцировать покомпонентно. При этом, Ф'к(х) = (-l)*"1**-^). Так что можно подсчитать $i(z), а все оставшиеся найти при помощи интегрирования. Из определения следует, что это периодические функции с периодом 2тг. Поэтому мы их будем рассматривать на интервале ]0,2тг[. Заметим, что производная этой функции постоянная (в тех точках, где она существует). Подсчитаем производную частичной суммы: sinmxy A . sin(n +1/2)д: => cosmz =-1/2+—±-. jt—. т ) A^i ' 2sinz/2 m=l m=l ' Это как раз тот случай, когда ряд нельзя почленно дифференцировать. Производная ряда существует, а предел производной частичной суммы — нет. Положение можно спасти, если слегка подправить частичные суммы. Рассмотрим последовательность функций: cos(n +l/2)ar m (2n-hi) sin ж/2' Очевидно, что Ф^х^п) -> Ф1(я) при п -> оо. При этом последовательность производных равномерно сходится к —1/2 : sin(n + l/2)a: -(n- (l/2)cosx/2cos(n + l/2)x_ cos(n + l/2)icosx/2 (2п+1)8т2Ж/2 " "1/2 (4n+ 2) sin2 x/2
12.3. ЧИСЛА БЕРНУЛЛИ И ЭЙЛЕРА 229 Значит Ф'х(х) = -1/2. Мы можем подставить х = тг и из определения получить Фг(тг) = 0. Поэтому Фх(х) = (тг — х)/2. Кроме того, ряд Ф1(тг/2) совпадает с рядом Лейбница и равен 7г/4. Мы подсчитали ряд Лейбница без использования разложения арктангенса. С помощью интегрирования находим Фг(я) = х2 /4 - тгх/2 + С. Константу С можно найти из равенства: Ф2(тг) = -Hi + 2 £ JL; = -Hi + Hl/2 = -тг2/12. 7Г2/4-7Г2/2 + С=-7Г2/12 =» (7 = 7Г2/6. С помощью интегрирования находим Фз(я) = х*/12-тгх2/4+п2х/6+С. Константу С находим из равенства: Ф3(тг) = 0 => С7 = (-1/12 -Ь 1/4 - 1/6)тг3 = 0. Теперь подставим в полученную формулу х = тг/2 : Glo = Фз(тг/2) = (1/96 - 1/16 + 1/12)тг3 = тг3/32. Очевидно, что двигаясь таким образом можно вычислись любое <7^+1. Хотелось бы иметь удобную формулу для многочлена Ф*(ж). На помощь приходят числа Бернулли. Заметим, что Ф\(х) = 7r(Z?i - x/2n). Кроме того, Ф2(ог) = тг2(В - ж/2тг)2, Ф3(ж) = -22тг3(В - аг/2тг)3/3!. Можно предположить, что имеет место формула: Проверка ее по индукции в два шага (для к = 2s и к = 2s + 1) сводится к проверке двух тождеств для чисел Бернулли (подставим ъ = 7г): rln5j
230 ГЛАВА 12. ПРОИЗВОДЯЩИЕ ФУНКЦИИ После сокращений получаем тождества: (2В - l)2s = (2 - 22')B2s, (2£ - 1)2*+1 = 0- Их можно записать в виде одного тождества: (2В - 1)* = (2 - 2к)Вк. Оно легко проверяется при помощи производящих функций: ЛВ-1/2)х _ _в*„-х/2 _ хе*/2 _ »(«* + еХ/2) ~ ™х _ 6 в* -1 в- -1 _ Вх/2 Вх ~Ze ~6 ■ Приравнивая коэффициенты при хк) получаем равенство (В — 1/2)* = - jBjfe. Исходное тождество получается из него умножением на 2к. Подставляя в Ф2*-н(#) я = тг/2, получаем равенство: Полученный результат можно записать в более удобной форме. Для этого используют введенные Эйлером числа {#п}п>о- Это целочисленная последовательность, нечетные члены которой равны нулю, а четные образуют знакопеременную последовательность. Первые числа Эйлера имеют вид: 1, 0, -1, 0, 5, -61, 0, 1385, 0, -50521, 2702765,... Определим эти числа при помощи рекуррентной мнемонической формулы: (Е + 1)п + (Е - 1)п = 0. Эту формулу можно разделить на два и выразить Еп через числа Эйлера с меньшими номерами с целыми коэффициентами. Так что все члены этой последовательности — целые числа. Мы уже использовали название числа Эйлера для последовательности коэффициентов биномиального типа. Однако путаница здесь исключается, так как те числа Эйлера имеют два индекса. При помощи формулы Тейлора можно получить основную формулу для чисел Эйлера подобно тому, как это делалось для чисел Бернулли. f(x + (E + l)h) + f(x
12.3. ЧИСЛА БЕРНУЛЛИ И ЭЙЛЕРА 231 = 2/(х) + ± {Е + 1)т + (Е-1)т^\ф™ = 2f(x). ml m=l Для получения производящей функции чисел Эйлера положим f(z) = е , х — и =?- Откуда находим, что еЕх = сЛ^я (здесь мы заменили переменную h на переменную ж). Эту функцию называют секанс гиперболический, она — четная (потому, что chx — четная функция). Из последнего следует, что все числа Эйлера с нечетными номерами равны нулю. Для нахождения связи между числами Эйлера и числами Бернулли рассмотрим следующие выражения: J4B-i)x ив-зи _ 4se4*e-* 4хе4*е-3* _ с — с — —л — — . — Приравнивая коэффициенты при степени хк в левой и правой частях полученного равенства, получаем равенство: ((45-1)*-(45-3 Это равенство можно упростить, воспользовавшись тождеством (4В — 1)к = (3 - 4B)fc, которое вытекает из легко проверяемого равенства е(АВ-\)х _ е(3-4В)х . (з-4В)х е**(-4х)е-** 4хе~* л —4х __ 1 1 _ о—4х о4х _ 1 С X X С< О X Из этого следует, что все числа Эйлера с нечетными номерами равны нулю. Для чисел Эйлера с четными номерами имеет место равенство: (4B-1)25+1 42s+1(B- гз 2s +1 (2s+ 1) Подставив последнее равенство в полученную ранее формулу для чисел G^+1, приходим к окончательной формуле для этих чисел:
232 ГЛАВА 12. ПРОИЗВОДЯЩИЕ ФУНКЦИИ Легко заметить, что все числа G* положительны. Так что из полученной формулы следует,что последовательность четных чисел Эйлера — знакопеременная. Числа С7^ до сих пор не представлены в замкнутой форме. Не найдено в замкнутой форме даже G2^ = 0,91596559417721905460357... Легко видеть, что G^ ->• 1 при А; -> оо. Значит для модулей четных чисел Эйлера следует асимптотическая формула: \E2s\ = 4^(45/7ге)2*+1/2(1 + о(1)), а -+ оо. Для того чтобы получить формулу, выражающую числа Бернулли через числа Эйлера, рассмотрим следующие выражения: 2хе2х " е2х +1 chx Х6 Приравнивая коэффициенты при x2s в левой и правой частях полученного равенства, получаем равенство: 23 Отсюда следует, что положительное рациональное число (_i)*-i!Ii—2~1'В2°- является целым и, значит, натуральным. Обозначим через T2s-i это число. Кроме того, положим T2s = 0. Эти числа называют тангенциальными числами. Название совсем не случайное — производящей функцией для них служит тангенс: д то=0 □ Для доказательства этой формулы подставим в основную формулу для чисел Бернулли h = —х и f(x) = cos a:: 0 = cos Вх — cos(Bx — х) = (1 - cos x) cos Bx — х/2 • sin x =» => cos Вх = х/2 • „ = х/2 • ctg{x/2)n 1 — cos х
12.4. ЧИСЛА КАТАЛАНА И ФИБОНАЧЧИ 233 Приведем второй способ получения этой формулы: □ cos Вх + г sin Вх = eiBx = '. ^ + ix/2 = XJ* + ix/2. th{ix/2) ' tg{x/2) ' Разложение для тангенса получается из формулы: tgx = ctgx - 2ctg(2x) = x~l(cos2Bx - cos4B:r).D Первые тангенциальные числа {Тп}п>о имеют вид: 0,1,0,2,0,16,0,272,0,7936,0,353792,0,22368256,0,... Упражнения 1. Доказать, что tg{sinx)x!sin{tgx) -> 30 при х -> 0. 12.4 Числа Каталана и Фибоначчи Число Каталана Кп определяется как число расстановок п — 2 пар скобок в п сомножителях. Положим: К\ = А"г = 1- Очевидно, что К$ = 2. Есть ровно две возможности расставить скобки в трех сомножителях: а^агаз) и (а1Ог)аз- Получим рекуррентную формулу для чисел Каталана. Разделим все способы расстановки п — 2 скобок в сомножителях а\п2.. а„ на п — 1 случай по тому признаку какие группы множителей перемножаются в самом конце. В первом случае в самом конце а\ умножается на каким-то образом перемноженные множители (а2аз...ап). При этом одна из пар скобок расходуется на то, чтобы окружить последние п — 1 множителей, а остальные — на то, чтобы расставиться их в этих сомножителях. Число таких расстановок скобок равно Кп-\ = К\ • Кп-\. Во втором случае в самом конце перемножаются (а\аг) и {а^а^...ап). Оставшиеся п — 4 пары скобок расставляются во второй группе сомножителей. Число таких расстановок равно Кп-г = #2 * -Кп-2- Пусть в конце перемножаются группы множителей — {а\ ... а8) и (as+i... ап). Число способов расстановок скобок равно К3 • Кп-8. Отдельно следует рассмотреть случай, когда выделяется последний множитель. В итоге мы получили формулу: Кп = #!#„_! + К2Кп-2 + . . .
234 ГЛАВА 12. ПРОИЗВОДЯЩИЕ ФУНКЦИИ Для последовательности чисел Каталана можно рассмотреть ряд К(х) = Кгх + К2х2 + ... + Кпхп 4-.... Этот ряд называют (неэкспоненциальной) производящей функцией для чисел Каталана. Заметим, что К{Х) • К(х) = Klx2 + . . . + (#1#п-1 + #2#п-2 + - • ■ + #n-ltfl)zn + . . . . Правую часть этого равенства можно представить как К{х) - х. Допустим, что К(х) сходится для некоторого ненулевого значения х. В этом случае мы можем выразить сумму ряда из полученного уравнения: К(х) = (1 ± у/Г^4х)/2. Для того чтобы убедиться в том, что нужно выбрать знак минус, разложим корень в ряд по формуле Ньютона: fin (1 + zf = 1 + tz + th2/2\ + ... + —zm + ... mi n=l Свободный член этого ряда равен нулю, поэтому и выбран знак минус. Коэффициенты этого ряда можно представить в более удобной форме: (_l)"-i2n(l/2)u = (-I)71"1! • (1 - 2) • (1 - 4)... (1 - 2(n - 1)) = () ^^ Для запоминания удобна формула Кп+\ = (2£)/(п + 1). Легко проверить, что радиус сходимости этого ряда равен 1/4. Мы нашли ряд, который удовлетворяет соотношению, эквивалентному рекуррентной формуле для коэффициентов ряда К(х), и первые коэффициенты которого совпадают с коэффициентами ряда К (х). Значит он совпадает с рядом К(х). В заключении главы рассмотрим чрезвычайно простую числовую последовательность, которая известна своими приложениями. Это — числа Фибоначчи {Fn}n>o : 0,1,1,2,3,5,8,13,21,34,55,89,144,233,377,610,987,1597,...
12.4. ЧИСЛА КАТАЛАНА И ФИБОНАЧЧИ 235 Они строятся по простейшему рекуррентному правилу: Fn = i^Vi-i + Fn-2- Для нахождения замкнутой формы для их представления можно воспользоваться производящими функциями. Однако лучше воспользоваться стандартным методом решения разностных уравнений. По рекуррентной формуле составим квадратное уравнение: х2 = х 4- 1. Степени его корней ф = (1 + ^5)/2 = 2 cos 72° - 1 и £ = (1 - \/5)/2 = -2 cos 72° удовлетворяют рекуррентной формуле. Поэтому будем искать решение в виде Значит имеет место формула: Fn = (фп - фп)/у/5. Для больших п удобно пользоваться формулой: Fn = [фп/у/5 + 1/2J. Можно заметить, что отношение соседних чисел Фибоначчи является подходящей дробью разложения числа ф = {1;1,1,1,...} в цепную дробь. Поэтому для них имеется соотношение: ~~р ~Р ~ "рП? ^ Fn+tFn-i - Fn = (~1) . Впрочем, оно легко проверяется по индукции. Можно рассматривать разложение цепной дроби {xi\хг,яз> • • •} с переменными хп. Как и в предыдущем случае возникает последовательность, для которой отношения соседних членов будут давать подходящие дроби. Это будет последовательность многочленов {Fn(xi, Х2,... , хп) }п>0, которые называются контину антами. Для них имеет место рекуррентное соотношение: Fn = XnFn-i + Fn-2, Fo — 1, Fi = x\. По индукции легко проверяется следующее правило получения многочлена Fn: нужно взять произведение х\Х2 .. .хп и последовательно вычеркивать из него пары соседних переменных. Например для п = 4 получается формула: + Х3Х4 + х\х± 4- Х\Х2 + 1. Эта комбинаторная интерпретация позволяет подсчитать число одночленов степени п — 2Л у многочлена Fn. Каждому такому одночлену можно однозначно сопоставить последовательность из к единиц и п — 2к нулей — единицам будут места вычеркиваемых пар переменных одночлена
236 ГЛАВА 12. ПРОИЗВОДЯЩИЕ ФУНКЦИИ х\х2 ... хп. Число таких последовательностей равно (n^fe)- Отсюда получаем формулу: к=а Если в нее подставить х = 1, то получится новое представление чисел Фибоначчи в замкнутой форме: Данная комбинаторная интерпретация позволяет получить новую рекуррентную формулу: В самом деле, первое слагаемое учтывает все те одночлены, при получении которых не вычеркивалась пара хтжт+1, а второе слагаемое учитывает все остальные одночлены. Подставив в полученную формулу единицы вместо переменных, получим тождество для чисел Фибоначчи: В частности, F2k = (^/ь+i + ^fc-i)-Rfe- Из этого тождества по индукции можно получить, что Fnk делится на Fk. Действительно, Fnk = F(n_!)fc_1+ifc+i = Fjn.^jkFfc+i + J5^!»—1)*—i- Из этого несложно вывести, что HOfl(Fm,Fn) = ^нод(т,п)«
Глава 13 Дополнительные главы комбинаторики 13.1 Разбиения Простейшие свойства разбиений. Представление числа п в виде суммы к натуральных слагаемых называется разбиением п на. к частей, если порядок следования слагаемых считать несущественным. Обозначим число таких разбиений через Рк{п)- Это число не превосходит числа всех решений уравнения a?i Ч-а^ +... + ijt = nB натуральных числах: p*(n) < (JJl{). С другой стороны, каждое разбиение дает не более к\ решений этого уравнения. Значит имеет место оценка снизу: (£lj)/fc! < Pfc(n). Легко получить рекуррентную формулу для числа разбиений. Действительно, пусть нам дано разбиение числа п на к частей. Вычтем из каждой части по единице. В результате получилось разбиение числа п—к. Однако число частей при этом могло уменьшиться — исчезли части равные единице. Имеет место равенство: Рк(п) = рк(п - к) + pfc_i(n - к) + ... + pi(n - fc). В самом деле, несложно построить обратную процедуру. Пусть дано разбиение числа п — к на s < к частей. Добавим в каждую из частей по единице и создадим k — s новых частей, которые равны единице. Очевидно, что так получаются все разбиения числа п на к частей.
238 ГЛАВА 13. ДОПОЛНИТЕЛЬНЫЕ ГЛАВЫ КОМБИНАТОРИКИ Несложно получить число Р2(я)- В самом деле, пусть п == 2т4-1. Тогда несложно выписать все нужные разбиения: 1 + 2т, 2 4- (2т - 1), 3 + (2т - 2),... , т 4- (т + 1). Если из второй части каждой представленнной выше суммы вычесть единицу, то получаться все разбиения на две части для п = 2т. Получается формула: рг(п) = [п/2\. При помощи рекуррентной формулы несложно проверить формулу: {п2/12, п = 0 mod 6; (n2-l)/12, n = ±lmod6; (n2-4)/12, n = ±2mod6; (n24-3)/12, n = 3mod6. Последний пример показывает, что не имеет смысла пытаться представить в замкнутой форме число р*(п). Однако можно получать содержательные факты о свойствах разбиений (в качестве примера см. задачу из секцию 4 главы 12). Обозначим через р(п) число всех разбиений числа п. Удобно считать р(0) = р(1) = 1. Имеет место оценка: Из этого следует, что производящая функция этой последовательности— ряд Р(х) = ££Li p(n)xn — сходится при \х\ < 1/2. Для этого ряда имеется удобное представление в виде бесконечного ^произведения: т=1 в=0 т=1 Здесь мы свернули бесконечные геометрические прогрессии в дроби. Это бесконечное произведение бесконечных сумм. При раскрытии скобок отличное от единицы слагаемое выбирается лишь в конечном числе множителей. Подсчитаем, сколько подобных членов возникает при раскрытии скобок. Найдем коэффициент при хк. Пусть из первой скобки выбран член
13Л. РАЗБИЕНИЯ 239 xtl, из второй — я2*2,..., из fc-й скобки выбрали z*tfc, а из остальных скобок мы выбрали единицу. Каждый такой член соответствует решению уравнения i\ + 2i2 4-... 4- kik = к в целых неотрицательных числах. Каждое решение однозначно соответствует разбиению числа к на части (среди этих частей %\ единиц, гг двоек, ..., г* чисел к). Поэтому при хк коэффициент равен р(к). Обозначим через qn число разбиений числа п на различные части. Тогда для производящей функции Q(x) можно найти следующее представление: <?(*) = £ ЯтХт = (1 + Х)(1 + Х2)(1 + X3) .... т=0 В самом деле, после раскрытия скобок при хт будет стоять коэффициент, равный числу представлений m в виде суммы различных слагаемых. Весьма полезным методом представления разбиений служат диаграммы Феррера. Каждое разбиение представляется следующим образом. Расположим части по убыванию. Каждую из частей представим строчкой из одинаковых кружков, и расположим эти строчки друг под другом. Например, разбиение 7 + 5 + 3 = 15 представляется в виде: Меняя местами строки и столбцы, можно получить взаимно однозначное соответствие между разбиениями. При этом все разбиения на к частей переходят во-все разбиения с наибольшей частью, равной к. Разбиение называется самосопряженным, если оно не изменяется при замене в диаграмме Феррера строчек на столбцы. Имеет место следующее утверждение: Утверждение. Количество самосопряженнных разбиений числа п совпадает с количеством его разбиений на нечетные различные части. Доказательство. D Утверждение доказывается посредством установления взаимно однозначного соответствия. Возьмем диаграмму Феррера произвольного разбиения на различные нечетные слагаемые, и согнем под прямым углом вниз каждую строчку в центральном звене, затем последовательно приставим друг к другу полученные скобки. В результате получится диаграмма Феррера самосопряженного разбиения. □
240 ГЛАВА 13. ДОПОЛНИТЕЛЬНЫЕ ГЛАВЫ КОМБИНАТОРИКИ Разбиение из приведенного выше примера преобразуется к следующему виду: 4 + 4 + 44-3 = 15 Комбинируя метод производящих функций с диаграммами Феррера, можно получить важные комбинаторные тождества. При этом используются производящие функции от нескольких пременных. Примером такой функции служит бесконечное произведение Пт=1(1 + ухт). Легко видеть, что после раскрытия скобок, у члена укхп будет коэффициент qk (п) равный числу разбиений числа п на к штук различных частей. Имеется интересная конструкция, переводящая произвольное разбиение в два разбиения на различные части. Сначала к исходному числу добавляется к(к+1)/2. Геометрически реализуем это приставлением сверху в левый угол равнобедренного прямоугольного треугольника со стороной fc, составленного из кругов. Продолжая гипотенузу, мы разделяем получающуюся фигуру на две части. Опуская выступающие столбцы в полученных фигурах вниз, получим две диаграммы Феррера. Поменяв в первой из них строки со столбцами, получим две диаграммы со строками различной длины. В качестве примера рассмотрим разбиение 7 + 5 + 4 + 4+1 = 21 и к = 2, получим разбиения: 7 + 5 + 4 + 3 = 19 и4+1 = 5 В нашем случае первая из полученных диаграм имела к + 2 строки, а вторая 2 строки. В общем случае, если первая имеет fc+j строк, то вторая — либо j строк, либо j — 1 строк. Например, если в этом примере взять fc = 3, то получатся диаграммы с 5 строками и с одной строкой (j = 2). Заметим, что выполняется обратное построение — по разбиению на различные слагаемые с к + j строками и разбиению на различные слагаемые с .; или j — 1 строками строится разбиение числа, которое меньше суммы двух разбиений на к(к + 1)/2.
13.1. РАЗБИЕНИЯ 241 Станем обозначать через [xn]f(x) коэффициент при степени хп ряда Указанные построения приводят к следующей формуле: *!)/» ^ 1 =f>fc+j] Ш1 5=1 5=1 Действительно, в левой части при степени £*(*+i)/2+n стоит коэффициент р{п). В правой части при этой степени стоит коэффициент Теперь, записав в виде формулы наши комбинаторные преобразования, можно воспользоваться преобразованиями производящих функций. Прежде всего заметим, что [uj~l]f(u) = [u*]uf(u). Это позволяет вынести из второй скобки правой части формулы общий множитель, останется множитель 1 + и : оо со оо J=l 5=1 5=1 Сумма в правой части может быть преобразована так, что от одной переменной можно будет избавиться. Положим и"1 = и, тогда правая часть преобразуется к виду [vk] n^=i(l + vx*)(l + v"1^5"1). Заметим, что можно рассматривать отрицательные ft, формула останется верной. Действительно, если в левой части заменить к на -ft, то это эквивалентно замене ft на ft-1. Однако и в правой части подобные замены эквивалентны. В самом деле, обозначим f(v) = Il^iCl + vx*)ll + w-1xs). Тогда в правой части стоит выражение [**](! + v-^Hv) = [vk\f{v) + [vk+1)f(v). Заменив ft на —ft, получим:
242 ГЛАВА 13. ДОПОЛНИТЕЛЬНЫЕ ГЛАВЫ КОМБИНАТОРИКИ Сложим все полученные равенства по всем целым к (при к = 0 это равенство 1=1) с множителем vk и умножим обе части на множитель nnii(l ~ х*) (он сократится в левой части): оо Л=-оо нтагональ а- ОО ная теорема + vx*)(l- Эйлера. ■)....j Имеет оо место IV* •о:5 го^ -1) ). сце Доказательство. D Заменим в предыдущем равенстве х на ж2, и яи на?/ : оо оо ~1V1 4-1Г1г2а-1\С\ — r2s^ 'у* = J](l + В полученном равенстве осталось заменить х на ж3/2, и у на -а; Х/2. Теорема. Имеет место рекуррентная формула: р(т) = р(т -1)4- р(т - 2) - р(т - 5) - р(т - 12) + ... & Доказательство. D Продифференцировав равенство Р(х)-(1/Р(х)) = 1, получим формулу Р'(х)(1/Р(х)) = -Р(х)(1/Р(ж))/. Умножив обе части на х, подставим в эту формулу пентагональное тождество: n=0 (E^)( E н n=0 Jk=—oo Коэффициент при хт имеет вид: n+Jk(3A:-l)/2=m n+Jk(3ik-l)/2=m
13.1. РАЗБИЕНИЯ 243 / \~ ) n+Jfc(3fc-l)/2=m Сокращая последнее равенство на общий множитель к\зк2~1) + п = т, получим доказываемую формулу. □ Однако из равенства 1a?#-1)(l - xs) Jk=-oo s=l можно вывести еще одну знаменитую теорему Теорема (тройное равенство Якоби). Имеет место тождество: аг)3(1 - а;2)3(1 - я3)3 ... = Доказательство. D Для удобства в тройном равенстве Якоби и в исходном равенстве заменим i на i2. В исходном равенстве заменим v на -у и разделим обе части на один из множителей правой части — на 1-ху : к=-оо 8=1 Преобразуем левую часть: (1 - xy)~l(I + £fex(—l)*a?*2(tf* +2/~*)J (l+xy+{xyf+. •. )(1-14Ч2kk2 Ч* m=l + ... + (- Подставив у = аГ"1, мы получим в правой части В левой части получится сумма: тп=1
244 ГЛАВА 13. ДОПОЛНИТЕЛЬНЫЕ ГЛАВЫ КОМБИНАТОРИКИ Заметим, что в скобках сокращаются все члены, за исключением члена (—1)ьхь^г+1\ где t = L\/^J- В полученной сумме этот член будет повторяться 2t+l раза подряд (для га = t2, t2 + 1,... , t2 -f 2t). Так что в итоге возникает сумма: 1 + J^l(-l)t(2t + l)s'(t+1)-0 Легко заметить, что р(4) = 5, р(5) = 7, р(6) = 11. Индийский математик Рамануджан заметил, что эти равенства — лишь начальные шаги общих закономерностей. Теорема (Рамануджан). 5|р(5п + 4); 7|р(7п + 5); 11|р(11п + 6). Доказательство. О При помощи полученных выше тождеств мы докажем первые две делимости. Для доказательства третьей нужны менее элементарные методы. Для доказательства первой закономерности мы покажем, что все коэффициенты производящей функции arll^iU - Xs)"1 при кратных пяти степенях делятся на пять. Мы сделаем это, если представим эту функцию в виде произведения двух степенных рядов с целыми коэффициентами, у первого из которых на пять деляться коэффициенты при степенях кратных пяти, а у второго ряда на пять будут делится все коэффициенты у степеней не кратных пяти. В самом деле, при раскрытии скобок кратные пяти степени из произведения получаются лишь при перемножении либо двух кратных пяти степеней из сомножителей, либо из двух не кратных пяти степеней из сомножителей. В обоих случаях коэффициент будет делиться на пять. В качестве первого множителя возьмем ряд ^rim=i(^ ~ xs)A. Второй множитель — О -*w)-e m=l будет удовлетворять указанному условию, потому что к нему можно применить полиномиальную формулу: Первый множитель можно представить в виде: ( £ f
13.1. РАЗБИЕНИЯ 245 Пусть в произведении оказалась кратная пяти степень: 5|(fc(3fc—l)+m(m+ 1))/2 + 1 =► 5|4fc(3fc - 1) + 4m(m + 1) + 8 = 2(* - I)2 + (2m + I)2 + 10fc2 + 5. Получается, что на 5 делится сумма 2а2 + б2, где а = к — 1 и Ь = 2т 4-1. Перебором остатков получим, что отсюда следует, что 5|а и 5|Ь. Однако при перемножении этих степеней коэффициент равен (-l)*+m(2m+l). Он делится на пять. Значит после приведения подобных все коэффициенты при кратных пяти степенях делятся на пять.О Доказательство второго свойства совершенно аналогичное. Представим функцию х2 n^i(l -ж5)""1 в виде произведения седьмой степени производящей функции для чисел р(п) и функции х2 f[%x(l — х3)6. Достаточно доказать, что у последней функции все коэффициенты при кратных семи степенях делятся на семь. Согласно тройному тождеству Якоби эта функция принимает вид: ( ) ( k=0 m=0 Пусть при раскрытии скобок произведение двух множителей дало кратную семи степень: 7\(к(к + 1) + т{т 4-1))/2 + 2 => 7|4fc(fc + 1) + 4т{т + 1) + 16 = (2* + I)2 + (2т + I)2 + 14. Однако сумма квадратов делится на семь тогда и только тогда, когда каждый из них делится на семь. Легче всего это проверить прямым перебором остатков. Значит, числа 2к + 1 и 2т + 1 делятся на семь. Поэтому, коэффициент при этой степени делится на семь. □ Упражнения 1. Из пентагональной теоремы Эйлера вывести рекуррентную^ формулу для сг(п) — суммы всех натуральных делителей натурального числа п: к Здесь а(т) = 0,ш < 0; а(0) = fc, если п =
246 ГЛАВА 13. ДОПОЛНИТЕЛЬНЫЕ ГЛАВЫ КОМБИНАТОРИКИ 13.2 Блок-схемы Примеры конфигураций. Пусть дано 17-элементное множество У, и в нем выделено Ь подмножеств Xi,A2,... ,Хъ (называемых блоками) по к элементов в каждом. Пусть каждый элемент встречается ровно в t блоках, и каждая пара элементов встречается ровно в А блоках. Типичным примером такой блок- схемы является проективная плоскость порядка п. В этом случае v = Ь = п2 + п + 1, fc = t — п + 1, А = 1. Более простым примером служит система троек Штайнера: b = v(v — 1)/6, А: = 3, t = (v — 1)/2, А = 1. Задача о семи налоговых полицейских (см. секцию 2 главы 6) доставляет нам пример наименьшей проективной плоскости и наменыпей нетривиальной системы троек Штайнера одновременно. Утверждение. Для любой блок-схемы имеют место соотношения: vt = bk, t(k-l) = \{v-l). Доказательство. П Для получения первого соотношения подсчитаем число элементов во всех блоках. С одной стороны, оно равно числу элементов в блоке, умноженному на число блоков. С другой стороны, оно равно числу всех элементов множества V, умноженному на число блоков, в которых встречается произвольный элемент. Для получения второго соотношения найдем количество пар, в которые входит произвольно выбранный элемент во всех блоках, где он встречается. С одной стороны, это число равно числу отличных от него элементов каждого блока, где он встречается, умноженное на число таких блоков. С другой стороны, оно равно числу вторых элементов пар, в которые входит этот элемент, умноженному на число появлений каждой из этих пар. D Для троек Штайнера эти условия определяют размеры множества V. Число v должно быть нечетным, и число v(v — 1) должно делиться на 6. Значит это число имеет вид 6n -f 1 или бп + 3. Для этих чисел система троек Штайнера может быть построена при помощи некоторого конструктивного метода. Что касается проективной плоскости, то до сих пор ее удавалось строить, когда порядок имеет вид степени простого числа. Мы можем строить проективную плоскость порядка п по системе из п — 1 попарно ортогональных латинских квадратов п х п (см. секцию 2 главы 6). В свою очередь, такая система строится по числовой системе,
13.2. БЛОК-СХЕМЫ 247 состоящей из п элементов» Для случая простого числа п = р у нас такая система имеется — это множество вычетов Z/p. Этот пример можно обобщить на случай п = рк. Напрашивающаяся система Ъ(рк не подходит. Дело в том, что при доказательстве свойств получающихся латинских квадратов мы пользовались тем, что любой ненулевой элемент числовой системы имеет обратный. В этом множестве вычетов каждый р-й элемент не имеет обратного. Нужно строить новую числовую систему из рк элементов. Она носит название «поле Галуа» и обозначается через GF(pk). Поля Галуа. Построение поля Галуа в точности напоминает построение простого расширения поля рациональных чисел (см. секцию 3 главы 10). Пусть дан неприводимый многочлен f(x) степени п с коэффициентами из Z/p. Элементами GF(pn) служат выражения вида ао+п\Х+...4-an-ixn~x, где at G Z/p. Эти выражения складывают и умножают как многочлены. При умножении степень может стать больше или равной п, тогда полученный результат заменяют на остаток от деления на f{x). Обратный элемент ищется точно также, как для простого расширения поля рациональных чисел — при помощи алгоритма Евклида. Рассмотрим простейший пример — построим GF(4). Неприводимый квадратный трехчлен с коэффициентами в Z/2 только один, это — х2 + х +1. Поле GF(4) состоит из четырех элементов: 0, 1, х, х + 1. Сложение как у многочленов. х2 = х +1, (х + I)2 = х, х(х + 1) = 1. Теперь можно по известному алгоритму построить проективную плоскость на 21 точке (см. секцию 2 главы 6). При помощи линейной алгебры несложно показать, что любая конечная числовая система, замкнутая относительно четырех арифметических операций, имеет рк элементов. Для этого нужно было бы подробно разбирать систему аксиом подобной системы — абстрактного поля (см. замечание из секции 1 главы 10). Мы не^станем здесь этим заниматься. Вместо этого исследуем свойства этого объекта. Заметим, что в конечном поле выполняется малая теорема Ферма: арк~1 = 1 для а ф 0. Доказательство дословно переносится со случая вычетов: все ненулевые элементы помножаются на а (от этого они лишь переставляются), а затем все они перемножаются и т.д. . Отсюда следует, что все элементы поля GF(pn) являются корнями
248 ГЛАВА 13. ДОПОЛНИТЕЛЬНЫЕ ГЛАВЫ КОМБИНАТОРИКИ многочлена хр - х. Из общей теории полей отсюда извлекается принципиальная эквивалентность всех полей с рк элементами — элементы любых двух таких полей можно так переобозначить, что сложение и умножение будут сохранять эти обозначения. Из теории вычетов на конечные поля можно перенести нечто более существенное — можно ввести порядок для каждого ненулевого элемента и дословно перенести доказательство существования примитивного элемента, степенями которого являются все ненулевые элементы. Теорема. Многочлен хр — х по модулю р имеет неприводимые множители степеней, которые являются делителями числа А;. Лемма 1. Многочлен хт — 1 делит многочлен хп — 1 тогда и только тогда, когда т делит п. Доказательство. D Если т делит п, то имеет место делимость многочленов. Обратно, пусть делятся многочлены, и п = ms + г, 0 < г < т. Тогда имеет место равенство: /ГП — 1 TmS — 1 ТГ — 1 zz. ** — *^ ' zz т~ * -», -Г • В правой части стоит сумма многочлена и правильной рациональной дроби. Значит хп — 1 не делится на хт - 1.П Лемма 2. Если а > 1 — натуральное число, то ат — 1 делит ап — 1 тогда и только тогда, когда т делит п. Доказательство. □ Нужно в предыдущем доказательстве заменить х на a. D Доказательство теоремы. D Пусть поле GF(pn) содержит поле GF(pm). Тогда многочлен хрП~1 - 1 делится на многочлен хрТП~1 - 1. По лемме 1 рп — 1 делится на рт -^1. По лемме 2 п делится на тп. Наличие неприводимого множителя степени s у многочлена эквивалентно существованию вложения GF(ps) С GF(pk). Поэтому число к должно делиться на 5. □ Заметим, что многочлен хр — х не имеет кратных множителей. Действительно, аналогично числовому случаю доказывается, что наличие кратного множителя у многочлена приводит к делимости производной на этот множитель. Однако производная исходного многочлена имеет вид ркхр ~г — 1 = — 1, и не может делиться на многочлен положительной степени. Задача. Проверить рекуррентную формулу ^2d\ndPd = pn для числа Рп неприводимых многочленов степени п с коэффициентами в Ъ{р и
13.2. БЛОК-СХЕМЫ 249 старшим коэффициентом единицей. D Всего многочленов степени s со старшим коэффициентов единицей ра штук. Производящая функция последовательности {рп}п>о может быть записана в виде (1 - рх)~х. С другой стороны, многочлены можно представлять в виде произведения неприводимых многочленов. Эту же производящую функцию можно представить в виде произведения геометрических прогрессий вида (1 -f хт + х2т + ...) = (1 - xm)-1 для каждого неприводимого многочлена степени т. После раскрытия скобок член xiimi ■ х*2™2.. .х*3™3 будет соответствовать многочлену, который при разложении на множители дает *i +*2 + - • -+*в неприводимых множителей, из которых ровно s различных. Таким образом, приведенный выше скобка будет встречаться в произведении ровно Р{ раз, а само произведение будет иметь вид: ш=1 Напомним разложение логарифма в ряд: —1п(1 — z) = Y^Li *sl$- Возьмем логарифм от обеих частей полученного равенства, представим логарифм бесконечного произведения бесконечной суммой и разложим логарифмы в ряды: n=0 m=l Jt=l Приравняем коэффициенты при степени п в левой и правой частях: тпк=п В итоге получилась рекуррентная формула: Yjd\ Из полученной формулы легко получить оценки для Рп. С одной стороны, пРп < рп. С другой стороны, Рп < d=l d=l P Мы п - 1 раз воспользовались предыдущей формулой. Последнюю формулу можно переписать в виде:
250 ГЛАВА 13. ДОПОЛНИТЕЛЬНЫЕ ГЛАВЫ КОМБИНАТОРИКИ Отсюда следует положительность всех чисел Рп. В частности, мы доказали существование неприводимых многочленов любой степени, и, значит, всех полей Галуа. Упражнения 1. Построить проективную плоскость на 21 точке. 2. Найти все неприводимые многочлены по модулям 2 и 3 первых пяти степеней. 13.3 Теорема Рамсея Любые три точки, не лежащие на одной прямой, являются вершинами треугольника. Если взять четыре точки, никакие три из которых не лежат на одной прямой, то не всегда они являются вершинами выпуклого четырехугольника. Может получиться и невыпуклый. Однако если взять пять точек с этим свойством, то среди них можно выбрать четыре вершины выпуклого четырехугольника. В самом деле, если выпуклая оболочка этих точек — четырехугольник или пятиугольник, то доказывать нечего. Еще может получиться треугольник, внутри которого лежат две точки. Проведенная через эти две точки прямая не может проходить через вершины треугольника и делит его на две части — треугольник и четырехугольник- В качестве вершин выпуклого четырехугольника можно взять две вершины, через которые проводили прямую, и две вершины полученного в результате этого четырехугольника, не лежащие на этой прямой. Несколько труднее доказать, что для получения вершин выпуклого пятиугольника нужно взять девять точек, никакие три из который не лежат на одной прямой. Задача. Какое минимальное количество точек, никакие три из которых не лежат на одной прямой, нужно взять для того, чтобы среди них нашлись все вершины выпуклого fc-угольника? Для первых чисел Акподходит ответ — 2к~2 + 1. Можно утверждать, что конечный ответ всегда существует. Чтобы доказать этот факт, нужны особые логические методы. Теорема Рамсея. Разделим в N-элементном множестве X все г- элементные подмножества на два непересекающихся класса МъМ произвольным образом. Можно утверждать, что существует такое число ЛГ(т, n, г (т>г,п>г), что при N > N(m,n,r) выполняется альтернатива:
13.3. ТЕОРЕМА РАМСЕЯ 251 либо существует такое m-элементное множество U С X, что все его г- элементные подмножества лежат в М, либо существует такое п-элементное множество V С X, что все его r-элементные подмножества лежат в Af. Станем обозничать через N(m,n,r) наименьшее из таких чисел. Сначала выведем из теоремы решение нашей проблемы. □ Возьмем т = fc, п = 5, г = 4. Пусть X будет множеством точек плоскости, никакие три из которых не лежат на одной прямой, М — класс всех наборов изо всех вершин выпуклых четырехугольников. Согласно теореме Рамсея при N > N{myn^r) среди точек X будет либо fc-элементное подмножество, все четверки точек которого будут вершинами выпуклых четырехугольников, либо пятерка точек, для которой любой набор из четырех точек будет давать невыпуклый четырехугольник. Однако вторая возможность никогда не выполняется, как мы показали выше. Что касается первой возможности, то она в точности соответствует выпуклому fc-угольнику. Для доказательства этого факта воспользуемся методом математической индукции. Для к = 4 это утверждение тривиально. Пусть оно выполняется для fc-угольника. Докажем его для (А; + 1)-угольника. Выделим одну точку. Согласно предположению индукции, остальные точки являются вершинами выпуклого fc-угольника. Выделенная точка не может лежать внутри него, так как попадет в этом случае внутрь треугольника с вершинами в рассматриваемых точках, что нарушает условие о выпуклости всех четырехугольников. Значит выделенная точка лежит вне выпуклого fc-угольника. Соединим ее с остальными точками отрезками. Стороны fc-угольника дадут fc треугольников, которые не содержат внутри себя других вершин. Значит ровно один из этих треугольников лежит целиком вне fc-угольника, гранича с ним только по стороне. Заменив эту сторону на две других стороны треугольника, мы из fc-угольника получим выпуклый (fc + 1)- угольник с вершинами в рассматриваемых точках. D Доказательство теоремы Рамсея. □ Проведем индукцию по г. Для г = 1 легко найти, что N(n, m, 1) = n 4- т - 1. Действительно, если разбить (п + т — 1)-элементное множество на две части, то из того, что в первой из них меньше чем п элементов, следует, что во второй содержится хотя бы т элементов. Для меньшего числа элементов уже возможно нарушение условия для обеих частей. Пусть это утверждение доказано для некоторого г -1. Докажем его для г. Для произвольных п> гит>г имеет место неравенство: N(n, m, r) < N(N(n-l} m, г), ЛГ(п, тп-1, г), г-1)+1. Из этого неравенства следует наше
252 ГЛАВА 13. ДОПОЛНИТЕЛЬНЫЕ ГЛАВЫ КОМБИНАТОРИКИ утверждение. В самом деле, N(u,r,r)=u и N(r,v,r)=v для произвольных и и v (если в u-элементном множестве не все r-элементные подмножества лежат в классе М, то одно из них можно взять в качестве V). При помощи этого неравенства отсюда вытекает существование числа N(r + 1,г + 1,г)<ЛГ(г + 1,г4-1,г-1) + 1. Затем можно получить существование чисел N(r + 2}r + lyr) и N(r 4- 1,г 4- 2, г). Продолжая эти рассуждения можно получить существование числа N(u, v, r) с произвольными и и v (в процессе доказательства можно двигаться по слоям с постоянным и + v). Докажем исходное неравенство. Рассмотрим разделение г-элементных подмножеств (N(N(n - 1, m, r), N(n, m -1,г), г — 1) 4- 1)-элементного множества X на непересекающиеся классы Л4 и АЛ Выделим в X элемент я. Пусть не существует ни нужного n-элементного подмножества, не содержащего элемент х, ни нужного m-элементного подмножества, не содержащего элемент х. Если из каждого r-элементного подмножества, содержащего элемент ж, его исключить, то получатся как раз все (г - 1)- элементные подмножества в X \ {ж}. В результате эти подмножества разбиваются на два класса. Если (г — 1)-элементные подмножества множества X \ {х} произвольным образом разделить на два класса, то либо существует N(n — 1, m, r)- элементное множество U со всеми (г — 1)-элементными подмножествами из первого класса, либо N(n - 1,т,г)-элементное множество V со всеми (г - 1)-элементными подмножествами из второго класса. Пусть выполняется первая возможность. Тогда для множества UU{x} все r-элементные подмножества, содержащие элемент ж, лежат в классе М. Пусть существует (п- 1)-элементное подмножество в С/, у которого все r-элементные подмножества лежат в классе М. Тогда все г-элементные подмножества n-элементного множества U\J{x) лежат в М. В противном случае существует m-элементное подмножество в [/, у которого все г- элементные подмножества лежат в классе N. Эта возможность никогда не реализуется, так как х $ U. Итак, мы нашли нужное п-элементное множество. Совершенно аналогично доказывается, что из существования множества V вытекает существование ш-элементного подмножества Х> все г- элементные подмножества которого лежат в классе Л/'.П Вычисление чисел 7V(n,m,r) представляет собой нерешенную задачу. Не разобран даже самый легкий нетривиальный случай г = 2. Для этого
13.3. ТЕОРЕМА РАМСЕЯ 253 случая легко проверить следующую оценку: (n + m-2)1 D Применим двойную индукцию по п и га. Согласно доказанному неравенству: JV(n,m,2) < N{N(n - l,m,2),iV(n,m - 1,2), 1) + 1 = N(n - 1,л Пример. D#(3,4,2) < (*) = 10. Можно показать, что iV(3,4,2) = 9.D Для этого случая имеется занятная геометрическая интерпретация. Исходное множество X можно изображать точками плоскости. Двухэлементное подмножество можно изображать отрезком, соединяющим соответствующие точки. Напомним (см. секцию 2 главы 12), что такую конфигурацию называют графом, точки — вершинами графа, отрезки — его ребрами. Если рассматривать все возможные ребра, то такой граф называется полным. Разделение всех двухэлементных подмножеств на два класса можно интерпретировать как раскраску ребер графа в два цвета — белый и черный. Теорема Рамсея утверждает, что найдутся либо п вершин, которым соответствует полный граф со всеми белыми ребрами, либо т вершин, которым соответствует полный граф со всеми черными ребрами. Например, равенство N(3,4,2) = 9 означает, что, как ни раскрашивай полный граф с девятью вершинами, все равно найдутся либо белый треугольник, либо черный «конверт» (полный граф на четырех вершинах). Эта интерпретация наводит на мысль, что графы можно раскрашивать в несколько цветов. Разделение на непересекающиеся классы всех двухэлементных подмножеств некоторого множества эквивалентно раскраске ребер полного графа с данным множеством вершин. При этом раскраска ребер в два цвета, соответствует выделению некоторого^графа с данным множеством вершин (в первый цвет выкрашены ребра этого графа, во второй цвет выкрашены ребра дуального или дополнительного к исходному графа). Заметим, что оценка для числа N(n, n, 2) из теоремы Рамсея дает следующий результат: Следствие. Если число вершин графа не меньше чем (2™1?),
254 ГЛАВА 13. ДОПОЛНИТЕЛЬНЫЕ ГЛАВЫ КОМБИНАТОРИКИ то либо он сам, либо дуальный граф содержат полный подграф с не менее чем п вершинами. □ Интересно найти наименьшее число вершин для графов с приведенным выше свойством. Можно показать, что оно не меньше чем 2п12. Интерпретация с раскрасками ребер полного графа приводит к более общей формулировке теоремы Рамсея. Теорема Рамсея для нескольких классов. Разделим в N-элементном множестве X все r-элементные подмножества на А; штук непересекающихся классов Mi(l < i < к) произвольным образом. Можно утверждать, что существует такое число N{m\, тпг,... , т*,г)(тп{ > г), что при N > N(m\, W2,.. • , mjt, r) выполняется одно из следующих условий: существует такое т,-элементное множество Ui С Ху что все его г- элементные подмножества лежат в Mj(l < i < i), Через N(mi,ra2,... ,mk->r) станем обозначать наименьшее из таких чисел. □ Доказательство теоремы в этой формулировке совершенно аналогично приведенному выше. □ Аналогично предыдущему можно доказать неравенство: »х - 1)!, (т, - 1)! (т. - Интересно отметить, что эту теорему доказал английский логик Рам- сей для бесконечных множеств. Формулировка этого варианта теоремы имеет вид: Теорема Рамсея для бесконечных множеств. Пусть все г-элементные подножества бесконечного множества X распределены между конечным числом непересекающихся классов. Тогда существует бесконечное множество U С X такое, что все его r-элементные подмножества лежат в одном из этих классов. Имеются удобные для некоторых случаев варианты теоремы Рамсея, в которых утверждается существование для каждого из классов множества £/,-. За это приходится платить тем, что число элементов во множествах Ui не фиксировано. При этом можно фиксировать общее число элементов, входящих в эти множества. Теорема. Разделим в TV-элементном множестве X все г-элементные подмножества на к штук непересекающихся классов М%(\ < г < к) произвольным образом. Можно утверждать, что существует такое число ДО*(п, г),
13.3. ТЕОРЕМА РАМСЕЯ 255 что при N > 7Vfc(n,r) выполняется условие: существуют такие непересекающиеся множества что все г-элементные подмножества С/» лежат в Mi(l <г< к). Через Nkin.r) станем обозначать наименьшее из таких чисел. Доказательство. D Очевидно, что Ni(n,г) = п (n-элементное множество имеет п элементов — вот и все, что здесь утверждается). Станем доказывать это утверждение для произвольного к индукцией по г и п. Первый шаг — Nfc(n, 1) = п (если разделить п-элементное множество на к непересекающихся частей, то их самих можно взять в качестве Ui). Пусть доказано существование 7Vjt(n,r - 1) для всех п. Очевидно, что при п < rNkin, r) = n (r-элементных подмножеств нет вовсе). Также ясно, что Nfc(r, r) = r (возможно ровно одно r-элементное подмножество). Пусть доказано существование числа Nk {п—1, г) (п > г), докажем существование числа iV^(n,r). Имеет место неравенство Nk(n,r) < N = Nk(kNk(n - l,r),r - 1) + 1. В самом деле, разобьем все r-элементные подмножества N-элементного множества кале сказано в формулировке теоремы. Рассмотрим произвольный элемент этого множества. Все г — \ элементные подмножества множества X \ {х} наследуют разделение на к классов: отнесем к г-му классу все те (г — 1)-элементные подмножества, которые при добавлении элемента принадлежат к г-му классу в большем множестве. Однако это разделение на классы находится в уже доказанном случае нашего утверждения — N — 1 = Nk(kNk(n — l,r),r — 1). Значит существуют такие Vi,... ,14 — подмножества X \ {х}, что их (г — 1)-элементные подмножества лежат в указанных классах, и общее число принадлежащих им элементов равно кЩ{п — 1,г). Хотя бы в одном из V{ число элементов не меньше |-й части от их общего количества. Пусть это будет множество Vi(|Vi| > Nk(n — 1,г)). Его r-элементные подмножества разбиты на классы исходным разбиением таких подмножеств во множестве . Однако число элементов в V\ удовлетворяет доказанному ранее случаю исходной теоремы. Этот случай соответствует выбору непересекающихся подмножеств с общим числом элементов, равным п — 1. Обозначим выбранные таким образом подмножества множества Vi через C/i,... ,f/ь Если бы в них было бы п элементов, то индуктивный шаг был бы осуществлен.
256 ГЛАВА 13. ДОПОЛНИТЕЛЬНЫЕ ГЛАВЫ КОМБИНАТОРИКИ Добавим в U\ выбранный вначале элемент . Нужно лишь проверить, что в исправленном множестве все r-элементные подмножества лежат в первом классе. Если такое подмножество не содержит , то оно по определению лежит в нем. Если же это подмножество получается из (г — 1)- элементного добавлением , то это (г — 1)-элементное подмножество лежит во множестве Vi, которое по построению содержит только такие (г — 1)- элементные подмножества, что при добавлении элемента лежат в первом классе. □ Замечание. Использованное выше неравенство для чисел JVjt(n,r) приводит к следующей оценке для г = 2: оч 2k71-1 - кп~2 - 1 2)< 2)<. D В самом деле, по индукции этот факт легко проверяется: 1 _ 2кп - кп~1 - к + к - Упражнения 1. Если число вершин графа не меньше чем 34п~1 -1, то либо он сам, либо дуальный граф содержат полный подграф с не менее чем п вершинами. Указание. Достаточно рассмотреть оценку для числа #2(2п,2). Заметим, что это гораздо более слабый результат, чем приведенное выше следствие из теоремы Рамсея. 2. Вывести теорему Рамсея в первоначальной формулировке (то есть для бесконечных множеств) из последней теоремы этой секции.
КОЛОСОВ ?! pi •й #-..: ' .:.'•; /:Г- 1 : - - 1 j I Колосов Вадим Александрович научный сотрудник кафедры математикиу СУНЦ МГУ HMr^VI. В. Ломоносов;). В 1987 г. окончил механико-математический диссертацию_ш.специальности «Геометрия и "топология». В настоящее нремя сфера научных интересов — алгебраическая алгоритмика. ' ;; ; комбинп i орная геометрия. i Теоремы и'Зад^чи алгебры, теории чисел и комбинаторики