Текст
                    Введение в алгебру, теорию чисел и
комбинаторику
Колосов В.А.
31 августа 1999 года, испр. 1 марта 2001 года

2 В этой книге даётся введение в современную комбинаторику и теорию чисел. Она представляет собой начальный курс для студентов математи- ков и информатиков, решивших специализироваться в этих областях или использовать их в работе. Ныне набирает силу тенденция повышения роли конкретной математики, а принятый здесь элементарный подход находится в русле этой тенденции. Главное место в нашей книге играют примеры и задачи, а не теории и аксиоматика. Для понимания основной части книги не требуется знаний, выходящих за рамки школьной программы. Решение уравнений через различные классы функций — основная тема элементарной алгебры — является в этой книге главным стимулом для вве- дения новых понятий. Мы используем ныне забытый подход к решению уравнений — метод резольвент (глава 4). Он напрямую связан с группами перестановок и симметрическими многочленами, которые вводятся как раз в связи с этим методом (глава 9). Затем в главе 9 даётся доказательство теоремы Абеля-Руфини с заранее оговариваемым пробелом (допущенным в свое время Руфини). Зато приведенное доказательство иллюстрирует связь дискриминанта и кососимметрических функций — объектов, стоящих за решением уравнений, но не используемых при обычном подходе. Изложе- ние доводится до групп Галуа уравнений на конкретных примерах (глава 10). Кроме того, исследуется решение уравнений через тригонометрические функции (как обычные, так и гиперболические). Эта малоизвестная тема имеет прямое продолжение в высших областях алгебры — общие уравнения выше четвертой степени решаются через некое обобщение тригонометриче- ских функций на случай комплексного переменного (т.н. тэта-функции). В этой книге подробно изучаются уравнения первых четырех степеней. Все необходимые для этого сведения от теоремы Безу до комплексных чисел да- ются в первых главах книги. В 11 главе разбираются ныне незаслуженно забытие главы элементарной алгебры — исключение неизвестных при по- мощи результанта и преобразование Чирнгаузена. Арифметическим вопросам посвящены 5-8 и 10 главы. Основной задачей, для решения которой и вводятся новые понятия, служат уравнения в целых числах. В 5 главе изучаются цепные дроби и уравнение Пелля. Классы вы- четов вводятся в б главе для решения арифметических, криптографических и комбинаторных задач. Глава 7 посвящена обсуждению квадратичного за- кона взаимности и его приложений. Гауссовы суммы изучаются в 8 главе. Дается их приложение к построению правильных многоугольников. Глава 10 посвящена полям алгебраических чисел. В соответствии с принятым эле- ментарным подходом мы рассматриваем лишь числовые поля. Стимулом для введения этих понятий служат задачи о построении цирклем и линей-
3 кой. В главе 11 и главе 13 также затрагиваются арифметические вопросы — теорема Лиувилля о приближении алгебраических чисел, критерий Дюма неприводимости целочисленных многочленов и вычисление числа неприво- димых многочленов над полем вычетов. Главы 3, 9, 12 и 13 представляют собой введение в современную ком- бинаторику с нулевого уровня. В 3 главе вводятся основные элементарные комбинаторные понятия. Мы отказались от традиционного подхода с разме- щениями, сочетаниями и перестановками. Ключевым инструментом служат убывающие степени (дающие число размещений). Они тесно связаны с про- изводящими функциями — основным инструментом комбинаторной науки. В главе 9 изучаются перестановки. Здесь доказываются теоремы о наимень- ших разложениях перестановок в произведение транспозиций (в частности, ’’соседних” транспозиций). Последние две главы требуют большей матема- тической подготовки от читателя — нужно знать математический анализ и простейшие понятия теории групп. Глава 12 посвящена изучению про- изводящих функций и различных систем специальных чисел (Стирлинга, Эйлера, Белла, Бернулли, Эйлера с одним индексом, тангенциальных, Ка- талана и Фибоначчи). Производящие функции вводятся для доказательства теоремы Пойа о перечислении раскрашиваний. В главе 13 излагаются клас- сические результаты о разбиениях натуральных чисел, полях Галуа и тео- рии Рамсея.
4
Оглавление 5
6 ОГЛАВЛЕНИЕ
Глава 1 Многочлены и алгебраические уравнения 1.1 Схема Горнера. Теорема Безу Пусть уравнение ж3 + aix2 + а^х + аз = 0 имеет корни Ж1,Ж2,тз. Тогда его левую часть можно представить в виде (х — xi)(x — xz)(x — Х3). Рас- кроем скобки и приравняем коэффициенты при одинаковых степенях пере- менной. Получаем следующую систему уравнений относительно перемен- ных Ж1,Ж2,тз : Xi + Х2 + хз = -а < Ж1Ж2 + Х2Х3 + Ж3Ж1 = b ХзХ2Хз = -Ь. Эта система имеет решение (и, v, w) тогда и только тогда, когда множе- ство {w, v, w} является множеством всех решений исходного уравнения. Та- ким образом, решения системы будут получаться из множества решений уравнения выписыванием всех элементов этого множества в определенном порядке. Этот факт составляет содержание теоремы Виета для уравнения третьей степени. Разберем следующую классическую задачу. 7
8 ГЛАВА 1. МНОГОЧЛЕНЫ И АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ Решить систему: х + у + z = а < х2 + у2 + z2 = а2 х3 + у3 + z3 = а3 для произвольного значения параметра а. Чтобы применить теорему Виета в этом случае нужно преобразовать эту систему в систему Виета для уравнения третьей степени. Первое уравнение уже имеет нужный вид. Со вторым уравнением справиться несложно: х2 + у2 + z2 = (х + у + z)2 — 2(ху + yz + zx) = а2 — 2(ху + yz + zx) = а2. Второе уравнение принимает вид ху + yz + zx = 0. Чтобы преобразовать третье уравнение придется воспользоваться тождеством: ж3 + у3 + z3 — 3xyz = (х + у + z)(x2 + у2 + z2 — ху — yz — zx) = = (х + у + z)((x + у + z)2 — 3(ху + yz + zx)) = а3. Отсюда получаем третье уравнение: xyz = 0. Система Виета принимает вид: х + у + z = а < ху + yz + zx = 0 xyz = 0. Она соответствует уравнению третьей степени: t3 — at2 = 0. Множество корней имеет вид: {0,0,а}. Решения системы составляют следующее мно- жество при а 0 : {(а, 0,0), (0, а, 0), (0,0, а)}. При а = 0 имеется ровно одно решение системы — (0,0,0). Совершенно аналогично получается теорема Виета для уравнения че- твертой степени х4 + «| ж3 -Ьагж2 -Ьазж + сц = 0 с корнями xi, Х2, ®з, ®4- Левая часть уравнения принимает вид: (х — х±)(х — х%)(х — хз)(х — хц). Раскрыв скобки и приравняв коэффициенты при одинаковых степенях переменной, получим систему Виета: + х2 + хз + х4 = -ах Ж1Ж2 + Ж1Ж3 + Ж1Ж4 + Ж2Жз + Ж2Ж4 + Ж3Ж4 = «2 + Ж1Ж3Ж4 + Ж2Ж3Ж4 = -аз Х1Х2Х3Х4 = щ.
1.1. СХЕМА ГОРНЕРА. ТЕОРЕМА БЕЗУ 9 Утверждение теоремы Виета состоит в том, что множество корней уравне- ния четвертой степени имеет вид {а, Ь, с, d} тогда и только тогда, когда все решения системы Виета получаются выписыванием всех элементов этого множества в виде четырехчленной последовательности всеми возможными способами. Разберем следующий пример. Решить уравнение ж4 + 4ж3 — 2ж2 — 12ж + 9 = 0, если известно, что оно имеет две пары равных корней. Пусть корни уравнения записываются в виде: Х\ = х-2 = и, хз = хц = v. Тогда система Виета перепишется следующим образом: 2(м + и) = — 4 м2 + Auv + v2 = (м + и)2 + 2uv = —2 2uv(u + и) = 12 (ми)2 = 9. Из первых двух уравнений получается, что и + v = —2, uv = —3. Отсюда получаем множество решений исходного уравнения — {1,1, —3, —3}. Последнее уравнение можно было решить другим способом. Станем ис- кать целые решения. Перенесем свободный член в правую часть с противо- положным знаком: ж(ж3 + 4ж2 - 2ж - 12) = -9. Произведение двух целочисленных множителей равно -9. Значит, для пере- менной х имеются следующие возможные целые значения: ±1, ±3, ±9. Под- ставляя их в уравнение, получим, что только 1 и —3 являются корнями. Для нахождения остальных корней разделим левую часть исходного уравнения на квадратный трехчлен (х — 1)(ж + 3) = ж2 + 2х — 3. В результате получим тот же самый квадратный трехчлен. Значит, левая часть исходного уравне- ния представляла собой квадрат квадратного трехчлена, и корни уравнения имеют кратность два. Наблюдение, позволившее нам решить уравнение вторым способом, можно оформить в виде следующего утверждения: все целые корни многочлена со всеми целыми коэффициентами и со стар- шим коэффициетом, равным единице находятся среди делителей свободного члена. Это утверждение можно обобщить на случай произвольного многочлена с целыми коэффициентами — /(ж) = аож” + ахж”-1 + ... + ап_1Ж + ап.
10 ГЛАВА 1. МНОГОЧЛЕНЫ И АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ Пусть х = p/q — несократимая дробь — рациональный корень этого мно- гочлена. Тогда, <Tf(pl<l) = аоРп + aip"-1g + ... + dn-ipg"-1 + anqn = 0. Заметим, что р должно быть делителем произведения anqn. Значит, р — делитель ап. Аналогично получим, что q — делитель «о. Таким образом, при помощи перебора делителей коэффициента при старшем члене и дели- телей свободного члена можно найти все рациональные корни многочлена с целыми коэффициентами. Большую роль в доказательстве и получении разнообразных алгебра- ических результатов играет деление многочленов с остатком. Разделить многочлен f(x) на многочлен g(x) означает подобрать такую пару много- членов q(x)n г(х), что f(x) = q(x)g(x) + г(х), причем степень многочлена г(х) меньше степени многочлена g(x). Практический алгоритм нахождения этих q(x) и г(х) — деление f(x) на g(x) ’’столбиком”. Заметим, что если многочлены f(x) и g(x) были с целыми коэффициентами и старший коэффи- циент многочлена g(x) равен единице, то многочлены q(x) и г(х) будут иметь только целые коэффициенты. При делении ’’столбиком” придется умножать многочлен g(x) лишь на целые кратные степеней переменной х. Отметим также, что при делении на многочлен первой степени остаток является кон- стантой. Теорема Безу. Число xq тогда и только тогда является корнем много- члена f(x), когда существует такой многочлен q(x), что f(x) = (х — xo)q(x). Доказательство.□ Если имеет место такое представление для f(x), то, подставляя в него х = хо, получим: f(xo) = 0. Обратно, пусть xq — корень многочлена f(x). Разделим многочлен f(x) на многочлен х — xq: f(x) = q(x)(x — tq) + г. Здесь г — действительное число. Оно равно нулю. В самом деле, подставим в это равенство х = xq : 0 = f(xo) = q(xo)(xo - х0) + г. □ Пример. При каких значениях параметра а многочлен х3+у3+z3+axyz разлагается в произведение двух многочленов, один из которых — x + y + z. Рассмотрим это выражение как многочлен от переменной z (х и у будут при этом параметрами). Тогда выделение этого множителя эквавалентно наличию у многочлена корня z = —х—у. Подставив этот корень в многочлен: х3 +у3 — (х + у)3 — аху(х + у) = —(а + 3)(ж + у)ху = 0 Отсюда следует, что а = —3.
1.1. СХЕМА ГОРНЕРА. ТЕОРЕМА БЕЗУ 11 Имеется удобный алгоритм для нахождения частного и остатка при деле- нии с остатком многочлена f(x) = aoxn+aixn~1+.. -+ап на многочлен x—xq: f(x) = q(x)(x — то) + г. Остаток г равен значению многочлена f(x) в точке хо (подставим х = xq в эту формулу), так что заодно мы получим способ быстрого подсчета значения многочлена в произвольно взятой точке. Пусть q(x) = Ьо®"-1 + Ъ1Хп~2 +... + bn-i. Приравняем коэффициенты при одинако- вых степенях в левой и правой частях равенства: f(x) + xijq(x) = xq(x) + г. аохп + (ai + хобо)®"-1 + • • • + ап + ж0&п-х = Ьохп + Ьхж”-1 + ... + bn-i + г Получаем цепочку равенств: b0 = а0, bi = ах + х0Ь0,... ,bt = at + ж0Ь»-х, • • • ,г = /(ж0) = ап + ж06п-1 Одна и та же процедура повторяется по многократно. Этот алгоритм назы- вается схемой Горнера. Пример. Вычислить f(4), если /(ж) = х4 — Зж3 + бж2 — 10ж + 16. Выпишем таблицу, в которой верхняя строчка будет состоять из коэффи- циентов многочлена f(x), а нижняя — из коэффициентов многочлена q(x). В самом конце нижней строчки вставим f(4). Нижнюю строчку будем за- полнять последовательно слева направо. Первый элемент — это ас, = 1. Каждый очередной элемент будет получаться в результате учетверения предыдущего и прибавлением элемента из второй строчки, стоящего над этим элементом. 1 -3 6 -10 16 1 1 10 30 136 Получилось /(4) = 136. Схема Горнера позволяет быстро перейти к пере- менной ж — жо от переменной х. Для этого ее нужно применить к многочлену q(x) и ко всем вновь получаемым многочленам. Для этого можно просто приписать новые строчки к полученной таблице. 1 1 10 30 136 1 5 30 150 — 1 9 66 — — 1 13 — — — Получилась формула: /(ж) = (ж—4)4 + 13(ж—4)3+бб(ж—4)2 + 150(ж —4) + 13б. Если в подобной формуле ровно к штук крайних справа коэффициентов равны нулю, то говорят, что кратность корня жо равна к. По-другому это
12 ГЛАВА 1. МНОГОЧЛЕНЫ И АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ условие можно сформулировать следующим образом: многочлен f(x) делится на (х — хо)к, но не делится на (х — хо)к+1. Формула для решений квадратного уравнения fix) = ж2 + ах + b = О, известная из школьной математики, имеет вид: Ж1,2 = 1/2(—а ± \/ а2 — 46). Этой формуле можно придать иной вид. Например, такой: (а + ±\/а2 — 46)% + 2Ь 2тг + а — ±у/а2 — 46 Знак здесь выбирается один и тот же в числителе и в знаменателе. Кажется невероятной связь числа % с квадратным трехчленом. Однако конкретные вычисления корней по этой формуле подтверждают ее истинность. Все дело в том, что существует бесконечное множество формул для корней квадратного трехчлена (или бесконечное множество разновидностей этой формулы). Выберем число с произвольным образом. Имеет место сле- дующая (истинная!) формула для корней исходного уравнения: (а + ±-/а2 — 46)с + 26 2с + а — ±\/а2 — 46 Здесь нужно только, чтобы 2с —а ± х/а2 — 46 (мы избегаем обращения в ноль знаменателя дроби). Для доказательства этой экзотической формулы рассмотрим выражение: /(ж, у) = ху + а(х + у)/2 + 6, /(ж, ж) = /(ж). Имеет место формула: f(x,y) - f(x)f(y) = (а2/4 - 6)(ж - у)2 В самом деле, (ху + а(х + у)/2 + Ь)2 — (ж2 + аж + 6) (у2 + ау + 6) = = х2у2 + а2 (ж + у)2/4 + 62 + аху(х + у) + а6(ж + у) + 26жу+ —х2у2 — Ъ2— а2ху — аху(х + у) — 6(ж2 + у2) — ab(x + у) = = а2 (ж — у)2/4 — 6(ж2 + у2) + 2Ьху = (а2/4 — 6)(ж — у)2.
1.2. ИНТЕРПОЛЯЦИЯ 13 Подставим в эту формулу х = жцг, у = с. При этом, f(x) = 0. После извлечения квадратного корня получается формула: Ti,2c + a(a:i,2 + с)/2 + Ь = ±\/а2 - 4Ь(ж1,2 - с)/2. Из этой формулы легко получается доказываемый факт. Обычная формула для корней квадратного уравнения получается переходом к пределу при с —> оо. Другими словами, если выбрать с большим по модулю и разде- лить на него числитель и знаменатель полученной формулы, то они будут лишь малыми добавками отличаться от числителя и знаменателя обычной формулы. При помощи теоремы Виета легко выразить дискриминант через корни: D = а2 — 46 = (жх + ж2)2 — 4жхж2 = (х± — ж2)2. Обобщение этой формулы для уравнений высших степеней позволяет опре- делить дискриминант для них. У пражнения 1. Выписать условие, при котором многочлены делятся друг на друга: а) ж3 + рх + q, х2 + тх — 1; Ь) ж4 + рх2 + д, х2 + тх + 1. 2. При помощи схемы Горнера раскрыть скобки и привести подобные слагаемые многочлена f(x + 3), где а) /(ж) = х4 — х3 + 1; 6) /(ж) = х4 + 4ж3 + бж2 + 10ж + 20. 3. Обозначим через sn = ж” + х% сумму n-х степеней корней уравнения ж2 + ах + b = 0. Выразить sn через sn_i и sn_2. 1.2 Интерполяция Метод математической индукции Важную роль для доказательства многих предложений играет следу- ющий метод. Пусть проверяется некоторое предположение Р(п), завися- щее от натурального п. Приведем пример (неравенство Бернулли): для ж > — 1 и любого натурального п имеет место неравенство (1 + ж)” > 1 + пх. Пусть предположение Р(1) истинно (проверку этого назыают на- чальным шагом индукции). Для доказательства исходного предположения для всех натуральных п достаточно доказать следующий факт: из того, что
14 ГЛАВА 1. МНОГОЧЛЕНЫ И АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ истинны предположения Р(1), Р(2),... , Р(к — 1) (этот факт называют пред- положением индукции), вытекает истинность предположения Р(к). Обычно из Р(к — 1) выводят Р(к). Например, неравенство Бернулли доказывается следующим образом. □ Начальный шаг индукции очевиден: (1 + ж)1 > 1 + 1 • х. Пусть выполняется неравенство (1 + х')к — 1 > 1 + (к — 1)ж для х > —1. Умножим обе части этого неравенства на положительное число 1 + х : (1 + х)к > (1 + ж)(1 + (к — 1)ж) = 1 + кх + (к — 1)ж2 > 1 + кх. Получили доказываемое предположение (последний член (к — 1)ж2 неотри- цателен) .□ Докажем методом математической индукции следующее Предложение. Пусть Ж1,Жг,... ,хп — различные корни многочлена f(x). Тогда f(x) делится на многочлен (х — х\)(х — х^}... (ж — хп). □Доказательство. Для п = 1 это предложение вытекает из теоремы Безу. Пусть это предложение верно для п = к — 1. Докажем его для п = к. Многочлен f(x) имеет корень х^- Значит, существует такой многочлен g(x), что /(ж) = (х — Xk)g(x). Этот многочлен имеет корни Ж1,Жг, • • • Действительно, 0 = f(xi) = (xt — Xk)g(xt) i = 1,2,... ,к — 1. Согласно предположению индукции, многочлен g(x) делится на многочлен (ж —жх)(ж — Х2) (x — Xk-i)- Отсюда следует, что f(x) делится на (х — жх)(ж — Ж2) (х — Xk)- п Следствие. Многочлен степени п имеет не больше чем п корней. □Доказательство. Пусть некоторый многочлен степени п имеет больше чем п корней, тогда он делится на многочлен степени большей чем п. Это невозможно, так как при перемножении многочленов их степени складыва- ются. □ Тут полезно отметить, что степень нулевого многочлена неопределена (в некоторых учебных пособиях ее полагают равной — оо). Пример. Пусть а,Ь,с — три различных числа. Тогда многочлен (ж — а) (х — Ь) (ж — 6) (ж — с) (ж —с) (ж —а) (с—а)(с —6) (а —6)(а —с) (Ь — с)(Ь — а) имеет по крайней мере три корня — а,Ь,с. Противоречие с приведенной выше теоремой объясняется тем, что этот многочлен — нулевой, его корнем является любое число. Теорема. Существует единственный многочлен f(x), который в задан- ных п + 1 точках — жо,Ж1,... ,хп — принимает заданные значения —
1.2. ИНТЕРПОЛЯЦИЯ 15 /И = к=1 f(xo), ... , f(xn), если считать, что его степень не должна превосхо- дить п. □Доказательство. Сначала приведем такой многочлен: (ж - Жр)(ж - ЖХ) (ж ~ Ж&—Х )(ж - Tfc+1) ...(х-хп (хк - ж0)(жк - Ж1) ... (хк - жк_1)(жк - Жк+1) ... (жк - ж„) ’ Теперь докажем, что других многочленов, принимающих в заданных точках заданные значения, не существует. Пусть есть еще один такой многочлен /1(ж). В таком случае ненулевой многочлен /(ж) — /х(ж) принимает в задан- ных точках нулевые значения. Этот многочлен имеет степень не больше п. Получили противоречие с наличием у него п + 1 корня.□ Выше мы заметили, что (ж — а) (ж — Ь) (ж — Ь) (х — с) (ж — с) (ж — а) (с—а) (с—6) (а —6) (а —с) (Ь — с)(Ь — а) Значит, приведенный выше многочлен f(x) не всегда имеет степень п. Исаак Ньютон нашел практический способ определения коэффициентов многочлена f(x). Станем искать его в виде: /(ж) = а0+а1(ж —ж0)+а2(ж —ж0)(ж —жх) + .. .+ап(ж-ж0)(ж-Ж1)... (ж-жп_х). Заметим, что в этой записи не участвует число хп. Однако его необходимо знать для того, чтобы определить коэффициент ап. Коэффициенты после- довательно определяются при помощи подстановки х = Xi, i = 0,1,... ,п. Сначала подставим ж = жо- Получим ао = /(жр). Затем подставим ж = жх- Получим равенство: а± = Коэффициенты будут получаться по- следовательно друг за другом. Пример. Найдем многочлен f(x), принимающий в точках 1,2,... , п ну- левое значение, и в точке ж = 0 принимающий значение 1. Найдем его по способу Ньютона: /(ж) = ао + ах ж + а2ж(ж — 1) + ... + апх(х — 1)... (ж — п + 1). Получим ао = 1, ах = —1. Легко заметить, что ак = (—1)к/к1. В результате мы получили тождество: 1 — ж + ж(ж — 1)/2! — ... + (—1)"ж(ж — 1)... (ж — п + 1)/п! = = (—1)"(ж — 1)... (ж — п)/п\. Заодно мы решили известную задачу, которая состоит в нахождении корней многочлена, стоящего в левой части. □
16 ГЛАВА 1. МНОГОЧЛЕНЫ И АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ У пражнения 1. Найти многочлен степени п, который в точках 1,2,... , /г+1 принимает значения 1, ... , -Цт, соответственно. Ответ: ж —1 (ж —1)(ж —2) (—1)”-1(ж — 1)(ж — 2)... (ж — /г) “ 1-2 + 1-2-3 ’ ’ ’+ 1-2...(п+1) ’ 2. Найти многочлен степени п, который в точках 0,1,2,... , п принимает значения 1,2,4,... , 2”, соответственно. Ответ: 1 + f + + ...+ 1.3 Решение уравнения третьей степени Общее уравнение третьей степени имеет вид: х3 + aix2 + О2Х + аз = О, где а/, аг, «з — произвольно заданные параметры. Его можно свести к урав- нению z3 + az + b = 0, имеющему более простой вид. Для этого из первых двух слагаемых выделим полный куб: х3 + 3(ох/3)ж2 + (3(ох/3)2ж + (ax/З)3) — (а2ж/3 + а3/27) + а^х + аз = 0; (ж + Ох/З)3 + (аг — о2/3)ж + аз — а3/27 = 0. Теперь можно переписать уравнение для переменной z = ж + О| /3. z3 + (аг — о2/3)г — (аг — а2/3)ах/3 + аз — ох/27 = 0. Итак, а = аг — о2/3, b = аз — О1О2/З + 2а3/27. Уравнение z3 + az + b = 0 также называют общим уравнением третьей степени. Для его решения используем метод Гудде, который состоит в пред- ставлении переменной z в виде суммы двух частей: z=u+v. На эти части будет наложено дополнительное условие (равенство). Вместе с исходным уравнением дополнительное условие составит систему из двух уравнений с двумя неизвестными. По решениям системы будут строиться решения ис- ходного уравнения. Метод состоит в выборе такого дополнительного усло- вия, чтобы получившаяся система легко решалась. Подставим u+v в урав- нение: и3 + v3 + 3uv(u + v) + а(и + v) + b = 0.
1.3. РЕШЕНИЕ УРАВНЕНИЯ ТРЕТЬЕЙ СТЕПЕНИ 17 Выберем следующее дополнительное условие: Зии = —а. Оно обеспечивает равенство нулю двух последовательных членов в левой части получивше- гося уравнения, которое переписывается в виде: и3 + v3 = —Ъ. В итоге по- лучилась система: ( и3 + v3 = — b [ uv = —а/3. Если возвести в куб второе уравнение системы, то она превращается в си- стему Виета относительно переменных и3 и v3 для квадратного трехчлена i2 + bt — а3/27. Дискриминант последнего имеет специальное обозначение: D/1 = Д = а3/27 + Ь2/4. Его неотрицательность означает возможность на- хождения корня у общего уравнения третьей степени методом Гудде. Корни этого квадратного трехчлена имеют вид: — Ъ/2 ± \/Д. Значит, z = и + v = \J—Ь/2 + \/Д + \J—Ъ/2 — \/~К. Получившаяся формула носит название формулы Кардано. Приведем еще один пример применения метода Гудде. Уравнение z3 — 5az3 + 5а2 z — 2Ь = О с параметрами а и b носит название уравнения Муавра. Подставим в него z = и + v : и 5 + v5 + 5гш(м3 + и3) + 10м2м2(м + и) — 5а(и3 + и3) — 15агш(м + м)+ +5а2(м + и) — 2Ь = 0. Внешний вид слагаемых, имеющих множитель 5(м3 + о3), приводит к идее выбрать в качестве дополнительного условия уравнение uv — а = 0. Ле- вая часть этого уравнения получается, если вынести указанный множитель за скобку из этих двух слагаемых. Разобьем слагаемое — 15auv(u + v) на две части----10ами(м + v) — 5auv(u + v). Первую из них сгруппируем со слагаемым 10м2м2(м + v), вынося общий множитель за скобку, получим: 10мм(м + v)[мм — а]. Сгруппируем вторую из них со слагаемым 5а2(и + v), вынося общий множитель за скобку, получим: 5а(м + и)[а — мд]. Дополни- тельное условие обнуляет все слагаемые, кроме выражения и5 + м5 — 2b. В результате получилась система: ( U5 + м5 = 2Ь uv = а.
18 ГЛАВА 1. МНОГОЧЛЕНЫ И АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ Возведя второе уравнение в пятую степень, получим систему Виета относи- тельно переменных и5 и v5 для квадратного трехчлена i2 — 2bt + a5. Условие неотрицательности дискриминанта — есть условие применимости нашего метода: Ь2 > а5. При выполнении этого условия, получается корень уравне- ния Муавра: z = \Jb+ y/li2 — а5 + \/b — y/b2 — а5. Заметим, что этот метод не дает всех корней уравнения. Поэтому, общее уравнение третьей степени нуждается в дополнительном исследовании. Про- ведем это исследование графическим методом. Заметим, что корень у об- щего уравнения третьей степени возникает как абсцисса точки пересечения графиков у = z3 + az и у = — b на координатной плоскости {(у,г)}. Если а > 0, то, как легко видеть, функция у = z3 + az монотонно возрастает на всей прямой. Поэтому, горизонтальная прямая у = — b пересекает ее гра- фик в единственной точке. Общее уравнение третьей степени имеет ровно один корень в этом случае. Заметим, что тогда Д > 0, и этот единственный корень дается формулой Кардано. Для а < 0 график у = z3 + az имеет вид: В самом деле, производная этой функции имеет вид : у' = 3z2 + а. Нули про- изводной дают точку минимума (zmin, ymin) и точку максимума (zmax, Утах)- %min — \/ ^/3, ymin — Cl/3/З; Zmax — у/ ^/3, Утах — "^ау/ Cl/3/З.
Если —b > утах или —b < утт, то графики пересекаются в одной точке (один корень). Если ymin < —Ь < утах, то графики пересекаются в трех точках (три корня). Если — b = ymin или — b = утах, то графики пересека- ются в двух точках (два корня). Существование трех различных корней у общего уравнения третьей сте- пени экивалентно выполнению неравенства: |6| < — 2«д/—а/3/3. Заметим, что обе части неравенства неотрицательны. Поэтому, возведение их в ква- драт будет эквивалентным переходом: Ь2 < —4«3/27. Однако последнее не- равенство можно переписать в виде: Д = а3/27 + 62/4 < 0. Уравнения, удо- влетворяющие этому условию, относят к так называемому неприводимому случаю. К нему также относятся уравнения, имеющие ровно два различ- ных корня, что эквивалентно условию Д = 0, а2 + Ь2 0. Случай, когда уравнение имеет ровно один корень и а2 + 62 / 0 (эквивалентное условие — Д > 0), называется приводимым случаем уравнения третьей степени. В приводимом случае формула Кардано дает единственное решение урав- нения. Если Д = 0, а2 + Ь2 0, то формула Кардано дает решение: z\ = 2-^/—6/2. Второй корень дает точка минимума при b > 0 — z-2 = zmln = у/—а/3, и точка максимума при b < 0 — z2 = zmax = — у/—а/3. Мы не рассмотрели случай а=Ь=0, когда уравнение имеет единственный корень z = 0. Отнесем это уравнение к неприводимому случаю. Нам не удалось решить общее уравнение третьей степени в случае, ко- гда оно имеет три различных корня (то есть Д > 0). Можно доказать, что для этого случая не существует общих формул, дающих решения, которые бы кроме четырех действий арифметики использовали бы только лишь из- влечения арифметических корней произвольных степеней. У пражнения 1. Решить уравнение ж3 — ЗаЬх + а3 + Ь3. 2. Решить уравнение х3 — Sabcdx + а3 с2 d + Ь3ссР. 3. Решить уравнение х3 + ах + b = 0 при помощи замены переменной х = z + k/z, выбрав подходящее значение параметра к. 1.4 Решение уравнения третьей степени методом Виета Некоторые тригонометрические формулы дают примеры уравнений тре- тьей степени.
20 ГЛАВА 1. МНОГОЧЛЕНЫ И АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ Рассмотрим пример. Формула косинуса тройного аргумента для угла тг/9 имеет вид: 1/2 = COS7T/3 = 4cos3 тг/9 — Зсо8 7г/9. Эта формула означает, что уравнение 4z3 — 3z — 1/2 = 0 имеет корень z\ = С08 7г/9. Однако в приведенную формулу с тем же успехом можно под- ставить число cos(tt/9 + 2тт/3), где п — целое. На первый взгляд может показаться, что уравнение третьей степени получает бесконечную серию решений. Однако периодичность косинуса приводит к тому, что к полу- ченному решению добавится только два новых: z^ = cos(tt/9 + 2тг/3) и z3 = cos(tt/9 + 4тг/3) = cos(tt/9 — 2тг/3). Французский математик Франсуа Виет сумел перенести приведенный выше метод решения на общее уравнение третьей степени. При этом с по- мощью формулы косинуса тройного аргумента удается решить как раз те уравнения третьей степени , которые не решались методом Гудде. Рассмотрим общее уравнение третьей степени г3 + az + b = 0. Попы- таемся свести его к уравнению 4/3 — 3/ = А, которое решается при по- мощи замены t = cos ф. Последнее уравнение эквивалентно уравнению : /3 — 3/4/ = А/4. Положим: z = kt, где к — постоянная, которую определим позднее. Подставив это выражение и разделив на fc3, получим уравнение: /3 + а/кЛ = —Ь/к3. Теперь понятно, что константу к нужно определить из условия: а/к1 = —3/4. Заметим, что коэффициент а < 0. Данный ме- тод применим только к уравнениям с отрицательным коэффициентом а. Положим: к = —а/3. Тогда уравнение принимает вид: 4/3 — 3/ = А = ---3,ь Подставим / = cos/. Получим: А = совЗф. Отсюда найдем ф. 2ах/—а/3 Необходимым условием существования решений у последнего тригономе- трического уравнения является условие : |А| < 1. Эти решения имеют вид: ф = ± arccos А/3+2тт/3, где п — целое число. Они дают ровно три значения для t: /1 = cos(l/3arccosА), /2 = cos(l/3arccosА + 2тг/3), /3 = cos(l/3 arccos А — 2тг/3). В итоге получаем три решения общего уравнения третьей степени : 3& zi = 2 -\/—а/3 cos (1/3 arccos-. ), 2а у/— а/3 Z2 = 2у/—а/3 cos(l/3 arccos----+ 2тг/3), 2а^/—а/3
1.5. ГИПЕРБОЛИЧЕСКАЯ ТРИГОНОМЕТРИЯ 21 Z3 = 2 а/3 cos( 1 /3 arccos--== — 2тг/3). 2ау/—а/3 Заметим, что условие применимости метода Виета — |А| < 1 — в точно- сти означает неприводимый случай уравнения третьей степени. Возведя в квадрат данное неравенство, получим эквивалентное неравенство А2 < 1 : 962 -4/За3 - ’ Умножив на положительное число —4/За3 обе части неравенства получим: 962 < -4/За3. Последнее неравенство эквивалентно условию, выделяющему неприводи- 3 .2 мый случай уравнения третьей степени : А = + ^- < 0. Итак, уравнение третьей степени решено для всех случаев. У пражнения 1. Получить формулы для решения общего уравнения третьей степени в случае, когда А = 0. 2. Используя формулу синуса тройного аргумента решить неприводимый случай уравнения третьей степени. 3. Решить уравнение z3 — 3(а2 + l)z — 2а(а2 + 1) = 0 при помощи формулы тангенса тройного аргумента. Ответ: z\ = tg(l/3arctga) — a.z-t = tg(l/3arctga + тг/З) — a, z3 = tg(l/3arctga — тг/З) — a. 1.5 Гиперболическая тригонометрия С классической экспоненциальной функцией ех можно связать несколько функций, свойства которых дублируют свойства тригонометрических функ- ций (за исключением периодичности). Это гиперболические синус, косинус, тангенс, котангенс — sinh x,coshx, tanh x,coth.r (иногда их обозначают че- рез shx, chx, thx, cthx). Положим : sinhx = 1/2(еж - е-ж), coshx = 1/2(еж + е-ж),
22 ГЛАВА 1. МНОГОЧЛЕНЫ И АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ sinh х cosh х tanh х = —j, coth x = -г-;— cosh x sinh x Первые три функции определены для всех действительных чисел, функция котангенс гиперболический не определена лишь для х = 0. Мы не будем обсуждать здесь их аналитические свойства. Отметим лишь, что синус ги- перболический монотонно возрастает и имеет обратную функцию, которая называется ареа-синус и обозначается через Areasin(x). Как легко следует из определения синус гиперболический — нечетная функция, а косинус гиперболический — четная функция. Поэтому, тангенс и котангенс гиперболические — нечетные функции. Докажем основное гиперболическое тождество: cosh2 х — sinh2 х = 1. В самом деле, 1/4(е2ж + 2 + е~2х) — 1/4(е2ж — 2 + е~2х) = 1/2 — (—1/2) = 1. Столь же просто получаются выражения для гиперболических синуса и косинуса двойного аргумента: 2 sinh ж cosh ж = 1/2 (ех - е~х)(ех +е~х) = 1/2(е2ж - е~2х) = sinh2a:. cosh2 х + sinh2 х = 1/4(е2ж + 2 + е~2х) + 1/4(е2ж - 2 + е~2х) = = 1/2(е2ж + е-2ж) = cosh2a:. Формулы сложения для гиперболических функций имеют вид: sinhaicosh?/ + sinhycosha: = 1/4(еж — е~х)(еу + е^)+ +1/4(е» - е~у)(ех + е~х) = 1/4(ех+у + ех~у - е~х+у - е~х~у+ +ех+у + е~х+у - ех~у - е~х~у) = 1/2(ех+у - е~х~у) = sinh(a: + у), coshxcosh?/ + sinhaisinh?/ = 1/4(еж + е~х)(еу + е^)+ +1/4(еж - е~х)(еу - е~у) = 1/2(ех+у + е~х~у) = sinh(a: + у). Заменив у на -у в этих формулах, получим: sinh(a: — у) = sinh х cosh у — sinh х cosh у, cosh(x — у) = cosh х cosh у — sinh х sinh у.
1.5. ГИПЕРБОЛИЧЕСКАЯ ТРИГОНОМЕТРИЯ 23 Получим формулы для гиперболических функций тройного аргумента. Можно было бы воспользоваться формулами сложения. Однако проще про- извести возведение в куб: cosh3 х = 1/8(е3<с + e~Sx + 3(еж + е-ж)) = 1/4(созЬЗж + 3 cosh ж), sinh3 ж = 1/8(е3<с — e~Sx — 3(еж — е-ж)) = l/4(sinh3a: — 3 sinh ж). Отсюда получаем тождества: cosh Зх = 4 cosh3 х — 3 cosh х, sinh Зх = 4 sinh3 х + 3 sinh х. Первое тождество в точности совпадает с тождеством для косинуса трой- ного аргумента. Поэтому, если использовать первое тождество для решения уравнения третьей степени, то получатся те же самые формулы, что полу- чились при решении методом Виета (только одну формулу вместо трех). Однако при х 0 cosli3x > 1. Так что, этим способом будут решаться уравнения приводимого случая. Если бы так решались все уравнения при- водимого случая, то новую формулу можно было бы использовать вместо формулы Кардано. Однако это не так. Поэтому, мы обратимся ко второму из тождеств. В уравнении г3 + az + Ъ = 0 сделаем замену переменной: z = kt, где к — постоянная. Разделив на ks, получим: i3 + a/k2t = —Ь/к3. Выберем к из условия: а/к2 = 3/4. Положим: к = 2^/а/З. Этим способом решаются все уравнения, для кото- рых а > 0. В этом случае Д > 0. Так что, новая формула будут заменять формулу Кардано при а > 0. . , „ ЗЬ л а „ sinh Зх =------.-= 4г3 + 3z 2ауа/3 Отсюда: z = — 2^/a/3sinh(l/3Areasm(— Здесь мы воспользовались нечетностью ареа-синуса и гиперболического си- нуса. У пражнения 1. Найти все случаи, когда общее уравнение третьей степени решается через формулу гиперболического косинуса тройного аргумента приведенным выше способом. 2. Получить формулы для гиперболического тангенса двойного и тройного аргументов.
24 ГЛАВА 1. МНОГОЧЛЕНЫ И АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ
Глава 2 Комбинаторика 2.1 Возрастающие и убывающие степени Обозначим через п множество из п элементов — {1,2,... ,п} . Подсчитаем количество всех функций f : к —> т. Для этого нужно удоб- ным образом представить информацию, которая определяет каждую кон- кретную функцию. Представим, что у нас имеется к штук ящиков, которые пронумерованы от 1 до к, и неограниченное количество карточек с числами 1,2,... , т. По каждой функции f : к —> т можно разложить карточки по ящикам (по одной карточке в каждый ящик) следующим образом: в ящик с номером i кладем карточку с числом f(i). Ясно, что функция однозначно определяется такой раскладкой карточек. Пересчитаем число возможностей для раскладки карточек. Очевидно, что в каждый ящик мы кладем карточки независимо от других. Поэтому, нужно перемножить числа возможностей раскладки карточек для всех ящи- ков. В любой ящик одну карточку можно положить ш способами. Значит, всего возможностей — тк. Вместо ящиков и карточек можно было рассматривать k-членные после- довательности чисел 1,2,... , т. Задача. Сколькими способами можно расставить к различных книг по ш полкам, если порядок книг на полке несущественен? Главная трудность этой задачи состоит в том, что нужно поменять местами ящики и карточки в напрашивающемся соответствии: полки — ящики, книги — карточки. Именно полки мы будем разбрасывать подобно 25
26 ГЛАВА 2. КОМБИНАТОРИКА карточкам по ящикам, а не наоборот. Перенумеруем полки числами от 1 до т, а книги — от 1 до к. Тогда расстановка книг по полкам однозначно определяет функцию f : к —> т. Число всех возможностей — тк. Задача. Подсчитать число всех подмножеств n-элементного множества. Можно считать, что исходным множеством служит множество п. Вы- деление подмножества X можно задать при помощи некоторой функции fx : п —> 2. Положим: , ,., fl, если i € X [2, если i X. Такие функции однозначно соответствуют подмножествам. Всему множе- ству X соответствует функция тождественно равная 1, пустому множеству соответствует функция тождественно равная 2. Всего таких функций — 2”. Напомним, что отображение или функцию называют вложением или инъекцией, если разные элементы имеют разные образы. Можно поставить вопрос о количестве вложений f : к —> т, если, конечно, т > к. Вло- жению f соответствует k-членная последовательность элементов из т со всеми различными членами. Приведенное выше рассуждение с ящиками и карточками изменяется следующим образом. Теперь количество карточек не безгранично — имеется ровно ш карточек, по одной каждого вида. По- этому, имеется ш возможностей положить одну карточку в первый ящик, т — 1 возможность положить одну карточку во второй ящик (одна карточка уже использована), т — 2 возможности положить одну карточку в третий ящик (две карточки уже использованы), ... , т — к + 1 возможностей поло- жить одну карточку k-й ящик (к этому моменту уже заполнен к — 1 ящик и осталось т — к + 1 карточек). Число возможностей имеет специальное обозначение: т- = т(т — 1)(т — 2)... (т — к + 1). Оно называется k-й убывающей степенью числа ш. Это обозначение имеет смысл сохранить и в том случае, когда ш — не натуральное и даже не целое число. По аналогии можно определить k-ю возрастающую степень числа ш по формуле: тк = т{т + 1)(т + 2)... (т + к — 1). Возрастающая и убывающая степени связаны очевидными соотношениями: (-m)i = (~1)ктк, (-т)к = (-1) W.
2.1. ВОЗРАСТАЮЩИЕ И УБЫВАЮЩИЕ СТЕПЕНИ 27 Можно предложить комбинаторную интерпретацию для возрастающей сте- пени тк. Заметим, что это число будет заметно больше числа всех функций f : к —> т. Для того, чтобы дать комбинаторную интепретацию для возра- стающей степени, представим число всех функций указанного вида новым способом. Поменяем местами карточки и ящики в предыдущей интерпрета- ции. Пусть к штук карточек, пронумерованных от 1 до к, раскладываются по ш ящикам, пронумерованным от 1 до ш. При этом i-я карточка кла- дется в {Д)-й ящик. После раскладки некоторые ящики могут оказаться пустыми, а некоторые могут содержать по нескольку карточек. Эта ин- терпретация не позволяет подсчитать число всех функций. Причина этого состоит в том, что в ящиках оказываются подмножества множества всех карточек, и совершенно неважно в каком порядке мы их туда кладем. Вот если бы в ящики раскладывались не подмножества, а упорядоченные после- довательности карточек, то можно было бы организовать процесс пересчета возможностей для раскладок. В результате должно получиться не число всех функций а большее число, так как упорядоченных последовательностей больше чем подмножеств. Пересчитаем эти возможности. Первую карточку можно положить ш различными способами (в любой из ш пустующих ящи- ков). Для укладки второй карточки имеется т + 1 возможность. Ее можно положить в один из т — 1 пустых ящиков (т — 1 возможность). В тот ящик, где уже лежит карточка, вторую карточку можно положить двумя способами — поверх лежащей карточки или под нее. Пусть уже разложено i штук карточек, и нужно положить (i+l)-ro. Пусть в первом ящике лежит «1 карточек, во втором ящике лежит 82 карточек, ... , в ш-м ящике лежит sm карточек. Имеет место равенство: si + «2 + • • • + = г. В первый ящик (г+1)-ю карточку можно положить si +1 способом — есть si — 1 способ поло- жить ее между карточками, кроме того, ее можно положить в самое начало или в конец стопки. Во второй ящик эту карточку можно положить $2 + 1 способом, ... , в ш-й ящик эту карточку можно положить sm + 1 способом. Всего способов положить i + 1-ю карточку — si + «2 + • • • + sm + т = т + i. Очередная карточка кладется независимо от других. Поэтому, число всех возможностей равно т(т + 1)... (т + к — 1) = тк. У пражнения 1. Проверить равенство: (т + 1)- — т- = ктк^1. 2. Пусть множество X содержит к элементов. Доказать, имеется ровно тк что ш-членных цепочек вложенных подмножеств вида X Э Х± Э Х% D ... Э Xm~i.
28 ГЛАВА 2. КОМБИНАТОРИКА Указание: По k-членной цепочке построить функцию f : X —> т. 2.2 Число подмножеств. Бином Ньютона Обозначим через число k-элементных подмножеств множества т. Мы пока умеем пересчитывать только k-членные упорядоченные последо- вательности элементов из т. Решим вспомогательную задачу: Сколькими способами k-элементное множество можно представить как k-членную упо- рядоченную последовательность? Ничего не изменится, если мы вместо дан- ного к-элементного множества возьмем множество к. В этом случае, как показано в предыдущей секции, ответ имеет вид убывающей степени — к- = к(к — 1)... 1 ( его обычно обозначают через к! ). Эта задача облег- чает пересчет к-элементных подмножеств. В самом деле, если по каждому к-элементному подмножеству множества т строится ровно к! к-членных последовательностей с различными членами, то произведение даст число всех к-членных последовательностей со всеми различными членами. Однако последнее число равно убывающей степени т- : к!(™) = т-. От- сюда получаем формулу: _ к /г| _ — k)l _ ml к) т ' к!(т — к)! kl(m — k)l' Заметим, что = 1, так как существует ровно одно О-элементное под- множество — пустое множество. Удобно положить: 0! = 1. Легко заметить, что (™) = • В самом деле, каждому k-элементному подмножеству мно- жества т однозначно соответствует (п-к)-элементное подмножество — его дополнение. Кроме того, этот факт непосредственно следует из полученной формулы для числа (™). Из этой формулы также следует, что = 1 и (Y) = т. Впрочем, это легко следует из определения (существует ровно одно ш-элементное подмножество множества т — оно само; существует столько же 1-элементных подмножеств, сколько элементов множества т). Сумма всех чисел при 0 > к > т даст число всех подмножеств мно- жества т. Однако последнее число мы находили в первой секции другим способом. Как всегда, решение одной комбинаторной задачи двумя спосо- бами приводит к содержательной формуле: о + 1 + ••+ = 2 О J \ 1J \т J
2.2. ЧИСЛО ПОДМНОЖЕСТВ. БИНОМ НЬЮТОНА 29 Задача. Доказать тождество: Для доказательства решим двумя способами следующую комбинаторную задачу: подсчитать число строк в таблице вхождений элементов в подмно- жества множества т. В этой таблице строки имеют вид: i € {... ,i,... }, где справа стоит подмножество, содержащее элемент i. Сначала обратим внимание на правые части строк данной таблицы. Возьмем произвольное k-элементное подмножество и подсчитаем в скольки строках оно встре- сается. Очевидно, что оно встречается ровно в к строках — каждая из этих строк определяется одним из элементов этого подмножества. Поэтому, все k-элементные подмножества дадут строк таблицы. Общее число строк таблицы дается левой частью нашего тождества. Теперь пересчитаем строки другим способом. Очевидно, что каждое число встречается одина- ковое число раз в левой части строк таблицы (каждый элемент входит в одно и то же число подмножеств ). Подсчитаем в какое число подмножеств входит элемент ш. Эти подмножества однозначно определяются своими до- полнительными элементами к элементу ш. Эти элементы составляют под- множество множества т — 1. Число подмножеств множества т, содержа- щих элемент ш, равно числу всех подмножеств множества m — 1, то есть числу 2т-1. Осталось умножить это число на число всех элементов, при этом получится правая часть исходного тождества — rn2m-1. Выделение последнего элемента можно использовать для получения важ- ного тождества для числа подмножеств. Разделим все k-элементные подмно- жества множества т на два класса: подмножества, содержащие элемент ш, и подмножества, его не содержащие. Последних, очевидно, штук (их можно считать k-элементными подмножествами множества т — 1). Коли- чество подмножеств из первого класса можно пересчитать, учитывая лишь дополнительные элементы к элементу ш. Выбросим изо всех этих подмно- жеств элемент ш. В результате получим все (fc — 1)-элементные подмноже- ства множества т — 1. Их — (™Zi) штук. Имеет место тождество: Это тождество можно преобразовывать, последовательно применяя его к первому или второму слагаемому из правой части. Если разлагать первое
30 ГЛАВА 2. КОМБИНАТОРИКА слагаемое, то получится равенство: т\ Он,— 1\ Он,— 2\ 1\ к) = \к- 1) + \к- 1)+"'+[к- 1)' Если последовательно разлагать второе слагаемое, то получится равенство: _ Ап — 1\ Ап — 2\ Ап — 3\ Ап — к — 1\ к) = \ к ) + U-1/ + \k-2j + ”’+ V 0 )' Нужно быть внимательным при получении последних членов в правых ча- стях этих равенств. Стоит также записать их при помощи знака суммиро- вания: т — к + i — 1 i Исходное тождество может быть использовано для вычисления чисел при небольших т. Для этого выписывают особую таблицу — так называе- мый треугольник Паскаля. В этой таблице m-я строчка имеет вид: Первые шесть строчек треугольника Паскаля имеют вид: 1 1 1 2 1 13 3 1 1 4 6 4 1 1 5 10 10 5 1 1 6 15 20 15 6 1 В этой таблице каждая следущая строка получается из предыдущей по пра- вилу: сначала между каждыми двумя соседними числами внизу вписыва- ется их сумма, затем получившаяся последовательность окаймляется спе- реди и сзади единицами. Согласно этому правилу седьмая строка будет иметь вид: 1 7 21 35 21 7 1. Как легко видеть, это правило является прямым следствием исходного тождества.
2.2. ЧИСЛО ПОДМНОЖЕСТВ. БИНОМ НЬЮТОНА 31 Можно заметить, что строчки этой таблицы являются последователь- ностями коэффициентов разложения бинома (х + у')т для т=1,2,3,4,5,6,7. Поэтому числа называют биномиальными коэффициентами. Для лю- бого натурального m можно доказать формулу бинома Ньютона: Можно воспользоваться методом математической индукции. Для т=1 эта формула очевидна. Пусть она доказана для т = п — 1. Умножим левую и правую части этой формулы для т = п — 1 на (х+у): (х+у)п = \ г — 1 / \ г ) При раскрытии скобок в правой части при члене хп~гуг возникает коэффи- циент ("у1) + (”Zi) = (?) Предположение проверено по индукции. Заметим, что при подстановке х = 1,у = 1 в формулу для бинома по- лучается формула для суммы всех биномиальных коэффициентов с одина- ковым верхним индексом, полученная ранее другим способом. Подставим х = 1,у = — 1 в формулу для бинома, получим тождество: (т\ (т\ . ..ЛтХ . л.к(т\ п - к +•••+ -1 +•••+ -1 =о. \ 0 / \ 1 / \г J \тJ При сложении этого тождества с выражением для суммы биномиальных ко- эффициентов слагаемые с нечетным нижним индексом сокращаются, осталь- ные слагаемые удваиваются. Сократив на два обе части, получим тожде- ство: So(m,2) = = 2m-1 Если же вычесть одно из этих равенств из другого, то сократятся члены с четным нижним индексом. Имеет место тождество: т 2г+ 1 = 2т-1. При помощи биномиальной формулы и свойств комплексных чисел можно получить формулу для суммы т
32 ГЛАВА 2. КОМБИНАТОРИКА У пражнения 1. Доказать тождество: i^- = т~/к. 2. Доказать равенства: °) т ~к 'т — к г — к 3. Доказать тождество: Е-=о (7) (k-i) = (Т)- Указание: Рассмотреть следующую комбинаторную интерпретацию. Из группы, состоящей из ш мужчин и п женщин, выбрали к человек. 4. Доказать, что а)(х + ^ п / \ п / \ ; Щх + У)п = ^(п]х*у^ Л \ 1 / Л \ 1 / г=0 4 7 г=0 4 7 2.3 Полиномиальная формула Выделение k-элементного подмножества в множестве т эквивалентно разделению т на две непересекающиеся части, первая из которых содер- жит к элементов, а вторая — ш-к элементов. Можно обобщить понятие би- номиального коэффициента следующим образом. Обозначим через (г I ) число представлений множества т в виде объединения п непересекающихся подмножеств, причем первое из них должно содержать ровно 1\ элемен- тов, второе — ровно I2 элементов, ... , последнее — ровно 1п элементов; 11 + /2 + • • • + In = т- т = Li U 1/2 О ... U Ln-, \Li| = Ц, i = 1,2,... , п Отметим, что порядок следования подмножеств Li важен, даже если они со- держат одинаковое количество элементов. При перестановке местами под- множеств с равным количеством элементов представление множества т в виде объединения изменяется. Биномиальный коэффициент можно записать »»«»: (?) = (» Для вычисления числа (г I ) можно воспользоваться следующими со- ображениями. Станем последовательно выбирать элементы для подмножеств Li,L2,-- - ,Ln. Подмножество Lt можно выбрать способами, при этом останется т — 1\ элементов. Из них выбирают I2 элементов для подмноже- ства Z/2 способами. При этом остается т — l\ — I2 элементов, из них
2.3. ПОЛИНОМИАЛЬНАЯ ФОРМУЛА 33 выбирается третье множество. Продолжая этот процесс можно дойти до по- следнего множества. Оно выбирается из оставшихся т—1±—12— -—ln-1 = 1п элементов единственным способом (запишем, однако, эту единицу в виде Все подмножества выбираются независимо друг от друга. Поэтому, необходимо перемножить получившиеся результаты: т! (т —к)! (m — li — l2)! (т — 1± — ... — /п-1)! /2!(т - - /2)! 13Цт - h - 12 - /3)! ’ ’ ’ W После сокращений получится формула: т! /. i/„i ГТ <1 •*'2 • • • • «П’ Эти числа называют полиномиальными коэффициентами. Имеет место фор- мула: (xi + Х2 + - - - + Хп) т I1I2 • • -I, Z1+Z2 +•••+/»—TH Она называется полиномиальной формулой. Для ее доказательства нужно подробно исследовать процесс раскрытия скобок у ш штук одинаковых мно- жителей (тх + х2 + • • • + хп). Можно обозначать эти множители натураль- ными числами от 1 до ш. Слагаемое х^х1^ х1™ возникает всякий раз, ко- гда ровно из Zi множителей выбирают первое слагаемое, ровно из 12 множи- телей выбирают второе слагаемое, ... , ровно из 1п множителей выбирают последнее слагаемое. Можно дать комбинаторную интерпретацию всем та- ким ситуациям. Пусть слагаемые из множителей выбраны указанным выше способом. Станем раскладывать карточки с номерами от 1 до ш в ящики, пронумерованные от 1 до п, следующим образом. Если из i-ro множителя выбрано слагаемое х^, то в k-й ящик кладем карточку с номером i. В резуль- тате получается представление множества т в виде объединения п непере- секающихся подмножеств, в первом из которых — 1| элементов, во втором — 12 элементов, ... , в последнем — 1п элементов. Так что, коэффициентом при члене х1^х1^ -х1™ будет число (г г )• Подставим в полиномиальную формулу xt = l,i = 1,2,... П’.
34 ГЛАВА 2. КОМБИНАТОРИКА Эта формула обобщает формулу для суммы всех биномиальных коэффици- ентов. Интересно узнать количество слагаемых в правой части полиноми- альной формулы. Это число совпадает с количеством решений уравнения: 11 + + ... + 1п = т в целых неотрицательных числах. Для биномиального случая п = 2, и ответ очевиден — т + 1. В общем случае можно применить следующее комбинаторное рассужде- ние. По решению (11,1,2, • • • Ап) этого уравнения в целых неотрицательных числах можно построить следующую последовательность из двоек и еди- ниц. Сначала поставим I] единиц, затем поставим одну двойку. После этого поставим I2 единиц, затем поставим одну двойку. И так далее. В самом конце поставим 1п единиц. Двойки, таким образом, играют роль разгра- ничителей между п последовательностями, состоящими из единиц. Таких разграничителей всего п — 1 штук. Единиц всего li +12 + • • • + 1п = т штук. Можно спросить: всякую ли последовательность, состоящую из ш единиц и п — 1 двоек, можно построить по решению. Некоторые последовательно- сти будут содержать по нескольку двоек подряд. Это просто означает, что в соответствующих местах стоят нулевые компоненты решения. По любой по- следовательности указанного вида из двоек и единиц можно однозначно по- строить решение. Осталось подсчитать число последовательностей. Однако подобные объекты нам уже встречались в первой секции при пересчете чи- сла всех подмножеств. Такая последовательность однозначно соответствует функции fx : т + п — 1 —> 2, которая выделяет ш-элементное подмножество X С т + п — 1. Всего таких функций — штук- Это число можно записать в виде — • Последняя задача допускает несколько комбинаторных формулировок, которые можно использовать на практике. Решение уравнения Z1 + Z2 + ... + 1п = т в неотрицательных целых числах можно представить следую- щим образом. Пусть имеется m одинаковых карточек, которые произволь- ным образом раскладываются по п ящикам, пронумерованным от 1 до п. В первый ящик кладется 1\ карточек, во второй ящик кладется I2 карточек. И так далее. В последний ящик кладется 1п карточек. Порядок следова- ния карточек неважен — они все одинаковые. Эта простая интерпретация позволяет решить следующую задачу: Найти число решений уравнения li + I2 + ... + 1п = ш в натуральных числах. В терминах нашей интерпре- тации это означает, что в каждом ящике лежит хотя бы одна карточка. Задача сводится к предыдущей следующим образом. Сначала положим в
2.3. ПОЛИНОМИАЛЬНАЯ ФОРМУЛА 35 каждый по одной карточке. Затем оставшиеся т — п карточек разложим как в предидущем случае. Число возможностей равно = (™~i) • Мультимножеством, состоящим из элементов некоторого множества на- зывается неупорядоченная совокупность, состоящая из элементов данного множества, которые могут в ней повторяться. Например, {1,3,3,3,4,4} — мультимножество элементов множества 4. Типичным примером на подсчет числа мультимножеств является следующая задача: Имеются пирожные трех сортов. Сколькими способами можно выбрать пять пирожных? Можно выбрать все пирожные одного сорта тремя способами. Если вы- бирается два сорта пирожных, то таких возможностей — 12 штук (тремя способами можно два сорта из трех, четырьмя способами можно разделить пять пирожных по сортам). Если используется все три сорта, то это озна- чает, что к трем разным пирожным нужно добавить еще два произвольным образом. Таких возможностей — б штук ( тремя способами можно добавить два одинаковых пирожных, тремя способами можно добавить два разных). Общее число мультимножеств — 21=(?) • Получается, что число мультим- ножеств равно числу раскладок пяти одинаковых карточек по трем разным ящикам. Это не случайно — общее число мультимножеств ш элементов из множества п равно (т^”7')- В самом деле, пусть имеется такое мультим- ножество. По нему однозначно строится раскладка ш одинаковых карто- чек по п разным ящикам: сколько имеется элементов i в мультимножестве, столько карточек кладется в i-й ящик. Обратная процедура также имеет место. Пусть имеется раскладка карточек по ящикам. На карточках, лежа- щих в каждом ящике, поставим номер ящика. Затем высыпим все карточки в одно место — получим мультимножество нужного вида. Разбиению множества т на п непересекающихся подмножеств также можно дать занятную комбинаторную интерпретацию. Пусть в первом под- множестве — 1\ элементов. Во втором подмножестве — 1^ элементов ... В последнем подмножестве — 1п элементов. Будем строить m-буквенное слово в алфавите, состоящем из п символов, следующим образом. Элементы мно- жества т будем считать номерами позиций в этом слове, а номера подмно- жеств — его буквами. Другими словами, в i-й позиции должна стоять буква , имеющая номер подмножества, в которое попало число i при разбиении. Очевидно, что, имея слово, мы сможем разбросать номера позиций его букв по подмножествам, соответствующим номерам букв по счету в алфавитном порядке. Так что, всего таких слов будет (г ; ) штук. Разберем класси- ческий пример: Сколько слов получаются перестановками букв в слове ” математика” ?
36 ГЛАВА 2. КОМБИНАТОРИКА Это слово имеет т=10 позиций и п=6 букв. Буква ”а” встречается li = 3 раза, буквы ”т” и ”м” встречаются по 1% = 1з = 2 раза, буквы ”е”,”и”,”к” встречаются однократно — Ц = Ц = 1в = 1. Общее число таких слов — (з 2 210i 1 1) = 151200. У пражнения 1. Доказать, что число способов, которыми два человека могут разделить 2п предметов одного вида, 2п предметов другого вида и 2п предметов третьего вида так, чтобы каждый получил Зп предметов, равно Зп2 + Зп + 1. 2. Пусть ао, 01,02,... — коэффициенты в разложении (1 + х + ж2)” по возрастающим степеням х. Доказать, что a) OqOi — O1O2 + O2O3 — ... — О2п-1О2п = 0; b) oq + 02 + 04 + ... + O2n = ^(3n + 1); c) O1 + 03 + 05 + . . . + O2n-1 = |(3” — 1). 2.4 Формула ’’включений и исключений”. Хорошо известную формулу для двух конечных множеств X и Y — |Х U У| = |Х| + |У| — |ХГ1У| — можно обобщить на случай нескольких множеств. Имеет место формула ’’включений и исключений”: |Xi U Х2 U ... U Хп| = = Е 1^1- Е |УпП^2|+ Е |^inXi2nXi3|-...+ 1<г<п l<ii<i2<n I<ii<i2<i3<n +(-i)fc-x Е |xilnxi2n...nxij+...+(-i)"-1|x1nx2n...nx„| \ <i) <i2<...<ii-<n В этой формуле k-я сумма суммируется по всем наборам из к штук раз- личных множеств. Всего множеств п штук. Значит, число слагаемых в к-й сумме равно , а общее число слагаемых в правой части формулы равно 2к — 1. Эту громоздкую формулу можно доказать методом математической индукции. В качестве начального шага индукции можно взять формулу для двух множеств. Предположим, что формула выполняется для п — 1 мно- жеств, и нам нужно доказать ее для п множеств — Х±, Х2,... , Хп. Положим Y = Xn_i U Хп. Раскрыв выражение |A"i U Х2 U ... U Хп~2 U У| по формуле ’’включений и исключений”, получим k-ю сумму из правой части в виде: (-i)fc-x( £ |хй n xi2 п... n xik |+ l<ii <г2<---<й <n—2
2.4. ФОРМУЛА ”ВКЛЮ ЧЕНИЙ И ИСКЛЮ ЧЕНИЙ”. 37 + £ l^n.-.n^nri 1<й <i2<---<ifc_i <п—2 Общий член у второй суммы можно переписать в виде: |Х П У| = |Х П (Х„_! и Х„)| = |(Х П Х„_х) и (X П Х„)|, где X = Х,А О ... О Xik_r. Последний член можно переписать в виде: |Х П Х„_х| + |Х П Х„| - |(Х П Х„_х) П (X П Х„)| = = |ХПХ„_1| + |ХПХ„|- |ХПХ„_1ПХ„| Если вставить первые два члена из правой части последнего равенства в исходное равенство, то они дадут все члены из k-й суммы, оканчивающиеся на Хп_1 или на Хп, за исключением членов, оканчивающихся на Хп_\ О Хп. Последние придут из (к — 1)-го шага. Дело в том, что третий член ”с минусом” из правой части последнего равенства дает слагаемые из (к + 1)- й суммы, причем в точности те из них, что оканчиваются на Хп_\ Г) Хп. Формула проверена по индукции. Разберем три важных примера применения формулы ’’включений и ис- ключений” . Пример 1 (число наложений). Функцию f : п —> т назовем наложе- нием или сюрьекцией, если всякое к € т можно представить в виде к = f(i). для некоторого i € п. При этом, конечно, п > т. Если ш=п, то число к однозначно представляется в таком виде , и функция f является также вло- жением. Число наложений обозначим через sur(n,m). Для вычисления этого числа найдем число всех функций, не являющихся наложениями. Множество всех таких функций представим в виде объединения Х± UA^U.. АЗХт, где Х^ — множество функций, которые не принимают значения к € т. Заметим, что X]. можно представить как множество всех функций f : п —> m\{fe}. Совершенно аналогично множество Х^ Г) Xi2 Г) ... Г) Х/. можно предста- вить как множество всех функций f : п —> m\{li, 12, , /«}. Поэтому, число его элементов равно (т — а)”. Каждая сумма в формуле ’’включений и ис- ключений” представляет собой сумму одинаковых слагаемых, указанного выше вида (т — а)” . Поэтому, имеет место формула: т / \ |Хх U Х2 и ... и Хго| = ( т ) (m - а)п. s=i k s 7
38 ГЛАВА 2. КОМБИНАТОРИКА Найдем число sur(n,m) как число элементов дополнения множества X] U Х2 U ... U Хт до множества всех функций: sur(n, т) = тп — |Xi U Х2 U ... U Хт | = т / \ т / \ = mn _ £(-1)-1 s)n = £(-1)’Г - «)”• §=1 ' ' §=0 ' При m=n это число равно числу вложений, то есть убывающей степени п— = /г!. Получается нетривиальная формула: д! = £ (-1Г 8=0 Пример 2 (число беспорядков). Несколько человек подбросили в воз- дух свои шляпы во время взятия футбольных ворот. Шляпы вернулись в произвольном порядке. Какова вероятность того, что каждый получит чу- жую шляпу? Под вероятностью понимается отношение числа возможностей распределения шляп указанным выше способом к числу всех возможностей. Ответ этой задачи несколько неожиданный: вне зависимости от того, де- сять человек бросили шляпы или тысяча, эта вероятность приблизительно равна 1/е. Пусть шляпы бросили п человек. Станем обозначать и людей, и шляпы элементами множества п. Тогда распределение упавших шляп задает функ- цию f : п —> п, которая является и вложением и наложением (такие функ- ции называются перестановками множества п). Пусть вначале у к-го чело- века была k-я шляпа, тогда перестановка f обладает следующим свойством: f(k) к для к = 1,2,... , п (такие перестановки называют беспорядками). Подсчитаем количество всех перестановок, не обладающих этим свойством. Обозначим через Х^ множество перестановок f, обладающих свойством: /(&) = к. Объединение всех таких множеств даст множество перестано- вок, не являющихся беспорядками. Количество элементов множества Х^ равно количеству перестановок множества n\{fc}. Аналогично число эле- ментов множества Хц О Л)2 О... О Хц равно числу перестановок множества n\{h,l2, ,1s}- Это число равно (п — в)! . В формуле ’’включений и ис- ключений” ему будут равны все слагаемые в s-й сумме: П / \ п |Хх U Х2 U ... U Х„| = ^(-l)*-1 (п) (n - s)! = n! ^(-l)’-1/^ 8=1 kV S=1
2.4. ФОРМУЛА ”ВКЛЮ ЧЕНИЙ И ИСКЛЮ ЧЕНИЙ”. 39 Поэтому, число беспорядков равно: п п! - |Хх U Х2 U ... U Х„| = n! ^2(-1)7s!. s=0 Значит, искомая вероятность равна 22”=О(—l)s/sl. Это — частичная сумма ряда, быстро сходящегося к 1/е. Пример 3 (формула для функции Эйлера). По любому натураль- ному числу п можно определить число ф(п') следующим образом. Положим: ф(1) = 1. Пусть п > 1, тогда ф(п') определяется как количество всех вза- имно простых (то есть не имеющих общих делителей, отличных от 1) с п чисел из множества п. К примеру, для п = б имеется лишь два таких числа — 1 и 5, </>(б) = 2. Соответствие п ф(п) называют функцией Эйлера. Пусть п = рУр22 • • -Р'т — разложение на простые множители (pi,p2,... ,рт — различные простые числа). Найдем формулу для числа ф(п'). Для этого представим в удобной форме подмножество тех чисел из п, что имеют отличные от единицы общие делители с числом п. Обозначим через X]. подмножество тех чисел из п, которые делятся на р^. Для числа из п не быть взаимно простым с п означает принадлежать к объединению Xi U Х2 U ... U Хт. Несложно подсчитать число элементов в Х/2. Для этого заметим, что в точности каждое r-е число из множества п делится на г, ко- гда п делится на г (если числа из п последовательно выписывать по строкам длины г в прямоугольную таблицу, то последний r-й столбец будет состоять изо всех кратных г чисел). Таких чисел — п/r штук. Поэтому, множество X/. содержит n/pk элементов. Если число делится на Pi},Pi2, ,ps, то это означает, что данное число делится на произведение PhPi2 - Pia (в силу того, что pk — простые числа для к = 1,2,... , т). Поэтому, в пересече- нии Хц OXi2 Г)... ПХ|, содержится ровно n(pirpi2 .. .р^)-1 чисел. Формула ’’включений и исключений” принимает вид: т \X1UX2U...UXm\=^-iy~1 £ п^р^.-.р^-1. s=l l<h<Z2<---<G <т Поэтому, ф(п) = п — |Xi U Х2 U ... U А"т| = т п(1+^~1г 52 (PhPh-'-piX1)- s=l 1 <h <l2<---<ls <т Эта сумма выглядит громоздко. Однако легко видеть, что она получается в результате раскрытия скобок в произведении: n(l — 1/pi)(1 — 1/рг)... (1 —
40 ГЛАВА 2. КОМБИНАТОРИКА 1/рт). Формула для функции Эйлера имеет вид: ф{п) = n(l - 1/pi)(1 - 1/рг) (1 - 1/рго)- У пражнения 1. Обобщенная формула ’’включений и исключений”. Пусть на некотором конечном множестве заданы п подмножеств. Принадлежность элемента к подмножеству станем интерпретировать как наделение элемента не- которым свойством. Обозначим через количество элементов, обладающих свойствами с номерами Z1J2, • • • ,ls- Доказать, что количество элементов, обладающих ровно к свойствами = Г Nhi2-ik ~ ) У? Nhi2...ik+1 + + 11 </2 < •••</& 11 </2 < ...<1к+1 +(-iy-k п п — к -У12...П- Заметим, что этой формулой можно пользоваться и при к = 0. 2. Решить задачи из примеров 1 и 2, пользуясь формулой из предыдущей задачи.
Глава 3 Комплексные числа 3.1 Алгебраическая форма комплексного числа При решении уравнения третьей степени методом Гудде остался не- исследованным неприводимый случай, когда вспомогательное квадратное уравнение имеет отрицательный дискриминант. Для того, чтобы справиться с этой трудностью, пришлось воспользоваться тригонометрией. В резуль- тате получились существенно отличающиеся друг от друга формулы для решения общего уравнения третьей степени в приводимом и неприводимом случаях. Введение комплексных чисел позволяет решать квадратные урав- нения с отрицательным дискриминантом и, таким образом, унифицирует решение уравнения третьей степени. Нужно уметь, однако, извлекать корни третьей степени из этих новых чисел, как того требует формула Кардано. Геометрическая интерпретация действительных чисел как точек прямой позволяет по аналогии ввести комплексные числа. Комплексными числами называют точки декартовой плоскости. Множество комплексных чисел обо- значается через С. Ось абсцисс отождествляют с действительной прямой, так что имеется вложение R С С. Ось ординат называют мнимой осью. Ле- жащие на ней точки называют чисто мнимыми числами. Базисный вектор этой оси (то есть вектор (0,1)) обозначают через i и называют мнимой еди- ницей. Действительное число 1 соответствует вектору (1,0), поэтому ком- плексное число z с координатами (а, 6) записывают в виде: z = а + Ы. Это — так называемая алгебраическая форма комплексного числа. Координаты 41
42 ГЛАВА 3. КОМПЛЕКСНЫЕ ЧИСЛА а и b называют, соответственно, действительной и мнимой частями ком- плексного числа z. Векторы, соответствующие комплексным числам можно складывать и умножать на действительные числа. Последнюю операцию можно распространить на комплексные числа, то есть можно определить произведение комплексных чисел. Пусть zi = di + bii, + b^i Положим: ziz-i = ciibi - о2&2 + (ai&2 + а261)г. Заметим, что i2 = —1. Это — ключевая формула. Действительно, произве- дение ziz^ определяется при помощи раскрытия скобок и применения этой формулы . Легко показать, что имеют место формулы: Z1Z2 = Z2Z1, Z1(Z2Z3) = (Z1Z2)Z3. Для ненулевого комплесного числа z = а + Ы можно определить обратное по формуле: г-1 = а/{а? + 62) — Ьг/(а2 + Ь2). В самом деле, обозначим z = а — Ы. Это число называют сопряженным к числу z. Тогда имеет место формула: zz = а2 + Ь2, из которой следует фор- мула для обратного числа. Длину вектора, соответствующего комплексному числу z, станем называть его модулем и обозначать через \z\. Докажем, что длина произведения комплексных чисел равна произведе- нию длин множителей. Это легко следует из формулы: |z|2 = zz. Заметим, что Z1Z2 = zi zi = aibi — «262 — (ai&2 + a2&i)i. Тогда, |ziz2|2 = ziz2zizi = ziz2zi zi = |zi|2|z2|2- 1=1 Отсюда следует, что длина обратного обратна длине исходного числа. Впрочем, это непосредственно следует из формулы: г-1 = z/|z|2. Заметим, что преобразование плоскости, определяемое переходом к обратному числу, тесно связано с инверсией относительно стандартной единичной окружно- стью. Эта инверсия задается формулой: z z/|z|2. Таким образом, взятие обратного есть композиция инверсии и сопряжения. При этом внутренность единичного круга отображается вне круга и наоборот. Единичная окруж- ность отражается относительно оси абсцисс на себя. Неподвижными оста- ются лишь точки ±1. Определение. Корнем tfz n-й степени из комплексного числа z называ- ется множество решений уравнения хп = z. Это множество также называют множеством корней n-й степени из числа z.
3.1. АЛГЕБРАИЧЕСКАЯ ФОРМА КОМПЛЕКСНОГО ЧИСЛА 43 Например, \/0 = {0}. В самом деле, из равенства хп = 0 вытекает, что |ж|” = 0. Вычислим квадратные корни из комплексного числа а + Ы. Пусть х = и + vi, тогда и2 — v2 + 2uvi = а + Ы. Нужно решить систему: и2 — v2 = а 2uv = b Возведем второе уравнение в квадрат — 4w2u2 = b2. Выразив из первого уравнения и2 = v2 + а, подставим его во второе уравнение. Получим биква- дратное уравнение: 4и4 + 4av2 — b2. Отсюда находим: и2 = 1/2 (а + у/а2 + Ъ2) v2 = 1/2(—а + у/а2 + Ъ2) Перед радикалом у/а2 + Ь2 был выбран знак ’’плюс”, потому что левая часть неотрицательна. Осталось извлечь арифметические квадратные корни из обеих частей и расставить перед ними знаки. Для последнего нужно обра- титься к исходному второму уравнению — 2uv = b. При возведении этого уравнения в квадрат потерялась необходимая информация. Если b = 0, то решения этой системы будут иметь вид: {(±д/а, 0)} для неотрицательных а, и вид {(0, ±уф([)} для отрицательных а. Для ненулевых b решения системы примут вид: {(sgn(b)yjl/2(a + у/а2 + Ь2), \J 1/2(-а + у/а2 + &)), (-sgn(b)\Jl/2(a + у/ а2 + Ь2), -\J 1/2(-а + у/ а2 + ^))}, где sqn(b) — знак числа Ь. Можно рассматривать многочлены и уравнения с комплексными коэф- фициентами. Многие конструкции, теоремы и формулы остаются верными для этого случая. Например, схема Горнера, теорема Безу, общая теорема Виета, формула для решения квадратного уравнения. Найдем все корни тре- тьей и четвертой степени из единицы. Для этого разложим на множители: х3 — 1 = (ж — 1)(ж2 + х + 1), х4 — 1 = (ж — 1)(ж + 1)(ж2 + 1). Квадратное уравнение х2 + х + 1 = 0 имеет корни ш = 1/2(—1 + y/3i), ш = 1/2(—1 — y/3i). При этом, ш = a/2, w2 + ш + 1 = 0. •У1 = {1, ш, ш2} у''! = {1, — l,i, — г}.
44 ГЛАВА 3. КОМПЛЕКСНЫЕ ЧИСЛА Решить систему: 2.т+у х2+у2 х-2у х2+у2 = -3 = 1. х + У + Эта достаточно сложная система легко решается при помощи комплексных чисел. В самом деле, умножим левую и правую части второго уравнения на мнимую единицу и сложим их, соответственно, с левой и правой частями первого уравнения: . (2 + i)(x — yi) „ . х + уг Ч----т----т---— —3 + г. х2 + у2 Положим z = x + yi. Получим уравнение: z+(2 + i)/z = —3 + г. Умножив его на z, получим квадратное уравнение: г2 + (3 — г)г + 2 + г = 0. Дискриминант имеет вид: D = (3 — г)2 — 4(2 + г) = —10г. Корни из дискриминанта имеют вид: х/—10г = {±\/5(—1 + г). Множество решений системы: {(-1/2(3 + \/5), 1/2(1 + \/5), (1/2(-3 + \/5), 1/2(1 - л/б)}. Можно перенести решение общего уравнения третьей степени методом Гудде на случай комплексных коэффициентов. Решение будет даваться фор- мулой Кардано. В ней нужно выбрать конкретные значения для кубиче- ских и квадратных корней. Эта формула содержит два квадратных корня и два кубических. С квадратными корнями разобраться легко — они должны иметь противоположные знаки, и безразлично в каком порядке они вхо- дят в кубические радикалы (последние складываются, а от перестановки слагаемых сумма не изменяется). Кубические радикалы совпадают с вы- ражениями и и v, которые связаны условием uv = —6/3. Это условие по- зволяет отобрать из девяти возможностей для значений кубических корней три возможности. В самом деле, существует ровно три значения для куби- ческого корня из ненулевого комплексного числа z: если х$ = z, ж.3 = z, то (жх/жг)3 = 1. Поэтому, множество кубических корней имеет вид: \fz = {жх, ШЖ1, ш2жх}. Таким образом, для первого радикала имеются возможности — {мх, anti, w2ui}, для второго радикала есть также три возможности — {vx,cuvx,cu2vx}- За- метим, что в качестве первого значения можно поставить любое из трех
3.2. ТРИГОНОМЕТРИЧЕСКАЯ ФОРМА КОМПЛЕКСНОГО ЧИСЛА 45 возможных. Выберем щ и Г| такими, чтобы ttiui = —Ь/3. Тогда множество корней общего уравнения третьей степени примет вид: {mi + ui, WM1 + w2t>i, w2Mi + uwi}. Аналогично предыдущему можно найти формулы для кубического корня у/х + yi из комплексного числа х + yi. Для действительного числа х эти формулы имеют вид: \/х + 0i = {\/х,ы^х,и2^х}. У пражнения 1. Доказать тождества: а) ж3 + у3 + z3 — 3xyz = (х + у + z)(x + wy + a>2z)(x + ш2у + uz); b) (x +wy + w2z)3 + (ж + ш2у + wz)3 = = 2(ж + у + z)3 — 9(ж + у + z)(xy + yz + zx) + 27xyz. 2. Найти числа, сопряженные к а) своему квадрату; Ь) своему кубу. 3.2 Тригонометрическая форма комплексного числа На плоскости наиболее употребительны две системы координат — де- картовы и полярные. Им соответствуют две формы записи комплексного числа. Как мы видели в предидущей секции, декартовым координатам ком- плексного числа соответствует алгебраическая форма записи. Для всех то- чек плоскости, за исключением начала координат, можно сопоставить по два числа — полярные координаты. Первая координата — это модуль со- ответствующего комплексного числа (длина радиус-вектора точки). Вторая координата называется аргументом комплексного числа z и обозначается через arg(z). Для точек верхней полуплоскости (включая ось абсцисс) ар- гумент определяется как угол между радиус-вектором точки и положитель- ным направлением оси абсцисс. Поэтому, для этих точек 0 < arg(z') < тг. Для точек нижней полуплоскости (без оси абсцисс) аргумент определяется как число противоположное величине угла между радиус-вектором точки и положительным направлением оси абсцисс. Таким образом, для этих то- чек —% < arg(z') < 0. Напомним, что против часовой стрелки откладывают
46 ГЛАВА 3. КОМПЛЕКСНЫЕ ЧИСЛА положительные величины углов, а по часовой — отрицательные. Аргумент — это наименьший по модулю угол, откладываемый от положительного направления оси абсцисс к радиус-вектору точки. Иногда рассматривают так называемый ’’большой” аргумент комплексного числа z — Arg(z'). Это — множество [arg(z) + 2тт|/г € Z}. Если это выражение входит в некую формулу, то мы рассматриваем бесконечное множество формул (по одной для каждого значения п € Z). Пусть комплексное число z задано полярными координатами (г, ф). Тогда, от алгебраической формы записи — z = х + yi — можно перейти к записи через полярные координаты. Заметим, что г = \/х2 + у2, созф = зтф = г г Поэтому, z = r(cos0 + isin0). Это — так называемая тригонометрическая форма комплексного числа z. В конце секции 5 главы 2 приведены формулы, связывающие аргумент с действительной и мнимой частями комплексного числа. Подобно тому, что алгебраическая форма записи комплексных чисел хо- рошо согласована с их сложением, тригонометрическая форма записи ком- плексных чисел хорошо согласована с их умножением. Теорема. При умножении ненулевых комплексных чисел их модули пе- ремножаются, а ’’большие” аргументы складываются. Доказательство. □ Пусть zi = ri(cos</»i + i sin </>i), Z2 = /'2 (cos 02 + г sin </>2)- Тогда имеет место формула: Z|Z2 = Г1Г2(сО8</>1 + i sin 01) (cos 02 + isin</>2) = = Г1Гг(сО8 01 COS 02 ~ sin 01 sin ф2 + i(cOS0i 8Н102 + COS 02 sin 01)) = = rir2(cos(0i + 02) + isin(0i + 02)). 1=1 Следствие (формула Муавра). Пусть комплексное число предста- вляется в следующем виде: z = r(cos0 + isin0),r > 0. Тогда имеет место равенство: zn = rn (cos пф + isinn0). □ Эта формула позволяет найти все корни n-й степени из единицы. Следствие. Имеет место формула: \/1 = {1,cos2tt//i + isin27r//i,cos2(27r//i) + г sin 2(тг/тг), cos3(2tt//i) + г sin 3(2тг/п),... ,cos(n — 1)(2тг/п) + isin(n — 1)(2тг/п)}
3.2. ТРИГОНОМЕТРИЧЕСКАЯ ФОРМА КОМПЛЕКСНОГО ЧИСЛА 47 Доказательство. □ Пусть хп = 1. Взяв модуль от обеих частей, полу- чим: |ж”| = |ж|” = 1. Значит, |ж| = 1. Это число имеет вид: х = cos<t>+ism</). Согласно формуле Муавра: cosn</» + isinnA = 1. Значит, имеет место фор- мула: пф = 2як. Отсюда вытекает, что ф = к(2тт/п),к € Z. Функции синус и косинус периодичны с наименьшим периодом 2тг. Поэтому, все возможные значения корней получатся при к = 0,1,2,3,... , п — 1. □ Обозначим через еп число соз2тг//г + isin27r/n. Тогда множество всех корней n-й степени из единицы примет вид: В тех случаях, где не возникает двусмысленности, мы будем опускать ниж- ний индекс после е. Можно легко сосчитать сумму всех корней n-й степени из единицы. Для этого умножим ее на ненулевое число е — 1 : (е - 1)(1 + е + е2 + ... + е"-1) = еп - 1 = 1 - 1 = 0. Значит, сумма всех корней n-й степени из единицы равно нулю. Заметим, что можно было сразу воспользоваться формулой для суммы геометриче- ской прогрессии, которая автоматически переносится на случай комплекс- ных чисел. Найдем произведение всех корней n-й степени из единицы при помощи формулы Муавра: 1 хе хе2 х.. .хе”-1 = е1+2+-+"-1 = en(n-i)/2 _ C0S7r(n-l) + г sin 7г(п — 1) = = СО8 7г(/1 — 1) = ( —I)”-1. При помощи корней n-й степени из единицы можно выразить все корни n-й степени из комплексного числа z через один из таких корней — х : yfz = {ж, же, же2,... ,же”-1}. Для доказательства достаточно заметить следующий факт. Если ж” = z, х% z, то имеет место равенство: (жх/жг)” = 1. Пусть z = r(cos</> + isin</>), тогда в качестве корня х удобно выбрать число ->/r(cos ф/п + г sin ф/п). Разберем следующую несложную задачу. Найти все комплексные числа, сопряженные к своей n-й степени. Аналитически это условие выглядит следующим образом: z = zn. Возь- мем модуль от обеих частей: |г| = |z| = |г”| = |г|”. Отсюда вытекает, что |z| = 0 или |z| = 1. Первый случай дает решение z = 0. Пусть |zj = 1. Arg(z) = Arg(zn) Однако, Arg(z) = —Arg(z), Arg(zn) = narg(z) + 2ттк,к €
48 ГЛАВА 3. КОМПЛЕКСНЫЕ ЧИСЛА Z. Поэтому, (п + l)Ary(z) = 2тгк, к € Z. Значит, получается еще множество из (n+1) решения — "+\/1. Всего эта задача имеет (п + 2) решения. Вторую часть решения можно оформить по-другому. Умножим исходное равенство на z: zz = zn+1. Однако, zz = |z|2 = 1. Разберем более сложную задачу: Вычислить суммы Si(m, 3), I = 0,1,2. Определение этих сумм — в конце секции 2 главы 2. Рассмотрим бином: (1 + w)m = (со8 7г/3 + i sin тг/З)*” = cos7rm/3 + isin7rm/3. С другой стороны, этот бином представляется в виде: (1 + ш)т = So(m,3) + Si(m,3)(jj + = = So(m,3) — S2(m,2) + (Si(m,3) — S2(m,3))w. Последнее равенство вытекает из формулы 1 + ш + w2 =0. Удобно рассмо- треть три случая в зависимости от остатка при делении числа m на три, чтобы избавиться от косинуса и синуса. Случай 1. m=3k costtA- + isinirk = (—l)fc. Приравняв обе формулы для бинома, получим равенство: (-l)fc = S0(3k,3) - S2(3k,3) + (51(3^3) - S2(3fe,3))w. Это равенство можно рассматривать как равенство двух векторов плоско- сти, разложенных по базису: 1,ш. Поэтому, оно эквивалентно следующей системе: S0(3fc,3)-52(3^3) = (-l)fc Si(3fe,3) - S2(3fe,3) = 0. У нас получились два уравнения и три переменных. Положение спасает еще одно уравнение, которое известно нам из секции 2 главы 2. Сумма трех наших неизвестных — это сумма всех биномиальных коэффициентов с верх- ним индексом 3k: So(3k,3) + Si(3fe,3) + 3) = 8k. В итоге получаются следующие формулы: S0(3k,3) = (8к + 2(—l)fc)/3, 51(3^3) = S2(3k,3) = (8к + (-l)fc+1)/3. Случай 2. m=3k+l cos(tt/3 + тгк) + i sin(7r/3 + тгк) = (—l)fc(l + ш).
3.2. ТРИГОНОМЕТРИЧЕСКАЯ ФОРМА КОМПЛЕКСНОГО ЧИСЛА 49 Получим систему: ' S0(3k + 1,3) + 51(3^ + 1,3) + S2(3fe + 1,3) = 2-8fc < S0(3fc + 1,3) — S2(3fc + 1,3) = (—l)fc _ Si(3fe + 1,3)-S2(3fe + 1,3) = (-l)fc. Решение имеет вид: S0(3fe+l,3) = Si(3fe+1,3) = (2-8fc+(—l)fc)/3, S2(3fe+1,3) = (2-8fc+2(-l)fc+1 )/3. Случай 3. m=3k+2 cos(2tt/3 + irk) + i sin(27r/3 + irk) = (—l)fcw. Получим систему: ' S0(3fe + 2,3) + Si(3fe + 2,3) + S2(3fe + 2,3) = 4 • 8fc < S0(3fe + 2,3) — S2(3fe + 2,3) = 0 _ Si(3fe + 2,3) — S2(3fe + 2,3) = (—l)fc. Решение имеет вид: S0(3fe+2,3) = S2(3fe+2,3) = (4-8fc+(-l)fc+1)/3, Si(3fe+2,3) = (4-8fc+2(-l)fc)/3. Совершенно аналогично можно подсчитать суммы Si(m, 4), I = 0,1,2,3. Для этого нужно рассмотреть бином: (1 + i)m = 2m/2(cos7r/4 + i sin тг/4)т = 2m/2(cos7rm/4 + isirnmi/A). С другой стороны, этот бином равен: (1 +i)ro = 50(m,4) - S2(m,4) + (Si(m,4) - S3(m,4))i. При этом имеют место равенства: S0(m,4) + S2(m,4) = S0(m,2) = 2го-1, Si(m,4) + S3(m,4) = 2го-1. Отсюда находим: S0(m,4) = 2ГО“2 + 2го/2-1 созтгт/4, Si(m,4) = 2ГО“2 + 2го/2-1 sin7rm/4, S2(m,4) = 2ГО“2 - 2т/‘2~1 созтгш/4, S3(m,4) = 2ГО“2 - 2го/2-1 sin7rm/4. Эти формулы примут более удобный вид, если рассмотреть частные случаи в зависимости от остатка при делении числа ш на 4.
50 ГЛАВА 3. КОМПЛЕКСНЫЕ ЧИСЛА У пражнения 1. Вычислить сумму всех к-х степеней всех корней n-й степени из 1. 2. Вычислить сумму: 1 + 2е + Зе2 + ... + /ге”-1, где е = cos2tt//i + sin27r//i. 3. Решить уравнение: (Th \ , . , / 1 9 // л\ ) х cos(0 + а) + I I х cos(0 + 2а) + ... + 3.3 Применение комплексных чисел к тригонометрии Формулы для синуса и косинуса двойного и тройного аргумента могут быть обощены на случай произвольного кратного аргумента. Для этого рас- смотрим следующий бином: (cos х + i sin х)п = cos пх + i sin nx. Раскрыв скобки по формуле Ньютона и отделив действительную и мнимую части, получим формулы: cos пх = cos” х — ( 2 ) cos”-2 х sin2 х + ( ” ) cos”-4 х sin4 x — ... . f n i . f ^h\ n 3 • 3 f ^h\ n ‘r • ‘r sin nx = . COS X sin x — cos sin +1 COS X sin x — . . . \i/ \3j \b j Общий член для первой суммы имеет вид: (—l)fc(2^) cos”-2fc a:sin2fc ж. Об- щий член для второй суммы имеет вид: (—cos”-2fc-1 xsin2fc+1 ж. Последние члены этих сумм зависят от четности п, поэтому они не выпи- саны. Приведем эти формулы для малых п: cos 4ж = cos4 х — б cos2 х sin2 х + sin4 х, sin 4х = 4 cos3 х sin х — 4 cos х sin3 х; cos 5х = cos5 х — 10 cos3 sin2 +5 cos x sin4 x, sin 5x = 5 cos4 x sin x — 10 cos2 x sin3 x + sin5 x. Из этих формул можно вывести некоторые интересные факты. Подсчи- таем, например, сумму ряда, состоящего изо всех обратных квадратов: 1 1 + 2-2 + З-2 + ... + к~2 + ... .
3.3. ПРИМЕНЕНИЕ КОМПЛЕКСНЫХ ЧИСЕЛ К ТРИГОНОМЕТРИИ 51 Разделим формулу для sin пх на sin” х : sinпх , fn\ , {п\ , — = nctg тх — I „ ) с/р Jx + I _ ) с/р °х — ... . sm х \3/ \5/ Заметим, что левая часть формулы обращается в ноль при х = "1/п,1 = 1,2,... , п — 1. Пусть п = 2к + 1. Тогда уравнение /n. -lx k f2k +1\ / 2к +1\ ь—2 р. 2fe + lpfc- ]ук х+ ]ук 2 —... = 0 \ 3 / \ 5 ) имеет корни yt = с/р2(тг/п),у2 = ctg2(тг2/п),... , ctg2 (тгк / п). Поэтому, пра- вую часть уравнения можно переписать в виде: (2fe+l)(p-pi)(p-p2) • • • (у~Ук) = (2fe+l)pfc-(2fe+l)(pi+p2+- • -+ук)ук~* 1+- Значит, коэффициенты при pfc-1 совпадают: /2&+Г\ , 2к(2к — 1) У1 + 2/2 + • • • + Ук — I „ I /2fe + 1 — ---. \ О / О Мы получили тождество: 2 % 2 тг2 ..тгк 2к(2к+1) йУ*2ГИ+ - +с,в = —6—• которое позволяет решить поставленную задачу. В самом деле, для любого угла а из первой четверти имеют место сравнения: sin а < а < tga. Возведя их в степень —2, получим двойное сравнение: ctg2a < а~2 < sin-2 а = с/р2 + 1. Станем подставлять вместо а числа id/(2k + 1) для I = 1,2,... , к. По- лучим двойные сравнения вида: у2 < (2к + 1)2/(тг/)2 < у2 + 1. Сложив их все, получим следующее двойное сравнение: У1+У2 + --- + Ук< (2/г+1/тг)2 (1 + 2 2 + 3 2 + ... + к 2) < yi+y% + • • - + Ук + к. Учитывая полученное тождество, перепишем его в виде: тг22к(2к — 1) 6(2fe + l)2 < 1 + 2~2 + 3“2 + ... + к~2 < it22k(2k — 1) 7r2fe 6(2fe+ I)2 + (2fe + l)2’ Крайние части этого двойного неравенства стремятся к одному и тому же пределу — к тг2/6. Значит, 1 + 2~2 + 3“2 + ... + к~2 + ... = тг2/6.
52 ГЛАВА 3. КОМПЛЕКСНЫЕ ЧИСЛА Можно обобщить следующие формулы, выражающие степени синуса или косинуса через косинусы или синусы кратных углов: 2 cos2 х = cos 2ж + 1, 2 sin2 = 1 — cos 2ж; 4 cos3 х = cos Зх + 3 cos x, 4 sin3 = 3 sin x — sin 3x. Для этого рассмотрим бином (u+u)", где и = cosx + ismx, v = cos— isinx. С одной стороны, (и + v)n = 2” cos” x. С другой стороны, можно раскрыть этот бином по формуле Ньютона, пользуясь тем, что uv = 1 : (м + и)" = ип + vn + ( J (м"“2 + д"“2) + Им"“4+д"“4) + ... 2k\ к J’ Заметим, что и1 + vl = 2 cos lx. В зависимости от четности п получим фор- мулы: fc-1 /2АЛ 4fc cos2fc х = 2 ( jcos2(fe — s)x + s=0 ' ® ' 4k cos2fc+1 x = cos(2fe + 1 — 2s)x. s=0 ' ' Совершенно аналогично, рассматривая бином (м — и)”, получим формулы: к 1 12к\ 4fcsin2fc = 2^(-l)fc+s jcos2(fe —з)ж + s=o ' ' 2k\ к ) /ОЬ I 1\ 4k sin2fc+1 x = ^(-l)fc+s ( ) sin(2fe + 1 - 2s)t S=0 \ S 7 У пражнения 1. По индукции проверить формулу: 2 cos пт = (2 cos ж)” — j (2 cos ж)”-2 + (2 со8ж)”~4 — , ,п(п — s — 1)(д — s — 2)... (п — 2s + 1) ... + (-1) —---------------7-^-----------(2созж)" 2s + . . . .S
3.4. ТЕОРЕМА ДАЛАМБЕРА-ГАУССА 53 Указание: Использовать формулу 2cos(/i + 1)t = 4cosxcosnx — 2cos(n — 1)ж. 2. Вычислить суммы: . {п \ {п \ a) cosх + I cos 2х + ... + I eosin + 1 )х; \1/ \п/ . {п \ „ I п\ . , о) sinj + I 8ш2ж + ... + I sml/i + 1)ж. \1/ \П/ 3.4 Теорема Даламбера-Гаусса Теорема Даламбера-Гаусса или, как её ещё называют, основная теорема алгебры состоит в следующем. Каждое алгебриаческое уравнение n-й степени с комплексными коэффи- циентами имеет ровно п комплексных корней с учетом их кратностей. При помощи теоремы Безу эта теорема легко сводится к более простой формулировке: каждое алгебраическое уравнение положительной степени имеет ком- плексный корень. □ В самом деле, выведем исходную теорему из этого предложения, ис- пользуя индукцию по степени уравнения. Для уравнений первой степни обе формулировки эквивалентны и выполняются очевидным образом. Пусть ис- ходная теорема выполняется для всех уравнений степеней не превосходя- щих п. Рассмотрим произвольное уравнение f(z) = 0, где degf(z) = п + 1. Согласно второй формулировке теоремы Даламбера-Гаусса, Это уравнение имеет корень zq. По теореме Безу существует многочлен g(z') степени п та- кой, что f(z) = (z — zo)g(z) = 0. Уравнение g(z) = 0 имеет ровно п корней, согласно предположению индукции. □ Эту теорему доказали Даламбер и Гаусс. Мы не станем здесь приво- дить их доказательства. Вместо этого мы разберем нестрогое доказатель- ство этой теоремы, которое носит название ’’дама с собачкой”. Подчеркнем, что мы рассматриваем уравнения вида f(z) = 0, где f(z) — многочлен с комплексными коэффициентами. Как мы показали в секции 2, уравнение zn = z имеет п + 2 решения. Поэтому, нужно рассматривать только стандартные многочлены (без сопряженной переменной). □ Можно положить старший коэффициент многочлена f(z') равным еди- нице: f(z) = zn + a±zn~1 + ... + an; 6 С к = 1,2,... , n.
54 ГЛАВА 3. КОМПЛЕКСНЫЕ ЧИСЛА Кроме того, можно считать, что свободный член не равен нулю (в против- ном случае многочлен имеет очевидный корень z = 0). Пусть /(г) = zn + /х(ж). Эти два слагаемых называют, соответственно, ’’дама” и ’’собачка.” Пусть а = maa:{|ai|, |«21, • • • , |ап|}, го — корень исход- ного уравнения. Пусть |го| > 1. Тогда, \zq | = |/i(zo)|- При этом выполняется соотношение: Ы” = 1/1Ы1 < МЫ”-1 + |а21|го|"-2 + • • • + |а„| < < nHz I”"1+ lz I”"2 + + -°(Ы + Ы + ... + 1) - Значит, 1 < а/(|го| — 1)- Поэтому, ко| < а + 1. При выполнении условия |г| > а + 1 ’’дама” имеет такой большой модуль, что ’’собачка” не может достать до нуля, и корней у уравнения нет. Теперь рассмотрим это уравнение при малых по модулю значениях z — \z\ < 1. В этом случае, значение исходного многочлена близко к свободному члену — ап. Действительно, \f(z) - а„| = klk"-1 + a1Zn~2 + ... + a„_i| < < kl (° + i)(kl”-1 + kl"“2 + • • • + 1) < kl(a + i>- В последней строчке мы заменили каждое слагаемое на 1. Для любого, сколь угодно малого е > 0 мы можем выбрать \z\ < 8 = s(a + 1)-1/г-1. При этом, будет выполнятся неравенство: |/(г) — ап| < е. Пусть г € [<5/2,а + 2]. Рассмотрим образ окружности z = r(cosi-Msini), где —% < t < тг, при отображении z f(z). Для значений г, близких к правому концу отрезка, этот образ — замкнутая кривая, ограничивающая область, внутри которой лежит начало координат — точка z = 0. При г, близких к левому концу отрезка, этот образ — замкнутая кривая, ограничивающая область, лежащую в е-окрестности точки ап. Точка z = 0 будет лежать вне этой области. При постепенном изменении г от левого до правого концов отрезка, за- мкнутая кривая — образ окружности радиуса г — будет плавно меняться. В силу того, что сначала точка z = 0 лежит вне области, ограниченной этой кривой, а в конце эта точка лежит внутри этой области, должно суще- ствовать промежуточное значение г, при котором данная кривая пересечет точку z = 0. Точка пересечения будет соответствовать корню исходного уравнения. □
3.4. ТЕОРЕМА ДАЛАМБЕРА-ГАУССА 55 Теорема. Всякий многочлен положительной степени с действительными коэффициентами раскладывается в произведение линейных множителей и квадратных трехчленов с действительными коэффициентами. Доказательство. □ Пусть f(x) — многочлен с действительными коэф- фициентами степени п > 1. Можно считать старший коэффициент равным единице. Пусть х±, Х2,... , хп — все его комплексные корни (кратные выпи- саны столько раз, какова их кратность). Тогда имеет место равенство: f(x) = (х- хг)(х - ж2)... (х - хп). Для доказательства теоремы достаточно показать, что корни, не являющи- еся действительными числами, делятся на пары комплесно сопряженных. Каждая такая пара дает квадратный трехчлен с действительными коэффи- циентами (с отрицательным дискриминантом): (х — (м + vi))(x — (и — vi)) = х2 — 2их + и2 + v2. Если хк — корень многочлена /(ж), то яД также корень этого многочлена. В самом деле, /(ж) = Это следует из того, что сопряженное к степени равно степени сопряженного. Поэтому, О = f(xk) = f(xk). Исходное утверждение проверяется по индукции. Для п = 2 оно очевидно. Предположим, что оно выполняется для всех многочленов не превосходя- щей п степени. Пусть degf(x) = п + 1. Многочлен /(ж) имеет корень. Если этот корень действительный, то f(x) представляется в виде произведения линейного множителя и многочлена степени п с действительными коэффи- циентами. Если этот корень не действительный, то многочлен f(x) предста- вляется в виде произведения квадратного трехчлена и многочлена степени п — 1 с действительными коэффициентами. В обоих случаях индуктивный переход осуществлен.□ Разложим на множители многочлен хп — 1. Его корни — это корни п-й степени из единицы. Разберем отдельно случаи четного и нечетного п. Пусть п = 2к. Имеется два действительных корня — ±1. Комплексные корни разбиваются на пары комплексно сопряженных: cos(2fe — s)— + isin(2fe — s)— = coss — + г sins —, s = 1,2,... , k. к к к к
56 ГЛАВА 3. КОМПЛЕКСНЫЕ ЧИСЛА Каждая такая пара дает квадратный трехчлен вида: х2 — 2ж cos+1. Раз- ложение имеет вид: fc-i х2к — 1 = (ж2 — 1) Ц(ж2 — 2жсо8 8^ + 1). 8=1 Разделив обе части на ж2 — 1, получим равенство: fc-i Ж2^-1) + . . . + Ж2 + 1 = ТТ (ж2 — 2х COS Sy + 1). . к 5=1 Подставив в него х = 1, получим: fc-i к = ТТ (2 — 2coss^-). к 5=1 Разделим каждую скобку на четыре и воспользуемся формулой синуса по- ловинного аргумента: , k—1 » ТТ • 2 —г—- = I I Sin S—Г. 4fc-i 11 2к 5 = 1 Извлекая квадратный корень из обеих частей, получим тождество: 7Г . „ 7Г . , .Д \/к sin — sin2— .. . smlfc - 1)— = 2к 2к v ' 2к 2fc-x Пусть п = 2к+1. Имеется один действительный корень — 1. Разложение имеет вид: к x2k+1 — 1 = (ж — 1) Ц(ж2 — 2жсо8 2а^^7Г + 1). 8=1 Разделив на ж — 1 обе части, получим равенство: к х2к + ж2к-1 + ... + 1 = ТТ(ж2 - 2tcos2s—- + 1). 11 v 2к+1 7 5=1 Подставив в него ж = 1, получим: к 2к + 1 = 1^(2-2 00828^-). 5=1
3.4. ТЕОРЕМА ДАЛАМБЕРА-ГАУССА 57 Разделив каждую скобку на четыре, взяв квадратный корень от обеих ча- стей и воспользовавшись формулой для синуса половинного аргумента, по- лучим тождество: • к • п . тг x/2fe+ 1 sm —------- sm 2 —---- ... sm к—---- = ——.---- 2k +1 2fe+l 2k +1 2k У пражнения 1. Разложить на линейные и квадратные множители с действительными коэффициентами многочлен хп + 1. 2. Доказать, что уравнение (1 + ix)n (1 - ix)n ~ й имеет корни все действительные и различные, если |а| = 1.
58 ГЛАВА 3. КОМПЛЕКСНЫЕ ЧИСЛА
Глава 4 Резольвенты уравнений 4.1 Резольвенты Лагранжа. При решении уравнения третьей степени методом Гудде его корень пред- ставляют в виде суммы двух частей: х = и + v. Лагранж нашел для и и v такую алгебраическую интерпретацию, которая существенным образом проясняет процесс решения, сводя его к комбинаторным манипулящиям с Xi, Х2, хз — корнями уравнения ж3 + ах + b = 0. Положим: pi = Ж1 + шх2 + 1А3, Р2 = Ж1 + W2T2 + ШХз, где си = — 1/2+\^г/2. Эти выражения называются резольвентами Лагранжа общего уравнения третьей степени. Заметим, что Pi + Р2 = 2ж1 + (ш + ш2)(ж2 + хз) = 2Ж1 - (ж2 + Хз). Это следует из уравнения ш2+ш+1 = 0. Согласно теореме Виета для общего уравнения третьей степени, xi + ж2 + хз = 0. Поэтому, рг + р2 = 3x t. Это как раз те части (утроенные) на которые разбивают корень уравнения — и = pi/3,v = р2/3. В самом деле, их произведение имеет вид: Р1Р2 = xl + Х% + Ж2 - Ж1Ж2 - Ж2Жз - Ж3Ж1. 59
60 ГЛАВА 4. РЕЗОЛЬВЕНТЫ УРАВНЕНИЙ Однако сумму квадратов можно преобразовать к виду: Х±+ Х%+ xl = (а?1 + Х2 + Жз)2 - 2(Ж1Ж2 + ®2®3 + Ж3Ж1). Поэтому, Р1Р2 = -3(т1Ж2 + + ®з®1) = -За, так как согласно теореме Виета Ж1Ж2 + ж2жз + Ж3Ж1 = а. Найдем, теперь, сумму кубов р$ + р% = (pi + Рг)((Р1 + Р2)2 - Зрхр2) = Зж1(9ж1 + 9а) = 27(ж? + ажх). Вспомним, что Xi — корень общего уравнения третьей степени. Значит, Жх + axi = —b,pi+p2 = —27b. В результате получилась система двух уравнений: Pi + Р2 = —276 Р1Р2 = -За Эта система совпадает с системой для и и v (для полного соответствия нужно первое уравнение разделить на 2 7,а второе — на 9). Коэффициенты а и b можно считать комплексными числами. р{ = 27(-Ь/2 + \/Д), pl = 27(-Ь/2 - \/Д) В формулах стоит одно и то же значение квадратного корня. Далее решение такое же, что и раньше с и и v. Впрочем, можно лучше объяснить получение второго и третьего корня. Извлечем из двух полученных формул кубические корни таким образом, чтобы выполнялось второе уравнение. Можно соста- вить систему: тх + х2 + xs = 0 < xi + ШХ2 + -Ь/2 + -6/2 Эта система легко решается. В самом деле, сложив все три уравнения, и воспользовавшись равенством ш2 + ш + 1 =0, получим: Зжх = 3(^/-6/2 + \/Д + y/-b/2 + \/Д) Х1 + Ш2Х2 + шхз = 3 y
4.1. РЕЗОЛЬВЕНТЫ ЛАГРАНЖА. 61 Умножим второе уравнение наш2, а третье — наш. Сложив все три равен- ства, получим: Зж2 = 3(w2 yj-b/Z + JK + ш \J-b/2 - \/Д) Теперь умножим второе уравнение на ш, а третье — наш2. Сложив все три равенства, получим: Зжз = 3(wy/—6/2 + а/Д + ш2 \J —Ь/2 — yfK) Однако, резольвенты Лагранжа полезны не только для объяснения ме- тода решения общего уравнения третьей степени. Аналогично квадратному уравнению, для уравнения третьей степени можно определить дискрими- нант £>з. Положим: -Оз = (xi ~ х2)2(х2 - жз)2(жз - Ж1)2, где Т1,Т2,жз — корни уравнения. Очевидно, что дискриминант равен нулю тогда и только тогда, когда уравнение имеет кратные корни. Это — основ- ное свойство дискриминанта. При помощи резольвент Лагранжа можно найти выражение дискриминанта через коэффициенты уравнения х3 + ах + b = 0. Для этого рассмотрим разность кубов резольвент: Р? - Pl = (Pi - Рг)(Р1 - wp2)(pi - ^2Рг) Первая скобка в правой части равна \/Зг(х2 — жз). Вторая скобка равна (1 — w2)(xi — ж2). Третья скобка равна (1 — w)(xi — ж2). Заметим, что (1 — сд)(1 — сд2) ~ 1 — £Д2 -Ь1 = 1-Ь1-Ь1 = 3 Значит, (р? - Р2)2 = -27£>з Однако левую часть последней формулы можно непосредственно выразить через коэффициенты уравнения: (р? - Р2)2 = (Р? + Р2)2 - 4рхР2 = (—276)2 + 4(За)3 = 27(4а3 + 2762) В итоге получаем формулу : D3 = —4а3 - 27b2 = -108Д
62 ГЛАВА 4. РЕЗОЛЬВЕНТЫ УРАВНЕНИЙ Напомним, что уравнение х3 + ах + b = 0 получилось из уравнения х3 + О1Ж2 + а%х + аз = 0 благодаря переходу к переменной х + oi/З, то есть корни первого уравнения получаются из корней второго уравнения путем прибавления к ним одного и того же слагаемого — oi/З. Поэтому, разности корней и, значит, дискриминанты у обоих уравнений совпадают. Подставим формулы a = a2—ai/3, b = оз — О1О2/З + 2о3/27 в дискриминант: D3 = afa| — 4а| — 4о3оз + I8O1O2O3 — 27а| £>з = 0 — необходимое и достаточное условие кратности корней уравнения X3 + О1Ж2 + О2Ж + 03 = 0. Разберем классическую задачу на дискриминант уравнения третьей сте- пени: Решить уравнение (х3 — 3qx +р3 — 3pq)2 — 4(рх + q)3 = 0. Заметим, что левая часть уравнения сильно напоминает дискриминант уравнения z3 + az + b = 0. Для полного соответствия внесем знак ’’минус” за скобку второго члена и умножим обе части на — 27 : -4(-Зрж - Зд)3 - 27(ж3 - 3qx +р3 - 3pq)2 = 0; о = — Зрх — 3q, b = х3 — 3qx — 3pq. Это условие выполняется тогда и только тогда, когда уравнение (от z) z3 — 3(рх + q)z + х3 — 3qx + р3 — 3pq = О имеет кратные корни. Как ни странно, это уравнение легко решается раз- ложением на множители. Для этого достаточно сгруппировать члены z3 + х3 + р3 — 3zxp . Из оставшихся членов---3qz — 3qx — 3qp — выносится множитель z + х + р. Такой же множитель выносится из первой группы членов: (z + х + p)(z2 + х2 + р2 — zx — хр — pz — Зд) = О Получаем первый корень — z\ = —х — р. Оставшиеся два корня найдем из квадратного уравнения: z2 — (х + p)z + х2 + р2 — хр — 3q = О
4.1. РЕЗОЛЬВЕНТЫ ЛАГРАНЖА. 63 Z2 = 1/2(ж + р + \/—Зж2 — Зр2 + бхр + 12g), Z3 = 1/2 (ж +р — \/—Зж2 — Зр2 + бхр + 12g) Исходное уравнение эквивалентно совокупности: —х — р = 1/2(ж + р + ^/—Зж2 — Зр2 + бхр + 12g —х — р = 1/2(ж + р — у/—3х2 — Зр2 + бхр + 12g 1/2(ж + р + у/—3х2 — Зр2 + бхр + 12g) = . 1/2(ж + р — у/—3х2 — Зр2 + бхр + 12g) Первое и второе уравнение совокупности можно переписать в виде: — 3(ж + р) = ±2^/—Зж2 — Зр2 + бхр + 12g. Возводя в квадрат, получим: 9(ж +р)2 = —Зж2 — Зр2 + брж + 12g ж2 + рж + р2 — g = О Ж1,2 = 1/2(-р± \/4д - Зр2) Само собой разумеется, что коэффициенты р и q предполагаются комплекс- ными числами. Третье уравнение совокупности можно переписать в виде: —Зж2 — Зр2 + бжр + 12g = О ж2 — 2рж + р2 — 4g = О ж3,4 =р± 2^/д Мы получили, вообще говоря, четыре различных корня. Это объясняется тем, что первый и второй корни имеют кратность два. В самом деле, исход- ное уравнение переписывается в виде: О - z2)2(z2 - ^3)2Оз - zi)2 = = — 27(ж2 Т рж Т р2 — д)2(ж2 — 2рж +р2 — 4д) = О У пражнения 1. Доказать, что для жз,ж2,жз — корней уравнения ж3 + ах + b = 0 — выполняются условия: 2. |2 2. |2 2. |2 ж, + жхж2 + ж2 = ж2 + ж2жз + ж3 = ж3 + Ж3Ж1 + жх = —а 2. Пользуясь результатом предидущей задачи, составить уравнение третьей степени, имеющее следующие корни: а) у1 = ж2 - жхж2 + ж2, у2 = ж2 - ж2ж3 + ж2, ys = ж2 - Ж3Ж1 + ж2; b) yi = О - ж2)2,у2 = (ж2 - ж3)2,?/з = (ж3 - Ж1)2
64 ГЛАВА 4. РЕЗОЛЬВЕНТЫ УРАВНЕНИЙ 4.2 Решение общего уравнения четвертой сте- пени Общее уравнение четвертой степени Ж4 + О1Ж3 + й2Х2 + а$х + щ = О можно привести к виду ж4 + ах2 + Ьх + с= 0, перейдя к переменной х + ах/4 (это удобно сделать, пользуясь схемой Горнера). Второе уравнение также станем называть общим уравнением четвертой степени. Решим его тремя способами. Метод Гудде Представим корень (удвоенный) в виде трех слагаемых: 2х = и + v + w. Умножим уравнение на 16 и подставим эту формулу в уравнение: (2ж)4 + 4а(2х)2 + 8Ь(2ж) + 16с = (и2 + v2+w2 + 2(uv + vw + ww))2+ +4a(u2 + v2 + w2 + 2(uv + vw + wu)) + 8b(u + v + w) + 16c = = (w2 + v2 + w2)2 + 4(w2 + v2 + w2)(tw + vw + wu) + 4(w2u2 + v2w2 + w2u2)+ +8uvw(u+v + w) + 4a(u2 + v2 +w2) + 8a(uv + vw + wu) + 8b(u + v + w) + 4Qc = 0 У нас три переменные — и, v, w. Значит, нужно получить систему из трех уравнений. Для этого нужно на слагаемые в последней формуле наложить два условия (сама эта формула даст третье уравнение). Пусть в последней формуле второе и шестое слагаемые в сумме будут равны нулю — 4(м2 + v2 + w2)(uv + vw + wu) + 8a(uv + vw + wu) = 0. Для этого достаточно наложить условие: и2 + v2 + w2 = —2а. Пусть, кроме того, четвертое и седьмое слагаемые в сумме будут равны нулю — 8uvw(u + v + w) + 8b(u + v + w) = 0. Для этого достаточно наложить условие: uvw = —b. Перепишем исходное уравнение с учетом наложенных условий: (—2а)2 + 4(м%2 + v2w2 + w2u2) + 4а(—2а) + 16с = О Оно эквивалентно уравнению: u2v2 + v2w2 + w2u2 = а2 — 4с. В результате получилась система: и2 + v2 + w2 = -2а < u2v2 + v2w2 + w2u2 = а2 — 4с uvw = —b
4.2. РЕШЕНИЕ ОБЩЕГО УРАВНЕНИЯ ЧЕТВЕРТОЙ СТЕПЕНИ 65 Если последнее уравнение системы возвести в квадрат (при этом теряется часть информации), то относительно квадратов переменных получится си- стема из теоремы Виета для уравнения третьей степени. Другими словами, уравнение z3 + 2az2 + (а2 - 4c)z - Ь2 = О имеет корни — z\ = u2,Z2 = 'о2,гз = w2. Для решения общего урав- нения четвертой степени нужно решить данное уравнение третьей сте- пени, вычислить квадратные корни из корней этого уравнения и положить: 2х = д/гГ + д/^2 + д/^з- Однако таким образом получается восемь решений (знак у каждого из корней можно выбрать двумя способами). Не все эти решения соответствуют решениям системы и, значит, корням исходного уравнения. Здесь играет роль как раз та информация, что была потеряна при возведении в квадрат третьего уравнения системы. Выберем знаки у квадратных корней и = д/z)", v = w = д/гз таким образом, чтобы вы- полнялось условие uvw = —Ъ. Это условие будет выполняться, если одновре- менно у двух корней изменить знак на противоположный. В итоге получаем все четыре корня общего уравнения четвертой степени: Х1 = y/zi + y/z2 + y/Z3, Х2 = y/zi — yfz2 — X-i = -yfz{_ + y/z2 - y/z$, Xi = —+ V^3- Разложение на множители Разложим правую часть общего уравнения четвертой степени в произ- ведение двух квадратных трех членов с неопределенными коэффициентами: ж4 + ах2 + bx + с = (х2 + и\Х + щ)(ж2 + иъх + '02) = О Если нам удастся выразить m,U2,vi, «2 через коэффициенты исходного урав- нения, то мы легко найдем все его корни, решив два квадратных уравнения. Раскрыв скобки, и приравняв коэффициенты при одинаковых степенях, получим следующую систему четырех уравнений: U1 + м2 = О Mi + v2 + М1М2 = а М1М2 + м2Д1 = b V1V2 = с
66 ГЛАВА 4. РЕЗОЛЬВЕНТЫ УРАВНЕНИЙ Первое и последнее уравнения системы дают возможность избавится от двух переменных: и = М| = — U2, v = Vi = c/v2- В результате получа- ется система двух уравнений с двумя неизвестными: v + c/v — и2 = а cu/v — uv = Ъ Выберем такие переменные и t2, чтобы и2 = t±t2,v2 = /2/^1- Для этого достаточно положить — ti = u/v,ti = uv. Тогда, первое уравнение системы перепишется в виде -^//2/^1 + с\/Ь //2 — М2 = а; второе уравнение системы перепишется в виде /2 = cii — h. Первое уравнение можно переписать в виде: /2 + cti = y/titzititz + а) (мы умножили обе части на -^Мг)- Теперь подставим в него /2 из второго уравнения и возведем обе части в квадрат: (cii — b + cii)2 = ii(cii — — b) + а)2 Здесь удобно перейти к переменной t = 2cii — b, и умножить обе части на 64с3, тогда уравнение перепишется в виде: 64с3/2 = (i + 6)(i — 6)((i — b)(t + b) + 4ас)2 = (t2 — b2)(t2 — b2 + 4ас)2 Удобно ввести новую переменную z = (t2 — b2)/4c, тогда уравнение перепи- шется в виде: 4cz + b2 = z(z + а)2 = z3 + 2az2 + a2z (мы разделили обе части на 64с3). У нас получилось точно такое же вспо- могательное кубическое уравнение — z3 + 2а z2 + (а2 — 4с) z — b2 = 0 , что и при решении методом Гудде! Метод Феррари Идея этого решения состоит в том, чтобы представить левую часть об- щего уравнения четвертой степени в виде разности квадратов. Она близка к идее предидущего метода, так как из разности квадратов возникает раз- ложение в произведение двух квадратных трехчленов. Подберем такой параметр t, чтобы следующее выражение представляло собой разность квадрата квадратного трехчлена и квадрата линейного вы- ражения: ж4 + ах2 + Ьх + с = (ж2 + t + а/2)2 — 2tx2 + bx + с — (/ + а/2)2
4.3. РЕЗОЛЬВЕНТЫ УРАВНЕНИЯ ЧЕТВЕРТОЙ СТЕПЕНИ. ДИСКРИМИНАНТЫ Для этого необходимо и достаточно, чтобы дискриминант квадратного трех- члена 2/ж2 — Ьх + (/ + а/2)2 — с равнялся нулю. D = Ь2 — 8t[(t + а/2)2 — с] = Ь2 — 2/[(а + 2/)2 — 4с] = О Положив z = 2t, получим прежнее вспомогательное уравнение: zs + 2az2 + (а2 - 4ф - Ь2 = О Все три метода приводят к одному и тому же вспомогательному кубиче- скому уравнению. Это наводит на мысль, что общее уравнение четвертой степени решается по существу только одним методом, хотя и возможны различные подходы. В следующей секции мы приведем некоторые доводы в подтверждение этой мысли. В заключение отметим, что Феррари (ученик Кардано) первым нашел метод решения общего уравнения четвертой степени. Наиболее удобное ре- шение методом Гудде получил Эйлер. У пражнения 1. Решить биквадратное уравнение ж4 + ах2 + с = 0 всеми тремя приведенными выше методами. 4.3 Резольвенты уравнения четвертой степени. Дискриминант Идею найти выражения от четырех корней xi, ж 2, жз, ж4 общего уравне- ния четвертой степени аналогичные резольвентам Лагранжа подсказывает следующая комбинаторная задача. Каким образом можно разделить множе- ство из четырех корней исходного уравнения на два двухэлементных под- множества, если порядок следования подмножеств неважен? Имеется ровно три возможности: {Ж1,Ж2} U {ж3,Ж4} {ж4, Ж3} U {ж2, Ж4} {ж4,ж4} U {ж2,ж3} Эти возможности определяются выделением того подмножества, где лежит элемент Х\ (к нему можно добавить или ж2, или ж3, или ж4).
68 ГЛАВА 4. РЕЗОЛЬВЕНТЫ УРАВНЕНИЙ Оказывается, что те части, на которые делится корень при решении методом Гудде, находятся именно из указанных выше соображений: М = Ж1+Ж2, Д=Ж1+Жз, W = Xi + Х4. В самом деле, и + v + w = Xi + ж2 + Xi + Х3 + Xi + Х4 = 2xi (из теоремы Виета для общего уравнения четвертой степени следует, что Xi + ж2 + Х3 + Х4 = 0). Корни вспомогательного уравнения третьей степени выражаются через корни исходного уравнения следующим образом: Z4 = и2 = (жх + Ж2)2 = (жх + Ж2)(Ж1 + Ж2) = -(жх + Т2)(жз + Ж4), Z2 = V2 = (жх + Жз)2 = -(Ж1 + Тз)(ж2 + ж4), Z3 = w3 = (Ж1 + ж4)2 = -(Ж1 + ж4)(ж2 + Х3). Эти выражения являются теми самыми резольвентами, посредством кото- рых решается общее уравнение четвертой степени. Вообще резольвентами называют выражения от корней некотого уравнения, которые являются кор- нями другого уравнения. При помощи общей теоремы Виета можно выра- зить коэффициенты последнего уравнения через коэффициенты исходного уравнения. Общая идеология здесь такова: решение исходного уравнения эквивалентно решению связанной с ним системы Виета. Решив вспомога- тельное уравнение, мы добавляем к этой системе новые уравнения, которые облегчают ее решение. Продемонстрируем этот метод на примере решения общего уравнения четвертой степени. Мы предложили три резольвенты — z4, z2, Z3. Они явля- ются корнями некоторого уравнения третьей степени. Это — вспомогатель- ное уравнение из предидущей секции — z3 + 2az2 + (а2 — 4c)z — b2 = 0. Предположим, что мы уже доказали этот факт. Тогда, мы можем решить вспомогательное уравнение в радикалах и выразить г4,г2,гз через коэф- фициенты а, Ь, с. Вместо системы Виета можно рассмотреть следующую систему: Х1 + Х2 + Хз + Х4 = 0 Ж1 + Х2 = Х1 + Хз = y/zi X! + Х4 = yfzi В ней только первое уравнение из системы Виета. Остальные три уравне- ния получаются при извлечении квадратных корней из резольвент. Решение
4.3. РЕЗОЛЬВЕНТЫ УРАВНЕНИЯ ЧЕТВЕРТОЙ СТЕПЕНИ. ДИСКРИМИНАНТЫ) этой системы не представляет никаких трудностей (нужно найти xi, сло- жив последние три уравнения системы. Затем, находятся остальные корни перенесением Х\ в правую часть в последних трех уравнениях системы). Естественно, что в итоге получились те же самые формулы, что и при ре- шении методом Гудде. Недоказанным остался тот факт, что резольвенты 21,22,23 являются всеми корнями указанного выше вспомогательного уравнения третьей сте- пени. Это можно доказать непосредственно из общей теоремы Виета. Мы почти так и поступим, только для облегчения технических сложностей ра- зобьем этот процесс на два шага. Обозначим через 2/1 = Ж1Ж2 + Ж3Ж4, у2 = Ж1Ж3 + Ж2Ж4, уз = Ж1Ж4 + Ж2Ж4 новые три резольвенты. Они связаны с исходными резольвентами следую- щим образом: zi = ~(У2 + Уз), = -(уз +уз), 2:3 =-(1/1 +1/2). Мы сначала построим уравнение с корнями у 1, у 2, Уз, и от него перейдем к уравнению с корнями 21,22,23. Пусть уравнение у3 + Ь±у2 + Ь2у + Ъз = 0 имеет корни уз,у2,Уз- Тогда, согласно общей теореме Виета: -Ь1 = У1 + 2/2 + Уз = ®1®2 + Ж3Ж4 + ®1®3 + ®2®4 + ®1®4 + ®2®3 = « Мы получили второй коэффициент общего уравнения четвертой степени. Ъц. = 2/12/2 + 2/22/3 + 2/32/1 = (®i®2 + t3t4)(tiT3 + t2t4) + ... = = ЖХЖ2Ж3 + . . . = (Х1+Х2+Хз+Х1)(Х1Х2Хз+Х1Х2Х4+Х1ХзХ4+Х2ХзХ1)-4Х1Х2ХзХ4 Многоточием мы обозначаем члены, которые отличаются от непосредственно предшествующего им члена лишь заменой переменных. В последней строчке мы так обозначили одиннадцать похожих членов, чтобы их не выписывать. Такие записи полезно проверять по числу входящих в них членов. Напри- мер, в предпоследней строчке трижды перемножаются по два множителя, каждый раз получается по четыре члена. Как раз двенадцать членов стоит в том выражении в последней строчке, где есть многоточие (сначала мы выделяем три корня из четырех, затем выделяем один из этих трех, ставя над ним вторую степень). В итоге получилась формула: 62 = — 4с (так как + хз + х4 = 0). -Ьз = (Х1Х2+ХзХ4)(Х1Хз+Х2Х4)(Х1Х4+Х2Хз) = Х^Х2Х3Х4 + . . . + Х4Х2Х3 + . . .
70 ГЛАВА 4. РЕЗОЛЬВЕНТЫ УРАВНЕНИЙ Сначала разберемся с выражением х3Х2ХзХ4 + ... = = Х1Х2ХзХ4(Х1 +Х2 + Х3 + Х4) + Х1Х2ХзХ4((Х1+Х2+Хз + Х4)2 — 2(х1Х2+Х1Хз+Х1Х4+Х2Хз+Х2Х4+ХзХ4)) = ~2аС Для того, чтобы выразить второе выражение через а, Ь, с,рассмотрим выра- жение: Ь2 = (Х1Х2Х3 + . . . )2 = Ж1Ж2Ж3 + ... + 2(т2Ж2жЗЖ4 +...) = = Ж2Ж2жЗ + • • • + 2Ж1Ж2ЖзЖ4(Ж1Ж2 +...)= ®1®2Ж3 + • • • + 2ас Значит, т2Ж2жз + = Ъ2 — 2ас и —Ьз = Ь2 — 4ас. Уравнение для резольвент yi, У2, Уз имеет вид: у3 — ау2 — 4су + 4ас — Ь2 = 0 Теперь аналогичным образом найдем коэффициенты уравнения z3 + ctz2 + C2Z + С3 = 0 для резольвент 21,22,23. -ci = -2(?/1 + у2 + уз) = 261 = -2а С2 = (yi +У2)(У2+Уз) + (У2+Уз)(Уз+У1) + (Уз+У1)(У1+У2) = 3(?/1?/2 + ) + +у2 Т У2 4" Уз = 3&2 + Ъ2 — 262 = Ъ2 + &2 = а2 — 4с Сз = (yi + У2)(У2 + Уз)(Уз + У1) = У1У2 + + 2У4У2УЗ = = (yi + У2 + Уз)(.У1У2 + У2УЗ + УЗУ1) - Зу1У2Уз + +%У1У2Уз = а(—4с) + (-3 + 2)(Ь2 - 4ас) = -Ь2 Итак, мы получили уравнение z3 + 2az2 + (а2 — 4c)z — b2 = 0. Чтобы не возникло впечатления, что резольвенты нужны лишь для того, чтобы лучше понять уже полученные результаты, подсчитаем с их помо- щью дискриминант общего уравнения четвертой степени D4. D4 = (Ж1 - Ж2)2(Ж1 - Жз)2(Ж1 - Ж4)2(Ж2 - Жз)2(ж2 - T4)2(t3 - Ж4)2 Заметим, что 21-22 = (Ж1+Ж2)2-(Ж1+Жз)2 = (Х2-Хз)(х1+Х2+Х1+Х3) = (ж2 ~Х3) - Х4 ).
4.3. РЕЗОЛЬВЕНТЫ УРАВНЕНИЯ ЧЕТВЕРТОЙ СТЕПЕНИ. ДИСКРИМИНАНТ71 Здесь мы воспользовались формулой: Xi + х2 + хз + х4 = 0. Совершенно аналогично получим: Z2 - Z3 = (х3 - Х4)(хХ - Х2) z3 - Z]_ = (х4 - Х2)(хХ - Хз) Отсюда следует, что дискриминант общего уравнения четвертой степени совпадает с дискриминантом построенного выше вспомогательного уравне- ния третьей степени. Подставим коэффициенты этого уравнения в формулу для дискриминанта, полученную в конце первой секции: Г>4 = 4а2(а2 - 4с)2 - 4(а2 - 4с)3 + З2а362 - 36аЬ2(а2 - 4с) - 2764 = = 16а4 с - 4а3Ь2 - 128а2с2 + 144ab2c - 27b4 + 256с3 Уравнение = 0 задает в координатах а,Ь,с замечательную поверхность — ’’ласточкин хвост”,которая используется в теории катастроф. Наши вы- числения могут быть полезными в других областях математики. У пражнения 1. Вычислить дискриминант общего уравнения четвертой степени х4 + ахх3 + а2х2 + а3х + а4 = 0 2. Выписать уравнение третьей степени для следующих резольвент: 2/1 = (хх +х2 -х3 -х4)2, 2/2 = - Х2 + х3 - х4)2, Уз = (х3 -Х2~Х3+ Х4)2 Здесь хх, х2, хз, х4 — корни уравнения х4 + ах2 + Ьх + с = 0. Решить это уравнение при помощи указанных резольвент.
72 ГЛАВА 4. РЕЗОЛЬВЕНТЫ УРАВНЕНИЙ
Глава 5 Решение уравнений в целых числах 5.1 Решение линейного уравнения в целых чи- слах Для решения уравнения вида ах + by = с , где а,Ь,с — произвольные целочисленные параметры, прежде всего нужно найти НОД(а,Ь) и прове- рить делится ли с на НОД(а,Ь). Если с не делится на НОД (а,Ь),то целочи- сленных решений (х,у) быть не может, так как левая часть уравнения при этом делится на НОД(а,Ь), а левая часть — не делится. Если с делится на НОД(а,Ь), то обе части уравнения можно сократить на НОД(а,Ь). При этом получается новое уравнение с взаимнопростыми коэффициентами в левой части. Будем решать именно такое уравнение ах + by = с, НОД(а,Ь) = 1. В дальнейшем мы покажем, что это уравнение всегда имеет решения ( причем бесконечно много решений). Заметим, что существование одного целочисленного решения приводит к бесконечной серии таких решений. Пусть (то, уо) — целочисленное решение, тогда для всякого целого t пара (то — bt, уо + at) также является решением: а(хо — bt) + b(yo + at) = ахо + byo — abt + bat = с. Более того, всякое решение (xi,yi) можно представить в указанном виде : Xi = хо — bt, yi = уо + at, для некоторого целого t. Рассмотрим разности 73
74 ГЛАВА 5. РЕШЕНИЕ УРАВНЕНИЙ В ЦЕЛЫХ ЧИСЛАХ и = Xi — xo,v = yi — уо- Пара (u,v) является решением так называемого однородного уравнения ах+by = 0. Однако его решения имеют вид : х = -bt, у = at, где t - целое. В самом деле, ах = -by. Поэтому, b делит ах. Однако, по условию числа а и b взаимно просты. Значит, b делит х.Аналогично, а делит у. Поэтому, и = btt,v = аС для некоторых целых Однако, au + bv = abti + bat-2 = 0. Значит, tt = —tz = t. Таким образом, достаточно найти одно целочисленное решение (хо,уо). Тогда все решения будут даваться формулами: х = xq — bt, у = уо + at, где t — целочисленный параметр. Эти формулы представляют параметрический способ задания прямой ах + by = с. Поэтому, считая t действительным или рациональным, мы получим все, соответственно, действительные или рациональные решения этого уравнения с двумя переменными. Необходимо найти методы для определения отдельного решения (то, уо). Линейное представление для НОД(а,Ь) доставляет формулу : am + bn = 1. Для нахождения пары (хо,уо) достаточно умножить эту формулу на с : а(тс) + Ъ(пс) = с. Положим : хц = тс, у о = пс. Линейное представление для НОД(а,Ь) можно получить при помощи алгоритма Евклида. Рассмотрим численный пример. Решить уравнение 62х + 26у = б в це- лых числах. Заметим, что число б делится на НОД(б2,2б) = 2. После со- кращения на 2 получим уравнение 31х + 13у = 3. С помощью алгоритма Евклида найдем такие шип, что 31m + 13п = 1: 31 - 2 х 13 = 5, 13 - 2 х 5 = 3, 5-3 = 2, 3-2 = 1 Подставляя третье уравнение в четвертое, получим: 1 = 3 — (5 — 3) = —5 + 2x3. Теперь подставим второе уравнение в полученное: 1 = —5 + 2(13 — 2x5) = 2 х 13 — 5 х 5. Осталось воспользоваться первым уравнением: 1 = 2 х 13 - 5(31 - 2 х 13) = 31 х (-5) + 13 х 12. Значит, т = -5,п = 12. Тогда, хо = — 5 х 3 = —15, г/о = 12 х 3 = 36. Общее решение имеет вид : х = —15 — 13Z, у = 36 + 31Z.
5.2. СВОЙСТВА ЦЕПНЫХ ДРОБЕЙ 75 У пражнения 1. Решить в целых числах уравнение : (а3 + а + 1)ж + (а — аА)у = (а4 + 2а)(1 — а3), где a — целое число. 2. Доказать,что для того, чтобы уравнение ах + by = с имело ровно п натуральных решений, с должно располагаться в пределах: (п — l)ab + а + b < с < (п + 1)аЬ — а — Ь. 5.2 Свойства цепных дробей Последний пример можно использовать для иллюстрации связи алго- ритма Евклида с дробями особого вида.Приведенные выше строчки алго- ритма Евклида для чисел 31 и 13 можно переписать в следующей форме: 31/13 = 2 + 5/13 13/5 = 2 + 3/5 5/3 = 1 + 2/3 3/2 = 1 + 1/2 Заметим,что в этих равенствах последний член каждой строчки совпадает с обратным числом для левой части следующей строчки. Поэтому исходную дробь можно представить в виде: 1 31/13 = 2 + -‘- = 2 + 13/5 f 573 1 1 1+з75 1 “Л Г“ я Выражения данного вида называют цепными дробями. Алгоритм Евклида позволяет представить всякое рациональное число в виде конечной цепной дроби.Легко видеть, что иррациональные числа нельзя представить в та- ком виде, так как конечные цепные дроби — рациональные числа ( их легко
76 ГЛАВА 5. РЕШЕНИЕ УРАВНЕНИЙ В ЦЕЛЫХ ЧИСЛАХ привести к виду p/q ). Для иррациональных чисел существует алгоритм представления в виде бесконечной цепной дроби.Для этого алгоритм деле- ния с остатком заменяют следующей процедурой.Пусть а — действитель- ное число, тогда а = [а] + {а}, где дробная часть {а} лежит в пределах от нуля до единицы, исключая единицу.Поэтому, {а}-1 > 1 для нецелых а. Аналогично разложим {а}-1: а = [а] + 1/{а}“1 = [а] + ’ где О < {{а}-1} < 1. Очевидно, что этот процесс разделения целой и дробной частей с переходом к обратному можно продолжать неограниченно долго. Он останавливается лишь с появлением целого числа. Для рационального числа p/q этот процесс совпадает с алгоритмом Евклида. В самом деле, пусть р = aq + b — деление с остатком. Тогда, p/q = а + b/q, где а — целая часть и b/q — дробная часть.Как уже было отмечено, для иррациональ- ного числа процесс разложения в цепную дробь никогда не завершится. В результате получится бесконечная последовательность целых чисел. Ста- нем обозначать цепную дробь 1 «о Н-----------1------- ах -I--------1---- «2 -I------— On через {оо, oi, 02,... ,о„}. Иррациональному числу будет соответствовать бесконечная последовательность {oq, oi,... , ап,... }. Если оборвать цепную дробь на к-м месте, то получится дробь {oq, Oi , . . . , Ofc} = Pk/Qfc, где HOfl(pfc,Qfc) = 1.Её называют к-й подходящей дробью данной цепной дроби.Для иррационального числа можно поставить вопрос о сходимости последовательности подходящих дробей к данному числу.Ниже мы докажем эту сходимость. Рассмотрим численный пример: а = \/2.Разложение имеет вид: л/2 = 1 + (л/2 — 1) = 1 + ----= 1 + — = 1 +---------------= (у/2 — I)-1 л/2 + 1 2 4-(>/2 —1) о и.____I_____ “ 2 4-_______1__ 1 2 + (V2-1)-1 2 + 2+(V2-l) 2 + --- 2 + —
5.2. СВОЙСТВА ЦЕПНЫХ ДРОБЕЙ 77 Очевидно, что процесс будет циклически повторятся, и \/2 = {1,2,2,... , 2,... }. Для периодических цепных дробей есть специальное обозначение: {do, di,... , dfc, d, b,... , c, a, b,... , c, a, b,... , c,... } = {do, di,... , dt, a, b,... , c}. Например, ^2 = {1,2}. Теорема. Имеют место следующие реккурентные формулы для подхо- дящих дробей Pk/<lk цепной дроби а = {do, di,... , ап,... }: f Рк = OfcPfc-1 + Рк-2 { Qk = OkQk-1 + Qk-2 Доказательство. Воспользуемся методом математической индукции. Дополним последовательности {рл,} и {%} на один шаг влево: p-i = 1, Q-i = 0. Тогда, в силу того, что ро = do, Qo = 1> имеем :pi/qi = °о + = °'а°+' > Pi = dido + 1 = dipo + P-i HQi=dixl + 0 = diQo + q~i- Так что, первый шаг индукции проверен. Пусть исходное равенство выполняется для всех дробей на к-м шаге. Проверим (к+1)-й шаг.Для этого представим цепную дробь {do, di,... , d^+i} в виде {do,di,... ,dfc_i,dfc + с нецелым последним элементом. Дробь Pk+i /Qk+i , будет к-й подходящей дробью для измененной последовательно- сти соответствующей исходной цепной дроби.По предположению индукции (dfc + dkl1)pfc-i +рк-2 (flkPk-l + Рк-2) + dj.ipfc-1 Pk+i/qk+i - — _х ,-------------------- , _х------------------------ (flk + <Д+1Як-1 + Ik-2 (OfcQk-1 + qk-2) + Ofc+iQfc-l Pk + afc+iPfc-l _ dfc+ipfc +pfc i 9fc + Ofc+i9fc-i ak+iqk + qk-i Для окончания доказательства необходимо доказать несократимость полу- чившейся в конце дроби.Это вытекает из следующей леммы. Лемма. Для чисел pk.qk. определяемых реккурентно по формулам: f Рк = OfcPfc-1 + Рк-2 { qk = Ofc9fc-i + qk-2 имеет место равенство: pkqk-i — Pk-iqk = (—l)fc-1. Доказательство. Для к=1 имеет место равенство pi qo — P0Q1 = (dido + 1) x 1 — dodi = 1. Воспользуемся, теперь, реккурентными формулами: Pkqk-l - Pk-iqk = (OfcPfc-1 + Pk-2)qk-l -Pfc-l(Ofc9fc-l + Qk-2) =
78 ГЛАВА 5. РЕШЕНИЕ УРАВНЕНИЙ В ЦЕЛЫХ ЧИСЛАХ ~(Рк-1Лк-2 -Pfc-2%-1)- Последовательно применяя аналогичный прием к стоящему в скобках вы- ражению, мы придём к выражению (—l)fc-1(piQo — PoQi) = (—О Из приведенного в лемме равенства вытекает, что НОД(р&,%) = 1 для любого к. В частности, это верно для числителя и знаменателя приведенной выше дроби. Утверждение теоремы проверено по индукции.□ Разделив равенство PkQk-i ~ Pk-iqk = (—l)fc-1 на qkqk-i и взяв абсо- лютную величину, получим равенство : \pk/qk ~ Pk-i/qk-i\ = ,lkt Оно означает, что длина отрезка между двумя соседними подходящими дробями равна величине обратной произведению их знаменателей. Для действительного числа а процесс построения цепной дроби позво- ляет ввести последовательность остатков {ап} от разложения в цепную дробь: а = {ao,ai,... ,ап,ап}. Например, для а = \/2 все остатки совпа- дают : од = - = х/2 + 1 = «1 = «2 = • • • = ctn- Периодичность в после- довательности остатков (начиная с некоторого места) в точности означает периодичность цепной дроби. Заметим, что при замене ап на ап + подходящая дробь pnlqn пе- реходит в число «.Легко видеть, что нулевая подходящая дробь от этого увеличилась — к числу «о нечто добавили. Однако первая подходящая дробь уменьшается от этой процедуры — слагаемое заменили дробью с большим знаменателем. Рассуждая аналогично, получаем неравенства : a >pilq2,a <рз/чз,а >Pi/qi,a <pb/q5,... ,а >P2k/q2k,a < P2k+i/q2k+i- Отсюда вытекает, что число а лежит между любыми двумя соседними под- ходящими дробями. Значит, расстояние от а до любого из концов не превос- ходит расстояния между соседними подходящими дробями: |р£-1/<й-1~о) < —А—. При этом, равенство достигается лишь при а = Pk/qk- Отсюда вы- текает сходимость последовательности подходящих дробей к числу а ( по- следовательность {</4;} монотонно неограниченно возрастает). Утверждение. Для любого действительного а и любого т > 1 можно найти такую несократимую дробь p/q, что д<ти \p/q~ Доказательство. Достаточно в последовательности {</&} найти такой номер, что qk < т < qk+i, и положить р = Pk,q = qk- Если же дробь ко- нечная, то её саму можно использовать в качестве приближения, в случае, когда т не меньше её знаменателя.□ Приведенная выше лемма дает удобный способ для решения линейного уравнения ах + by = с в целых числах. Она позволяет легко найти ш и п для равенства am + Ьп = 1,в случае НОД(а,Ь)=1.Для этого разложим а/b в цепную дробь : а/b = {ао,ах,... ,an}. В полученном разложении п—я
5.2. СВОЙСТВА ЦЕПНЫХ ДРОБЕЙ 79 подходящая дробь есть а/b, то есть рп = a,qn = Ъ. Поэтому равенство PnQn-i - Pn-iQn = (-1)”-1 можно переписать в виде aqn-i + b(-pn-i) = (—I)”-1. Умножив обе части на (—I)”-1, получим : т = (—l)”-1Qn-i,п = (—1)прп-1 В частности, для примера из предидушего пункта имеем : а = 31, b = 13,pn-i/qn-i = {2,2,1,1} = 12/5. Откуда: т = —5, п = 12. Для быстрого вычисления подходящих дробей удобно использовать та- блицы для них, которые легко заполнять по реккурентным формулам из Теоремы : Например,для числа у/2 таблица подходящих дробей имеет вид: ^к 1 2 2 2 2 2 2 Рк 1 1 3 7 17 41 99 239 Чк 0 1 2 5 12 29 70 169 Легко заметить, что подходящие дроби очень хорошо приближают число у/2 = 1,4142136 ...: р2/«2 = 1,4, Рз/«з = 1,4166... , р4/«4 = 1,41379 ... , Pb/q§ = 1,41428... , pe/qe = 1,4142012.... Эти приближения для \/2 были известны с древности. Можно показать, что приближение заданного числа подходящими дробями более точное в некотором строгом смысле, нежели приближение любой дру- гой последовательностью рациональных чисел. У пражнения 1. Показать, что для натурального а имеет место разложение : 2\/1 + а2 = {2а, а, 4а}. 2. Доказать, что если квадратное уравнение с целыми коэффициентами имеет корень {а, Ь, с}, то второй его корень — а — {с, Ь}. 3. Пусть цепная дробь {ao,ai,... } имеет подходящие дроби {pk/qk}- Доказать, что: a) 1 ~ {^fc, flk—1, • • • , Ох }. Ь) PkQk-2 ~ Рк-2<1к = (-1)к&к- С) pkqk = {O'fc, ^к~ 1 5 ' ' ' 5 ^1 5 «О} ^к~ 1 5 ' ' ' 5^1}-
80 ГЛАВА 5. РЕШЕНИЕ УРАВНЕНИЙ В ЦЕЛЫХ ЧИСЛАХ d) Pk+2Qk-2 — Pk-2Qk+2 — anan+ian+2 + an + an+2- e) Pk/4k Po/QO — 9o91 91 92 + 92 93 • • • + 9n_19n 4. Показать, что {n«o, na±, па-2, паз, • • • } = n{ao, n2a±, а%, п2аз,...}. 5. Решить уравнение 10ж = 3 в цепных дробях. 5.3 Решение уравнений в рациональных чи- слах Станем рассматривать только уравнения, имеющие вид равенства нулю многочлена от двух переменных с целыми коэффициентами.Простейшим примером решения уравнения в рациональных числах служит полученная в предидущем параграфе рациональная параметризация прямой ах + by = с.Так что, обычно решение уравнения в рациональных числах геометри- чески означает параметризацию соответствующей кривой в рациональных функциях.Заметим,что в приведенном примере целые решения легко выде- ляются среди рациональных — для этого достаточно рассмотреть целые значения параметра. Для уравнений второй степени это уже не так. Примером может слу- жить знаменитое уравнение Пелля х2 — 46i/2 = 1 , которое задал в 17 веке Пьер Ферма английским математикам в качестве задачи-вызова. Следуя традиции, заложенной ещё Диофантом, они нашли рациональные решения этого уравнения. Метод предложенного англичанами решения также восходит к Диофанту.Они заметили, что кривая второй степени (гипербола), которая задается этим уравнением, проходит через точку (—1,0), и стали пересекать кривую пря- мыми, проходящими через эту точку. Общий вид уравнения подобной пря- мой — у = t(x + 1), где t — угловой коэффициент прямой,который при- нимают за параметр. Подставим это равенство в уравнение Пелля: х2 — 46 (х + I)2 = 1. Получившееся квадратное имеет корень х = — 1 ( кривая проходит через точку (—1,0)). Второй корень легко найти из теоремы Ви- ета : х = х-46^2 - Это абсцисса второй точки пересечения прямой и кривой. Ординату этой точки пересечения можно найти из уравнения у = t(x + 1): У = ^(i-46t2 + 1) = i-46t2 В итоге получены формулы для рациональной параметризации кривой или формулы для решения уравнения Пелля в ра- циональных числах :
5.3. РЕШЕНИЕ УРАВНЕНИЙ В РАЦИОНАЛЬНЫХ ЧИСЛАХ 81 ( v _ l+46f2 ) л ~ l-46i2 I II ~ 2t ( у ~ l-46i2 Затем английские математики во главе с лордом Броункером и Валли- сом заметили, что из полученного решения никак не извлечь целочисленные решения и нашли так называемый циклический метод нахождения целочи- сленных решений (этот метод будет изложен в секции 5).Эта история по- казывает принципиальное различие между методами решения уравнений в рациональных и в целых числах. Однако в некоторых случаях методы для решения уравнений в целых и в рациональных числах совпадают. В качестве примера найдем пифагоровы тройки (x,y,z) (то есть решения уравнения х2 + у2 = z2 в целых числах) при помощи метода, характерного для решения уравнений в рациональных числах. Для этого разделим на z2 обе части равенства. В результате полу- чилось уравнение а2 + b2 = 1, где а = x/z,b = y/z. Последнее уравнение задает единичную окружность в координатах (а, 6).Для нее известна три- гонометрическая параметризация : а = cos р Ъ = sin р Для получения рациональной параметризации выразим синус и косинус через тангенс половинного аргумента, который станем обозначать как ра- циональный параметр t : _ i-tg (у/2) _ i-г2 _ 1+«э2(^/2) - 1+«2 _ 2ig(y/2) _ 2t - i+ia2(v/2) - 1+i2 Для нахождения пифагоровых троек достаточно представить рациональ- ный параметр в виде несократимой дроби :t = m/n. Отсюда: а = ™2^”2, Ь = „Р+п? При взаимнопростых шип разной четности полученные дроби не- сократимы. Поэтому : х = т2 —п2,у = 2тп, z = т2 + п2 — попарно взаимно простые числа, задающие пифагорову тройку. В секции 7 мы покажем, что все пифагоровы тройки с попарно взаимно простыми компонентами имеют такой вид.
82 ГЛАВА 5. РЕШЕНИЕ УРАВНЕНИЙ В ЦЕЛЫХ ЧИСЛАХ Всякое уравнение второй степени можно рационально параметризовать. Заметим, что коэффициенты получающихся рациональных функций мо- гут быть иррациональными. Такая рациональная параметризация не дает решения в рациональных числах.Бывают такие уравнения третьей сте- пени, что не допускают рациональной параметризации. Например, урав- О Q М нение у = х — х не допускает рациональной параметризации. У пражнения 1. Найти рациональную параметризацию для уравнения, задающего ’’декартов лист”: ж3 + у3 = Заху, где а - рациональное. 2. Найти рациональную параметризацию для уравнения, задающего ’’лемнискату Бернулли” : (ж2 + у2)2 = х2 — у2. Ответ : х = 3. Для кривой у2 = х3 — 2 найти точку пересечения с касательной в точке (3,5). Ответ : (129/100,383/1000). 5.4 Уравнение Пелля. Существование реше- ния Таблица для подходящих дробей числа \/2 из секции 2 дает примеры для выражений следующего вида — р2. — 2<//; = ±1 : I2 — 2 х I2 = —1, З2 — 2 х 22 = 1, 72 — 2 х 52 = —1, 172 - 2 х 122 = 1 412 - 2 х 292 = -1, 992 - 2 х 702 = 1, 2392 - 2 х 1692 = -1. Это примеры решений уравнений х2 — 2у2 = ±1. Уравнения вида х2 — dy2 = ±1 называются уравнениями Пелля, их решают в целых числах. Мы будем заниматься в основном уравнением х2 — dy2 = 1. У него есть решения (±1,0) при любом d. Будем считать d натуральным числом, не являющимся квадратом. Пусть (ж1,?/1) — еще какое-либо решение уравнения Пелля. С ним свя- зано еще три решения : (—xi,yi), (xi,—yi), (—Xi,—yi). Поэтому, станем рассматривать xi > 0, у\ > 0. Отметим, по этому решению строится бес- конечная серия решений {(х^, уь)} Для этого достаточно возвести выра- жение xi + yiVd в к—ю степень и отделить целую часть и часть при \fd\
5.4. УРАВНЕНИЕ ПЕЛЛЯ. СУЩЕСТВОВАНИЕ РЕШЕНИЯ 83 (жх + yi)k = хк + Укл/d. В самом деле, возведем ж2 — dy2 в к—ю степень: (жх + - yi'/d)k = 1 = (хк + ykVd)(xk - ykVd) = ж| - dy2k. Мы воспользовались тем, что (жх — у\)к = хк — ук. Это вытекает из формулы бинома Ньютона: хк складывается из членов вида Cksxk~2sy2sds, —yk скла- дывается из членов вида С^+1Жх-28-1 (—yi)2s+1ds. Из полученных равенств вытекает, что хк — ykVd = (жх — г/хл/с/)* = (жх +yv/d)~k. Положим, поэтому, (х-к,у-к) = (хк,—ук) . Кроме того, положим (хо,уо) = (1,0). Для любого целого к имеет место формула : хк + ykVd = (жх + yiVd)11. Определение. Пусть (жх,ух) — такое натуральное решение уравнения Пелля ж2 — dy2 = 1, что жх — наименьшая абсцисса натурального реше- ния. Тогда это решение называется основной единицей множества решений уравнения. Выразим у через х в равенстве ж2 — dy2 = 1: у = ±-\/<1_1(ж2 — 1). Однако при ж > 1 функция у = ^/<1-1(ж2 — 1) монотонно возрастает. Поэтому, в определении основной единицы, эквивалентным образом, можно было потре- бовать минимальность ординаты а не абсциссы, или даже минимальность суммы жх + yv/d > 1. Теорема. Пусть (жх,ух) — основная единица множества решений урав- нения ж2 — dy2 = 1, тогда все целочисленные решения этого уравнения опи- сываются формулой {±(ж£,— целое число }. Доказательство. Докажем, что других решений нет. Достаточно по- казать, что нет других натуральных решений. Пусть (ж, у) — натуральное решение, не лежащее в приведенной выше серии. Тогда существует такой номер к, что хк +ykVd < x + yy/d < ж^+х +yk+ii/d. В самом деле, последова- тельность {жп + yn'/d} монотонно неограниченно возрастает.Умножив эти неравенства на положительное число хк — ykVd , получим: 1 < ж' + y'y/d < жх + yiVd. Заметим, (ж',у') — решение исходного уравнения. Кроме того, из первого неравенства вытекает, что это натуральное решение. Из второго неравенства вытекает противоречие с минимальностью решения (жх,ух)- □ Теорема. Если d не является точным квадратом, то уравнение Пелля ж2 — dy2 = 1 имеет бесконечно много целочисленных решений. Доказательство. Достаточно показать, что существует натуральное решение (£,//). Станем приближать \fd рациональными числами. Возьмем сначала тх > 1 и найдем пару натуральных чисел (жх, yi) с условием |жх/yi — V2| < < П согласно утверждению из секции 2. Умножив на yi, по- лучим неравенство |жх — yi| < г)-1. Из него вытекает, что жх < yv/d + 1 и жх + yiVd < 2y\\fd + 1. Перемножив последнее неравенство на неравен- ство с модулем, получим |ж2 — ch/2| < 2y\\fdT~] + г-1 < 2\/d + 1. Рассмо-
84 ГЛАВА 5. РЕШЕНИЕ УРАВНЕНИЙ В ЦЕЛЫХ ЧИСЛАХ трим произвольную бесконечно монотонно возрастающую последователь- ность {rj;}. Для каждого ть получим натуральную пару (хь,Ук) с условием |ж|—ch/k| < 2\/d+l приведенным выше способом. В результате получим бес- конечно много пар натуральных чисел, удовлетворяющих этому условию. Для каждой пары выражение х2 — dy2 принимает некоторое целое значение из промежутка (—2%/cZ — 1,2\/d + 1). Некоторое целое значение п принима- ется для бесконечного множества пар. Среди них обязательно найдутся две пары и (£2,^2) такие, что £1 = £2 mod п.щ = //2 mod п. Положим Со + r]o^/d = (Ci + гц — 42^) = C1C2 — '/|'/2^ + (С2Ч1 — СхЧг)^- Тогда Co — d'fi = n2. Однако, Co = C1C2 — gig2<i = Ci — dq2 mod n = 0 mod n и r)o = 0 mod n. To есть Co = и r)o = nq для некоторых целых С и г). Тогда, С2 — drj2 = 1. При этом, jjo / 0 ( иначе пары (Ci,^i) и (£2 ,'/2) пропорциональны). □ Итак, мы получили полное описание решений уравнения Пелля х2 — dy2 = 1. Что же касается уравнения х2 — dy2 = —1, то для него можно построить аналогичную теорию, если существует хотя бы одно решение. Например, если d — простое число вида 4fc+l, то у этого уравнения решения существуют. В случае, когда d делится на простое вида 4fc — 1, решений нет. Общая же картина существования решений у уравнения Пелля ”с минусом” до сих пор неясна. У пражнения 1. Пусть (р, q) — натуральное решение уравнения Пелля х2 — dy2 = 1. Доказать, что дробь p/q приближает иррациональность x/d по избытку с точностью не ниже, чем (2g2 Vd)-1. 2. Для каждого целого к > 1 найти основную единицу уравнения Пелля а)х2 — (к — l)(fe + 1)у2 = 1 Ь)х2 — (к — 1)ку2 = 1. 3. Доказать, что для простого d = 4fc + 1 уравнение х2 — dy2 = — 1 имеет целочисленные решения. 5.5 Английский циклический метод Как известно, Пьер Ферма предложил английским математикам следу- ющую задачу: решить в целых числах уравнение х2 — 46у2 = 1. Для этого достаточно найти основную единицу. За год работы англичане разработали метод нахождения основной единицы.
5.5. АНГЛИЙСКИЙ ЦИКЛИЧЕСКИЙ МЕТОД 85 Ближайший квадрат к числу 46 — 72 = 49. Рассмотрим равенство 72 — 46 х I2 = 3. Станем видоизменять это равенство, умножив его на п2 — 46: (72 — 46 х 12)(/г2 — 46 х I2) = 3(/г2 — 46). Левую часть можно преобразовать к виду: (7/г + 46)2 — 46(/г + 7)2 = 3(/г2 — 46). Это легко вытекает из равенства: (7 + лДб)(п + 746) = 7п + 46 + (п + 7)746. Следующий этап состоит в следующем. Подберем п таким образом, чтобы на 3 делились одновременно п + 7 и п2 — 46. Этого легко добиться. Доста- точно положить п = 3s + 2 (условие делимости п + 7 на 3) и подставить это равенство в п2 — 46. Заметим , что п2 — 46 автоматически делится на 3, так как на 3 должно делиться выражение 7п + 46 (его квадрат — член равенства, в котором все остальные члены делятся на 3 ). Станем выбирать такое s, чтобы выражение п2 — 46 принимало наименьшее по модулю значе- ние. В нашем случае это достигается при s = 3, п = 8. Осталось сократить на 9, и первый шаг алгоритма осуществлен: (56 + 46)2 — 46х9х52 = 3х 18, 342 - 46 х 52 = 6. Второй шаг алгоритма состоит в умножении исходного равенства на п2 — 46. Получим: (34/г+5 х46)2—46(5/г+34)2 = 6(/г2—46). Требуется найти такое п, чтобы выражение 5п + 34 делилось на 6,и выражение п2 — 46 принимало наименьшее по модулю значение. Легко видеть, что это достигается при /г = 4: 62(26 + 35)2 — 46 х 62(4 + 5)2 = —6 х 30. Сокращая на 36, получаем : 612 - 46 х 92 = -5. Третий шаг алгоритма имеет вид : (61/г + 9 х 46)2 — 46(9/г + 61)2 = —5(/г2 —46). Получаем : п = 6. Значит, 25(75 + 81)2 - 46 х 25(10+13)2 = 50. Сокращая на 25, получаем: 1562 — 46 х 232 = 2. Можно продолжить использование этого алгоритма, но проще возвести полученное выражение в квадрат и сократить на 4: 1562 — 46 х 4(156 х 23)2 = 4, 243352 - 46 х 35882 = 1. Итак, следуя историческому пути, мы нашли основную единицу : х = 24335, у = 3588. Интересно отметить, что этот алгоритм был открыт индийским мате- матиком 12 века Бхаскарой Ачарьей. От него остались вычисления для основной единицы уравнения х2 — G7y2 = 1. 82 — 67 = —3, (8/г + 67)2 — 67(8 + /г)2 = —3(/г2 — 67). Выбираем п = 7. После сокращения на 9 получаем 412 — 67 х 52 = 6. Второй шаг: (41п + 5 х 67)2 — 67(5/г + 41)2 = 6(/г2 — 67). Выбираем п = 5. После сокращения на 36 получаем: 902 — 67 х II2 = —7. Третий шаг: (90/г + 11 х 67)2 — 67(11/г + 90)2 = —7(/г2 — 67). Выбираем /г = 9. После сокращения на 49 получаем: 2212 — 67 х 272 = —2.
86 ГЛАВА 5. РЕШЕНИЕ УРАВНЕНИЙ В ЦЕЛЫХ ЧИСЛАХ Далее Бхаскара возводит обе части выражения в квадрат и сокращает на 4 : (2212 + 67 х 272)2 - 67 х 4(27 х 221)2 = 4. 488422 - 67 х 59672 = 1. Если этого не делать и следовать алгоритму, то далее получаются строчки 18992 - 67 х 2322 = -7 35772 - 67 х 4372 = 6 90532 - 67 х 11062 = 3 488422 - 67 х 59672 = 1. Имеются основания считать, что уже Архимед владел приведенным выше методом для получения основной единицы. Предложенная им задача о бы- ках Гелиоса приводит уравнению Пелля с гигантской основной единицей, которую нельзя было определить без специальных методов. Приведенные выше уравнения Пелля с d = 46 и d = 67 имеют одни из самых больших основных единиц среди уравнений с двузначным коэффици- ентом d. Самая большая основная единица для таких уравнений достигается при d = 61. Леонард Эйлер получил доказательство того, что приведенный выше алгоритм всегда приводит к основной единице. Мы приводить его здесь не будем. Стоит заметить, что циклический метод нахождения основной единицы не самый удобный для вычисления. Гораздо удобно вычислять основную единицу при помощи цепных дробей. В следующей секции мы покажем, что квадратические иррациональности разлагаются в периодические цеп- ные дроби. Главный шаг в вычислении основной единицы состоит в вы- числении предпоследней перед повторением периода в цепном разложении числа \fd подходяшей дроби. Во многих случаях ее числитель и знаменатель сразу дадут основную единицу. В качестве примера рассмотрим уравнение х2 — 31у2 = 1. Разложение в цепную дробь имеет вид : д/ЗТ = {5,1,1,3,5,3,1,1,10}. Таблица для подхо- дящих дробей имеет вид: 5 1 1 3 5 3 1 1 Pk 1 5 6 11 39 206 657 863 1520 qk 0 1 1 2 7 37 118 155 273 Заметим, что 15202 — 31 х 2732 = 1. Так что, х = 1520, у = 273.
5.6. ТЕОРЕМА ЭЙЛЕРА-ЛАГРАНЖА 87 У пражнения 1. Провести вычисление основной единицы для уравнений Пелля с d = 46 и d = 67 видоизмененным циклическим методом, то есть методом, в котором п выбирают таким, что а) выражение п2 — d принимает наименьшее натуральное значение. Ь) выражение п2 — d принимает наибольшее отрицательное значение. 2. Провести вычисления основной единицы для уравнений Пелля с d = 46 и d = 67 при помощи цепных дробей. 5. 6 Теорема Эйлера-Лагранжа Напомним, что действительное число называется квадратичной рацио- нальностью тогда и только тогда, когда оно является корнем квадратного трехчлена с целыми коэффициентами. Другими словами, квадратичные ир- рациональности это — числа вида а ± х/b, где а и b — рациональные числа. Теорема. Число а разлагается в периодическую цепную дробь тогда и только тогда, когда а является квадратической рациональностью. Доказательство. Сначала докажем прямое утверждение. Пусть а раз- лагается в периодическую цепную дробь. Пусть ап — n-й остаток раз- ложения числа а в цепную дробь: а = {ao,ai,... ,ап,ап}. Тогда имеет место равенство: а = Pqc^~^Pqn~\ Его легко доказать, разлагая ап в цеп- ную дробь: ап = {an+i,an+2,... }. Тогда для k-й подходящей дроби p'k/q'k этого разложения имеет место равенство: = {ao,ai,... , un-p'klq'k} = Р"!?/Э tf"-1 Переходя к пределу к —> оо, получаем исходное равенство. ЧпРк/Чк-ГЧп-1 Имеет место повторение остатков через период длины s, начиная с не- которого номера: an+s = ап. Значит, имеют место равенства: Pnfin 4“ Рп— 1 Pn+s^n+s 4“ Pn+s—1 Pn+s^n 4“ Pn+s—1 a = ---------=------------------=---------------. QnPn 4“ Qn Qn+s^n+s 4“ Qn+s—1 Qn+s^n 4“ Qn+s—1 Равенство первой и третьей дроби приводит к квадратному уравнению с целыми коэффициентами для ап • (Рп/-*п 4“ Рп—l)(Qn+s^n 4“ Qn+s—1) ~ (.Qn^n 4“ Qn- I )(Pn+san 4“ Pn+s —1)- Таким образом, остаток ап — квадратичная иррациональность. Отсюда следует, что а — квадратичная иррациональность. В самом деле, подста- вим ап в равенство: а = Рп°‘пМ>п-1 и освободимся от иррациональности в знаменателе.
88 ГЛАВА 5. РЕШЕНИЕ УРАВНЕНИЙ В ЦЕЛЫХ ЧИСЛАХ Обратное утверждение доказывается несколько сложнее. Пусть а — ко- рень квадратного уравнения с целыми коэффициентами: аа2 + Ьа + с = 0. Подставив выражение ^"”’‘^’‘21 в ЭТУ формулу, получим квадратное урав- нение для остатка ап: Апа„ + Впап + Сп = 0, где Ап = аРп + bpnqn + cq2, Вп — 2apnpn-i + b(pnqn-i + Pn—iqn) "Ь 2c<7n<Zn—i, С„ = + bpn-iqn-i + cq2_r. Заметим, что Сп = Bn_±. Кроме того, дискриминант уравнения для остатка совпадает с дискриминантом исходного уравнения : В2 - 4А„С„ = (Ь2 - 4ac)(pnqn-i - pn-iqn)2 = b2 - 4ас. Оценим |А„|. Для этого заметим, что |pn/gn - а| < (gngn+i)_1 < q„2- Поэтому, |pn -agn| < g-1, то есть рп = aqn + 0n/qn, где |0n| < 1. Подставим это выражение в равенство для Ап: Ап — atpQn 4" ^п/Qn) "Ь b(aqn ~Ь $п/Qn) "Ь CQn = (аа2 + ba + c)q2 + 2ааОп + абп/qn + Ь0п = (2оа + Ь)0п + '^n/q2- Отсюда следует, что | Ап| < \2аа + 6| + |о|. Правая часть последнего нера- венства не зависит от п. Поэтому существует лишь конечное число коэф- фициентов Ап и Сп. Отсюда вытекает конечность множества Вп, в силу постоянства дискриминанта В2 — 4АпСп. Поэтому, имеется лишь конечное число уравнений для остатков и, значит, лишь конечное число самих остат- ков ап. Следовательно, некоторые два из них равны: ап = an+s. Совпадение двух остатков означает периодичность цепной дроби. □ Можно поставить вопрос об особенностях разложения в цепную дробь квадратных корней из натуральных чисел. Этот вопрос решил юный Эва- рист Галуа, доказавший следующую теорему. Теорема. Пусть п — натуральное число, не являющееся полным ква- дратом.Тогда имеет место разложение в цепную дробь следующего вида: х/п = {до, 01,02,... , ап, 2ао}, при ЭТОМ Дг = On+1-г, 1 < i < П. □
5.6. ТЕОРЕМА ЭЙЛЕРА-ЛАГРАНЖА 89 У пражнения 1. Доказать, что при разложении иррациональности у/п, где п — натуральное, период начинается сразу же после выделения целой части. 2. Доказать, что иррациональность вида х/1 + п2, где п — натуральное, разлагается в цепную дробь таким образом, что а)2(д2 + l)qk =рк-1 +Pk+i- b)2pk = qk-r +qk+i. Pi+P2 + ---+Pk _ PkPk+i ~ PoPi qi+ql + ... + ql qkqk+i - qoqi
90 ГЛАВА 5. РЕШЕНИЕ УРАВНЕНИЙ В ЦЕЛЫХ ЧИСЛАХ
Глава 6 Сравнения и диофантовы уравнения 6.1 Сравнения и классы вычетов Разберем следующую задачу: Найти все целые х, для которых число 4ж2 + 2ж + 1 делится на семь. Для задач такого типа используют специальные обозначения. Говорят о решении сравнения 4ж2 + 2ж + 1 = 0 mod 7. Вообще, запись и = v mod т означает, что целые числа и и v дают один и тот же остаток при делении на т. Можно заметить, что числа 1 и 2 являются решениями. С ними можно связать бесконечные серии решений. Рассмотрим все числа, дающие при делении на семь остаток 1 или 2. Это числа вида 7п + 1 и 7п + 2, где п — целое. Подставим первую серию чисел в исходное выражение: 4(7п + I)2 + 2(7/г + 1) + 1 = 4(49/г2 + 14/г) + 14/г + (4 • I2 + 2 • 1 + 1) Получается, что это число отличается от результата подстановки самого остатка 1 на число кратное семи. Та жа самая картина получается для любого остатка, то есть при подстановке произвольного числа вида 7п + I получается число, которое отличается от результата подстановки остатка I на кратное семи число. Так что , для решения этой задачи достаточно пере- брать все возможные остатки при делении на семь — подставить 0,1,2,3,4,5,б и отобрать решения. Ответом будут числа вида 7п+1 и 7/г+2. Этот пример 91
92 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ наводит на мысль, что решения аналогичных задач следует искать не среди бесконечного множества целых чисел а из некоторого конечного множества. По любому натуральному числу m можно получить разбиение множе- ства всех целых чисел на m непересекающихся подмножеств: {тп^п € Z} U {тп + 1|д € Z}U {тп + 2|д € Z}U... U {тп + т — l|n € Z}. Мы в одно подмножество отобрали все числа, дающие один и тот же оста- ток при делении на т. Такое подмножество называется классом вычета I по модулю m и обозначается через I, где I — общий остаток при делении на ш. Станем также обозначать это подмножество через s, для любого со- держащегося в нем элемента s (s называют представителем класса вычета). Например, для т = 7 имеют место равенства: 2 = —5 = 16. Решения срав- нений следует искать не среди бесконечного множества целых чисел а среди конечного множества классов вычетов. Множество классов вычетов по мо- дулю ш обозначают через Z/m. Z/т = {О, Т, 2,... , т — 1} Классы вычетов можно складывать и умножать. Положим: 81 + S2 = 81 + 82, 81 • 82 = 81 • 82- Результат не зависит от выбора представителей классов вычетов. Проверим это для операции умножения. Пусть мы выбрали другие представители — si + п±т и 82 + п^т. Тогда получим по формуле: (si + nim)(s2 + п2т) = sis2 + (nis2 + n2s1)m = sls^. В результате мы получили новую числовую систему с конечным числом эле- ментов. Эти элементы можно складывать и умножать, для всякого элемента а будет противоположный элемент —а, который в сумме с элементом а дает нулевой элемент 0. Кроме того, имеется единичный элемент 1. Нулевой и единичный элементы обладают следующими характерными свойствами: а + 0 = 0 + а = а; а • 0 = 0 • а = 0; 1 - а = а • 1 = а, для произвольного элемента а. Интересно узнать описание всех обратимых классов вычетов по модулю ш, то есть таких а, что существует b со свойством: а-b = 1. Для нулевого эле- мента не существует класса вычетов b с таким свойством. Действительно,
6.1. СРАВНЕНИЯ И КЛА ССЫ ВЫЧЕТОВ 93 пусть b • 0 = 1. Однако при умножении на нулевой класс вычетов должен получаться нулевой класс вычетов. Значит, 0 = 1, что возможно только при т = 1 (мы будем исключать этот случай из рассмотрения). Слегка подпра- вив эти рассуждения, можно доказать, что класс вычетов I необратим, если I — делитель числа т. Пусть l-b = 1 и т = l-k. Умножим первое равенство на к: к - I b = к. Однако к • I = т = 0. Значит, 0 = к, что невозможно, так как 0 < к < т. Теорема. Вычет а по модулю m обратим тогда и только тогда, когда НОД(а,т)=1. Всего обратимых вычетов ф(т) штук. Доказательство. Достаточно доказать, что для любого числа 0 < а < т, НОД(а, m) = 1 существуют вычет b такой, что ba = 1. Мы укажем практический способ нахождения такого вычета. При помощи алгоритма Евклида или цепных дробей найдем линейное представление НОД(а,т): 1 = b • а + с • т. Тогда 1 = ba + ст = Ьа = Ъа. □ Для простого т = р обратимыми будут все вычеты кроме нулевого. В этом случае на множество Z /р переносятся многие свойства действитель- ных и комплексных чисел. Например, можно рассмотреть многочлены с ко- эффициентами в Z /р. Для них будет выполнятся и схема Горнера, и деление с остатком, и интерполяционные формулы — все доказательства дословно переносятся на этот случай. Не стоит упускать из виду, что уравнения с коэффициентами из Z/m можно рассматривать просто как сравнения по модулю ш: До • хп + ... + ап_1 • х + = аохп + ... + ап_1Ж + ап. Так что, для изучения сравнений можно использовать теорию многочле- нов. Подчеркнем, что теория переносится лишь для сравнений по простому модулю. Для сравнений по составному модулю будут нарушаться самые простые свойства и теоремы. Например, уравнение х2 = 1 второй степени с коэффициентами из Z/8 имеет четыре решения — {1,3,5,7}. Легко при- вести пример двух многочленов с коэффициентами из Z/6, произведение которых имеет степень меньшую чем сумма степеней этих многочленов: (2ж2+ 3)(3ж2+ 4) = 5ж2. Вычеты можно использовать при шифровании сообщений. Простейшей системой шифрования служит система, которой пользовался Юлий Цезарь. Он применял циклический сдвиг 23 букв классического латинского алфа- вита (в нем отсутствовали буквы w,v и j) на три буквы. Вместо буквы а он ставил d, вместо буквы b он ставил е, вместо с — f, и так далее. Вместо
94 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ букв x,y,z он ставил буквы а,Ь,с. Например, сообщение ’’sapienti sat” шифру- ется как ’’xdsmhqym xdy”. Очевидно, что сдвигать можно на произвольное количество букв. Получается 23 системы шифрования латинских текстов (среди которых будет и прямая запись исходного сообщения — сдвиг на 23 буквы). По сути дела мы заменяем буквы на их порядковые номера, которые рассматриваем по модулю 23. Эта идея замены символов на вычеты весьма полезна и применяется в современных криптосистемах. Обобщением системы Цезаря служит аффинная криптосистема. Рассмо- трим шифрование английских текстов при помощи следующего метода. Сначала сопоставим каждой букве английского алфавита вычет по модулю 26: а — 0, b — 1,... ,z — 25. Выберем два числа киш, причем НОД(&, 26)=1. Шифровать будем по следующему правилу. Вычет i заменяется на вычет i' = ki + т. Число ki + т может быть довольно большим — мы нуждаемся в формуле, которая бы по целому числу х давала остаток при его делении на п. Эта формула имеет вид: х— [-Jп. Число к может принимать значения 1,3.5,7,9,11,15,17,19,21,23,25 а число m может принимать все значения от О до 25. Получается всего 12 • 26 = 312 способов шифрования английских тек- стов. Каждый такой способ позволяет однозначно дешифровать сообщения по шифровкам — по вычету V восстанавливается вычет i = к (г' — т) (здесь к — обратный вычет к вычету к). Если НОД(Л’,26) > 1, то нару- шается однозначность дешифровки. Зашифруем, например, слово ’’mathe- matician” при помощи аффинной криптосистемы с к = 4, т = 3. 012345678 910111213141516171819202122232425 3 711151923 1 5 913172125 3 711151923 1 5 913172125 abcdefghijklmnopqrstuvwxyz dhlptxbfjnrvzdhlptxbfjnrvz Получается слово ’’zdbftzdbjljdd”. Однако точно также шифруется слово ” zathezntician”. Мы получили наглядное представление о необратимости вычета 4 по модулю 26. Можно обсудить проблему дешифровки сообщений, зашифрованных при помощи аффинной системы. Пусть у нас есть перехваченная шифровка: ”kar Imvlj hkenlj vsr kar pvnhr efs ovts adljvez odljvez ovlj”
6.2. ЛАТИНСКИЕ КВАДРАТЫ 95 Нам нужно узнать каким из 312 шифров пользовался противник. Для этого достаточно правильно дешифровать две буквы. Если бы у нас была боль- шая шифровка, то мы могли бы использовать таблицы средней частоты употребления букв в английском языке (самая употребительная буква ”е” имеет частоту — 12,31%, затем идут буквы ”t” — 9,59%, ”а” — 8,05%, ”о” — 7,94%). Подсчитав частоту употребления символов в шифровке, мы бы без труда дешифровали несколько букв. В нашем случае можно догадаться, что дважды употребленнное слово ”kar” есть не что иное как определен- ный артикль ’’the”. Значит, ”h” — 7 шифруется как ”а” — 0 и ”е” — 4 шифруется как ”г” — 17. Получаем систему сравнений для чисел киш: ( 7к + т = 0 mod 26 [ 4к + т = 17 mod 26 Вычтя из первого сравнения второе получим сравнение Зк = —17 mod 26. Легко найти обратный вычет для 3 — 3-9 = 27 =1 mod 26. Умножив обе части этого сранения на 9, получим: к = (—17) • 9 = 9 • 9 = 3 mod 26. Из первого сравнения системы находим т = — 21 = 5 mod 26. Получаем следующий способ шифрования: 012345678 910111213141516171819202122232425 5 81114172023 0 3 6 91215182124 1 4 7101316192225 2 abcdefghijklmnopqrstuvwxyz filoruxadgjmpsvybehknqtwzc Шифровался детский стишок: "the clock struck one the mouse ran down hickory dickory dock." 6.2 Латинские квадраты Конечные числовые системы, построенные в предидущей секции, могут быть использованы в комбинаторных построениях. В частности, с их помо- щью строят так называемые латинские квадраты.
96 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ Латинским прямоугольником размеров п х т называют прямоугольную таблицу, состоящую из п строк длины т. Каждая строчка состоит из од- них и тех же различных m символов. Строчки отличаются друг от друга лишь порядком этих символов. При этом требуется, чтобы каждый столбец состоял из п различных символов. Так что, в каждой строчке и в каждом столбце все символы разные. Особенно интересен случай п = т. Тогда столбцы состоят изо всех возможных символов, как и строчки. Заметим, что латинских прямоугольников размера п х т при п > т не существуют, так как символы в столбцах в этом случае должны повторятся. Рассмотрим в качестве примера два латинских квадрата 3x3: 2 3 1 3 12 3 1 2 2 3 1 12 3 12 3 Интересно было бы узнать число всех латинских прямоугольников. Для уточнения задачи можно унифицировать набор используемых символов и их расположение в последней строчке. Пусть последняя строчка всех та- блиц будет иметь вид: 1,2,... , п. Если были использованы какие-то другие символы или эти, но в другом порядке, то расположение символов в по- следней строчке дает схему для переобозначения. Для таблиц 2 х т мы получили ответ в последней секции главы ’’Комбинаторика”. Легко видеть, латинские прямоугольники 2 х т однозначно соответствуют беспорядкам из ш элементов. Их число равно т!(1/2! — 1/3! + ... + (—l)m/m!). Несколько сложнее подсчитать число латинских прямоугольников размера 3 х т. В общем случае задача не решена до сих пор. Латинские квадраты связаны с некотороми комбинаторными задачами. Примером служит задача о построении в квадратное каре т2 офицеров. При этом офицеры делятся на представителей ш полков, по ш офицеров ка- ждого полка. Кроме того, офицеры делятся на представителей ш званий, по ш офицеров каждого звания. Если и звания, и полки обозначать числами от 1 до ш, то самих офицеров можно обозначать парами вида где i — звание, j — полк; 0 < i < т, 0 < j < т. Задача состоит в том, чтобы расставить этих офицеров в квадратное каре таким образом, чтобы в ка- ждой шегенге и каждой колонне встречались офицеры всех полков и всех званий. Если рассмотреть отдельно условие на звания или на полки, то оно эквивалентно построению латинского квадрата. Возникает задача о постро- ении двух латинских квадратов, которые связаны между собой следующим
6.2. ЛАТИНСКИЕ КВАДРАТЫ 97 образом. При наложении одного квадрата на другой возникает т2 пар (г, j). Требуется, что никакая пара не повторялась — невозможно одного и того же офицера поставить на два разных места. Два латинских квадрата, удо- влетворяющие этому условию, называют ортогональными друг другу. Так что, задача о построении офицеров в квадратное каре эквивалентна задаче о нахождении двух ортогональных латинских квадратов нужного размера. Два приведенных выше ортогональны друг другу и дают решение задачи о 9 офицерах. Наложим их друг на друга: (2,3) (3,1) (1,2) (3,2) (1,3) (2,1) (1,1) (2,2) (3,3) Очевидно, что задача о 4 офицерах неразрешима. Можно решить задачи о 16 и о 25 офицерах. Эйлер догадался о неразрешимости задачи о 36 офи- церах. Этот факт был доказан лишь в 1900 году. На основании неразре- шимости этой задачи для т = 2 и т = 6 Эйлер выдвинул гипотезу о неразрешимости этой задачи для любого т = Ак + 2. В двадцатом веке эта гипотеза была опровергнута уже для значения т = 10. Приведем решение задачи о 100 офицерах. Для удобства запоминания этой таблицы отступим от стандартных обозначений. Станем пользоваться следующими десятью символами — 0,1,2,3,4,5,6,а,Ь,с. Таблица имеет вид: (0,0) (6, а) (5,6) (4, с) (с,1) (6,3) (а, 5) (1,2) (2,4) (3,6) (а, 6) (1,1) (0, а) (6,6) (5, с) (с, 2) (6,4) (2,3) (3,5) (4,0) (6,5) (а, 0) (2,2) (1,а) (0,6) (6, с) (с,3) (3,4) (4,6) (5,6) (с, 4) (6,6) (с,1) (3,3) (2, а) (1,6) (0, с) (4,5) (5,0) (6,2) (1,с) (с, 5) (6,0) (а, 2) (4,4) (3,а) (2,6) (5,6) (6,1) (0,3) (3,6) (2, с) (с, 6) (6,1) (а, 3) (5,5) (4, а) (6,0) (0,2) (1,4) (5, а) (4,6) (3, с) (с, 0) (6,2) (а, 4) (6,6) (0,1) (1,3) (2,5) (2,1) (3,2) (4,3) (5,4) (6,5) (0,6) (1,0) (а, а) (6,6) (с, с) (4,2) (5,3) (6,4) (0,5) (1,6) (2,0) (3,1) (6, с) (с, а) (а, 6) (6,3) (0,4) (1,5) (2,6) (3,0) (4,1) (5,2) (с, 6) (а, с) (6, а)
98 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ Теорема. Для любого простого числа р существуют такие р — 1 латин- ские квадраты размеров р х р, что каждые два из них ортогональны. Доказательство. Приведем метод построения р — 1 латинского ква- драта размероврхр, где р — простое число. При этом, каждые два квадрата будут ортогональны. Рассмотрим вычеты по модулю р: Z/p = {1,2,... ,р}. В квадраты станем записывать именно тех представителей классов выче- тов, что приведены выше. Обозначим через а\ j число, которое стоит у 1-го квадрата, в i-й строке, в j-м столбце. Положим : ai,j = — — P’l — J — Р’1 — — Р — 1- Докажем, что 1-й квадрат является латинским. Пусть в i-й строчке со- впадают два элемента: aliu = aliv. Значит, имеет место равенство: i • I + и = i I + v mod р. Отсюда следует, что и = v mod р. Это был один и тот же элемент. Пусть в j-м столбце совпадают два элемента: al. , = а\, г. Значит, имеет место равенство: и I + j = v • I + j mod p. Отсюда следует, что и • I = vl. Из определения следует, что 1^0. Так что, последнее равенство можно умножить на I .В результате получится равенство: и = v. Итак, мы дока- зали, что все эти квадраты — латинские. Осталось проверить их попарную ортогональность. Пусть при наложении м-го и и-го квадратов совпали две пары: (а“ , «' j) и Тогда имеет место пара равенств: a“j = a“j, и «'j = а^,^,. Получаем следующую систему: i и + j = i' i -v + j = i' u + f v+j' Вычтем из первого равенства второе: i и — v = i' и — v. В силу того, что квадраты разные, вычет и — v — ненулевой, и на него можно сократить. Поэтому, i = i'. Отсюда немедленно вытекает, что j = j'. Значит, пара была одна. Квадраты ортогональны. □ В дальнейшем мы обобщим эту теорему на случай степеней простых чи- сел. Возможно ли ее дальнейшее обобщение неизвестно до сих пор. Приве- деннные выше два квадрата построены по методу, приведенному в теореме. Рассмотрим в качестве примера построение четырех попарно ортогональ- ных латинских квадратов размеров 5x5:
6.2. ЛАТИНСКИЕ КВАДРАТЫ 99 23451 34512 45123 51234 34512 51234 23451 45123 45123 23451 51234 34512 51234 45123 34512 23451 12345 12345 12345 12345 Интересно было бы узнать построение трех попарно ортогональных квадра- тов размеров 4x4. Наборы из т — 1 попарно ортогональных латинских квадратов размеров т х т позволяют построить интересный комбинаторный объект — про- ективную плоскость порядка т. В качестве примера рассмотрим задачу, решение которой приводит к самой маленькой по числу элементов проек- тивной плоскости. Задача. Отряду из семи налоговых полицейских поручено провести про- верку семи пунктов обмена валюты. Проверка обменного пункта осуще- ствляется командой тремя полицейскими. Требуется, чтобы каждая пара полицейских встречалась при проверке не более одного раза. Нужно напи- сать распределение отряда по командам. Обозначим полицейских номерами от 1 до 7. В первый обменный пункт пошлем первые три номера — {1,2,3}. В остальные шесть пошлем их по отдельности, каждого в два пункта. Нужно еще заполнить шесть команд парами из оставшихся полицейских — 4,5,б,7. Как мы уже знаем четыре элемента разбить на две пары можно тремя способами — {4,5} U {6,7}, {4,6} U {5,7} и {4,7} U {5,6}. В результате получилось следующее решение задачи: {1,2,3} {1,4,5} {1,6,7} {2,4,6}{2,5,7} {3,4,7} {3,5,6} Это решение обладает следующими свойствами: 1) каждые две точки принадлежат одному и только одному подмножеству. 2) каждые два подмножества пересекаются ровно по одной точке. 3) существуют такие четыре точки, что никакие три из них не лежат в одном подмножестве. Последнему свойству удовлетворяют точки 4,5,6,7. Эти три свойства по- лученной нами системы подмножеств рассматривают как аксиомы. Такую
100 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ систему подмножеств называют проективной плоскостью, сами подмноже- ства называют прямыми. Из аксиом можно вывести, что при числе точек в прямой — т +1 общее число точек в проективной плоскости — т2 + т + 1. Число прямых совпадает с общим числом точек. Число ш называют поряд- ком проективной плоскости. В приведенном примере т = 2. Третья аксиома требует наличия четырех различных точек. Поэтому, не существует про- ективной плоскости порядка 1. Конечная проективная плоскость порядка ш строится по набору из т — 1 попарно ортогональных латинских квадратов размеров т х т. Нам нужно из множества {1,2,... , т2 + т +1} выбрать т2 + т +1 (т + 1)-элементных подмножеств. Сначала выбираем подмножество {1,2,... , т + 1}. Оставши- еся подмножества разбиваются на т + 1 группу по ш элементов в каждой. Во множествах первой группы присутствует элемент 1, во множествах вто- рой группы присутствует элемент 2, и так далее, во множествах (т + 1)-й группы присутствует элемент т + 1. Нам нужно дополнить эти множества ш элементами каждое. Выпишем первые две группы: {1, т + 2, т + 3,... , 2m + 1} {2, т + 2,2m + 2,... , m2 + 2} {1,2m + 2,2m + 3,... , 3m + 1} {2, m + 3,2m + 3,... , m2 + 3} {1, m2 + 2, m2 + 3,... , m2 + m + 1} {2,2m + 1,3m + 1,... ,m2 + m + l} Как выписывать оставшиеся m — 1 группы лучше всего пояснить на при- мере. Пусть т = 3. Выпишем в строчку элементы каждого из двух ортого- нальных латинских квадратов, столбик за столбиком. Получим таблицу: 5 6 7 8 9 10 11 12 13 3 3 2 1 1 3 2 2 1 3 4 2 3 1 3 1 2 1 2 3 Здесь в верхней строчке таблицы выписаны числа от т + 2 до т2 + т + 1. В левом столбце стоят первые числа подмножеств — от 3 до т + 1. Чтобы получить все подмножества с первым числом i нужно взять строчку, начинающуюся с числа i. В ней будет по m штук единиц, двоек, и т.д.. В одно подмножество выпишем число i и все элементы верхней строки, под которыми в i-й строке стоит одно и то же число. В нашем примере строка с первым элементом 3 даст следующие подмножества: {3,7,8,12} {3,6,10,11} {3,5,9,13}.
6.3. ОСНОВНЫЕ ТЕОРЕМЫ 101 Строка с первым элементом 4 даст следующие подмножества: {4,7,9,11} {4,5,10,12} {4,6,8,13}. Получились недостающие т2 —т = 6 прямых. Можно доказать, что задание т — 1 попарно ортогональных латинских квадратов размеров т х т эквива- лентно построению конечной проективной плоскости порядка ш. Указанное построение задает эту эквивалентность. 6.3 Основные теоремы Благодаря конечности полученных числовых систем, можно поставить следующие вопросы: 1. Чему равна сумма всех элементов множества вычетов ? 2. Чему равна сумма k-х степеней всех элементов множества вычетов ? 3. Чему равно произведение всех ненулевых вычетов ? и т.п. Легче всего ответить на первый вопрос. Для этого нужно рассмотреть арифметическую прогрессию: Т + 2 + ... + m—1 = 1 + 2 + ... + т — 1 = т(т — 1)/2. Ответ существенно зависит от четности числа ш. Если оно нечетное, то число т— 1 — четное, и число (т—1)/2 — целое. В этом слечае, сумма равна произведению вычетов т (т — 1)/2 = 0(т — 1)/2 = 0. Для четных ш это неверно. Рассмотрим простейший пример: ш=4, 1 + 2 + 3 = 2. Для четных ш сумма представляется в виде т/2 т — 1 = —т/2 = т/2. Последнее равенство вытекает из того, что т/2 + т/2 = 0 mod т. Довольно просто разобраться с третьим вопросом для составного т = s - I; s > 1,1 > 1. В произведении должны встретиться вычеты s и I, кото- рые дадут нулевой вычет, так что произведение в этом случае равно нулю. Приведенное рассуждение представляет собой пример правдоподобных не- верных выводов. Рассмотрим пример т=4: 1-2-3 = 6 = 2. К счастью, это — единственное исключение. Докажем правильность нашего вывода для всех остальных случаев. Прокол в рассуждении состоит в том, что множители s и I могут совпасть. Этого не избежать только для чисел m вида р2, где р — простое. Однако для р > 2 среди множителей исходного произведения обязательно встретятся р и 2р, которые дадут нулевой вычет. Мы полу- чили единственное исключение для т = 22. Здесь мы впервые столкнулись с особым, нерегулярным поведением вычетов по модулю, являющемуся сте- пенью двойки. Это — их характерная особенность. Она прослеживается и
102 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ в верхних областях математики (алгебре, алгебраической топологии), где многие теоремы нужно отдельно доказывать для этого случая. Нам оста- лось разобрать случай т = р, где р - простое число. Теорема (Вильсон). Для простого числа р имеет место сравнение (р — 1)! = —1 mod р. Доказательство. Мы докажем, что l-2-...-р—1=р—1. Достаточно доказать, что все вычеты — 2,3,... ,р — 2 — разбиваются на пары вза- имно обратных вычетов, и их произведение равно единичному вычету. Для этого докажем, что эти и только эти вычеты имеют отличающиеся от них обратные вычеты. Пусть некоторый вычет х совпадает со своим обратным: х = ж-1. Умножив это равенство на х получим уравнение: х2 = 1. Перенося единичный вычет в правую часть, получим равенство: (х — 1)(ж + 1) = 0. Мы получили равенство произведения двух вычетов нулю. Это эквивалентно делимости произведения двух чисел на простое число р. Из него вытекает, что хотя бы один из множителей делится на р. Значит, либо х = 1, либо х = —1 = р — 1. Существуют только два вычета, которые совпадают со своими обратными — 1 и р — 1. □ Таким образом, третья задача полностью разобрана. Обозначим через П(т) произведение всех ненулевых вычетов ъ’А/т. Тогда имеет место равенство: П(т) = < 2, _0, =т, если т = 4 если т > 4 — составное если т — простое Вторая задача несколько сложнее разобранных выше. Мы рассмотрим случай т=р — простого модуля. В этом случае множество ненулевых вы- четов устроено достаточно просто — это множество степеней одного и того же вычета, который называют примитивным вычетом по модулю р: Tj/p= {0,1,а, а2,... ,ар~2}. Очевидно, что легко найти произведение этой суммы и вычета ак — 1, где к — исходная степень: (ак - 1)(1 + ак + а2к + ... + а^~2^к) = а^~^к - 1. Из этой формулы можно получить значение для искомой суммы при помощи следующей теоремы.
6.3. ОСНОВНЫЕ ТЕОРЕМЫ 103 Малая теорема Ферма. Для любого целого х имеет место сравнение по простому модулю: хр = х mod р. Доказательство. Достаточно доказать для натуральных х. Доказа- тельство проведем при помощи индукции по х. Для х = 1 утверждение очевидно. Пусть оно выполняется для х = к. Тогда для х = к + 1 получим сравнение: (fe + l)p = F+Qf^+Qf^ + .-.+ Q^ Jfe+l = F + 1 = fe + l modp. Это вытекает из делимости биномиальных коэффициентов на p.D Для чисел х не кратных р этому утверждению можно придать иную форму. Сократим равенство хр = х на вычет х. Получим равенство: F-1 = 1. Применив это равенство к полученной формуле, получим равенство: 1 = 1 — 1 = 0. Значит, одна из скобок в левой части равна нулю. Рассмотрим случай степени к, не делящейся нар—1. В этом месте нужно воспользоваться тем , что а — примитивный вычет. Все его степени дают р — 1 ненулевых вычетов. Для этого достаточно взять степени 0,1,... ,р — 2, потому что воз- ведение в р — 1 степень эквивалентно возведению в нулевую степень. При этом, степени вычета а ведут себя как вычеты по модулю р — 1. Разделим произвольную степень п на р — 1 с остатком: п = q(p — 1) + г, 0 < г < р — 1. Тогда имеет место равенство: ап = (ар-1)9аг = аг. Вместо самих степеней можно рассматривать их остатки от деления на р — 1. Вычет ак не может быть единичным, потому что остаток от деления к на р — 1 не равен нулю. Значит, нулевому вычету равна искомая сумма всех k-х степеней вычетов. Осталось найти эту сумму для степеней к, делящихся на р — 1. При этом, каждый ненулевой вычет в такой степени даст единичный вычет. Получа- ется сумма, состоящая р — 1 единичного вычета. Она равна —1. Обозначим через Е(р, к) искомую сумму. Мы получили ответ во второй задаче: . f 0, если р — 1 + к = еслир—l|fe. Нам осталось доказать существование примитивного вычета. Теорема. Существует ровно </>(р—1) примитивных вычетов по простому модулю р. Доказательство. Каждому ненулевому вычету Ь сопоставим натураль- ное число ord(b), называемое порядком вычета Ь. Определим порядок как наименьшую натуральную степень, в которой данный вычет равен единич- ному вычету. Это число, как следует из малой теоремы Ферма, не пре- восходит р — 1. Нам нужно доказать существование вычетов максимально
104 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ возможного порядка р — 1. В самом деле, для вычета b порядка к все сте- ______ _ _2 —k — i пени l,b,b ,b различны. Наличие двух совпадающих вычетов b и -=-£ м T$—t о из этой серии эквивалентно равенству о , которое невозможно в силу минимальности порядка к. Заметим, что к является делителем числа р — 1. Разделимр — 1 на к с остатком:р — 1 = q-k + r, 0 < г < р— 1. Тогда, имеют место равенства: т = ьр-1 = (b'yV' = V. Получаем меньшую чем порядок степень, в которой вычет равняется еди- нице. Эта степень должна равняться нулю. Значит, порядок — делитель числа р — 1. Пусть для делителя d числа р — 1 имеется ровно ф' (d) вычетов порядка d. Положим ф'(1) = 1. Число всех ненулевых вычетов можно представить как сумму по всем делителям числа р — 1 : 52 d | р-1 Заметим, что число </»'(d) равно или нулю или </>(d). В самом деле, пусть есть хотя бы один вычет b порядка d. В этом случае, легко описать множество всех вычетов порядка d. Дело в том, что они лежат среди корней уравнения xd = 1. У многочлена степени d корней не больше чем d. Доказательство этого факта дословно переносится на многочлены с коэффициентами из Z /р. Однако, мы имеем d различных корней этого уравнения — 1, Ь, I?,... , b \ Так что, множество вычетов порядка d можно отбирать среди этих выче- тов. Мы утверждаем, что при возведении всех приведенных выше корней уравнения xd = 1 в степень s, где 0 < s < d НОД(зД)=1, они просто пе- реставятся местами. Пусть два из них 6*' и bt2 совпали при возведении в степень s. Это эквивалентно равенству bS'1' = 1. Рассмотрим линейное представление для НОД(еД): s • и + d • v = 1. Возведем обе части получен- ного равенства для вычетов в степень и: (Ъ )il-i2 = 1. Однако из равенства Tsu+dv yl Tsu т „ yii-i2 т „ yii у<2 о =0 вытекает, что о = о. Значит, о = 1. Итак, вычеты о ио совпадают. Мы доказали, что вычет Ь имеет порядок d. Получается </>(d) вычетов порядка d. Заметим, что вычет b , где НОД(в,<1) = q > 1, обраща- ется в единичный вычет при возведении в степень d/q. Значит, иных кроме указанных </>(d) вычетов порядка d не существует. Окончание доказательства основано на лемме, принадлежащей К.Ф. Гауссу.
6.3. ОСНОВНЫЕ ТЕОРЕМЫ 105 N = { Лемма. Имеет место раенство для любого натурального п: 52 = п- d | п Доказательство. Рассмотрим набор из п дробей: 1 2 3 п •) •) •) • • • •) п п п п Некоторые из этих дробей сократимы, некоторые — нет. Разобьем множе- ство N на непересекающиеся части следующим образом. Соберем вместе дроби, сокращающиеся на один и тот же делитель: N = ис/|пФ(7/), где в Ф(с7) входят все дроби с числителями, которые имеют наибольший общий делитель со знаменателем п равный d. Нужно подсчитать число элементов множества Ф(с7). После сокращения на d в него будут входить все дроби с числителями s такими, что 0 < s < n/d, HOH(s,n/d)=l. Таких числителей всего ф(п/<1) штук. Значит, |Ф(<7)| = </>(n/d). В результате получилась фор- мула: п = |7V| = Она отличается от доказываемой формулы всего лишь порядком слагаемых — вместо делителей d можно рассмотреть дополнительные к ним делители n/d.D Осталось подставить в полученнную формулу п = р — 1 и сопоставить результат с формулами р — 1 = и < </>(d). Мы получили равенство = </>(d) для любого делителя числа р— 1.П Следствие. Множество вычетов Z/р для каждого делителя d числа р— 1 содержит ровно </>(d) вычетов порядка d. □ Можно поставить вопрос о существовании примитивного вычета, сте- пени которого давали бы все обратимые вычеты, для составного модуля ш. Такой примитивный вычет существует для всех т = рк, где р — не- четное простое число. Кроме этих значений модуля примитивный вычет существует лишь для т = 2р1\ где р — нечетное простое число. Мы не станем здесь доказывать эти факты. Обратим, однако, внимание на то, что степени двойки опять выделяются среди степеней простых чисел — по этим модулям нет примитивных вычетов. У пражнения 1. Теорема Клемента. Числа р и р+2 являются простыми тогда и только тогда, когда имеет место сравнение: 4[(р — 1)! + 1] +р = 0 mod (р + 2)р.
106 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ 6.4 Сравнения по составному модулю Рассмотрим следующую задачу: Найти наименьший натуральный х, удо- влетворяющий системе сравнений: х = 1 mod 2 х = 2 mod 3 х = 4 mod 5 х = 6 mod 7 Для решения этой задачи достаточно заметить, что все сравнения можно переписать в виде х = —1 modp;p = 2,3,5,7. Общее решение будет иметь вид: — 1 + 2 • 3 • 5 • 7 • п; п € Z. В самом деле, число х + 1 делится на 2,3, 5,7. Наименьшим натуральным решением будет х = 209, п = 1. Ничего не стоит привести пример подобной системы, которая не имеет решений. Пусть х удовлетворяет системе: х = 4 mod 6 х = 5 mod 15 Тогда из первого уравнения следует, что это число дает остаток 1 при делении на 3. Однако, из первого уравнения следует, что это число дает остаток 2 при делении на 3. Это получилось потому, что модули, по которым рассматривались сравнения, имели нетривиальный общий делитель — 3. Китайская теорема об остатках. Система сравнений х = ах mod mi х = аг mod m2 х = ап mod тп имеет целочисленное решение при любых «г,1 < i < п, если все числа mi, 1 < i < п попарно взаимно простые. Доказательство. Построим решение в явном виде. Обозначим через Мк произведение всех модулей mi, за исключением модуля т-к,! < к < п. Обозначим через Мк какой-либо представитель класса вычетов, обратного к вычету Мк по модулю тк- Другими словами, М'к — некоторое решение сравнения Мк М'к = 1 mod тк- Это решение существует, в силу того, что НОД(ЛД;, т-к) = 1. Решение исходной системы сравнений дается формулой: xq — aiMiM^ + + • • • + йпМпМ'п.
6.4. СРАВНЕНИЯ ПО СОСТАВНОМУ МОДУЛЮ 107 В самом деле, если рассмотреть это число по модулю ть, то все слагаемые, за исключением k-го слагаемого, дадут нулевые остатки при делении на пц. Однако, k-е слагаемое по этому модулю имеет вид: о^МкМ^ = mod тк. □ Общее решение этой системы сравнений задается формулой х = xq + mi m2 • • • mnN;N € Z. В самом деле, для множества целых чисел 0 < г < mi m2 ... тп имеется только одно решение — г о — остаток от деления хо на mi m2 .. -тп. Пусть п — какое-либо другое решение из этого множества. Тогда, п — и =0 mod mj,, для любого модуля mj,. Значит, это число де- лится на любой из модулей и, следовательно, на их произведение. Это может быть, только если это число равно нулю, и п = го- Любое множество из mi m2 ... тп последовательных целых чисел содержит ровно одно решение исходной системы. Решение сравнения по составному модулю сводится к решению сравне- ний по модулям равным степеням простых чисел. Для этого достаточно разложить основной модуль на простые множители т = р*' р%2 -Р^”, ре- шить сравнение по модулям pskk, 1 < к < п и ’’склеить” полученные решения в одно при помощи Китайской теоремы об остатках. Теорема (Эйлер). Для любого обратимого вычета а по модулю m имеет место равенство: = 1. Доказательство. Пусть и, v,... , w — представители всех обратимых классов вычетов (взятых по одному разу). Если их всех умножить на число а, то получатся также представители всех обратимых классов вычетов. Это утверждение эквивалентно тому, что получатся все разные вычеты, так как обратимость при умножении двух обратимых вычетов сохраняется. Пусть аи = av mod m. Тогда число а(и — v) делится на т. Однако, НОД(а,т) = 1. Значит, и — v = 0 mod т. Выходит, что числа и и v при- надлежали к одному классу вычетов. Перемножим все обратимые вычеты двумя способами — выбрав две при- веденнные выше системы представителей: й -v.. .w = ай -av.. .aw Сократив на левую часть, получим искомое равенство 1 = . Степень, в которой стоит вычет а равна числу всех обратимых вычетов.□ На этой теореме основана современная система шифрования RSA, на- званная так по первым буквам фамилий первооткрывателей — Ривеста, Шамира и Эдлемана. Сначала стоит объяснить, чем она принципиально отличается от рассмотренной выше аффинной системы и подобных ей ста- ринных систем. Большинство старинных систем были одноалфавитными.
108 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ Это означает, что каждая буква на протяжении всего текста шифруется одинаково. В системе RSA одна и та же буква в разных частях текста может шифроваться по-разному. Такие системы называют многоалфавитными. В системе RSA шифруются не отдельные символы, а целые фрагменты текста в несколько десятков символов. Выбирается большое целое число ш ( имею- щее несколько десятков или даже сотен десятичных знаков ). Текст делится на фрагменты, которые представляются целыми числами 0 < а < п. Пусть, например, используется всего сотня символов. Число ш выбрали более чем в сотню десятичных знаков. Тогда, выбирается длина фрагмента сообщения в 50 символов (каждый символ занимает две позиции — заменяется дву- значным числом). Фрагмент заменяется числом а, которое возводится в не- которую степень di и приводится по модулю ш, то есть степень заменяется на остаток от деления на ш. Итак, для шифрования нужно знать два числа — di и ш. Причем, эти числа можно публиковать открыто — противник все равно не сумеет вовремя дешифровать сообщение. Системы, в которых ключ шифрования публикуется открыто называются системами шифрова- ния с открытым ключом. Они основаны на том, что для дешифрования нужно обладать дополнительной информацией (ее называют секретная ла- зейка), зная только метод шифрования сообщений, невозможно их быстро дешифровать. Объясним, как устроена секретная лазейка в системе RSA. Число ш вы- бирают в виде произведения двух громадных простых чисел: т = pq. Тогда, ф(п) = (р— l)(g — 1). Согласно теореме Эйлера, для любого 0 < а < т имеет место сравнение t.C'nl = 1 mod т, если оно было взаимно просто с числом ш. Для дешифрования найдем такое число dz, что имеет место сравнение d\dz = 1 mod ф(т). Значит, didz = 1 + ф(т)Д;Д € Z. Дешифровка будет осуществлятся посредством возведения числа-шифра в степень dz Если ис- ходное сообщение а было взаимно просто с т, то шифр, возведенный в сте- пень dz имеет вид: adld2 = а a^m^N = a mod т. Значит, при приведении по модулю m восстанавливается исходное сообщение. Осталось выяснить, что происходит, если исходное сообщение а не было взаимно просто с чи- слом т. Это может быть, когда а делится ровно на одно из простых чисел р или q. Пусть оно делится на р. Докажем, что число adldz и по модулю р и по модулю q сравнимо с исходным сообщением а. Отсюда будет следовать, что это число сравнимо с а по модулю pq, то есть исходное сообщение вос- станавливается и в этом случае. Что касается модуля р, то ситуация здесь тривиальная: adldz = 0 = a mod р. По модулю q можно воспользоваться ма- лой теоремой Ферма: adld2 = а = a mod q. Так что, секретной лазейкой, позволяющей быстро дешифровать сообщение является число dz-
6.4. СРАВНЕНИЯ ПО СОСТАВНОМУ МОДУЛЮ 109 Его легко найти, если известно число ф(т') или известно разложение числа m в произведение простых. Нужно заметить, что эта система принципиально связана с использова- нием компьютеров для вычислений. Не имеет смысла выбирать небольшие числа т, так как в этом случае шифроваться будут фрагменты, состоящие из нескольких символов. По сути это будет мало чем отличаться от одноал- фавитных систем. Эти системы ’’взламываются” при помощи баз данных, которые содержат информацию о частотах появления букв в текстах на кон- кретных языках. Однако давно составлены базы данных о частоте появле- ния небольших групп букв в текстах на всех известных языках. Так что, для содержательных примеров использования системы RSA нужно пользо- ваться компьютером, калькулятором здесь не обойдешься. Это приводит к новому взгляду на сложность различных математических процедур и задач. Например, возведение чисел в большие степени с приведением их по модулю ( процедура, необходимая для шифрования и дешифрования в системе RSA ) — несложная стандартная процедура, с которой легко справляется ком- пьютер. Однако разложить произвольное стозначное число на простые мно- жители быстро не может ни один компьютер. Это — сложное задание. До сих пор не найдено удобных и быстрых алгоритмов для разложения боль- ших чисел на множители. На этом основана система RSA — чрезвычайно сложно найти секретную лазейку, потому что для этого нужно разложить на множители огромное число ш. Система RSA нуждается в генерировании больших простых чисел. Необ- ходимы методы для определения простоты числа. Теорема Вильсона вроде бы доставляет такой метод. Для определения простоты числа п нужно про- верить, делится ли число (п — 1)! на п. Если не делится, то число п — про- стое. Однако, этот метод хуже даже стандартного ’’решета Эратосфена”. Малая теорема Ферма дает нам тест для проверки числа п на простоту. Вы- берем случайным образом несколько чисел 0 < а < п , вычислим степени а”-1 по модулю п. Если где-нибудь не получилось единицы , то число п — составное. Другое дело, что получение единицы для всех возможных а еще не гарантирует простоту числа п. Встречаются составные числа п, для ко- торых выполняется малая теорема Ферма для всех чисел, взаимно простых с п . Такие числа называются числами Кармайкла. Самое маленькое число Кармайкла — 561=3 • 11 • 17. Числами Кармайкла являются также числа 1729, 2465, 172081, 294409, 56052361. До сих пор неизвестно, конечно или бесконечно множество чисел Кармайкла. Этот простейший тест на про- стоту на практике немного видоизменяют, используя открытый Гауссом Квадратичный закон взаимности. Так возникли тесты Соловэя-Штрассена
по ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ и Миллера-Рабина проверки на простоту. 6.5 Метод бесконечного спуска Сначала решим классическую проблему элементарной теории чисел — перечислим пифагоровы тройки, то есть такие натуральные тройки (x,y,z), что х2 + у2 = z2. Заметим, что взаимная простота любых двух чисел из тройки ведет ко взаимной простоте любой пары из тройки, так как общий делитель любых двух чисел из тройки будет делителем третьего числа. Достаточно найти все попарно взаимно простые пифагоровы тройки, все остальные пифагоровы тройки будут получаться из них умножением на множители. Пусть (x,y,z) — пифагорова тройка с попарно взаимно простыми компо- нентами. Заметим, что ровно одна из них четна. Это может быть х или у, но не z. В самом деле, если z — четное ,а х и у — нечетные, то правая часть равенства х2 + у2 = z2 делится на 4, а левая имеет вид 8п + 2. Это вытекает из того, что всякое нечетное число в квадрате имеет вид 8п + 1 (нечетное число имеет вид 4fe + 1 или Ак — 1, в квадрате получается 8(2fe2 ± к) + 1). Пусть у — четное,а х и z — нечетные. Тогда у2 = (z — x)(z + х). Обе скобки в правой части представляют собой четные числа (как , соответ- ственно, разность и сумма нечетных чисел). Положим : z—x = 2р, z+x = 2g. Отсюда легко вытекает, что z = p + q, х = q — p. Если бы числа р и q имели бы нетривиальный общий множитель , то, как следует из последних ра- венств, этот же общий множитель имели бы и числа х и z. Поэтому, числа р и q взаимно просты. Кроме того, они имеют разную четность (в против- ном случае, числа х и z были бы четными). Заметим, что имеет место равенство : (у/2)2 = pq. Так что, произведение двух взаимно простых чисел равно квадрату натурального числа. Из этого следует, что каждое из этих чисел является квадратом. В самом деле, если разложить квадрат в произведение четных степеней простых множителей, то каждая из этих степеней целиком войдет в один из двух взаимнопростых множителей (эти множители разделят четные степени между собой). Пусть р = п2, q = т2. Тогда пифагорова тройка имеет вид : 9 9 х = т — п < у = 2тп 2 , 2 z = т + п , где шип — взаимно простые натуральные числа разной четности. Легко
6.5. МЕТОД БЕСКОНЕЧНОГО СПУСКА 111 проверить, что полученная тройка действительно является пифагоровой. Метод бесконечного спуска разработал Пьер Ферма для доказательства несуществования целочисленных решений уравнений. Он основывается на следующем простом наблюдении: Не существует монотонно убывающей по- следовательности натуральных чисел. Единственное полное доказательство, оставшееся от Ферма, проведено методом бесконечного спуска. Приведем его здесь в качестве иллюстрации метода. Теорема. Уравнение ж4 + у4 = z2 не имеет натуральных решений. Доказательство. Пусть (то, уо, го) — натуральное решение. Можно считать, что компоненты решения попарно взаимно простые. Тогда, (х$, yg,zo) — пифагорова тройка с попарно взаимно простыми компонентами. Значит, х2 = т2 — п2 < у2 = 2тп z = т2 + п2, где шип — взаимно простые числа разной четности. Заметим, что п — четное,а m — нечетное. В противном случае, х2 и п2 имеют вид 8п + 1 как квадраты нечетных чисел, а т2 делится на 4. В таком случае, левая часть первого равенства имеет вид 8п + 1, а правая часть имеет вид 4/г — 1. Пусть п = 2г,где г взаимно просто с ш. Подставим это соотношение во второе равенство : (у/2)2 = гт (заметим, что у — четное). Отсюда 9 9 следует, что гит — квадраты натуральных чисел: г = и и т = v , где и и v взаимно просты. Из первого равенства системы следует, что (х,п,ш) — пифагорова тройка с попарно взаимнопростыми компонентами. Поэтому, х = а2 — Ь2 < п = 2аЬ т = а2 + Ь2, где а и b — взаимно простые числа разной четности. Из второго равенства полученной системы следует, что и2 = г = аЪ. Значит, числа а и b являются квадратами : а = s2 и b = t2, где s и t — взаимно простые. Поэтому третье равенство последней системы можно переписать в виде: v2 = т = s4 + i4. Итак,(е,1,у) — натуральное решение исходного уравнения со взаимно простыми компонентами. При этом, zo > v. Действительно, zo = т2 +п2 > т2 = v4. Нам удалось по одному натуральному решению исходного уравнения по- строить другое , которое имеет меньшую третью компоненту. Очевидно,
112 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ что этот процесс можно повторить с новым решением, и, вообще, итери- ровать неограниченное число раз. При этом возникнет бесконечная после- довательность решений с монотонно убывающей третьей компонентой. По- следовательность третьих компонент будет монотонно убывающей последо- вательностью натуральных чисел. Такая последовательность невозможна. □ У пражнения 1. Найти все целочисленные решения уравнений: а)х2 + 2у2 = г2; Ь)х2 + у2 = 2г2. 2. Доказать, что уравнение х4 — у4 = z2 не имеет натуральных решений. 3. Найти все целочисленные решения уравнений: а)1 + х + х2 + х3 = у2; Ь)х2 + 2 = у3. 6.6 Последняя теорема Ферма Попытки построить подобно пифагоровым тройкам нетривиальные це- лочисленные решения уравнения хп + уп = zn приводят к неудаче. Для п=4 это вытекает из теоремы предидущей секции и было доказано самим Пье- ром Ферма. Если мы докажем этот результат для всех нечетных простых показателей, то будет доказана Последняя теорема Ферма : Не существует натуральных решений уравнения хп + уп = zn при п > 2. Она была сформу- лирована в 1640 году и полностью доказана в 1995 году. Этапы ее решения за три с половиной века были заметными вехами развития теории чисел. Первый этап соответствует случаю п=4. Как мы видели, он решается эле- ментарными методами. Для нечетных простых показателей привлекаются неэлементарные понятия. Следующий этап связан с именем Леонарда Эйлера, который в 1763 году доказал случай п=3. Развитие предложенных им методов позволило дока- зать эту теорему для простых чисел первого десятка. Особенно технически сложный случай п=7 был доказан Ламэ. Приведем доказательство Эйлера. Доказательство. Пусть (то, уо, zq) — решение уравнения х3 + у3 = z3 с попарно взаимно простыми компонентами. Откажемся от предположения о натуральности решения.Будем рассматривать ненулевое целочисленное решение. Можно считать, что xq — четное, a Zij.yij — нечетные (иначе (-^о)3+Уо = (-жо)3)- Пусть го-?/о = 2р, z0 + y0 = 2q, тогда z0 = p + q, уо =
6.6. ПОСЛЕДНЯЯ ТЕОРЕМА ФЕРМА 113 q — р, где р и q — взаимно простые числа разной четности. Подставим : х1 = 4-у1 = (р + q)3 ~(q~ р)3 = 2р(р2 + 3g2). Заметим, что числоp2+3q2 нечетное. Поэтому, НОД(2р,р2+3</2)=НОД(р,р2+ Зд2)=НОД(р, Зд2)=НОД(р, 3). Рассмотрим два случая: р делится на 3 или р не делится на 3. 1) случай: р не делится на 3, НОД(2р,р2 + 3g2) = 1. Тогда числа 2р и р2 + 3g2 являются кубами. Далее Эйлер делает смелый шаг — разлагает второе число на комлексные множители р2 + 3g2 = (р + \/—3g) (р — д/—3g) и рассматривает арифметику чисел вида а + а/—36, где а и b целые. В этой арифметике он заключает, что каждый из множителей р ± \/—3g является кубом числа вида а + а/—36: р + a/—3g = (а + \/—З6)3 = а3 — 9а62 + \/—3(3«26 — З63). Значит, 2р = 2(а3 — 9а62) = 2а(а — ЗЬ)(а + ЗЬ). Заметим, что а и b — взаимно простые числа разной четности, и а не делится на 3. Поэтому, НОД(2а,а- ЗЬ)=НОД(2а,а+ЗЬ)=НОД(а-ЗЬ,а+ЗЬ)=1. Значит, каждый из этих множи- телей является кубом: 2а = и3, а — ЗЬ = v3, а + ЗЬ = w3. Эти числа связаны между собой: v3 + w3 = и3. Мы получили еще одно решение исходного уравнения с попарно взаимно простыми компонентами. При этом, число и — четное, a v и w — нечетные. Отметим, что |ж§| > |2р| > |2а| = |м3|. Значит, |жо| > |м|. Итак, по решению с попарно взаимно простыми ком- понентами нам удалось построить еще одно такое решение с меньшей по модулю четной компонентой. Этот процесс можно неограниченно итериро- вать. В результате получится монотонно убывающая последовательность натуральных чисел — модулей четных компонент решений. Противоречие. 2) случай: р делится на 3, НОД(2р,р2 + 3g2) = 3. Пусть р=3г, тогда х3 = 18r(g2 + Зг2), где НОД(18г, д2 + Зг2) = 1. Поэтому, числа 18г и д2 + Зг2 являются кубами. Далее точно так же, как в первом случае, получаем формулу: д + а/~Зг = а3 — 9ab2 + а/~3(За2Ь — ЗЬ3). Из нее следует, что г = 36(а - Ь) (а + Ь), где НОД(36, а - 6)=НОД(36, а - 6)=НОД(а - b, а + b) = 1. В силу того, что 18г — куб, число г делится на 3, и число 18г/27=2г/3 является кубом. При этом, 2г/3 = 2Ь(а — b)(a+b). Значит, числа 2Ь, а — Ъ, а+Ь являются кубами: 2Ь = и3, a — b = v3, a + b = w3. Эти числа связаны между собой: и3 + v3 = w3. При этом выполняется формула: |жо| > |м|. Как и в первом случае, нам удалось осуществить бесконечный спуск. □ Отметим, что в этом доказательстве Эйлер допустил существенную не- точность. Он перенес на числа вида а + а/—ЗЬ (а и b — целые) правило для
114 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ кубов целых чисел : Если произведение взаимно простых множителей равно кубу, то каждый из этих множителей — куб. Это правило существенно опирается на однозначность разложения на простые множители. Однако во введенной Эйлером числовой системе теорема об однозначном разложе- нии на простые неверна. Достаточно рассмотреть пример: 4 = 2x2 = (1 — \/—3)(1 + -\/—3). Этот пример дает два принципиально различных раз- ложения числа 4 на простые множители во введенной Эйлером числовой системе. Однако положение можно спасти, несколько расширив числовую систему. Нужно добавить числа вида: а + 1/2 + д/=3(Ь + 1/2), где а и b — целые числа. В новой числовой системе Z(\/—3) обратимых элементов, то есть аналогов знаков ±1, шесть штук: ±1,±1/2± 3/2. Приведенный пример дает несущественно различающиеся разложения на простые мно- жители — простые элементы в двух этих разложениях получаются друг из друга умножением на числа 1/2 ± 3/2, являющиеся аналогами зна- ков. Можно ввести для любого целого числа d, не являющегося квадратом, аналогичную числовую систему Для чисел вида d = 4п + 1 эта чи- словая система будет содержать аналогичные добавленным выше элементы ” с половинами”. Изучение обратимых элементов этих числовых систем для натуральных d приводит к уравнениям Пелля. Заметим, что разделение на два случая в доказательстве Эйлера экви- валентно разделению на случай, когда одна из компонент решения делится на 3, и случай, когда ни одна из компонент решения не делится на 3. Во- обще, для произвольного простого показателя принято отдельно доказывать теорему для попарно взаимно простых решений, которые ни в одной компо- ненте не делятся на показатель, и для попарно взаимно простых решений, у которых ровно одна компонента делится на показатель. Так выделяют, соответственно, первый и второй случаи Последней теоремы Ферма. Теорема Софи Жермен. Пусть простое число р таково, что число 2р+1 — простое, тогда для показателя р выполняется первый случай По- следней теоремы Ферма. Докажем эту теорему в частном случае р=5. Общий случай доказыва- ется совершенно аналогично. Доказательство. Пусть (x,y,z) - нетривиальное целочисленное решение с попарно взаимно простыми компонентами, которые не делятся на 5. Имеет место разложение: х5 + у5 = (х + у)(ж4 — х3у + х2у2 — ху3 + у4). Пусть простое число q делит наибольший общий делитель этих двух скобок. Тот факт, что q делит первую скобку означает, что х = —у mod q. Поэтому, вторая скобка сравнима с числом 5у4 по модулю q. С другой стороны, она делится на q. Однако у не может делиться на q, так как в этом случае
6.6. ПОСЛЕДНЯЯ ТЕОРЕМА ФЕРМА 115 НОД(ж, у) делится на q ( сумма х+у делится на q, следовательно, х также должен делиться на q ). Поэтому, q=5. Этот случай исключается в силу того, что произведение скобок равно z5, a z не делится на 5. Поэтому, каждая из скобок равна пятой степени натурального числа. В равенстве х5 + у5 = z5 переменные х и у можно менять с переменной z вместе с изменением знака. Так что, еще две пары скобок равны пятым степеням : х + у = а5, ж4 — х3у + х2у2 — ху3 + у4 = a5, z = аа. z - у = ь5,у4 + у3z + y2z2 +yz3 + г4 = /35,х = Ь/3. z — х = с5, г4 + z3x + z2x2 + zx3 + х4 = 75,у = 07. Рассмотрим исходное уравнение по модулю 11. Из малой теоремы Ферма следует, что любое число в пятой степени может принимать только три значения по модулю 11 : -1, 0, 1. В самом деле, если г не делится на 11, то г10 — 1 = (г5 — 1)(г5 + 1) = 0 mod 11. Значит, г5 = ±1 mod 11. Исходное урав- нение может удовлетворяться, лишь когда одна одна из переменных делится на 11. Пусть это будет переменная z (выбор переменной несущественнен). Сложим первые равенства из трех приведенных выше строчек : 2г = а5 + Ь5 + с5. Значит, сумма пятых степеней из левой части делится на 11. Отсюда вытекает, что одна из этих степеней делится на 11. Это не может быть Ь5, так как, в этом случае, z-y делится на 11, и, поэтому, у делится на 11. Аналогично, с5 не делится на 11. Итак, а делится на 11. Первое равенство из первой строчки приводит к сравнению: х = —у mod 11. Подставляя его во второе равенство из той же строчки, получим сравнение : 5ж4 = a5 mod 11. Применяя сравнение z = 0 mod 11 ко второму равенству третьей строчки, получаем : х4 = 7s mod 11. Значит, 67s = a5 mod 11. Это сравнение воз- можно только при условии : а = 7 = 0 mod 11. Отсюда и из последнего равенства третьей строчки следует, что у делится на 11. Противоречие со взаимной простотой у и z. □ Были получены значительные усиления теоремы Софи Жермен. Од- нако главная линия исследования Последней теоремы Ферма в прошлом веке была заложена Куммером, который использовал числовые системы, связан- ные с разложением двучлена zn — хп на линейные множители с комплекс- ными коэффициентами. Сам Куммер доказал Последнюю теорему Ферма для всех простых показателей в пределах сотни. Развитие его методов по- зволило доказать эту теорему для всех простых показателей в пределах ста тысяч.
116 ГЛАВА 6. СРАВНЕНИЯ И ДИОФАНТОВЫ УРАВНЕНИЯ Однако решение эта проблема получила, благодаря совсем иному под- ходу — исследованию арифметических свойств кубических кривых. Равен- ству ап + Ьп = сп поставили в соответствие кубическую кривую у2 = х(х — ап)(х — сп). Математики Фрей и Рибет доказали, что для доказатель- ства несуществования этого равенства нужно доказать известную гипотезу Таниямы о свойствах подобных кривых. В 1995 году Уайлс в сотрудниче- стве с Тэйлором в журнале ’’Annals of mathematics” опубликовал доказа- тельство этой гипотезы и полностью доказал Последнюю теорему Ферма.
Глава 7 Квадратичный закон взаимности 7.1 Решение квадратных сравнений Как мы выяснили решение сравнений по произвольному составному мо- дулю сводится к их решению по модулю вида рк, где р — простое чи- сло. Первым шагом для их решения будет нахождение всех решений по модулю р. В этой книге мы на этом и остановимся. Только лишь разбе- рем один пример решения квадратного уравнения х2 = 7 для множества Z/3fc. Этот пример показывает, как действовать в общем случае. Сначала найдем решения по модулю три. Это два решения Х\ = 1 + 3/г; /г € Z, Х2 = 2 + 3/г; п € Z. Теперь, станем искать решения по модулю девять в виде: Xi = 1 + Зм + 9/г; п € Z, х% = 2 + Зм + 9/г; п € Z, где 0 < и, v < 3. (1 + Зм + 9/г)2 = 7 mod 9, 1 + би = 7 mod 9, и = 1. (2 + Sv + 9/г)2 = 7 mod 9, 4 + 12м = 7 mod 9, v = 1. Затем, станем искать решение по модулю 27: жх = 1 + 3 + 9м + 27/г, х% = 2 + 3-1- 27/г. (4 + 9м + 27/г)2 = 7 mod 27, 16 + 72м = 7 mod 27, м = 1. (5 + 9м + 27/г)2 = 7 mod 27, 25 + 90м = 7 mod 27, м = 1. 117
118 ГЛАВА 7. КВАДРАТИЧНЫЙ ЗАКОН ВЗАИМНОСТИ Затем, станем искать решение по модулю 81: х± = 1 + 3+9+27м+81/г, Х2 = 2 + 3 + 9 + 27и + 81/г. (13 + 27м + 81/г)2 = 7 mod 81, 169 + 54м = 7 mod 81, м = 0 (14 + 27м + 81/г)2 = 7 mod 81, 196 + 27м = 7 mod 81, м = 2. Очевидно, что этот процесс можно продолжать неограниченно долго. По- лучается запись в троичной системе счисления Х\ = 1110..., Х2 = 2112 .... Пусть мы получили решения по модулю рк : х± = а + ркп, Х2 = Ь + ркп. Найдем решения по модулюpk+1 : xi = а+ирк+рк+1п, Х2 = b+vpk +рк+1п. (а + ирк + pfc+1n)2 = 7 mod pk+1, а2 + 2аирк = 7 mod pk+1. Однако, имеет место равенство: а2 = 7 + spk. Значит, нужно решить срав- нение: Заир11 = spk mod pk+l. Оно эквивалентно сравнению: 2ам = s mod р. Аналогично ищется второе решение. Подобным образом подбираются реше- ния в общем случае. В связи с приведенным примером возникает интересная аналогия. По- строение решений по модулям вида 3fc чем-то напоминало нахождение по- следовательных приближений к корню из семи. Хотелось бы придать смысл бесконечной последовательности 1110.... Это действительно можно сделать — таким образом получаются так называемые р-адические числа. Их изу- чение выходит за рамки нашего курса. Как мы уже отмечали, свойства многочленов с коэффициентами из мно- жества вычетов по простому модулю р во многом повторяют свойства мно- гочленов. На этот случай можно перенести методы решения уравнений. Рас- смотрим квадратное уравнение х2+ах+Ь = 0. Старший коэффициент можно считать равным единице (в противном случае, умножим все уравнение на обратный к старшему коэффициенту вычет). Ничего не стоит выделить в этом уравнении полный квадрат — вычет, обратный к 2, равен (р + 1)/2 : _______ ______________2 х2 + 2(р + 1)/2ах + Ь = (ж + + • а)2 + Ь — + -а =0. Уравнение свелось к следующему: z2 = с. Вероятно, подобное перенесение методов с обычных уравнений на уравнения с коэффициентами в Z/p воз- можно и в других случаях. Нам необходимо исследовать уравнения вида zn = с, для того, чтобы понять, что значит ’’корень n-й степени” в мно- жестве вычетов Z/p. Мы сразу будем искать ненулевые решения, так как
7.1. РЕШЕНИЕ КВАДРАТНЫХ СРАВНЕНИЙ 119 нулевое решение есть лишь у уравнения zn = 0 (при этом, оно будет един- ственным решением). Теорема. Уравнение zn = с либо имеет ровно НОД(п,р — 1) решений, либо не имеет решений вовсе. Если НОД(п,р — 1) = 1, то уравнение всегда имеет единственное решение. Доказательство. Воспользуемся существованием примитивного вычета а по модулю р. Пусть z = as. Уравнение переписывается в виде: asn = с. Пусть с = аг. Тогда уравнение сведется к линейному сравнению для степе- ней: sn = t modp — 1. Здесь s — переменная, t и n — постоянные. Если НС)Д(п,р — 1) = d, то все будет определятся следующим условием. Де- лится ли число t на d, или — нет ? Если t не делится на d, то равенство sn = t + (р — T)N,n € Z, невозможно, и решений исходное уравнение не имеет. Если t делится на d, то это равенство можно сократить на d. Полу- чится равенство sn' = t' + При этом, НОД(/г', 2^) = 1. Сравнение sn' = t' mod 2д1 имеет единственное решение — класс вычетов по модулю 2д1. В множестве целых чисел этот класс распадется на d классов вычетов по модулю р — 1. Получается d решений у исходного уравнения. Если d = 1, то сравнение имеет единственное решение по модулю р — 1. □ Мы получили, что возведение всех вычетов в взаимно простую с р—1 сте- пень представляет собой попросту перестановку вычетов. Этот факт можно было получить непосредственно. Достаточно возвести в такую степень при- митивный вычет. В результате получится примитивный вычет. Среди на- туральных чисел, находящихся в пределах от 1 до р — 1, таких степеней ф(р — 1) штук. Они дадут все возможные примитивные вычеты. Соответ- ствие примитивного вычета а и вновь полученного примитивного вычета b задает перестановку всех вычетов. При этом, нулевой вычет переходит в себя, а вычет as переходит в вычет b . Исследуем решение квадратного уравнения х2 = с. Если оно имеет ре- шения, то вычет с называется квадратичным. В противном случае, с назы- вают неквадратичным. Для того, чтобы выяснить квадратичность вычета с, нужно представить его в виде а* и, следуя доказательству теоремы, про- верить четность числа t. Если t — четное, то уравнение имеет решения. В противном случае, уравнение решений не имеет. Видимо должны суще- ствовать более простые методы для определения квадратичности вычета — слишком много дополнительной информации используется при представле- нии вычета в виде степени примитивного вычета. Однако это представление полезно для легкого доказательства следующих теоретических фактов: 1) произведение двух квадратичных вычетов — квадратичный вычет;
120 ГЛАВА 7. КВАДРАТИЧНЫЙ ЗАКОН ВЗАИМНОСТИ произведение двух неквадратичных вычетов — квадратичный вычет; произведение квадратичного и неквадратичного вычетов — неквадратичный вычет. 2) ненулевых квадратичных вычетов столько же, сколько неквадратичных. Интересно было бы узнать, каким образом квадратичные вычеты лежат среди неквадратичных. В следующей секции мы получим важный резуль- тат по этой теме — Квадратичный закон взаимности. Однако эта тема все еще является предметом серьезных научных исследований. Теорема (Критерий Эйлера). Если ненулевой вычет с — квадра- тичный, то имеет место сравнение: с(р-1)/2 = 1 mod р. В противном случае, имеет место сравнение: с^р-1^2 = —1 modp. Доказательство. Уравнение х^р-1й2 = 1 имеет не более чем (р — 1)/2 решений, так как этому числу равна степень многочлена х(р-1)/2 — 1. Од- нако любой квадратичный вычет а2и является решением этого уравнения (согласно Малой теореме Ферма = 1). Ненулевых квадратичных вы- четов ровно (р — 1)/2 штук. Значит, неквадратичные вычеты в степени (р — 1)/2 не равны единичному вычету. Имеет место равенство: (с(р-1)/2 _ 1)(с(р-1)/2 + 1) = cP-1 -1 = 0. Если произведение двух вычетов равно нулевому вычету, то хотя бы один из них — нулевой. Однако для неквадратичного с первая скобка — ненулевой вычет. Значит, вторая скобка — нулевой вычет. Имеет место равенство : 5(р-1)/2 _ ГТ. □ Определим символ Лежандра (^) произвольного класса вычетов с по мо- дулю простого нечетного числа р по следующей формуле: с \ - = < JPJ 0, если р | с; 1, если р | с , -1, если р | с , вычет с — квадратичный; если вычет с — неквадратичный . Согласно критерию Эйлера, символ Лежандра можно представить в виде: (^) = с(р-1)/2 mod р. Отсюда легко следует формула: (у) = (^)(^)- Эта формула эквивалентна сформулированному выше утверждению 1) о про- изведении вычетов. Однако формула для символа Лежандра дает и менее очевидные утверждения. Например, следующее: Если простое число р имеет вид 4fe + 1, то уравнение х2 + 1 = 0 имеет два решения; если простое чи- сло р имеет вид 4fe — 1, то это уравнение не имеет решений. В самом деле,
7.1. РЕШЕНИЕ КВАДРАТНЫХ СРАВНЕНИЙ 121 (-Д) = (—1)(р 1^2. Подставляя сюда формулу для числа р, получим дока- зываемое утверждение. В заключение секции докажем утверждение о простых числах при по- мощи полученных результатов. Нечетные простые числа делятся на два указанных выше класса. Докажем, что в каждом из этих классов лежит бесконечно много простых чисел. Доказательство в обоих случаях от про- тивного. Пусть все простые вида 4fe — 1 это — Р1,Р2, ,Рп- Тогда, число N = 4piP2 • • -Рп ~ 1 не может быть простым, ибо превосходит все указанные про- стые числа, имея тот же вид. Число N — нечетное, кроме того, оно не де- лится ни на одно из указанных выше простых чисел. Значит, это составное число раскладывается в произведение простых чисел вида 4к + 1. Однако это невозможно, так как произведение чисел вида 4к + 1 само имеет такой вид.Противоречие. Докажем, что простых чисел вида 4к + 1 бесконечно много. Пусть все такие числа — Р1,Р2, • • • ,Рп- Тогда число N = 4р2р| .. .р„ + 1 не может быть простым, ибо превосходит все указанные числа, имея тот же вид. Число N — нечетное, кроме того, оно не делится ни на одно из указан- ных выше простых чисел. Значит, это составное число раскладывается в произведение простых чисел вида 4к — 1. Пусть р — одно из них. То- гда, сравнение х2 + 1 = 0 modp имеет решения х = ±2pip2 • • -Рп, так как N = 0 mod р. Противоречие с полученным выше равенством = — 1 для простых р = -1k — 1. У пражнения 1. Выписать явные формулы для решений уравнения х2 = — 1 для множества вычетов Z /р, где р = 4к + 1 — простое число. Указание: Воспользоваться теоремой Вильсона. 2. Доказать, что для р = 4fc — 1 решениями уравнения х2 = а в множестве Z/p являются вычеты ±ак, если известно, что оно имеет решения. 3. Доказать, что в натуральном ряду находятся сколь угодно большие участки, состоящие из последовательных составных чисел. Указание: рассмотреть участок вида п! + 2, п! + 3,... , п! + п. 4. Пусть р(п) — n-е по порядку простое число. Доказать, что 2п — 1 < р(п) < 22 для п > 1. Указание: доказать неравенство р(п + 1) < р(1)р(2).. .р(п) + 1.
122 ГЛАВА 7. КВАДРАТИЧНЫЙ ЗАКОН ВЗАИМНОСТИ 7.2 Квадратичный закон взаимности Пусть натуральное число п разложено в произведение степеней простых делителей п = р^р^2 Р^к Имеет место формула: 'Pk\ Д>) Чк Имеют значение лишь нечетные степени простых чисел, так как в четных символ Лежандра равен единице. Задача, таким образом, сводится к вычи- слению символов Лежандра от простых чисел, меньших р. Теорема(Квадратичный закон взаимности). Для любого простого нечетного числа q имеет место формула: л) \ч) Доказательство. Найдем представители классов вычетов по модулю р 7^ q для чисел вида qt,l < t < (р — 1)/2 в следующей системе представи- телей: {—(р — 1)/2,... , —1,0,1,2,... , (р — 1)/2}. Другими словами, запишем представителя класса вычета числа qt в виде qt = etrt mod р, где б; = ±1,1 < п < (р — 1)/2. Заметим, что все числа и получатся разными (из этого следует, что это будут все натуральные числа от 1 до (р — 1)/2). В самом деле, пусть и = vs. Из этого следует, что число qt ± qs = q(t ± s) делится на р. Значит, число t ± s делится на р, что может быть только при условии равенства этого числа нулю (так как |i ± s| < р). Перемножив всех этих представителей, получим равенство вычетов: 1)/2 . = eie2 •••е(р-1)/2ПГ2 ...Г(р_1)/2. Однако, согласно критерию Эйлера q(p-1)/2 = (£) modp. Кроме того, р-1. rir2...r(p_1)/2 = — Значит, для символа Лежандра получилась формула: — eie2 ... €(р_1)/2.
7.2. КВАДРАТИЧНЫЙ ЗАКОН ВЗАИМНОСТИ 123 Рассмотрим следующую нечетную функцию: f(z') = 2isin2Trz, где i — мни- мая единица. Она периодична с наименьшим положительным периодом рав- ным единице. Символ Лежандра можно выразить с помощью этой функции. Лемма 1. Для нечетных простых чисел р и q имеет место формула: м = w ,У яр ' Доказательство. Из равенства qt = €trt + flip следует, что /(у) = Перемножив равенства по всем t, получим: (р-1)/2 (р-1)/2 П /(т-) = е1е2---е(р-1)/2 П t=l 1 t=l 1 Лемма 2. Для нечетного натурального числа п имеет место формула: f(n-Z) -i-r s s ,, x = Il f(z- ~)f(z+ -). /(*) АД n n Доказательство. Обозначим:^ = cos27r/Q-Hsin27r/g. Имеет место фор- мула: п—1 xn-yn=l[(e-sx-esy). s=0 Она вытекает из равенства: ип - 1 = Ц (e~su - es) = е-(1+2+...+п-1) JJ (м - e2*). s=0 s=0 Для доказательства достаточно положить и = х/у и умножить обе части этого равенства на уп. Само это равенство вытекает из того, что множество корней n-й степени из единицы можно представить в виде: \/1 = {e2s|s = 0,1,2,... , /г—1}, так как НОД(2,п)=1. Кроме того, e-(1+2+...+n-i) _ 12” = 1. Для окончания доказательства подставим в полученнную формулу: х = cos 2ttz + г sin 2тгг, у = cos 2ttz — г sin 2тгг. Левая часть имеет вид: хп — уп = f(n-z). Правая часть имеет вид: П"=о f(z ~ «)• Для ^2^ < s < /г — 1 можно
124 ГЛАВА 7. КВАДРАТИЧНЫЙ ЗАКОН ВЗАИМНОСТИ записать равенство: f(z — ^) = f(z + — 1) = f(z + Поэтому, имеет место равенство: (п-1)/2 f(n-z) = f(z) JJ f(z- -)f(z+ -).□ хх n n s=l Окончим доказательство Квадратичного закона взаимности следующим образом. Для символа Лежандра имеет формула: W й яр Имеется ровно множителей /(| — |). Если такой множитель по- менять на множитель /(| — |), то просто поменяется знак. Если это про- делать со всеми такими множителями, то все выражение умножится на (—1)г"2 у,2 . При этом числа р и q поменяются ролями, так как во вто- ром множителе слагаемые можно менять местами. В результате получится выражение, которое стоит в правой части доказываемой формулы. □ В качестве примера рассмотрим решение уравнения z2 + 3 = 0 в множе- стве классов вычетов по простому модулю р > 3. Для символа Лежандра имеют место равенства: = (_i)(P-i)/2(_i)^-^m = (р \0 / \0 Все превосходящие 3 простые числа можно разбить на два класса: имеющие вид бк + 1 и имеющие вид бк — 1. Решение исходной задачи позволяет дока- зать, что в каждом классе бесконечно много простых чисел. Подставив р в символ Лежандра, получим: = (6fc±x) = = ±1, где везде выбирается один и тот же знак. В самом деле, в Z/3 вычет 1 — квадратичный, а вычет — 1 — неквадратичный. Значит, уравнение z2 + 3 = 0 имеет два решения для р = 6fc +1, не имеет решений для р = бк— 1. Доказательство бесконечно- сти множества простых чисел вида бк — 1 дословно повторяет аналогичное доказательство для чисел вида 4fe — 1 из предидушей секции. Докажем от противного бесконечность множества простых чисел вида бк + 1. Пусть Р1,Р2, • • • ,рп — все такие числа. Тогда число N = APiPz • • -Рп + 3 не может быть простым, ибо превосходит все указанные числа и имеет остаток 1 при делении на 6. Оно не делится ни на 2, ни на 3, ни на одно из указанных выше простых чисел. Значит, оно разлагается в произведение простых вида бк— 1.
7.2. КВАДРАТИЧНЫЙ ЗАКОН ВЗАИМНОСТИ 125 Пусть простое р — один из этих множителей. Тогда N = 0 mod р. Значит, уравнение z1 + 3 = 0 имеет решения z = ±2pip2 -рп bh/p. Противоречие с доказанным свойством простого р = бк — 1. Итак, всякий вычет а по модулю 4 или 6 содержит бесконечно много простых чисел, если а взаимно просто с модулем. Этот факт допускает обобщение для произвольного модуля. Теорема Дирихле: Всякий класс вы- четов а содержит бесконечно много простых чисел, если а взаимно просто с модулем. Не так давно было найдено элементарное доказательство этой за- мечательной теоремы. Оно очень длинное, поэтому мы не станем его здесь приводить. В курсах теории чисел оно доказывается при помощи серьезной аналитической техники. Мы еще не вычислили символ Лежандра (-). Для этого приведем пару общих формул для символа Лежандра (имеющих лишь теоретическое зна- чение) и заодно еще раз докажем Квадратичный закон взаимности. Была получена следующая формула для символа Лежандра (^) = ехег • • • е(Р-1)/2> где at = etrt,l < t < (р — 1)/2 (ег = ±1,1 < П < (р = 1)/2). Несложно получить явную формулу для знака: et = (—l)L2loi/p}J. в самом деле, знак ’’плюс” получается, когда 0 < {at/p} < 1/2; знак ’’минус” получается, ко- гда 1/2 < {at/p} < 1. Полученную формулу можно слегка подправить. Для этого умножим обе части формулы at/p = \at/p\ ± {at/p} на два и возьмем от полученного целую часть: \2at/p\ = \2\at/p\J ± [2{ai/p}J = 2[at/p\ ± [2{ai/p}J. Возведя минус единицу в эту степень, получим формулу: (_l)L2oi/pJ = (-1) L2Wp}J =€i. Значит, для символа Лежандра имеется формула: (p-1)/2L2ai/pJ Из нее можно получить формулу для символа Лежандра от двойки. Пусть а — нечетное число, тогда число а + р — четное. Имеют место формулы: 2а\ _ /2(а + р)\ _ /4\ /°2Р\ _ /°2РА _ (_1a^=71)/2L(»+p)*/pJ = . РJ \ Р J \р) \ Р J \ Р J (_l)E?=71,/2(La</pJ+<) = (_i)2±71,/2АСр] . (_i)(p2-i)/8.
126 ГЛАВА 7. КВАДРАТИЧНЫЙ ЗАКОН ВЗАИМНОСТИ В самом деле, вычет 4 — квадратический, сумма арифметической прогрес- сии 1 + 2 + ... + (р — 1)/2 равна + 1) • Теперь подставим в полученную формулу а = 1: :S=i1)/2LVpJ . (_1)(р2-1)/8 = (_!)(р2-1)/8 В самом деле, [i/pj = 0. Получив формулу для символа Лежандра от двойки, можно сократить обе части этой формулы в формуле для символа Лежандра от 2а: (^) = (—1)^=1 U \-at/p\_ Последняя формула верна лишь для нечетных а. С ее помощью легко доказать Квадратичный закон взаим- ности. Для этого достаточно доказать формулу: (Р-1)/2 (9-1)/2 ~2—2”= 52 l«VpJ+ 52 lps/qj. t=l s=l При возведении минус единицы в правую части этой формулы получается произведение символов Лежандра (^) (|), вместе с левой частью получается формула эквивалентная Квадратичному закону взаимности. Левую часть доказываемой формулы представим как число точек мно- жества {(/, s)| t = 1,2,... , (р — 1)/2; s = l,2,... , (q — 1)/2}. Это множество прямая у = 3-х делит на две части. Оказывается, что они содержат как раз столько точек, сколько их в суммах из левой части доказываемой формулы. Сначала докажем, что прямая не пересекает это множество. Предположим, что точка (i, s) лежит на этой прямой: ps = qt. Значит, число qt делится на р. При этом НОД(р, q) = 1. Следовательно, t делится на р. Это невозможно, учитывая границы, в которых изменяется число t. Подсчитаем число точек, лежащих под прямой. Сначала найдем, сколько их в вертикальном отрезке, соответствующем натуральной абсциссе 1 < t < (р — 1)/2. Длина отрезка равна qt/p. Целочисленных точек в нем \_qt/p\ штук. Складывая эту вели- чину по всем отрезкам, получаем сумму (gi/pj • Совершенно анало- гично подсчитывается количество точек, лежащих над прямой. Нужно бу- дет рассмотреть горизонтальные отрезки (см. рисунок). Отметим, что при р > q прямая проходит выше точке А((р—1)/2, (q —1)/2). Требуется обосно- вать, почему в самых правых вертикальных отрезках не окажется лишних точек с целочисленными координатами. Для доказательства нужно рассмо- треть треугольник, у которого две вершины представляет собой точки А и В(р/2,д/2), а третья вершина лежит на пересечении указанной прямой и горизонтальной прямой, проходящей через точку А. Этот треугольник не
7.3. ПРИЛОЖЕНИЯ ЗАКОНА ВЗАИМНОСТИ 127 содержит лишних точек с целочисленными координатами, потому что он целиком лежит в горизонтальной полосе между двумя последовательными целыми значениями ординаты. Длина высоты этого треугольника, опущен- Итак, получено второе доказательство квадратичного закона взаимно- сти. Таких доказательств существует очень много. В дальнейшем мы при- ведем еще одно доказатество этой теоремы. 7.3 Приложения закона взаимности Коснемся сначала важной для теории чисел темы — представления про- стых чисел алгебраическими выражениями. Теорема. Простое число р > 3 представляется в виде: 1. Суммы двух квадратов натуральных чисел р = х2 + у2 тогда и только тогда, когда оно имеет вид р = 4к + 1; 2. Суммы квадрата и удвоенного квадрата натуральных чисел р = х2 + 2у2 тогда и только тогда, когда оно имеет вид р = 8к + 1 или 8к + 3; 3. Суммы квадрата и утроенного квадрата натуральных чисел р = х2 + Зу2 тогда и только тогда, когда оно имеет вид Qk + 1. Доказательство. Сначала докажем необходимость этих условий. 1. Пусть р = х2 +у2. Рассмотрим это равенство по модулю р: х2 +у2 = 0. Умножим обе части на вычет, обратный к у2, получим равенство: z2 + l = 0. Здесь z = х -у-1. Мы построили решение уравнения в 7L/р. Значит, р имеет вид Ак + 1.
128 ГЛАВА 7. КВАДРАТИЧНЫЙ ЗАКОН ВЗАИМНОСТИ 2. Пусть р = х2+2у2. Как и выше получаем решение уравнения z2+2 = 0. Значит, = +1. Однако, (—2\ /—1\/2\ . , р-i , , р2-1 . ,p-i р+5 — = — - = -1) 2 -1) 8 = -1) 2 4 • \ Р ) \Р ) \р) Подставим в это равенство р, представленное в виде 8к + I, I = 1,3,5,7. Подходит только I = 1, I = 3. 3. Пусть р = ж2+3?/2. Как и выше получаем решение уравнения г2+3 = 0. Это возможно лишь для р = бк + 1. Теперь докажем достаточность этих условий. Мы построим по реше- ниям уравнений в Z/p нужные х и у. Основным инструментом для этого бу- дет утверждение из секции 2 главы ’’Решение уравнений в целых числах”. Оно доказывает существование приближения действительного числа а ра- циональной дробью со знаменаталем, не превосходящим заранее заданного числа т > 1. 1. Пусть Zq + 1 = 0 mod р. Мы будем приближать рациональное число zo/p рациональным числом п/у с т = д/р. При этом должны выполняться неравества: у < ^/р, \zq/p — п/у\ < (уд/р)-1. Второе неравенство можно переписать в виде равенства: п = п/у+—, |0|<1. yVp Умножив это равенство на ру, получим: zoy — np = в^/р. Левая часть послед- него равенства — целое число. Обозначим его через х. Тогда, |ж| = |0д/р| < д/р. Кроме того, х = zoy mod р. В таком случае, сумма двух квадратов х2 + у2 делится на р. Действительно, х2 + у2 = z^y2 +у2 = —у2 +у2 = 0 mod р. Значит, можно написать оценку: 0 < х2+у2 < 2р. Однако, это число делится на р. Отсюда следует, что х2 + у2 = р. 2. Пусть Zq + 2 = 0 mod р. Аналогично предидущему приблизим дробь zq/p рациональным числом п/у с т = д/р и положим х = zt)y — пр. Сумма квадрата и удвоенного квадрата делится на р: х2 + 2у2 = z/y2 + 2у2 = 0 mod р. Кроме того, можно написать оценку:0 < х2 + 2у2 < Зр. Возникает альтернатива: х2 + 2у2 = р или х2 + 2у2 = 2р. Во втором случае число х — четное. Подставим х = 2и и сократим на два: 2и2 + у2 = р. В любом случае, мы получили нужное представление числа р.
7.3. ПРИЛОЖЕНИЯ ЗАКОНА ВЗАИМНОСТИ 129 3. Совершенно аналогично предыдущему получим число х2+3у2, которое делится на р. Причем, |ж| < р, |у| < р. Из оценки 0 < ж2+3у2 < 4р вытекают три возможности: х2 + Зу2 = р, х2 + Зу2 = 2р или х2 + Зу2 = Зр. Вторая возможность никогда не реализуется. В самом деле, оба слагаемых нечетны (если бы оба слагаемых были четными, то правая часть делилась бы на 4; разную четность они иметь не могут, так как правая часть при этом нечетна). Однако нечетное число в квадрате имеет вид 8s + 1. Пусть х2 = 8si + 1, у2 = 8s2 + 1. Тогда правая часть делится на 4 — она имеет вид: 8(si + Звг) + 4. Третья возможность легко сводится к первой: х = Зи => Зм2 + у2 = р. □ Следствие. Простое число р > 3 представляется в виде р = х2 —ху +у2, где х и у — натуральные числа, тогда и только тогда, когда оно имеет вид р = 6k + 1. Доказательство. Пусть р имеет такой вид, тогда его можно предста- вить в виде р = и2 + Зи2. Положим: х = и + v, у = 2д. Тогда х2 — ху + у2 = и2 + Зи2 = р. Пусть р = х2 — ху + у2. Тогда 4р = (2ж — у)2 + Зу2. Значит, уравнение z2 + 3 = 0 имеет в Z/p решения ±2ж — у у~г. Отсюда следует, что р имеет указанный вид. □ Закон взаимности облегчает вычисление символа Лежандра. На этом основан метод поиска больших простых чисел при помощи теста Соловэя- Штрассена. Этот тест опирается на формулу: а^р-1^2 = (^) moclp, для О < а < р и простого р. Дело в том, что и левая, и правая части срав- нения легко вычисляются . Для быстрого вычисления левой части степень (р — 1)/2 представляют в двоичном коде. Это позволяет свести возведение в большую степень к многократному возведению в квадрат с последующим приведением к остатку по модулю р. Что же касается левой части, то сразу же возникают вопросы. Как вычислить символ Лежандра по модулю, про- стоту которого как раз и проверяют ? Для этого вводят обобщение символа Лежандра на составные модули — так называемый символ Якоби. Пусть со- ставное нечетное число ш раскладывается на множители следующим обра- зом: т = piP2 -Рп- Определим символ Якоби по формуле: Вычисление символа Якоби оказывается легкой алгоритмизуемой задачей, потому что выполняются следующие свойства, которые составляют квадра-
130 ГЛАВА 7. КВАДРАТИЧНЫЙ ЗАКОН ВЗАИМНОСТИ тичный закон взаимности для символа Якоби: (—= (-1/т х^2; (—= (-l/™2 х)/8; f—= (-1)™2 f—Ya = 1 mod 2. \т J \т J \т J \а J Так что, для подсчета символа Лежандра нужно воспользоваться этими свойствами. Сами вычисления не предполагают заранее, известна ли нам простота числа т. Символ Якоби служит вспомогательным вычислитель- ным средством для символа Лежандра. Таким образом, обе части исходной формулы легко вычисляются при помощи компьютера. Рассмотрим пример: 662 \ / 2 \ f 331 \ / 331 \ _ Z20014 2001/ - V200V \2001J ~ \2001J ~ К^ЗГ/ Убедившись в справедливости формулы a(m-1)/2 = mod т. для до- статочного количества взаимно с m чисел 0 < а < р, можно быть уверенным в большой вероятности простоты числа т. Теорема. Для нечетного составного числа m не более половины взаимно простых с m чисел 0 < а < т удовлетворяют условию a^7"-1^2 = (^) mod т. Доказательство. Пусть квадрат простого числа р2 делит т, тогда (1+m Y = 1- В самом деле, для всякого pi из разложения числа m на про- стые множители имеет место сравнение: 1 + т/р = Imodpj. Значит , (1^£) = +1. Сравнение (1 + т/р)^т~1^2 = 1 mod т не имеет места. В самом деле, пусть р в s-й степени выносится из числа m: т = psm', где НОД(р, т') = 1. Тогда, (1 + т/р)(т-1)/2 = (1 +ps-1m')^m-1^2 = 1 +ps~1m'(m — 1)/2 mod т. Мы раскрыли бином по формуле Ньютона и заметили, что все члены, за исключением двух первых, делятся на т. Второе слагаемое из правой части не делится на ps, потому что т — 1 не делится на р. Значит, для а = 1 + т/р не выполняется условие, указанное в теореме. Нам нужно найти число а с таким же свойством в случае, когда чи- сло m не делится ни на какой нетривиальный квадрат (то есть, когда в разложении т = pip-i - Рп все простые различны). Пусть s — неквадра- тичный вычет по модулю pi; с и b — такие числа, что с • w,/p\ = 1 modpi
7.3. ПРИЛОЖЕНИЯ ЗАКОНА ВЗАИМНОСТИ 131 и bpi = 1 mod т/р\. Положим а = scm/p\ + Ър\. Имеют место равества: Итак, для любого составного модуля m мы нашли взаимно простое с ним число а, для которого а(т-1)/2 (^j. Пусть щ, U2,... , щ — все целые числа удовлетворяющие условиям: 0 < щ < т, НОД(мг,т) = 1, и^т = mod т, для 1 < i < t. Тогда остатки от деления чисел аи±, аи2, , ащ на m дадут столько же различных чисел, которые удовлетворяют двум пер- вым условиям, но не удовлетворяют третьему. □ Таким образом, для теста Соловэя-Штрассена не возникает препятствий, аналогичных числам Кармайкла для теста, опирающегося на малую тео- рему Ферма. В любом случае, не менее половины пробных чисел дают отри- цательный результат тестирования, если число m было составным. Числа Кармайкла и здесь дают ’’ложку дегтя в бочке меда” — для чисел Кар- майкла т=1729 и т=56052361 указанное сравнение выполняется ровно на половине взаимно простых с модулем чисел 0 < а < т. Так что, эту теорему нельзя усилить. Докажем закон взаимности для символа Якоби. Пусть т = Р1Р2 -рп и а = q±q2 ... qs — разложения на простые множители двух нечетных чисел. Имеют место равенства: = (-1)^=1^ = ! -2 Достаточно доказать, что = Cm ~ 1)/2 mod 2 и = (а — 1)/2 mod 2. Это непосредственно следует из пункта 1 следующей леммы. Лемма 1. Для нечетных чисел и и v имеют место сравнения: 1. (м — 1)/2 + (и — 1)/2 = (uv — 1)/2 mod 2; 2. (и2 — 1)/8 + (о2 — 1)/8 = (u2v2 — 1)/8 mod 2. Доказательство. 1. Подставим и = 2и' + 1, v = 2v' + 1 в сравнение: и’ + v' = ((2м' + 1)(2и' + 1) - 1)/2 = 2uV + и' + v' mod 2. 2. Подставим и = 4х + h и v = 4у + /, где h = ±1 и f = ±1, в сравнение: 2х2 + hx + 2у2 + fy= ((16ж2 + 8hx + 1)(16г/2 + 8fy + 1) - 1)/8 =
132 ГЛАВА 7. КВАДРАТИЧНЫЙ ЗАКОН ВЗАИМНОСТИ 32х2у2 + 16(ж2/у + y2hx) + 2(ж2 + у2) + 8hxfy + hx + fy mod 2. □ С помощью первого пункта леммы можно доказать равенство: = = ТТ f—= (-i)E?=i(p-i)/2 = (_п(т-1)/2_ mJ С помощью второго пункта леммы можно доказать равенство: (—) = 2^ = тт = (_1)Е?=1(р?-1)/8 = (_1)(™2-1)/8. т) г£1 \Pi) При помощи закона взаимности можно доказать следующую теорему. Теорема. Для любого натурального числа п, не являющегося полным квадратом, можно найти бесконечно много простых модулей, по которым вычет п не является квадратичным. Доказательство. Достаточно рассмотреть случай, когда число п не делится на нетривиальные квадраты, то есть п = 2е</| </2 • • • qt, е € {0,1}, qi — нечетные различные простые числа i = 1,2 ... , t. Сначала рассмотрим п = 2. Вычет 2 не является квадратичным тогда и только тогда, когда п = 8к + 3 или п = 8к + 5. Теорема Дирихле утвер- ждает бесконечность множества простых чисел каждого из этих видов. Нам нужно доказать бесконечность объединения этих множеств, то есть более слабое утверждение. Для доказательства мы применим следующий логиче- ский прием. Пусть {/1,^2, • • • Us} — произвольное множество простых чисел, превосходящих число три, по модулям которых двойка — неквадратичный вычет. Мы найдем превосходящее тройку простое число, которое в нем не содержится, по модулю которого двойка является неквадратичным выче- том. Из этого следует, что таких простых чисел бесконечно много. В са- мом деле, начнем с простого числа 5. Найдем еще одно простое нужного вида, и так далее. Каждый раз мы будем расширять множество при по- мощи этого факта. Докажем существование нового простого числа. Поло- жим, b = 8ZiZ2 • • • ls + 3. Тогда (|) = —1. Пусть b = pip-i -рг — разложение на простые множители. Заметим, что все эти множители больше тройки и не лежат в приведенном выше множестве. Для по крайней мере одного из них двойка будет неквадратичным вычетом, так как = — 1.
7.3. ПРИЛОЖЕНИЯ ЗАКОНА ВЗАИМНОСТИ 133 Теперь применим этот прием к случаю, когда п = 2eqiq2 .qt, t > О, е < 1. Пусть {/1,/г,--- Us} — произвольное множество нечетных про- стых чисел, не содежащее числа qt, i = 1,2,... ,t. Пусть число и дает неквадратичный вычет по модулю qt и число Ъ — решение системы срав- нений: х = 1 mod 8 х = 1 mod It, х = 1 mod qt, x = u mod qt i = 1,2,... , s i = 1,2,... ,t- 1 Первая строчка нам нужна для того, чтобы = +1. Кроме того, (п\ _ /2Л /ох\ Л/2 \ W “ Д Д ь Дь) Пусть b = piP2 - Рг — разложение на нечетные простые множители. Ника- кой из этих множителей не содержится в исходном множестве. Кроме того, среди них нет множителей числа п. При этом, (у) = = —1. Хотя бы один из pt является модулем, по которому класс вычетов числа п — неквадратичный. Мы начнем с пустого исходного множества простых чисел. Затем, станем наполнять его при помощи указаннной процедуры не- ограниченно. □
134 ГЛАВА 7. КВАДРАТИЧНЫЙ ЗАКОН ВЗАИМНОСТИ
Глава 8 Гауссовы суммы 8.1 Простейшие гауссовы суммы Количество квадратичных ненулевых вычетов по простому модулю р равно количеству неквадратичных вычетов. Поэтому, сумма всех символов Лежандра равна нулю. Кроме того, сумма всех корней степени р из единицы равна нулю. На этих двух простых фактах основывается теория гауссовых сумм. Гауссовой суммой та, а € Z называется сумма (p)e°fc, гДе е = cos 2тг/р + i sin 2тг/р. Очевидно, что для нижнего индекса важно лишь к ка- кому классу вычетов по модулю р принадлежит число а. Если а = 0, то получается сумма всех символов Лежандра: Гц = 0. Заметим, что все суммы выражаются через одну: та = (^)тх. В самом деле, умножим это равенство на (р) : (р)т« = т1- оДнако, При умножении на ненулевой вычет а вычеты переставляются местами. Поэтому при переходе к новому индексу суммирования t = ак всего лишь меняется порядок суммирования. Теорема, г2 = (—l)(p-1)/2p. Доказательство. Подсчитаем сумму таТ-а двумя способами. Сна- 135
136 ГЛАВА 8. ГАУССОВЫ СУММЫ чала выразим все гауссовы суммы через первую: Р-1 /-л2\ Р-1 Z—1\ S (А-) ri=ri X (-А = (-1 )<₽-"/» (₽ - 1)г?. а=0 \ / а=1 \ " / Можно раскрыть каждую гауссову сумму, исходя из определения: Р~ 1 / к р — 1 р — 1 / к р — 1 / Пх = £ £ - u=E - р = (р-1)Р. \ V J \ V J \ V / u,v=0 х г ' а=0 u,f=0 и=0 х 7 Здесь мы воспользовались тем, что J2p=q eaO~v) = 6uvp, где - _ ( 0, если и 7^ v; u’v ~ [ 1, если и = V. Значит, (—1)(р-1)/2(р — 1)т2 = (р— 1)р. □ Из доказанной теоремы вытекает, что гауссова сумма л равна А^/р или ±y/pi, в зависимости от того, какой вид имеет число р — 4n +1 или 4п — 1. Возникает вопрос о том, какой знак нужно выбрать — ’’плюс” или ’’ми- нус”. Этот вопрос занимал К.Ф. Гаусса целый год, пока он не нашел ре- шение. Оказывается всегда нужно выбирать ’’плюс”, гауссова сумма равна квадратному корню из р или — р. Мы не станем здесь этого доказывать. Гауссовы суммы дают еще одно доказательство закона взаимности. Для этого придется оперировать с числами вида xq + Xis + х^е2 +... + хр-2£р~2, где xt € Z. Оказывается, что они единственным образом представляются в таком виде. Мы докажем это в главе 10. При этом сумма, разность и произведение двух таких чисел имеет нужный вид. Для доказательства по- следнего можно понижать степени е при помощи равенства ер-1 = —ер-2 — ...—£ — 1. Мы рассмотрим сравнения в множестве таких чисел. Рассмотрим произвольное нечетное простое число q. Тогда rf = = (-1)^ pO-i)/2T1 = (—1)"2' -mod q. С другой стороны, эту степень суммы можно раскрыть по полиномиальной формуле. Отметим, что коэффициенты —j—Л-------f делятся на простое число v Sq ! S1!.. .Sp _ 1!
8.2. ЧИСЛО РЕШЕНИЙ СРАВНЕНИЯ 137 q. Так что, после приведения по модулю q в сумме останутся только q-e степени отдельных слагаемых: Значит, имеет место равенство; -(-1) 2 2 - где а — комплексное число, указанного выше вида. Воспользуемся одно- значностью представления таких чисел. Приравнивая целые числа — ко- эффициенты при одинаковых степенях е, получим, что а = 0 и (-) = 8.2 Число решений сравнения Подсчитаем сначала число решений у сравнения х2 + у2 = 0 mod р, где р = 4к + 1. Метод подсчета состоит в том, чтобы представить N — число решений — в виде: N = ^2 = a)N{y2 = b), л-|-6=0 где 7V(...) — число решений сравнения .... Мы попросту представили пра- вую часть в виде суммы двух слагаемых. Теперь можно предложить фор- мулу для числа решений: N(z2 = с) = 1 + (^). Подставим ее в исходную формулу: л-|-6—0 л-|-6—О Подставим: b = —а, 0 < а < р— 1. Первое слагаемое даст р. Второе и третье слагаемые дадут сумму всех символов Лежандра — 0. Четвертое слагаемое даст сумму:
138 ГЛАВА 8. ГАУССОВЫ СУММЫ Получаем ответ: N = р + (—1)(р-1)/2(р — 1). Для р = 4к — 1 получаем одно решение. Это, конечно, точка (0,0). Для р = 4к + 1 получается всего 2р — 1 решение. Немного усложним задачу. Пусть в правой части вместо нуля стоит еди- ница, получим уравнение ’’окружности”: х2 + у2 = 1. Можно сказать, что мы подсчитываем количество точек конечной ’’окружности” в Z/p. N= £ N(x2=a)N(y2 = b) = £ (1 + Q)(1 + Q) = д-|-6=1 д-|-6=1 Первое слагаемое даст р. Второе и третье слагаемые дадут сумму всех символов Лежандра — 0. Четвертое слагаемое даст сумму при а=0,1 получаются нулевые члены у этой суммы, вычет квадратичен тогда и только тогда, когда обратный к нему вычет — квадратичен. Заме- тим, что t = al — а принимает все значения от 1 до р — 2. Действительно, выразим а через t: /1 — а = а => а = i(l + /)-1. Получилось взаимно однозначное соответствие между ненулевыми выче- тами t и а, причем а 1, t —1. В четвертой сумме отсутствует только один символ Лежандра — ("^)- Значит, она равна — (^)- Получаем ответ: N = P-^~ Хотелось бы обобщить этот пример на более высокие степени перемен- ных. Рассмотрим уравнение ж3 + у2 = 1 в Z /р, где р — простое вида Qk + 1. Для простых р = Qk — 1 имеется ровно р решений. Строятся они следу- ющим образом: по каждому у из уравнения х3 = 1 — у2 находится ровно один х (так так НОД(р — 1,3) = 1). Рассуждая точно так же, можно до- казать, что уравнение хс + Г (у,... ,z) = Осп переменными имеет ровно р”-1 решений, если переменная х не входит в F и НОД(р — 1,с) = 1. Будем считать этот случай тривиальным. Сосредоточим внимание на противо- положном случае. Совершенно аналогично предидущему получим формулу для числа решений: N = N(x3 = a)N(y2 = b). Для содержательных
8.2. ЧИСЛО РЕШЕНИЙ СРАВНЕНИЯ 139 вычислений нужно найти формулу для числа решений уравнения х3 = а в Z/p. Напомним, что все ненулевые вычеты выражаются через прими- тивный вычет: Z/p = {0,1,м, м2,... ,йр~2}. Обозначим через А функцию Z/p —> \/lU {0} = {0,1, ш, ш2}. Пусть А(0) = 0, A(mz) = ш1. Эта функция ана- логична символу Лежандра для кубических сравнений. Ненулевой вычет а является кубическим тогда и только тогда, когда А(а) = 1. Кроме того, имеет место формула А(аЬ) = А(а)А(Ь). Такими же свойствами обладает и любая степень этой функции. Заметим, что степени дают еще только две новые функции — А2 и А3. Последняя функция на всех ненулевых вычетах равна единице, а на нулевом вычете она равна нулю. Ее заменяют на то- ждественно равную единице на всех вычетах функцию. Сумма трех этих функций дает число решений уравнения х3 = а. Если ненулевой вычет а — кубический, то для р = 6к + 1 НОД(р — 1,3) = 3, и ровно три решения имеет уравнение х3 = а. Для некубического вычета сумма трех функций принимает значение 1 + ш + ш2 = 0. Для нулевого вычета есть только одно решение этого уравнения — нулевой вычет. Именно для учета этого слу- чая пришлось переопределить функцию А3. Так что, формула для числа решений исходного уравнения принимает следующий вид: N = 'У } (1+А(а)+А2(а))(1+) 1+А(а)+А2(а)+ д-|-6=1 д-|-6=1 + (А(а)+А2(а)) Получилось пять сумм, соответствующих каждому из слагаемых. Первая сумма равна р. Вторая, третья и четвертая суммы равны нулю. Действи- тельно, ровно на 2k вычетах функции А и А2 принимают значения — 1, ш и ш2. Осталось вычислить сумму S = 22а=о(А(а)-|-А2(а))(А=^). Если в первую скобку добавить слагаемое 1, то получится сумма S = Р-1 /-j _ \ Р-1 /1 _ \ =£(1 + А(а) + А2(а))(— а=0 \ / а=0 \ Р / Однако утроенную сумму по всем кубическим вычетам можно заменить на сумму по всем кубам вычетов — каждый ненулевой куб встретится три раза. Получим сумму: Последняя сумма содержит ровно р—3 ненулевых слагаемых, которые равны ±1 (единица представляется кубом ровно трех вычетов, поэтому ровно трое
140 ГЛАВА 8. ГАУССОВЫ СУММЫ слагаемых равны нулю). Достаточно найти это число по модулю р. Восполь- зуемся критерием Эйлера: (р-1)/2 /Р~1\ Р-1 = 1+ ^2 (-1)Ч ? )(52s3i)modp- t=0 ' ' s=l Последняя стоящая в скобках сумма не делится на р только для t = 0 и t = (р — 1)/3 = 2fc. Получаем сравнение: (р-!\ /ЧАЛ /ЧАЛ Jmodp- Количество решений исходного уравнения равно N = p+S, где S = — (3fcfc) mod р и это число представляется в виде суммы р — 3 ненулевых символов Ле- жандра. Рассмотрим пример: р = 19. 9-8-7 S = — -—-—- = —84 = 11 mod 19. 1-2-3 Значит, S = —8 или S = 11. Однако второй случай отметается потому, что это число представляется в виде суммы р — 3 = 16 слагаемых , которые равны ±1. Если из них 11 равны 1, то оставшиеся пять не могут в сумме дать ноль. Значит, всего имеется 11 решений. Найдем число решений уравнения ж4 + у2 = 1. Интересным здесь будет случай р = 4к + 1. Число решений можно представить в виде: N = ^2 = a)N(v2 = &)- д-|-6=1 Для уравнения х4 = а можно предложить аналог символа Лежандра — функцию А : Z/p —> {0, — 1,1,г, — г}. Положим: Х(й*) = г1, А(0) = 0, где й примитивный вычет по модулю р. Заметим, что А2 (а) = Как и в предидущем случае, имеет место равенство: N(x4 = а) = 1 + А(а) + А2 (а) + А3 (а).
8.2. ЧИСЛО РЕШЕНИЙ СРАВНЕНИЯ 141 Значит, ЛГ = £ (1 + A(a)+Q+A3(a))(l+Q) = а+Ь=1 р 1 / \ /1 \ / \ /1 \ /1 \ Е-. X / \ I X 3 / \ /1 - / ОД / 1 - ОД /х / X хЗ Z \\/1 - ЯЛ 1 + А(а) + ( - ] + Л (а) + (——) + (-) (——) + (А(а) + Л (а)) (—— ]. а=0 ' \/\/\/ \/ Первая сумма равна р. Каждое значение функции А на ненулевых вычетах принимается одинаковое количество раз (к раз). Поэтому, сумма всех зна- чений функции А равна к(1 + i — 1 — i) = 0. Значение А3 (а) получается при помощи комплексного сопряжения к значению А(а). Поэтому, сумма всех значений функции А3 равна нулю. Так что, ненулевыми могут быть только первая, последняя и предпоследняя суммы. Предпоследнюю сумму мы уже вычисляли — она равна — (Д) = — 1. Для вычисления последней суммы за- метим, что для а = u2s+l левая скобка в ней представляет собой сумму чисел i и —г. Так что, в сумме остаются лишь члены соответствующие квадра- тичным вычетам. Все квадратичные ненулевые вычеты можно представить ______2 _2 ------2 в виде: 1 ,2 ,... , (р — 1)/2 . Поэтому, последнюю сумму можно записать в виде: В силу того, что (Д) = +1, имеет место равенство: Значит, последнюю сумму можно записать в виде: S = (~-). Эта сумма имеет р — 3 ненулевых члена. Для ее вычисления по модулю р вос- пользуемся критерием Эйлера: p-i 2fc /охд 2fc /ог.\ р-1 i6fc-2s) mod р. t=l s=0 \s / s=0 \s / t=1 Однако сумму одинаковых степеней всех вычетов мы уже вычисляли. В этом случае, она будет отлична от нуля лишь при s = к. Получаем S = (—l)fc (2Д (—1) = (—l)fc+1 (2fcfc). Итак, мы получили ответ: N = р — 1 + S, где
142 ГЛАВА 8. ГАУССОВЫ СУММЫ S представляет собой сумму из р — 3 членов, которые равны ±1. При этом, число S сравнимо с числом (—l)fc+1(2fcfc) по модулю р. Рассмотрим пример: р = 29, к = 7. Тогда = f 1 а8 14 • 13 • 12 • 11 • 10 • 9 • 8 “ ’ 2-3-4-5-6-7 13 • 11 • 24 = 143 • 24 = (-2) • (-5) = 10 mod 29. Заметим, что S —19. В самом деле, если из 26 символов Лежандра 19 равны -1, то из суммы оставшихся семи не получится ноль. Значит, S = 10, N = 38. Можно попробовать найти число решений уравнения х3 + у3 = 1 в Z /р, где р = 6к + 1. N= N(x3 = a)N(y3 = Ь) = (1 + A(a) + A2(a))(l + А(Ь) + А2(Ь)) = д-|-6=1 д-|-6=1 1 + A(a) + А(Ь) + A2(a) + А2(Ь) + X(ab) + А2(аЬ) + А(а)А2(Ь) + А2(а)А(Ь). д-|-6=1 Первая сумма равна р. Вторая, третья, четвертая и пятая суммы равны нулю. Легко вычисляются также последние две суммы . Заметим, что А2 (Ь) = А-1 (Ь) = А(Ь-1) для ненулевого вычета Ь. Значит, р—1 р—1 р—2 £A(a)A2(T^i) = £А(«Т^Г') = £A(i) = -A(F^T) = -1. a=2 a=2 i=l Мы в точности повторили аналогичные рассуждения для символа Лежандра и воспользовались тем, что р — 1 — кубический вычет. Последняя сумма вычисляется точно так же. Осталось подсчитать сумму 22о_|_(,=т(А(аЬ) + А2(аЬ)). В силу комплексной сопряженнности слагаемых А2(аЬ) и А(аЬ), эту сумму можно переписать в виде S = 27Je(J2o+()_T А(аЬ)). Сумма, от которой берется удвоенная действительная часть называется суммой Якоби. Эти суммы изучаются в следующей секции. Пока мы можем дать ответ в виде: N = р - 2 + S. 8.3 Общие суммы Гаусса и Якоби В предидущей секции мы рассмотрели конкретные примеры вычисле- ний, связанных с характерами и суммами Якоби.
8.3. ОБЩИЕ СУММЫ ГАУССА И ЯКОБИ 143 Пусть р — простое число. Характерами по модулю р называются сте- пени функции х : Z/p —> р-\/1 U {0}, которая определяется формулами: у(0) = 0, х(мг) = //, где й — примитивный вычет по модулю р, г) = cos + i sin • Для любого характера значение на единичном вычете равно единице. Кроме того, значение характера на произведении вычетов равно произведению значений. При этом характер х° называют единичным — он равен единице на всех ненулевых вычетах. Для удобства вычисле- ний его переопределяют на нулевом вычете — кладут равным единице, а не нулю. Это связано с определением значения нулевого вычета в нулевой степени. Как мы уже убедились на примерах вычислений числа решений сравнений, формула 0=1 оказывается удобной. Легко подсчитать сумму всех значений характера. Если это был единичный характер, то эта сумма равна р. Для неединичного характера эта сумма равна нулю : р— 2 р— 1 &*(«*) = ^2 £=0 £=0 Г = ^—к—г- Г]К — 1 = 0. Подсчитаем также сумму значений всех характеров на одном вычете. Если это был нулевой вычет, то сумма равна единице. Если это был единичный вычет, то сумма равна р — 1. Для всех остальных вычетов эта сумма равна нулю: р-2 р-2 к=0 к=0 kt = Ч(Р~1)г ~ 1 — 1 = 0. Заметим, что символ Лежандра — это характер: = у(р_1)/2(а). Для других примеров характеров из предидущей секции также можно найти соответствующие им степени. Для любых двух характеров Ai и Аг можно определить сумму Якоби: J(Ax,A2)= £ Х1(а)-Х2(Ь). д-|-6=1 Гауссовы суммы также можно определить для любого характера А: р-1 та(А) = £А(/Кг, t=0 где е как всегда равно cos 2тг/р + i sin 2тг/р.
144 ГЛАВА 8. ГАУССОВЫ СУММЫ Легко заметить, что то (А) = 0 для неединичного характера А. Кроме того, то(х°) = 0 для не делящегося на р числа а и то(х°) = р. Все гауссовы суммы с данным неединичным характером выражаются через одну: та(А) = А(а) -Ti(A). Доказательство здесь такое же, как для случая сумм с символом Лежандра. Для а = 1 станем опускать этот индекс из записи гауссовой суммы. Кроме того, прямым обобщением получается теорема о том, что модуль гауссовой суммы равен д/р. Теорема Для неединичного характера А имеет место равенство: т(А)т(А) = А(-1)р. Доказательство. Вычислим сумму выражений та(А)т_а(А) по всем вы- четам а двумя способами. Сначала выразим их через т(А) : р—1 р—1 £та(А)т_а(А) = £ЩА(-а)т(А)г(А) = А(-1)(р - 1)т(А)т(А). а=0 а=1 С другой стороны, можно воспользоваться определением гауссовой суммы: р—1 р—1 р—1 р—1 р—1р—1 £(£a(s)£-)(£ W"ai) = £££a(s)W(s-z) = а=0 s=0 i=0 а=0 s=0 i=0 р—1 р—1 р— 1 р—1 £ А(«)Ш(Ее°(8’4)) = £ A(s)A(i)W = £А(8)Жр= (Р- 1)р- s,i=0 а=0 s,i=0 s=l Приравняв два этих результата и заметив, что А(—1) = ±1, получим дока- зываемое утверждение. □ Заметим, что т(А) = А(—1)т(А). В самом деле, можно записать: р—1 р—1 т(А) = £АНс' = А(-1)£ Ае* = А(—1)т(А). i=0 i=0 Отсюда немедленно получаем: т(А)т(А) = р => |т(А) | = д/р. Теорема. Пусть для двух характеров Ai и Аг выполняется неравенство: А1А2 х°. Тогда имеет место равенство: Т(А1)г(Аг) = J(Ai, A2)t(Ai Аг). Доказательство. Перемножим две суммы Гаусса: р—1 р—1 р—1 (£A1(S)es)(£A2(i>i) = £( £ Х^Х^е™. 8=0 t=0 т=0 $+t=m
8.3. ОБЩИЕ СУММЫ ГАУССА И ЯКОБИ 145 Сначала заметим, что внутренняя сумма, соответствующая т = 0, равна нулю: р—1 р—1 А1 (s)A2(—s) = Лг(—1) Ai A2(s) = 0. 8=0 8=0 Оставшиеся внутренние суммы легко выразить через сумму Якоби. Для этого будем считать параметры суммирования вычетами по модулю р. По этому модулю вычет т обратим. Поэтому, можно найти однозначное пред- ставление: s = s'm vs. t = t'm. У Ai(s'm)A2(i'm) = AiA2(m) У Ai(s')A2(i') = AiA2(m)J(Ai, А2). s'm+t'm=m s +* — ' Исходное произведение можно переписать в следующем виде: р-1 У2 A1A2(m)£roJ(A1,A2) = t(A1A2)J(A1,A2).D т=1 Если один из характеров — единичный, а другой — неединичный, то соответствующая им сумма Якоби равна нулю. Кроме того, = р. Если два неединичных характера комплексно сопряжены друг другу, то соответствующая им сумма Якоби равна р — 1. Из последних двух теорем следует, что модуль суммы Якоби двух неединичных несопряженнных друг другу характеров равен д/р. Следствие. Для произвольного характера А = хт имеет место равен- ство: rd(A) = J(A, A) J(A2, А)... J(Ad-2, А)А(-1)р. Здесь d = нодрп^-х) — наименьшая натуральная степень, в которой А равен единичному характеру. Доказательство. Согласно двум приведенным выше теоремам имеют место равенства: rd-2(A) • т2(А) = rd-2(A) • т(А2)J(A, А) = rd-3(A) • т(А3) J(A2, A)J(A, А) = = ... = т(А) • т(Ар-1)J(AP-2, А)... J(A2, A) J(A, А) = = A(-l)pJ(Ap-2, А)... J(A2, A) J(A, А). В самом деле, Ар-1 = А.П
146 ГЛАВА 8. ГАУССОВЫ СУММЫ Теорема. Пусть число m имеет вид: т = 2apipz .. .pk, где ps, 1 < s < к различные простые числа Ферма (то есть числа вида 22 +1). Тогда правильный m-угольник можно построить циркулем и линейкой. Доказательство. Достаточно построить правильный р-угольник, где р — простое число вида р = 22 +1. Если число сторон является произведе- нием двух взаимно простых чисел mi и п»2, то линейное представление их наибольшего общего делителя единицы — umi + vm-i = 1 — дает возмож- ность построить угол через углы и : 2% 2% 2% = и -1- v —. ШхШг-----------------Ш2-Ш1 Рассмотрим сумму по всем характерам по модулю р: р—1 р—1 £ Ф) = £ £ а(п)£" = £ е"(£ л(п)) = 1 + (р _ 1> X X п=0 п=0 X Эта сумма легко вычисляется — благо, что мы заранее подсчитали сумму значений характеров на каждом вычете. Нам нужно найти формулу для е или для cos —, использующую лишь четыре действия арифметики и из- влечения квадратных корней (комплексные или арифметические корни — безразлично, так как мы ранее выразили комплексные корни от комплекс- ных чисел от арифметические). Формула для суммы всех гауссовых сумм показывает, что мы добьемся нужного, если выразим через рациональные числа при помощи указанных операций все гауссовы суммы. Однако согласно доказанному выше следствию, для некоторого делителя d = 2Ь числа р — 1 = 22 для характера А имеет место формула: rd(A) = J(A, A) J(A2, А)... J(Ad-2, А)А(-1)р. Однако сумма Якоби выражается через число г] = cos + sin , действи- тельная и мнимая части которого легко выражаются через указанные опе- рации. Так что, по существу, мы получили практический метод построения числа соз2тг/р. □ Известны лишь пять простых чисел Ферма: 3,5,17,257,65537. Они соот- ветствуют t= 0,1,2,3,4. Леонард Эйлер заметил, что число следующее число Ферма 232 + 1 делится на 641. В самом деле, 641=54 + 24 = 5-27 + 1. Поэтому, имеют место сравнения: 54 = —24 mod 641, 5 • 27 =-1 mod 641.
8.3. ОБЩИЕ СУММЫ ГАУССА И ЯКОБИ 147 Возведем второе из них в четвертую степень: 54 • 228 = 1 mod 641. Заменив первый множитель из левой части при помощи первого сравнения, полу- чим сравнение: —24 • 228 = —232 = 1 mod 641. Оно эквивалентно сравнению: 232 + 1 = 0 mod 641. Несложно проверить равенство: 232 + 1 = 641 • 6700417. Следующее число Ферма также составное: 264 + 1 = 274177-67280421310721. Все последующие проверки чисел Ферма на простоту давали отрицатель- ный результат. Возможно, что других простых чисел Ферма не существует. Если это так, то наша теорема состоит в том, что можно построить 257- угольник и 65537-угольник. Построение последнего имеется среди рукопи- сей библиотеки Геттингенского университета. При помощи приведенного метода можно попытаться найти формулу для cos 2%/257, подобную приве- денной в главе 10 формуле для соз2тг/17. Вернемся к задаче о числе решений сравнения х3 + у3 = 1 mod р для р = Qk + 1. Она свелась к нахождению числа S = 2ReJ(A, А), где характер А имеет вид А = y2fc. Нам известен модуль суммы Якоби: |J(A, А)|2 = р. Пусть J(A, А) = а + bw, тогда это равенство можно переписать в виде а2 — ab + Ь2 = р. Если бы число р однозначно представлялось в таком виде, то из этого представления можно было найти S = 2а — Ь. Однако существует несколько представлений такого вида. Исходное представление выделяется следующими свойствами: а = — 1 mod 3, b = 0 mod 3. Для доказательства этих свойств рассматривают куб гауссовой суммы: р—1 р—1 р—1 г3 (А) = (^A(s)es)3 = ^A3(s)e3s = ^e3s = -1 mod 3. S=1 S=1 S = 1 С другой стороны, т3(А) = J(A,A)p = J(A,A)mod3. Значит, J(A,A) = —1 mod 3. Совершенно аналогично получим: J(A, A) = J(A, A) = —1 mod 3. Итак, получены два сравнения: а + bw = — 1 mod 3, а + bw = — 1 mod 3. Вычтя из первого второе, получим: Ъ\/—3 = 0 mod 3. Возводя его в квадрат, получим: — ЗЪ2 = 0 mod 9. В отличие от приведенных выше это — сравнение целых чисел (предидущие сравнения проводились среди целых алгебраиче- ских чисел, подробнее об этом в главе 10). Из этого сравнения следует, что число b делится на три. Значит, а = — 1 mod 3. Этими условиями числа а и b определяются однозначно, это представление можно использовать для на- хождения числа S = 2а — b = 1 mod 3. Однако, лучше поступить по-другому. Заметим, что (2а — b)2 + ЗЬ2 = 4р. Пусть b = ЗВ, тогда 4р = S2 + 27В2.
148 ГЛАВА 8. ГАУССОВЫ СУММЫ Это единственное представление, если потребовать: S = 1 mod 3, В > 0. Поэтому, его можно использовать для нахождения числа S. Рассмотрим примеры: р = 61 или р = 67. Для первого случая используем равенство: 4-61 = 244 = 1 + 35 = 12 + 27-32. Значит, S = 1, ^ = 61 — 2 + 1 = 60. Для второго случая используем равенство: 4 • 67 = 268 = 52 + 27 • З2. Значит, S = —5, ^ = 67— 2 — 5 = 60. Обращаем внимание на то, что в последнем случае S < 0. Изложенная выше теория позволяет строить неожиданные тригономе- трические тождества. Рассмотрим, к примеру величину гауссовой суммы с характером — символом Лежандра. Добавим к ней сумму всех корней р-й степени из единицы. р—1 р—1 £Мт2 = /)ег = £е*2. i=0 ж=0 Рассмотрим отдельно случай р = 4к + 1 от случая р = 4к — 1. Если выпол- няется первый случай, то гауссова сумма — действительное число. Значит, последняя сумма представляет собой сумму косинусов: 2?Г 9 2% о . , 9 — 1 + cos — • 1 + cos — • 2 + ... + cos 2ttw • (р — 1) = Лр. Р Р Если выполняется второй случай, то гауссова сумма — чисто мнимое число. Значит, последняя сумма представляет собой сумму синусов, умноженных на мнимую единицу. Имеет место равенство: . 2% 9 2?Г 9 2?Г . , 9 — sm — • 1 + sin — • 2 + ... + sm — • (р - 1) = Лр. р р Р Пусть р = Qk + 1. Рассмотрим величину т(А) + т(А2), где А = х2к. Если к ней добавить сумму всех корней р-й степени из единицы, то получится сумма: р— 1 р—1 р—1 £(1 + A(i) + А2>г = ^N(x3 = Т)е* = ^ех3. t=0 t=0 х=0 Заметим, что А2 = А и т(А2) = т(А). Поэтому исходная величина — дей- ствительное число. Она равно сумме 2тг о 2тг о 2тг . , о z = 1 + cos — • 1л + cos — • 23 + ... + cos — • (p — 1) . P P P