Текст
                    ф
s
X
го
ffi
о
го
ГО
а
ю
о
а>
о
х
л
а
х
о
S
и
и
Ф
■в-
О
Q.
Ф
Ф
и
Ю. В. Нестеренко
ТЕОРИЯ ЧИСЕЛ
Физико-
математические
науки
ACADEMA


ВЫСШЕЕ ПРОФЕССИОНАЛЬНОЕ ОБРАЗОВАНИЕ Ю. В. НЕСТЕРЕНКО ТЕОРИЯ ЧИСЕЛ Рекомендовано Учебно-методическим объединением по классическому университетскому образованию в качестве учебника для студентов высших учебных заведений, обучающихся по специальности «Математика» academ'a Москва Издательский центр «Академия» 2008
УДК 511(075.8) ББК22.13я73 Н561 Рецензенты: доктор физико-математических наук, профессор С. П. Струнков (Государственный университет — Высшая школа экономики); доктор физико-математических наук Е.М.Матвеев (заведующий кафедрой высшей математики Московского государственного технического университета им. А.Н.Косыгина) Нестеренко Ю. В. Н561 Теория чисел : учебник для студ. высш. учеб. заведений / Ю. В. Нестеренко. — М.: Издательский центр «Академия», 2008. - 272 с. ISBN 978-5-7695-4646-4 Основу учебника составляют результаты элементарной теории чисел, сформировавшейся в трудах классиков — Ферма, Эйлера, Гаусса и др. Обзорно освещены свойства простых чисел, теория диофантовых уравнений, алгоритмические аспекты теории чисел с применениями в криптографии (проверка больших простых чисел на простоту, разложение больших чисел на множители, дискретное логарифмирование) и с использованием ЭВМ. Для студентов высших учебных заведений. УДК 511(075.8) ББК22.13я73 Оригинал-макет данного издания является собственностью Издательского центра «Академия», и его воспроизведение любым способом без согласия правообладателя запрещается © Нестеренко Ю. В., 2008 © Образовательно-издательский центр «Академия», 2008 ISBN 978-5-7695-4646-4 © Оформление. Издательский центр «Академия», 2008
Введение Предмет изучения теории чисел — числа и их свойства, т. е. числа выступают здесь не как средство или инструмент, а как объект исследования. Натуральный ряд 1,2,3,4, ...,9,10,11, ...,99,100,101, ... — множество натуральных чисел — является важнейшей областью исследований, необычайно содержательной, важной и интересной. Изучение натуральных чисел было начато в Древней Греции. Евклид и Эратосфен открыли свойства делимости чисел, доказали бесконечность множества простых чисел и нашли способы их построения. Задачи, связанные с решением неопределенных уравнений в целых числах, были предметом исследований Диофанта, а также ученых Древней Индии и Древнего Китая, стран Средней Азии. В XVII в. П. Ферма и в XVIII в. Л. Эйлер внесли огромный вклад в наши знания о натуральных числах. И если Ферма оставил лишь свои открытия, не сопроводив их доказательствами, то Эйлер, оказавший большое влияние на развитие всей математики, а также механики, создал новые методы и приемы, реализовал идеи, которые играют важную роль и в современных исследованиях и приложениях теории чисел (в частности, ученый предложил использовать средства математического анализа при исследовании проблем теории чисел). Основные исследования в теории чисел можно условно сгруппировать по нескольким направлениям. Исследования свойств простых чисел. Среди натуральных чисел выделяются так называемые простые числа, т. е. числа, которые невозможно представить в виде произведения меньших натуральных сомножителей. Множество их бесконечно. Согласно асимптотическому закону распределения простых чисел, их количество в пределах от 1 до заданного числа х асимптоти- X чески равно -—. Эта теорема была независимо доказана (1896) \пх 3
Ж. Адамаром и Ш. Ж. де ла Валле-Пуссеном. Вопросы распределения простых чисел в различных числовых последовательностях, например среди значений фиксированного многочлена /(п), составляют одну из проблем этого раздела теории чисел. Для многочленов первой степени она была решена в середине XIX в Г. П. Лежен Дирихле, однако и в настоящее время не доказана бесконечность множества простых чисел в последовательности п2 + 1,п > 1. Исследование расстояний между соседними простыми числами в натуральном ряду составляет другой круг проблем этого направления. Среди нерешенных задач отметим, например, утверждение о бесконечности множества пар простых чисел р, q с условием p—q = 2, так называемую «проблему близнецов». Эти вопросы, несмотря на их кажущуюся сугубо теоретическую направленность, представляют большой практический интерес. С изучением свойств простых чисел тесно связаны исследования дзета-функции Римана. Аддитивные задачи. Здесь рассматриваются вопросы представимости целых чисел в виде сумм слагаемых определенного вида. Например, Ж. Лагранж установил (1770), что каждое натуральное число представимо в виде суммы четырех квадратов целых чисел. Впоследствии Д. Гильберт обобщил (1909) это утверждение, заменив суммы квадратов суммами произвольных фиксированных степеней, решив тем самым знаменитую проблему Варинга. И. М. Виноградов доказал (1937), что каждое достаточно большое целое число представимо в виде суммы трех простых чисел, но так называемая бинарная проблема Гольдбаха о представимости всякого четного числа п > 6 в виде суммы двух нечетных простых чисел все еще остается открытой. Диофантовы уравнения. Вопросы разрешимости уравнений в целых числах относятся к древнейшим в теории чисел. В связи с исследованиями в этой области уже упоминались имена Диофанта, Ферма и Эйлера. Теория сравнений, являющаяся важным инструментом исследования диофантовых уравнений, была систематически разработана К. Ф. Гауссом. Отметим, в частности, его квадратичный закон взаимности. Теория алгебраических чисел, толчком к созданию которой послужили в первую очередь исследования уравнения Ферма хп + + yn = zn,n>3, ив настоящее время приносит плоды в этой области. Отметим полученное П. Михайлеску (2000) решение проблемы Каталана о существовании у уравнения ху — zl = 1 единственного решения в целых числах х > 2, у > 2, z > 2,£ > 2, а именно З2 - 23 = 1. 4
Диофантовы приближения. Это раздел теории чисел о решении неравенств в целых числах, включающий теорию цепных дробей и другие алгоритмы построения приближений действительных чисел рациональными, а также ряд вопросов геометрии чисел. Среди наиболее ярких достижений отметим тео«- рему К. Ф. Рота (1954) о том, что алгебраические числа не могут слишком хорошо приближаться рациональными. Среди нерешенных вопросов отметим знаменитую проблему Литтлвуда о том, что для любых действительных чисел а,р и любого положительного г неравенство \х\ • \xol — у\\ • \х$ — уг\ < е разрешимо в целых числах х > О, yi, у^. Трансцендентные числа. В этом разделе исследуются вопросы иррациональности и трансцендентности действительных чисел. Как правило, это классические постоянные или значения аналитических функций. Неалгебраичность, т. е. трансцендентность, числа е была доказана Ш. Эрмитом (1873), а трансцендентность числа тс Ф. Линдеманом (1882). Предполагается, что любое число вида Р(е, тс), где Р(х, у) — многочлен с целыми коэффициентами, трансцендентно, однако к настоящему времени не доказана даже иррациональность числа е + тс. Нижние оценки линейных форм от логарифмов алгебраических чисел, доказанные средствами теории трансцендентных чисел (А. Бейкер, 1967), играют важную роль при нахождении решений многих диофантовых уравнений. Теория чисел — один из древнейших математических разделов. Арифметические исследования послужили базой для создания ряда разделов математики, и в то же время теория чисел использует аналитические, алгебраические, геометрические и многие другие методы для решения теоретико-числовых проблем, ряд из которых лсд ал и ждет своего решения столетиями. Для доказательства все еще открытой гипотезы Римана о нулях дзета-функции использовались методы, развитые в теории дифференциальных уравнений, теории функций комплексного переменного, функциональном анализе. А доказательство асимптотического закона распределения простых чисел впервые было получено методами комплексного анализа. Попытки решения проблемы Ферма, проблем распределения простых чисел стимулировали развитие ряда разделов алгебры. Теория чисел безусловно относится к фундаментальным разделам математики. Вместе с тем ряд ее задач имеет самое непосредственное отношение к практической деятельности. Например, благодаря в первую очередь запросам криптографии и ши- 5
рокому распространению ЭВМ исследования алгоритмических вопросов теории чисел переживают в настоящее время период бурного и весьма плодотворного развития. Криптографические потребности стимулировали исследования классических задач теории чисел, в ряде случаев привели к их решению, а также стали источником постановки новых фундаментальных проблем. Традиции исследования проблем теории чисел в России идут, вероятно, от Л.Эйлера (1707—1783), который прожил здесь в общей сложности 30 лет и многое сделал для развития науки. Под влиянием его трудов сложилось творчество П. Л. Чебыше- ва (1821 — 1894), выдающегося ученого и талантливого педагога, издавшего вместе с В. Я. Буняковским (1804—1889) арифметические сочинения Эйлера. П. Л. Чебышев создал Петербургскую школу теории чисел, представителями которой являлись А. Н. Коркин (1837-1908), Е. И. Золотарев (1847-1878) и А.А.Марков (1856-1922). Г. Ф. Вороной (1868-1908), учившийся в Петербурге у А. А. Маркова и Ю. В. Сохоцкого (1842 — 1927), основал школу теории чисел в Варшаве. Из нее вышел ряд замечательных специалистов по теории чисел, в частности В.Серпинский (1842 — 1927). Другой воспитанник Петербургского университета Д. А. Граве (1863—1939) многое сделал для преподавания теории чисел и алгебры в Киевском университете. Его учениками были О. Ю. Шмидт (1891 — 1956), Н. Г. Чеботарев (1894 — 1947), Б.Н.Делоне (1890—1980). Теоретико-числовые исследования проводились также в университетах Москвы, Казани, Одессы. В советский период в области теории чисел работали такие выдающиеся ученые, как И. М. Виноградов (1891 — 1983) (аналитическая теория чисел), А. О. Гельфонд (1906 — 1968) (трансцендентные числа) , Ю.В.Линник (1915 — 1972) (аналитическая теория чисел), А. Я. Хинчин (1896—1959) (диофантовы приближения), И. Р. Шафаревич (р. 1923) (алгебраическая теория чисел). Эта книга, представляющая собой учебник по элементарной теории чисел, включает в основном традиционные темы. Вместе с тем здесь доказаны оценки Чебышева для количества простых чисел, разложение числа е в непрерывную дробь, трансцендентность чисел е, 71 и невозможность квадратуры круга с помощью циркуля и линейки. Большое внимание уделяется также алгоритмическим вопросам теории чисел.
Глава 1 О делимости чисел Натуральные числа образуют последовательность, ряд чисел, натуральный ряд. Под этим подразумевается, что у каждого натурального числа а есть непосредственно следующее за ним, отличное от 1, натуральное число а + 1. Числа, непосредственно следующие за различными натуральными числами, не могут совпадать. Кроме того, выполняется так называемая аксиома индукции. Аксиома индукции. Если некоторое подмножество натурального ряда содержит 1 и вместе с каждым натуральным числом содержит непосредственно следующее за ним, то оно содержит все натуральные числа. Из этих простейших свойств следует, что: 1) каждое непустое подмножество натурального ряда содержит наименьший элемент; 2) каждое непустое конечное подмножество натурального ряда содержит наибольший элемент; 3) если известно, что некоторое утверждение о натуральных числах выполняется для числа а, а также из предположения, что утверждение верно при некотором п, следует справедливость этого утверждения для числа п +1, то это утверждение верно для всех натуральных чисел, больших или равных а. Про доказательства, основанные на последнем свойстве, говорят, что они выполняются методом математической индукции. Натуральный ряд бесконечен. Его обозначают буквой N. В натуральном ряду установлен порядок: из двух разных натуральных чисел меньшим будет то, которое в натуральном ряду стоит раньше. В множестве натуральных чисел определены операции сложения и умножения. Операция вычитания определена не всегда. Вычитать можно лишь меньшее натуральное число из большего.
Натуральные числа составляют множество положительных целых чисел. Если к ним добавить отрицательные числа и нуль, то получится множество целых чисел 0,±1,±2,±3,±4, .... Это множество принято обозначать буквой Z. С его элементами молено выполнять арифметические операции: сложение и вычитание, умножение и деление. Если первые три операции применимы ж любым двум целым числам, то операция деления выполнима не всегда. 1.1. Свойства делимости целых чисел В дальнейшем целые числа будут обозначаться латинскими буквами а, Ь, с и т. д. Определим важное понятие делимости чисел. Определение 1.1. Говорят, что целое число а делится па целое число ЬфО, если найдется целое число с, удовлетворяющее равенству а = be. Например, число 111 делится на 37, а 28 делится на —4, ведь 111 = 37 • 3 и 28 = (-4) • (-7). Число 5 не делится на 3. Действительно, неравенства 3 • 1 < 5 < 3 • 2 означают, что целое с, для которого -3-е = 5, должно удовлетворять неравенствам 1 < с < 2. Ясно, что такого числа в множестве Z не существует. Если целое число а делится на целое число Ь, то Ь называется делителем, а — делимым, а для обозначения этого отношения используется символ Ь\а. Если целое число а не делится на 6, то используется обозначение b \ а. Нуль делится на любое целое число а ф 0. Отметим также следующие свойства делимости. Лемма 1.1. Пусть а,Ъ,с — целые числа. 1. Имеем 1\а. 2. Если а ф 0, то а\а. 3. Если а\Ъ, то а\Ъс. 4- Если а\Ъ и Ь\с, то а\с. 5. Если а\Ъ и а\с, то а\(Ь + с) и а\(Ь — с). 6. Если а\Ъ иЬф 0, то \а\ < \Ь\. Доказательство. Справедливы равенства а = 1 • а = а • 1, доказывающие первое и второе свойства. 8
Делимость a\b означает, что с некоторым и £ Ъ имеем b = аи. Но тогда be = а(ис) иг значит, а\Ьс. Это доказывает третье свойство. Для доказательства четвертого свойства заметим, что, согласно условию, с некоторыми целыми и, v выполняются равенства b — аи, с = bv. Отсюда следует, что с = auv и, значит, а\с. Для пятого свойства, поскольку а\Ъ и а\с, имеем b = аи, c — av с некоторыми и, v Е Z. Но тогда b + c = a(u + v) и b — c = a(u — v), что завершает доказательство пятого свойства. Из равенства b = аи, где и Е Z, и условия b ^ 0 следует, что и^Ои, значит, |it| > 1. Но тогда |Ь| = |а||гх| > |а|. ■ Как уже отмечалось, не любые два числа связаны отношением делимости. В общем случае используется деление с остатком. Теорема 1.1. Для любых целого числа а и натурального b существуют единственным образом определенные целые числа q,r, удовлетворяющие условиям a = bq + r, 0<r<b. (1.1) Доказательство. Докажем существование чисел q, r. Если Ь\а, т. е. b = аи с некоторым целым и, положим q = и, г = 0. При таком выборе условия (1.1), очевидно, выполнены. Далее будем предполагать, что число а не делится на Ь. Множество М натуральных чисел, представимых в виде a—bk с некоторым целым к, не пусто. Действительно, при к = — \а\ — 1 имеем a-kb = a + (\а\ + 1)6 > а + (|о| + 1) > 1. Обозначим буквой г наименьшее из чисел множества М. Тогда г > 1, и с некоторым целым q выполняется равенство г = а — - bq. Поскольку а - b(q + 1) = г - b < г, то а - b(q + 1) £ М, и, значит, выполнено а — b(q + 1) = г — Ъ < 0. Учитывая, что равенство а — b(q + 1) = 0 невозможно, ведь Ь\а, заключаем г — b < 0. Итак, 1 < г < Ь. Существование нужных чисел g, r доказано и в этом случае. Допустим теперь, что вместе с парой чисел (q,r), удовлетворяющих условиям (1.1), существует еще одна, отличная от нее пара чисел (и, v), для которой a = bu + v, 0<v<b. (1.2) 9
Из равенств (1.1) и (1.2) следует bq + г = Ьи + v. Поэтому г — v = b(u — д), так что b\(r — v). Из неравенств (1.1) и (1.2) находим также \r — v\ < b. Согласно последнему свойству леммы 1.1 можно утверждать теперь, что г — v = 0, т. е. v = г. Но тогда 6(и — q) = 0 и, значит, и = q. Получаем, что пары (д, г) и (и, v) должны совпадать вопреки нашему предположению. Это противоречие завершает доказательство теоремы 1.1. ■ Числа г и д, определенные в теореме 1.1, называются остатком от деления числа а на 6 и неполным частным при делении а на Ь. В случае г = 0 слово «неполное» в названии q опускают. Например, справедливо равенство -1234 = 23-(-54)+ 8. Можно сказать, что остаток от деления числа — 1234 на 23 равен 8, а неполное частное равно —54. Из доказательства теоремы 1.1 следует, что целое число а делится на натуральное b в том и только том случае, когда соответствующий остаток равен нулю. Числа, делящиеся на 2, называются четными; числа, не делящиеся на 2, т. е. имеющие при делении на 2 остаток 1, называются нечетными. Для реального нахождения остатка и неполного частного можно использовать алгоритм деления столбиком. Известны и другие более эффективные алгоритмы.1 1.2. Наименьшее общее кратное и наибольший общий делитель Пусть ai, ...,an — ненулевые целые числа. Целое число К называется общим кратным чисел ai, ... ,an, если оно кратно каждому из этих чисел, т. е. а\\К, ..., ап\К. Например, \а\ • • • ап\ есть одно из их общих кратных. Определение 1.2. Наименьшее из положительных общих кратных называется наименьшим общим кратным чисел ai, ...,an. Множество общих кратных чисел ai, ...,an будет обозначаться символом jM{ai, ... ,an}, а их наименьшее общее кратное — НОК(аь ..., ап) или [аи ..., ап]. хСм., например, Ахо А. Построение и анализ вычислительных алгоритмов / А. Ахо, Дж. Хопкрофт, Дж. Ульман. — М.: Мир, 1979. 10
Теорема 1.2. 1. Любое общее кратное нескольких чисел делится на их наименьшее общее кратное. 2. Для любых отличных от нуля целых чисел ai, ..., ап выполняется равенство [ai, . ..,an] = [[ai, ... ,an_i],an]. Доказательство. Пусть т = [ai, ..., an] и К — какое-нибудь общее кратное чисел ai, ..., an. Разделив с остатком число К на га,, получим целые q, г, удовлетворяющие условиям К = mg + г, 0 < г < га. Из свойств делимости находим, что г = К — гад делится на каждое из целых чисел clj и потому есть общее кратное чисел ai, ...,an. Учитывая, что т есть наименьшее из положительных общих кратных, приходим к заключению, что неравенство г > 0 невозможно. Поэтому г = 0 и т \ К. Первое утверждение теоремы доказано. Для сокращения записи в оставшейся части доказательства будем использовать обозначения и= [ab ...,an], v = [ai, ...,an_i]. Каждое общее кратное чисел v и an делится, очевидно, на числа ai, ..., an, т. е. является их общим кратным. Поэтому v, ап} С М{а\, ..., an}. С другой стороны, каждое общее кратное чисел ai, ..., an делится на числа ai, ...,an_i и, согласно первому утверждению теоремы, делится на v. Вместе с тем оно делится на ап и потому является общим кратным чисел v иап. Это доказывает обратное включение M{v, an} D М{аъ ..., ап}. Из совпадения множеств следует равенство их наименьших положительных элементов [v, ап] = и. Ш Множество всех делителей целого отличного от нуля числа а конечно. Действительно, если d|a, то, согласно последнему свойству из леммы 1.1, выполняется неравенство \d\ < \a\. Пусть ai, a2, ..., ап — целые числа и d G Ъ — их общий делитель, т. е. d|ai, d|a2, ..., d|an. Из изложенного ранее следует, что если среди чисел ai,a2, ... ,an есть не равное нулю, то множество общих делителей этих чисел конечно. Оно всегда содержит 11
±1 и потому не пусто. В дальнейшем, если речь будет идти об общих делителях, будем подразумевать, что в соответствующем наборе ai,O29 •- • ,ап содержится хотя бы одно не равное нулю число. Определение 1.3. Наибольшим общим делителем совокупности целых чисел называется наибольшее положительное число, делящее каждое из этих чисел. Целые числа называются взаимно простыми, если их наибольший общий делитель равен 1. Найдем, например, все общие делители чисел 6,10,15. Они содержатся среди делителей 6, т.е. среди чисел ±1,±2,±3,±б. Учитывая, что 15 = 2 • 7 + 1 не делится на 2, а значит, не делится и на 6, из списка возможных делителей следует исключить ±2, ±6. Равенство 10 = 3-3 + 1 означает, что 10 не делится на 3. Поэтому в списке общих делителей остаются лишь числа ±1, и потому (6,10,15) = 1. Числа 6,10,15 взаимно просты. Множество всех общих делителей чисел ai,a2, ... ,an будем обозначать символом P{ai, ..., an}, а их наибольший общий делитель — НОД(ах, ..., ап) или (ai, ..., ап). Выведем из теоремы 1.2 соотношение между наибольшим общим делителем двух чисел и их наименьшим общим кратным. Следствие 1.1. Для любых двух натуральных чисел а,Ъ справедливо равенство [а, Ь] • (а, 6) = а • Ь. Доказательство. Произведение аЬ есть общее кратное чисел а и Ь. Согласно теореме 1.2, оно делится на их наименьшее общее аЬ кратное, т. е. -—— есть целое число. Из равенств [а,Ь] __ ab [а, Ь] _ аЬ [а, 6] аЬ следует, что ■=—— есть общий делитель чисел аи о. [а, Ь] Пусть теперь d — произвольный общий делитель а и Ь. В силу равенств ab Ь , a b 12
заключаем, что — есть общее кратное чисел а и Ь. По теореме 1.2 а г п а& тт оно делится на la, ol, т. е. отношение -г.—гт есть целое число. 11о- а[а, и\ ab ^ „ ab , ^ аЬ этому ——— > 1 и т—гг > d. Следовательно, -,—-г — наибольший d[a, Ь] [а, Ь) [а, Ь] из всех общих делителей чисел а и Ь. ■ Следствие 1.2. Яа/ш а | be u (а, Ъ) = 1, то с делится па а. Доказательство. Произведение Ьс есть общее кратное чисел b и а. По теореме 1.2 оно делится на [a, b]. Согласно условию и следствию 1.1 заключаем, что [а, Ь] = аЬ, так что ab \ be и, значит, а | с. ■ Теорема 1.3. 1. Наибольший общий делитель нескольких чисел делится па любой их общий делитель. 2. Справедливо равенство Доказательство. Пусть а\, ..., an — некоторый набор целых чисел и di, ..., dm — все их положительные общие делители. Буквой d обозначим наименьшее общее кратное этих делителей, т.е. d = [rfi, ...,dm]. Каждое из чисел ai, ...,ап есть общее кратное всех делителей di, ..., dm. Согласно теореме 1.2 молено утверждать, что d|ai, ..., d\an. Следовательно, d есть один из общих делителей чисел ai, ..., ап. При любом fc имеем d&|d, поэтому выполнено неравенство dk < d. Итак, d — наибольший общий делитель данных чисел, он делится на любой другой их общий делитель. Обозначим для краткости с— (ai, ...,an_i), d= (ai, ...,an). Так как каждое из чисел ai, ..., ^n-i делится на с, то по свойствам делимости каждое из этих чисел делится на (с, ап). Число О"п также делится на (с,ап). Следовательно, (с,ап) есть общий делитель всех данных чисел и потому (с, ап) < d. Докажем, что имеет место противоположное неравенство. Так как d есть общий делитель чисел ai, ..., an_i, по первому утверждению теоремы d\c. Вместе с тем d\an. Следовательно, d есть общий делитель чисел с и ап. Но тогда d < (c:an). Доказанные неравенства означают, что (с, ап) = d. ш 13
Применив несколько раз равенства из теорем 1.2 и 1.3, молено свести вычисление наименьшего общего кратного и наибольшего общего делителя нескольких чисел к такой же задаче для двух чисел. В свою очередь следствие 1.1 позволяет свести вычисление наименьшего общего кратного двух чисел к вычислению их наибольшего общего делителя. Эта задача будет рассмотрена далее (см. 1.3). 1.3. Алгоритм Евклида Пусть а>Ь — натуральные числа, требуется найти (а, Ъ) — их наибольший общий делитель. Задача эта, конечно, может быть решена путем перебора всех натуральных чисел d от 1 до Ь и проверки условий d\a, d\b. Однако этот путь требует большого объема вычислений. Придуманный в Древней Греции алгоритм, называемый алгоритмом Евклида, достаточно быстро находит наибольший общий делитель и при этом не разлагает числа на множители. В основе его лежит следующее утверждение. Лемма 1.2. 1. Если а — целое, Ь — натуральное и Ь\а, то множество общих делителей чисел а и Ь совпадает с множеством делителей Ь. В частности, (а, Ь) = Ь. 2. Если а = bq + r, 0 < г < 6, то V{a, 6} = V{b, г}, в частности, (а, Ь) = (Ь, г). Доказательство. Множество общих делителей чисел а и b содержится среди делителей Ь, т. е. £>{а, Ь} с Т>{Ь}. В то же время каждый делитель числа Ь, в силу условия Ь|а, будет делителем числа а, т.е. принадлежит Т>{а,6}. Следовательно, множество общих делителей чисел а и Ь совпадает с множеством делителей 6. Это доказывает первое утверждение леммы 1.2. Для доказательства второго утверждения заметим, что по свойствам делимости каждый общий делитель чисел 6 и г делит число bq + г = а и, значит, принадлежит множеству V{a, b}. Точно так же каждый общий делитель чисел а и 6 делит число a — bq = г, так что принадлежит множеству V{b, r}. Этим доказано равенство V{a,b} — V{b,r}. Отсюда следует и совпадение наибольших общих делителей пар чисел a, b и 6, г. ■ Доказанное в лемме 1.2 равенство (а, 6) = (Ь, г) позволяет при нахождении наибольшего общего делителя заменить пару чисел 14
а, 6 другой парой Ь, г. Заметим, что г < Ь, т. е. одно из двух чисел, участвующих в алгоритме, уменьшилось. Повторив несколько раз деление с остатком и заменив каждый раз пару целых чисел новой, будем каждый раз уменьшать одно из двух чисел, участвующих в работе алгоритма. Ясно, в какой-то момент одно из чисел станет равным нулю и наибольший общий делитель сможет быть найден с помощью первого утверждения леммы 1.2. Рассмотрим алгоритм подробнее. Положим го = а, г\ = Ь и обозначим Г2, ..., гп — последующие делители в алгоритме Евклида. Таким образом, получаются следующие равенства а = г0 = bqi + Г2, 0 < Г2 < Ь, Ь = n = r2q2 + гз, 0 < г3 < г2, Г4, 0 < Г4 < Г3, , . Гп-2 = rn_ign_i + rn, 0 < тп < rn^i, ^n-i = rnqn. Алгоритм останавливается, когда деление произойдет без остатка (последний остаток rn+i = 0). В соответствии с леммой 1.2 находим равенства (а, 6) = (Ь, г2) = (г2, г3) = (г3, г4) = • • • = (rn_i, гп) = (гп, 0) = гп. Таким образом, наибольший общий делитель равен последнему делителю (он же последний ненулевой остаток) в алгоритме Евклида. Пример 1.1. Найти наибольший общий делитель чисел 3009 и 894. Пользуясь алгоритмом Евклида, находим 3 009 = 894 • 3 + 327, 894 = 327 - 3 + 240, 327 = 240 • 1 + 87, 240 = 87 - 2 + 66, 87 = 66-1 + 21, 66 = 21-3 + 3, 21 = 3 • 7. Последний ненулевой остаток равен 3, поэтому (3 009,894) = 3. Для реализации алгоритма Евклида на компьютере больше подходит следующая его форма, в которой отсутствуют индексы У делителей и остатков. Алгоритм (Евклида). Даны: натуральные числа а и Ь; 6< а. Найти: наибольший общий делитель (а, Ь). 15
Шаг 1. Вычислить г — остаток от деления а на 6, т. е. найти целое г, удовлетворяющее условиям а = bq + г, О < г < Ь. Шаг 2. Если г = О, то (а, 6) = 6, СТОП. Шаг 3. Если г ф О, то заменить пару {а, Ь} парой {Ь, г} и перейти к шагу 1. Пример 1.1 показывает, что с помощью алгоритма Евклида можно достаточно быстро найти наибольший общий делитель. Оценку количества делений в нем дает следующая теорема1. Теорема 1.4. Количество делений, необходимое для вычисления с помощью алгоритма Евклида наибольший общий делитель двух положительных целых чисел, не превышает пятикратного количества цифр в десятичной записи меньшего из этих двух чисел. Доказательство. Пусть а>Ь — натуральные числа и b записывается т цифрами в десятичной системе счисления. Это значит, что Ю771""1 < b < 10m. Требуется доказать, что алгоритм Евклида, примененный к числам а, Ь, выполнит не более 5га делений с остатком. Положим го = а и обозначим г\ = 6, Г2,..., гп — последовательность делителей в алгоритме Евклида. Тогда Гг-i = ЯгП + Гг+Ъ 0 < r*+l < П, % = 1, 2, . . . , П- 1, Гп=(а,Ь). Докажем справедливость неравенств гп-г>^\ г = 0,1,...,п-1, (1.4) где X = = 1,61... есть корень квадратного уравнения X2 — X — 1 = 0. Для этого воспользуемся методом математической индукции. При г = 0 имеем гп > 1 = Х°. При г = 1 находим ^п-1 ^ гп + 1 > 2 > X, так что неравенство (1.4) опять справедливо. Предположим теперь, что l<fc<n — 1и неравенство (1.4) выполняется при всех г < к. Имеем следующую цепочку равенств и неравенств rn_fc_i = qn-кГп-к + Гп-k+i > гп-к Таким образом, неравенство (1.4) выполняется и при г = fc+1. Это доказывает справедливость (1.4) при всех г = 0,1,...,п — 1. Поскольку 10m > b и b = r\ > Х71"1, m> (n- утверждение доказано французским математиком Г. Ламе (1845). 16
В последнем неравенстве была использована оценка X > 101'5 = = 1,58... Таким образом, п < Ът + 1. ■ Рассмотрим последовательность целых чисел ип, п > О, определенную рекуррентно г*о = 0, щ = 1, ип = ип-\ + ип-2, п>2. Согласно этому определению, U2 = и\ + uq = 1, щ — U2 + и\ = 2 и т.д. В результате получается ряд чисел: 0,1,1,2,3,5,8,13, 21,..., носящий название последовательности Фибоначчи1. Из закона образования этой последовательности видно, что при п > 3 остаток от деления числа ип+\ на ип всегда равен un_i, неполное частное при этом равно 1. Таким образом, для нахождения наибольшего общего делителя {ип, un+i) потребуется п — 1 деление с остатком. Например, для вычисления наибольшего общего делителя чисел щ = 8 и щ = 13 требуется 5 делений с остатком, а для вычисления (иц.ии) = (89,144) необходимо 10 делений с остатком. Эти примеры показывают, что граница для числа делений, утверждаемая теоремой 1.4, может достигаться. Для нахождения наибольшего общего делителя нескольких чисел можно использовать так называемый обобщенный алгоритм Евклида. Если ai,<22, ...,an — целые неотрицательные числа и п2 = a\q + г, 0 < г < ai, то по лемме 1.2 выполняется равенство Т>{а\, п2} = V{r, a{\. Следовательно, (ai,a2,a3j ...,an) = {г,аъаъ, ...,an). (1.5) Наибольший общий делитель совокупности чисел не зависит от того, в каком порядке эти числа записаны, поэтому каждое число в совокупности может быть заменено его остатком от деления на любое другое число из этой же совокупности, причем наибольший общий делитель при такой замене сохранится. Ясно, что операция (1.5) уменьшит сумму чисел в списке, если а2 ^ сь\- И эта сумма не сможет быть уменьшена указанным способом лишь в случае, если все числа списка, кроме одного, равны нулю. Но в таком случае наибольший общий делитель вычисляется легко: (ai,0, ...,0) = а\. Эти рассуждения могут быть оформлены в виде алгоритма следующим образом. Итальянский математик Леонардо Пизанский (1180 — 1240) имел прозвище Фибоначчи («сын Боначчо»). 17
Алгоритм (обобщенный алгоритм Евклида). Дано: совокупность целых неотрицательных чисел {ai, ..., an}. Найти: наибольший общий делитель D = (ai, ..., ап). Шаг 1. Заменить список {а\) ..., an}, переставив его элементы так, чтобы число, стоящее на первом месте, было наименьшим из положительных чисел списка. Шаг 2, Если все числа а2, ..., ап равны нулю, положить D = = аи СТОП. Шаг 5. Заменить в списке {аи • • • , an} каждое из ненулевых чисел а2, ..., ап его остатком при делении на а\. Перейти к шагу 1. Пример 1.2. Вычислить D = (10,6,15,24). Имеем D = (6,10,15,24) = (6,4,3,0) = (3,6,4,0) = = (3,0,1,0) = (1,3,0,0) = (1,0,0,0) = 1, т. е. числа 10,6,15,24 взаимно просты. Заметим, что числа, равные нулю, могут быть исключены из списка в процессе работы обобщенного алгоритма Евклида. При этом длина списка уменьшится и на заключительном шаге весь список будет состоять из одного числа — искомого наибольшего общего делителя. 1.4. Решение в целых числах линейных уравнений Уравнения, в которых неизвестные величины выражаются целыми числами, называются диофантовыми (по имени древнегреческого ученого Диофанта1). Пусть а,Ь,с — целые числа. Рассмотрим простейшее диофантово уравнение ах + by = с. (1.6) Легко проверить, что уравнение 19а; + 12у = 1 (*) имеет бесконечное множество решений х = — 5 +12*, у = 8 — Ш, t € Z. Уравнение же 2х — 6у = 3 (**) решений в целых числах не имеет, ведь при любых целых #, у левая часть этого уравнения делится на 2, т. е. четна, а правая часть (3) есть нечетное число. 1 Диофант жил в III в. н.э. До нас дошли шесть книг его фундаментального труда «Арифметика», где рассматриваются разнообразные уравнения с целыми и рациональными неизвестными и обсуждаются способы решения таких уравнений. 18
Теорема 1.5. 1. Уравнение (1.6) разрешимо в целых числах я, у тогда и только тогда, когда (а, Ь)\с. 2. В случае разрешимости множество решений бесконечно. Все они имеют вид где пара чисел хо?Уо естъ какое-либо фиксированное решение, а t — произвольное целое число. Замечание 1.1. В приведенных уравнениях (*) и (**) имеем (19,12) = 1 и (2,6) = 2 |3. Доказательство. Предположим, что целые числа хсьУо со~ ставляют решение уравнения (1.6). Так как (a, b) \ а и (а, b) | 6, то из свойств делимости следует (а, Ь)|ажо + Ьуо = с Необходимость условия (а, 6) | с для разрешимости уравнения (1.6) доказана. Заметим, что утверждение теоремы в обратную сторону можно доказывать, считая коэффициенты уравнения a, b целыми неотрицательными числами. Общий случай всегда молено свести к этому, сменив, если потребуется, знак у неизвестной. Предполагая а > О, b > 0, докажем нужное утверждение методом математической индукции по величине суммы а + Ь. Если а + 6 = 1, то, скажем, а = 1,6 = 0. Тогда (а, Ь) = 1 и условие (a,b) \ с выполняется при любом с. Уравнение так лее разрешимо при любом с. Решением является пара чисел х = с, У = 0. Предположим, что целое п > 1, и утверждение теоремы выполняется для всех уравнений вида.(1.6) с неотрицательными коэффициентами, сумма которых положительна и не превосходит п. Пусть также а, Ъ — неотрицательные числа с суммой а + Ь = п + 1. Не уменьшая общности, можно считать, что а > Ь. В случае 6 = 0 имеем (а, Ь) = а и условие (а, 6) | с равносильно делимости а | с, т. е. равенству с = аи с некоторым целым и. Уравнение (1.6) имеет решением пару чисел х = и, у = 0. В случае b > 1 воспользуемся равенством а = b • 1 + (а — Ь). По второму утверждению леммы 1.2 из него следует (а, Ь) = (Ь, а—Ъ) и (6, а — Ь) | с. Учитывая теперь оценку b + (а — Ь) = а = п + + 1 — b < n, заключаем, согласно индуктивному предположению, что существуют целые числа и, v, удовлетворяющие равенству (а — b)u + bv = с. Это равенство может быть переписано в виде аи + b(v — и) = с, 19
откуда следует, что уравнение (1.6) имеет решением целые чис- ла х = и, у = v — и. Первое утверждение теоремы полностью доказано. Для доказательства второго утверждения заметим прежде всего, что числа (1.7) составляют решение уравнения (1.6). Действительно, а\хо + т—£л* ) + Ь \ У° " 7—1л * ) = ахо + ьУо = с. Осталось проверить, что каждое решение уравнения (1.6) представимо в виде (1.7). Если #i,yi — некоторое решение, то из равенств ах\ + Ьу\ = с, ахо + Ьуо = с следует a(xi - х0) = b(y0 - у\). (1.8) Числа a, b могут быть представлены в виде а = (а, Ь)г, b = (а, 6)5, где r,s — целые взаимно простые числа. Сократив равенство (1.8) на (а,6), получимr(x\ — xq) = s(yo — y{) и s \ г{х\—хо). Воспользуемся следствием 1.2. С его помощью, учитывая (г, s) = 1, заключаем s \ {х\ — хо) или х\ — xq = st с некоторым целым t. Итак, Ъ Xi = Xq + St = Хо + —t. (a, b) Подставив это выражение в (1.8), находим -—— t = b(yo — у{) и У\ — Уо — т—тт*- Это завершает доказательство теоремы 1.5. ■ (а, 6) Приведенное доказательство второго утверждения основано на следствии 1.2 теоремы 1.3. Покажем, как это следствие может быть выведено из первого утверждения теоремы 1.5. Второе доказательство следствия 1.2. По условию числа a, b взаимно просты. Согласно первому утверждению теоремы 1.5, существуют целые числа х, у, для которых выполнено равенство ах + by = 1. Умножив его на с, получим асх + Ьсу = с. Отсюда, так как ас и be делятся на Ь, заключаем b \ с. ш Доказательство теоремы 1.5 не позволяет находить решения уравнения (1.6) в целых числах. В силу теоремы 1.5 для этого достаточно найти хотя бы одно его решение. Способ вычисления такого решения основан на алгоритме Евклида. 20
Рассмотрим еще раз равенства (1.3). Первое из них дает г2 = = а — bqi. Подставив это выражение во второе равенство, находим г3 — b - r2q2 = b(l + q\q2) - Щ2- Далее из третьего следует rA = r2- r3q3 = а(1 + q2q3) ~ b(qi + q3 + Ч\Шъ)- Продоллсив вычисления, молено найти представление гп = аи + + bv с некоторыми целыми щ v. Но это равенство означает, что уравнение ах + by = (а, Ь) имеет решение х = и, у = v. А поскольку (а, 6) | с, решениями уравнения (1.6) будут целые числа си cv Все вычисления удобно оформить в матричном виде. Рассмотрим матрицы Ai= (® J), г =1,2, ...,п-1. С их помощью равенства (1.3) могут быть представлены так: и, значит, л/г й /д 1\ /0 1 \ Матрица, обратная к I? „ I, имеет вид I .. _ I, поэтому где Bi = ( ]. Обозначив для краткости В = Бп_х • • • В\ = = f ^ J, из равенства ( Г^-1 j == jB f ^ J найдем гп = аи + bv. Так, для примера 1.1 имеем - (? Л) (? Л) (? Л) (! Л X X 11 -37> 21
Это матричное равенство означает, что уравнение 3 009а; + + 894у = 3 имеет решение х = —41, у = 138. Обратимся теперь к более общей задаче. Рассмотрим систему диофантовых уравнений ■'• 'П..П... ' (1-9) ra.l^l + ' * * + где коэффициенты уравнений aij^bi — целые числа. Неизвестные xi, ..., хп также предполагаются целыми. С этой системой связываются две матрицы «т,2 • • - Первую будем называть матрицей системы, а вторую — расширенной матрицей. В матричном виде эта_система уравнений может быть переписана так: А • х = Ь, где Ъ — вектор-столбец размерностью 7П, состоящий из правых частей системы (1.9). В случае если все правые части системы (1.9) равны нулю, система называется однородной. Далее опишем процесс, позволяющий находить все решения системы (1.9) в целых числах. Составим матрицу Л, содержащую т + п строк и п +1 столбцов. Первые т строк этой матрицы совпадают со строками матрицы В. Продолжения первых столбцов матрицы А совпадают со столбцами единичной п х п матрицы Еп, а продолжение последнего столбца матрицы В состоит из нулей. Таким образом, матрица Л имеет вид А - Еп 0 Столбцы матрицы Л в порядке следования слева направо обозначим [,A]i, ..., [Д]п+1- Часть матрицы Л, образованную столбцами [.A]i, ..., [А]т будем называть главной частью матрицы Л. 22
Процесс решения системы (1.9) распадается на два этапа. На первом из них выполняются некоторые преобразования, имеющие целью привести Л к специальному виду М=(с VK о (l.ii) Здесь С, К — целочисленные матрицы размером т х п и п х п соответственно, и матрица С имеет трапециевидную форму r^i С1Д С2Д Сг,1 0 С2,2 Сг,2 0 0 Сг,3 ... 0 ... 0 ... Ср|Г 0 ... 0 ... 0 ... 0 0 0 \Ст,1 Ст,2 Ст,г О ) (1.12) причем схд > 0, ..., Сгр > 0. Для приведения матрицы Л к виду А' разрешается выполнять преобразования трех типов (допустимые преобразования): а) переставить столбцы главной части Л; б) изменить знаки у всех элементов какого-либо столбца главной части; в) умножить первый столбец главной части на некоторое целое число и вычесть результат из другого столбца главной части. Опишем последовательность выполняемых преобразований подробнее. По ходу работы алгоритма матрица Л будет меняться, однако для краткости будем обозначать замещающие ее матрицы той же буквой Л, а для элементов этих матриц по-прежнему будем использовать обозначения a^j. Таким образом, знак dij применяется для числа, стоящего на пересечении строки с номером г и столбца с номером j, меняющегося в процессе вычислений. Сама последовательность вычислений будет похожа на обобщенный алгоритм Евклида. Шаг 1. Изменить главную часть матрицы Л с помощью допустимых преобразований вида а и б так, чтобы в левом верхнем углу Л стояло положительное число, наименьшее среди абсолютных величин всех ненулевых элементов первой строки главной части. Шаг 2. Разделить каждое из чисел a\j с остатком на ахд, т. е. найти представления 0<Sj< j = 2, ..., n. 23
Заменить в матрице А столбцы [Л]2, ...,[Л]п столбцами соответственно. Вернуться к шагу 1 и повторить все операции. В результате (как и в обобщенном алгоритме Евклида) будет уменьшаться сумма абсолютных величин элементов первой строки главной части Л. Процесс завершится лишь тогда, когда все элементы ai52, • • • > ai,n станут равными нулю. На этом этапе вычислений определится первый столбец матрицы А!. Дальнейшая работа происходит со столбцами [Л]2, ..., [Л\п. Заметим, что первые элементы этих столбцов равны нулю, и потому выполнение допустимых преобразований с этими столбцами не будет менять первую строку Л. В дальнейшем необходимо выполнить операции п. 1 и 2 с матрицей, образованной столбцами [Л]2, ..., [А]п, работая с элементами второй строки этой матрицы (все элементы первой строки равны нулю). В результате матрица А преобразуется к виду а272 = 02,2 > О, а2>з = • • • = a2,n = 0. Ясно, что продолжение подобных действий со столбцами [Л]з, ..., [Л]п в конечном счете приведет матрицу А к виду А!. Во второй части алгоритма происходит работа со всеми столбцами матрицы А1'. По-прежнему будем обозначать их [Л]ь ...,[Д]п+1. Шаг 3. Обозначим к\ и 1\ неполное частное и остаток от деления первого элемента столбца [.A]n+i на схд и заменим столбец [Д]п+1 на [Д]п+1 ~~ fci[^]i- Обозначим далее &2 и t<i неполное частное и остаток от деления второго элемента нового столбца РЧп+i на С2,2 и заменим столбец [Д]п+1 на [*A]n+i "~ fol-^b- Продолжим действовать таким же образом, пока столбец [*4]n+i не будет заменен на [Л]п+1 ~ &гИ]г- На этом вычисления заканчиваются. Первые г элементов столбца [Л]п+1 равны £i, ... ,£г, а остальные обозначим последовательно ^г+ъ • • • > ^т+п- Заметим, Теорема 1.6. 1. Система уравнений {1.9) 'разрешима в целых числах тогда и только тогда, когда И\ = • • • = £m = 0. 2. В случае разрешимости обозначим s = п — г иЩ е Zn — вектор с координатами £m+i, ..., £т+п в порядке следования. Тогда общее решение системы уравнений (1-9) имеет вид х0 + ti[tf]r+i + • • • + t8[K]n, (1.13) где ti, ...,ts пробегают всевозмоэюпые наборы целых чисел, а [K]j — соответствующие столбцы получившейся в результате преобразований матрицы^ (см. (1.11)). 24
Доказательство. Заметим, что каждый столбец главной части матрицы А! есть линейная комбинация столбцов главной части исходной матрицы Д, отвечающей системе уравнений (1.9)^ Поэтому равенства 1\ = • • • = Иш — 0 означают, что столбец Ь есть линейная комбинация столбцов матрицы А с целыми коэффициентами. Это, конечно, означает разрешимость системы (1.9). Заметим, что преобразование, обратное к допустимому, также допустимо. Это значит, что каждый столбец главной части исходной матрицы А есть линейная комбинация столбцов главной части матрицы А!. Если система уравнений (1.9) разрешима в целых числах, то вектор Ъ есть линейная комбинация с целыми коэффициентами столбцов матрицы А. Но тогда, в силу изложенного ранее, он есть линейная комбинация столбцов матрицы С. Будем использовать обозначение [C]i, ..., [С]п для столбцов матрицы С. Заметим, что все столбцы [C]j, j > г, нулевые. Поэтому для некоторых целых чисел г/i, ..., иг выполняется равенство u1[C}1 + ---+ur[C]r = b. Сравнивая в этом равенстве первые координаты, заключаем, что ^1^1,1 — Ъ\. Отсюда следует, что к\ = и\ и 1\ = 0. Сравнение вторых координат дает U2C2,2 = 62 — &iC2,i и, следовательно, &2 = Щ и ^2 = 0. Продолжив эти рассуждения, находим к\ — • • • = £г = 0 и uj = kj,j = 1, ... ,г. Но тогда Ь — &i[C]i — • • • — kr[C]r есть нулевой вектор и, значит, £r+i = • • • = £п = 0. Это завершает доказательство первого утверждения теоремы. Любая допустимая операция со столбцами матрицы равносильна умножению справа этой матрицы на некоторую целочисленную матрицу с определителем ±1. Так, изменение знака у всех элементов столбца с номером к равносильно умножению на диагональную матрицу, у которой все элементы главной диагонали равны 1, за исключением стоящего в fc-й строке, который равен —1. Перестановка столбцов с номерами ^, к равносильна умножению на матрицу, у которой все столбцы, кроме имеющих номера I и fc, совпадают со столбцами единичной матрицы, на пересечении к-то столбца с £-й строкой и £-го столбца с к-й строкой стоят единицы, а все остальные элементы этих столбцов равны 0. Вычитание первого столбца, умноженного на целое д, из столбца с номером к равносильно умножению на матрицу, совпадающую с единичной матрицей, за исключением элемента, стоящего на пересечениии первой строки и fc-ro столбца, где вместо 0 стоит —q. 25
Из изложенного ранее следует равенство )■£)•-• где S — некоторая целочисленная матрица размером nx n с определителем ±1. Но тогда С = А'8иК = Еп«8, так что С = = А К. Предположим теперь, что система (1.9) разрешима. Тогда из изложенного ранее следует равенство с некоторым вектором v Е Zn. Отсюда находим хо = v и 0 = = — b + А • v. Но тогда 0 = — Ь + А • хо и хо есть решение системы (1.9). Разобьем матрицу К на две части Ki = ([K]i, ..., [К]г) и К 2 = ([K]r+i, ..., [К]п). Последние s = п — г столбцов матрицы С нулевые, поэтому из установленного ранее равенства С = А-К следует АК2 = 0. Но это значит, что все столбцы матрицы К2, т. е. векторы [K]r+i, .. •, [К]п, есть решения однородной системы уравнений, соответствующей (1.9). Тогда с любыми целыми числами *i, ..., ts выполняется равенство А • (хо + £i[K]r+i + • • • + + *e[K]n) = Ъ и вектор (1.13) есть решение системы (1.9). Для любого решения х G Zn системы (1.9) должно выполняться равенство А (а? — xq) = 0. По доказанному ранее К есть целочисленная матрица с определителем ±1. Поэтому обратная к ней матрица имеет целые элементы. Обозначив у = К~х(х — — хо) G Zn, будем иметь Су = А • Ку = А • (х - хо) = 0. Учитывая теперь вид (1.12) матрицы С, находим, что первые г координат вектора у равны 0. Значит, х — xq = К • у = К2 • t, где t e Z5 есть вектор, состоящий из последних 5 координат вектора у. Если эти координаты есть £i, ... ,ts, получаем представление (1.13) для вектора х. Теорема полностью доказана. ■ Покажем, как работает изложенный ранее алгоритм. Пример 1.3. Решить уравнение 87xi + 13^2 + 6x3 = 1. Выполнив допустимые преобразования, находим 26
(Ы 13 6 -1\ /6 13 87 -1\ /6 1 3-1 10001 [ 0 0 1 0 | 00 1 0 0 100)010 0)01 0 0 0 0 10/ \1 0 0 0 / \1 -2 -14 0 16 3 -1\ /10 0 0 001 0 | 10 0 10 10 О О I ~ I 1 -6 -3 1 ^-2 1-14 0 / \-2 13 -8 -2/ Данное уравнение разрешимо, и его общее решение имеет вид (°\ (Л ■*i ~6 +*2 -з , ti,t2ez. В заключение установим необходимое и достаточное условие разрешимости системы линейных диофантовых уравнений, аналогичное первому утверждению теоремы 1.5. При этом будем предполагать, что уравнения системы (1.9) независимы, т.е. ранг матрицы А равен га. В противном случае некоторые уравнения молено исключить из системы, не изменив множества решений. Чтобы сделать формулировку и доказательство по возможности более короткими, для каждой целочисленной матрицы М ранга га будем обозначать символом D{M} наибольший общий делитель миноров этой матрицы порядка га. Теорема 1.7. Если уравнения системы (1-9) независимы, то равенство D{A} = £>{В} необходимо и достаточно для ее разрешимости в целых числах. Доказательство. Будем использовать в доказательстве обозначения, введенные в алгоритме решения систем и в доказательстве теоремы 1.6. При выполнении допустимых преобразований ранги матриц не меняются. Точно так же по второму утверждению леммы 1.2 при выполнении допустимых преобразований не будут меняться наибольшие общие делители миноров максимального ранга. Поэтому_rgA =_rgC, т.е. г = га, и D{A} = £>{C}, D{B} = = £){(С, -£)}, где I — вектор-столбец с координатами £i, ..., £т. Если система уравнений (1.9) разрешима в целых числах, то по теореме 1.6 имеем £\ = ... = 1т = 0. Но тогда матрица (С,£) имеет единственный отличный от нуля минор порядка га_и он равен определителю матрицы С. Поэтому D{C} = D{(C,^)}, и это доказывает необходимость условия теоремы. 27
Предположим теперь, что выполнено равенство D{A} = = D{B}. Так как rg С = т, то система уравнений Сх = 1 разрешима в рациональных числах. Поэтому существуют целые взаимно простые числа г/о, • • •, ит, щ > О, такие, что щ! = ui[C]i + • • • + ит[С}т. (1.14) Обозначим Aj определитель матрицы, построенный на столбцах и До = схд • • • Сг,г — единственный отличный от нуля минор порядка т матрицы С. Выразим вектор 1 с помощью равенства (1.14) через векторы [С]&, и подставим это выражение в определитель Aj. Поскольку определитель линейно зависит от элементов первого столбца, а, кроме того, определитель с двумя совпадающими столбцами равен нулю, находим uqAj = ±г^До. Справедливы равенства Умножая их на щ и пользуясь следствием 2.2 (см. гл. 2.2), будем иметь u0D{B} = (иоДо, • • •, и0Ат) = (г*оДо, и\До . ■., итА0) = = До = £>{А}. Согласно условию, выполняется равенство D{A} — -D{B}, поэтому ito = 1. Теперь сравним первые координаты векторов в (1.14). Получившееся при этом равенство 1\ = и\С\,\ и неравенства 0 < 1\ < < схд означают, что 1\ — 0, щ = 0. Сравнение вторых координат в (1.14) дает l<i — U2C22, откуда в силу 0 < £2 < ^2,2 получим ^2 = 0, U2 = 0. Продолжив действовать точно так же, найдем 1\ = • • • = £т = 0. По теореме 1.6 теперь можно утверждать, что система диофантовых уравнений (1.9) разрешима в целых числах. ■ Задачи для самостоятельного решения 1. Найдите наибольший общий делитель чисел: а) 385 и 781; б) 1 234 и 56 789; в) 53 357 и 70 303; г) 221 - 1 и 227 - 1; д) 28, 12 и 60. 2. Найдите наименьшее общее кратное чисел: а) 33 и 35; б) 34 и 38; в) 30 и 165; г) 8 192 и 32 768; д) б, 10 и 15. 28
3. Решите в целых числах уравнения: а) 11а; + 23?/= 24; б) 15я + 19у = 1; в) 253х-449у = 1; г) 53х + 47г/ = 11; д) 81х - 48у = 33; е) 2582-172?/=112; ж) 38х+114у = 209; з) 122х + 129у = 2; и)91х + 117у = 156. 4. Найдите наименьшее решение в положительных числах уравнения: а) 119а: - 67у = 34; б) 24 335х - 3 588?у = 1. 5. Решите в целых числах уравнения: а) 10x + 7y-8z = l; б) 23ж-53у+ 80z = 101; в) 17х + 13у + 8z = 89; г) 17х + 23у + 3z = 200; д) 2д: + Зу + 7z = 1; е) 6x-5y + 3z = l. 6. Решите в целых числах системы уравнений: = -3, ■=-5, [lly-8z = 2; f 3xi - 2x2 + 4x3 + 2x4 = 19, I 5xi + 6x2 - 2x3 + 3x4 = 23; - 8x4 = 36, 3xi — 4x2 + 7хз + 5x4 = 12.
Глава 2 Простые и составные числа Натуральное число называется составным, если его можно представить в виде произведения двух меньших натуральных чисел. Заметим, что оба множителя при этом отличны от 1. Примеры составных чисел строить очень легко. Для этого нужно взять какие-нибудь два натуральных числа, не равных 1, и перемножить их. Так, 2-3 = 6, 23-47=1 081,127-9 721 = 1 234 567-составные числа. Гораздо труднее разложить какое-нибудь заданное число на множители, иногда, как в следующих двух примерах, для этого требуется применение вычислительных средств: 1111 111 = 239-4 649, 11111111111 = 21 649 • 513 239. Некоторые натуральные числа, отличные от 1, вообще нельзя представить в виде произведения меньших множителей. Такие числа называются простыми. Все сомножители в приведенных примерах — простые числа. Эта глава посвящена в основном обсуждению свойств простых чисел. 2.1. Простые числа. Решето Эратосфена. Бесконечность множества простых чисел Как было указано ранее, отличное от 1 натуральное число называется простым, если его нельзя представить в виде произведения меньших натуральных сомножителей. Всякое простое число р имеет лишь два положительных делителя: 1 и р. Множители, в произведение которых раскладывается составное число, являются его делителями. Поэтому можно утверждать, что натуральное число — составное, если оно делится на некоторое меньшее число, отличное от 1. Так, все четные числа, превосходящие 2, делятся на 2 и потому все они составные. 30
Число 7 не делится ни на одно из чисел 2,3,4,5,6 и потому составным не является, т. е. простое. Чтобы проверить, пользуясь указанным правилом, будет ли составным число 1 009, нужно разделить его на все числа из ряда 2,3,4, ..., 1 007,1 008. Для сокращения этого процесса можно воспользоваться следующим утверждением. Лемма 2.1. Пусть N — составное число up — наименьший из его делителей, удовлетворяющих условию р > 1. Тогда р — простое число up2 < N. Доказательство. Так как N составное число, по определению оно может быть представлено в виде N = ш;, причем 1 < <u<N,l<v<N. Согласно условию леммы, имеем р2 <uv = = N. Пусть d — какой-либо отличный от единицы делитель р. Свойства d | р,р | N означают, что d есть делитель ЛГ, и по определению р имеем d>p. Итак, число р не имеет делителей, удовлетворяющих неравенствам 1 < d < р. Значит, р — простое число. ■ Следствие 2.1. Каждое целое число N > 1 имеет простой делитель. Доказательство. Если N — простое число, то утверждение выполнено, поскольку N \ N. Если же N — составное число, то утверждение имеет место согласно лемме 2.1. ■ Лемма 2.1 позволяет утверждать, что если 1 009 составное число, то оно имеет простой делитель р, удовлетворяющий неравенствам 2 < р < 31. Поскольку все четные числа, отличные от 2, не просты, и составными являются делящиеся на 3 числа 9,15,21,27, а также число 25 = 5 • 5, заключаем, что возможные делители 1 009 содержатся среди чисел 2,3,5,7,11,13,17,19,23,29,31. (2.1) Теперь уже сравнительно легко обнаружить, что ни одно из них не является делителем 1 009, так что это число простое. Числа (2.1) составляют список всех простых чисел р из промежутка 2 < р < 31. Действительно, если среди чисел (2.1) есть составное число, оно должно иметь простой делитель, не превосходящий 5. Но все числа, делящиеся на 2,3,5, уже исключены нами из отрезка 2 < х < 31. Приведенным рассуждениям можно придать общую форму, и в результате мы получаем метод, позволяющий сравнительно 31
легко определить список всех простых чисел до заданной границы N. Этот метод носит название решето Эратосфена1. Алгоритм 2.1 (решето Эратосфена). Алгоритм находит список всех простых чисел р\ < р2 < ... до заданной границы N. Шаг 1. Выпишем все целые числа 2,3,4, 5, ..., N — 1, N. Положим pi = 2 и начиная с 4 = р\ будем вычеркивать числа, двигаясь с шагом 2. (Заметим, что все числа, вычеркнутые на этом шаге алгоритма, — четны, т. е. делятся на 2.) Шаг 2. Пусть к > 2 и уже определены числа pi, ... ,Pk-i- Обозначим pk первое невычеркнутое число, следующее зар/-_1. Если Рк > ^> то обозначаем р£+ъР/с+2> • • • все оставшиеся невычерк- нутыми числа, следующие зар/*, в порядке возрастания. На этом алгоритм завершает свою работу. Шаг 3. Если р| < ЛГ, то вычеркиваем числа, начиная с р\ и двигаясь до N с шагом р&. Вычеркнутые ранее числа также принимаются в учет, но не вычеркиваются еще раз. По завершении этой процедуры алгоритм увеличивает индекс к на единицу и переходит к шагу 2. Для обоснования корректности алгоритма заметим, что в процессе его работы вычеркиваются только составные числа, а все простые остаются невычеркнутыми. Предположим теперь, что среди невычеркнутых чисел осталось хотя бы одно составное, обозначим его буквой а, 2 < а < N. По лемме 2.1 это число имеет простой делитель р, удовлетворяющий неравенствам р2 < а < N. Как и всякое простое, число р осталось невычеркну- тым по окончании работы алгоритма. Вместе с тем неравенство р2 < N означает, что в результате одного из проходов алгоритма по списку чисел от 2 до ЛГ были вычеркнуты, начиная с р2, все числа, делящиеся на р. Но тогда и а должно содержаться среди вычеркнутых чисел. Получившееся противоречие доказывает, что алгоритм оставляет невычеркнутыми только простые числа. Это завершает обоснование алгоритма. Простые числа составляют довольно большую часть натурального ряда. Так, среди первых 100 натуральных чисел имеется 25 простых, а среди первых 1016 натуральных — 279 238 341 033 925 простых. Так, простыми будут Ь^ 20071^^1 и 2007^^12007. 44 44 275 ^ратосфен (276 — 196 гг. до н. э.) — древнегреческий математик, географ и астроном. 32
Наибольшие из известных в настоящее время простых чисел имеют вид q24 036 583 __ •. q2^ 964 951 __ i о30 402 457 — 1 Они записываются соответственно 7 235 733, 7 816 230 и 9 152 052 десятичными цифрами. Наибольшее из них было найдено в декабре 2005 г. Впрочем, пока эта книга готовится к изданию, возможно рекорд будет побит. Следить за достижениями в этой области можно в Интернете по адресу http://primes.utm.edu/ largest.html. Теорема 2Л (теорема Евклида1). Множество простых чисел бесконечно. Доказательство. Допустим, что простые числа составляют конечное множество {pi,P2> •••?Pm}- Рассмотрим натуральное число N = р\ • • • рт + 1. Согласно следствию 2.1, оно имеет простой делитель р. Так как N не делится ни на одно из чисел pi, ... ,pm, но делится на р, то простое число р отлично от каждого из р\, ..., рт. Получившееся противоречие завершает доказательство теоремы Евклида о простых числах. ■ 2.2. Основная теорема арифметики Целое число б 025 729 может быть разложено на множители следующим образом: 6 025 729 = 2 419 • 2 491 = 2.173 ■ 2 773. (2.2) Попытки разложить далее каждый из четырех сомножителей требуют некоторых усилий. Тем не менее, согласно теореме, носящей название «Основная теорема арифметики», разложения на меньшие сомножители должны существовать. Теорема 2-2. Каждое целое число, большее единицы, раскладывается в произведение простых чисел и притом единственным способом, если не учитывать порядок сомножителей. Замечание 2.1. Теорема утверждает, что два произведения простых чисел могут быть равны друг другу лишь в случае, если они имеют одинаковые сомножители и, возможно, отличаются порядком их Теорема о простых числах содержится в IX книге «Начал» Евклида. По некоторым косвенным данным, предполагается, что он жил в Александрии в Ш в. до н. э. 2 Нестеренко 33
следования. Множители в разложениях (2.2) не могут быть простыми. Более того, каждое простое число, входящее в разложение 2173, должно, согласно теореме 2.2, присутствовать в разложениях 2419 или 2491. Но это легко проверить, вычислив наибольшие общие делители. С помощью алгоритма Евклида находим (2 173,2 419) = 41, (2 173,2 491) = 53. Теперь, выполнив деления, получим 2 173 = 41 • 53, 2 419 = 41 • 59, 2 491 = 47 • 53, 2 773 = 47 • 59, так что 6 025 729 = 41 • 47 • 53 • 59, и все сомножители в последнем разложении, как легко проверить, просты. Доказательство, Воспользуемся методом математической индукции. Числа 2,3, как мы в этом убедились, просты, и, значит, утверждение теоремы для них справедливо. Пусть натуральное п > 3 и каждое целое число, меньшее п, единственным способом представимо в виде произведения простых. Докажем сначала, что п может быть разложено в произведение простых чисел. По следствию 2.1 существует простое pi, делящее п. В случае п = р\ искомое произведение состоит из одного множителя. Если же р\ < п, то п = pirn, где 1 < т < п. Согласно индуктивному предположению, найдутся простые числа Р2, • • • 5 Pr j для которых т = Р2-- -рг- Тогда п = р\р2 "-Рг- Существование разложения доказано. Предположим теперь, что возможны два разложения n = pi---pr = qi---q8, (2.3) где pi, qj — простые числа. Если pi совпадает с каким-либо из чисел qj, то, сократив равенство (2.3) на этот общий множитель, получим два различных представления числа т = рг • • • рг < п в виде произведения простых чисел. Но это, согласно индуктивному предположению, невозможно. Значит, р\ отлично от всех чисел qj. Все положительные делители р\ исчерпываются числами l,pi, а все положительные делители q\ исчерпываются числами l,?i. Лишь единица присутствует в обоих множествах. Значит, (pi,#i) = 1. Согласно следствию 1.2 из теоремы 1.2 число и = q<i- • -qs < п делится на ръ т.е. и = piv, v e Z. Число г;, согласно индуктивному предположению, можно представить в виде произведения простых чисел. Это приводит к новому разложению и на простые сомножители, ведь все числа qj отличны от р\. Итак, и допускает два различных представления в виде произведения простых чисел, вопреки 34
индуктивному предположению. Получившееся противоречие завершает доказательство теоремы. ■ Утверждение о единственности разложения можно доказать и по-другому, не ссылаясь на следствие 1.2. Второе доказательство единственности. Как и в первом доказательстве, будем использовать индукцию по величине раскладываемого числа п. Допустим существование двух разложений (2.3). Повторив рассуждения из начала первого доказательства единственности, можно прийти к случаю, когда простое число р\ отлично от всех qj при любых индексах j. He уменьшая общности, можно считать при этом, что р\ < q\. Рассмотрим целое число а = п — p\q^ • • • qs. Его можно двумя разными способами представить в виде произведения меньших чисел а = (91 - Pi)«2' • 'Qs = Pib < n, где b = p2 • * • Pr ~ 42 " ' Qs- Оба числа q\ — p\ и 6 могут быть разложены в произведения простых множителей, и таким образом будут получены два разложения числа а < п в произведения простых. Докажем, что они различны. В разложение а — р\Ъ входит простое число р\. Оно отлично от всех простых чисел #2> • • • ? Qs в разложении а = (qi — Pi)q2' "Qs- Но оно не входит и в разложение числа q\ — pi, в противном случае мы имели бы p\\q\, вопреки простоте q\ и предположению Р\ ф q\- Получившееся противоречие завершает доказательство. ■ Третье доказательство единственности. Заметим, что если натуральное число единственным образом раскладывается в произведение простых чисел, то каждый его простой делитель должен входить в это разложение. Как и ранее, можно вести доказательство с помощью индукции по величине раскладываемого числа. Предположив, что существуют два разложения (2.3), не содержащие одинаковых простых чисел в левой и правой частях, можно считать, что р\ — самое маленькое простое среди Pj и точно так же q\ — самое маленькое среди qi. Кроме того, можно предполагать, что р\ < q\. Поскольку п — составное число, имеем р\ < q\ < п и, значит, p\q\ < п. Натуральное число b = п — piqi меньше, чем п. Кроме того, оно делится на оба простых числа pi,gi. Согласно индуктивному предположению, оно единственным образом раскладывается в произведение простых чисел и потому оба эти простые числа должны входить в разложение Ь. Но тогдаpiqi\b и p\q\\n = q\q2 ---qs- Следовательно, 35
Pi\u = #2 * * * 9s- Но это невозможно, так как и < п и по индуктивному предположению каждый его простой делитель должен входить в его разложение на простые множители. ■ Среди простых сомножителей, присутствующих в разложении п = pi • • -рг, могут быть и одинаковые. Например, 25 = 5 х х 5 = 52. Их можно объединить, воспользовавшись операцией возведения в степень. Кроме того, простые сомножители можно упорядочить по величине. В результате получается разложение п = Pi1 " * -Pfcfc5 Pi < V2 < • • • < Pk- Такое представление числа называется каноническим разложением на простые сомножители. Например, каноническое представление числа 2 520 имеет вид 2 520 = 23 • З2 • 5 • 7. Набор различных простых чисел, а также набор показателей степени otj определяются по числу п единственным способом. Для кратности вхождения простого числа р в каноническое разложение числа п будет использоваться обозначение vp(n). Если п не делится на простое р, будем считать vp(n) = 0. Например, v2(2 520) = 3, v3(2 520) = 2, vn(2 520) = 0. При таком определении справедливо представление р\п В дальнейшем будут использоваться подобные выражения с указанием под знаком произведения тех или иных условий на входящие в него простые числа. Кроме того, иногда бывает удобно формально записывать и бесконечные произведения, если лишь конечное количество входящих в них сомножителей отлично от единицы. Например, равенство (2.4) может быть записано в виде где произведение берется по бесконечному, согласно теореме 2.1, множеству всех простых чисел. В этом произведении лишь конечное количество сомножителей отлично от единицы, ведь Vp(n) ф 0 лишь для простых делителей р числа п, а это множество конечно. При умножении степеней с одинаковым основанием показатели степени складываются, поэтому для любых двух целых чисел а, 6 и простого числа р выполняется равенство
vp(afc) = vp(a) + vp(b). (2.5) Отсюда, в частности, следует, что целое число п делится па число d в том и только том случае, когда для любого простого числа р выполпяются перавепства vp(rf) < vp(n). (2.6) Действительно, равенство п = du в силу (2.5) и неравенства »р(и) > 0 приводит к (2.6). Если же, наоборот, для любого* простого числа р выполняется неравенство (2.6), то целое число и = V удовлетворяет равенству п = du и, значит, d\n. Еще одно простое, но полезное свойство будет использоваться далее. Если а и b — патуральпые числа, причем для каждого простого числа р выполпепо равепство vp(a) = vp(6), то а = Ь. Определим канонические разложения наименьшего общего кратного и наибольшего общего делителя нескольких натуральных чисел. Следствие 2.2. Для любых патуральпых чисел ai, ..., ат и любого простого числа р справедливы равепства vp([ai, ..., От]) = max{vp(ai), ..., vp(am)}; (2.7) vp((ab ..., От)) = min{vp(ai), ..., vp(am)}. (2.8) Доказательство. Определим целое число М равенством Из неравенств vp(M) > vp(aj) следует aj|M, т.е. М — общее кратное чисел ai, ... ,am. Если К — какое-нибудь общее кратное этих чисел, то при любом простом р должны выполняться неравенства vp(K) > vp(aj), j = 1, ..., m, и, значит, vp(K) > max{vp(ai), ..., vp(am)} = vp(M). Следовательно, М\К и M < К. Это доказывает, что М есть наименьшее общее кратное данных чисел и (2.7). 37
Равенство (2.8) доказывается аналогично. Определим Из неравенств vp(D) < vp(aj) следует D\uj, т.е. D — общий делитель чисел ai, ..., am. Если L — какой-нибудь общий делитель этих чисел, то при любом простом р должны выполняться неравенства vp(L) < vp(aj), j = 1, ...,га, и значит, vp(L) < min{vp(ai), ..., vp(am)} = vp(£>). Следовательно, L\D и D > L. Это доказывает, что D есть наибольший общий делитель данных чисел и (2.8) ■ Приведенные рассуждения дают иные доказательства теорем 1.2 и 1.3. Равенства (2.7) и (2.8) могут использоваться также и для вычисления наименьшего общего кратного и наибольшего общего делителя нескольких чисел. Так, имеем 2 737 = 7 • 17 • 23, 9 163 = 72 • 11 • 17, 9 639 = З4 • 7 • 17 и, значит, [2 737,9 163,9 639] = З4 - 72 • 11 • 17 • 23 = 17 070 669, (2 737,9 163,9 639) = 7 • 17 = 119. Этот способ применим лишь, если числа сравнительно невелики. Разложение на простые сомножители больших чисел — очень трудоемкая задача, и в таком случае удобнее использовать алгоритмы, приведенные в гл. 1. Представим еще несколько следствий основной теоремы арифметики. Их можно было бы вывести и из теорем 1.2 и 1.3 (см. 1.2), но приводимые здесь доказательства короче и единообразнее. В дальнейшем предполагается, что Ь, сц, ..., ап — произвольные натуральные числа. Следствие 2.3. Если число Ь взаимно просто с каждым из чисел ai, ..., an, то оно взаимно просто с произведением этих чисел. Доказательство. Обозначим d = (Ь, а\ • • • ап). Пусть р — какое-либо простое число. Так как \v{d) < vp(b), то в случае vp(6) = 38
= 0 имеем также vp(d) = 0. Если же vp(6) > 1, то в силу взаимной простоты Ъ и aj имеем vp(aj) = 0, 1 < j < п. Но тогда vp(d) < vp(ai • • • an) = vp(ai) + ... + vp(an) = 0. Итак, в любом случае выполняется vp(d) = 0. Поскольку это верно для любого простого числа р, заключаем d = 1. ■ Следствие 2.4. При любом натуральном Ь выполняется равенство (6аь ..., Ьап) = Ь(аь ..., ап). Доказательство. Для каждого простого числа р, пользуясь равенством (2.5) и следствием 2.2, находим vp((6ai, ..., ban)) = niin vp(6aj) = min (vp(b) + vp(aj)) = nain vp(aj) = vp(6)+vp((ai, • • •, an)) = vp(6(ab ..., an)). Это доказывает нужное равенство. ■ Определение 2.1. Целые числа ai, ...,an называются попарно взаимно простыми, если для любых двух индексов г < j выполняется (a{,aj) = 1. Числа 6,10,15 взаимно просты, но не являются попарно взаимно простыми, так как (6,10) = 2. Более того, имеем (6,15) = 3, (10,15) = 5. Попарная взаимная простота означает, что для каждого простого р среди чисел ai, ..., ап не более чем одно может делиться на р. Иначе это условие можно записать в виде max vp(aj) = vp(ai) + ... + vp(an), для любого простого р. Следствие 2.5. Наименьшее общее кратное попарно взаимно простых натуральных чисел а\, ..., ап равно их произведению^ т. е. Доказательство. Пусть р — произвольное простое число. Тогда vp([ab ... ,an]) = ma ... + vp(an) = vp(ai • • • an). Поскольку это верно для любого простого числа р, получаем требуемое равенство. ■ 39
Следствие 2*6. Если число b делится на каждое из попарно взаимто тр&стых чисел ai, ... ,an, то b делится и на их произведение а\ • • -ап. Доказательство. По теореме 1.2 число b делится на наименьшее общее кратное {ai, ..., an], равное, согласно следствию 2.5, произведению а\ • • • ип. Молено дать этому утверждению и другое доказательство, основанное на свойствах показателей vp. Поскольку при любом j выполнено су|Ь, для любого простого числа р имеем vp(b) > > Vp(aj) и max Vpidj) = vp(ai) + ... + vp(an) = vp(ai • • • an). Поскольку это верно для любого простого числа р, заключаем, что а\ • • • ап | Ь. ■ Следствие 2.7. Длл любых натуральных чисел 6, ai, ..., ап имеем ?с тому же числа а\, ..., an попарно взаимно просты, то выполняется равенство -.(an,6). (2.9) Доказательство. Для любого простого числа р имеем vp((ai • • • an, Ь)) = min{vp(6), vp(ai - • - an)} = = min{vp(6), vp(ai) + ... + vp(an)} и n vp((ab 6).-. (an, 6)) = Y, min{vp(b), VpC^)}. (2.11) i=i Первое утверждение следует теперь из неравенства п min{y, xi + ... + хп} < ^2 min{y, x»}, (2.12) г=1 справедливого при всех неотрицательных действительных числах у, #i, ..., хп. Для доказательства (2.12) рассмотрим два случая. Если при всех индексах г выполнены неравенства Х{ < у, то имеем 40
min{y, xi + ... + xn} < xi + ... + xn = Если же найдется индекс j, для которого у < Xj, то п min{y, a;i + ... + хп} < у = min{y, Xj) < ^ min{y, а^}. г=1 Это доказывает первое утверждение следствия. Предположим теперь, что числа ai, ... ,an попарно взаимно просты. Пусть р — произвольное простое число. Тогда среди чисел Vp(aj) не более одного отлично от нуля. Не уменьшая общности, можно считать, что vp(a2) = ... = vp(an) = 0. Тогда, пользуясь равенствами (2.11) и (2.10), находим vp((ai, 6) • • • (an, b)) = min{vp(6), vp(ai)} = = min{vp(b), Vp(ai) + ... + vp(an)} = vp((ai • • • an, 6)), что завершает доказательство следствия. ■ В дальнейшем понадобятся две функции: целая и дробная части числа. Напомним их определения и свойства. Целой частью действительного числа х называется наибольшее целое число к, удовлетворяющее неравенству к < х. Обозначается эта функция [х]. Например, [2,5] = 2, [тс] = 3, [—1,3] = —2. Из определения следует, что при любом х справедливы неравенства [х] < х < [х] + 1. Сложив неравенства [х] < х и [у] < у, получим [х] + [у] < х + у и, согласно определению, имеем Это неравенство справедливо и при любом количестве слагаемых, что легко доказать методом математической индукции. Из определения сразу же следует, что для любого целого числа п выполняется [х + п] = [х] + п. При любом действительном х и любом натуральном а выполняется равенство a J LaJ (2.13) Чтобы пояснить его, обозначим q = — . Тогда aq < х < a(q + 1) LaJ х < a(q + 1). 41
Разделив эти неравенства на а, получим что и доказывает (2.13). Дробной частью числа х называется функция {х} = х — [х]. Она удовлетворяет неравенствам 0 < {х} < 1 и имеет период 1. Действительно, {х+1} = х+1 — [х+1] = я— [х] = {х}. Например, {-1,3} = {0,3} =0,3. Рассмотрим два примера, имеющих теоретический интерес, в которых вычисляются кратности вхождения простых чисел в канонические разложения некоторых чисел. Обозначим для каждого действительного числа х > 1 символом К{х) наименьшее общее кратное всех натуральных чисел, на превосходящих х. Лемма 2.2. Для любого действительного х>1 имеем р<х Доказательство. Для каждого простого числа р с помощью (2.7) имеем vp(lf (я)) = maxi<u<x vp(u). Если k = vp(u) для неко- In т* торого и < ж, то рк\и и рк < и < х. Значит, к < -—. Но тогда inp [In я] -— . Из этой оценки и неравенства lnpj [lnxi lnx следует, что max vD(u) = l<u<x ^v Кроме того, из приведенных рассуждений вытекает, что при р > х выполняется \р[К(х)) = 0, что завершает доказательство леммы. ■ Далее символом п! будем обозначать произведение всех целых чисел от 1 до п, т. е. п\ = 1 • 2 • 3 •... • п. Лемма 2.3. Для каждого натурального числа п имеем (2.14) 42
Замечание 2.2. Сумма в действительности конечна, так как при к 7 In П рК > п, т. е. при к > -— слагаемые равны нулю. Доказательство. Среди чисел 1,2, ..., п на простое р делятся лишь р, 2р, Зр, ..., rap, где га — наибольшее целое число, удо- [п\ _ — . Поэтому Р\ vp(n!) = vp(p • 2р... rap) = vp(pmra!) = га + vp(ra!). (2.15) Получившееся равенство позволяет доказать нужную формулу с помощью метода математической индукции. При п < р обе части равенства (2.14) равны нулю, и оно, конечно, выполняется. Предположим теперь, что п > р и это равенство справедливо для любого натурального числа, меньшего п. Тогда из (2.15) и (2.13), поскольку га < п, находим что и завершает доказательство. ■ В качестве еще одного примера рассмотрим дробь где п, oi, ..., аг — натуральные числа с условием ai + .. .+ar = n. Докажем, что эта дробь есть целое число. Пользуясь/геммой 2.3, можно написать Последнее неравенство выполняется в силу того, что при любом к справедливо Pkl+'"+[pk\-[ Pk ail Гаг] ^ [ai + .. ■ + kl+'"+[k\[ ■й- Итак, число N раскладывается в произведение неотрицательных степеней простых чисел, и потому есть целое число. 43
2.3. Теоремы Чебышева Простые числа распределены в натуральном ряду весьма нерегулярно. Например, можно указать сколь угодно длинные отрезки натурального ряда, не содержащие ни одного простого числа. Выберем с этой целью некоторое натуральное п и рассмотрим следующие друг за другом числа п\ + 2, п\ + 3, п! + 4, ..., п! + п. Первое из них делится на 2, второе на 3, третье на 4 и т. д. Последнее число делится на п. Указанный отрезок натурального ряда не содержит ни одного простого числа. Такие отрезки расположены достаточно далеко в натуральном ряду. Например, максимальное расстояние между любыми соседними простыми числами, меньшими 1015, равно 276. Вместе с тем существуют сгущения простых чисел. Так как четные числа, большие 2, делятся на 2, то минимальное расстояние между соседними простыми числами не меньше двух. Простые числа, расположенные на расстоянии 2 друг от друга, называются близнецами. Таким образом, любая пара близнецов состоит из нечетных простых чисел р и р + 2. Известны примеры достаточно больших близнецов, например простыми будут числа 156-5202±1, 291-21553±1. Предполагается, что множество таких пар бесконечно, однако этот факт не доказан. С помощью компьютера можно построить пары достаточно больших простых чисел р, #, связанных, например, соотношением р = 2д + 1, и предполагается, что любое уравнение ах — by = ее натуральными и попарно взаимно простыми коэффициентами имеет бесконечное количество решений в простых числах р, q. Но эта проблема не решена и относится к очень трудным. Несмотря на большие сложности исследования свойств простых чисел, удается определить некоторые усредненные их характеристики. Одной из них является функция тс(а:), равная количеству простых чисел р, с условием р < х. Имеется лишь четыре простых числа, удовлетворяющих неравенству р < 10. Это 2,3,5,7. Поэтому к(10) = 4. Решето Эратосфена позволяет определить, что тх(ЮО) = 25. Известно, что тх(1012) = 37 607 912 018. Ясно, что с ростом х функция п(х) возрастает. А из теоремы 2.1 следует, что она возрастает до бесконечности, т. е. к(х) —> —> оо. 44
С помощью решета Эратосфена можно получить и некоторую оценку сверху для функции к(х). Для простейшей оценки исключим из множества чисел 2,3, ...,iV, N > 3, все четные числа. Количество их в этом множестве равно — . Среди чет- L ^ J ных имеется только одно простое число 2. Поэтому <«L. (2Л6, 2ЛГ При iV = l,2 оценка n(N) < —- также справедлива, ведь л(1) = О, ал(2) = 1. Если использовать для просеивания два простых числа 2,3, т. е. исключить все числа, делящиеся на 2 или 3, кроме самих этих чисел, можно таким же способом получить неравенство - 3 Для произвольного действительного х > 1 имеем к(:е) = *([х])<М + 5<£±Ё. Отсеивая также числа, делящиеся на 5,7 и т. д., можно доказать, что доля простых среди натуральных чисел п < х с ростом границы х стремится к нулю, т. е. к(х)/х —» 0. Этот факт был доказан А. Лежандром1 (1798). Впервые достаточно точные границы изменения функции л (ж) были установлены П. Л. Чебышевым2 (1850). Теорема 2.3. При всех х > б справедливы неравенства fl JL < ф) < Ь JL (2.17) In х In я; гдеа = -1п2; Ь = 51п2. Неравенства (2.17) были доказаны П. Л. Чебышевым с лучшими константами а = 0,921...; Ь = 1,105..., но при достаточно больших х. Мы несколько ослабили его результат, упростив Антуан Лежандр (1752 — 1833) — французский математик. Пафнутий Львович Чебышев (1821 —1894) — русский математик. 45
при этом вычисления. Заметим также, что в настоящее время известны намного более точные неравенства х , ч х < к(х) < - -, х > 55. ч ' lnz-4' Для доказательства теоремы 2.3 понадобятся две леммы. Лемма 2.4. При любом натуральном п наименьшее кратное чисел 1,2, ..., 2п + 1 больше, чем 4n, т. е. [1,2,3, ...,2п + 1] >4П. Доказательство. Рассмотрим рациональную функцию Она может быть представлена в виде суммы простейших дробей n! + 1 + 2 ( )( ) х х + 1 х + 2 x + n с целыми коэффициентами а*,. Например, 1 11 Ri(x) = х(х + 1) х х + 1' 1 1 2 . 1 х(х + 1) (х + 1)(х + 2) х х + 1 х + 2" В общем случае имеем тождество доказывающее целость коэффициентов в (2.18) с помощью метода математической индукции. Подставим х = п + 1 в тождество (2.18). В результате получится ~~ п + 1 п + 2 2п + 1~ _ п\ п\п\ ч 7 {и + 1) • • • (2п + 1) (2ti + 1)! 46
Обозначим для краткости К = [1,2,3, ...,2п + 1]. Поскольку коэффициенты а^ — целые числа, то KI £ Z. Учитывая, что KI > 0, заключаем KI > 1, так что К > Г1 = (2п п!п! Докажем с помощью метода математической индукции неравенство п\п\ При п = 1 оно, очевидно, выполняется. Предположив его справедливость для п — 1, при п > 2 имеем (2п + 1)! _ (2п + 1)2п (2п-1)! п_г _ п п\п\ п2 (п — 1)!(п — 1)! Лемма 2.5. При каждом действительном х>2 справедливо неравенство р<х Доказательство. Докажем сначала утверждение для целых значений х, воспользовавшись методом математической индукции. При х = 2 неравенство, очевидно, выполняется. Пусть п > 3 и для всех целых х < п неравенство леммы справедливо. Рассмотрим далее два случая. 1. Предположим, что п = 2т четно. Учитывая, что п = 2т составное число, и пользуясь индуктивным предположением для х = 2т — 1, находим р<п р<2т—1 В этом случае нужное неравенство доказано. 2. Если п = 2т - 1 нечетное число, то m > 2. Применив индуктивное предположение для х = гм, имеем Пр=Пр П р<4т П р- (22°) Р<п р<т т<р<2т—1 т<р<2т—1 Чтобы оценить последнее произведение, рассмотрим биномиальный коэффициент (1т - 1\ (2т - 1)1 V т )~m\(m-l)V 47
являющийся целым числом. Справедливо равенство (2га - 1)! = (2т^ Лт\(т - 1)! (2.21) Пусть р — какое-нибудь простое число, удовлетворяющее неравенствам т < р < 2га — 1. Левая часть (2.21) делится на р. Из неравенства р > га, простоты р и основной теоремы арифметики следует, что р не может входить в разложения на простые сомножители числа га!(га — 1)! и, значит, р входит в разложение (2г^~1)- Таким образом, все простые числа р из промежутка т< р < 2га — 1 входят в разложение этого биномиального коэффициента. Следовательно, П ^(*"m-1). (2.22) Докажем с помощью метода математической индукции, что при любом целом А; > 1 справедливо неравенство ( ^Г1) < 4fc~x. При к = 1 это неравенство, очевидно, выполняется. Если оно верно для к — 1 при к > 2, то имеем ( 2к - 1 к )~ Щк - 1)! k_2 k 2(2fc-l) (2fc-3)! k_2 k-i AC V у * v Из (2.20) и (2.22), применив доказанное неравенство с к = га, находим р<п Итак, неравенство леммы 2.5 при любом целом х доказано. Если же х не целое число, то находим р<х р<[х] Здесь [х] — целая часть числа х. Это завершает доказательство леммы. ■ Доказательство теоремы 2.3. Пусть х > б — произвольное действительное число. 48
Докажем сначала левое неравенство (2.17). Определим для этого целое число п неравенствами 2п + 1 < х < 2п + 3. (2.23) Из лемм 2.4 и 2.2 находим __ [Чп(2п+1)1 _-_ 1п(2п+1 4П < К(2п + 1)= Д pi шр J < Yl p 1пр = p<2n+l p<2n+l Если прологарифмировать это неравенство по основанию 2, по- 2п лучится тс(2п+1) > — -. Отсюда, учитывая неравенства Iog2(2n + 1) (2.23) и монотонность функции тс(х), получаем v '- v ' ;Mog2x^21og2x* Это доказывает левое неравенство (2.17) с а = - In 2. Перейдем теперь к доказательству правого неравенства (2.17). Справедлива оценка Пользуясь (2.16) и неравенством ^log2p < 2x, следующим из р<х леммы 2.5, находим , ч 2 о/^ 2х 2 о/ч Зх К(Х < ~Х2/3 + г^ = -X2/3 + . w 3 log2 x2/3 3 log2 x Как известно, при любом действительном t > 0 справедливо неравенство t > log2t. Взяв здесь t = ж1/3, находим х2/3 < х < 3- . И тогда log2x 7i(x) < 2^— + Зг-^- = 5-^- , ~ bg2 х log2 x log2 x что завершает доказательство теоремы 2.3. ■ 49
Следствие 2.8. Если 2 = р\ < р2 < рг < • • • последовательность всех простых чисел, то с некоторыми положительными постоянными ос, (3 выполняются неравенства cm In n < pn < fin In п. Доказательство. При каждом натуральном п имеем к(рп) = = п. Подставив х = рп в неравенства теоремы 2.3, получим при Эти неравенства можно переписать в виде Из последнего равенства следует In п = \прп — In lnpn + In Сп и, значит, nlnn _ Л lnlnpn _ Л lnlnp Учитывая, что выражение в скобках с ростом п стремится к единице, в силу неравенств а < Сп < Ь, заключаем, что последова- nlnn тельность ограничена снизу и сверху некоторыми положи- Рп тельными постоянными. Это значит, что с некоторыми положительными постоянными а, р выполняются неравенства 1 nlnn 1 а значит, и an Inn < pn < pnlnn. ■ Следующее утверждение впервые было доказано Л. Эйлером. Следствие 2.9. Ряд У -, где суммирование происходит по р всем простым числам, расходится. Доказательство. В силу неравенств следствия 2.8 ряды оо - - оо - ;— и 2^ - = ^ — сходятся или расходятся одновре- п=2 менно. 50
При всех t > 0 справедливо неравенство ln(l + £) < t. Поэтому для любого целого п > 2 имеем 1 1 / , -п 1 1 1 Лп(п+1)\ . 1п(п lnlnfn + 1) - lnlnn = In — < —^ V Ьп / ~ In 1 - 1 = Inn \ п) nlnn Складывая эти неравенства при всех п = 2,3, ..., ЛГ, находим > lnln(iV + 1) - In In 2 > lnln(AT + 1). nlnn n=2 Полученная оценка доказывает неограниченность частичных ОО - сумм ряда У —■— и тем самым расходимость ряда из чисел, ^—' nlnn п=2 обратных простым. ■ В следующем утверждении, носящем название «постулат Бертрана», по существу содержится оценка сверху расстояния между двумя соседними простыми числами рь и р&+1- Оно, в частности, утверждает, что Pk+i < %Рк- Эта, и даже более сильная, теорема впервые была доказана П. Л. Чебышевым (1852). Теорема 2.4. Для любого натурального п > 2 существует простое число р, удовлетворяющее неравенствам п < р <2п. Доказательство. Докажем сначала, что утверждение теоремы верно для любого п < 600. Рассмотрим для этого последовательность простых чисел 2,3,5,7,13,23,43,83,163,317,631. Каждое из них меньше удвоенного предыдущего. Пусть п — произвольное целое число из промежутка 2 < п < 600. Тогда п содержится между двумя последовательными простыми q, p из выписанного ряда, т. е. q < п < р. Учитывая, что р < 2д, заключаем р <2q < 2n. Искомое простое число р найдено. Поскольку теорема доказана для всех чисел п < 600, далее будем предполагать выполненным неравенство п > 600. Рассмотрим целое число р<2п+1 51
В доказательстве леммы 2.4 было установлено, что N\K = [1,2, ...,2п + 1] и JV>4n. (2.24) Докажем справедливость неравенства jV<(2n + l) Д pv"^. (2.25) р<2п-1 Если 2п+1 простое число, то V2n+i(N) = 1 и в (2.25) имеет место равенство. Если же 2п + 1 — составное, то N = Пр<2п-1^р^ и (2.25) так же выполняется. Предположим, что утверждение теоремы неверно и интервал п < х < 2п не содержит ни одного простого числа. Тогда из (2.25) следует ЛГ<(2п + 1) Y[pMN) (2-26) р<п 2п + 1 Ьсли простое число р удовлетворяет неравенствам —-— < о Зт) — 1 <р<п, тор<п< —-— < 2р и 2р < 2п + 1 < Зр. Значит, Vp(n!) = 1 и vp((2n + 1)!) = 2. Таким образом, vp(N) = vp((2n + +1)!) - 2vp(n!) = 0 и из (2.26) следует N<(2n + l) Д pv^Nl (2.27) 2п + 1 Предположим теперь, что у2п+ 1 < р < —-—. Тогда, в о частности, 1п(2п + 1) < 2 In р. Поскольку N\K, из леммы 2.2 следует vp(N) < vp(tf) = |ln(2n + 1)| < L Но тогда из (2.27) находим дим N<(2n + 1) Д р Ц pv"W< +1 (2-28) 1 П р П p"AN)- Так как N \ К,ио лемме 2.2 имеем < МК) = lnp 52
Но тогда правое неравенство теоремы 2.3 дает < (2п + 1)*(>/5й+Т) < ^п Воспользовавшись оценкой снизу (2.24) для числа iV, а также леммой 2.5, из (2.28) находим 4^ 4. (2.29) Легко проверить, что функция f(x) = x2-2~x монотонно убывает на множестве х > 4. Поскольку /(4) = 1, то при любом х > 4 выполняется неравенство х2 < 2х. В частности, при х = \/2п+ 1 находим 2п + 1 < 2v/2n+1. Теперь из неравенства (2.29) следует 22п+1 Из последнего неравенства находим п < 544, вопреки условию п > 600. Получившееся противоречие доказывает существование простого числа, утверждаемого леммой. ■ 2.4. Дзета-функция Римана и свойства простых чисел Дзета-функция определяется рядом ?• (2-3°) 71=1 По историческим причинам ее аргумент принято обозначать буквой s. Как известно из курсов математического анализа, ряд (2.30) сходится при каждом действительном s > 1 и расходится при s < 1. Такие ряды при различных целых значениях 5 изучал Л. Эйлер. Впоследствии дзета-функция стала рассматриваться как функция действительного переменного s > 1. Ее свойства тесно связаны со свойствами множества простых чисел, что позволяет использовать для исследования простых чисел методы теории функций. Следующее утверждение называется тождеством Эйлера. 53
Теорема 2.5. При каждом s > 1 справедливо тождество -1 Замечание 2.3. Правая часть тождества (2.31) содержит бесконечное количество сомножителей. Под таким бесконечным произведением понимается предел конечного произведения -П ('-£ Ч у р<х при х —> оо. Доказательство. Пользуясь формулой для суммы членов бесконечно убывающей геометрической прогрессии, находим Это равенство справедливо при любом простом р и любом s > 1. Выберем некоторое число х > 2, и пусть 2 = pi < р2 < • • • < < рг — все простые числа, не превосходящие х. Перемножим равенства (2.32) для всех простых чисел р < х. В результате получится (233) где справа стоит бесконечная сумма, в которой показатели fci, ..., kr независимо пробегают множество всех целых неотрицательных чисел. Слагаемые в рядах (2.32) положительны, поэтому, согласно теореме о перемножении рядов, равенство (2.33) будет выполняться как бы мы ни упорядочивали слагаемые в его правой части. Упорядочим их по возрастанию знаменателей. Среди этих знаменателей нет одинаковых, ведь по основной теореме арифметики равенство выполняется лишь в случае к\ = ^i, ... кг = £г. Поэтому (2.33) молено переписать в виде - Е кг,..„кг 54
где знак «'» обозначает, что суммирование происходит по всем натуральным числам, раскладывающимся в произведение простых р < х. По основной теореме арифметики каждое натуральное число п раскладывается в произведение простых. Ясно также, что в случае п < х эти простые не превосходят х. Поэтому равенство (2.34) можно переписать в виде j2^ J2s с2-35) ^—' ns ^—' ns п<х п>х Преобразуя его, находим ' (2.36) n<x n>x n>x Второе неравенство (2.36) выполняется в силу того, что в его правой части суммирование происходит по большему множеству натуральных чисел, а сами слагаемые положительны. Правая часть (2.36) стремится к нулю с ростом ж, ведь эта сумма есть остаток сходящегося ряда (2.30). Но тогда lim Р(х) = lim У^ — = Us). z—oo я—оо *-? ns п<х Тождество Эйлера доказано. ■ Прежде чем выводить следствия этого тождества, докажем одно вспомогательное утверждение, которое будет использоваться и в дальнейшем. Поэтому докажем его в несколько большей общности, чем это потребуется здесь. Лемма 2.6. 1. При любом натуральном N справедливы неравенства N 1 \n(N + 1) < V - < ln(2JV + 1). n=in 2. Существует предел - -lnrr I = у > 0. Замечание 2-4- Численное значение предела равно у = = 0,577 215 664 9... Эта математическая константа, такая же как л или 55
е, носит название постоянной Эйлера. В отличие от двух последних констант арифметические свойства постоянной Эйлера пока не поддаются исследованиям. Предполагается, что у иррациональна, но это в настоящее время не доказано. Доказательство. При любом действительном t > О справедливо неравенство ln(l + t) < £, легко доказываемое, например, с использованием дифференцирования. С его помощью при t = 1/п, где п - произвольное натуральное число, находим 1п(п + 1) - Inn = In (1 + -)<-. (2.37) \ п) п Просуммировав эти неравенства для всех целых п из промежутка 1 < n < iV, найдем TV , N - > > (ln(n + 1) - Inn) = \n(N + 1). n *—' n=l n=l Точно так лее легко проверить, что при любом t из интервала О < t < 1 справедливо ln(l + t) - ln(l - t) > 2t. Поставив в это неравенство £ = —, находим 1 - < 1п(2п + 1) - 1п(2п - 1). п Слолсив эти неравенства для п = 1, ..., JV, получим -ln(2n-l)) = ln(2iV + l). п=1 п=1 Это завершает доказательство первого утверлсдения леммы. Для доказательства второго утверлсдения обозначим П=1 С помощью неравенства (2.37) при N > 1 получаем sN - sN_i = — - ln(JV + 1) + \nN > О, 56
т. е. s./v — возрастающая последовательность. В то же время из первого утверждения леммы следует неравенство sN < \n(2N + 1) - ln(JV + 1) < In 2, так что последовательность sn ограничена. Как известно, доказанные свойства означают существование предела При любом N > 1 имеем 5дг > si = 1 — In2. Поэтому у > 1 — -1п2>0. Пусть х > 1 — действительное число. Тогда £ П<Х - - lnz = s[x] + Щх] + 1) - In ж = sM + In I 1 + i-i . n l 1 L J \ x J С ростом х первое слагаемое в правой части получившегося выражения стремится ку,а второе стремится к нулю. Лемма доказана полностью. ■ Перейдем теперь к выводу следствий из тождества Эйлера. Следствие 2.10. При любом х>2 справедливо неравенство р<х Замечание 2.5. Из этого неравенства следует бесконечность множества простых чисел. Ведь, если множество простых конечно, то функция, стоящая в левой части неравенства, постоянна при всех достаточно больших х, но правая часть этого неравенства стремится к бесконечности. Доказательство. Из (2.35) следует неравенство п>- р<х Ч У справедливое при любом s > 1. Переходя в нем к пределу при s^1h пользуясь первым утверждением леммы 2.6, находим V V р) ^ п г 1п р<х ч г' п<х п<[х] 57
В разд. 2.3 была доказана расходимость ряда из чисел вида 1/р, где р — простое число. Докажем несколько более точное утверждение. Следствие 2.11. При любом х > 2 справедливо неравенство \j - > In In х — 1. р<х Доказательство. Из неравенства ln(l+t) < t при t — 1/(р—1) следует In ( 1 - - 1 = Суммируя эти неравенства при всех простых р < х, находим In р<х Применяя к левой части оценку из следствия 2.10, получаем требуемое неравенство. ■ Л. Эйлер также нашел формулы, связывающие значения дзета-функции в четных положительных точках с числом тс. Например, f «4)§ т CW-f; Для значений в нечетных точках подобные соотношения неизвестны. Предполагается, что они не существуют. Несмотря на то что ряд (2.30) расходится при 5 < 1, дзета- функцию можно определить и при таких значениях аргумента. Например, при s > 1 справедливо тождество п=1 п=1 ч f Последний ряд, как известно, сходится при 5 > 0. Поскольку множитель 1 — 21-s отличен от нуля на множестве 0 < 5 < 1, это равенство можно рассматривать как определение дзета-функции в интервале 0 < s < 1. 58
Б.Риман1 (1859) определил дзета-функцию при любом комплексном значении 5 и установил ряд ее глубоких свойств. Он также первым использовал обозначение C(s) для функции (2.30), получившей впоследствии название дзета-функции Римана. Как функция комплексного переменного s = а + it дзета-функция аналитична во всех точках комплексной плоскости, за исключением точки 5 = 1, где она имеет полюс первого порядка. Дзета- функция £(s) обладает симметрией относительно точки 5 = 1/2, а именно удовлетворяет некоторому функциональному уравнению. Она обращается в нуль в точках s = —2, —4, —6, ..., а, кроме того, как предположил Риман, имеет бесконечное количество нулей в полосе 0 < а < 1, расположенных симметрично относительно прямой а = 1/2 и вещественной оси (этот факт был доказан Ж. Адамаром2 (1893)). Риман высказал без доказательства и приближенную формулу3 для количества таких нулей в прямоугольнике 0 < а < 1,0 < t < Т. Он также предположил, что все нули £(s) в полосе 0 < а < 1 в действительности лежат на прямой а = 1/2. Эта гипотеза — знаменитая «гипотеза Римана» — не доказана до сих пор. Риман показал, что поведение функции тс (я) тесно связано с расположением нулей £(s). Рассматривая дзета-функцию как функцию комплексного переменного, Ж. Адамар и Ш. Ж. Валле-Пуссен4 установили точный порядок роста функции тс(х), доказав (1896), что х тс( х) п(х)~-— при х —► оо, т.е. lim —~^-= 1. (2.38) In х s->oo х/ In х Это утверждение называется асимптотическим законом распределения простых чисел. Если ф(х) — натуральный логарифм наименьшего общего кратного всех целых чисел п, удовлетворяющих неравенствам 2 < п < х и 9 (я) = V^lnp, то каждая из асимптотических формул ф(х) ~ х\ Q(x) ~ х при х —> оо, эквивалентна равенству (2.38). хБернхард Риман (1826 — 1866) — немецкий математик, оказавший существенное влияние на развитие теории аналитических функций, геометрии и теории чисел. 2Адамар Ж. (1865 — 1963) — французский математик. 3Ее доказал (1895) немецкий математик Ханс фон Мангольдт (1854 — 1925). 4Шарль Жан де ла Валле-Пуссен (1866 — 1962) — французский математик. 59
Валле-Пуссен дал и оценку точности, с которой функция х/ In х приближает 7t(x). Важную роль в доказательстве сыграло утверждение об отсутствии нулей дзета-функции Римана в некоторой области полосы 0 < о < 1. При этом выяснилось, что для всех достаточно больших х функция тс(х) лучше приближается интегралом Г du J W 2 чем отношением х/\пх. Из справедливости недоказанной гипотезы Римана можно вывести оценку х du \пи < где с — некоторая положительная постоянная. Наконец, приведем одно элементарное утверждение, эквивалентное гипотезе Римана. Пусть N — натуральное число. Расположим все дроби а/Ь с условиями 0<а<6; (о,Ь) = Ь < N, в порядке возрастания и обозначим их г^, 1 < к < М. Такая последовательность называется рядом Фарея порядка N. Ясно, что количество дробей М в ряде Фарея зависит от N. Для справедливости гипотезы Римана необходимо и достаточно, чтобы при каждом г > 0 существовала зависящая только от г постоянная С, при которой для всех N > 1 выполняется оценка м Е М < Это неравенство означает, что дроби ряда Фарея не должны слишком сильно отклоняться от соответствующих дробей, полученных делением отрезка [0; 1] на М равных частей. Задачи для самостоятельного решения 1. Разложите на простые множители число 232 792 560. Проверьте, что оно делится на все целые числа от 2 до 22. 2. Докажите, что при любом простом р > 2 числитель дроби т л 1 1 п=1+2+3+ 1 делится на р. 60
3. Докажите, что при любом целом п число п4 + 4 составное. 4. Докажите, что если 2П — 1 простое число, то обязательно п должно быть простым числом. 5. Докажите, что если 2П + 1 простое число, то обязательно п — 2к. 6. Докажите, что при любом действительном ж справедливо неравенство [6ж] + [ж]> [Зж] + 2[2ж]. 7. Докажите, что при любом целом п выполняются равенства: а) [Зп + 8] \п + 2] Гп + 11] [п + 19] [ J LJ + | + [ 25 J L25J + Р25| + |25 б) 8п п + 7 25 8. Докажите, что при любом целом п > 1 число 6п!п! 3n!2n!2n! будет целым. 9. Пусть а, 6 — натуральные взаимно простые числа, причем их произведение ab есть квадрат целого числа. Докажите, что каждое из чисел а, Ь есть квадрат. 10. Пусть #, у, z — целые числа: х2 + у2 = z2, (ж, у) = (ж, z) = (у, z) = 1. Докажите последовательно, что: a) z нечетно; ^ z-x z+x о) если х нечетно, то —-— и —-— взаимно просты; Zi Zi в) с некоторыми натуральными числами a, b выполняются равенства г) выполняются равенства Х = а2-Ъ2, у = 2а6, z = а2 + Ь2, (а, 6) = 1. (*) Эти равенства можно записать в виде х -Ь гу = (а + Ы)2. д) Проверьте, что с любыми целыми числами а, Ь и целыми ж, у, z, определенными равенствами (*), выполняется z2 = ж2 + у2. 11. Пусть ж, у, z — натуральные числа: 61
х4 + у4 = z2, (ж, у) = (ж, z) = (у, z) = 1. (**) Докажите последовательно, что: а) если х нечетно, то x2+iy2 = (u+iv)2 с целыми взаимно простыми и, и, при этом и и г?/2 — квадраты натуральных чисел; б) х + iv = (г2 + г52)2 с целыми взаимно простыми г, 5; в) г4 + 54 = и = t2, причем z > t\ г) уравнение (**) не имеет решений в натуральных числах. д) Докажите, что уравнение Ферма х4 + у4 = z4 не имеет решений в натуральных числах. 12. Докажите, что для каждого комплексного числа а найдется число р = а+Ь\/—2 G Z[\/—2], удовлетворяющее неравенству |а~Р| < 1. Выведите отсюда, что в кольце Z[\/^2] имеет место единственность разложения на простые сомножители. 13. Докажите, что каждое из чисел 3,4 + у/—23,4 — >/—23 просто в кольце Ъ\\/—23]. Вместе с тем выполняется равенство З3 = (4 + + \/— 23) (4 — у/—23), означающее, что в кольце Z[\/—23] нет единственности разложения чисел на простые сомножители. 14. Пусть х, у — целые числа, удовлетворяющие равенству я3 — — у2 = 2. Пользуясь утверждением задачи 12, докажите последовательно, что а) у нечетно и числа у + \/^2, у — у/—2 взаимно просты в кольце Zb/=2); б) у -Ь \/^2 = (а + Ь>/^2)3 с некоторыми целыми а, Ь; в) все решения в целых числах уравнения х3 —у2 = 2 исчерпываются х = 3, у = ±5.
Глава 3 Арифметические функции В теории чисел встречается множество функций. Арифметическими принято называть, вообще говоря, комплекснознач- ные функции, определенные на множестве натуральных чисел. Свойства некоторых, наиболее важных из них, обсудим в этой главе. 3.1. Мультипликативные функции и их свойства Функция 9(п), определенная на множестве натуральных чисел, называется мультипликативной, если для любых двух взаимно простых натуральных чисел а и b выполняется равенство 9(аЬ) = в(а)9(Ь). Например, для любого действительного числа 5 функция 0(п) = = ns есть мультипликативная функция. Далее будут приведены и другие примеры мультипликативных функций. Если 0(п) — не равная тождественно нулю мультипликативная функция, то 0(1) = 1. Действительно, если натуральное число а таково, что 9(а) ф 0, то имеем 0(а) = 0(а • 1) = 0(а)0(1). Сокращая это равенство на 0(а), находим 1 = 0(1). Любое натуральное число а > 1 единственным образом представляется в виде произведения простых сомножителей, т.е. а = = Pi1...^- Поэтому для мультипликативной функции 0(п) имеем 0(а) = р\а так что любая мультипликативная функция однозначно определяется заданием ее значений на степенях простых чисел. 63
Более того, задав произвольным способом функцию на степенях простых чисел и определив ее значения на всех натуральных числах с помощью равенств (3.1), получим мультипликативную функцию. Произведение мультипликативных функций есть мультипликативная функция. Действительно, если 9(n) = 6i(n)02(n), где 01 (п) и 82 (п) — мультипликативные функции, то для любых двух взаимно простых натуральных чисел а и Ь имеем 8(аЬ) = Qi(ab)B2(ab) = ei(a)9i(6)02(a)e2(6) = в(а)8(Ь). Опишем еще один способ построения мультипликативных функций. Лемма 3.1. Пусть 0(п) — мультипликативная функция и функция f(n) определена равенствами d\n где суммирование происходит по всем натуральным делителям числа п. Тогда f(n) — мультипликативная функция и W)). (3.2) р\п Здесь произведение берется по всем простым делителям числа n, a vp(n) есть кратность, с которой р входит в разложение п на простые сомножители {см. 2.2). Доказательство. Для доказательства мультипликативности функции /(п) рассмотрим какие-нибудь два натуральных взаимно простых числа а и 6. Каждый натуральный делитель d числа аЪ единственным образом представляется в виде произведения d = di^, где di|a, d2\b. Поэтому имеем <ь\ь Таким образом, функция /(п) мультипликативна. 64
Пользуясь мультипликативностью для п = P\l •••Prri находим /Н = Др?1) •.. f{pk/) = f[(l + 8(р,) + 9(р?) + ... 3.2. Функция Мёбиуса и формулы обращения Функцией Мёбиуса1 \i(n) называется мультипликативная функция, определенная на степенях простых чисел следующим образом: ц(р) = -1, фк) = О, к > 2. Пользуясь мультипликативностью, ее можно доопределить на всех натуральных числах следующим образом: 1) ц(1) = 1; 2) (л(п) = 0, если п делится на квадрат простого числа; 3) у.(р\Р2 • • -Рг) = (~1)Г) если все простые числа pi,P2> • • • ?Рг различны. Например, =-1; ^(6) = ii(10) = 1; ^(8) = ц(9) = 0. Функция [i(n) по определению является мультипликативной. Поэтому будет мультипликативной и функция 0(п) = ——. ть В дальнейшем будем считать, что s > 1 — фиксированное действительное число. Равенство (3.2) для выбранной функции 8(п) принимает вид d\n р\п Это равенство справедливо для любого натурального п и любого действительного числа 5. Выберем п = Пр<хР ПРИ некотором достаточно большом ^ и рассмотрим две суммы 2^ ^т^ и 2-^ "we"' ^читывая5 что d\n d<x \i(d) = 0, если d делится на квадрат простого числа, заключа- 1А. Ф. Мёбиус (1790 — 1868) — немецкий математик и астроном. Нестеренко 65
ем, что каждое ненулевое слагаемое второй суммы содержится среди слагаемых первой суммы. Поэтому d\n d<x d>x и, значит, р<х d<x d>x Переходя в этом неравенстве к пределу при х —+ +оо и пользуясь тождеством Эйлера (см. теорему 2.5), находим (3.4) d=l Таким образом, функция Мёбиуса имеет самое непосредственное отношение к дзета-функции Римана. В частности, гипотеза Римана о нулях дзета-функции эквивалентна оценке d<x при любом сколь угодно малом положительном е. Можно проверить с помощью тождества Эйлера, что равенство (3.4) эквивалентно следующему утверждению, которое будет доказано независимо от (3.4). Лемма 3.2. Справедливы равенства 1, если п = 1; I 0, если п > 1. d\n Доказательство. Равенство в случае п = 1, очевидно, выполняется. Пусть далее п > 1. Поскольку [i(n) — мультипликативная функция, то равенство (3.2) и определение функции Мёбиуса дают d\n p\n Теорема 3.1 (формула обращения Мёбиуса). Пусть /(п) — произвольная функция натурального аргумента и 66
*(*) = £/(«*)■ d\n Тогда справедливы равенства > (Ц) (3-5) d\n Доказательство. При п = 1 имеем #(1) = /(1) и требуемое равенство выполняется. Пусть далее п > 2. Согласно определению функции <7(п) находим Е ^ (?) = Е nw> E /w = Е /(с) Е м- d\n d\n elf c|n rf|f По лемме 3.2 сумма Yj[i(d) отлична от нуля лишь в случае с = п. Учитывая, что в последнем случае она равна 1, получаем требуемое равенство. ■ Укажем теперь несколько более общее тождество, чем (3.5), лежащее в основе так называемых «методов решета». Связь этого тождества с решетом Эратосфена, мотивирующая название, указывается далее в примере 3.1. Теорема 3.2. Пусть а\, ..., аг — действительные иЪ\, ..., Ьг — натуральные числа. Для любого натурального d положим j:d\bj где суммирование ведется по всем индексам j, для которых bj делится на d. Тогда справедливо равенство Замечание 3.1. Суммирование в левой сумме равенства (3.6) проводится по всем натуральным d, а в правой сумме — по всем индексам 3 с условием 6^ = 1. Заметим также, что лишь конечное количество чисел Cd отлично от нуля, ведь множество делителей чисел &i, ..., br конечно. 67
Доказательство. С помощью леммы 3.2 находим d d j:d\bj j=l d\bj 3'bj=l Теорема 3.1 есть частный случай последнего утверждения. Действительно, пусть п — произвольное натуральное число и 1 = Ь\ < 62 < • • • < br — все его натуральные делители. Для функции /(п) из теоремы 3.1 положим aj = f (n/bj). Тогда j:d\bj c\n/d где д — функция, определенная в теореме 3.1. Учитывая, что Cd — 0 при d \ п, находим равенства Е <ч = Е / (г) = /(»); Е ^«а = Е № (5). j:6j=l i:bj-=l Ч J/ d d|n из которых в силу (3.6) следует равенство (3.5). С приложениями теоремы 3.1 мы еще встретимся в дальнейшем. Сейчас же рассмотрим несколько примеров применения теоремы 3.2. Пример 3.1. Пусть х > 2 — действительное и D — натуральное числа. Положим в теореме 3.2 г = [ж]; а^ = 1; fy = (j, D) при j = 1, ...,г. Тогда еслис£|£>; Равенство (3.6) приобретает следующий вид d\D где TV — количество натуральных чисел п < ж, взаимно простых cjD. Если выбрать D = П Р? то число JV в формуле (3.5) равняет- ся количеству натуральных п, 1 < п < х, не имеющих простых делителей р < у. Таким образом, число N — 1 равняется в этом 68
случае количеству натуральных чисел п на отрезке у < п < х, оставшихся невычеркнутыми после просеивания решетом Эра- тосфена с помощью всех простых чисел р < У- Выберем D= Ц р. Так как каждое составное число п < х имеет простой делитель р < у/х, то условию (j, D) — 1 в рассматриваемом случае удовлетворяют лишь простые числа р из промежутка у/х < р < х и число 1. Поэтому N = тг(х) — к(у/х) + 1 и равенство (3.7) можно переписать в виде d\D где D — [] р. Получившуюся формулу молено использовать Р<у/Х для вычисления значений функции к(х). Однако сумма, стоящая в правой части (3.8), содержит слишком много слагаемых, и это затрудняет вычисления. Выбрав D — Yl P-) молено получить формулу, требующую значительно меньшего объема вычислений. Пример 3.2. Пусть х > 2 — действительное число иг= [х]. Для каждого j < х определим bj как наибольшее целое число s с условием s2 \ j. Положим также су = 1. Тогда и по теореме 3.2 находим где Т(х) — количество натуральных чисел п < ж, не делящижж на квадрат целого, большего 1. Суммирование в левой части (3.9) проводится по всем натуральным числам d < \/х, ведь при d > у/х имеем [x/d2] = 0. Отбрасывая знаки целой части в этой сумме, мы совершим ошибку, не превосходящую у/х. Поэтому равенство (3.9); может быть переписано в виде $ (3-ю) d<y/x 69
Сумма в последнем равенстве есть частичная сумма ряда H(d) 1 _ 6 к2' Заменяя частичную сумму в (3.10) суммой ряда, мы совершим ошибку, не превосходящую остаточного члена и, значит, меньшую, чем ( } Но тогда равенство (3.10) можно переписать в виде T(z) = ~z + O(v^). Получившееся равенство можно интерпретировать, сказав, что при случайном выборе натурального числа из множества п < х с вероятностью, близкой при больших х к 6/тс2, получим число, не делящееся на квадрат целого числа, отличный от 1. 3.3- Функция Эйлера Для каждого целого числа п > 1 обозначим символом ср(п) количество натуральных чисел, не превосходящих п и взаимно простых с п. Иначе, ср(п) есть количество целых чисел fc, удовлетворяющих условиям Так, определенную функцию натурального аргумента п называют функцией Эйлера. В частности, имеем ср(1) = 1. Среди чисел 1,2,3,4,5,6 взаимно простыми с 6 являются лишь 1 и 5. Поэтому ф(6) = 2. Для каждого простого числа р лишь одно из чисел среди 1,2, ..., р не взаимно просто с р, а именно само число р. Поэтому ср(р) = р — 1. Если п — рг есть степень простого числа, то нетривиальный общий делитель с п могут иметь лишь числа, делящиеся на р, т. е. числа вида рк. Неравенство рк < рг выполняется для целых чисел к < рг~1 и только для них. Поэтому Свойства функции Эйлера описываются следующей теоремой. 70
Теорема 3.3, 1. Для любого натурального п>2 выполняется равенство р\п 2. Функция Эйлера мультипликативна, т. е. для любых двух натуральных взаимно простых чисел а и b имеем ф(аЬ) = ф(а)ф(Ь). Первое доказательство. По лемме 3.2 при любом натуральном к выполняется равенство _ J 1, если (fc,n) = 1; [О, в противном случае. Е d\{k,n) Поэтому справедливо представление Все числа d, присутствующие в получившейся двойной сумме, являются делителями числа п. Соберем вместе слагаемые этой суммы, отвечающие одному и тому лее делителю d числа п. Ясно, что они будут появляться при /с, делящихся на d, т.е. при к = d, 2d, 3d, ... Последним из них будет число к = п, а количество слагаемых, отвечающих фиксированному значению d, рав- но —. Таким образом, а d\n d\n Первое утверждение теоремы следует отсюда с помощью равенства (3.3) при 5 = 1. Второе утверждение теоремы может быть выведено из первого с помощью основной теоремы арифметики. Действительно, Ф(а)ф(6) Иначе: из первого утверждения теоремы следует, что функция Эйлера есть произведение двух мультипликативных функций п и I I ( ^ ) 1 а потому она мультипликативна. ■ i V Р/ р\п ч у/ 71 = аЦ (l - I) ЬЦ U - I) = аЬЦ (l - i) = Ф(а6).
Первое утверждение теоремы 3.3 сразу же следует из теоремы 3-2., если положить в ней щ — l,fej = (j, n) при 1 < j < п. Приведенное доказательство по существу повторяет доказательство теоремы 3.2 в этом специальном случае. Иное доказательство теоремы 3.3 основало на следующей лемме. Лемма 3.3. Для любого натурального п выполняется равенство d\n Доказательство. Пусть i— делитель числа п и Аг — множество чисел к из совокупности 1,2, ...., п, удовлетворяющих условию :"(fc, и) = г. Каждый элемент множества Аг делится на г и, значит, имеет вид к = rl с некоторым £,1 < € < —. По след- т ствию:2.4 из теоремы 1.3 справедливо равенство (к,п)=г(£,п/г), из которого следует, что включение к £ Аг выполняется в том и только том случае, когда (£, п/г) = 1. Поэтому количество элементов в мнолсестве Аг равно ср(.п/г).. Множества Аг для различных г |п, очевидно., не пересекаются, а их объединение совпадает с совокупностью 1,2,..., п. Поэтому Если г пробегает все делители числа п, то п/г также пробегает все делители п. Обозначив d = п/г, получаем -d\n r\n Первое утверждение теоремы 3.3 получается из равенства леммы 3.3 с помощью формулы обращения Мёбиуса (см. теорему 3.1), примененной к функциям /(п) = ф(п) и д(п) = п. ЗА. Сумма делителей и число делителей натурального числа При любом натуральном s функция п8 мультипликативна. Согласно лемме 3.. 1 жультипликативнсш будет и функция 72
d\n При 5 = 0 так получается функция т(п) = ao(n) = — количество делителей п, а при s = 1 функция d\n — сумма делителей числа п. Обе эти функции мультипликативны. Если п = р^1 • • • р^1, то по лемме 3.1 имеем vkj+1 J=l J=l ^ Заметим также, что т(п) равно количеству решений в натуральных числах ж, у уравнения ху = п. Древнегреческие математики выделили класс чисел, обладавших с их точки зрения некоторой внутренней гармонией, так называемых совершенных чисел. Целое число N > 1 называется совершенным, если оно равно сумме своих собственных делителей. Под собственными подразумеваются делители, отличные от самого числа. Так, собственными делителями числа б являются числа 1,2,3 и в силу равенства 1 + 2 + 3 = 6 число 6 совершенно. Еще одним совершенным числом является 28. Число 5 «недостаточно», у него сумма собственных делителей, равная 1, слишком мала. А число 12 «избыточно», его сумма собственных делителей равна 16. До сих пор неизвестно, существуют ли нечетные совершенные числа. Это одна из нерешенных древних проблем теории чисел. Структура четных совершенных чисел описывается результатами Евклида и Эйлера. Теорема 3.4. Четное число N > 0 совершенно тогда и только тогда, когда оно имеет вид N = 2n(2n+1 - 1), причем 2n+1 — 1 — простое число. 73
Например, 6 = 2-3, причем 3 = 22 — 1 — простое число, а 28 = 22-7 и 7 = 23 — 1 — также простое число. Простые числа вида 2к — 1 называются простыми числами Мерсенна1. Из тождества аш - 1 = (а - 1)(1 + а + • • • + а™"1) следует, что число 2тк — 1, где га, /с — натуральные числа, делится на 2к — 1. Поэтому число Мр = 2Р — 1 может быть простым лишь в случае, если р — простое число. Так, M<i = 3, М3 = 7, М5 = 31 и M-j = 127 — простые числа. С каждым из них связано некоторое совершенное число. Но число 211 — 1 = 2 047 = 23-89 простым не является. Следующие простые числа Мерсенна — Л^13> Л^195 -Мз1 и Mq\. В 2.1 указаны самые большие известные в настоящее время простые числа вида 2Р — 1. Предполагается, что множество простых чисел Мерсенна, а значит, и множество четных совершенных чисел бесконечны. Однако этот факт не доказан и является еще одной древней проблемой теории чисел. Доказательство теоремы 3.4- Докажем сначала утверждение Евклида, т.е. совершенность указанных в теореме чисел. Чтобы проверить это, воспользуемся выведенной ранее формулой для суммы делителей числа. Если q = 2n+1 — 1 — простое число и N = 2ng, то имеем i)=q. 2^ = 2N. Одним из слагаемых суммы делителей o(N) является и само число iV, поэтому сумма собственных делителей N равна o(N) — — N = ]V, т. е. N совершенно. Теперь докажем утверждение Эйлера, что каждое совершенное число имеет вид, указанный в формулировке теоремы. Пусть N = 2па — совершенное число, причем п > 1 и а нечетно. Так как числа 2п и а взаимно просты, а сумма делителей числа — мультипликативная функция, имеем c(N) = a(2n)a(a) = (2n+1 - 1)а(а). Учитывая, что N — совершенное число, т. е. o(N) = 2ЛГ, получаем уравнение 2n+la = (2n+1 - 1)а(а). 'М.Мерсенн (1588 — 1648) —французский математик. 74
Так как 2n+1 и 2n+1 — 1 взаимно простые числа, отсюда заключаем, что а делится на 2n+1 — 1, т. е. а = (2n+1 — 1)6 с некоторым натуральным b и о(а) = 2п+1Ь. Если b > 1, то различные числа а, 6,1 являются делителями а, так что о(а) > a + b+l = а(а) +1. Получившееся противоречие означает, что Ь = 1 и о(а) = а + + 1. Следовательно, а имеет лишь два делителя 1 и а. Но тогда а — 2n+1 — 1 — простое число. ■ 3.5. Оценки среднего значения арифметических функций Арифметические функции, как правило, ведут себя очень нерегулярно. Поэтому представляют интерес усредненные характеристики их поведения. Рассмотрим сначала функцию т(п). Теорема 3.5. При N —» +оо справедлива следующая асимптотическая формула N J2^(n) = NlnN + O(N). (3.13) n=l Замечание 3.2. Поскольку т(п) есть количество решений в натуральных числах х, у уравнения ху = п, сумма из (3.13), для краткости обозначим ее символом U(N), равна количеству решений в натуральных числах х, у неравенства ху < N. Геометрически эта величина может быть представлена как количество точек первого квадранта с целыми положительными координатами, лежащих на гиперболе ху — N и под ней. Доказательство. Из формулы т(п) = \J 1 следует d\n n=l d\n Поменяем в этой двойной сумме порядок суммирования, сделав d внешней переменной. При фиксированном значении d переменная п принимает значения, кратные d, т. е. d, 2d, ... Обозначим п = dk и получим, что натуральное число к меняется в интервале 1 < к < N/d. Таким образом, фиксированному значению d соответствует [N/d] слагаемых двойной суммы, равных 1. Поэтому 75
«■■ей- Отбросив в каждом слагаемом знак целой части, мы совершим ошибку, не превосходящую единицы. Функция же U(N) изменится не более чем на N. Поэтому N 1 Из леммы 2.6 следует \J — = 1пЛГ+О(1). Поэтому для функции d<N U(N) получаем асимптотическое равенство (3.13). ■ Среднее значение функции т(п) N согласно теореме 3.5, равно примерно In N. В настоящее время известны результаты, намного более точные, чем формула (3.13). Дирихле (1849) доказал, что N J2T(n) = NlnN + (2y- 1)N + O(Nb) (3.14) 71=1 с 8 = 1/2. Этот результат был усилен Г. Ф. Вороным1 (1903), доказавшим, что формула (3.14) верна при любом 8 > 1/3. Полученный результат также уточнялся. Но известно, что формула (3.14) при 8 < 1/4 уже неверна. Теорема 3.6. При N —♦ +оо справедлива следующая асимптотическая формула: KN + O(N\nN). (3.15) п=1 Доказательство. Пусть V(N) — сумма из формулировки теоремы. Тогда имеем п=1 d\n Георгий Федосеевич Вороной (1868 — 1908) — русский математик. 76
Заменим в получившейся двойной сумме переменную суммирования п новой переменной fc, положив п = dk. Новые переменные суммирования d, к будут пробегать все пары натуральных чисел, удовлетворяющие неравенствам dk < N. Тогда V(N) = £ d = £ £ d. (3.16) dk<N Jfe=l \<d<N/k При любом t > 1 справедливы равенства (3.17) d<t z l Поэтому из (3.16) находим Из леммы 2.6 следует, что £ _ \ < ln(2iV + 1), поэтому 1 N Заменим теперь конечную сумму ^ —^ суммой ряда к=1 1 ~,~ч Л При этом будет совершена ошибка, оцениваемая величиной -г^ ^ Т7 (см- (3-11)), что приводит к нужной асимптотиче- k N ской формуле. ■ Из теоремы 3.6 следует, что среднее значение суммы делителей равно примерно —t?N. J..Z Теорема 3.7. При N —* +оо справедлива следующая асимптотическая формула: N „ (п) = 4^2 + O(N In N). (3.18) 71=1 77
Замечание 3.3. Из определения функции Эйлера следует, что зна- чение Ф{п) равно количеству несократимых дробей — из промежутка п О < t < 1 со знаменателем п, а сумма из формулировки теоремы равна количеству несократимых дробей со знаменателем, не большим N на промежутке [0; 1]. Общее же количество пар целых чисел m, n с условием 1 < т < п < N равно 1 71=1 Поэтому результат теоремы 3.7 можно выразить иначе: выбирая случайным образом пару целых чисел га,п, удовлетворяющих неравенствам 1 < т < п < N, можно получить несократимую дробь с ве- роятностью — = 0,6079... Доказательство. Обозначим сумму из (3.18) символом S(N). Тогда, пользуясь равенством (3.12), находим П=1 71=1 d\n Заменим в получившейся двойной сумме переменную суммирования п новой переменной fc, положив п = dk. Новые переменные суммирования d, k будут пробегать все пары натуральных чисел, удовлетворяющие неравенствам dk < N. Тогда N dk<N d=l l<k<N/d Из равенства (3.17) следует, что внутренняя сумма в правой части (3.20) равна —^ + O(N/d). Подставляя это выражение в Аа Аа (3.20) и пользуясь тем, что |fi(d)| < 1, находим 4fk d<N \ d<N Пользуясь оценкой леммы 2.6, заключаем, что 2 78
Заменим теперь конечную сумму 2_] ,2 сУмм°й РяДа d<N 1 6 При этом будет совершена ошибка, оцениваемая величиной -j2 < — (см. (3.11)), что, наконец, приводит к нужной асимп- d>N тотической формуле. Задачи для самостоятельного решения 1. Докажите, что для любой мультипликативной функции 8(п) выполняется тождество d\n p\n 2. Докажите тождество d\n 3. Докажите тождество d\n 4. Докажите тождество 5. Функция Лиувилля Х(п) определяется равенством fl ,еслип = 1; \(-l)ai+-+ae , если п = р?1 - • .р«*. Докажите, что функция Х(п) удовлетворяет тождеству Е jl , , X(d) = b , a[n ч 79
6. Определите две функции Чебышева т<х Они равны соответственно логарифму произведения всех натуральных чисел m < x и логарифму наименьшего общего кратного всех этих чисел, см. гл. 2. Докажите тождества п<х п<х 7. Докажите тождества: а) п=1 б) ОО / N 12 £ о ^ О* n=l в) П=1 где Tfc(n) — количество решений в натуральных числах уравнения Xi - • - Xk = П.
Глава 4 Числовые сравнения Множество всех целых чисел бесконечно. Удобнее работать с конечными объектами. Для многих задач оказывается полезным разбить все множество целых чисел на конечное количество классов, объединив в один класс все числа, имеющие одинаковый остаток при делении на некоторое фиксированное число. Простейшее разбиение такого сорта - четные и нечетные целые числа. Обращаясь с этими классами по определенным правилам, можно получать информацию о решениях рассматриваемой задачи. Описанию этой теории посвящена настоящая глава. 4.1. Сравнения и их основные свойства Пусть га > 2 — целое число. Определение 4.1. Два целых числа а и b называются сравнимыми по модулю га, если т\(а — Ь), т.е. если их разность делится на га. Число га называется модулем сравнения. Отношение сравнимости обозначается символом a = b(modra) и обладает следующими легко проверяемыми свойствами: 1) а = a(modra) для любого целого а; 2) если а = 6(modra), то Ъ = a(modra); 3) если а = b(modm) и Ь = c(modra), то а = c(modra). Например, свойство 3 следует из равенства a — с = (а — Ь) + (Ь — с), поскольку оба слагаемых в правой части делятся на т. Если разность а — b не делится на га, будем писать а ф ^ b(modm); 81
4) если а = Ь (mod га), с = d (mod m), то a + c = 6 + d( mod ra); a — c = 6 — d( mod ra); ac = bd( mod ra), т. е. сравнения по одному и тому же модулю можно почленно складывать, вычитать и умножать. Доказательства трех указанных сравнений следуют из равенств (Ь + d) - (а + с) = (6 - a) + (d - с); (Ь- d) - (а- с) = (Ь- а) - (d- с); bd — ас = (6 — a)d + (d — с)а и свойств делимости. Из свойства 4 следует также, что к любой из частей сравнения можно прибавить любое число, кратное модулю, обе части сравнения можно умножить на одно и то же целое число и возвести в одну и ту же натуральную степень. В результате получатся верные сравнения. В частности, отсюда следует, что если a = b (mod га) и Р(х) — произвольный многочлен с целыми коэффициентами, то Р(а) = Р(Ь) (mod га). Подобное свойство выполняется и для многочленов от нескольких переменных; 5) если аЬ = ас (mod га) и (а, га) = 1, то b = с (mod га). Действительно, согласно условию га | (ab — ас) = а(Ъ — с) и так как при этом га и а взаимно просты, по следствию 1.2 из теоремы 1.3 получаем га | (Ь — с). Условие взаимной простоты (а, га) = 1 в свойстве 5 существенно: 4 = 0 (mod 4), но из этого не следует, что 2 = 0 (mod 4); 6) обе части сравнения и модуль можно умножить на любое отличное от нуля число, т. е. из сравнения а = b (mod га) при d ф 0 следует ad = bd (mod rad). Из га | (b — a) следует rad | (b — a)d = (bd — ad); 7) обе части сравнения и модуль можно разделить на их общий множитель, т. е. из сравнения ad = bd (mod rad) при d ф 0 следует a = b (mod ra). Из rad | (bd — ad) = d(b — a), очевидно, следует га|(Ь — a); 8) если a = b (mod га), то (a, ra) = (b, ra). 82
Действительно, из условия следует, что b — а = тс с некоторым целым с. Но тогда b = а + тс и множество общих делителей чисел а и т совпадает с множеством общих делителей чисел b и т. В частности, наибольшие элементы этих множеств совпадают, т.е. (а, га) = (6,т); 9) если а = b (mod т) и d\m, то а = b (mod d). Согласно условию, b — а = me с некоторым целым с. Так как d | m, отсюда следует d\ (b — a); 10) если сравнение а = b имеет место по нескольким модулям, то оно имеет место и по модулю, равному наименьшему общему кратному этих модулей. Действительно, если а = b (mod raj), j = 1,2, ... ,r, то разность а— 6 делится на каждое из чисел ту По теореме 1.2 можно утверждать, что а — Ь делится на наименьшее общее кратное модулей rai, ... ,гаг. Пример 4..1. Докажем, что уравнение х2 - 5у2 = 3 (4.1) не имеет решений в целых числах. Предположим, что целые числа а и 6 удовлетворяют данному уравнению, т. е. а2 — 562 = 3. Тогда а2 = 3 (mod 5). Целое число а сравнимо с одним из чисел 0,1,2,3,4 по модулю 5. Тогда а2 сравнимо по этому же модулю с одним из чисел 0,1,22 = 4,32 = 4,42 = 1. Так как 3 не сравнимо по модулю 5 ни с одним из чисел 0,1,4, приходим к противоречию, доказывающему, что уравнение (4.1) не имеет решений в целых числах. 4.2. Классы вычетов. Кольцо классов вычетов по данному модулю Свойства сравнений 1 — 3 (см. 4.1) означают, что все множество целых чисел разбивается в объединение непересекающихся подмножеств, состоящих из чисел, попарно сравнимых между собой. Эти подмножества называются классами вычетов по модулю т. Элементы каждого из подмножеств называются вычетами этого класса. Класс вычетов, содержащий целое число а, будет обозначаться а. Таким образом, а = 6, если и только если a = Ь (mod m). Например, класс вычетов 0 состоит из всех чисел, делящихся на т. Каждое целое число а представимо в виде 83
а = mq + г, 0 < г < га, с целыми д, г. Отсюда следует, что а и г лежат в одном классе вычетов и, значит, каждый класс вычетов содержит целое число г из промежутка 0 < г < га. Таким образом, количество классов вычетов по модулю га не превосходит га. С другой стороны, каждое из чисел 0,1,2, ...,га — 1 лежит в некотором классе вычетов и классы эти различны, ведь разность любых двух чисел из указанного списка не делится на т. Эти рассуждения доказывают, что существует ровно га классов вычетов по модулю га. Каждый из них содержит единственное целое число г из промежутка 0 < г < га, называемое наименьшим неотрицательным вычетом класса, и потому 0, 1, ..., га-1 — все классы вычетов по модулю га. На множестве классов вычетов по модулю т можно ввести операции сложения, вычитания и умножения по правилам а + b = а + Ь; a — b = a — b\ ab = ab. (4.2) Свойство 4 сравнений показывает, что так определенные операции не зависят от выбора представителей классов а и 6 и действительно являются операциями между классами вычетов. Мнолсество классов вычетов по модулю га с так определенными операциями является коммутативным кольцом — кольцом классов вычетов по модулю га. Все аксиомы кольца, а также коммутативность легко проверяются с помощью свойств делимости. Роль нулевого элемента этого кольца играет класс 0. Действительно, для любого элемента а имеем Роль единичного элемента — класс вычетов 1 ; а • 1 = а • 1 = а; 1 • а = 1 • а = а. Проверка ассоциативности умножения выполняется так: а(Ъс) = abc = a(bc) = (ab)c = abc = (ab)c. Доказательство дистрибутивности проводится следующим образом: (a + b)c = a + bc= (a + b)c = ac + bc = ac + bc = ac + be. 84
Остальные аксиомы кольца проверяются столь же несложными преобразованиями. В кольце Z/mZ, вообще говоря, могут быть делители нуля. Например, при га = 6 имеем 3 • 4 = 12 = 0. Пусть а — целое число, d = (a, m), причем 1 < d < т. Тогда с некоторыми целыми числами u, v выполняются равенства а = du, га = dv и av = udv = um = 0 (mod m). Это значит, что а • v = 0, причем v ф 0, т. е. а — делитель нуля в кольце Z/mZ. Определим теперь группу обратимых элементов этого кольца. Лемма 4.1. Пусть а — целое число, взаимно простое с модулем т. Тогда найдется целое число 6, удовлетворяющее сравнению ab=l( mod га). (4.3) Доказательство. Рассмотрим числа а, 2а, За, ..., та. (4.4) Они не сравнимы друг с другом по модулю т. Ведь если ак = = а£ (mod m), где k,t — натуральные числа, не превосходящие т, то по свойству 5 сравнений выполняется к = I (mod га), что возможно лишь в случае к = £. Итак, числа (4.4) принадлежат различным классам вычетов по модулю га. Количество этих чисел равно га, поэтому какое-то из них принадлежит классу 1. Если это число равно Ьа, 1 < b < га, то аЬ = 1 (mod га). ■ Приведенное доказательство леммы 4.1 неконструктивно. Оно не позволяет найти число Ь, удовлетворяющее сравнению (4.3). Рассмотрим диофантово уравнение ах — ту = 1 относительно неизвестных я, у. Согласно теореме 1.5 это уравнение разрешимо в целых числах. Действуя так, как описано в подразделе 4.1, можно найти пару чисел х = Ь, у = с, удовлетворяющую равенству ab — гас = 1. Тогда аЬ = 1 (mod га). Эти рассуждения дают еще одно доказательство леммы 4.1. Если целое число а взаимно просто с модулем га, то по лем- ме 4.1 найдется целое Ь, удовлетворяющее (4.3). Тогда ab = ab= 1 и класс вычетов а обратим. Если же (а, га) > 1, то по доказанному ранее класс вычетов а есть делитель нуля в кольце G Z/raZ и потому обратимым быть не может. Итак, класс вычетов а обратим, если и только если (а, га) = 1. По свойству 8 сравнений, если некоторый класс вычетов содержит число а взаимно простое с модулем, то все вычеты этого класса будут взаимно простыми с модулем. Поэтому среди 85
всех классов вычетов выделяются классы, состоящие из элементов, взаимно простых с модулем. Эти классы имеют вид к для О < к < т и (fc,ra) = 1. Количество таких чисел к равно ф(ш), т.е. задается функцией Эйлера. Итак, доказано следующее утверждение. Теорема 4.1. Множество классов вычетов по модулю т с операциями, определенными равенством (4-2), образует коммутативное кольцо с единицей. Группа обратимых элементов этого кольца состоит из ц(т) классов, наименьшие неотрицательные вычеты которых взаимно просты с модулем. В частности, если модуль т есть простое число, т. е. у(т) — — т — 1, то каждый класс вычетов, отличный от 0, имеет обратный в кольце Ъ/тЪ. Это значит, что кольцо классов вычетов по простому модулю есть поле. На языке сравнений удобно описывать так называемые признаки делимости чисел. При наличии калькулятора или компьютера, конечно, удобнее воспользоваться техническими средствами, но иногда бывает польза и от вычислений на бумаге. Предположим, нам нужно узнать, делится ли данное натуральное число N на некоторое другое число d. Идея всех признаков делимости состоит в том, чтобы построить меньшее число М, делящееся на d одновременно с N. Следующий общий способ основан на использовании леммы 4.1. Пусть d — натуральное число, взаимно простое с основанием системы счисления 10. Тогда согласно лемме 4.1 найдется число /с, для которого 10fc = 1 (mod d). Пусть теперь N = Wu+v, где it, v — целые числа. Тогда справедливо сравнение по модулю d N = Юи + v = 10u + 10kv = Щи + kv)( mod d). Обозначим М = u + kv. Поскольку числа 10 и d взаимно просты, то из сравнения следует, что N и М одновременно делятся на d. Так что вопрос о делимости N на число d сводится к выяснению, делится ли на d число М. Если при этом окажется, что М < iV, то наша задача упростилась. Рассмотрим некоторые примеры. В них число v равно младшей цифре в десятичной записи числа N. Пример J^.2. d = 7. В этом случае справедливо сравнение 10(—2) = 1 (mod 7) и можно взять к = —2. Из изложенного ранее следует, что число N = Юи + v делится на 7 одновременно с числом и — 2v. Заменяя данное число N меньшими числами по 86
этому правилу, получаем последовательность убывающих чисел N{. Пусть, например, N = 22 624. Тогда JVX = 2 262 - 2 • 4 = 2 254; N2 = 225 - 2 • 4 = 217; ЛГ3 = 21 - 2 • 7 = 7. Так как последнее число делится на 7, то 22 624 также делится на 7. Пример 4-3. d = 13. Имеем 10-4 = 1 (mod 13) и можно взять к = 4. Число N = 10it + г? делится на 13 одновременно с числом и + 4г>. Пусть, например, N = 32 721. Тогда iVi = 3 272 + 4 -1 = 3 276; N2 = 327 + 4 - 6 = 351; ЛГ3 = 35 + 4 • 1 = 39. Последнее число делится на 13, поэтому 32 721 также делится на 13. Пример 4-4- d = 17. Имеем 10(—5) = 1 (mod 17) и можно взять к = —5. Число N = 10и + v делится на 17 одновременно с числом и — 5v. Пусть, например, N = 39 321. Тогда АГх = 3 932 - 5 • 1 = 3 927; N2 = 392 - 5 • 7 = 357; jV3 = 35 - 5 • 7 = 0. Итак, число 39 321 делится на 17. При d = 19 можно взять к = 2; при d = 23 имеем к = 7; при d = 29 - к = 3. Для d = 3 и d = 9 имеем к = 1 и, как легко проверить, получается известный признак: натуральное число делится на 3 или 9, если сумма его цифр делится на 3 или 9. А в случае d = 11 натуральное число делится на 11 в там и только том случае, когда знакочередующаяся сумма его цифр делится на 11. Для доказательства этих утверждений нужно также использовать индукцию по количеству цифр. 4.3. Полная и приведенная системы вычетов Совокупность представителей всех классов вычетов по заданному модулю т > 2 называется полной системой вычетов по модулю т. Например, числа —2,-1,0, 1,2 составляют полную 87
систему вычетов по модулю 5. Еще один пример полной системы вычетов по модулю 5 составляют числа 0,2У 22 = 4,23 = 8,24 = 16. Совокупность наименьших неотрицательных вычетов всех классов, т. е. чисел 0,1, ..., т — 1У составляет полную систему вычетов. Любые m числа, попарно несравнимые друг с другом по модулю т, образуют полную систему вычетов по этому модулю, ведь они принадлежат различным классам вычетов, а количество их равно числу классов. Набор чисел (4.4) при а, взаимно простом с модулем т, составляет, как это установлено при доказательстве леммы 4.1, полную систему вычетов. Еще один пример полной системы вычетов — совокупность целых чисел ж, удовлетворяющих неравенствам—— < х < —. Это так называв- мые абсолютно наименьшие вычеты классов по модулю га. Так, при 7тг = 5 имеем уже указанную ранее полную систему вычетов —2,-1,0,1,2, а при га = 6 — систему вычетов —2,-1,0,1,2,3. В подразделе 4.2 было доказано, что существует ср(га) классов вычетов по модулю т, состоящих из чисел, взаимно простых с модулем. Любой набор представителей этих классов вычетов называется приведенной системой вычетов. Любые <р(га) чисел, попарно несравнимые друг с другом по модулю т и взаимно простые с модулем, образуют приведенную систему вычетов по модулю 771, действительно, ведь они лежат в различных классах, состоящих из чисел, взаимно простых с т, а количество их равно количеству таких классов. Теорема 4.2. Пусть а,т > 2 — целые взаимно простые числа. Тогда: 1) если х пробегает полную систему вычетов по модулю га, то ах + Ь, где Ъ — любое целое число, также пробегает полную систему вычетов по модулю га; 2) если х пробегает приведенную систему вычетов по модулю т, то ах также пробегает приведенную систему вычетов по этому модулю. Доказательство. Для доказательства первого утверждения достаточно проверить, что для любых двух чисел х\ и х^ лежащих в различных классах вычетов по модулю т, числа ах\ + Ь и ах2 + Ь также лежат в различных классах вычетов. Предположим противное. Тогда ах\ + Ь = ах2 + b (mod m). Из этого сравнения следует, что ах\ = ах^ (mod m), и поскольку числа а, т взаимно просты, по свойству 5 сравнений заклю- 88
чаем, что х\ = х^ (mod га). Но это невозможно, так как х\ и x<i принадлежат различным классам вычетов по модулю га. Первое утверждение теоремы доказано. Из изложенного ранее следует, что для любых двух различных чисел xi, X2 приведенной системы вычетов числа axi, ax2 лежат в различных классах вычетов. Осталось доказать, что для х, лежащего в приведенной системе вычетов, число ах взаимно просто с т. Так как (а, га) = 1 и (ж, га) = 1, то по следствию 2.3 из теоремы 2.2 заключаем, что (аж, га) = 1. Теорема доказана полностью. ■ 4.4. Теорема Вильсона Следующее утверждение, характеризующее простые числа, называется теоремой Вильсона1. Теорема 4.3 (теорема Вильсона). Для любого простого числа р выполняется сравнение (р-1)1 + 1 = 0 (mod p). Доказательство. Для р = 2 утверждение очевидно выполняется, поэтому далее будем считать, что р нечетно. Пусть а — некоторое целое число из промежутка 1 < а < р. Так как (а, р) = = 1, то по лемме 4.1 существует целое число 6, удовлетворяющее сравнению аЪ = 1 (mod р). При этом молено считать, что Ь есть наименьший неотрицательный вычет в своем классе. Ясно, что Ъ ф 0, т. е. 1 < Ь < р. Кроме того, число Ь определяется единственным образом. Ведь если ab\ = 1 (mod p); ob<i = 1 (mod p), то р | а(Ь\ — 1)2) и р | {Ъ\ — 62)? что при различных bi, 62 из промежутка 1 < b < p невозможно. Если b = a (mod р), то а2 = 1 (mod р) и р \ (а2 — 1) = (а — — 1)(а +1). Так как р — простое число, это возможно лишь в случае а = 1 или а — р — 1. Из доказанного следует, что множество целых чисел а из промежутка 1 < a < р — 1 может быть разбито на пары различных целых чисел а, 6, удовлетворяющих сравнению ab ■= 1 (mod p). Следовательно, р-2 fc= I (mod p). теорема впервые была доказана французским математиком Ж. Л. Лагранжем (1771). 89
Умножив это сравнение на р — 1, получим (р - 1)! = р - 1 = -1 ( mod p). ■ Для составных чисел теорема Вильсона, конечно, нарушается. Ведь если целое число N имеет делитель d, I < d < iV, то (N — 1)! делится на d. Значит, (N — 1)! + 1 на d не делится, а потому не делится и на N. 4.5. Теоремы Эйлера и Ферма Следующее утверждение было доказано Л. Эйлером (1760) и носит его имя. Теорема 4.4 (теорема Эйлера). Для каждого целого числа а, взаимно простого с модулем т, выполняется сравнение а^™) ее 1 (mod га). Доказательство. Пусть гi, ..., г^ — какая-нибудь приведенная система вычетов по модулю га. Тогда h = ср(га). Согласно теореме 4.2 множество чисел аг\,аг2, ...^агь также составляет приведенную систему вычетов. Это значит, что каждое число второй системы лежит в одном классе с каким-либо единственным числом первой системы вычетов. Поэтому справедливы сравнения аг\ • аг2 • • • arh = r\ • r<i • • • r^ ( mod га). (4.5) Так как каждое из чисел rj взаимно просто с модулем, то сравнение (4.5) можно сократить на каждое из г у В результате получаем сравнение ah = 1 (mod га) или аф(т) =■ 1 (mod га). ■ Например, для га = 10 имеем ср(10) = 4. В соответствии с теоремой Эйлера можно утверждать, что каждое нечетное число а, не делящееся на 5, удовлетворяет сравнению а4 = 1 (mod 10), т.е. последняя цифра в десятичной записи числа а4 равна 1. И действительно, I4 = 1, З4 = 81, 74 = 2 401, 94 = 6 561. Пример 4' &• Определим последние три цифры в десятичной записи числа З2007. Для этого достаточно сосчитать З2007 (mod 1 000). Так как ср(1 000) = ср(8) • ср(125) = 4 • 100 = 400 90
и (3,1 000) = 1, то по теореме Эйлера выполняется сравнение З400 ее 1 (mod 1000). Отсюда следует 32 007 = ^400)5 . 37 = з7 ( mod 1 000). Эти сравнения означают, что З2007 и З7 = 2 187 имеют одинаковые три последние цифры, и десятичная запись числа З2 007 оканчивается цифрами 187. Для некоторых чисел а сравнение ad = I (mod га) может выполняться и при натуральных d < ср(га). Например, для а = 1 можно взять d = 1. Имеем З2 = 1 (mod 8), тогда как ср(8) = 4. Можно проверить, что З100 = 1 (mod 1000), но ранее установлено равенство ср(ЮО) = 400. Наименьшее натуральное число d с условием ad = I (mod га) называется показателем числа а по модулю га. Лемма 4.2, Пусть d — показатель числа а по модулю га. Натуральное число к удовлетворяет сравнению ак = 1 (mod га) в том и только том случае, когда d\k. В частности, d | ср(га). Доказательство. Для каждого k = ds имеем ак = (ad)s = 1 (mod га). Докажем утверждение в обратную сторону. Пусть ак = l(mod m). Разделив к на d с остатком, получим к = dq + r, 0 < г < d. Тогда ar = (ad)q • аг = ак = 1 (mod га). Учитывая, что d — наименьший натуральный показатель с условием ad = 1 (mod га) и г < d, заключаем, что г = 0. Следовательно, d\ к. Ш Рассмотрим частный случай теоремы Эйлера, в котором га = = р есть простое число. Тогда ср(р) = р — 1 и получается следующее утверждение. Теорема 4.5 (малая теорема Ферма). Если целое число а не делится на простое число р, то ар~1 = 1 (mod p). Из этой теоремы следует, что при любом целом а число оР — — а = а(ар~1 — 1) делится на р. 91
4.6. Представление рациональных чисел бесконечными десятичными дробями Как пример использования теоремы Эйлера, рассмотрим представления рациональных чисел а бесконечными десятичными дробями, т. е. в виде рядов оо а = а0 + ^2 JFjk = а°' а1а2 • • • > (4-6) где все а&, к > 1, есть цифры 0 < а^ < 9, и покажем, что рациональным числам соответствуют периодические разложения. Прежде всего, существует не более одного представления числа а в виде (4.6), содержащего бесконечное количество цифр, отличных от 9. Это следует из того, что при любом к > 0 справедливо равенство aolOfc + ... + аь-ilO + a& = [lO^a]. Докажем, что сумма ряда, соответствующего бесконечной периодической десятичной дроби, есть рациональное число. Это достаточно доказать для чисто периодической дроби a = = 0(aiu2 ... am). Обозначив А = a\\Qm~l + ... + am_il0 + am и пользуясь формулой для суммы геометрической прогрессии, найдем 10 102 10"» 1^ Заметим, что если при этом a = - — несократимое представле- о ние в виде отношения натуральных чисел, то Ь \ (10ш — 1), т.е. 10т = 1 (mod 6). Пусть теперь a = -г, где 0 < а < Ъ и (6,10) = 1. Обозна- о чим буквой d показатель числа 10 по модулю Ь. Тогда 10d = = 1 (mod b) и с некоторым натуральным числом с выполняется равенство 10d — 1 — be. Записав теперь ас в десятичной системе счисления В — ас — bilO^"1 + ... + fe^-ilO + Ьд и пользуясь тождеством (4.7), получим представление а в виде бесконечной периодической дроби 92
Период в бесконечном десятичном разложении числа а записывается теми же цифрами, что и числитель в представлении а = —p-j . При этом нужно иметь в виду, что период может 1U — 1 начинаться с некоторого количества нулей, так — = 0, (01). а Если рациональное число а > 1, то числитель дроби а = —, о (а, Ь) = 1, можно представить в виде а = bq + г, 0 < г < 6, и, разложив - в бесконечную периодическую дробь, получим т = Ч-> Q>i • • • bd). При г = 0 имеем а = q = g, (0). Если знаменатель дроби - не взаимно прост с 10, т. е. делится о на 2 или на 5, то его можно умножить на такое натуральное число и = 2S5*, что получится равенство ub = 10fct>, где (г?, 10) = 1 и к = max(v2(6), V5(b)). Тогда Получившееся представление дает конечную десятичную дробь в случае v = 1 и бесконечную периодическую дробь, если v > 1. Заметим также, что в случае (6,10) = 1 длина минимального периода равна показателю 10 по модулю Ь. В силу леммы 4.2 длина периода не превосходит при этом ср(Ь). Минимальную длину периода ср(Ь) имеют, как можно проверить, рациональные числа со знаменателями Ъ = 7, 17, 19, 23, 29, 47, 49, 59, 61, 97. Список исчерпывает все такие b < 100. Пусть а = у — несократимое представление с (Ь, 10) = 1. о Пусть также - = 0, (Ь\... bd) и с = 10а (mod Ь), 0 < с < Ь. Тогда b с некоторым целым q имеем Период дроби 7 получается из периода — циклическим сдвигом b b на одну позицию. Если допустить в этом случае не чисто периодические разложения, то 93
и можно сказать, что бесконечные разложения дробей - и - имеют одинаковые периоды. В частности, если показатель 10 по модулю b равен ср(6), то бесконечные десятичные разложения всех дробей -, 1 < а < 6, о (а, Ь) = 1 имеют одинаковые периоды. Например, ]- = 0, (142857); ^ = 0, (285714); ^=0,(428571); ^ = 0,(571428); ^ = 0,(714285); ^ = 0,(857142). 4.7. Проверка на простоту и построение больших простых чисел Пусть N — натуральное число, вообще говоря, большое. Оно может быть либо составным, либо простым. Как определить, к какому из этих двух классов относится данное число? Можно попробовать разделить N на простые числа из таблицы, составленной с помощью решета Эратосфена и содержащей все простые числа до некоторой границы В, определяемой нашими возможностями. Если у N есть малые простые делители, то их можно найти таким способом и доказать, что N — составное число. Если же малые простые делители не обнаружены и В сравнительно велико, а именно В2 > N, можно утверждать, что N — простое число. Действительно, если бы N было составным, по лемме 2.1 оно имело бы простой делитель р < \N < jB, содержащийся в нашей таблице. Но таковой отсутствует. В случае же N > В2 никакого заключения о числе N сделать нельзя. Далее будем считать, что N достаточно велико и не имеет малых простых делителей. Выберем целое число а, 1 < а < iV, и вычислим с помощью алгоритма Евклида наибольший общий делитель d = (a, N). Если оказалось, что d > 1, то можно утверждать, что N — составное число, ведь оно делится на d, причем Kd<N. Если же оказалось, что (a, N) = 1, то о числе N опять никакого заключения сделать нельзя. Если у составного числа N нет 94
малых простых делителей, то количество взаимно простых с ним чисел а на интервале 1 < d < N, равное ср(ЛГ) - 1 = NY[p\N(l - — р~1) — 1, будет достаточно большим, и маловероятно, что выбранное наугад число а позволит разложить число N на множители. В этом случае может помочь малая теорема Ферма. Если для числа N и выбранного а с условием (a, N) = 1 ее утверждение нарушается, можно утверждать, что N — составное число. Итак, если (а,ЛГ) = 1, и aN~l^l(mod ЛГ), то N — составное число. Простейший алгоритм для вычисления ad (mod ЛГ), состоящий в последовательном умножении на а результата предшествующего вычисления, требует d— 1 умножений. В действительности это вычисление можно провести намного быстрее. Пример 4-6. Вычислим 2436 (mod 437). Поскольку числа не очень большие, это можно сделать с помощью калькулятора. Используя свойства сравнений (для краткости не будем указывать модуль сравнения, равный 437), получаем: 23 = 4 • 2 = 8; 26 = 82 = 64; 213 = 642 . 2 ^ _Ш; 227 s (_iii)2 . 2 ^ 170; 254 s 1702 s 5g; 2109 = 582 • 2 = 173; 22i8 s 1732 = 213; 2436 = 2132 = 358 ф 1. Проведенные вычисления не раскладывают число 437 на множители, но доказывают, что оно составное. Как легко проверить, 437 = 19 • 23. Может показаться, что указанный способ проверки требует слишком много вычислений. Но эти вычисления однотипны — либо возведение в квадрат, либо удвоение числа по модулю N. И это обстоятельство оказывается очень удобным при реализации алгоритма на компьютере. А кроме того, как будет видно далее, и количество возведений в квадрат мало по сравнению с величиной N. Пример 4.6 есть частный случай общего алгоритма. Алгоритм 4.1. Даны: целые числа a,N> I, d > 0. Найти: ad (mod N). Шаг 1. Представить d в двоичной системе счисления, т. е. найти такие цифры dj G {0, 1}, что d = do2r Н bdr_i2 + dr, d0 = 1. 95
Шаг 2. Положить ао = аи затем для г = 1, ..., г вычислить ai = a\_xadi (mod N). (4.8) Шаг 3. Положить ad = ar (mod N). Таким образом, в случае d{ = 0 алгоритм вычисляет а{ = = а?_х (mod iV), если же d{ — 1, то а^ = а?_х • а (mod N). Pea- • лизованная последовательность вычислений для d = 436 = 28 + + 27 + 25 + 24 + 22 (см. пример 4.6) в точности соответствует алгоритму. Докажем теперь, что алгоритм работает правильно и количество выполняемых им арифметических операций не очень велико. Теорема 4.6. Алгоритм действительно вычисляет ad(mod N). Он использует для этого не более 2[log2d] умножений в кольце вычетов Z/iVZ. Доказательство. При всех г = 0,1, -.., г справедливы сравнения (И = л*2*+~+* (mod N). (4.9) Докажем это индукцией по L При г = 0 утверждение выполняется, так как do = 1. Подставив (4.9) в равенство п{+\ = afadi+l, находим равенство (4.9) для а»+1- Это доказывает (4.9) для всех г. При i = г получаем ar = ad, что доказывает правильность алгоритма. Для доказательства второго утверждения обозначим символом c(d) количество умножений в кольце Z/JVZ, необходимых алгоритму для вычисления ad (mod iV). Докажем индукцией по d неравенство c(d) <2[log2d]. (4.10) Обозначим для этого т = do2r~l + • • • + dr-\. Тогда d = 2m + + dr> 2m. При d = 1, 2 неравенство (4.10) очевидно выполняется. Пусть теперь d > 3. В силу алгоритма справедливы соотношения c(d) = c(m) + 1 + dr < c(m) + 2 < 2[log2 m] + 2 = = 2[log22m]<2[log2d], доказывающие нужное неравенство. ■ Одним из понятий, используемых для сравнения эффективности алгоритмов, является их сложность. Сложность алгорит- 96
мов теории чисел обычно принято измерять количеством арифметических операций (сложений, вычитаний, умножений и делений с остатком), необходимых для выполнения всех действий, предписанных алгоритмом. Впрочем, это определение не учитывает величины чисел, участвующих в вычислениях. Ясно, что перемножить два стозначных числа значительно сложнее, чем два однозначных, хотя и в том и в другом случае выполняется лишь одна арифметическая операция. Поэтому иногда учитывают еще и величину чисел, сводя дело к так называемым битовым операциям, т. е. оценивая количество необходимых операций с цифрами 0 и 1 в двоичной записи чисел. Это зависит от рассматриваемой задачи, от целей автора и т. д. Говоря в дальнейшем о сложности, будем иметь в виду количество арифметических операций, необходимых для выполнения алгоритмов. Алгоритмы, в которых количество арифметических операций может быть оценено некоторой степенью числа цифр, необходимых для записи данных, называются полиномиальными. Такие алгоритмы, как правило, работают достаточно быстро при их использовании на практике. Алгоритм Евклида требует выполнения O(loga) арифметических операций (см. теорему 1.2). Для алгоритма 4.1 возведения в степень согласно теореме 4.6 нужно O(\ogd) арифметических операций. Так как целое число d записывается в двоичной системе счисления не менее чем log2d цифрами, получаем, что как алгоритм Евклида, так и алгоритм возведения в степень относятся к разряду полиномиальных, т. е. быстрых алгоритмов. Теорема Вильсона также может быть использована для определения, является ли данное натуральное число простым или составным. В отличие от теоремы Ферма быстрые алгоритмы для вычисления факториалов не известны, а использование формулы к\ = к(к - 1)! (mod N) требует примерно N умножений для нахождения (АГ — 1)! (mod N). Основанный на этой формуле алгоритм не является полиномиальным. Его использование на практике требует очень много времени на вычисления, и даже при сравнительно небольших N ответ с помощью этого алгоритма получить не удается. Сравнительно недавно, в 2000 г., был найден детерминированный алгоритм полиномиальной сложности, позволяющий по заданному натуральному числу N сказать, будет оно простым или составным. Он был предложен индийскими математиками М. Агравалом, Н. Кайалом и Н. Саксеной. Но этот алгоритм не очень удобен на практике, так как требует слиш- 4 Нестеренко 97
ком большого объема памяти при вычислениях на компьютере. Объем необходимой памяти — еще одна характеристика качества алгоритма. Используемые в настоящее время алгоритмы для проверки простоты заданного числа N имеют сложность О ((logiV)clogloglogAr) с некоторой постоянной с > 0. Поскольку функция log log log x растет очень медленно в пределах, важных для практического использования, эти алгоритмы работают быстро. Однако знания, необходимые для их описания, выходят за рамки настоящей книги. К сожалению, с помощью малой теоремы Ферма не всегда можно проверить, что испытываемое число N — составное. Существуют составные числа, для которых выполняется сравнение aN~l = 1 (mod N) при любом целом а с условием (a, N) = 1. Пример ^.7. N = 561 = 3-11-17. Для каждого целого а, взаимно простого с 561, имеем (а, 3) = (а, 11) = (а, 17) = 1 и по малой теореме Ферма выполняются сравнения а2 = 1 (mod 3); а10 = 1 ( mod 11); а16 = 1 ( mod 17). Так как 560 делится на 2,10 и 16, то число а560 — 1 делится на каждую из разностей а2 — 1, а10 — 1, а16 — 1. Значит, а560—1 делится на 3, 11, 17 и потому делится на произведение этих чисел, т.е. делится на 561. Составное число N называется числом Кармайкла1, если aN-i ^ 1 ^ mod Nj при любом а е Z, (а, N) = 1. (4.11) Числа Кармайкла встречаются в натуральном ряду достаточно редко, но известно, что их множество бесконечно. Рассмотрим следующий алгоритм, доказывающий для составного числа, что оно является составным, и несколько более точный, чем прямое использование малой теоремы Ферма. Алгоритм 4.2. Дано: нечетное натуральное число N > 2. Определить: будет ли N составным числом. Шаг 1. Найти целые числа s,t, для которых N — 1 = 2% причем t нечетно. Выбрать целое число а, 1 < а < N. Шаг 2. Если (а, N) > 1, то N — составное число. ^armichael — английский математик, доказавший (1912), что каждое составное число со свойством (4.11) есть произведение различных нечетных простых чисел, N = pi • • -pr, причем г > 3 и (р3г — 1) | (N — 1) при всех j. Число 561 обладает этим свойством. Еще один пример 1 729 = 7-13-19. 98
Шаг 3. Если (a, N) = 1 и выполнены условия а* # 1 ( mod iV); а2*' ^ -1 ( mod N); (4Д2) то N — составное число. Шаг 4- Если хотя бы одно из условий шага 3 нарушается, то алгоритм завершает свою работу не дав ответа. Очевидно, ответ алгоритма в шаге 2 верен. Справедливо разложение на множители aN~l - 1 = (а* - 1)(а* + 1)(а2' + 1). -. (а2*'4 + 1). (4.13) Если N — простое число, то по малой теореме Ферма обе части последнего равенства должны делиться на N и, следовательно, хотя бы один из сомножителей в правой части (4.13) должен делиться на N. Значит, хотя бы одно из условий (4.12) будет нарушено. Это доказывает, что и в п. 3 алгоритм дает верный ответ. Можно доказать, что для составного нечетного N > 9 количество взаимно простых с N чисел а, 1 < а < N, для которых нарушается хотя бы одно из условий (4.12), сравнительно невелико, а именно, оно не превосходит — ср(ЛГ), где (f(N) — функция Эйлера. Это значит, что если алгоритму 4.2 задано составное число N и он выбирает в п. 1 число а на интервале 1 < а < N случайным образом, то с вероятностью > - алгоритм докажет, что N — составное число. А применяя этот алгоритм г раз и выбирая каждый раз число а по-новому, докажем, что N — составное с вероятностью > 1 — 4~г. Подчеркнем еще раз, что алгоритм всегда дает правильный ответ, а оценивается лишь вероятность того, что ответ будет получен. Алгоритм 4.2 дает удобное на практике средство отсеивания составных чисел. Если он сработал достаточно много раз и не дал ответа, можно надеяться, что испытываемое число просто. К сожалению, алгоритм не доказывает это. Рассматриваемая далее теорема позволяет получать некоторую информацию о возможных делителях N и приводит к некоторому достаточному условию простоты. Теорема 4.7. Пусть N — нечетное и F — натуральное числа, такие, что для любого простого делителя q \ F существует Целое а с условиями aF = 1 (mod N), (aF'q - 1, Лг) = 1. (4.14) 99
Тогда любой простой делитель р числа N удовлетворяет сравнению р= 1 (mod F). Доказательство. Пусть р — простой делитель N;q — простой делитель F и а — число, удовлетворяющее (4.14). Тогда aF = 1 ( mod р), aF'q ф 1 (mod p) (4.15) и, в частности, а не делится нар. Обозначим буквой d показатель а по модулю р, т. е. наименьшее натуральное число с условием ad = 1 (mod р). Так как по малой теореме Ферма av~l = 1 (mod p), то в силу леммы 4.2 имеем d\p — 1 и v,(d)<vff(p-l). (4.16) Из (4.15) и леммы 4.2 следует, что d \ F и d \ F/q. Это возможно лишь в случае vg(F) = v,(d). (4.17) Из (4.16) и (4.17) находим Последнее неравенство согласно условию справедливо для любого простого делителя q числа F, поэтому F\p — 1 или р = = 1 (mod F). Ш Пусть а > 1 и m — натуральные числа. Если m имеет нечетный простой делитель г, т. е. т = rs, то из равенства s ат + 1 = (а5)г + 1 = (as + l)(ae(r"1) - a<r~^ + ... - a следует, что am + 1 — составное число. Значит, число ат + 1 может быть простым лишь в случае, если т не имеет нечетных простых делителей, т. е. т = 2П. Числа Fn = 22n + 1, 71=1,2, ... называются числами Ферма. Первые четыре числа Ферма Fi = 5, F2 = 17, F3 = 257, F4 = 65 537 (4.18) просты. 100
П. Ферма предположил (1640), что при любом целом п > 1, число Fn будет простым, но не смог доказать это для F5 = 232 + l. Л. Эйлер показал (1729), что F5 делится на 641, и тем опроверг гипотезу Ферма. Короткое доказательство этого факта использует представления Пользуясь ими, получаем F5 = 232 + 1 = -54-228 + 1 = -(5-27)4 + 1 = -1 + 1 = 0 (mod 641). Позлее было доказано, что числа Fq^Fj — составные. Последнее число было разложено на простые множители в 1970 г. Число F& — также составное, но его простые делители неизвестны. В настоящее время неизвестно, будет число Fn простым или составным. Не найдено ни одного простого числа Ферма, отличного от чисел (4.18). В связи с числами Ферма отметим знаменитую теорему Гаусса: правильный п-угольник может быть построен с помощью циркуля и линейки лишь в случае п = 2kp\ • • -рг, где pj — различные простые числа Ферма. Как же можно было угадать возможный делитель 641 числа Ферма F5? Воспользуемся для этого теоремой 4.7 и выберем N = F5 = 232 + 1, F = 128, а = 216 + 1. Так как а2 = 232 + 2 • 216 + 1 = 217 ( mod N), то а64 = 217'32 = (-1)17 = -1 (mod N). Следовательно, а128 = 1 ( mod N), (а64 - 1, W) = (2, N) = 1. Согласно теореме 4.7 каждый простой делитель р числа F5 должен удовлетворять сравнению р = 1 (mod 128). Первые простые числа в прогрессии 1 + 128& есть 257 и 641. Они получаются при к = 2 и к = 5 соответственно. Второе из них есть делитель числа Ферма F$. Предположим далее, что известна лишь часть F разложения числа N — 1 на простые сомножители. Эта информация позволяет сделать некоторые заключения о свойствах делителей числа 101
N. А если известная часть разложения N — 1 достаточно велика, то иногда можно сделать вывод об отсутствии нетривиальных делителей, т. е. о простоте N. Рассмотрим сначала случай, когда F = N — 1, т. е. известно полное разложение числа N — 1 на простые множители. Этот случай представляют, например, числа Ферма. Следствие 4.1. Пусть N нечетно и для каэюдого простого делителя q числа N — 1 существует целое а с условиями aN~l = 1 (mod N), (ap-W* - 1, лЛ = 1. (4.19) Тогда N — простое число. Доказательство. Применяя теорему 4.7 с F = N — 1, заключаем, что каждый простой делитель р числа N удовлетворяет сравнению р = 1 (mod N — 1) и, значит, р> N. Но это возможно лишь в случае р = JV, т. е. когда N — простое число. ■ К сожалению, чаще всего при доказательстве простоты какого-либо числа N разложение N — 1 на простые множители удается определить лишь частично. В таком случае может помочь следующее утверждение. Следствие 4.2. Пусть N, F нечетны R < 4F + 3, причем для каждого простого делителя q числа F существует целое b с условиями 1 = 1 (mod AT), (V^-i)/<? - 1, J\r) = 1. (4.20) Тогда N — простое число. Доказательство. Применим теорему 4.7 ка = bR. Согласно этой теореме каждое простое p\N удовлетворяет сравнению р = = 1 (mod F) и, поскольку р — 1 четно, a F нечетно, удовлетворяет неравенству р > 1 + 2F. Предположим, что N — составное. Тогда по лемме 2.1 (2F + I)2 < р2 < N = FR + 1 < 4F2 + 3F + 1. Получившееся противоречие завершает доказательство. ■ Как правило, необходимость в больших простых числах возникает в связи с различными криптографическими приложениями. Этот вопрос будет затронут далее (см. 4.8). Естественно, к 102
конструируемым числам предъявляются определенные требования. Конструкция простых чисел должна быть массовой, а сами простые числа в каком-то смысле хорошо распределенными в заданном диапазоне. Для нужд криптографии естественно требовать, чтобы конструируемые простые числа, по крайней мере внешне, не имели каких-либо особенностей, выделяющих эти числа среди множества всех простых. С другой стороны, на практике иногда нужны простые числа р, обладающие какими- либо дополнительными особенностями, например р — 1 не должно иметь малых нечетных простых делителей. Все применяемые алгоритмы строят возрастающую последовательность простых чисел, используя на каждом шаге простые числа, построенные ранее. Процесс продолжается до тех пор, пока не будет построено простое число нужной величины. В качестве простейшего примера покажем, как с помощью следствия 4.2, имея большое простое число F, можно построить существенно большее простое число N. Выберем для этого случайным образом целое число Q на промежутке F < Q < 2F + 1 и положим N = 2FQ + 1. Затем можно проверить число N на отсутствие малых простых делителей. Испытать его некоторое количество раз с помощью алгоритма 4.2. Если при этом выяснится, что N — составное число, следует выбрать новое значение Q и опять повторить вычисления. Так нужно делать до тех пор, пока не будет найдено число ЛГ, выдержавшее испытания алгоритмом 4.2 достаточно много раз. В этом случае появляется надежда на то, что N — простое число, что и следует попытаться доказать с помощью следствия 4.2. Для этого можно случайным образом выбирать число Ь, 1 < b < iV, и проверять для него выполнимость условий Ъ"-1 = 1 ( mod N), (b2Q - 1, N) = 1. (4.21) Если при выбранном b эти соотношения выполняются, то, поскольку 2Q < 4F + 2 < 4F + 3, согласно следствию 4.2 можно утверждать, что число N — простое. Если же условия (4.21) нарушаются, нужно выбрать другое значение b и повторять эти операции до тех пор, пока такое число не будет обнаружено. Предположим теперь, что построенное число N действительно является простым. Зададимся вопросом: «Сколь долго придется перебирать числа 6, пока не будет найдено такое, для которого выполнены условия (4.21)?». Заметим, что для простого числа N первое условие (4.21), согласно малой теореме Ферма, 103
будет выполняться всегда. Те же числа 6, для которых нарушается второе условие (4.21), удовлетворяют сравнению Ь2® = = 1 (mod N). В гл. 5 будет доказано, что в промежутке 1 < < Ъ < N имеется не более 2Q — 1 чисел, удовлетворяющих сравнению Ь2® = 1 (mod N). Это означает, что, выбирая случайным образом числа b на промежутке 1 < b < iV, при простом N можно с вероятностью большей чем 1 — F"1 найти число Ь, для которого будут выполнены условия следствия 4.2, и тем доказать, что N действительно является простым числом. Заметим, что построенное таким способом простое число N будет удовлетворять неравенству N > 2F2, т. е. количество цифр в его записи более чем вдвое будет превосходить количество цифр в записи исходного простого числа F. Заменив теперь число F на найденное простое число N и повторив с этим новым F все указанные действия, можно построить большее простое число. Начав с какого-нибудь небольшого числа, простоту которого можно проверить, например, делением на малые табличные простые числа, и повторив указанную процедуру достаточное число раз, можно построить простые числа нужной величины. Покажем пример вычислений с помощью описанной схемы. Начнем с простого числа F\ — 1 223. Пользуясь следствием 4.2, с b = 2, получим по формулам Ni = 2FiQi + 1, F^+i = Nf. Qi = 1 231, F2 = Ni = 3 Oil 027; Q2 = 3 Oil 067, F3 = N2 = 18 132 808 071 619; Qs = 18 132 808 071 644, F4 = N3 = 657 597 457 125 248 955 270 143 273; Q4 = 657 597 457 125 248 955 270 143 281, N4 = 864 868 831 235 187 275 941 586 469 515 911 058 724 056 920 216 597 427. Каждое из чисел Ni просто. При их построении мы выбирали числа Qi наименьшими Qi > Fi, при которых соответствующие числа Ni оказывались простыми. Во всех случаях это удалось доказать с помощью следствия 4.2 при 6 = 2. В настоящее время никаких теоретических гарантий для существования простого числа N = 2FQ + 1,(3 < 2F + 1 не существует. Тем не менее опыт вычислений на ЭВМ показывает, что простые числа в арифметической прогрессии встречаются достаточно близко к ее началу. Упомянем также гипотезу о существовании бесконечного количества простых чисел q с условием, что число 2q + 1 — простое, т. е. простым является уже первый член прогрессии. Очень важен в связи с описываемым методом вопрос о расстоянии между соседними простыми числами в арифметической 104
прогрессии. Ведь убедившись, что при некотором Q число N = = 2FQ + 1 — составное, можно заменить Q на Q + 1 и продолжить действовать описанным способом до тех пор, пока не будет найдено простое число N. И если расстояние между соседними простыми числами в прогрессии велико, нет надежды быстро построить нужное число N. Перебор чисел Q до момента встречи простого числа N окажется слишком долгим. В более простом вопросе о расстоянии между соседними простыми числами рп и рп+1 в натуральном ряде доказано лишь, что 38 pn+i -Рп — О(рп) при любом с > —. Это очень трудная теоре- Ы ма, но она дает слабую оценку для наших потребностей. Вместе с тем существует так называемая гипотеза Крамера (1936), что Рп+\ ~Рп = О(1п2рп), дающая вполне приемлемую границу. Вычисления на ЭВМ показывают, что простые числа в арифметических прогрессиях расположены достаточно плотно. Если принять на веру, что наименьшее простое число, а также расстояние между соседними простыми числами в прогрессии 2Fn+l при F < п < 2F+1 оцениваются величиной О (In2 F), то описанная схема построения больших простых чисел имеет полиномиальную оценку сложности. И несмотря на отсутствие теоретических оценок времени работы алгоритмов, отыскивающих простые числа в арифметических прогрессиях со сравнительно большой разностью, на практике эти алгоритмы работают вполне удовлетворительно. 4.8. Разложение целых чисел на множители и криптографические применения Предположим, что задано некоторое составное натуральное число N и требуется разложить его на меньшие множители. Эта задача относится к разряду трудных в вычислительном отношении. Первые алгоритмы ее решения были предложены Ферма, Эйлером, Гауссом, Лежандром и другими классиками математики. Современные алгоритмы используют вычисления в полях алгебраических чисел, эллиптические кривые и разнообразные технические конструкции. Наилучшая из известных оценок сложности разложения числа N на множители имеет вид О(ехр(с(1пЛ/')1/3(1п1пАГ)2/3)) с некоторой положительной постоянной с. Впрочем, эта оценка количества необходимых арифме- 105
тических операций условна, так как опирается на ряд недоказанных, но весьма правдоподобных гипотез теории чисел. Установленный в настоящее время рекорд — разложение на два простых множителя числа N = 27 997 833 911 221 327 870 829 467 638 722 601 621 070 446 786 955 428 537 560 009 929 326 128 400 107 609 345 671 052 955 360 856 061 822 351 910 951 365 788 637 105 954 482 006 576 775 098 580 557 613 579 098 734 950 144 178 863 178 946 295 187 237 869 221 823 983, записываемого в десятичной системе 200 цифрами. Ему было присвоено имя RSA-200. Работы по разложению были начаты в конце 2003 г. и завершились в мае 2005 г. Было найдено разложение на простые множители N — pq, где р = 3 532 461 934 402 770 121 272 604 978 198 464 368 671197 400 197 625 023 649 303 468 776 121 253 679 423 200 058 547 956 528 088 349 и q = 7 925 869 954 478 333 033 347 085 841 480 059 687 737 975 857 364 219 960 734 330 341 455 767 872 818 152 135 381 409 304 740 185 467. Вычисления на предварительном этапе выполнялись на многих ЭВМ, работавших параллельно. Оценка общего времени работы, условно приведенная к одному процессору с рабочей частотой 2,2 ГГц, составляет 55 лет. Заключительный этап проводился на кластере, состоявшем из 80 процессоров такой же производительности, и занял три месяца. Более подробный отчет об этой работе можно найти в Интернете по адресу http:// www.loria.fr/ zimmerma/records/factor.html. Приведенная информация показывает, насколько больших вычислительных ресурсов требует разложение целых чисел на множители. Она характеризует только внешнюю сторону этой деятельности, оставляя в тени труд математиков, разработавших соответствующие алгоритмы, и программистов, сумевших реализовать их оптимальным образом. Подводя некоторый итог, подчеркнем, что большие простые числа могут быть построены сравнительно легко, например с помощью алгоритмов 4.1 и 4.2 (см. 4.7). Перемножив два из них, 106
можно получить большое целое число, разложение которого на множители представляет практически непреодолимые трудности для тех, кто не знает исходные простые числа. На этом обстоятельстве основана одна из используемых систем шифрования информации. RSA1, предложенная в 1977 г. В течение длительного срока ее применения никто не смог придумать легкий способ распознавать сообщения, зашифрованные с ее помощью. Любой текст можно записать последовательностью цифр, например перенумеровав буквы алфавита и знаки, используемые при написаниии текстов: пробелы, точки, запятые, тире и т. д. Заменив каждую букву или знак их номером, получим последо- вательнось цифр, подлежащую шифрованию. Длинные последовательности можно разбить на блоки, и шифровать каждый блок отдельно. Тот, кто хочет использовать систему RSA (обозначим его буквой А), поступает следующим образом: 1) выбирает два достаточно больших простых числа р, q и третье число е, взаимно простое с (р — l)(q — 1); 2) вычисляет N = pq, а также целое число d с условием ed=l (mod (p- 3) публикует в открытой печати числа е, N. Заметим, что простые числа р, q и показатель степени d остаются в секрете. Согласно условию, числа е и (р — l)(q — 1) взаимно просты. Лемма 4.1 утверждает, что число d, удовлетворяющее сравнению из п. 2, существует. Найти его можно, например, решив в целых числах u, v уравнение ей — (р — l)(q — l)v = 1 так, как это объяснено в 1.4, и положив d = и. При этом можно считать, что Блок информации можно представлять целым числом ж, 1 < < х < N. Каждый, желающий сообщить пользователю А некоторую секретную информацию х, должен зашифровать ее по правилу у = хе (mod N). После этого он может переслать по открытому каналу связи сообщение у. Сокращение, составленное из первых букв фамилий ее авторов: Rivest R., Shamir A., Adleman L. 107
В соответствии с конструкцией числа N выполняется равенство cp(JV) = cp(p)cp(g) = (р — l)(q — I). Согласно теореме Эйлера имеем yd = (xe)d = x(mod N). Поэтому пользователю А для восстановления сообщения достаточно вычислить yd (mod N). Обе операции шифрования и расшифрования выполняются достаточно быстро. Злоумышленник для расшифровки сообщения должен найти целое число я, удовлетворяющее сравнению хе = у (mod N). Известные быстрые алгоритмы решения этой задачи при больших N не связаны с вычислением секретного числа d. Это можно сделать, зная функцию Эйлера cp(iV)- При известных числах N и ср(АГ), решив систему уравнений pq = N, (р — l)(q — — 1) = cp(iV) относительно чисел р, д, молено найти простые делители N, т. е. разложить число N на множители. Значит, вычисление функции Эйлера y(N) — задача столь же сложная в вычислительном отношении, как и разложение на множители. Возможно существуют и другие сравнительно быстрые способы определения d по известной информации е, N или способы вычисления целого х, удовлетворяющего сравнению хе = = у (mod iV), но по настоящее время такие обнаружены не были. Задачи для самостоятельного решения 1. Докажите, что если целые числа а, 6, с связаны соотношением а2 + Ь2 = с2, то abc = 0 (mod 30). 2. Найдите две последние цифры десятичной записи числа 2". 3. Найдите остатки от деления: а)2юооооона7; б) 22 на 19, где к — произвольное натуральное число. 4. Докажите, что следующие уравнения не имеют решений в целых числах: а) у2 = 5 + 9х; б)ж2=уз + 7; в) х\ + 2^2 = 4#з + Ьх\, среди Xi есть отличные от нуля; г) х2 + у2 + z2 = lAxyz, xyz ф 0; д) x2+y2+z2 = n, где натуральное число п имеет вид п = 4п(8г;+7). 5. Пусть р — An + 1 — простое число и а = (2п)! Докажите, что р\а2 + 1. 6. Пусть р — простое нечетное число. Докажите, что при любом целом а разность (а + 1)р — ар — 1 делится на р. Выведите отсюда с 108
помощью индукции по а, что при любом натуральном а разность аР — а делится на р (см. малую теорему Ферма). 7. Пользуясь алгоритмом 4.1, проверьте, что при р = 1 093 число 2Р~~1 — 1 делится на р2. 8. Запишите в виде дроби число 0,012345679. 9. Пусть а,Ъ,с — натуральные числа, причем (а,с) = 1. Вычислите сумму
Глава 5 Сравнения с одним неизвестным В гл. 4 мы уже встречались с задачей нахождения целых чисел, удовлетворяющих заданным сравнениям. Так, лемма 4.1 есть утверждение об условиях разрешимости в целых числах х сравнения ах = 1 (mod га). Уравнение х2 — Ъу2 = 3 (см. (4.1)) не имеет решений в целых числах потому, что неразрешимо сравнение х2 = 3 (mod 5). Из малой теоремы Ферма следует, что для простого р каждое целое число удовлетворяет сравнению хр — х = 0 (mod р). А чтобы прочитать сообщение, зашифрованное с помощью схемы RSA, нужно уметь решать сравнения вида хе = a (mod m). В этой главе будут рассмотрены некоторые общие вопросы, связанные с решением сравнений, в которые входит одна неизвестная величина, будем обозначать ее х. В отличие от уравнений каждое сравнение имеет еще и модуль. Разрешимость сравнений, а также способы нахождения решений зависят, как будет видно в дальнейшем, от свойств модуля. Молено утверждать, что решение сравнений по модулю т есть решение уравнений в кольце классов вычетов Ъ/тЪ. 5.1. Основные определения Пусть даны целое число т > 2 и многочлен f(x) = апхп+.. .+ + а\х + clq с целыми коэффициентами. Говорят, что целое число и удовлетворяет сравнению апхп + ... + а\х + ао = 0 (mod m), (5.1) если f(u) = 0 (mod m). Из результатов 4.1 следует, что для любого целого числа г?, сравнимого с и по модулю т, выполняется f(v) = f{u) = = 0 (mod m), иначе, все числа класса вычетов х = и (mod m) 110
удовлетворяют сравнению (5.1). Таким образом, множество, состоящее из всех целых чисел, удовлетворяющих (5.1), если оно не пусто, представляется в виде объединения нескольких непересекающихся классов вычетов по модулю т. Каждый класс вычетов, состоящий из чисел, удовлетворяющих (5.1), называется решением сравнения (5.1), а количество таких классов вычетов — числом решений этого сравнения. Число решений сравнения (5.1) есть число решений уравнения f(x) = 0 в кольце Z/mZ. При этом если класс вычетов к состоит из чисел, удовлетворяющих сравнению f(x) = 0 (mod га), то в соответствии с определением операций в кольце классов вычетов Z/mZ имеет место равенство f(k) = 0. Здесь мы допускаем некоторую вольность, используя одно и то же обозначение /(ж) как для многочлена с целыми коэффициентами, присутствующего в сравнении, так и для многочлена в уравнении, коэффициенты которого являются соответствующими классами вычетов. С формальной точки зрения сравнению (5.1) должно соответствовать уравнение апхп + ... + а\х + а0 = 0. В дальнейшем для краткости записи будем опускать черточки, если из контекста ясно, что речь идет о решении уравнения в кольце классов вычетов. Согласно малой теореме Ферма, каждое целое число удовлетворяет сравнению хр — х = 0 (mod p) при простом р. Поэтому каждый класс вычетов кольца Z/pZ есть решение этого сравнения, а число его решений равно р. Если коэффициент при старшей степени х не делится на га, т. е. т \ ап, то говорят, что степень сравнения (5.1) равна п. Например, сравнение второй степени х2 — 1 = 0 (mod 8) имеет четыре решения х = 1 (mod 8); х = 3 ( mod 8); х = 5 (mod 8); х = 7 (mod 8), в иных обозначениях эти классы вычетов по модулю 8 могут быть записаны так: Т,3,5,7. Сравнению удовлетворяет каждое нечетное число. Можно рассматривать и сравнения более общего вида f(x) = g(x) (mod m), (5.2) где f(x),g(x) — многочлены с целыми коэффициентами. Из свойств сравнений сразу же следует, что множества чисел, удо- 111
влетворяющих (5.2) и сравнению f(x) — д(х) = 0 (mod га), совпадают. Так что все вопросы, возникающие в связи со сравнениями (5.2), сразу же сводятся к соответствующим вопросам для сравнений, содержащих 0 в правой части. 5.2. Сравнения первой степени Каждое сравнение первой степени может быть переписано в виде ах = Ь (mod га), т\ а. (5-3) Основной результат о таких сравнениях есть следующая теорема. Теорема 5.1. Сравнение (5.3) разрешимо, если и только если Ь делится на наибольший общий делитель (а,га). Количество решений в этом случае равно (а, га). Доказательство. Сравнение (5.3) разрешимо в том и только в том случае, когда решение в целых числах я, у имеет уравнение ах + ту = Ь. (5-4) По теореме 1.5 для этого необходимо и достаточно, чтобы (а, т)\Ь. Обозначим для краткости d = (а, га). Предположим теперь, что b делится на d. Из той лее теоремы следует, что множество решений уравнения имеет вид х = х0 + — t; У = Уо~ -;t, (5.5) а а где пара чисел хо, у о есть какое-либо фиксированное решение, а t — произвольное целое число. Итак, множество целых чисел ж, удовлетворяющих сравнению (5.3), имеет вид х = хо + ^t, teZ (5.6) при некотором целом хо. Рассмотрим числа xk = x0 + ^k, fc = l,2, ...,d. (5.7) а Докажем, что каждое число, удовлетворяющее сравнению (5.3), сравнимо по модулю га с одним из чисел (5.7). Пусть х 112
имеет вид (5.6) и к — то из чисел совокупности 1,2, ..., (а, га), которое сравнимо с t по модулю (а, га). Тогда t = к + q{a,m) с некоторым целым q и х = хо + —(к + qd) = Xk + qm = Xk ( mod га). Для завершения доказательства осталось проверить, что все числа (5.7) лежат в разных классах вычетов по модулю га. Предположим, что Xk = X£ (mod га), где к,£ — различные числа из набора 1,2, ..., d. Тогда га га. —к — —£ ( mod га). d d ч у Разделив обе части и модуль этого сравнения на целое число —, (Л получаем в силу свойства 7 (см. 4.1), что к = £ (mod d). Получившееся противоречие завершает доказательство теоремы. ■ Отметим, что лемма 4.1 следует из доказанной теоремы. Для решения сравнения (5.3) нужно найти хо, решив в целых числах уравнение (5.4), и воспользоваться формулой (5.7) для нахождения представителей всех нужных классов вычетов. Для упрощения решения сравнения все коэффициенты можно заменить их наименьшими неотрицательными вычетами по модулю га. Заметим также, что в случае разрешимости, т.е делимости b на (а,га), обе части сравнения и модуль можно разделить на (а, га), что упростит задачу, сведя ее к сравнению с меньшим модулем. Множества чисел, удовлетворяющих новому сравнению и данному, совпадают. Например, решим сравнение 38х = 4 (mod 26). Так как 38 = 12 (mod 26), то у данного сравнения те же решения, что и у сравнения 12х = 4 (mod 26). Имеем (12,26) = 2 и 4 делится на 2, поэтому данное сравнение разрешимо и имеет два решения. Кроме того, множество удовлетворяющих ему чисел такое же, как и у сравнения 6х = 2 (mod 13). Заменим получившееся сравнение уравнением 6х + 13у = 2. Для решения этого уравнения применим алгоритм Евклида. Уже первый его шаг приводит к равенству 13 = 6 • 2 + 1, из 113
которого следует, что 1 = 13-2-6и2 = 13-2 — 4-6. Таким образом, уравнение имеет решение х = —4, у = 2 и хо = —4. Множество чисел, удовлетворяющих сравнению 6х = 2 (mod 13), состоит из одного класса вычетов по модулю 13, а именно х = = —4 (mod 13). Относительно же модуля 26 имеем два решения. Эти классы вычетов по модулю 26 содержат числа -4+yfc, A: = 1,2, т. е. числа 9,22. Итак, решения данного сравнения имеют вид х = 9 ( mod 26); х = 22 ( mod 26). 5.3. Китайская теорема об остатках При решении некоторых задач возникает потребность найти целые числа х, удовлетворяющие одновремено нескольким сравнениям. Как и в случае уравнений, при этом говорят, что требуется решить систему сравнений. Решим, например, следующую систему сравнений: Зх =5 (mod 4), 5х =2 (mod 7). (5.8) Один из возможных общих способов решения этой задачи состоит в том, чтобы заменить систему сравнений системой уравнений, вводя при этом новые переменные. Так, первому сравнению заданной системы удовлетворяют в точности те целые числа х, для которых найдется целое число у, удовлетворяющее равенству Зх — 4у = 5. Аналогично, второе сравнение может быть заменено уравнением 5х — lz = 2, а вся система сравнений может быть заменена системой уравнений Эту систему можно решить способом, изложенным в гл. 1 (см. 1.4). Соответствующая матрица (1.10) имеет вид (2, 5 1 0 Ко -4 0 0 1 0 0 -7 0 0 1 -5\ -2 0 0 0У 114
Поскольку нас в действительности не интересуют переменные у и z, две последние строки этой матрицы можно отбросить и все вычисления, указанные в разд. 1.4, выполнять для более простой матрицы. С помощью допустимых преобразований находим ^ 1 О О О —5 1 О О -1 -4 -28 -113, Таким образом, все числа, удовлетворяющие заданной системе сравнений, имеют вид х — —113 + 28t, t £ Z. Это множество можно записать в виде х = —113 (mod 28) = — 1 (mod 28). Конечно, в данном конкретном случае систему сравнений можно было бы решить проще. Умножив каждое из сравнений „ Г9х = 15 (mod 4); системы на о, получим систему сравнении < I 15х = 6 (mod 7), {х = -1 (mod 4); , ' Система, переписанная в таком виде, х = —1 (mod 7). означает, что все искомые числа х таковы, что х + 1 делится на 4 и 7, т. е. делится на 28. В результате находим х = — 1 (mod 28). Далее рассмотрим системы сравнений специального вида х = а\ ( mod mi); х =а2 (mod m2); . . х = а^ (mod где mi > 0, a^ — заданные целые числа. Их решение также может быть сведено к решению систем уравнений. Но в одном важном частном случае решение системы (5.9) может быть получено относительно легко. Следующее утверждение было известно в Китае примерно 2 тыс. лет назад. Теорема 5.2 («китайская теорема об остатках»). Если mi, • • • з тк попарно взаимно просты, то система сравнений {5.9) разрешима. Определим целые числа М, М*, bi условиями М М = mi • • • mfc, Mi = — , Mibi = a{ ( mod mi), l<i<k, m Xo = Mih + ... + Mkbk. (5.10) 115
Тогда множество целых чисел, удовлетворяющих системе сравнений (5.5), составляет класс вычетов х = хо (mod M). Замечание 5.1. Поскольку в условиях теоремы (Mi,mi) = 1, существование чисел bi следует из теоремы 5.1. Заметим также, что числа bi определяются не единственным способом. При использовании теоремы 5.2 для решения систем сравнений следует выбирать те из них, которые дают по возможности меньшие значения хо- Доказательство. Так как rrii\Mj при j ф г, при любом г выполняются сравнения хо = Мфг = а{ ( mod mi). (5-И) Это значит, что множества целых чисел, удовлетворяющих системе (5.9) и системе х = хо ( mod mi), 1 < г < fc, (5.12) совпадают. Сравнения (5.12) выполняются в том и только том случае, когда rrii\{x — хо), 1 < г < fc. Учитывая попарную взаимную простоту модулей га^, с помощью следствия 2.6 заключаем, что последнее свойство выполняется для тех и только тех чисел х, для которых М\(х — хо), т. е. х = хо (mod М). Ш Пример 5.1. Решим систему сравнений х = 3 ( mod 7), х = 2 ( mod 11), х = 1 ( mod 13). В данном случае модули 7,11,13 попарно взаимно просты. Пользуясь соотношениями теоремы 5.2, находим М = 7-11*13 = 1001, Mi = 11 - 13 = 143, М2 = 7 • 13 = 91, Мг = 7 • 11 = 77. Решив вспомогательные сравнения 143х = 3 (mod 7), 91х = 2 ( mod 11), 77х = 1 ( mod 13) и выбрав по одному числу, удовлетворяющему каждому из них, находим Ь\ = 1, &2 = — 3, 6з = — 1. Далее вычисляем х0 = 143 • 1 + 91(-3) + 77(-1) = -207. Ответ: х = -207 (mod 1001). Следствие 5.1. Если числа а\, ...,а& независимо друг от друга пробегают полные системы вычетов по модулям т\, ..., 116
тк соответственно, то числа хо, определенные для каждого набора а\, ..., ak с помощью равенств (5.10), пробегают полную систему вычетов по модулю М = т\ • • • тпк. Доказательство. Достаточно доказать, что получающиеся указанным в условии способом числа хо принадлежат различным классам вычетов по модулю М. Предположим, что а\, ..., ак и а71? ..., а'к — два набора вычетов по модулям т\, ..., тк, причем такие, что хотя бы для одного индекса г выполняется mi \ (a,i — а[). Пусть также числа hi, Ь[ удовлетворяют сравнениям Mibi = ai (mod mi); Мф[ = a[ (mod mi) и x0 = Mibi + ... + МкЪк; x'o = Mib[ + ... + МкЪ'к. Если хо = Xq (mod M), то при любом г, 1 < г < /с, выполняются сравнения хо = Xq (mod m*). Учитывая, что mi|Mj при j ф г, заключаем, что М^ = Мф[ (mod rrii). Но тогда a^ = a[ (mod т^), т.е. а^, а[ принадлеж:ат одному классу вычетов по модулю га^. Поскольку это доказано для любого индекса г, приходим к противоречию. ■ Следствие 5.2. Если числа а\, ...,ак независимо друг от друга пробегают приведенные системы вычетов по модулям mi, ...,тк соответственно, то числа xq, определенные для каждого набора а\, ... ,ак с помощью равенств (5.10), пробегают приведенную систему вычетов по модулю М = т\ • • • тк. Доказательство. Все числа жо, полученные согласно условию, принадлежат различным классам вычетов по модулю М. Это доказано в следствии 5.1. С помощью равенства (2.9) и сравнений (5.11) находим (М,х0) = (mi,х0) • • • (тк,х0) = {mi,a{) • • • {тк,ак). Значит, равенство (хо,М) = 1 выполняется в том и только том случае, когда (ai,rrii) = 1, 1 < г < к. Это завершает доказательство следствия. ■ Следствие 5.2 дает иное доказательство утверждения теоремы 3.3 о мультипликативности функции Эйлера ср(п). Действительно, если числа а\, ..., ак независимо друг от друга пробегают приведенные системы вычетов по модулям mi, ..., тк, то количество получившихся наборов равно cp(mi) • • • cp(mfc). Согласно следствию 5.2, это число равно количеству классов вычетов по Модулю М, состоящих из чисел, взаимно простых с М, т. е. равно ф(М). В результате получается равенство ср(М) = cp(mi) • • • (тк) при условии, что числа т* попарно взаимно просты. 117
5.4. Полиномиальные сравнения по простому модулю Здесь рассмотрены сравнения вида /(ж) = апхп + ... + агх + а0 = 0 ( mod р), р \ ап, (5.13) где р — простое число. Следующее утверждение, доказанное Ж. Л. Лагранжем (1768), носит его имя. Теорема 5.3. Сравнение (5.13) имеет не более п решений. Замечание 5.2. Для составного модуля, даже при п = 1, утверждение теоремы может нарушаться. Доказательство. Докажем теорему индукцией по степени сравнения п. При п = 1 справедливость ее утверждения следует из теоремы 5.1. Предположим теперь, что п > 2 и утверждение справедливо для всех сравнений степени меньшей п. Пусть хо — целое число, удовлетворяющее сравнению (5.13). Тогда /(хо) = О (mod p) и /(ж) - /(ж0) = Jfc=l где д(х) = апхп~1 + ... £ Щх]. Из этого равенства следует, что для каждого целого числа жь удовлетворяющего сравнению (5.13), будет выполняться сравнение (х\ — х^)д{х\) = 0 (mod p). Если при этом хо, х\ лежат в различных классах вычетов по модулю р, т. е. р { (xi — хо), то будем иметь д(х\) = 0 (mod p). Итак, каждое целое число, удовлетворяющее сравнению (5.13) и не лежащее в классе вычетов хо, будет удовлетворять сравнению д(х) = 0 (mod p). Согласно индуктивному предположению, это сравнение имеет не более п — 1 решений. Отсюда следует, что существует не более п классов вычетов по модулю р, элементы которых удовлетворяют сравнению (5.13). ■ Следствие 5.3. Для каждого простого числа р справедливо сравнение хр-х = х(х- 1)(х - 2) • • • (х - р + 1) ( mod p), (5.14) т. е. коэффициенты при одинаковых степенях переменной х в левой и правой частях (5.14) сравнимы между собой по модулю р. 118
Доказательство. Рассмотрим многочлен f(x) = хр _ х _ ф _ !)(х _ 2)... (х - р + 1) е Z[x]. Степень его, как легко видеть, не превосходит р — 1. Если п — наибольшее целое число, такое, что коэффициент при хп в многочлене f(x) не делится на р, то степень сравнения /(ж) = = 0 (mod р) равна п. Для каждого целого числа а, 0<а<р— 1, согласно малой теореме Ферма, имеем f(a) = ap — a = 0 (mod p). Значит, количество решений сравнения f(x) = 0 (mod p) равно р. По теореме 5.3 выполняется неравенство р < п. Поскольку п < р - 1, получаем противоречие, доказывающее, что все коэффициенты многочлена f(x) делятся нар. Это завершает доказательство теоремы. ■ Сравнивая коэффициенты при х в первой степени слева и справа в (5.14), получаем теорему Вильсона: — 1 = (р—l)!(mod p). Теорема 5.4. Пусть f(x) = (хр - х)д(х) + г (ж), r(x) e Z[x], degr(x) < p. Тогда множества целых чисел, удовлетворяющих сравнениям f(x) = 0 (mod ж) и г{х) = 0 ( mod p), совпадают. Другими словами, каждое сравнение (5.13) можно заменить равносильным ему сравнением степени не превосходящей р— 1. Доказательство. Для каждого целого числа а в силу малой теоремы Ферма имеем /(а) = (ар - а)д(а) + г (а) = r(a) (mod p). Отсюда сразу же следует нужное утверждение. ■ Иногда степень сравнения можно еще уменьшить, не изменяя множества решений. Для описания этого способа удобно воспользоваться тем, что кольцо классов вычетов Z/pZ по простому модулю р является полем. Для краткости будем обозначать его символом ¥р. Из следствия 5.3 получаем, что в кольце ¥р[х] выполняется равенство хр — х = х(х — 1) • • • (ж — р+1).С формальной точки зрения в этом равенстве вместо чисел 1,2, ... ,р — 1 Должны были бы стоять классы вычетов Т, 2, ... ,р — 1, но для краткости записи, как отмечалось ранее, мы черточки не ставим. 119
Пример 5.2. Разделить с остатком многочлен Зх3+2 на многочлен 2х + 1 в кольце ¥ъ[х]. Так как 4-2 = 3 (mod 5), в кольце многочленов ¥$[х] справедливо равенство Зх3 + 2 - 4х2(2х + 1) = х2 + 2. Поскольку 3-2 = 1 (mod 5), имеем х2 + 2- Зх(2х + 1) = 2х + 2 2х + 2-(2х + 1) = 1. Итак, в кольце ¥$[х] справедливо равенство Зх3 + 2 = (4х2 + Зх + 1)(2х + 1) + 1. (5.15) Остаток от деления равен 1. Равенство (5.15), выполняющееся в кольце Fs[x], может быть переписано как сравнение в кольце многочленов Z[x] Зх3 + 2 = (4х2 + Зх + 1)(2х + 1) + 1 ( mod 5). Здесь, как и ранее, имеется в виду, что коэффициенты при одинаковых степенях х у многочленов, стоящих слева и справа от знака «=», сравнимы по модулю 5. При любом простом р в кольце многочленов Fp[x], выполняя деление с остатком, можно вычислять наибольший общий делитель двух многочленов. Этот алгоритм подобен алгоритму Евклида (см. 1.3) и носит то же название. Наибольший общий делитель многочленов /(х) и д(х) будет, как и для целых чисел, обозначаться символом (/(х),д(х)). Следующее утверждение позволяет, не нарушая равносильности, понизить степень сравнения больше, чем теорема 5.4. Теорема 5.5. Пусть /(х) и d(x) многочлены с целыми коэффициентами, причем если рассматривать их как многочлены из кольца¥р[х], то d{x) есть наибольший общий делитель /(х) и хр — х. Тогда множества решений сравнений /(х) = 0 ( mod р) и d(x) = 0 ( mod p) (5.16) одинаковы. 120
Доказательство. Согласно условию, в кольце ¥р[х] выполняется равенство /(ж) = d{x)h{x), где h(x) e ¥р[х]. Заменив коэффициенты многочлена h(x) их наименьшими неотрицательными вычетами и получив многочлен из кольца Z[x], мы сохраним для него обозначение h(x), для которого выполнено сравнение /(ж) = d(x)h(x) ( mod p). Пусть для целого а выполняется сравнение d(a) = 0 (mod p). Тогда имеем /(а) = d(a)h(a) = 0 (mod p). Таким образом, целое число а удовлетворяет первому из сравнений (5.16). Подобно теореме 1.5, можно утверждать,что в кольце многочленов Fp[x] найдутся многочлены u(x),v(x), удовлетворяющие равенству f(x)u(x) + (хр — x)v(x) = d(x). Заменяя эти многочлены соответствующими многочленами из кольца Z[x], получаем сравнение d(x) = f(x)u(x) + (хр - x)v{x) ( mod p). Если для а е Z выполнено сравнение /(а) = 0 (mod p), то согласно малой теореме Ферма имеем d(a) = f(a)u(a) + (ap - a)v(a) = 0 (mod p). Значит, а есть решение второго из сравнений (5.16). ■ Кольцо ¥р[х] имеет много общего с кольцом целых чисел Z. В нем не только выполняется алгоритм Евклида для нахождения наибольшего общего делителя двух многочленов. Например, молено ввести понятие сравнимости многочленов по модулю т(х) G Рр[ж], полагая два многочлена /(ж), д(х) G ¥р[х] сравнимыми, если разность f(x) — д(х) делится на т(х). Это свойство можно обозначать символом f(x) = д(х) (mod m(x)). Для таких сравнений выполняются свойства, подобные свойствам сравнений (см. 4.1). Пример 5.3. Упростим сравнение хг - 2х - 3 = 0 ( mod 17) (5.17) с помощью теоремы 5.5. Вычислим для этого наибольший общий Делитель многочленов х3 — 2х — 3 и х17 — х в кольце F17 [x]. Имеем в кольце Fi7[x] сравнения по модулю многочлена х3 — 2х — 3 (для краткости модуль в обозначениях опускаем): 121
х3 ее 2х + 3; х4 = 2х2 + Зх; х8 = (2х2 + Зх)2 = 2х + 2; х16 = (2х + 2)2 = 4х2 + 8х + 4; х17 = х(4х2 + 8х + 4) = 8х2 - 5х - 5. Таким образом, в соответствии с алгоритмом Евклида (х17 - х,х3 - 2х - 3) = (8х2 - 6х - 5,х3 - 2х - 3). Продолжая алгоритм Евклида, находим х3 - 2х - 3 + 2х(8х2 - 6х - 5) = 5х2 + 5х - 3; 5х2 + 5х - 3 - 7(8х2 - 6х - 5) = -4х - 2 и 8х2 - 6х - 5 = (4х + 2)(2х + 6). Таким образом, искомый наибольший общий делитель равен 4х + 2, или 2х +1. В соответствии с теоремой 5.5 сравнение (5.17) имеет те же решения, что и сравнение 2х + 1 = 0 (mod 17). Последнее сравнение имеет единственное решение х = 8 (mod 17). Замечание 5.3. В примере 5.3 для вычисления остатках17 по модулю х3 — 2х — 3 использовался алгоритм, подобный алгоритму 4.1 (его можно применять и в других случаях при больших р). Далее рассмотрим, как можно находить решения полиномиальных сравнений по простому модулю. Если модуль р не очень велик, это можно сделать перебором элементов какой-нибудь полной системы вычетов по модулю р. Пример 5.4- Решить сравнение х2 + х + 1 = 0 (mod 7). Многочлен х2 + х + 1 прих = —3, —2, —1,0,1,2,3 принимает значения 7,3,1,1,3,7,13 соответственно. Из них только значения в точках —3,2 делятся на 7. Сравнение имеет два решения х = — 3 (mod 7), х = 2 (mod 7). В общем случае сравнение имеет смысл сначала упростить, пользуясь теоремой 5.5. Далее будем предполагать, что такое упрощение выполнено и многочлен /(х) в сравнении (5.13) есть делитель многочлена хр — х = х(хр~1 — 1) в кольце ¥р[х], а точнее — делитель многочлена хр~1 — 1. Кроме того, будем предполагать, что р > 3. 122
Приведенный далее алгоритм носит вероятностный характер и эффективен на практике. Он строит множество Л4, состоящее из различных делителей многочлена /(х), в кольце Fp[x]. При этом количество элементов в множестве М. увеличивается до тех пор, пока оно не станет равным п = deg f(x). Алгоритм 5.1. Данные: многочлен f(x) G Fp[x], га = = deg f(x) > 2, f(x)\(xp~1 — 1). Найти: все корни многочлена Шаг 1. Положить М = {f(x)}. Шаг 2. Выбрать каким-либо способом элемент с Е Fp. Шаг 3. Для каждого и(х) б Л4 с условием degu(x) > 1 выполнить следующие действия: 3.1) если и(с) = 0, то исключить и(х) из множества ЛА и заменить его парой многочленовх — си и(х)/{х — с); 3.2) если и(с) ф 0, то вычислить 3.3) если 1 < degd(x) < degu(x), то исключить и(х) из множества ЛЛ и заменить его парой многочленов d(x) и u(x)/d{x)\ 3.4) если #jM = n, то алгоритм завершает работу. Множество Л4 в этом случае состоит из всех многочленов вида х — у? гДе у G Fp — корень многочлена /(х). ZZ/аг ^. Перейти к шагу 2. Пример 5.5. Решим сравнение х3 + 2х + 1 = 0 (mod 17). В начальный момент имеем М — {х3 + 2х + 1}. При с = —1 с помощью алгоритма возведения в степень в кольце Fi7[x], как и в примере 5.4, находим сравнения по модулю х3 + 2х + 1 (х + I)4 = 4х2 - 5х - 3, (х + I)8 = Зх2 + 9х - 2 и ((х + I)8 - 1, х3 + 2х + 1) = х - 3. Разделив многочлен х3 + 2х + 1 на х - 3, получаем х3 + 2х + 1 = (х - 3)(х2 + дх - 6). После этого множество М принимает вид М = {х—3, х2+3х-6}. Точно так же при с = 0 находим (xs -l,x2 + 3x-Q) = x + 8. Разделив многочлен х2 + Зх — 6 на х + 8, получаем 123
х2 + 3х-6 = (ж + 8)(ж-5). Множество Л4 становится равным М = {х-3,ж-5,х + 8}. Множество решений данного сравнения имеет вид х = 3 ( mod 17), ж = 5 ( mod 17), ж = -8 ( mod 17). Конечно, все вычисления лучше выполнять с помощью калькулятора или компьютера. Следующее утверждение объясняет, почему алгоритм достаточно быстро находит решения сравнения. Лемма 5.1. Пусть и(х) | f(x),degu(x) > 2. Вероятность того, что при случайном выборе с Е ¥р количество элементов в мноэюестве Л4 в шаге 3 алгоритма увеличится, не меньше -. Доказательство. Из условия леммы, поскольку и(х)\(хр~1 — — 1), следует, что и{х) имеет в поле ¥р не менее двух корней, причем все его корни различны. Пусть уъ Y2 — корни многочлена и(х). Обозначим Т> подмножество Fp, состоящее из элементов £, удовлетворяющих условиям По теореме Лагранжа многочлен (х — yi) ~2 — [х — уг) ^ имеет v — 3 не более —-— корней. Поэтому, обо в множестве D через #D, получим v — 3 не более —-— корней. Поэтому, обозначив количество элементов Докажем, что для каждого с G Т> алгоритм увеличивает количество многочленов в множестве М. Если с = yi или с = у2, то очевидно это будет выполнено в п. 3.1. Далее будем считать, что обе разности с — у* отличны от нуля. Каждый ненулевой элемент Ь G Fp по малой теореме Ферма удовлетворяет равенству О = If-1 - 1 = (0- * р_ 1 и, значит, удовлетворяет в точности одному из равенств 6 2 =1 ИЛИ 0 2= —1. 124
Поскольку с € Р, и, значит, одно из чисел Yi,Y2 будет корнем многочлена (х — р—1 — с) 2 — 1, а другое — нет. Следовательно, в этом случае 1 < < degd(x) < degifc(x), т.е. d(x) есть собственный делитель и(х). Оцениваемая вероятность не меньше >>. р ~ 2р 2 Лемма 5.1 показывает, что при случайном выборе элемента с £ Fp вероятность того, что величина ФМ не увеличится после к повторений шагов 2 — 4 алгоритма, не превосходит 2~к. 5.5. Полиномиальные сравнения по составному модулю Рассмотрим сначала случай, когда модуль сравнения есть степень простого числа р, т.е. т = рк,к > 2. Если f(x) - многочлен с целыми коэффициентами и целое число а удовлетворяет сравнению f(x) = 0 (mod pk), то pk\f(a)- Но тогда р|/(а), так что а удовлетворяет сравнению f(x) = 0 (mod p). Отсюда можно сделать два заключения. 1. Если сравнение f(x) = 0 (mod p) не имеет решений, то ни при каком к > 2 сравнение /(#) = 0 (mod pk) также не имеет решений. 2. Для каждого числа а, удовлетворяющего сравнению f(x) = = 0 (mod pk), найдется решение сравнения f(x) = 0 (mod p), которому принадлежит а. Таким образом, решение сравнений по модулю, равному степени простого числа р, сводится, во-первых, к выяснению разрешимости сравнения по простому модулю ри,в случае разрешимости, поиску решений по простому модулю. А во-вторых, к поиску решений сравнения по модулю рк, принадлежащих фиксированному решению по простому модулю. Первый шаг обсуждался в 5.4, второй основан на следующем утверждении. Теорема 5.6. Пусть f(x) — многочлен с целыми коэффициентами и х\ — целое число, удовлетворяющее условиям /On) = 0 ( mod p), f'(xi) ф 0 ( mod p). 125
Тогда при любом к > 1 существует единственное решение сравнения /(х) = 0 (mod pfc), принадлежащее классу вычетов х = = х\ (mod p). Доказательство. Докажем теорему индукцией по степени модуля к. При к = 1 утверждение очевидно выполняется. Предположим, утверждение теоремы справедливо для некоторого к > 1. Тогда существует единственное целое число а, удовлетворяющее условиям /(а) = 0 ( mod рк), 0 < а < pfc, а = хг ( mod р). Найдем все целые числа 6, такие, что = 0(modpfc+1), 0<Ъ<рк+\ b = xi(modp). (5.18) Из первого условия вытекает pk\f(b) и, значит, наименьший неотрицательный вычет класса Ь (mod pk) равен а. Но тогда Ь — = а + pkt с некоторым целым £, 0 < t < р. Многочлен /(а + х) = со + ах + с2х2 + ... (5.19) имеет целые коэффициенты. Подставив в это равенство х = О, находим со = /(а)- А дифференцируя равенство (5.19) и также подставляя 0 вместо х, получаем с\ — f'(a). При х = pkt из (5.19) следует сравнение f(b) = /(а) + f'{o)pkt (mod pfc+1). Так как pfc|/(a) и pk+1\f{b), разделив обе части сравнения нар , получим 0= Щ1 +f\a)t (mod р). Учитывая теперь, что а = х\ (mod р), заключаем, что /;(а) = = f'{x\) (mod p) и f(xi)t + Щ- = 0 (mod p). (5.20) Согласно условию теоремы, р { f'(xi), так что по теореме 5.1 сравнение (5.20) разрешимо относительно t и имеет единственное решение. Решив это сравнение, найдем единственное число Ь = а + pfct, удовлетворяющее условиям (5.18). Это завершает шаг индукции и вместе с ним доказательство теоремы. ■ Приведенное доказательство позволяет находить решения сравнений по модулю, равному степени простого числа. 126
Пример 5.6. Решить сравнение х3 — Зх2 — 1 = 0 (mod 125). Решив сравнение х3 — Зх2 — 1 = 0 (mod 5), находим: х = н 2 (mod 5), х = 4 (mod 5). Определим числа, удовлетворяющие системе сравнений х3 - Зх2 - 1 = 0 ( mod 25); х = 2 ( mod 5). Представив х в виде х = 2 + 5£ и подставив это выражение в многочлен /(ж) = ж3 — Зх2 — 1, как и в доказательстве теоремы 5.6, находим /(2) +/'(2)5* ее 0 ( mod 25), или —5 = 0 (mod 25). Получившееся сравнение решений относительно t не имеет, поэтому данное сравнение не имеет решений, принадлежащих классу вычетов х = 2 (mod 5). Заметим, что в рассмотренном случае /'(2) = 0. Теперь найдем числа, удовлетворяющие системе сравнений х3 - Зх2 - 1 = 0 ( mod 25), х = 4 ( mod 5). (5.21) Представив ж. в виде х = 4 + 5£ и подставив это выражение в многочлен /(ж) = ж3 — Зх2 — 1, находим 15 + 24-5* = 0 (mod 25). Сократив обе части этого сравнения на 5, получим сравнение 3 + 24* = 0 (mod 5), равносильное сравнению 3 — t = 0 (mod 5). Таким образом, t = 3 и система сравнений (5.21) имеет решение х = 19 (mod 25) = -6 (mod 25). Здесь 19 = 4 + 5 • 3. Продолжая действовать так лее, как и в доказательстве теоремы 5.6, представим искомые х в виде х = —6 + 25£. Учитывая, что /(—6) = —325 и /'(—6) = 144, приходим к сравнению -325 + 144 • 25* = 0 ( mod 125). Сократив это сравнение на 25, получаем -13 + 144* = 0 (mod 5), или равносильное сравнение 2 — t = 0 (mod 5). Ему удовлетворяет t = 2, так что решением исходного сравнения является класс вычетов по модулю 125, содержащий -6 + 25 • 2 = 44. Таким образом, данное сравнение имеет единственное решение х = 44 (mod 125). 127
Перейдем теперь к решению сравнений по произвольному составному модулю. Теорема 5.7. Пусть f(x) — многочлен с целыми коэффициентами и mi > 1» . ..,rafc > 1 — попарно взаимно простые числа. Множества целых чисел, удовлетворяющих сравнению f(x) = 0 ( mod mi • • • mk) (5.22) и системе сравнений f{x) = 0 ( mod mi), ... , f{x) = 0 ( mod m*), (5.23) совпадают. Если при любом натуральном т символ N(m) обозначает количество решений сравнения f(x) = 0 (mod m), то N(mi • • • rrik) = N(mi) • • • iV(mfc)- Доказательство. Пусть 6 — целое число, удовлетворяющее сравнению (5.22), т.е. mi • • mmk\f(b). Тогда при любом j, 1< j <fc, выполняется rrij\f(b) или f(b) = O (mod rrij). Значит, b удовлетворяет системе сравнений (5.23). Докажем обратное утверждение. Если Ь удовлетворяет системе сравнений (5.23), то rrij\f(b) при любом j, I < j < к. Числа mi, ... ,т& попарно взаимно просты. Пользуясь следствием 2.6 (см. гл. 2), заключаем, что mi • • • т&|/(Ь) и, значит, 6 удовлетворяет сравнению (5.22). Пусть ai, ..., a,k — целые числа, удовлетворяющие сравнениям (5.23) соответственно. Согласно теореме 5.2 система сравнений х = а\ ( mod mi), ... , х = ак ( mod т&) разрешима, и целое число #о, определенное равенством (5.10), удовлетворяет этой системе. Тогда при любом j имеем f(xo) = = f{cij) = 0 (mod mj), т.е. xq удовлетворяет системе сравнений (5.23), и по доказанному удовлетворяет сравнению (5.22). Если числа ai, ...,а^ независимо друг от друга пробегают классы вычетов, состоящие из решений соответствующих сравнений (5.23), то по следствию 5.1 числа хо, определенные равенством (5.10), пробегают различные классы вычетов по модулю mi • • • mfc. Эти классы вычетов по доказанному состоят из чисел, удовлетворяющих сравнению (5.22). Значит, число решений этого сравнения не меньше чем N(mi) • • • N(rrik). По доказанному выше каждое целое число 6, удовлетворяющее сравнению (5.22), удовлетворяет системе сравнений (5.23) 128
и потому при каждом j класс вычетов b (mod rrij) есть решение сравнения fix) = О (mod rrij). Это доказывает, что никаких решений, отличных от построенных N(mi) • • • N(rrik) решений, сравнение (5.22) не имеет. ■ Замечание 5.4- Приведенное доказательство позволяет находить решения сравнения (5.22) при составном модуле га. А именно, если т = р\1 • • • ргкк — разложение в произведение различных простых чисел, то, определив числа ai, ...,afc, удовлетворяющие сравнениям f(x) = 0 (mod рг-э) при 1 < j < fc, и выбрав хо с помощью равенства (5.10), найдем некоторое решение xq (mod га) сравнения (5.22). Более того, так будут найдены все решения, если каждое из чисел ai, ..., a& независимо будет пробегать все решения своего сравнения. Пример 5.7. Решить сравнение х3 — х2 + 2х+1 = 0 (mod 75). Справедливо разложение 75 = 3 • 52. Сравнение х3 — х2 + 2х + + 1 = 0 (mod 3) имеет два решения х = 1 (mod 3), х = = 2 (mod 3). Сравнение х3 — х2 + 2х + 1 = 0 (mod 5) имеет единственное решение х = 3 (mod 5). Для того чтобы решить сравнение х3 - х2 + 2х + 1 = 0 (mod 25), (5.24) представим х в виде х = 3 + Ы. Для вычисления t получаем, как было указано ранее, сравнение 25 + 23 • Ы = 0 (mod 25). Таким образом, £ = 0 и сравнение (5.24) имеет единственное решение х = 3 (mod 25). В соответствии с теорией для решения исходного сравнения нужно найти решения двух систем сравнений (х =l(mod3), ix ее 2 (mod 3), \х = 3 ( mod 25); ух = 3 ( mod 25). Первая из них имеет решение х = 28 (mod 75), а вторая х = = 53 (mod 75). Два найденных класса вычетов и составляют ответ к задаче. Задачи для самостоятельного решения 1. Решите сравнения: а) Иж = 45 (mod 37); б) 2бх = 19 (mod 31); в) 899х = 7 (mod 2 166). 2. Решите системы сравнений а) , Ь = 7 (mod 11), | 63); Нестеренко 129
б) (4х = 3 (mod 25), [Зх = 8(mod 20); в) Га; = 3 (mod 29), x = 13(mod 21), [z=-5 (mod 32). 3. Решите сравнения: а) x2 - x + 2 = 0 (mod 17); б) x3 + 2x + 2 = 0 (mod 125); в) x3 + 2x + 9 = 0 (mod 216); r) x4 -f 7x + 4 = 0 (mod 27); д)х3+4х + 1 (mod 75).
Глава 6 Сравнения второй степени В гл. 5 решение полиномиальных сравнений по произвольному модулю было сведено к такой же задаче для сравнений по простому модулю. В данной главе обсуждаются вопросы, связанные с разрешимостью сравнений второй степени по простому модулю, и приложения доказанных результатов к исследованию некоторых диофантовых уравнений. В дальнейшем считается, что простое число р нечетно. 6.1. Сравнения второй степени по простому модулю Каждое сравнение второй степени ах2 + Ьх + с = 0 (mod p), pja, (6.1) можно упростить, изменив его коэффициенты и сделав замену переменной. Умножив обе части сравнения (6.1) на число 4а, не делящееся на р, получим равносильное сравнение 4а2х2 + АаЬх + кас = О ( mod р). Его можно переписать в виде (2ах + b)2 = b2 — Aac (mod p) или y2 = D(modp), (6.2) где использованы обозначения у = 2ах + Ь и D = Ъ2 — Аас. Так как р \ 2а, сравнение 2ах + b = y( mod p) при любом целом у имеет единственное решение относительно х- Это устанавливает взаимно-однозначное соответствие между 131
решениями сравнения (6.1) относительно х и сравнения (6.2) относительно у. Из изложенного следует, что в дальнейшем можно рассматривать лишь сравнения вида х2 = а (mod р). (6.3) По теореме 5.3 сравнение (6.3) имеет не более двух решений. Если это сравнение разрешимо иа^О (mod р), то число решений равно двум. Действительно, вместе с решением хо (mod p) сравнение будет иметь решением и класс вычетов — хо (mod р), причем эти классы вычетов различны. В противном случае мы имели бы хо = —хо (mod p) и р\х$. Но тогда р|а, что противоречит условию. Таким образом, при а ф О (mod р) сравнение (6.3) либо не имеет решений, либо имеет два решения. В случае а = = 0 (mod р) сравнение имеет единственное решение х = 0 (mod р). Установленное ранее взаимно-однозначное соответствие между множествами решений сравнений (6.1) и (6.2) позволяет утверждать, что и в общем случае при p\D = b2 — Аас сравнение (6.1) имеет единственное решение. Если же р \ D, то сравнение (6.1) либо имеет два решения, либо не имеет их вовсе. Легко проверить, что сравнение х2 = — 1 (mod 3) не имеет решений, а сравнение х2 = — 1 (mod 5) имеет два решения: х = = 2 (mod 5) и х = 3 (mod 5). Целое число а называется квадратичным вычетом по модулю р, если сравнение (6.3) имеет решение. Если же это сравнение не имеет решений, то число а называется квадратичным невычетом по модулю р. Числа, сравнимые между собой, одновременно являются квадратичными вычетами или квадратичными невычетами. Число —1 есть квадратичный невычет по модулю 3. Оно же является квадратичным вычетом по модулю 5. Лемма 6.1. Любая приведенная система вычетов по модулю р содержит квадратичных вычетов и столько же квадратичных невычетов. Целое число а, не делящееся на р, будет квадратичным вычетом в том и только том случае, когда а^ = 1 (mod p), (6.4) и квадратичным невычетом в том и только том случае, когда о2^ = -1 (mod p). (6.5) 132
Доказательство. Пусть а — квадратичный вычет. Тогда с некоторым целым числом 6, не делящимся на р, выполняется сравнение b2 = a (mod p). Возводя обе части этого сравнения в степень —-— и пользуясь малой теоремой Ферма, находим aV ее б?"1 = 1 (mod p). Таким образом, каждый квадратичный вычет удовлетворяет сравнению х 2 —1 = 0 (mod p). Согласно теореме 5.3 можно р-1 утверждать, что существует не более классов вычетов, состоящих из квадратичных вычетов. Числа (б.б) очевидно, являются квадратичными вычетами. Они не сравнимы друг с другом по модулю р. В противном случае нашлись бы два числа fci, &2, удовлетворяющие условиям p\(kj - Щ) = (кг - k2)(kl + fc2), 1 < к ^i < к2 < h < ^=i. Но указанная делимость невозможна, поскольку сумма к\ + к% и разность fci — ^2 не делятся на р, они положительны, но меньше р — 1. Итак, существует не менее —-— классов вычетов по модулю р, состоящих из квадратичных вычетов. Из доказанного следует, что квадратичные вычеты образуют р — 1 ровно —-— классов вычетов и удовлетворяют сравнению (6.4). Но тогда квадратичные невычеты составляют оставшиеся Р-1 —-— классов вычетов, состоящих из чисел, не делящихся на р, а каждая приведенная система вычетов по модулю р содержит р— 1 ровно —-— квадратичных вычетов и столько же квадратичных невычетов. _г Если а — квадратичный невычет, то по доказанному р f a 2 — - 1. По малой теореме Ферма имеем Следовательно, р\а 2 + 1 и, значит, выполнено сравнение (6.5). ■ 133
6.2. Символ Лежандра и его свойства Символ Лежандра ( — 1 есть функция, принимающая три W значения: —1,0,1. Ее аргументами являются простое нечетное число р и целое число а. Определение 6.1. )[ — 1, если а — квадратичный невычет по модулю р; = < 0, если р|а; I 1, если а — квадратичный вычет по модулю р. Свойства символа Лежандра описывает следующая теорема. Теорема 6.1. Пусть а, Ь — произвольные целые числа. Тогда: 1) (Н = cl^t (mod p); 2) если a = b (mod р), то (-) = (-); \РУ \Р/ кроме того ( - ) = 1; ( — ) = (—1) 2 . \РУ \ Р ) Доказательство. Первое утверждение теоремы совпадает со вторым утверждением леммы 5.2. Если а = Ъ (mod р), то множества решений сравнений х2 = = a (mod p) и х2 = 6 (mod p), очевидно, совпадают. Отсюда следует, что эти сравнения разрешимы или неразрешимы одновременно, что доказывает второе утверждение теоремы. С помощью первого утверждения находим следующие сравнения по модулю р Левая и правая части получившегося сравнения равны ±1 или 0. Поэтому их разность не превосходит 2 и делится на р > 2. Следовательно, их разность равна 0. Третье утверждение доказано. Сравнение х2 = 1 (mod p) при любом простом нечетном р разрешимо.Решением является класс вычетов х = 1 (mod p)- Поэтому ( - ) = 1. \Р) 134
Из первого утверждения теоремы при а = — 1 следует (у) = (-1)^ (mod p). Абсолютное значение разности левой и правой частей этого сравнения не превосходит 2 и делится на нечетное простое число р. Значит, эта разность равна нулю, что доказывает справедливость последнего утверждения теоремы. ■ Замечание 6.1. Из последнего утверждения теоремы 6.1 следует, например, что сравнение х2 + 1 = 0 (mod p), где р - простое нечетное число, разрешимо в том и только том случае, когда р = 1 (mod 4). 6.3. Квадратичный закон взаимности Утверждение, называемое квадратичным законом взаимности, впервые сформулировал Л.Эйлер (1783), а К.Ф.Гаусс (1796) дал первое его доказательство. Теорема 6,2 (квадратичный закон взаимности). Еслир uq — различные простые нечетные числа, то Иначе, (-) = (-], если р=1( mod 4) или q = 1 ( mod 4); Я/ \Р/ ( - ) = -(-], если р = 3 ( mod 4) и q = 3 ( mod 4). \qj \pJ Можно также сказать, что в первом случае сравнения х2 = s q (mod р) и х2 = р (mod g) разрешимы или неразрешимы одновременно, а во втором случае из разрешимости одного из этих сравнений следует неразрешимость другого. Квадратичный закон взаимности вместе с утверждениями теоремы 6.1 позволяют вычислять символ Лежандра и тем устанавливать разрешимость или неразрешимость квадратичных сравнений. Некоторые примеры будут рассмотрены в конце подраздела. Перед тем как доказывать теорему 6.2, установим одно вспомогательное утверждение и выведем следствие из него. В этом Утверждении используется тот факт, что совокупность чисел 135
р-1 р-1 составляет приведенную систему вычетов по модулю р. Лемма 6.2 (лемма Гаусса). Пусть р — простое нечетное число и а — целое число, не делящееся на р. Для каждого к = 1, 2, ..., —-—., определим е& = ±1 условиями >odp), 0<rfc<^=-. (6.7) 2(9е t — количество отрицательных среди чисел Бц, Бг* • • • ? 2 Доказательство. Докажем сначала, что все числа г&, определенные в (6.7), не сравнимы друг с другом по модулю р. Предположим, что для некоторых индексов к > £ выполняется сравнение г к = Г£ (mod p). Тогда, согласно определению, имеем ка = = ±£а (mod p) и, значит, р\(к =F /). Но этого быть не может, так как 0 < |fe ± Z| < р — 1. Отсюда следует, что набор чисел < 7*1, ..., г^± \ лишь перестановкой отличается от набора < 1, р— \Л 2, ..., —-— >. Перемножив все сравнения (6.7) и пользуясь равенством ri • • • T2z± = ( —-z— )!} получим z± = ( —-z— )!} (^Y~ya^ = (^-)!^2---е£^ (mod p). (р— 1\ —-— 1!, не кратное р^ и пользуясь первым утверждением теоремы 6.1, находим ( ~ 1 ^ \Р/ * • • £ezi1 (mod p). Учитывая, что разность левой и правой 2 2 частей этого сравнения по абсолютной величине не превосходит 2, получаем утверждение леммы. • 136
/2\ eLi! Следствие 6.1. 1. — | = (—1) s . W 2. ifc/ш а нечетно, то ( — I = (—l)5, где S = /^ — f. u2-! Замечание 6,2. Для каждого нечетного числа it дробь —-— есть о целое число. Действительно, и2 — 1 = (и — 1}(и 4-1) есть произведение двух последовательных четных чисел. Одно из них делится на 4, а другое на 2. Доказательство. Неполное частное от деления числа ак на р \ак] равно — . Поэтому IP i lakl _ \ гь, если е& = 1; L P J IР — rfc? если £& = —1. Р — 1 Суммируем эти равенства при всех к = 1,2, ..., —-—. Учитывая, что 1 + 2 + Н — = —-— и пользуясь обозначениями 2 8 леммы 6.2, получим а — р- S = t-2 p-i 2 к=1 Перейдем в этом равенстве к сравнению по модулю 2. Заметив, что 2), p=-l(mod 2), p2 - 1 p2 - 1 получаем a + S = t-\ — (mod 2), т.е. 8 8 2). (6.8) При а = 2 все слагаемые в сумме, определяющей S, равны лю. Поэтому 5 = 0 и t = —- о это доказывает п. 1 следствия. р-1 нулю. Поэтому 5 = 0 и £ = fl—— (mod 2). В силу леммы Гаусса 8 137
Если а — нечетно, то согласно (6.8) имеем t = S (mod 2), что в силу леммы Гаусса доказывает п. 2 следствия. щ Доказательство теоремы 6.2. По следствию 6.1 выполняют- равенства (- J = (-1)51 и (- J = (-1)52, где ся р-1 q-1 Поэтому и достаточно доказать равенство _p-lq-l о— 1 При фиксированном целом х из интервала 0 < х < —-— М величина — есть количество целых точек у на промежутке qx ax О < у < — или, учитывая, что — не есть целое число, — на про- Р Р ох межутке 0 < у < —. Отсюда следует, что S\ равно количеству Р пар целых чисел х, у, удовлетворяющих неравенствам v — 1 ох 0<х< ^Чг-' 0<у < —. 2 р Поскольку - не целое число, и — < -, заключаем, что S\ есть 2 р 2 количество точек (ж, у) G Z2 с условиями Точно так же число 52 равно количеству точек (х, у) 6 Z2 в прямоугольнике 138
с условием qx — ру < 0. Последнее условие может быть переписано в виде ру — qx > 0. Ни одна из точек (я, у) G 1? прямоугольника Т не лежит на прямой линии ру — qx = 0, поэтому сумма S\ + 52 равна количеству точек с целыми координатами, лежащих в Т, т.е. ll 2 2 ' Пример 6.1. Определим, разрешимо ли сравнение х2 = = 53 (mod 233). Заметим, что 53 и 233 — простые числа. Так как 53 = 1 + 4 • 13 и 233 = 4 • 53 + 21, то, применив квадратичный закон взаимности и второе утверждение теоремы 6.1, находим V233/ " V 53 ) ~ V53 Пользуясь третьим утверждением теоремы 6.1 и вновь применив квадратичный закон взаимности, получим (,53) = (,53) \53) = \Т) \Т) ■ Далее, учитывая, что 53 = 7-7 + 4и53 = 3*18 — 1, имеем и, наконец, Таким образом, данное сравнение не имеет решений. Пример 6.2. Определим, для каких простых чисел р разрешимо сравнение х2 + 3 = 0 (mod p). При р = 2 решение существует х = 1 (mod р). При р = 3 решением является класс вычетов х = 0 (mod p). Рассмотрим далее случай р > 3. Согласно теоремам 6.1 и 6.2 справедливы равенства 139
Поскольку {1, если р = 1 ( mod 3); — 1, если р = 2 ( mod 3), /-3\ заключаем, что равенство — ) = 1 для простых чисел р > 3 V Р ) выполняется лишь при р = 1 (mod 3). Учитывая, что р нечетно, последнее сравнение можно переписать в виде р = 6п + 1, п Е Z. Итак, данное сравнение разрешимо лишь при р = 2,3 и всех простых числах вида 6п + 1. Пример 6.2 может быть обобщен. Теорема 6.3. Множество всех простых чисел р, для которых разрешимо сравнение ах2 + bx + с = 0 ( mod p), pfa> (6-9) состоит из некоторых делителей числа 2D, где D — Ь2 — 4ас, а также из простых чисел, лежащих в нескольких классах вычетов по модулю 4|Z)|. Доказательство. Достаточно рассматривать только простые числа р, не делящие 2D. Как указывалось ранее, существует взаимно-однозначное соответствие между решениями сравнения (6.9) и решениями сравнения х2 = D (mod p). Последнее сравнение разрешимо лишь для тех простых чисел р, для которых выполняется равенство ( — ) =1. Для завершения доказатель- \Р/ ства теоремы достаточно установить, что множество нечетных простых чисел р, для которых ( — ) = 1, состоит из несколь- ких классов вычетов по модулю 4|D|. Это равносильно утверждению, что для простых чисел из одного класса вычетов по модулю A\D\ сравнение х2 = D (mod p) разрешимо или неразрешимо одновременно, т. е. сравнение р\ = р2 (mod 4|D|) влечет за собой \PiJ \Рг) Пусть D = (—l)ai • 2a2 Yl q*4 - разложение числа D в произведу дение простых сомножителей (с учетом знака). Тогда 140
рассмотрим несколько случаев. 7)i — 1 Р2 — 1 1. Так как рг = р2 (mod 4), то —-— = —-z— (mod 2) и по четвертому утверждению теоремы 6.1 выполняется равенство -)-(-)■ Р\ ) \P2j 2. Допустим, что с*2 > 1. Тогда D делится на 2, следовательно, Р\ = Р2 (mod 8) и / 2 \ / 2 \ По первому утверждению следствия 6.1 получаем [ — 1 = [ — ) \PiJ \Р2/ /2\а2 — Р1 и, значит, при любом с*2 > 0 выполняется равенство ( — 3. Пусть теперь q \ D, q нечетно. Из сравнения р\ = = Р2 (mod 4|D|) следует р\ = pi (mod ^), так что ( — ) = ( — ). В то лее время р\ = р2 (mod 4), поэтому Теперь с помощью квадратичного закона взаимности находим Из равенств, доказанных в пп. 1 — 3 с помощью (6.10), нахо- дим [ — ) = ( — ]. ■ Замечание 6.3. Во многих случаях модуль 4|JD| может быть уменьшен. Например, его можно заменить любым числом 4К с усло- вием, что —г есть квадрат целого числа. К 141
6.4. Символ Якоби и его свойства Символ Лежандра определен только для пар целых чисел а,р, у которых р есть простое нечетное число. Определение можно распространить на большее множество пар целых чисел и построить таким способом функцию, называемую символом Якоби. Одним из важных свойств символа Якоби является возможность вычислять его значения, не используя весьма трудоемкую операцию разложения чисел на множители. В частности, это дает быстрый способ вычисления значений символа Лежандра. Пусть Р — положительное нечетное число и Р = р\ • • • рг — его разложение в произведение простых чисел, не обязательно различных. Определим для каждого целого числа а символ Яко- би ( —) равенством где справа стоит произведение символов Лежандра. Следует отметить, что символ Якоби не имеет отношения к разрешимости квадратичных сравнений. Например, (2\ - J = —1 и, значит, ни при каком целом х число х — 2 не делится на 3. Тем более оно не делится на 15. В дальнейшем буквой Р будет обозначаться некоторое положительное нечетное число. Основные свойства символа Лежандра описывает следующая теорема. Теорема 6.4. /. Если целые числа а, Ъ взаимно просты с Р и удовлетворяют сравнению a = b (mod Р), то (—) = ( — ). 2. Для любых целых чисел а, Ь, взаимно простых с Р, выполняется равенство I — ) = f — J I ~ I. 3. Справедливы равенства 142
4- Для любых двух положительных нечетных взаимно про- fQ\ /Р\ стых чисел Р, Q имеет место равенство I — 1 [ —- 1 = -(-1) 2 Лемма 6.3. Для любых нечетных целых чисел щ, ...,гхт справедливы сравнения: . щ ■ ■ ■ ит - 1 _ v-^ ttj-1 V1 г=1 8 « - Доказательство. Рассмотрим сначала случай т = 2, обозначив для краткости и = щ, v = 1^2- Справедливо сравнение tiv - 1 - (и - 1) - (v - 1) = (u - l)(v - 1) = 0 (mod 4). Разделив обе части его и модуль на 2, получим первое утверждение. Для доказательства второго утверждения разделим обе части и модуль сравнения и\2 - 1 - (гх2 - 1) - {v2 - 1) = {и2 - l)(v2 - 1) = 0 (mod 64) на 8. По доказанному при любом т > 3 справедливы сравнения 1771—1 = 22 ( г=1 Оба утверждения леммы следуют отсюда с помощью математической индукции. ■ Доказательство теоремы 6.4- Пусть Р = Р\--Рг — разложение в произведение простых чисел. Тогда для любых а = = Ь (mod Р) имеем а = Ъ (mod р^), г = 1, ..., г, и, согласно определению и теореме 6.1, получаем 143
Это доказывает первое утверждение теоремы. Справедливы равенства доказывающие второе утверждение. Пользуясь определением символа Якоби, теоремой 6.1 и леммой 6.3, находим (?) г=1 4jrt/ г=1 Пусть теперь Р, Q — положительные нечетные взаимно простые числа и Р = Pi' "Pr-, Q — Qi''ш Qs ~~ их разложения в произведения простых чисел. Пользуясь определением символа Якоби, вторым утверждением теоремы и квадратичным законом взаимности, находим (5)Й) Согласно лемме 6.3 имеет место сравнение UU 2 2 \^ 2 J \U 2 - 2 2 (m°d2)' доказывающее вместе с (6.11) четвертое (последнее) утверждение теоремы. ■ Вычислим с помощью теоремы 6.4 символ Якоби ( —- I, сов- у Zoo J падающий, поскольку 233 — простое число, с соответствующим символом Лежандра. Имеем, пользуясь утверждениями 1, 3 и 4 этой теоремы, 144
( ( V 233,1 " V 53 -(Ю-&)--1- что, конечно, совпадает с результатом предыдущих вычислений. Способ вычисления символа Якоби, примененный в рассмотренном примере, может быть оформлен в виде общего алгоритма полиномиальной сложности. 6.5. Суммы двух и четырех квадратов Этот раздел посвящен применению сравнений для исследования диофантовых уравнений специального вида. Сначала рассмотрим уравнение х2 + у2 = п, (6.12) где предполагается, что п — заданное целое положительное число. Решения (я, у) этого уравнения также будут предполагаться целыми числами. Не при всяком натуральном п это уравнение имеет решения. Например, любое решение в целых числах уравнения х2 + у2 = 7 должно удовлетворять неравенствам \х\ < 2,|у| < 2. Перебирая последовательно все пары чисел, удовлетворяющих этим неравенствам, можно убедиться, что ни одна из них не является решением уравнения. Сначала рассмотрим уравнение вида (6.12) в предположении, что его правая часть есть простое число р. Лемма 6,4. Еслир — простое число вида 4А;+1, то уравнение х2 + у2 = р разрешимо в целых числах (ж,у). Доказательство. Для простого числа р = 4А; + 1 символ Ле- жандра ( — ) равен 1, и, значит, найдется целое число а, удо- V Р ) влетворяющее сравнению а2 = — 1 (mod p). Для любых целых чисел х, у справедливы сравнения х2 + у2 = х2 - а2у2 = (х- ау)(х + ay) ( mod p). (6.13) Рассмотрим всевозможные пары целых чисел (ж, у), удовлетворяющие условиям 145
О < х < Ш, О < у < [у/р\, (6.14) и для каждой такой пары найдем класс вычетов (х+ау) (mod р). Количество получившихся классов вычетов не превосходит р, в то время как количество пар (я, у) равно Это значит, что найдутся по крайней мере две пары (#2? 2/2)7 удовлетворяющие условиям (6.14), для которых классы вычетов (xi + ayi) (mod р),г = 1,2, совпадают. Таким образом, х\ + ау\ = Х2 + ау2 (mod р) или (х\ - жг) + а(у\ — у2) = 0 (mod р). Обозначив для краткости хо = х\ — Х2, у о = У\ — У2, с помощью (6.13) получим Яо + Уо = (х0 + ауо)(хо - ау0) = 0 (mod p), т. е. число Жд + Уо делится на р. Условия (6.14) означают, что числа хсьУо не очень велики, а именно: \хо\ = \хг - х2\ <[у/р\<у/р, \уо\ = \У\ - Iftl < [>/Я < у/Р- Но тогда Xq + Уо <Р+Р = 2р. Учитывая, что пары чисел (xi,j/i), (^25 У2) различны, находим х% + у§ > 0. Интервал (0,2р) содерлсит лишь одно число, делящееся на р, а именно р. Следовательно, х§ + Уо = Р- ■ Лемма 6.5. Если два уравнения х2 + у2 = и, х2 + у2 = v, и, г? € Z, разрешимы в целых числах, то и уравнение x2 + y2 = uv (6.15) имеет целые решения. Доказательство. Рассмотрим пары целых чисел (xi,yi), (#2э У2)? удовлетворяющие равенствам х2 + у2 = и, х\ + у2 = v. Раскрыв скобки, легко проверить, что 0*1*2 ~ У1У2)2 + (Х\У2 + У\Х2? = (х\ + yl)(x\ + yl) = UV. (6.16) 146
Таким образом, целые числа z — х\Х2 — У1У2; t = Х1У2 + удовлетворяют равенству z2 +t2 = uv, т. е. уравнение (6.15) разрешимо в целых числах. ■ Рассмотрим комплексные числа и их произведение у = ар = (хгх2 - У1У2) + г(хгу2 + Равенство (6.16) может быть переписано в виде |у|2 = |а|2|р|2. Таким образом, оно по-существу равносильно равенству |ос{3| = = MIPI- Теорема 6.5. Уравнение (6.12) разрешимо в целых числах тогда и только тогда, когда разложение п на простые сомножители содерэюит каждое простое число вида Ак + 3 в четной степени. Доказательство. Докажем разрешимость уравнения (6.12) в условиях теоремы. Если разложение п на простые сомножители содержит каждое простое число вида Ак + 3 в четной степени, то справедливо равенство п = {р\ • --ре)т2, где pi, ... ,рц — простые числа вида 4к + 1 или 2. Уравнение х2 + у2 = 2 имеет решение х = 1,у = 1. Согласно лемме 6.4 каждое из уравнений х2 + у2 = pj при pj > 2 разрешимо в целых числах. Имеет решения в целых числах также и уравнение х2 + у2 = га2. Например, пара чисел х = га, у = 0 будет его решением. Применив теперь несколько раз лемму 6.5, заключаем, что и уравнение (6.12) при п = р\ • • -ре • га2 имеет целые решения. Предположим, что существуют натуральные числа, предста- вимые в виде суммы двух квадратов, но имеющие в своем разложении на простые сомножители хотя бы одно простое число вида 4НЗв нечетной степени. Пусть п = х% + у% — наименьшее из таких чисел и для р = 4к + 3 кратность vp(n) нечетна. Справедливы сравнения х% + у% = 0 (mod p) и *о = -Уо (mod p). (6.17) Предположим, что р \ xq и, значит, р \ уо- Определим целые числа щ v равенствами xq = pu, y0 = pv. Тогда п = р2{и2 + v2). Так как га = и2 + v2 < n, то, согласно условию минимальности в определении п, кратность vp(ra) четна. Но тогда будет четным и 147
число vp(n) = vp(m) + 2, вопреки определению п. Следовательно, р\хопр\уо. р-1 Возведем обе части сравнения (6.17) в степень —-— = 2к + 1 и получим х^1 =-yp0~l (mod р). (6.18) По малой теореме Ферма выполняются сравнения х$~ = = 1 (mod р); т/о"1 = 1 (mod р), так что из (6.18) следует 1 = = — 1 (mod р). Последнее сравнение невозможно, ведь р = Ак + + 3 > 2. Это противоречие завершает доказательство теоремы. ■ Докажем теорему о представимости натуральных чисел в виде суммы четырех квадратов. Первое доказательство этой теоремы было опубликовано Ж. Л. Лагранжем (1770). Теорема 6.6. Каждое целое, положительное число предста- вимо в виде суммы четырех квадратов целых чисел. Иначе, для каждого натурального п уравнение о О О О Х1 + Х2 + Х3 + Х4 = п разрешимо в целых числах. Сначала докажем утверждение, подобное лемме 6.5. Лемма 6.6. Если натуральные числа ti, v представимы в виде суммы четырех квадратов, то их произведение также можно представить в виде суммы четырех квадратов. Доказательство. Доказательство, как и в случае леммы 6.5, основано на некотором тождестве. Рассмотрим четыре комплексных числа Y = и матрицы Имеем det А = х\ + х\ + х\ + х\\ det В = у\ + у\ + у\ + у\. Справедливо матричное тождество * в- 148
означающее, в частности, что матрица А • В имеет такую же структуру, что и матрицы (6.19). Легко проверить, что а§ + $ч = Х1уз-Х2У4 + x3yi + х±у2 + г{х\уА + х2уз ~ Поэтому равенство det A • det В = det(A • В) приводит к тождеству где toto _i hx§4 -^ *i ^2 ^3 Z4 • О О )(у? + У2- = xiyi - = яц/2 + = Х1УЗ - = х\у± + vy\- Х2У2 Х2У1 Х2У4 Х2УЗ ЬУ42) = -х3уз + хзУа + ХЗУ1 — хзУ2 Z~y + Z2 + * ~ Х4У4] - Я4У35 + Х±у2\ + х±у\. 9 9 '3+24 Тождество (6.20) можно проверить и непосредственно, раскрыв скобки. Лемма 6.6 сразу же следует из (6.20). Действительно, если с некоторыми целыми числами Жг, yj выполняются равенства xl + xl + xj + xl = щ У1+У2+Уз + Уа = vi то определенные выше целые числа z% согласно тождеству (6.20) дают представление числа uv в виде суммы четырех квадратов z\ + z\ + z\ + z\ = uv. Ш Лемма 6.6 означает, что для доказательства теоремы 6.6 достаточно установить представимость простых чисел в виде суммы четырех квадратов. Поскольку 2 = I2 + I2 + О2 + О2, далее будем считать, что р — простое нечетное число. Докажем вспомогательную лемму о сравнениях. Лемма 6.7. Для каждого простого нечетного числа р существуют целые числа a ub, удовлетворяющие сравнению l + a2 + 62 = 0(mod p). Доказательство. Рассмотрим два множества чисел 149
р + 1 _. р + 1 Каждое из них состоит из —-— чисел. Поскольку — Ь P+l Н = р + 1 > р, заключаем, что объединение этих множеств Х\ U Х2 должно содержать два числа, принадлежащих одному классу вычетов по модулю р. Но числа множества Xi, очевидно, не сравнимы между собой. Точно так же не сравнимы и числа второго множества. Поэтому найдутся целые числа а, Ь, такие, что а2 е Хи -1 - Ь2 е Х2 и а2 = -1 - Ь2 (mod p). ■ Доказательство следующей леммы напоминает доказательство леммы 6.4. Лемма 6.8. Каждое простое число есть сумма четырех квадратов. Доказательство. Пусть a, b — целые числа, определенные в лемме 6.7. Рассмотрим все наборы целых чисел х = (#i, х2, #з, х^\ удовлетворяющие условиям 0<Xi<[y/p\, г = 1,2,3,4, (6.21) и для каждого такого набора найдем пары классов вычетов (хз + ах\ + 6x2 ( mod р), х^ — Ьх\ + ax<i ( mod p) J. (6.22) Количество получившихся при этом пар классов вычетов не превосходит р2, в то время как количество наборов х равно (1 + Ш)4 > Ш4 = р2- Значит, найдутся два различных набора х = (xi, Х2, хз, х±)\ у = = {Уъ У2> Уз? 2/4)? удовлетворяющие условиям (6.21), для которых классы вычетов (6.22) совпадают, т. е. + ах\ + Ьх2 =уг + &У\ + fy/2 (mod p); - Ъх\ + ах2 =Уа ~ Ьу\ + ау2 (mod p). Положим ki = Х{ — у г. Тогда выполняются условия к3 = -ак\ - bk2 ( mod p), fc4 = Ьк\ - ак2 (mod p), \к{\ < у Отсюда находим сравнение к\ + к\ + к\ + к\ = к\ + к\ + (afci + Ьк2)2 + (Ькг - ак2)2 = = (к2 + Щ)(1 + а2 + Ъ2)=0{mod p) 150
и неравенства О < к\ + к\ + Щ + к\ < 4р. Следовательно, к1 + к\ + Щ + к\ = rap, где т есть какое-то из чисел 1, 2, 3. При ?71 = 1 утверждение леммы выполняется. Рассмотрим случай т = 2. Сумма к^ + к% + к% + к\ делится на 2 и, значит, числа &1,&2,&з?&4 могут быть разбиты на пары одинаковой четности. Не уменьшая общности, можно считать, что &i, к2 и &з, &4 имеют одинаковую четность. Тогда все четыре числа к\ - &2, &i + к2, fc3 - &4, fc3 + &4 четные и из равенств fh + k2\2 , [кг-к2\2 , fks + kA\ {-»-)+ {-2-)+ {-г-) = (fc? + ^ + ^ + *2)=P следует утверждение леммы. При т = 3 сумма fcf + fc| + fc| + ^4 делится на 3. Квадраты целых чисел при делении на 3 дают в остатке 0 или 1. Поэтому одно из чисел к{ делится на 3, а остальные не делятся. Изменив, если необходимо, нумерацию этих чисел, можно, не уменьшая общности, считать, что на 3 делится fci. Сменив также в случае необходимости знаки у чисел &2>&з?&45 можно считать, что &2 = &з — ^4 = 1 (mod 3). Действительно, если к = 2 (mod 3), то -к = 1 (mod 3). Воспользуемся тождеством (6.20), положив в нем Xi = к^ у\ = = 0, у2 = Уз = У4 = 1, и получим /fc2 + fc3 + fc4\2 | (h + h-кЛ2 [ /fei-fc2 + fc4\2 | (к\ + к2 — к$\ 1/,9 ,9 ,2 12\ { ±) =^(к2 + Щ + Щ + к1)=р. (6.23) Из предположений об остатках чисел ki при делении на 3 следует, что все дроби в равенстве (6.23) есть целые числа. Это завершает доказательство леммы 6.8, а вместе с тем и теоремы 6.6. ■ В виде суммы трех квадратов представимы не все натуральные числа п. Исключительное множество составляют числа вида 4а(8Ь + 7) при целых неотрицательных а, 6 и только они. Например, число 7 нельзя представить в виде суммы трех квадратов целых чисел. 151
Теорему Лагранжа можно обобщить, рассматривая вместо квадратов кубы, четвертые или более высокие степени. Д. Гильберт1 (1909) доказал, что для каждого целого к > 2 можно найти целое п > 0 с условием, что любое натуральное число пред- ставимо в виде суммы не более чем п слагаемых вида хк с целыми х > 0. При к = 2 это утверждение выполняется согласно теореме 6.6 с п = 4. Сформулированное утверждение было высказано как гипотеза Э. Варингом (1770). 6.6. Представление нуля квадратичными формами от трех переменных В этом разделе речь пойдет о решении в целых числах я, у, z уравнения ах2 + by2 + cz2 = 0, (6.24) в котором коэффициенты а, 6, с предполагаются отличными от нуля целыми числами. Ясно, что при любых коэффициентах уравнение (6.24) имеет решение х = у = z = 0. Это решение будем называть тривиальным и далее найдем условия, при которых уравнение имеет хотя бы одно нетривиальное решение. Уравнение (6.24) имеет нетривиальное решение в целых числах тогда и только тогда, когда оно разрешимо в рациональных числах, среди которых есть отличное от нуля. Действительно, если рациональные числа а,р,у удовлетворяют уравнению (6.24), то умножив их на общий знаменатель, молено найти набор целых чисел, также удовлетворяющих этому уравнению. Сначала выполним несколько упрощающих, но не уменьшающих общности предположений. Коэффициенты а, 6, с уравнения (6.24) должны иметь разные знаки. В противном случае уравнение имеет лишь тривиальное решение х = у = z = 0. Умножив в случае необходимости уравнение на —1 и сменив, если нужно, обозначения переменных, можно считать, что а>0, Ь>0, с<0. (6.25) Если какие-либо два коэффициента, например а и 6, имеют общий простой делитель р, т.е. а = ри, Ь = pv при некоторых целых и, v, то, умножив уравнение (6.24) на р, получаем равенство и(рх)2 + v(py)2 =2 1Д. Гильберт (1862 — 1943) — выдающийся немецкий математик. 152
из которого следует, что уравнение (6.24) имеет нетривиальное решение в целых числах одновременно с уравнением их2 + vy2 + pcz2 = 0. Заметим, что \uvpc\ < \аЪс\, т. е. абсолютная величина произведения коэффициентов нового уравнения меньше абсолютной величины произведения коэффициентов предшествующего. Если в новом уравнении найдутся два коэффициента, имеющие нетривиальный общий делитель, такое преобразование молено повторить. Ясно, что этот процесс должен завершиться, ведь натуральные числа \abc\ образуют убывающую последовательность, а она не может быть бесконечной. Итак, при выяснении вопроса о разрешимости уравнения (6.24) в целых числах, можно считать, что коэффициенты а, Ь, с попарно взаимно просты, т.е. (а,Ь) = (Ь,с) = (а,с) = 1. (6.26) Наконец, если какой-либо из коэффициентов, пусть а, делится на квадрат простого числа, т.е. а = p2w, где р — простое число; w — целое число, то уравнение (6.24) может быть переписано в виде w(px)2 + by2 + cz2 = 0, т. е. имеет нетривиальное решение в целых числах одновременно с уравнением wx2 + by2 + cz2 = 0. Проделав эту операцию несколько раз, молено добиться, чтобы ни один из коэффициентов уравнения не делился на квадрат никакого простого числа. Следующая теорема была впервые доказана А. М.Лежан- дром (1785). Теорема 6.7. Пустьа,Ь,с — целые числа, удовлетворяющие условиям (6.25) и (6.26), а кроме того не делящиеся на квадрат никакого простого числа. Уравнение (6.24) имеет нетривиальное решение в целых числах в том и только том случае, когда каждое из сравнений Ъ\2 + с = 0(mod a); qi2 + а = 0(modb); av2 + b = 0(mod с) разрешимо в целых числах X, \i, v. 153
Доказательство. Докажем сначала, что из существования нетривиального решения уравнения (6.24) следует разрешимость каждого из сравнений (6.27). Покажем это, например, для последнего из сравнений. В остальных случаях доказательства аналогичны. Предположим, что уравнение (6.24) имеет нетривиальные решения. Выберем среди них решение (хсьУсь^о) с неотрицательными компонентами и наименьшей величиной \xq\ + |уо| + |zo|. Проверим, что числа с и уо взаимно просты. В противном случае они оба делятся на некоторое простое число р. Но тогда из равенства ах% + byl + czl = 0 (6.28) следует, что р|аж0. Учитывая взаимную простоту а и с, получаем отсюда, что р\х$. Числа х$, уо делятся на р. Из (6.28) теперь следует p2\cz% и, так как, согласно условию, с не делится на квадрат р, то p\z%. Целые числа и = хо/р, v = yo/p: w = zo/p составляют решение уравнения (6.28), причем \и\ + \v\ + \w\ < \xq\ + |yo| + |^о|- Получившееся противоречие означает, что числа с и уо взаимно просты. Из доказанного равенства (с, у о) = 1 следует, в силу теоремы 5.1, что найдется целое число v, удовлетворяющее сравнению yov = хо ( mod с). Далее с помощью равенства (6.28) находим l2 + b) = ax20 + byl = -czl = 0 ( mod с), и, в силу (с, уо) = 1, получаем c|(av2 + Ь), что равносильно последнему сравнению (6.27). Теперь докажем, что из разрешимости сравнений (6.27) следует разрешимость уравнения. Пусть X, [i, v — целые числа, удовлетворяющие сравнениям (6.27). Справедливо сравнение по модулю с: ах2 + by2 + cz2 = ах2 — av2y2 — (ах — avy)(x + vy) ( mod с) или в иных обозначениях f(xJy,z) = L1(x,y,z)Mi(xJyJz) (mod с), (6.29) где /(ж,у,z) = ax2+by2+cz2 nLi(x,y,z) = ax-avy, Mi(x,y,z) = = x + vy — линейные формы с целыми коэффициентами. 154
Точно так же найдутся линейные формы с целыми коэффициентами L2(x,y,z),M2{x,y,z), L3(a;,2/,2), М3(ж,у,2), для которых /(ж,у,г) = L2(x,y,z)M2(x,y,z) (mod a); (6.30) fix, у, z) = L3(x, у, z)M3(x, у, z) ( mod 6). (6.31) Рассмотрим далее всевозможные тройки целых чисел (х, у, z), удовлетворяющие условиям 0 < х < [у/Щ]; 0 < у < h/jac[]; 0 < 2 < [л/^6]. (6.32) Количество их 5 удовлетворяет неравенству S = (1 + [у/\Ьс\ Каждой такой тройке (х, у, z) поставим в соответствие набор классов вычетов по модулям |с|, а, Ь, а именно: (Li(z, у, ^)(mod|c|), L?(x, у, z)(mod a), L3(x, y, z)(mod b)). Количество различных наборов классов вычетов равно \abc\ и, как указано выше, меньше количества 5 наборов троек (ж, у, г). Поэтому найдутся две тройки (xi,yi,2i), (x2,y2,^2)? удовлетворяющие сравнениям L\(xi,yi,zi) = Li(x2,y2,z2) (mod |c|); L2{xi,yi,zi) = L2(x2,y2,z2) (mod a); 2,z2) (mod 6). Обозначив xo = xi — X2; yo = yi — У25 ^o = ^i "" Z23 и пользуясь линейностью L^, последние сравнения молено переписать в виде O) = 0 (mod |c|); 2о) =0 (mod a); , Уо, 2о) = 0 (mod Ъ). Теперь из сравнений (6.29), (6.30), (6.31) следует о, Уо, 2о); а|/(х0, уо, 20); Ь|/(х0, уо, 20). В силу попарной взаимной простоты чисел а, Ь, с эти делимости означают, что целое число /(xq, уо, zq) делится на abc. 155
Далее из неравенств (6.32) следует, что |жо| = |xi — X2I < [у/\Ьс\] и аналогично |уо| < [\/lacl]> \z®\ — [у/Щ- Пользуясь этими неравенствами и (6.25), находим i2/0, zq) > czq > ahc\ /(ж0, уо, го) < axl + ьУо < 2|а6с|. Здесь использовалось также, что все числа |6с|, |ас|,аЬ не являются квадратами. Из этих неравенств, поскольку а6с|/(хо, Уо> ^о) следует, что /(^о, Уо, zo) = mabc, т = 0, -1. Случай т = 0 доказывает нужное утверждение, так как по крайней мере одно из чисел хо, Уо> ^о отлично от нуля. Если же clxq + byfi + cz% = — абс, имеем Умножив последнее равенство на х$ + Ьс, получаем равенства -a(xl + bc)2 = (byl + czl){xl + bc) = b(xoyo - cz0)2 означающие, что числа Xq + 6с; хоуо — czo] xozo + Ьуо составляют решение уравнения (6.24). Это решение нетривиально, так как Xq + be ф 0. В противном случае \Ьс\ было бы квадратом целого числа, что неверно. ■ Существует алгоритм (здесь его не приводим), позволяющий в случае разрешимости уравнения (6.24) находить все решения в целых числах. Рассмотрим некоторые примеры. Пример 6.3. Решить в целых числах уравнение Согласно теореме 6.7 данное уравнение имеет нетривиальное решение лишь в случае разрешимости всех трех сравнений 2Х2 - 1 = 0(mod 3); -ц2 + 3 = 0(mod 2); 3v2 + 2 = 0(mod 1). Первое из этих сравнений равносильно сравнению X2 = = — l(mod 3) и, так как ( — ] = — 1, оно не имеет решений. Зна- чит, данное уравнение имеет лишь тривиальное решение х = у = = z = 0. 156
Пример 6.4' Найти все простые числа р, при которых уравнение х2 + у2 = pz2 имеет нетривиальное решение в целых числах. При р = 2 уравнение имеет решение х = у = z = 1. Поэтому далее будем считать, что простое число р нечетно. Согласно теореме 6.7 данное уравнение имеет нетривиальное решение в том и только том случае, когда выполняется сравнение v2 + 1 = 0 (mod p). Это условие равносильно равенству [ — ) = 1. Учитывая, что ( — ) = (—1)^~, заключаем, что V Р ) \ Р ) нетривиальное решение существует лишь для р = 2 и простых чисел р из прогрессии 4п + 1. Задачи для самостоятельного решения 1. Вычислите значения символа Лежандра: . /111\ ^ /529 \ /2108\ /19525 а) UliJ;6) UoiJ;B) Uj) [ 2 Р 2. Разрешимы ли сравнения: а) х2 = 68 (mod 113); б) х2 = 219 (mod 383); в) х2 + 7х + 45 = 0 (mod 409); г) Ъх2 + Их - 91 = 0 (mod 379). 3. Для каких простых чисел р число 15 будет квадратичным вычетом по модулю р? 4. Найдите все простые числа р, для которых разрешимо сравнение х2 = 5 (mod р). 5. Найдите все простые числа р, для которых разрешимо сравнение х2 + 2 = 0 (mod р). Докажите, что существует бесконечное количество простых чисел вида 8п -f 3. 6. Найдите все простые числа р, для которых разрешимо сравнение х2 = 2 ^nod p). Докажите, что существует бесконечное количество простых чисел вида 8п — 1. 7. Докажите, что уравнение х2 — у3 = 7 не имеет решений в целых числах ж, у. 8. Докажите, что если р > 2 - простое число, a, b - целые, р { а, то ^V р
Глава 7 Первообразные корни и индексы Согласно теореме 4.1 при любом натуральном га > 2 группа обратимых элементов кольца Z/raZ состоит из ср(га) классов, наименьшие неотрицательные вычеты которых взаимно просты с модулем га. Будем обозначать эту группу символом (Z/raZ)*. Настоящая глава посвящена изучению ее структуры. 7.1. Показатель числа по заданному модулю Согласно малой теореме Ферма (см. 4.5) для каждого целого числа а, взаимно простого с модулем га, выполняется сравнение аф(т) = 1 (mod га). Для некоторых чисел а сравнение ad = 1 (mod га) может выполняться и при d < cp(m). Например, (-1)2 = 1 (mod га). Пусть а — целое число, взаимно простое с модулем га. Напомним, что наименьшее натуральное число d с условием ad = = 1 (mod га) называется показателем числа а по модулю га (см. подразд. 4.5). Например, при га > 2 показатель —1 равен 2. Если два числа сравнимы по модулю га, то их показатели по модулю га одинаковы. На языке теории групп можно сказать, что показатель числа а по модулю га равен порядку элемента а в мультипликативной группе (Z/raZ)*. Заметим, что порядок этой группы равен ср(га). Определение 7.1. Целое число а, взаимно простое с модулем га, называется первообразным корнем по модулю га, если его показатель равен ср(га). Если а — первообразный корень по модулю га, то числа l.a.a2,...,^^)"1 (7.1) принадлежат различным классам вычетов. Действительно, если бы нашлись целые числа 0 < и < v < ср(га) — 1, для которых 158
аи = a? (mod m), то в силу взаимной простоты чисел а и га мы получили бы l = av~u (mod m). Но это невозможно, так как 0 < v — и < ц(т) и показатель а равен ф(т). Множество (7.1) состоит из ср(т) чисел. Поэтому среди (7.1) есть представители всех классов вычетов, состоящих из чисел взаимно простых с га. Иначе, для каждого целого числа Ъ, взаимно простого с модулем га, найдется единственное целое к, удовлетворяющее условиям b = ak (mod га), 0 < к < ср(га). Это свойство можно выразить иначе, сказав, что первообразный корень по модулю га существует лишь в случае, когда (Z/raZ)* — циклическая группа. Оно выполняется не для всех модулей га. Например, квадрат каждого нечетного числа при делении на 8 дает в остатке 1. Значит, показатель каждого нечетного числа по модулю 8 может равняться лишь 1 или 2, и всегда отличен от ф(8) = 4. Первообразных корней по модулю 8 не существует. Свойства показателей описывает следующая лемма. Лемма 7.1. 1. Пусть d — показатель числа а по модулю га. Натуральное число п удовлетворяет условию ап = 1 (mod га) в том и только том случае, когда d\n. 2. Пусть а,Ь — целые числа, взаимно простые с модулем га, показатели их равны соответственно uhv. Если (и, v) = 1, то показатель числа аЬ равен uv. 3. Если показатель числа с равен uv, то показатель си равен V. Доказательство. Заметим, что числа аЬ и аи, о которых идет речь в формулировке теоремы, взаимно просты с модулем, поэтому каждое из них имеет некоторый показатель. Первое утверждение леммы уже доказано нами (см. лемму 3.1). Чтобы доказать второе утверждение, обозначим буквой 5 показатель числа аЪ. Так как (ab)uv = (au)v(bv)u = l(mod га), то по первому утверждению леммы имеем s\uv. С другой стороны, из сравнения (ab)s = 1 (mod га) следует 1 = (ab)su = {au)sbus = bus (mod га). 159
С помощью первого утверждения находим v\us. Согласно условию числа u,v взаимно просты, поэтому v\s. Аналогично доказывается, что u\s. Учитывая взаимную простоту чисел гцг>, получаем отсюда uv\s. Итак, доказано, что s = uv. Для доказательства третьего утверждения обозначим буквой t показатель числа си. Так как 1 = cuv = (cu)v (mod га), то t \ v. А из сравнения 1 = (си)г = ctu (mod га) следует, в силу первого свойства, что uv \ tu и v\t. Но тогда t = v и последнее утверждение леммы доказано. ■ Следствие 7.1. Если (а, га) = 1 и целые числа u,v удовлетворяют сравнению аи = av (mod m), то и = v (mod d), где d — показатель а по модулю т. Доказательство. Не уменьшая общности можно считать, что v > и. Поскольку а и т взаимно просты, из данного сравнения следует av~u = I (mod га). Согласно первому утверждению леммы 7.1 выполняется d\(v — и). Ш 7.2. Существование первообразных корней по простому модулю К. Ф. Гаусс опубликовал (1801) два доказательства следующей теоремы. Теорема 7.1. Для каждого простого нечетного числа р существуют первообразные корни по модулю р. Доказательство. Обозначим буквой d наименьшее общее кратное показателей всех чисел, не делящихся на р. Из теоремы Ферма (см. 4.5) и первого утверждения леммы 7.1 следует, что р — 1 делится на показатель каждого числа, не кратного р. Но тогда d | (р — 1) (см. теорему 1.2). Из первого утверждения леммы 7.1 следует, что каждое целое число, не кратное р, удовлетворяет сравнению xd — 1 = = 1 (mod р). Значит, это сравнение имеет р — 1 решение. С помощью теоремы 5.3 находим теперь d > р — 1. Таким образом, d = p-l. Пусть р — 1 = qi1 •••qrr — разложение на простые сомножители. По свойству наименьшего общего кратного (см. следствие 2.2) можно утверждать, что для каждого индекса г, 1 < г ^ < г, найдется число а^, показатель которого равен q^Vi. Положим а = а^1 • • • а£г. По третьему утверждению леммы 7.1 показа- 160
хель числа а\1 равен qki. Из второго утверждения этой же леммы следует, что показатель числа а равен qkl • • • qkr = р — 1. Итак, построенное число а есть первообразный корень по модулю р. Ш Второе доказательство теоремы 7.1. Как уже указывалось, р — 1 делится на показатель по модулю р любого числа, не кратного р. Для каждого натурального d, делящего р — 1, обозначим символом ф(с£) количество чисел среди 1,2, ... ,р — 1, показатель которых по модулю р равен d. Тогда ф(й) > 0 и р-1, (7.2) ф-1 ведь каждое число из набора 1,2, ... ,р — 1 имеет некоторый показатель по модулю р. Пусть для какого-то d выполняется ф(й) > 0 и b — некоторое число с показателем d. Согласно условию минимальности в определении показателя все числа Ь*, fc = 0,l, ...,d-l, (7.3) лежат в различных классах вычетов по модулю р и удовлетворяют сравнению kd dk Значит, они являются решениями сравнения xd — 1 = 0 (mod p). Так как это сравнение не может иметь более d корней, все его решения исчерпываются классами вычетов по модулю р, содержащими числа (7.3). В частности, каждое число, имеющее показатель d, сравнимо с одним из чисел (7.3). Предположим, что г = (&, d) > 1. Тогда , d т.е. показатель £г не превосходит -. Из этого рассуждения сле- т Дует, что если показатель какого-либо числа Ьк из (7.3) равен d, то должно быть выполнено условие (k,d) = 1. Значит, при любом d\p — 1 выполняется неравенство ф(бГ) < cp(d). Итак, при любом d\p—l выполняется неравенство ф(й) < (f(d). Согласно лемме 3.3 выполняется 6 Нестеренко 161
С помощью (7.2) теперь находим £ (ф(<0 - №) = о. Все слагаемые в этой сумме неотрицательны, поэтому при любом d\p — 1 выполняется равенство ф(й) = ф(й). В частности, ф(р — 1) = ф(р -~ 1) > 0>и это завершает доказательство теоремы. Щ Следствие 7.2. Для каждого простого нечетного р суще- ствует в точности ф(р— 1) первообразных корней по модулю р. Доказательство. Согласно определению функции ф(сЕ) это утверждение следует из равенства ф(р—1) = ф(р — 1). ■ Для практического нахождения первообразных корней удобно пользоваться следующим утверждением. Лемма 7.2. Целое число с, не делящееся на простое нечетное р, будет первообразным корнем по модулю р в том и только том случае, если для любого простого числа д, делящего р — 1, выполняется р-1 с я ф\ (mod p). Доказательство. Обозначим буквой d показатель числа с по модулю р. Тогда d\(p — 1). Если d < р — 1, то найдется такое р — 1 ezlL простое число д, что #<i|(p — 1) или d I . Но тогда с * г- 9 9 = 1 (mod р), вопреки условию. Значит, d = р— 1, и это завершает доказательство леммы. ■ Пример 7.1. Найти наименьший первообразный корень по модулю 23. Справедливы сравнения по модулю 23 211 = 2 • (32)2 = 2 • 92 = 1; З11 = 9 • (27)3 = 9 • 43 = 1. Из них следует, что числа 2,3 не являются первообразными корнями по модулю 23. Кроме того, 411 = (211) = 1 (mod 23), так что и 4 не есть первообразный корень по модулю 23. Далее 511 = 5 • 255 = 5 • 25 = -1 ( mod 23) и 52 = 2 (mod 23). Применяя лемму 7.2 к простому числу р = 23 и с = 5, заключаем, что 5 есть наименьший первообразный корень по модулю 23, т. е. для каждого натурального числа 6, не 162
делящегося на 23, найдется целое к с условием b = Ък (mod 23). Иначе, класс вычетов 5 есть образующая в группе (Z/23Z)*. Количество первообразных корней по модулю 23 равно ср(22) = () = 10. Пример 7.2. Пусть p,q — простые нечетные числа, связанные соотношением р = 2q + 1. Докажем, что в случае q = An + 1 число 2 есть первообразный корень по модулю р, если лее q — = An + 3, то — 2 есть первообразный корень по модулю р. Так как р — 1 = 2q имеет лишь два простых делителя 2ид, то, согласно лемме 7.2, для доказательства того, что с есть первообразный корень, достаточно проверить выполнимость двух условий с2 ф 1 (mod р); сд ф 1 (mod р). Для с = 2 или с = — 2 первое из этих условий равносильно 4 ^ ^ 1 (mod p), что, конечно, выполняется, так как р>2-3 + 1 = 7. Для проверки второго условия рассмотрим сначала случай # = 4п + 1ис = 2.В этом случае имеем (mod p). p; ' p2-l Так как в рассматриваемом случае —-— = (An + l)(2n + 1), о заключаем, что 2q = — 1 (mod p) и, значит, 2 есть первообразный корень по модулю р. В случае д = 4п + 3ис= —2 находим ) s (mod p), \Р/ v2 -I причем = (An + 3)(2п + 2). Следовательно, (-2)q = 8 s — 1 (mod р), так что —2 есть первообразный корень по модулю р. Если известны все простые делители числа р — 1, то проверка Условий леммы 7.2 выполняется достаточно быстро с помощью алгоритма, изложенного в подразделе 4.7. Множество первообразных корней при заданном р достаточно велико, поэтому выбирая числа с случайным образом на промежутке 0 < с < р, можно с большой вероятностью попасть на первообразный корень и доказать это с помощью леммы 7.2. 163
Существует гипотеза1, что для каждого целого числа а, отличного от — 1 и квадратов целых чисел, существует бесконечно много простых чисел р, для которых а является первообразным корнем по модулю р. Например, существуют сколь угодно большие простые числа, для которых 2 будет первообразным корнем. 7.3. Построение первообразных корней по модулям рк и 2рк Далее докажем существование первообразных корней по модулям вида р* и 2ра, где р — простое нечетное число. Теорема 7.2. Пусть р — простое нечетное число и а > 1 — целое. Тогда: 1) по модулям ра и 2ра существуют первообразные корни; 2) пусть g — первообразный корень по модулю р. Если целое число д\ удовлетворяет условиям gi=g(modp), P2\g{-l-l, (7.4) то g\ — первообразный корень по любому модулю вида ра, где а > 1. По крайней мере одно из чисел g или g + p удовлетворяет условиям (7.4):, 3) если ^2 нечетно и р2 = g\ (mod р2), тпо дч — первообразный корень по любому модулю вида 2ра, где а > 1. По крайней мере одно из двух чисел д\ и д\+ р2 удовлетворяет указанным условиям. Пример 7.3. Доказать, что 2 есть первообразный корень по модулям 37а при любом целом а > 1. Найти первообразные корни по модулям 2 • 37а. Докажем сначала, что 2 есть первообразный корень по модулю 37. Поскольку для р = 37 выполняется р — 1 = 36 = 22 • З2, то в силу леммы 7.2 достаточно проверить, что 218 ф 1 (mod 37) и 212 ф 1 (mod 37). Имеем 26 = 64 = -10 (mod 37), поэтому 212 = (-10)2 = 26 (mod 37), 218 = (-10)3 = -1 (mod 37). Итак, 2 есть первообразный корень по модулю 37. Предположим теперь, что 372|236-1 = (218-1)(218 + 1). Гипотеза высказана немецким математиком Э. Артином (1898 — 1962). 164
Так как 218 = -1 (mod 37), то 372|(218 + 1) = (26 + 1)(212 - 26 + 1). Учитывая, что 26 + 1 = 65 не делится на 37, заключаем, что 372|212 - 26 + 1 = 4 033 = 37 • 109. Получившееся противоречие означает, что 372 \ 236 — 1. Согласно теореме 7.2 можно утверждать теперь, что 2 есть первообразный корень по модулю 37а при любом целом а > 2. Так как 2 + 37 = 39 нечетно, то, согласно последнему утверждению теоремы 7.2, число 39 есть первообразный корень по любому модулю вида 2 • 37а при целом а > 1. Доказательство теоремы 7.2. Первое утверждение теоремы следует из второго и третьего. Поэтому перейдем непосредственно к их доказательству. Если оба числа (д + р)р~1 — 1 и gv~l — 1 делятся на р2, то Р2\(д +р)р~1 — др~1 и, раскрывая скобки в (д +р)р~1 с помощью формулы Ньютона для бинома, находим 0 = (д + pf-1 - sTl = (p - l)sr2p ( mod p2). Но тогда р\(р — 1)др~2, что невозможно. Итак, доказано, что по крайней мере одно из чисел (д + p)v~l — 1 и др~1 — 1 не делится на р2, т. е. по крайней мере одно из двух чисел д и д + р удовлетворяет условиям (7.4). Пусть д\ — произвольное число с условиями (7.4). Докажем, что при любом целом р > 0 выполняется равенство -1) _ i) = р + 1. (7.5) Воспользуемся для этого математической индукцией по р. При Р = 0 утверждение следует из условий теоремы (7.4). Допустим теперь, что равенство (7.5) справедливо для некоторого р > 0 и докажем его для р + 1. Из (7.5) следует, что Возводя это равенство в степень р, находим 165
Поскольку для 2 < к < р— 1 биномиальный коэффициент 7 \к р! делится нар и также выполняются неравенства Щр — к)\ + !) > Р + 2; р(р + 1) > р + 3, находим Из этого сравнения, поскольку р \ с, следует (7.5) для р + 1. Равенство (7.5) доказано для любого Р > 0. Пусть теперь а > 2 — некоторое целое число. Докажем, что д\ есть первообразный корень по модулю ра. Обозначим для этого буквой d показатель д\ по модулю ра. Так как gf = 1 (mod ра) и gi = g (mod р), то справедливо сравнение gd = 1 (mod p). С помощью леммы 7.1, поскольку д есть первообразный корень по модулю р, т. е. показатель д по модулю р равен р — 1, заключаем, что (р — l)|d. По теореме Эйлера выполняется сравнение д^ =l(mod pa). Опять применяя лемму 7.1, заключаем d|cp(pa) = p*~l{p — 1). Учитывая установленную ранее делимость (р — l)|d, находим, что d = рР(р — 1) с некоторым целым (3, удовлетворяющим неравенствам 0 < р < a — 1. Согласно определению d должно выполняться В соответствии с равенством (7.5) отсюда следует, что a < р + + 1. Сравнив это неравенство с доказанным ранее, получим р = = a — 1 и d = pCL~1(p — 1) = cp(pa). Таким образом, д\ есть первообразный корень по модулю ра. Для доказательства третьего утверждения теоремы заметим, прежде всего, что оба числа д\ и д\ +р2 сравнимы с д\ по модулю р2, и, в силу нечетности р2, одно из них будет нечетным, т.е. удовлетворяет условиям, определяющим #2- Согласно определению для <?2 выполнены условия (7.4), поэтому #2 — первообразный корень по модулю ра. Кроме того (<?2,2ра) = 1- Обозначим буквой s показатель #2 по модулю 2ра. Так как д% = 1 (mod pa) и р2 есть первообразный корень по модулю ра, то s > ср(ра) = ф(2ра). Теперь согласно теореме Эйлера можно утверждать, что s = cp(2pa). Следовательно, g<i есть первообразный корень по модулю 2ра. ■ Замечание 1.1. Любой первообразный корень по модулю ра, где ft :> 2, будет также и первообразным корнем по модулю р. Действитель- 166
но, пусть 6 — первообразный корень по модулю ра. Тогда для любого целого числа а, не делящегося на р, найдется целое число /с, удовлетворяющее сравнению а = Ьк (mod ра). Но тогда а = bk (mod р). Так как это справедливо для а = 1,2, ...,р — 1, показатель числа 6 по модулю р не может быть менее р — 1. 7.4. Теорема об отсутствии первообразных корней по модулям, отличным от 2, 4, pfc и 2pfc Ранее были рассмотрены примеры модулей га = ра, га = 2ра, для которых существуют первообразные корни и описан алгоритм их вычисления (см. 7.2 и 7.3). При га = 4 первообразным корнем будет число 3. При т = 2 существует единственный класс вычетов, состоящий из чисел, взаимно простых с 2, а именно класс 1, состоящий из нечетных чисел. В этом случае первообразным корнем будет 1. Здесь будет доказано, что указанными примерами исчерпываются все случаи существования первообразных корней. Теорема 7.3. Пусть а > 3 — нечетное целое число. Тогда: 1) каждое нечетное число а удовлетворяет сравнению а2*"2 = 1 (mod 2а); (7.6) 2) показатель числа 5 по модулю 2а равен 2а~2; 3) каждое нечетное число сравнимо по модулю 2а с одним из чисел ±5, ±52, ±53, ...,±52а~2. (7.7) Замечание 7.2. Эта теорема на языке теории групп может быть переформулирована как утверждение о том, что мультипликативная группа (Z/2aZ)* равна прямому произведению своих циклических подгрупп, порожденных классами вычетов —1 и 5. Доказательство. Докажем сначала первое утверждение. При a = 3 оно верно, так как для а = 26+1 выполняется а2 — 1 = = 46(6+1), и одно из двух последовательных чисел 6,6+1 четно. Так как а нечетно, то при любом целом к > 0 число а2 + 1 четно. Из равенства ( ) ( ) (7.8) следует теперь, что v2 (a2fc+1 - l) > v2 (a2fc - l) + 1. 167
Так как по доказанному V2(a2 — 1) > 3, заключаем отсюда по индукшрж, что v2(a2" - 1) > fc + 2, к> 1. Это неравенство при к = a—2 дает первое утверждение теоремы. Так как 5 = 1 (mod 4), то при любом целом к > 0 находим б2* + 1 = 2 (mod 4) и, значит, v2 f 52 + 1J = 1. Теперь из равенства (7.8) при а = 5 следует, что v2 (52fe+1 - l) = v2 (б2* - l) + 1. Отсюда же, поскольку v2 (5 — 1) = 2, находим v2 (б2* - l) = к + 2, fc > 0. (7.9) Пусть теперь a > 3 — целое число. Обозначим буквой d показатель числа 5 по модулю 2а. Из первого утверждения теоремы следует, что d|2a~~2, и, значит, d = 2^, р < a — 2. Согласно определению d имеем 2а|52 — 1, откуда в силу (7.9) следует a < р + 2. Таким образом, р = а — 2nd = 2а~2. Второе утверждение доказано. Для доказательства третьего утверждения теоремы достаточно установить, что числа (7.7) составляют приведенную систему вычетов по модулю 2а. Поскольку все эти числа нечетны, достаточно установить их попарную несравнимость по модулю 2я (см. 4.3). Предположим, что 5к = -5* (mod 2a),l < k,£ < 2a~2. Тогда 5к = —5^ (mod 4) и, значит, 1 = — 1 (mod 4), что неверно. Итак, числа с разными знаками из набора (7.7) не сравнимы друг с другом по модулю 2а. Если предположить, что сравнимы какие-либо два числа (7.7) с одинаковыми знаками, имеем 5fc ее 5е (mod 2a),l < £ < к < 2a"2. Тогда 5к~е = 1 (mod 2a), 0 < к — £ < 2а~2. Но это противоречит второму утверждению теоремы. ■ Теорема 7.4. Первообразные корни существуют лишь для модулей 2, 4, р\ 2ра, (7.10) где р — простое нечетное и а — целое положительное числа. Доказательство. Существование первообразных корней в случаях (7.10) доказано ранее. 168
Далее будет показано, что если т отлично от чисел вида (7.10), то для любого целого а, взаимно простого с т, выполняется сравнение а^ ее 1 (mod m). (7.11) Это сравнение означает, что показатель каждого числа а с условием (а, т) = 1 меньше ср(т), так что первообразных корней в этом случае не существует. Итак, пусть т = 2QLp*1 ..-p£r отлично от чисел вида (7.10). Тогда возможны следующие три случая: 1)г = О,ос>3; 2)г = 1,а>2; 3) г > 2. В каждом из них выполняется равенство В первом случае имеем т = 2а,ос > 3. Тогда сравнение (7.11) совпадает с (7.6), и уже доказано в теореме 7.3. Во втором и третьем случаях среди чисел Ф(2а), фСр?1), ..., ф?) (7.13) найдется по крайней мере два четных. Действительно, в третьем случае г > 2 и таким будет каждое из чисел ср(р^), г = 1, ..., г. Во втором же случае, т.е. при г — 1, выполняется неравенство а > 2, так что четным помимо фСр"1) будет и ср(2а). Поскольку среди чисел (7.13) имеется не менее двух четных, заключаем с помощью равенства (7.12), что 2ф(2а)|ф(т), 2у(г)?)\<?(т), ..., 2q>(p^)|<p(m). Но тогда ——- делится на каждое из чисел (7.13) и, следовательно, делится на показатель числа а по каждому из модулей 2а, р?*, 1 < г < г. Согласно первому утверждению леммы 7.1 теперь имеем = 1 (mod 2а); а^ = 1 (mod р?*), г = 1, ...,г. Из этих сравнений, поскольку все числа 2а, р?*, 1 < i < г, по- парно взаимно просты, следует, что разность а * — 1 делится на их произведение, т.е. делится на число т. Сравнение (7.11) доказано во всех случаях. 169
Оно, как указывалось ранее, означает, что показатель по модулю га каждого числа а взаимно простого с га, не превосходит —-— и значит меньше ср(га). Поэтому первообразных корней по модулю га не существует. ■ 7.5. Индексы и их свойства Рассмотрим сначала случаи га = рк или т = 2рк, где р — простое нечетное число и к > 1, в которых, по доказанному, существует первообразный корень. Пусть д — первообразный корень по модулю т. Тогда для любого целого взаимно простого с га числа а существует единственное целое у, удовлетворяющее условиям а = ду( mod га), 0 < у < ср(га). Это число называется индексом числа а по модулю га при основании g и обозначается символом ind5 а или inda, если указание на первообразный корень, относительно которого определяется индекс, не существенно. Итак, имеем а = gm^a ( mod m), 0 < indga < <p(m). (7.14) Свойства индексов описывает следующая лемма. Лемма 7.3. Пусть т = рк или т = 2рк. Тогда: 1) indg ab = indg a + ind^ b (mod cp(m)); 2) если a,b — первообразные корни по модулю m, то для любого числа с, взаимно простого с га, выполняется сравнение , с = inda cindb a ( mod cp(ra)), причем (ind^a, cp(ra)) = 1. Доказательство, Справедливы сравнения gmdgab = ab = gmd9agmd9b = gmdga+ind9b ( из которых, так как g — первообразный корень по модулю т, получаем первое утверждение леммы (см. следствие 7.1 из леммы 7.1). С помощью (7.14) находим bindacindba = Aind6aV 170 с ^ Q =
Пользуясь следствием 7.1 из леммы 7.1, заключаем cp(ra)|(inda cindb о. — ind& с). Это доказывает сравнение из второго утверждения леммы. Обозначим d = (ind^ a, cp(m)). Справедливы сравнения по модулю т ind6a = ^ф(т)^ s x (mod т) Так как а — первообразный корень по модулю га, это сравнение возможно лишь в случае d — 1. ■ Перейдем теперь к общему случаю. Пусть т > 1 — целое число и — разложение в произведение степеней различных простых чисел. Обозначим J 1 если a < 1; _ J 1 если a < 1; " | 2 если a > 2; ° " 1 2а~2 если а > 2, Согласно (7.12) при любом a > 0 выполняется ddodi • • • dr = cp(m). (7.15) Для каждого г, 1 < г < г, фиксируем некоторый первообразный корень gi по модулю р*1. Если a — целое число, взаимно простое с.модулем т, то и согласно теоремам 7.2 и 7.3 существуют целые числа Y)Yo> Yi, ..., Yd удовлетворяющие сравнениям (mod2a); glr (modp?). Из теоремы 7.3 и определения первообразного корня следует также, что набор чисел у,уо5Уъ •••5Yr будет определен единственным способом, если наложить дополнительные условия 0<Y<d, O<Yo<do, •••> 0<yr<dr. (7.17) 171
Определенная единственным способом совокупность чисел у, уо, Yij •- • ?Тг, удовлетворяющая условиям (7.16), (7.17), называется системой индексов числа а. Каждый элемент системы индексов будет индексом числа а по соответствующему модулю. Систему индексов числа а будем обозначать y(a),yo(a),yi(a), ...,yr(a). Числа, лежащие в одном классе вычетов по модулю га и взаимно простые с га, очевидно, имеют одинаковые системы индексов. И наоборот, для каждой системы индексов система сравнений (7.16) относительно неизвестного а имеет согласно китайской теореме об остатках (см. 5.3) единственное решение по модулю га. Это решение есть класс вычетов по модулю га, состоящий из чисел, взаимно простых с га. Заметим также, что равенства у (а) = у о (л) = • • • = у г (а) = 0 выполняются лишь для чисел, сравнимых с 1 по модулю га. Установленное взаимнооднозначное соответствие между элементами группы (Z/raZ)* и системами индексов согласуется с равенством (7.15). Лемма 7.4. Индексы произведения двух чисел сравнимы по модулям d,do, . ..,dr с суммами соответствующих индексов сомножителей, т. е. для любых двух чисел а, 6, взаимно простых с модулем га, выполняются сравнения d); yo(ab) = уо(а) + уо(Ь) (mod d0); ( , {(ЛЬ) уг(а6) = уг(а) + yr(b) ( mod dr). Иначе, сопоставление a(mod га) *-> (y(mod d),yo(mod do)? • • • >yr(mod dr)) является изоморфным отображением мультипликативной группы (Z/mZ)* на прямую сумму аддитивных групп Z/dZ ф Z/d0Z 0 ... 0 Z/drZ. Доказательство. Сравнения (7.18) по модулям <4, 1 < к < г, следуют из первого утверждения леммы 7.3. Для доказательства первых двух сравнений (7.18) находим, пользуясь первым сравнением (7.16), (_l)Y(ab)5Yo(ab) = ab = (_1jY(a 172
При а < 1 имеем d = do = 1, и нужные сравнения (7.18) очевидно выполняются. Если а = 2, то d = 2, d0 = 1 и сравнение (7.19) принимает вид (_1)т(оЬ) = («ijYCaJ+YW (mod 4), откуда следует у(аЬ) = у (а) + + у(6)(тосЫ). В случае a > 3, переходя в (7.19) к сравнению по модулю 4, находим (-1)y(<*) = (_i)Y(a)+Y(&) (mod 4) и, значит, у(аЬ) = = Y(a) + Y(b)(modd). Но тогда 5Y°(ab) = 5Y°(a)+Yo(6) (mod 2a), откуда, согласно второму утверждению теоремы 7.3, находим Yo(ab) = Yo(a) + Yo(^) (mod 2a~2). Это завершает доказательство леммы. ■ Определим с помощью китайской теоремы об остатках целые числа с-1, со сравнениями c_i = —I(mod2a); c_i = l(modp^fc), 1 < к < г, со = 5(mod 2a); со = l(modp^fc), 1 < к < г, и Cj для каждого j = 1, ..., г сравнениями Cj = gj(modp^); Cj = I(mod2a); Cj = l(modp^fc), 1 < fc < г, к ф j. Из этого определения следует, что для b=c_\ Cq° wc{ • • -c£r выполняется сравнение (_1)Y(a)5Yo(a)(mod2a); grrr{a)(modp?). Теперь из (7.16) следует, что разность b — а делится на каждый из модулей 2а, р^1, ... ,р£г. Таким образом, для каждого целого числа а, взаимно простого с модулем т, выполняется сравнение а = cl^clo{a)cll{a) • • - сУ^ ( mod m). (7.20) Из определения чисел с_ь О), . • •, Сг следует, что их показатели равны соответственно d,do, ... ,dr. Отсюда, поскольку системы индексов для чисел, не сравнимых по модулю т, различны, вы- Текает, что для каждого взаимно простого с т целого числа а существует единственный набор чисел fc_i,fco5 ...,fcr; удовлетворяющих условиям 173
а = с^с^с*1 • • • ckrr ( mod m), (7.21) 0 < fc_i < d, 0 < fc0 < do, • • •, 0 < /cr < dr, иначе, мультипликативная группа (Z/mZ)* есть прямое произведение своих циклических подгрупп, порожденных классами вычетов, содержащими числа c_i, со, ..., Ср. При этом набор показателей степени в (7.21) совпадает с системой индексов числа а. 7.6. Дискретное логарифмирование Согласно (7.14) и лемме 7.3 свойства индексов напоминают свойства обычных логарифмов от действительных чисел. Поэтому иногда в современной литературе индексы называют дискретными логарифмами, а процесс их нахождения — дискретным логарифмированием. Далее будет показано, каким образом задача вычисления indb(a) по модулю pn+l, при п > 1, т. е. вычисления единственного целого числа, удовлетворяющего условиям Ъх = а ( mod рп+х), О < х < рп(р - 1), (7.22) где р — нечетное простое число; b — фиксированный первообразный корень по модулю pn+1, (a,p) = 1, может быть достаточно быстро сведена к аналогичной задаче в случае п = 0. Пусть р — простое нечетное и п > 1 — целое число. По теореме Эйлера для каждого целого а, не делящегося на р, число аф(рП) — 1 делится на рп, и потому существует единственное целое число Q(a), такое, что аФп) _ 1 Q(a) = —— (mod pn) 0 < Q(a) < pn. (7.23) Определенная этими условиями функция Q(a) называется частным Ферма. Она обладает следующими свойствами. Лемма 7.5. 1. Для любых двух целых чисел а, 6, не делящихся па р, выполняется сравнение Q{ab) = Q(a) + Q(b) ( mod pn); (7.24) 2. Функция Q(a) имеет период pn+1, m. e. для любого целого а, не делящегося на р, выполняется равенство Q(a + pn+l) = () 174
3. Если b — первообразный корень по модулю pn+l, то Q(b) не делится на р. Доказательство. Из равенства (7.23) следует а^п) = 1 + Q(a)pn ( mod р2п). (7.25) Пользуясь этими сравнениями для a, b и ab, находим 1 + Q(ab)pn ее (аЬ)*(Рп) ее (1 + Q(a)pn)(l + Q(b)pn) (mod p2n). Раскрыв скобки в правой части, находим сравнение Q(ab)pn = Q(a)pn + Q(b)pn ( mod p2n). Разделив обе его части и модуль на рп, приходим к (7.24). С помощью формулы Ньютона для бинома находим сравнение по модулю р2п: (а + р» = а^^п) + а^")-1^ - 1)р2п = а^^п) ( mod p2n). С помощью (7.25) получаем 1 + Q(a + pn+l)pn = 1 + Q(a)pn ( mod p2n) и Q(a + pn+1) = Q(a) (mod pn). Оба целых числа Q(a),Q(a + + pn+1) лежат на промежутке 0 < х < рп и разность их по доказанному делится нарп. Значит, они равны. Второе утверждение леммы доказано. Пусть д\ — первообразный корень по модулю pn+1, построенный в теореме 7.2. Тогда Из равенства (7.5) при р = п - 1 следует Значит, vp(Q(gi)) = 0 и р \ Q(gi). Справедливо сравнение b = дг 9l (mod pn+1). С помощью Уже доказанных утверждений 1 и 2 леммы находим Q(P) = Q (д?91 Ь) = (indei b)Q(9l) (mod рЛ). 175
Из утверждения 2 леммы 7.3 следует, что mdgi b не делится на р. Теперь можно утверждать, что р \ Q(b). Лемма полностью доказана. К Поскольку Ъ есть первообразный корень по модулю pn+1, то, как указывалось ранее, Ъ будет первообразным корнем и по модулю р. Значит найдется единственное целое число хо, удовлетворяющее условиям а = bx° ( mod р), 0 < х0 < ср(р) = р - 1. Теорема 7.5. Для каждого целого а, не делящегося на р, системе сравнений = Q(a) (modpn); 1 х = хо ( mod p — 1) удовлетворяет единственное целое число, принадлежащее промежутку 0 < х < рп(р — 1), оно удовлетворяет также сравнению (7.22). Доказательство. Так как по лемме 7.5 коэффициент Q(b) не делится на р, то первое сравнение системы (7.26) имеет единственное решение х = х\ (mod pn). Значит, система (7.26) равносильна системе сравнений {х = х\ (mod pn); х = хо (mod p— 1), имеющей согласно китайской теореме об остатках единственное решение по модулю рп(р — 1). Итак, каждой из систем условий (7.22), (7.26) удовлетворяет единственное целое число. Докажем их совпадение. Пусть целое к удовлетворяет (7.22). Тогда Ък = a (mod pn+1), и согласно лемме 7.5 имеем Q{a) = Q(bk) = kQ(b) (mod pn), т. е. А: удовлетворяет первому из сравнений (7.26). Из (7.22) следует, что Ък = а = 6Ж° (mod p). Так как 6 — первообразный корень по модулю р, по следствию 7.5 из леммы 7.1 находим к = хо (mod р — 1), т. е. выполняется и второе сравнение системы (7.26). ■ Если известно число хо, то решение системы сравнений может быть найдено достаточно быстро с помощью алгоритмов, 176
изложенных в подразд. 5.2, 5.3. Числа Q(a),Q(b) легко вычисляются, как решения сравнений вида (7.25) с помощью тех же алгоритмов. Вычет аф(рП) (mod р2п) находится с помощью алгоритма, описанного в разд. 4.7. Обсудим теперь задачу дискретного логарифмирования по простому нечетному модулю. Приведем ее формулировку в этом случае. Дано простое число р. Для заданных чисел а, 6 £ Z требуется решить сравнение Ьх ее a (mod p). (7.27) Решение этой задачи очень трудоемко в вычислительном отношении. Не случайно в конце практически всех учебников по элементарной теории чисел приводятся таблицы индексов (дискретных логарифмов). Лучшие из известных алгоритмов дискретного логарифмирования, использующие вычисления в полях алгебраических чисел, требуют O(exp(c(lnp)1/3(lnlnp)2/3)) арифметических операций. Впрочем, эта оценка условна, поскольку опирается на ряд недоказанных, но весьма правдоподобных гипотез теории чисел. В конце 2006 г. А. Я. Дорофеев, Д. М. Дыгин и Д. В. Матюхин опубликовали в Интернете1 очередной рекорд дискретного логарифмирования. В качестве модуля было выбрано простое число, записываемое 135 десятичными знаками, р = [2446ti] + 63 384 = 570 857 799 147 913 943 142 073 298 159 453 290 747 376 295 550 451 905 113 865 375 911 86.5 918 588 022 945 237 020 702 500 203 437 615 419 679 961 659 928 369 778 961 422 486 479. Число 5 = 7 является первообразным корнем по этому модулю. Авторы вычислили indg 11 = 26 380 941 544 253 268 435 779 383 277 762 670 448 370 011 005 096 163 124 033 661 054 514 364 572 303 487 227 503 001 638 396 257 384 118 164 938 889 215 403 106 849 600 742 712. В случае обычных логарифмов в поле действительных чисел имеется специальное основание е = 2,71828..., позволяющее достаточно быстро вычислять логарифмы с произвольной точно- lCm.: http://www.nabble.com/Discrete-logarithm-in-GF(p— 135-digits- t2870677.html. 177
стью. Например, это можно сделать с помощью быстро сходящегося при | х |< 1 ряда 1 + х Л/ х3 х5 ч Логарифмы по произвольному основанию Ь могут быть вычислены с помощью тождества In a Подобное ему в дискретном случае доказано в лемме 7.3. Но в случае дискретных логарифмов нет основания, по которому логарифмы вычислялись бы столь же быстро, как натуральные в поле действительных чисел. Для решения задачи дискретного логарифмирования (7.27) можно вычислять последовательно степени 6fe(modp) при к = 1,2, ..., р — 1, пока не будет получено значение, сравнимое с а по модулю р. Число fc, соответствующее этому значению, и будет искомым индексом а. Такой способ вычисления индексов требует слишком большого количества арифметических операций. Следующий простой метод, предложенный А. О. Гельфондом (1962), так называемый метод согласования, позволяет находить индексы существенно быстрее1. Алгоритм 7.1, Пусть р — простое число, р > 3, а — первообразный корень по модулю р, b £ Z,p { b. Требуется решить сравнение (7.27). Шаг 1. Вычислить Н = [у/р] + 1. Шаг 2. Положить с = ан (mod p). Шаг 3. Составить два набора чисел S = {ck (mod p), 1 <к<Н} T={bae (mod p), 1 <£<#}. Имеется в виду, что множества 5 и Г содержат наименьшие неотрицательные вычеты соответствующих классов. Шаг 4- Упорядочить оба набора 5, Г по возрастанию и найти совпавшие элементы. Это даст числа fc, ^, для которых выполнено ск = bae (mod p). 1В зарубежной литературе этот метод называется методом больших и малых шагов. 178
Шаг 5. Положить х = Нк - £ (mod р - 1), 0 < х < р - 1. Найденное алгоритмом число х удовлетворяет сравнению (7.27). Действительно, по малой теореме Ферма выполняется аеах = анк = ск = Ъа£ (mod р). Разделив обе части этого сравнения на ае, поскольку р \ а, находим ах = b (mod р). Осталось доказать, что при любых числах а, 6, удовлетворяющих условиям алгоритма, множества S и Т имеют общий элемент. Пусть а; — целое число, удовлетворяющее сравнению (7.27) и неравенствам 0 < х < р — 1. Разделив х с остатком на Я, получим такие целые числа у, z, что х = Hy + z, 0<z<H. Тогда 0<у<-|:<-|:<#, ведь Я = [^/р] + 1 > у/р. Положим к = у + 1,£ = Н — z. Справедливы неравенства 1 < к < Я, 1 ^ ^ ^ Я. Поэтому числа s = ck (mod р), 0 < s < р и t e = fo/ (mod p), 0 < £ < р лежат в множествах 5 и Т соответственно. Кроме того, t = Ъае = ая^+£ = ая^+1) = ск = s ( mod p), так что s = t. Нетрудно проверить, что выполнение алгоритма уравнивания требует (y/plnp) арифметических операций и операций перестановки элементов при упорядочении множеств S и Т. Он существенно быстрее перебора множества всех возможных решений. Однако и этот алгоритм не позволяет находить индексы при больших р. Еще одним его недостатком является очень большая память, необходимая для хранения в компьютере множеств S и Г. Высокая сложность задачи дискретного логарифмирования лежит в основе некоторых ее криптографических применений. Приведем здесь только один пример, связанный с построением так называемого общего ключа для шифрования информации. Пример 7.4- Рассмотрим ситуацию, когда два корреспондента, например А и В, хотели бы обмениваться информацией через Интернет, причем так, чтобы эта информация оставалась недоступной для остальных лиц. Известны методы шифрования, зависящие от так называемого ключа. Тот, кто знает ключ, 179
может раскрыть зашифрованное сообщение, а тот, кому ключ неизвестен, если и сможет расшифровать сообщение, то за столь большое время, что раскрытая информация уже потеряет свое значение. Наши корреспонденты, не имея иной связи, кроме как через Интернет, хотят выработать общий ключ для шифрования информации. Будем представлять себе ключ, как некоторую последовательность цифр, т. е. целое число. Для решения подобных задач на практике иногда используется такой метод. Корреспонденты А и В, обмениваясь информацией через Интернет, вырабатывают некоторое большое простое число р и находят первообразный корень д по модулю р. После чего каждый из них: 1) выбирает на промежутке от 1 до р — 1 случайное число х(А) или х(В) соответственно и вычисляет у(А) = gxW ( mod р) или у(В) = gx^ ( mod р); 2) посылает через Интернет своему корреспонденту найденное число у (А) или у (В): 3) вычисляет (у(В))х^ (mod р) или (у(А))х(в) (mod p). Ясно, что при этом оба получат одно и то же число к = (у(В))ж(Л) = 9<Б)Х(А) = (y{A))*W (mod p), 0<к<р, которое и будет использоваться в качестве секретного общего ключа. Через Интернет будут переданы числа р,р, gx^ (mod p), дх(в) (mod p). Попытка определить по ним ключ к связана с необходимостью вычисления х(А) или я(В), т.е. решением задачи дискретного логарифмирования. Далее при сравнительно небольшом р это требует неприемлемо больших вычислительных затрат времени. Рассмотрим, например, простое число р — 1000 003. Справедливо разложение на простые множители р — 1 = 2 • 3 • 166 667. С помощью леммы 7.2 легко проверить, что 2 есть первообразный корень по модулю р. Действительно, 26 = 64(modp); 2500001 = -l(modp); 2333334 = 499 501(modp). 180
Выберем, например, х(А) = 394 792, х{В) = 851 982. Тогда у(А) = 774 919 = 2394792(modp); у(В) = 568 356 = 2851982(modp). Общий ключ, соответствующий указанному выбору чисел х(А) и х(В), равен 958 970 = 568 356394 792(modp); 958 970 = 774 919851982(modp). Итак, в рассматриваемом случае к = 958 970. Рассмотрим при том же простом р иной выбор чисел х(А) = = 829 267, х{В) = 723 759. Тогда у(А) = 58 188 = 2829267(modp); у(В) = 804 734 = 2723 759(modp) и общий ключ к вычисляется так: 3 = 804 734829 267 (mod р); 3 = 58 188723 759 (mod p). Значит, в этом случае к = 3. Такой «секретный» ключ, наверное, неприемлем и корреспонденты Аи В доллсны выбрать иные случайные числа. В последнем случае числа х(Л), х(В) подбирались специально. Подобная ситуация встречается крайне редко. 7.7. Двучленные сравнения В этом подразделе рассмотрим сравнения вида zn = a (mod m), (7.28) где т = ра или т = 2ра, р — простое нечетное и а — целое положительное число. Будем так лее предполагать, что а — целое, взаимно простое сш,ип — натуральное. Обозначим буквой д первообразный корень по модулю т, и Для калсдого целого числа Ь, взаимно простого с т, символом ind b будем обозначать индекс числа 6, вычисленный по модулю п при основании д. Следующая теорема дает два критерия разрешимости сравнения (7.28). 181
Теорема 7.6. В указанных условиях равносильны следующие три утверждения: 1) сравнение (7.28) разрешимо] 2) с d = (n,cp(ra)) выполняется сравнение =i (mod m); (7.29) 3) d|inda. В случае разрешимости сравнение (7.28) имеет в точности d решений. Доказательство. 1 => 2. Предположим, что сравнение (7.28) разрешимо и обозначим буквой с некоторое его решение. Тогда сп = a (mod m) и по теореме Эйлера Ф(т) пф(т) / ф/т\\3 , 1 \ a d =c d = (сф1тМ = 1 (mod m). 2 => 3. Если выполняется условие (7.29), то Но тогда целое число —— inda делится на cp(m). Следователь- (Л но, d\ inda, те. выполняется третье из утверждений. 3 => 1. Допустим, что а удовлетворяет условию d|inda. Рассмотрим сравнение пу = inda ( mod ф(т)) (7.30) относительно неизвестной у. Согласно теореме 5.1 сравнение (7.30) разрешимо и имеет в точности d решений. Обозначим наименьшие неотрицательные вычеты этих d классов вычетов по модулю ф(т) буквами у^ j = 1, ..., d. И определим также Xj как наименьшие неотрицательные вычеты в классах gyi (mod m), j = 1, ..., d. Тогда yj = indxj и Итак, сравнение (7.28) разрешимо и имеет не менее d решений. Это, в частности, завершает доказательство эквивалентности трех утверждений теоремы. Ранее было показано, как в случае разрешимости сравнения (7.28) найти d его решений. Покажем, что никаких других решений, кроме построенных, это сравнение не имеет. Если с — 182
целое число, удовлетворяющее сравнению (7.28), то gnmdc = ^ gmda (mod га). С помощью следствия 7.1 из леммы 7.1 заключаем, что nindc = inda (mod cp(m)). Но тогда индекс hide сравним по модулю ср(га) с одним из чисел у^ а число с сравнимо по модулю га с одним из Xj. Теорема доказана. ■ В частности, получаем следствие. Следствие 7.3. Если (n,cp(m)) = 1, то сравнение (7.28) при любом а, взаимно простом с модулем га, имеет единственное решение. Целое число а, взаимно простое с модулем га, называется п-степенным вычетом или вычетом степени п, если сравнение хп = а (mod pm) разрешимо. В противном случае число а называется п-степенным невычетом. При п = 2,3,4 применяется также терминология квадратичный, кубический, биквадратичный вычет или невычет. Из этого определения следует, что числа, сравнимые по модулю га, одновременно являются n-степенными вычетами или невычетами. С помощью введенного понятия первое утверждение теоремы 7.6 может быть переформулировано в виде критерия для отыскания степенных вычетов. Следствие 7.4. Целое число а, взаимно простое с модулем т, будет вычетом степени п > 2, если и только если выполняется сравнение (7.29). Следствие 7.5. Если d = (п, ср(га)), то вычеты степени п по модулю т совпадают с вычетами степени d no тому же модулю. Это утверждение выполняется в силу равенства (п, ф(га)) = = d = (d, ср(га)) и следствия 7.4. Следствие 7.6. Число классов п-степенных вычетов по модулю га равно . , где d = (п, ср(га)). a Доказательство. В силу теоремы 7.6 число а, взаимно простое с га, будет n-степенным вычетом в том и только том случае, когда d\ inda. Но среди чисел 0, ..., ср(га) — 1 — возможных зна- ф(га) чений индексов имеется в точности , делящихся на а. ■ а 183
Задачи для самостоятельного решения 1. Найдите наименьшие первообразные корни по модулям 7, 11, 41, 47. 2. Докажите, что первообразный корень по простому модулю р > 2 есть квадратичный невычет по модулю р. 3. Найдите первообразные корни по модулям 9, 27, 243, 162, 250, 343. 4. Пусть х иу — натуральные числа, 3х - 2у = 1. Докажите последовательно утверждения: а) число 2 есть первообразный корень по модулю 3х; б) 3х-1! у; в) х = 1, у = 1 или х = 1, у = 3. 5. Разложите в произведение циклических подгрупп следующие группы: (Z/15Z)*, (Z/24Z)*, (Z/120Z)*. 6. Докажите, что если р = 2П + 1 — простое число, то 3 есть его первообразный корень. 7. Докажите, что если р и q = Ар + 1 простые числа, то 2 есть первообразный корень по модулю д. 8. Определите число решений каждого из сравнений: а) хъ = б (mod 101); б) Зх12 = 7 (mod 41); в) Зх12 == 2 (mod 41); г) х15 = 1 £nod 61).
Глава 8 Цепные дроби В связи с различными обстоятельствами иногда приходится заменять действительные числа их приближенными значениями. Часто при этом хочется обеспечить необходимую точность, выбирая рациональное приближение по возможности с меньшим знаменателем. Вероятно, наиболее известный исторический пример такой замены связан с устройством календарей. В настоящее время считается, что Земля совершает полный оборот вокруг Солнца в среднем за 365,24219 суток. Простейшее приближение к продолжительности года 365,25 = = 365- было положено в основу юлианского календаря, создан- 4 ного александрийскими астрономами. Указом Юлия Цезаря в 46 г. до н. э. этот календарь был введен во всей Римской империи. Поскольку год должен содержать целое число суток, то в юлианском календаре на каждые три года продолжительностью в 365 дней приходился один високосный год продолжительностью 366 дней. Так обеспечивается средняя продолжительность года в 365- суток. 4 Юлианский год чуть длиннее истинной продолжительности обращения Земли вокруг Солнца. Небольшая ошибка (11 мин и 14 с за год) по прошествии 128 лет привела к ошибке в одни сутки и продолжала накапливаться. В 1582 г. в католических странах специальным распоряжением папы Григория XIII был введен новый календарь. В качестве приближения к истинной продолжительности года было выбрано число 365 = 365 + - - jrz = 365,2425, дающее ошибку в 185 = 365 + °Дни сутки примерно за 3 300 лет.
Ценой лучшего приближения стало усложнение календаря. Високосными стали считаться годы, номера которых делятся на 4, но не делятся на 100, а кроме того годы, номера которых делятся на 400. По григорианскому календарю годы с номерами 1700, 1800, 1900 високосными не являлись, в то время как 2000 год был високосным. В России григорианский календарь был введен в 1918 г. Персидский астроном, математик и поэт Омар Хайям пред- о ложил календарь, основанный на приближении 365— = = 365,242424.... Этот календарь, введенный в 1079 г. и действовавший в Иране до середины XIX в., содержал восемь високосных лет, повторявшихся с циклом в 33 года. На протяжении цикла между восемью последовательно идущими високосными годами располагались семь отрезков по три обыкновенных года в 365 дней и один отрезок в четыре обыкновенных года. Ошибка в одни сутки накапливалась в этом календаре примерно за 4 500 лет. Заметим, что календарные системы играют важную роль в организации религиозной жизни. Существенной компонентой лунно-солнечных календарей, какими в действительности являются и юлианский, и григорианский календари, является правильная организация не только последовательности солнечных лет в 365 и 366 дней, но и лунных месяцев. Так, христианская Пасха по постановлению Никейского Собора 325 г. должна праздноваться в первое воскресенье после первого полнолуния, следующего за днем весеннего равноденствия. При этом имеются в виду не астрономические полнолуние и равноденствие, а даты, вычисляемые по определенным канонизированным математическим правилам. Если учесть, что средняя продолжительность отрезка времени, за который Луна проходит все фазы от одного новолуния до другого, равна 29,530588 сут, а лунные месяцы поэтому должны содержать по 29 и 30 дней, получается весьма сложная проблема согласования последовательности годов с последовательностью месяцев, так чтобы обе последовательности достаточно точно следовали за движениями Солнца и Луны. В обыденной жизни лунная составляющая юлианского и григорианского календарей не принимается во внимание. Цепные дроби дают алгоритм, позволяющий находить в некотором смысле наилучшие приближения действительных чисел рациональными. 186
8.1. Теорема Дирихле о приближении действительных чисел рациональными Рациональные числа расположены на действительной оси всюду плотно, т. е. для любого действительного числа а в любой его е-окрестности найдется бесконечно много рациональных чисел. Иначе, при любом е > 0 неравенство < е (8.1) я имеет бесконечное количество решений в различных рациональ- р ных числах -. Задача усложняется, если интересоваться существованием решения с не очень большим знаменателем, ограничив его в зависимости от е. Например, ответ на вопрос: «Существует ли решение с условием q < e""1/2?» не очевиден. Дирихле доказал (1842) теорему, позволяющую устанавливать существование решений неравенства (8.1) с ограничением величины знаменателя. Теорема 8.1. Пусть аиТ — действительные числа, причем Г > 1. Тогда существуют целые числа p,q, удовлетворяющие неравенствам а~-<—, l<q< Доказательство. Как и ранее, будем обозначать [х] и {х} целую и дробную части числа х. Положим N — [Т] и разобьем отрезок [0; 1] на N + 1 отрезков лгТТ -х~ лГТТ' u = o,i, ...,лг, 1 длины iv 4-1 Рассмотрим N + 1 чисел {fca}, fc = 0,l, ...,ЛГ. (8.2) Если хотя бы одно из них попадает в крайний правый из малых отрезков, т. е. удовлетворяет неравенствам N . Г1 , . 187
то получим Очевидно выполняется к ф О, поэтому 1 < к < N < Т. Положив теперь q — k,p— [fca] + 1, получаем нужное утверждение. Если же крайний правый отрезок не содержит ни одной из точек (8.2), то все они распределяются между оставшимися N отрезками. Но множество (8.2) состоит из N + 1 чисел. Значит, по крайней мере один из построенных малых отрезков содержит не менее двух чисел, отвечающих различным значениям fc. Пусть числа {fci<x} и {fc2oc} принадлежат какому-то из малых отрезков. Не уменьшая общности, можно считать, что fci > fc2- Из неравенства |{fcia} — {fc2<x}| < ——- находим 1 — [fcia] — fc2<x - Положив q = fci — &2 > 0 и р = [feia] — [^a], получаем требуемые неравенства 1 < q = кг - к2 < N < Т, \q* -p| < j±-^ < i. ■ Следствие 8.1. Пусть a — иррациональное число. Тогда Р существует бесконечное множество несократимых дробей -, Я удовлетворяющих неравенству 1 Доказательство. Предположим, что множество решений неравенства (8.3) в несократимых дробях конечно. Обозначим все эти решения Pi P2 Рт /«.4\ Ч\ 0.2 Чт Так как a — иррациональное число, то 5 = mini{\qiOL — Pi\} > 0- Положим Т = 5"1. По теореме 8.1 существуют целые числа р, д» удовлетворяющие неравенствам \qa-p\<b, l<q<b~\ (8.5) 188
Если числа р, q имеют нетривиальный общий делитель, то разделив р, q на него, получим еще одну пару целых чисел, удовлетворяющих неравенствам (8.5). Поэтому можно считать, что Г) (Р) о) — 1» т-е- Дробь - несократима. Первое из неравенств (8.5) означает, что дробь | отлична от всех дробей (8.4). Кроме того из (8.5) находим \q*-p\<b< -, Q т. е. построенная несократимая дробь £ есть еще одно, отличное от дробей (8.4), решение неравенства (8.3). Получившееся противоречие завершает доказательство следствия. ■ Теорема Дирихле неэффективна, т. е. не дает способ строить хорошие рациональные приближения к числам. В следующих разделах будет рассмотрен алгоритм, позволяющий сравнительно легко находить такие приближения и имеющий вместе с тем важное теоретическое значение. 8.2. Конечные цепные дроби Пусть ao,ai,a2, ... — конечная или бесконечная последовательность целых чисел, причем щ > 1 при г > 1. Выражение вида а0 + " (8.6) + называется цепной, или непрерывной, дробью. Если последовательность a,i конечна, то цепная дробь равна некоторому рациональному числу. Если же последовательность бесконечна, то выражению (8.6) также можно придать вполне определенное числовое значение, которое в этом случае будет иррациональным. Для краткости записи вместо выражения (8.6) будет использоваться [ao; ai, а2, . • •] или [ао; а\, п2, .. -, ат] при конечной последовательности ао, ai, ..., ат. В этом разделе будут изучены некоторые свойства конечных цепных дробей. 189
Пусть а, 6 — целые числа, b > 0. Рассмотрим последовательность вычислений в алгоритме Евклида при нахождении наибольшего общего делителя (а, 6), см. (1.3): о» — bqi + ^2, 0 < Г2 < Ь; гз, О < г3 < г2; г4, 0 < г4 < гз, т-п-2 = rn_i^rn_i + rn, 0 < rn < rn_i; Гп-1 = 7*n9n- Разделив каждое из равенств (8.7) на соответствующий делитель, получим а ь q b T 0 To rz 1 1 Ыгз)' J ' (rz/uY = 9n-i + —• rn-i Qn Подставив левые части получившихся равенств в правые части предшествующих, найдем представление рационального числа - в виде конечной непрерывной дроби — = [9i5 92? 9з> • • • , 9п]« Та- о о ким образом, алгоритм Евклида позволяет находить представление рациональных чисел непрерывными дробями. Заметим, что это представление не единственно: г ! /[915 92,93, .-.,9n-M], если qn>\\ 915 92,93, -чЧп = < г , -, - [1915 92,93, .-.,9п-1 + 1], если qn = l. Для любого рационального числа существует представление конечной цепной дробью, при этом можно выбирать длину дроби по своему усмотрению так, чтобы она была четной или нечетной. В дальнейшем используется обозначение [жо;яъ --ч^п] Для конечной цепной дроби вида (8.6), где вместо целых чисел п{ стоят переменные х%. Конечные цепные дроби такого вида являются рациональными функциями от Х{. Следующее утверждение позволяет легко вычислять их. 190
Лемма 8.1- Пусть хо, х\, ... — переменные и последовательность многочленов Р/с(хо, ..., a;*), Qk{xo, • • •, я&)? к > — 1, опре- делена формулами [Qfc = ^Qfc-i + Qfc-2, Q-i = 0, Po = 1. Тогда при любом п > 0 выполняется равенство Г~ . ~ 1 n XnPn-i + rn-2 /Q 1П\ Fo;*i, ...,жп = — = —— — . (8.10) Уп ^пУп-1 + Wn-2 Доказательство. Воспользуемся индукцией по п. При п = 0,1 имеем NPq г 1 ,1 X\Xq + 1 Pi Qo xi xi Qi Предположим, что п > 1 и утверждение леммы выполняется для дробей длины п, т. е. [xo;xi, ...,жп] = Подставив в это тождество хп Н вместо жп, находим xn+i [хо5 X\j ..., жп, xn4-ij = [xoj Xi, ..., xn_i, xn H j Xn+1Pn + Pn-1 что завершает доказательство леммы. ■ Следствие 8.2. При всех п > 0 справедливы тождества QnPn-x - PnQn-i = (-l)n. Доказательство. Воспользуемся индукцией по п. При п = 0 имеем QoP-i - PoQ-i = 1 • 1 - хо • 0 = 1. Предположим, что п > 1 и для всех индексов меньших п нужное тождество справедливо. С помощью (8.9) находим = -{Qn-iPn-2 - Pn-iQn-г) = -ИГ"1 = (-l)n- ■ 191
Следствие 8.3. При любом п>1 справедливы тождества QnPn-2 - PnQn-2 = (-iT^Xn. Доказательство. Пользуясь (8.9) и следствием 8.2, находим QnPn-2 - PnQn-2 = = (XnQn-l + Qn-2)Pn-2 ~ {XnPn-1 + Pn-2)Qn-2 = = Xn(Qn-lPn-2 - Pn-lQn-2) = (-1)П-1ХП. Ш Пусть ao,ai,a2, ... — последовательность целых чисел, причем ai > 1 при г > 1. Тогда определены целые числа рп = Рп{ао> • • •, an); qn = Qn(a0, ..., an), n > 0, причем qn > 0. Будем также считать р-\ = l,g_i = 0. Согласно (8.9) имеем {Рк = O'kVk-l + Рк-2] Р-1 = 1; РО = «о; /g ^ч + Як-2', Ч-\ = 0; до = 1. В частности, из (8.11) находим q\ = а\ > 1 и при fc > 2 последовательно Таким образом, gn,n > 1, есть строго возрастающая последовательность натуральных чисел. Она стремится к бесконечности, если последовательность ai бесконечна. По следствию 8.2 выполняются равенства qnVn-i - Pnqn-i = (-1Г, n > 0. (8.12) Из них, в частности, следует, что рп и qn взаимно просты, а дробь — несократима. Точно так же доказываются равенства qn qnPn-2 ~ Pnqn-2 = {-l)n~lan, n > 1. (8.13) Согласно лемме 8.1 г 1 Рп [ao;ai, ...,anj = —. qn Ti Так определенные дроби — ,n > 0, называются подходящими qn дробями цепной дроби [ао;йь&2> ...]. Числа а^ называются неполными частными этой цепной дроби. Множество подходящих дробей конечной цепной дроби конечно. 192
тт а г 1 а Р™ Для рационального числа т = ао; аъ ..., аш имеем - = —. 6 о qm Равенство (8.12) позволяет решать диофантовы уравнения вида ах — by = 1 при взаимно простых а и b > 0. Если -г = —, 6 Qm причем т нечетно, то b = gm,a = pm и с s = qm-ъУ = Pm-i имеем ах-Ъу= pmqm-l - gmPm-l = (-1)771"1 = 1- Зная одно частное решение х = qm-ii У = Pm-i? можно найти все решения так, как это объясняется в теореме 1.5. Пример 8.1. Решить диофантово уравнение 19ж + 15у = 1. Рациональное число — имеет следующее разложение в цепную 19 5 дробь — = [1; 3,1,3]. В данном случае длина цепной дроби т = 3 нечетна. В соответствии с указанным правилом находим [1; 3,1] = - и 19 • 4 — 15 • 5 = 1. Значит, данное уравнение имеет решение х = 4, у = —5, а общее его решение можно представить в виде х = 4 + 15fc, у = — 5 — 19fc, к G Z. 8.3. Цепная дробь действительного числа В этом подразделе мы рассмотрим бесконечные цепные дроби. Каждой из них будет придано некоторое иррациональное значение и будет доказано, что так устанавливается взаимно-однозначное соответствие между бесконечными цепными дробями и иррациональными числами. Теорема 8.2. Пусть [ao; ai, а2,...] — конечная или бесконечная цепная дробь с целыми неполными частными, причем ап > 1 при п > 1. Тогда: 1) последовательность подходящих дробей с четными номерами возрастает, последовательность подходящих дробей с нечетными номерами убывает. При этом любая подходящая дробь нечетного порядка больше любой подходящей дроби четного порядка; 2) если цепная дробь бесконечна, то существует предел 7 Нестеренко 193
,. Рп ос = lim —, n-*°° qn причем а — иррациональное число] 3) справедливы неравенства а — Рп п> 0. (8.14) Доказательство. С помощью равенств (8.13) при п > 2 получаем Рп-2 _ Рп _ (-1)п~1ап ^п-2 <?п qnqn-2 Учитывая неравенства ап > 0, qk > 0, находим что эта разность отрицательна при четном п и положительна при нечетном п. Это доказывает первое утверждение теоремы. Пусть цепная дробь бесконечна. Из равенств (8.12) следует Р2._Р2^1=_11_< k>Q (815) q2k "■ <?2fc<72fc+l Таким образом определены отрезки —, . По доказанному их левые концы возрастают, а правые убывают. Значит, эти отрезки образуют вложенную последовательность. Согласно (8.15), длины отрезков стремятся к нулю. Поэтому существует единственное число а, принадлежащее всем этим отрезкам. Учитывая строгое возрастание левых концов и строгое убывание правых концов, заключаем, что Р2Н ... _Р2£+1 Л>0,*>0. (8.16) Отсюда следует, что при любом п > 0 дроби — и лежат на Qn Qn+i действительной оси по разные стороны от точки а. Поэтому 0< а — Рп Яп Рп+1 Яп+1 Рп Чп QnQn+l (8.17) Это доказывает третье утверждение теоремы. Допустим, что а — рациональное число. Тогда с некоторыми целыми a, b > 0 имеем а = -. Из (8.17) следует, что о а — Рп Чп \Щп - Ьрп\ bqn J_ bqn 194
Сравнив получившееся неравенство с (8.17), находим b > что невозможно при всех п, ведь последовательность qn стремится к бесконечности. Значит, а иррационально, и это завершает доказательство теоремы. ■ Число а, определенное в теореме 8.2, будем называть значением бесконечной цепной дроби [ао; ai, a2, ...] и записывать в виде Соответствующие подходящие дроби будем называть также подходящими дробями числа а. Эта терминология будет использоваться и для конечных цепных дробей. В частности, если a — рациональное число, то любая его подходящая дробь, отличная от а, удовлетворяет одному из неравенств (8.16). Теорема 8.3. Пусть [ao; ai, а2,...] — конечная или бесконечная цепная дробь с целыми элементами, причем для п > 1 выполняется неравенство ап > 1, а для конечной дроби ее последнее неполное частное больше 1. Тогда для любых двух соседних подходящих дробей к а имеем |<?n_i<x-pn_i| > \qn0L-pn\, п>0. (8.18) Кроме того: ап+г = Различные цепные дроби указанного вида имеют различные значения. Доказательство. Из равенств (8.11) следует - pn+i) = an+i(<7na - рп) + (Зп-ia - pn-i), n > 0. Отсюда, поскольку qu^-Pk = (—l)fe|%a — Pfc| при любом k > -1, находим \qn+i0L - Pn+i\ = -On+ikna-Pnl + kn-ia-Pn-il, n > 0, или |gn__!a-pn_i| = On+ilgna-Pnl + kn+ia-pn+il, n > 0. (8.20) В случае <fo+ia — Pn+i 7^ 0 неравенство (8.18), очевидно, выполняется. Если же qn+i0i — Pn+i = 0^ Т0 согласно условию an+i > 2, т&к что (8.18) выполняется и в этом случае. 195
\qj-2& — P7-2I Будем использовать обозначение аи = т-=* —г в случае, |ey_iot —pj_i| если эта величина определена. Из доказанного ранее следует, что QLjj > 1 при 7 > 1. Разделив (8.20) на отличное от нуля число \qna—pn\i получим = ап+1 + . (8.21) О+2 В случае <?п+1а ~~ Рп+г = 0 дробь в (8.21) отсутствует, так что в любом случае имеем an+i < Q-n+i < &n+i + 1 и «n+1= [an+i], ^ > 0. Это завершает доказательство (8.19) при п > 0. Из (8.18) для п = 0 и (8.16) для /с = 0 находим 1 > a — ao > 0, следовательно ao = [ao]. Допустим теперь, что существуют две различные цепные дроби, имеющие одно и то же значение a= [ao;ai,a2, -..] = [Ьо'ММ, •••]• Обозначим — и -у подходящие дроби этих цепных дробей соот- Яп Яп ветственно и |gn_ia - pa_i | 1^п-1а - Pn-11 По доказанному ранее справедливы равенства ao = [a], bo = [a], так что ao = Ьо- Пусть г — наименьшее целое число, для которого От ф Ьг. Из рекуррентных уравнений (8.11) следует, что qn = qfn, рп = pfn при — 1 < п < г. Согласно (8.22) при п = г имеем аг = рГ7 а из (8.19) теперь находим аг = [о^] = [рг] = br. Получившееся противоречие завершает доказательство теоремы 8.3. Ш Ранее было доказано, что каждое рациональное число может быть представлено в виде конечной цепной дроби. Покажем, что и для каждого иррационального числа существует равная ему бесконечная цепная дробь. Теорема 8.4. Пусть a — действительное иррациональное число. Положим ao = а и определим бесконечные последовательности целых ап и действительных ап чисел равенствами ап - Ы, <xn+i = " , п > 0. (8.23) a O 196
Тогда ап > 1 при n > L Если \ — \ ~~ последовательность кЯп) п>о подходящих дробей бесконечной цепной дроби [^o;«i,02, ...], то при всех к > 0 справедливы равенства „ U 1 *k+lPk+Pk-l /ft О/|ч а = [«о, ai, ..., a*, ocfc+1j = — , (8.24) к . (8.25) Як-1 Цепная дробь [ода*, а?,...] равна а. Числа otfc, последовательно вычисляемые с помощью равенств (8.23), называются остатками непрерывной дроби числа а. Доказательство. Поскольку а иррациональное число, то все числа an также иррациональны. Это следует из второго равенства (8.23), поскольку ап — целые числа. Учитывая, что 0 < осп — - ап < 1, заключаем согласно (8.23), что an+i > 1 при п > 0. Но тогда при п > 0 выполнены неравенства an+i > 1. Первое равенство (8.24) следует из равенств (8.23), если переписать их в виде an = ап -\ . А для доказательства второго равенства (8.24) достаточно подставить в тождество (8.10) при п = к + 1 следующие значения переменных: Xj = a^-,0 < j < fc, xk+i = otfc+i. Теперь равенство (8.25) следует из (8.24) и (8.12) непосредственным вычислением ЯкЫ+гРк +Рк-\) - Рк(<*к+1Як + gjb-i) - рк = = _ ЯкРк-1 - РкЯк-1 _ ~ Як-1 U-k+гЯк + Як-1 Из (8.25) находим — < -т Ц: т= ——. (8-26) 9fc Як(а>к+1Як + Як-1) ЯкЯк+1 Рк откуда следует, что последовательность подходящих дробей — Як сходится к а и, значит, a = [ao; ai, a2, ...]. ■ Заметим, что равенства (8.23) — (8.25) справедливы и для конечных цепных дробей в пределах тех индексов, для которых 197
существуют неполные частные и подходящие дроби. При этом ап = —— в формулах (8.8). гп+1 Помимо (8.26) из равенства (8.25) можно вывести и оценку снизу для приближения а подходящими дробями. Действительно, 1 1 - рк\ = • Як-i (ajfe+i + 1)як + Як-i 1 (8.27) Як+l + Як' откуда получаем следствие. Следствие 8.4. При любом к>0 выполняется неравенство 1 " Як(Як+\ + Як) Из теорем 8.2 — 8.4 следует критерий иррациональности числа. Следствие 8.5. Действительное число ос иррационально в том и только том случае, когда его цепная дробь бесконечна. Каждая подходящая дробь несократима и в силу неравенств (8.14) удовлетворяет (8.3), откуда вытекает еще одно доказательство следствия 8.1. Равенства (8.23) дают удобный алгоритм для вычисления непрерывной дроби числа. Знание непрерывной дроби позволяет с помощью равенств (8.11) легко вычислять соответствующие подходящие дроби, т.е. находить хорошие рациональные приближения к а. В дальнейшем будет показано, что эти приближения являются в некотором смысле наилучшими. Пример 8.2. Найти разложение в непрерывную дробь числа 1 + VT7 и первые пять соответствующих подходящих дробей. В соответствии с формулами (8.23) находим 1 + VU «о = 2 ' а° = 1а°1 = ' л/Г7 198
В формулах (8.23) каждое число an+i однозначно определяется по числу an. Поэтому совпадение 0С4 = ai означает, что будут выполнены равенства as = c*2, olq = аз и так далее, т. е. последовательность ап в данном случае будет периодической. Имеем = [2; 1,1,3,1,1,3,1,1,3, ...] = [2;ТГЦЗ]. Равенства (8.11) могут быть переписаны в матричном виде (Рп-1 Рп-2\ (ап\ = (рп\ \qn-i qn-2) \l) \Яп) ' Это позволяет организовать вычисление подходящих дробей, начиная с п = 1, следующим образом: )=(?)■■■■ В результате находим следующие приближения 2 3 5 18 23 41 146 1' Г 2' У' У' 16' "57"' Заметим, что l+fl- g = -^0,000947187... 8.4. Наилучшие приближения Наилучшие приближения к заданному числу а определяются как наилучшие среди приближений с заданным ограничением величины знаменателей. 199
Определение 8.1. Рациональная дробь - называется паи- Я. лучшим приближением к действительному числу а, если для а р любой другой дроби - Ф - с условием 1 < Ь < q выполняется неравенство \Ьа-а\ > \qa-pl иначе, если система неравенств имеет единственное решение в целых числах, а именно: Заметим, что наилучшее приближение всегда есть несократимая дробь. Ведь если р = иа, q = ub, и > 1, то \а — ab\ < \р — aq\ и О < Ъ < <?, т. е. система неравенств (8.28) имеет решением и пару чисел х = а, у = Ь. Следующая теорема описывает связь между наилучшими приближениями к иррациональным числам и подходящими дробями. Теорема 8.5. Всякое наилучшее приближение к числу а есть подходящая дробь к нему. Всякая подходящая дробь — ко. Чп при п > 1 есть наилучшее приближение к этому числу. Замечание 8.1. Подходящая дробь — = - к числу а = - не яв- qo 1 3 ляется наилучшим приближением к нему, так как система (8.28) имеет в этом случае лишнее решение х = 1, у = 1. Лемма 8.2. Пусть —, — соседние подходящие дроби к Qk числу а, причем —— ф а. Тогда система неравенств Qk+i (829) \0 < у < qk+i V ' имеет лишь два решения в целых числах, а именно 200
Доказательство. Пусть (я, у) — решение системы неравенств (8.29) в целых числах. Рассмотрим систему линейных уравнений х = ирк + vpk+i] + vqk+i относительно неизвестных u, v. Так как определитель этой системы равен qh+iPk — Pk+iQk = (—l)k+1, то ей удовлетворяют целые числа. Сохраним для них те же обозначения u, v. Поскольку у > О, то по крайней мере одно из чисел г/, v отлично от нуля. Рассмотрим несколько случаев: 1) предположим, что и = 0. Тогда 0 < у = vqk+i < Як+1- Значит, у = qk+i, v = 1, и х = pfc+i; 2) пусть v = 0. Тогда х = upki у = щк, и > 0, и \Рк - Щк\ >\х- ау\ = и\рк - cqfcl, что возможно лишь при и = 1. Но тогда х = Рк,У = qk\ 3) предположим, что uv ф 0. Если числа u, v имеют одинаковые знаки, то условие у > 0 означает, что и > 0, v > 0. Но тогда У > Цк + Чк+\-> что неверно. Итак, гш < 0. Имеем х-уа = и(рк - щк) + v(pk+i ~ афь+i). (8.30) Учитывая, что числа р^ — а^ и pfc+i — oufc+i также имеют разные знаки, заключаем, что знаки слагаемых в правой части равенства (8.30) одинаковы. Поэтому \х - уа\ = \и\\рк - что противоречит условию. ■ Р Докажем теперь теорему 8.5. Пусть — наилучшее приближение к числу а и к — наибольший индекс, для которого выполнено неравенство % ^ Я- Предположим, что \р-щ\ < \Рк~Щк\- Тогда определена дробь ——, причем q < %+i- Но это невоз- Як+1 можно в силу леммы 8.2. Значит выполняется неравенство 201
Учитывая теперь, что - есть наилучшее приближение к а, нахо- дим q = qk,p — рк, т. е. - есть одна из подходящих дробей к а. Я Докажем теперь, что при к > 0 каждая подходящая дробь к числу а является наилучшим приближением к нему. Як+1 Пусть целые числа я, у удовлетворяют неравенствам Согласно теореме 8.3 выполняются неравенства f |ж-ау| < \рк-Щк\ , [О < у < qk+1, что по лемме 8.2 возможно лишь в случае х = р^+ьу = Значит, дробь действительно является наилучшим прибли- Qk+1 жением к а. Это завершает доказательство теоремы. ■ Р Теорема 8.6. Если несократимая дробь -, q > 0, удовлетво- Q ряет неравенству а-Р- q то она есть наилучшее приближение к а и является одной из подходящих дробей к нему. Доказательство. Предположим, что целые числах = а, у = b удовлетворяют неравенствам (8.28), т. е. Г|а-с*| < \р-щ\ , \0<b<q. Тогда, пользуясь неравенством треугольника, находим \aq - bp\ = \q(a - ab) - b(p - aq)\ < < q\a — ab| + b\p — <xq\ < 2q\p — aq\ = 2q2 Следовательно, целое число aq — bp равно нулю. Согласно условию числа р, q взаимно просты. Поэтому из доказанного равенства aq = bp следует q\b. По условию 0 < b < q, так что b = q и а = р. Это доказывает, что - есть наилучшее приближение к а. q 202
Второе утверждение теоремы следует теперь из теоремы 8.5. ■ Покажем, что множество рациональных решений неравенства (8.31) бесконечно. Теорема 8.7. При к > 1 по крайней мере одна из двух соседних подходящих дробей —, -^- удовлетворяет неравенству Як Яя+1 (8.31). Доказательство. Предположим, что выполняются неравенства (8.32) Qk tffc+i Сложив их и пользуясь тем, что дроби —, —— лежат по разные Як Яя+\ стороны от а, находим Ч Як Pfc+i Як+1 Рк+1 Як Як+1 1 ЯкЯк+1 Откуда, выполнив простые преобразования, получаем (#&+1 - Як)2 £ 0, что невозможно, так как q^+i > Як- Это противоречие доказывает, что предположение (8.32) неверно и утверждение теоремы выполняется. ■ Последовательность подходящих дробей для иррационального числа бесконечна. Поэтому находим усиление следствия 8.1. Следствие 8.6. Пусть а — иррациональное число. Тогда существует бесконечное множество несократимых дробей -, удовлетворяющих неравенству 2q> 8.5. Эквивалентные числа На множестве действительных чисел можно ввести отношение эквивалентности. Два действительных числа а и |3 называются эквивалентными, если найдутся целые числа а, Ь, с, d, удовлетворяющие равенствам 0L = ad-bc = ±1. (8.33) 203
Это отношение будет обозначаться а. ~ р. Заметим, что каждое число а эквивалентно самому себе. В этом случае равенство (8.33) выполняется с а = d — lrb=c=0. Если а ~ р, то отношение выполняется и в противоположную сторону, т. е. р ~ а. Действительно, из (8.33) легко найти, что р са — а Наконец, если а ~ р и р - ~ у, то а: ~ У- Чтобы проверить это, возьмем два представления аР + Ь о PY + 9 , , ,- ... а = -£ ;, Р= ad-bc = =ЫУ ps - gr = ±1, cp + rf r ry + s r ^ H и подставим выражение для р в первую дробь. В результате получится равенство иу + v wy +1У в котором коэффициенты u,v,w,t определяются, как нетрудно проверить, матричным равенством (и v\ _ fa b\ fp q\ \w t) \c d) \r s)' Так как определитель произведения матриц равен произведению определителей, то ut — vw = ±1. Итак, а ~ у* Из этих трех свойств следует, что множество всех действительных чисел распадается на классы чисел, эквивалентных между собой. Если при разложении действительного числа а в непрерывную дробь получается равенство а = [ао; ai, ..., а&, а&+х], то (см. (8.24)) . OCfc+iPfc +Рк-\ а = ao;ai, ... ,ak,u.k+\\ = ; > о-к+хЧк + Як-i где рк, Як,Рк-1 з Чк-\ — числители и знаменатели подходящих дробей, удовлетворяющие согласно (8.12) равенству -i " PkQk-i = (-1)*, к > 0. (8.34) Но это значит, что a ~ a^+i при любом к > 0. Если, например, a — рациональное число, раскладывающееся в непрерывную дробь длины к +1, то a^+i — целое число. Но любые два целых числа, очевидно, эквивалентны. Это доказывает, что любые два рациональных числа эквивалентны. Более обще справедливо утверждение. 204
Теорема 8.8. Действительные числа а и (3 эквивалентны тогда и только тогда, когда их разложения в непрерывные дроби, начиная с некоторого места, совпадают. Доказательство. Предположим сначала, что разложения чисел а и$ совпадают с некоторого места. Тогда существуют такие индексы k, L, что причем otfc+i = рм-i- Из изложенного ранее имеем a = p^+i ~ р и, значит, a ~ р. Докажем теперь, что утверждение справедливо в противоположную сторону. Предположим, что a ~ р. Рассмотрим далее несколько частных случаев. При этом будем использовать запись а х р для обозначения того, что разложения в непрерывные дроби чисел ot и р, начиная с некоторого места, совпадают. 1. Если р = a+n, где п — некоторое целое число, то непрерывные дроби чисел аир совпадают уже начиная с первого места, т. е. а х р. 2. Пусть р = —а. Можно предполагать, что а не целое число, ведь этот случай уже разобран в п. 1. Имеем a = a0 + - , a0 G Z, a0 < a < ao + 1, у > 1, т. e. a = [ao;у]. Тогда —ao — 1 < —a < —ao и Y-1 1 —a = — ao — И = —ao — 1 + — Y-l При у > 2 имеем —a = [—ao — 1; 1, у — 1] и, учитывая, что, как доказано в п. 1, разложения у и у—1, начиная с некоторого места, совпадают, получаем a x р. При 1 < у < 2 имеем у = 1 + -,р>1, так что Р a = [a0; 1, р], -a = [-a0 - 1; 1 + р]. Учитывая, что разложения р и 1+р, начиная с некоторого места, совпадают, получаем а х — a = {3. 3. Пусть р = -: 205
а) при а > 1 имеем (3 = [0; а] и утверждение а х (3 выполняется; б) при 0 < а < 1 имеем а = (З"1, (3 > 1, т. е. а = [0; р] и утверждение ржа также выполняется; в) при а < 0 по доказанному ранее имеем 1 1 1 —а а "" а После рассмотрения трех частных случаев перейдем к общему ооН-Ь ad-bc = ±l, (8.35) и будем вести доказательство утверждения (3 х а индукцией по |с|. В случае |с| = 0 имеем р = ±а + 6 и утверждение следует из доказанного в п. 1 и 2. Предположим |с| = п > 1 и для всех чисел, у которых коэффициент при а в знаменателе представления (8.35) по абсолютной величине меньше п, утверждение выполняется. В случае \а\ < п находим bd ±l aa 6 и согласно индуктивному предположению имеем Р"1 х а, откуда по доказанному ранее р х р"1 х а. Утверждение выполняется. В случае \а\ > \с\ можно, не уменьшая общности, считать с > 0. Иначе можно сменить знаки у всех чисел а, Ь, с, d в представлении (8.35). Разделив коэффициент а на с с остатком, найдем а = cq + г, 0 < г < с. Тогда _ ra + b - qd Y = P — q ra + b — qd Учитывая, что c(b — qd) — dr = be — ad = ±1 и 0 < r < с < п, заключаем по индуктивному предположению и доказанному ранее axyxp-gxp. ■ 206
8.6. Квадратичные иррациональности и цепные дроби Рациональные числа являются простейшими из действительных чисел. Следующий по сложности подкласс действительных чисел составляют квадратичные иррациональности. Действительное число а называется квадратичной иррациональностью, если оно не рационально и есть корень квадратного трехчлена f(x) = ах2 + Ъх + с с целыми коэффициентами а, 6, с. Разделим коэффициенты на общий делитель и, если а < О, умножим трехчлен на —1. Так получится многочлен f{x) с целыми коэффициентами, удовлетворяющий условиям /(а) = 0, (а,6,с) = 1, а>0. (8.36) Существует только один такой многочлен. Число D(a) = Ъ2 — Aac называется дискриминантом а. Ясно, что D(a) > 0 и отлично от квадрата целого числа. В этом разделе будут рассмотрены свойства цепных дробей, в которые раскладываются квадратичные иррациональности. Пусть D целое положительное число, отличное от квадратов. Множество чисел вида х + уу/D с рациональными ж, у обозначается символом Q(y/D). Это множество замкнуто относительно операций сложения и вычитания, умножения и деления. Например, для умножения и деления имеем (х + yVD)(u + vVD) = (xu + yvD) + (xv + yu)y/D; (8.37) 1 x-yy/D x -y x2 — Dy2 x2 — Dy2 x2 — Dy1 (8.38) Значит, множество Q(\AD) является полем. Оно содержит множество рациональных чисел. Каждое иррациональное число из Q(y/D) есть квадратичная иррациональность. Для каждого числа a = х + y\fD e Q(v^D) с рациональными х, у будем использовать обозначение а' = х — у\ГЬ. Ясно, что для иррационального а число а' есть второй корень квадратного трехчлена /(ж), удовлетворяющего (8.36). Для рациональных чисел а имеем а7 = а. 207
Числа а и а' называются сопряженными. Для любых двух чисел а,р 6 Q(y/D) выполняются равенства В последнем случае предполагается, что р ф 0. Проверим эти равенства для умножения и деления. Для сложения и вычитания они проверяются аналогично. Если ос = х + + у\[Т), р = и + v\/D, x, у,щу G Q, то согласно формулам (8.37), (8.38) находим а'р' = (zu + yvD) - (xv + уи)\Л5 = (ар)'; 1 и v р7" 1г2-Лг;2 + и2 - Dv2 " \Р/ ' Цепная дробь [ао;&ьа23 ...] называется периодической, если последовательность ап, начиная с некоторого места, периодична, т. е. для некоторого целого к при всех достаточно больших п выполняется равенство ап+£ = ап. Дробь называется чисто периодической, если равенство ап+& = ап выполняется для всех п > 0. Периодические дроби будут обозначаться [ao;ai, ... ^а где afc+i, ...,a^4-fc ~ период. Соответственно чисто периодические дроби обозначаются Теорема 8.9 (теорема Эйлера—Лагранхса). Пусть a — действительное иррациональное число. Цепная дробь а периодична тогда и только тогда, когда a — квадратичная иррациональность. Замечание 8.2. Тот факт, что периодические цепные дроби есть разложения квадратичных иррациональностей, был доказан Л. Эйлером (1737). Обратное утверждение о периодичности цепной дроби для любой квадратичной иррациональности было установлено Ж. Л. Лаг- ранжем (1770). Начнем доказательство с первого утверждения. 208
Доказательство. Буквами pj, qj обозначим числители и знаменатели подходящих дробей цепной дроби числа а. Предположим сначала, что цепная дробь а чисто периодическая, т. е. а = [ao,ai, ...,а^_х]. Тогда a = [ao;ai, ... ,а*_1,а*]. Поскольку а& = [ао,аъ • • • ?afc-i] = <*? имеем а = [ао; ai, ..., зд_1, а] или а = Чк-2 Значит, a — корень многочленаqk-ix2+(qk-2—Pk-i)x—Pk-2- Цепная дробь числа а бесконечна, поэтому а иррационально. Итак, a — квадратичная иррациональность. В общем случае имеем a = [ao;ai, ... ,6^,^+1, ...,ал+*] = [ao;ai, ...,a^,y]5 где у = [ол+1»ал+21 • • • >aM-fcL как установлено ранее, — квадратичная иррациональность. Тогда Phi. = Qh-i' Значит, а есть корень многочлена второй степени и иррациональное число. Теорема в одну сторону доказана. Докажем теперь, что квадратичные иррациональности раскладываются в периодические цепные дроби. Введем для этого еще одно понятие. Пусть a — квадратичная иррациональность, /(х) = ах2 + + Ьх + с — многочлен с целыми коэффициентами, удовлетворяющий условиям (8.36). Второй корень этого многочлена, отличный от а, был обозначен ранее символом а'. Число а будем называть приведенным, если а>1, -1<а'<0. (8.39) Пример 8.3. Пусть D — целое положительное, не равное квадрату целого числа. Положим ao = [VD] и а = ао + \[Т). Тогда a — приведенная квадратичная иррациональность. Действительно, а' = ao — y/D и неравенства (8.39), очевидно, выполняются. Для завершения доказательства теоремы 8.9 понадобятся три вспомогательных утверждения. 8 Нестеренко 209
Лемма 8.3. Пусть а, (3 — действительные числа, связанные соотношением (3 = v Н—, где v — целое число. Если р — квадратичная иррациональность, то таким будет и число а, причем D(ol) — -D(P). Если р — приведенная квадратичная иррациональность и v — [р], то а — приведенная квадратичная иррациональность. Доказательство. Так как а = G Q(y/D($)) и а §£ Q, то а — квадратичная иррациональность. Если а — корень многочлена ах2 + Ьх + с с целыми коэффициентами, удовлетворяющими условиям (а, 6, с) = 1, а > 0, то число р есть корень многочлена с(х - v)2 + b(x — v)+a = ex2 + (b - 2cv)x + a-bv + cv2. Коэффициенты этого квадратного трехчлена взаимно просты в совокупности, поэтому D(p) = (& _ 2а;)2 - 4с(а - bv + cv2) = b2 - Aac = D(ol). Допустим теперь, что р — приведенная квадратичная иррациональность, т. е. р > 1, -1 < р' < 0. Так как v = [р], то 0 < |3-г> < 1 иа= > 1. Р — v Из равенства, связывающего числа аир, учитывая, что v = = Q3] > 1, находим Р'1 Отсюда следует 0 < —а' < 1 и -1 < а; < 0. Получившиеся неравенства означают приведенность а. ■ Из леммы 8.3 в частности следует, что остатки ап, получающиеся при разложении квадратичной иррациональности а в цепную дробь, являются квадратичными иррациональностями, их дискриминанты равны дискриминанту а, т. е. D(oLn) = D(cl), п> 1. Лемма 8.4. Если а — квадратичная иррациональность, то числа ап — остатки непрерывной дроби а, при всех достаточно больших номерах п будут приведенными. Доказательство. Из определения остатков непрерывной др°" би следует, что ап > 1 при любом п > 1. 210
Далее из равенства (8.25) следует -Рп= , У L> (8.40) Н- gn_i Яп Рп Учитывая, что ► а, и, значит, второе слагаемое в правой ча- Яп сти последнего равенства стремится к нулю, получаем, что при всех достаточно больших п выполняется неравенство осп'+1 < 0. Из (8.41) также следует () 1)0п = Яп ~ Яп-i + ———р^. Яп Поскольку qn — qn-\ > 1, заключаем, что при всех достаточно больших п выполняется anr+1 + 1 > 0. Доказанные неравенства означают, что для п, превосходящих некоторую границу, все числа an будут приведенными. ■ Лемма 8.5. Для каждого целого числа D > 0 существует лишь конечное число приведенных квадратичных иррациональ- ностей с дискриминантом D. Доказательство. Предположим, что a — приведенная квадратичная иррациональность дискриминанта D и f(x) = ах2 + + Ъх + с — многочлен, удовлетворяющий условиям (8.36). Тогда Ь2 - 4ac = D и с ф 0. Условие приведенности означает, что с = aaa7 < 0. Значит, Ь2 + 4а\с\ = D и |b| < y/D, 0 < а < I>/4, -D/4 < с < 0, т.е. при фиксированном D каждый из целых коэффициентов а, Ь, с может иметь лишь конечное число значений. ■ Завершение доказательства теоремы 8.9. Докажем, что каждая квадратичная иррациональность раскладывается в периодическую цепную дробь. Пусть a — квадратичная иррациональность. Обозначим D — ^ D(ol). Из лемм 8.3 и 8.4 следует, что найдется целое число по, такое, что при всех п > по числа an будут приведенными квадратичными иррациональностями дискриминанта D. Из леммы 8.5 211
следует, что среди них может быть лишь конечное число различных. Поэтому найдутся два индекса т > £ > по, такие, что &т = <*£. Каждый остаток непрерывной дроби однозначно определяется по предшествующему остатку. Поэтому ocm+i = <*£+i, am+2 = 0^+2 и т.д. Обозначив к = т — I > 0, получившиеся равенства можно записать в виде ап+& = ап при любом п > £. Требуемая периодичность непрерывной дроби доказана. ■ Определим теперь, разложение каких квадратичных ирраци- ональностей в цепную дробь будет чисто периодическим. Теорема 8.10. Пусть а — квадратичная иррациональность. Цепная дробь а будет чисто периодической в том и только том случае, когда а — приведенная иррациональность. Доказательство. Если цепная дробь а чисто периодическая, то с некоторым натуральным к при любом п > 0 выполняются равенства an+fe = an. В частности, a = ao = осг& при любом целом г > 0. Выбрав г достаточно большим, в соответствии с леммой 8.3 заключаем, что a — приведенная квадратичная иррациональность. Предположим теперь, что a — приведенная квадратичная иррациональность. По лемме 8.3 молено утверждать, что все числа осп, п > 0, приведены. Согласно теореме Эйлера—Лагранжа найдутся целые индексы к и £, такие, что при любом п > £ выполняется неравенство an+^ = an. Будем считать, что £ — наименьшее число с этом свойством. Допустим, что £ > 1. Из равенств + +(8.42) следует / ~~7 = ae-i - o^-i а 1/ Учитывая, что o^_i и o^+fc-i — приведенные иррациональности, получаем 0 < — а/_х < 1 и 0 < —а/+А._1 < 1, так что Из равенства ot£ = a^+fc следует a/ = a/+fc и a^_i = a^k-i- Возвращаясь к равенствам (8.42), получаем a^_i = a^+fc-i, что противоречит минимальности £. Следовательно, £ = 0. ■ 212
8.7. Использование цепных дробей для решения некоторых диофантовых уравнений Пусть d — натуральное число, не являющееся квадратом какого-либо целого числа. Диофантово уравнение х2 -dy2 = l (8.43) называется уравнением Пелля. Ясно, что если пара целых чисел #, у есть решение этого уравнения, то числа ±х, ±у ПРИ любом распределении знаков также будут составлять решение уравнения (8.43). Поэтому, оставив в стороне тривиальное решение х = ±1,у = 0, далее будем рассматривать решения с условием х > 0, у > 0. Если числа ж, у образуют решение уравнения (8.43), то х2 > > dy2 и х > \fd у. Но тогда \х - Vd у\ = j=r < = х + yd у 2vd у У X С помощью теоремы 8.6 заключаем теперь, что дробь — есть под- У ходящая дробь к числу Vd. Таким образом, задача нахождения решений уравнения Пелля в натуральных числах сводится к поиску тех из подходящих дробей для л/d, которые удовлетворяют этому уравнению. Разложения в цепные дроби чисел вида Vd обладают рядом особенностей. Лемма 8.6. Пусть а — приведенная квадратичная иррациональность. Тогда р = - также приведенная квадратичная иррациональность. Период цепной дроби р состоит из чисел периода а, записанных в обратном порядке. Доказательство. Утверждение, что р есть квадратичная иррациональность, очевидно, так как а ' есть корень того же многочлена второй степени, что и а. Приведенность р означает выполнение следующих неравенств: 213
Первое неравенство выполняется, поскольку — 1 < а ' < 0, а второе — в силу того, что а > 1. Пусть а = [ao,ai, ... ,ат] — чисто периодическая в силу теоремы 8.10 цепная дробь числа а. Тогда справедливы равенства <*fc = ак + , к = 0, ..., га, a0 = am+i = a. (8.44) Обозначим Pfc = — —А—, к = 0, ..., га + 1. Из (8.44) следует тп+1 — к или в других обозначениях 1 (8.45) Pm+l-fc Меняя сторонами члены равенства (8.45), находим pm_fc = ак + , 0 < к < га. \>т+\-к Введем новую переменную г = га — к для обозначения индексов. Тогда получившиеся равенства могут быть переписаны в виде pi = am-i + -—, 0 < г < га. (8.46) Рг+1 Согласно лемме 8.3 все числа аш+1_& приведены. Как доказано ранее, отсюда следует приведенность чисел р& и, значит, неравенства Pfc > 1. Теперь из (8.46) получаем [Pi] = am-i, 0 < г < га. Из определения чисел В^ следует, что Bm+i — 7 = ао = -t— = Ро- Поэтому р = [аш, ... ,ао] и это завершает до- аш+1 казательство леммы. ■ Лемма 8.7. Если d — натуральное число, не являющееся квадратом никакого целого числа, то yd = [ao;&i, .. •,a>ki2floL где ao = [Vd], причем упорядоченный набор чисел а\, ..., ak симметричен, т. е. а\ = ak, a<i — ak-\ и т. д. 214
Доказательство. Число у = ao + Vd приведено. Действительно, оно, очевидно, удовлетворяет неравенству у > 1, а кроме того для у' = ао — \fd в силу uq = [\fd\ выполняется — 1 < у' < 0. Согласно теореме 8.10 можно утверждать, что у имеет чисто периодическую цепную дробь. Учитывая, что [у] = 2ао, находим Ч,...,ак] (8.47) и yd — [ао; ai, ..., а^, 2ао] с некоторыми целыми сц, ..., а&. Отсюда в силу равенства у + Y — 2ао и, следовательно, Y = 2а0 + получаем разложение Согласно лемме 8.6 отсюда следует у = [2ао, а&, ..., ai]. Сравнив эту цепную дробь с (8.47), получаем утверждение о симметрии. ■ Лемма 8.8. Пусть d — натуральное число, не являющееся квадратом никакого целого и ап — последовательность остатков цепной дроби \/d, определенная равенствами (8.23). Для каждого п > 0 выполняется равенство где Ап,Вп — целые числа. При п > 0 справедливы равенства d — А2 Ап+1 = апВп-Ап, Бп+1 = —2±i, Ао = 0, Во = 1. (8.49) Доказательство. Докажем равенство (8.48) индукцией по п. Для п — 0 утверждение выполняется с Ао = 0 и Во = 1. Пусть теперь п > 0 и утверждение верно для числа an. Из равенств ai = —р= и a/ = —т= следует сц > 1, —1 < ai < yd — ао \d + ао < 0, так что ai — приведенное число. Согласно лемме 8.3 можно утверждать, что an+i — приведенное число. Обозначим ax2 + bx + c, a,b,ceZ, (a,6,с) = 1, а > 0, 215
многочлен, корнем которого является an+i. Из условий приведенности следует, что an+i > a^+1. Поэтому Та' a"+1 Та' где jD(an+i) = b2 — 4ac — дискриминант an+i. Все числа a^ при j > 0 имеют равные дискриминанты, поэтому б2 — 4ac = D(oi) = = 4d. Отсюда следует, что Ь четно и с целыми числами An+i = = — 6/2, Дп+1 = a > 0 справедливо представление an+i = Б • (8.50) #1 2А Число oin+i приведено, поэтому ——— = an_}_i + a^, l > 0 и, Д+1 значит, Дп+i > 0. Равенство an = an H можно переписать в виде an+i(an — — an) = 1. Подставив сюда представления (8.48), (8.50) и умножив получившееся равенство на BnBn+i, легко находим Vd)(An - anBn + Vd) = 5nBn+i. (8.51) Раскрыв скобки в левой части получившегося равенства и приравняв нулю коэффициент при \/d, получим Ап — апВп + Ап+\ = = 0, так что Аг+1 = О"аВп - Ап. Теперь из (8.51) следует d — Ап+1 = ВпВп+\ и И - Л2 (8.52) Лемма полностью доказана. ■ Лемма 8.9. Если в условиях предыдущей леммы — — под- ходящая дробь к \fd, то pl-dql = {-l)n+lBn+l, n>-\. (8.53) Доказательство. Из (8.24) при a = \fd ик = п находим 0Ln+i(qny/d - рп) = рп-1 - qn-iVd. (8.54) 216
Умножив обе части равенства (8.54) на qn\fd + pn, получим Если подставить в это равенство выражение для otn+i из (8.50) и, воспользовавшись иррациональностью л/d, сравнить коэффициенты при \fd, то будем иметь ^Б = Piq q Последнее равенство выполняется в силу (8.12). ■ Следующая теорема описывает множество всех решений уравнения Пелля (8.43). Теорема 8.11. Пусть d — натуральное число, не равное квадрату целого, и — разложение в цепную дробь с наименьшим периодом. Множество решений уравнения Пелля в натуральных числах состоит из пар (pmqn) числителей и знаменателей подходящих дробей к y/d с условием, чтоп + 1 четно и делится нак + 1. Определим целые положительные числа х\,у\ равенствами если к нечетно, если к четно. Все решения уравнения Пелля (8.43) в натуральных числах образуют последовательность (хт, ут) и получаются по формуле Xm + yrny/d=(x1+y1Vd)m1 m = l,2, ... . (8.55) Замечание 8.3. Тривиальное решение х = 1,у = 0 уравнения (8.43) получается по формуле (8.55) при т = 0. Доказательство. Как отмечалось в начале подраздела, все решения (я, у) уравнения Пелля в натуральных числах содержатся среди числителей и знаменателей подходящих дробей к Vd. Согласно формуле (8.53) пара чисел (рп, qn) будет решением уравнения Пелля лишь в случае, когда выполняются два условия: 1) п нечетно; 2) Вп+1 = 1. 217
Равенство Вп+\ = 1 выполняется в том и только том случае, когда otn+i = An+i + yfd. Так как при этом ocn+i приведено, то — 1 < An+i — Vd < 0, и, значит, Ап+\ = [Vd\ = ао. Следовательно, равенство Bn+i = 1 имеет место в том и только том случае, когда an+i = ао + \[d = [2ао, ах, ..., а&], т. е. с некоторым целым т > 1 выполняется п + 1 = ra(fc + 1). Итак, все решения уравнения Пелля в натуральных числах совпадают с парами чисел (pn, gn), номера которых нечетны и удовлетворяют условию п + 1 = = т(к + 1). Это доказывает первое утверждение теоремы. Чтобы найти формулы для решений, докажем сначала индукцией по п справедливость равенств / 1ЛП+1 ccia2 •.. an+i = -Ь—I—-, п > 0. (8.56) Рп - qnvd При п = 0 формула (8.56) следует из равенства \fd = ао Н . Предположим, что п > 1 и aia2 • • • an = ^—1 Т (8.57) Pn-i -gn-iva Из (8.54) следует Pn-i - Qn-i\/d 7=— , п > 0. Теперь для того чтобы получить (8.56), достаточно перемножить два последних равенства. В случае п + 1 = т(к + 1), пользуясь тем, что цепная дробь л/d имеет период длиной к + 1, т. е. a£+fc+i = a^, находим Сравнив это равенство с (8.56) при п + 1 = т(к + 1), получим Рп - qnVd = (pjb - qk\fd)m и, переходя к сопряженным числам, — Рп + qn^Td = (рк + qkVd)m. (8.58) 218
Если к нечетно, то при любом натуральном т число п + 1 = = т{к + 1) будет четным. Следовательно, при любом натуральном т пара целых чисел (р7г, qn), определенная равенством (8.58), будет решением уравнения Пелля. Это доказывает второе утверждение теоремы при нечетном к. Если же к четно, то п + 1 = т{к + 1) будет нечетным лишь в случае, когда т = 2г — четно. Тогда из (8.58) находим Рп + QnVd = (рк + qkVd)2r = (xi + yiVd)r. Ш Следствие 8.7. Решения уравнения Пелля могут быть найдены с помощью рекуррентных соотношений Ут+1 = УгХт + справедливых при т > 0. Для доказательства этих формул достаточно заметить, что из (8.55) следует равенство Хт+1 + Ут+l^d = (хт + и воспользовавшись иррациональностью \/d, сравнить соответствующие коэффициенты в левой и правой частях. Пример 8.4* Найти все решения в натуральных числах уравнения х2 - 29у2 = 1. Следующие вычисления раскладывают а = \/29 в непрерывную дробь: а0 = л/29 , а0 = [а0] = 5, 1 1 \/29 + 5 1 ai-2 1 4 5 5 л/29 + 3 J+2 5 \/29 + 3 219
\/29-5 Таким образом, \/29 = [5; 2,1,1,2,10]. В данном случае к = 4 и последовательность подходящих дробей такова: ро_5 11 16 27 Р4_70 9d"l' Т' У' Т' 44~13'"' Поскольку fc четно, находим в соответствии с теоремой 8.11 xi + У1Л/29 = (70 + 13\/29)2 = 9 801 + 1 820\/29. Значит, наименьшее решение данного уравнения в натуральных числах имеет вид х\ = 9801, yi = 1820. Последовательность всех решений может быть вычислена по формулам = 9 801хт + 52 780ут; Например, второе и третье решения имеют вид (192 119 201,35 675 640), (3 765 920 568 201,699 313 893 460). Из доказательства теоремы 8.11 следует, что уравнение х2 — — dy2 = — 1 разрешимо в целых числах лишь в случае, если длина наименьшего периода цепной дроби \[d нечетна. Известны немногие случаи, когда можно утверждать, что это уравнение разрешимо, не раскладывая \[d в цепную дробь. Лемма 8.10. Если р — простое число вида 4п + 1, то уравнение х2 -ру2 = -1 разрешимо в целых числах, и, значит, наименьший период разложения у/р в цепную дробь имеет нечетную длину. Доказательство. Пусть (u, v) — наименьшее решение уравнения х2—ру2 = 1 в натуральных числах. Оно существует согласно теореме 8.11. Тогда и2 — v2 = 1 (mod 4), и, значит, и — нечетно, _ и + 1 тх — 1 Л и + 1 и — 1 a v — четно. Поскольку — — = 1, числа —-— и —-— взаимно просты. Теперь из равенства и — 1 и + 1 ~~2 2~~~ 220
заключаем, что с некоторыми натуральными числами s,£ и г = = ±1 выполняются равенства Из этих равенств следует t2 - ps2 = e. Учитывая условие минимальности при выборе решения (it, v) и неравенство 1 < 5 < г?, заключаем г = —1 и, значит, и2 — — pv2 = — 1. Из разрешимости уравнения я2 — ру2 = — 1 в целых числах следует, что наименьший период разложения yjp в цепную дробь имеет нечетную длину. ■ Следующее утверждение было доказано ранее (см. лемму 6.4). Здесь покажем, как с помощью непрерывных дробей можно находить решения соответствующего диофантова уравнения. Теорема 8.12. Еслир — простое число вида 4п + 1, то уравнение х2 + у2=р разрешимо в целых числах. Доказательство. Из леммы 8.10 следует, что длина наименьшего периода цепной дроби yjp нечетна. Вместе с утверждением леммы 8.7 это позволяет записать yjp— [ao;ai, ...,ar,ar, Тогда = [ar, ...,ai,2ao,ai, ...,ar ] и по лемме 8.6 заключаем ar+i = —. Значит, ar_j_iar/, x = —1. ar+l A2 —p Пользуясь теперь представлением (8.48), находим \_2 = — 1 и, следовательно, А2+г + В2+1 —р. Ш Замечание 8.4- Приведенное доказательство дает и способ вычис- 2 -f \/29 ления решения. Так при р = 29 имеем г — 2 и аз = . Пара чисел 5 (2,5) составляет решение уравнения х2 + у2 = 29. Второе доказательство теоремы 8.12. Так как р при делении на 4 дает в остатке 1, то по теореме 6.1 найдется целое число а, удовлетворяющее условиям 221
а2 + 1 = 0 ( mod р), 0 < а < р. Разложим рациональное число - в цепную дробь, и пусть Р Чк подходящая дробь к - с наибольшим номером, удовлетворяю- Р щим неравенству qk < у/р- Тогда yjp < qk+i- Из неравенства (8.26) следует, что Р Як ЧкЧк+\ Умножив обе части последнего неравенства на произведение знаменателей левой части, получим \<Щк~РРк\ Тогда 2 Кроме того имеем aqk — ррк = Щк (mod p) и (aqk - ррк)2 + ql = ч1{^2 + 1) = 0 (mod p). На интервале 0 < х < 2р есть только одно целое число, делящееся на р, а именно само р. Поэтому (aqk — ррк)2 + ?| = Pi T-е- уравнению теоремы 8.12 удовлетворяют числа х = aqk — ррк и У = Як- ■ Например, для решения уравнения х2 + у2 = 29 заметим, что сравнению х2 + 1 = 0 (mod 29) удовлетворяет число х = 12. 12 Справедливо разложение в цепную дробь — = [0; 2,2,2,2]. Чис- 29 Vi 2 литель и знаменатель подходящей дроби — = [0; 2,2] = - удо- 42 5 влетворяют данному уравнению. Нетрудно доказать, что уравнение из теоремы 8.12 с точностью до перестановки переменных имеет единственное решение. 8.8. Разложение числа е в цепную дробь Классическая постоянная е определяется в курсах математического анализа пределом 1\п п) ton [1 + - ] = 2,718281828459045235360287471352662497757... п—кэо 222
Далее будет доказано, что эта десятичная дробь бесконечна и не имеет периода. Букву е для обозначения указанного предела впервые стал использовать Л.Эйлер, который доказал (1737) следующее утверждение. Теорема 8.13. Разложение числа е в цепную дробь имеет вид е= [2; 1,2,1,1,4,1,1,6,1,1,8,1,1,10,1, ...]. В отличие от десятичного разложения цепная дробь е устроена регулярно: пары единиц перемежаются последовательно идущими четными числами. Можно представить себе ее неполные частные а* при г > 1, иначе, заметив, что их последовательность распадается на отрезки, состоящие из трех чисел и имеющие вид 1,2т, 1, где т = 1,2,3, ... Поэтому цепную дробь для е часто записывают в виде [2; 1,2m, l]m>i. Так как цепная дробь числа е бесконечна, из второго утверждения теоремы 8.2 вытекает следствие. Следствие 8.8. Число е иррационально. Для доказательства теоремы 8.13 рассмотрим бесконечную последовательность действительных чисел /_i, /о, Д, /2, •.., определенную с помощью интегралов 1 hn-2 = -. (еххп(1 - x)ndx , п > 1, п! J О 1 n>0, о 1 hn = —t fexxn(l - x)n+ldx , n > 0. n\ J 0 Эти числа связаны между собой рекуррентными соотношениями. Лемма 8.11. Все числа I^k > —1, неотрицательны и образуют убывающую последовательность. Справедливы равенства hn-2 = hn-\ + hn, n>\, hn-i = hn + hn+i, n > 0, hn = (2n + 2)/3n+i + /3n+2, n > 0. 223
Доказательство. Докажем сначала равенства, связывающие числа Ik- Имеем 1 hn-2 - /зп-i = -} f exxn(l - х)п(1 - x)dx = J3n, п. j о 1 1 = 1 Je*(z - х2Пх - (1 - х)) = /зп-i - /зп. о Второе равенство получено интегрированием по частям. Для доказательства третьего соотношения воспользуемся тем же приемом 1 = т^т f еххп(1 - х)п+\1 - 2x)dx = 1Ъп - (2n + 2)/3n+i. 0 Доказанные равенства могут быть записаны единообразно в виде fc>0, (8.59) где {1 если к = Зп — 1; 1 если к = Зп; (8.60) 2п + 2 если А: = Зп + 1. Утверждение леммы о положительности чисел Ik следует из того, что все подинтегральные функции непрерывны на отрезке [0; 1] и положительны на интервале (0; 1). Теперь с помощью равенств (8.59) и (8.60) получаем Ik-\ > h, к > 0. ■ Введем обозначения ак = ^, к > 0. 224
Из леммы 8.11 следует, что а& > 1, а из равенства (8.59) находим *к = Ьк + , к>0. Но тогда bk = [а*], и согласно теореме 8.4 получаем разложение в цепную дробь ос0 = [60; Ъ\, 62, ...] = [1; 2,1,1,4,1,1,6,1, ...]. Поскольку 1 1 /_i = (exxdx = 1, /0 = Геж(1 - x)dx = е - 2, о 1 ^ о 1 находим осо = -. Отсюда также следует, что е = 2 Н и, е — 2 осо значит, е = [2; Ьо, h,...] = [2; 1,2,1,1,4,1,1, б, 1, ...]. Задачи для самостоятельного решения 1. Разложите в непрерывную дробь числа: 147 129 1135 1024 13 ' 111' 129 ' 713 ' 2. Разложите в непрерывную дробь числа: а) \/5; б) \/17; в) \/Тд; г) . Выпишите подходящие дроби к каждому из этих чисел до тех пор, пока не будет найдено рациональное приближение с точностью до КГ4. _ 3. Вычислите: [1;1], [2;2,4], [1;273], [1;2ДТ]. 4. Найдите с помощью непрерывных дробей частное решение дио- фантова уравнения: а) 101х - 13у = 2; б) 79х - 19г/ = 5. 5. Решите в целых числах уравнения: а) х2 - 10у2 = 1; б) х2 - 7у2 = 1; в) х2 - 17у2 = -1; г) х2 + у2 = 89. 6. Вычислите число е с точностью до 10~8 с помощью непрерывной дроби этого числа.
Глава 9 Алгебраические и трансцендентные числа В множестве комплексных чисел можно выделить подмножества, удобные в том или ином отношении. Например, для решения диофантовых уравнений иногда привлекаются числа, лежащие в более широких множествах, чем множество рациональных чисел. Так, в главе 8 оказалось удобным описывать множество всех решений уравнения Пелля, используя квадратичные иррациональности, т. е. корни квадратных уравнений с рациональными коэффициентами. Попытки доказательства теоремы Ферма о решениях в натуральных числах уравнения хп + уп = zn, n > 2, привели к созданию теории, описывающей свойства чисел, зависящих от корней степени п из единицы, а в конечном счете к теории алгебраических чисел. 9.1. Поле алгебраических чисел В этом разделе будут установлены простейшие свойства алгебраических чисел. Определение 9.1.1. Комплексное число а называется алгебраическим, если найдется отличный от нуля многочлен f{x) G Е Q[x], для которого /(а) = 0. 2. Среди всех таких многочленов выберем многочлен наименьшей степени и со старшим коэффициентом 1. Этот многочлен называется минимальным многочленом а. Его степень называется степенью а и будет обозначаться degoc. Пример 9.1. Любое рациональное число а является алгебраическим, как корень многочлена f(x) = x — a Е Q[x]. Указанный многочлен, очевидно, является минимальным многочленом числа а, и потому dega = 1. 226
Пример 9.2. Любая квадратичная иррациональность а есть корень некоторого многочлена с целыми коэффициентами ах2 + + Ьх + с. Так как а иррационально, то этот многочлен имеет минимальную степень среди всех, лежащих в кольце Q[x] и обращающихся в нуль при подстановке а вместо х. Поэтому f(x) = х2 + Ь с Н—х Н— G Q[x] — минимальный многочлен а и dega = 2. Так а а г, \fl — алгебраические числа степени 2. Укажем некоторые свойства минимального многочлена. Лемма 9.1. 1. Минимальный многочлен любого алгебраического числа неприводим. 2. Если f(x) — минимальный многочлен числа а, которое также является корнем многочлена g(x) G Q[x], то многочлен д(х) делится на f(x). 3. Неприводимый многочлен со старшим коэффициентом 1 служит минимальным многочленом для каждого из своих корней. 4- Все корни минимального многочлена различны. Доказательство. Пусть а — алгебраическое число, и его минимальный многочлен f(x) G Q[x] приводим, т.е. может быть разложен на множители меньшей степени в кольце Q[x]. Например, f(x) = g(x)h(x), где g(x),h(x) G Q[x] и degg(x) < deg/(x), degh(x) < degf(x). Из равенства 0 = /(cO = «/(a)fc(a) следует, что либо g(a) = 0, либо h(a) = 0. В любом случае получаем противоречие, ведь f(x) имеет минимальную степень среди всех ненулевых многочленов кольца Q[x], обращающихся в нуль в точке а. Для доказательства второго утверждения разделим многочлен д{х) на f(x) с остатком д(х) = f(x)q(x) + ф), degr(x) < deg/(a;). Справедливы равенства 0 = д(а) = /(a)g(a) + r(a) = r(a). Поскольку r(x) €Q[x], из определения минимального многочлена, равенства г (а) = 0 и неравенства degr(a;) < deg/(x) следует г(х) = 0, т. е. многочлен д(х) делится на f(x) без остатка. 227
Пусть д[х) = хп + ап-\хп 1 + ... + ао — неприводимый многочлен из кольца Q[x] и р — его корень. Обозначим минимальный многочлен числа р через f(x). Согласно второму утверждению леммы имеем f(x)\g(x). По условию многочлен д(х) неприводим, значит, д(х) = с/(ж), где с — некоторая константа. Старшие коэффициенты многочленов /(х), д(х) равны единице, поэтому д(х) = f(x) и д(х) есть минимальный многочлен р. Третье утверждение леммы доказано. Пусть f(x) — минимальный многочлен алгебраического числа а и р — кратный корень fix). По первому утверждению леммы многочлен /(ж) неприводим и тогда по третьему утверждению он есть минимальный многочлен р. Так как р — кратный корень многочлена /(ж), то производная f'(x) G Q[x] также имеет (3 своим корнем, что невозможно, так как deg / (х) < deg f(x). Итак, многочлен f(x) не имеет кратных корней. ■ Определение 9.2. Если а — алгебраическое число степени п, то корни ai, ..., осп его минимального многочлена называются числами, сопряженными с а. Докажем, что множество всех алгебраических чисел замкнуто относительно арифметических операций. Теорема 9.1. Если а и р — алгебраические числа, то числа а + р, р — а, ар, а в случае, если а ф 0, то и р/а являются алгебраическими числами. Из этой теоремы следует, что множество всех алгебраических чисел есть поле. Коммутативность и ассоциативность операций сложения и умножения, а также дистрибутивность умножения выполняются, поскольку они имеют место в поле комплексных чисел. Числа 0 и 1 являются алгебраическими. Напомним некоторые факты, обычно доказываемые в университетских курсах алгебры и необходимые для доказательства теоремы 9.1. Пусть А — некоторое кольцо и ti, ..., tn — переменные. Многочлен F(ti, ..., tn) G A[*i, ..., tn] называется симметрическим, если он не меняется при любой перестановке переменных. Чтобы привести примеры симметрических многочленов, введем еще одну переменную х и рассмотрим многочлен (х - ti) • • • (х - tn) = xn- oixn~l + о2хп-2 + (-1)пап. Здесь буквами gi, ..., ап обозначены многочлены 228
t2 Эти многочлены, равные сумме всех переменных, сумме всевозможных произведений по две переменные и т. д., очевидно обладают свойством симметрии и называются элементарными симметрическими многочленами. Теорема 9.2 (теорема о симметрических многочленах). Пусть — симметрический многочлен степени d. Тогда существует многочлен G[z\, ..., zn] Е A[zi, ..., zn] степени не выше d, такой, что F[tu ...,tn] = G[ab ...,an]. Например, имеет место тождество Как простое следствие этой теоремы получаем лемму. Лемма 9.2. Пусть Р(х, у) G Q[x, у] — многочлен от двух переменных с рациональными коэффициентами. Пусть также a — алгебраическое число степени п u ai, ...,an — все его сопряженные. Тогда Р(х, ai) • Р(х, ос2) •... • Р(х, а„) = Д(ж), (9.1) есть многочлен от переменной х с коэффициентами из поля рациональных чисел Q. Доказательство. Пусть А = Q[x] — кольцо многочленов от переменной х. Рассмотрим произведение Р(х, t\) • Р(х, ^) * • • • х хР(ж, tn), где ti, ..., tn — переменные. Этот многочлен не меняется при любой перестановке переменных t\, ..., tn, в произведении лишь меняются местами сомножители. Так что это произведение есть симметрический многочлен от переменных ti, ..., tn с коэффициентами из кольца А = Q[x]. Из теоремы о симметрических многочленах следует теперь, что для некоторого многочлена Q(x, #1, ..., хп) с рациональными коэффициентами выполняется равенство Р(ж, h) • Р(х, t2) •.. • • Р(ж, tn) = Q(x, ab 02, ..., an), (9.2) 229
где ai, ..., оп — элементарные симметрические многочлены. Заменим в последнем равенстве переменные ti, ..., tn числами ai, ..., an. Тогда левая часть (9.2) примет такой же вид, как и левая часть (9.1). Если р(х) = хп + а\хп~1 + ... + ап-\х + + ап Е Q[x] — минимальный многочлен числа а, то согласно теореме Виета выполняются равенства а2(аь ...,ап) = а2; ап(аь ...,ап) = (-1)пап. Поэтому правая часть равенства (9.2) после указанной ранее подстановки примет вид Q(x, — ai,a2, ..., (—l)nan). Учитывая, что все числа ai рациональны, получаем нужное утверждение. ■ Доказательство теоремы 9.1. Утверждение тривиально, если a = 0. Далее будем считать а ф 0. Пусть a = oti, a2, ..., an — числа, сопряженные с а, а д{х) — минимальный многочлен числа р. Определим многочлены Pi (ж, у) = д{х + у)\ Р2(х,у) =д(х-у)] Рз(х, у) = д{ху)\ Р*{х, у) = утд(у~1х). По лемме 9.2 многочлены Ri{x) = Цд(х + aj); R2(x) = Д д{х - а,-); j=l 3=1 принадлежат кольцу Q[x]. Так как a = ai, то - a + ai) = 5(cx + р - ai) = ^(Pa"1^) = д((фа^) = дф) = 0, и, значит, Лх(р - а) = 0; Д2(а + р) = 0; Д3(Р/а) = 0 и Д4(ар) = 0. Таким образом, каждое из чисел р — a, a + р, (3/а и ар есть корень многочлена с рациональными коэффициентами. Поэтому все они — алгебраические числа. ■ Пусть £i, ..., \т — алгебраические числа. Обозначим символом Q(5i, ..., \гп) наименьшее поле, содержащее все числа &, а 230
также поле рациональных чисел Q. Это поле, как легко видеть, состоит из всевозможных дробей вида -г ч / п где А,В — многочлены от переменных х\, ..., хт с рациональными коэффициентами. Говорят, что числа £i, ..., \ш порождают поле Q($i, ..., <;m). Из теоремы 9.1 следует, что все его элементы являются алгебраическими числами. Рассмотрим сначала структуру таких полей в случае т = 1, т. е. когда они порождаются одним числом. Лемма 9.3. Пусть \ — алгебраическое число степени п. Тогда каэюдый элемент а поля Q(£) единственным образом представляется в виде * = г0 + пЪ + • • • + гп-г1п-\ Tj e Q. (9.3) Доказательство. Пусть р(х) — минимальный многочлен £. Согласно определению каждый элемент a G Q(£) может быть представлен в виде а = , где А(х),В(х) Е Q[x], причем BS) S) ф 0. Многочлен р{х) неприводим, поэтому возможны два случая. Либо В(х) делится на р(х), либо эти многочлены взаимно просты. Если р(х) — делитель В(х), то каждый корень р(х) и, в частности, £, доллсен быть корнем многочлена В{х). Но это неверно. Значит, многочлены р{х) и В(х) взаимно просты. В этом случае можно утверждать, подобно теореме 1.5, что существуют многочлены u(x),v(x) G Q[x], для которых выполняется равенство u(x)p(x)+v(x)B(x) = 1. Подставив в него х = 2; и воспользовавшись тем, что р(£) = 0, находим у(1)В(1,) = 1 и, следовательно, а = А(£)г>(£). Разделим теперь многочлен A(x)v(x) на р(х) с остатком, т. е. определим многочлены q(x),r(x) G Q[x] условиями A{x)v{x) = q(x)p(x) + г(ж), degr(x) < degp(x) = п. Подставив х — \ в последнее равенство, находим а = г(£), что доказывает (9.3), поскольку многочлен г(х) имеет вид г(х) = го + + г\х + ... + rn-.ixn~l с рациональными коэффициентами г у Существование двух многочленов r(x),s(x) G Q[x] с условиями <x = r(5), a = 5(5), degr(x)<n, deg5(x)<n, 231
означало бы, что r(£) = s(Z) и, согласно второму утверждению леммы 9.1, что p(x)\(r(x) — s(x)). Степень делимого меньше п = degp(x), поэтому r(x) = s(x). щ Теорема 9.3. Всякое поле Е = Q(£i, ...Дт), порожденное алгебраическими числами $i, ..., £т, может быть порождено одним числом. Другими словами, существует число 0 G £", такое, что Е = Число 0, порождающее поле Е, называется его примитивным элементом. Рассмотрим, например, поле Q(\/2, \/3) и число 0 = \/2 + + у/3 G Q(\/2, \/3). Справедливы равенства (0 - л/2)2 = 3, (0 - л/3)2 = 2, из которых следует, что V 20 ' V 20 Поэтому \/2, \/3 G Q(8) и Q(>/2, \/3) = Q(0). Доказательство теоремы 9.3. Докажем сначала нужное утверждение для поля, порожденного двумя алгебраическими числами, т. е. будем считать, что Е = Q(a, (3). Пусть степени чисел a, p равны соответственно т и п, а /(ж) = zm+am_1zm-1 + ...+a0, 5(x) =xn+6n_ixn-1 + ...+6o — их минимальные многочлены. Корни этих многочленов, т. е. числа, сопряженные с а, [3, обозначим ai, ..., am и Pi, ..., рп соответственно. При этом будем считать a = ai, p = (Зь Все числа а^, равно как и числа Pj, различны между собой. Выберем с G Q так, чтобы аг + cpfc^ai + cpi, при (г,*0тЧМ). (9.4) Это, очевидно, молено сделать, ведь каждое уравнение o^ + xPfc = = ai + xfii при (г, к) ф (1,1) имеет не более одного решения, а поле Q бесконечно. Положим 0 = a + ср и обозначим L = Q(0). Справедливо включение L С Q(a,p). В дальнейших рассуждениях будет использоваться многочлен h(x)=f(B-cx)eL[x]. 232
Принадлежащие кольцу L[x] многочлены д{х) и h(x) имеют общий корень р, ведь /i(p) = /(0 - ср) = /(а) = 0. Если d(x) — их наибольший общий делитель, то, как и в случае теоремы 1.5, можно утверждать, что с некоторыми многочленами гх(х), v(x) G Е L[x] выполняется равенство g(x)u(x) + h(x)v(x) = d(x). Из этого равенства следует, что число (3 является корнем многочлена d(x) G L[x]. Так как d(x) — делитель неприводимого над полем Q многочлена д(х), то d(x) не имеет кратных корней. Предположим, что degd(x) > 1. Тогда многочлен d(x) имеет корень у, отличный от р. Все корни d(x) содержатся среди корней многочлена д(х). Поэтому у = Pfc с некоторым номером к > 1. Учитывая, что у является также корнем многочлена h(x), т. е. 0 = /i(y) = /(0 — су), заключаем, что 0 — су = о^ с некоторым номером г. Но тогда 0 = oti + cpfc вопреки (9.4). Получившееся противоречие доказывает, что degd(x) = 1, т. е. d(x) = ax + b G L[x]. Но тогда р = —b/a GLna = 0 — ф € L. Следовательно, Q(a,p) = L = Q(0), чем и завершается доказательство теоремы 9.3 для полей, порожденных двумя числами. Пусть теперь Е = Q(£i, ... ,£m). Если считать теорему доказанной для полей, порожденных т — 1 числом, то Q(5b ••• Лт-i) = Q(tj) для некоторого алгебраического числа г). Так что Е = Q(7),£m). Пользуясь уже доказанным утверждением для полей, порожденных двумя числами, заключаем, что с некоторым 0 G Е будет выполняться равенство Е = Q(0). ■ Теорема 9.4. Если число £ — корень многочлена с алгебраическими коэффициентами а», то $ — алгебраическое число. Замечание 9.1. Теорема утверждает, что поле всех алгебраических чисел нельзя расширить, присоединив к нему корень какого-либо многочлена с алгебраическими коэффициентами. Это свойство называется алгебраической замкнутостью. Поле комплексных чисел также обладает этим свойством. Доказательство. Не уменьшая общности, можно считать, что ат = 1. Ведь после деления многочлена ср(ж) на ненулевой старший коэффициент am получится многочлен со старшим коэффициентом 1 и остальными коэффициентами — алгебраическими числами, также обращающийся в нуль в точке £. Согласно теореме о примитивном элементе для некоторого алгебраическо- 233
го числа G выполняется равенство J5 = Q(oto, oil, ..., otm_i) = ( Обозначим п = deg9. По лемме 9.3 существуют такие многочлены cij(x) Е Q[x], 0 < j < m, что deg aj(x) < пи qlj = aj(6). Пусть 0i = 0,02, ..., 0?г ~ числа, сопряженные с 0. Обозначим Р(х,у) = хт + am-i{y)xm-1 + ... + аг(у)х + ао(у) € Q[x,y] Так как P(^,8i) = 0, то Я(£) = 0 и, согласно лемме 9.2, R(x) б G Q[x\. Следовательно, £ — алгебраическое число. ■ 9.2. Приближения алгебраических чисел рациональными. Существование трансцендентных чисел Множество действительных чисел не исчерпывается только алгебраическими числами. Неалгебраические числа Г. В. Лейбниц назвал трансцендентными. Итак, трансцендентным называется всякое число, которое неспособно удовлетворить никакому алгебраическому уравнению с целыми коэффициентами, т. е. не является корнем никакого многочлена с целыми коэффициентами. Строгое доказательство существования трансцендентных чисел впервые было дано Ж. Лиувиллем (1844). Он установил, что алгебраические числа не допускают слишком хороших приближений рациональными, и это свойство позволило ему построить первые примеры трансцендентных чисел. Если а — комплексное алгебраическое число, то для любо- Р го рационального числа - выполняется неравенство Я > | Im ос| и ясно, что к числу а из С \ К. нельзя приблизиться рациональным на расстояние, меньшее |Imoc|. Поэтому далее будут рассмотрены рациональные приближения действительных алгебраических чисел. Следующая теорема о том, что действительные алгебраические числа «плохо» приближаются рациональными, была доказана Лиувиллем (1840). Теорема 9.5, Пусть а — действительное алгебраическое число степени п>2. Тогда найдется константа с > 0, завися- 234
щая только от а, такая, что для любого рационального числа -, q > 0, выполняется неравенство Ч >-£.. (9.5) Доказательство. Пусть f(x) E Q[x] — минимальный многочлен числа and — общий знаменатель его коэффициентов. Пусть также а = oti,ot2, ...,ап — числа, сопряженные с а. По лемме 9.1 многочлен f(x) неприводим. Поскольку степень его п не меньше 2, то f(x) не имеет рациональных корней и, значит, dqnf(p/q) — целое отличное от нуля число. Но тогда dqn\f(p/q)\ > > 1. Рассмотрим теперь два случая: Р < 1. Тогда 1) пусть а Ч < l«i - а| Из этих неравенств следует <dqn\f(p/q)\ = dqn <dqn *-P- a-? П n<i«-*i Обозначив c = d l Щ=2 (la ~ aj\ + 1) > получаем нужное неравенство; 2) в случае a > 1 можно взять ту лее константу с, что и в первом случае. Она, очевидно, удовлетворяет неравенству с < 1, поэтому Следствие 9.1. ifc/ш a E любого т>2 неравенство 0< a < — имеет бесконечно много решений - G Q, mo a трансцендентно. 235
Доказательство. 1. Докажем сначала, что а ^ Q. Предполо- жим, что это не так, и а = -, а, Ь G Z, Ъ > 0. Возьмем т = 2. По условию существует бесконечно много р/с?, удовлетворяющих неравенствам 0 < национальных чисел < -£. Среди них есть, конечно, решения со сколь угодно большими знаменателями q. С другой стороны, aq — bp bq ~bq 1 1 Сопоставив полученные неравенства, заключаем, что —^ > — и, значит, q <b. Получившееся противоречие доказывает иррациональность а. 2. Докажем, что а не есть алгебраическое число степени большей чем 1. Предположим противное, и пусть dega = п > 2. Положим т = п + 1. По условию следствия существует бесконечно много рациональных чисел -, удовлетворяющих неравенствам Я О < a < —. А с другой стороны, по теореме 9.5 с неко- q qm торой константой с > 0, не зависящей от р и q, должно выпол- > —. Сопоставив эти неравенства, получим — < —тт- Но тогда q < - вопреки бесконечности Ч Ч ^ множества рациональных решений неравенства из условия следствия. ■ Укажем теперь конкретное трансцендентное число. Следствие 9.2. Число а, определенное рядом няться неравенство с k=0 трансцендентно. Замечание 9.2. Члены этого ряда «быстро» стремятся к нулю, а общий знаменатель первых п членов ряда растет «не очень быстро». Эти свойства позволяют построить последовательность хороших рациональных приближений к числу а, что обеспечивает с помощью следствия 9.1 трансцендентность а. 236
Доказательство. Для каждого натурального п определим целые числа п Чп = 2 , рп = 2_^ 2 fc=o Рациональное число равно частичной сумме ряда, определяющего а. Поскольку члены ряда положительны, то го а- — = Чп Учитывая, что (к + 1)! > А;!, получаем 2~(fe+1)!/2~fe! < - и А Из этих неравенств следует, что для любого га > 2 неравенствам 0< дТП удовлетворяет бесконечное количество различных рациональ- ных чисел —, п > га. Согласно следствию 9.1 можно утверждать теперь, что а — трансцендентное число. ■ Ясно, что таким способом, выбирая вместо 2 другие натуральные основания, можно построить множество примеров трансцендентных чисел. Например, выбрав ряд с членами 10~fc!, получим число, записываемое в десятичной системе нулями и единицами. Причем расстояния между соседними единицами будут возрастать очень быстро. Это число также трансцендентно. Иное доказательство существования трансцендентных чисел было предложено Г. Кантором, установившим счетность множества алгебраических чисел и несчетность множества действительных чисел. Таким образом, множество действительных чисел не может исчерпываться алгебраическими числами. Более 237
того, трансцендентные числа составляют множество большей мощности, чем алгебраические. Впрочем, это рассуждение не позволяет строить примеры трансцендентных чисел. Утверждение теоремы Лиувилля может быть представлено, как оценка снизу значения в алгебраической точке а многочлена первой степени см. (9.5). В таком виде теорема Лиувилля допускает обобщение. Теорема 9.6. Пусть а — алгебраическое число степени n> L Тогда существует постоянная с > 0, зависящая только от числа а, такая, что для любого многочлена Р(х) G Ъ[х\ с условием Р(а) ф 0 выполняется неравенство \р{*)\> Яп-1' где d — deg Р и Н — максимум абсолютных величин коэффициентов многочлена Р. Замечание 9.3. Это утверждение понадобится далее для доказательства трансцендентности л. Доказательство. Пусть fix) = хп + ап-\хп~1 + ... + ао £ Е Q[x] — минимальный многочлен числа а и oti = а, ot2, ..., ап — корни этого многочлена, т. е. числа, сопряженные с а. Пусть также а 6 Z, а > 0, — наименьший общий знаменатель коэффициентов fix). Тогда aaj G Z, 0 < j < т. Согласно теореме о симметрических многочленах, примененной для симметрического многочлена Р(х\) • • • Р{хп) и кольца Z, найдется многочлен Q(zi, ..., zn) с целыми коэффициентами, такой, что P(xi)---P(xn) = Q(oi,...,an), (9.6) причем degQ < ndegP = nd. Подставив в тождество (9.6) числа oci, .. -, an вместо переменных х\, ..., хп соответственно и пользуясь теоремой Виета, найдем P(ai) • • • P(an) = Qi-an-i, ..., (-l)na0). (9.7) Учитывая, что степень многочлена Q(z\, ..., zn) по совокупности переменных не превосходит nd, а коэффициенты его — целые числа, заключаем, что А = andQ{—an_i, ..., (—l)nao) есть целое число. 238
Если А = О, то в силу (9.7) для некоторого индекса j должно выполняться равенство P(olj) = 0. С помощью леммы 9.1 заключаем, что f(x) есть минимальный многочлен числа olj и f(x)\P(x). Но тогда Р(ос) = 0, вопреки условию теоремы. Таким образом А ф 0. Целое отличное от нуля число не может быть по абсолютной величине меньше единицы, поэтому выполняется неравенство \А\ > 1 или f)l>l. (9-8) Так как коэффициенты многочлена Р(х) не превосходят if, a степень его равна d, имеем неравенства (а,)| < Я (1 + |а,-| + |а Теперь из (9.8) следует 3=2 Выбрав с = CL~nY¥j=2(^ + l^'l)""1? получаем отсюда неравенство теоремы 9.6. ■ 9.3. Иррациональность чисел ег и тс Иррациональность числа е следует из бесконечности цепной дроби этого числа. Иное доказательство, найденное значительно позже, использует представление Допустим, что е рационально и с целыми положительными числами a, b выполняется равенство е = —. Тогда, определив целые числа ь ,. д = Ы, р = > — п=0 находим qe — р = а(Ь — 1)! — р G Z и n=b+l 239
n! При п > b +1 выполняется неравенство ——'—гт = п-(п — 1) •... х (6 + 1)! 1 X (Ы- 2) > 2-»-1. Поэтому ^ < „ „.Л < (6Т1)Т (1 + 5 + ? + -) " FTT s L Но целое число qe — р не может принадлежать интервалу 0 < < х < 1. Получившееся противоречие доказывает иррациональность е. Легко видеть, что подобные рассуждения не позволяют доказать, например, иррациональность е2. Они должны быть несколько уточнены. Для дальнейшего понадобится одна конструкция, основанная на классическом разложении к=о Лемма 9.4. Для каждого целого п > 0 существуют такие многочлены с целыми коэффициентами Q(x) = хп + ... и Р(х) = {-1)пхп + ..., (9.10) что ОО г, -ч| р/^.\ _ П(т\рХ — Р(<А — \ Л ^ ^' «.^ /Q I -1 \ Дрп этом для каждого комплексного числа z выполняется неравенство Ы2п+1 . . \R(z)\ < J£!^j-eW. (9.12) Замечание 9.4» Правая часть неравенства (9.12) с ростом п достаточно быстро стремится к нулю. Поэтому, например, при z = а € Ъ целые числа Р(а), Q(a) могут служить числителем и знаменателем хорошего рационального приближения к еа. Доказательство. Определим дифференциальный оператор 5 = х— и для каждого многочлена Т(х) = апхп + ... + а\х + ао (XX будем обозначать символом Г(8) дифференциальный оператор Г(8) = апЬп + ... + агЬ + а0, 240
действующий на функцию f(x) по правилу (х) = anbnf(x) + ... + aihf(x) + aof(x). Здесь bkf(x) = b(bk-lf(x)) при jfe > 1. Выясним, как оператор 8 действует на степени переменной х и функцию ех. Для любого натурального г имеем Ъкхг — гкхг и, значит, для любого многочлена Т(х) выполняется равенство Т(Ъ)хг = Т{г)хг. Докажем, что для каждого целого к > О выполняется равенство Ькех = Ак(х)ех, где Ak(x)eZ[x], degAk(x) = k, (9.13) причем коэффициент при хк в многочлене Ак{х) равен 1. Утверждение легко доказывается индукцией по к. При к = 0 оно, очевидно, выполняется. Предположим, что к > 1 и выполняется равенство Sfc~1ex = Ак-\{х)ех с многочленом Ак-\(х), удовлетворяющим сформулированным ранее условиям. Тогда Ькех = 8 (8*-V) = 8 (^_!(х)еж) = Ак(х)ех, где Л^(ж) = xAfc_i(x) + хА'к_г(х). Из этого равенства следует справедливость (9.13), а таклсе утверждение о старшем члене Ак(х). Выберем теперь какое-нибудь целое число п > 0 и определим многочлен Т{х) равенством Т(х) = Ytfj=n+i(x ~" з) ^ Z[x]. Если применить дифференциальный оператор Т(8) к обеим сторонам равенства (9.9), то по доказанному Г(8)еж = Q(x)ex, где Q{x) — многочлен степени п с целыми коэффициентами, его старший коэффициент равен 1. Кроме того k=0 где к=0 к=0 и Я(х) = 2J -^(^)"1Т* ^читывая равенства Т(к) = 0 при А; = к=п+\ = п + 1, ..., 2п, находим 9 Нестеренко 241
к 2 Шх)- V Т(к)—- У (fc"1)' xfc /с=2?г+1 v ; При к > 2п + 1 выполняется неравенство fc! _ поэтому при любом z G С имеем \r\2n+l+t U|2n+1 \z\ \z\ v—"\ l\ n! Заметим также, что в силу равенства (9.14) старший член многочлена Р{х) имеет вид (—1)пжп. ■ Теорема 9.7. Для каждого рационального г ф О число ег иррационально. Доказательство. Предположим, что er € Q для некоторого г = -, где а,Ь — целые, причем а > 0. Тогда число еа = (ег)ь о рационально. Выберем целое q > 0, такое, что qea = p G Ъ. Согласно (9.11) и (9.12) находим теперь 0 < qR{a) < 1 для любого достаточно большого п. С другой стороны, равенство (9.11) влечет qR(a) = q(Q(a)ea - Р(а)) = Q(a)p - P(a)q e Z. Так как это противоречит неравенствам 0 < qR[a) < 1, заключаем, что er ^ Q. ■ Теорема 9.8. Число к иррационально. Доказательство. Предположим, что к = -гэ a?^ GZh обозна- 6 чим г = тсЬг = аг. Тогда R(z) = Q(ai)eM - P(ai) = Q(ai)(-1)6 - P(ai) G Z[i]. Из неравенства (9.12), поскольку Д(^) = гх + гг; с целыми п, г;, находим R(z) = 0 для всех достаточно больших п. Далее используются обозначения Рп(х) = Р(ж), Qn(x) = Q(^)? -Rn(^) = Д(ж), указывающие на величину параметра п, при котором построена тройка Р(ж), Q(x), Д(х). Из (9.11) следует тождество 242
а также неравенство ordx=o Д(х) > 2п + 1, означающее, что разложение многочлена А(х) в ряд Тейлора в окрестности точки х = 0 начинается по крайней мере со степени x2n+1, и оценка deg А(х) < 2п+1. Но это возможно лишь в случае А(х) = yx2n+l с некоторой постоянной у. Сравнив с помощью (9.10) старшие коэффициенты в равенстве (9.15), находим А (ж) = 2(—1)па;2п+1 и Д(г) 7^ 0 вопреки равенству (9.15) и -Rn(z) = Rn+i{z) = 0. ■ 9.4. Трансцендентность числа е Важной частью доказательства иррациональности чисел ви- да ег, г Е Q, г ф О, является конструкция рациональных приближений к этим числам. Ш. Эрмит предложил (1873) при любом га е Z,ra > О аналитическую конструкцию целых чисел 6о, 6i, ..., bm, таких, что все разности Ьоек — &&, 1 < к < га, близки к нулю, конструкцию так называемых совместных приближений. На этой основе он доказал следующую теорему. Теорема 9.9. Число е трансцендентно. В основе конструкции Эрмита лежит тождество X Г е-г/(г)(1г = F(0) - F(x)e~x, (9.16) о справедливое для любого многочлена /(ж) G С [ж], при м ), M = deg/(x), (9.17) и легко доказываемое, например, с помощью дифференцирования (9.16). Действительно, производная левой части равна е~х/(х). А для производной правой части находим (F(0) - e-*F(x))' = e~x(F(x) - F'(x)) = e~xf{x). Совпадение производных означает, что разность левой и правой частей (9.16) есть константа. Учитывая, что обе эти функции обращаются в нуль при х = 0, заключаем, что они равны. Доказательство теоремы 9.9. Предположим, что е — алгебраическое число. Тогда при некотором натуральном га и с неко- 243
торыми целыми коэффициентами ао, ...,ат выполняется равенство атет + ... + аге + а0 = О, ат > 0. (9.18) Пусть п — натуральное число, впоследствии достаточно большое. Выберем многочлен f(x) = xn+r*{x - l)n+ri • • • (х - где каждый из параметров го, ... ,rm в дальнейшем будет выбран равным 0 или 1. Для любых двух натуральных чисел fc, l справедливо равенство rJb4Mi°> если ^>fc; /919ч Многочлен /(ж) имеет целые коэффициенты. Поэтому из (9.19) следует, что коэффициенты многочлена f^\x) делятся на 1\ В силу выбора f{x) обладает также свойством /М(о) = /Ю(1) =... = /W(m) = о, о < е < п. Поэтому при любом к = 0,1,2, ... ,т для многочлена jP(x), определенного равенством (9.17), получаем м м где Ьк — целые числа. Из тождества (9.16) при х = к находим efef Ьоек - Ьк = — е~г/(г)(И. (9.20) п! J о т Многочлен f(x) есть произведение ^(п + г») < (т + 1)(п + г=0 +1)скобок вида х — к, каждая из которых на отрезке [0, т] не превосходит т. Поэтому max \f(x)\ < cn+1, с = mm+1. (9.21) 0<я<га Теперь из (9.20) и (9.21) следуют равенства fc = 0,l,...,m. (9.22) 244
Умножим равенство (9.20) на а& и просуммируем получившиеся произведения при всех к = 0,1, ..., т. В силу (9.18) находим I = aobo + ... + атЬш = - 22 ак— е"*/(*)Л- (9.23) fc=o п* 0 Равенства (9.22) означают, что 1=0 (з)- <9-24' Определим функции 1, если ж < fc: 0, если х > к. Тогда равенство (9.23) можно переписать в виде * fc=o g где - TO efc? Г ~ ^fi^UkWt = - e-lf{t)G{t)dt, (9.25) На промежутке m — 1 < x < m имеем G(x) = —amem > 0, n! так что функция G{x) отлична от тождественного нуля. Функция G{t) постоянна на интервалах между целыми точками. Поэтому она может менять знак лишь при переходе переменной х через целые точки. Выберем теперь показатели ri, ..., rm_i равными 0 или 1 так, чтобы функции G(t) и /(£) при переходе через каждую целую точку 1, ..., т — 1 одновременно меняли бы знак или сохраняли его. Параметры го и гт можно взять, например, равными нулю. Тогда под интегралом в правой части равенства (9.25) стоит знакопостоянная функция, что обеспечивает условие / ф 0. Итак, / = ао&о + •■••■ + ambm есть целое отличное от нуля число,: которое в силу (9.24) меньше 1 при достаточно большом п. Получившееся противоречие завершает доказательство теоремы 9.9. ■ 245
9.5. Трансцендентность числа к В этом разделе будет доказана следующая теорема. Теорема 9.10. Число к трансцепдентно. Начнем с некоторой задачи, относящейся к теории приближения функций. Предположим, что на интервале (а; Ь) определена функция f(x) и известны ее значения в некоторых точках oto, ..., 0Lm этого интервала. Требуется найти многочлен Р(х) по возможности меньшей степени, принимающий в заданных точках cij те же значения, что и функция f(x). Если количество точек т достаточно велико, а функция достаточно гладкая, то значения этого многочлена, называемого интерполяционным, будут близки к значениям функции f(x) ив других точках интервала (а; Ь). Для решения этой задачи определим многочлены Q(x) = (х - oto) • • • (х - *т), Qk(x) = -Q?L, k = 0,...,m, X Otfc и будем искать многочлен Р(х) в виде с некоторыми постоянными Ь^, подобрав их так, чтобы выполнялись нужные равенства значений. Учитывая, что при к ф j выполняется Qk(&j) = 0, получаем bjQj(oij) = P{olj) = /(aj), j = 0,1, ..., m и, следовательно, Построенный многочлен удовлетворяет условиям и, значит, является интерполяционным многочленом. Для доказательства трансцендентности л требуется решить сначала более сложную интерполяционную задачу, в которой необходимо совпадение не только значений искомого многочлена со значениями заданной функции, но и их производных до некоторых порядков. Конструкция этого интерполяционного многочлена задается следующей леммой. 246
Лемма 9.5. Пусть oto, <*ъ • • • > am ~~ различные числа из интервала (а; 6) и го, ri, ..., rm — неотрицательные целые числа. Положим N = — 1 + V^ m (rj + 1) и определим многочлены х-а,Р+1, Qk(x) = — з=о ^х ' Пусть таксисе f(x) — функция N раз дифференцируемая в (а; Ь). Тогда многочлен i=o где имеет степень не выше N и удовлетворяет равенствам pW(afc) = /W(afc), 0 < £ < rfc, 0 < к < т. (9.27) Доказательство. Так как deg Qk(%) — N — r^, degi?fc(a:) < r^, и эти неравенства справедливы при любом А; = 0,1, ..., т, заключаем, что deg P(x) < N. Фиксируем некоторое целое число /с, 0 < к < т. Учитывая, что при j ф к многочлен Qj{x) делится на (х — otfc)rfc+1, получаем Р{х) = Qk(x)Rk(x) + О((х - afc)rfc+1). Многочлен Rk(x) определен как многочлен Тейлора в точке х = otfc для функции тгтт» поэтому и, следовательно, /(х) = Qk(x)Rk(x) + О((х - Из полученных формул для Р(х) и f(x) теперь следует, что f() Р{) О(( )ГА+1) f() Р() у фру д () f() р ду, f(x) - Р{х) — О((х - а^)ГА:+1) и потому f(x) и Р(х) имеют одинаковые производные в точке х = ос& до порядка г^ включительно. Поскольку это заключение справедливо для любого целого /с, 0 < к < т, лемма доказана. ■ 247
Следствие 9.3. Существует единственный многочлен, удовлетворяющий условиям ($.27) и имеющий степень не выше N. Доказательство. Существование многочлена доказано в лемме 9.5. Если А{х) и В(х) — два многочлена степени не выше JV, удовлетворяющие условиям (9.27), то Q(x)\(A(x) — В(х)). Учитывая, что deg Q{x) = N + 1 и deg(A(x) — В(х)) < JV, заключаем А(х) = В(х). Ш Следствие 9.4. В условиях леммы 9.5 на интервале (а;Ь) существует такая точка £, что b=oj=o 3'Vk •"' Левая часть этого равенства есть коэффициент при xN в многочлене Р(х) из леммы 9.5. Доказательство. Коэффициент при xN в многочлене Р(х), как это следует из равенства (9.26), равен сумме старших коэффициентов многочленов Rj(x), т. е. ™ 1 / А \ rk 1 (dY ^ Ти\ \dt) \ Ои(€\ I. " ^ ^ Мти - *\\ ^*KJ "=«* fc=0 Это доказывает второе утверждение следствия. Для доказательства первого утверждения заметим, что функция F(x) = f(x) — — Р(х) в силу леммы 9.5 имеет в каждой из точек а^ € (а; Ь) нули кратности г к +1. По теореме Ролля, примененной несколько раз, на этом интервале есть точка £, такая, что F^ (5) = 0. Из равенства F(N\Z,) = f^N\<i) — iVlajv, где а^ - старший коэффициент многочлена Р{х), получаем первое утверждение следствия. ■ Доказательство теоремы 9.10. Допустим, что я — алгебраическое число. Степень его обозначим буквой т. Тогда т > 1. Утверждения леммы 9.5 и ее следствий применим к функции f{x) = sinTta; и точкам <*о = 0, ai = 1, ... , am = т. Пусть N — произвольное натуральное число, в дальнейшем оно будет выбрано достаточно большим. Положим 248
Если п — частное п s — остаток от деления N + 1 на т + 1Г т. е. N + 1 = (га + 1)те + s,r 0* < 5 < га, тог как легко видеть, Тогда 771 п если j < 5, j n — 1 если j > 5, j = 0,1, , т. (m + 1 - в)та = (m + l)n + s = Каждому натуральному числу iV поставим в соответствие многочлен Pn{x)7 определенный леммой 9.5 при указанном выборе функции f(x) и чисел а0, ..., ат; г0, ..., гт. Если для некоторого А/" выполняется неравенство degPjv+i < < N + 1, то по следствию 9.3 можно утверждать, что Pjv+i(#) = = Pjsr(x). Если бы неравенства degPpj(x) < N выполнялись для всех TV, больших некоторого целого числа М, то по доказанному при любом N > М имело бы место равенство Pn(x) = Рм(%) и тогда, в частности, (8шта)^о = Р^(0), £ = 0,1,2,.... Так как Рм(#) ~~ многочлен, то правая часть последнего равенства равна нулю при всех достаточно больших £. С другой стороны, все нечетные производные функции sin тех в точке 0 отличны от нуля. Получившееся противоречие означает, что существуют сколь угодно большие числа N, для которых deg Рде(х) = N. Выберем какое-нибудь достаточно большое целое число N с условием degPjv(x) = N. Если В — коэффициент при xN в многочлене P/v(^)? то согласно выбору N выполняется В ф 0. По следствию 9.4 имеем (r, _ 7v (9-29) где Справедливы равенства (shiTix)^ = (-1) V sin у , (9.30) 249
из которых следует, что числа f(Vk i\k) в равенстве (9.29) либо равны 0, либо с точностью до знака совпадают с некоторой степенью тс, причем показатель степени не превосходит числа п. Ниже будет показано, что ак j Е Q, поэтому В есть многочлен от к с рациональными коэффициентами. Из определения чисел ак j следует, что 1 °° •k)j. (9.31) Qk{t) Подставим в это тождество t = к + dx, где d — некоторое натуральное, делящееся на все числа 1,2, ..., т. Например, молено взять d = m\ Тогда (9.31) может быть переписано в виде л оо (9.32) П (к - £ + dxY^1 j=o Учитывая, что к-e + dx k-ei- Лх rz t—k г=0 d т.е. функция -—-—— раскладывается в точке 0 в ряд Тей- /с -с -| ах лора с целыми коэффициентами, заключаем с помощью (9.32), что ряд dN~Tk ^2akjd^x^ имеет целые коэффициенты. Поэтому dN~rk+jakj E Z и, значит, dNakJ e Z, 0 < j < тк. (9.33) оо оо Если и(х) = ^ Ujxi и v(x) = ^ VjX^ — два степенных ряда, j=o j=o будем обозначать символом и{х) <С v(x) тот факт, что каждый коэффициент ряда и(х) по абсолютному значению не превосходит соответствующего коэффициента ряда v(x), т.е. \uj\ < Vj, j = 0,1, ... Например, при к ф £ имеем +1 L ke + x kix__±_ 1 e-k 3=0 250
Легко проверить, что если степенные ряды связаны соотношениями Mi (ж) < Vi(x) И U2(x) < V2(z), TO Ui(x)m2(x) < <С vi(x)v2(x). Для этого достаточно лишь сравнить соответствующие коэффициенты степенных рядов. С помощью индукции указанное свойство легко распространяется на любое число сомножителей. Пользуясь этим свойством, находим = y(N-rk-l j=0 ^ 3 Таким образом, \akj\ < 2N, fc = 0,l,...,m, j = 0,1, ..., rk. (9.34) Из (9.29), (9.30) и (9.33) следует, что существует такой многочлен с целыми коэффициентами А(х), что А(ъ) = dNn\B ф 0, deg A(x) < п. При этом согласно (9.34) имеем оценку для Н(А) — максимума абсолютных величин коэффициентов А: т Н(А) < dNn\ ^{rk + 1)2N < nlc^1, к=0 где с\ — положительное число, зависящее только от га. Так как А(к) ф 0, а л, по предположению, есть алгебраическое число степени га, находим с помощью теоремы 9.6 оценку снизу: =г, (9-35) где С2, сз — положительные числа, зависящие только от га. Оценим теперь \А{ъ)\ сверху. Для этого воспользуемся правой частью равенства (9.28). Имеем 251
Из определения чисел rj следует неравенство N + 1 < (77г+1)(п+ + 1). Произведение (n!)m+1 состоит из (га + 1)(п — 1) < N — 1 сомножителей, превосходящих 1, поэтому (n!)m+1 < N\ В результате имеем ИМ1 < где С4 = (nd)m+l зависит только от т. Сравнив полученную оценку с (9.35), приходим к неравенству i!)™-1 ~ (n!)m или 1 < (СЗС4|"+ . (9.36) n! При больших п это неравенство невозможно. С другой стороны, имеем (n + l)(ra + l) > N+1, что противоречит выбору числа N достаточно большим. Получившееся противоречие завершает доказательство трансцендентности тс. ■ 9.6. Невозможность квадратуры круга Знаменитая проблема квадратуры круга может быть сформулирована так: построить на плоскости квадрат, площадь которого равнялась бы площади заданного круга. При этом построение необходимо выполнить с помощью циркуля и линейки — инструментов, находившихся в распоряжении древнегреческих геометров. Многочисленные попытки найти требуемое построение продолжались в течение более, чем трех тысячелетий до тех пор, пока Ф.Линдеман не доказал (1882), что такого построения не существует. Это утверждение будет доказано далее. Когда говорят о построении с помощью циркуля и линейки, имеют в виду, что по заданному условиями набору точек, отрезков, окружностей или других геометрических объектов требуется построить некоторый новый отрезок, точку, окружность и т.п., используя только эти инструменты. Причем с их помощью разрешается выполнять лишь две основные операции: 1) провести с помощью линейки прямую линию через две заданные или построенные ранее точки; 252
2) провести циркулем окружность с центром в заданной или построенной ранее точке радиуса, равного расстоянию между двумя заданными или построенными точками. Любая геометрическая фигура, которая может быть построена, задается совокупностью прямых, окружностей и точек. Например, для построения квадрата достаточно построить четыре его вершины. В результате выполнения в определенном порядке указанных операций на плоскости возникнет множество прямых, окружностей и некоторых точек их пересечения, содержащих искомые точки, прямые или окружности. Не все точки пересечения этих прямых и окружностей в действительности необходимы для построения. Перенумеруем теперь заданные условием точки, прямые и окружности в некотором порядке, а затем прямые, окружности и используемые для построения точки пересечения в порядке их возникновения. Тогда на черте лее появится конечная последовательность прямых, окружностей и точек, содержащая все искомые геометрические объекты. Каким лее образом в процессе построения могут возникать новые прямые, окружности и точки? Перечислим все имеющиеся возможности: а) новая прямая может быть построена лишь с помощью линейки, приложенной к двум построенным ранее точкам; б) новая окружность может быть построена лишь с помощью циркуля, помещенного в построенную ранее точку. При этом радиус ее равен расстоянию мелсду двумя построенными ранее точками; в) новая точка может быть построена, как пересечение двух построенных прямых; г) новая точка может быть построена, как пересечение построенных прямой и окружности; д) новая точка может быть построена, как пересечение двух построенных окружностей; е) новая точка может быть построена с помощью операции, которую назовем «произвольный выбор». Поясним подробнее последнюю операцию. Иногда при выполнении построения бывает безразлично, где взять необходимую точку. Тогда говорят: «Возьмем произвольную точку на плоскости, на построенной ранее прямой и т.п.» Рассмотрим, например, следующую древнюю и часто возникавшую на практике задачу: построить с помощью циркуля и линейки центр нарисованной окружности. Ясно, что построение центра не может начаться ни с одной из перечисленных операций а)—д). Одно 253
из классических решений этой задачи начинается с произвольного выбора трех точек А, В и С на окружности с тем, чтобы впоследствии с помощью циркуля и линейки, так как это объясняется в школьном курсе геометрии, построить центр окружности, описанной вокруг треугольника ABC, т. е. центр заданной окружности. Сделав эти вступительные замечания, предположим, что существует построение с помощью циркуля и линейки, решающее проблему квадратуры круга, т. е. позволяющее для любого заданного круга построить равновеликий ему квадрат. Введем на плоскости систему координат, поместив ее начало в центр заданного круга и выбрав в качестве единицы измерения длины радиус заданного круга. Всякая точка во введенной на плоскости системе координат может быть задана парой чисел (я; у), прямая и окружность уравнениями в канонической форме, соответственно, ах + by + с = 0 и (х — хо)2 + (у — — уо)2 = г2, где (жо,уо) ~~ координаты центра и г — радиус окружности. Определим теперь на плоскости класс алгебраических точек, прямых и окружностей. Точку будем называть алгебраической, если ее координаты есть алгебраические числа, прямую — если она может быть задана уравнением с алгебраическими коэффициентами. Окружность будем называть алгебраической, если ее радиус и координаты центра есть алгебраические числа. В частности, заданная окружность имеет уравнение х2 + у2 = 1 и потому является алгебраической. Покажем, что операции а)—д), примененные к алгебраическим объектам, в результате также дают алгебраические точки, прямые и окружности. В самом деле: а) прямая, проведенная через две точки с. алгебраическими координатами (х\,у\) и (х2,2/2)5 задается уравнением (х2 - xi)(y - у\) - (2/2 - yi){x - xi) = 0. Согласно теореме 9.1 это уравнение в канонической форме имеет алгебраические коэффициенты и потому определяет алгебраическую прямую; б) окружность с алгебраическим центром, радиус которой есть алгебраическое число, по определению является алгебраической; в) две пересекающиеся прямые, задаваемые уравнениями + biy + cj = O, г = 1,2, с алгебраическими коэффициентами 254
di, bijQ? имеют общую точку с координатами, удовлетворяющими системе уравнений { = сь а2х + Ь2у + с2. Решение этой системы, найденное, например, по формулам Крамера, имеет, согласно теореме 9,1, алгебраические координаты я, у. Так что точка пересечения двух алгебраических прямых является алгебраической; г) точки пересечения алгебраических прямой и окружности имеют координаты ж, у, удовлетворяющие системе уравнений {ах + Ьу = с, (х - я0)2 + (У - Уо)2 = г2 с алгебраическими коэффициентами. Не уменьшая общности, можно считать, что b ф 0. Выразив из первого уравнения системы неизвестную у через х и подставив это выралсение вместо у во второе уравнение, получим квадратное уравнение относительно ж, коэффициенты которого согласно теореме 9.1 будут алгебраическими числами. Но тогда по теореме 9.4 алгебраическими числами будут оба корня х\ и х2 получившегося квадратного уравнения, а следовательно, и вторые координаты у* = — (ах{ + с)Ь~1 точек пересечения. Итак, обе точки пересечения (xi, yi) и (х2, Уг) будут алгебраическими; д) координаты х, у точек пересечения двух алгебраических окружностей удовлетворяют системе уравнений с алгебраическими коэффициентами. Вычитая почленно второе уравнение системы из первого, получим линейное уравнение с алгебраическими коэффициентами. А затем, как и в предыдущем случае, проверяем, что координаты точек пересечения есть алгебраические числа. Этим доказано, что точки пересечения двух алгебраических окружностей будут алгебраическими. Обсудим теперь ситуацию с операцией е) — «произвольный выбор». Заметим, что точки с алгебраическими (и даже рациональными) координатами всюду плотны на плоскости. Это означает, что сколь угодно близко к любой точке плоскости находятся точки с алгебраическими координатами. Кроме того, согласно теореме 9.4 они будут всюду плотны на алгебраических 255
прямых и окружностях. Действительно, в любой окрестности точки (ж1, yi), лежащей, например, на алгебраической окружности, найдется точка (#2, У 2) с абсциссой x<i — рациональным числом, принадлежащая этой же окружности. Но тогда вторая координата у2 должна быть алгебраическим числом, так что точка (#25У2) будет алгебраической. Это означает, что если все точки, прямые и окружности, получившиеся в результате операций, предшествовавших «произвольному выбору», были алгебраическими, то и при «произвольном выборе» можно построить алгебраическую точку. Изложенное приводит к следующему выводу. Построение с помощью циркуля и линейки, реализующее квадратуру алгебраического круга х2 + у2 = 1, может быть выполнено таким образом, что все встречающиеся в нем точки, прямые и окружности будут алгебраическими. В частности, это означает, что алгебраическими будут и все вершины квадрата, получающегося в конце построения, и равновеликого по площади заданному кругу. Если (a:i,?/i), (х2,2/2) — соседние вершины квадрата, то его площадь, как легко видеть, равна (х2 — х\)2 + (у2 — Уг)2 и является алгебраическим числом. Но эта же площадь по условию должна равняться площади заданного круга, т. е. числу к. Таким образом, получается противоречие с теоремой Линде- мана о трансцендентности числа тс, означающее, что квадратура круга с помощью циркуля и линейки невозможна. Задачи для самостоятельного решения 1. Найдите минимальный многочлен числа 9 = у/2 + \/3. Найдите степень б и его сопряженные. 2. Число а есть корень многочлена я3 — х — 1 и р = 2а2 — а. Найдите многочлен с коэффициентами из Q, корнем которого является р. 3. Докажите, что tg при p,gGZ есть алгебраические числа. 4. Представьте число а = -—= -= в виде го + г\ \/2 + ^4^2 + 3 Tj € Q. 5. Пусть а — корень многочлена f(x) = х3 — 9х — 9 и (3 = б + а — а2, у = — б—2а-Ьа2. Докажите, что числа р, у также есть корни многочлена 256
6. Докажите иррациональность чисел In г при любом г G Q, г > О, и log2 тс. 7. Докажите иррациональность чисел у/а при любых целых п > 1, а > 1, если афЬп при Ь G Z. 8. Докажите, что для любой сколь угодно быстро убывающей функции h(n), принимающей положительные значения, существует число а (зависящее от этой функции), такое, что неравенство |а 1 < h(q) имеет бесконечное множество решений в рациональных числах -. 9. Докажите, что при любых целых р и q > 0 выполняется неравенство V2-? 1 q ±q* 10. Пусть a, ai, ..., am G Q, m > 0. а. Докажите с помощью индукции по m, что если то с некоторым у G Q и целыми fei, ..., кш, 0 < к3 < 1, выполняется равенство a = c^-..o&»Y2. б. Пусть ai, a2, ..., ar — различные натуральные, отличные от единицы, числа, не делящиеся на квадраты простых чисел. Докажите с помощью задачи 10, а, что любое число Р = bi y/ai + ... + bry/a~r ф 0, bj € Q, иррационально. Например, число >/2 + \/3 + \/б иррационально.
Ответы и указания Глава 1 1. а) 11; б) 1; в) 229; г) 23 - 1 = 7; д) 4. 2. а) 1155; б) 646; в) 330; г) 32 768; д) 30. 3. а) х = -2 - 23*, у = 2 + lit; б) х = -5 - 19*, у = 4 + 15*; в) ж = 323 + 449*, у = 182 + 253*; г) х = 41 + 47*, у = -46 - 53*; д)ж = 1 + 16*,у=1 + 27*; е) нет решений; ж) нет решений; з) х = -74 - 129*, у = 70 + 122*; и) ж = -6-9*, у = 6 + 7*. 4. а) ж = 29,у = 51; б) у = 19 038, а; = 2 807. 5. а) х = м, у = 7 + 2м + 8v, z = б + Зм + б) ж = -13 - 29м - 80i;, y = M,z = 5 + 9M в) x = it, у = 5 + Зм + 8v, z = 3 - 7u - r) x = u, у = 1 + 2u + 3v, г = 59 - 21гх - 23v; д) ж = — 3 — Ъи — 7v, у = u, z = 1 + и + 2v\ е) a; = tz, у = 1 + Зг;, z = 2 — 2w + bv. 6. а) ж = 1 + 3u, у = 51 - 7u, z = 63 + 13м. б) нет решений; в) ж = 25 + 88u, у = 30 + 104u, z = 41 + 143м. г) Ж1 = 1 + 2м, х2 = 2 + 7м + 8v, х3 = 3 + 8м + 9v, ж4 = 4 - 12м - 10г>. д) Ж1 = 2 - 11м - 23v, х2 = 2м, х3 = -2 + Зм + 2v, ж4 = 4 + 4м + llv. Глава 2 1. 232 792 560 = 24 • З2 • 5 • 7 • 11 • 13 • 17 • 19. Каждое целое число из промежутка от 1 до 22 раскладывается в произведение простых чисел 2, 3, 5, 7, 11,13, 17, 19 в степенях, не превосходящих кратности их вхождения в 232 792 560. 2. При любом целом fc, I < fc < —-—, имеем 1 к р — к к(р — к) 3. п4 + 4 = (п2 + 2п + 2)(п2 -2п + 2). 258
4. 2UV - 1 делится на 2й - 1. 5. При нечетном и число 2UV + 1 делится на 2V + 1. 6. Функция, равная разности левой и правой частей данного неравенства, имеет период 1. Поэтому неравенство достаточно доказать при 0<х < 1. 7. Функция, равная разности левой и правой частей данного неравенства, имеет период 25. Поэтому оба равенства достаточно проверить при 0 < п < 24. 8. Воспользуйтесь формулой для кратности простого числа в разложении га! и неравенством из задачи 6. Глава 4 2.88. 3. а) 2; б) 16. 4. Рассмотрите сравнения по модулю 9 в случае а); 7 — в случае б); 16 — в случае в); 2П, где п — наибольшее целое число с условием, что каждое из чисел х, у, z делится на 2п в случаях г) и д). 6. Все биномиальные коэффициенты ( ) при 1 < к < р делятся V J нар. -к- с — 1 9. ——. Выражение ак + Ъ пробегает полную систему вычетов по модулю р при к = 1,2, ..., с. Глава 5 1. а) х = -6 (mod 37); б) х = 21 (mod 31); в) х = 359 (mod 2 166). 2. а) х = 139 (mod 693); б) нет решений; в) х = 7 195 (mod 19 488). 3. а) нет решений; б) х = -12 (mod 125); в) х = 85 (mod 216), ж = 117 (mod 216), х = 149 (mod 216); г) х = -5 (mod 27); д) х = 13 (mod 75). Глава 6 1. а) -1; б) 1; в) 1; г) -1. 2. а) нет; б) да; в) да; г) нет. 3. р = 2,3,5 и все простые числа, удовлетворяющие сравнениям p = ±l,±7,±ll,±17(mod 60). 259
4. р = 5 и все простые числа, удовлетворяющие сравнениям р = = ±1 (mod 5). 5. р = 2 и все простые числа, удовлетворяющие сравнениям р = = 1 (mod 8), р = 3 (mod 8). Если pi,... ,рг простые числа вида 8п 4- 3, то число N = (pi • • • Рг)2 + 2 при делении на 8 имеет остаток 3 (выведите, что оно имеет простой делитель вида 8/с+З, отличный от р\, ..., рг). 6. р = 2 и все простые числа, удовлетворяющие сравнениям р = = ±1 (mod 8). Если pi,...,pr простые числа вида 8п — 1, то число N = (pi • • *Рг)2 — 2 при делении на 8 имеет остаток 7 (выведите, что оно имеет простой делитель вида 8fc — 1, отличный от pi, ... ,рг). 7. Если целые числа я, у удовлетворяют данному уравнению, то у нечетно. Выполняется равенство х2 + 1 = (у + 2)(?/2 — 2у + 4). Так как а — у1 — 2у + 4 = (у — 1)2 + 3 = 3 (mod 4), то а имеет простой делитель р = 4п + 3. Тогда ( — ) = — 1 иэто противоречит делимости р|(х2 + 1). V Р ) 8. Последовательность ап + Ь пробегает полную систему вычетов по модулю р. Глава 7 1. 3; 2; 6; 5. 3. Число 2 есть первообразный корень по модулям 3, 9, 27, 243. Первообразными корнями по модулям 162, 250, 343 будут соответственно числа 83, 127 и 3. 5. (Z/15Z)* = (7)(11), (Z/24Z)* = (7)(13)(17); (Z/120Z)* = (31)(41) х х (61)(97). 8. а) 5; б) 4; в) нет решений; г) 15. Глава 8 , Ж _ [11;3,4], « _ piM, If . „,, = [1; 2,3,2,2,1,1,7]. " /=• ГЛ -n ^ o 9 38 161 682 a) V5 = [2; 4], подходящие дроби 2, -, —, -^-, j^g; ,f „ 111;M, ig = [wl, If -ftw.»,,^- = [1; 2,3,2,2,1,1,7]. " /=• Гл -n ^ o 9 38 161 682 а) V5 = [2; 4], подходящие дроби 2, -, —, -^-, ^; ^ КЧ и ol * . 33 268 2177 б) VI7 = [4; 8], подходящие дроби 4, —, —, -^-; в) \/19 = [4; 2,1,3,1,2,8], подходящие дроби 4, -, у, —, —, —, 1421 "326~; , ч/10 + З fQT7—. . . 37 114 1405 г) = [3; 12,3], подходящие дроби 3, — > ~yf-> -^gg-- _ _, 161 268 170 114 Дроби ——, , , приближают соответствующие числа с 72 65 39 37 точностью до 10~4. с\СГ\
3. [1;Т] = i±^, [2; 4 + %/37 7 4.а)(х,у) = (8,62); б) (*,») = (8,33). 5. а) х + уу/Ш = ±(19 + 6v/lO)n, n 6 Z; б) х + yv^ = ±(8 + 3%/7)п, n € Z; в)х + у\/17 = ±(4+\/17)2п+1, n€Z; г) (х,у) = (±5, ±8), (ж, у) = (±8, ±5). 23 225 6. Подходящая дробь с номером 11 есть = 2,718281835... О О АХ Она с точностью до 10~8 приближает е = 2,718281828.... Глава 9 1. х4 — 10х2 +1. Степень числа 0 = \/2 + \/3 равна 4, множество его сопряженных состоит из четырех чисел ±\/2 ± \/3. 2. х3 - Ах2 + 9х - 11. 4.1 + 1У2-1й.
Список литературы 1. Арнольд И. В. Теория чисел. — М. : Учпедгиз, 1939. 2. Боревич 3. И. Теория чисел / 3. И. Боревич, И. Р. Шафаревич. — М. : Наука, 1985. 3. Бухштаб А. А. Теория чисел. — М. : Просвещение, 1966. 4. Венков Б. А. Элементарная теория чисел // ОНТИ НКТП СССР.-М.-Л., 1937. 5. Виноградов И. М. Основы теории чисел. — М. : Наука, 1981. 6. Гаусс К. Ф. Труды по теории чисел. — М. : Изд-во АН СССР, 1959. 7. Граве Д. А. Элементарный курс теории чисел. — Киев : Изд-во Ун-та Св. Владимира, 1913. 8. Диксон Л. Е. Введение в теорию чисел. — Тбилиси, 1941. 9. Диофант. Арифметика. — М. : Наука, 1974. 10. Егоров Д. Ф. Элементы теории чисел. — М. — Петроград: Госиздательство, 1923. 11. Лежен Дирихле Г. П. Лекции по теории чисел // ОНТИ НКТП СССР-М.-Л, 1936. 12. Ожигова Е. П. Развитие теории чисел в России. — Л. : Наука, 1972. 13. Сушкевич А. К. Теория чисел. — Харьков : Изд-во Харьковского ун-та, 1956. 14. Чебышев П. Л. Теория сравнений. Полное собрание сочинений. - Т. 1. - М. - Л. : Изд-во АН СССР, 1946. 15. Ферма П. Исследования по теории чисел и диофантову анализу. — М. : Наука, 1992. 16. Шидловский А. Б. Диофантовы приближения и трансцендентные числа. — М. : Физматлит, 2007. 17. Dickson L. E. History of theory of numbers. — Washington. Vol. I, 1919, Vol. II, 1920, Vol. III, 1923.
Оглавление Введение 3 Глава 1. О делимости чисел 7 1.1. Свойства делимости целых чисел 8 1.2. Наименьшее общее кратное и наибольший общий делитель . . 10 1.3. Алгоритм Евклида 14 1.4. Решение в целых числах линейных уравнений 18 Задачи для самостоятельного решения 28 Глава 2. Простые и составные числа 30 2.1. Простые числа. Решето Эратосфена. Бесконечность множества простых чисел 30 2.2. Основная теорема арифметики 33 2.3. Теоремы Чебышева 44 2.4. Дзета-функция Римана и свойства простых чисел 53 Задачи для самостоятельного решения 60 Глава 3. Арифметические функции 63 3.1. Мультипликативные функции и их свойства 63 3.2. Функция Мёбиуса и формулы обращения 65 3.3. Функция Эйлера 70 3.4. Сумма делителей и число делителей натурального числа ............ 72 3.5. Оценки среднего значения арифметических функций 75 Задачи для самостоятельного решения 79 Глава 4. Числовые сравнения 81 4.1. Сравнения и их основные свойства 81 4.2. Классы вычетов. Кольцо классов вычетов по данному модулю 83 4.3. Полная и приведенная системы вычетов 87 4.4. Теорема Вильсона 89 4.5. Теоремы Эйлера и Ферма 90 4.6. Представление рациональных чисел бесконечными десятичными дробями 92 4.7. Проверка на простоту и построение больших простых чисел 94 4.8. Разложение целых чисел на множители и криптографические применения 105 Задачи для самостоятельного решения 108 263
Глава 5. Сравнения с одним неизвестным 110 5.1. Основные определения 110 5.2. Сравнения первой степени 112 5.3. Китайская теорема об остатках 11.4 5.4. Полиномиальные сравнения по простому модулю 118 5.5. Полиномиальные сравнения по составному модулю 125 Задачи для самостоятельного решения 129 Глава 6. Сравнения второй степени 131 6.1. Сравнения второй степени по простому модулю 131 6.2. Символ Лежандра и его свойства 134 6.3. Квадратичный закон взаимности 135 6.4. Символ Якоби и его свойства 142 6.5. Суммы двух и четырех квадратов 145 6.6. Представление нуля квадратичными формами от трех переменных 152 Задачи для самостоятельного решения 157 Глава 7. Первообразные корни и индексы 158 7.1. Показатель числа по заданному модулю 158 7.2. Существование первообразных корней по простому модулю 160 7.3. Построение первообразных корней по модулям рк и 2рк ... 164 7.4. Теорема об отсутствии первообразных корней по модулям, отличным от 2, 4, рк и 2рк 167 7.5. Индексы и их свойства 170 7.6. Дискретное логарифмирование 174 7.7. Двучленные сравнения 181 Задачи для самостоятельного решения 184 Глава 8. Цепные дроби 185 8.1. Теорема Дирихле о приближении действительных чисел рациональными 187 8.2. Конечные цепные дроби 189 8.3. Цепная дробь действительного числа 193 8.4. Наилучшие приближения 199 8.5. Эквивалентные числа 203 8.6. Квадратичные иррациональности и цепные дроби 207 8.7. Использование цепных дробей для решения некоторых диофантовых уравнений 213 8.8. Разложение числа е в цепную дробь 222 Задачи для самостоятельного решения 225 Глава 9. Алгебраические и трансцендентные числа .... 226 9.1. Поле алгебраических чисел 226 9.2. Приближения алгебраических чисел рациональными. Существование трансцендентных чисел 234 264
9.3. Иррациональность чисел ег и к 239 9.4. Трансцендентность числа е 243 9.5. Трансцендентность числа к 246 9.6. Невозможность квадратуры круга 252 Задачи для самостоятельного решения 256 Ответы и указания 258 Список литературы 262
Учебное издание Нестеренко Юрий Валентинович Теория чисел Учебник Редактор А. Н. Мирошников Технический редактор Н. И. Горбачева Компьютерная верстка: Т. А, Клименко Корректоры В.АЖилкина, Г. Н. Петрова Изд. № 101109685. Подписано в печать 20.12.2007. Формат 60x90/16. Бумага офсетная № 1. Печать офсетная. Гарнитура «Тайме». Усл. печ. л. 17,0. Тираж 2000 экз. Заказ № 25624. Издательский центр «Академия», www.academia-moscow.ru Санитарно-эпидемиологическое заключение № 77.99.02.953.Д.004796.07.04 от 20.07.2004 117342, Москва, ул. Бутлерова, 17-Б, к. 360. Тел./факс: (495) 334-8337, 330-1092. Отпечатано в ОАО «Саратовский полиграфкомбинат». 410004, г. Саратов, ул. Чернышевского, 59. www.sarpk.ru.
ACADENTA Издательский центр «Академия» Учебная литература для профессионального образования Наши книги можно приобрести (оптом и в розницу) Москва 129085/ Москва, пр-т Мира, д. 101 в, стр. 1 (м. Алексеевская) Тел./факс: (495) 648-0507, 330-1092,334-1563 E-mail: sale@academia-moscow.ru Филиалы: Северо-Западный 198020, Санкт-Петербург, наб. Обводного канала, д. 211-213, литер «В» Тел.: (812) 251 -9253,252-5789,575-3229 Факс: (812) 251 -9253,252-5789 E-mail: fspbacad@peterstar.ru Приволжский 603005, Нижний Новгород, ул. Алексеевская, д. 24г и 24д Тел.: (8312)18-1678 E-mail: pf-academia@bk.ru Уральский 620144, Екатеринбург, ул. Щорса, д. 92а, корп. 4 Тел.: (343)257-1006 Факс: (343) 257-3473 E-mail: academia-ural@mail.ru Сибирский 630108, Новосибирск, ул. Станционная, д. 30 Тел. /факс: (383) 300-1005 E-mail: academia_sibir@mail.ru Дальневосточный 680014, Хабаровск, Восточное шоссе, д. 2а Тел./факс: (4212) 27-6022, E-mail: filialdv-academia@yandex.ru Южный 344037, Ростов-на-Дону, ул. 22-я линия, д. 5/7 Тел.: (863)253-8566 Факс:(863)251-6690 E-mail: academia-rostov@skytc.ru Представительство в Республике Татарстан 420094, Казань, Ново-Савиновский район, ул.Голубятникова, д. 18 Тел. / факс: (843) 520-7258,556-7258 E-mail: academia_kazan@mail.ru www. academia-moscow. ru
Предлагаем acadEm'a вашему вниманию следующие книги: С А. АГАФОНОВ, Т. В.МУРАТОВА ОБЫКНОВЕННЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ Объем: 240 с. В учебном пособии изложены основные методы обыкновенных дифференциальных уравнений. Наряду с традиционными разделами, входящими в этот курс, представлены метод построения первого интеграла для линейных систем произвольного порядка, а также анализ устойчивости систем общего вида. В отдельной главе рассмотрены многочисленные задачи из области естествознания, решение которых сводится к дифференциальным уравнениям. Для студентов высших профессиональных учебных заведений. Может быть полезно преподавателям математики, аспирантам. Н. Н. ГОЛОВАНОВ, Д. П. ИЛЬЮТКО, Г. В. НОСОВСКИЙ и др. КОМПЬЮТЕРНАЯ ГЕОМЕТРИЯ Объем: 512 с. В учебном пособии математически строго изложены все необходимые сведения из дифференциальной геометрии и топологии, даны основные понятия и инструменты компьютерной геометрии, приведено математическое описание некоторых важных алгоритмов геометрического моделирования и автоматического проектирования. Представлены последние результаты достижений в области компьютерной обработки современной цифровой фотографии — склейки проективно-преобразованных изображений. Для студентов учреждений высшего профессионального образования.
А. П. КРИЩЕНКО, А. Н. КАНАТНИКОВ АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ Объем: 272 с. В учебнике изложены основные понятия алгебры и аналитической геометрии. Рассмотрены линейные операции над векторами, понятие базиса; скалярное, векторное и смешанное произведения, использование векторной алгебры в решении геометрических задач; прямые на плоскости, прямые и плоскости в пространстве, кривые и поверхности второго порядка. Для студентов учреждений высшего профессионального образования. И.А. ЛАВРОВ МАТЕМАТИЧЕСКАЯ ЛОГИКА Под ред. Л.Л.МАКСИМОВОЙ Объем: 240 с. В учебном пособии изложены основы современного подхода к изучению математических теорий с привлечением логических понятий и методов, а также концепция программы Д.Гильберта о построении математических теорий аксиоматическим путем. Рассмотрены аксиоматические теории для множеств, натуральных и действительных чисел и для геометрии. Для студентов учреждений высшего профессионального образования. Г. А. МИХАЙЛОВ, А. В. ВОЙТИШЕК ЧИСЛЕННОЕ СТАТИСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ: МЕТОДЫ МОНТЕ-КАРЛО Объем: 368 с. В учебном пособии представлены как классические результаты, так и последние теоретические и методические разработки численного статистического моделирования. Рассмотрены методы моделирования случайных величин и процессов, численного интегрирования и решения интегральных уравнений второ- www. academia-moscow. ru
го рода, возможности применения методов Монте-Карло при решении задач теории переноса излучения и краевых задач для уравнений в частных производных. Для студентов учреждений высшего профессионального образования. Может быть полезно широкому кругу специалистов, использующих методы вычислительной математики в различных приложениях. Ю. Н. ПАВЛОВСКИЙ, Н. В. БЕЛОТЕЛОВ, Ю. И. БРОДСКИЙ ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ Объем: 236 с. В учебном пособии представлены материалы по разработке имитационных математических моделей сложных явлений, процессов, систем по компьютерной реализации моделей и организации интерфейсов в процессе выполнения имитационных экспериментов с моделями. Дан анализ моделируемых процессов. Приведены примеры имитационных математических моделей, иллюстрирующие составляющие технологии имитационного моделирования. Для студентов учреждений высшего профессионального образования. Может быть полезно аспирантам и научным работникам. Т. С СОБОЛЕВА, А. В. ЧЕЧКИН ДИСКРЕТНАЯ МАТЕМАТИКА Объем: 256 с. В учебнике рассмотрены общие (множества и отношения, алгебра и топология) и специальные (математическая логика, математическая кибернетика, математическая информатика) вопросы дискретной математики. Для студентов учреждений высшего профессионального образования. Может быть полезно аспирантам, научным работникам и специалистам в области прикладной математики и современных наукоемких информационных технологий.
В.Н.ТУТУБАЛИН ТЕОРИЯ ВЕРОЯТНОСТЕЙ Объем: 352 с. В учебном пособии изложено основное математическое содержание теории вероятностей, даны разнообразные примеры ее применений, в том числе приемы статистической обработки наблюдений. Понятия меры и интеграла Лебега (обычно не включаемые в математические курсы для технических специальностей) в учебном пособии не используются. Предполагается знание курса математического анализа (включая функции нескольких переменных) и основ линейной алгебры. Для студентов учреждений высшего профессионального образования. Е.Е.ТЫРТЫШНИКОВ МЕТОДЫ ЧИСЛЕННОГО АНАЛИЗА Объем: 320 с. В учебном пособии изложены основы численных методов — методы и алгоритмы матричного анализа. Рассмотрены вопросы приближения функций, методы решения нелинейных уравнений и минимизации. Помимо классических основ обсуждаются новые результаты и подходы, получившие развитие в последние годы (в частности, методы нелинейной аппроксимации для нелокальных операторов, тензорные декомпозиции, вейвлет-преоб- разования, общая теория многоуровневых матриц и др.). Для студентов учреждений высшего профессионального образования. Е.СВЕНТЦЕЛЬ ТЕОРИЯ ВЕРОЯТНОСТЕЙ Объем: 576 с. Учебник является одним из наиболее известных по теории вероятностей и предназначен для студентов, знакомых с высшей математикой и интересующихся техническими приложениями тео- www. academia-moscow. ru
рии вероятностей. Большое внимание в нем уделено различным приложениям теории вероятностей (теории вероятностных процессов, теории информации, теории массового обслуживания и др.). Для студентов учреждений высшего профессионального образования. Может быть полезен широкому кругу читателей, применяющих теорию вероятностей в практической деятельности. Е. С ВЕНТЦЕЛ Ь, Л. А. ОВЧАРОВ ТЕОРИЯ ВЕРОЯТНОСТЕЙ И ЕЕ ИНЖЕНЕРНЫЕ ПРИЛОЖЕНИЯ Объем: 464 с. В учебном пособии дано систематическое изложение основ теории вероятностей под углом зрения их практических приложений по специальностям: кибернетика, прикладная математика, ЭВМ, автоматизированные системы управления, теория механизмов, радиотехника, теория надежности, транспорт, связь и т.д. Несмотря на разнообразие областей, к которым относятся приложения, все они пронизаны единой методической основой. Для студентов учреждений высшего технического профессионального образования. Может быть полезно преподавателям, инженерам и научным работникам разных профилей, которые в своей практической деятельности сталкиваются с необходимостью ставить и решать задачи, связанные с анализом случайных процессов. www. academia-moscow. ru