Автор: Прасолов В.В.   Соловьев Ю.П.  

Теги: теория чисел   алгебра  

ISBN: 5-88688-018-6

Год: 1997

Текст
                    В. В. Прасолов, Ю. П. Соловьев
Эллиптические
функции
и
алгебраические
уравнения
Москва „Факториал" 1997


ББК 22.132 П 70 УДК 511.3 П 70 Прасолов В. В., Соловьев Ю. П. Эллиптические функции и алгебраические уравнения. — М.: Изд-во «Факториал», 1997. — 288 с. — ISBN 5-88688-018-6. Книга представляет собой вводный курс в теорию эллиптических функций и эллиптических кривых и предназначена для первого знакомства с предметом. Основные вопросы, рассматриваемые в книге — это геометрия кубических кривых, эллиптические функции и их свойства, эллиптические интегралы, теоремы сложения эллиптических функций и интегралов, теорема Абеля о лемнискате, теорема Морделла, тэта-функции, кривые Серре. Кроме того, вперые в учебной литературе, приводится вывод теоремы Ферма из некоторых гипотез об эллиптических кривых. В книге подробно изложена классическая теория решения общего алгебраического уравнения пятой степени в тэта-функциях. Ил. 46. Библиогр. 80. Издание осуществлено при финансовой поддержке Российского фонда фундаментальных исследований. Проект № 96-01-14036. Научное издание Прасолов Виктор Васильевич Соловьев Юрий Петрович Эллиптические функции и алгебраические уравнения. Редактор Попеленский Ф. Ю. Художник Рожковская Н. А. Формат 60 х 90/16. Гарнитура литературная. Усл. печ. л. 18. Бумага офсетная № 1. Подписано к печати 11.6.1997. Тираж 1300 экз. Заказ № 1790 Издательство «Факториал», 17449, Москва, а/я 331; ЛР № 063537 от 22.07.1994. Оригинал-макет подготовлен с использованием макропакета AP-TgX. Отпечатано во 2-й типографии издательства «Наука». 121099, Москва Г-99, Шу- бинский пер., 6. © В. В. Прасолов, Ю. П. Соловьев, 1997. ISBN 5-88688-018-6 © Факториал, оформление Рфи
ОГЛАВЛЕНИЕ Предисловие 5 Глава 1. Геометрия кубических кривых 9 § 1. Сложение точек кубической кривой 9 § 2. Прямые и кривые на проективной плоскости 18 § 3. Касательные и точки перегиба 22 § 4. Нормальные формы неособой кубической кривой 29 § 5. Особые кубические кривые 34 § 6. Неособая кубическая кривая не допускает рациональной параметризации 37 Глава 2. Эллиптические функции 39 § 1. Топологическое строение неособой кубической кривой в СР2 . . 41 § 2. Эллиптические функции 44 § 3. Функция Веиерштрасса 48 § 4. Дифференциальное уравнение для функции p(z) 52 § 5. Параметризация кубической кривой с помощью функции Веиерштрасса 54 § 6. Эллиптические интегралы 58 § 7. Теоремы сложения для эллиптических интегралов F(ip) и E(tp) . 65 § 8. Эллиптические функции Якоби 69 § 9. Теорема Веиерштрасса о функциях, обладающих алгебраической теоремой сложения 73 Глава 3. Дуги кривых и эллиптические интегралы 77 § 1. Дуги эллипса и гиперболы 77 § 2. Деление дуг эллипса 79 § 3. Кривые с эллиптическими дугами 86 § 4. Кривые, дуги которых выражаются через дуги окружности .... 90 Глава 4. Теорема Абеля о делении лемнискаты 93 § 1. Построение правильного 17-угольника. Элементарный подход . . 96 § 2. Построение правильных многоугольников. Элементы теории Га- луа 99 § 3. Уравнение деления лемнискаты 110 § 4. Доказательство теоремы Абеля о делении лемнискаты 120 § 5. Несколько замечаний о кривых Серре 129 Глава 5. Арифметика эллиптических кривых 145 § 1. Метод секущих Диофанта. Диофантовы уравнения второй степени 146 § 2. Сложение точек на кубической кривой 158 § 3. Некоторые примеры 163
4 ОГЛАВЛЕНИЕ § 4. Теорема Морделла 171 § 5. Ранг и группа кручения эллиптической кривой 178 § 6. Гипотеза Таниямы и последняя теорема Ферма 185 Глава 6. Алгебраические уравнения 201 § 1. Решение уравнений 3-й и 4-й степени 202 § 2. Симметрические многочлены 205 § 3. Резольвенты Лагранжа 207 § 4. Корни из единицы 210 § 5. Теорема Абеля о неразрешимости в радикалах общего уравнения пятой степени 215 § 6. Преобразование Чирнгауза. Уравнение пятой степени в форме Бринга 222 § 7. Уравнения пятой степени, разрешимые в радикалах 225 Глава 7. Решение уравнения S-й степени 239 § I. Определение тэта-функции 239 § 2. Нули тэта-функций 241 § 3. Соотношение 0* = % + 0* 242 § 4. Представление тэта-функций бесконечными произведениями . . . 243 § 5. Соотношение ¢((0) = пв0(0) в2(0) в3(0) 246 § 6. »т-функция Дедекинда и функции /, /,, /2 247 § 7. Преобразования тэта-функций по параметру т 249 § 8. Преобразования ^-функции Дедекинда 250 § 9. Общая схема решения уравнения пятой степени 252 § 10. Преобразования порядка 5 254 § 11. Замена т на т + 2 255 § 12. Замена т на -1/т 257 § 13. Замена т на Ы- 259 § 14. Функции, инвариантные относительно замен т на т + 2, -1/т и 2^4 262 § 15. Вывод модулярного уравнения 263 § 16. Решение уравнения 5-й степени 265 § 17. Основная модулярная функция j(r) 269 § 18. Фундаментальная область функции j(r) 271 § 19. Решение уравнения j(r) = с 274 § 20. Функции, инвариантные относительно замен тнат+1и-1/т 277 § 21. Функции, инвариантные относительно замен т на т + 2 и-1/т 277 § 22. Заключительные замечания 280 Список литературы 282 Предметный указатель 287
ПРЕДИСЛОВИЕ В июне 1796 г., в «Литературной газете», издававшейся в Иене, была помещена следующая заметка. НОВЫЕ ОТКРЫТИЯ Всякому начинающему геометру известно, что можно геометрически, т. е. циркулем и линейкой, строить разные правильные многоугольники, а именно треугольник, пятиугольник, пятнадца- тиугольник и те, которые получаются из каждого из этих путем последовательного удвоения числа его сторон. Это было уже известно во времена Евклида, и, как кажется, с тех пор господствовало убеждение, что область элементарной геометрии дальше не распространяется: по крайней мере, я не знаю удачной попытки распространить ее в эту сторону. Тем более кажется мне заслуживающим внимания открытие, что кроме этих правильных многоугольников может быть геометрически построено еще множество других, например, семнадцатиугольник. Это открытие является собственно лишь следствием одной еще не совсем законченной большой теории. Как только она обретет завершенность, то будет предложена публике. К. Ф. Гаусс из Брауншвейга, студент-математик в Гёттингене. Законченный вид эта теория обрела через пять лет. Она была опубликована в седьмом разделе знаменитых «Disquisitiones Arithmeticae» («Арифметических исследований») Гаусса, увидевших свет в 1801 г. Гаусс доказал, что если число п сторон правильного многоугольника имеет вид п = 2ар,.. .рк, где р{ — различные простые числа Ферма, т. е. простые числа вида 22"1 + 1, то многоугольник может быть построен циркулем и линейкой. На алгебраическом языке это утверждение означает, что для числа п указанного вида уравнение хп - 1 =0 может быть решено в квадратных радикалах. Доказательство теоремы Гаусса основано на изящной алгебраической теории, которая послужила краеугольным камнем для теории Галуа, созданной тридцать лет спустя после появления «Арифметических исследований».
6 ПРЕДИСЛОВИЕ В упомянутом седьмом разделе «Арифметических исследований» кроме теории деления круга, т. е. алгебраической теории круговых функций, содержится также краткое замечание Гаусса о том, что разработанный им метод может быть применен и к некоторым высшим трансцендентным функциям, в частности, к функциям, связанным с интегралами вида I . . Это заме- J V1 - х4 чание было отправной точкой для исследований Абеля, который в 1827 г. доказал, что на те же самые гауссовские п частей можно разделить с помощью циркуля и линейки лемнискату Бернулли. Для этого Абелю пришлось усовершенствовать метод Гаусса, и главное, создать новую математическую дисциплину — теорию эллиптических функций. Эта теория и ее геометрический двойник — теория эллиптических кривых — заняли одно из центральных мест в математике, синтезировав самые различные ее ветви. Несмотря на свой почтенный возраст, теория эллиптических функций и эллиптических кривых остается живой и бурно развивающейся областью математики и служит неиссякаемым источником исследовательской техники, задач и гипотез. Достаточно сказать, что в последнее десятилетие эллиптические функции и кривые стали предметом пристального внимания специалистов даже в таких неклассических областях, как алгебраическая топология и квантовая теория поля, а совсем недавно с помощью теории эллиптических кривых получено доказательство последней теоремы Ферма. Предмет настоящей книги — это теория эллиптических интегралов, эллиптических функций и эллиптических кривых, развитая в той степени, которая необходима для доказательства теоремы Абеля о лемнискате. Основные вопросы, рассматриваемые в книге — это геометрия кубических кривых, эллиптические функции и их свойства, эллиптические интегралы, теоремы сложения эллиптических функций и интегралов, дуги алгебраических кривых, выражаемые в эллиптических интегралах, теорема Абеля о лемнискате. Кроме того, мы рассматриваем арифметические свойства эллиптических кривых, теорему Морделла, вывод теоремы Ферма из некоторых гипотез об эллиптических кривых, тэта-функции и решение общего алгебраического уравнения пятой степени в тэта-функциях. Иными словами, книга представляет собой вводный курс в теорию эллиптических функций и эллиптических кривых и предназначена для первого знакомст-
ПРЕДИСЛОВИЕ 7 ва с предметом. В то же время, мы надеемся, что она окажется интересной и для профессионалов. Основу книги составили три лекции, прочитанные одним из нас (Ю. С.) в 1991/92 учебном году в цикле студенческих чтений Московского математического общества. Изложенный в книге материал был собран воедино для специального курса, реализованного вторым автором (В. П.) в 1992/93 учебном году в Московском независимом университете. Во время работы над книгой В. прасолов получал финансовую поддержку от Российского Фонда Фундаментальных Исследований (проект № 95- 01-00846). Предварительная версия книги была опубликована в виде лекционных заметок *) . Мы признательны редактору книги Ф. Ю. Попеленскому за плодотворное сотрудничество. При написании книги мы использовали обширную литературу — как классические труды, так и различные современные работы. Большое влияние на нас оказала замечательная статья М. Роузена из «American Mathematical Monthly» [В 14], содержащая современное доказательство теоремы Абеля. Много полезного мы почерпнули из прекрасных руководств Вебера [Б11], Хьюзмоллера [Б31], Коблица [Б 17] и Степанова [Б27]. Книга не предполагает у читателя никаких предварительных знаний, выходящих за пределы младших курсов математических специальностей университетов, и ориентирована на самый широкий круг читателей: студентов-математиков и физиков, школьных учителей и даже школьников старших классов. Надеемся, что читатель, познакомившийся с предметом настоящей книги, сможет ощутить то очарование тонкого искусства, которое испытывали мы, разбирая работы старых мастеров. г. Москва, октябрь 1996 г. *) Прасолов В. В., Соловьев Ю. П. Эллиптические функции. Специальный курс. — М.: Издательство МК НМУ, 1993. Прасолов В. В., Соловьев Ю. П. Алгебраические уравнения ■ тэта-функции. — М.: Издательство МК НМУ, 1994.
ГЛАВА 1 ГЕОМЕТРИЯ КУБИЧЕСКИХ КРИВЫХ § 1. Сложение точек кубической кривой Плоской алгебраической кривой называется множество точек (х,у) е R2, удовлетворяющих уравнению f(x,y) = 0, где f(x>y) — ненулевой многочлен. На некоторых плоских кривых существуют естественные групповые законы сложения точек. Простейшими примерами таких кривых являются прямая и окружность. Для того, чтобы определить сложение точек на прямой, зафиксируем на ней некоторую точку О. Суммой точек прямой X и Y будем считать такую точку Z, что Ol = Ш+OY. Очевидно, что точки прямой образуют коммутативную группу относительно этой операции сложения. Суммой двух точек (г cos а, г sin а) и (г cos /3, г sin /3), окружности х2 + у2 = г2 будем считать точку (г cos(a+ < t + /3),rsin(a + /3)). Этот закон сложения точек геометрически можно проинтерпретировать следующим образом. Пусть Е = = (г, 0), А и В — произвольные точки единичной окружности. Проведем через точку Е прямую, параллельную прямой АВ; она пересекает окружность в точке С. Будем считать точку С суммой точек А и В Рис. 1 (рис. 1).
10 ГЛ. 1 ГЕОМЕТРИЯ КУБИЧЕСКИХ КРИВЫХ В таком виде определение годится для любой коники, т. е. кривой второго порядка. Фиксируем на конике некоторую точку Е и будем считать суммой точек А и В точку, в которой прямая, проведенная через точку Е параллельно прямой АВ, вторично пересекает конику. Коммутативность полученной операции очевидна, нулевым элементом служит точка Е. Для нахождения элемента —А нужно провести через точку А прямую, параллельную касательной в точке Е. Закон ассоциативности проверяется несколько сложнее. Рассмотрим на конике точки А, В и С. Обозначим точки А + В и В + С через Р и Q соответственно. Равенство А + (В + С) = (А + В) + С эквивалентно следующему утверждению: «Если А, В, С, Е, Р и Q — точки коники, причем АВ \\ ЕР и ВС || EQ, то AQ || СР». Это — частный случай теоремы Паскаля о шестиугольнике, вписанном в конику. Для параболы у = х2 с фиксированной точкой Е = (0,0) суммой точек (ж,, у,) и (х2,у2) будет точка (х1+х2,у1 +у2 + 2х1х2). Для гиперболы ж2 — у2 = 1 с фиксированной точкой Е = (1,0) суммой точек (ж,,ух) и (х2,у2) будет точка (ж,ж2 + уху2,ухх2 + у2хх). При параметризации х = cht, у — sh t это сложение соответствует сложению параметра t. Кубической кривой называется плоская алгебраическая кривая Y^aixly3 ~ 0, где наибольшее значение i + j равно трем. м На любой неособой кубической кривой (свойства этих кривых мы подробно обсудим в § 3) тоже существует естественный закон сложения точек. Закон сложения несовпадающих точек произвольной кубической кривой можно определить следующим образом. Отметим на ней произвольную точку Е. Чтобы сложить точки А и В, проведем прямую АВ. Она пересечет кубическую кривую в некоторой точке X. Точку пересечения прямой ХЕ с кубической кривой будем считать суммой точек А и В (рис. 3). Е Рис. 2
§ 1. СЛОЖЕНИЕ ТОЧЕК КУБИЧЕСКОЙ КРИВОЙ 11 А+В Рис. 3 В определении сложения дважды использовано следующее свойство кубической кривой: если прямая пересекает ее в двух точках, то она пересекает ее еще ровно в одной точке. Это свойство кажется почти очевидным. В самом деле, из уравнения прямой ах + + by + с = 0 можно выразить х или у и подставить в уравнение кубической кривой. Получим уравнение третьей степени. По условию у него есть два вещественных корня, а значит, должен быть и третий вещественный корень. В действительности все не так просто. И дело не только в том, что уравнение может иметь кратные корни. Его степень может оказаться меньше трех. С этим нам еще придется разобраться (см. § 2), потому что иначе операция сложения точек будет неполноценной: складывать можно будет не все точки. Коммутативность полученной операции очевидна. Легко проверить также, что Е — нулевой элемент. Докажем ассоциативность операции. \А + с Равенство (А + В) + С = (А + С) + В эквивалентно тому, что точка пересечения прямых, соединяющих точки А + В и С, А + С и В, лежит на кубической кривой (рис. 4). Обозначим изображенные на рис. 4 прямые следующим образом: Pl=AC, р2 = Е(А + В), Рз = В(А + С), qx=AB, q2 = E(A + C), Рис 4 q3 = C(A + B). Будем считать, что все точки пересечения прямых рг и q- попарно А + В
12 ГЛ. 1. ГЕОМЕТРИЯ КУБИЧЕСКИХ КРИВЫХ различны. Тогда утверждение, которое нужно доказать, можно сформулировать следующим образом: Теорема 1. Пусть А^ — точка пересечения прямых pi и q-, где 1 ^ г, j ^ 3, причем точки Aj,- попарно различны. Про все точки А^, кроме точки А33, известно, что они лежат на некоторой кубической кривой. Тогда точка А33 тоже лежит на этой кубической кривой. Доказательство. Пусть р,(ж,у) = 0 и q.(x,y) = = 0 — уравнения прямых pi и д,-. Тогда уравнение третьей степени р{р2р3 = 0 задает тройку прямых рх, р2 и р3, а уравнение 91¾¾ = 0 задает тройку прямых qv q2 и q3. Кубическая кривая архр2р3 + /9^¾¾ = 0 проходит через все точки А,--. Оказывается, что в таком виде можно представить уравнение любой кубической кривой, проходящей через восемь из девяти точек Afj. Докажем это. Выберем в качестве осей координат прямые р, и qx, т. е. будем считать, что pt(x,y) = у и qi(x,y) = х. Пусть рассматриваемая кубическая кривая задается уравнением Р(х,у) = 0. Функции Р(0,у) и ур2(0,у)р3(0,у) обращаются в нуль в трех точках Ап, А21 и А31, лежащих на оси Оу (рис. 5). Кроме того, эти функции — многочлены степени не более трех. Следовательно, Р(0,у) = аур2(0,у)р3(0,у). Аналогично P(x,0) = /3xq2(x,0)q3(x,0). Рассмотрим многочлен Q(x, у) = Р(х, у) - аур2(х, у)р3(х, у) - /Зх q2(x, у) q3(x, у). Ясно, что Q(0,y)=P(0,y)-ayp2(0,y)p3(0,y)=0. Многочлен %(у) + а1(у)х + а1(у)х2 + ... Рис. 5
§ 1. СЛОЖЕНИЕ ТОЧЕК КУБИЧЕСКОЙ КРИВОЙ 13 тождественно равен нулю при х = 0 лишь в том случае, когда %(у) = 0, т. е. этот многочлен делится на х. Аналогичные рассуждения показывают, что многочлен Q(x,y) делится и на у, т. е. Q(x,y) = xyQi(x,y). Степень многочлена Q(x, у) не превосходит трех, поэтому Q{(x,y) — линейная функция или константа. Вспомним теперь, что в точках А22, А23 и А32 обращаются в нуль многочлены Р, р2р3 и q,q3, а значит, в этих точках обращается в нуль и многочлен Q. А так как во всех этих точках ху ф 0, то в них обращается в нуль и линейная функция Qv Точки А22, А23 и А32 не лежат на одной прямой, а для ненулевой линейной функции / уравнение f(x,y) = 0 определяет прямую. Следовательно, Q, = 0, т. е. Р = ар,р2р3 + /9д1д29з- ^ частности, точка А33 лежит на кривой Р(х,у) = 0. D Мы доказали также, что любая кубическая кривая, проходящая через точки Ау, задается уравнением архр2р3 + Pqxq2q3 = 0. Иными словами, такие кривые образуют однопараметрическое семейство. С помощью теоремы 1 можно получить очень простые доказательства двух классических теорем. Теорема 2 (Паскаль). Точки пересечения противоположных сторон вписанного шестиугольника лежат на одной прямой. Доказательство. Пусть pl = АВ, qx = ВС, р2 = EF, q2 = DE, р3 = CD, q3 = AF (рис. 6). В качестве кубической кри- Рис. 6
14 ГЛ. 1. ГЕОМЕТРИЯ КУБИЧЕСКИХ КРИВЫХ вой возьмем кривую, заданную уравнением QI = 0, где Q = = О — уравнение окружности, 1 = 0 — уравнение прямой UV, г U и V — точки пересечения прямых р{ и q2, р2 и qx соответственно. Пусть W — точка пересечения прямых р3 и q3. Про все остальные точки пересечения прямых pi и q- известно, что они лежат на кривой QI = 0. Следовательно, точка W тоже лежит на этой кривой, причем именно на прямой I, а не на окружности. □ Вместо окружности Q = 0 можно взять любую кривую второго порядка. В частности, можно считать, что Q = pq, где р и q — линейные функции. В ~~"~~^-—^.^ этом случае мы получим теоре- \\~~ /4~-~— МУ Паппа. \ \/ \ ~~~^Г~— Теорема 3 (Папп). На \ц/4^ J^(u/ прямой р взяты точки А, 7% /*\ /\_ ~~ С и Е, на прямой q взяты / V-^ /\ \ точки В, D и F. Прямые АВ /у^\ / \\ и DE, ВС и EF, AF и CD пе- ^^ \у ^s^ ресекаются в точках U, V и D В f W соответственно (рис. 7). Тогда точки U, V и W ле- Рис. 7 жат на одной прямой. Доказательство. Дословно повторим доказательство теоремы Паскаля, считая, что Q = pq — уравнение, задающее пару прямых р и q. □ Теорему 1 иногда приходится применять и в тех случаях, когда некоторые из точек At- совпадают. Поэтому следует понять, как нужно изменить ее формулировку, чтобы она оставалась верной и в таких ситуациях. Попарное различие точек А{- использовалось для обоснования двух утверждений: 1) в точках А22, А23 и А32 величина ху отлична от нуля, поэтому линейная функция Q( в них обращается в нуль; 2) эти точки не лежат на одной прямой, поэтому Qx = 0. В процессе доказательства теоремы 1 используются лишь ограничения многочлена Р на прямые р{ и q-. Поэтому можно ожидать, что вместо попарного различия точек А-- достаточно предположить следующее: «Если две, соответственно три, точки А-;, лежащие на прямой р{ или q- совпадают, то ограничение многочлена Р на эту прямую имеет в этой точке корень кратности два, соответственно три». Это изменение относится и к точке А„„.
§ 1. СЛОЖЕНИЕ ТОЧЕК КУБИЧЕСКОЙ КРИВОЙ 15 Покажем, что так сформулированная теорема 1 остается верной. Доказательство того, что многочлен Q = P- ар{р2р3 - Pq{q2q3 делится на ху = р,д,, сохраняется без изменений. Если А-- = = Aik = А, то в точке А ограничение Р на р{ имеет корень кратности два, ограничение р{р2р3 тождественно равно нулю, а ограничение ¢,¾¾ имеет корень кратности два, так как qAA^) = = 0 и q^(Aik) = 0. Следовательно, в точке А ограничение Q на pt имеет корень кратности два. Для прямой q-, а также в случае трех совпадающих точек рассуждения аналогичны. Теперь ясно, что в точках А22, А23 и А32 линейная функция Q, по-прежнему обращается в нуль. В том случае, когда некоторые из этих точек совпадают, нужно воспользоваться тем, что ненулевая линейная функция на прямой не может иметь корень кратности два. Что же касается утверждения теоремы 1, то ясно, что для ограничения функции ар\Р2р3 + Pqxq2q3 на прямую р3 кратность корня в точке А33 равна количеству прямых q-, проходящих через эту точку. Для прямой Z, касающейся кривой F(X) = 0 в точке Х0, ограничение F на I имеет в точке Х0 корень кратности два. В самом деле, пусть точка X, движется по этой кривой к точке Х0. Ограничение функции F на прямую Х0Х, имеет корни Х0 и Хх. В предельном положении прямая Х0Х{ совпадает с I и корни Х0 и Х{ сливаются в один корень кратности два (рис. 8, а). Слияние трех корней происходит на касательной в точке перегиба (рис. 8,6). Более подробно точки кратного пересечения прямой и кубической кривой мы обсудим в § 3. Рис. 8 а) Рис. 8 б) Для кривых степени п ^ 3 теорему 1 можно обобщить следующим образом.
16 ГЛ. 1. ГЕОМЕТРИЯ КУБИЧЕСКИХ КРИВЫХ Теорема 4. Пусть А^ — точка пересечения прямых pi и q-, где 1 ^ г, j ^ п, причем точки А^ попарно различны. Про все точки Ац, для которых i + j < п + 3, известно, что они лежат на кривой степени п. Тогда и остальные точки А^ тоже лежат на этой кривой. Доказательство. Проведем индукцию по степени кривой п. База индукции п = 3 была рассмотрена при доказательстве теоремы 1. Пусть теперь п > 3. Выберем в качестве осей координат прямые р, ид,. Пусть кривая, о которой идет речь в условии теоремы, задается уравнением Рп(х,у) = = 0. Тогда Рп(0,у) = ар{ ... рп и Рп(х,0) = (3q{ ... qn. Рассмотрим многочлен Qn = Pn-apx...pn-f3q{... ... qn. Достаточно доказать, что Qn = = 0. Легко проверить, что Qn де- ^_ лится на ху = p{q{, т. е. Qn = Ак = PiQiQn-2- Остается доказать, что ненулевой многочлен Qn_2 степени не Рис. 9 более п — 2 не может обращаться в нуль в точках А^, где i,j > 2 и i+j < п + 3 (на рис. 9 они изображены для п = 5). Предположим, что такой ненулевой многочлен Qn_2 существует. Его ограничение на прямую р2 обращается в нуль в та- 1 точке А22, А23, ..., А2п. Следовательно, ограничение Qn_2 на эту прямую тождественно равно нулю, т. е. Qn_2 = РгЯп-з- Многочлен Qn_3 обращается в нуль в точках, образующих аналогичную конфигурацию меньшего размера (на рис. 9 эти точки обведены). Эти рассуждения показывают, как делается шаг индукции. □ Метод доказательства геометрических теорем с помощью семейства кривых рхр2рг + /J?i?2?3 = 0 был разработан немецким математиком Юлиусом Плюккером (1801-1868). Идея представить тройку прямых как вырожденную кубическую кривую оказалась весьма плодотворной. Доказательства многих сложных геометрических теорем сводились теперь к умелому подбору коэффициента fi, который стал часто появляться в статьях Плюкке- ра. Такая алгебраизация геометрии не всем пришлась по душе. Якоб Штейнер (1796—1863), один из крупнейших геометров того времени, отказывался даже приписывать знаки геометрическим
§ 1. СЛОЖЕНИЕ ТОЧЕК КУБИЧЕСКОЙ КРИВОЙ 17 величинам и предпочитал вместо этого рассматривать различные варианты расположения точек. И при этом ему порой удавалось получать более тонкие и глубокие результаты, чем Плюккеру. О новых алгебраических методах в геометрии Штейнер отзывался неодобрительно. Задачи. 1. Прямые АВ и CD пересекаются в точке Р, ВС и AD — в точке Q. Кубическая кривая проходит через точки А, В, С, D, Р, Q. Докажите, что касательные в точках Р и Q пересекаются в точке, лежащей на этой кривой. Указание. Примените теорему 1 в случае, когда A3l = = Аг2 и Ахъ = А23. 2. Прямая пересекает кубическую кривую в точках А, В и С. Касательные в точках А, В и С пересекают кривую в точках Av В1иС1. Докажите, что точки А{, В{ и С, лежат на одной прямой. Указание. Примените теорему 1 в случае, когда р{ — р2. 3. Восьмиугольник со сторонами lv...,l& вписан в конику. Докажите, что восемь точек пересечения прямых lt и 1-, где j — — г = 3 (mod 8), лежат на одной конике. Указание. Пусть р{ = l2i_v q{ = l2i, С, = 0 — исходная коника, С2 = 0 — коника, проходящая через пять из восьми оставшихся точек пересечения прямых pi и q.-. Примените теорему 2 к кривой СХС2 = 0. 4. Докажите.что уравнение любой кривой степени п— 1, проходящей через все точки пересечения прямых р{ = 0,... ,рп = О, имеет вид где А1,...,АП — некоторые константы. (Предполагается, что все точки пересечения попарно различны.) Указание. Пусть С = 0 — уравнение такой кривой. Рассмотрим прямую I, не проходящую через точки пересечения прямых Р}. Числа можно подобрать так, что во всех п точках пересечения прямой I с прямыми рг выполняется равенство
18 ГЛ. 1. ГЕОМЕТРИЯ КУБИЧЕСКИХ КРИВЫХ Такое же равенство выполняется тогда в п точках любой из прямых Pj. § 2. Прямые и кривые на проективной плоскости В предыдущем параграфе упоминалось о том, что сложение точек кубической кривой определено, вообще говоря, не для всех точек. Покажем это на примере кривой у2 = х(х- 1)(х-2) (2.1) (рис. 10). Подставив в (2.1) уравнение прямой х = 1/2, получим у2 = 3/8. Степень этого уравнения равна двум, а не трем. Значит, прямая х = 1/2 пересекает кривую (2.1) лишь в двух точках, причем пересечения не кратные. Попытка сложить эти точки не увенчается успехом. Если (ж, у) — точка кривой (2.1), то х х lim - = lim . — х—>оо у х—>оо л/х^ 3 х j = lim -= = 0. 1->00 у/Х Естественно предположить, что кривая (2.1) и прямая х = 1/2 проходят еще через одну точку — «бесконечно Рис 10 удаленную» точку в направлении оси Оу. Более того, недостающие точки пересечения могут оказаться на бесконечно удаленной прямой. Попытаемся к точкам обычной плоскости для каждого направления I добавить точку, в которой пересекаются параллельные прямые направления I. Сделать это нужно еще и потому, что иначе наши формулировки и доказательства теорем Паппа и Паскаля будут не совсем аккуратными. Мы ведь всегда предполагали.что рассматриваемые прямые пересекаются, но они могут быть и параллельными. Можно, конечно, отдельно рассматривать случаи, когда некоторые прямые пересекаются, а некоторые параллельны. Но это весьма утомительно, потому что
§ 2. ПРЯМЫЕ И КРИВЫЕ НА ПРОЕКТИВНОЙ ПЛОСКОСТИ 19 каждый случай требует не только отдельной формулировки, но и отдельного доказательства. Рассмотрим некоторую точку О, не лежащую в плоскости П, и сопоставим каждой точке А е П прямую О А. Прямой I е П будет при этом сопоставлена вся плоскость Ol, содержащая точку О и прямую I, за исключением прямой /', проходящей через точку О параллельно I. Если прямая Z, е П параллельна прямой I, то плоскости Ol и Olx пересекаются по прямой /'. Ясно также, что если точка А удаляется по прямой I в бесконечность, то предельным положением прямой О А будет прямая /'. Определим проективную плоскость RP2 следующим образом. Назовем точками RP2 прямые, проходящие через точку О. Прямыми RP2 назовем плоскости, проходящие через точку О. При этом прямые, параллельные плоскости П, соответствуют бесконечно удаленным точкам плоскости П, а плоскость, параллельная плоскости П, соответствует бесконечно удаленной прямой плоскости П. На проективной плоскости любые две прямые пересекаются в одной точке. Проективные прямые, соответствующие параллельным прямым плоскости П, пересекаются в точке бесконечно удаленной прямой. Если про плоскость П забыть, то бесконечно удаленные точки ничем не будут отличаться от остальных точек. Для работы с алгебраическими кривыми нужно ввести координаты на проективной плоскости. Будем считать, что точка О расположена в начале системы координат, а плоскость П задана уравнением 2=1. Прямая, проходящая через точку О, состоит из точек вида (Хх, Ху, Xz), где числа х, у, z фиксированы. Поэтому точками RP2 можно назвать ненулевые тройки вещественных чисел (x,y,z), причем тройки (ж, у, z) и {Хх,Ху, Xz) считаются эквивалентными. Бесконечно удаленная прямая задается уравнением 2 = 0. В определении проективной плоскости числа х,у, z и А можно считать комплексными. В этом случае получим определение комплексной проективной плоскости СР2. Геометрия алгебраических кривых в СР2 существенно проще, чем в RP2. Это связано с тем, что над полем С любой многочлен n-й степени имеет с учетом кратности ровно п корней. Кривой у2 = х(х- 1)(ж-2)
20 ГЛ. 1. ГЕОМЕТРИЯ КУБИЧЕСКИХ КРИВЫХ можно сопоставить кривую y2z = х (х — z) (х — 2z) на проективной плоскости. В самом деле, это уравнение действительно задает кривую на проективной плоскости, так как точки (х, у, z) и (Хх, Ху, \z) одновременно либо удовлетворяют ему, либо не удовлетворяют. Кроме того, на плоскости П, заданной уравнением 2=1, оба уравнения совпадают. Аналогичным образом алгебраической кривой J2 aijx%V^ — 0 можно сопоставить кривую на проективной плоскости ]П о.^х%у3zn~l~i = 0, где п = max (г + j). Теперь уже можно проверить, правильно ли было наше предположение, что прямая х = z/2 и кривая y2z = х(х — — z) (х — 2z) пересекаются в бесконечно удаленной в направлении оси Оу точке. Подставив выражение х = z/2 в уравнение кривой, получим y2z = 3z3/8. Это уравнение имеет решения трех видов: 2 = 0, у = kz и у = ~kz, где к = ^/3/8. Следовательно, прямая х = z/2 на проективной плоскости пересекает рассматриваемую кривую действительно в трех точках: (1/2,^/378,1), (1/2,-^/3/8,1), (0,1,0). Третья точка — бесконечно удаленная в направлении оси Оу. Можно даже нарисовать, как выглядят прямая х = z/2 и рассматриваемая кривая в окрестности бесконечно удаленной точки (0,1,0). Для этого нужно вместо плоскости z = 1 взять какую- нибудь плоскость, проходящую через точку (0,1,0) и не проходящую через начало координат. Возьмем, например, плоскость у = 1. На ней мы получим кривую z = x(x — z)(x — 2z). При малых х и z она выглядит почти как кривая z = х3 (рис. 11). Переход к проективной плоскости оказывается спасительным не только в разобранном выше случае. Любая прямая на проективной плоскости либо целиком принадлежит кубической кривой, либо пересекает ее с учетом кратности ровно в трех комплексных точках. Найти точки пересечения прямой ах + Ъу + + cz = 0 и кубической кривой 0 Рис. 11 i+j+k=3 (tyxVz*
§ 2. ПРЯМЫЕ И КРИВЫЕ НА ПРОЕКТИВНОЙ ПЛОСКОСТИ 21 на проективной плоскости можно следующим образом. Одно из чисел а, Ь, с отлично от нуля. Пусть, например, с ф 0. Тогда z = ах + (Зу, где а = —а/с и /3 = — b/с (случай а = /3 = 0 не исключается). Подставив это выражение в уравнение кубической кривой, получим уравнение вида Q(x,y) = Y,bpxpy3-p- Возможны два случая. 1) Все коэффициенты Ь равны нулю. Тогда прямая ах + + by + cz = 0 целиком принадлежит кривой, т. е. Q делится на ax + by + cz. 2) Не все коэффициенты b равны нулю. Тогда Q(x,y) = bxrys (х - txy) ...(х- tmy), где r+s+m = 3. Множителю хг соответствует (r-кратная) точка пересечения (0,1,/3), множителю у3 — точка (1,0, а), множителю х - t{y — точка (<г-, 1, at{ + /3). У кубического многочлена Q с вещественными коэффициентами может быть либо три вещественных корня, либо один. Поэтому любая прямая на проективной плоскости пересекает с учетом кратности кубическую кривую либо в трех вещественных точках, либо в одной. Тем самым, со сложением несовпадающих точек кубической кривой мы почти разобрались. Неприятности остаются лишь для особых кривых с точками самопересечения или точками возврата. Дело в том, что любая прямая, проходящая через такую точку, имеет с кривой кратное пересечение (см. задачи 2 и 3). Поэтому при сложении такой точки с любой Другой точкой мы должны были бы всегда получать один и тот же результат. Более подробно об особых кубических кривых мы поговорим в § 5. Задачи. 1. Докажите, что кривая у2 = х3 + рх + q пересекает бесконечно удаленную прямую z = 0 в одной точке, причем кратность пересечения равна трем. 2. Докажите, что в точке (0,0) любая прямая пересекает кривую у1 = х2 (х+1) с кратностью не меньше двух, а для прямых У ~ ±ж кратность равна трем.
22 ГЛ. 1. ГЕОМЕТРИЯ КУБИЧЕСКИХ КРИВЫХ 3. Докажите, что в точке (0,0) любая прямая пересекает кривую у2 = х3 с кратностью не меньше двух, а для прямой у = 0 кратность равна трем. 4. Докажите, что на комплексной проективной плоскости любая окружность проходит через бесконечно удаленные точки (1,г,0)и(1,-г,0). § 3. Касательные и точки перегиба Для сложения точек А и В, лежащих на кубической кривой, нужно провести прямую АВ. А как следует поступить в том случае, когда точки А и В совпадают? Будем считать, что точка А неподвижна, а точка В движется к А по данной кривой. Тогда при определенных условиях (сформулированных ниже) прямая АВ стремится к некоторой фиксированной прямой — касательной в точке А. Поэтому для нахождения суммы А + А вместо прямой АВ нужно провести касательную в точке А. Если кривая, проходящая через точки А и В, задается уравнением F = 0, то ограничение F на прямую АВ имеет корни в точках А и В. В предельном положении, когда точки А и В совпадают, ограничение F в точке А имеет кратный корень. Таким образом, ограничение F на касательную имеет кратный корень в точке касания. Это свойство можно использовать для того, чтобы получить уравнение касательной. Пусть точка Р = (р{,р2,р3) принадлежит кривой F = 0, т. е. F(P) = 0, а X = (ж,,ж2,ж3) — произвольная точка. Точки проективной прямой РХ имеют вид АР + цХ; отличные от X точки этой прямой имеют вид Р + tX. Рассмотрим ограничение F на прямую РХ как функцию t. В интересующем нас случае F есть многочлен степени три, поэтому F(P + tX) = F(P) + at + bt2+ ct3 = Q(t), где F(P) = 0, a=£F.(P)*., b=l-y£Fij(P)xlxj (Fj — производная F по г'-й переменной). Точка P соответствует значению t = 0. Многочлен Q(t) имеет в нуле кратный корень, если a = 0, т. е. Yl^i(P)xi = 0- Точка Р, для которой хотя
§ 3. КАСАТЕЛЬНЫЕ И ТОЧКИ ПЕРЕГИБА 23 бы одно из чисел F^P) отлично от нуля называется неособой точкой кривой. Для неособой точки Р уравнение ]Г] Fi(P)xi = О однозначно определяет прямую I, касающуюся кривой в точке Р. Геометрически касательная к кривой определена однозначно, независимо от системы координат. При нашем подходе независимость определения касательной и особой точки от выбора системы координат пока не видна. Докажем инвариантность этих определений. Посмотрим, что происходит при замене координат (xvx2,x3) на (upUj.Ug), где х{ = Y,aijuj- ПУСТЬ G(uvu2,u3) = F(xl(u),x2(u),x3(u)). Тогда 9G=vaf^=v 1 ди- *-<дх{дщ £-< г ч" J г г J г Так как матрица J = (¾) невырожденная, то набор (GVG2,G3) ненулевой тогда и только тогда, когда набор (FVF2,F3) ненулевой. Если / и g — строки (FVF2,F3) и (GVG2,G3), х и и— столбцы (х1,х2,х3) и (uv и2, и3), то х = Ju и g = fJ. Поэтому gu — (fJ)(J~lx) = fx, а значит, уравнения fx = О и gu = О определяют одну и ту же прямую. Чтобы перейти от проективных координат (х1, х2, х3) к обычным координатам (xvx2), нужно положить х3 = 1. Для соблюдения условия х3 = 1 точки прямой РХ нужно записать в виде Р +1 (X - Р). Разложение F(P + t(X-P)) = Y,Fi(P)(xi-Pi)t + ... позволяет записать уравнение касательной в виде Fl(P)xl+F2(P)x2 = Fx{P)Px+F2(P)p2. Для проективных координат, т. е. в случае однородной функции F, выражение ^Щ^)Рг равняется нулю. Дело в том, что Для любого однородного многочлена F степени п справедлива формула Эйлера y£Fi(X)xi = nF(X). Эту формулу достаточно проверить для монома ж[ж|жд. где r+t+ + в = п. Для положительных г, s и t производные этого монома
24 ГЛ. 1. ГЕОМЕТРИЯ КУБИЧЕСКИХ КРИВЫХ по ж,, х2 и х3 равны гх\ 'ж|жд, sx\x^ [х13 и tx^x^x^ '. После домножения их соответственно на х,, х2 и ж3 получим гх[х|жз> [ж^Жз- Остается вспомнить, что r + s+t = п. Случай, когда среди чисел г, s и t есть нулевые, разбирается аналогично. Пусть Р — неособая точка кривой F = 0. Тогда определена касательная / в точке Р. Ограничение многочлена F на прямую / имеет в точке Р кратный корень. Если кратность этого корня не меньше трех, то Р называется точкой перегиба. Иными словами, из условия а = £ F{(P) х{ = О должно следовать, что т. е. квадрика £ Fiji?) xixj = 0 должна содержать прямую Напомним, что многочлен второй степени х1 Ах, записанный в матричной форме, делится на линейную функцию хт/ лишь в том случае, когда х1 Ах = хТ1тТх. Это означает, что матрица A = lmT есть произведение столбца на строку, т. е. имеет ранг 1. В частности, det А = 0. Таким образом, если Р — точка перегиба, то det(F-(Р)) = 0. Покажем, что для неособой точки кривой верно и обратное, т. е. если Р — неособая точка и det (F-(P)) = 0, то Р — точка перегиба. Рассмотрим квадрику Точка Р принадлежит ей, так как согласно формуле Эйлера Кроме того, прямая YlFi(p)xi = 0 касается этой квадрики в точке Р. В самом деле, уравнение касательной к квадрике Y^Fij(P)xlxJ=0 в точке Р имеет вид Y^Fij(P)xiPj=0, а согласно формуле Эйлера Y,Fij(P)xiPj=2Y,Fi(P)xi.
§ 3. КАСАТЕЛЬНЫЕ И ТОЧКИ ПЕРЕГИБА 25 Поэтому касательная к кривой в точке Р касается квадрики Y,Fij{P)xixj=Oi которая вырождена в силу условия det(F-(Р)) = 0. Следовательно, квадрика состоит из пары прямых и целиком содержит касательную. Подведем итоги. Точки пересечения кривых F = 0 и Н = 0, где Н(Х) = det(Fy(X)), содержат все точки перегиба кривой F = 0. Точками перегиба не будут лишь особые точки кривой F = 0. Кривая Н = О называется кривой Гессе, или гессианом, кривой F = 0. Если F — однородный многочлен степени п, то Ftf—однородный многочлен степени п —2. Поэтому Н — однородный многочлен степени 3 (п — 2). Для кубического многочлена F многочлен Н тоже кубический. Инвариантность понятия точки перегиба и инвариантность кривой Гессе доказываются почти так же, как мы доказывали инвариантность касательной. Пусть G(uvu2,u3) = Г(ж1(и),ж2(и),ж3(г*)), где ж,- = Yl aijuj- ТогДа d2G v d2F дх{ dXj = Р9 duDdua 4-? дхidxi дип диа ^aip ijajq' т. e. (G^ = JT {F{j)J, где J = (a{j). Следовательно, det (GM) = = (det J)2 det {F{j■). Поэтому условия det (F{j) = 0 и det(Gw) = 0 эквивалентны. Нахождение точек перегиба кривой сводится к нахождению точек ее пересечения с гессианом. Для этого требуется найти точки пересечения двух кривых. В этом случае, когда одна из кривых — прямая, мы это уже делали. Уравнение прямой позволяет выразить одну переменную через другую. Подставив это выражение в уравнение кривой, можно исключить одну переменную. Для кривых произвольной степени тоже можно исключить одну переменную, но сделать это несколько сложнее. Для большей наглядности мы сначала рассмотрим кривые в обычных координатах (ж, у) и лишь затем перейдем к проективным координатам (х, у, z). Для простоты ограничимся случаем кривых третьей степени.
26 ГЛ. 1. ГЕОМЕТРИЯ КУБИЧЕСКИХ КРИВЫХ Многочлены f(x,y) и h(x,y) третьей степени можно записать в виде f(x, У) = %У3 + «1 (х) у2 + (^(х) у + а3(х), h(x, у) = Ь0у3 + 6, (х) у2 + Ь2(х) у + 63(ж), где ак(х) и Ьк(х) — многочлены степени не более к, О < к < 3. Если (ж0, у0) — общая точка кривых f(x, у) = О и h(x, у) = О, то многочлены Му) = %У3 + а{у2 + а2у + а3 К(У) = ьоУ3 + Ь\У2 + Ь2У + &з> где ак = ак(х0) и bk = Ьк(х0), рассматриваемые как многочлены от переменной у, имеют общий корень у0. Верно и обратное: если /0 и hQ имеют общий корень у0, то кривые /(ж, у) = 0 и h(x, у) =0 пересекаются в точке (ж0, у0). Над полем С у двух многочленов общий корень есть тогда и только тогда, когда у них есть общий делитель (над полем R общий делитель может не иметь корней). Если Oq60 Ф О, то у многочленов /0(у) и h0(y) общий делитель есть тогда и только тогда, когда существуют такие многочлены Л, и /,, что fQhl = hQfif причем степени h{ и /, меньше, чем степени h и f соответственно. В самом деле, если у /0 и hQ есть общий делитель d, то можно положить /, = /0d_1 и hl = hQd~l. А если f0hl = h0fv причем deg/j < deg/0, то в hf{ должны входить все простые множители, входящие в /0, причем в тех же степенях. Войти же все в /, они не могут. Ограничение о^ Ф О, безусловно, обременительное, но в проективном случае удовлетворить ему будет легко. Пусть h\(y) = ЩУ2 + ЩУ + Щ, f[(y) = v0y2+vly + v2. Равенство fhl = hf{ можно записать в виде ^uo+%ui -Vo-V'i 03^0+02^,+0,^2-63^(,-62^,-6,^2 Од^+О^ -63^,-63¾ a3u2 -b3v2 0, 0, 0, 0, 0, 0.
§ 3. КАСАТЕЛЬНЫЕ И ТОЧКИ ПЕРЕГИБА 27 Эта система линейных однородных уравнений относительно и и v имеет ненулевое решение тогда и только тогда, когда ее определитель равен нулю, т. е. "1 % ft„ а3 = 0. (3.1) Этот определитель называется результантом многочленов / и h. Коэффициенты ак и Ьк зависят от х, поэтому определитель (3.1) есть многочлен R от х, возможно нулевой. Для каждого корня х0 многочлена R(x) у кривых f(x, у) = 0 и h(x, у) = 0 есть общая точка (х0,у0). Отметим, что в вещественном случае при х0 £ R число у0 не обязательно вещественно. Если многочлен Щх) нулевой, то у кривых есть общая компонента. Повторим теперь предыдущие рассуждения для проективных координат, записав многочлены / и h в виде /(ж, у, г) = a0z3 + аДж, у) z2 + а^ж, у) г + а3(ж, у), h(x, у, z) = b0z3 + ft, (ж, у) z2 + Ь2(х, y)z + Ь3(х, у), где ак и ftfc однородные многочлены степени к, 0 ^ к ^ 3. Координаты можно выбрать так, чтобы кривые /=0и/1 = 0не проходили через точку (0,0,1). Тогда будет выполняться нужное нам условие а^ Ф 0. Определитель (3.1) в проективном случае есть некоторый многочлен R(x,y). Докажем, что он либо нулевой, либо однородный степени девять. В самом деле Д(Аж, Ху) = «о А а, «о Aft, А2^ Аа, «о Aft, A2ft^ A3ft, A3a3 A2a2 A3a3 \a{ A2a2 A3a3 A3ft, Aft, A2ft0 A3ft, Домножим вторую и пятую строки на А, а третью и шестую на А2. В результате получим определитель R(x,y), в котором fc-й столбец домножен на Afc. Следовательно, А6Д(Аж, Ху) = \l5R(x,y), ■r.e.R(\x,Xy) = X9R(x,y).
28 ГЛ. 1. ГЕОМЕТРИЯ КУБИЧЕСКИХ КРИВЫХ В общем случае, для многочленов степеней тип степень многочлена Щх, у) равна тп. Действительно, Xp+qR{Xx,Xy) = XrR(x,y), п(п — 1) где р= 1 +2 + ... + (п- 1) = m (тп — 1) 2 2 (m + n)(m + n- 1) r=l + ... + (m+п-1)= -1^ -. Легко проверить, что г — р — q = mn. Ненулевой многочлен R(x,y) можно представить в виде 9 YI (У{Х - х{у), где числа xi и yi не обращаются в нуль одновре- i=l менно. Для каждой из девяти пар (ж,-, у{) найдется такое число г,-, что (х^у^г{) — точка пересечения кривых / = 0 и h = 0. Многочлен Щх, у) может иметь кратные корни, т. е. некоторые пары (ж,',у,-) могут быть пропорциональными. Поэтому девять различных общих точек есть не у любой пары кубических кривых. Но на комплексной проективной плоскости одна общая точка есть всегда. Значит, у любой неособой кубической кривой есть точка перегиба. Именно это свойство нам понадобится в следующем параграфе. Задачи 1. Докажите, что точка (хо,у0) кривой у — f(x) является точкой перегиба тогда и только тогда, когда f"(x0) = 0. 2. Докажите, что все точки кривой у2 = (х — х,) (х — х2) (х — х3) неособые тогда и только тогда, когда числа xi попарно различны. 3. Докажите, что все точки кривой у = (х - х,) (х - х2) (х - х3), кроме точки (0,1,0), неособые.
§ 4. НОРМАЛЬНЫЕ ФОРМЫ НЕОСОБОЙ КУБИЧЕСКОЙ КРИВОЙ 29 4. Пусть А и В — точки перегиба кубической кривой, С — третья точка пересечения прямой АВ с кубической кривой. Докажите, что С— точка перегиба. Указание. Примените теорему 1.1 в случае, когда pl = = р2=р3 = АВ, qv q2 и q3 — касательные в точках А, В и С. 5. Касательные к кубической кривой в точках А и В пересекаются в точке перегиба Р, прямая АВ пересекает кривую в точке С. Докажите, что PC — касательная. Указание. Примените теорему 1.1 в случае, когда р, — касательная в точке Р, р2 = р3 = АВ, ql и q2 — касательные в точках А и В, q3 = PC. § 4. Нормальные формы неособой кубической кривой Кубическая кривая называется неособой, если все ее точки неособые. В этом параграфе мы докажем, что над полем С уравнение неособой кубической кривой линейными заменами однородных координат можно привести к любому из следующих видов: 1) y2z = х3 + pxz2 + qz3 (форма Вейерштрасса), 2) х3 + у3 + z3 = ЗХхуг. При этом в первом случае многочлен х3 + рх + q не имеет кратных корней (иначе кривая особая), а во втором случае Л3 ф 1 (иначе кривая состоит из трех прямых). Рассмотрим неособую кубическую кривую над полем С. В предыдущем параграфе было доказано, что у нее есть точка перегиба. Можно считать, что точка перегиба имеет координаты (0,1,0), причем касательная в этой точке задается уравнением 2 = 0. Иными словами, ограничение функции F{x, y,z) = Y^ aijxiyj z3-{-j на прямую z = 0, т. е. многочлен Оз0ж3 + a2lx2y + al2xy2 + а^у3,
30 ГЛ. I. ГЕОМЕТРИЯ КУБИЧЕСКИХ КРИВЫХ имеет корень ж = 0 кратности три. Следовательно, с^, = а12 = = Oqj = 0, но а30 ф 0, так как иначе рассматриваемая кривая целиком содержала бы прямую 2 = 0. Касательная в точке (0,1,0) задается уравнением Fs(0,1,0)х + ^(0,1,0)у+ ^(0,1,0)2 = 0. Поэтому ^(0,1,0) = Fj,(0,l,0) = 0, но F2(0,1,0) ф 0, так как иначе точка (0,1,0) была бы особой. Однородный многочлен Fz(x,y, z) степени 2 при x=z=0ny= 1 принимает значение Ощ. Можно считать, что ат= 1- ^ обычных, не проективных координатах уравнение кривой запишется тогда в виде у2 - 2 (ах + Ь) у + Р3(х) = О, где Р3 — многочлен третьей степени. Сделав замену ух = у — — ах — Ь, получим у\ — (ах + Ь)2 + Р3(х) = 0, т. е. у2 = Q3(x), где Q3(x) = (ах + Ь)2 — Р3(х) — многочлен третьей степени. Заменой х = Аж, + /j, его можно привести к виду х\ + рхх + q. Многочлен Q3 не имеет кратных корней, так как иначе уравнение кривой можно было бы привести к виду у2 = х2 (ах + /?), а для такой кривой начало координат есть особая точка. В предыдущем параграфе было доказано, что с учетом кратности кубическая кривая имеет 9 точек перегиба. Но мы не смогли выяснить, все ли они различны. Если уравнение неособой кубической кривой записать в виде у2 = Q3(x), то легко найти точки ее пересечения с гессианом и доказать, что все они различны. Теорема 1. Неособая кубическая кривая в СР2 имеет ровно 9 различных точек перегиба. Доказательство. Можно считать, что многочлен Q3 имеет корень х — 0, т. е. рассматриваемая кривая задается уравнением /(ж, у) = 0, где /(ж, у) = у2 - х3 - ах2 - Ьх. Так как у многочлена Q3 нет кратных корней, то Ь Ф 0 и а2 — АЬ ф 0. Чтобы получить уравнение кривой Гессе, перейдем к однородным координатам: Тогда H(x,y,z) = F(x,y,z) = y2z- —6х — 2az 0 0 22 -2ах - 2bz 2у х3 - ax2z — —2ах — 2bz 2у -2Ъх = 8 [(у2 -+- bxz) (Зж + az) — (ах + bz)2 z],
§ 4. НОРМАЛЬНЫЕ ФОРМЫ НЕОСОБОЙ КУБИЧЕСКОЙ КРИВОЙ 31 В обычных координатах уравнение кривой Гессе имеет вид h(x,y) = у2 (Зх + о) + Ьх(3х + а) - (ах + Ь)2. Найти точки пересечения кривых / = 0 и h = 0 можно легко. Запишем равенство / = 0 в виде у2 = х3 + ах2 + Ьх и подставим это выражение в уравнение h = 0. В результате получим (ж3 + ах2 + Ьх) (Зх + а) + Ьх (Зх + а) - (ах + Ъ)2 = О, т. е. q(x) = Зх4 + Аах3 + ЬЬх2 — Ь2=0. Докажем, что многочлен q(x) не имеет кратных корней. Его производная равна 12 (х3 + + ах2 + Ьх). Поэтому Ч(х)-^Г hx+a-^\=(Ab-a2)x2. Предположим, что q(xQ) = д'(ж0) = 0. Тогда х0 ф 0, так как д(0) = — Ь2 ф 0. С другой стороны (46 - а2)х\ = 0, причем АЬ — — а2фО. Поэтому х0 = 0. Получено противоречие. Мы доказали, что многочлен q(x) имеет четыре различных корня х^ Каждому корню xi соответствуют два разных значения у, так как у2 = х\ + ах\ + Ъх{ = д'(ж^)/12 ф 0. Итак, кривые F = 0 и Н = 0 имеют 8 точек пересечения в конечной области z ф 0. А так как F(x, у,0) = -х3 и Н(х,у,0) = 2Аху2, то на прямой z = О кривые F = 0 и Н = 0 имеют ровно одну общую точку (0,1,0). □ Любая прямая, проходящая через две точки перегиба, содержит еще одну точку перегиба. В самом деле, можно считать, что одна из точек перегиба имеет координаты (0,1,0). Если (х0,у0) — общая точка кривой у2 = х3 + ах2 + Ьх и ее гессиана у2 (Зх + о) + Ьх (Зх + а) = (ах + Ь)2, то (х0, —у0) — тоже их общая точка. Точ- № (0) 1»Р) и (ж0, ±2/0,1) лежат на прямой Рис. 12 а) х = x0z. Конфигурация из 9 точек перегиба и 12 содержащих их прямых схематично изображена на рис. 12, а). Более симметричная схема этой конфигурации изображена на рис. 12,6). 10(0,1,0)
32 ГЛ. I. ГЕОМЕТРИЯ КУБИЧЕСКИХ КРИВЫХ Теорема 2. Заменой координат девять точек перегиба кубической кривой можно перевести в следующий набор точек: (0,1,-1), (0,£2,-е), (0,е,-е2), (-1,0,1), (-е2,0,1), (-£,0,1), (1,-1,0), (-£,1,0), (-£2,1,0), где £3 = 1 и £ ф 1, т. е. е2 + £ + 1 = 0. Доказательство. Прямые 189, 463, 527 (рис. 12, б) не могут пересекаться в одной точке. В самом деле, пусть R — общая точка этих прямых. Любые четыре точки общего положения в СР2 можно перевести проективным преобразованием в любые другие четыре точки общего положения. Поэтому можно считать, что точки R, 1, 5 и 6 вещественные. Но тогда вещественными будут и все остальные точки конфигурации. Легко убедиться, что это невозможно. Добавив прямую 145 к указанной тройке прямых, получим четверку прямых общего положения. Поэтому можно считать, что прямые 145, 189, 463 и 527 задаются уравнениями х + у + + z = 0, х = 0, у = 0 a z = 0 соответственно. Тогда координаты точек перегиба имеют следующий вид: (0,1,-1), (0,а,-Ь), (0,c,-d), (-1,0,1), (-а',0,1), (-с',0,1), (4.1) (1,-1,0), (-6', 1,0), (-cf, 1,0), причем все числа a,b,...,d' ненулевые. Точки (0, а, ~Ь), (—а',0,1), (—6', 1,0) лежат на одной прямой, а именно на прямой 862. Поэтому ab' = ba1. Можно считать, что а= а' и Ь = У. Аналогично с = с' и d = dl. Рассмотрев прямые 167 и 123, получим соответственно а = = d и b = с. Рассмотрев прямые 538 и 596, получим at = be и с = ad. Следовательно, Ь3 = 1 и a = b2. Ясно также, что b ф 1. Подставив в (4.1) значения а = е2, Ъ = е, с = е и d = £2, получим требуемые точки.
§ 4. НОРМАЛЬНЫЕ ФОРМЫ НЕОСОБОЙ КУБИЧЕСКОЙ КРИВОЙ 33 Легко проверить, что остальные восемь прямых, содержащих тройки данных точек, имеют уравнения вида x+ay+(3z = О, где а и Р принимают значения 1, ей е2. □ С помощью теоремы 2 легко доказать, что любую неособую кубическую кривую можно привести к виду ж3+у3 + z3 + 3Xxyz = = 0. В самом деле, пусть точки перегиба данной кривой имеют координаты, указанные в условии теоремы 2. Эти точки лежат как на тройке прямых xyz = 0, так и на тройке прямых (х + у + z) (ж + еу + e2z) (ж + е2у + ez) = 0. Поэтому любая кубическая кривая, проходящая через эти девять точек, задается уравнением fixyz + v(x + y + z)(x + ey + e2z) (ж + е2у + ez) = 0. Остается заметить, что (х + у + z) (х + еу + e2z) (х + е2у + ez) = х3 + у3 + z3 - 3xyz. Задачи 1. Докажите, что линейной заменой х' = ах + Ь кривую у2 = (х — ж,) (х — х2) {х — х3) можно привести к виду у2 = х>(х>-1)(х'-\), где А = (ж3 - ж,): (х2 - ж,). При этом для одной и той же кривой может получиться шесть разных значений А, а именно, А, А-1, 1-А, (1-А)-1,(А-1)А-1,А(А-1Г1. 2. Пусть F = 0 — уравнение кубической кривой, Н = 0 — уравнение ее гессиана. Докажите, что XF+цН = 0 — уравнение кубической кривой с теми же точками перегиба, что и у исходной кривой (предполагается, что кривая невырожденная). 3. Докажите, что кривая x3 + y3 + z3 = 3Xxyz неособая тогда и только тогда, когда А3 ф 1. 4. Докажите, что кривая x3+y2z+axz2 = 0 служит гессианом своего гессиана.
34 ГЛ. 1. ГЕОМЕТРИЯ КУБИЧЕСКИХ КРИВЫХ 5. Докажите, что кривая ж3 + у3 + z3 = Зцхуг служит гессианом кривой х3 + у3 + z3 — ЗХхуг тогда и только тогда, когда 4 +Л3 6. Преобразовать кривую у2 = х(\ -ж)(1 -Л2ж), л9 4fc (l + k)H (\+k)(\-kt) полагаял = (Ttwх= отиту = (1+^)3 • 7. Преобразовать кривую х3 + у3 - Зх - Зу + 4 = О, х - 1 полагая и = , v = у — 1. У- 1 8. Преобразовать кривую х3 + у3 + 3 (х2 + у2) + 2(х + у) + 1 = О, полагая и = х + у, v = ху. 9. Исследовать действие рационального преобразования и = 1, v = у/х на кривую х2 - х3 - у2 = 0. Сделать то же самое для кривой х2 — хА — у2 = 0. § 5. Особые кубические кривые Уравнение неособой кубической кривой можно записать в виде у2 = (х-х1)(х - х2)(х - ж3), где числа ж,, х2 и х3 попарно различны. В вещественном случае такая кривая изображена на рис. 13. Пусть ж, < х2 < ж3. При слиянии корней ж, и ж2 получается кривая у2 = ж2 (ж - 1) (рис. 14, а). При слиянии корней ж2 и х3 получа- Рис. 13 ется кривая вида у2 = ж2(ж + 1) (рис. 14, б). Над полем Ж эти кривые различны, но над полем С
§ 4. НОРМАЛЬНЫЕ ФОРМЫ НЕОСОБОЙ КУБИЧЕСКОЙ КРИВОЙ 35 их различие исчезает. При слиянии всех трех корней получается кривая у2 = х3 (рис. 14, в). Для всех этих трех кривых начало координат — особая точка. Рис. 14 а) Рис. 14 б) Рис. 14 в) Любая прямая у = кх пересекает кривые у2 — х2 (х ± 1) и х3 в особой точке не менее чем двукратно. В самом деле, х3 корень х = О не У для уравнений к2х2 = х2 (х ± 1) и к 2™2 _ менее, чем двукратный. Поэтому для любой прямой, соединяющей особую точку с другой точкой кубической кривой, третьей точкой пересечения будет особая точка. Тем самым, сложение особой точки с любой другой точкой всегда должно приводить к одному и тому же результату. Поэтому для особой точки определить сложение не удастся. Но если особую точку исключить, то /2 — х° сложение как для кривой у" = х2 (х+1), так и для кривой у2 точек определить можно. Мы докажем, что если в качестве нулевого элемента в обоих случаях взять бесконечно удаленную точку, то кривая у2 — = х2 (х + 1) над полем Ш. превращается в группу ненулевых действительных чисел по умножению, а кривая у2 = х3 — в группу действительных чисел по сложению. Начнем с кривой у2 = х3. Она допускает рациональную параметризацию х = t~2, с прямой ах + by + с — у = t . Точки пересечения этой кривой О определяются соотношением ct3 + at + b = 0. Если прямая не проходит через особую точку, то с ф 0. В этом случае получаем кубическое уравнение с нулевым коэффициентом при t2. Сумма корней такого уравнения равна нулю: t, + -I-12 + t3 — 0. Возьмем в качестве нулевого элемента Е бесконечно удаленную точку, соответствующую параметру tE = 0.
36 ГЛ. I, ГЕОМЕТРИЯ КУБИЧЕСКИХ КРИВЫХ Пусть точкам А и В данной кривой соответствуют значения параметра tA и tB. Прямая АВ пересекает кубическую кривую в точке X; при этом tA + tB + tx = 0. Прямая EX пересекает кривую в точке А + В, т. е. tE ■+ tx + tA+B ~ 0. Следовательно, tA+B = — tx = tA + tB. При сложении точек кривой у2 = х3 складывается соответствующие им значения параметра t. Отметим, что особой точке соответствует значение параметра t = оо. Кривая у2 = х2 (х + 1) также допускает рациональную параметризацию. В самом деле, пусть у = tx. Тогда t2x2 = х2 (х+ 1), т. е. х = t2 — 1 ку — tx = t3 —t. Прямая ax+by+c = 0 пересекает кривую у2 = х2 (х+ 1) в точках, значения параметра для которых удовлетворяют соотношению a(t2 - l) + b(t3~t) + c = 0. Если b ф 0, то после деления на Ь получим кубическое уравнение с коэффициентом 1 при t3 и -1 при t. Корни такого уравнения удовлетворяют соотношению V2 + V3 + V1 =~L Более простое соотношение можно получить после замены t = = (1+т)(1 — т)-1. В самом деле, легко проверить, что тхт2т3 = 1. Возьмем в качестве нулевого элемента Е бесконечно удаленную точку, соответствующую значению параметра тЕ = 1. Для нахождения суммы А + В нужно рассмотреть точку X, в которой прямая АВ пересекает кубическую кривую. Так как тАтвтх = 1 ТХТЕТА+В = 1, ТО т А+В + 00 При сложении точек кривой Рис. 15 у = х (х+ 1) соответствующие им значения параметра т перемножаются. Особой точке соответствует не одно, а два значения каждого из параметров t и т, а именно i = ±1 и г = 0, оо (рис. 15).
§ 6. НЕОСОБАЯ КРИВАЯ НЕ ДОПУСКАЕТ ПАРАМЕТРИЗАЦИИ 37 Задачи 1. Докажите, что точки (t^2,f[3),... ,(t^2,t^3), лежащие на кривой х3 = у2, принадлежат одной кривой второго порядка тогда и только тогда, когда tl + ... +16 = 0. 2. Кривая у2 = х2 (х - 1) имеет рациональную параметризацию х = t2 + 1, у = t3 + t. Докажите, что точки, соответствующие значениям параметра t{, t2 и t3, лежат на одной прямой тогда и только тогда, когда i,i2 + t2t3 + t3t{ = 1. 3. Неприводимая кривая третьего порядка, имеющая особую точку с несовпадающими касательными, имеет три точки перегиба, лежащие на одной прямой. Ее уравнение можно привести к виду у2 = х2 (х — 1). 4. Неприводимая кривая третьего порядка, имеющая особую точку с совпадающими касательными, имеет одну точку перегиба. Ее уравнение можно привести к виду у2 = х3. § 6. Неособая кубическая кривая не допускает рациональной параметризации Особые кубические кривые, которыми мы занимались в предыдущем параграфе, допускают рациональную параметризацию. Но никакая неособая кубическая кривая такой параметризации не допускает. Напомним, что неособую кубическую кривую можно привести к виду у2 = х (х - 1) (х - А), где Л ф 0,1. Теорема 1. Если А ф 0, 1, то не существует таких многочленов Рх, Р2, Q{, Q2, что функции y(t) = Pl(t)/P2(t) и x(t) = Q{(t)/Q2(t) не постоянные и удовлетворяют соотношению у2 = х(х — 1) (ж — Л). Доказательство. Предположим, что Р,(t)/P2(t) и Qi(t)/Q2(t) — не константы, причем Л2 = Qi Qi-Q2 Qi-^2 '! Ц?2 т»2 ^2 Тогда можно считать, что многочлены Р, и Р2 взаимно просты, Q\ и *?2 тоже взаимно просты. Так как P?Q32 = PtQtiQt -QJiQt - \Q2),
38 ГЛ. 1. ГЕОМЕТРИЯ КУБИЧЕСКИХ КРИВЫХ то многочлен Р2, который взаимно прост с Р2, делится на Q\, а многочлен Q\, который взаимно прост с Q,, Ql — Q2 и Ql — XQ2, делится на Р22. Следовательно, многочлены Ql и Р22 пропорциональны. Поэтому после замены многочлена Р, на пропорциональный ему многочлен можно получить равенство P^ = Ql(Ql-Q2)(Qi -л^)- (6-1) Кроме того, многочлен Q\ — квадрат некоторого многочлена, а значит, Q2 тоже квадрат некоторого многочлена. Многочлены Qx, Q, —Q2 и Qx — \Q2 попарно взаимно просты, поэтому из равенства (6.1) следует, что каждый из них — полный квадрат. Итак, в семействе многочленов вида aQx + /3Q2, где a, (J € С, нашлись четыре полных квадрата, а именно, Q,, Q2, Qx — Q2, Qx — \Q2. Эти многочлены не пропорциональны и попарно различны, поскольку Л ф О,1. Чтобы прийти к противоречию, покажем, что на проективной прямой aQx +/3Q2, где многочлены Q, и Q2 взаимно просты, а,/3 е С и не обращаются в нуль одновременно, не более трех точек могут быть полными квадратами. Предположим, что на этой проективной прямой нашлись четыре полных квадрата. Два из них обозначим через R\ и R\. Так как Щ не пропорционально R\, то два оставшихся полных квадрата можно представить в виде a,i?2 — (ixR\ и a2R\ — (52R\. Многочлены Rx и R2 взаимно просты и поэтому многочлены y/c^iRl ± ^/^iR2 должны быть полными квадратами, причем не пропорциональными. Таким образом среди многочленов aRx +/3R2, где Я, и R2 — взаимно просты, а,/3 е С и не обращаются в нуль одновременно, существуют четыре попарно не пропорциональных квадрата. В результате от проективной прямой aQx + (3Q2, на которой есть четыре полных квадрата, мы переходим к проективной прямой aRx + /3R2, на которой тоже есть четыре полных квадрата. От полученной проективной прямой можно перейти к следующей и т. д. Но при каждом таком переходе максимальная степень многочлена вида aQx + /3Q2 уменьшается по крайней мере в два раза. Получено противоречие. □ Задача Приведите пример взаимно простых многочленов Q, и Q2, для которых многочлены Qx, Qx + Q2h Qx+ 2Q2 являются полными квадратами.
ГЛАВА 2 ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ Сложение точек окружности связано с ее параметризацией функциями синус и косинус. В самом деле, рассмотрим отображение /: R —> S1, заданное формулой /(£) = (cost,sint). Это отображение параметризует окружность действительными числами таким образом, что сложение точек окружности соответствует сложению действительных чисел. Аналогичная параметризация существует и для кубических кривых. Она получается с помощью эллиптических функций. При этой параметризации сложение точек кубической кривой, определенное в гл. 1, соответствует сложению значений параметра. В этой главе мы изучим основные свойства эллиптических функций и покажем, как с их помощью можно параметризовать неособую кубическую кривую. Своим названием эллиптические функции обязаны эллипсу, хотя связь эта косвенная. Связующим звеном между ними послужили эллиптические интегралы. Дело в том, что длина дуги эллипса выражается эллиптическим интегралом некоторого частного вида. Именно отсюда и произошло название — «эллиптический интеграл». А эллиптические функции возникли при обращении эллиптических интегралов другого частного вида, никак не связанных с длиной дуги эллипса. Эллиптические интегралы появились еще в XVII в. при вычислении длин дуг некоторых кривых. Помимо эллипса, важным примером для развития этой теории послужила лемниската Бернулли, длина дуги которой выражается интегралом вида а f dx \ -, . Для этого интеграла в первой половине XVIII в. J V 1 — ж4 о
40 ГЛ. 2. ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ итальянский математик граф Фаньяно получил теорему сложения а Р 7 Г dx С dx _ С dx J vT=V+ J vT^V- J vT^7' 0 0 0 где _ ay/T^pi + pVY^tf 7 ~ 1 + a2/?2 Исследования Фаньяно заинтересовали Эйлера. Ему удалось получить теорему сложения для интегралов более общего вида а С dx о где Р(х) = 1 + тх2 + тгж4. При этом а /3 т J VPR+ J ffi = J s/РЩ' 0 0 0 где _ сх^/РЩ + /Зу/PR 7 1 - raa2/?2 Эйлер получил также теоремы сложения более общего вида. Над развитием теории эллиптических интегралов много лет неутомимо трудился Лежандр. Свои результаты он изложил в книге «Exercises de calcul integral» («Упражнения по интегральному исчислению»), опубликованной в 1811-1819 гг. Переработанное издание этой книги вышло в 1827-1832 гг. под названием «Traite des fonctions elliptiques et des integrales euleriennes» («Трактат об эллиптических функциях и эйлеровых интегралах») [А7]. Эти три тома большого формата содержат огромное количество теорем о свойствах эллиптических интегралов и их приложениях. Эллиптическими функциями Лежандр называл то, что сейчас называют эллиптическими интегралами. После появления работ Абеля и Якоби значение книги Лежандра померкло. Но сами Абель и Якоби о книге Лежандра отзывались с большим уважением, как она того и заслуживает.
§ 1. ТОПОЛОГИЧЕСКОЕ СТРОЕНИЕ КУБИЧЕСКОЙ КРИВОЙ В СР2 41 Собственно теория эллиптических функций начинается с работы Абеля «Recherches sur les fonctions elliptiques» («Исследования по эллиптическим функциям») [А1], которая была опубликована в 1827-1828 гг. в журнале Крелля. Абель показал, что при обращении эллиптического интеграла первого рода _ С dx J \/(1 -сх2)(1 + ех2) появляется функция <р(а), имеющая в комплексной области два периода. Он детально исследовал уравнения, связывающие р(а) и <р(па). Почти одновременно с Абелем теорией эллиптических функций начал заниматься Якоби [А 15]. Это привело к напряженному, хотя и недолгому состязанию между ними. Не имея постоянной работы, почти в нищете Абель завершил вторую часть «Recherches ...» и продолжил интенсивные исследования. Но вскоре он тяжело заболел и умер в 1829 г. в возрасте 27 лет. Многое из того, что было обнаружено Абелем и Якоби, задолго до них знал Гаусс, но он не опубликовал своих результатов. § 1. Топологическое строение неособой кубической кривой в СР2 Эллиптические функции удобно рассматривать как функции комплексного переменного. Многие их свойства выявляются лишь на комплексной плоскости, а не на вещественной прямой. Параметризация кубической кривой тоже более наглядна над полем С. Поэтому мы начнем с того, что выясним, как устроена топологически неособая кубическая кривая в СР2. Оказывается, что с топологической точки зрения все такие кривые устроены одинаково; все они—двумерные торы. Уравнение любой неособой кубической кривой в СР2 можно привести к виду y2z = (х — axz){x — a2z)(x — a3z), (1-0 где числа а, попарно различны. Это уравнение определяет в СР2 комплексную кривую, комплексная размерность которой равна 1, а вещественная равна 2. Чтобы выяснить топологическое строение кривой (1.1) в СР2, рассмотрим проекциюр: СР2\(0,1,0) —> СР', при которой
42 ГЛ. 2. ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ точка (x,y,z) переходит в точку (x,z). Комплексная проективная прямая СР1 (одноточечная компактификация С) гомеоморф- на двумерной сфере S2. При b ф О уравнение у2 = 6 имеет ровно два различных решения. Поэтому если z ф 0 и х — a{z ф 0, то у точки (x,z) б СР1 есть ровно два прообраза, лежащих на кривой (1.1). Если же z ф 0, но x/z равно одному из чисел аг-, то прообраз один. В случае, когда z = 0, уравнение (1.1) превращается в уравнение х3 = 0. Следовательно, у точки оо = (1,0) прообраз тоже один, а именно, точка (0,1,0). Точнее говоря, при стремлении z к нулю прообраз точки (1,г) стремится к точке (0,1,0). Проекция р кривой (1.1) на СР1 устроена следующим образом. Если из СР1 исключить точки а,, а^, а3 и оо, то у всех остальных точек будет ровно по два прообраза. Строение отображения в окрестностях точек а{ и оо нужно изучить более детально. Будем для простоты считать, что а, = 0. Рассмотрим аффинные координаты, т. е. положим z = 1. Тогда (1.1) перепишется в виде у2 =х{х-а2){х-аъ), где а2а3 Ф 0. Величина (я — ^(х — а3) почти постоянна для точек х, близких к нулю, т. е. мы фактически имеем уравнение у2 = сх. Это уравнение имеет решения вида х — с\2е2г<р, у = — c\e"f. Обозначим через (х0,у0) решение, отвечающее ц> = 0. При изменении ц> от 0 до 7г получим полный обход вокруг точки (0,1) на СР1, который начинается и заканчивается в точке (х0,1). У величины у0 при таком обходе изменяется знак. Проекция кривой (1.1) на СР1 в рассматриваемой системе координат устроена как (х, у) i—> х. Поднимая на кривую (1.1) обход вокруг точки (0,1) на СР1, мы попадаем не в исходную точку (х0,у0), а точку (х0,-у0) (рис. 14). Но повторив обход еще раз, мы возврате- 14 тимся в исходную точку, так как, изменив дважды знак числа у0, снова получим исходное число. Строение проекции кривой (1.1) на СР1 в окрестности точки оо такое же, как и в окрестностях
§ 1. ТОПОЛОГИЧЕСКОЕ СТРОЕНИЕ КУБИЧЕСКОЙ КРИВОЙ В СР2 43 кривая у в СР2 точек а±. В самом деле, пусть х = 1. Тогда в окрестности точки 2 = 0 уравнение (1.1) выглядит приблизительно как у2 = \/z. При полном обходе вокруг точки z = 0 величина у изменяет знак. Сделаем на СР1 разрезы от ах до а^ и от а3 до оо. Поднятия этих разрезов на кривую (1.1) разбивают ее на две части. В самом деле, при обходе вдоль любого замкнутого пути в СР1, не пересекающего разрезы, точки a,, Oj, а3 и оо мы будем обходить лишь парами, а при обходе вокруг двух точек величина у не изменяется. Поэтому из одного прообраза некоторой точки СР1 нельзя попасть во второй ее прообраз, не пересекая разрезов. Если на СР1 сделать разрезы от о, до а^ и от а3 до оо, то оставшуюся часть СР1 можно представить в виде плоскости с разрезами (рис. 15). Лежащая над ней часть кривой (1.1) состоит из двух кусков. Нужно лишь понять, как эти куски склеены. Пересекая в СР1 разрез, мы попадаем с края со знаком плюс одного куска кривой (1.1) на край со знаком минус другого куска. Произведя такую склейку краев, в результате получим тор (рис. 16). СР1 Рис. 15 Рис. 16 Алгебраическую кривую называют эллиптической, если она как одномерное комплексное многообразие представляет собой тор. Можно показать, что любая эллиптическая кривая биголо- морфна некоторой неособой кубической кривой в СР2.
44 ГЛ. 2. ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ Параметризацию кубической кривой в СР2 можно задать с помощью отображения /: С1 —>СР2, где f(z) = (Fl(z),F2(z), 1). Образ этого отображения должен быть тором. Простейшее отображение С1 на тор получается при отождествлении всех точек вида z + пи1 + тш2. Это соответствует тому, что и1 и и2 — периоды функций Fx и F2. § 2. Эллиптические функции Функция / называется двоякопериодической, если существуют такие комплексные числа о», и и2 (причем ujJu2 ф Ж), что для любых целых чисел тип выполнено равенство f(z + mwl + пш2) = f(z). Для определенности будем считать, что 1т(ш1/ш2) > 0. Это означает, ШЧ что поворот от о», к ш2 происходит по часовой / стрелке (рис. 17). /_^-——"—ш2 В дальнейшем нас будут интересовать о лишь мероморфные двоякопериодические функции. Напомним, что аналитическая функция Рис. 17 называется мероморфной, если у нее в конечной области С нет особых точек, отличных от полюсов. В окрестности любой конечной точки а мероморф- ная функция / допускает разложение Ш[ +ш2 /(г) = с0 (г - а)г + с, (г - a)r+l + ..., где с0 ф 0, г б Z. Мероморфная двоякопе- риодическая функция называется эллиптической. Любое комплексное число z можно о представить в виде z = а1ш1 + а2ш2, где а{ 6 R. Число а^ можно представить в Рис. 18 виде суммы его целой и дробной частей, поэтому эллиптическая функция полностью определяется своими значениями в области {а1ш1 + а2ш2 | 0 ^ av а2 ^ 1}, которая называется фундаментальным параллелограмме<л\ (рис. 18).
§ 2. ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ 45 ZU. Теорема 1. Эллиптическая функция, не имеющая полюсов, постоянна. Доказательство. Предположим, что эллиптическая функция f(z) не имеет полюсов. Тогда функция \f(z)\ непрерывна на С. А так как фундаментальный параллелограмм компактен, то |/(-г)| ^ М для некоторого числа М. Но тогда |/(г)| ^ М для всех z £ С Итак, / — ограниченная целая функция на С. Согласно теореме Лиувилля функция / постоянна. □ Все особые точки мероморфной функции, расположенные в конечной области, изолированные. Поэтому фундаментальный параллело- а + ш1 + ш2 грамм содержит лишь конечное число а + ш ■—*"" / особых точек. Следовательно, параллелограмм можно параллельно сдвинуть так, что на его сторонах не будет особых точек. Образ фундаментального параллелограмма при параллельном переносе мы также будем называть Рис. 19 фундаментальным параллелограммом, и в дальнейшем будем считать, что на его сторонах нет особых точек. Пусть Р — фундаментальный параллелограмм с вершинами а, а + ш1, а + ш1 + ш2 и а + ш2, ЭР — его граница (рис. 19). Тогда I f(z)dz = 0 для любой эллиптической функции f(z). дР В самом деле, в этот интеграл входят интегралы [f(z)dz и f J(z)dz а а+и>2 со знаками плюс и минус соответственно. Эти интегралы равны, так как f(z + ш2) = f(z). Аналогичным образом сокращаются интегралы по другой паре сторон. Из этого утверждения можно получить существенную информацию о нулях и полюсах эллиптической функции. Теорема 2. Справедливы утверждения: а) сулима вычетов особых точек эллиптической функции, расположенных внутри фундаментального параллелограмма, равна нулю;
46 ГЛ. 2. ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ б) пусть ai — нули и полюсы эллиптической функции, расположенные внутри фундаментального параллелограмма, ri — их порядки {порядки нулей положительные, а порядки полюсов отрицательные). Тогда Y2ri ~ ^ и Y2riai = чгпш1 + пы2, где тип — целые числа. Доказательство. Если на границе фундаментального параллелограмма Р нет особых точек функции д, то £resS=2^ \9{z)dZ- р ЭР Для доказательства теоремы а) достаточно воспользоваться этим равенством, положив д = j. Для доказательства равенства Y2ri ~ 0 нужно положить 9(z) = f'(z)/f(z)- Если f(z) — эллиптическая функция, то функция g(z) = f'(z)/f(z) тоже эллиптическая. Кроме того, если f(z) = c0(z- a)r + cl{z- а)Г+[ + ..., то g(z) ~ r(z- a)~l +al+a2(z- a) + ..., а значит, вычет функции g(z) в точке а равен г. Таким образом, Для доказательства равенства Ylriai ~ rnuJ\ + rUjJi положим g(z) = zf'(z)/f(z). Нам придется проделать некоторые вычисления, потому что функция g(z) = zf'(z)/f(z) не обязательно эллиптическая. Предварительно заметим, что если f(z) = c0(z-a)r+cl(z-a)r+l+..., то a + (z - a) rc0(z~ a)r"1 + ... . . 9{*) = "~^Ч—4fri = ar(z-a) l+ ..., z - a c0(z~ a)r l а значит, вычет функции g(z) в точке а равен аг. Теперь займемся вычислением интеграла I g(z)dz. В него входит разность интегралов J Or J /(*) J f(z) J f(z)
§ 2. ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ 47 Нетрудно проверить, что эта разность равна а А так как /(a+(^) = /(а), то при изменении г от а до а+и){ логарифм f(z) может измениться лишь на 2кт. В итоге получаем, 1 Г что в интеграл -— I g{z)dz одна пара сторон параллелограмма 2т J дР дает вклад пш2, где п — целое число. Другая пара сторон дает вклад тш1. □ Как мы уже говорили, непостоянная эллиптическая функция должна иметь хотя бы один полюс внутри фундаментального параллелограмма. Но так как сумма вычетов особых точек, лежащих внутри фундаментального параллелограмма, равна нулю, то функция не может иметь там ровно один плюс порядка — 1. Число полюсов эллиптической функции, лежащих внутри фундаментального параллелограмма, с учетом их кратностей называют порядком эллиптической функции. Минимальный возможный порядок равен двум, при этом есть два варианта: 1) один полюс порядка —2 (так устроена функция Вейер- штрасса, о которой пойдет речь в следующем параграфе); 2) два простых полюса (так устроены эллиптические функции Якоби, о которых рассказывается в § 8). Согласно теореме 2, б) для эллиптической функции сумма порядков нулей, лежащих внутри фундаментального параллелограмма, равна сумме порядков полюсов, т. е. равна ее порядку. Ясно также, что у функции f(z) - с полюсы те же самые, что и у функции }{z). Поэтому эллиптическая функция порядка г любое конечное значение принимает внутри фундаментального параллелограмма с учетом кратности ровно г раз. Задачи 1. Эллиптические функции /ид имеют одинаковые периоды, причем в каждом полюсе они имеют одинаковые главные части cr(z - a)r + cr+l(z - a)r+l + ...+ c_,(z - о)-1. Докажите, что разность этих функций постоянна.
48 ГЛ. 2. ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ 2. Эллиптические функции /ид имеют одинаковые периоды, причем их нули и полюсы совпадают с учетом их кратности. Докажите, что отношение этих функций постоянно. § 3. Функция Вейерштрасса Мы уже доказали некоторые свойства эллиптических функций, но еще не убедились, что множество эллиптических функций состоит не только из констант. Пора привести пример нетривиальной эллиптической функции. Докажем, что для любой решетки Л = {тш1 + nw2 | т,п £ Z}, и1,ш2 £ С, Imu^/u^ > О, эллиптической будет функция РМ = ~2 + Т,' 1 - ыУ \z-uj) 1 шс (3.1) где штрих у знака суммы означает, что суммирование ведется по всем ненулевым элементам ш £ Л. Группировка членов в квадратных скобках существенна, потому что по отдельности ряды Yl {z - ш)~2 и Yj>uj~2 расходятся. Докажем сначала, что ряд (3.1) действительно определяет мероморфную функцию. На любом компакте К, не содержащем точек решетки, этот ряд сходится равномерно и абсолютно. В самом деле, -1 1 1 2zu ш 2z z2u~ (z — и)2 и2 и2 (z — и)2 Если число \из\ достаточно велико, то W4 (ZLJ-[ 2z~z2oj-[ О2 . ,.„ .-i 2z. Поэтому (zoj~l — \y для всех и £ Л' с достаточно большим значением |и>| и для всех z £ К найдется такая константа С, что 1 (г - w)2 1 W- < м Кроме того, \z — из\ > е для всех z £ К и ш £ Л', поэтому такая константа найдется и для всех ш £ к'. Легко проверить, что ряд 13'М-3 сходится. В самом деле, £'м -з Y, £ l^i + qu*\~3 < Yl 8n(nhy n=i max(|p|,|g|)=n n=l
§ 3. ФУНКЦИЯ ВЕЙЕРШТРАССА 49 где h — наименьшая из высот фундаментального параллелограмма. Таким образом, p(z)— мероморфная функция с полюсами в узлах решетки. Она называется функцией Вейерштрасса. Перейдем к доказательству периодичности функции p(z). Рассмотрим для этого ее производную p'(z) = -2 5>-u;)-3 (здесь суммирование ведется уже по всем узлам решетки). Очевидно, что и{ и и2 — периоды функции p'(z). Поэтому функции p(z + ыг) и p(z) могут отличаться лишь на константу с. Подставив значение z = -ojJ2 в равенство p(z + u^) = p(z) + с, получим р(Ш}/2) = р(-и{/2) + с. Но из формулы (3.1) видно, что функция p(z) четная. Поэтому с = 0, т. е. ш1 и ш2 — периоды функции p(z). Функция р имеет в узлах решетки двукратные полюсы, других особых точек у нее нет. Внутри фундаментального параллелограмма расположен ровно один узел решетки. Поэтому сумма полюсов функции р, расположенных внутри фундаментального параллелограмма, сравнима с нулем по модулю Л. Согласно теореме 2 § 2 внутри фундаментального параллелограмма расположены два нуля и ни функции р, причем u+v = О (mod Л). Для любой константы с полюсы функции p(z) - с совпадают с полюсами функции p(z), поэтому внутри фундаментального параллелограмма есть ровно две точки и и v, для которых р(и) = р(у) = = с, причем и + v = 0 (mod Л). В том случае, когда и = — и (mod Л), эти две точки совпадают, т. е. соответствующее значение функция р Рис. 20 принимает двукратно. В точках, в которых сливаются два нуля функции p(z)-c, производная p'(z) обращается в нуль. Фундаментальный параллелограмм можно выбрать так, чтобы внутри него лежали ровно четыре точки, для которых и = —и (mod Л), а именно точки + О —L _2 и —! L U' 2 ' 2 2 (рис. 20). Первая из этих точек — полюс функции р, а три дру-
50 ГЛ. 2. ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ гие — нули функции р'. Итак, значения для функции р двукратные, причем других двукратных значений нет. Двукратные значения соответствуют нулям производной, поэтому p'(z) = 0 тогда и только тогда, когда z = i> f' -V^ (modA)- Отметим, что числа е,, е2 и е3 попарно различны. Предположим, например, что е, = е3. Тогда функция p(z) - ei имеет двукратные нули в точках u>j/2 и о>2/2, т. е. внутри фундаментального параллелограмма расположено не менее четырех нулей этой функции, чего не может быть. Функция Вейерштрасса не только дает пример эллиптической функции, но и позволяет описать, как устроены все эллиптические функции. Теорема 3. Пусть f(z)—произвольная эллиптическая функция, p(z) — функция Вейерштрасса с теми же периодами. Тогда существуют такие рациональные функции R и Rl, что f = R(p) + Ri(p)p' Доказательство. Функцию f(z) можно представить в виде суммы четной функции g(z) = (f(z) + f(-z))/2 и нечетной функции h(z) = (f(z) - /(-2))/2. А так как р (z) — нечетная функция, то h{(z) = h(z)/p'(z) — четная функция, причем f(z) = g(z) + h1(z)p'(z) Поэтому достаточно доказать, что четную эллиптическую функцию можно представить в виде рациональной функции от р. Докажем предварительно некоторые свойства нулей и полюсов четных эллиптических функций. 1. Пусть / — четная функция, и — ее нуль, соответственно полюс, порядка т. Тогда —и тоже ее нуль, соответственно полюс порядка т. В случае нулей достаточна заметить, что для четной функции / справедливо равенство f^k\-z) = (-l)kf(k\z). В случае полюсов вместо / можно рассмотреть 1//.
§ 3. ФУНКЦИЯ ВЕЙЕРШТРАССА 51 2. Если / — четная эллиптическая функция и при этом и = = —и (mod Л), то порядок нуля или полюса функции / в точке и четен. Доказательство проведем для нулей (для полюсов вместо / можно рассмотреть 1//). Условие и = -и (mod Л) эквивалентно тому, что U~ ' 2' 2 ' ~2 (modA)- Кроме того, из периодичности функции /' следует, что f'(u) = = f'(—u). Но производная четной функции нечетна, поэтому /'(«) = 0. Следовательно, если функция / имеет в точке и нуль, то он по крайней мере двукратный. При "=у. 2 ' ~2 (modA) функция F(z) = p(z) - р(и) имеет в точке и нуль второго порядка; при и = 0 (mod Л) таким свойством обладает функция F(z) = l/p(z). С помощью функции F можно построить четную эллиптическую функцию /,(z) = f(z)/F(z), порядок нуля в точке и для которой ровно на 2 меньше, чем для функции /. Поэтому если /,(«) Ф 0, то порядок нуля функции / в точке и равен 2, а если /,(«) = 0, то к функции /, можно применить такие же рассуждения, как и к функции /, и т. д. Согласно доказанным выше свойствам нулей и полюсов четной эллиптической функции / их можно разбить на пары чисел, отличающихся друг от друга знаком, т. е. (х, —х). Выберем в каждой такой паре по одному представителю. Пусть а,,..., ак — представители нулей, Ь,,..., Ьк — представители полюсов. Рассмотрим эллиптическую функцию Q(z\ - ЖЫг\\ - П(И*)-РК-)) Q(z)-*(p(z))-n<H*)-fW)' где в произведения входят лишь элементы а{ и bit отличные от узлов решетки (в узлах решетки функция р принимает бесконечные значения). Если не обращать внимания на узлы решетки, то полная система нулей и полюсов у функции Q такая же, как и у функции /, поскольку p(z) = р(а) тогда и только тогда, когда z = ±а (modЛ). Но согласно теореме 2, б) параграфа 2 сумма порядков нулей и полюсов эллиптической функции, лежащих внутри фундаментального параллелограмма, равна нулю,
52 ГЛ. 2. ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ поэтому порядок нуля или полюса в узле решетки однозначно определен порядками остальных нулей и полюсов. Следовательно, f(z)/Q(z) — эллиптическая функция, не имеющая полюсов, т. е. константа. В итоге получаем, что f(z) = cR(p(z)). О Задачи Эллиптическая функция / такова, что все ее полюсы расположены в узлах решетки периодов. Докажите, что / = Р(р) + + Р1(р)р', где Р и Р, —многочлены. Указание. Из разложения / = Щр) + Д,(р) р' можно получить, что 2R(p(z)) = f(z) + f(-z) и 2p'(z)Rl(p(z)) = = f(z) ~ f(—z)- Покажите, что функции R и Rl не принимают бесконечных значений в конечных точках. § 4. Дифференциальное уравнение для функции p(z) В предыдущем параграфе было доказано, что четная эллиптическая функция рационально выражается через p(z), причем выражение было указано в явном виде. Это утверждение можно применить к четной функции (p'(z))2. Она имеет двукратные нули в точках ~, —*——-, ~ и шестикратный полюс в узле решетки. Следовательно, (pl(z))2=c(p(z)-el)(p(z)-e2)(p(z)-e3), (4.1) где (шх + о/2 А так как p(z) = z-2 + ... p'(z) = -2z-3 + ..., то с = 4. Дифференциальное уравнение для функции p(z) можно получить и другим способом. Заодно мы получим другую форму этого уравнения. Воспользуемся тем, что если коэффициенты при неположительных степенях z в разложениях Лорана функций
§ 4. ДИФФЕРЕНЦИАЛЬНОЕ УРАВНЕНИЕ ДЛЯ ФУНКЦИИ р (z) 53 (p'{z))2 и ap3(z) + bp2(z) + cp(z) + d совпадают, то эти функции равны. В самом деле, их разность — эллиптическая функция без полюсов, в нуле принимающая нулевое значение. Следовательно, их разность — константа, причем нулевая. Так как (т^)ЧШ='+2-з*г+-- то = \+3G4z2 + 5G6z4 + ..., zl где Gk = Y^'u~k (для нечетного к эта сумма нулевая). Поэтому p(z) = z-2 + ..., p\z) = z-4 + 6G4 + ..., p3(z) = z-6 + 9GiZ-2+\5G6 + ..., (p'(z))2 = 4z'6 - 24G4z~2 - 80G6 + ... (записаны лишь интересующие нас члены разложения Лорана). Таким образом, ap\z) + bp2(z)+cp(z) + d = = az~6 + bz-4 + (9aG4 + с) z~2 + (\5aG6 + 6bG4 +d) + ... Следовательно, ар3 + bp2 + cp + d = (p1)2, если f a = 4, \b = 0, | 9aG4+c = ~24G4, [ \5aG6 + 6bG4 +d = -80G6. Полученная система уравнений, очевидно, имеет решение (а = 4, \ь = о, ] с = -60С4, [d = -140G6.
54 ГЛ. 2. ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ Для упрощения обозначений, обычно полагают g2 = 60G4 = 60j2'"~\ 03 = 140^=140^-6. Тогда (p'(z))2 = 4p3(z)-g2p(z)-gr (4.2) Сравнение выражений (4.1) и (4.2) показывает, что е,+е2 + е3 = 0, е,е2 + е2е3 + е3е, = -#2/4, е,е2е3 = д3/4. Легко проверить, что gl - 21 д\ = 16(е, - е2)2(е2 - е3)2(е3 - е,)2. В предыдущем параграфе было показано, что числа е,, е2 и е3 попарно различны. Поэтому д2 — 27#3 ф 0. Возникает естественный вопрос: если д2 и <73—данные числа, причем д2 ф 27д\, то обязательно ли существует решетка, для которой д2 — 60 £) 'о;-4 hj3= 140^'u;-6? Ответ на этот вопрос положительный (см., например, [Б 15]). Задачи 1. Докажите, что р" = 6р2 - д2/2 и р'" = \2р'р. 2. Докажите, что p(2n~2\z) и p(2n+l\z)/p'(z)— многочлены степени п от p(z). 3. Докажите, что е\ + е\ + е\ = д2/2, е\ + е\ + е\ = 3#3/4 и е\ + е\ + е\ = д22/Ъ. § 5. Параметризация кубической кривой с помощью функции Вейерштрасса Дифференциальное уравнение для функции р позволяет прояснить природу сложения точек кубической кривой. Но для этого придется воспользоваться тем фактом, который мы оставили без доказательства: для любых чисел д2 и д3, где д\ ф 21д\,
§ 5. ПАРАМЕТРИЗАЦИЯ КРИВОЙ ФУНКЦИЕЙ ВЕЙЕРШТРАССА 55 существует решетка, для которой функция Вейерштрасса удовлетворяет уравнению (р')2 = Ар3 - д2р - д3. Кубическую кривую у2 = 4ж3 - д2х - д3 можно параметризовать с помощью функции р, положив x = p(z), y=p\z). Переходя к однородным координатам в СР2, отображение /: С/Л —> СР2 определим следующим образом z^(P(z),p'(z),l) при гфО, 2(-+(0,1,0) при z = 0. Очевидно, что это отображение аналитично во всех точках, отличных от узлов решетки. Записав его в виде можно убедиться, что оно аналитично и в окрестности узла решетки. Отображение / взаимно однозначно отображает тор С/Л на кубическую кривую y2z = Ах3 - g2xz2 - g3z3 в СР2. В самом деле, на бесконечно удаленной прямой z = 0 лежит лишь точка (0,1,0) этой кривой. В нее отображаются узлы решетки, которым на торе соответствует одна точка. Для остальных точек можно рассмотреть аффинную кривую у2 = 4ж3 - д2х - д3 и отображение z i-> (p(z), p'{z)). Уравнение p(z) = с может иметь одно или два решения. Два решения оно имеет в том случае, когда p'(z) Ф 0. Решения при этом имеют вид ±z. Образы этих двух точек при отображении z i-> (p(z), p'(z)) не совпадают, так как ненулевые числа p'{z) и p'(-z) = -p'(z) отличаются знаком.
56 ГЛ. 2. ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ Сложение точек комплексной плоскости индуцирует сложение точек тора, а оно, в свою очередь, с помощью отображения / индуцирует сложение точек кубической кривой. Оказывается, что это и есть определенное ранее сложение точек кубической кривой, причем в качестве нулевого элемента берется бесконечно удаленная точка (0,1,0). Действительно, пусть точки Рх и Р2 кубической кривой соответствуют точкам zx и z2 комплексной плоскости, т. е. Pi = (P(zi)i P'(zi))- Проведем через них прямую у = ах + b, при этом p\z>) = ap(z{) + b, где i= 1,2. Эл- Рис. 21 липтическая функция p'(z)—ap(z)— — Ь имеет в точке z — 0 полюс кратности 3, а в других точках фундаментального параллелограмма полюсов у нее нет. Следовательно, ранг этой функции равен 3, т. е. она имеет ровно 3 нуля, а именно, уже известные нам нули zx и z2 и некоторый третий нуль z3. А так как сумма полюсов равна нулю, то zx + z2 + z3 = 0 (mod Л), а значит, z3 = —zx ~z2 (mod Л). Итак, третьей точкой пересечения прямой РХР2 с кубической кривой будет точка Р'з = (P(z3), p'(z3)) = (И-*, - zt)> P\~zx ~ zi)) = = (p(zx+z2),-p'(zx+z2)). Таким образом, точка Р3 = (p(zx + z2), p'(zx +z2)), соответствующая сумме чисел zx и z2, симметрична точке Р3 относительно оси Ох (рис. 21). Иными словами, Р3 — точка пересечения кубической кривой с прямой Р3Е, где Е = (0,1,0) — бесконечно удаленная точка кубической кривой. Именно в этом мы хотели убедиться. Продолжив предыдущие рассуждения чуть дальше, можно доказать, что функция р обладает алгебраической теоремой сложения, т. е. p(zx + z2) алгебраически выражается через p(zx) и p(z2). В самом деле, прямая у = ах + Ь, проходящая через
§ 5. ПАРАМЕТРИЗАЦИЯ КРИВОЙ ФУНКЦИЕЙ ВЕЙЕРШТРАССА 57 точки Р, и Р2, пересекает кубическую кривую у2 = 4ж3 - д2х - д3 в трех точках (х{,у(), причем ж, = p(z^), х2 = p(z2) и х3 = = p(zl + z2). Поэтому кубическое уравнение (ах + б)2 = 4х3 — д2х — д3 имеет указанные корни хр х2 и х3. Выразив через них коэффициент при х2, получим P(zi) + И*2) + P(*i + Ч) = а74- А так как p'(zx) = ap(zl) + b и p'(z2) = ap(z2) + 6, то a = _ о v 1/— v ^ . Следовательно, Таким образом, p(zl + z2) рационально выражается через р(г^ и р'(г;), г = 1,2. Остается напомнить, что p'(z^) алгебраически выражается через p{z^), а именно: P'(*i) = \/4р3(^)-32Р(^)-33- Замечание. С помощью функции Вейерштрасса можно параметризовать также и кривую у2 = С4(х), где G4(x) = OqX4 + ujX3 + a2x2 + a3x + a4 — многочлен четвертой степени без кратных корней. Сделаем для этого замену переменных х = хр'+a, у = j/jX^2. В результате получим 2/2х~4 - b4x~4 + b3x~3 + b2x~2 + blx^1 + G4(a). Если а — корень многочлена С4, то у2 = 6,х3 + b2x2 + b3xi + Ъ4. Эту кубическую кривую можно параметризовать с помощью функции Вейерштрасса. Отметим, что аналогичным образом замена х = х^1 + а, у = ^х,-" позволяет перейти от кривой у2 = G2n(x) к кривой У^С^х).
58 ГЛ. 2. ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ § 6. Эллиптические интегралы Функция Вейерштрасса p(z) удовлетворяет дифференциальному уравнению Следовательно, dz = *» т. е. -\ V4P3 - 92Р ~ <73 ' du ^4и3 - д2и - д3 ' где и = p(z). Таким образом, z = р '(«), т. е. функция Вейерштрасса возникает при обращении интеграла Г du J \/4«3 -92и-93 Эллиптическим интегралом называют интеграл вида I R (х, у/Щх)) dx, где G(x) — многочлен третьей или четвертой степени, не имеющий кратных корней, a R(x, у) — рациональная функция двух переменных. Впервые такие интегралы появились при вычислении дуг различных кривых, в частности, эллипсов. Лишь позднее было замечено, что для некоторых эллиптических интегралов обратные функции обладают многими интересными свойствами, прежде всего, двоякопериодичностью. Эллиптические интегралы можно привести к некоторым более простым формам. Но предварительно рассмотрим интегралы более простого вида. Прежде всего докажем, что если Щх) — рациональная функция, то I R(x)dx есть сумма рациональной функции и некоторого числа слагаемых вида с,- 1п(х—а,). Для этого достаточно доказать, что рациональную функцию R(x) можно представить в виде л<*> + Е r^4k > где А(х) — многочлен.
§ 6. ЭЛЛИПТИЧЕСКИЕ ИНТЕГРАЛЫ 59 Пусть Щх) = P(x)/Q(x), где Р и Q — многочлены. Поделив Р на Q с остатком, можно перейти к дроби S/Q, где degS < degQ. Пусть Q = Q{Q2, где Q{ и Q2— взаимно простые многочлены. Тогда существуют такие многочлены а и Ь, что a{x)Ql(x) + b(x)Q2(x) = 1. Поэтому S alSQl + a2SQ2 Q^ a^S В полученных дробях нужно снова поделить с остатком числитель на знаменатель. После нескольких таких операций придем к сумме многочлена А(х) и нескольких дробей вида р(х) (х — а)~п, где degp(x) < п. Остается записать многочлен р(х) в виде р(х) = Ьх{х~ а)""1 + Ъ2(х - а)"-2 + ... + Ьп. Первым проблемой интегрирования рациональных функций начал заниматься Лейбниц. Он рассматривал лишь разложения многочленов на сомножители с вещественными коэффициентами, поэтому у него возник вопрос: любой ли вещественный многочлен можно разложить на сомножители первой и второй степени с вещественными коэффициентами. В 1702 г. Лейбниц опубликовал статью, в которой утверждал, что многочлен х4 + а4 нельзя разложить требуемым образом, поскольку х4 + а4 = (х2 + a2V^l)(х2 - a2V^l) =(х + а^Д/^Т) х х (x-ayV^jix + ay-V^ljlx-ay-y/^), а произведение никаких двух из этих множителей, как он считал, не может быть квадратным трехчленом с вещественными коэффициентами. И лишь через 17 лет Николай Бернулли указал, что ж4 + о4 = (х2 + а2)2 - 2а2х2 = (х2 + V2ax + а2) (х2 - V2ax + а2). В переписке Лейбница и Якоба Бернулли обсуждались также интегралы иррациональных выражений, возникающие при решении различных физических и математических задач. Многие из этих интегралов являются эллиптическими.
60 ГЛ. 2. ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ Перейдем теперь от рациональных функций к простейшим иррациональностям. Для вычисления интеграла х)\ dx, где G(x) = ax + b — линейная функция, сделаем сначала замену и = ах + Ь. В результате получим интеграл вида \ Л, (и, л/и) du, где Л, снова рациональная функция. Сделаем затем замену t = = л/и. Тогда du = d(t2) = 2tdt, а значит, \Rl(u,y/u)du= \Rl(t2,t)2tdt = \R2(t)dt, где R2 — рациональная функция. Пусть теперь G(x) = ах2 + bx + с. Как было сказано в предыдущем параграфе, с помощью замены х = х~1+а, у = у{х~1 от кривой у2 = G(x) можно перейти к кривой у2 = G,(x,), где G, — линейная функция. Применим эту замену для вычи- сления интеграла |д(х,»)Л. где J = ОД. Пусть х = х~'+а, у = у{х\л, причем G(a) = 0. Тогда dx = -x[2dxl и \R(x,y)dx = - \R(x~[+a,y1xYl)x~2dx] = \ R{{xvyl)dxv причем у2 = Ax{ + В. n Итак, интегралы вида \R(x,y)dx, где R — рациональная функция и у = л/Щх), выражаются через элементарные функции, если degG < 2. В случае, когда degG = 3, могут возникать функции, обратные к эллиптическим. Интеграл \R(x,y)dx,
§ 6. ЭЛЛИПТИЧЕСКИЕ ИНТЕГРАЛЫ 61 где , = JB&j, сводится к ИНТегралу \Q{x.y)dx, где , - = ^/4х3 — д2х — д3. В самом деле, с помощью замены х = х^1 +а, У = У[х72 от многочлена G4 четвертой степени можно перейти к многочлену третьей степени, а от произвольного многочлена третьей степени с помощью линейной замены можно перейти к многочлену вида 4х3 - д2х — д3. Можно было бы ограничиться вычислением интегралов вида I R(x, y)dx, где у2 = 4х3 — д2х — д3, но во многих случаях бывают полезны другие формы эллиптических интегралов. Поэтому мы сначала проведем вычисление эллиптических интегралов в общем виде, и лишь затем обратимся к некоторым их конкретным формам. р Пусть I = I R(x, y)dx, где R — рациональная функция и у2 = а0х4 + 4а{х3 + 6а2х2 + 4а3х + а4, причем хотя бы один из коэффициентов а0 и а1 не равен нулю. Теорема 1 (Лежандр). Эллиптический интеграл I можно представить в виде линейной комбинации рациональной функции от х и у, интеграла рациональной функции от х и интегралов Г dx С xdx С х2 dx С dx J !/' J 2/ ' J У J (х-с) у' Доказательство. Так как у2 полиномиально выражается через х, то можно считать, что рациональная функция R не содержит ук при к ^ 2. Кроме того, а + Ъу = (a + by)(c-dy)y _А c + dy (с + dy) (с - dy) у у где А а В — рациональные функции от х. Поэтому вычисление исходного интеграла \R(x,y)dx сводится к вычислению Г Л/ v , CA(x)dx _ интегралов вида I В(х) dx и I ——— . Рациональную функ^ цию А(х) можно представить в виде *) = Ev + E^Cr) т г)
62 ГЛ. 2. ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ Поэтому остается рассмотреть интегралы хп dx У dx с)ту т > 1. Так как — (хту) = тх dx m-'y^mfx mxm-ly2 + -xr nm+3 d(y2) dx „m+2 = a0(m + 2) + 2a, (2m + 3) + У + 6 a2 (m + 1) У -m+l + 2 a3 (2m + 1) h ma. „m— 1 У У ' У то получаем, что хту = 0^(171 + 2) Jm+3 + 2 a, (2m + 3) Jm+2+ + 605(771+ l)Jm+1 +2a3(2m+ 1) Jm + ma4Jm_,. Записав такие равенства для m = 0,1,2,..., мы сможем последовательно выразить J3 через J0, J,, J2 и рациональную функцию от х и у, затем J4 через J0, J,, J2 и т. д. В случае, когда % = О, мы выразим J2 через J0 и J,, затем J3 через J0 и J, и т. д. Г dx Для вычисления интегралов i/m = I —— запишем многочлен С(х) в виде J \х — с) У G(x) = b0(x - с)4 + 46, (х - с)3 + 6Ь2(х - с)2 + 4Ь3(х -с) + Ъ4 (при этом Ь0 — а0). Как и в предыдущем случае, получим тождество £((х-сГ,)^Ь0(т + 2)(Х °J + /■т _ r\m+2 fx—r1m+l + 26, (2m + 3) ^-^ + 662 (m + 1) * '- + + 2b3 (2m + 1) (x-cT 2/ + mb, (х-с) m—1
§ 6. ЭЛЛИПТИЧЕСКИЕ ИНТЕГРАЛЫ 63 X У Интегрируя эти тождества при т = -1, -2, -3,.... получаем (х - с? = 2b'J° " 6№ " 6ЬзЯг " 2№' ^-L = " Vo + 6Ь,Ч - 66,7, - 12Ь2Я2 - 10Ь3Я3 - ЗЬ4Я4 и т. д. Эти равенства позволяют выразить Я2,Я3,Я4,..., через J0, J,, J2,..., Я, и рациональные функции х и j/. D Как мы уже говорили, любой эллиптический интеграл можно свести к интегралу I R(x,y)dx, где у2 = Ах3 — д2х — д3. Эту форму эллиптических интегралов называют формой Вей- ерштрасса. Так как в этом случае (¾ = 0, то J2 выражается через J0 и Jp поэтому остаются три вида интегралов Г dx у/Ах3 <у/4х3 -02^- xdx - д2х- dx ■9г ■9г J (х- с) yj'Ах3 - д2х- д3 Другая широко распространенная форма эллиптических интегралов — это форма Лежандра. Для нее у2 = (\-х2)(\-к2х2). Перейти от формы Вейерштрасса к форме Лежандра можно следующим образом. С помощью замены х = ахх + Ь от многочлена 4х3 - д2х — д3 перейдем к многочлену я1(я1 - 1)(х, - к2). Затем сделаем замену £2 = х^1, rf = у2х~[3. В результате получим if = (1-^)(1-ft'**). Для формы Лежандра появляются все четыре вида интегралов: Г dx Г xdx Г x2dx Г dx ЗТОД' ]7Щ' J \/ОД' ){х-с)у/Щ£)'
64 ГЛ. 2. ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ где G(x) = (1 - х2)(1 - к2х2). Но при этом f xdx 1 f du -и- J V(l -х2)(1 -½2) 2 J V(l -«)(1 -&2u)' где и = x2. Следовательно, этот интеграл выражается через элементарные функции. Чтобы несколько упростить вид интегралов в форме Лежанд- ра, сделаем замену х = sin уз. Тогда dx = cos уз^уз, \/1 — х2 = = cos уз и \/1 - &2х2 = УГ — A;2 sin2 уз. Поэтому вышеуказанные неэлементарные интегралы принимают вид f dv (6..) \J\ — k2sm2(f sin2y3dy3 \/l - &2 sin2 уз dy? (sin уз - с) у/1 - A;2sin2y3 (6.2) (6.3) Интегралы (6.1) и (6.3) называются соответственно эллиптическими интегралами первого и третьего рода. Что же касается интеграла (6.2), то его можно представить в следующем виде f ;[n2vdv =i ( , d{p -1 (vi-^sinv^. J v/l-*2sin2y3 *2 J v/l-^sin2y3 *2 J Интеграл fc2sin2y3dy3 (6.4) И называется эллиптическим интегралом второго рода. Для эллиптических интегралов первого и второго рода используются обозначения Лежандра: ч> ч> F(<p) = [ . dip Е{ф)= [y/l-k2sm2<fd<f. J л/1 - &2sin2y3 J о v о Теорема 2 (следствие из теоремы Лежандра). Всякий эллиптический интеграл I можно представить в виде линейной комбинации рациональной функции от х и у, интеграла рациональной функции от х и интегралов (6.1), (6.2) и (6.4).
§ 7. ТЕОРЕМЫ СЛОЖЕНИЯ ДЛЯ ЭЛЛИПТИЧЕСКИХ ИНТЕГРАЛОВ 65 Задачи 1. Покажите, что интеграл 1 (1 + xs)~^3dx заменой переменных сводится к эллиптическому интегралу. Указание. Сделайте замену х-3 + я3 = 2*-3/2. 2. Покажите, что интеграл J (1 - х-)-**, заменой „ере- менных сводится к эллиптическому интегралу. Указание. Сделайте замену £(1 - х) = (1 - я3)1/3. § 7. Теоремы сложения для эллиптических интегралов F(tp) и E(tp) Пусть v v о о где A(ip) = у/\ -fc2sinV- Теорема 1. Пусть F(<p) + F(ip) = F(fi). Тогда sin у, алгебраически выражается через sin</? и sini/>. Доказательство. Рассмотрим дифференциальное УраВН6НИе Ар 'Лф = Q у/\ - k2sin2if у/\ - fc2sinfy Оно имеет интеграл F(</?) + F(ip) - F(^) = О, где ц — константа. Учитывая нечетность функции F, его можно записать в виде F(tp) + F(i>) + F(-!i) = 0. Покажем, что интегралом этого уравнения является также соотношение cos tp cos tp - slmps'impy/l — fc2sinfy = cos/x. (7.1) После возведения в квадрат оно становится симметричным по параметрам <р, ф и — ц: COS2 ip + COS2 ф + COS2 fi — - 2 cos <p cos ф cos ц + k2 sinV sin2i/> sin V = 1. (7.2)
66 ГЛ. 2. ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ Следовательно, соотношение (7.1) выполняется вместе с соотношениями cos /i cos уз + sin /i sin уз уГ — к2 sin2V> = cos ф, (7.3) cos /i cos ф + sin /i sin ф \J\ — k2 sin2y3 = cos уз. (7.4) Поделим обе части (7.1) на sin уз sin ф и продифференцируем полученное выражение. Результат можно преобразовать к виду , /COS!/) — COS 11 COS уз\ dtpl z. о Г +(1ф \ sin у? у cosy? — cosцcost/;\ _п sinV> Воспользовавшись формулами (7.3) и (7.4), получим V^l - &2sinV \Jl - Л;2 sin2-0 Таким образом, выражение (7.1) действительно есть интеграл рассматриваемого дифференциального уравнения. Но двух независимых интегралов у него быть не может, поэтому из равенства F(tp) + jF(V>) = jF'(m) следует равенство cos уз cos ф — sin уз sin ф \/\ — к2 sin2/i = cos LI. Осталось заметить, что sin/x алгебраически выражается через cos/x. D В действительности, для sin ц легко получить явное выражение. Пусть х = cos/i, тогда sin2// = 1 — х2. Соотношение (7.2) можно рассматривать как квадратное уравнение относительно х. Решив его, получим _ cos уз cos ф - sin уз sin ф Д(у?) Д(^) п сч cos/x— . —— . (7.5) 1 — K-'sin^y? ъ\ъ1ф Корень квадратного уравнения выбран так, чтобы при малых у; и ф формулы (7.5) и (7.1) были согласованы. Несложными алгебраическими преобразованиями из (7.5) можно получить следующие выражения для sin/i и Д(/л) _ sin уз cos ф А(ф) + sin ф cos уз Д(уз) 8Ш М ~~ 1-FsinVsinV ' ( ' _ Д(уз) Д(т/>) - к2 sin уз sin V> cos уз cos ф W~ l-fc2sin2y3sin2V ' ( '
§ 7. ТЕОРЕМЫ СЛОЖЕНИЯ ДЛЯ ЭЛЛИПТИЧЕСКИХ ИНТЕГРАЛОВ 67 Поделив (7.6) на (7.5), получим tg/i- tgyA(y) + tgy>A(V>) Последнюю формулу можно интерпретировать следующим образом. Пусть углы у?' и ф' таковы, что tgy?' = tgy?A(y?) и tg-ч^' = = tgф A(V0- Тогда /i = уз' + ф'. В приложениях весьма важен случай /л = 7г/2. В этом случае cos/л = 0 и sin/л = 1. Из (7.3) и (7.4) получаем sin у? = cosV'/A(V;) и sim/> = cosy?/A(y?), а из (7.1) получаем cosy?cosi/> = 6 sin уз sin ф, т. е. 6tgy?tgV> = 1, где b = \/1 — &2. Из (7.5) следует, что cos уз cost/) = Д(у?) Д(^) sin уз sin V», поэтому Д(уз)Д(т/;) = 6. Следовательно, cosy? = sim/>A(y?) = = Ь sin ф/А(ф) и cos t/i = 6sin уз/Д(уз). Формулы (7.5) и (7.6) до некоторой степени напоминают формулы для косинуса и синуса суммы двух углов. С их помощью можно получить выражения, аналогичные выражениям cos пуз и sin пуз через cosy? и sin уз. Пусть -F(y?n) = nF(y?). Тогда 2 sin у? cos у? Д(уз) 1 — 2 sin2 у? + к2 sin4y3 Sm^= 1-FsinV "' C0S^2 = 1-tfslnV ' 2tgy3A(y3) 1 - 2A;2 sin2y3 + A;2 sinV 2~ l-(tg<M(y^)2' (^}~ 1-FsinV ' Для нахождения у? no данному ip2 можно воспользоваться тем, что tg(y?2/2) = tgy? Д(уз), а можно также решить уравнение 1 - 2х2 + к2х4 C0S^2= \-кЧ< ' где х = sin уз. Это уравнение соответствует делению -F(y?2) пополам. Для деления F(V>) на три равные части нужно решить уравнение Зх - 4 (1 + к2) х3 + 6к2х5 - &4х9 ъ'тф = 1 - 6&2х4 + 4к2 (1 + к2) х6 - 3&4х8 '
68 ГЛ. 2. ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ где х = sin уз. При ■ф = 7г/2 получим уравнение (1 +х)(1 -2х + 2к2х3 - к2х4)2 = 0, т. е. деление F(ir/2) на три равные части сводится к решению уравнения I - 2 sin <р + 2k2 sin3 уз + к2 sin4 уз = 0. Для эллиптического интеграла второго рода E(ip) также есть теорема сложения, которая непосредственно связанная с теоремой сложения для эллиптических интегралов первого рода -Р(уз). Теорема 2. Если F(ip) + F(ip) - F(/i) = 0, то E(ip) + Е(ф) - E(fi) = к2 sin уз sin -ф sin /i. Доказательство. Пусть E(ip) + Е{ф) - Е(ц) = = P(ip,ip, ц). Продифференцируем это равенство при постоянном значении /л. В результате получим А(<р) dip + А(ф) dip = dP. Но согласно (7.3), (7.4) .. . cos уз — cos -ф cos и cos -ф — cos ю cos и A(V) = :—Г~- > А0/0 = : : • Sin Щ) sin /i sin уз sin /i .„ .'cosy? — cosibcosu\ , /cos^ — cosy?COSu\ , dP = . , . ) dip+( 4 7^ dip = 1 sin "ф sin /i ) \ sin уз sin /i ' Поэтому p — cos^cos/A sin ф sin /i у _ d (sin2 уз + sin2 ф + 2 cos y? cos ф cos /i) 2 sin ip sin i/> sin /i Согласно (7.2) 1 — sin2 уз + 1 — sin2 ф — 2 cos ip cos ф COS /i = = 1 - cos2 /i - к2 sin2y3 sin2^ sin2/i. Поэтому d (A; sin уз sin ф sin /i)2 ,2,,. .... dP = —■— :—— — = ArcUsinyssini/'Sin/i). 2 sin уз sin ф sin /i А так как P и sin уз sin i/> sin/л обращаются в нуль при уз = 0, то Р = к2 sin уз sin ф sin /i. П
§ 8. ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ ЯКОБИ 69 Эта теорема сложения позволяет получить для разностей nE(tp) - E(fn), где F(ipn) = nF(f), следующие выражения: 2E(if) - E(f2) = к2 sin уз sin уз sin уз2, 3E(if) - E(<p3) = (2E(<p) - E(<p2)) + (E(<p2) + E(<p) - E{if3)) = = k2 sin уз (sin if sin (f2 + sin if2 sin if3), и т. д. Применениям полученных в этом параграфе формул для решения задач о делении дуг эллипса посвящена гл. 3. § 8. Эллиптические функции Якоби В предыдущем параграфе мы рассмотрели функцию F{y)=\- d-X Л-r^ , («Л) J V(l-x2)(\-kW) J л/1-FsinV о 0 где x = sin if, и получили для нее теорему сложения: если F(if) + + F(j>) = F(/i), то sin if cos ■ф А(ф) + sin ■ф cos if Д(уз) 1 - k2 sin2y3 sin2 ■ф Частный вид формул (8.2) и (8.2) при к = О хорошо знаком: X If arcsin^ \тт^Ь= W о о где х = sin if, и sin /i = sin if cos ■ф + sin ■ф COS if, если /i = if + ф. Функция x = sin уз во многих отношениях лучше, чем arcsinx. Неудивительно поэтому, что рассматривать функцию, обратную к F(if) удобнее, чем саму F(if). Заменим обозначение Лежандра F(if) на обозначение Якоби u(if) = F(if). Обратная к и(ф) функция if(u) называется амплитудой и и обозначается am и. В предыдущем параграфе были получены формулы (7.5)- (7.7) для функций sin уз, cosy? и А(уз) = а/1 - &2sin2y3. Если sin А* = — Г L*L*?2r,. ■ (8-2)
70 ГЛ. 2. ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ ввести функции sn ^ = sin am u, cn*u = cosamu, dnu = A(amu), то эти формулы можно записать в следующем виде: сп и en v — sn и sn v dn и dn v „ „ч Cn(W + ^)= 1-tfsnWt; ' (8-3) sn u en г; dn г; + snven udn и /n „4 sn(^) = l-fc2snW, ' (8'4) , , , dn и dn v — k2 sn и sn г; en *u en v dn (« + «) = : г»—^ = . (8.5) 1 - k2 sn2 и sn2 г/ Функции sn и, спи и dn и обычно называют эллиптическими функциями Якоби, хотя многие свойства этих функций в том или ином виде были обнаружены до него Лежандром и Абелем. Одно из важнейших свойств функций snu, спи и dnu — двоякопериодичность. Наличие у этих функций одного периода достаточно очевидно. В самом деле, функции sin у? и cosy? имеют период 27г, а функция sin2 ip имеет период 7г. Поэтому функции snu и спи имеют период АК, где 7Г/2 I * О а функция dn и = у/\ — k2sn2u имеет период 2К. С помощью теорем сложения (8.3)-(8.5) можно выяснить поведение функций snu, спии dnu при увеличении аргумента на четверть периода К и на полупериод 2К. Подставив значения К у/\ - &2SinV ' snA"=l, сп К = 0, dnK =\/\-к2 в формулы (8.3)-(8.5), получим cn*u sn (и + К) = -— , dn*u / , v\ Vl -к2 sn и сп(и + К) = - dnu dn{u + K)=^Jl. dnu
§ 8. ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ ЯКОБИ 71 А так как sn 2К = 0, en 2К = 1 и dn 2К = 1, то 5п(г4 + 2/0 = -snu, cn(u + 2/iQ = -cntt, dn(u + 2K) = dnu. Обнаружить второй период эллиптических функций Якоби несколько сложнее. Вспомним предварительно, что интеграл J \/\ — k2 sinV был получен из интеграла Г dx V(l -х2)(1 -А;2х2) заменой х = sin уз. Сейчас нам будет удобнее работать с исходным интегралом. На комплексной плоскости функция dx V(l -х2)(1 - к2х2) вообще говоря, не определена, потому что значение и(х) зависит от пути интегрирования. Значения функции и(х) в одной и той же точке могут отличаться на числа вида Г dx J у/(\ -х2)(1 -к2х2) ' где интеграл берется по замкнутому контуру С. При этом любое такое число L будет периодом обратной функции х(и). Подынтегральная функция имеет особые точки ±1, ±к~]. Посмотрим, как влияют обходы вокруг этих точек на значения функций sn и = х, en it = \J\ — х2 и dntt = \/1 — &2х2. Пусть ! К= [ dx J л/(1 -х2)(1 -к2х2) и ° X dx -I л/(1 -х2)(1 -к2х2) о
72 ГЛ. 2. ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ Обход вдоль пути, изображенного на рис. 22, показывает, что значение интеграла в точке X равно а и К + (К - a) = 2К - а. В самом деле, на последнем участке изменяется знак функции VI — х2 и изменя- рис 22 ется направление интегрирования, в результате двух изменений знак перед интегралом получается положительный. Та- х j k-> ким образом, sna = sn(2K — a). ? 'T^-rTpT-Q Кроме того, знак функции VI — х2 при этом обходе изменяется, а знак Рис. 23 функции VI — к2х2 не изменяется. Поэтому en a = — en (2К — а) и dn a = dn (2К — а). Заменив a на —а, получим sn(a + 2K) = sn(-a) = -sna, en (a + 2.К")= - en (-a) = - en a, dn(a + 2K) =dn(-a) = dna. Эти формулы мы уже получали другим способом. Рассмотрим теперь обход вдоль пути, изображенного на рис. 23. Пусть *-' dx г!" ж'= I V(l -x2){\-k2x2) Число К1 вещественно, так как при х £ (\,k~l) число VI — х2 мнимое. Тогда значение интеграла в точке X равны а и К+гК'+ + гК1 — (К — а). Пояснений здесь требует лишь знак последнего слагаемого. Дело в том, что произошли три перемены знака: изменилось направление интегрирования и изменились знаки обеих функций VI — х2 и VI — к2х2. В результате получаем sn a = sn (а+2гК'), en a = - en (a+2iK'), dn a = - dn (a+2iK'). Следовательно, функции snu, спи и dn-u имеют периоды 2iK', АгК' и 4гК' соответственно. Кроме того, у функции спи есть период 2К + 2гК'. В самом деле, en (а + 2гК' + 2К) = - сп (а + 2гК') = сп а.
§ 9. ТЕОРЕМА ВЕЙЕРШТРАССА 73 Таким образом, функция snu имеет периоды 4К и 2iK', функция сп и имеет периоды АК и 2К + 2iK', а функция dn и имеет периоды 2К и АгК'. Задачи 1 Докажите, что К' = I , , где k'2 + k2 = 1. J V(l - t2)(l - A:'2t2) Указание. Сделайте замену k't = \/1 - /с2ж2, где число /с' выбрано так, что к\/х2 — 1 = fc'-v/l-t2". § 9. Теорема Вейерштрасса о функциях, обладающих алгебраической теоремой сложения Будем говорить, что мероморфная функция tp(z) обладает алгебраической теоремой сложения, если существует такой ненулевой многочлен F от трех переменных, что F(<p(Zl + z2),<p(Zl),<p(z2)) = 0. Это равенство означает, что ip(zl+z2) алгебраически выражается через <£(.?,) и <p(z2). Например, алгебраической теоремой сложения обладает функция sn z. В самом деле, если а= sn (z^z^, b = snzu c = snz2, то _ ЬуТ^У! -fc2c2 + cyT^fcVl -k2b2 а~ 1 - k2b2c2 С помощью двух возведений в квадрат можно избавиться от радикалов и получить полиномиальное соотношение F(a,b,c) = 0. Функция Вейерштрасса <p(z) тоже обладает алгебраической теоремой сложения. В самом деле, как показано в § 5, если а=р(г1+г2), b=fp(zl) и c = p(z2), то
74 ГЛ. 2. ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ После преобразования этой формулы можно получить соотношение вида F(a,b,c) = 0, где F — многочлен. Любую эллиптическую функцию / можно записать в виде f=R(p) + Rl(p)p', где R и Д[ — рациональные функции (см. § 3). Это представление позволяет получить алгебраическую теорему сложения для произвольной эллиптической функции, если учесть, что (р')2 = 4р3 - д2р - д3. В самом деле, если R. ф О, то р' = . Поэтому R\\P) Это соотношение можно переписать в виде Р(/, р) = 0, где Р — многочлен, степень которого по / равна 2. В случае, когда Л[ =0, соотношение / = R(p) тоже можно записать в таком виде. Пусть A = f(zl+z2), £ = /(*,), C = /(z2). Из соотношений F(a,b,c) = 0 и Р(А,а) = 0 можно получить соотношение F{(A,b,с) = 0, вычислив результант многочленов /(о) = F(a,b,c) и д(а) = Р(А,а). Затем из соотношений F{(A,b,c) = 0 и Р(В,Ь) = 0 получим, что F2(A,B,c) = 0, а из соотношений F2(A, В,с) = 0 и Р(С,с) = 0 получим требуемое соотношение G(A, В,С) = 0. Алгебраической теоремой сложения обладают не только эллиптические функции. Как хорошо известно, алгебраической теоремой сложения обладает функция ez, так как ezi+z? = eziezz. Кроме того, если и = R(f), где R — рациональная функция, то P(u,f) = 0, где Р — многочлен линейный по и. Поэтому из соотношения F(a,b,c) = 0 можно получить соотношение G(A,B,C) = 0, где A = R(a), В = ЩЬ) и С = Щс). Поэтому любая рациональная функция, а также любая рациональная функция от eXz обладает алгебраической теоремой сложения. Оказывается, что приведенные примеры исчерпывают все мероморфные функции, обладающие алгебраической теоремой сложения.
§ 9. ТЕОРЕМА ВЕЙЕРШТРАССА 75 Теорема 1 (Вейерштрасс). Мероморфная функция ip(z), обладающая алгебраической теоремой сложения, либо является эллиптической, либо имеет вид или R(z), или R(e ), где R —рациональная функция. Доказательство. В конечной области мероморфная функция не имеет особых точек, отличных от полюсов. Если существует lim уз(,г) или lim —— , z—»оо z—»оо ifi(z) то функция (p(z) рациональная. В самом деле, вычтем из функции <р сумму ее главных частей во всех полюсах (если точка оо является полюсом, то главная часть функции в этой точке имеет вид arzr + ar+izr+1 + ..., где г > 0). В результате получим функцию /, не имеющую особых точек, причем точка оо тоже неособая. Следовательно, функция / — константа, а исходная функция уз — рациональная. В дальнейшем будем считать, что функция уз не рациональная, т. е. точка оо существенно особая. Для доказательства теоремы Вейерштрасса нам потребуется следующая теорема о поведении функции в окрестности существенно особой точки. Теорема 2 (Большая теорема Пикара). Аналитическая функция (f(z) принимает в произвольной окрестности существенно особой точки любое конечное значение, за исключением,, быть может, одного. Доказательство этой теоремы можно найти в [БЗ]. □ Пусть F(y3(z, + z2), уз(г,), tp(z2)) = 0, где F — многочлен, причем его степень по первому аргументу равна п. Нужно доказать, что функция уз периодическая, причем если она не двоякопериодическая, то ip(z) = R(eXz). Из теоремы Пикара следует, что функция уз в окрестности существенно особой точки принимает некоторое значение с бесконечно много раз. Пусть а,,..., ап+1 — точки, в которых уз принимает значение «. Особые точки функции уз, а также точки z, для которых точки z + ai особые, образуют множество меры нуль. Поэтому существует неособая точка z0 функции уз, для которой точки а{+г0 тоже
76 ГЛ. 2. ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ неособые. При этом точки z и а{ + z для z, достаточно близких к z0, тоже неособые. Для таких точек z рассмотрим уравнение F(x^(z),c) = 0. (9.1) Оно имеет п + 1 корень xi — ip(z + аг), так как F(<p(z + о,-), v(z), с) = F(ip(z + а{), <p(z), <р(а{)) = О Уравнение (9.1) представляет собой ненулевой многочлен степени п от х, поэтому оно имеет не более п различных корней. Следовательно, ip(z + a ) = <p(z + a„) для некоторых несовпадающих р и q. Такие соотношения выполняются для любой точки z из окрестности точки z0, но пары (р, q) могут при этом меняться. Тем не менее, пар (р, q) конечное число, поэтому некоторое соотношение tp(z + a ) = if(z + а ) выполняется для бесконечного набора точек z. Эти точки имеют предельную точку zv причем функция ip в ней регулярна. По теореме единственности получаем, что функции ip(z + а ) и <p(z + а ) совпадают, т. е. а - а — период функции ip. Мы доказали, что функция ц> периодическая, для определенности можно считать, что минимальный период функции if равен 27г. Предположим, что других периодов у функции if нет. Докажем, что тогда ip(z) = R(w), где w — etz, R — рациональная функция. Отображение z \—> w = егг переводит полосу 0 ^ ^ Re 2 < 27г в плоскость с разрезом от 0 до +оо. Функция т/>(ги) = if(z) мероморфна на плоскости с выколотыми точками О и схэ. Если эти точки не являются существенно особыми, то функция ф рациональна. Предположим, что хотя бы одна из них существенно особая. Тогда согласно теореме Пикара существуют точки ft,,... ,ЬП+Р для которых ф{Ь{) — с Прообразы /Зр ... ,/?п+1 этих точек при отображении z \—> w попарно различны и лежат в полосе 0 < Rez < 27г. Уравнение F(x, ip(z),c) = 0 имеет корни ij = if(/3i + z). Повторив те же рассуждения, что и раньше, получим, что функция f> имеет период /L — /3 , причем О < Re/3p,Re/?9 < 2тт. Следовательно, функция ip либо имеет не только чисто вещественный период 2-к, либо имеет вещественный период, меньший 2-к. Последний случай невозможен, так как период 27г по предположению наименьший. D
ГЛАВА 3 ДУГИ КРИВЫХ И ЭЛЛИПТИЧЕСКИЕ ИНТЕГРАЛЫ Для окружности легко построить дугу, длина которой равна сумме длин двух ее заданных дуг. Вообще говоря, это связано с тем, что sin(y3 + ф) выражается через sin уз и sin-0 по формуле sin(y> + V) = sin узу 1 - sin2 -0 + sin -0у 1 _ sin2 уз. Но, как мы уже знаем, для эллиптических интегралов F(y?) и E(ip) также есть теоремы сложения. Это означает, что для кривых, дуги которых выражаются через -Р(уз) и Е(<р), также возможна операция сложения дуг, хотя она будет и более громоздкой. Для кривых, дуги которых выражаются через Е(ф), это будет сложение не в прямом смысле, а с некоторой алгебраической добавкой. В этой главе мы займемся кривыми, дуги которых выражаются через эллиптические интегралы. Во многих отношениях из всех таких кривых наиболее интересна лемниската. Но она заслуживает специального изучения, и ей мы займемся в гл. 4. § 1. Дуги эллипса и гиперболы Нетрудно проверить, что с помощью формул х = a cos уз, у = Ь sin уз можно параметрически задать эллипс 2 2 х V 1--=1 а2 Ь2 Дифференциал dl длины дуги эллипса равен y/dx2 + dy2 = dtp \/а2 cos2y3 + 62_sin2y3. Если a = 1 и b = \/\ — к2, то
78 ГЛ. 3. ДУГИ КРИВЫХ И ЭЛЛИПТИЧЕСКИЕ ИНТЕГРАЛЫ В этом случае длина дуги эллипса, заключенной между концом малой полуоси В и точкой М — = (a cos уз, b sin уз), равна У ч ^ V л Е(ф) = f v/1 -к2%\п2грйф. Рис. 24 Таким образом, длина дуги эллипса выражается эллиптическим интегралом второго рода. Именно отсюда пошло название для интегралов этого типа — эллиптический интеграл. Наиболее простая параметризация гиперболы 2 2 — - У- = 1 а2 Ъ2 получается с помощью гиперболических функций: х = acht, у = = bsht. Но для выражения длины гиперболы через F(f) и £(уз) нужна параметризация с помощью тригонометрических функций. Одну из yIL возможных таких параметризаций дают формулы х = a/ cos уз, у = btgtp. При этой параметризации дифференциал длины дуги равен 1 COS2y3 \/a2sinV + b2dp, Рис. 25 желаемого выражения эта формула не дает. Рассмотрим поэтому другую параметризацию, положив у = 62tgy3. Тогда х2 = f_±Y П _ (1_Ь2 )sin2 у V cos уз у v ' В частности, в том случае, когда а2 — 1 — b2 = к2, получим
§ 2. ДЕЛЕНИЕ ДУГ ЭЛЛИПСА 79 а значит, COS2 <£\/l — fc2Sin2</3 Поэтому длина дуги ЛМ гиперболы (рис. 25) равна J cosWl -k2sin4 J cos2V>A(V>)' о 0 а/,ч л ,9.9< . .//,4 fc2sinV>cosV> где A(V>) = vl -kzsmzip. А так как А (ф) = —— , то /а/,44. ,ч/ fc2sin2V A(V) 1-fc2 1-fc2 А/(Ч поэтому r(^) = A(^)tgV- J A(^)d^ + (l-fe2) {^у = о о = A(^)tgv-£(V) + (l-fc2)F(V). Таким образом, длина дуги гиперболы тоже выражается через эллиптические интегралы E(tp)t F(ip) и элементарную функцию A(ip)tgip, хотя и это выражение более сложное. § 2. Деление дуг эллипса 2 2 Рассмотрим эллипс — + — = 1, где а = 1 и 6 = %/1 — к2. а1 Ь1 Длина его дуги ВМ (рис. 24) равна Е(<р). В § 7 гл. 2 было показано, что если F(ip) + F{ij)) = F(/i), то Е(<р) + Е(ф) ~ Е(ц) = к2 sin ip sin ф sin /i, при этом ip, ф и ц связаны соотношением соьусоъф - sin if sin V^\/l — ^2 sin2/i = COS/i.
80 ГЛ. 3. ДУГИ КРИВЫХ И ЭЛЛИПТИЧЕСКИЕ ИНТЕГРАЛЫ У г к\ в — > Мы не будем напоминать все полученные в § 7 формулы, хотя многие из них нам сейчас понадобятся для получения соотношений между дугами эллипса. Начнем с исследования случая fj, = 7г/2. Тогда sin/i = 1, а углы ^р и ф связаны соотношением btg^tgV' = 1- Пусть точки М Рис- 26 и N соответствуют углам у> и ф (рис. 26). Обозначив через атсВМ длину дуги ВМ, запишем Е{(р) = arc ВМ, Е(ф) = arc ВМ + arc MN, Е(ц) = arc ВМ + arc MN + arc NA. Следовательно, £(y>) + Е(ф) - E(fi) = arc ВМ - arc iVA. Нами доказано следующее утверждение. Теорема 1 (Фаньяно). Пусть углы риф связаны соотношением Ъ\.£ф\£ф = \, М и N — соответствующие этим углам точки эллипса. Тогда разность длин дуг ВМ и NA равна k2 sirup sin ф. О Рассмотрим подробнее случай, когда точки М и N совпадают, т. е. у? = ф = в. При этом tg2^ = Ь-1 и sin2 в = (1 +b)~l. Следовательно, ВМ- AM = к2sin2в = 1-6. Кроме того, ВМ + AM = Е (-) = Ех — четверть длины эллипса. Поэтому ^ и АМ=1-Е'-1-{\-Ь) т. е. с точностью до алгебраической добавки -(1 —Ь) точка М делит дугу пополам. Наличие дополнительного члена fc2siny>sini/;sin/i
§ 2. ДЕЛЕНИЕ ДУГ ЭЛЛИПСА 81 в теореме сложения для эллиптических интегралов второго рода приводит к не совсем естественному делению «пополам». Аналогичное деление дуги «пополам» можно произвести не только для четверти дуги эллипса, но и для произвольной дуги ВМ. Если if = ф = в и F(<p) + F(ip) = F(n), то 2Е(в)-Е(ц) = A;2 sin2 0 sin м, причем углы в и ц связаны соотношением cos2# - sin2# Д(аО = cos ^. Для нахождения угла у, по данному углу в («удвоение» дуги) можно воспользоваться любой из формул 2 sin в cos в А(в) или tg(|)=A(0)tg0. А для нахождения угла в по данному углу ц (деление дуги «пополам») можно воспользоваться формулой .2 1 - cos ц sin 0 = -1 гт-т- I + А(м) Равенство 2Е(в)-Е(ц) = A;2 sin2 0 sin д означает, что 2 arc ВМ - arc BN = к2 sin2 в sin ц, где точки М и N соответствуют углам виц. При этом arc ВМ = - arc BN + - к2 sin26> sin ц = 2 2 s2 Таким образом, полученные формулы не позволяют построить точку, которая разбивает дугу АВ ровно пополам. Однако,
82 ГЛ. 3. ДУГИ КРИВЫХ И ЭЛЛИПТИЧЕСКИЕ ИНТЕГРАЛЫ построение какой-нибудь дуги MN, длина которой равна половине длины дуги АВ, может быть проделано точно, без алгебраической добавки (рис. 27). Построим сначала точку К, делящую дугу АВ «пополам», т. е. с алгебраической добавкой. Этой точке соответствует угол в, для которого У sin2 0 = (1+6)-1 Е(6)=\ех + ^(\-Ъ). Для углов tp w ф должно выполняться соотношение Е(ф)-Е(ц>)=1-Е1. В М(<р) Рис. 27 Пользуясь свободой выбора точки М, наложим на углы tp и ф дополнительное условие F(tp) + F(6) — F(ip) = 0, из которого следует, что E(tp) + Е(в) - Е(ф) = к2 sin ч> sin ф sin в и cos if cos ф + sin if sin ф А(в) = cos в. Тогда -El = Е(ф) - E(tp) = Е(в) - к2 sin tp sin ф sin в = = -rE1 + -(1 -b) - к2 sin ip sin ф sin в, а значит, A:2 sin <p sin ф sin в = -(1 - b). Учитывая, что к2 = 1 - b2 и sin2# = (1+ b)~\ получим ^ sin tp sin ф = (i-b)vT+b 1 1 . = - sin в. 2\ГГ+Ь 2 2(1-62) А так как Д(#) = V^, то соотношение cos ip cos ф + sin tp sin ф А(в) = cos в можно переписать в виде Vb cos tp cos ф + — sin в = cos в.
§ 2. ДЕЛЕНИЕ ДУГ ЭЛЛИПСА 83 Но y/bs'md — cos0, поэтому cosу>cosф = -cos0. В результате для <р и ф мы получаем уравнения sin ip sin ф = - sin 6* и cos <р cos ^ = - COS б. Следовательно, 1 7Г / 7Г\ cos (у ± ф) — - (cos б т sin б) = cos — cos (б ± — \ . Эти формулы позволяют найти (риф. Кроме того, из тех же уравнений можно получить и выражения siny? = -\/3 + 4sin0 + 2sin20- -г>/3 - 4sin0 + 2sin20, 4 4 sinV = -r\/3 + 4sin0 + 2sin20 + т \/3 - 4 sin 0 + 2 sin2 0. 4 4 Найденные выражения показывают, что если дан эллипс, в котором проведены большая и малая полуоси О А и ОВ, то с помощью циркуля и линейки можно построить дугу эллипса, длина которой равна половине длины дуги АВ. Впрочем, если полуоси не заданы, то их можно построить с помощью циркуля и линейки, хотя это и не совсем просто (см., например, [Б5, с. 114]). Займемся теперь делением дуги эллипса на три равные части. Рассмотрим прежде всего деление с алгебраической добавкой. Напомним, что если Е{ф) = 3F(ip), то • _ Зх - 4 (1 + fc2) х3 + 6fcV - k4x* S1" ^ ~ 1 - 6/fc2x4 + 4*2 (1 + к2) х6 - 3/fc4x8 ' где х = sin <р. При ф = 7г/2 это уравнение сводится к уравнению 1 - 2х + 2/fcV - /fcV = 0. (2.1) Если F{tp2) = 2F(<p) и F(ip3) = 3F(v?) (т. е. <р3 = ф), то 3E(tp) - Е(ф) = к2 sin <р (sin <р sin <р2 + sin <р2 sin <р3). Построим теперь какую-нибудь дугу, длина которой равна трети длины дуги АВ, где О А и ОВ — полуоси эллипса. В этом случае ф = <р3 = 7г/2, поэтому sin<^3 = i, а значит, ЗЕ(<р) - Е(ф) = k2sinips'm<p2(s'mip+ 1),
84 ГЛ. 3. ДУГИ КРИВЫХ И ЭЛЛИПТИЧЕСКИЕ ИНТЕГРАЛЫ т. е. E(ip) = -Е1 + - к2 sin ip sin ip2 (sin y> + 1). (2.2) О О Пусть x = sin ip — корень уравнения (2.1). Будем искать углы -фиш, удовлетворяющие соотношениям Е(Ш)-Е(ф)=~Е\ (2.3) F(<p) + F(i>) - F{u>) = 0. (2.4) Из (2.4) следует, что Е(ф) + Е(ф) — Е(ш) = к2 sin <р sin ф sin ш. Учитывая (2.2) и (2.3), получим sin ^ sin w = - sin у2 (1 + simp). (2.5) О Кроме того, из (2.4) следует, что cos ф cos u) + sin ф sin ш A(ip) = cos <p, а значит cos ф cos ш = cos ip — - sin ip2 A(y>) (1 + sin tp). О Воспользовавшись соотношением cos <p2 cos tp3 + sin <p2 sin <p3 A(y) = cos <p получим sin <p2 = cos tp/A(tp). (2.6) Записав соотношение (2.1) в виде l-(l-x2)/(l-A;V) = (l-x)2, где х = sin ip, мы можем следующим образом преобразовать (2.6): cosy>2 = 1 — sin у?. Поэтому cos ф cos ш = cos <р - - cos tp (1 + sin ф) = - cos tp (1 + cos tp2).
§ 2. ДЕЛЕНИЕ ДУГ ЭЛЛИПСА 85 Это соотношение вместе с (2.5) приводит к следующим формулам: cos (ф ±ш) = - (cos ip + cos ip cos ip2 =p sin ip2 =p sin f sin ip2) = = - (cos ip т sin <p2 + COS (if ± <p2)). Таким образом, если корень уравнения (2.1) можно построить с помощью циркуля и линейки, то для эллипса с отношением осей 1 : \/1 — к2 с помощью циркуля и линейки можно построить дугу, длина которой равна трети дуги АВ. Примером такого эллипса служит эллипс с отношением осей 1 : \/2, для которого fc2 = 1/2. Уравнение (2.1) в этом случае имеет вид х4 - 2х3 + Ах - 2 = 0. Сделав замену х = \/1 - z, получим уравнение 2(1 +z)VT^ = 2 -(1-2)2. После возведения обеих частей в квадрат получим z4 + 6z2 - 3 = 0, т. е. z2 = -3 ± 2^3. В итоге z = V 2\/3 — 3 и sin <р = х = \/1 — z, т. е. угол ip можно построить с помощью циркуля и линейки. Весь материал этого параграфа взят из классического сочинения Лежандра «Traite des fonctions elliptiques» [A7]. Задачи. 1. Пусть углы <р и ф связаны соотношением btgiptgtp = = 1. Согласно теореме Фаньяно разность дуг ВЫ и NA равна fc2 sin f sinф. Докажите, что она равна также отрезкам MMi и NNV где М, и N{ — проекции центра эллипса на касательные в точках М и N (рис. 28). в м. Рис. 28
86 ГЛ. 3. ДУГИ КРИВЫХ И ЭЛЛИПТИЧЕСКИЕ ИНТЕГРАЛЫ § 3. Кривые с эллиптическими дугами Эллипс служит примером кривой, длина дуги которой выражаются эллиптическим интегралом второго рода. Для кривой, дуги которой выражаются эллиптическим интегралом первого рода, сложение дуг тоже можно было бы выполнять, причем даже без алгебраической добавки. Но есть ли вообще кривые, координаты которых являются достаточно простыми функциями параметра <р, а длина дуги, как функция аргумента <р, представляет собой эллиптический интеграл первого рода? Для к = 1/\/2 такая кривая была известна еще Фаньяно, это — лемниската. Ле- жандр пытался построить пример такой кривой для произвольного к. Иными словами, он искал кривую х = x(tp), у = у(ц>), длина дуги которой от точки с параметром 0 до точки с параметром ip равна v dip F(<P)= f у/1 - k2sin2(p Построить пример такой кривой не очень сложно. Если cos if dip — b simp dip dX=~, , 9 ■ 9 ' "2/=l .9 ■ 9 > 1 - к2 sin2 ip I - к2 sm2ip где b = \/l — к2, то dx2 + dy2 = ^— = (J^)\ 1 - k2sm2ip \A(ip)J Поэтому в качестве функций x(ip) и у(<р) можно взять первообразные функций cosy> — bsimp 1 - к2 sinV' l-k2s'm2ip' Соответствующие интегралы легко вычисляются с помощью замены переменных и = sin ip и v = cos ip. В результате получаем 1 , 1 + ки 1 . 1 + к sin ip х = — in — — in — 2k 1 — ku 2k 1 — ksxvup'1 1 , kv 1 kcosip y=kaTctsT = kaTCtg-b—-
§ 3. КРИВЫЕ С ЭЛЛИПТИЧЕСКИМИ ДУГАМИ 87 Легко проверить, что . ь cos ку = v/l-/fc2sinV chfcx = екх _|_ е А;х у/1 - /c2sinV т. е. cos/су = ftch/cx. Этот пример Лежандр нашел легко, но он его не устраивал, потому что кривая cos ку = bchkx не алгебраическая. Ему удалось также построить пример алгебраической кривой, длина дуги которой равна Ё(ф) с некоторой алгебраической добавкой. Итогом этих исследований Лежандра явилась проблема нахождения всех алгебраических кривых, длина дуги которых представляем собой эллиптический интеграл первого рода. Проблему Лежандра решил французский математик Жозеф-Альфред Сер- ре. В трех работах, опубликованных в журнале Лиувилля [А 10] (изложение этих работ см. в [Б25, § 563-565; Б24]), он создал общий метод нахождения таких кривых и получил их полное описание. В частности, он построил семейство плоских алгебраических кривых S , зависящих от рационального положительного параметра р, длина дуги которых в точности равна F(y?). Кривые Серре S получаются следующим образом. Пусть р — фиксированное число. Рассмотрим треугольник ОРМ, стороны ОР и РМ которого равны \[р и у/р + Т, а углы при вершинах О я М равны а и j3. Пусть cosu> = cos(pa — (р+ 1)/3)- (3.1) Введем прямоугольную систему координат Оху с началом в вершине О треугольника ОРМ так, чтобы ось Ох образовала со стороной ОМ угол ш (рис. 29). Будем изменять треугольник ОРМ так, чтобы точка О оставалась неподвижной, длины сторон ОР и РМ оставались постоянными, а угол ш между осью Ох и стороной ОМ каждый раз определялся бы соотношением (3.1). Точка М опишет при этом некоторую кривую 5_. Пусть х = р cos ш и у = р sin ш — координаты точки М. Можно считать, что х и у зависят от параметра а. Рис. 29
ГЛ. 3. ДУГИ КРИВЫХ И ЭЛЛИПТИЧЕСКИЕ ИНТЕГРАЛЫ Теорема 1 (Серре). Длина дуги кривой S , как функция параметра а, равна VpJ dlf> где k= ^ J\ -A;2sinV' VP+1' о При этом кривая S алгебраическая для любого положительного рационального р. Доказательство. Пусть ОМ = р. Согласно теореме косинусов р+ 1 =р + р2 -2p\/pcosa, р = р+ 1 +р2 -2p\Jp+ 1 cos/3, т. е. Р2 - 1 Р1 + 1 cos a = ^-^, cos/3 = F / . (3.2) 2PV/P 2Pv/pTT Таким образом, р и cos а связаны полиномиальным соотношением. Кроме того, если р € Q, то cos а и cos ра связаны полиномиальным соотношением. Следовательно, р и cos pa связаны полиномиальным соотношением. Аналогично р и cos(p+ 1)/3 связаны полиномиальным соотношением. А так как х = р cos uj = р cos (pa — (р+ 1) /3), у = ps'muj, то х и р, а также у и р связаны полиномиальными соотношениями. Следовательно, я и у связаны полиномиальным соотношением, т. е. кривая 5 алгебраическая. Из (3.2) следует, что R . . R sina = — , sin/3 = 2pv/p' 2pv/p+l ' где R = \j—p* + 2(2p+ l)p2 — 1. Дифференцируя равенство cos w = cos (pa - (p+ 1)0), получим -sinwdw = -(pda-(p+ l)d0) sin (pa - (p + 1)/3). При этом sinw = ± sin (pa - (p+ 1) /3). Следовательно, ± dw = pda — (p + 1) dp.
§ 3. КРИВЫЕ С ЭЛЛИПТИЧЕСКИМИ ДУГАМИ 89 Воспользовавшись тем, что Р2-1 cos а = 2pv/p d cos a = — sin a da = -= da, получим de = -^+1^. Аналогично Л/9 ^ - l dP R p Следовательно, R p Пусть dl — дифференциал длины дуги. Тогда т. е. dl2 = dp2 + p2du;2 = 4p(p+l)^, dp А так как dl = ±2y/p(p+l) R . da п , -dp то cos/3 v^ R da ±dl= у/р cos/3' Кроме того, так как sin /3 = . / sin а, то поэтому cos /3 = V Р+1 = \/\ — fc2sin2a, где к = А -. В итоге, если отбросить знак, получим V Р+* dl = у/р \/1 - к2 sin2 а ' что и требовалось. D Кривая S обладает следующим замечательным свойством. Пусть точки О, A w В соответствуют значениям параметра 0, а и /9. Рассмотрим точку С, для которой длина дуги ОС равна сумме длин дуг О А и ОВ. Иными словами, точке С соответствует
90 ГЛ. 3. ДУГИ КРИВЫХ И ЭЛЛИПТИЧЕСКИЕ ИНТЕГРАЛЫ такое значение параметра 7> что F(-y) = F(a) + F(0). Тогда C0S7 алгебраически выражается через cos а и cos/З. Кроме того, координаты точек А, В и С алгебраически выражаются через cos а, cos/З и cos 7 соответственно. Поэтому координаты точки С алгебраически выражаются через координаты точек А и В. Таким образом, сложение и деление дуг кривой 5 — алгебраические задачи. В частности, можно написать уравнение деление дуги кривой 5 на п равных частей. Рассмотрим теперь более подробно кривую 5 для р = 1. В этом случае cos а = —-— , cos в = —=— . Несложные вычисления показывают, что x = pcos(a-2/3) = ^-хт~+ 1 Д(1-Р2) где R = \/-р* + 6р2 - 1. Поэтому x-l = р, cos/3 и у = —рх sin/3, где р1 = —-=— . Кроме того, С082/3=(^) = *Р?' т. е. рассматриваемая кривая — лемниската. § 4. Кривые, дуги которых выражаются через дуги окружности В предыдущем параграфе была построена серия кривых, для которых сложение дуг — алгебраическая операция. Есть и другие примеры таких кривых. Они были построены еще Эйлером. Он писал, что нашел эти кривые лишь после длительных трудов. Координаты точек этих кривых являются алгебраическими функциями аргумента tgs, где s — параметр, пропорциональный длине дуги кривой. Сложение дуг таких кривых есть алгебраическая операция, так как tg(a + /3) алгебраически выражается
§ 4. КРИВЫЕ, ДУГИ КОТОРЫХ ВЫРАЖАЮТСЯ ЧЕРЕЗ ДУГИ ОКРУЖНОСТИ 91 через tga и tg/З. Впоследствии Серре обобщил примеры, построенные Эйлером. Он даже дал полную классификацию таких кривых. Мы ограничимся лишь наиболее простым примером. Пусть (* - а)п+2 У (t- а)п (t + if ' где п — целое или рациональное число, а — комплексное число. При изменении t от —оо до +оо точки с координатами (х, у) образуют некоторую кривую. Эта кривая алгебраическая, так как х и у алгебраически выражаются через t. Легко проверить, что dx + idy имеет вид (t-a)n+l{pt + q) (t - a)n+l (t + г)3 Число а можно выбрать так, что pt + q = k(t — г). При этом можно даже считать, что \а\ = 1, а именно: у/п(п+ 2) г а = п+\ п+1 ' При таком значении а получим pt + q = k(t — г), где к = 2Уп(п + 2) п+ 1 В этом случае dx- idy — к -т / ,, , dt. У (t- a)n+l (t - if Следовательно, dl2 = dx2 + dy2 = k2-—£r =(к- dt (t + if (t - if \ t2+l Поэтому Г dr 1 = ±к -r^-{=±kavctgt. о Таким образом, если параметр s равен длине дуги кривой, деленной на к, то t = ±tgs, причем координаты х и у точек кривой
92 ГЛ. 3. ДУГИ КРИВЫХ И ЭЛЛИПТИЧЕСКИЕ ИНТЕГРАЛЫ алгебраически выражаются через t. Отсчет длин дуг ведется от точки, соответствующей параметру t = 0. Задачи 1. Докажите, что при п = 1 после гомотетии уравнение рассматриваемой кривой в полярных координатах можно записать в виде р2 + 6р-2 COS f = 3p2V3
ГЛАВА 4 ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ Лемнискатой называют кривую, уравнение которой в полярных координатах имеет вид г2 = cos 20 (рис. 30). Это название происходит от латинского слова lemniscatus — украшенный лентами. В декартовых координатах (х, у), где х = г cos в, у — rsin#, эта кривая имеет уравнение (х2 + у2)2 = х2-у2. В самом деле, х2 + у2 = г2 и х2 - у2 = г2 cos 29. Первым к исследованию лемнискаты обратился французский астроном Жак Доминик (Джованни Доминико) Кас- сини (1625-1712), итальянец по национальности. Он рассматривал даже более общие кривые, для точек которых произведение расстояний до двух фиксированных точек F, и F2 постоянно (рис. 31). На основании астрономических наблюдений Кае сини полагал, что с помощью таких кривых движение планет можно описать более точно, чем с помощью эллипсов. Эти кривые называют теперь овалами Кассини. Но книга Кассини «Elements d'astronomie» («Основы астрономии»), в которой они изучались, была опубликована лишь через много лет после его смерти, оо
94 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ в 1749 г. Математическому сообществу лемниската стала известна из статей Якоба Бернулли и Иоганна Бернулли, опубликованных в 1694 г. [А2]. Поэтому ее обычно называют лемнискатой Бернулли. Наиболее замечательные свойства лемнискаты были обнаружены итальянским математиком графом Фаньяно (1682-1766). Кстати сказать, именно он ввел термин «эллиптические интегралы». Фаньяно обнаружил, что длина дуги лемнискаты выражается эллиптическим интегралом первого рода. Он получил теорему сложения для этого интеграла и тем самым показал, что деление дуги лемнискаты на п равных частей — это алгебраическая задача. В 1750 г. Фаньяно издал собрание своих статей под названием «Produzioni matematiche» [All]. Берлинская академия поручила написать отзыв об этой книге Леонарду Эйлеру. Работы Фаньяно вызвали у него большой интерес к эллиптическим интегралам. В своих многочисленных исследованиях Эйлер существенно развил и обобщил методы и результаты Фаньяно. Уже Фаньяно было известно, что деление лемнискаты сводится к решению алгебраического уравнения. Но методы анализа разрешимости уравнений в квадратных радикалах тогда еще не были разработаны. Первым существенного успеха в этой области добился в 1796 г. 19-летний Гаусс. Он обнаружил, что правильный 17-угольник можно построить с помощью циркуля и линейки, т. е. уравнение я17 — 1 = 0 разрешимо в квадратных радикалах. Позже Гаусс доказал, что с помощью циркуля и линейки можно построить правильный n-угольник для всех п вида 2ар, ... рк, где pi — различные простые числа Ферма, т. е. простые числа вида 22"1 -f 1. Гаусс писал, что для всех остальных п правильный n-угольник нельзя построить с помощью циркуля и линейки, но нет никаких подтверждений того, что он действительно умел это доказывать. Уравнение деления лемнискаты тоже интересовало Гаусса. Например, он показал, что уравнение 25-й степени, связанное с делением лемнискаты на 5 равных частей, решается в квадратных радикалах. Его рассуждения были основаны на том, что число 5 можно представить в виде произведения двух комплексно сопряженных чисел 2 + г и 2 — г (см. § 3). Этих исследований Гаусс не опубликовал, но в книге «Disquisitiones Arithmeticae» («Арифметические исследования»), изданной в 1801 г. [A3, а], он упомянул, что разработанные им методы применимы не только
ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ 95 к тригонометрическим функциям, но и к функциям, связанным с Jdx . Это утверждение заинтриговало Абеля. Он подробно исследовал уравнение деления лемнискаты и доказал, что лемнискату можно разделить на п равных частей для всех чисел п вида 2ар,.. .рк, где р,- — различные простые числа Ферма. Эту теорему Абель считал одним из наиболее важных своих достижений. Она содержится во второй части его большой работы «Recherches sur les fonctions elliptiques» («Исследования по эллиптическим функциям») [А1]. Доказательство Абеля весьма длинное и сложное. Впоследствии Эйзенштейн (1823-1852) получил более простое доказательство. При этом он обнаружил интересные свойства многочленов деления лемнискаты. Недавно Роузен [В 14] нашел новое изящное доказательство теоремы Абеля. Оно сравнительно несложно, и, кроме того, ясно показывает решающее значение инвариантности решетки периодов лемнискатических функций относительно умножения на г. Чтобы читатель мог почувствовать стиль эпохи Абеля и, в то же время, познакомиться с современным истолкованием предмета, мы приведем оба доказательства — и то, которое полтора века назад получил Эйзенштейн, и то недавнее, которое было найдено Роузеном. Абель доказал лишь возможность деления лемнискаты на п равных частей с помощью циркуля и линейки при указанных значениях п. Однако, он не доказывал, что при других п этого сделать нельзя. И, тем не менее, как показано в работе [В14], при других п нельзя построить с помощью циркуля и линейки координаты точек, делящих лемнискату на п равных частей. Но это не означает, что при других п нельзя разделить лемнискату на на п равных частей с помощью циркуля и линейки в том случае, когда лемниската нарисована. Дело в том, что использование самой лемнискаты дает для построений дополнительные возможности. Рассматривая точки пересечения прямых и окружностей с лемнискатой можно, вообще говоря, строить не только квадратичные иррациональности. И последнее замечание. Известно, что с помощью циркуля и линейки можно разделить пополам любую дугу окружности. Оказывается, что с помощью циркуля и линейки можно разделить пополам и любую дугу лемнискаты. Доказательство этого факта приведено на с. 113.
96 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ Прежде чем заняться уравнением деления лемнискаты, рассмотрим более простое уравнение деления окружности. Сначала мы покажем, как вполне элементарным способом можно решить в квадратных радикалах уравнение ж17 — 1 = 0, хотя это решение не переносится на уравнение деления лемнискаты. Затем обсудим подход к разрешимости уравнения хп — 1 = 0 в квадратных радикалах, который переносится и на уравнение деления лемнискаты. § 1. Построение правильного 17-угольника. Элементарный подход Корни уравнения хп— 1 = 0 являются вершинами правильного та-угольника. В самом деле, если е = е2жг'п, то е, е2,..., en_1 — корни рассматриваемого уравнения. Поделив многочлен хп — 1 = 0 на х — 1, получим многочлен хп~1 + хп~2 + ... + х + 1. Таким образом, если уравнение Xй-1+хп~2 + ... + х+1 = 0 (1.1) разрешимо в квадратных радикалах, то правильный п-угольник можно построить с помощью циркуля и линейки. При п = 3 никаких вопросов не возникает, потому что квадратное уравнение х2 + х + 1 =0, безусловно, разрешимо в квадратных радикалах. При п = 5 уравнение (1.1) решается легко. В самом деле, после замены и = х + х~1 его можно переписать в виде и2 + и — 1 = 0. При п = 17 решить уравнение (1.1) в квадратных радикалах уже не так просто. Гаусс использовал для этого следующий метод, применимый и к более сложным случаям. Попытаемся расположить корни 17-й степени из единицы е, е2, е3, ..., е16, где е = е2"7/17 в виде цикла так, чтобы каждый из них получался из предыдущего одним и тем же способом, а именно, возведением в одну и ту же степень. Если возводить в квадрат, то таким образом можно получить только восемь корней: так как (е9)2 опять равно е.
§ 1. ПОСТРОЕНИЕ ПРАВИЛЬНОГО 17-УГОЛЬНИКА 97 Попробуем возводить е в некоторую более высокую степень д. Тогда получается ряд чисел £ £9 £02 £03 ^'5 с, с , с , с , . . ., t Мы должны подобрать такое д, чтобы выполнялось следующее условие: остатки от деления чисел 1, д, д2,.. .,д15 на 17 должны принимать значения от 1 до 16. Такие числа называются примитивными корнями по модулю 17. Более общим образом, целое число а называется примитивным корнем по простому модулю р, если s = р — 1 — наименьшее целое положительное число, для которого а8 = 1 (mod р), Гаусс доказал существование примитивных корней для любого заданного простого числа. К сожалению, не существует простого способа нахождения таких корней. Для небольших простых чисел метод подбора, по-видимому, ничем не хуже любого другого метода. В частности, для р = 17 имеется восемь примитивных корней: g = 3,5,6, 7, 10,11, 12, 14. Возьмем примитивный корень g = 3. В результате получим последовательность чисел ек = е3 , к = 0,..., 15: е, е3, е9, е10, е13, е5, е15, е", е16, е14, е8, е\ е\ е12, е\ е6. Пусть х{ — сумма чисел ек с четными номерами к, х2 — сумма чисел ек с нечетными номерами к, т. е. х, = е + е9 + е13 + е15 + е16 + е8 + е4 + е2, х% = £3 + еЮ + £5 + £П + £и + £7 + £!2 + £6_ Сумма всех корней уравнения я17 - 1 = 0, включая корень х = 1, равна нулю, поэтому х{ + х2 = — 1. Несложные вычисления показывают, что Х[Х2 = -4. В самом деле, пусть a = 2п/17. Тогда ек = cos ka + г sin ka, поэтому е + е16 = 2 cos a, е9 + е8 = 2 cos 8а, е13 + е4 = 2 cosAa и е15 + е2 = 2 cos 2a, т. е. Х[ = 2 (cos a + cos 8а + cos 4а + cos 2а). Аналогично х2 = 2 (cos За + cos 7a + cos 5а + cos 6а). Воспользовавшись формулой 2 cos pa COS qa = cos(p + q) a + COs(p - q) a,
98 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ получим ххх2 = 8 (cos a + cos 2а + cos За + .. .+ cos8a) = 4 (я, +х2) = —4. Таким образом, я, и х2 можно найти, решив квадратное уравнение х2 + х-4 = 0 (1.2) Так как cos a + cos 2a > 2 cos 7r/4 = V2 > — cos 8a и cos4a > 0, то x, > 0. Поэтому x2 = -4/x, < 0, т. e. xi — положительный корень уравнения (1.2), а х2 — отрицательный. Обозначим суммы чисел ек с номерами, дающими при делении на 4 остатки 0, 1, 2 и 3, через yv у3, у2 и yi соответственно. Тогда у1 = е + £13 + £16 + £4 = 2 (cos a + cos 4a), y2 = £9 + £15 + £8 + £2 = 2 (cos 8a + cos 2a), y3 = £3 + £5 + £14 + £12 = 2 (cos 3a + cos 5a), Vi = e10 + e" +e7 + e6 = 2 (cos 7a + cos 6a). Ясно, что yl+y2 = xl и yl > y2, так как cos a > cos 2a и cos 4a > > cos 8a. Кроме того, yiy2 = 2 (cosa + ... + cos 8a) = -1. Таким образом, yl и y2 удовлетворяют уравнению y2—xxy— 1 = 0. Легко проверить, что у3 и yi удовлетворяют уравнению у2 — - х2у - 1 = 0, причем у3>уг Рассмотрим, наконец, zx = е + £16 = 2 cos а и z2 = е13 + + е4 = 2 cos 4а, т. е. суммы чисел ек с номерами, дающими при делении на 8 остатки 0 и 4. Тогда z{ > zv z{ + z2 = yx и Z\Z2 = 4cosacos4a = 2 (cos 5a + cos 3a) = y3. Поэтому zl — больший корень уравнения z2 — yiz + y3 = 0. Таким образом, отрезок длиной z{ = 2cos(27r/17) можно построить с помощью циркуля и линейки. После этого правильный 17-угольник строится очевидным образом. Для полноты, следуя [Б32], приведем явное описание построения 17-угольника. 1) Восстановим перепендикуляр к прямой UV в точке О и отложим на нем отрезок ОА, равный единице, а из точки О
§ 2. ЭЛЕМЕНТЫ ТЕОРИИ ГАЛУА 99 по UV— отрезок ОС = 1/4. Из С, как из центра, проведем окружность радиуса С А, пересекающую UV в точках В и D. Тогда OB = я,/2, OD = -х2/2. 2) Соединим Ас В, Q и из В, как из центра, проведем окружность радиуса ВО, пе- — ресекающую АВ и ее продолжение в точках Р и М. Тогда AM = yv АР = —у2. Аналогично шолучим, что AN = у3 и AQ = -у4. 3) На продолжении AD отложим AL = N0. На NL как на диа- Рис 32 метре построим окружность, которая пересекается с продолжением АВ в точке F. Из F, как из центра, проведем окружность радиуса AI = АМ/2. Эта окружность пересекает AD в точке G. Из G, как из центра, проведем окружность того же радиуса, которая пересечет AD в точках КиН. Тогда АН = zx и АХ = z2. Таким образом, отрезок АК равен стороне правильного 34-угольника, вписанного в круг радиуса единица. § 2. Построение правильных многоугольников. Элементы теории Галуа В предыдущем параграфе было показано, как можно решить в квадратных радикалах уравнение я17 — 1 = 0. Теперь мы докажем, что для всех чисел п вида 2пр, ... рк, где рг- — различные простые числа Ферма, уравнение хп — 1 = 0 разрешимо в квадратных радикалах. При этом наше изложение будет таким, чтобы его почти без изменений можно было перенести на случай лемнискаты. Сопоставив каждому действительному числу t точку с координатами (cost,sint), получим параметризацию единичной ок-
100 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ ружности С действительными числами. В результате С превращается в абелеву группу с единичным элементом (1,0). Так как cos (t + s) = cos t cos s — sin t sin s, sin (t + s) = sin t cos s + cos t sin s, то закон сложения точек окружности записывается следующим образом: (а, Ь) + (с, d) = (ас - bd, ad + be) — (/(а, b, с, d), д(а, b, с, d)). Легко проверить, что 2(х,у) = (х2-у\2ху) и 3(х,у) = (х3-3ху2,3х2у-у3). Аналогично п(х,у) = (fn(x,y),gn(x,y)), где /п и ^ — многочлены с целыми коэффициентами. Из соотношения cos тр + + г sin тр = (cos ip + г sin ip)n получаем .„с,,,- ±±M^ML. <21) Пусть Cn — множество таких точек (я, у) € С, что п(х,у) = = (1,0), т. е. fn(x, у) = 1 и дп(х, у) = 0. Эти точки служат вершинами правильного n-угольника. Ясно также, что Сп — подгруппа С, причем она изоморфна Z/nZ — аддитивной группе вычетов по модулю п. Над полем С решениями системы уравнений fn(x,y) = 1, дп(х,у) = 0 будут не только точки Сп. Найдем все эти решения. Воспользовавшись формулами (2.1), можно перейти к эквивалентной системе уравнений (х + гу)п = 1, (ж — гу)п = 1. Следовательно, х + iy = ер и х — iy = eq, где е = е2т1п. В частности, х2 + у2 = epeq, поэтому равенство х2 + у2 = 1 выполняется тогда и только тогда, когда ер = e~q. Таким образом, Сп можно охарактеризовать как множество всех решений системы уравнений 1п(х>У)= !. дп(х,у) = 0, (2.2) х2 + у2 = 1.
§ 2. ЭЛЕМЕНТЫ ТЕОРИИ ГАЛУА 101 Рассмотрим поле Кп, порожденное над Q координатами всех точек множества Сп. Например, С3 состоит из точек (1,0) и (—1/2, ±л/3/2), поэтому К3 = Q(\/3). Множество С4 состоит из точек (± 1,0) и (0, ± 1), поэтому К4 = Q. Пусть с — автоморфизм поля Кп, оставляющий элементы поля Q неподвижными. Так как коэффициенты многочленов fn и дп — целые числа, то а определяет некоторую перестановку точек Сп. По этой перестановке автоморфизм а однозначно восстанавливается, так как координаты точек Сп порождают поле Кп. Ясно также, что автоморфизму а соответствует не произвольная перестановка элементов группы Сп, а ее автоморфизм. Следовательно, группа Gn автоморфизмов поля Кп над Q изоморфна некоторой подгруппе группы Aut(Z/nZ). Дальнейший ход доказательства таков. Сначала мы покажем, что если п = 2ар, .. .рк, где р{ — различные простые числа Ферма, то порядок группы Aut(Z/nZ) равен степени двойки. Тогда, в частности, порядок группы Gn тоже равен степени двойки. Затем мы докажем, что если порядок группы G равен 2к, то существует такая последовательность подгрупп G = G°DGl D ...DGk = {е}, что G1 — подгруппа G1"1 индекса 2 для г = 1,..., к. Наконец, по этой последовательности подгрупп мы построим последовательность квадратичных расширений полей, начинающуюся полем Q и заканчивающуюся полем Кп. Существование такой последовательности расширений означает, что все элементы поля Кп, в частности, и координаты точек Сп являются квадратичными иррациональностями. Лемма 1. Порядок группы ки\.(Ъ/пЪ) равен степени двойки тогда и только тогда, когда п = 2apl.. .pk, где pi — различные простые числа Ферма. Доказательство. Автоморфизмы аддитивной группы Z/nZ имеют вид х \—> тх, где т — число, взаимно простое с п. Поэтому порядок группы Aut(Z/nZ) равен (р(п), где <^(п) — количество чисел, не превосходящих п и взаимно простых с п. Если числа р и q взаимно просты, то <p(pq) = <p(p)<p(q). В самом деле, пусть 0^а^р-1 и 0 < Ь < g - 1. Тогда остатки от деления п = pq чисел вида aq + Ьр на п образуют полную систему вычетов по модулю п. Для доказательства этого достаточно
102 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ заметить, что а\Ч + &,р — °г9 + b2p (modpg) тогда и только тогда, когда (о, - а2) q = (Ъ2 - 6,)р (modpg), т. е. a, = (¾ (modp) и 6, = Ь2 (modg). Ясно также, что числа aq + bp и pq взаимно просты тогда и только тогда, когда числа а и р, а также 6 и q взаимно просты. Если п = рк, где р — простое число, то (р(п) = рк~1(р- 1). В самом деле, среди чисел, не превосходящих п, общий делитель с п имеют лишь числа р, 2р,... ,рк~1р. Их количество, равно рк~1. к к Пусть п = р,1 ...рт. Тогда <р(п) есть произведение чисел Pi (Pi~ 0- Число рк~1(р-1) может быть степенью двойки лишь в двух случаях: а) р = 2, при этом к — любое; б) р- 1 = 2е, при этом к = 1. Во втором случае число с не может иметь нечетных делителей. В самом деле, если d — нечетный делитель с, то 2е + 1 = = xd + 1 делится на х + 1. Следовательно, р— простое число вида 22' + 1. D Лемма 2. Если порядок группы G равен 2k, то существует такая последовательность подгрупп G = G°DGl D...DGk = {е}, что G1 — подгруппа G%~x индекса 2 для i = 1,...,¾. Доказательство. Применим индукцию по к. При к — 1 утверждение очевидно. Предположим, что утверждение доказано для всех групп порядка 2fc~'. Прежде всего докажем, что в группе G существует не единичный элемент, коммутирующий со всеми остальными. Для каждого элемента х е G рассмотрим класс сопряженных с ним элементов, т. е. множество элементов вида gxg~x, где g € G. Любые два класса либо совпадают, либо не пересекаются, т. е. группа G разбита на попарно не пересекающиеся классы сопряженных элементов. Равенство gxxg^x = g2xg2x эквивалентно равенству xh = hx, где h = <^"'g,. Рассмотрим подгруппу Gx = {heG\xh = hx}.
§ 2. ЭЛЕМЕНТЫ ТЕОРИИ ГАЛУА 103 Элементы дххд^х и д2хд2х равны тогда и только тогда, когда <?, € 6 g2Gx. Поэтому число элементов класса {дхд~1} равно индексу подгруппы Gx в G, а значит, оно имеет вид 2s. Класс {дхд~1} содержит ровно один элемент лишь в том случае, когда х коммутирует со всеми элементами группы G, т. е. х — элемент центра G. Предположим, что центр группы G состоит лишь из единичного элемента. Тогда сумма мощностей всех классов сопряженных элементов равна 1 +2si +.. . + 2sp, где я,- ^ 1. Следовательно, эта сумма нечетна. С другой стороны, она равна порядку группы G, т. е. равна 2к. Получено противоречие, поэтому центр группы G содержит неединичный элемент а. Он порождает циклическую подгруппу порядка 2Г. Рассмотрим элемент b = ат, где т = 2r_1. Подгруппа Н, порожденная элементом Ь, имеет порядок 2 и является нормальной, поскольку Ь лежит в центре группы G. По предположению индукции для группы F = G/H порядка 2к~1 существует последовательность F = F° D F1 э ... D Fk~l = {е}, где F1 — подгруппа F*~l индекса 2 для г = 1,..., к — 1. Чтобы получить требуемую последовательность подгрупп G, положим Gk = Н и G{ = F{ U bF{ при г = 0,..., к - 1. D Пусть п = 2ар1 ... рт, где р{ — различные простые числа Ферма. Тогда у группы Gn автоморфизмов поля Кп над Q есть последовательность подгрупп G = G° d Gl D .. • D Gk = {е}, где G1 — подгруппа Gl~l индекса 2 для г = l,...,k. Сопоставим подгруппе G1 множество L{, состоящее из тех элементов поля Кп, которые остаются неподвижными при действии всех автоморфизмов из G{. Сумма, разность, произведение и отношение элементов L{ принадлежит L{, поэтому L{ — поле. Ясно, что Lk = KnnLiDLi_l. Все автоморфизмы из G1 оставляют элементы поля L{ неподвижными. Кроме того, Gl~l = Gl U oGl, где а — любой элемент из G*-1 \G\ Поэтому а2 € G1, так как множеству oGl этот элемент принадлежать не может. Следовательно, автоморфизм с поля Кп таков, что если х е L{, то а2х = х. Кроме того, ах = = а: тогда и только тогда, когда х € 1^_,. Любой элемент х € L{
104 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ можно представить в виде суммы элементов ж, = (ж + стж)/2 и ж2 = (ж-стж)/2. При этом стж, = ж, и стж2 = —ж2. Следовательно, ж, G Lj_! С Lj и ж2 = ж - ж, G Lt-. Предположим, что Lt- ф L{_v Пусть a G L,- \ Lt_, и а = ста - а. Тогда ста = -а, причем а ^ Ф 0. Кроме того, ст(аж2) = (-а)(-ж2) = аж2, т. е. ах2 G Ь^_, и х2 G а-1 £,,-_,. Таким образом, L{ = L{_x + a-1 £<,•_,. Другими словами, размерность Lt- над Li_l равна двум. Следовательно, если х € L{, то элементы 1, ж, ж2 линейно зависимы над полем £,-_]. Поэтому ж2 + рж + q = О, где р, q G Lt_,. Значит, любой элемент поля Хп — квадратичная иррациональность над полем L0. Докажем теперь, что L0 = Q. Для этого достаточно доказать, что для любого ж G -ffn\Q найдется автоморфизм поля Кп над Q, сдвигающий ж. Вообще говоря, не любое расширение поля Q обладает таким свойством. Например, у поля {р + q у/2 + г уД | р, q, г G Q} нет автоморфизмов, отличных от тождественного. В самом деле, элемент \/2 может перейти лишь в корень уравнения ж3 - 2 = = 0, а рассматриваемому полю принадлежит только один корень этого уравнения. Заметим сначала, что Кп — это алгебраическое расширение Q, т. е. координаты точек Сп — алгебраические числа. В самом деле, решения системы уравнений fn(x,y) = 1, gn(x,y) = = 0 алгебраические. Для доказательства достаточно рассмотреть fn(x,y) - 1 и дп(х,у) как многочлены от у и записать их результант. _ Пусть Q — множество всех алгебраических над Q чисел. Легко проверить, что Q — поле. В самом деле, пусть а, (3 е Q. Тогда ap = (¾ + с^а + ... + ар_^ар~\ Р = ъ0 + ъхр + ... + ъч_хр-\ где а{,Ь{ g Q, причем а0Ь0 ф 0. Поэтому любой элемент кольца, порожденного над Q элементами а и /3, можно представить в виде линейной комбинации с рациональными коэффициентами элементов a'/3J-, где 0 < г < р и 0 ^ j < q. В частности, элементы 1, а + р, ..., {а + (3)т можно представить в виде линейной комбинации указанных pq элементов, поэтому они линейно зависимы над полем Q, т. е. a+fi G Q. Аналогично доказывается, что
§ 2. ЭЛЕМЕНТЫ ТЕОРИИ ГАЛУА 105 а/3 е Q. Кроме того, а^а'1 = а^-1 - а, - ... - ар_{оР~2, поэтому а-1 G Q. Любой автоморфизм г поля Q над Q переводит поле К в себя. В самом деле, поле Кп порождено координатами точек Сп, а Сп совпадает с множеством всех решений над С системы уравнений (2.2). Равенство L0 = Q означает, что если a G Кп \ Q, то существует автоморфизм а: Кп —► Кп, для которого а\а) ф а. Для доказательства этого достаточно указать автоморфизм г: Q —► Q, для которого т(а) ф а. Теорема 1. Пусть а и Ъ — корни одного и того же неприводимого_многочлена над Q. Тогда существует автоморфизм т: Q —► Q, для которого т(а) = Ь. Доказательство. Пусть К — поле, а — корень неприводимого многочлена Р на полем К, К(а) — поле, порожденное а над К. Тогда произвольный изоморфизм /: К —у К' можно продолжить до изоморфизма д: К(а) —► К'((3), где /3 — корень многочлена f(P). В самом деле, поле К(а) состоит из элементов вида ^fya3, гДе У ^ 0 и fe- € К. Положим д [J2^jaJ) = = ^Ц(кЛР3. Это определение корректно, так как равенство ^2k-a3 = 0 эквивалентно тому, что многочлен F = ^к.-а3 делится на Р. Построим сначала изоморфизм т,: Q(a) —► Q(6). Выберем затем элемент t2 G Q \ Q(a). Он является корнем неприводимого многочлена Р2 над Q(a). Пусть t2 — корень многочлена 7-,(Р2). Тогда можно построить изоморфизм т2: Q(a,t2) —► -* Q(b,t2). Выберем элемент t3 е Q\(a,t2) и построим изоморфизм т3: Q(a,t2,t3) —► Q(b,4)*3) и т- д- Так как размерность пространства Q над Q счетна, то можно построить базис {1, е, = = а, е2, е3,...} пространства Q над Q. Элементы t2, t3, ... можно выбирать так, чтобы поле Q(a, t2,..., tk) содержало подпространство, порожденное элементами 1, е, е^. В результате мы построим мономорфизм г: Q —► Q, для которого т(а)_= Ъ. Остается проверить, что т — эпиморфизм. Пусть 7i € Q — корень неприводимого многочлена R над Q, 7i> • ■■>7П — все корни этого многочлена. Тогда r(7j) £ {7р • • .,7«}. причем числа т(7,),... ...,т(7п) попарно различны. Поэтому множества {7р--'>7п} и
106 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ {-7-(7,),.. .^(Тп)} совпадают. В частности, 71 = т(т.-) для некоторого j. О Теорему 1 можно существенно обобщить. Заметим сначала, что поле Q алгебраически замкнуто. В самом деле, пусть х0 — корень многочлена а + /Зх + ... + шхп = О, где а, /3,..., ш € Q. Рассмотрим неприводимый над Q многочлен, имеющий корень а. Пусть а,,... , а — корни этого многочлена. Тогда все элементарные симметрические функции от а{,...,а выражаются через его коэффициенты, поэтому они рациональны. Определим аналогично /3,,..., /3 • ...; ш,,..., шг и рассмотрим многочлен Р(*)= П (а{ + ^х + ... + икхп). Этот многочлен ненулевой, причем все его коэффициенты выражаются через crs(al,..., a ),..., at(u;l,..., и>г), поэтому они рациональны. А так как Р(х0) = 0, то х0 £ Q. П В общем случае для автоморфизмов алгебраически замкнутого поля О, над подполем К справедливо следующее утверждение. Теорема 2. Пусть х, у € П, где О, — какое-либо расширение поля К. Тогда автоморфизм поля О, над К, переводящий х в у, существует тогда и только тогда, когда либо х и у оба трансцендентные над К, либо оба они алгебраические и являются корнями одного и того же неприводимого многочлена над К. Для полей общего вида эту теорему мы доказывать не будем (доказательство см. [Б9]). N Но для наиболее интересного случая — автоморфизмов С над Q — мы приведем доказательство не только этой теоремы, но и некоторых ее обобщений. Например, мы докажем, что мощность множества автоморфизмов С совпадает с мощностью множества всех отображений С —> С (т. е. она больше мощности С). Наше изложение следует статьям [В7, В16]. Для начала заметим, что изоморфизм полей у: F —> G продолжается до изоморфизма ip'\ F(a) —> G(/3) тогда и только тогда, когда выполняются следующие условия: 1)если элемент а алгебраичен над F и Р — неприводимый многочлен над F с корнем а, то /3 — корень многочлена у(Р);
§ 2. ЭЛЕМЕНТЫ ТЕОРИИ ГАЛУА 107 2) если элемент а трансцендентен над F, то /3 трансценден- тен над G. Для дальнейших рассуждений нам понадобится лемма Цор- на. Дело в том, что доказательства по индукции применимы лишь к счетным множествам, а размерность С над Q несчетна. Поэтому для работы с автоморфизмами С над Q требуется другой аппарат, и лемма Цорна достаточно удобна для этих целей. Прежде чем сформулировать лемму Цорна, дадим некоторые определения. Пусть М — некоторое множество. Обозначим через 2м множество всех его подмножеств. Множество А с 2м называют цепью, если для любых двух его элементов a,b € А либо а С Ь, либо b С а. Множество В С 2м называют замкнутым по Цорну, если для любой цепи А с В множество В содержит также объединение всех элементов цепи А. Элемент т £ В называют максимальным, если множество т С М не содержится ни в каком другом множестве а с М, являющемся элементом В. Лемма (Цорн). Каждое непустое замкнутое по Цорну множество В С 2 содержит по крайней мере один максимальный элемент т. С помощью леммы Цорна можно построить продолжение автоморфизма f подполя в С до автоморфизма всего поля С. Для этого нужно применить лемму Цорна к семейству автоморфизмов, продолжающих tp. Но тут есть одна небольшая трудность. Пусть Q с F С F' — поля w tp — автоморфизм F над Q. Тогда продолжение tp до автоморфизма F' над Q существует отнюдь не всегда. Например, пусть F = Q(V2), F' — Q( V2) и <р задан формулой: а + Ь\/2 >-> а — Ь\/2. Тогда \/2 е F' под действием автоморфизма должен переходить в элемент т е F', квадрат которого равен т2 = — \/2. Легко видеть, что элементов т с таким свойством в поле F' нет. Однако, если поле F' является алгебраическим замыканием поля F, то следующее утверждение показывает, что продолжение автоморфизма <р существует. Теорема 3. Изоморфизм полей ip: F —> G можно продолжить до изоморфизма F —► G их алгебраических замыканий. Доказательство. Рассмотрим всевозможные продолжения автоморфизма tp до изоморфизма ipa: Fa —> Ga, где
108 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ Fa С F, а значит, Ga С G. Покажем, что множество всех подмножеств в F х G вида {{a,<pa(a))\a€Fa} замкнуто по Цорну. Рассмотрим в этом множестве произвольную цепь. По определению цепи для любых двух ее элементов соответствующие им изоморфизмы ipa и <рр таковы, что один из этих изоморфизмов является продолжением другого. Это означает, что объединению всех элементов цепи соответствует некоторый изоморфизм, т. е. их объединение принадлежит рассматриваемому множеству. Согласно лемме Цорна рассматриваемое множество имеет максимальный элемент. Этому элементу соответствует изоморфизм ф: F' —> G'. Нужно доказать, что F' = F и С = G. Предположим, что некоторый элемент а € F не_принадлежит F'. Элемент а алгебраичен над полем F', а поле G алгебраически замкнуто. Поэтому поле G содержит элемент Ь, являющийся корнем образа при изоморфизме ф минимального многочлена элемента а над полем F'. Следовательно, изоморфизм ф: F' —> G' можно продолжить до изоморфизма F'(a) —> G'(b), что противоречит максимальности элемента, соответствующего изоморфизму ф. Итак, F[ = F. Остается доказать, что G' = G. Поле G' изоморфно F, поэтому оно алгебраически замкнуто. Кроме того, поле G' содержит G. Следовательно, G' = G. D Теперь можно доказать теорему о продолжении автоморфизмов подполей поля С. Теорема 4. Любой автоморфизм ф подполя в С продолжается до автоморфизма всего поля С. Доказательство. Рассмотрим всевозможные продолжения данного автоморфизма ip: F —> F до автоморфизмов ipa: Fa —> Fa, где Fa С С. Как и при доказательстве теоремы 3, получаем, что множество, состоящее из множеств вида {{a,va(a))\a€Fa}, имеет максимальный элемент. Этому элементу соответствует автоморфизм ip': F' —> F'. Нужно доказать, что F' = С. Пусть некоторое комплексное число а не принадлежит F'. Если число а алгебраично над F', то согласно теореме 3 существует продолжение автоморфизма <р' до автоморфизма алгебраического замыкания поля F', которое строго больше F'. Если же элемент а
§ 2. ЭЛЕМЕНТЫ ТЕОРИИ ГАЛУА 109 трансцендентен над полем F', то существует продолжение изоморфизма <р' до изоморфизма F'(a) —> F'(a), переводящего а в а. В обоих случаях получаем противоречие с максимальностью элемента F'. Следовательно, F' = С. □ Отметим, что изоморфизм двух подполей в С не всегда можно продолжить до автоморфизма поля С. Например, существует изоморфизм С —> F с С, где F ф С. Такой изоморфизм строится следующим образом. Пусть ava2,...— счетное множество комплексных чисел, алгебраически независимых над Q. Отображение ai н-> ai+l задает изоморфизм Q(a,, a2,...) -» Q(a2, a2,...) С 0(а,, a,,.. .)• Рассмотрим всевозможные продолжения этого изоморфизма до таких изоморфизмов ®а: Fa —> Ga (Fa,Ga С С), что элемент а{ трансцендентен над Ga. По лемме Цорна множество {Fa} имеет максимальный элемент, который, как легко показать, совпадает с С. Таким образом, получаем изоморфизм С —> F С С, где поле F не содержит числа ар а потому F Ф С. Доказательство теоремы 2 в случае автоморфизмов поля С над полем Q теперь не представляет трудностей. В самом деле, если комплексные числа х и у трансцендентны, то можно рассмотреть автоморфизм поля Q(x, у), меняющий местами х и у. Согласно теореме 4 этот автоморфизм можно продолжить до автоморфизма поля С. Если же числа хну являются корнями одного и того же неприводимого многочлена над полем Q, то существует изоморфизм Q(x) —> Q(y), приводящий х в у. Согласно теореме 3 его можно продолжить до изоморфизма алгебраических замыканий полей Q(x) и Q(y). Но алгебраические замыкания этих полей совпадают, поэтому мы теперь получаем автоморфизм поля Q(x) = Q(y), который по теореме 4 продолжается до автоморфизма поля С. Теперь уже ясно, что мощность автоморфизмов поля С не меньше мощности континуума. Но оказывается, что мощность этого множества больше мощности континуума. Теорема 5. Мощность множества всех автоморфизмов поля С совпадает с мощностью всех отображений С в С. Доказательство. Нужно доказать, что мощность множества всех автоморфизмов поля С совпадает с мощностью множества всех подмножеств континуального множества. При этом
по ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ достаточно доказать, что мощность множества всех автоморфизмов поля С не меньше мощности множества всех подмножеств континуального множества. Множество В С С называют базисом трансцендентности над Q, если В алгебраически независимо над Q и В не содержится в другом множестве комплексных чисел, алгебраически независимых над Q. Из максимальности множества В следует, что поле С алгебраично над полем Q(B). Поэтому, в частности, множество В имеет мощность континуума. Покажем, что любому подмножеству S в В можно сопоставить автоморфизм (ps поля С так, чтобы разным множествам соответствовали разные автоморфизмы. Рассмотрим автоморфизм поля Q(B) над полем Q, переводящий элемент х £ В в элемент х, если х € S, и в элемент —х, если х ¢. S. Согласно теореме 4 этот автоморфизм можно продолжить до автоморфизма всего поля С. Ясно, что если элемент х принадлежит одному из множеств S и Г, а другому не принадлежит, то fs(x) = —ipT(x), поэтому ips ф tpT. D Задачи 1. Докажите, что любой автоморфизм поля К тождествен. Указание. Любой автоморфизм а поля К должен оставлять неподвижными элементы поля Q. Кроме того, неравенство х ^ у эквивалентно тому, что х — у = а2, а € К. 2. Пусть / — неприводимый многочлен над Q, имеющий корень cos(2A;7r/n). Докажите, что все корни многочлена / вещественны. Указание. Любой автоморфизм поля Q над полем Q сохраняет поле Кп с К. § 3. Уравнение деления лемнискаты Вычислим длину дуги лемнискаты г2 = cos 26. Напомним, что дифференциал дуги кривой в полярных координатах можно вычислить по формуле ds2 = dr2 + r2d02. Действительно, если х = г cos в и у = г sin в, то ds2 = dx2 + dy2 = (cos в dr - r sin в d9)2+ + (sin в dr + r cos в dOf = dr2 + r2d92.
§ 3. УРАВНЕНИЕ ДЕЛЕНИЯ ЛЕМНИСКАТЫ В нашем случае 1тdr = -2 sin в d9. Поэтому ds2-- Следовательно, s(r) = г \ 0 dx VI -х4 = dr2 г "I 0 + i. V(i r4^r2 - COS2 20 dx -x2)(l- dr2 1 -r4 ■ k2X2) ' где к2 = -1. Таким образом, г = sns — эллиптический синус Якоби для к2 = — 1. Правда, с таким модулем к синус Якоби обычно не рассматривают, но теорема сложения, безусловно, остается справедливой: sn и en v dn v + sn v en и dn и sn(u + v) = — 5 5 ' 1 + sn2 и sn2v где сп и = л/1 - sn2u и dn и = л/1 + sn2 и. В дальнейшем будем обозначать sn s для А;2 = -1 через y(s). Соотношение ds VI-г4 Vi - ^4(*) означает, что у' = л/Г — у4. Поэтому теорему сложения можно записать в виде ^ ; 1 +V(u)^2(v) Функция у? обладает очень важным свойством, которое нам неоднократно придется использовать: ip(iu) = iif(u). В самом деле, после замены х = гу получим it i С dx _ . С J vr3^4 ~1 ) о о Следовательно, если dy о о dy то г = ip(u) и г'г = ip(iu). Из соотношения у(г'и) = iip(u) следует,
112 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ что <p'(iu) = y'(u) и <p'(—u) = tp'(u). Соотношение (p(iu) = iip{u) означает, что решетка периодов функции ip переходит в себя при отображении и \—► iu. Выясним, как именно устроена эта решетка. Пусть И dx VT=. Тогда длина лемнискаты равна 2ш. Число ш играет для лемнискаты такую же роль, как число тг для окружности. Согласно определению y>(w/2) = 1 и y>'(w/2) = 0. Из свойств функции sn следует, что 4>{и + ш) = —у(и). Поэтому tp(u + + ш) = —ip(u), а значит, y>(u + w ± Рис. 33 ± ш) = ip(u), т. е. ш (1 ± г) — периоды функции ip. Найдем теперь нули и полюсы функции ip. Пусть а, (3 е К. Тогда *« + *> = 1-^(а)^) • Заметим, что <р и <р' не имеют на действительной оси полюсов. Поэтому равенство <р(а + г/3) = 0 возможно лишь в том случае, когда ip(a) <р'(0) = <р'(а) <рф) = 0. Вещественные нули функций if и ip' имеют соответственно вид тш и (m + \/2)ш, где т G Z. Поэтому нули функций (р должны иметь вид тш + пш или (т + 1/2)ш + (n + 1/2) z'w. Очевидно, что (р(тш + пш) = 0. Равенство «« + И/2М. + 4,/2) = ^М-- r^M- = i 1 + yz(u) 1 — 4>l\u) показывает, что если ц>(и+ш/2) = О, то <р {и + г'ш/2) = оо. Поэтому (т+ 1/2)ш + (п+ 1/2)гш — полюсы функции tp. Система нулей и полюсов функции ip изображена на рис. 33 (полюсы отмечены крестиками), фундаментальный параллелограмм заштрихован. Обратимся теперь к задаче деления лемнискаты на равные части. Пусть длина дуги лемнискаты, заключенной между нача-
§ 3. УРАВНЕНИЕ ДЕЛЕНИЯ ЛЕМНИСКАТЫ 113 лом координат и точкой (г, в), равна s. Тогда г = <p(s). Длина одного лепестка лемнискаты равна ш, поэтому точки, для которых s = кш/п, где 0 < к < та, делят его на та равных частей (рис. 34). Чтобы построить эти точки, достаточно построить отрезки длиной г = f(a), где а = кш/п. В самом деле cos 26 = г2, поэтому точку (г, в) можно построить с помощью циркуля и линейки, если известен отрезок г. Так как па = кш, то (р(па) = 0. Теорема сложения для функции ip позволяет выразить <р(па) через tp(a), т. е. <р(па) = Fn(ip), где f = <р(а), a Fn — алгеб- Рис. 34 раическая функция. Таким образом, задача деления на та равных частей дуги лемнискаты, заключенной между началом координат и точкой (г, в), сводится к решению уравнения Fn(<p) = 0. В частности, для того, чтобы разделить на та равных частей весь лепесток лемнискаты достаточно решить уравнение Fn(ip) = 0. Прежде, чем обратиться к общему случаю, рассмотрим уравнение Fn(<p) = г при некоторых та. Начнем со случая та = 2. Для того, чтобы разделить пополам с помощью циркуля и линейки дугу лемнискаты, нужно решить уравнение F2(<p) = г в квадратичных радикалах. Согласно теореме сложения F№ = ^2а) = l+^(a) = 1+<? • Уравнение 2^1-^4 = г(1+^4) после возведения в квадрат и замены х = tp2 — <р~2 перепишется в виде х2 + 4г~2х + 4 = 0. Покажем, что можно разделить пополам дугу лемнискаты, заключенную между произвольными точками (т-,,0,) и (г2,в2). Пусть искомая точка имеет координаты (г0,в0). Ясно, что r0 = = tpl —Ц-—- ), где ri = <р(3{), г = 1,2. Построение г0 сведется к
114 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ решению уравнения F2((p) = г, если мы сумеем построить отрезок y>(Sj + s2). Для этого достаточно воспользоваться теоремой сложения *'! + °2) = 1+^(.,)^(.,) ■ Пусть п = 3. Так как ip(2a + а) + ip(2a - a) = VK )V к ' 1 + ip2(2a) ip2(a) ' то п \ / + 6у>4-3 ^ = ^1+6^-3^- Таким образом, деление лемнискаты на три равные части сводится к решению уравнения у>8 + 6у4 — 3 = 0. Оно, очевидно, разрешимо в квадратных радикалах. Наконец, пусть п = 5. Для вычисления у(5а) можно воспользоваться тем, что Несложные, но громоздкие вычисления показывают, что ^24+5(у20-125^16+30(у2-105^8-62^4+5 ¥4 ^-^1+50^-125^+300^2-105^^-62^20+5^24- ( ' Для решения уравнения F5(ip) = 0 в квадратных радикалах Гаусс воспользовался тем, что над кольцом Ъ[г] число 5 разлагается на множители 2 + г и 2 — г. Пусть (3 = (2 + г) а и (3 = (2 — г) а. Тогда -гУ4 + 2 + 1 -, V + 2-г _ ^)=^1_(1_2г)^=^ ^) = у l-(l+2i)^=^ , гф* + 2 - г - -г^ + 2 + г ^(5а) = ^ -j ,, , 0.ч ,4 , У(5а) = ф l-(l+2i)V4' rv ' г 1-(1-2г)^' Отметим, кстати, что числитель дроби (3.1) делится на числители дробей ф и ф. Поделив его на (-гУ + 2 + г) (гУ + 2 - г) = / - 2^4 + 5, получим многочлен ^16 + 52^2-2б/-12^4 + 1.
§ 3. УРАВНЕНИЕ ДЕЛЕНИЯ ЛЕМНИСКАТЫ 115 Ненулевое решение уравнения р(5а) = 0, можно получить, решив сначала уравнение гф* + 2 - i = О, а затем уравнение —4 Можно также сначала решить уравнение — гф +2+г = О, а затем уравнение У i<p* + 2-г 1-(1+2г')^> = -0= УГ - 2г. (3.3) Поделив (3.2) на (3.3), получим квадратное уравнение относительно ip*. Перейдем к общему случаю. Заметим, что формула сложения для ip и соотношение ip(ia) = itp(a) позволяют выразить величину if ((а + Ы)а), a,b£Z, через <р(а): V((a + bi)a) = Fa+bi(a). Вообще говоря, функция Fa+bi алгебраическая. Но если а + Ь — нечетное число, то эта функция рациональна. Чтобы проверить это, заметим сначала, что ip ф = if (а ± ia) = (1 ± г) /Г^7 1 , 4 ip'(a ± га) = ^1-^4 = ^-^, 1 — if* при этом в последней формуле знак корня определяется тем, что у'(0) = 1. Кроме того, сложив выражения для ip(x + y) и ip(x-y), получим 2if(x)ip'(y) <f{x + у) + ф -У)= , ^ 2/t 2/ Ч • 1 +lf2(X)lf2(y) Пусть у = a±ia. Тогда 2ip(x)(\+^) <р(х + у) + <р(х - у) 1 - ip* ± 2iip2(x) if2 Таким образом, если ip{x) и f(x - у) — рациональные функции от ip, то ip(x + у) тоже рациональная функция от <р. Например,
116 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ положив х = а, получим -iip* + 2 + г ip(2a + га) = ip ip(2a — ia) = <р 1 — (1— 2г) <^4' up* + 2 - г 1-(1+2г)^»' Рассуждения по индукции показывают, что если число а + Ъ P(<f4) нечетно, то <f((a + Ы)а) = р , где Р и Q — многочлены с коэффициентами из кольца Z[ г ] = {р + qi\p, q € Z}. Если при этом b = О, то коэффициенты многочленов Р nQ — целые числа. Будем называть комплексное число а + Ы нечетным, если а и b — целые числа, и при этом а + Ь нечетно. Докажем теперь некоторые свойства многочленов Р и Q для произвольных нечетных чисел т = а + Ы. Любое такое число т, прибавляя к нему числа вида ±2(1 ±г), можно привести к виду ±1 или ±г, т. е. к виду ге. Теорема 1. Справедливо равенство: <рР~{ + А1(рР-5 + ... + А^ ip(ma) = ieif —- -3^ . 4 где f = <f (а) и p = a2 +b2 — квадрат нормы числа т. Доказательство. Воспользуемся соотношением <р(и + геш/2) ip(u + ге+1ы/2) = (-\)Н. Пусть х = if (и + ш/2) и у = ip (и + г'ы/2). Тогда ху = г и if (ти + геш/2) <р (ти + ге+[ш/2) = (-1)4 т. е. Р{т\ P(l,\ = (-l)ei. Q{x) Q(y) Следовательно, Р(х) P(ix~l) _ , ,.е Q(x) Q(ix~l) (-1)£
§ 3. УРАВНЕНИЕ ДЕЛЕНИЯ ЛЕМНИСКАТЫ 117 Кроме того, P(ix~l) = Р(х~1) и Q(ix-l) = Q(x~l), так как Р и Q зависят лишь от ж4. Поэтому многочлены Р и Q имеют одну и ту же степень г, причем Q(x) = \хгР(х~{). Коэффициент А можно найти, воспользовавшись тем, что f (ш/2) = 1 и f (muj/2) = ie. В самом деле, это означает, что г6 = ■, т. е. А = Ге. AjP(1) Остается показать, что г = а2 + Ь2 - 1. При преобразовании z н-> z/m решетка, порожденная ш и ш, переходит в решетку нулей функции f (та). Поэтому нули функции ip(ma) образуют решетку с площадью фундаментального параллелограмма и>2 \т\"2. Площадь параллелограмма периодов функции ip(a) равна 2ш2, поэтому он содержит 2 \т\2 нулей функции ip(ma) = у? Так как степени многочлена Р и Q равны, то равенство (р(та) = О выполняется тогда и только тогда, когда выполняется одно из равенств if — 0 или P(ip) — 0. Каждое уравнение ip(a) — а имеет в параллелограмме периодов ровно два решения, поэтому степень 2\т\2 - 2 многочлена Р равна —— = \т\2 — 1. D Корни уравнения P(ip) = О при нечетном комплексном т могут быть описаны следующим образом. Пусть О, — ш(1 - г) и О.' = ш(\ +г) — периоды функции ip(a). Из равенства ip(ma) = О следует, что та = (а + Ы) ш — pfl + p'fl', где р = а/2 - 6/2, р' = а/2 + 6/2. так как О/ = 2Q, то та = = (р + {$/)$!. Обозначая комплексное число p+ip' £ Z[ г ] через v, получим, что та = vfl, т. е. а — vfl/m. Заставим v пробегать полную систему вычетов по модулю т, за исключением нуля. Тогда числа ip(vQ./m) будут корнями уравнения P{ip) = 0. Все эти корни различны между собой. В самом деле, равенство \ т ) \ т возможно лишь в двух случаях: или когда v = и' (mod т) что исключено, или же когда 2(i/W) = (l +0(1 -2iv)m
118 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ что также невозможно, поскольку правая часть делится только на 1 -И, а левая часть — на 2. Таким образом, все корни уравнения Р(ц>) = 0 имеют вид s„ = у I — \т где v пробегает полную систему вычетов по модулю т, исключая нулевой вычет. На примере вычисления ip(ma) при т = 5 мы уже видели, что важны арифметические свойства т не столько над кольцом Z, сколько над кольцом Z[ г ]. Это подтверждает и следующая теорема, доказанная Эйзенштейном. Теорема 2. Пусть т = а + Ы — нечетное простое над Ъ[г\ число. Тогда числа Л,, ..., А^-а делятся на т. Доказательство. Поделив многочлен на многочлен l+A^ + ... + А^-1, получим <р(та) = (р(с0 + с{1р* +c2ips + ...), (3.4) где Cj £ Z[i], причем с0 = Л^-ь Другое выражение для ц>(та) можно получить, воспользовавшись тем, что <р'(а) = y/l-^(a) = 1 +]Г>у-?(а), (3.5) где s• € Q. В самом деле, так как <р(0) = Ои <р'(0) =1, то Равенство <р' = 1 — <р может выполняться лишь в том случае, когда р- = О при j ф 0(mod4). Значит ip(a) = а(\ +d,a4 + d2a8 + ...), где dj € Q. Заменив а на та, получим ip(ma) = та( 1 •+- d, (та)* + d2(ma)s + ...). (3.6)
§ 3. УРАВНЕНИЕ ДЕЛЕНИЯ ЛЕМНИСКАТЫ 119 Чтобы сравнить (3.6) с (3.4), заметим еще, что </ = /(а) = а*(1 + d{a* + d2a8 + .. .)к. Поэтому (3.4) можно переписать в виде tp(ma) = с0а(1 + dlai + d2as + ...)+ + с,а5(1 +eia4 + e2a8 + ...) + ... (3.7) Сравнивая выражения (3.6) и (3.7), получим т = с0, d{m? = c0d[ +С[, d2m9 = c0d2 + с, е, + с2, d3m13 = c0d3 +с{е2+ c2f{ + с3 и т. д. Следовательно, ск = тНк(т)1~1, где Яд.— многочлен степени Ак с целыми коэффициентами, в совокупности взаимно простыми с целым числом I. Формула nHk(n)l~l = ск(п) справедлива для любого нечетного п£ Z[ г ] (не обязательно простого); при этом ск(п) е Z[i]. Следовательно, пНк(п) = 0(то(Л). Пусть q е Z[i] — простой нечетный делитель числа I. Тогда пНк(п) = 0 (modg) для любого нечетного числа п. С другой стороны, сравнение хНк(х) = О (modg) не может иметь более deg(xHk(x)) = 4/:+1 различных по модулю q решений. Для нечетного числа q остатки от деления нечетных чисел на q образуют полную систему вычетов, так как если число щ четно, то число п= ri\ + q нечетно. Решетка чисел, пропорциональных q, порождена векторами q и iq. Площадь фундаментального параллелограмма этой решетки равна |д|2, поэтому полная система вычетов по модулю q содержит \q\2 элементов. Значит, |д|2 < Ак +1. Следовательно, если Ак + 1 < |т|2, то I не делится на т. А так как тНк{тп) делится на I, то Нк(т) делится на I и ск делится на т. Таким образом, если т — нечетное простое число, то с,, с2, .. .,Cg-5, где р = \т\2, делятся на т. Из соотношения А^ + Л^5<^4 + ... + ^-1 = = (1 + АУ + ... + А^р~х){с0 + с,у>4 + с2<р* + ...)
120 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ следуют равенства Ав_1 =с, ^ 0' ^-р—5 — ^0 1 ^1' 4 А, = СдАр^ + с, Ар^ + ... + Cg-5. 4 4 4 Поэтому числа А,, А2, ..., А^д = т делятся на т. D Задачи 1. Докажите, что если а, Ь, х, у Е Ш и х + гу = Vа + ib, то х и у выражаются через а и 6 с помощью квадратных радикалов. 2. (Теорема Эйзенштейна) Пусть f(x) = а^х4 + a,xn_1 + ... ... + ап, где а • е Z[ г ], причем для некоторого простого над Z[ г ] числа т коэффициенты а,, ..., ап делятся на т, ап не делится на т2 и а0 не делится на т. Докажите, что многочлен / неприводим над Z[i]. 3. Докажите, что если т — нечетное простое над Z[ г ] число, то многочлен ур~1+А,у)р~5 + . . .+АР i из теоремы 1 неприводим. § 4. Доказательство теоремы Абеля о делении лемнискаты В этом параграфе мы приведем два доказательства теоремы Аоеля. Одно из них — классическое — принадлежит Эйзенштейну, другое — более современное — Роузену [В14]. Краеугольным камнем этих двух доказательств, равно как и оригинального доказательства самого Абеля, служит тот факт, что решетка периодов функции ip(a) инвариантна относительно умножения на комплексную единицу г. Лучше всего это видно в доказательстве Роузена, поэтому с него мы и начнем. В подходе Роузена вместо лемнискатической функции >р(а) используется функция Вейерштрасса p(z), отвечающая решетке Л = {2аи) + 2Ыш \а,Ь <Е
§ 4. ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ 121 Отметим, что эта решетка содержится в решетке периодов функции ip, но не совпадает с ней. В конце этого параграфа мы покажем, что для указанной решетки д2 = —1/4 и д3 = 0, т. е. p'\z) = Ap\z)-{-p(z). Возможность перехода к функции p(z) связана с тем, что справедливо следующее утверждение. Лемма 1. Если отрезок длиной р(а) можно построить с помощью циркуля и линейки, то отрезок длиной <р(а) тоже можно построить. Доказательство. По модулю решетки Л нули функции <р имеют вид 0, ш, гш, (1 + i)u>, а ее полюсы имеют вид (l+«')w (3 + «)w (l + 3«')w (3 + 3«')w Функция p'(z) тоже имеет нули ш, гш, (1 + г')ш, а точка О полюс этой функции. Кроме того, 1-И \ /3 + 3« \ /3 + г \ /1 + 3« Рассмотрим функцию р\~2~ш) =Р[-^—ш) и Р\-7Г-Ш) =Р\^-Ш </(*) = P\z) l+i, ,\\ tcnt~\ ^-i/3+г, (р(г)-р(^ы))(р(г)-р(^ы)) -ш В окрестности нуля p{z) = z~2 + ... и p'(z) = -2z~3 + ..., поэтому g(0) = 0. Следовательно, функция g имеет те же самые нули и полюсы, что и функция if. Поэтому <fi(z) = Cg(z). . /w\ /1+« Докажем теперь, что отрезки длиной р I — , р I - /3 + г \ 0 \2; V р I —-—и> 1 можно построить. Заметим, прежде всего, что отрезки длиной р(ш), р(гш) и р((1 +г)ш) можно построить, так как эти числа являются корнями уравнения 4х3 — —х = 0. Кроме того, легко проверить, что i 16p2(z)-l
122 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ а х ос Пусть задано р(а). Рассмотрим х = : и у = - : = — 1 + г 1 — г I Чтобы найти р ( — ), достаточно решить квадратные уравнения г 16p'(s)-l i 16р2Ы-1 Р{а)~ 32 р<*) И Р(Х)-32 р(у) • Если можно построить р(а), то можно построить и р'(а) = 4р3(а) — -. Следовательно, д(ш/2) можно построить, а так как <р(ш/2) = 1, то можно построить и константу С. В итоге получаем, что если можно построить р(а), то можно построить д(а), а значит, можно построить и (р(а). □ Таким образом, для доказательства теоремы Абеля нужно проверить, что если п = 2арх ... рт, где pi — различные простые (ки\ числа Ферма, то отрезки длиной р( — I, где к = I, ..., п — 1, можно построить. Отображение z i—► (p(z), p'(z)) можно рассматривать как гомеоморфизм тора С/Л на кривую Е, заданную уравнением у2 = = 4х3 — -х. При этом сложение точек тора индуцирует сложение точек кривой Е. Элементы группы Е, порядок которых делит п, образуют подгруппу \( [2ш + 2Ьш\ ,(2аш + 2Ыы\\ ,.^ , 1 Нулевой элемент соответствует а = Ъ = 0. Это — бесконечно удаленная точка. Группа Еп аналогична группе Сп для окружности. Продолжая аналогию, покажем, что если (а, Ъ) и (c,d)— точки Е, то (а, Ъ) + (с, d) = (f(a, b, с, d), д(а, b, с, d)), причем erf (и) = f(uu) и crg(u) = д(сги) для любого автоморфизма а поля С. Теорема сложения
§ 4. ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ 123 показывает, что /(a, b,c,d) = —а-с- - при аф с. Дифференцируя равенство (4.1) и учитывая, что p"(z) = ep2(z)~l-g2 = 6p^)-l можно представить д в виде рациональной функции от а, Ь, с, d с рациональными коэффициентами. В случае, когда zl = = z2(modA), можно воспользоваться формулой Если же z, = — 22(modA), то остается справедливой формула (4.1), нужно лишь считать выражения в обеих частях бесконечными. С помощью функций /ид можно получить функции fn и дп, для которых (fn(x,y)tgn(x,y)) = п(х,у). Точки Еп задаются при этом уравнениями fn(x,y) = оо и 9n(xiV) ~ °°- Для точек' отличных от бесконечно удаленной точки, это означает, что обращаются в нуль знаменатели дробей fn Теперь можно рассмотреть поле Кп, порожденное над Q координатами конечных точек Еп. Повторив для Еп такие же рассуждения, как для Сп, получим, что группа Gn автоморфизмов поля Кп над Q изоморфна некоторой подгруппе группы Aut(En). Так как Еп ~ ( ~Л ) /Л ~ Л/таЛ ~ Z/nZ ® Z/nZ> то Aut(En) « GL2(Z/nZ). В случае простого п порядок группы GL2(Z/nZ) равен количеству базисов пространства (Z/nZ)2, т. е. равен (п2 - 1)(п2 - п). Это число делится на п(п+ 1), поэтому ни при каком п ^ 2 оно не может быть степенью двойки. Наши рассуждения зашли в тупик! Выручит нас свойство, которым мы неоднократно пользовались при изучении многочленов деления лемнискаты, а именно, инвариантность решетки периодов относительно умножения на г. b-d а — с
124 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ В данном случае это означает, что p(iz) и p'(iz) выражаются через p(z) и p'(z) по формулам p(iz) = —p(z) и р (iz) = ip'(z). В самом деле, Иг) = *-2+£'((г-АГ2-А-2). АеЛ Из инвариантности решетки Л относительно умножения на г следует, что p(iz) = -p(z). Дифференцируя это равенство, получаем ip'(iz) ~ -p'(z). Таким образом, действие г на торе С/Л индуцирует действие г на кривой Е, которое задается формулой г(х,у) = (—x,iy). На группе А/пА, изоморфной Еп, действие элемента к + И € Z[ г ] задается формулой (2аш + 2Ыш) (mod п) \—> (к + И) (2аш + 2Ыш) (mod п). Это действие переносится на группу Еп. Пусть F = Q(i), Fn — поле, порожденное координатами точек Еп над F, Gn — группа автоморфизмов поля Fn над F. Если а б Gn, то ст(г') = г, поэтому ст(г'(х,у)) = (—ах,гау) = га(х,у). Кроме того a((a,b) + (c,d)) = a((a,b)) + <j((c,d)). Следовательно, Gn — подгруппа группы автоморфизмов Z[ г ] — модуля Л/пЛ. Для отображения а+г'6 i—> (k + il)(a+ib), где а и 6 берутся по модулю п, обратным будет отображение к — il a + ib>—>-j^-p(a + ib). Оно определено тогда и только тогда, когда число к2 + I2 взаимно просто с п. Для получения попарно различных отображений нужно считать, что 0 ^ к, I ^ п — 1. Таким образом, порядок группы автоморфизмов Z[i] — модуля Л/гаЛ равен количеству пар чисел (&,/), где 0 < к, I ^ п — 1 и к2 + /2 взаимно просто с п. Обозначим их количество Ф(п). Вычисление Ф(п) разобьем на леммы. Лемма 2. Если числа р и q взаимно просты, то Ф(рд) = Ф(р)Ф(я). Доказательство. Пусть 0 ^ а,, 6, ^ р — 1 и 0 < а2, 62 ^ q — 1. Тогда пары (а, 6) = (а,д + a^p^b^q + 62р) образуют полную систему пар вычетов по модулю pq. Кроме того, a2+i2-(a2 + 62)g2 + (a2 + 62)p2. Поэтому взаимная простота чисел а2 + Ь2 и pq эквивалентна взаимной простоте чисел а2 + б2 и р и чисел а\ + b\ и д. □
§ 4. ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ 125 Лемма 3. Если р — простое число вида Ак + 3, то ф(р) = р2-1. Доказательство. Нужно доказать, что если а2 + Ь2 делится на р, то оба числа а2 и Ь2 делятся на р. Предположим, что а2+Ь2 делится на р, но хотя бы одно из чисел а и Ь не делится на р. Тогда оба числа а и Ь не делятся на р, поэтому согласно малой теореме Ферма ар_1 = 1 (modp) и Ь^-1 = 1 (modp), a значит, ap_1 + &p_1 = 2(modp). С другой стороны, число аР-х + V-1 = а4к+2 + Ъ4к+2 = (a2)2k+l + (b2)2k+l делится на а2 + Ь2, поэтому оно делится на р. □ Лемма 4. Если р — простое число вида Ак + 1, то Ф(р) = (р-\)2. Доказательство. Прежде всего докажем, что любое простое число р вида Ак + 1 представимо в виде суммы двух квадратов. Наиболее простое доказательство этого утверждения предложено Д. Цагиром. Рассмотрим множество всех решений уравнения х2 + Ayz = рв натуральных числах. Достаточно доказать, что у этого уравнения есть решение, для которого выполнено равенство у = z. Это равносильно тому, что инволюция a(x,y,z) = (x,z,y), определенная на множестве решений, имеет неподвижную точку. Напомним, что инволюцией называют такое отображение /, что /(/(х)) = х для всех х. Если /(х0) = х0, то х0 называют неподвижной точкой. На множестве, состоящем из нечетного числа элементов, любая инволюция имеет неподвижную точку. Поэтому достаточно доказать, что общее количество решений данного уравнения нечетно. Построим для этого инволюцию г, имеющую ровно одну неподвижную точку. Определим {(х + 2z,z,y - х - z) при х < у - z, (А) (2y-x,y,x-y + z) при y~z<x<2y, (В) (x-2y,x-y + z,y) при 2у<х. (С) Легко проверить, что хф2у!Л.хфу — z. Кроме того, любое решение действительно переводится отображением г в решение. Разобьем решения на три типа в соответствии с тем, какое именно из неравенств выполняется: х < у — z, у - z < х < 2у или
126 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ 2у < х. Отображение г переводит тип А в тип С, тип В в тип В, а тип С в тип А. Теперь легко проверить, что г — инволюция. Неподвижной может быть лишь точка типа В. Из равенства (х, у, z) = (2y-x,y,x-y + z) следует, что у = х. Поэтому р = х (х + 4z), т. е. х = у = 1 в силу простоты числа р. Следовательно, неподвижная точка ровно одна, а именно (1,1, к), т. к. р = Ак + 1. Докажем теперь, что при фиксированном а ф 0 уравнение х2 + a2 = O(modp) имеет ровно два решения. В самом деле, существуют такие ненулевые числа Ь и с, что Ь2 +с2 = O(modp). Домножив это равенство на (ас~1)2, получим b\ + a2 = O(modp), где 6, = abc~l. Следовательно, х2 = b2(modp) это уравнение имеет решения х = ±6,. Таким образом, в Ф(р) не входят лишь 2(р— 1) пар с ненулевыми а и Ь и пара (0,0). Поэтому Ф(р) = = р2-1-2(р-1) = (р- I)2. □ Очевидно также, что Ф(2) = 2. Лемма 5. Пусть р — простое число, к ^ 1. Тогда ф(рк) = (рк-1)2ф(р). Доказательство. Числа а+ахр, где 0<а<р— 1, 0 < ^ а, ^ pfc_1 — 1 образуют полную систему вычетов по модулю pfc. Число (a + а,\р)2 + (b + Ь1р)2 не взаимно просто с рк тогда и только тогда, когда оно не взаимно просто с р, т. е. а2 + Ь2 = = 0(modp). Остается заметить, что каждой паре (а, Ь), входящей в Ф(р), соответствует (р*-1)2 пар, входящих в Ф(рк). П Теперь уже легко проверить, что Ф(п) — степень двойки тогда и только тогда, когда п = 2ар1 ... рт, где р{ — различные к к простые числа Ферма. В самом деле, Ф(2ар,'.. .рт) может быть степенью двойки лишь в том случае, когда fc, = ... = fcm = 1. Если р = 4к + 1, то Ф(р) = (р — I)2. Это число — степень двойки лишь в том случае, когда р = 1+2°. Пусть р = 4к + 3 и Ф(р) = j= р2 — 1 = (р— 1) (р+ 1) есть степень двойки. Последовательные четные числа р — 1 и р+l могут быть степенями двойки лишь в том случае, когда р = 3. Для завершения доказательства теоремы Абеля нам остается лишь проверить, что для рассматриваемой решетки выполнены равенства д2 = 60]Г'(2оа; + 2Ыш)~4 = i
§ 4. ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ 127 д3 = 140 ]Г '{2aw + 2Ыи>)~6 = 0. Второе равенство очевидно, так как д3(А) = -д3(гА), а в нашем случае г'Л = Л. Основная трудность заключается в доказательстве равенства ]Р (aw + Ьш)~* = —. _ 15 Рассмотрим три решетки: L0 = {aw + Ьш}, aw + Ыш - [ш + I 2 Ыш 1 а и Ъ нечетны а - Ъ нечетно; 1+г. ■}• Тогда -L0 = L0 U L, U L2 и L2 = —^—Lr Обозначим £)/ через \L\. Тогда /1-4 16|L0| = \k = \LQ\ + \L,\ + \L2 \L2\ = ( 1+г 1^1 = -4^,1, поэтому |L[| = -5|L0|. Чтобы доказать требуемое равенство |L0| = 1/15, получим еще одно соотношение между \LX\ и \L0\. Воспользуемся для этого тем, что L0 — решетка нулей функции tp(z), a L, —решетка ее полюсов. Учитывая, что <р'(0) = 1, получим ^-•п'ИШ'-!)". аб£п /?eL, причем бесконечные произведения нужно понимать как пределы при ЛГ —> оо конечных произведений, определяемых условиями 1а|> \Р\ ^ N. Ненулевые элементы решеток L0 и Lx можно разбить на четверки вида {±/y,±i,y}, поэтому «■>-'П'('-г)П'('-?)"'
128 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ где 0 < arga, arg/? < 7г/2. Следовательно, z^ = z±\n<p(z)=l + (\Ll\-\L0\)z4 + ... (4.2) Функция z~lip(z) не изменяется при замене z на —z или ±г,г, поэтому tp(z) = z (1 + cz4 + ...). Кроме того, (ip'(z))2 = 1 - <p4(z), поэтому (1 + 5cz4 + .. .)2 = 1 - z4{\ + cz4 + • • -)4, а значит, с = = —1/10. Следовательно, гЩ = 1+4ег* + . ..= 1-L4 + ... (4.3) Сравнив выражения (4.2) и (4.3), получим |LJ — |L0| = —2/5. А так как |L,| = —5|L0|, то \L0\ = 1/15. Приведем теперь вкратце доказательство Эйзенштейна, точнее, его модифицированную версию, предложенную Мельниковым [В 12]. Это доказательство основано на свойствах многочленов деления лемнискаты, которые были получены в § 3. Итак, рассмотрим числа tpl — J, fc = 1,..., п— 1, где п — некоторое натуральное число. В силу теоремы сложения достаточно ограничиться случаем, когда п— простое число. Для п = 2 теорема была доказана в § 3, где мы нашли явный вид уравнения деления и делим его в квадратичных радикалах. Поэтому предположим, что п— нечетное простое число. Если п = 3 (mod 4), то оно остается простым и в кольце Z[ г ], если же п = 1 (mod 4), то оно распадается в кольце !\г] в произведение двух простых сопряженных множителей т = а + Ы и т = а — Ы. Вычислив <р\ — I и tpl I, по теореме сложения найдем ipl — I. Таким образом, будем считать, что п — простое число в Z[i]. Обратимся теперь к уравнению деления лемнискаты Ф(х) = хр~[ + А{хр~ъ + А2хр~5 + ... + А^ = 0. 4 Согласно теореме 3 § 2 для простого над Z[ г ] числа п все коэффициенты А1 делятся на п и, кроме того, AE~i = п. Применяя 4 критерий Эйзенштейна, мы получаем, что многочлен Ф(х) неприводим для простого п.
§ 5. НЕСКОЛЬКО ЗАМЕЧАНИЙ О КРИВЫХ СЕРРЕ 129 Пусть д — примитивный корень по модулю простого числа п. Очевидно, что д можно выбрать нечетным. Обозначим корни уравнения (4.4) через получим, что каждый из них будет одной и той же рациональной функцией предыдущего, т. е. Это означает, что уравнение деления лемнискаты абелево и поэтому разрешимо в радикалах (исчерпывающее изложение теории абелевых уравнений можно найти в двухтомнике Бернсаида и Пантона [Б6]). Все эти радикалы будут квадратичными тогда и только тогда, когда р = 2а + 1. Если п — простое гауссово число, то р также простое и имеет вид р = 22 + 1. Если же р — квадрат простого числа q = 3 (mod 4), то равенство q = 2а + 1 возможно лишь при q = 3. § 5. Несколько замечаний о кривых Серре «„Wenn die Konige bauen, haben die Karrer zu tun" *) — сказал немецкий поэт... Но возчикам нужны дороги. В истории нашей науки нередко случалось так, что король открывал новый путь в землю обетованную, а его наследники, предпочитая свои тропинки, оставляли этот путь зарастать чертополохом.» Эта сентенция Андрэ Вейля (цит. по [Б 12]) вполне применима к кривым Серре. Достаточно сказать, что даже в знаменитых «Лекциях о развитии математики в XIX столетии» Феликса Клейна имя Серре встречается всего лишь один раз, да и то совсем по иному поводу. Единственное упоминание об этих кривых, которое нам удалось найти в математической литературе, принадлежит Джорджу Сальмону [Б24] и относится к викторианским временам... *) «Когда строят короли, работу получают возчики» (перев. с немецкого). Строка из стихотворения «Кант и его последователи», приписываемого Шиллеру.
130 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ Около двух лет тому назад кривые Серре привлекли внимание югославского математика А. Липковского. Ниже мы приводим некоторые его результаты, относящиеся к этому предмету. Для исследования кривых Серре нам понадобятся некоторые свойства плоских алгебраических кривых. Перечислим их вкратце, отсылая за подробностями к руководствам [Б29, Б14]. Будем рассматривать в комплексной проективной плоскости определенную проективную систему координат. Пусть f(x,y,z) — неприводимый однородный многочлен степени п от неизвестных x,y,z с комплексными коэффициентами. Если некоторая тройка (а1,а2, а3) координат точки Р удовлетворяет уравнению f(x,y,z) = 0, то все другие значения координат этой точки также удовлетворяют тому же уравнению, поскольку f (pav ра^, ра3) = pnf(al,a2,a3). Множество всех точек Р с указанным свойством называется неприводилюй алгебраической кривой степени п. Пусть С — некоторая кривая^ задаваемая уравнением f(x,y,z) = 0. Так как многочлен f(x,y,z) неприводим, то он, в частности, не делится на z, и поэтому существует соответствующий неоднородный многочлен f(x,y, 1). Обозначим его через F(x,y). Уравнение F(x,y) = 0 называется уравнением кривой С в соответствующей аффинной координатной системе. Ясно, что решением уравнения F(x, у) = 0 будут те точки кривой С, которые не лежат на бесконечно удаленной прямой z = 0. Пусть A = (a,, dj, а3) и В = (6,, 62,63) — две различные точки, лежащие на кривой С. Точка Р = (х,,х2,х3) лежит на прямой L, соединяющей точки А и В, тогда и только тогда, когда xk = afcs+fyfc* ПРИ некоторых s и t. Значения s и t, дающие точки, лежащие на кривой С, будут решениями уравнения f(as + bt) = f(a{s + 6(t, a^s + 62t, a3s + b3t) = 0. Так как / — неприводимый многочлен, то f(as + bt) не является нулем тождественно по s и t. Следовательно, он будет однородным многочленом степени п от этих переменных и уравнение f(as + bt) = 0 удовлетворяется точно п значениями отношения s : ~t, если считать корни этого уравнения в соответствии с их кратностями. Каждое значение отношения s : t определяет точку, общую для ЬиС. Точку, отвечающую r-кратному корню, удобно считать r-кратной точкой пересечения ЬиС.
§ 5. НЕСКОЛЬКО ЗАМЕЧАНИЙ О КРИВЫХ СЕРРЕ 131 Рассмотрим теперь более внимательно пересечение кривой С и прямой L в том случае, когда L проходит через данную точку Р кривой С. Пусть f(x,y) = О— уравнение кривой С в аффинной системе координат, в которой Р имеет координаты (а, 6). Параметрические уравнения прямой L имеют вид: х = а + At, у = b + fit. Прямая L определяется отношением А : ц. Точки пересечения L и С соответствуют корням уравнения f(a+ At, 6 +/it) = 0. Разложим левую часть этого уравнения по степеням t. Учитывая, что /(а, 6) = 0, получаем * (ДА + /»/*) + 21 У***2 + 2fxy^ + fyyS) + • • • = 0, где /д.,/„,... — значения производных / в точке Р. Возможны два случая. а) Предположим, что fx и / не равны 0 одновременно. Тогда почти каждая прямая, проходящая через Р имеет с кривой С однократное пересечение в точке Р. Единственным исключением будет прямая, соответствующая значению A : /i, для которого fxX + f (1 = 0. Эта прямая является касательной к С в точке Р. б) Предположим теперь, что все производные / до порядка (г — 1) включительно (г > 1) равны 0 в точке Р и хотя бы одна производная порядка г отлична от 0 в этой точке. Тогда каждая прямая, проходящая через Р, имеет с кривой С по меньшей мере r-кратное пересечение в точке Р. При этом точно г прямых имеют более, чем r-кратное пересечение с кривой С. Эти исключительные прямые, касательные к кривой в точке Р соответствуют решениям уравнения fxr\r + с1/хг-1уу-^ + ... + /,,// = о и должны при подсчете их числа браться такое же число раз, какова кратность соответствующего корня. В этом случае точка Р называется r-кратной точкой (точкой кратности г) кривой С. Точка кривой С, имеющая кратность 1, называется простой точкой этой кривой. Точки кратности 2 и более называются особыми точками. Точка кратности г называется обыкновенной
132 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ r-кратной точкой, если в ней существует г различных касательных. Необходимое и достаточное условие того, что точка (а,Ь,с) является особой, дается равенствами 11 h \ - д/(а'Ь>с) _ д/(а>ь>с) _ 9f(a,b,c) _ /(а, 0, с)- дх - ду - ^ -U в проективных координатах и соответственно равенствами дх ду в аффинных координатах. Критерий для нахождения особых точек в проективных координатах выражается следующим образом. Точка Р тогда и только тогда является r-кратной точкой кривой f(x,y,z) = 0, когда в этой точке все производные от / порядка г — 1 обращаются в нуль, но существует производная порядка г, отличная от нуля. Рассмотрим две проективные плоскости 11,(1,,12,13) и П2(г/,,у2,У3) и зададим отображение Т: П, —> П2> полагая У% = XjXki где i,j, k = 1,2,3, причем числа i,j,k различны. Отображение Г называется квадратичным, преобразованием или раздутием плоскости П, в П2. Оно обладает следующими свойствами. 1) Каждая точка плоскости П,, за исключением точек (1,0,0), (0,1,0) и (0,0,1), отображается в определенную точку плоскости П2. Три исключительные точки называются фундаментальными точками преобразования Т. Их образы не определены. (2) Все точки прямой хг = 0, кроме фундаментальных, отображаются в точку у{ = 1, у. = 0, ук = 0. Три прямые х{ = 0 называются иррегулярными прямыми отображения. Обозначим через Т' отображение xi = VjVk плоскости П2 в П,. Оно, очевидно, также обладает свойствами, подобными свойствам 1) и 2). Кроме того, имеет место следующее свойство.
§ 5. НЕСКОЛЬКО ЗАМЕЧАНИЙ О КРИВЫХ СЕРРЕ 133 3) Если (х) = (я,, х2, х3) — точка, не лежащая на иррегулярных прямых отображения Г, то точка (у) = Т(х\ не лежит на иррегулярных прямых отображения Т', причем Т(у) = (х). Поскольку аналогичное свойство имеет место также и для Г', мы видим, что Г и Г' определяют взаимно однозначное соответствие между точками плоскостей П, и П2, не лежащими на иррегулярных прямых. Если — кривая на плоскости П,, то образы ее точек при отображении Г будут удовлетворять уравнению 9(у) = Ду2Уз'У\Уз>У\У2) = 0- Кривая д называется алгебраическим образом кривой / при отображении Г. Пусть / — неприводимый многочлен и пусть д — алгебраический образ /. Если д(у) = n(y)f'(y), где 7г(г/) — произведение степеней г/,, а многочлен /' не делится ни на один из г/,, то кривую /' = 0 называют образом кривой / при отображении Г. Имеет место следующая фундаментальная теорема. Теорема 1. Любую неприводимую кривую последовательными раздутиями можно преобразовать в неприводимую кривую, имеющую лишь обыкновенные особенности. Для исследования структуры особых точек кривой удобно параметризовать части этой кривой формальными степенными рядами. Обозначим через C[[t]] поле формальных степенных рядов от переменной t с комплексными коэффициентами. Каждый отличный от нуля элемент C[[t]] может быть однозначно записан в виде и = t~k(a0 + ait + ...), где к — целое число и oq ф 0. Число к называется порядком ряда и и будет обозначаться через О(и). Пусть /(х,,х2,х3) — 0 — уравнение алгебраической кривой С в комплексной проективной плоскости. Элементы uvu2, и3 поля C[[t]] называются координатами некоторой параметризации кривой С, если
134 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ 2) Не существует ненулевого элемента е 6 С[[£]], для которого ещ е С, г= 1,2,3. Пусть (и) = (ii,,ii2,ii3) — произвольная параметризация кривой С a h = — гшпО(и^). Тогда, если положить v{ = ^щ, то элементы vi будут определять ту же самую параметризацию. При этом v{ е C[[t]] и хотя бы одно из значений О(^) равно нулю. Следовательно, хотя бы одно из значений иДО) = ai ф Ф 0. Точка (a) = (а^а^, Oj) называется в таком случае центром параметризации. Очевидно, что при преобразовании координат координаты центра будут вести себя подобно координатам точек. Отсюда следует, что параметризация имеет однозначно определенный центр. Если (и) = (и{,и2,и3) — некоторая параметризация и если для ненулевого элемента s б С[[£]] порядок O(s) > 0, то совокупность (v) — (u,(s),u2(s),ii3(s)) также будет параметризацией с тем же центром. В случае, когда O(s) = 1, две такие параметризации называются эквивалентными. Предположим, что щ е С[[£г]] для некоторого г > 1. Тогда можно упростить степенные ряды, заменяя f новой неизвестной *'. В этом случае параметризация (и) = («,,-u2,it3), а также любая эквивалентная ей, называется приводимой. Если такого упрощения не существует, параметризация называется неприводимой. Класс эквивалентности неприводимых параметризаций кривой С называется ветвью этой кривой. Общий центр всех параметризаций называется центром ветви. Можно показать, что любая точка кривой С является центром хотя бы одной ветви. Если (и) = (ut,u2,u3) — параметризация ветви Р, для которой все 0(и{) > 0 и хотя бы одно из значений 0(и{) = 0, и если g(Xj,x2,x3) — произвольный однородный многочлен, то мы можем определить порядок Ор(д) многочлена д, как порядок степенного ряда д(щ,и2,и3). Положительное число г = minOp(L), где L — любая прямая, проходящая через центр ветви Р, называется порядком ветви. Одно из наиболее важных применений понятия ветви и ее порядка содержится в следующей теореме. Теорема 2. 1) Если Q — некоторая г-кратная точка кривой С, то сумма порядков ветвей С', имеющих Q своим центром, равна г.
§ 5. НЕСКОЛЬКО ЗАМЕЧАНИЙ О КРИВЫХ СЕРРЕ 135 2) Точка кривой С будет простой тогда и только тогда, когда она является центром единственной ветви. Обратимся теперь к кривым Серре. Напомним их определение. Пусть р — фиксированное рациональное число. Рассмотрим треугольник OPV с вершиной О, находящейся в начале координат, сторонами ОР и РМ, равными соответственно у/р и у/р+ 1, и углами при вершинах О и М, равными а и /3 (рис. 29). Будем изменять треугольник ОРМ так, чтобы точка О оставалась неподвижной, длины сторон ОР и РМ оставались постоянными, а угол ш между осью Ох и стороной ОМ определялся бы следующим соотношением: cos о; = cos (pa - (р+ 1)/3). (5.1) Тогда геометрическое место точек вершины М называется кривой Серре, отвечающей параметру р, и обозначается через S . Пусть р — длина отрезка ОМ. Тогда координаты точки М имеют вид х = pcosu}, у = р sin ал Из теоремы косинусов вытекает, что cosa= 1=, cos/3 = . , (5.2) 2Рл/р' 2pVp + T поэтому для рационального числа р выражение (5.1) можно представить в виде многочлена от cos a, cos/3, sin а и sin/З. Другими словами, существует полиномиальная зависимость между переменными х, р и у, р, т. е. полиномиальные уравнения Р(х,Р) = 0, Q(y,p) = 0. (5.3) Исключая из этих уравнений р, мы получим полиномиальное уравнение для кривой Sp F(x,y) = 0. (5.4) Приведем несколько примеров уравнений (3) для различных значений р (напомним, что х2 + у2 — р): -1 + 4р2+р4. Р=1, х= 7Г2 • р = 2, х = 4р2 1- 12р2 + 27р4 + 4р6 12^р4
136 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ -1+ 24р2 - 162р4 + 256р6 + 27р8 р = О, X = р=1/2, х = р = 1/3, х = 96\/3р6 -2 + 6р2+р6, З^р3 ^(-9+24р2-2р4 + Зр8) 32 р4 Внешний вид простейших кривых Серре показан на рис. 35. Пусть р = s/t — представление положительного рационального числа р в виде несократимой дроби (s, t € N). Можно показать, что соотношения (5.3) имеют вид ^ + ,,^.- + ^ JW„,t (5.5, где п = s + t и тп = 2s + t — 1. Кроме того, (¾ = -*3, on = = se. Поэтому для нечетных знаменателей t многочлен F(x,y) из уравнения (5.4) выглядит следующим образом: F(x, у) = 6х(х2 + г/2)в+(*-')/2- - % - а, (х2 + у2) - ... - ae+t (х2 + y2y+t (5.6) Степень кривой в этом случае равна a = 2п = 2s + 2*. Для четных t многочлен F(x, у) имеет более сложную структуру: F{x, у) = Ь2х2(х2 + у2)2°+^ - -[%-al(x2 + y2) + ... + as+t(x2 + y2r+t}2. (5.7) Его степень равна 4s + At. Мы будем рассматривать здесь лишь кривые Серре S с натуральными значениями параметра р (т. е. случай t = 1). другие случаи пока не исследованы. Хорошо известно, что лемниската является рациональной кривой, т. е. допускает рациональную параметризацию; иными словами, ее род равен нулю. Оказывается, это свойство выполняется и для всех кривых Серре S с натуральными значениями параметра р. Теорема 3. Для любого натурального числа р кривая Серре S рациональна.
§ 5. НЕСКОЛЬКО ЗАМЕЧАНИЙ О КРИВЫХ СЕРРЕ 137 р=1/4 Р= 3 Рис. 35. Кривые Серре при различных параметрах р
138 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ Доказательство. Воспользуемся следующим утверждением (вытекающем, в свою очередь, из формулы Римана — Гурвица [Б14]): плоская алгебраическая кривая, задаваемая уравнением F(x, у) = 0, является рациональной тогда и только тогда, когда обращается в нуль число _ (d- \)(d-2) ^и(и- 1) называемое родом этой кривой. Здесь d = degF и v — кратность особой точки; суммирование ведется по всем особым точкам, включая и бесконечно удаленные. Итак, рассмотрим многочлен (5.6): F(x,y) = Ъх(х2 + y2f -%- ах{х2+у2) - ... - V,(x2 + у2)^1. Изучим, прежде всего, его поведение на бесконечности. С этой целью разложим его на однородные составляющие F(x,y) = FQ(x,y) + ... + Fd(x,y), а = 2р + 2, (5.8) и перейдем к однородному многочлену от переменных х, у, z f{x, у, г) = zdF0(x, у)+ ... + zFd_x(x, у) + Fa(x, у). (5.9) Система уравнений для нахождения особых точек однородного многочлена S(x,y,z) выглядит следующим образом: 9l = 9£ = 9l=f = 0 дх ду dz Следовательно, особые точки на бесконечно удаленной прямой z = 0 имеют вид (х : у : 0), где (х,у) — решение системы уравнений dFd(x,y) _dFJx,y) дх ду Здесь = Fd_l(x,y) = 0. (5.10) Ра(*>У) = -a^{x2+y2f+\ Fd_x{x,y) = hx(x2+y2f. Таким образом, система уравнений (5.10) сводится к системе х(х + 2 + у2? = у(х2 +у2)Р = 0, что дает ровно две точки (±г : 1 : 0).
§ 5. НЕСКОЛЬКО ЗАМЕЧАНИЙ О КРИВЫХ СЕРРЕ 139 Исследуем поведение кривой в этих особых точках. Для этого нужно рассмотреть однородный многочлен (5.9) в карте у = = 1 и перенести начало координат в точку (x,z) = (±i, 0) (подробности, относящиеся к используемой здесь технике, можно найти, например, в руководствах [Б29, Б14]. Поскольку вычисления в обоих случаях аналогичны, проведем их лишь для точки (» : 1 : 0), т. е. для (х, z) — (г, 0). В этом случае после указанных преобразований мы получаем многочлен Ь(х + i)xp(x + 2ifz - %z2p+2 - а{х(х + 2i)z2p -... ...-a^xp+\x + 2i)p+l. (5.12) Начальная форма этого многочлена в точке (0,0) равна b'xPz - <^z2p+2n - a[xz2P -...- a'pxpz2 - 4+1xp+1, (5.13) где коэффициенты 6', a!0,..., a! +1 вычисляются по коэффициентам 6, Oq, . ..,a^_x. Таким образом, мы получаем особую точку кратности р+ 1 с характеристическими одночленами xpz, z2p+2, х1^1. Отвечающая этой особой точке диаграмма Ньютона имеет вид, изображенный на рис. 36. Очевидно, что на сторонах этой диаграммы не содержится точек с целыми координатами. Это означает, что особенность состоит из двух ветвей. Чтобы вычислить понижение рода от этой особенности, ее можно разрешить раздутием. Для этого достаточно всего двух раздутий. Очевидно, что на сторонах этой диаграммы не содержится точек с целыми координатами. Это означает, что особенность состоит из двух ветвей. Чтобы вычислить пониже- Рис. 36 ние рода от этой особенности, ее можно разрешить раздутием. Для этого достаточно всего двух раздутий. Первое раздутие имеет вид х н-> xz, z н-> х. При этом XPZ + ^2^-2 + хр+1 ^ гИ-1(хР + zP+\ + д.р+1).
140 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ В карте ihi, z \-► xz особенности нет, так как форма xpz + + z2p+2 + xp+l переходит при этом в xp+l(z + xpz2p+ 1). В результате первого раздутия получаем одну особую точку типа хр + + zpJrX + xp+i кратности р. При втором раздутии получаются простые точки. В самом деле, для х ь-► xz, z i—► z имеем xp + zp+x + i^1 H-f zp(xp + z + x^z). Если же i и i, г и xz, то xp + z^1 + x**1 ^ xp(l + xz**1 + x). Дерево бесконечно близких точек имеет вид (р+1)—>(р)—>(1), поэтому вклад двух бесконечно удаленных точек (±г : 1 : 0) в род д равен (Р + 1)р р(р- 1) -2 = -2р* 2 ' 2 Следовательно, после разрешения этих особенностей род д кри вой становится равным (d-2)(d-2) ^/1/(1/-1) , ./1/(1/- 1) fc-£^P<P, (5.14) где £} означает суммирование по всем особым точкам, расположенным в конечной части комплексной плоскости. В частно- /е 1 ,.ч \^'и(и - 1) сти, из неравенства (5.14) вытекает, что вклад > —- от особых точек кривой S в конечной части плоскости не превосходит р. Найдем теперь конечные особые точки кривой S . Основываясь на свойствах симметрии кривой, можно предположить, что эти особые точки расположены на оси Ох и, стало быть, удовлетворяют системе уравнений 2^ = F(x,0) = 0. (5.15)
§ 5. НЕСКОЛЬКО ЗАМЕЧАНИЙ О КРИВЫХ СЕРРЕ 141 Предположение это будет оправдано, если мы сможем убедиться, от этих особых точек равен в точности р. Чтобы проанализировать систему уравнений (5.15), удобно воспользоваться соотношением (5.1). Уравнение .F(x,0) = 0 равносильно тому, что ш = О или 7г, что, в свою очередь, равносильно уравнению cos(pa-(p+ 1)/3) = ±1, (5.16) откуда ра-(р+ 1)/3 = дтг, geZ. (5.17) Если добавить к (5.17) условия sin/3 = J—^- sina и 0 < а, в, а + /3 < тг, (5.18) р+ 1 мы получаем систему уравнении ( Р Ч Р = та г ^j Я е р+1 р+1 р = arcsin ( л/ sina VVp+1 (5.19) Р Для q = 0 прямая /3 = а пересекает кривую /3 = = arcsin I . / -sina) ровно в двух точках. Все остальные р q прямые /3 = a 7г либо вовсе не пересекают ее (при g < 0 и при q > р), либо пересекают ровно в одной точке (при g = 1,...,р). Последняя точка пересечения имеет координаты (7Г,0). Таким образом, наша система (5.19) или, что то же самое, исходная система (5.15), имеет ровно две простых и р двойных корней. Это означает, что не существует других особых точек и что род кривой д — 0. Следовательно, все кривые S при натуральных р рациональны. □ Сопоставим кривой Серре S эллиптическую кривую. Для этого представим дифференциал дуги dl = \Jp dtp ^1-^sin^
142 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ кривой Sn в виде dl= , dx V4x3 - 92х - 93 Прямые вычисления показывают, что _ 16^+16^+1 (2р+1)(32р2 + 32р- 1) 92 ~ 12р2(р+ I)2 ' 9з~ 6V(P+1)3 Назовем кривую У2 = 4х3 - д2х - д3 эллиптической кривой, ассоциированной с кривой S . Выше мы отмечали, что решающим моментом в доказательстве теоремы Абеля о делении лемнискаты является инвариантность решетки периодов лемнискатической функции <р(а) относительно умножения на комплексную единицу i. Эта инвариантность служит проявлением важного общего свойства некоторых эллиптических кривых — наличия у них так называемого комплексного умножения. Пусть Е — некоторая эллиптическая кривая. Как групповое многообразие она изоморфна фактору комплексной плоскости С по решетке Л, натянутой на периоды ш{, ш2. Кривая Е изоморфна фактору С по решетке гш,, zu2 для любого гЕС, поэтому можно считать, что ш{ = 1, ш2 = т и Imr > 0. Любой эндоморфизм кривой Е индуцирует умножение на такое комплексное число z, что zt е А. Эндоморфизмы кривой Е образуют кольцо А(Е), содержащее в качестве так называемых тривиальных эндоморфизмов кольцо целых чисел Z. Остальные эндоморфизмы, если они существуют, задаются комплексными числами и называются комплексным умножением. Если А(Е) ф Z, то говорят, что кривая Е имеет комплексное умножение. В общем случае кривая Е не имеет комплексных умножений. Действительно, предположим, что число z определяет нетривиальный эндоморфизм Е. z = а + bi, zi = с + di (а, 6, с, d G Z, b ф 0) и, следовательно, ai + Ьт2 = с + dr. (5.20) Таким образом, г должно принадлежать мнимому квадратичному полю К, a z должно принадлежать кольцу целых элементов
§ 5. НЕСКОЛЬКО ЗАМЕЧАНИЙ О КРИВЫХ СЕРРЕ 143 О(К) поля К, поскольку z определяет эндоморфизм Z-модуля конечного ранга. Следовательно, А(Е) — это подкольцо в О(К), содержащее Z и имеющее как Z-модуль ранг два. Наоборот, любое такое подкольцо R в мнимом квадратичном поле К можно получить описанным способом. Для этого достаточно положить Е = C/R. Наличие у эллиптической кривой Е комплексного умножения удобнее всего выражать с помощью так называемого ./-инварианта. Если Е задана уравнением в форме Вейерштрасса у2 = х3 + ах + Ь, то ее j'-инвариант определяется формулой л£)=1728^ст (5'21) (подробнее о ./-инварианте см. в гл. 7 § 17-19). Две эллиптические кривые изоморфны в том и только в том случае, когда их У-инварианты равны. Если кривая Е определена над полем Q, т. е. если a, b е Q, существует очень простой критерий наличия у нее комплексного умножения: кривая Е обладает комплексным умножением тогда и только тогда, когда j(E) — целое число [Б26, б; Б2]. Можно показать [Б2], что имеется ровно 13 классов эллиптических кривых с комплексным умножением и рациональным j'-инвариантом. Значения ^-инварианта для них таковы: у = 26-33, 26-53, О, -33-53, -215, -215-33, -218-33-53, -215 -з3 -53 - II3, -г'^з^-гз^гэ3, 23-з3п3, 24-33-53, 33-53-173, -3-215-53. Теорема 4. Среди эллиптических кривых, ассоциированных с кривыми Серре S , р € N, лишь эллиптическая кривая, соответствующая лемнискате S\, обладает комплексным умножением. Доказательство. Из формулы длины дуги для кривых Серре р
144 ГЛ. 4. ТЕОРЕМА АБЕЛЯ О ДЕЛЕНИИ ЛЕМНИСКАТЫ нетрудно получить, что dl = —, где У у2 = х*-2{2р+1)х2+1. (5.22) Это — уравнение эллиптической кривой в форме Лежандра. Переходя к уравнению в форме Вейерштрасса и вычисляя затем j -инвариант, получим >-2 р>(р+1)* • (5-23) Так как • _ 28 (Р(Р+ 1)+1)3 _ 2.,я , п , о gs, 3-2« 2« то число j может быть целым лишь при р = 1. В этом случае i = 26 ■ З3. Таким образом, лишь эллиптическая кривая, отвечающая лемнискате £,, допускает комплексное умножение. D В заключение сформулируем несколько проблем. Прежде всего, было бы очень полезно найти для кривых Серре Sp с натуральным параметром р их рациональные параметризации, подобные параметризации лемнискаты. Однако главной проблемой является исследование структуры кривых Серре для нецелых значений параметра р. Здесь имеется два непохожих семейства: с нечетными и с четными значениями знаменателя t. Представляется очень правдоподобным, что при нечетных t все кривые Серре рациональны. В то же время компьютерные вычисления показывают, что при четных t могут появляться нерациональные кривые. Далее, было бы очень важно вычислить у-инварианты соответствующих эллиптических кривых и исследовать наличие у них комплексного умножения. И, наконец, было бы очень интересно проверить, не обобщается ли доказательство Эйзенштейна на кривые без комплексного умножения.
ГЛАВА 5 АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ В этой главе мы рассмотрим некоторые наиболее известные диофантовы уравнения. Диофантовым уравнением называется полиномиальное уравнение /(х,,...,хп) = 0, коэффициенты которого целые числа. Решение (х{ ) назовем целочисленным, если все xi — целые. Решение этого уравнения в рациональных числах называется рациональным,. Очевидно, что в случае, когда / — однородный многочлен, задача нахождения рационального решения равносильна задаче нахождения целочисленного решения. Истоки теории диофантовых уравнений восходят к античной математике. Еще Евклид разработал метод нахождения наибольшего общего делителя d двух чисел а1 а а2. Вообще говоря, этот метод приводит к решению диофантова уравнения alxl + + а^х2 = d, однако сам Евклид решением таких уравнений не занимался. Евклид знал также способ нахождения наибольшего общего делителя трех чисел; этот способ годится и для п чисел. Он основан на том, что ((ар.. .,an_Y), ап) = (ар..., ап). При решении геометрических задач древнегреческие математики никогда не пользовались составлением уравнений, так как разработанное ими понятие геометрической величины не позволяло этого делать. Вследствие этого, у древнегреческих математиков не могло быть большого интереса к уравнениям. После Евклида новые приемы решения уравнений в целых числах были созданы лишь в III в. н. э. александрийским математиком Диофантом. Он разработал способы решения в целых и рациональных числах квадратных и некоторых кубических уравнений с двумя и более неизвестными, заложив тем самым фундамент новой математической дисциплины, называемой теперь в его честь теорией диофантовых уравнений. Свои исследования он изложил
146 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ в обширном сочинении в 13 книгах под названием «Арифметика». Удивительна судьба этого сочинения. После своего появления в свет оно исчезло более чем на тысячелетие и считалось безвозвратно утраченным. Лишь в 1464 г. немецкий ученый Ре- гиомонтан случайно обнаружил 6 из 13 книг «Арифметики». В первый раз она была напечатана в латинском переводе в 1575 г. После ее французского издания 1621 г., подготовленного Баше де Мезирьяком, она стала настольной книгой многих математиков, в числе которых были Рене Декарт, который первым стал систематически использовать уравнения для решения геометрических задач, и Пьер Ферма. Как раз на полях своего экземпляра «Арифметики» П. Ферма записал одно из самых знаменитых в истории математики замечаний: «Cubum autem in duos cubos, aut quadrato-quadratum in duos quadrato-quadratos, et generaliter nullam in infinitum ultra quadratum potestatem in duas ejusdem nominis fas est divedere; cujus rei demonstrationem mirabilem sane detexi. Hanc marginis exiguitas non caperet*)». Совокупность приемов, разработанная Диофантом, сохранила свое значение до настоящего времени. Она носит название метода секущих. Этот метод позволяет полностью проанализировать уравнение второй степени и служит прототипом для исследования кубических уравнений. § 1. Метод секущих Диофанта. Диофантовы уравнения второй степени Прежде чем рассмотреть общую ситуацию, продемонстрируем метод секущих на конкретном примере — одном из тех, которые Диофант разбирает в своей «Арифметике». Пусть дано уравнение х2-у2=1 (1.1) и требуется найти все его рациональные решения. Уравнение (1.1) задает на плоскости Оху гиперболу. Сразу видно, что *) «Невозможно разложить куб на два куба, или биквадрат на два биквадрата, или вообще степень, большую двух, на две степени с тем же самым показателем; я нашел этому поистине чудесное доказательство, однако поля слишком малы, чтобы оно здесь уместилось». (Перев. с лат.)
§ 1. МЕТОД СЕКУЩИХ ДИОФАНТА. УРАВНЕНИЯ ВТОРОЙ СТЕПЕНИ 147 точка Р = (1,0) — точка пересечения гиперболы с осью Ох — является решением. Проведем через эту точку секущую (рис. 37) у = к(х-1) (1.2) и найдем вторую точку пересечения этой секущей с кривой (1.1). Для этого подставим выражение (1.2) в уравнение (1.1) и решим полученное квадратное уравнение относительно х. В результате получим ,2 i 1 Xl,2 = l_fc2 • Один корень х, = 1 нам известен — он соответствует точке (1,0), другой корень х2 определяет вторую точку 2fc fc2 + l fc2 - Г fc2 - 1 (1.3) Для любого рационального fc ф ±1 эта формула определяет точку на нашей кривой, а значит, и рациональное решение данного уравнения. При к ~ ±1 секущая пересекает кривую только в точке Р (рис. 37). Наоборот, для любого рационального решения, т. е. рациональной точки М на кривой, секущая РМ задается уравнением (1.2) с рациональным fc, так как тогда катеты прямоугольного треугольника РМН рациональны. Таким образом, формула (1.3) при всевозможных рациональных fc Ф ±1 дает все решения уравнения (1.1) в рациональных числах. Этот метод применим не только к многочлену х2 — у2 — 1, но и к любому многочлену второй степени от двух переменных р(х, у) = Ах2 + 2Вху + Cy2 + Dx + Ey + F с целыми или рациональными коэффициентами при условии, что на кривой р(х, у) = 0 есть хотя бы одна рациональная точка Р0 = = (х0,у0). В самом деле, проведем через эту точку прямую у-у0 = к(х-х0) (1.4) Рис. 37
148 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ и найдем точки пересечения кривой р(х,у) = 0 с этой прямой. Для этого подставим (1.4) в уравнение р(х,у) = 0. Многочлен р(х,у0 + к(х-х0)) имеет степень 2 относительно х. Если положить р(х, у0 + fc (х — х0)) = г(к) х2 + s(k) х + £(fc), где r(fc),s(fc),£(fc)— многочлены от fc, то для х получим уравнение г(к) х2 + s(k) х + t(k) = 0. Нам известен один из корней этого уравнения, а именно х = х0. Поэтому другой корень х = х, можно найти с помощью соотношения я(к) Х° + Хх ~ г(к) • Подставив выражение _ £(fc) Х] ~ Х° г(к) в уравнение (1.4), получим Таким образом, координаты второй точки имеют вид ^=(-*°-Шуу°-к{2х°+Ш)У (1-5) Так как s(k) и г(к) — многочлены с рациональными коэффициентами, то при любых рациональных fc, для которых r(fc) ф 0, формула (1.5) дает рациональное решение уравнения р(х, у) — 0, а поскольку при рациональных х, и ух угловой коэффициент к=У\~Уо Х\ ~ хо также рационален, формула (1.5) дает все рациональные решения при условии, что заранее известно хотя бы одно рациональное решение. Вопрос о существовании рациональной точки на кривой второго порядка р(х, у) = 0 довольно сложен. Такие точки имеются
§ 1. МЕТОД СЕКУЩИХ ДИОФАНТА. УРАВНЕНИЯ ВТОРОЙ СТЕПЕНИ 149 далеко не всегда. Например, их нет на окружности х2 + у2 = 3 и на эллипсе х2 + 82у2 = 3. Если кривая р(х,у) = 0 приводима над Q, то задача нахождения рациональной точки сводится к исследованию линейного диофантова уравнения, поэтому можно ограничиться рассмотрением лишь неприводимых над Q кривых р(х, у) = Ах2 + 2Вху + Су2 + Dx + Ey + F = 0. Хорошо известно, что в случае, когда дискриминант Д = АС—В2 квадратичной формы Ах2 + 2Вху + Су2 равен нулю, уравнение р(х,у) = 0 с помощью невырожденного линейного преобразования с рациональными коэффициентами приводится либо к виду ах2 + у = 0, где а ф 0, либо к виду х2 - с = 0, где с не является полным квадратом. В случае же, когда Д ф 0, уравнение р(х, у) = 0 приводится к виду ах2 + by2 + с = 0, аЬфО. (1.6) Очевидно, что кривая х2 — с = 0 не имеет рациональных точек. Очевидно также, что на кривой ах2 + у = 0 есть рациональная точка (0,0). Стало быть, остается исследовать кривую (1.6). Если с = 0, то (0,0) — рациональная точка кривой (1.6), поэтому можно считать, что аЬс ф 0. Прежде всего, для разрешимости уравнения (1.6) в рациональных числах необходимо, чтобы не все коэффициенты а,Ь и с были одного знака. Выполнив при необходимости замену переменных х i-> х-1, у I—> ух~х или х i-> ху~1, у I—> у~1, уравнение (1.6) можно привести к виду ах2 + by2 - с = 0, а>0,Ь>0,с>0. (1.7) При этом можно считать, что а, 6 и с — взаимно простые в совокупности и свободные от квадратов целые числа. Если х = р/r, у = q/r, где р, q,r £ Z — некоторое рациональное решение уравнения (1.7), то уравнение ах2 + by2 - cz2 = 0 (1.8) обладает ненулевым целочисленным решением (x,y,z) = = (Р,4ir)- Обратно, если уравнение (1.8) имеет нетривиальное
150 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ решение в целых числах (х, y,z), то z ф 0 (иначе мы получили бы нетривиальное решение уравнения ах2 + by2 = 0, а > 0, Ь > 0) и тогда уравнение (1.7) разрешимо в рациональных числах. Следовательно, вопрос о существовании рациональных решений уравнения (1.6) сводится при выполнении указанного выше необходимого условия к вопросу о нетривиальной разрешимости в целых числах уравнения (1.8). При этом числа а, Ь и с можно считать не только взаимно простыми в совокупности, но и попарно взаимно простыми. В самом деле, пусть, например, а и Ь делятся на q. Тогда q(ax2 + by2 — cz2) = а,х2 +Ь{у2 — c{z2, где х, = qx, yl = qy, a, = a/q, 6, = b/q, c, = qc. Критерий существования нетривиального решения уравнения (1.8) был получен еще Лежандром. Теорема 1. Если а, Ь и с — попарно взаимно простые натуральные числа, свободные от квадратов, то уравнение ах2 + by2 -cz2 = 0 имеет нетривиальное целочисленное решение тогда и только тогда, когда разрешимы все три сравнения: х2 — be = 0 (mod а), х2 — ас = 0 (mod 6), x2 + ab = 0 (mode). Нам будет удобнее перейти от уравнения (1.8) к уравнению 9,9 9 асх + bey = z{. Если (1,1/,2:,) — решение этого уравнения, то zl делится на с, так как с свободно от квадратов. Поэтому (х,у, zx/c) — решение уравнения (1.8). Таким образом, вместо теоремы 1 достаточно доказать следующее утверждение. Теорема 2. Пусть а и b —натуральные числа, свободные от квадратов. Уравнение ах2 + by2 = z2 (1.9)
§ 1. МЕТОД СЕКУЩИХ ДИОФАНТА. УРАВНЕНИЯ ВТОРОЙ СТЕПЕНИ 151 имеет нетривиальное решение в целых числах тогда и только тогда, когда существуют такие целые числа а, /3 и 7> что а) а2 — а = 0 (mod 6), б) /32-Ъ = 0 (mod а), в) >y2 + ab/h2 = 0 (mod h), где h = (а, b). Доказательство. Предположим сначала, что уравнение (1.9) имеет нетривиальное целочисленное решение x,y,z. Можно считать что (x,y,z) = 1. Из (1.9) следует, что ах2 = z2 (modb). Пусть (Ь, х) = d. Тогда х = dxx и Ъ = dbv поэтому ad2x\ + dbxy2 = z2. Следовательно, z = dzx. Значит, Ьху2 делится на d, причем d свободно от квадратов, так как Ъ свободно от квадратов. В итоге получаем, что все числа х, у, z делятся на d, т. е. d = 1. Поэтому существует такое число х', что хх1 = 1 (mod 6). Тогда а = а2 (modb), где a = x'z. Аналогично доказывается разрешимость сравнения Ь = /З2 (mod а). Сравнение в) можно записать в виде 72 + ахЬх = 0 (mod h), где а = hax,Ъ = hbx. При этом числа ax,bx,h попарно взаимно простые и свободные от квадратов. Так как а и b делятся на h, то z = hzx, а значит, ахх2 + Ъху2 = hz\. Если (х,К) = d, то у и zx делятся на d. Поэтому d = 1 и существует такое число х', что хх' = 1 (mod h).
152 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ Домножив сравнение а,х2 + b{y2 = О (mod h) L /2 на о,х , получим а, 6, +72 = 0 (mod h), где 7 = Ъ{х'у. Предположим теперь, что разрешимы все три сравнения а)- в). Если а = 1, то теорема очевидна. Кроме того, можно считать, что а^Ь, поскольку при b > а следует лишь поменять местами х и у. Пусть а = Ь, тогда согласно в) 72 + 1 = 0 (mod а). Предположим, что один из простых делителей числа а имеет вид р = 4fc + 3. Тогда 72 + 1=0 (modp) и (4^=(-1)^=(-1)^ = -1 (modp). С другой стороны, согласно малой теореме Ферма, (72) 2~ =7Р- 1 = 1 (modp). Приходим к противоречию, поэтому а является произведением простых чисел вида 4fc+1 и, возможно, числа 2. Каждый простой сомножитель числа а представим в виде суммы двух квадратов (лемма 4 § 4, гл. 4). Ясно также, что (х2 + у2) (z2 + t2) = (xz - ytf + (xt + yz)2. Поэтому a = r2 + s2 для некоторых целых г и s. Тогда решение уравнения (1.9) задается в виде х = г, у = s, z = г2 + s2. Остается рассмотреть случай, когда а > Ь > 1. От уравнения (1.9) перейдем к новому уравнению Ах2 + by2 = z2, где О < А < а и для А разрешимы сравнения, аналогичные а)-в). После конечного числа шагов, меняя местами А и Ь при А < Ь, мы получим либо А = Ь, либо b = 1. В каждом из этих случаев,
§ 1. МЕТОД СЕКУЩИХ ДИОФАНТА. УРАВНЕНИЯ ВТОРОЙ СТЕПЕНИ 153 как уже было показано, решение существует. По этому решению мы построим решение уравнения (1.9). Согласно б) существует такое число /3, что /З2 - 6 = аАк2, где число А свободно от квадратов. При этом можно считать, что |/3| ^ а/2. Покажем сначала, что 0 < А < а. Так как /32 = аАк2 + Ь< а(Ак2 + 1), то А > 0. Кроме того, b ф 1 и b свободно от квадратов. Поэтому /З2 Ф 6, а значит, А Ф 0. Ясно также, что Докажем теперь разрешимость требуемых сравнений. Так как /З2 - b = аАк2, то /32=6 (mod А), поэтому разрешимо сравнение, аналогичное б). Кроме того, /3 = = /г/3,, где h = (a,b), поэтому /г/32-Ь, = щАк2. (1.10) В частности, h(32x=axAk2 (mod 6,). Из а) следует, что a, = ha2 (mod 6,). Поэтому hff = hA(a]k)2 (mod 6,). А так как h, к и а, взаимно просты с 6,, то А = р2 (mod 6,). Кроме того, из (1.10) следует, что ахАк2 = -6, (modh). Поэтому A(a,fc)2 = -a,6, =72 (mod/г). Значит, A = <j2 (mod /г).
154 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ Числа h и Ь, взаимно просты, поэтому hu+bxv = 1 для некоторых целых чисел и и v. Рассмотрим число х = hup + bxvq. Так как hu = 1 (modb,) и Ь,и=1 (mod/i), то х = р (modb,) и х = q (mod/i), а значит, A = i2(modb,) я А = x2(modh). Следовательно, А = х2 (modb). Рассмотрим теперь Я = (А,Ъ). Пусть А = НА2 и Ь = НЪ2. Тогда /3 = Я/32 и Я/?2 - Ь2 = о,А2к2. Поэтому -А2Ь2 = а(А2к)2 (mod Я). Из в) следует, что а = а2 (mod Я). Значит, -A2b2 = г2 (mod Я). Предположим теперь, что уравнение АХ2 + bY2 = Z2 имеет нетривиальное целочисленное решение. Умножим равенство АХ2 = Z2 - bY2 на аАк2 = f32 - Ъ. В результате получим a(A*fc)2 = (Z2 - bY2) (/32 -b) = (/3Z + b)2-b (f3Y + Zf. Значит, уравнение (1.9) имеет целочисленное решение х = АХк, у = (3Y+Z, z = /3Z + bY. Это завершает доказательство, так как ХфО. U В 1950 г. канадский математик Хольцер [В21] получил уточнение теоремы Лежандра, которое дает эффективный алгоритм для нахождения нетривиального целочисленного решения уравнения (1.8), а значит, и для нахождения рационального решения уравнения (1.7). Теорема 3 (Хольцер). Пусть а, Ь, с, —попарно взаимно простые числа, свободные от квадратов, причем а, Ь > 0, с < 0. Тогда если уравнение ах2 + by2 + cz2 = 0 имеет ненулевое целочисленное решение, то оно имеет также ненулевое целочисленное решение, для которого 12<Ь|с|, у2 ¢. а\с\, z2 ¢. ab.
§ 1. МЕТОД СЕКУЩИХ ДИОФАНТА. УРАВНЕНИЯ ВТОРОЙ СТЕПЕНИ 155 Доказательство (Морделл [В13, в]). Достаточно доказать, что z2 ^ ab. В самом деле, тогда ax2+by2 ^ ab \с\, поэтому х2 ^ Ь\с\ и у2 ^ а\с\. Рассмотрим решение (х0, у0, z0), для которого (х0, j/0) = 1 и z\ > об. Достаточно показать, что с помощью этого решения можно построить новое решение (х, у, z), для которого \z\ < |,z0|. Тройка чисел x0+txv y0 + tyv z0 + tzl будет решением тогда и только тогда, когда числа t, хх, ух, zx удовлетворяют соотношению (ах2 + by2 + cz\) t2 + 2 (ах0х1 + by0yx + czQzx )t = 0. При t фО на £ можно сократить. В результате получим t = m/n, где т = —2(ах0х1 + by0yx + czQzx), п = ах\ + ta/f + c.Zp После умножения на знаменатель п получим решение xQn+ ххт, yQn + ухт, zQn + zxm. Покажем.что все эти три числа делятся на Д = (с, хху0-ухх0). По условию (с, ab) = I и (х0, у0) = I. Поэтому из равенства ax2Q + byl + cz\ = О следует, что (с, abx0y0) = 1, а значит, (A, abxQyQ) = 1. Следовательно, существуют такие целые числа х^"1 и з/^1, что х0х^' = 1 (mod А) и у0Уо1 = 1 (mod А). А так как хху0-ухх0 = 0 (mod А), то xx=yxx0y~l (mod А).
156 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ Теперь легко показать, что Р = ах0х, + by0yl = 0 (mod А), Q = ax2 + by2 = 0 (mod А). В самом деле, Р = ах0 (з/, х0у~х) + ЬуоУ] = ух (ах20 + Ъу20) у'1 == 0 (mod А), Q = a(ylx0y-if+by1 = (ах20 + byl)y2y~2 = 0 (mod А). Таким образом, х0п + ххт = х0(ах2 + by2 + cz2) - 2хх(ах0хх +by0y1 +czQzx) = = x0Q + cxQz2 — 2х,Р - 2cx,2;02;I = 0 (mod А). Аналогично доказывается, что и остальные числа делятся на Д. Пусть 6 — делитель числа А. Тогда тройка чисел х = (х0п + х, т) <5-1, У = {Уоп + У\т)&~\ z = (z0n + zx т) 6~1 является целочисленным решением. Его нужно подобрать так, чтобы выполнялось неравенство \z\ < \z0\. Ясно, что 6z_ _ ( | ах0х, + byQy{ czn czn 2 /ах0х, +Ьу0уЛ2 _ ах2 + by czn Учитывая, что cz\ = —{ах20 + Ьу%), получаем 8z ( ахпх, + Ьупу, \ ab , ч9 ,, .., = (Zi+_o_! ^] +_(Vl-xo2/l)2. (1.11) czn czn - 2У2 C'Z, Теперь построим требуемое решение. В качестве х, и ух возьмем произвольное решение уравнения у0х, — х0ух = 6. Тогда на 6 накладывается лишь одно условие — 6 делит с. Первый случай: число с четно. В качестве 6 возьмем число с/2, a 2j выберем так, чтобы выполнялось неравенство *1 + ах0х, + Ьу0ух czn 1 *2"
§ 1. МЕТОД СЕКУЩИХ ДИОФАНТА. УРАВНЕНИЯ ВТОРОЙ СТЕПЕНИ 157 Тогда из (1.11) получаем 2 1 ab <4 + 4Щ По условию z\ > ab, поэтому \z\ < \z0\. Второй случай: число с нечетно. Потребуем, чтобы выполнялось условие zxl + byl + czl = 0 (mod2); (1-12) Иными словами, число zl должно иметь ту же четность, что и число axl +byr Соотношение (1.12) эквивалентно тому, что п = ах2 + by2 + cz2 = О (mod 2). Следовательно, числа х0п+ ххт, yQn + yxm, zQn + zxm делятся на 26. Поэтому если вместо 6 взять число 6' = 26, то для него тоже будет выполняться соотношение (1.11). В этом случае оно принимает вид 2fe _ / ах0хх + by0yl \ ■ czn ~ \l cz0 ) ab о С Zn Положим 6 = с, а число zx выберем так, чтобы выполнялось соотношение (1.12) и при этом имело место неравенство Тогда т. е. Ы < IzJ. П zi + ах0хх + Ьу0ух czn < 1. ab £ 1 + ^ < 2, Задачи 1. Какие из следующих уравнений имеют нетривиальные целочисленные решения? а) Зх2 - Ъу2 + 7z2 = 0. б)7х2 + Пу2- 19z2 = 0. в) 8х2 - Ъу1 - Зг2 = 0. г) llx2-3i/2-41z2 = 0.
158 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ 2. Найдите рациональные точки следующих кривых: г)х2-Ъу2 = \; б) х2 + Чу2 = 9; в) х2 - 6у2 = 1. 3. Докажите, что уравнение х2 — 2у2 = 3 не имеет целочисленных решений. 4. Пусть d — натуральное число, свободное от квадратов. а) Докажите, что если (xvy{) — целочисленное решение уравнения х2 - dy2 = 1 и (х, + y{\/d)n = хп + ynVd, где хп и уп — целые числа, то (хп,уп) тоже решение этого уравнения. б) Докажите, что если уравнение х2 — dy2 = — 1 имеет целочисленное решение, то уравнение х2 — dy2 = 1 тоже имеет целочисленное решение. в) Докажите, что уравнение х2 — dy2 = 1 имеет хотя бы одно целочисленное решение. г) Докажите, что если уравнение х2 — dy2 = п, где п ф О, имеет хотя бы одно целочисленное решение, то оно имеет их бесконечно много. § 2. Сложение точек на кубической кривой В своей «Арифметике» Диофант не ограничился уравнениями второй степени. Он с успехом решает и некоторые кубические уравнения, демонстрируя общий прием при нахождении рациональных решений уравнения у(6-у) = х3 -х. Однако систематический интерес к диофантовым уравнениям третьей степени возник, по-видимому, лишь в связи с античной задачей о конгруэнтных числах, исследование которой было предпринято арабскими математиками X в. Положительное число г б Q называется конгруэнтным, если оно является площадью некоторого прямоугольного треугольника с рациональными длинами сторон. Например, 6 — площадь треугольника со сторонами 3, 4 и 5; стало быть, 6 — конгруэнтное число. Пусть число г конгруэнтно и а, 6, с 6 Q — стороны прямоугольного треугольника с площадью г. Для любого г б Q можно найти такое s б Q, что s2r — целое число, свободное от квадратов. Но площадь треугольника со сторонами sa, sb
§ 2. СЛОЖЕНИЕ ТОЧЕК НА КУБИЧЕСКОЙ КРИВОЙ 159 и sc равна s2r. Таким образом, без ограничения общности можно считать, что г = п — натуральное число, свободное от квадратов. Следует отметить, что в определении конгруэнтного числа стороны треугольника должны быть лишь рациональными числами, а не обязательно натуральными. В то время как 6 — наименьшая возможная площадь треугольника с целочисленными сторонами, существует прямоугольный треугольник с рациональными сторонами и с площадью 5. Такую площадь имеет треугольник со сторонами (3/2,20/3,41/6). Можно показать, что 5 — наименьшее конгруэнтное натуральное число. Оказывается, что проблема описания всех конгруэнтных чисел сводится к диофантову уравнению третьей степени. А именно, справедливо следующее утверждение. Теорема 1. Пусть п — натуральное число, свободное от квадратов. Тогда эквивалентны следующие три условия: 1) п — конгруэнтное число; 2) существует такое рациональное число х, что числа х, х + п и х — п являются квадратами рациональных чисел; 3) на кривой у2 = х3 — п2х существует рациональная точка (х,у), координата х которой является квадратом рационального числа, причем знаменатель х — четное число, а числитель х не имеет общих делителей с п. Доказательство. Сначала докажем эквивалентность условий (1) и (2). Пусть а < Ъ < с — такая тройка положительных рациональных чисел, что а2 + Ь2 = с2 и п = аЪ/2. Положим х = с2/4. Тогда х+п = (а+Ь)2/4 их-п= (а-Ь)2/4. Следовательно, х,х + п и х — п — квадраты рациональных чисел. Наоборот, если х удовлетворяет условию (2), то положим с = 2у/х и найдем числа оибиз системы уравнений (а + Ь)2 =4 (х + п), (а - Ъ)2 = 4 (ж - п). Иными словами, если х удовлетворяет условию (2), то искомый треугольник имеет стороны а = \/х + п — \/х — п, Ъ = \/х + п + \/х — п, с = 2sfx. Чтобы доказать эквивалентность условий (2) и (3), рассмотрим такое рациональное число х, что х, х+п и х — п — квадраты
160 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ рациональных чисел. Тогда ж = и2 и (х+п) (х-п) = v2. Положим у = uv. Тогда у2 = ж3-п2ж, (2.1) т. е. точка (х, у) лежит на кубической кривой (2.1). Поскольку х = с2/4, знаменатель х делится на 2. А так как п свободно от квадратов, то числитель х не имеет общих делителей с п. Наоборот, если х = и2 = (с/2)2 их3 — п2х = у2, то v2 = у2/х = х2 - п2 = (х + п) (х — п) и мы имеем пифагорову тройку v2 + n2 = ж2. Числа ж2 и v2 имеют один и тот же знаменатель д4, причем число q по предположению четно. Следовательно, числа q2v и q2x целые, а число q2n четное, причем q2x и q2n не имеют общих делителей и (q2v)2 + (q2n)2 = (q2x)2. Поэтому q2v = s2 — t2, q2n = 2st, q2x = s2 + t2, где s и t — целые числа. Так как то треугольник со сторонами 2s/q, 2t/q и 2и прямоугольный, причем его площадь равна 2st/q2 = q2n/q2 = п. □ Задача о конгруэнтных числах, а также некоторые другие классические задачи, например, задача об отыскании рациональных решений уравнения х3 + у3 = 1, являются частными случаями проблемы нахождения рациональных решений общего кубического уравнения /(ж, у) = 0 с двумя неизвестными, т. е. нахождения рациональных точек кривой С, заданной уравнением /(*, 2/) = 0. Предположим сначала, что кубическая кривая /(ж,у) = 0 имеет особую точку О, причем эта точка рациональна. В особой точке прямые пересекают кривую не менее чем двукратно. Из этого, в частности, следует, что кубическая кривая не может иметь двух особых точек О и О,, так как иначе прямая ООх имела бы с кубической кривой не менее чем четырехкратное пересечение. Проведем через точку О = (х0,у0) рациональную прямую ж = ж0 + at, у = у0 + Ы, где а, b £ Q. Точки пересечения этой прямой с кубической кривой соответствуют корням многочлена
§ 2. СЛОЖЕНИЕ ТОЧЕК НА КУБИЧЕСКОЙ КРИВОЙ 161 F(t) = f(x0 + at,y0 + bt). Коэффициенты многочлена F рациональны, причем для почти всех прямых его степень равна трем (степень меньше трех лишь для прямых, проходящих через бесконечно удаленные точки кривой). Многочлен F имеет двукратный корень t = О, соответствующий точке О. Следовательно, третий корень многочлена F рационален, т. е. он соответствует рациональной точке кривой. Ясно также, что прямая, соединяющая точку О с рациональной точкой кривой, задается уравнением с рациональными коэффициентами. Это дает полное описание множества рациональных точек особой кубической кривой. В дальнейшем мы будем рассматривать лишь неособые кубические кривые. Напомним, как в главе 1 было определено сложение точек неособой кубической кривой. Пусть Е — фиксированная точка данной кривой, АтлВ — некоторые точки кривой, X — точка пересечения прямой АВ с кривой. Суммой точек А и В называется точка пересечения прямой ЕХ с данной кривой. Легко проверить, что если кубическая кривая задается многочленом с целыми коэффициентами и точка Е рациональна, то сумма двух рациональных точек будет рациональной точкой. Кривая у2 = х3 + ах + Ь будет неособой тогда и только тогда, когда ее дискриминант Д = -(4а3 + 27Ь2) отличен от нуля. В том случае, когда в качестве нулевого элемента выбрана бесконечно удаленная точка, для такой кривой легко получить явные формулы сложения точек. Пусть прямая у = рх + q пересекает данную кривую в точках (х{,у{), г= 1,2,3. Тогда (рх + q)2 = х3 + ах + Ь при х = х{,х2,х3. Сумма корней этого уравнения равна р2, следовательно, _ 2_ ( У\ ~ УчN 2 Х3 — —Ж[ — х2+ р — — х{ — х2 + I y3=px + q= ' _ 2 {x3-Xl)+yr 1 2 Ясно, что сумма точек {х{,у{) и (х2,у2) имеет координаты (х3, -у3). В случае, когда х{ = х2, у{ = у2, достаточно заметить, что 1- У\ ~У2 и ч 3xi +а lim ——— = у(х,) = —± . х2-^>х{ х, - х2 2у,
162 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ Отдельно следует разобрать случай хх = х2, ух Ф у2. В этом случае сумма точек есть бесконечно удаленная точка кривой. Полученные формулы показывают, что, зная одну рациональную точку Р кривой у2 = х3 + ах + Ь, можно найти рациональные точки 2Р, ЗР и т. д. Рассмотрим, например, кривую у2 = х3 - 2 и точку Р = (3,5). Тогда /129 _^83\ Vioo' iooo; — новая рациональная точка. Теперь можно вычислить ЗР, 4Р и т. д. При этом с каждым шагом объем вычислений стремительно возрастает. Если обозначить через хп первую координату точки пР, то _ 129 _ 164323 Х; _ 3' Х2 ~ ЮО ' Хз ~ "2924Т ' __ 2340922881 _ 307326105747363 Х" ~ 58675600 ' Ч ~ 160280942564521' А числитель хп имеет уже 71 знак. Следует отметить, что точки Р, 2Р, ЗР,... не обязательно различны. В таком случае наименьшее число т £ Q, для которого тР есть нулевой элемент группы, т. е. бесконечно удаленная точка, называется порядком точки Р. Задачи. 1. Докажите что точка Р = (0,2) на кривой у2 = ж3+4 имеет порядок 3. 2. Докажите что точка Р = (2,4) на кривой у2 = х3 + Ах имеет порядок 4. 3. Каждая из следующих точек имеет конечный порядок на соответствующей кривой. Найдите его. а)Р = (0,4) нау2 = 4х3+ 16. б)Р = (2,8) нау2 = 4х3 + 16х. в)Р = (2,3) на у2 = х3+\. г)Р = (3,8) на у2 = х3 - 43х + 166. д) Р = (3,12) на у2 = х3 - 14х2 + 81х. е) Р = (0,0) на у2 + у = х3 - х2. ж) Р = (1,0) на у2 + ху + у = х3 - х2 - Зх + 3.
§ 3. НЕКОТОРЫЕ ПРИМЕРЫ 163 4. Пусть /п — функции на кривой у2 = х3 + ах + Ь, 4а3 + 27Ь2 ф О, задаваемые соотношениями /i = l. Л = 2i/, /3 = Зх4 + бох2 + \2Ьх — а2, /4 = Ау (х6 + 5ох4 + 20Ьх3 - 5а2х2 - 4аЬх - 8Ь2 - а3), Лт = 2/т(/т+2/т-1 _ /m+2/m+l)' т ^ 3, J2m+1 = Jm+IJm ~ Jm-\Jm+\ > т ^ ^' Пусть, далее, <7n = xf2n-fn_xfn+x и 4j//»n = /,^/2-1 "/n-l/n+l- Докажите, что n(z,2/) = (<7n//2,/>n//n)- § 3. Некоторые примеры В этом параграфе мы рассмотрим несколько примеров неособых кубических кривых, заданных уравнением в нормальной форме у2 = х3 + ах + b или же уравнением у2 4- 2су = х3 + ах + Ь, которое сводится к предыдущему заменой у на у + с. Нам придется сменить обозначения. Дело в том, что в вопросах, связанных с рациональными точками на эллиптической кривой и редукцией по модулю р, обозначение кривой через Е является традиционным. Поэтому до конца главы бесконечно удаленная точка кривой или единица группового закона будет упоминаться без какого-либо обозначения, а эллиптическая кривая будет обозначаться через Е. Нас будет интересовать в основном множество рациональных точек кривой Е, которое мы будем обозначать E(Q). Это множество, как уже говорилось, является абелевой группой, нулевым элементом которой служит бесконечно удаленная точка
164 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ кривой. В связи с этим бесконечно удаленную точку кривой тоже удобно считать рациональной точкой. Пример 1. Рассмотрим следующую задачу: представить произведение двух последовательных целых чисел у(у + 1) в виде произведения трех последовательных целых чисел (ж — 1) х (ж + 1) = х3 — х. Эта задача приводит к кривой Е, задаваемой уравнением у2 + у = х3-х. (3.1) На этой кривой есть шесть очевидных точек с целочисленными У У* + У=^х3-х -ЗР = (-1,0),/" "\ д> / No- / N "* l (И)-* \ 3P=(-l,-l)^^_^ V / V 4 / \ ' \ \ \ \ 1 P = (0,0) V Л \ N У I \\ / 1 4^ /' ^ чл L -+ \ 1 !-P = (0,-1)4 \ \ \ \ \ \ \ \ \ \ t \ \ N. / / / / / / 1 / 1/ 2P = (1,0) .- 2P = (1,-1) \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ 4 \ \ \ X ЛР = (2,-3) Рис. 38 координатами: (0,0), (1,0), (-1,0), (0,-1), (1,-1) и (-1,-1) (рис. 38). Положим Р = (0,0). Тогда все указанные точки порождаются точкой Р: ЗР = (-1,-1), 2Р = (1,0), -Р = (0,-1), -2Р = (1,-1), -ЗР = (-1,0).
§ 3. НЕКОТОРЫЕ ПРИМЕРЫ 165 Точка Р порождает бесконечную циклическую группу. Все точки вида (2п+ 1)Р лежат на замкнутой компоненте кривой, содержащей точку Р. Точки вида 2пР расположены на некомпактной компоненте и при увеличении п стремятся к бесконечности. Пример 2. Кривая Е, задаваемая уравнением у2 + у = х3 - х2, (3.2) имеет четыре очевидные точки с целочисленными координатами: (1,0), (0,0), (0,-1) = -(0,0) и (1,-1) = -(1,0) (рис. 39). Касательная к кривой Е в точке (1,0) пересекает кривую в точке (0,-1). Это означает, что 2(1,0) = (0,0) и, стало быть, 2(1,-1) = (0,-1). Касательная к кривой Е в точ- у ке (0,0) пересекает ее в зр = (0,\-1) точке (1,0), т. е. 2(0,0) = = (1,-1). Из равенств 2(1,0) = (0,0), 2(0,0) = (1,-1) = -(1,0) получаем 4(1,0) = -(1,0), т. е. 5(1,0) =0. Следовательно, подмножество {0,(1,0),(0,0),(0,-1),(1,-1)} 4Р=(1,-1) = -Р Рис. 39 образует в E(Q) циклическую подгруппу порядка 5. Используя более развитую технику, можно показать, что других рациональных точек на этой кривой нет. Пример 3. Рассмотрим кривую Е, заданную уравнением у2 + у = х3 + х2. (3.3) На этой кривой есть четыре очевидные точки с целочисленными координатами: (0,0), (-1,0), (0,-1) = -(0,0) и (-1,-1) = = -(-1,0) (рис. 40). Точка Р = (0,0) порождает бесконечную циклическую подгруппу в E(Q). Например, нетрудно вычислить,
166 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ ЧТО -ЗР = (1,1), 2Р = (-1,-1), ЗР = (1,-2), 4Р = (2,3), 5Р = (-3/4,-9/8). Касательная Т к кривой в точке —2Р пересекает эту кривую в точке 4Р. Прямая L, проходящая через 2Р и Р, пересекает Е 4Г4Р = <2,3) у*+у = х3+х2 / ' I 2Р = (-1,-1)# / • — ог = ~ ' / I 3 2^ Рис. 40 в точке —ЗР. Точка —5Р вычисляется либо с помощью прямой Lp проходящей через Р и 4Р, либо с помощью прямой L2, проходящей через точки 2Р и ЗР. Пример 4. Рассмотрим уравнение Ферма и3 + v3 = w3. Его ненулевыми целочисленными решениями являются тройки
§ 3. НЕКОТОРЫЕ ПРИМЕРЫ 167 (и,v,w) = (1,-1,0), (1,0,1) и (0,1,1). Все остальные целочисленные решения им пропорциональны. Кубическое уравнение u3 + v3 = w3 записано не в нормальной форме, однако с помощью преобразования 3w 9 (и — v\ 1 Х u + v,V 2\u + v)+2 мы получим кривую Е, задаваемую уравнением в нормальной форме у2 _ у = хз _ 7 (3.4) Указанное преобразование переводит точку (1, — 1,0) в бесконечно удаленную. Точка (1,0,1) переходит при этом в точку (3,5), а точка (0,1,1) — в (3, —4). Таким образом, E(<Q) является циклической группой состоящей из трех элементов {0, (3,5), (3, —4)}, поскольку если бы E(Q) содержало бы другие рациональные точки (х,у), то им соответствовали бы нетривиальные решения (и, v,w) уравнения Ферма и3 + v3 = w3. Убедимся, что ЗР = 0 для Р = (3,5), вычислив —2Р с помощью касательной к Е в точке Р. Из уравнения для производной (2у— \)у' = Зх2 находим угловой коэффициент касательной к Е в точке (3,5): А-2^т-Т-3- Следовательно, касательная задается уравнением у = 5 + 3 (х - 3) = Зх - 4. Она пересекает кривую (3.4) в точках, абсциссы которых удовлетворяют уравнению (Зх - 4)2 - (Зх - 4) - х3 - 7, т. е. х3 - 9х2 + 27х - 27 = (х - З)3 = 0. Таким образом, абсцисса точки —2Р есть х = 3. Значит, —2Р = = Р, откуда ЗР = 0. Пример 5. Рассмотрим кривую у2 - х3 + к, (3.5)
168 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ где к — целое число. Соответствующее диофантово уравнение впервые было рассмотрено в XVII в. Ферма и Баше де Мезирь- яком в частном случае к = — 2 и впоследствии интенсивно изучалось. До сих пор неизвестно, при каких целых значениях к уравнение (3.5) имеет по крайней мере одно рациональное решение. Баше утверждал, но не доказал этого, что если есть рациональное решение (х,у), ху ф 0, то метод касательных приводит к бесконечному числу рациональных решений. На современном языке это означает, что если группа E(Q) рациональных точек кривой (3.5) ненулевая, то она бесконечная. С несколькими исключениями это утверждение было доказано в 1930 г. немецким математиком Фуэтером. В 1966 г. замечательно короткое доказательство результата Фуэтера получил английский математик Морделл (см. задачу 2 в конце этого параграфа). Пример 6. В 1643 г. Ферма в письме к Мерсенну предложил найти такие целочисленные пифагоровы тройки (X, Y, Z) со взаимно простыми X, Y, Z, для которых гипотенуза Z и сумма катетов X + Y являлись бы полными квадратами. Ответ, которым располагал Ферма, имеет вид X = 1061652293520, Г = 4565486027761, (3.6) Z = 4687298610289, причем это наименьшее положительное решение. Записывая эту задачу алгебраически, мы получаем систему уравнений (x2 + y* = Z\ < Z = b\ ^X + Y=a2. Положим е = X — Y. Тогда X=l-(a2 + e), Y=l-(a2-e). Таким образом b* = Z2 = X2 + Y2=l-(a4 + e2) и е2 = 2Ь4 - а4. (3.7)
§ 3. НЕКОТОРЫЕ ПРИМЕРЫ 169 Поделив это соотношение на а4, мы приходим к кривой v2 = 2u4-l. (3.8) Если пара чисел (и, v) удовлетворяет уравнению (3.8) и если (х, у) заданы формулами 2(v + 2u2-l) х = У = (и-1)2 ' 4((2«- l)v + 2u3- 1) (3.9) (и-1)3 то имеет место соотношение у2 = х3 + 8х. (3.10) Обратно, если точка (х, у) лежит на кривой (3.10), то пара (и, v), удовлетворяющая уравнению (3.8), находится из формул у - 2х - 8 и = : ;т« у - Ах + 8 (3.11) _ у2 - 24а:2 + 48у - 16а: - 64 V ~ (у - Ах + 8)2 Например, точки (х,у) = (0,0), (1,3) и (1,-3) соответствуют точкам (и, v) = (-1, -1), (-1,1) и (-13, -239). Заметим, что соответствие (3.9), (3.11) не является взаимно однозначным: точка (и, v) = (13,239) переходит при этом соответствии в (х, у) = = (8, 24), однако точка (ж, у) = (8,24) отображается в особую точку. Точно так же, точка (х,у) = (8, -24) переходит в (и, v) = = (1,-1), но (и, v) = (1, -1) отображается в особую точку. Итак, мы получаем, что рациональная точка на эллиптической кривой (3.10) задает рациональное решение (и, v) уравнения (3.8) и, следовательно, целочисленное решение (а, Ь,е) системы (3.7) со взаимно простыми а и Ь. Легко видеть, что числа a, b и е должны быть нечетными. Таким образом, мы приходим к пифагоровой тройке (X, Y, Z) X=l-(a2 + e), Y=l-(a2-e), Z = Ъ2 (3.12) и все, что остается сделать для решения задачи Ферма — это проверить, будут ли числа X и Y положительными. К сожалению, малые решения, такие как (a,b,c) = (1,13,239), приводят к отрицательному Y.
170 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ Задачи 1. Пусть Р0 = (х0,у0), у0 Ф 0 — рациональная точка кривой у2 = х3 + к. Показать, что касательная в точке Р0 пересекает эту кривую в точке Р, = (х,,2/,), где _94-8хУ _ 27x1 - 36ху0 + 8у40 *'" Ч ' у'~ Ч Показать, в частности, что кривая у2 = х3 — 2 имеет рациональные точки Р0 = (3,5) и Р, = 2. (Морделл [В13, б]) Пусть к — целое число, свободное от шестых степеней и отличное от 1 и —432. Пусть, далее, кривая у2 = х3 + к имеет рациональную точку Р0 = (х0, у0), причем х0у0 Ф 0. а) Положив х0 = p/q2 и у0 = r/q3, где (p,q,r) = 1, (p,q) = 1 и (Q,r) = 1 > показать, что точка Р, = (х,, у,) из задачи 1 имеет координату х,, задаваемую соотношением б) Доказать, что если Зр*/2г не является целым числом, то в) Доказать, что если Зр2/2г — целое число, то, применяя к точке Р, указанный в предыдущей задаче процесс, можно прийти к рациональной точке Р/ ф Р0. г) Используя результаты задач а) — в), доказать, что кривая у2 — х3 + к имеет бесконечно много рациональных точек. 3. а) Доказать что уравнение у2 = х3 + 1 не имеет рациональных решений, отличных от (—1,0), (0, ±1), (2,±3). б) Доказать, что уравнение у2 — х3 — 432 не имеет рациональных решений, отличных от (12, ±36). /129 383 \ I 100' 1000 J
§ 4. ТЕОРЕМА МОРДЕЛЛА 171 § 4. Теорема Морделла В 1901 г. великий французский математик А. Пуанкаре высказал предположение [А8], что все рациональные точки E(Q) эллиптической кривой могут быть получены из некоторого их конечного числа с помощью операции сложения точек. В алгебраических терминах это утверждение можно сформулировать следующим образом. Теорема 1. На эллиптической кривой Е, заданной уравнением с рациональными коэффициентами, группа E(<Q) рациональных точек является конечнопорожден- ной абелевой группой. Сам Пуанкаре считал это утверждение очевидным. Строгое доказательство гипотезы Пуанкаре впервые получил англичанин Л. Морделл в 1922 г. [В13, а]. За семь десятилетий появились различные обобщения и новые варианты доказательства этой теоремы. Мы приведем здесь один из них с небольшим пробелом (чтобы его заполнить, необходимы сведения из теории делимости в кольцах целых алгебраических чисел). Итак, рассмотрим кривую у2 = х3 + ах + Ь, где а, Ь е Q и А = -(4а3 + 27Ь2) ф 0, можно считать, что а и Ь — не только рациональные, но и целые числа. В самом деле, пусть р г а = -, о = - Я Я (дроби в этих выражениях не предполагаются несократимыми). Положим У= 3' Х= 2- Тогда исходное уравнение перепишется в виде у2 = х3 + pq3xx + + rq5; коэффициенты этого многочлена целые. Пусть а,, а2, а3 — корни уравнения у2 = х3 + ах + Ъ. Поскольку, по предположению, а, Ь G Z, то ava2,a3 — целые алгебраические числа. Итак, у2 = (х-а,)(х-а2)(х-а3). (4.1)
172 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ При исследовании этого уравнения можно следить лишь за координатой х, так как каждому значению х0 соответствуют два значения ±у0. Рассмотрим в качестве примера эллиптическую кривую у2 = х3 — 2. На этой кривой лежит точка Р0 = (3,5). В § 3 мы показали, что _ /129 383 \ 0 Uoo' iooo;- При этом 129 з/s (^- 6^2 -2^4 х, —а, = —— — V2 41 loo '- v ю т. е. точка 2Р0 = (х1,у1) имеет следующее свойство: число х1 — а{ является квадратом в поле <Q>(\/2). Это свойство играет в доказательстве теоремы Морделла решающую роль. Покажем, что если Е — определенная над Q эллиптическая кривая (4.1) и а — одно из целых алгебраических чисел а{,а2,а3, то отображение E(Q) —> Q(a), при котором точке (х0,у0) G E(Q) ставится в соответствие элемент х0 — а £ Q(a) может быть включено в коммутативную диаграмму Ш) > Q(«) E(Q)/2E(Q) > Q(a)/Q(a)2 , причем сложению точек в E(Q) соответствует умножение смежных классов в <Q>(a)/Q(a)2. Получим сначала явные формулы для сложения точек кривой у2 = х3 + ах + b в более удобном для наших целей виде. Пусть прямая у = рх + q пересекает кривую у2 = х3 + ах + b в трех точках (xt-,yt-), г = 1,2,3. Тогда х3 + ах + Ь — (рх -f q) = (х — х:) (ж — х2) (х — х3). В частности, если х = а — один из корней многочлена х3+ах+Ь, то учитывая, что a3 + аа + b = 0, получим (я, - а) (х2 - а) (х3 - a) = (pa + qf. Ясно также, что pa + q= yi (х2 -<*)-У2 (xi ~ а)
§ 4. ТЕОРЕМА МОРДЕЛЛА 173 Следовательно, х а=-_ 1 ^1(^2-0=)-^(^1-°)^ (42) 3 (х, - а)(х2 - а) \ х2 - х, ' В случае х, = х2 (т. е. для касательной) получаем Зх? + а Поэтому 2у Л i „\ /„. ^ \ \ 2 Если воспользоваться тем, что у2 = (х, - а) (х2 - с*2) (х3 - а3)> а + а2 + а3 = 0| aa2a3 = — b и a3 4- аа 4 Ь = О, то (4.3) можно привести к виду х2 - a - 2ax, - 2a2 2^ (4.4) Теперь мы готовы доказать коммутативность изображенной выше диаграммы. В группе Q(a)/Q(a)2 все неединичные элементы имеют порядок 2. Поэтому формула (4.2) показывает, что если точкам Р и Q соответствуют классы А, В € Q(a)/Q(a)2, то точке P+Q соответствует класс АВ. Из формулы (4.4) вытекает, что точке 2Р соответствует единичный класс Е. Это утверждение можно обратить: если точка Q соответствует единичному классу, то Q = 2Р. При доказательстве мы ограничимся лишь случаем, когда элементы 1,а и а2 линейно независимы над <Q>. Пусть х — а — (и0 + и,а + и2а2)2 = = Ид 4 2и0и,а 4 (и2 4 2и0и{)а2 4 2щи2а3 4 w2a4 = = («о — 2bulu2) 4 (2и0и1 — 2аи{и2 — ftw2) 4- 4 (и2 4 2и0и2 — aw2,) a2-
174 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ Тогда а) Ид — 2bu{u2 = х, б) 2и0и{ — 2аихи2 — Ьи^ = — 1, в) и2{ + 2и0и2 — aul = 0. Умножим б) и в) соответственно на — и2 и и, и сложим полученные равенства. В результате получим и3{ + аихг^ + bu^ = и2. А так как и2 Ф 0, то и\ Ui\3 + a[^)+b, и 1 т. е. точка Р = (х',у'), где х' = — и у' = —, лежит на рассма- и2 и2 триваемои кривой. Докажем, что Q = 2Р. Из соотношения в) вытекает, что х' + 2и0у' — а = 0, CL — X 1 X поэтому и0 = /—. Кроме того, и2 = —, и, = х'и2 = —. Следовательно, У У У п JL I CL Ju In и0 + и.а + иЖ = —— (- — а + —. а = 2у' у1 у1 х'2-а- 2ах' - 2а2 2у> В силу (4.4) отсюда вытекает, что Q = 2Р. Таким образом, если точки Р nQ соответствуют одному классу, то Р+Q соответствует классу Е, поэтому существует такая точка R, что P + Q = 2R. Этим завершается доказательство коммутативности нашей диаграммы. Важно отметить, что образ группы E(Q) в <Q>(a)/Q(a)2 конечен (мы опускаем доказательство, чтобы избежать довольно длинного экскурса в теорию делимости в кольцах целых алгебраических чисел). Отсюда следует, что рациональные точки нашей кривой попадают в конечное число классов Q(a)/Q(a)2. Пусть представителями этих классов являются точки Qx,..., Qm. Возьмем произвольную рациональную точку Р0 данной кривой.
§ 4. ТЕОРЕМА МОРДЕЛЛА 175 Она попадает в один класс с некоторой точкой Qi , и поэтому р0 + Qt = 2Р,. Аналогично, Р, + 2Q{ = 2Р2. Поэтому P0 + Q. +2Qi2=2(Pl+Qi2) = 4Pr Продолжая аналогичные рассуждения, найдем, что Р0 + Qiy + 2Qi2 + ... + 2kQik+i = 2k+iPk+l. Ниже мы покажем, что для любой точки Р0 после конечного числа шагов получается точка Рд.+ 1, числители и знаменатели координат которой ограничены константой С, не зависящей от Р0. Таких точек конечное число и, стало быть, любая точка Р0 принадлежит группе, порожденной точками Qv...,Qm и еще некоторым конечным набором точек. А это и есть искомая теорема Морделла. Итак, нам осталось доказать, что указанная выше процедура построения Pfc+1 приводит к конечному множеству точек. Точку (х0, у0) кривой у2 = х3 + ах + b можно представить в виде (p/s2,t/s3), где p/s2 и t/s3 — несократимые дроби. В самом деле, пусть х0 = p/q — несократимая дробь. Тогда (У0Я2)2 = q(p3 + W + bq3) = qr, где (q, r) = (q,p3) = 1. Поэтому q = s2, r = t2 и y^ss = s2t2, т. e. у = t/s3. Так как (p, q) = 1 и(д,г)= 1, то (p, s) = 1 и (t,s) = 1. Для точки P0 = (xQ,y0) положим A0 = max(|p|,s2). Тогда *2<AJ>(l + |a| + |b|), т. e. \t\<r A3/2 \Z\ 5¾ CjAq . Аналогично, для точек Q{ ,P, и 2P, определим числа p, A, и и соответственно. Нас интересует оценка для А, через А0. Оценим сначала и>. Для удобства введем следующие обозначения координат точек: P°={72'ij' Qii = {72'73)' Pl=V^MJ' 2Pl=W'73)- При этом числа р, q, г можно считать ограниченными константой (числа s,t,u используются лишь как промежуточный результат вычислений; окончательный результат — числа xvyl,zl).
176 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ Формулу сложения точек кубической кривой можно преобразовать к следующему виду: Уу-уЛ2 _ (xix2 + а) (хх + х2) + 2Ь- 2уху2 хз — ^\ Х2 """I ] — / \2 \х\~ х2/ \х\ ~ Х2> Поэтому из равенства Р0 + Qi = 2РХ получаем s _ (рх + ar2z2) (r2x + pz2) + 2Ьг424 - 2qryz и2 (г2х — pz2)2 Числа х и z2 имеют порядок А0, z4 — порядок А^, ayz — порядок V V = ^о- Поэтому ш < с2Ад. Покажем теперь, что Тогда А^Сз^ЧсХ2. А < с г1/2А1/4 л2 ^ С4С4 л0 и поэтому Ап < сА0/2 , где с = тах(1,с^). Следовательно, для любого А0 при достаточно больших п число Ап ограничено константой с. Формулу (4.4) можно записать в виде s -а\ -(*! o„!i_^lA и2 ) \z\ z\ ) 2у, ' т. е. (s - аи2)1/2 = -?- (х2 - az\ - 2ax,z2 - 2а2z\) = 2yxzx = 60 + 6^ + 62^, (4.5) где _ и , 2 _ 4ч _ uxxzx _ ш£ e°-2yxzx{Xl~aZ^ ei""^T' Ч~ 2/i ' Выражение в левой части есть целое алгебраическое число, по- :0 + еха + е2( этому е0 + еха + е2а2 также целое алгебраическое число Лемма 2. Пусть е^+еха+е2а2 — целое алгебраическое число, причем е{£ Qu сг+аа+Ь = 0. Тогда е{А € Z, где Д — дискриминант многочлена х3 + ах + Ъ.
§ 4. ТЕОРЕМА МОРДЕЛЛА 177 Доказательство. Пусть а{,а2,а3 — корни многочлена х3 + ах 4 b и o-j, <т2, <т3 — автоморфизмы поля С, переводящие а в а{,а2,а3 соответственно. Для j £ Q(oc) определим след tr(7), полагая Ит) = aib) + °гЬ) + азЬ)- При этом tr(7) £ Q и если 7 — целое алгебраическое число, то tr(7)GZ. Умножим равенство j = е0 4- е,а + е2а2 на а и а2, а затем возьмем след: tr (7) = Зе0 + е, tr (a) + е2 tr (а2), tr (07) = е0 tr (а) + в[ tr (а2) + е2 tr (а3), tr (а27) = е0 tr (а2) 4- е, tr (а3) + е2 tr (а4). Эти три равенства можно рассмотреть как систему уравнений с целочисленными коэффициентами для е0,е1;е2. Определитель этой системы равен 3 а{ + а2 + а3 а2 + «2 + аз а, 4- ос2 4- а3 а2 4- а\ 4- а2 а3 + а\ 4- а^ = 1 1 «1 «2 2 2 «1 «2 а2 4 а2 4 а2 af 4 а3 4 а3 а4 4 а4 4 а4 1 аз а2 = 1 а, а2 1 а2 а2 1 а3 < *2 (а, - а2)2(а{ - а3)2(а2 - а3)2 = A. D Итак, числа (2е0 - ае2)А = UL y{z ■х2 и -е2А иА Це- Vi лые. Так как -\ и Чг — несократимые дроби, то число иА также целое. В самом деле, если бы эта дробь была несократима и в ее знаменатель входил бы делитель у{ (соответственно, z{), то он не мог бы сократиться с z\ (соответственно, ж2). Следовательно, х\ и z\ являются делителями чисел (2е0 - ае2)А и -е2А соответственно. Написав равенство (4.5) для чисел а{,а2 и а3, мы получим, что (2е0 -ае,)Ди е2А линейно выражаются через (з - а-и2)1/2, г = 1,2,3, а значит, имеют порядок ы1/2. Итак, мы
178 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ показали, что А, ^ с,А0' и, тем самым, установили конечность множества точек Р^+\, что и требовалось. § 5. Ранг и группа кручения эллиптической кривой Согласно результатам предыдущего параграфа группа E(Q) рациональных точек эллиптической кривой, определенной над полем Q, является конечнопорожденной абелевой группой. Как любая конечнопорожденная абелева группа, E(Q) допускает следующее разложение: E(Q) = ZrE xTorsE(Q), где гЕ — ранг группы E(Q), a Tors.E(<Q>) — подгруппа элементов конечного порядка в E(Q). Число гЕ называется рангом эллиптической кривой Е, а подгруппа Tors.E(<Q>) — группой кручения этой эллиптической кривой. Можно показать, что ранг эллиптической кривой сохраняется при бирациональных преобразованиях. Ранг гЕ вычислен для многих эллиптических кривых над Q. В большинстве случаев он очень мал: чаще всего он равен 0, 1, 2 или 3. В качестве иллюстрации, в табл. 1 и 2 мы приведем значения рангов кривых у2 = х3 + ах и у2 = х3 +а для некоторых значений а [Б31]. Табл. 1. Ранги эллиптических кривых Е, задаваемых уравнениями у2 = х3 + ах Ранг гЕ = 0 гЕ=\ гЕ = 2 гЕ = 3 Значение параметра а а= 1, 2, 4, 6, 7, 10, 11, 12, 22, -1, -3, -4, -8, -9, -11, -13, -18, -19 а = 3, 5, 8, 9, 13, 15, 18, 19, 20, -2,-5, -6, -7, -10, -12, -14, -15, -20 а= 14, 33, 34, 39, 46, -17, -56, -65, -77 а = -82
§ 5. РАНГ И ГРУППА КРУЧЕНИЯ ЭЛЛИПТИЧЕСКОЙ КРИВОЙ 179 Табл.2. Ранги эллиптических кривых Е, задаваемых уравнениями у2 = I3 + а Ранг гЕ = 0 тЕ=\ гЕ = 2 гЕ = 3 Значение параметра а а= 1, 4, 6, 7, 13, 14, 16, 20, 21, -1, -3, -5, -6, -8, -9, -10, -14, -432 а = 2, 3, 5, 8, 9, 10, 11, 12, 18, -2, -4, -7, -13, -15, -18, -19, -20, -21 а= 15, 17, 24, 37, 43, -11, -26, -39, -47 а= 113, 141, 316, 346, 359, -174, -307, -362 До сих пор неизвестно, существуют ли эллиптические кривые сколь угодно большого ранга. В 1986 г. французскому математику Местру удалось построить примеры эллиптических кривых всех рангов от 3 до 14 включительно. Например, кривая у2 + 9767у = х3 + 3576х2 + 425х - 2412 имеет ранг rE ^ 9, а кривая у2 + 357573631 у = х3 + 2597055х2 - 549082х - 19608054 имеет ранг rE ^ 14. Одна из наиболее знаменитых гипотез в современной теории чисел связывает число гЕ с порядком нуля в s = 1 некоторой аналитической функции, соответствующей кривой Е. Эта гипотеза была сформулирована в 1965 г. английскими математиками Бёр- чем и Суиннертон-Дайером. Перед тем, как обратится к ней, нам нужно ввести некоторые новые понятия. Пусть у2 = х3 + ах -f Ь — некоторая эллиптическая кривая, причем Д = -(4а3 + 27Ь2)^0. Как уже указывалось в предыдущем параграфе, без ограничения общности мы можем считать, что а и b — целые числа. Пусть р — некоторое простое число. Рассмотрим сравнение у2 = х3 -f ах 4- b (mod р),
180 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ или, что эквивалентно, уравнение у2 = х3 + ах + Ъ, a,b£Z/pZ = Fp. (5.1) Если простое число р не делит дискриминант Д, то уравнение (5.1) определяет эллиптическую кривую Е над полем F . В этом случае говорят, что кривая Е имеет хорошую редукцию. Кривую Е называют редукцией кривой Е по модулю р. Обозначим через N число точек кривой Ер с координатами в Fp, включая бесконечно удаленную точку. Например, уравнение у2 = х3 -f Зх, рассматриваемое над полем Fs, имеет решения (0,0), (1,±2), (2,±2), (3,±1), (4,±1), оо и поэтому N5 = 10. Что можно сказать о числе ./V для произвольной кривой у2 = х3 + ах + b над полем F ? Любая такая кривая содержит по меньшей мере бесконечно удаленную точку. С другой стороны, каждый элемент х из F дает не более двух значений у, поэтому, с учетом бесконечно удаленной точки, число N не превышает 2р+ 1. Таким образом, имеют место очевидные неравенства 1 ^Np^2p+l. Эти неравенства можно переписать в следующем виде: |р+1-лд<Р. В 1934 г. немецкий математик Г. Хассе получил более точную оценку [В20]: |Р+1-лд<2^. Отправляясь от чисел N , определим так называемую L-функцию рациональной эллиптической кривой Е, полагая ЦЕ,*) = Ц(- L_J) Ijf- * ,_Д (5.2) где а = р + 1 - N и А — дискриминант данной кривой.
§ 5. РАНГ И ГРУППА КРУЧЕНИЯ ЭЛЛИПТИЧЕСКОЙ КРИВОЙ 181 Из оценки Хассе можно без труда показать, что указанное бесконечное произведение сходится при Re s > 3/2. Существует гипотеза, что функция L(E, s) может быть аналитически продолжена на всю комплексную плоскость. Гипотеза 1 (Хассе — Вейль). Для любой эллиптической кривой Е, определенной над Q, существует такое положительное целое число N и знак е = ±1, что модифицированная L-функция А{Е, s) = Ns/2(2n)-s T(s) L(E, s), где через T(s) обозначена Г-функция Эйлера, удовлетворяет функциональному уравнению A(E,s) = -eA(E,2~s). Несмотря на огромные усилия многих первоклассных математиков, эта гипотеза до лета 1993 г. была доказана лишь в некоторых частных случаях. В июне 1993 г. произошло знаменательное событие — американский математик А. Уайлс анонсировал доказательство гипотезы Таниямы для полустабильных эллиптических кривых, из которой, в свою очередь, вытекает гипотеза Хассе — Вейля. Мы рассмотрим гипотезу Таниямы в следующем параграфе в связи с доказательством последней теоремы Ферма. Используя обширный эмпирический материал о кривых вида у2 = х3 + ах и у2 = х3 4- а и предположив, что L(E, s) может быть продолжена на всю комплексную плоскость, Бёрч и Суиннертон- Дайер пришли к следующей гипотезе. Гипотеза 2 (Бёрч, Суиннертон-Дайер). Пусть Е — определенная над Q эллиптическая кривая. Тогда ее ранг гЕ равен порядку нуля функции Z(E' S)=U 1 * .-2, (5-3) в точке s = 1. Это предположение, так же как и гипотеза Хассе — Вейля, вытекает из гипотезы Таниямы. Займемся теперь группой кручения Torsi?(<Q>). Чтобы проиллюстрировать встречающиеся здесь возможности, вычислим
182 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ группу кручения для семейства кривых у2 = х3 + ах. Без ограничения общности мы можем считать, что а — ненулевое целое число, свободное от четвертых степеней. В самом деле, при подстановке х »-> q2x, у i-> q3y уравнение у2 = х3 + ах преобразуется к виду ^=^+{£)*)• Теорема 3. Пусть Е — эллиптическая кривая, задаваемая уравнением у2 = х3 + ах, где а — свободное от четвертых степеней целое число. Тогда {Z/2 0 Z/2, если -а = т2, m € N, аф 4; Z/4, если а = 4; Z/2, в остальных случаях. Доказательство. Найдем среди точек E(Q) точки порядка 2. Все они имеют вид (х,0), где х — корень кубического уравнения х3 + ах = 0. Таким образом, три точки порядка 2 существуют тогда и только тогда, когда -а = т2, т € N. При этом точка (0,0) всегда является точкой второго порядка. Обратимся теперь к точкам четвертого порядка. Пусть (х0,у0) одна из таких точек. Тогда 2(х0,у0)— точка второго порядка. Имеется две возможности. Либо 2(х0,у0) = (0,0), либо 2(хо'%) = (±п»,0). В первом случае существует прямая L, задаваемая уравнением у = Хх, проходящая через (0,0) и касающаяся кривой Е в точке (х,у). Поэтому уравнение (Ах)2 = х3 + ах, (5.3) имеет однократный корень 0 и двукратный х0. Уравнение (5.3) преобразуется к виду х (х2 - А2х + а) = 0. Так как прямая L касается Е в точке (х0, у0), то квадратное уравнение х2 — А2х + + а = 0 имеет двукратный корень х0, т. е. его дискриминант А4 — 4а равен нулю. Поскольку число а свободно от четвертых степеней, уравнение А4 — 4а = 0 имеет рациональное решение только при а = 4. В этом случае точками четвертого порядка, удовлетворяющими уравнению 2(х, у) = (0,0), будут точки (2,4) и (2,-4). Во втором случае, который имеет место только тогда, когда выполнено равенство -a = т2, т е N, существует прямая L,
§ 5. РАНГ И ГРУППА КРУЧЕНИЯ ЭЛЛИПТИЧЕСКОЙ КРИВОЙ 183 задаваемая уравнением у = А (х ± т), проходящая через точку (=Fm,0) и касающаяся кривой Е в точке (х0,у0). Уравнение (А (х ± т))2 = х3 + ах преобразуется к виду (х ± т) (ж2 — (А2 ± ±m)i^ mA2) = 0. Так как прямая L касается кривой Е, то дискриминант квадратного трехчлена ж2 — (A2±m)x^mA2 равен нулю. То есть А4 ± 6А2т + т2 = 0. (5.4) Из полученного уравнения следует, что т = А2(±3 ± 2\/2). В силу этого, соотношение (5.4) не может быть выполнено при т в N и А е Q. При помощи аналогичных рассуждений можно показать, что на кривой Е при а = 4 не существует рациональных точек, удовлетворяющих уравнению 2(х,у) = (2, ±4). Отсюда следует, что точки с порядками равными 2к, к £ G N, образуют, в зависимости от числа а, подгруппы Z/2 ф Z/2, Z/4 и Z/2. Таким образом, для доказательства теоремы остается показать, что в E(Q) не существует точек нечетного порядка. Доказательство этого факта мы приведем от противного. Предположим, что в E(Q) имеется точка Р Ф 0, для которой ЪР = 0, т. е. 2Р = —Р. Тогда касательная прямая у = Хх + /3 к кривой Е в точке Р, будучи подставленной в уравнение у2 = = х3 + ах должна давать полный куб, т. е. должно выполняться уравнение 0 = х3 + ах-(Аж + /3)2 = (х-г)3, (5.5) где г — первая координата точки Р. Раскрывая скобки в соотношении (5.5), получаем 0 = х3 - Х2х2 + (а- 2/ЗА) х - {З2 = х3 - Ъгх2 + Зг2х - г3, откуда Зг = А2, г3 = /З2, что дает соотношение /З2 = А6/27. Кроме того, третье соотношение между коэффициентами Зг2 = а - 2/ЗА приводит к равенству невозможному при рациональных а и А. □
184 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ Подобным образом, можно показать, что если Е — эллиптическая кривая, задаваемая уравнением у2 = х3 + а, где а — свободное от шестых степеней число, то ' Z/6Z, если а= 1; ^ _._. Z/3Z, если а = ±m2, т е N, а ^ 1, а ^ -432; Tors E(<Q) = < , Z/2, если а = ±тл, т е Z, а ф 1; . О, в остальных случаях. Структуру группы Torsi?(Q) для кривых в форме Вейер- штрасса у2 = /(х) с целыми коэффициентами во многом проясняет следующее утверждение. Теорема 4. Пусть Е — эллиптическая кривая у2 = = f(x), где /(х) = х3 + ах2 + Ьх + с — многочлен третьей степени с целыми коэффициентами. Если (х, у) — точка конечного порядка в Е, то х, у £ Z и у делит дискриминант А жногочлена /(х). Из этой теоремы вытекает эффективный вычислительный алгоритм для нахождения группы Tors E(<Q) эллиптической кривой у2 = х3 + ах2 + Ьх + с, a,b,c £ Z. Рассмотрим конечное множество всех делителей у0 дискриминанта А = 18а2Ь2 - 4а3с + I8abc - 4Ь3 - 27с2 и найдем все целочисленные решения х0 кубического уравнения х3 + ах2 + Ьх + с - yl = 0. Тогда все точки конечного порядка, не равные нулю, содержатся среди найденного множества точек {(х0, у0)}. В 1976 г. американский математик Б. Мазур [В11] доказал удивительную теорему о структуре групп кручения эллиптических кривых. Теорема 5. Пусть Е — произвольная эллиптическая кривая, определенная над полем рациональных чисел Q. Тогда Tors i?(Q) изоморфна одной из следующих пятнадцати групп: Z/mZ при т ^ 10 или т = 12, Z/2Z © е Z/2mZ при т < 4. В следующей ниже таблице приведены примеры рациональных эллиптических кривых, для которых реализуются эти группы кручения.
§ 6. ГИПОТЕЗА ТАНИЯМЫ И ПОСЛЕДНЯЯ ТЕОРЕМА ФЕРМА 185 Т а б л. 3. Примеры групп кручения эллиптических кривых Эллиптическая кривая Е у2 = х3 + 2 у2 = х3 + 8 у2 = х3 + 4 у2 = хг + Ах у2 + у = х3 — X2 у2 = х3 + 1 у2 — ху + 2у = х3 + 2х2 у2 + 1ху — 6у = х3 — 6х2 у2 + Зху + 6у = х3 + 6х2 у2 — 1ху — 36у = х3 — 18х2 у2 + 43ху-210у = х3-210х2 у2 = х3 — X у2 = х3 + 5х2 + 4х у2 + Ъху — 6у = х3 - Зх2 у2 = х3 + 337х2 + 20736х Группа Tors E(Q) 0 Z/2 Z/3 Z/4 Z/5 Z/6 Z/7 Z/8 Z/9 Z/10 Z/12 Z/2 e Z/2 Z/2 e Z/4 z/2 e z/6 Z/2 e Z/8 § 6. Гипотеза Таниямы и последняя теорема Ферма Во введении к настоящей главе мы процитировали замечание Пьера Ферма о невозможности представить целое число, являющееся степенью большей двух, в виде суммы двух таких же степеней. Этот текст на латыни, следующий за указанием «Наблюдение господина де Ферма», находится в издании трудов Ди-
186 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ офанта, которое было выпущено Ферма-сыном в 1670 году через пять лет после смерти его отца. Оно доподлинно воспроизводит замечание, внесенное Ферма в его собственный экземпляр сочинений Диофанта, в настоящее время утраченный. Ферма утверждал, что уравнение ап + Ъп = сп не имеет целочисленных решений с abc ф 0. Это утверждение называется последней (или великой) теоремой Ферма. За триста лет оно было проверено для всех п < 150000, но до последнего времени в общем случае оставалось не доказанным. В этом параграфе мы опишем подход к доказательству теоремы Ферма, основанный на теории эллиптических кривых. История взаимосвязи между последней теоремы Ферма и эллиптическими кривыми начинается в 1955 году, когда японский математик Ютака Танияма (1927-1958) сформулировал проблему, представляющую собой несколько ослабленную версию следующей гипотезы. Гипотеза 1 (Танияма). Любая эллиптическая кривая, определенная над полем рациональных чисел, является модулярной. В такой форме гипотеза Таниямы появилась в начале шестидесятых годов в работах японца Горо Шимуры. В последующие годы Шимурой и французским математиком Андрэ Вейлем была показана фундаментальная связь гипотезы Таниямы со многими разделами арифметики эллиптических кривых. На рубеже шестидесятых и семидесятых годов французский математик Ив Эллегарш сопоставил с уравнением Ферма ап + bn = сп эллиптическую кривую у2 = х(х-ап)(х-сп) (6.1) и использовал известные к тому времени результаты, касающиеся теоремы Ферма, для изучения точек конечного порядка на эллиптических кривых. Дальнейшее развитие событий показало, что сопоставление ЭЛЛИПТИЧЕСКАЯ КРИВАЯ у2 = х(х - ап)(х - сп) УРАВНЕНИЕ ФЕРМА ап + Ьп=сп
§ 6. ГИПОТЕЗА ТАНИЯМЫ И ПОСЛЕДНЯЯ ТЕОРЕМА ФЕРМА 187 является поистине революционным. В 1985 г. немецкий математик Герхард Фрей предположил, что эллиптическая кривая, соответствующая контрпримеру к теореме Ферма, не может быть модулярной (в противоречие с гипотезой Таниямы). Самому Фрею не удалось доказать это утверждение, однако вскоре доказательство было получено американским математиком Кеннетом Рибе- том. Другими словами, Рибет показал, что последняя теорема Ферма является следствием, гипотезы Таниямы. 23 июня 1993 г. математик из Принстона Эндрю Уайлс, выступая на конференции по теории чисел в Кембридже (Великобритания), анонсировал доказательство гипотезы Таниямы для широкого класса эллиптических кривых (так называемых полустабильных кривых), в который, в частности, входят все кривые вида (6.1). Тем самым он заявил, что доказал последнюю теорему Ферма. Дальнейшие события развивались довольно драматически. В начале декабря 1993 г. за несколько дней до того, как рукопись работы Уайлса должна была пойти в печать, в его доказательстве были обнаружены пробелы. Исправление их заняло свыше года. Текст с доказательством гипотезы Таниямы, написанный Уайлсом в сотрудничестве с Тейлором, вышел в свет летом 1995 года [В17, В19]. В рамках нашей небольшой книги мы не имеем возможности сколь-нибудь подробно обсудить гипотезу Таниямы и привести ее доказательство. Поэтому мы ограничимся тем, что сформулируем все основные понятия, относящиеся к гипотезе Таниямы, и покажем, как из этой гипотезы вытекает последняя теорема Ферма. Начнем с понятия модулярности. Пусть Н — верхняя комплексная полуплоскость # = {zeC|Imz>0}. Для натурального числа N определим группу матриц T0(N), полагая Г0<^={(с d)e5L2(Z)'|C = 0(m°diV)}- Группа T0(N) действует на Я с помощью дробно-линейных преобразований -=^ И^Н<">, г с Я.
188 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ Нетрудно показать, что факторпространство H/T0(N) является некомпактной римановой поверхностью. Мы хотели бы пополнить эту поверхность, т. е. превратить ее в компактную. Напомним, прежде всего, что группа, действующая на множестве, разбивает это множество на классы эквивалентности: две точки лежат в одном классе, если существует элемент из группы, переводящий одну из этих точек в другую. В частности, если G — подгруппа в SL2(Z), то мы говорим, что две точки тх,т2 £ Н являются G-эквивалентными, если существует такой элемент д £ G, что т2 = дт{. _ Обозначим через Н множество Н U {сю} U Q, где Н — верхняя полуплоскость. Это означает, что мы добавляем к Н бесконечную точку (которую можно представить себе как точку, находящуюся очень высоко на мнимой оси), а также все рациональные точки на вещественной оси. Точки {oo}U<Q> называются параболическими. Легко видеть, что группа SL2(b) транзитивно действует на параболических точках. В самом деле, запишем некоторое рациональное число в виде дроби а/с со взаимно простыми а и с. Мы можем найти Ь и d из уравнения ad — be = 1 и построить матрицу (а , J е SL2(Z). Эта матрица переводит сю в а/с. Следовательно, все рациональные числа попадают в тот же класс 5Ь2(2)-эквивалентности, что и сю. Подгруппа T0(N) также переставляет параболические точки, но уже не транзитивно. Это означает, что множество параболических точек {сю} и Q разбивается больше чем на один класс эквивалентности. Например, если р — простое число, то Г0(р) имеет две параболические точки сю и 0, в то же время Г0(р2) имеет р+ 1 параболическую точку сю, 0 и ——, где к = 1,.. .,р— 1. кр Обычная топология на Н продолжается на множество Н следующим образом. Фундаментальную систему окрестностей точки сю составляют множества Uc = {т G Н \ Im т > С} U {сю} для всех С > 0. Рассмотрим теперь параболическую точку а/с £ Q с Я. Дополним пару чисел а, с до матрицы Не bd)£SL^- С помощью отображения д переведем окрестность Uc в круги, касающиеся вещественной оси в точке а/с. Эти круги образу-
§ 6. ГИПОТЕЗА ТАНИЯМЫ И ПОСЛЕДНЯЯ ТЕОРЕМА ФЕРМА 189 ют фундаментальную систему открытых окрестностей точки а/с. Другими словами, последовательность т- сходится в этой топологии к а/с тогда и только тогда, когда последовательность чисел 1т<7-1(т.) сходится в обычной топологии к бесконечности. Положим X0(N) = H/V0(N). можно показать, что X0(N) — компактная риманова поверхность. Ее род задается формулой д = g(X0(N)) = 1 + L(N) - L2(N) - L3(N) - L^N), (6.2) где М(ЛГ) 3, если N = 2, P\N P если N > 2; М2(ЛГ) О, если N = 0 (mod 4), в противном случае; P|JV4 ч р Мз(ЛГ) ( 0, если N = 0 (mod 2) или N = 0 (mod 9), N Т7 I 1 4- ( — ) ), в противном случае; p\N dliV v v В этих формулах мы подразумеваем, что </?(1) = 1, и символ Лежандра, т. е. -1_ Р -3 Р 0, если р = 2, 1, если р = 1 (mod 4), k—1, если р = 3 (mod 4); 0, если р = 3, 1, если р = 1 (mod3), .-1, если р = 2 (mod3).
190 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ При малых N род д = g(X0(N)) представлен в следующей таблице: Табл. 1 N 9 N 9 1 ... 10 0 20 1 11 1 21 1 12 0 22 2 13 0 23 2 14 1 24 1 15 1 25 0 16 0 26 2 17 ■1 27 1 18 0 28 2 19 1 29 2 Выше мы отмечали, что любая эллиптическая кривая является римановой поверхностью рода 1. Назовем эллиптическую кривую Е модулярной, если для некоторого натурального числа N существует голоморфное отображение из X^N) на Е. Еще одно понятие, с которым мы встречаемся при выводе последней теоремы Ферма из гипотезы Таниямы, — это полустабильные кривые. Пусть Е — некоторая эллиптическая кривая, заданная уравнением у2 = х3 + ах + Ь, (6.3) в котором а и b — целые числа. Как и в предыдущем параграфе, для простого числа р обозначим через Е редукцию кривой Е по модулю р, т. е. кривую у2 = х3 + ах + Ь, a,b£ Z/pZ = ¥р , Рассмотрим те простые числа р, которые делят дискриминант А = — (4а3 + 27Ь2) кривой (т. е. те р, для которых редукция Е не является эллиптической кривой над соответствующим полем F ). Для таких р многочлен х3 + ах + Ь имеет кратный корень и, следовательно, кривая Е содержит особую точку. Если кратность корня равна двум, то через эту точку проходят две различные касательные к Е если же кратность равна трем, то имеются две совпадающие касательные. В первом случае особая точка называется точкой самопересечения, а во втором — точкой возврата.
§ 6. ГИПОТЕЗА ТАНИЯМЫ И ПОСЛЕДНЯЯ ТЕОРЕМА ФЕРМА 191 Стоит отметить, что точно так же можно классифицировать особые точки редукций и для эллиптических кривых, заданных уравнениями вида у2 + а{ху + а3 = х3 + а2х2 + а4х 4- а6. с целыми коэффициентами, поскольку подходящими заменами переменных х = и2х' + г, у = и3у' + su2x' +t, и, г, s,t € Q, эти уравнения преобразуются к уравнениям вида (6.3) (см. § 4 гл. 1). Эллиптическая кривая Е над полем Q называется полустабильной, если для всех простых р ее редукции Е не имеют особых точек возврата. Теперь мы в состоянии точно сформулировать утверждение, доказанное Эндрю Уайлсом. Гипотеза 2 (Гипотеза Таниямы для полустабильных кривых). Всякая полу стабильная эллиптическая кривая, определенная над полем рациональных чисел, является модулярной. Вернемся вновь к определению модулярности. Можно доказать, что фигурирующее в нем натуральное число N — это так называемый кондуктор эллиптической кривой. Он является делителем ее дискриминанта и для произвольной кривой определяется довольно сложно. В случае же полустабильных эллиптических кривых нетрудно получить его полное описание. Начнем с нескольких вспомогательных замечаний. Пусть г — некоторое рациональное и р — простое число. Ес- и ли г ф 0, представим его в виде г = рп—, где и, v € Ъ и (и,р) = = (v,p) = 1. Положим v \г\р = р-п, гфО; |0|р=1. Число \т\ называется р-адической нормой числа г и обладает следующими свойствами: 1) |г + я|р<тах{|г|р, |я|р}, 2) Нр = |г|р|я|р. Скажем, что число г £ Q является р-целым, если \r\ ^ 1.
192 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ Рассмотрим теперь некоторую эллиптическую кривую. Уравнение такой кривой можно записать в виде у2 + а,у + а3у = х3 + а2х + а4х + а6, (6.4) откуда линейными заменами получается форма Вейерштрасса. Прямые вычисления показывают, что дискриминант кривой (6.4) равен А = -Ъ22Ъ& - 8Ь3 - Ш\ + 9Ь2Ь4Ь61 (6.5) где Ь2 = а, + 4а2, Ь4 = 2а4 + aia3, b6 = а3 -f 4а6, Ь& = а^& + 4а2а6 — а{а3а^ + (¾¾ ~~ а4- В частности, замена переменных приводит уравнение (6.4) к виду у2 = х3 - 27с4х - 54с6, (6.6) где с4 = Ь\ - 27Ь4, с6 = —Ь\ + 36й2Ь4 - 216Ь6. Для дискриминанта кривой (6.6) имеет место соотношение 1728А = с3-с2. (6.7) Назовем уравнение (6.4) с целыми коэффициентами минимальным для простого числа р, если р-адическая норма |Д| дискриминанта (6.5) не возрастает при заменах переменных x = u2x' + r, y = u3y' + su2x' + t, u,r,s,t€<Q, (6.8) обладающих тем свойством, что новые коэффициенты в уравнении кривой являются р-целыми. Уравнение (6.4) называется уравнением эллиптической кривой в глобально минимальной форме, если оно минимально для всех простых и его коэффициенты — целые числа. Можно показать, что для любой эллиптической кривой над существует такая замена переменных (6.8), что результирующее уравнение является глобально минимальным. Мы не станем доказывать это утверждение. Вместо этого мы покажем, как можно
§ 6. ГИПОТЕЗА ТАНИЯМЫ И ПОСЛЕДНЯЯ ТЕОРЕМА ФЕРМА 193 конструктивно достичь минимальности одновременно для всех простых р > 3. Лемма 1. Пусть р — простое число и все коэффициенты а^ в уравнении (6.4) являются р-целыми. Если выполняется одно из трех неравенств |Д|р>р~12, 1<ч1р>р~4, Ыр>р~6, то уравнение (6.4) минимально для простого р. Если же р > 3, |Д| ^ р-12 и |с4| ^ р~4, то это уравнение не минимально для р. Доказательство. Предположим, что замена переменных (6.8) приводит к такой системе р-целых коэффициентов {a'j}, что 1 ^ |Д'|р > |Д|р. Прямое вычисление показывает, что и[2А' = Д, поэтому |и|р2 |Д'| = |Д| , откуда \и\ < 1. Но тогда МР <Р-1 и |д|р = н;2|д'1р<Р-12. Рассуждения для с4 и с6 аналогичны. Обратно, пусть р > 3, |Д|р ^р"12 и |с4|р ^р"4. Согласно (6.7) 1728Д = с*-с2. Так как |1728| = 1, то |с6| ^ р~6. Ранее мы отмечали, что существует замена переменных, переводящая уравнение (6.4) в уравнение (6.6): у2 = х3 - 27с4ж - 54с6 с дискриминантом Д' = 212312Д. Если мы применим к (6.6) замену переменных вида (6.8) cu = pur = s = t = Q, то в результате получим уравнение у2 = х3 - 27жс4р-4 - 54cgp-6. Поскольку |с4р"4| ^ 1, |с6р_6| ^ 1, это уравнение имеет р-це- лые коэффициенты. Его дискриминант Д" имеет р-адическую норму |Д"|р = р12|Д'|р = р12|Д|р. Следовательно, данное уравнение не было минимальным для р, что и требовалось доказать. □ Пусть Д — дискриминант полустабильной эллиптической кривой Е, заданной в глобально минимальной форме, и = Р\ ■■■Рк
194 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ — разложение модуля А на простые множители. Тогда кондуктор N кривой Е определяется формулой N = Pi...Pk. (6.9) Для того, чтобы «перебросить мостик» между гипотезой Таниямы и последней теоремой Ферма, нам необходимо переформулировать «бескоординатное» геометрическое определение модулярности в теоретико-числовых терминах. Это достигается с помощью одного из наиболее могущественных инструментов современной теории чисел: модулярных форм. Как обычно, через Н будем обозначать верхнюю комплексную полуплоскость. Пусть N — натуральное число и А; — целое число. Модулярной формой веса к для группы T0(N) называется голоморфная функция /: Н —> С, удовлетворяющая условию J(gT) = (cT + d)kf(r) (6.10) для любых g = ( J е T0(N) и г £ Я, и голоморфная во всех параболических точках. Подставив в уравнение (6.5) матрицу g = ( _ . ) £ Г0(тУ), мы получим, что /(г) = /(т+ 1) для всех т £ Н. Следовательно, функция / допускает разложение в ряд Фурье оо Дт)=Х>п<Д q = e2™, (6.11) п=0 с комплексными коэффициентами ап, причем все ап с отрицательными номерами п равны нулю, поскольку / голоморфна в параболической точке {оо}. Назовем модулярную форму / параболической, если / обращается в нуль во всех параболических точках. В частности, для параболической формы коэффициент (¾ (значение в точке {оо}) в разложении (6.11) равен нулю. Назовем параболическую форму нормализованной, если а, = 1. Пространство параболических форм веса к для группы Г0(тУ) обозначается через Sk(ro(N)). Использование буквы S традиционно: это первая буква немецкого слова spitzenform — параболическая форма.
§ 6. ГИПОТЕЗА ТАНИЯМЫ И ПОСЛЕДНЯЯ ТЕОРЕМА ФЕРМА 195 Очевидно, что d\m(Sk(ro(N))) = О для нечетных к. Можно доказать, что все пространства Sk(T0(N)) конечномерны. В дальнейшем нас будут особо интересовать параболические формы веса 2 для группы T0(N). Каждая такая форма определяет голоморфный дифференциал на римановой поверхности X0(N) = = H/T0(N), поскольку / ат + Ъ \ _ dr \cT + d) ~ (ст + df и, следовательно, /(t)g?t инвариантен относительно действия группы ro(7V) на Н. Так как пространство параболических форм S2(T0(N)) совпадает с пространством голоморфных дифференциалов на X0(N), то dim(52(r0(AT))) = g(X0(N)) = д, (6.12) где род д задается формулой (6.2). В частности (см. табл. 1), dim(S2(r0(2))) = 0. (6.12) Эта нехитрая формула и сыграет важную роль при выводе из гипотезы Таниямы последней теоремы Ферма. Для фиксированного N на пространстве S2(T0(N)) имеется семейство линейных операторов Тт: 52(Г0(ЛГ)) -* 52(Г0(ЛГ)), индексированных целыми числами т ^ 1. Эти операторы задаются следующим образом. Пусть оо 1(г) = ЕапЯП 71=1 — ряд Фурье параболической формы /(г) G S2(T0(N)). Тогда Tm/(r) = f;( Е danm/d>y. (6.14) ^=1 (d,N)=l d | (n,m) Операторы Tm называются операторами Гекке.
196 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ Собственной формой называется нормализованная параболическая форма /(г) е S2(T0(N)), являющаяся собственной функцией для всех операторов Гекке Тт. Из формулы (6.9) следует, что если оо — собственная форма, то Тт f = amf для всех т ^ 1. Если °° т = Т,апЯп — параболическая форма из Sk(T0(N)), то с ней можно связать L-функцию L(f,s), задаваемую при Res > к/2 + 1 рядом оо п=1 и аналитически продолженную на всю комплексную плоскость. Используя явный вид операторов Гекке (6.14), мы можем легко показать, что нормализованная собственная параболическая форма /(г) е S2(T0(N)) допускает следующее разложение в бесконечное произведение: ад,)-Д(^)-Д(^р^) (6,6) Отметим полное формальное сходство этого разложения с разложением (5.2) для L-функции L(E,s) эллиптической кривой Е. В терминах L-функции L(f,s) определение модулярности формулируется следующим образом. Эллиптическая кривая Е над полем рациональных чисел называется модулярной, если существует собственная параболическая форма /(г) = оо = Y1 апЯп € S2(T0(N)), где N — кондуктор кривой, такая что L(f7s) = L(E,s). Другими словами, эллиптическая кривая Е модулярна, ес- оо ли существует собственная модулярная форма /(г) = J2 апЯп G е S2(T0(N)), такая что «=' an = p+l-Np, (6.17)
§ 6. ГИПОТЕЗА ТАНИЯМЫ И ПОСЛЕДНЯЯ ТЕОРЕМА ФЕРМА 197 где N — число точек редукции Ер, включая бесконечно удаленную точку. Теперь мы готовы к штурму теоремы Ферма. Очевидно, что если эта теорема доказана для некоторого показателя п, то тем самым она доказана и для всех показателей, кратных п. Так как всякое целое число п > 2 делится или на 4, или на нечетное простое число, то можно поэтому ограничиться случаем, когда показатель равен либо четырем, либо нечетному простому числу. Для п = 4 элементарное доказательство теоремы Ферма было получено Эйлером. Таким образом, достаточно изучить уравнение а! + Ь1 = с1 (6.18) в котором показатель I есть нечетное простое число. Очевидно, что в уравнении (6.18) числа а, Ъ и с можно считать попарно взаимно простыми. Пусть al + bl = cl — контрпример к теореме Ферма, и пусть I ^ 5. Рассмотрим эллиптическую кривую Е, заданную уравнением у2 = х (х — а ) (ж — с ). Дискриминант этой кривой равен Д= 16 a2W, а в представлении (6.6) имеем c4=16(a2'-aV+c2'). Представим кривую Е в глобально минимальной форме и вычислим ее кондуктор N. Любое нечетное простое число р, делящее дискриминант А, делит произведение abc. Так как числа a, b и с попарно взаимно просты, то отсюда следует, что коэффициент с4 не делится на р. Поэтому в силу леммы 1 эллиптическая кривая минимальна для р. Если р | ас, то прямая проверка показывает, что (0,0) является точкой самопересечения для кривой Е . Если же р | Ь, то Е имеет точку самопересечения (а1,0). Таким образом, кондуктор N должен иметь вид М = 2аЦр, (6.19) р\ abc р нечетно
198 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ и всё что остается, это вычислить показатель а (т. е. выяснить, равен он нулю или единице). Без ограничения общности можно считать, что число с четно, поэтому а'=0 (mod 32). (6.20) Так как Ъ1 = -a1 (mod 4) и/ нечетно, то, меняя в случае необходимости местами а и Ь, мы можем считать, что а1 = 1 (mod 4). (6.21) Полагая х = АХ и у = 8Y + АХ, мы приходим к уравнению Y2 + XY = X3 + \(l -a1 -cl)X2 + -^-a!clX. (6.22) 4 16 v Сравнения (6.20) и (6.21) показывают, что коэффициенты этого уравнения целые, и поэтому оно задает глобально минимальную форму нашей эллиптической кривой. По модулю 2 уравнение (6.22) имеет вид Y2+XY = X3 или Y2 + XY = X3+X2. с особой точкой (X, Y) = (0,0). Так как ни один из многочленов Y2 + XY, Y2 + XY + Y2 не является полным квадратом, точка (0,0) есть точка самопересечения. Принимая во внимание соотношение (6.19), мы получаем, что кондуктор нашей кривой задается формулой ЛГ = Ц р. (6.23) р| abc Воспользуемся теперь следующей теоремой. Теорема 2 (Рибет). Пусть Е — эллиптическая кривая над полем Q, заданная в глобально минимальной форме и имеющая дискриминант р|Д и кондуктор N= П/р Р\А
§ 6. ГИПОТЕЗА ТАНИЯМЫ И ПОСЛЕДНЯЯ ТЕОРЕМА ФЕРМА 199 Предположим, что Е — модулярная кривая с модулярной параметризацией уровня N, заданной нормализованной параболической формой оо /(T) = 9 + 5>n<7nes2(r0(tf)). п=2 Фиксируем простое число I, и пусть Nx = - ^. (6.24) П р) \р: ep=l;l\6p J Тогда существует параболическая форма оо /l(0 = Ean9nG52(roW)) п=\ с целыми коэффициентами, такая что ап = ап (m0d/) для всех 1 ^ п < оо. Теорема Рибета сводит нахождение связей между гипотезой Таниямы и теоремой Ферма к весьма простым вычислениям. Теорема 3. Из гипотезы Таниямы для полустабильных эллиптических кривых следует последняя теорема Ферма. Доказательство. Предположим, что теорема Ферма неверна, и пусть J _L ^ J a 4- о = с — соответствующий контрпример (как и выше, здесь I — нечетное простое число, большее трех, и а, Ь, с — попарно взаимно просты). Применим теорему 2 к эллиптической кривой у2 = ж (ж - а') (ж -с'). Сравнивая формулы (6.23) и (6.24), мы видим, что TV, = 2. Следовательно, по теореме 2 найдется параболическая форма /1(г) = ХХ«л п=1
200 ГЛ. 5. АРИФМЕТИКА ЭЛЛИПТИЧЕСКИХ КРИВЫХ лежащая в 52(Г0(2)). Но в силу (6.8) — это нулевое пространство. Поэтому dn = О для всех п. В то же время о, = 1. Стало быть, сравнение an = dn (mod0 не выполняется для п = 1, и мы приходим к противоречию. □ Заметим, в заключение, что значение гипотезы Таниямы отнюдь не ограничивается ее связью с теоремой Ферма. Как уже кратко упоминалось в предыдущем параграфе, из гипотезы Таниямы вытекает гипотеза Хассе — Вейля (для эллиптических кривых над полем рациональных чисел эти гипотезы эквивалентны), а вместе с нею открываются новые горизонты в исследовании рифметики эллиптических кривых.
ГЛАВА 6 АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ В последних двух главах мы займемся алгебраическими уравнениями. Проблема решения уравнений в радикалах интересовала математиков всех времен. После того, как Тарталья и Феррари решили уравнения третьей и четвертой степени, появились надежды решить любое алгебраическое уравнение, да и сама алгебра до конца XVIII столетия развивалась как наука о решении уравнений. Эти надежды серьезно поколебали Жо- зеф Луи Лагранж и Паоло Руффини, а окончательно их развеял Нильс Хенрик Абель [А1], доказав в 1824 г. невозможность решения общего уравнения пятой степени в радикалах. Дальнейшие продвижения теория алгебраических уравнений получила в направлении трансцендентного анализа. Творцом этого направления, по-видимому, можно считать Франсуа Виета, который еще в конце XVI в., изучая проблему трисекции угла, предложил аналитический способ решения кубического уравнения х3 — За; + а = О, где а — положительное число, не превосходящее двух. Виет, рассматривая для этого уравнения подстановку а = 2 sin а, показал, что уравнению удовлетворяет величина х = 2sin(a/3). Идея Виета ждала своего развития примерно 275 лет. В 1858 г. молодой французский математик Шарль Эрмит [А 14, а], занимаясь теорией модулярных уравнений, пришел к выводу, что всякое уравнение пятой степени можно решить в модулярных эллиптических функциях. Одновременно к аналогичным результатам пришел Леопольд Кронекер, преобразовав уравнение пятой степени в модулярное уравнений шестой степени.
202 ГЛ. 6. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ § 1. Решение уравнений 3-й и 4-й степени Известно много разных способов решения в радикалах уравнений 3-й и 4-й степени. В этом параграфе мы обсудим лишь наиболее простые из них. Некоторые другие способы решения мы обсудим в § 3 и § 6. Предварительно заметим, что уравнение хп + аххп"1 + ... + ап = 0 можно привести к виду уп + ^уП-2 + . . . + Ьп = 0 а, ,_, с помощью замены у = х -\—-. Поэтому достаточно рассмотреть тг кубические уравнения вида х3 + ах + b = 0 и уравнения 4-й степени вида х4 + ах2 + Ьх + с = 0. В первую очередь рассмотрим кубические уравнения. Будем искать корни уравнения х3 + ах + Ъ = 0 (1.1) в виде х = у/р + y/q. Тогда х3 Р+д + 3\/рд(\/р+Уя) =p + q+Z\/pq: Поэтому р и q должны быть такими, чтобы выполнялись равенства Зу/pq = —а и р+ q = —Ь. Тогда р и q являются корнями уравнения 9 а t + bt - — = 0. 27 Следовательно, b j. & a" ,, ox P'9=-2±V4+27 (L2) Формула x = \fp+ уедает 9 различных значений. Чтобы получить формулу, которая дает 3 значения, можно воспользоваться соотношением у/р yfq = —а/3. Эта формула имеет вид
§ 1. РЕШЕНИЕ УРАВНЕНИЙ 3-Й И 4-Й СТЕПЕНИ 203 где р находится по формуле (1.2). При этом значение х не зависит от выбора знака перед радикалом в формуле (1.2). Легко проверить, что определенные по формуле (1.2) значения х являются корнями уравнения (1.1). Обратимся теперь к уравнениям 4-й степени. Первый способ. Попытаемся представить многочлен х* + ах2 + Ъх + с в виде разности двух квадратов. Воспользуемся для этого тем, что x4 + ax2 + bx + c = (x2 + ~ + t\ - ( 2tx2-bx+ (t2 + at-c+^- Выберем величину t так, чтобы дискриминант / а2 D = Ъ2 - 8t I t2 + at - с + — был равен нулю. Тогда х4 + ах2 + bx + c= (х2 + ~ +t) -2t(x - — Поэтому уравнение х4 + ах2 + bx + c = 0 (1.4) можно решить следующим образом. Сначала решим относительно t кубическое уравнение b2 -8t(t2 + at-c+^ J =0. Пусть t0 — один из его корней. Тогда уравнение (1.4) можно записать в виде Второй способ принадлежит Эйлеру. Пусть х4 — корни уравнения (1.4). Положим и = х{ + х2 = -(х3 + х4). Тогда х4 + ах2 +Ьх + с = (х2 —их + а) (х2 + их + /3), т. е. а+(3 — и2 = a, u(a—P) = b, а(3 = с.
204 ГЛ. 6. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ Из первого и второго уравнений получаем 1 а — т; I а + и* + 2 V и Р=\\ а+и' Подставив эти выражения в третье уравнение, получим иь + 2aui + (а2 - Ас) и2 - Ъ2 = 0. (1.5) Уравнение (1.5) является кубическим уравнением относительно и2. Решив это кубическое уравнение, найдем 6 корней уравнения (1.5). Они имеют вид ±uv ±и2, ±и3. Можно считать, что Jb i I JL а \ J d-i i | Jb п — LLn • Aj 1 ~J~ Aj i U/n у 32n i Xi Ил ) 2 4 — 2' Ju n t Jb n U»o • огда ui + u2 + u3 = 2x]. Третий способ. Рассмотрим систему уравнений f = y = 0 1 д = у2 + ay + bx + с — 0 торое уравнение можно заменить на А/+<7 = 0. Подберем А так, тобы А/ + д оказалось произведением двух линейных функций. Это означает, что кривая А/ + д — 0 представляет собой пару рямых. Так бывает тогда и только тогда, когда -А и Ъ — 2 0 1 а + Х 2 Ъ 2 а + Х 2 с = 0 (1.6) Поэтому если А0 — корень кубического уравнения (1.6), то уравнение А0/ + д = 0 распадается на два линейных уравнения, и система уравнений / = 0, А0/ + # = 0 легко решается.
§ 2. СИММЕТРИЧЕСКИЕ МНОГОЧЛЕНЫ 205 § 2. Симметрические многочлены Многочлен /(а;,,.. .,хп) называется симметрическим, ес- * - ( 1 2 ... п\ ли для любой перестановки I . .1 выполняется ра- венство ' *■ п Важнейшим примером симметрических многочленов служат элементарные симметрические многочлены сДа;,,.. -,хп), которые определяются соотношением {х-х,)...{х-хп) = хп- <уххп~х + а2хп~2 -... + (-1)Х- Таким образом, если х1,...,хп — корни многочлена хп + + а{хп~{ + ... + ап, то ^1.---.^) = (-04- Удобно считать, что <rk{xv ..., хп) = О при к > п. Теорема (Основная теорема о симметрических многочленах). Любой симметрический многочлен f{x{,..., хп) можно представить в виде многочлена g от элементарных симметрических многочленов, т. е. /(^1.---,^) = ^(^,---,^)- При этом многочлен g определен однозначно. Доказательство. Достаточно рассмотреть случай, когда многочлен / однородный. Будем говорить, что порядок члена axf1 ... хпп выше порядка члена bx\l ... %", если а{ = /Зр ... ...,ак = (Зк, ак+1 > (Зк+1 (возможно к = 0). Легко проверить следующие свойства этого порядка. 1) Наивысший член произведения двух многочленов равен произведению их наивысших членов. 2) Если ах11 ... хпп — наивысший член симметрического многочлена, то а^ ^ а2 ^ ... ^ ап. Пусть наивысший член однородного симметрического многочлена / равен ах1'... хпп. Рассмотрим многочлен а1-а2_а2-а3 _ап 1 f2 ... <Jn ■
206 ГЛ. 6. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ Согласно свойству 1) его наивысший член равен „ <*1-а2/ <*2-<*3 Та2-<*ЗЧ / «„ «пч_ «1 «п КЛ/ЛЬI VI 9 / * * * V I * * * Tl / UmL/ l . . . JLfi Потому порядок наивысшего члена у многочлена ниже, чем у многочлена /. Проделаем с многочленом /, такую же операцию, как с многочленом /, и т. д. Так как количество одночленов, порядок которых ниже порядка наивысшего члена многочлена /, конечно, то после нескольких операций получим нулевой многочлен. Это означает, что , а|-а2 а9_а3 ап , / \ / = аа,' V22 ...<тпп + ... = #(ст, ...стп). Докажем теперь единственность представления f(xv...,xn) = = 9(aii- ■ чстп)- Для этого достаточно проверить, что если д(а{,..., <тп) = 0 для любого набора х^...,хп, то д — нулевой многочлен. Пусть д — ненулевой многочлен (над полем нулевой характеристики). Тогда g(av.. .,ап) ф 0 для некоторого набора о,,...,оп. Ясно так же, что если х1,...,хп — корни многочлена хп -аххп~х +а2хп~2 - ... + (-\)пап, то а^х^ .. .,хп) = о,-. D Замечание. Если коэффициенты многочлена / целочисленные, то коэффициенты многочлена д тоже целочисленные. Основная теорема о симметрических многочленах играет важную роль в теории алгебраических уравнений по следующей причине. Пусть хх,..., хп — корни многочлена хп + аххп~х + ... ... + ап. Предположим, что некоторый многочлен f(xx,...,xn) не изменяется при любых перестановках корней. Тогда его можно представить в виде многочлена от коэффициентов а,,...,ап. Этим свойством нам придется часто пользоваться. Задачи. 1. Пусть sk(xl,..., хп) = х\ + ... + хкп. Доказать, что sk-sk_lai + sk_2a2 - ... + (-\)ккак = О
§ 3. РЕЗОЛЬВЕНТЫ ЛАГРАНЖА 207 § 3. Резольвенты Лагранжа Квадратное уравнение х2 + ах + b = 0 можно решать следующим образом. Пусть хх и х2 — корни этого уравнения. Тогда 1. х\ = 2^1 + х*>+ ^i ~ ^)1 = 2 (х1+х2) + у!(х1 -х2У • (3.1) При этом хх + х2 и {хх — х2)2 — симметрические функции корней, а значит, их можно выразить через коэффициенты а и Ь. Выражения получатся следующие: \2 (х{ — х2) = (х{ + х2) — 4х{х2 = а — 4Ь Таким образом, *' = 2 -а+\/а2-4Ъ Квадратный корень у/а2 — 4Ь имеет два значения, дающих оба корня уравнения. Аналогичный подход можно применить и к решению кубического уравнения. При этом вместо квадратных корней возникают кубические корни. Пусть а — примитивный кубический корень из единицы, т. е. а3 = 1 и а ф 1. Для корней кубического уравнения х3 + ах3 + Ьх + с = 0 формула, аналогичная формуле (3.1), выглядит следующим образом: Ху = - [(х{ + х2 + х3) + (хх + ах2 + а2х3) + (х1 + а2х2 + ах3)] = = 3(^1 + ^2 + ^3) + + (Xj + ах2 + а2х3)3 + \/(х1 + а2х2 + ах3)3 (3.2) Чтобы можно было воспользоваться этой формулой, нужно вычислить величины и = (х1 + ах2 + а2х3)3 и v = (х{ + а2х2 + + ах3)3. При любой перестановке корней величина и переходит либо в себя, либо в v. В этом легко убедиться, если в полученном после перестановки корней выражении вынести за скобку
208 ГЛ. 6. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ коэффициент ак при х{. Таким образом, u + v и uv — симметрические многочлены от ж,, х2 и х3, а значит, их можно выразить через коэффициенты кубического уравнения. После того как эти выражения получены, решение кубического уравнения сводится к решению квадратного уравнения. Такой метод решения кубического уравнения независимо предложили два французских математика, Лагранж и Вандер- монд, причем сделали это они одновременно. В 1770 г. Вандер- монд представил свою работу Парижской академии, а Лагранж, который с 1766 г. по 1787 г. жил и работал в Берлине, доложил свои результаты Берлинской академии. Работа Вандермонда «Memoire sur la resolution des equations» содержала новый подход к решению уравнений третьей и четвертой степени, а также некоторых других уравнений, в том числе уравнения хп — I = 0. Статья Вандермонда была опубликована лишь в 1774 г. За это время, в 1771 г. и в 1773 г., были опубликованы две части фундаментального сочинения Лагранжа «Reflexions sur la resolution algebrique des equations» [A6]. В нем содержались почти те же идеи, что у Вандермонда, но они были разработаны существенно более детально. Вандермонд, ознакомившись с работами Лагранжа, к этой тематике больше не возвращался. Основываясь на приведенном выше примере, введем следующее определение. Пусть хп + а{хп~1 + ... + ап— некоторый многочлен с рациональными коэффициентами, х0,.. .,£„_, — его корни. Резольвентами Лагранжа называются выражения r(x0,a) = x0 + ax{ + ... + an~lxn_v где а — корень n-ой степени из единицы. Точки а, удовлетворяющие условию ап = 1, расположены на комплексной плоскости в вершинах n-угольника, при этом точки ак расположены в вершинах правильного т-угольника, где т = п/(п, к). Поэтому Ек _ / п ПРИ k = Q (mod п), аа(0при k^O (modn). Следовательно, Г -* / , (3-3)
§ 3. РЕЗОЛЬВЕНТЫ ЛАГРАНЖА 209 Таким образом, если резольвенты Лагранжа известны, то корни уравнения можно вычислить по формулам (3.3). Лагранж предложил следующий способ вычисления резольвент, который мы рассмотрим сначала для кубического уравнения. Пусть г = х0 + + ахх + а2х2 — резольвента Лагранжа для кубического уравнения. В зависимости от порядка, в котором берутся корни х0, хх и х2, величина г принимает шесть значений г,,...,г6. Рассмотрим многочлен шестой степени g(t) = (t-rl)(t -r2).. .(t-r6). Его коэффициенты являются симметрическими многочленами от rit поэтому они являются симметрическими многочленами от х0, хх и х2, а значит, их можно выразить через коэффициенты исходного уравнения. Лагранж назвал уравнение g(t) = 0 разрешающим уравнением. Дело в том, что оно легко решается в радикалах. В самом деле, пусть г, = х0 + ах{ + а2х2 и r4 = = х0 + ах2 + а2хх. Тогда остальные значения ri равны r2 = от,, r3 = a2r,, r5 = ar4, r6 = а2т*4. Поэтому (i-r,)(i-r2)(i-r3)=i3-r3, (t-r4)(t-r5)(t-r6)=t3-rl а значит, g(t) = (t3 — r3)(t3 — rf). Таким образом, уравнение g(t) = 0 является квадратным уравнением относительно t3. Найдем разрешающее уравнение для многочлена четвертой степени. При этом в качестве корня четвертой степени из единицы удобно взять не первообразный корень а = ±г, а корень а = — 1. В этом случае резольвента принимает при перестановках корней не 4! = 24 значения, а всего лишь 24/4 = 6, причем каждое значение принимает ровно четыре раза: г, =(х0 + х{)- {х2 + х3) = -г4, г2 = (х0 + х2) - (хх + х3) = -г5, г3 = (х0 + х3) - (я, + х2) = -г6. Таким образом, g(t) = h*(t), где h(t) = (f - r2)(t2 - r\){t2 - r23). Поэтому уравнение g(t) = 0 эквивалентно уравнению h(t) = О, которое является кубическим относительно t3.
210 ГЛ. 6. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ Проводить вычисления резольвент для первообразных корней a = ±i необходимости нет. В самом деле, (х0 + х, + х2 + х3) + гх + г2 + г3 = 4х0. Для многочлена пятой степени разрешающее уравнение имеет степень 5! = 120. Пусть г = х0 + ах, + а2х2 + о?х3 + а4, где а5. Если г, — одно из значений резольвенты г, то от,, o?rv а3гх и а4г, тоже будут значениями резольвенты г. Поэтому разрешающий многочлен g(t) представляет собой многочлен 24-й степени от t5. Несмотря на значительные усилия, Лагранжу не удалось решить уравнение g(t) = 0. Этот неуспех побудил его считать, что общее уравнение пятой степени нельзя решить в радикалах. Но для тех уравнений, которые можно решить в радикалах, метод резольвент Лагранжа оказался важным способом их решения. В следующем параграфе мы воспользуемся им для решения в радикалах уравнения хп — 1 = 0. § 4. Корни из единицы Уравнение хп = 1 допускает очевидное решение в радикалах: х = vl. Но это решение неудовлетворительно по следующей причине. Поделив многочлен хп - 1 на х - 1, получим многочлен /п(х) = хп~'+хп-2 + ... + 1. Степень многочлена /п равна п— 1, поэтому формула х = \/\ дает на один корень больше, чем нужно. Для корней многочлена /п желательно получить формулу, пользуясь которой, не приходилось бы извлекать корни степени выше п— 1. В этом параграфе нас будут интересовать лишь такие формулы для корней многочлена fn. Разберем сначала несколько примеров. Формулы для корней многочленов/3(х) = х2+х+1 и /4(х) = (х+1)(х2+1) получаются элементарно, поэтому мы сразу перейдем к многочлену /5(х) = = х4 + х3 + х2 + х + 1. Положим у = х + х-1. Тогда уравнение /5(х) = 0 эквивалентно уравнению у2 + у - 1 = 0.
§ 4. КОРНИ ИЗ ЕДИНИЦЫ 211 Корни последнего уравнения вычисляются по формуле _ -1±л/5 2/i,2 - 2 а корни уравнений у{ = х + х"1 имеют вид л/5- 1±л/-2л/5- 10 —л/5 - 1 ± л/2л/5 — 10 4 4 Число а называют примитивным корнем п-й степени из единицы, если ап = 1 и ак ф 1 при fc=l,2, ...,n—1.В этом случае числа а, а2,..., ап"х попарно различны. Легко проверить, что если а и /3 — примитивные корни р-й и g-й степени из единицы, причем числа р и q взаимно просты, то а/3 — примитивный корень из единицы степени pq. Поэтому достаточно рассмотреть уравнения fm(x) = 0, где т — степень простого числа. Для уравнения f7(x) = 0 тоже можно сделать замену у = = х + х"1. В результате получим уравнение у3 + у2 - 2у - 1 = 0. Его корни получим по формуле 1/ , 3/-7 + 21v/^3 3/-7-214/^3 \ ^з = з(-1 + У б + V б )■ После этого корни уравнения /,-(а;) = 0 можно найти, решив квадратные уравнения х2 — у{х +1=0. Для многочлена /п = 0 замена у = x+x"i не приводит к желаемому результату, поскольку после такой замены получается уравнение 5-й степени, а как его решать, непонятно. Преодолеть возникающие трудности позволяет метод резольвент Лагранжа. Корнями уравнения /п(:е) = :е10 + :е9+ ... + 2+1 =0 (4.1) являются числа а, а2,..., а10 где а — один из примитивных корней 11-й степени из единицы. Степень многочлена /п равна 10, поэтому для построения его резольвенты Лагранжа нужен корень 10-й степени из единицы. Пусть /3 — примитивный корень
212 ГЛ. 6. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ 10-й степени из единицы. Упорядочим корни уравнения (4.1) так, что каждый следующий корень является квадратом предыдущего: а, а2, а4, а8, а5, а10, а9, а7, а3, а6. (4.2) Рассмотрим резольвенту Лагранжа, построенную по этой последовательности корней: г, = г(а, (3) = а + (3а2 + (32а4 + (33а8 + ... + /З8 а3 + /39а6. При замене примитивного корня /3 корнем /Зг, г = 1,..., 10, получим резольвенты Лагранжа г{ = г(а,(Зг), i = 1,..., 10. Легко проверить, что г, + r2 + ... + r10 = 10а. Поэтому искомый корень 11-й степени а будет найден, если удастся вычислить величины г,,.. .,г10. Покажем теперь, как можно вычислить величины г]°. Так как а" = 1 и /З10 = 1, то г,- можно представить в виде J] aijk(3jak, где 0 < j < 9, 0 < к < 10, а г]° можно представить в виде £ Ь^'о*, где 0 < J < 9, 0 < к < 10. При этом aijk и 6ij/k — целые неотрицательные числа. Запишем г\° как многочлен от а, причем степени а расположим в порядке (4.2): + р.3(/3)а4 + ...+р.10(/3)а6. (4.3) окажем, что г]° не зависит от а, т. е. г]° = рД/3), где рг- — многочлен с целыми коэффициентами. Легко проверить, что г(а\р) = /Г*г(а,/?*), т. е. гг(а2) = /TV^a). Поэтому r\°(a2) = = г\°(а). Таким образом, обозначив для краткости pik({3) в формуле (4.3) через рк, получим Ро + Р\а + Р2а2 + Рз°4 + Р*а* + • • • + P9q3 + Р\оа& = = Ро + Р\а2+ Р2а* + Рза* + рХ + • • • + А»"6 + Рюа-
§ 4. КОРНИ ИЗ ЕДИНИЦЫ 213 Следовательно, Можно доказать следующее утверждение. Теорема 1. Пусть р — простое число, а и (3 — примитивные корни степени р и р — 1 из единицы. Тогда из равенства qi{(3)cc + q2{(3) a2 + ... + qp_l(f3)aP-l=0, где ql,q2,...,ql —многочлены с целыми коэффициентами, следует, что ^(/3) = q2{P) = ■ ■ ■ = q {{(3) ~ 0. Такого рода независимость корней а и /3 кажется почти очевидной. Однако строгое доказательство теоремы 1 не так просто. Оно требует привлечения элементов теории Галуа. Это доказательство мы приводить не будем. Применив теорему 1 (для р = 11) к равенству 4.4, получим Р\о — Р\ = Рг = Рз = ■ ■ • = Рч- Следовательно, г\° = Р0(Р) + Р№ (а + а2 + а3 + ... + а10) = р0((3) - Pl(/J). Подведем итоги. Примитивный корень 10-й степени можно представить в виде произведения примитивных корней пятой и второй степени. Поэтому (3 можно выразить с помощью квадратных радикалов. Затем можно представить г]° в виде многочлена от (5 с целыми коэффициентами. После этого остается воспользоваться формулой Эта формула дает, правда, 100 значений, а не 10, как хотелось бы. Нужные 10 значений приходится выбирать среди полученных значений. Поэтому более удобна формула Дело в том, что величины г{г\°~г, как и величины г]°, тоже не зависят от а. Чтобы доказать это, достаточно заметить, что r^a2)r}°-V)=^4(«)(i9_1''i(a!))10",' = r.-(a!)rr",'(a!)
214 ГЛ. 6. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ Таким образом, формула (4.5) однозначно определяет а после того, как выбрано одно из десяти значений г, = 1у/г\°. Аналогичным образом можно решить и уравнение /р(х) = = 0 для любого простого числа р > 2. При решении уравнения /п(х) = 0 мы воспользовались тем, что примитивные корни 11-й степени из единицы можно упорядочить так, чтобы каждый следующий корень был квадратом предыдущего. Такое расположение корней возможно потому, что числа 2к, к = 0,1,...,9, имеют попарно различные остатки по модулю 11. Для остатков по модулю, например, 7, аналогичное утверждение неверно, но для произвольного простого числа р существует такое простое число д, что числа дк, к = 0,1,.. .,р - 2, имеют попарно различные остатки по модулю р. Иными словами, мультипликативная группа ненулевых вычетов по модулю р является циклической группой, порожденной образующей д. Доказывать это хорошо известное утверждение мы не будем. Пусть а и (3 — примитивные корни из единицы степени р и р— 1 соответственно. Если числа дк, к = 0,1,...,9, имеют попарно различные остатки по модулю р, то числа а а2 дР-1 а, ОТ, QM , . . ., QM исчерпывают все примитивные корни р-й степени из единицы. Поэтому для многочлена /р(х) можно рассмотреть резольвенту Лагранжа г{=а + (3а9 + (32а9 +... + /^"'а^"'. Положим г,- = Г[(а,/Зг). Легко проверить, что г{(а9,Рг) = = (3~1с{(а,(Зг). Следовательно, величины rf~[ и г{гр~[~г не изменяются при замене а на а9. Как и в случае р = 11, с помощью этого свойства и теоремы 1, можно доказать, что величины г[~1 и r^f г представляют собой многочлены от /3 с целыми коэффициентами. Для (3 выражение в радикалах можно получить по индукции, так как /3 — корень из единицы степени р - 1 < р. Формула для вычисления а имеет вид Эта формула дает однозначное выражение для а после того, как выбрано одно из значений г, = p_v/r1p_1.
§ 5. ТЕОРЕМА АБЕЛЯ О НЕРАЗРЕШИМОСТИ УРАВНЕНИЯ 215 § 5. Теорема Абеля о неразрешимости в радикалах общего уравнения пятой степени Работы Лагранжа побудили многих геометров, а в то время так называли всех математиков, заняться поисками доказательства неразрешимости в радикалах общего уравнения пятой степени и уравнений более высоких степеней. В 1798-1813 гг. появилось несколько работ итальянского математика Паоло Руф- фини (1765-1822). Вслед за Лагранжем он рассматривал подстановки корней уравнений и ввел при этом термин «группа перестановок». Эта серия работ [А9] увенчалась доказательством теоремы о неразрешимости в радикалах уравнений пятой и более высоких степеней. К сожалению, в этом доказательстве был существенный пробел. Руффини без основания предполагал, что радикалы рационально выражаются через корни исходного уравнения (см. теорему 4). Первое полное доказательство теоремы о неразрешимости общего уравнения пятой степени получил гениальный норвежский математик Нильс Хенрик Абель (1802-1829). Это доказательство он изложил в мемуаре «Доказательство невозможности алгебраического решения общих уравнений пятой степени», опубликованном в первом номере журнала Крелля за 1825 г. Будем говорить, что уравнение F(x) = xn + Clxn-l+... + cn = 0 является общим уравнением п-тл степени, если его коэффициенты сп .. .,сп рассматриваются как независимые переменные над некоторым полем L. В дальнейшем будем считать, что L = Q. Присоединив коэффициенты с{,...,сп к полю Q, получим поле A = Q(Cj,.. .,сп). Его называют полем рациональности данного уравнения. Присоединив к полю Д корни а{,...,ап уравнения (5.1), получим поле A(F). Его называют нормальным полем уравнения (5.1) или полем Галуа этого уравнения. Будем говорить, что уравнение (5.1) разрешимо в радикалах, если поле A(F) содержится в расширении R поля Д, полученном путем присоединения к Д некоторых радикалов р{ = = Яуа^, р2 = х/а^,..., рт = S\fa^n, где а, € Д, а2 € Д^,), аз € А(р{,р2),..., ат € А(р{,...,рт_1).
216 ГЛ. 6. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ Пример. Пусть F(x) = х2 + с{х + с2. Тогда Д = Q(cpc2) и A(F) = A (v/o|). гДе ^ = с^ - 4с2 е А. Отметим, что показатели sl,...,sv радикалов р{,р2,.. .,рт можно считать простыми числами. В самом деле, если sk = uv, skr- то присоединение радикала рк = уак можно заменить последовательным присоединением радикалов р = у/ак и р{ = Х/р. Поэтому в дальнейшем будем рассматривать лишь присоединение радикалов с простыми показателями. Предположим, что уравнение (5.1) разрешимо в радикалах. Присоединим к полю А первообразные корни из единицы £р .. -,£т, степени которых равны степеням радикалов р{,.. .,рт соответственно. Полученное поле обозначим К. Так как А с К, ToA(F)cA(pl,...,pm)cK(pl,...,pm) Для доказательства теоремы Абеля нам понадобятся некоторые вспомогательные утверждения. Теорема 1. Пусть р — простое число, к — поле нулевой характеристики. Многочлен хр — а приводим над полем к тогда и только тогда, когда а = ЬР для некоторого b Ек. Доказательство. Предположим, что хр — а = = f(x)g(x), где f(x) и д(х) — многочлены над полем к. Пусть £ — примитивный корень р-ой степени из единицы и /3 = ^/а. Тогда f(x) = хг + с{хг-[ + ... + сг = (х - eni(3) ... (х - епг(3). Поэтому ±е1/Зг = сг е к, где I = п{ + .. . + пг. А так как (ё)р = 1, то (±(Згу = (сг)р, т. е. аг = (±сг)р. Число р простое и 1 ^ г — = deg/ < р, поэтому rs + pt = 1 для некоторых чисел s и t. Следовательно, a = arsapt = (±с*аь)р = ЬР, где Ь = ±сага1 £ к. Ясно так же, что если а = ЬР, то многочлен хр — а приводим, так как он делится на х — Ъ. □ Теорема 2. Пусть s — простое число и ai € к — = K(pl:.. .,/9j_[). Если р{ = У~а{ ¢. к, то р\ G к тогда и только тогда, когда I делится на s. Доказательство. Если / = ns, то р\ = a" G к, так как a- G к. Предположим теперь, что р\■ = а € к, причем I = sq + г, где 0 < г < s. Тогда а = р\ = (а^р^, а значит, pr{ = Ь, где
§ 5. ТЕОРЕМА АБЕЛЯ О НЕРАЗРЕШИМОСТИ УРАВНЕНИЯ 217 b = 0,(0,^1. Над полем к многочлены ха — аг и xr — b имеют общий корень р{, поэтому они имеют общий делитель, степень которого не превосходит г < s. В частности, многочлен х3 — ai приводим над полем к. Из теоремы 1 следует, что ai = bs, где b G к. Ясно, что b = ер{, где е — корень степени s из единицы. А так как е G К с к, то pi G к. Получено противоречие. □ Можно считать, что pv...,pm — минимальная последовательность радикалов с простыми степенями, требуемая для вычисления корня а уравнения (5.1), т. е. любая такая последовательность содержит по крайней мере т таких радикалов. При этом условии справедливо следующее утверждение. Теорема 3. Корень а уравнения (5.1) можно представить в виде а = и0+ р+ и2р2 + ... + us_,/9s~' где s — степень радикала рт, р = \fa, где а и все щ — какие-то элементы поля к = К(р{,.. .,pm__i). Доказательство. Так как а е K(pv.. .,рт) = к(рт) и Ptn е *• то а = b0 + Vm + V4 + • • • + К-\Рт\ (5-2) где bi е к. Трудность заключается лишь в том, чтобы добиться равенства 6, = 1. По условию а £ к, поэтому хотя бы одно из чисел bi,...,ba_i отлично от нуля. Пусть fy ф 0, где 1 < / < з. Положим р = blplm. Так как число s простое, то ul + vs = 1 для некоторых целых чисел и и v. При этом ри = bfp^ = bfp\^va = = bfa~vpm, т. е. рт = сри, где с = bj~uav G к. Так как рт ¢. к, то рек. Ясно так же, что psbfpl£ = bfa1 £ к. Заменим в выражении (5.2) рт на сри, вспомнив при этом, что bipm = р. В результате получим а = Ь0 + Ъ{сри + Ъ2с2р2и +... + р+... + Ьв_1/э<*-,)м (5.3) Из теоремы следует, что рь е к тогда и только тогда, когда t делится на s. А так как числа и и s взаимно простые, то элементы l,pu,p2u,.. .,р(а~^и линейно независимы над полем к, причем набор этих элементов совпадает с набором l,p,p2,.. .,ps~i (в другом порядке). Таким образом, (5.3) дает требуемое выражение для а: a = b0 + p + b2p2 + ... + b's_[Ps-[. П
218 ГЛ. 6. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ Теорема 4. Минимальную последовательность радикалов /Эр .. -,рт для вычисления корня а многочлена (5.1) можно выбрать так, что р{,...,рт представляют собой полиномы над К от корней а,,.. .,ат многочлена (5.1). Доказательство. Будем исходить из произвольной минимальной последовательности pv...,pm. Напомним, что через К мы обозначили поле, полученное в результате присоединения к полю Д первообразных корней £,,..., ет, степени которых равны степеням радикалов /?,,.. .,рт. Согласно теореме 3 радикал рт можно заменить радикалом р той же самой степени s так, что а = и0 + р + и2р2 + ... + u3_lP3~l, где щ е k = K(pv.. .,рт_{) и ps = а €. к. Покажем, что для любого корня £ многочлена Xs — а величина a(O = u0 + t, + u2? + ... + us_^ является корнем многочлена (5.1). Подставим в многочлен F(x) = хп + с1хп~1 + ... + сп вместо х величину а(£). Учитывая, что £я = а е к, в результате получим выражение вида где Щ е к. Многочлены Xs — а и b0 + blx + ... + bs_{xs~l имеют общий корень р, поэтому они имеют общий делитель над А:. Но согласно теореме 1 многочлен Xs - а неприводим над А:, поэтому Ь0 = 6, = ... = Ь3_{ = 0. Это означает, что если £ — корень многочлена х3 - а, то а(£) — корень многочлена (5.1). Пусть е — примитивный корень степени s из единицы. Тогда £ = егр, поэтому величины аг+1 =и0 + егр + и2е2гр2 + ... + u^e^'V-1 при г = 0,1,.. .,s- 1 будут корнями многочлена (5.1). Например, для s = 3 получим а, = и0 + р + и2р2, а2 = и0 + sp + и2е2р2, а3 = и0 + е2р + и2ер2. А так как 1 + е + е2 = 0, то а{+а2+а3=3и0, а{+е~1а2+е~2а3=3р, а1+е~2а2+е~1а3=3и2р2.
§ 5. ТЕОРЕМА АБЕЛЯ О НЕРАЗРЕШИМОСТИ УРАВНЕНИЯ 219 Таким образом, р = - (а, + е2а2 + еа3). Для s > 3 формулы получаются более громоздкие, но рассуждения те же самые. Доказательство теоремы для последнего радикала рт завершено. Перейдем к радикалу рт_г Выше было показано (для s = 3), что величины uQ, р, и2р2,... .. .,us_lp3~1 полиномиально выражаются через корни а,,.. .,ат многочлена (5.1). Кроме того, они лежат в поле K(pv .. .,рт_1), поэтому каждую из указанных величин можно представить в виде "о + »\Рт-\ + v2P2m-\ + ■■■ + Ч-iPm-l> где vt € K(pv.. .,рт_2). Последовательность радикалов р,,... .. .,рт минимальна, поэтому равенства и1 = и2 = ... = vi_x = О не могут выполняться сразу для всех величин, так как иначе радикал рт_1 можно было бы исключить. Поэтому существует соотношение вида ^0 + v\Pm-\ + *V4-1 + • • • + »1-\Рт-х = r(al. • • •» an) где vt € K(pi,..., pm_2). причем не все элементы vx,..., ul_l равны нулю, a r(av .. .,ап) — некоторый многочлен над полем К. Рассмотрим многочлен G(x) = Yl (х ~ Г(а<х(1), • • •» а<т(п)))> где произведение берется по всем подстановкам а е Sn. Коэффициенты многочлена G являются симметрическими многочленами от корней многочлена (5.1), поэтому они полиномиально выражаются через коэффициенты многочлена (5.1). Таким образом, G — многочлен над К, причем он имеет корень Р = и0 + v\Pm-\ + Wm-l + ■■■ + Щ-\Рт-\ Ясно так же, что корень /3 выражается в радикалах (с помощью последовательности радикалов /?,,.. .,рт_1). Согласно теореме 3, заменив радикал рт_1 радикалом р' той же самой степени, можно добиться равенства vx = 1. К радикалу р' теперь можно применить те же самые рассуждения, которые мы применили к радикалу р. Затем переходим к радикалу рт_2 и т. д. до радикала рх. □ Теперь можно приступить непосредственно к доказательству теоремы Абеля.
220 ГЛ. 6. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ Теорема 5 (Абель). При п ^ 5 корень общего многочлена степени п нельзя выразить в радикалах. Доказательство. Предположим, что некоторый корень а{ общего многочлена степени п хп + clXn~l + с2хп~2 + ... + сп можно выразить в радикалах. Тогда согласно теоремам 1-4 для а{ существует выражение в радикалах следующего специального вида. Корень а{ получается последовательным присоединением радикалов р1,...,рт простых степеней, а эти радикалы, в свою очередь, являются полиномами от корней av.. .,ап исходного многочлена. Точнее говоря, пусть ер..., ет — примитивные корни из единицы, степени которых равны степеням радикалов 0i>--->0m-2 соответственно, A = Q(cp .. .,сп) и K = A(el,...,em) = Q(el,...,em,cl,...,cn). Тогда а, полиномиально выражается через р1,...,рт над полем К, т. е. а1 =Ф1,---,Рт,С|,.--,Сп). где г — полином над Q(e1,.. .,ет). В свою очередь, радикалы р1:...,рт полиномиально выражаются над полем К через ар...,ап, т. е. 01 =Mal.--->an'cP"->cn)> где г{ — полином над Q(ep ..., ет). Так как мы имеем дело с общим многочленом степени п, то можно считать, что ар.. .,ап — независимые переменные, а ср .. .,сп представляют собой (с точностью до знака) элементарные симметрические многочлены от ap...,an. Покажем, что при п ^ 5 предположение о разрешимости в радикалах общего алгебраического уравнения степени п приводит к противоречию. Рассмотрим для этого перестановку т_ /1 2 3 4 5 6 ... п\ \2 3 4 5 1 6 ... п)' которая циклически переставляет первые 5 элементов, а остальные элементы оставляет неподвижными. Докажем, что при действии Т на корни а1,...,ап первый радикал р1 не изменяется. Так как 01 =rl(al,...,an,cl,...,cn)= f/ap
§ 5. ТЕОРЕМА АБЕЛЯ О НЕРАЗРЕШИМОСТИ УРАВНЕНИЯ 221 где а, —многочлен от с,,...,сп над полем Q(e,,.. .,ет), то равенство р\ = а, можно рассматривать как соотношение вида <p(av...,an,cv...,cn) = 0, где у — многочлен над полем Q(e,,..., em). Покажем, что соотношение такого вида сохраняется при любой перестановке корней а,,..., ап. Пусть /3, = а^, ..., (Зп = а^, где г,,..., гп — некоторая перестановка чисел 1,2,..., п. Тогда где dj = сД/Зр ...,/Зп). А так как функции с{ симметрические, то di = Ci(<*i, ■ • ->aJ = сг- ПОЭТОМУ Итак, соотношение pvx = а, сохраняется при действии перестановки Т на корни а,,...,ап, т. е. T(pf) = Т(а1). Ясно, что Т(рР\) = Т(рх)р. А так как а, зависит лишь от симметрических функций корней, то Т(а]) = о,. Следовательно, Т(р,) = е^р, и Тт(рх) = е™АРр Но Т5 - / — тождественная перестановка, поэтому e^Vi = ^5(Pi) = Рр т- е- efА = 1. Обратимся теперь к перестановкам г/_/1 2 3 4 5 6 ... п\ VI 2 4 5 3 6 ... rj У /1 2 3 4 5 6... п\ \2 3 1 4 5 6 ... п) Легко проверить, что U3 = V3 = I, поэтому £/(/?,) — £>\Р\ и У(/9,) = e\pv причем е\^ = e\v = 1. Кроме того, VU = Т, поэтому T(p1) = VU(p1) = e?+vp1 Следовательно, еА — e^+v', а значит, е^ = е^е^ — e^v' = 1, так как е\х = е\^ = е\и = 1. В итоге получаем Т(р, ) = /?,. Переходя последовательно к радикалам р2,.. .,рт, аналогично получим Т(р{) = р{ при г = 2,.. .,т. Так как р{ = r{(av. ..,ап,с,,. ..,сп), то равенство a, =r(p,,...,pm,Cl,...,cJ
222 ГЛ. 6. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ можно рассматривать как соотношение между ах,.. .,ап,сх,... .. .,сп над полем Q(ep ..., ет). Это соотношение сохраняется под действием подстановки Т, т. е. Т(ах) = r(T(px),...,T(cn)) = r(px,..., сп), так как Т(с{) — с{ и Т(р{) — р{. Таким образом, Т(ах) — ах. С другой стороны, согласно определению Т получаем Т(ах) = а2, а значит, ах = а2. Равенство ах — а2 противоречит независимости корней общего уравнения. П § 6. Преобразование Чирнгауза. Уравнение пятой степени в форме Бринга В 1683 г. в лейпцигском журнале «Acta eruditorum» Э. В. фон Чирнгауз (1651-1708) опубликовал способ преобразования алгебраических уравнений, который, как ему казалось, позволял решить в радикалах уравнение любой степени [А12]. Лейбниц сразу же опроверг заявление Чирнгауза о всемогуществе его преобразования. Дело в том, что при решении уравнений 5-й степени с помощью преобразования Чирнгауза приходится решать уравнение 24-й степени. Несмотря на это, преобразование Чирнгауза имеет важные приложения. Например, с его помощью любое уравнение пятой степени без кратных корней можно привести к виду у5 + Ъу = а, решая при этом лишь уравнения второй и третьей степени. А в главе 2 мы покажем, что уравнения такого вида можно решать с помощью тэта-функций. Преобразование Чирнгауза уравнения хп + сххп~х + ... .. -+сп заключается в следующем. Пусть хх,..., хп — корни этого уравнения. Рассмотрим рациональную функцию ip, которая не обращается в бесконечность в точках хх,...,хп. Положим yi = = ц>(х{) и найдем уравнение уп + qxyn~x + • • • + qn = о корнями которого являются ух,..., уп. Далее мы покажем, что если это уравнение не имеет кратных корней, то xi можно выразить через у{. Выбирая подходящим образом функцию <р, можно добиться того, чтобы коэффициенты qx,.. .,9„-i стали равны нулю. Но для этого потребуется решить уравнение степени (п — 1)!; именно на это обстоятельство указал Лейбниц.
§ 6. ПРЕОБРАЗОВАНИЕ ЧИРНГАУЗА 223 Не теряя общности, в качестве рациональной функции tp можно взять многочлен степени не более п— 1. Дело в том, что справедливо следующее утверждение. Теорема 1. Пусть х{,..., хп — корни многочлена f степени п и tp = P/Q, где Р и Q — многочлены, причем Q(Xj-) ф 0, г = 1,..., п. Тогда существует многочлен g степени не более п — 1, значения которого в точках xv .. ,,хп совпадают со значениями функции tp в этих точках. Доказательство. По условию многочлены / и Q не имеют общих корней, поэтому они взаимно просты. Следовательно, существуют многочлены а и Ь, для которых af + bQ = 1. Так как /(а;,) = 0, то b(x{) = l/Q(xi). Поэтому tp(xi)=P(xi)/Q(xi) = P(xi)b(xi) Таким образом, в качестве требуемого многочлена g можно взять остаток от деления многочлена РЬ на многочлен /. □ В дальнейшем будем считать, что к уравнению f(x) = xn + c[xn-1 + ...+cn применяется преобразование У = 9(х) = Ро + Р\(х) + ■ • • + Рп-1хП~{- Покажем, как в этом случае можно вычислить коэффициенты многочлена уп + qxyn~x + ... + qn с корнями у{ = д(х{), i= 1,... ...,п. Чтобы избежать громоздких обозначений, ограничимся случаем п = 3. Если х3 = —с1х2 — с2х — с3, то ух = р0х + р{х2 + р2(-с{х2 - с2х - с3) = р'0 + р[х + р'2х2. Аналогично ух2 = $ + р"х + р2х2, причем р" — линейные функции параметров pt. Таким образом, если ж,- — корень многочлена/и yi = д(х^, то система уравнений (P0-y)zo + P\zi+P2z = 0' « Pozo + (p\-y)zi+P2z = 0' (6Л) >Pozo + P"zi+(P2-y)z = °-
224 ГЛ. 6. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ имеет ненулевое решение (z0,zvz2) = (1,хг-,а;?). Положим /Ро Pi Рг\ А = [р'о р\ Р*2 ■ Ч' P'l PV Тогда det(A — уЕ) = 0 для yi = д(х{). В том случае, когда многочлен det (Л — уЕ) не имеет кратных корней, он совпадает с искомым многочленом у11 + q{yn~l + ... + qn. Так как элементы матрицы А линейно зависят от параметров pit то коэффициент qk является многочленом степени к от параметров рг-. В том случае, когда многочлен у11 + qxyn~l + ... + qn не имеет кратных корней, матрица А не имеет кратных собственных значений. Поэтому каждому собственному значению матрицы А соответствует единственное с точностью до пропорциональности решение системы (6.1). Это означает, что по корню yi преобразованного многочлена однозначно восстанавливается корень х{ исходного многочлена, причем xi рационально выражается через yt. Преобразование Чирнгауза позволяет решить в радикалах уравнения третьей и четвертой степени. Кубическое уравнение можно привести к виду У3 + Яз = °. решив систему из линейного уравнения qx = 0 и уравнения второй степени q2 = 0, зависящих от параметров р0, pltp2- Для этого нужно решить квадратное уравнение. Уравнение четвертой степени можно привести к виду у4 + q2y2 + qi = 0. Для этого нужно решить систему из линейного уравнения q{ = 0 и уравнения третьей степени q3 = 0, что сводится к решению кубического уравнения. Уравнение пятой степени можно привести к виду У5 + q±y + % = 0, решив систему уравнений qy=q2 = q3= 0. Для этого нужно решить уравнение шестой степени. Более тонкий анализ, проведенный в 1789 г. шведским математиком Брингом, показывает, что в
§ 7. УРАВНЕНИЯ ПЯТОЙ СТЕПЕНИ, РАЗРЕШИМЫЕ В РАДИКАЛАХ 225 данном случае вместо уравнения шестой степени достаточно решить уравнения второй и третьей степени, поступив следующим образом. Чтобы удовлетворить условию q{ = О, выразим один из параметров р0,...,р4 как линейную функцию остальных параметров. Тогда коэффициент q2 будет представлять собой квадратичную форму относительно четырех из параметров р±. Эту квадратичную форму можно привести к виду 2,2 2 2 U\ + Щ — V\ — V2, где и• и v- — линейные функции от р{ (для этого понадобится извлекать квадратные корни). Чтобы удовлетворить равенству q2 = 0, достаточно решить систему линейных уравнений ui = vv и2 = v2. После этого остается два параметра, причем относительно них уравнение q3 представляет уравнение третьей степени. В итоге получаем уравнение вида у5 + q4y + q5 = 0. В том случае, когда q4 ф 0, с помощью линейной замены это уравнение можно привести к виду уь + Ъу = а. § 7. Уравнения пятой степени, разрешимые в радикалах Согласно теореме Абеля корни уравнения пятой степени в общем случае не могут быть выражены в виде алгебраических функций от своих коэффициентов. Поэтому весьма интересно найти условия на коэффициенты, при выполнении которых уравнение разрешимо в радикалах, а также получить в явном виде корни этих разрешимых уравнений. Для уравнения общего вида такие условия были найдены английским математиком А. Кэ- ли [В 10]. Ввиду сложности результата мы не станем его приводить, отсылая читателя или к мемуару самого Кэли или к учебнику Д. А. Граве [Б13], а сами ограничимся случаем, когда уравнение задано в упрощенной форме х5 + ах + Ъ = 0, (7.1) где а и b — рациональные числа и многочлен в левой части неприводим. (Для приводимого многочлена уравнение пятой степени очевидно разрешимо в радикалах, поскольку оно распадается в два уравнения степеней, не превосходящих четырех.) Чтобы описать разрешимые уравнения пятой степени (7.1), мы обобщим метод Кардано решения кубических уравнений вида
226 ГЛ. 6. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ х3 + ах + Ъ = 0. Прежде всего, переформулируем этот метод так, чтобы его можно было применить и к уравнениям (7.1). Пусть и,, и2 — комплексные числа и w — примитивный кубический корень из единицы. Раскрывая скобки в произведении (х — (и, + и2)) (х — (um, + w2u2)) (х — (ги2и, + wu2)) , (7.2) мы получим многочлен х3 -Ъщи2х-(и\ + и\). (7.3) Так как х- = w3u, + w23и2, j = 0,1,2, являются корнями кубического многочлена (7.2), то подставляя их в (7.3), мы получим три тождества: (w3U\ + w2ju2)3 — 3u,u2 (ги^и, + w2jи2) — (и3 + и32) = 0. Таким образом, кубическое уравнение х3 + ах + Ъ = 0 имеет три решения х. — wJ ui + w2j и2, j = 0,1,2, где и3 и и2 находятся из системы уравнений {и3 + и3 = -Ь, Очевидным обобщением многочлена (7.2) является многочлен пятой степени 4 Ц (х - (wjUl + w4ju2)), (7.4) где теперь w — примитивный корень пятой степени из единицы. Раскрывая это произведение, мы получим, что многочлен пятой степени 3^ + 03^ + —х + Ь 5 (называемый иногда многочленом Муавра) имеет корни х^=и)3щ-{-и)^и21 j =0,1,2,3,4,
§ 7. УРАВНЕНИЯ ПЯТОЙ СТЕПЕНИ, РАЗРЕШИМЫЕ В РАДИКАЛАХ 227 где и\ и и\ определяются системой уравнений и\ + и\ = -Ь, Поскольку нас интересует не многочлен Муавра, а многочлен х5 + ах + Ь, рассмотрим вместо (7.4) многочлен пятой степени 4 Л (х - (wjul + w2ju2 + w3ju3 + w4ju4)), (7.5) 3=0 где u{, u2, u3,u4 — ненулевые вещественные числа и w — примитивный корень пятой степени из единицы. Записав (7.5) в виде многочлена по а; и подставив в этот многочлен величины х ■ = w3 и{ + w2ju2 + w33 и3 + wi:,u4, мы получим для j = О,1,2,3,4 следующие тождества: (wJu[ + w2ju2 + w3ju3 + w4ju4)5— - 5 U{w^u{ + w2ju2 + w3:>u3 + w4;>u4)3- - 5 V(wJul + w2ju2 + w3ju3 + w^u4f- - 5 W(wJul + w2^u2 + w3iu3 + w4j u4)+ + 5(X-Y)-Z = 0, (7.6) где U = u{u4 + u2u3, V = u{u2 + u2u\ + u3u2 + u4u23, W = u2ul + u^ul — u\u2 — v^u4 — u\ux — u34u3 — u{u2u3u4, X = u3u3u4 + u32u{u3 + u3u2u4 + u34u{u2, Y — u, ulu4 + щи2,и3 + щи1и2. + u.u2ul I u>3 u*4 ~r u*o "ч "'З ~T~ "зи2 4 ' ^4^1^9 5
228 ГЛ. 6. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ Наша цель — найти вещественные числа uv и2, и3, щ, удовлетворяющие уравнениям utu4 + и2и3 = О, (7.7) ихи\ + и2и\ + и3и\ + и^и\ = О, (7-8) 5 (и\и\ + и\и\ — и3и2 — и\иА- —и\и{ — и34и3 — и{и2и3и4) = а, (7.9) —(u{u\u\ + u2u\u\ + u3ulul + и4и\и\)\— -(u\ + u\ + ul + u\) = b. (7.10) Для таких uv и2, и3, и4 многочлен (7.5) принимает вид х5 + ах+Ь и имеет корни Xj = wjui+w2ju2 + w3ju3 + w4ju4, У = 0,1,2,3,4. (7.11) Теорема 1. Пусть а и b — такие рациональные числа, что многочлен пятой степени х5 + ах + Ь неприводим. Тогда уравнение х5 + ах + b = О разреъиимо в радикалах в том и только том случае, когда существует такие рациональные числа числа е = ± 1, с ^ О и е ф 0, что 5e4(3-4ec) l -4е5(11£ + 2с) С2+1 ' Ь~ С2 + 1 • (Z) В этом случае корни уравнения имеют вид Xj = e{wju{ + w^u2 + w3ju3 + w4jUi), j = 0,1,2,3,4. (7.13) где w = e27™/5 и (7.14)
§ 7. УРАВНЕНИЯ ПЯТОЙ СТЕПЕНИ, РАЗРЕШИМЫЕ В РАДИКАЛАХ 229 V{ =VD+y]D-£\fD, v2 = -y/D-y/p + ejD, (7i5) v3 = -VD + yJD + eVD, v4 = ^D-^D- eVD, L> = c2+1. (7.16) Доказательство. Предположим, что неприводимый многочлен пятой степени х5 + ах+Ь разрешим в радикалах. Тогда его резольвента z6 + 8ах5 + 40aV + 160а3а;3 + 400а4х2+ + (512а5 - 3\25b4)x + (256а6 - 9375afc4) имеет рациональные корни [Б11, а]. Следовательно, г удовлетворяет уравнению (г + 2а)4 (г2 + 16а2) - 55Ь4 (г + За) = 0, (7.17) откуда вытекает, что г ф —2а, г ф —За при а ф 0. Определим неотрицательное рациональное число с и ненулевое рациональное число е, полагая Ъг — 16а — ЪЬе ее — g=n/_.o_4. (7Л8> где е = ± 1. Тогда 4(r + 3a)' 2(r + 2a)' 2 , , 25 (г2 + 26a2) 3 - 4ес = 11е+2с = 16 (г + За)2 ' 25а г + За' 25е(г + 2а) 2(г + 3а) ' так что соотношения 5е4 (3 - 4ес) _ 55ab4 (г + За) с2 + 1 (r + 2а)4 (г2 + 16а2) = а
230 ГЛ. 6. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ 4е5(11е + 2с) _ 55¾5 (г + За) с2+ 1 ~~ (г + 2а)4(г2 + 16а2) ~ задают требуемую параметризацию. Покажем теперь, что неприводимое уравнение пятой степени 5 Ъе\Ъ-Аес) 4е5(11£ + 2с) + С2+1 ^ С2+1 ~U (Л1У) разрешимо в радикалах при е = 1, причем корни его задаются формулами (7.11). Тогда для произвольного е преобразование а; ь-> ех дает требуемые корни (7.13). Из соотношений (7.15) вытекает, что vx+v4 = 2y/D, v2 + v3= -2>/D, vxv4 = evD, v2v3 = -ел/Д (7.20) (7.21) следовательно, {vl + v2 + v3 + v4 = 0, u,t;4 + v2v3 = 0. Далее, из (7.14) мы получаем „S-lfe u5_^ u5_^ u5_^ ,722v Стало быть, Ul"4 = ~7Б' U2% = 7d' (7'23) ^4 = ¾. «з«4=§> ^3 = ¾. "X = §. (7-24) 3 _ еи^з J _ cv3v4 (7.25) 3 _ £vxv2 J £V2v4 y ' что с учетом соотношений (7.21) дает уравнения (7.7) и (7.8).
§ 7. УРАВНЕНИЯ ПЯТОЙ СТЕПЕНИ, РАЗРЕШИМЫЕ В РАДИКАЛАХ 231 Из соотношений (7.15), (7.22)-(7.25) следует, что 5 (и\и\ + и\и\ — и\и2 — u\ui — й^и1 — и^и3 — UjU2u3u4) = _ 5(3-4еч/рЗТ) _ 5(3 -Аес) (7.26) D с2 + 1 5 ((t^u3u4 + и\ихи^ + и^и2и4 + и^щщ)— —{ихи\и\ + и2и\и\ + u3ulu24 + и4и\и\)) — (7.27) /5 5 s 5ч 44е + 8VD - 1 4(11е + 2с) -(^ + 4 + ^ + 4) = = - ^2 + 1 ;, т. е. уравнения (7.9) и (7.10). Таким образом, уравнение 5 5(3-4£с) 4(11£ + 2с) + с2+1 с2 + 1 ~ U разрешимо в радикалах и его корни задаются формулой (7.11). D Замечание. В трактате Вебера [Б11,а] (см. также [Б22, Б32]) условие разрешимости формулируется несколько иначе: уравнение (7.1) тогда и только тогда решается в радикалах, когда оно либо приводимо, либо его коэффициенты а и Ь имеют вид 3125А^4 а = Ъ = (А- 1)4(А2-6А + 25)' 3125А^5 (А- 1)4(А2-6А + 25)' где \ и /j, — некоторые рациональные числа, А ф 1. Займемся теперь вычислением групп Галуа уравнений пятой степени (7.1), разрешимых в радикалах. Для этого нам понадобятся так называемые транзитивные группы подстановок. Группа G подстановок степени п называется транзитивной, если для любых двух номеров i, j, 1 ^ г, j ^ п, в группе G существует хотя бы одна подстановка, переводящая номер г в номеру. Значение транзитивных групп для теории Галуа объясняется следующим утверждением. Теорема 2. Группа Галуа неприводимого многочлена транзитивна.
232 ГЛ. 6. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ Доказательство. Достаточно заметить, что если многочлен неприводим, то все его корни ар .. .,ап сопряжены между собой, и поэтому для любой пары корней а,-, а- в поле Q(a,,...,an) найдется автоморфизм над Q, переводящий корень а{ в корень а-. □ Докажем теперь следующую общую теорему о транзитивных группах. Теорема 3. Порядок транзитивной группы подстановок степени п делится на п. Доказательство. Пусть G — произвольная транзитивная группа подстановок степени п. Разобьем группу G на непересекающиеся классы, объединяя в один класс все подстановки, одинаково действующие на номер 1. Так как группа G транзитивна, то число таких классов равно п. Обозначим через Н класс подстановок, оставляющих номер п на месте. Очевидно, что Н является подгруппой в группе G. Две подстановки д^д2 € G принадлежат одному классу тогда и только тогда, когда glg^i € Н, т. е. когда подстановки д{, д2 принадлежат одному и тому же смежному классу по подгруппе Н. Следовательно, рассматриваемые классы совпадают со смежными классами по подгруппе Н. Поэтому индекс подгруппы Н равен п. Так как группа G обладает подгруппой индекса п, то ее порядок делится на п. □ Простейшими транзитивными группами являются циклические группы. Очевидно, что циклическая группа подстановок степени п транзитивна тогда и только тогда, когда ее образующей служит цикл длины п. В частности, порядок такой группы равен п. Нетрудно проверить, что число всех циклов длины п равно (п - 1)!. В самом деле, любой цикл длины п единственным образом представляется в виде (1г2г'3 ... гп), где г2,г3,...,гп — некоторая перестановка чисел 2,3, ...,п. Так как циклическая группа порядка п содержит ip(ri) образующих, то отсюда следует, что число всех циклических транзитивных групп подстановок степени п равно (п- 1)!/<^(п). В частности, для п == 5 это число равно шести. Очевидно, что группа подстановок, содержащая цикл длины п, транзитивна. Покажем, что в случае, когда п является простым числом, верно и обратное. Теорема 4. Любая транзитивная группа подстановок простой степени р содержит цикл длины р.
§ 7. УРАВНЕНИЯ ПЯТОЙ СТЕПЕНИ, РАЗРЕШИМЫЕ В РАДИКАЛАХ 233 Доказательство. Пусть G — произвольная транзитивная группа подстановок степени р. Разобьем множество всех циклов длины р, не принадлежащих группе G, на классы, объединяя циклы с, и с2 в один класс, если в группе G найдется такой элемент д, что с2 = д~хсхд. Обозначим через Нс класс, содержащий цикл с. Легко видеть, что для любых двух циклов сх и с2 длины р, не принадлежащих группе G, классы Нс и Нс либо совпадают, либо не пересекаются. Рассмотрим теперь некоторый цикл с = (г\,..., г ) длины р, не принадлежащий группе G. Пусть д — произвольный элемент группы G. Если д имеет вид 9 =Q: :::£)■ <7-28» то 9~Xcg = {jxj2...jp), т. е. подстановка д~хсд также является циклом длины р. Кроме того, поскольку g(g~lcg)g~l = с, цикл д~1сд не принадлежит группе G. Следовательно, формула а(д) = д~Хсд задает отображение а группы G на класс На. Покажем, что отображение а является биекцией. Для этого достаточно установить, что из равенства а(дх) = а(д2) следует равенство д1 = д2. Итак, пусть 0:(^) = &(д2), т. е. 0i-1c0i = 921с92- Тогда (9х92Х)~Хс{9\92Х) = с, т. е. д~1сд = с, где д = дхд2^• Поэтому, если подстановка д имеет вид (7.28), то с = (jxj2.. .jp), откуда следует, что д — с , где к — такой номер, что j\ =У^+1- Число к взаимно просто с р, поскольку оно меньше р. Если к > 0, то найдутся такие числа о и Ь, что ka + pb = 1. Значит с _ ска+рЬ _ ска = да^
234 ГЛ. 6. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ и следовательно, вопреки предположению, с е G. Поэтому к = О, т. е. д = е и д{ = д2. Таким образом, все классы Нс состоят из одного и того же числа элементов, равного порядку группы G. Поэтому число всех циклов длины р, не принадлежащих группе G делится на порядок группы G и, следовательно, в силу теоремы 3, делится на р. С другой стороны, как было указано выше, число всех циклов длины р равно (р— 1)! и поэтому на р не делится. Следовательно, группа G обязательно содержит циклы длины р. □ Каждый цикл длины р, содержащийся в группе G, определяет циклическую подгруппу, состоящую из р — 1 циклов длины р и тождественной подстановки. Так как эти циклические подгруппы пересекаются только по тождественной подстановке, то общее число циклов, содержащихся в группе G, равно (р — 1)т, где т — число циклических подгрупп порядка р группы G. Следовательно, обозначая через ps число циклов длины р, не принадлежащих G, мы получим уравнение (р- \)m + ps = (p- 1)!, откуда т = (р - 2)! - рг, (7.29) г»о<,<<^. V Для р = 5 число г может принимать лишь значения 0 и 1. В соответствии с этим мы получаем, что т = 1 или 6, т. е. транзитивная группа пятой степени содержит либо одну циклическую группу пятого порядка, либо шесть таких групп. Если в транзитивной группе G подстановок пятой степени содержится шесть циклических групп пятого порядка, то в силу тождеств (ij) (kl) = (ikjlm) (ikjml), (ij) (Ik) = (ikjlm) (ikmlj), группа G содержит произведения двух любых транспозиций и поэтому содержит любую четную подстановку. Следовательно, в этом случае G является либо знакопеременной группой А5, либо симметрической группой S5 и, значит, не разрешима. Таким образом, нас будут интересовать лишь те группы G, которые содержат ровно одну циклическую группу пятого порядка. Пусть и — образующая этой группы. Для определенности
§ 7. УРАВНЕНИЯ ПЯТОЙ СТЕПЕНИ, РАЗРЕШИМЫЕ В РАДИКАЛАХ 235 положим и = (12345). Циклическую группу с этой образующей обозначим через Z5. Рассмотрим, далее, подстановку v = (25)(34). Непосредственно проверяется, что е, и, и2, и3, и4, v, uv, u2v, u3v, u4v образуют группу. Эта группа называется диэдральной группой порядка 5 и обозначается D5. Она содержит циклическую группу Z5 в качестве нормального делителя, причем факторгруппа D5/Z5 изоморфна группе Z2. Стало быть, группа D5 разрешима. Рассмотрим теперь подстановку w = (2354). Легко видеть, что w4 = е, wu = u3w. Поэтому подстановки 2 3 4 е, и,и ,и ,и , го, uw, u2w, u3w, u4w, 9 9993949 w ,uw1 ^w1 ^u. ur,V7W , го3, uw3, и2ги3, u3w3, и4гу3 образуют группу двадцатого порядка. Эта группа называется ме- тациклической группой или же группой Фробениуса и обозначается F20. Так как w2 = v, то D5 содержится в Fw в качестве нормального делителя индекса 2. Поэтому группа F20 разрешима. Покажем, что группами Z5, D5 и F^ исчерпываются все транзитивные группы пятой степени, содержащие только одну циклическую группу пятого порядка. В самом деле, пусть s — произвольная подстановка такой группы G. Если s переводит номер 1 в номер к, то подстановка g = su~k оставляет единицу на месте. Пусть g записывается в виде VI г2 г3 г4 гъ) Тогда g~lug = (li2i3i4i5). Так как любой цикл длины 5 в группе G является по условию степенью цикла и, то отсюда следует, что g-lug = uk, к =1,2,3,4.
236 ГЛ. 6. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ Поскольку и = (12345), из этого соотношения вытекает, что подстановка д совпадает с одной из следующих подстановок /1 2 3 4 5\ е ll 2 3 4 5/' /1 2 3 4 5\ W={\ 3 5 2 4J' з /1 2 3 4 5\ W =(l 4 2 5 з)' /1 2 3 4 5\ V=ll 5 4 3 2) и поэтому принадлежит группе F20. Следовательно, и подстановка s принадлежит этой группе. Значит, G С F^. Но единственность подгруппами в F20, содержащими группу Z5, являются Z5, D5 и F20, что и требовалось доказать. Таким образом, разрешимое в радикалах уравнение пятой степени может иметь одну из трех групп Галуа: Z5, D5, F20. Выясним, в каких случаях разрешимое в радикалах уравнение (7.19) имеет в качестве группы Галуа ту или иную из этих групп. Для этого нам понадобится дискриминант многочлена пятой степени. Нетрудно показать, что дискриминант Д многочлена х5 + + ах + Ъ равен Д = 4а5 + 55Ь4. В частности для многочлена, записанного в виде (7.19) AiKb 20 Д = ~—^-(4ес3 - 84с2 - 37ес - 122)2. (7.30) Воспользуемся теперь следующим фактом, доказательство которого можно найти, например, в замечательном учебнике по высшей алгебре Д. Граве [Б13]: Теорема 5. Многочленх5 + ах+Ь имеет в точности один вещественный корень, если Д > 0. □ В силу (7.30) отсюда следует, что уравнение (7.19) имеет ровно один вещественный корень. Но поскольку у уравнения (7.19) есть комплексные корни, Z5 его группой Галуа быть не может. Поэтому остаются две возможности: D5 и F^. Они также различаются дискриминантом Д. А именно, можно доказать (см. [В5, В15]), что группа Галуа уравнения (7.19) изоморфна D5 тогда и только тогда, когда рациональное число Д является
§ 7. УРАВНЕНИЯ ПЯТОЙ СТЕПЕНИ, РАЗРЕШИМЫЕ В РАДИКАЛАХ 237 полным квадратом. В виду (7.30) последнее условие эквивалентно тому, что полным квадратом является число 5D = 5, (с2 + 1). Итак, мы получаем окончательный ответ: если 5D = 5 (с2 + 1) является квадратом рационального числа, то группа Галуа уравнения (7.19) есть D5, в противном случае — группа F20. С помощью теоремы 1 нетрудно получить примеры уравнений пятой степени вида (7.1), не разрешимые в радикалах. Пусть р— простое число, р = 3 (mod4). Покажем, что уравнение пятой степени х5 + 2рх + 2р2 = 0 не разрешимо в радикалах. Заметим прежде всего, что в силу критерия Эйзенштейна многочлен х5 + 2рх + 2р2 неприводим. Предположим, что наше уравнение разрешимо в радикалах. Тогда на основании теоремы 1 существуют такие рациональные числа е = ±1, с^О и е ф 0, что 2р=-^т(3-4«0, (7.31) & + 1 2р2 = —^гт(П£+2с). (7.32) & + 1 Представим рациональные числа с и ев виде несократимых дробей с = m/п и е = r/s, где т, п и г, s — попарно взаимно простые целые числа. Подставляя эти выражения для с и е в формулы (7.31) и (7.32), получим 2р (т2 + п2) s4 = 5г4 (Зп - 4ет) п, (7.33) 2р2 (т2 + п2) s5 = -4г5 (11еп+ 2т) п. (7.34) Так как р — простое число, р = 3 (mod 4) и (m,ri) = 1, то т2 + п2 не делится на р. Более того, поскольку (г, s) = 1, из соотношения (7.33) вытекает, что г также не делится на р. Пусть ра, р3, р1, р6 — наибольшие степени числа р, делящие соответственно числа n, 3n-4em, llen + 2m и s. Приравнивая степени числа р в обеих частях соотношений (7.33) и (7.34), получаем Г1+4* = а + /? \2 + 5(5 = а + 7.
238 ГЛ. 6. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ С другой стороны, число р не может одновременно делить п и Зп - 4ет, поэтому либо а = 0, либо /3 = 0. Аналогично, либо а = 0, либо 7 = 0 и либо /3 = 0, либо 7 = 0- Другими словами, по меньшей мере два из трех чисел a, ft, j должны быть равными нулю, что противоречит системе (7.35). Следовательно, уравнение х2 + 2рх + 2р2 = 0 не разрешимо в радикалах.
ГЛАВА 7 РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ § 1. Определение тэта-функций Напомним, что функция / называется двоякопериодиче- ской, если для любых целых тип f(z + nwi +тш2) = f(z), причем u)Ju>2 ¢. R. Теорема 1 из § 2 главы 2 утверждает, что целая функция не может быть двоякопериодической. Тэта-функции представляют собой целые функции, имеющие один настоящий период и один квазипериод: при добавлении к аргументу квазипериода функция хотя и изменяется, но по достаточно простому закону. Верхнюю полуплоскость Н = {те С | Imr >0} можно отобразить внутрь единичного круга D={qeC\\q\^ 1}, положив q = еШТ. В самом деле, пусть т = х + гу, где х, у € R. Тогда q = ешх~™у = е~™уешх и |д| = е~пу. Поэтому |д| < 1 тогда и только тогда, когда у > 0, т. е. Imr > 0. Фиксируем число т € Н и рассмотрим ряд сю сю о . о ъ{у\т)= Y. e(mT+2mv^l= Y, Я 771=-СЮ Модуль отношения последовательных членов этого ряда равен |g2m+le2^| ^ |g|2m+le2irH. Д ТЭК КЗК lim |q|2m+1 = 0, ТО
240 ГЛ. 7. РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ в3(ь | г) представляет собой ряд целых функций переменной v, равномерно сходящийся в любой области |v| ^ с, где с — константа. Поэтому в3(у | г) — целая функция переменной v. Эту функцию мы часто будем обозначать для краткости 03(v). Наряду с функцией 03(v) удобно рассматривать функции в0(ь) = 93(v + 1/2) = Y, qm2e2nimvenim = ^2(-l)mqm2e2nimv, 0,(«) = ie-^v~Tl^ e3(v + 1/2 - т/2) = _ • —ni(v—т/4) X "" m2 2nimv „nim — nimr _ _ iy^^_^ynq(m-l/2)2eiri(2m-l)v^ в2(у) = е-™<"-т/4> 63(v - т/2) = _ g-7ri(u—т/4) X "" m2 2mmv -nimv _ X "" (m-1/2)2 7ri(2m-l)u Функции 0о(и|т), 0,(v|t), 02(ulr)' ^зН7") называются тэ- та-0ун?сцш1лш. Теорема 1. Для функций 9k(v), к = 0,1,2,3 мжеют жесто соотношения **(«+!) = **(«), fc = 0,3 0fc(«+l) = -**(«), fc=l,2 0^ + 0 = ^)0^), fc = 2,3 ^(« + т) = -Л(«)^(«), fc = 0,l, где Л(и) = д-'е-2™. Доказательство. Проверим эти соотношения для функции в3. При замене v на и + 1 ряд (1.1) не изменится, так как е2т™("+|) = e2nimv. Это означает, что 03(и+ 1) = 93(v). Далее 03(и + г) = £ qm2,?™™qb» = = q-le-2^^q(™+l)2e27ri(m+l)u = q-le-2^^). Оставшиеся утверждения проверяются аналогично. D
§ 2. НУЛИ ТЭТА-ФУНКЦИЙ 241 § 2. Нули тэта-функций Пусть числа так связаны соотношением к = 1 — т. Тогда (-1)т = -(-1)* и q(m-'/2)2 = g(*-i/2)2f а значит, вх{-у) = = -0, (и). В частности, 0,(0) = 0. Так как 0,(и + 1) = -б, (и) и б, (и + г) = -Л(и)0,(и), то вх(т + пт) = 0. Покажем, что других нулей у функции 0, нет. Для этого достаточно проверить, что внутри параллелограмма П с вершинами ±1/2 ± т/2 функция 0, имеет единственный нуль. Ясно, что в[(у+\) ^в[(у) e^v + i) w в[(у + т) ^ -л'(ц)а,(ц)-л(ц)а;(ц) = 6{(v + t)~ -А(у)6х(у) A'(v) в[(у) в[(у) А(у) ^0,(^) ^в^уУ Следовательно, если С — граница параллелограмма П, обходимая против часовой стрелки, то 2ni ) 0,(*Г с В самом деле, интегралы по сторонам, полученным сдвигом на 1, сокращаются, а сумма интегралов по сторонам, полученным сдвигом на г, равна 27гг, поскольку длины этих сторон равны 1. Если f(z) — ck(z - ак)к + ..., то /'(*) fc , _ f(z) z-ak Поэтому для целой аналитической функции / величина _L [ ?(*),~ 2« J f(z) С равна количеству нулей с учетом их кратности, лежащих внутри С. Таким образом, внутри параллелограмма П функция 0, имеет ровно один нуль.
242 ГЛ. 7. РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ Исходя из выражений для функций в0, в{ и в2 через функцию в3, легко получить следующую таблицу нулей тэта-функций: нули W т+ (га+ 1/2) т ex(v) т + пт e2(v) тп + l/2+пт 63{v) тп+ 1/2+ (n+ 1/2) т Задачи. 1. Доказать, что функции 0О, 02 и 03 четные. § 3. Соотношение 0\ = в\ + (% Величины в{ = ¢,-(0), г = 0,2,3, и в[ = 0((0) называют тэта- константами. Напомним, что они зависят от параметра т. */ ч а02(и) + ЬЭД , „ Рассмотрим функцию f(v) = —' -Ач/ ^-^, где а.Ь € С. Числа 1 и т являются периодами функции /, поэтому / —дво- якопериодическая функция с фундаментальным параллелограммом П. Фундаментальный параллелограмм можно сдвинуть так, чтобы внутри него лежал лишь один нуль функции 60(v), а именно точка т/2. Если числа а и Ь подобраны так, что а#22(т/2) + Ье1(т/2) = 0, то эллиптическая функция f(v) имеет внутри параллелограмма П не более чем однократный полюс. Следовательно, она постоянна. Подставив значения v = т/2 и v = 0 в соотношение 62(V) = е-"<«-т/4)0з(|; _ т/2), получим соответственно 62{т/2) = е-™/*в3(0), 02(О) = е™т/*93{-т/2) = е™1* в3(т/2). Поэтому авЦт/2) + ЬвЦт/2) = аВЩ + ЬВЩ, где В = e~viT/4.
§ 4. ПРЕДСТАВЛЕНИЕ ТЭТА-ФУНКЦИЙ ПРОИЗВЕДЕНИЯМИ 243 Положим а = -9\ и b = в2. Тогда aB2Q\ + ЬВ2в\ — О, а значит, -0>)91 +в1(у)в1 = с e\(v). Чтобы вычислить константу с, положим v = 1/2. Функция в2 в этой точке обращается в нуль, а для вычисления #3(1/2) и #0(1/2) можно подставить значения v = 0 и v = 1/2 в соотношение 00(v) = 63(v+l/2). В результате получим в0 = 6>3(1/2) и 0о(1/2) = = #3(1) = #3. Поэтому т. е. с = 6>02. Таким образом, 0f(u)0f - 022(^)022 = 6>2(v)02. В частности, при v = О получаем 6>з =^+6*о, Т. е. (1 + 2q + 2q4 + 2g9 + . . .)4 = 16g(l + q12 + q23 + q3A + .. У + + {\-2q+2q4-2q* + ...)4. Задачи. 1. Докажите следующие соотношения: e20(v)e2-e2(v)e23; el{v)e\-e2{v)e\; в23(у)в22-в22(у)в23. § 4. Представление тэта-функций бесконечными произведениями Функция 93{v) — Yj Qk e2mkv имеет нули к=—оо тп+ 1/2 + (п+ 1/2) т. Положим s = e27m\ При этом преобразовании нули функции 63(V) ПереХОДЯТ В ТОЧКИ e2*i(m+l/2)e2*t(n+l/2)r = -^+^ где q = = eviT. e\(v)92Q = e23{v)6l = e2(v)e20 =
244 ГЛ. 7. РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ Разобьем эти точки на два множества: -<Г',-<Г3,-<Г5,... (4.1) -q,-q\-q\... (4.2) Предельной точкой множества (4.1) является оо, а предельной точкой множества (4.2) является 0. оо Ряд ^2 \q2 1\ сходится, поэтому функция ге=1 oq Jt=l будет целой функцией от а с нулями в точках множества (4.1). Аналогично функция ^ Jt=l будет целой функцией, если ее рассматривать как функцию от s~l (как функция от s она имеет особенность в нуле). Нулями функции f2(s) являются точки множества (4.2). Рассмотрим функцию f(s) = /,(s)/2(«). Функция g(V) = f(e2™) = f(s) имеет те же нули, что и функция в3(у). При замене v i-> v + 1 величина s = e2mv не изменяется, поэтому g(v +1) = g(v). При замене v *-у v + т величина s заменяется на e2niTe2nw = sq2, поэтому 9(v + r)= l+q~ls~l g(v) = q-ie-2™g{v). 1 + qs Следовательно, отношение функций в3(у) и g(v) является целой двоякопериодической функцией, т. е. константой. Таким образом, оо 03(у) = сЦ(1+д2к-1е2™)(1+я2к-1е-2™) (4.3) к=\ Аналогичные разложения можно получить и для остальных тэта-функций. Так как е2т»(и-н/2) _ e-2niv^ то оо W = б3(г;+ 1/2) = с Y[(\-q2k-le2™)(l-q2k-le-2™) (4.4) fc=l
§ 4. ПРЕДСТАВЛЕНИЕ ТЭТА-ФУНКЦИЙ ПРОИЗВЕДЕНИЯМИ 245 Так как n2k-i „2tri(v+l/2-r/2) _ _п2к-2 2niv q е — q е , 2к-1 e-2m(v+l/2-r/2) _ _ 2ке~2ть ТО 0, (v) = {е-™д1'%(у + 1/2 - т/2) = оо Ci(l - е2™)е-™д1/* Д (1 _ q^e2™) (1 - ^V2™). fc=l Ясно также, что г'(1 - e^mv^e~mv = 2siri7ru, поэтому оо 0,(v) = 2^8^^11(1 - q2ke2™)(l -q2ke-2™). (4.5) Jt=l Легко проверить, что 62(v) = 6{{v + 1/2), поэтому оо 62(v) = 2cql<4cosnv П(1 + д2*е2™)(1 +<?2А:е-2™)- (4.6) Jt=l Докажем теперь, что ж с =11(1 ~Л <4J> Jfc=l Рассмотрим для этого последовательность функций ^(-) = ^(1-^-)0-^-^)= £ <*(")-*■ Jt=l А=-п Она равномерно сходятся к функции оо . . оо 11(1-^-)0-^--) = ^0^) = ^ £ (-i)V-*. Jt=l fc=-oo Приравнивая коэффициенты при нулевой степени з, получим 1/с = lim %(п). п—>оо и ЯСНО, ЧТО ап(п) = (-l)"ql+3+...+(2n-l) = (_l)nqn2 ^ ме
246 ГЛ. 7. РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ того, очевидно равенство fn(q2s) _ (l-g2n+ls)(l-q-ls~l) _ I - q2n+ls /„(*) ~ (l-gs)(l-g2n-is-i) - qs-q2n ' поэтому (qs-q2n) £ ak(n)q2kSk = -(l-q2^s) £ ak(n)sk, k=—n k=—n T. e. £ afc(n)(l -g2^fc))Sfc = Y, *k(n)(q2n+l-q2k+l)s> k=—n k=—n k + \ Следовательно, fj(l _g2(n+fc)) f](l-g2("+fc)) %(«) = qn -n = — • n(g2fc+1 -g2n+i) ]l(l-92fc) k=\ k=i Пусть |g|2 = a < 1. Тогда 1 - an < |1 - g2("+fc)| < 1 + an. Кроме n того, lim n ln(l ± an) = 0. Поэтому lim П (1 - q2(n+k)) = 1, а n—»oo n—»00 i 'fc=l значит, . оо c= lim —- = J](l-^)- n^oo ^(n) AX § 5. Соотношение 0{(O) = ir0o(O)02(O)03(O) Из формул (4.4)-(4.7) следует, что 0о(О) = сП(1-92*-')2; it=i оо fc=i оо ^з(0) = сП(1+^-')2; (5.1) (5.2) (5.3) к=\
§ 6. ^ФУНКЦИЯ ДЕДЕКИНДА 247 ^(0) = 27^11(1-^)2. (5.4) fc=l Для доказательства последней формулы достаточно заметить, что 0((0)= lim e.(v)/v. и—>оо оо Так как П (1 ~ Ч2к)2 = с2, то 0((0) = 2щх^с3. Поэтому для fc=i доказательства соотношения 0((0) = 7г0о(О)02(О)03(О) достаточно проверить, что оо 11(1-^)(1+ ^)0+д2*-') = 1- k=i Ясно, что оо оо П(1-92*"1) = П(1-9П)(1-92П)"1 fc=i i=i и оо оо П(1+Л(1+^-') = П(1+^)- k=l п=1 Поэтому оо 11(1-^)(1+^)(1+^) = :=1 оо оо Yl(l-qn)(l+qn)(l-q2nrl = Yl(l-q2n)(l-q2n)-l = L k=l оо п—1 п=1 § 6. ^-функция Дедекинда и функции /, /,, /2 Формулы (5.1)-(5.4) с учетом (4.7) позволяют представить тэта-константы в следующем виде: оо 0((0) = 2^), где »/(r) = g"12 J](l "Л fc=i оо e3(0) = v(r)f(r), где /(T) = ^'/24n(l + 92fc"'); /с = 1
248 ГЛ. 7. РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ W = V(r)/,V), где /,(т) = 9"'/24 [](1 - д2*"1); Jt=i оо *2(0) = ^(т)/22(т), где /2(г) = ^2д'/'2П(1+Л Из соотношения 0^(0) = 0^(0) + 0^(0) следует, что /8 = /,8 + /28- (6.1) В предыдущем параграфе было показано, что оо П(1-^-')(1+Л(1+^-') = 1. Jt=l Поэтому //,/2 = V2. Функции /, /, и /2 можно следующим образом выразить через функцию Т)\ е-^,(/2+1/2); Т/(Т) Т/(Т) Ш = ЛЩ. (6.5) //(г) Докажем, например, формулу (6.3). Легко проверить, что ^/2+1/2) = 1/м WM тт 1 ~ (»У/2)2* = А;=1 = ,-1/24^/24(1+9)(1-92)(1+93)(1-94)--- = (1-^)(1-94)... оо = g-l/24e7rz/24jQ(1_q2A:-l) Jt=l Формулы (6.4) и (6.5) доказываются еще проще.
§ 7. ПРЕОБРАЗОВАНИЯ ТЭТА-ФУНКЦИЙ ПО ПАРАМЕТРУ т 249 § 7. Преобразования тэта-функций по параметру г В § 1 мы выяснили, как ведут себя функции 9{(у \ т) при заменах v на v + 1 и на v + т. Оказывается, что при заменах т на т + 1 и на —1/т функции 0Ди | т) тоже преобразуются по достаточно простым законам. Для замены т на т + 1 это не удивительно, поскольку при такой замене величина q = ежгт заменяется на (/ = —q. Поэтому в0(ь\т+\) = в3(ь\т), e3(v\r+l) = 90(v\r) и ек(у\т+1) = е^вк(у\т) при fc=l,2. Что же касается замены т на т1 = —1/т, то при этом величина g = е~жгт заменяется на д' = е~пг'т = е_7Г ' q. Наличие закона преобразования при такой замене, безусловно, удивительно. Чтобы найти этот закон, рассмотрим функцию 9{) 03(v\t) ■ Несложные вычисления показывают, что g(v +1) = g(v) и g(v + т) = g(v), т. е. д — двоякопериодическая функция. При этом нули знаменателя имеют вид v = (m+l/2)T + (n+l/2), а нули числителя определяются соотношением r'v = (m+ 1/2) т' + (п+ 1/2), т. е. и = (т+1/2)-(п+1/2)т. Таким образом, нули числителя совпадают с нулями знаменателя, а значит, д — целая двоякопериодическая функция. Следовательно, д = С, где С — константа. Заменяя v на v + 1/2, v + т/2 и v + 1/2 + т/2, из равенства в3(т'у \т') = С e~wiT,v293(v | т) (7.1)
250 ГЛ. 7. РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ можно получить равенства е2(т'у\т') = Се-*гт'"2е0(у\т), (7.2) в0(т'у \т') = С e-*ir,v292(v | т), (7.3) вх(т'у | т') = iCe'^'^e^v | т). (7.4) Перемножив равенства (7.1)-(7.3) и положив v = О, получим 02(О | т') 03(О1 г') в0(01 т') = С3 в2(01 г) 03(О1 г) 0О(О | т). (7.5) Продифференцировав по v равенство (7.4) и положив v = О, получим ^^(01^) = 2(7^(0^). (7.6) А так как в[ = ттв0в2в3, то из равенств (7.5) и (7.6) следует, что С2 = — гт. Ясно так же, что при чисто мнимом т обе величины #3(0 | т) и #3(01 т') положительны. Следовательно, С = y/—ir и 03(О| -1/т) = у/Ч^в3(0\т). (7.7) § 8. Преобразования ^-функции Дедекинда Преобразования тэта-функций по параметру т приводит к преобразованиям т/-функции Дедекинда, так как 2тг7]\т) = в[(0\т). Из соотношения 0,(01 т + 1) = еш11вх(0\ т) получаем т](т+\) = е™/12т](т). (8.1) Если учесть, что С = л/-{т и т' = — 1/т, то соотношение (7.6) принимает вид в[(0\ -\/T) = (VZ^)3e'i(0\T). Следовательно, V(-\/t) = VZ^v(t). (8.2)
§ 8. ПРЕОБРАЗОВАНИЯ ^-ФУНКЦИИ ДЕДЕКИНДА 251 С помощью формул (8.1) и (8.2) можно получить законы преобразования функций /, /,, и /2 при заменах т на т + 1 и на —1/т. Например, /(т+.)='--^.+ 1> = '^Ш = .-*»/,<„. ,8.3) 7/(т+1) 7/(т) Аналогично получаем Мт+1) = е-™/2АПт), (8.4) /2(т+1) = е"'/12/2(т). (8.5) Отметим, что /(т + 2) = е_7Гг/12/(т), а значит, /(т + 48) = /(т). Легко проверить, что ft 1 М _ H>j_ У^2^т?(2т) _ *1 (_1/TJ = / , , ч = /—г- , ч- = /2(Т)- (8Ь) т/(-1/т) у/-гтг}(т) Заменив т на —1/т, получим /2(-1/т)=/,(т). (8.7) Выражение для /(—1/т) аналогичными вычислениями получить не удается. Но если воспользоваться тем, что /(т)/,(т)/2(т) = ^2 и /(-1/^)/,(^)/2^) = /(-1/^/,(-1/^/,(-1/^ = ^, то получим /(-1/т)=/(т). (8.8) Докажем теперь соотношение /(r)/(^rJ)=V2. (8-9) Из (6.4) и (6.5) следует, что /,(2т)/2(т) = \/2. А так как /,(2т) = е-7Гг'/24/(2т-1)
252 ГЛ. 7. РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ /,(r) = /1(-l/T)=e,rf/M/(l-l/T)l то /(2т-1)/(1-1/т) =V2. х- 1 Положим х = 2т-1. Тогда 1 - 1/т = -, а значит, полученное х + 1 соотношение эквивалентно (8.9). § 9. Общая схема решения уравнения пятой степени Оставшаяся часть этой главы непосредственно посвящена решению уравнения пятой степени. Соответствующая конструкция достаточно сложна и опирается на разнообразные факты, причем доказательства многих из них требуют громоздких вычислений. Чтобы помочь читателю разобраться в этой конструкции, мы сейчас опишем общую схему действий: что и с какой целью делается. Пусть /(т), /,(т), /2(т) — определенные в § 6 функции. Положим u = f(r), vc = f(^±^j, «оо =/(5т). Исследование поведения и и v, где символом v обозначена од- п 1 т-1 на из функции vc или v^, при заменах т на т + 2, — и - т т + 1 показывает, что uv и u/v при этих заменах преобразуются следующим образом: т + 2 -1/т т-1 т+1 UV e-™l2uv uv 2 uv и V eW3« V и V V и При этом индекс с функции vc преобразуется точно так же, как преобразуется т. Эти факты будут доказаны в §§ 10-13.
§ 9. ОБЩАЯ СХЕМА РЕШЕНИЯ УРАВНЕНИЯ ПЯТОЙ СТЕПЕНИ 253 Используя эти наблюдения несложно доказать, что (2)' +(»)•_(„).* \v/ \и/ (uvY т. е. аи6 - u5v6 + Auv + и6 = 0. Будем рассматривать и = /(г) как параметр. Для каждого значения этого параметра получаем уравнение шестой степени, корни которого явным образом выражаются через т. Нам бы хотелось сделать то же самое для уравнения у5 + by = а. Оказывается, что этого можно достичь следующим образом. Рассмотрим многочлен пятой степени с корнями ,„ _ fooo - vz) K+l - Vz-l)(vz+2 ~ Vz-2) ,Qn где z = 0, 1, 2, 3, 4. Вычисления показывают, что этот многочлен имеет вид w(w2 + 5)2-ul2 + 64u-12. После замены у(т)= /,У)-/,У) 2 У{Т) /»(т) (»2(г) + 5) (У< } мы приходим к уравнению Итак, для решения уравнения у* + Ъу = а нужно поступить следующим образом. Сначала находим г, для которого /,V)-/2V) = a/V). Эта задача сводится к решению квадратного уравнения и вычислению обратной функции для функции /. Затем по формуле (9.1) вычисляем wz(t), а после этого по формуле (9.2) вычисляем уг(т). Это и есть корни рассматриваемого уравнения. Реализацию этой программы мы начнем с исследования поведения и a v при заменах г (§§ 10-13). Именно с этой частью программы связаны наиболее громоздкие вычисления, но их идейная сторона весьма проста.
254 ГЛ. 7. РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ § 10. Преобразования порядка 5 Матрице ( а ,) можно сопоставить дробно-линейное преобразование т i-> . При этом матрице Т = ( _ ) соответ- ст + a w 1 / ствует преобразование т >-> т + 1, а матрице 5 = ( ~ ] — преобразование т ь-> — 1/т. Легко проверить, что матрице АБ соответствует преобразование т >-> А(Вт), а матрице —£ = = f „ . ) соответствует тождественное преобразование. Формулы (8.1) и (8.2) можно записать следующим образом: т/(Гг) = е**'/]277(г), (10.1) ?7(5т) = л/^77(т). (10.2) Пусть SL2(Z) — группа целочисленных матриц порядка 2, имеющих определитель 1. В § 18 мы докажем, что группа SL2(Z)/±E порождена элементами S и Т. Это означает, что если А е е SL2(Z), то т/(Ат) можно выразить через т/(т) с помощью формул (10.1) и (10.2). Такое явное выражение через элементы матрицы А впервые было получено Дедекиндом (именно поэтому функция т/(т) носит его имя). Аналогичное выражение можно получить и для /(Ат), но при этом может встретиться не только /(г), но и /,(т), и /2(т). Например, /(Гг) = е"7"'/24/,^). Нам понадобятся такие выражения лишь для некоторых конкретных матриц А. Мы выведем их отдельно. Решение уравнения 5-й степени основано на изучении преобразований /(г) ь-> f(Pr), где Р = (Р М —целочисленная матрица с определителем 5. Если А е SL2(Z), то f(APr) выражается через f(Pr), /[(Рт) и f2(Pr). Поэтому следует выяснить, к какому простейшему виду можно привести матрицу Р умножением слева на матрицу А е SL2(Z). Пусть end — такие взаимно простые числа, что ср + dr — = 0. Существуют такие целые числа а и Ь, что ad — be = 1. Это означает, что (■ »)e5L,(Z) и С J) (??) = (£ Я-
§11. ЗАМЕНА т на т + 2 255 причем p's' = 5. Воспользовавшись тем, что /1 п\ (р q\ _ (р q+ns\ VO lAO s) VO s )' матрицу P можно привести к виду ( ~ М где -s/2 ^ q ^ s/2. В итоге получаем, что Р можно привести к одному из следующих видов: F°°=(o l) ' jP°= VO 5J,jP±1=V0 5)'Р±2=(о б)' Следовательно, все функции f(Pr) и /ДРт), где г = 1,2 иР — целочисленная матрица с определителем 5, могут быть выражены через v00(r) = f(P00T), vc = f(Pcr), МРжт), Л(Рст), с = 0,±1,±2, г =1,2. Попытаемся выяснить, как ведет себя vc,c = 0, ±1, ±2 (соответственно v^) при замене т на Вт, Б е 5//2(Z). Функция vc(t) = v(Pcr) заменяется при этом на v(PcBt) (соответственно ^(т) — на v(P00Bt)). Подобрав матрицу А е G SL2(Z) так, чтобы матрица Q = АРСБ (соответственно АР^Б) оказалась равна Р^, Р0, Р±1 или Р±2, можно будет выразить vc(Bt) (соответственно v^Bt)) через f(Qr) или /г(фт). Следующие три параграфа посвящены вычислениям этих выражений для матриц В, соответствующих заменам т на т + 2, —1/т и г-1 г+Г § 11. Замена т на т + 2 При замене т на т + 1 функция /(т) заменяется на e-7"/24/i(T) (см. (8.3)). Чтобы не прибегать к функции /,, ограничимся заменой т на т + 2. При этом, например, г^ = /(5т) переходит в /(5т + Ю) = е-57Гг'/'2д5т) = е"5*''/12!^, а^0 = /(т/5) — в /т + 2\
256 ГЛ. 7. РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ Получились преобразования разного вида: в одном случае есть множитель е-57"/12, а в другом множитель отсутствует. Дело в том, что мы неудачно выбрали функции v0, и±1, и±2 и v^. Можно выбрать их так, что все преобразования будут выглядеть одинаково. Обозначим через Рс матрицу (» д с G Z. Ясно, что ис(т) = v(Pct) для всех с € Z. Так же, как в § 10 показывается, что любую целочисленную матрицу с определителем 5 умножением слева на матрицу из SL2(Z) можно привести к одной из матриц Р Р Р Р Р Р ^ОО' ГС^ ГС^ ГС^ ГС^ ГСЬ1 где с,,...,с5 — полная система вычетов по модулю 5. Это означает, что функция /(Рт) может быть выражена через /(Рхт), МР^т), f(Pc,r), ft(Pcr), i= 1,2, j = 1,...,5. Установим до конца этой главы обозначения «ос = HPoc-r), V0 = f(P0T), V, = /(Р^Г), Щ = f(P-48T), V3 = f(P48Tl V4 = /(-Р-Эб7")- Этот, на первый взгляд странный, выбор функций и(т) объясняется следующим образом. Во-первых, числа 0, ±48, ±96 образуют полную систему вычетов по модулю 5. Во-вторых, функция / имеет период 48, следовательно существует всего 240 различных функций /1 —-— 1. Оказывается, множитель, о котором говорилось в начале этого параграфа, возникающий при преобразовании функции /1 —-— I, зависит от остатка при делении с на 48. В дальнейшем мы будем считать, что индекс с у функции vc является вычетом по модулю 5. Например, под функцией и5(т) соглаше- следует понимать не /1 —-— j, а и0(т) = /1-1. Такое ние позволяет очень просто описать поведение функции v при замене т на т + 2. Функция vc заменяется на е заменяется на е-57"/12^. В самом деле, vx(t + 2) = /(5 (г + 2)) = е-5-/'2/(5т) = е"5*'/",, (т)>
§ 12. ЗАМЕНА г НА -1/т 257 = е -^/^/(^^)=6-5^12^^). Аналогично проверяются остальные случаи. Удивительным образом преобразование индекса с совпадает с преобразованием параметра т. В следующих двух параграфах мы убедимся, что это верно и для замен т на —1/т и т на -. т + 1 § 12. Замена т на —1/т При замене т на — 1/т функция v^ = /(5т) заменяется на Легко проверить, что v0 заменяется на v^. Таким образом, vc заменяется на v_lic при с = 0, оо. Для остальных значений индекса с это тоже верно, но доказательство требует громоздких вычислений. Чтобы выяснить как преобразуются функции vc, где с ф Ф 0, оо, нам придется представлять матрицы из SL2(Z) в виде произведений матриц S и Т. Делать это проще всего для матриц с небольшими элементами, поэтому мы воспользуемся тем, что При заменах т на -1/т функции v±2 и v±l заменяются на еТ5*/12//±2г-1\ и ^/,^-11 т + 48 5 нее нужно привести к одному из шести основных видов дробно Вычисления мы начнем с функции /( —-— ) = v__2. Для
258 ГЛ. 7. РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ -2т - 1 линейную функцию — . Следуя описанному в § 10 алгорит- му приведения, получаем соотношение (-5-2М 5 о) = V0 б)" Поэтому /(=¼^)-'Кт-' где -1 _^ _^ ) = -ST2ST~2S. Следовательно, f[~4^) =f(ST2ST-2sfT 2 ))• Легко проверить, что f(S Т2 S Т~2 S/3) = /(Г2 S Т~2 5/3) = = e-^i2f(ST-2S/3) = e-Wi2+Wi2y(/3) = f(py Таким образом, функция / ( —-— ) заменяется на e-™/*f(lJll\ = e-*Wl+48 _ 1(Л = /(^). Аналогичные вычисления показывают, что функция / при с = ±2. Ясно также, что — 1/с = с при с = ±2. Для функций /( —-— ) вычисления чуть более длинные. Так как U 4М 5 о) ~ (о-5У (б 4/ =STST-*ST-\
§ 13. ЗАМЕНА т НА (т - 1 )/(т + 1) 259 то f(=^j=f(sTST-*ST->(l±* Легко проверить, что f(STST~* ST'1 /3) = /(ГST~4 ST'1 /3) = = e-^l^f^ST^ST^P) = е-^ЫТ-^Т^/З) = = e-^^f^ST-1 /3) = е-9™/24/,(Т-' /3) = e~ni/3f(/3). Jr + 96\ Поэтому функция /1 —-— I заменяется на e-57ri/6-7ri/3r/ T + 4 Ясно, что А так как -+-+-=2ие 2пг = 1, то в результате получаем, что ,.,(4^)--.-/(^)---.-^---- вычисления показывают, что и_, заменяется на и,. Таким образом, при замене т на — 1/т функция г>с заменяется на v_lic при всех с. т-1 § 13. Замена т на - Докажем, что при замене т на функция vc заменяется с — 1 на -\/2/vd, где d = -. Существенную роль при доказатель- С -у- 1 стве этого играет соотношение (8.9): ч-Ч^тН-
260 ГЛ. 7. РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ Для вычислений нам нужно получить соотношение вида: (!-i)(S!!) = ("f)(S$)(:-i). "3" где матрица ( ~ , ] задана, а матрица (а ^ ) € SL2(Z) выбирается так, чтобы элемент (2,2) матрицы ( j? ^ ) был действительно нулевым. После умножения обеих частей равенства (13.1) на матрицу ( . . ) это условие приводит к соотношению (-а + 7) (а + Ъ) + (8 -/3)d = 0. Наиболее просто получаются соотношения для v0 и v^; они имеют вид (l 1М0 5) = \0 l)(o 1М1 l)' (l l) VO 5J = (-4 l) (0 5J (l lj- Следовательно, v2 i^ihA ,(rT—\ f = e4ni/24f U - -4\ J \ т+\ 5 V^ -47ri/24 - ( ! T - ! _ e-47Tl/Z4у ./t + 4^ V5 t+ 1 При выводе второй формулы мы воспользовались тем, что /(z47Tl)=/(VH4"i/M'W Учитывая, что е-7" = — 1, получаем т+\) /г+ 96 у jV5t+1>/ /t-96N
§ 13. ЗАМЕНА т НА (т - 1 )/(т + 1) 261 Для г», и v4 соотношения имеют вид (! -\)(l 4)-(1 !)(i 1)(1 "!)• <'"> Проведем вычисления для и,. При замене т на —— функция /т + 96\ г». = / —-— I заменяется на т- 1 т+1 ч^%л= /»+.+1 rrZi =с-»"/«щ _ е-19тгг'/24 г / а + * ^ _ p-19iri/24 . где а = и /3 = —=—. Соотношение (13.2) означает, что т+ 1 5 л/2 = / 3/3 - 1 /,Г v-2"+1 Легко проверить, что 2/3+[J Jl\-2/3+[ = е™1и12{2-\/(3) = еъ™1и!х{(1). Поэтому /=■ e-19«/24/i(/g) = _e-5«/24/i(/g) = _ V^ '<i т. е. функция г», заменяется на —y/2/v0. Аналогичные вычисления показывают, что v4 заменяется на -л/2/f(5r) = -y/2/v^. Для v2 получаем соотношение (i i) ( о -б) = ( з -г) (о si w J'
262 ГЛ. 7. РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ а затем проверяем, что v2 переходит в — л/2/и2. Аналогично доказывается, что v3 переходит в —\/2/v3. Результаты вычислений, проведенных в §§ 11-13, можно записать в виде следующей таблицы, где е = e~5nt/i2: т + 2 -1/т т-1 т+1 и е-™'/12и и л/2 и иоо еиоо V0 V2 vl vo ev2 uoo V2 V4 Vl ev3 V4 V2 vo V2 ev4 V2 V2 V2 V3 ev0 V3 V2 V3 vt evl vi V2 § 14. Функции, инвариантные относительно замен т на т + 2, — 1/т и т-1 т+1 Функция / (т) сохраняется при заменах т на т + 2 и на т-1 212 — 1/т, а при замене т на она заменяется на — ,„.. .. Если т+1 /24(т) же мы рассмотрим функцию )12 F(r) = /24(т) + -^ = q-1 [](1 + q2k'T+ + 2^^(1+^)-24 = ^-424 + ..., то она сохраняется и при замене т на -. В самом деле, при г + 1 212 этой замене -24 заменяется на /24(т). Можно доказать, что если функция д(т), мероморфная в верхней полуплоскости 1тт > 0, сохраняется при замене т на
§ 15. ВЫВОД МОДУЛЯРНОГО УРАВНЕНИЯ 263 т + 2, -1/т и -, то при некотором ограничении д(т) = т+ 1 = R(F(t)), где R — рациональная функция. Ограничение заключается в том, что функция g(q), где q = етт, должна быть мероморфной. Для мероморфной функции д(т) это условие сводится к тому, что точка q = 0 не является существенно особой, т. е. в оо разложении g(q) = Yl cnqn для отрицательных п все коэффи- п=—оо циенты сп, кроме конечного их числа, нулевые. (Доказательству этого утверждения посвящены §§ 17-20). Кроме того, уравнение F(t) = с разрешимо для всех комплексных с ф 0 (это мы доказываем в § 20). Если R(F(t)) не обращается в бесконечность при всех т, для которых F(t) Ф оо, то R — многочлен. В самом деле, пусть R — дробь с непостоянным знаменателем. Тогда ее знаменатель обращается в нуль при некотором F(t) ф оо. Если же R(F) не обращается в бесконечность и при q = 0 (т. е. F — сю), то Л — константа. Мы воспользуемся этими фактами сначала для вывода модулярного уравнения, а затем и для решения уравнения 5-й степени. § 15. Вывод модулярного уравнения Рассмотрим функции Из результатов §§ 11-13 следует, что они преобразуются следующим образом: т + 2 -1/т т- 1 г+1 А -А А -А В -В В -в
264 ГЛ. 7. РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ Отсюда следует, что функция (А» - Вж) (А - Во) (А,-В,)... (А4 - В4) не изменяется при всех указанных преобразованиях т, поскольку при этих преобразованиях лишь переставляются сомножители. В дальнейшем величины А0 и В0 будут обозначаться через А5 и В5 соответственно. С одной стороны, это не противоречит нашему соглашению, что индекс с понимается как вычет по модулю 5. С другой стороны, использование А5 и В5 традиционно (например, см. [Б11, б]) и нам бы не хотелось нарушать эту традицию. Легко проверить, что A00 = q-X'\\-2q + ...), BQO = q-1'*(l-2q+...). Поэтому А^ - В^ обращается в нуль при q = О, т. е. при Im т —» —у оо. Покажем, что Ас — Вс обращается в нуль при q = О для всех с. Ясно, что u(5t-c) = /(5t) = Voo(t), vc(5r - с) = / (5Т~5С + С) = Нт) = <т). Кроме того, функции А и В не изменяются при замене и на v, а v на и. Поэтому Ас(Ьт-с) = А00(т), Вс(5т-с) = Вж(т). (15.1) А так как условия Im (5т -с)->оои1тг->оо эквивалентны, то Ас — Вс обращается в нуль при q = 0. В результате мы получаем, что функция Ц(АС ~ Вс)2 п°сто- с янна, причем при q = 0 она обращается в нуль. Следовательно, Ас - Вс = 0 для некоторого с. Формулы (15.1) показывают, что тогда Ас - Вс = 0 для всех с. Таким образом, т. е. v6 - uV + Auv + и6 = 0. (15.2)
§ 16. РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ 265 Уравнение (15.2) связывает и = /(т) и v = /(5т); его называют модулярным уравнением. Если фиксировать и = /(т) и рассматривать (15.2) как уравнение относительно v, то его корнями будут v^ и vc, с = 0, ±1,±2. Из теоремы Виета следует, в частности, что ]>с = ^6- (15-3) § 16. Решение уравнения 5-й степени В предыдущем параграфе было показано, что коэффициенты многочлена 6-й степени с корнями vc выражаются через и. Докажем теперь, что коэффициенты многочлена 5-й степени с корнями w0, №,, w2, w3 и w4, где w„ = (Voc - Vz) (Vz+\ - Vz-j)(Vz+2 ~ Vz~2) v5u3 (16.1) тоже выражаются через и, и найдем явный вид этого многочлена. С помощью таблицы преобразований функции vc можно получить следующую таблицу преобразований функций wz: т + 2 -1/г т- 1 т+1 w0 -w2 w0 ~w0 wl -w3 w2 ~w3 w2 -W4 w\ -wA w3 -tw0 WA -w2 W4 -Wl w3 ~Wl на При этом для вычисления преобразований wz при замене т нужно воспользоваться соотношением (15.3). т+1 Рассмотрим многочлен Y[(w - Wi) = w5 + AxwA + A2w3 + A3w2 + A4w + A5. (16.2)
266 ГЛ. 7. РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ Его коэффициенты не обращаются в бесконечность при и ф О, оо. Кроме того, функции А2, А2, А\, А4 и А\ не изменяются при заме- т- 1 нах т на т+2, — 1/т и . Поэтому они являются полиномами _ т+ 1 от и24 + 212u-24 = q~l + 24 + Такой полином отличен от константы лишь в том случае, когда его разложение по степеням q начинается с члена, степень которого не превосходит —1. Вычислим первый член разложения функции wz. Так как оо /(т) =^110+^), fc=l где q = епгт, то первый член разложения vc равен (</)-1^24, где q' = е5пгт при с = оо и q' = е™(т+с)/5 при с Ф оо. Легко проверить, что е-7Г,с/120 = ас, где а = е-47™/5. Поэтому первый член разложения функции wz равен g-5/24g-l/120(a*+l _ a*-l)g-l/120(a*+2 _ Qz-2) _ ^ где A = a2z(a3 — a — a-1 + a_3)/\/5 = a2z, так как a3 -a~a~l + a-3 = 2(cos36° + cos72°) = >/5. Таким образом, разложение функции Ах начинается с члена q_1/1° (или с члена еще более высокой степени). Следовательно, функции А2, А2, А\ и А4 постоянны, а функция А\ линейно зависит от и24 + 2l2u~24 = q~l + 24 + ..., поскольку ее разложение начинается с члена /хд-1, где р, — (a.2a4aGa8)2 = 1. Сравнивая первые члены разложений функций u24 + 212u-24 и А\, получаем ^ = ^ + ^ + ^- Чтобы вычислить константы С, Av А2, А2 и А4, достаточно вычислить значения vc для некоторого конкретного т. Удобнее всего это сделать для т = г. В самом деле, — 1/г = г, поэтому согласно (8.7) получаем /i(0 = /2(0- (16.3) Ясно также, что для чисто мнимого т функции /, fl и /2 принимают положительные значения. Поэтому из (16.3), (6.1) и (6.2)
§ 16. РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ 267 следует, что и = /(») = \/2 Воспользовавшись тем, что (2 - г) (2 + г) = 5, получаем 1^ + ю| = =е-шфА f (г-^\ =е-107гг/24/(г- + 2) = е-«/2/(г)= - г ^2. 4 Аналогично и, = г \/2. 2 При т = г модулярное уравнение принимает вид jj6-oV + o9i) + a6 = 0, (16.4) где о = \/2. Мы уже нашли два корня этого уравнения, а именно, v3 = -ia и v2 = га. Поделив многочлен (16.4) на (v — v2) (v — v3) = = v2 + а2, получим многочлен v* - aV + aV + a7v + a4 = (v - a)2 (v - /3)2, где a+(3 = a и a/3 = -a2. Если предположить, что a > 0 и /3 < О, a(l + v/5) a(l-\/5) то получим a = ——- и /3 = —-*— -. Ясно также, что _1 Ы) J V 5 «» = /(5<) = / -i: =/U =% причем и^ > 0, так как /(т) > 0 для любого чисто мнимого т. Поэтому t/2(l+Vl) t/2(l - >/5) uo = voo = g » ^1=^4 = 2 ' Подставив в (16.1) значения vc при т = г, получим w0 = О, wl = w2 = i v 5, w3 = w3 = —i v 5. Следовательно, при т = г многочлен (16.2) имеет вид w(w-i \/5)2 (w + г \/5)2 = w (w2 + 5)2.
268 ГЛ. 7. РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ Таким образом, А\{г) = 0, т. е. с = -("И(,)+^)) = '(2б+2в, = '2'- Поэтому 26 г>12 / О6 \ Л2 „,24 . Z о7 — I о,12 \ т. е. 4 = ±(«"-^)- Легко проверить, что разложения функций А5 — —w0wxw2wzwA и u12 — 26и~12 начинаются с — д'^2 и д'^2 соответственно. Поэтому Аъ = —и12 + 26и~12, а значит, уравнение (16.2) имеет вид U;(U;2 + 5)2 = n12-64n-12. Из соотношений /8 = /f + /2 и //,/2 = \/2 следует, что 12 64 /24(т)-64_/^/18(т)-/28(т) " Поэтому и «12 /12(т) V /V) Положим Тогда г-гт , ЛУ)-/28(т) /2(т) (ш2(т) + 5) У(т) = ' 2, . ,,■ (16.5) /2(т) (ш2(т) + 5) f8 _ f 8 2/4 52/ = 2/(^ + 5)--71 /2 / 2 /Г - /| Если = а, то корни уравнения у2 + 5у = а (16.6) можно вычислить следующим образом. Сначала вычислим vc(t), с = сю,0,1,2,3,4. Затем по формуле (16.1) вычислим w (т),
§ 17. ОСНОВНАЯ МОДУЛЯРНАЯ ФУНКЦИЯ j'(r) 269 z = О,1,2,3,4. Наконец, по формуле (16.5) вычислим yz(r), z = = О,1,2,3,4. Это и есть корни уравнения (16.6). Чтобы научиться решать уравнение (16.6) с любым параметром а, нужно лишь научиться решать уравнение /?(т)-/28(т) = а/2(т) (16.7) Если учесть, что /8 = /f + /28 и //,/¾ = V2, то после возведения в квадрат это уравнение можно привести к виду /24 - а2/12 - 64 = 0. (16.8) Уравнение (16.8) является квадратным относительно /12. Один его корень дает решение уравнения (16.7), а другой — решение уравнения, полученного из (16.7) заменой а на —а. В § 14 мы сформулировали некоторые свойства функций, т — 1 инвариантных относительно замен т на т + 2, — 1/т и -. т + 1 Этими свойствами мы воспользовались для решения уравнения 5-й степени. Займемся теперь их доказательством. § 17. Основная модулярная функция j(r) В этом параграфе мы построим функцию j'(r), инвариантную относительно замен т на т + 1 и —1/т. Функция j(r) интересна тем, что любую функцию, инвариантную относительно этих замен и удовлетворяющую некоторым условиям мероморфности, можно представить в виде рациональной функции от j. Рассмотрим сначала функции к{т)-вША k4T)-eMil к{т)-е\{о\ту к{т)-вио\ту Они связаны соотношением к2 + к12 = 1 (см. § 3). Полученные в § 7 формулы преобразований тэта-функций по параметру т позволяют проверить, что к'(тУ к(-1/т) = к'(т), к'(-1/т) = к(т).
270 ГЛ. 7. РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ Рассмотрим теперь функцию А(т) = (fc'(r))2. При заменах г на г + 1 и — 1/т величина А переходит в 1/А и 1 — А соответственно. Мы хотим получить функцию з(т), инвариантную относительно этих замен. Для этого достаточно построить рациональную функцию от А, инвариантную относительно замен А на 1/А и 1 —А. Такую функцию можно получить следующим образом. Под действием указанных преобразований число А может переходить лишь в следующие шесть чисел: A I 1_А ± J_ hi А' А' 1 А' 1-А' 1-А' А * Поэтому функция инвариантна относительно указанных преобразований. Часто бывают более удобны две другие функции, полученные из Jl линейными преобразованиями, а именно, Jt+3 (А2-А + 1)3 2 2 А2(1-А)2 ' 27 _ /ЧА+1)(А-2)(А-1/2Г * 32 4 ~ V Л(1 -Л) Для наших целей наиболее удобна функция J2. Положим 3{t)-zj2-z Д2(1_А)2 -г fc4fc/4 - _ q8 (0f ~ ^2^0)3 _ /0-\8(^3 ~^р)3 _ _ //16 _ /8/8\3 _ (/ — 16) — \J J[J2I ~ r24 Воспользовавшись тем, что /24(т) = q_1 ПО + q2A:_1)24, для функции j(r) можно получить следующее разложение: со +3 • 162 - 163q J](l + q2^')-2" = q"2 + 744 + J] Cnqn. n=l
§ 18. ФУНДАМЕНТАЛЬНАЯ ОБЛАСТЬ ФУНКЦИИ j(r) 271 Функция j(t) не изменяется при заменах т на т + 1 и — 1/т. А так как при замене тит|1 величина q = етт заменяется на —q, то функция j(q) четная. Поэтому все коэффициенты сп с нечетными номерами нулевые. § 18. Фундаментальная область функции j(r) Функция j(t) определена в верхней полуплоскости Н = {теС\1тт>0} В точках, получающихся друг из друга преобразованиями т н-> ь-> т± 1 ити-1/т, значения функции j совпадают. Покажем, что множество £> = {retf||r|>l,|Rer|<l/2} обладает следующими двумя свойствами: 1) любую точку т, т € Н, с помощью композиции преобразований тн->т±1 ити-1/т можно перевести в точку т' € Д 2) никакие две различные внутренние точки множества D нельзя перевести друг в друга указанными преобразованиями. Рассмотрим группу G = SL2(Z)/±E и группу G', порожденную преобразованиями 5 и Т. Любой элемент группы G' имеет вид -»££■ С 2) *«»<*>■ Поэтому можно считать, что G' — подгруппа G. Это замечание позволяет доказать, что для фиксированной точки т € Н среди всех точек д'т, где д' € G', можно выбрать ту, у которой мнимая часть максимальна (и нельзя выбрать ту, у которой мнимая часть минимальна, поскольку lim Im I ) = 0). Если д € G, то n->oo yT-lf-nJ /ат + Ь\ т adr + bc? Imr Im (дт) = Im I = Im ст + dj \cT + d\2 \ст + d\2 Поэтому неравенство Im (дт) ^ Imr эквивалентно неравенству |cr + d| ^ 1, которое выполняется лишь для конечного множества пар целых чисел (c,d). Таким образом, величина 1т(^т) принимает конечное множество значений, не меньших Im т (хотя
272 ГЛ. 7. РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ каждое такое значение принимается для бесконечного множества элементов д € G). В итоге получаем, что при поиске элемента д € G, для которого мнимая часть числа дт максимальна, можно ограничиться конечным набором элементов. Эти рассуждения справедливы не только для всей группы G, но и для любой ее подгруппы. Пусть т' — тот из образов точки т е Н под действием группы G', у которого мнимая часть максимальна. Так как преобразования т' t-> т' ± 1 не изменяют мнимую часть т3, то можно считать, что |Rer'| ^ 1/2. Покажем, что в этом случае т' G D, т. е. \т'\ ^ 1. В самом деле, из условия Imr' ^ \т(д'т') следует, в частности, что Im т > Im 1 1 г'|2 Imr', т. е. \т'\ > 1. Докажем теперь свойство 2, причем в уточненном виде. А именно, покажем, что под действием элементов группы G' граничные точки области D отождествляются так, как показано на рис. 41, т. е. под действием преобразований тм т±1 склеиваются лучи QP и SP, дуги QR и SR тоже склеиваются под действием преобразования т (—> —1/т. Никаких других склеек граничных точек не происходит. Отметим, что если бесконечно удаленная точка Р включена в область D, то в результате указанной склейки из D получается сфера, т. е. j можно рассматривать как функцию на сфере. В следующем параграфе будет показано, что j задает взаимно однозначное отображение этой сферы на С U оо. Предположим, что т' — д'т, где д' € € G', причем гит' — две различные точки области D. Можно считать, что , ат + Ъ У cr + d' где С 2) G SL2(Z). Рис. 41 Рассмотрим сначала случай с = 0. В этом случае ad = 1, т. е. преобразование имеет вид т (-> т ±Ь. Случай b = О приводит к совпадающим точкам т и т'. Если b ф 0, то лишь для преобразований т (—> т ± 1 образ множества D пересекается
§ 18. ФУНДАМЕНТАЛЬНАЯ ОБЛАСТЬ ФУНКЦИИ ./'(т) 273 с самим множеством D, причем их пересечение принадлежит множеству |Rer| — 1/2. Предположим теперь, что с фО. Тогда т' = ат + b а 1 ст + d с с^т + с!)' т. е. \т'- а/с\\т + d/c\ = 1/с2. (18.1) Числа а/с и d/c вещественны, поэтому мнимые части чисел т' — — а/с и т+d/c соответственно равны мнимым частям чисел т'ит, а значит, их модули не меньше >/3/2. Следовательно, \с\ ^ 2/>/3. А так как с — ненулевое целое число, то с = ± 1. Поэтому (18.1) можно записать в виде \TTa\\T±d\ = 1. Если т е D и m G Z, то |r + m| ^ 1, причем равенство возможно лишь в следующих случаях: 1)|т| = 1, т = 0; 2)т = е™/3, т = 0,-1; 3)Т = е2™/3, т = 0, 1. Таким образом, в случае с ф 0 возможны склейки только тех точек, модуль которых равен 1, причем для точек, отличных от efe7"/3, возможны склейки лишь по отображению тм — 1/т. Для точек екжг/3 возможны склейки по отображениям тм — 1/т± 1. Попутно мы доказали еще одно уточнение свойства 2, а именно, если т — внутренняя точка области D и дт G D, где ^ G С', то д — тождественное преобразование. С помощью этого свойства можно доказать следующее утверждение. Теорема 1. Группа G = SL2(Z)/ ± Е порождена элементами S и Т, т. е. G' = G. Доказательство. Пусть g — произвольный элемент группы G. Рассмотрим некоторую внутреннюю точку т0 области D. Так как Imr lm{9T) = \cVTdJ2' то дт0 € Я. Поэтому существует такой элемент д' группы G', что д'(дт0) € D. В результате мы получаем, что внутренняя точка т0
274 ГЛ. 7. РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ области D переводится в некоторую точку области D преобразованием д'д € G'. Поэтому д'д — тождественное преобразование, а значит, д = (¢/)_1 EG'. О Если мы хотим, чтобы в области D не было различных точек, получающихся друг из друга преобразованиями группы G, то этого можно добиться, например, исключив из области D луч PQ и дугу QR и оставив точки Р, Q и R. Полученное множество называют фундаментальной областью группы G. Если не различать точки, получающиеся друг из друга преобразованиями S и Т, то фундаментальной областью можно называть и саму область D. Фундаментальную область можно снабдить структурой топологического пространства, исходя из того, что она является фактор-пространством Н по действию группы G. Значение функции У(т) в любой точке г € Н совпадает со значением У(т) в некоторой точке т' £ D. Кроме того, как будет показано в следующем параграфе, значения функции У(т) в различных точках фундаментальной области группы G не могут совпадать. Поэтому D называют также фундаментальной областью функции j(t). § 19. Решение уравнения j(r) = с Функция j(т) = q~2 + 744 + ... не обращается в бесконечность при Imr > 0. Поэтому функция j не имеет полюсов в верхней полуплоскости Н. При Im т = сю функция j{r) принимает бесконечное значение. Решение уравнения j(r) = с мы начнем с вычисления значений у в «вершинах» фундаментальной области, т. е. в точках i, е = е7"/3 и е2. Напомним, что *> = ('"-£)" и /(*) = \/2 (см. § 13). Поэтому у (г) = 123 = 1728. Для вычисления У(е) = У(е)2 можно воспользоваться тем, что е= 1 - 1/е. В самом деле, из этого соотношения следует, что /(е) = /(1-1/е) =в-"/м/а(е), /i(e) = A (1 - * А) = е-«/24/(£).
§ 19. РЕШЕНИЕ УРАВНЕНИЯ У(т) = с 275 Поэтому >/2 = /И Л И ЛИ = /3И а значит, /24(е) = (v^)8 = = 16. Следовательно, j(e) = 0. Теорема 1. Каждое значение с функция j(r) принимает в фундаментальной области ровно один раз. Доказательство. Предположим сначала, что с отлично от 0 и 1728. Если на границе фундаментальной области принимается значение с, то фундаментальную область можно изменить так, как показано на рис. 42. Точнее говоря, если значение с принимается в некоторой точке границы, то мы вырезаем окрестность U этой точки и приклеиваем к D образ окрестности U при отображении 5 или Г^1. Такую операцию нельзя проделать для «вершин», но они и не могут встретиться, поскольку с ф О,1728. Если мероморфная функция g(z) не имеет полюсов в области G и не имеет нулей на ее границе dG, то количество нулей функции д, лежащих внутри области G, равно Рис. 42 2тгг J dG 9(*) dz. В самом деле, пусть g(z) = c0(z — a)r + с{ (z — a)r+l + Тогда g'(z)/g(z) = r(z-arl + .... Поэтому сумма вычетов особых точек функции д'/д, лежащих в области G, равна количеству нулей функции д с учетом их кратностей. Возьмем в качестве G область, изображенную на рис. 43, а в качестве д возьмем функцию j(z) — с. Легко проверить, что г'о-1/2 J Л*)-с )j(z)-c J dG Р, io+l/2
276 ГЛ. 7. РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ В самом деле, j(z +1)= j(z), поэтому интегралы по отрезкам Р,<5 и SP2 взаимно уничтожаются. Кроме того j(—\jz) = j(z), Рис. 43 Рис. 44 поэтому интегралы по дугам QR и RS тоже взаимно уничтожаются. Это остается верным и в том случае, когда нам приходится изменять границу фундаментальной области. Так как j(т) = q~2 + 744 +_... = е~2жгт + 744 + ..., то при достаточно больших а для z € 1 1 га--,га+- имеем lim а—юо d\n(J(z) - с) = d(—2niz + ...) = —2nidz + .... Следовательно, ia-i/2 ^-. f dln(j-(*)-c)=l. /7гг J ia+l/2 В случае, когда с — 0 или 1728, можно поступить следующим образом. Рассмотрим область G, изображенную на рис. 44. (Если на границе области принимается значение с, то область нужно подправить, как это делалось раньше.) Количество нулей функции j(z) — с, лежащих в области G, равно г(г') г(е) ~2 3~' 8G где г(г') и г(е) — кратности нулей функции j(z) — с в точках г и е соответственно. Для доказательства этого утверждения достаточно заметить, что для точки i интеграл берется по половине _l_ Cj'(z)dz = 1m J j(z) — с 1
§ 21. ФУНКЦИИ, ИНВАРИАНТНЫЕ ОТНОСИТЕЛЬНО ЗАМЕН т НА т + 2 И -1/т 277 окружности, а для точек е и е2 в сумме интеграл берется по трети окружности, причем окружность обходится по часовой стрелке, что приводит к знаку минус. Если с = О или 1728, то г(е) ф О или г(г) ф 0. В этом случае количество нулей функции j(r) — с, лежащих в области G, строго меньше 1, т. е. j(r) ф с при т е G. Отметим также, что если с = О, то г(е) = 3, а если с = 1728, то г(г) = 2. Это означает, что в точке е функция /(т) имеет нуль кратности 3, а в точке г функция j(r) — 1728 имеет нуль кратности 2. □ § 20. Функции, инвариантные относительно замен тнат+1 и — 1/т Любая функция д(т), определенная в верхней полуплоскости Н и инвариантная относительно замен т на т+ 1 и — 1/т, представима в виде G(j(t)), где G — некоторая функция. В самом деле, как было показано в предыдущем параграфе, функция j'(t) задает взаимно однозначное отображение D U оо в С U оо. Поэтому существует обратное отображение У-1: CUoo —у DUoo. Положим G(z) = g(j-\z)). Тогда G(j(r)) = д(э~Ъ'(т))) = д(т). Предположим теперь, что функция д, рассматриваемая как функция от q = ешт, мероморфна в круге \q\ ^ 1. Тогда G — рациональная функция. В самом деле, так как функция д мероморфна, то особые точки функции G в конечной области могут быть лишь полюсами. Значение j = оо соответствует q = О, поэтому в соответствии с условием точка оо не может быть существенно особой для функции G. Следовательно, функция G не имеет в С U оо особых точек, отличных от полюсов. Вычтем из G главные части ее разложений в особых точках. В результате получим функцию, не имеющую особых точек в С U оо, т. е. константу. А так как все главные части разложений функции G в особых точках состоят из конечного числа членов, то G — рациональная функция. § 21. Функции, инвариантные относительно замен т на т + 2 и —1/т Для решения уравнения 5-й степени нам потребовалось описание функций, инвариантных относительно замен т на т + 2,
278 ГЛ. 7. РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ — 1/т и -. Пока что мы описали лишь функции, инвариантные относительно замен т на т + 1 и —1/т. Но после этого уже легко получить описание интересующих нас функций. Напомним, что j(r) = (/24(т) - 16)3//24(т). Функция /24(т) инвариантна относительно замен т на т + 2 и —1/т. В классе функций, инвариантных относительно этих замен, она играет ту же роль, какую играет функция j(r) в классе функций, инвариантных относительно замен гнаг+1 и —1/т. А именно, любая функция д, инвариантная относительно замен т на т + 2 и -1/т, рационально выражается через /24 (в том случае, когда функция д, рассматриваемая как функция от q = ег7ГТ, мероморфна в круге |д| < 1). Доказать это можно тем же способом, которым мы воспользовались в § 20. Для этого нужно доказать следующее утверждение. Теорема 1. Положим D, = {т € #||т| > 1, | Иет| ^ 1}. Тогда а) для группы Gv порожденной преобразованиями т н-► |—► т + 2 и т н-> —1/т, множество D, является фундаментальной областью. б) Каждое ненулевое значение функция /24 принимает в области D, ровно один раз. Доказательство. Пусть т' — тот из образов точки т € € Я под действием группы G,, у которого мнимая часть максимальна (существование такой точки т1 доказано в § 18). Так как преобразование т7 i-> т'±2 не изменяет мнимую часть т', то можно считать, что {Кет'] ^ 1. Покажем, что в этом случае т' е Du . е. \т'\ ^ 1. В самом деле, по условию 1тт'>1т(^=р^1тт', поэтому \т'\ ^ 1. Мы показали, что любую точку т е Н действием элемента g € G, можно перевести в точку т' е £>,. Чтобы доказать, что различные внутренние точки области Dx нельзя перевести друг в друга действием элементов группы G,, достаточно проверить утверждение б).
§ 21. ФУНКЦИИ, ИНВАРИАНТНЫЕ ОТНОСИТЕЛЬНО ЗАМЕН т НА т + 2 И -1 /т 279 Пополним область £>, (рис. 45) точками ±1. Этим точкам соответствует q = — 1. Для такого значения q получаем оо /» = <г'ПО+ ч2к~1Г = 0, причем этот нуль бесконечнократныи, т. е. для функции j(r) точки т = ±1 существенно особые. В области D, функция j(r) А lmz = a Рис. 45 Рис. 46 не имеет полюсов, поэтому в области Dl функция / (т) не обращается в нуль. Кроме того, при Imr —» оо функции j(r) и /24(т) принимают значение оо. Остается рассмотреть ненулевые значения функции /24(т). Пусть G — область, изображенная на рис. 46. Тогда при сфО, учитывая изображенные на рис. 45 склейки, получаем га-1/2 jdln(/24(*)-c)= | d\n(f\z)-c). dG F24/ га-Н/2 А так как /2 (т) = q '+... = е~ — „-1 + ..., то поэтому dln(/Z4(z) -с) = d(-iriz + ...) = —itidz + ..., га-1/2 lim [ d\n(f24(z)-c)= 1. а—юо J га-И/2 Это означает, что в области Dl функция / (т) принимает каж дое ненулевое значение ровно один раз. □
280 ГЛ. 7. РЕШЕНИЕ УРАВНЕНИЯ 5-Й СТЕПЕНИ Предположим теперь, что функция д, удовлетворяющая условию мероморфности, инвариантна не только относительно п , 1 Г — 1 замен т на т + 2 и — 1/т, но и относительно замены т на -. 1 т+ 1 Тогда д(т) = Д(/24(т)), где R — такая рациональная функция, что R (/24 (^j)) = Д</»). т. е. Я (р) = Д(/24). Положим /24(т) = х, 212 = о. Пусть fc=-oo Тогда х*. Ю=Е<^ **-*, поэтому cfcofc = c_fc, а значит, Я(Ж) = Со + Ес,(^ + (^). Рассматривая разности 1жН— ) - I xfc + I — ) ), легко дока- зать индукцией по к, что xr + I — J полиномиально выражается а, / а\ через х + -. Таким образом, Rix) = G [х + - , где G — неко- х \ х/ торая функция. Так как функция R рациональна, то функция G не имеет особых точек, отличных от полюсов, поэтому и G — рациональная функция. В итоге получаем, что функция д(т) ра- 212 ционально выражается через функцию /24(т) -\—--—. § 22. Заключительные замечания Приведенное нами решение уравнения 5-й степени следует в основном знаменитой книге Вебера [Б11, б]. У Вебера значительную часть изложения занимает мотивировка, поясняющая происхождение этого решения. А именно, он вычисляет группу
§ 22. ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ 281 Галуа модулярного уравнения (это вычисление восходит к Галуа) и показывает, что уравнение 5-й степени в форме Бринга можно представить в виде резольвенты Галуа модулярного уравнения. Это означает, что решение уравнения 5-й степени сводится к решению модулярного уравнения, корни которого известны. Как уже упоминалось, первое решение уравнения 5-й степени с помощью эллиптических модулярных функций опубликовал Эрмит в 1858 г. Тогда же аналогичные результаты получили Кронекер, Бриоски и Жубер. Об их исследованиях и о своем собственном подходе к решению уравнения 5-й степени в 1884 г. Клейн написал книгу «Лекции об икосаэдре и решении уравнения 5-й степени» [Б 16]. Вебер писал свою книгу после них, поэтому его изложение просто и понятно. Для корней общего уравнения n-й степени известно выражение через тэта-константы (но не от одной переменной, а от нескольких). Такое решение уравнения степени п содержится в статье X. Умемуры, опубликованной как приложение к книге Д. Мамфорда «Лекции о тэта-функциях» [Б20]. Решение алгебраических уравнений можно получить не только с помощью тэта-функций, но и с помощью других специальных функций. Многочисленные исследования были посвящены решению алгебраических уравнений посредством гипергеометрических функций и их обобщений. Этот вопрос обсуждается в упомянутой книге Клейна. Пожалуй, наиболее глубокие результаты, относящиеся к этому направлению, содержатся в монографиях Лахтина [Б 18]. Современный обзор можно найти в книге Белардинелли [Б4].
СПИСОК ЛИТЕРАТУРЫ А. Классические работы 1. Абель Н. X. (AbelN. Н.) (Euvres completes du Niels Henrik Abel. — Christiania, 1881. 2. Бернулли И. (Bernoulli I.) Opera Omnia. T. I—IV. — Lausannae; Genevae: Bosquet, 1742. 3. Гаусс К. Ф. (Gauss С. F.) а) Труды по теории чисел. — М.: АН СССР, 1959. б) Werke. Bd. 10. — Gottingen, 1917. 4. Диофант (Diophant) Арифметика и книга о многоугольных числах.—М.: Наука, 1974. В. Жор дан К. (Jordan С.) Traite des substitutions et des equations algebriques. — Paris, 1870. 6. Л а г p а н ж Ж. Л. (Lagrange J. L.) Reflexions sur la resolution algebrique des e'quations // Mem. Acad. Berlin. — 1770-71. 7. Л e ж а н д p A. M. (Legendre A. M.) Traite' des fonctions elliptiques et des integrates euleriennes. V. 1-3. — Paris, 1825-1832. 8. Пуанкаре A. (Poincare H.) Sur les propriete's des courbes algebriques planes // J. Liouville. — 1901.— V. 7.-P. 161-233. 9. Руффини П. (Ruffini P.) Theoria generale delle equazioni in cui si dimostra impossibili la soluzione algebraica delle equazioni generali di grado superiore al quarta. — Bologna, 1799. 10. С e p p ё Ж. A. (Serret J. A.) а) Memoire sur la representation geometrique des fonctions elliptiques et ul- tra-elliptiques // J. math, pures et appl.—1845. —V. 10.— P. 257. б) De'velopments sur une classe d'equations relatives a la representation ge'ometrique des fonctions elliptiques // J. math, pures et appl. — 1845. — V. 10. —P. 357. в) Note sur les courbes elliptiques de la premiere espece // J. math, pures et appl.—1845. —V. 10. —P. 421. 11. Фаньяно Дж. (Fagnano G. С.) Opere Matematiche del Marchese Guilio Carlo de'Toschi di Fagnano. V. 1-3.-Publ. dai Soci V. Volterra, G. Loria, D. Gamboli, 1911-1913. 12. Чир н ray 3 Э. (Tschirnhausen E.) Nova metodus auferendi omnes terminos intermedios ex data aequatione // Acta eruditoru.—T. 2. — Leipzig, 1689.
СПИСОК ЛИТЕРАТУРЫ 283 13. Эйлер Л. (EulerL.) а) Интегральное исчисление. Т. I.—М.: Гостехиздат, 1956. б) Opera Omnia, Ser. I. Т. XXI. — Leipzig; Berlin: Teubner, 1913. 14. Эрмит Ш. (Hermite Ch.) а) Sur la resolution de l'equation du cinquieme degre // С. r. Acad. Sci. Paris.—1858. —V. 46. б) Sur l'equation du cinquieme degre // С. r. Acad. Sci. Paris. — 1865. — V. 61; 1866. —V. 62. 15. Якоби К. Г. (Jacobi С. G. J.) Gesammelte Werke. —Berlin, 1881-1891. Б. Основные руководства 1. Айерлэнд К., Роузен М. И. (Ireland К., Rosen М.) Классическое введение в современную теорию чисел. — М.: Мир, 1987. 2. Алгебраическая теория чисел/Ред. Дж. Касселс, А. Фрёлих. — М.: Мир, 1969. 3. Ахиезе р Н. И. Элементы теории эллиптических функций. — М.: Наука, 1970. 4. Белардинелли Дж. (Belardinelli G.) Fonctions hypergeometriques de plusieurs variables et resolution analitique des equations algebriques generates.— Paris: Gauthier-Villars, 1960. б. Бе рже M. (Berger M.) Геометрия. — М.: Мир, 1984. 6. Берне а йд У. С, П ант он А. У. (Burnside W. S., Panton A. W.) Theory of equation. V. 1, 2. —Dublin, 1928. 7. Боревич 3. И., Шафаревич И. Р. Теория чисел. — М.: Наука, 1995. 8. Брискорн Э., Кнёррер X. (Brieskorn Е., Knorrer Н.) Plane algebraic curves. — Birkhauser, 1986. 9. Бурбаки H. (Bourbaki N.) Алгебра. Многочлены и поля. Упорядоченные группы. — М.: Наука, 1965. 10. Ващенко-Захарченко М. Е. Высшая алгебра. Теория подставлений и ее приложения к алгебраическим уравнениям. — Киев: Типогр. Имп. ун-та Св. Владимира, 1890. 11. В е б е р Г. (Weber Н.) а) Lehrbuch der Algebra. Bd. 2. Gruppen. Lineare Gruppen. Anwendungen der Gruppen Theorie. Algebraische Zahlen. — Braunschweig, 1899. б) Lehrbuch der Algebra. Bd. 3. Elliptische Funktionen und algebraische Zahlen. —Braunschweig, 1908. 12. Вейль A. (Weil A.) Эллиптические функции по Кронекеру и Эйзенштейну. — М.: Мир, 1978. 13. Граве Д. А. Элементы высшей алгебры. — Киев: Типогр. Имп. ун-та Св. Владимира, 1914.
284 СПИСОК ЛИТЕРАТУРЫ 14. Гриффите Ф., Харрис Дж. (Griffiths Ph., Harris J.) Принципы алгебраической геометрии. — М.: Мир, 1982. 15. Гурвиц А., Курант P. (Hurwitz A., Courant R.) Теория функций. — М.: Наука, 1968. 16. Клейн Ф. (Klein F.) Лекции об икосаэдре и решении уравнений пятой степени. — М.: Наука, 1989. 17. Ко блиц Н. (KoblitzN.) Введение в эллиптические кривые и модулярные формы. — М.: Мир, 1988. 18. Л ахти н Л. К. а) Алгебраические уравнения, разрешимые в гипергеометрических функциях.—М., 1893. б) Дифференциальные резольвенты алгебраических уравнений высших степеней.— М., 1896. 19. Л е н г С. (Lang S.) а) Эллиптические функции. — М.: Наука, 1984. б) Основы диофантовой геометрии. — М.: Мир, 1986. 20. М а м ф о р д Д. (Mumford D.) Лекции о тэта-функциях. — М.: Мир, 1988. 21. Мор дел л Л. Дж. (Mordell L. J.) Diophantine equations. — New York: Academic Press, 1969. 22. Постников M. M. Теория Галуа. — M.: Физматлит, 1963. 23. Р о б е р т A. (Robert А.) Elliptic curves // Lecture Notes in Math. — Springer, 1973.— V. 326. 24. Сальмон Дж. (Salmon G.) A traite on higher plaine curves: intend as a sequel to a traition on conic. — Dublin: Smith, 1852. 25. С e p p e Ж. A. (Serret J. A.) Cours de calcul differentiel et inte'gral. V. 1-3.—Paris: Gautier-Villars, 1879 (2me ed.). 26. Силверман Дж. X. (Silverman J. H.) а) The arithmetic of elliptic curves. — Springer, 1986. б) Advanced topics in the arithmetic of elliptic curves. — Springer, 1994. 27. Степанов С. A. Арифметика алгебраических кривых. — М.: Наука, 1991. 28. Уиттекер Э. Т., В а тс он Дж. Н. (Whittaker Е. Т., Watson G. N.) Курс современного анализа. Т. 1, 2. — М.: Физматгиз, 1963. 29. У о к е р P. (Walker R. J.) Алгебраические кривые. — М.: ИЛ, 1952. 30. Ф р и к е P. (Fricke R.) Die elliptischen Funktionen und ihre Anwendungen. Bd. 1,2. — Leipzig; Berlin: Teubner, 1916-1922. 31. Хьюзмоллер Д. (Husemoller D.) Elliptic curves. — Springer, 1987.
СПИСОК ЛИТЕРАТУРЫ 285 32. Чеботарев Н. Г. Теория Галуа. — Гостехиздат, 1936. 33. Эр мит Ш. Курс анализа. — Гостехиздат, 1936. В. Избранные статьи L Бёрч Б. Дж. (Birch В. J.) Conjectures on elliptic curves // Theory of Numbers/Proc. of Symp. in Pure Math.—Pasadena, 1963 —V. 8. 2. Бёрч Б. Дж., Суиннертон-Дайер X. П. Ф. (Birch В. J., Swinnerton-Dyer Н. P. F.) Notes on elliptic curves // J. Reine und Angew. Math. — 1963. — Bd. 212. — S. 7-25; 1965. —Bd. 218. —S. 79-108. 3. Be иль A. (Weil A.) Sur un theoreme de Mordell // Bull. $ci. Math. 2. — 1930. — V. 54. — P. 182-191. 4. Грюневальд Ф. Й., Циммерт P. (Griinewald F. J., Zimmert R.) Uber einige rationale elliptische Kurven mit freiem Rang > 8 // J. Reine und Angew. Math. — 1977. — Bd. 296. — S. 100-107. 5. Даммит Д. С. (Dummit D. S.) Solving solvable quintics // Math. Сотр. — 1991. — V. 57. —P. 387-401. 6. Иг уса Дж. (Igusa J.) On the transformation theory of elliptic functions // Amer. J. Math. — 1959. — V. 81. —P. 436-452. 7. Йел П. Б. (Yale P. В.) Automorphisms of the complex numbers // Math. Mag. — 1966. — V. 39. — P. 135-141. 8. Кассе л с Дж. В. С. (Cassels J. W. S.) Diophantine equations with special reference to elliptic curves // J. London Math. Soc. — 1966. — V. 41 —P. 193-291. [Имеется перевод: Диофантовы уравнения со специальным рассмотрением эллиптических кривых // Математика. Сб. переводов. 1968. —Т. 12:1. —С. 113-160; Т. 12:2. —С. 3-48.] 9. Ко уте Дж., Уайлс Э. (Coates J., Wiles А.) On the conjecture of Birch and Swinnerton-Dyer // Invent. Math. — 1977. — V. 39, №3. —P. 223-251. 10. Кэли A. (Cayley A.) On a new auxilary equation in the theory of equations of the first order // Phil. Trans. R. Soc —London, 1861.—V. 91, P. 263-276. 11. Мазур Б. (Mazur В.) Rational points on modular curves // Lecture Notes in Math. — Springer, 1976.—V. 601. 12. Мельников И. Г. Задача деления лемнискаты // Уч. зап. ЛГПИ — 1958. — Т. 197. — С. 20-42.
286 СПИСОК ЛИТЕРАТУРЫ 13. Морде л л Л. Дж. (Mordell L. J.) а) On the rational solutions of the indeterminate equations of the third and fourth degrees // Proc. Cambr. Phil. Soc —1922. —V. 21. —P. 179-192. б) The infinity of rational solutions of y2 = x3 + к // J. London Math. Soc. — 1966.—V. 41. —P. 523-525. в) On the magnitude of the integral solutions of the equation ax2 + by2+cz2 = = 0// J. Number Theory. —1969.—V. 1.-P. 1-3. 14. Роузен M. И. (Rosen M. I.) Abel's theorem on the lemniscate // Amer. Math. Monthly. — 1981. — V. 88. —P. 387-395. 15. Спирман Б. К., Вильяме К. С. (Spearman В. К., Williams К. S.) Characterization of solvable quintics i5 + ax + b // Amer. Math. Monthly. — 1994. —V. 101. —P. 986-992. 16. Сундарарджан Т. (Soundararajan Т.) On the automorphisms of the complex number field // Math. Mag. — 1967. — V. 40. —P. 213. 17. Тейлор P., Уайлс Э. (Taylor R., Wiles A.) Ring-theoretic properties of certain Hecke algebras // Ann. Math. — 1995. — V. 141. —P. 552-613. 18. Тейт Дж. (Tate J.) Arithmetic of elliptic curves // Invent. Math. — 1974. — V. 23. — P. 179-206. 19. Уайлс Э. (Wiles A.) Modular elliptic curves and Fermat's Last theorem // Ann. Math. — 1995. — V. 141. —P. 443-551. 20. X а с с e Г. (Hasse H.) Abstrakte Begriindung der komplexen Multiplikation und Riemannsche Ver- mutung in Funktionenkorpern // Abh. Math. Sem. Hamburg. — 1934. — Bd. 10. —S. 325-348. 21. Хольцер Л. (Holzer L.) Minimal solutions of Diohpantine equations // Can. J. Math. — 1950. — V. 11. —P. 238-244.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Амплитуда 69 Базис трансцендентности ПО Ветвь 134 Гессиан 25 Гипотеза Бёрча, Суиннертон-Дайера 181 — Таниямы 186 для полустабильных эллиптических кривых 191 Группа диэдральная 235 — кручения 172 — метациклическая 235 — транзитивная 231 — Фробениуса 235 Закон сложения на кубической кривой 10, 22, 35 Инволюция 125 Интеграл эллиптический 58 в форме Вейерштрасса 63 в форме Лежандра 63 первого рода 64 второго рода 64 третьего рода 64 Касательная к кубической кривой 23 Кондуктор эллиптической кривой 191, 194 Кривая алгебраическая неприводимая 130 плоская 9 — Гессе 25 — кубическая 10 неособая 29 особая 34 — Серре 87, 135 Кривая эллиптическая 43 Кривая эллиптическая, ассоциированная с кривой Sp 142 полустабильная 191 модулярная 190, 196 Лемма Цорна 107 Лемниската 93 Многочлен симметрический 205 элементарный 205 Множество максимальное 107 — замкнутое по Цорну 107 Норма р-адическая 191 Образ алгебраический 133 Область фундаментальная 274 Овалы Кассини 93 Оператор Гекке 195 Параллелограмм фундаментальный 44 Параметризация 133 — приводимая 134 — неприводимая 134 — эквивалентная 134 — эллиптической кривой 35, 37, 54 Плоскость проективная 19 комплексная 19 Поле Галуа 215 — нормальное 215 — рациональности 215 Порядок ветви 134 — точки 162 — эллиптической кривой 47 Преобразование квадратичное 132 — Чирнгауза 222 Прмитивный корень 97 по простому модулю 97 n-й степени из единицы 211 Прямая иррегулярная 132
288 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Раздутие 132 Ранг эллиптической кривой 172 Редукция кривой 180 Резольвента Лагранжа 208 Результант 27 Решение рациональное 145 Теорема Абеля о делении лемнискаты 95 о неразрешимости 220 — Веиерштрасса 75 — Лежандра 61 — Мазура 184 — Морделла 171 — о симметрических многочленах 205 — Паппа 14 — Паскаля 13 — Пикара 75 — Рибета 198 — Серре 88 — сложения алгебраическая 73 для эллиптических интегралов 65 — Фаньяно 80 — Ферма 186 — Хольцера 154 — Эйзенштейна 120 Точка возврата 190 — параболическая 188 — перегиба 24 — неособая 23 — неподвижная 125 — самопересечения 190 — фундаментальная 132 — г-кратная 131 обыкновенная 132 Тэта-функция 240 Умножение комплексное 142 Уравнение в глобально минимальной форме 192 — деления лемнискаты 110 — диофантово 145 — минимальное для простого числа 192 — модулярное 265 — пятой степени в форме Бринга 224 — разрешимое в радикалах 215 — п-й степени общее 215 Форма Веиерштрасса неособой кубической кривой 29 — модулярная веса к 194 — параболическая 194 — собственная 196 Формула Эйлера 23 Функции эллиптические Якоби 70 Функция Веиерштрасса 49 — двоякопериодическая 44, 239 — мероморфная 44 — модулярная j(r) 269 — эллиптическая 44 Цепь 107 Число конгруэнтное 158 — р-целое 191 ./-инвариант 143 L-функция 180 у-функция Дедекинда 247