Автор: Прасолов В.В.  

Теги: алгебра   математика  

ISBN: 5-900916-73-1

Год: 2001

Текст
                    Прасолов В. В.
Многочлены
Издание второе,
стереотипное
мцнмо
2001


УДК 512.62 П70 ББК 22.144 Прасолов В. В. П70 Многочлены. — 2-е изд., стереотипное. — М.: МЦНМО, 2001.^336 с: ил. ISBN 5-900916-73-1 В книге изложены основные результаты исследований по теории многочленов, как классические, так и современные. Большое внима- внимание уделено 17-й проблеме Гильберта о представлении неотрицательных многочленов суммами квадратов рациональных функций и ее обобще- обобщениям. Теория Галуа обсуждается прежде всего с точки зрения теории многочленов, а не с точки зрения обшей теории расширения полей. Для студентов, аспирантов, научных работников — математиков и физиков. ББК 22.144 ISBN 5-900916-73-1 © В. В. Прасолов, 1999, 2001. © МЦНМО, 1999, 2001. Оглавление Предисловие к первому изданию 8 Глава 1. Корни многочленов 9 1. Неравенства для корней 9 1.1. Основная теорема алгебры 9 1.2. Теорема Коши 10 1.3. Теорема Лагерра 13 1.4. Аполярные многочлены 15 1.5. Проблема Рауса-Гурвица 20 2. Корни многочлена и его производной 21 2.1. Теорема Гаусса-Люка 21 2.2. Корни производной и фокусы эллипса 23 2.3. Локализация корней производной 25 2.4. Гипотеза Сендова-Илиева 28 2.5. Многочлены, у которых совпадают корни их самих и их производных 30 3. Результант и дискриминант 30 3.1. Результант 30 3.2. Дискриминант 34 3.3. Вычисление некоторых результантов и дискриминантов 35 4. Разделение корней 38 4.1. Теорема Фурье-Бюдана 38 4.2. Теорема Штурма 42 4.3. Теорема Сильвестра 43 4.4. Разделение комплексных корней 47 5. Ряд Лагранжа и оценки корней многочлена 49 5.1. Ряд Лагранжа-Бюрмана 49 5.2. Ряд Лагранжа и оценки корней 52 Глава 2. Неприводимые многочлены 58 6. Основные свойства неприводимых многочленов 58 6.1. Разложение многочленов на неприводимые множители . 58 6.2. Признак Эйзенштейна 61 6.3. Неприводимость по модулю р 63 7. Признаки неприводимости 64 7.1. Признак Дюма 64 7.2. Многочлены с доминирующим коэффициентом 68 7.3. Неприводимость многочленов, принимающих малые значения 71
Оглавление 8. Неприводимость трехчленов и четырехчленов 72 8.1. Неприводимость многочленов хп ± хт ± хр ± 1 72 8.2. Неприводимость некоторых триномов 77 9. Теорема неприводимости Гильберта 78 10. Алгоритмы разложения на неприводимые множители 82 10.1. Алгоритм Берлекэмпа 82 10.2. Факторизация с помощью леммы Гензеля 85 Глава 3. Многочлены специального вида 91 11. Симметрические многочлены < 91 11.1. Примеры симметрических многочленов 91 11.2. Основная теорема о симметрических многочленах .... 93 11.3. Неравенства Мюрхеда 95 11.4. Функции Шура 98 12. Целозначные многочлены 99 12.1. -Базис целозначных многочленов 99 12.2. Целозначные многочлены от многих переменных 102 12.3. g-аналог целозначных полиномов 103 13. Круговые многочлены 104 13.1. Основные свойства круговых многочленов 104 13.2. Формула обращения Мёбиуса 105 13.3. Неприводимость круговых многочленов 107 13.4. Выражение Фтп через Ф„ 108 13.5. Дискриминант кругового многочлена 109 13.6. Результант пары круговых многочленов 110 13.7. Коэффициенты круговых многочленов 112 13.8. Теорема Веддерберна 113 13.9. Многочлены, неприводимые по модулю р 114 14. Многочлены Чебышева 116 14.1. Определение и основные свойства 116 14.2. Ортогональные многочлены 121 14.3. Неравенства для многочленов Чебышева 124 14.4. Производящая функция 126 15. Многочлены Бернулли 129 15.1. Определения многочленов Бернулли 129 15.2. Теоремы дополнения, сложения аргументов и умножения 132 15.3. Формула Эйлера 134 15.4. Теорема Фаульгабера-Якоби 135 15.5. Арифметические свойства чисел и многочленов Бернулли 137 Оглавление Глава 4. Некоторые свойства многочленов 151 16. Многочлены с предписанными значениями 151 16.1. Интерполяционный многочлен Лагранжа 151 16.2. Интерполяционный многочлен Эрмита 154 16.3. Многочлен с предписанными значениями в нулях производной 155 17. Высота многочлена и другие нормы 158 17.1. Лемма Гаусса 158 17.2. Многочлены от одной переменной 160 17.3. Максимум модуля и неравенство Бернштейна 164 17.4. Многочлены от многих переменных 167 17.5. Неравенство для пары взаимно простых многочленов . . 170 17.6. Неравенство Миньотта 171 18. Уравнения для многочленов 174 18.1. Диофантовы уравнения для многочленов 174 18.2. Функциональные уравнения для многочленов 181 19. Преобразования многочленов 187 19.1. Преобразование Чирнгауза 187 19.2. Уравнение пятой степени в форме Бринга 189 19.3. Представление многочленов в виде сумм степеней линейных функций 190 20. Алгебраические числа 194 20.1. Определение и основные свойства 194 20.2. Теорема Кронекера 196 20.3. Теорема Лиувилля 199 Глава 5. Теория Галуа 203 21. Теорема Лагранжа и резольвента Галуа 203 21.1. Теорема Лагранжа 203 21.2. Резольвента Галуа 207 21.3. Теорема о примитивном элементе 212 22. Основы теории Галуа 214 22.1. Соответствие Галуа 214 22.2. Многочлен с группой Галуа 55 219 22.3. Простые радикальные расширения 220 22.4. Циклические расширения 221 23. Решение уравнений в радикалах 223 23.1. Разрешимые группы 223
Оглавление 23.2. Уравнения с разрешимой группой Галуа 225 23.3. Уравнения, разрешимые в радикалах 226 23.4. Абелевы уравнения 229 23.5. Критерий Абеля-Галуа разрешимости уравнения простой степени 233 24. Вычисление групп Галуа 239 24.1. Дискриминант и группа Галуа 239 24.2. Резольвентные многочлены 239 24.3. Группа Галуа по модулю р 243 Глава 6. Идеалы в кольцах многочленов 246 25. Теоремы Гильберта о базисе и о нулях 246 25.1. Теорема Гильберта о базисе 246 25.2. Теорема Гильберта о нулях 248 25.3. Многочлен Гильберта 252 25.4.' Однородная теорема Гильберта о нулях для р-полей . . . 260 26. Базисы Грёбнера 263 26.1. Многочлены от одной переменной 263 26.2. Деление многочленов от многих переменных 264 26.3. Определения базисов Грёбнера 265 26.4. Алгоритм Бухбергера 268 26.5. Приведенный базис Грёбнера 270 Глава 7. Семнадцатая проблема Гильберта 272 27. Суммы квадратов: введение 272 27.1. Некоторые примеры 272 27.2. Теорема Артина-Касселса-Пфистера 277 27.3. Неравенство между средним арифметическим и средним геометрическим 281 27.4. Теорема Гильберта о неотрицательных многочленах р^{х,у) 283 28. Теория Артина 289 28.1. Вещественные поля 290 28.2. Теорема Сильвестра для вещественно замкнутых полей . 295 28.3. Семнадцатая проблема Гильберта 298 29. Теория Пфистера 303 29.1. Мультипликативные квадратичные формы 303 29.2. С;-поля 306 Оглавление 29.3. Теорема Пфистера о суммах квадратов рациональных функций 308 Дополнение 313 30. Алгоритм Ленстры-Ленстры-Ловаса 313 30.1. Общее описание алгоритма 313 30.2. Приведенный базис решетки 314 30.3. Решетки и факторизация многочленов 317 Литература 324 Предметный указатель 331
Предисловие к первому изданию Теория многочленов составляет существенную часть университет- университетских курсов алгебры и анализа. Тем не менее, книг, целиком посвящен- посвященных теории многочленов, чрезвычайно мало. В этой книге изложены основные результаты исследований по тео- теории многочленов, как классические, так и современные. Большое внима- внимание уделено 17-й проблеме Гильберта о представлении неотрицательных многочленов суммами квадратов рациональных функций и ее обобще- обобщениям. Теория Галуа обсуждается прежде всего с точки зрения теории многочленов, а не с точки зрения общей теории полей и их расширений. В книгу не вошли два важных результата из теории многочленов, изложение которых занимает весьма много места: решение уравнений пятой степени с помощью тэта-функций и классификация коммутиру- коммутирующих многочленов. Эти результаты подробно изложены в двух недавно вышедших книгах, в написании которых я принимал непосредственное участие: [ПрС] и [ПрШ]. Во время работы над этой книгой я получал финансовую поддержку от Российского фонда фундаментальных исследований согласно про- проекту №98-00-555. Май 1999 г. В. Прасолов Глава 1 Корни многочленов 1. Неравенства для корней 1.1. Основная теорема алгебры В те давние времена, когда алгебра была скудна теоремами, сле- следующее утверждение получило название основной теоремы алгебры: «Многочлен степени п с комплексными коэффициентами имеет ровно п корней (с учетом их кратностей)». Впервые это утверждение сфор- сформулировал Альбер де Жирар в 1629 г., но он даже не пытался его дока- доказывать. Первым осознал необходимость доказательства основной тео- теоремы алгебры Даламбер, но его доказательство A746) не было признано убедительным. Свои доказательства предложили Эйлер A749), Фонсене A759) и Лагранж A771), но и эти доказательства были небезупречны. Первым удовлетворительное доказательство основной теоремы алге- алгебры получил Гаусс, который привел три разных доказательства A799, 1815 и 1816), а в 1845 г. опубликовал еще и уточненную версию своего первого доказательства. Обзор различных доказательств основной теоремы алгебры можно найти в [ТУ]. Мы ограничимся одним доказательством. Оно использует следующую теорему Руше, которая имеет и самостоятельный интерес. Теорема 1.1 (Руше). Пусть / и д — многочлены и у — замкнутая несамопересекаюшаяся кривая на комплексной плоскости. Тогда если \f(z)-g(z)\<\f(z)\ + \g(z)\ A) при всех 2Еу,то внутри кривой у расположено одинаковое количество корней многочленов / и д (с учетом их кратностей). Доказательство. Рассмотрим на комплексной плоскости вектор- векторные поля v(z) = f(z) и w(z) — g(z). Из условия A) следует, что ни в какой точке кривой у векторы «июне являются противоположно на- направленными. Напомним, что индексом кривой у относительно векторного поля v называют количество оборотов вектора v(z) при полном обходе точки z вдоль кривой у. (Для более подробного знакомства со свойствами ин- индекса мы советуем обратиться к главе 6 книги [Пр1].) Рассмотрим век- векторное поле vt = tv + (l — t)w. При этом v0 = w и V\ — v. Ясно также, что
10 Глава 1. Корни многочленов в любой точке геу вектор vt{z) ненулевой. Это означает, что для кри- кривой у определен индекс ind(<) относительно векторного поля Vt. Целое число ind(t) непрерывно зависит от t, поэтому ind(() = const. В частно- частности, индексы кривой у относительно векторных полей v и w совпадают. Несложно показать, что индекс кривой у относительно векторного поля v равен сумме индексов особых точек, в которых v(z) = 0. (Индекс особой точки zo определяется как индекс кривой \z — z§\ — ?, где ? до- достаточно мало.) Для векторного поля v(z) = f(z) индекс особой точки zo равен кратности корня zo многочлена /. Таким образом, из совпа- совпадения индексов кривой у относительно векторных полей v(z) = f(z) и w{z) — g(z) следует, что внутри кривой у расположено одинаковое количество корней многочленов /ид. ? С помощью теоремы Руше можно не только доказать основную те- теорему алгебры, но и получить оценку для модуля любого корня много- многочлена /: Теорема 1.2. Пусть/(г) = zn + aizn~1 + .. . + ап, где at <= С. Тогда внутри круга \z\ = 1-fmax |а*| расположено ровно п корней многочлена / (с учетом их кратностей). Доказательство. Пусть а = тах|а*|. Многочлен g(z) = zn имеет i внутри рассматриваемого круга корень 0 кратности п. Поэтому доста- достаточно проверить, что если \z\ = 1 + а, то \f(z) - g(z)\ < \f(z)\ + \g(z)\. Мы даже докажем, что \f{z) - g(z)\ < \g(z)\, т.е. Ясно, что если \z\ = 1 + а, то ап\< a(\z \n-1 \n. ? 1.2. Теорема Коши Здесь мы обсудим теорему Коши о корнях многочленов, а также ее следствия и обобщения. 1. Неравенства для корней 11 Теорема 1.3 (Коши). Пусть f(x) = х" - 6izn-1 - ... -bn, где все числа 6, неотрицательны, причем хотя бы одно из них отлично от нуля. Тогда многочлен / имеет единственный (некратный) положительный корень р, а модули всех остальных корней не превосходят р. Доказательство. Положим bl Если x ф 0, то уравнение f(x) = 0 эквивалентно уравнению F(x) = 0. При возрастании i от 0 до -foo функция F(x) строго убывает от +оо до —1. Поэтому при х > 0 функция F обращается в нуль ровно в одной точке р. При этом nbn Следовательно, р — некратный корень многочлена /. Остается доказать, что если хо — корень многочлена /, то q = — l^o | < V- Предположим, что q > р. Тогда из монотонности функции F следует, что F(q) < 0, т.е. f(q) > 0. С другой стороны, из равенства xg = hx^1 +... + bn следует, что qn < hq"'1 + ... + bn, т. е. f{q) < 0. Приходим к противоречию. ? Замечание. Теорема Коши непосредственно связана с теоремой Перрона-Фробениуса о неотрицательных матрицах (по этому поводу см. [Wi]). У многочлена х2п - хп - 1 имеется п корней, модули которых равны модулю положительного корня этого многочлена. Поэтому в теореме Коши утверждение о том, что модули корней не превосходят р, во- вообще говоря, нельзя заменить на утверждение о том, что модули корней строго меньше р. Но, как показал Островский, в достаточно общей си- ситуации это можно сделать. Теорема 1.4 (Островский). Пусть f(x) - хп - bixn~l - ... - bn, где все числа Ь{ неотрицательны, причем хотя бы одно из них отлично от нуля. Тогда если наибольший общий делитель номеров положительных коэффициентов 6, равен 1, то многочлен / имеет единственный положи- положительный корень р, а модули всех остальных корней строго меньше р.
12 Глава 1. Корни многочленов Доказательство. Пусть положительны только коэффициенты 6^, bk2,-.-,bkm (fci < &2 < ... < кт). Наибольший общий делитель чисел к\,..., кт равен 1, поэтому найдутся такие целые числа s\,..., sm, что -(-... + smkm = 1. Снова рассмотрим функцию F(x) = -1. Уравнение F(x) = 0 имеет единственное положительное решение р. Пусть х — любой другой (ненулевой) корень многочлена /. Положим q = |x| . Тогда = ? + ••• + т. е. F(q) > 0. При этом равенство F(q) = 0 возможно лишь в том случае, когда bkjxki = \bkJxki\>0 при всех i. Но в таком случае ък1 т.е. х > 0. Это противоречит тому, что х ф р, а р — единственный положительный корень уравнения F(x) = 0. Таким образом, F(q) > 0. Поэтому из монотонности функции F(x) при положительных х следует, что q < р. ? Из теоремы Коши-Островского можно вывести следующую оценку для модуля корней многочлена с положительными коэффициентами. Теорема 1.5. а) (Энестрём-Какейа) Если все коэффициенты мно- многочлена д{х) = аохп~1 + ... -f an-i положительны, то для любого корня \ этого многочлена справедлива оценка min {ai/aj-i} = 5 < \\\ < у = max {ai/a,-_i}. 1<г<п1 б) (Островский) Пусть пк/ak-i < у при к = ki,..., кт. Тогда если наибольший общий делитель чисел п, к\,..., кт равен 1, то Щ < у. 1. Неравенства для корней 13 Доказательство. Рассмотрим многочлен (х - у)д{х) = аохп - (уа0 - ах)*" - ... - (уап_2 - an_i)a; - yon_b По определению у > а,/а*_1, т.е. ya,_i — а; > 0. Поэтому по теореме Коши у — единственный положительный корень многочлена (х — у)д(х), а модули всех остальных корней этого многочлена не превосходят у. Если ^ — корень многочлена д, то т] = ?~*—корень многочлена an-iyn~1 + ... + а0. Поэтому Х = N = Т. е. > 8= min Когда выполнено условие б), корень у многочлена (х — у)д(х) строго больше модулей всех остальных корней этого многочлена. ? Замечание. Теорема Энестрёма-Какейа тоже связана с теоремой Перрона-Фробениуса: см. [AnSV]. Существенное обобщение теоремы Энестрёма-Какейа получено в статье [GG]. При этом отброшено требование вещественности коэффи- коэффициентов и ослаблено требование их монотонного возрастания. Но фор- формулировка этой теоремы весьма громоздка, поэтому она здесь не при- приведена. 1.3. Теорема Лагерра Пусть zi,...,zn e С — точки, которым приписаны единичные мас- массы. Тогда точку Z, = {z\ + ... + zn)/n называют центром масс точек z\,... ,zn. Это понятие можно обобщить следующим образом. Сделаем дробно-линейное преобразование w, переводящее точку zq в оо, т.е. w(z) — Ь Ь. Найдем центр масс образов точек z\,... ,zn, а затем сделаем обратное преобразование w~x. Несложные вычисления показы- показывают, что результат не зависит от а и Ь, а именно, мы получаем точку + ... + zi - го zn - г0 — центр масс точек z\,...,zn относительно точки zq- A)
14 Глава 1. Корни многочленов Центр масс точек z\,...,zn лежит внутри их выпуклой оболочки. Это утверждение легко переносится на случай центра масс относи- относительно точки zq. Нужно лишь прямые, соединяющие точки Zi и Zj, за- заменить окружностями, проходящими через точки z,, Zj и zo- Точка zo, соответствующая точке оо, лежит при этом вне выпуклой оболочки. ТЕОРЕМА 1.6. Пусть f(z) = (z - z{) ¦ ... ¦ (z - zn). Тогда центр масс корней многочлена / относительно произвольной точки z задается формулой С2 = z - nf(z)/f!(z). Доказательство. Ясно, что f'(z)/f(z) —(z-zi^ + .-. + ^z-Z Требуемое утверждение непосредственно следует из формулы A). ? Теорема 1.7 (Лагерр). Пусть f(z) — многочлен степени пи х — его некратный корень. Тогда центром масс всех остальных корней много- многочлена относительно точки ж служит точка X = х - 2(п - l)f'(x)/f"(x). Доказательство. Пусть f(z) = (z - x)F(z). Тогда f'(z) = F(z) + + (z - x)F'(z) и f"(z) = 2F'(z) + (z- x)F"(z). Поэтому f'(x) = F(x) и f"{x) — 2F'(x). Применим предыдущую теорему к многочлену F сте- степени п — 1 и к точке z = х. В результате получим требуемое. ? Теорема 1.8 (Лагерр). Пусть f(z) — многочлен степени п и X(z) = z-2(n-l)f'(z)/f"(z). Предположим, что окружность (или прямая) С проходит через некрат- некратный корень z\ многочлена /, а все остальные корни многочлена / при- принадлежат одной из двух областей, на которые С делит плоскость. Тогда X{z\) принадлежит той же самой области. Доказательство. В случае обычного центра масс окружности С соответствует прямая, по одну сторону от которой лежат все корни многочлена, кроме z\. Их центр масс лежит по ту же самую сторону от этой прямой. ? 1. Неравенства для корней 15 Следствие. Пусть z\ — один из некратных корней многочлена / с максимальным модулем. Тогда |Ar(zi)| < |zi|, т.е. \z1-2(n-l)f'{z1)/f"(z1)\<\z1\. Доказательство. Все корни / лежат в круге {г поэтому точка X{z\) тоже лежит в этом круге. с|ы < Теорема 1.9. Пусть / — многочлен с вещественными коэффициен- коэффициентами, а Сг = z — nf(z)/f'(z). Все корни многочлена / вещественны тог- тогда и только тогда, когда при всех геС\1 выполняется неравенство lm z -1тСг < 0. Доказательство. Предположим сначала, что все корни много- многочлена / вещественны. Пусть Im z = a > 0. Прямая, состоящая из точек с мнимой частью е, где 0 < ? < а, отделяет точку z от всех корней многочлена / (они лежат на вещественной оси). Поэтому lml,z < z. При ? -*¦ 0 получаем ImCz < 0. Легко проверить, что равенство Im?2 = 0 невозможно. В самом деле, пусть ?г е Ш. Рассмотрим окружность, проходящую через точку z и касающуюся вещественной оси в точке Cz. Слегка пошевелив эту окружность, можно построить окружность, по одну сторону от которой лежат точки z и X,-, а по другую — все корни многочлена /. В случае Im z = a < 0 рассуждения аналогичны. Предположим теперь, что Im z ¦ Im Cz < 0 при всех zgC\I Пусть z\—такой корень многочлена /, что Im(zi) ф 0. Тогда lim Cz = z\, Z—Zl поэтому Im z\ ¦ Im^zi > 0. ? Изложение теории Лагерра основано на статье [Gr]; см. также [ПС]. 1.4. Алолярные многочлены Пусть f(z) — многочлен степени п, С — фиксированное число или оо. Функцию л f(r - \ & {z) при С = 00 называют производной многочлена f(z) относительно точки С- Легко " Г ) проверить, что если f(z) = ? Qakzk, то -/'(*) = ? (" Г )ak+izk, fc=0 П fc=0 fc=0
16 Глава 1. Корни многочленов а значит, A) fc=O Пусть f(z) = Yl (k)akzk — многочлен с корнями zr,..., zn, a g(z) = k=0 n = E ik)bkzk ~ многочлен с корнями ?i,...,?„. Из формулы A) следует, к=0 ЧТО где апап Таким образом, равенство А^А^ ...A^nf(z) = 0 эквивалентно ра- равенству B) aQbn - Qaibn_i -f ^агК-г 4-.. - + (-l)nan60 = 0. Многочлены /ид, коэффициенты которых связаны соотношением B), называют аполярными. Будем называть круговой областью внутреннюю или внешнюю часть круга или полуплоскости. Теорема 1.10 (J. H. Grace, 1902). Пусть / и д — аполярные много- многочлены. Тогда если все корни многочлена / лежат в круговой области К, то по крайней мере один корень многочлена д тоже лежит в К. Доказательство. Нам потребуется следующее вспомогательное утверждение. Лемма 1.1. Пусть все корни zi,...,zn многочлена f(z) лежат вну- внутри круговой области К, а точка С лежит вне К. Тогда все корни мно- многочлена A^f{z) лежат внутри К. 1. Неравенства для корней 17 Доказательство. Прежде всего заметим, что если w,—корень многочлена A^f(z), то С — центр масс корней многочлена f(z) отно- относительно точки Wi (определение центра масс относительно точки см. на с. 13). В самом деле, если С Ф оо, то равенство A^f(w{) = 0 можно записать в виде Если же С = оо, то f'(wi) = A^f(wi) = 0, поэтому V 1 = f (Wi) = о j^zj-Wi f(wi) U- Следовательно, центр масс точек z\,...,zn относительно точки Wj на- / 1 N-1 ходится в точке Wj + = оо. Теперь уже ясно, что точка Wi не может лежать вне К. В самом деле, если бы точка Wj лежала вне А", то центр масс точек z\,...,zn относительно точки w, лежал бы внутри К, а это противоречит тому, что точка Z, лежит вне К. ? С помощью леммы 1.1 утверждение теоремы доказывается следую- следующим образом. Предположим, что все корни Сь ¦ ¦ ¦, Сп многочлена g ле- лежат вне К. Рассмотрим многочлен А^2... A^nf(z). Его степень равна 1, т. е. он имеет вид c(z — k). Из леммы следует, что k e К. Условие аполяр- аполярности многочленов /ид означает, что А^ (z — к) = 0. С другой стороны, непосредственное вычисление производной показывает, что А^ (z — k) = = Х,\ - к. Поэтому к = Ci Ф К. Приходим к противоречию. ? Для каждого многочлена / имеется целое семейство аполярных ему многочленов. Подобрав подходящим образом аполярный многочлен, с помощью теоремы Грэйса можно доказать, что у многочлена / есть корень в данной круговой области. Для тех же целей иногда бывает удобно воспользоваться и непосредственно леммой 1.1. Пример 1. У многочлена f(z) = 1-z + cz", где се С, есть корень в круге \z - 1| < 1.
18 Глава 1. Корни многочленов -1 Доказательство. Многочлены f(z) = 1 + (") —z + cz" и g(z) = = zn + {^)bn-izn~l 4-... 4- Ьо аполярны, если 1 -n ( — j bn-i +cb0 = 0, т.е. 1 + b,,_i +cb0 = 0. Пусть Cfc = 1 - expBrafc/n), A; = 1,... ,n. Тогда g(z) = Yl(z - Cfc) = = 2n + (jjbn-iz'1 +...-(- Ьо, гДе bn-i = — ^ i^fc = —1 и 6o = ± П Cfc = = 0. Поэтому многочлены f(z) и <?(г) аполярны. А так как все корни многочлена д лежат в круге \г — 1| < 1, то по крайней мере один из корней многочлена / лежит в этом круге. ? Пример 2. У многочлена 1 - z + c\zni + ... + ckznk, где 1 < п\ < < п2 < ¦ ¦ ¦ < пк, есть по крайней мере один корень в круге -1 Til 1 Доказательство. Начнем с многочлена f(z) = 1 - z + ciz. Пред- Предположим, что все его корни лежат в области \z\ > -. Тогда согласно лемме 1.1 корни многочлена Aof(z) = щ - (п\ - \)z тоже лежат в обла- области \z\ > ———. Но корень многочлена Aof(z) равен -—Ц-. Приходим к противоречию. Для многочлена f(z) = 1 - z + cxzni + ... + ckznk доказательство проведем индукцией по А;. Рассмотрим многочлен Aof(z) = nk- (nk- -ni)zni + ... + ck-i(nk -nk_x)znk-1. Заменим в этом многочлене z на —ZTTW- ^° предположению индукции корни полученного многочлена лежат в круге П\ П2 Пк-1 < Гц - 1 п2 - 1 ' " Tifc-i - Г поэтому корни многочлена Aof(z) лежат в круге П\ П2 Пк \z\ < т — 1 «2 — 1 — 1' 1. Неравенства для корней 19 Следовательно, предположение о том, что все корни многочлена f(z) лежат вне этого круга, приводит к противоречию. ? Пусть f(z) = ? Qa^ и g(z) = ? QbizK Многочлен h(z) = j=l i=l = S ( )aibiZ% называют композицией многочленов / и g. г=1 Теорема 1.11 (Сегё). Пусть / и д — многочлены степени п, при- причем все корни многочлена / лежат в круговой области К. Тогда любой корень композиции h многочленов /ид имеет вид -Qk, где ^ — неко- некоторый корень многочлена д, а к е К. Доказательство. Пусть у — какой-то корень многочлена h, т.е. J2 (™)aj6iY* = 0- Тогда многочлены f(z) и G{z) = zng(-yz~l) аполярны. г=1 Поэтому согласно теореме Грэйса один из корней многочлена G(z) ле- лежит в К. Пусть, например, з(-у^-1) = 0, где к е К. Тогда -yfc = Сг, где Ci — корень многочлена д. ? Для многочленов, степени которых не обязательно равны, имеется следующий аналог теоремы Грэйса. п Теорема 1.12 [Az]. Пусть f(z) = Y: {")<чг< и g(z) = г=1 i многочлены степени пит, причем т < п. Предположим, что их коэф- коэффициенты связаны соотношением Qaobm - A>ibm-i -f ... + (-1)™ Qam60 = 0. C) Тогда справедливы следующие утверждения: а) если все корни многочлена g(z) лежат в круге \z\ < г, то по край- крайней мере один корень многочлена f(z) тоже лежит в этом круге; б) если все корни многочлена f(z) лежат вне круга |г| < г, то по крайней мере один корень многочлена g(z) тоже лежит вне этого круга. Доказательство [Ru]. а) Соотношение C) инвариантно относи- относительно замены z на rz в многочленах /ид, поэтому можно считать, что г = 1. Предположим, что все корни многочлена f(z) лежат в обла- области \z\ > 1. Тогда все корни многочлена znf(l/z) лежат в области \z\ < 1.
20 Глава 1. Корни многочленов Поэтому из теоремы Гаусса-Люка (теорема 2.1 на с. 22) следует, что все корни многочлена = Д("-™> {znf(l/z)) = n(n - (m i=0 лежат в области \z\ < 1. Следовательно, все корни многочлена г=0 г=0 лежат в области \z\ > 1. Соотношение C) означает, что многочлены /г и g аполярны. Все корни многочлена /2 лежат в круговой области \z\ > 1, поэтому согласно теореме Грэйса по крайней мере один корень многочлена д тоже лежит в этой области. Приходим к противоречию. б) Все корни многочлена /г лежат в области \z\ > 1, поэтому по крайней мере один корень многочлена д тоже лежит в этой области. ? 1.5. Проблема Рауса-Гурвица Во многих задачах об устойчивости возникает потребность выяс- выяснить, все ли корни многочлена лежат в левой полуплоскости (т. е. ве- вещественные части корней отрицательны). Такие многочлены называют устойчивыми. Проблема Рауса-Гурвица заключается в том, чтобы не- непосредственно по коэффициентам многочлена выяснить, устойчив он или нет. Известно много разных решений проблемы Рауса-Гурвица (см., например, [По2]). Мы ограничимся одним простым критерием, приведенным в [Str]. Прежде всего заметим, что достаточно рассмотреть случай много- многочлена с вещественными коэффициентами. В самом деле, если p(z) = = J2anzn — многочлен с комплексными коэффициентами, то можно рас- рассмотреть многочлен Ясно, что вещественные части корней у многочлена p(z) такие же, как и у многочлена p(z). Кроме того, выражения коэффициентов многочлена p*{z) симметричны относительно ап и а^\ Это означает, что коэффи- коэффициенты многочлена р* переходят в себя при сопряжении, т. е. они веще- вещественны. 2. Корни многочлена и его производной 21 Теорема 1.13. Пусть p{z) — zn + axzn l + ... 4- an — многочлен с вещественными коэффициентами, q(z) — zm + b\zm~l + ... + bm, где m = n(n — l)/2, — многочлен, корнями которого служат все суммы пар корней многочлена р. Многочлен р устойчив тогда и только тогда, когда все коэффициенты многочленов р и q положительны. Доказательство. Пусть многочлен р устойчив. Отрицательному корню а соответствует множитель z — а с положительными коэффици- коэффициентами. Паре сопряженных корней а±гр с отрицательной вещественной частью соответствует множитель {z - а - i$)(z - а + гр) = г2 - 2az + а2 + [З2 с положительными коэффициентами. Таким образом, все коэффициенты многочлена р положительны. Комплексные корни многочлена q распадаются на пары сопряжен- сопряженных корней, поэтому коэффициенты многочлена q вещественные. Кроме того, вещественные части всех корней многочлена q отрицательны. Те же самые рассуждения, что и для многочлена р, показывают, что все коэффициенты многочлена q положительны. Пусть теперь все коэффициенты многочленов р и q положительны. В таком случае все вещественные корни многочленов р и q отрица- отрицательны. Поэтому если а — вещественный корень многочлена р, то а < О, а если а± гр — пара комплексных сопряженных корней многочлена р, то 2а = (а + гр) + (а — гр) — корень многочлена q, а значит, 2а < 0. ? 2. Корни многочлена и его производной 2.1. Теорема Гаусса-Люка В 1836 г. Гаусс показал, что все корни производной многочлена Р, отличные от кратных корней самого многочлена Р, являются положе- положениями равновесия для поля сил, которое создается одинаковыми ча- частицами, расположенными в корнях многочлена Р (в корне кратности г расположено г частиц); каждая частица создает силу притяжения, обратно пропорциональную расстоянию до этой частицы. Из этой тео- теоремы Гаусса легко вывести приводимую ниже теорему 2.1, но сам Гаусс об этом не упоминает. Первым сформулировал и доказал теорему 2.1 французский инженер Люка (F. Lucas) в 1874 г. Поэтому теорему 2.1 часто называют теоремой Гаусса-Люка.
22 Глава 1. Корни многочленов Теорема 2.1 (Гаусс-Люка). Корни производной многочлена Р при- принадлежат выпуклой оболочке корней самого многочлена Р. Доказательство. Пусть P(z) = (z - z\) ¦... ¦ (z - zn). Легко прове- проверить, что Р(*) ... 1 . .1 P'(z) z - z\ A) Предположим, что P'(w) = 0, P{w) ф 0 и w не принадлежит выпуклой оболочке точек z\,..., zn. Тогда через точку w можно провести прямую, не пересекающую выпуклой оболочки точек z\,...,zn. Поэтому век- векторы w—z\..... w—zn лежат в одной полуплоскости, заданной этой пря- мои. Следовательно, в одной полуплоскости лежат и векторы ... W — Zl 1 1 2 P(Z) ..., , поскольку - = pjy. Следовательно, — P'(z) z-zi ... -\ — ф 0. Получено противоречие. Поэтому w принадлежит вы- Z Zn пуклой оболочке корней многочлена Р. ? Соотношение A) позволяет доказать следующее свойство корней производной многочлена с вещественными корнями. Теорема 2.2 [An]. Пусть P(z) = (z - хх) ¦... ¦ (z - хп), где хх < ... ... < хп. Тогда если некоторый корень а:, заменяется на х\ е {xi,Xi+\), то все корни производной многочлена Р увеличиваются. Доказательство. Пусть z\ < z2 < ... < zn-\ — корни производ- производной многочлена с корнями х\,... ,хп, a z[ < z'2 < ... < z'n_1—корни производной многочлена с корнями хх,... ,х[,... ,хп. Для корней z*. и z'k соотношение A) принимает вид 1=1 Zk- х, - = о. B) »=1 Предположим, что теорема неверна, т. е. z'k < Zk для некоторого к. Тогда z'k — х\ < Zk — xi. При этом числа z'k — х\ и Zk — Xi одного знака. В самом деле, Zj < Xj, z'j < х\ при j < i - 1 и zj > Xi, z'j > x\ при j > i. Следоватечьно, < — т при всех i — 1,..., п. Но в таком случае Zk %i Zfc Xj соотношения B) не могут выполняться одновременно. ? 2. Корни многочлена и его производной 23 2.2. Корни производной и фокусы эллипса Корни производной кубического многочлена имеют следующую ин- интересную геометрическую интерпретацию. Теорема 2.3 (ван ден Берг, [В]). Пусть корни кубического мно- многочлена расположены в вершинах треугольника ABC на комплексной плоскости. Тогда корни производной этого многочлена расположены в фокусах эллипса, касающегося сторон треугольника ABC в их середи- серединах. Первое доказательство. Прежде всего заметим, что если Q(z) = = P(z - а), то Q'(z) = P'{z - а), поэтому началом координат можно считать любую точку. Можно считать, что треугольник ABC получен преобразованием z + z z-z cos а = 2 cos2 ^ + z sin2 ^ A) из правильного треугольника с вершинами w, zw и ?2w, где |ш| = 1 и ? = expBju/3). Тогда полуоси а и b рассматриваемого эллипса равны 1 cos а _ _ /-R туг - и , а расстояние между его фокусами r\ w. t2 равно vcr — ог = = -sinа. Точки F\ и F2 переходят в точки (±1,0) при растяжении с коэффициентом 1 . V1 (¦ а а -sinal = I sin -cos -  В результате преобразования A) и этого растяжения получаем преобра- преобразование Положим а = w ctg -. Тогда многочлен с корнями А, В и С имеет вид -at \ х - at 1 as' Легко проверить, что Р'{х) = Зх2 + Зе + Зе = Ъх2 - 3, поэтому корни многочлена Р' равны ±1. ? ?
24 Глава I. Корни многочленов Второе доказательство [Sho]. Пусть е = expB;u/3), a z0,21,22 — корни рассматриваемого многочлена. Выберем числа Со, Ci 5 С2 так, что 2, 22 = Со + Ci?2 B) т.е. 22, = Zq + Z\t2 + 22?, C'2 = 20 В дальнейшем будем предполагать, что zq + 21 + 22 = О, т. е. Со = 0. Легко проверить, что кривая Ci^*9 + ^е'"9, где 0 < ср < 2л, пред- представляет собой эллипс, полуоси которого направлены по биссектрисам внешних и внутренних углов угла С1ОС2 {О — начало координат), при- причем длины полуосей равны |Ci| + |Сг| и |Ki| — Кг||- В самом деле, рассма- рассматриваемая кривая является образом единичной окружности при отобра- отображении 2 >-* Ci2 4- Сгг. Кроме того, если Ci = |Ci|e'a и С2 = КгН*3, то Модуль этого выражения максимален при ср = ——-*- + кк и минима- а + 8 г. , „ лен при ср = —-г-2- + - + к;:. Эти значения ф как раз и соответствуют направлениям указанных биссектрис. Фокусы /i и /2 эллипса Х^хе1"* + Сге~~г<|) лежат на прямой, соответ- ствующеи углу ср = —г-*-, т. е. отношение ¦=-=- является положительным * Ч1Ч.2 чиатом. Кроме того, квадрат расстояния от фокуса до центра эллипса равен разности квадратов полуосей, т. е. он равен (|С1| + |С2|J-(|С1|-|С2|J=4|С1С2|. Таким образом, /1/2 = CiC2 Соотношения B) при Со = 0 показывают, что вершины 20, z\, 22 рассматриваемого треугольника лежат на эллипсе CieK|> + С2е~г(|> а сере- середины его сторон лежат на эллипсе x(Cie!<l> 4- Сге~г(|>). Середина хорды первого эллипса может лежать на втором эллипсе лишь в том случае, когда эта хорда касается эллипса. Таким образом, требуется доказать, что фокусы эллипса -(Cie!<? + Сге~г<|)) совпадают с корнями производ- производной многочлена (z - zq)(z - z{){z - 22). Фокусы эллипса удовлетворяют уравнению 22— С1С2 = 0, а корни производной удовлетворяют уравнению 202i +2022+2i22 = 0, Т.е. 3(г2 - С1С2) = 0. ? 2. Корни многочлена и его производной 25 2.3. Локализация корней производной 2.3.1. Круги Иенсена Пусть / — многочлен с вещественными коэффициентами. Для ка- каждой пары сопряженных корней z и 1 этого многочлена построим круг с диаметром zz\ такие круги называют кругами Иенсена многочлена /. Теорема 2.4 (Йенсен). Любой невещественный корень производной многочлена / лежит внутри или на границе одного из кругов Иенсена. Доказательство. Пусть z\,...,zn — корни многочлена /. Тогда f'{z) A) Прежде всего покажем, что если точка z лежит вне круга Иенсена с диаметром zpzq, то sgnlm Z- Zc + т = -sgnlm 2. В самом деле, 1 т-. + 1 _ 2(z-а)((г-аJ+Ь2) z-a-bi^z-a + Ы Uz _ af + tf\* Im(B-a)|2-a|24-B-aN2) = (b2 - \z - a\2) Imz. Покажем теперь, что если z ф. Ш. и Zj — а е R, то 1 sgnlm = -sgnlm2. В самом деле, B) C) z — a z — a \z — а\" \z — а\ Из формул A), B) и C) следует, что если точка г ф. Ш. расположена вне всех кругов Иенсена, то sgn Im -7777 = ~ sSn Im 2 ^ 0. Поэтому /'B) ф 0, т.е. z — не корень производной. ?
26 Глава!. Корни многочленов Для количества корней производной, вещественная часть которых принадлежит данному отрезку, можно доказать следующую оценку, уточняющую теорему Йенсена. Теорема 2.5 (Уолш). Пусть / = [a,f3], К — объединение / и кру- кругов Йенсена, пересекающих /. Тогда если К содержит А; корней много- многочлена f{z), то количество корней многочлена f'(z), лежащих в К, за- заключено между А; — 1 и А; 4-1. Доказательство. Пусть С — граница наименьшего прямоуголь- прямоугольника, стороны которого параллельны осям координат и который со- содержит К. Рассмотрим ограничение на С отображения z *-+¦ е"?, где 9 = &vg(f'(z)/f(z)). Из формул A), B) и C) следует, что образ части С, лежащей в верхней полуплоскости, расположен на полуокружности \z\ — 1, Imz < 0, а образ части С, лежащей в нижней полуплоскости, расположен на полуокружности \z\ = 1, Imz > 0. Поэтому количество оборотов образа кривой С вокруг начала координат равно 0 или ±1. Это означает, что индексы кривой С относительно векторных полей f(z) и f'(z) совпадают или отличаются на ±1, т.е. количества нулей функ- функций / и /', заключенных внутри кривой С, совпадают или отличаются на ±1. ? 2.3.2. Теорема Уолша Теорема 2.6 (Уолш). Пусть корни многочленов /i и f2 лежат в кругах A'i и К2, радиусы которых равны ri и г2, а центры находятся в точках с\ и С2. Тогда все корни производной многочлена / = /i /г лежат либо в К\, либо в К2, либо в круге К радиуса П\ + «2 с центром в П2С1 -(- П\С2 Til т Tlo И П2 = Доказательство. Пусть z — корень производной многочлена /, ле- лежащий вне Ki т К2-Тогда. fi(z)f2(z)+fi(z)f2{z) - 0, причем fi{z),f2{z), Рассмотрим точки ?j и t,2 — центры масс многочленов f\ и /2 отно- относительно точки z. Согласно теореме 1.6 на с. 14 2. Корни многочлена и его производной 27 Поэтому n2Ci + П1С2 = (ni 4- n2)z - nxn2 f jr~ + yr^ J = (ni + n2)z, т.е. z = — -. А так как все корни многочлена Л лежат в Ki, П\ +П2 то Q e Ki. Остается заметить, что если точки ^ и ^ с массами п\ и п2 лежат в кругах К\ и К2, то их центр масс z лежит в круге К. ? 2.3.3. Теорема Грэйса-Хивуда Теорема 2.7 (J. Н. Grace, 1902, P. J. Heawood, 1907). Если zinz2 — различные корни многочлена / степени п, то в круге \z — с\ < г, где с = (zi + z2)/2 и г = (|^i — z2\/2) ctg(x/n), находится по крайней мере один корень многочлена /'. п — 1 -I Доказательство. Пусть f'(z) = ? ( ь. )а*г*\ Тогда fc=0 0 = 22 = I f'(z) dz = fc=0 n-l fc=o где коэффициенты bo,..., bn_i зависят только от z\ и z2, а от коэффи- коэффициентов а<з, ¦ ¦ • ,an-i они не зависят. Таким образом, по данным z\ и z2 П-1 _ j можно построить многочлен g(z) = JZ ( , )б^гк, аполярный много- fc=0 члену /'(г). Чтобы получить явное выражение для многочлена д, положим ад. = = (—l)*^™"*, т.е. рассмотрим многочлен h(z) = (х — z)n~1. В таком случае 1 к=0 ~2 [n-1)xn-1-kbn.1-k = J{x-l)n-1dz = (z - Zl)n - (x - ., - Zl + Z2 . Zl — Z2 к% , Корни многочлена д имеют вид Qfc = — h 1—-—ctg—, (для к — 1,2,..., n — 1). Все они лежат на границе рассматриваемого круга \z — с\ < г. Поэтому согласно теореме 1.10 на с. 16 в круге \z — с\ < г находится по крайней мере один корень многочлена /'. ? Другие теоремы о локализации корней производной приведены в статье [Ма2].
28 Глава!. Корни многочленов 2.4. Гипотеза Сендова-Илиева В 1962 г. болгарский математик Б. Сендов высказал следующую ги- гипотезу, которую часто приписывают другому болгарскому математику, Л. Илиеву: «Пусть P(z) —многочлен, все корни которого лежат в круге \z\ < 1. Тогда если zo —один из корней многочлена P(z), то в круге \z - zq\ < 1 есть по крайней мере один корень многочлена P'(z)i>. (Пред- (Предполагается, что degP > 2.) Гипотеза Сендова-Илиева доказана для всех многочленов степени не выше 5 и для некоторых специальных многочленов (см., напри- например, [Scm]). Мы ограничимся доказательством гипотезы Сендова-Илиева для многочленов вида Это доказательство приведено в [CS]. Случай, когда п = щ + Пх + п2 > 4, разбирается достаточно просто. В этом случае нужно доказать, что если \zi\ < 1 при i = 0,1,2, то многочлен P'(z) = n(z - zoY^iz - Zlr-l{z - z2)n*-\z - Wl)(z - w2) A) имеет корень, лежащий в круге \z — zq\ < 1. Если no > 1, то таким корнем будет zq. Поэтому будем считать, что щ = 1- Запишем P(z) в виде P(z) = (z - zq)Q(z). Ясно, что Р'Ы = Q(z0) = (z0 - Zl)nHz0 - z2)n\ B) Из A) и B) следует, что n{z0 - wi)(z0 - w2) = (z0 - z1)(z0 - z2). C) Учитывая, что |zo — z\\ < \zo\ + \z\\ = 2 и \zo — z2\ < 2, получаем \z0 - Wi\ ¦ \z0 - w2\ < 4/n < 1, ПОЭТОМУ |zo — lL'i| < 1 ИЛИ \zo — W2\ < 1. Остается рассмотреть случай, когда n0 = щ — n2 = 1. Для этого нам потребуется следующее вспомогательное утверждение, которое мы сформулируем в более общем виде, чем это нужно для наших целей. 2. Корни многочлена и его производной 29 Лемма. Пусть P(z) — многочлен степени п, где п > 2. Тогда если \P"(zo)\>(n-l)\P'(zo)\, то по крайней мере один из корней многочлена Р' лежит в круге Доказательство. Пусть w\,w2,...,wn-i —корни многочлена Р'. Можно считать, что старший коэффициент многочлена Р равен 1. В 1 п-1 таком случае P'(z) = п П (z ~ wj)- Если P'(z) ф 0, то можно взять логарифм от обеих частей и продифференцировать их. В результате получим P"(z) п-1 P'(z) j=i По условию zo —некратный корень многочлена Р, т. е. P'{zq) ф 0. Пред- Предположим, что |zo — Wj\ > 1 при j — l,...,n— 1. Тогда из неравенства Р"Ы\ >{п- 1)\Р'Ы\ следует, что п-1 < Р'Ы п-1 <? \ZO - Wj < п - 1. Приходим к противоречию. U Займемся теперь непосредственно многочленом P(z) = (z~ zo){z - Zl)(z - z2) = {z- zo)Q{z). Ясно, что P"{z) = Q4?) P'(z) Q(z) zo-zi I - 22 2Bг0 - г! - г2) (г0 - zi)(zo -г2)' Рассмотрим треугольник ABC с вершинами А = zo, В — z\, С = z%. Ясно, что |z0 - z\\ — с, |z0 - г2| = 6 и \2z0 - z\ - z2\ = 2ma, где ma — длина медианы. Согласно лемме если 4ma > 2bc, то гипотеза Сендова- Илиева верна. По условию Ъ < 2 и с < 2, поэтому неравенство 2ma > be выполняется как при гпа > Ь, так и при та > с. Остается рассмотреть случай, когда та < b и та < с.
30 Глава!. Корни многочленов Соотношение C) показывает, что гипотеза Сендова-Илиева верна, если be < 3. Поэтому можно считать, что 6с > 3. В таком случае Ь2 + с2 = F - сJ + 26с > 6, а значит, Ь2 + с2 - а2 > 6 - 4 > 0, т.е. LA < 90°. Из неравенств 6 > > та и с > та следует, что LC < 90° и LB < 90°, поэтому треуголь- треугольник ABC остроугольный. Пусть R — радиус его описанной окружности, ha —высота, опущенная из вершины А. Тогда c/ha = sin В = 2R/b, т. е. 6с = 2Rha < 2Rma. Чтобы получить требуемое неравенство 6с < 2та, остается доказать, что R < 1. Остроугольный треугольник ABC рас- расположен внутри единичной окружности \z\ — 1. Если описанная окруж- окружность 5 треугольника ABC лежит внутри единичной окружности, то неравенство R < 1 очевидно. Пусть теперь окружность 5 и единич- единичная окружность имеют общую хорду. Из остроугольности треуголь- треугольника ABC следует, что эта хорда видна из вершин треугольника под острым углом ср. Эта же хорда видна из точек единичной окружности под углами ф и 180° — ф, где ф < 90°. При этом ф < ср. Из неравенств ф < ср < 90° < 180° - ф следует, что R < 1. 2.5. Многочлены, у которых совпадают корни их самих и их производных В статье [Chu] утверждалось, что если Р и Q — многочлены со стар- старшим коэффициентом 1, причем множества корней многочленов Р и Q совпадают и множества корней многочленов Р' и Q' тоже совпадают, то Рт = Qn для некоторых натуральных тип. Затем в доказательстве этого утверждения были обнаружены пробелы и вскоре в [Roi] был по- построен контрпример. Конструкция этого контрпримера весьма сложная. Заинтересованному читателю мы советуем обратиться непосредственно к статье [Roi]. По поводу свойств многочленов, у которых совпадают корни их са- самих и их производных, см. также [DS]. 3. Результант и дискриминант 3.1. Результант п т Рассмотрим многочлены f(x) = Yl a,iXn~% и д(х) = JZ ЬгХт~г, где 8=0 1=0 ао ф 0 и &о Ф 0. Над алгебраически замкнутым полем многочлены /ид 3. Результант и дискриминант 31 имеют общий делитель тогда и только тогда, когда они имеют общий корень. Если же поле не алгебраически замкнуто, то общий делитель может быть многочленом, не имеющим корней. Наличие у / и g общего делителя эквивалентно тому, что существу- существуют такие многочлены р и q, что fq — gp, причем degp < n — 1 и degq < < т — 1. Пусть q = uoxm~1 + ... + um_i и р — voxn~l -f ... + vn-i. Равенство fq = gp можно записать в виде системы уравнений ditto + ao«i = б^о 4- 60ui, — b2v0 + biV\ Многочлены / и g имеют общий корень тогда и только тогда, когда эта система имеет ненулевое решение (uo,u\,... ,vo,Vi,...). Если, например, т = 3 и п = 2, то определитель этой системы уравнений имеет вид а0 о 0 -6о 0 ai ао 0 —6i —6о 02 ai ао —Ьг -bi 0 а,2 oi —Ьз —t>2 0 0 Q2 0 -6з = ± ао ai 02 О О ао ai 02 О 0 ао ai 6о 6i Ьг Ьз О 6о 6i 62 = ±detS(/,5). Матрицу 5(/, д) называют матрицей Сильвестра многочленов /ид. Определитель матрицы 5(/, д) называют результантом многочленов /ид; результант многочленов /ид обозначают R(f,g). Ясно, что ¦Щ/! я) — однородный многочлен степени т по переменным а, и сте- степени п по переменным bj. Многочлены /ид имеют общий делитель тогда и только тогда, когда определитель рассматриваемой системы равен нулю, т.е. R(f,g) = 0. Результант имеет много разных приложений. Например, если заданы полиномиальные соотношения P(x,z) = 0 и Q(y,z) = 0, то с помощью результанта можно получить полиномиальное соотношение R(x,y) = = 0. В самом деле, рассмотрим данные полиномы Р(х, z) и Q(y,z) как полиномы от z, считая х и у постоянными. Тогда результант R(x,y) этих полиномов дает требуемое соотношение R{x, у) = 0. Результант позволяет также сводить решение системы алгебраиче- алгебраических уравнений к нахождению корней многочленов. В самом деле, пусть Р(хо,уо) = 0 и Q{xo,yo) = 0. Рассмотрим Р(х,у) и Q(x,y) как много- многочлены от у. При х — хо они имеют общий корень уо- Следовательно, их результант R(x) равен нулю при х = xq.
32 Глава 1. Корни многочленов — корни много- многоТеорема 3.1. Пусть х, — корни многочлена /, а члена д. Тогда R(f,g) = Доказательство. Так как f(x) = ао(х - xi) ¦... • (х — хп), то а* = = ±аоОк{х\ ,¦¦¦ ,хп), где а к — элементарная симметрическая функция. Аналогично bk = ±b0Ok(yi,... ,ут)- Результант является однородным многочленом степени т по переменным щ и степени п по переменным bj, поэтому R(f,9) = dl?b% где Р— симметрический многочлен от х\,... ,хп и yi,. ¦ ¦ ,ут, обраща- обращающийся в нуль при Xi = yj. Формула показывает, что Подставив в это равенство xt — у^ получим, что R — нулевой много- многочлен. Аналогичные рассуждения показывают, что многочлен Р делится т п Так как д[х) = b0 J] (х - yj), то П 9{яг) = bo Yl(xi ~ Vj), а значит, "i i S = a = aom f[(box? bm) t=i — однородный многочлен степени п по переменным bo, ¦.. ,bm. Для пе- переменных ао, ¦ ¦ ¦ ,ап рассуждения аналогичны. Ясно также, что симме- трический многочлен а™ П (&о?™ + Ь\х™ + ... + Ьт) является много- i=l членом от ао, ¦ ¦ ¦,an,bo,...,Ьт. Следовательно, R(ao,... ,bm) — XS, где X — некоторое число. С другой стороны, коэффициент при ГД х™ у мно- многочленов a™6oP(xi,...,хт) и 5 равен а^Щ, поэтому X = 1. ? Следствие 1. R(g,f) = (- 3. Результант и дискриминант 33 Следствие 2. Если / = gq + г, то где bo — старший коэффициент многочлена д. Доказательство. Пусть у_,—корни многочлена д. Тогда /(у_,) = = r(j/j). Остается воспользоваться тем, что R{f,g) = Ь^е%^\\/(У}) и Следствие 3. R{f,gh) = R(f,g)R(f,h). Доказательство. Пусть xt — корни многочлена /, ший коэффициент. Тогда R(f,9h) = a« — его стар- стара n m ТЕОРЕМА 3.2. Пусть f(x) = ? щхп-{ и д(х) = ^ Ьцт~\ Тогда су- i=0 t=0 ществуют многочлены ф и ф с целыми коэффициентами от переменных x,oq, ... ,an,bo,. ¦ ¦ ,Ьт, для которых выполняется равенство ф(я, a, b)f(x) + ф(х, а, Ъ)д{х) = R(f, g). Доказательство. Пусть со,..., с„+то_! — столбцы матрицы Силь- Сильвестра S(f, g) и ук =хт+п~к~1. Тогда УоСо + ¦ ¦ ¦ + yn+m-icn+m-i =с,где с — столбец [xm~1f(x),... ,f(x),xn~1g(x),... ,д{х)). Рассмотрим это ра- равенство как систему линейных уравнений относительно уо,- ¦ ¦,J/n+m-i и воспользуемся правилом Крамера, чтобы найти уп+т-\- В результате получим Уп+m-i det(co,..., Cn+m-i) = det(co,..., cn+m_2, с). A) Остается заметить, что yn+m-i = 1, det(co,... ,cn+m_i) = R(f,g), а определитель, стоящий в правой части равенства A), можно предста- представить в требуемом виде. ? 2 - 1010
34 Глава!. Корни многочленов 3.2. Дискриминант Пусть xi,...,xn — корни многочлена f(x) = аох" + ... + ап, причем а0 ф 0. Величину ?>(/) = а2," П (х«"" хзJ называют дискриминантом многочлена /. Теорема 3.3. Д(/,/') = ±a0D{f). Доказательство. ПотеоремеЗ.1 R{f,f) = о^ Ц/'(*«)> где х4 — % корни многочлена /. Легко проверить, что f'(xi) = ao Y\{xj ~ xi)- По- этому R(f, /') = "о" j-фг Замечание. Несложно показать, что R(fJ') = R(f',f) = (-l)"(" Следствие. Дискриминант является многочленом с целыми коэф- коэффициентами от коэффициентов многочлена /. Теорема 3.4. Пусть /, g и h — многочлены со старшим коэффици- коэффициентом 1. Тогда D(fg) = D(f)D(g)R2(f,g), D(fgh) = D(f)D(g)D(h)R2(f,g)R2(g,h)R2(h,f). Доказательство. Пусть ц,.. ¦, хп — корни многочлена /, а ух,... • • -,Ут — корни многочлена д. Тогда D(fg) = Y[(xi - xjf Ц(У1 - yjJ Jlixi - yjJ = D(f)D(g)R2(f,g). Вторая формула доказывается аналогично. О Теорема 3.5. Пусть / — вещественный многочлен степени п, не имеющий вещественных корней. Тогда sgn?>(/) = (—I)™' • 3. Результант и дискриминант 35 Доказательство. Воспользовавшись разложением f(x) = ац(х-х1)-...-(х-хп), легко проверить, что D{(x-a)f(x))=D{f(x)){f(a)f. Пусть а и а — пара сопряженных корней многочлена /, т.е. f(x) = = (х - а)(х - а)д(х). Тогда ?>(/(*)) = D{g(x))(a-aJ{f(a)f(a)J. Ясно, что sgn(a - aJ = -1 и (/(a)/(a)J = |/(a)|4 > 0. Поэтому sgnD(/) = -sgnD(g). Требуемое утверждение теперь легко доказыва- доказывается индукцией по п. ? Теорема 3.6. Пусть f(x) = хп + сцх"-1 + ... + «„ — многочлен с целыми коэффициентами. Тогда его дискриминант ?>(/) имеет вид 4k или 4/с + 1, где А; — целое число. Доказательство. Пусть х\,...,хп — корни многочлена /. Тогда D{f) — &2(/), гДе Hf) = П (xi ~ xi)- Рассмотрим вспомогательную ве- личину 8i(/) = П (xt+Xj). Ясно, что 8Х(/) —симметрическая функция i<3 от корней многочлена /, поэтому 8i(/) —целое число. Кроме того, ,... ,хп) где U — симметрический многочлен от xi,...,xn с целыми коэффици- коэффициентами. Поэтому D(/) = b2(f) + 4fci, где к\ —целое число. Ясно также, что 82(/) = 4/с2 или 4/с2 + 1. ? 3.3. Вычисление некоторых результантов и дискриминантов В этом параграфе мы приведем некоторые примеры вычисления ре- результантов и дискриминантов. Пример 3.1. D(xn + а) = (-1)п{п-1^2ппап-1.
36 Глава 1. Корни многочленов Доказательство. Воспользуемся тем, что где xi,...,xn — корни многочлена /. В нашем случае f'(x) = пхп 1 и Цх, = (-1)"а, a значит, П*" = (-l)"*"-1^"-1 =an~1. ? Пример 3.2. D(x"-X + х"'2 + ... + 1) = (-i)(»-i)(»-2>/2nn-a. Доказательство. Рассматриваемый многочлен ф(х) = х" + ... ... + 1 удовлетворяет соотношению (х - 1)ф(х) = хп - 1. Поэтому = ?>((х - 1)Ф(х)) = D(x" - 1) = (_i)(n Остается, заметить, что фA) = п. 2 ? Пример 3.3. Пусть }п{х) = 2j- + ...+ -^-. Тогда Доказательство. Коэффициент при старшем члене многочлена д(х) = n\fn(x) равен 1, поэтому Dig) = (-l)"*" где oti,..., <х„ — корни многочлена /„. Ясно, что дЧсц) = п!/>,) = п!/,,.! Поэтому = п! t=l Остается заметить, что Па« = (—l)"ff@) = (—1)"п!. Пример 3.4. Пусть d = (г, в), n = r/d и si = s/d. Тогда R(xr -a, xs- Ъ) = (-!)' (aSl -d п 3. Результант и дискриминант 37 Доказательство. Соотношение Д(з,/) = (-l)deg/de89/j(/;ff) по- показывает, что если требуемое утверждение верно для пары (r,s), то оно верно и для пары {s,r). В самом деле, (-l)r*+d+r = (-1)8. Таким образом, можно считать, что г > s. При s = 0 утверждение очевидно. Если s > 0, то, поделив хТ — а на Xs — 6, получим остаток Ьхг~8 — а. Поэтому R(xr - а, Xs - Ъ) = ЩЪхг~' -а,х°-Ъ) = = R(b,xs - ЬЩхг~* - а/Ь,х° -Ъ) = = b"R(xr-s -а/Ъ,хя-Ъ). Легко видеть, что если R(xr~s —a/b,xs-b) = (-l)s((a/b)Sl - bri~Sl), то R(xr — a,xs — b) = (-l)s(aSl — bTl) . Остается применить индукцию по г + s. D Пример 3.5. Пусть п > к > 0, d = (n,k), ni = n/d и hi = k/d. Тогда D(xn + ахк + b) = Доказательство [Sw]. Из формулы D(/) = (-l)n(-n-l^2R(f,f) получаем D(x" + ax* +b) = (-l)n{n-1]/2R(xn + ax* + 6, nx" + fcaxfc-x) = = (-1)»(»-1)/2ппЛ(а;п + ax* 4- b, x" + п^ках"'1). Воспользовавшись тем, что R(f,xmg) = R(f,xm)R(f,g) = {f(O))mR(f,g), получим D(xn + axk +b) = (-\)<n-^/2nnbk-1 R(xn + axk + b, xn~k + n~lka). Остаток от деления многочлена хп + ax* + b на х"~* + п~1ка равен a(l - n~1k)xk + b, поэтому R(xn + ax* + 6,x"-* + n-lka) = R{a(l - n*:)** + b,xn~k + n^ka). Результант пары двучленов вычислен в предыдущем примере. ?
38 Глава 1. Корни многочленов 4- Разделение корней 39 4. Разделение корней Здесь мы обсудим различные теоремы, позволяющие вычислить или хотя бы оценить сверху количество вещественных корней многочлена, расположенных на интервале (а,Ь). Формулировки таких теорем ча- часто используют понятие числа перемен знака в последовательности ао, а\,...,ап, где аоап ф 0. Это число определяется следующим образом. Все нулевые члены рассматриваемой последовательности исключаются, а для оставшихся ненулевых членов вычисляется количество пар сосед- соседних членов разного знака. . 4.1. Теорема Фурье-Бюдана Теорема 4.1 (Фурье-Бюдан). Пусть N(x)—число перемен знака в последовательности f(x),f'(x),... ,/'"'(х), где / — многочлен сте- степени п. Тогда число корней многочлена / (с учетом их кратности), заключенных между аи Ь, где /(а) ф 0, f(b) ф 0 и а < Ь, не превосходит N(a) — N(b), причем число корней может отличаться от N(a) — N(b) лишь на четное число. Доказательство. Пусть точка х движется по отрезку [а,Ь] от а к Ь. Число N(x) изменяется лишь в том случае, когда х проходит через корень многочлена /*ш' при некотором т <п. Рассмотрим сначала случай, когда точка х проходит через г-крат- ный корень хо многочлена }{х). В окрестности точки хо многочлены f(x),f'(x),...,f(r\x) ведут себя приблизительно как (х - xo)rg(xo), (х — xo)r~lrg(xo),¦ ¦ ¦ ,r\g(xo)- Таким образом, при х < хо в этой по- последовательности происходит г перемен знака, а при х > хо в этой последовательности перемен знака не происходит (имеется в виду, что точка х достаточно близка к хо)- Предположим теперь, что точка х проходит через r-кратный корень xq многочлена /'ш', не являющийся корнем многочлена /<m-1) (при этом Хо может как быть корнем /, так и не быть корнем /). Требуется до- доказать, что при проходе через xq число перемен знака в последователь- последовательности /*ш~1'(а;),/'т'(х),... ,/'ш+г'(х) изменяется на неотрицательное четное число. В окрестности точки xq эти многочлены ведут себя при- приблизительно как F(xq),(x - xo)rG(xo),(x ~ xo)r~1rG(xo), ¦ ¦ ¦ ,r\G(xo). Если исключить F(xo), то в оставшейся последовательности при х < хо происходит ровно г перемен знака, а при х > х0 перемен знака не про- происходит. Что же касается первых двух членов, F(xq) и (х - xo)rG(xo), то в случае четного г число перемен знака при х < х0 и при х > хо одно и то же, а в случае нечетного г число перемен знака при х < хо на 1 больше или меньше, чем при х > хо (в зависимости от того, имеют ли F(xo) и G(xo) один и тот же знак или разные знаки). Итак, при четном г изменение числа перемен знака равно г, а при нечетном г изменение числа перемен знака равно г ± 1. В обоих случаях это изменение четно и неотрицательно. ? Следствие 1 (Правило Декарта). Количество положительных кор- корней многочлена f[x) = аохп + а\хп~1 + ... + а„ не превосходит числа перемен знака в последовательности ао, ai,..., а„. Доказательство. Так как /(г)@) = г\ап-г, то ЛГ(О) совпадает с чи- числом перемен знака в последовательности коэффициентов многочлена /. Ясно также, что ЛГ(+оо) = 0. ? Замечание. Якоби показал, что правило Декарта можно использо- использовать и для оценки количества корней, заключенных между аир. Для х — а этого нужно сделать замену у = многочлен т.е. х = 1 + tf' и рассмотреть Правило Декарта, примененное к этому многочлену, дает оценку коли- количества корней, заключенных между а и р. В самом деле, когда х изме- изменяется от а до р, у изменяется от 0 до оо. Следствие 2 (de Gua). Если в многочлене отсутствуют 2т после- последовательных членов (т. е. коэффициенты при этих членах равны нулю), то у этого многочлена не менее 1т мнимых корней, а если отсутствуют 2т +1 последовательных членов, то в случае, когда их заключают члены разного знака, многочлен имеет не менее 2т мнимых корней, а в слу- случае, когда их заключают члены одного знака, многочлен имеет не менее 1т + 2 мнимых корней. В некоторых случаях сравнение перемен знаков в двух последова- последовательностях позволяет получить более точную оценку числа корней, чем та оценка, которую дает теорема Фурье-Бюдана. Теорема такого рода
40 Глава 1. Корни многочленов была впервые сформулирована еще Ньютоном, но доказал ее лишь Силь- Сильвестр в 1871 г. Заменим последовательность f(x),f'(x),...,f^n\x) на последовательность /0(х), /i(x),..., /„(я), где A) и рассмотрим еще одну последовательность F0(x),Fi(x),...,Fn(x), где F0(x)=F(x), Fn(x) = рп(х) и i(x) = ff(x) - /j_1(x)/i B) Будем учитывать только те пары fi(x), fi+i(x), для которых sgn.Fi(ж) = = sgnFi+i(a:). Пусть N+(x) —количество пар, для которых sgn/j(a;) = = sgn/j-)-i(x), a N-(x) — количество тех пар, для которых sgn/j(x) = Теорема 4.2 (Ньютон-Сильвестр). Пусть / — многочлен степени п без кратных корней. Тогда число корней многочлена /, заключенных между а и Ь, где а < b и f{a)f(b) ф О, не превосходит как N+{b) - N+(a), так и N-(a)-N-{b). Доказательство. Рассмотрим сначала случай, когда для много- многочлена / выполняются следующие условия: 1) никакие два последовательных многочлена fi не имеют общих корней; 2) никакие два последовательных многочлена Ft не имеют общих корней; 3) корни многочленов /, и F, отличны от а и Ь. В таком случае из формулы B) следует, что у многочленов fi и Fi нет общих корней. Из формул A) и B) легко получить, что f — (п — i\ f- (V\ Ji — \n Ч1г, (о) fiF{ = (n - i — l)(Fifi+i + Fi+Xfi). D) Пусть точка х движется от а к Ь. Числа N±(x) изменяются лишь в том случае, когда точка х проходит либо через корень многочлена fi, либо через корень многочлена Fi. Разберем отдельно три случая. Случай 1: прохождение через корень хо многочлена /о = /. Если /o(zo) = 0, то Рг(хо) = Д2Ы " /0Ы/2Ы = А2Ы > О- 4- Разделение корней 41 Поэтому при прохождении через хо в последовательности Fq(x) = = 1, Fi(x) перемен знака не происходит. Из формулы C) следует, что sgn/'(x) = sgnfi(x). Поэтому если /i(zo) > 0, то /о(а;о - е) < 0 и /о(хо + е) > 0, а если /i(x0) < 0, то /о(хо - е) > 0 и /о(хо + е) < 0. В обоих случаях fo(xo - e)/i (io-e)<0h /о(яо + e)/i(a;o + е) > 0. Таким образом, при прохождении через х0 ве- величина N+ увеличивается на 1, а величина 7V_ уменьшается на 1. (Речь идет только о вкладе в N± пары /о, /i) Случай 2: прохождение через корень хо многочлена fi, где i > > 1. В этом случае изменение знаков происходит в последовательности /»-i)/i;/i+i- Возможные варианты знаков рассматриваемых многочле- многочленов при х = хо ± е сильно ограничиваются следующими соотношениями: 1) согласно формуле C) sgn/j+i = sgn/t'; 2) согласно формуле B) sgni^zo) = sgn(/?(z0) - /i-i(so)/i+i(xo)) = 3) sgnFi±1 =sgn/?±1 = 1. Если Fi(xo) < 0, то в парах Fi_i,Fj и Fi,Fi+i происходят смены знака, а по условию мы такие пары не рассматриваем. Если же Fi(xo) > > 0, то fi-i(xo)fi+i(xo) < 0. Знаки многочленов полностью опреде- определяются знаком fi+i(xo). При обоих знаках сначала пары /j_i(xo — e)> fi(x0 - е) и fi{xo — е), /i+i(zo — е) дают, соответственно, вклады в N+ и в 7V_, а затем пары /i_i(x0 + t),fi(xo + t) и /Дх0 + e),/t+i(a;o + е) дают, наоборот, вклады в W_ и в N+. Таким образом, их общий вклад как в 7V+, так и в 7V_ не изменяется. Случай 3: прохождение через корень хо многочлена Fi. В этом случае для знаков многочленов выполняются следующие соотношения: 1) /i-i(*o)/«+i(*o) = Л2Ы - Fi(xo) = /?(х0) > 0; 2) sgn// = sgn/i+1; 3) из формулы D) следует, что sgnF/ = sgn/i_i/i+1Fi+i. Несложный перебор возможных вариантов показывает, что либо 7V+ и 7V_ не изменяются, либо 7V+ увеличивается на 2, либо 7V_ уменьшается на 2. Остается объяснить, как можно избавиться от наложенных на мно- многочлен / условий 1)-3). Если какие-то из этих условий не выполняются, то после малого шевеления коэффициентов многочлена / эти условия будут выполняться. Но корни многочлена / некратные, поэтому при 1
42 Глава 1. Корни многочленов малом шевелении коэффициентов количество корней многочлена /, ле- лежащих строго внутри отрезка [а,Ь], не изменяется. П Замечание. Для многочлена / с кратными корнями можно при- применить чуть более тонкие рассуждения. А именно, рассматривать не произвольные малые шевеления, а лишь те, при которых вещественный корень кратности г распадается на г различных вещественных корней. Чтобы получить такое малое шевеление, удобнее изменять не коэффи- коэффициенты многочлена, а его корни. 4.2. Теорема Штурма Рассмотрим многочлены }{х) и fi(x) = f'(x). Будем "искать наиболь- наибольший общий делитель многочленов / и Д по алгоритму Евклида: / = Qifi ~ /2, Л = <hh — /з> /„-2=<Zn-l/n-l-/n, /n-1 = <7n/n- Последовательность Д Д,.. .,/„_!,/„ называют последовательностью Штурма многочлена /. Теорема 4.3 (Штурм). Пусть w(x)—число перемен знака в по- последовательности f(x),fi(x),..., }„(х). Тогда количество корней много- многочлена / (без учета их кратности), заключенных между а и Ь, где /(а) ф Ф О, f(b) ф О и а < Ъ, в точности равно w{a) - w(b). Доказательство. Рассмотрим сначала случай, когда многочлен / не имеет кратных корней (т. е. многочлены / и /' не имеют общих кор- корней). В таком случае /„ — некоторая ненулевая константа. Проверим сначала, что если мы проходим через один из корней мно- многочленов Д,..., fn-i, то число перемен знака не изменяется. В рассма- рассматриваемом случае соседние многочлены не имеют общих корней, т. е. если /г(а) = 0, то /r±i(a) ф 0. Кроме того, из равенства /r_i = qr~ifr - -fr+i следует, что /r_i(tx) = -/г+1(сс). Но в таком случае число перемен знака в последовательности /r_x (cc), e, /r+i (а) равно 2 как при е > 0, так и при е < 0. 4- Разделение корней 43 Будем двигаться от а к Ь. Если мы проходим через корень х0 много- многочлена /, то сначала числа f(x) и }'{х) будут разного знака, а потом эти числа будут одного знака. Таким образом, количество перемен знака в последовательности Штурма уменьшается на 1. Все остальные пере- перемены знака, как уже было показано, при прохождении через точку хо сохраняются. Рассмотрим теперь случай, когда многочлен / имеет корень хо крат- кратности т. В таком случае / и Д имеют общий делитель (х — хо)т~1, поэтому многочлены Д,..., /г делятся на (х - хо)т~1. Поделив /, Д,... ..., fr на (а; — хо), получим последовательность Штурма ср, cpi,..., срг для многочлена ср(ж) = f(x)/(x — xo)m~1. Многочлен ср имеет некратный корень xq, поэтому при прохождении через хо число перемен знака в последовательности ср,cpi,...,cpr увеличивается на 1. Но при фиксиро- фиксированном х последовательность /, Д,..., fr получается из последователь- последовательности ср,cpi,...,cpr умножением на константу, поэтому число перемен знака в этих последовательностях одно и то же. ? 4.3. Теорема Сильвестра Вычисление последовательности Штурма весьма трудоемко. Силь- Сильвестр предложил следующий более элегантный метод вычисления коли- количества вещественных корней многочлена. Пусть / — вещественный многочлен степени п с некратными кор- корнями <xi,...,<х„. Положим sfc = <х* + ... + а*. (Для вычисления sk, разу- разумеется, не нужно знать корни многочлена, потому что s/t, как симме- симметрическая функция, выражается через коэффициенты многочлена.) Теорема 4.4 (Сильвестр), а) Количество вещественных корней многочлена / равно сигнатуре квадратичной формы, заданной матри- матрицей so si Sl S2 Sn-1 Sn-1 Sn ... S2n б) Все корни многочлена / положительны тогда и только тогда, ко- когда положительно определена матрица / Sl S2 ... Sn S2 S3 ... Sn+l \ Sn Sn+1 ¦ • ¦ S2n+1
44 Глава 1. Корни многочленов Доказательство (Эрмит). Пусть р — вещественный параметр. Рассмотрим квадратичную форму F(xu...,xn) = vl vl + A) ¦" ' an+p' гдеyr = xi+arx2 + - ¦ . + а"~1х„. Коэффициенты многочленаFявляются симметрическими функциями от корней многочлена /, поэтому они ве- вещественны. Это, в частности, означает, что форму F можно предста- представить в виде h2 + ... + h2p-h2p+1-...-h2n, где h\,..., hn —линейные формы от xi,..., хп с действительными ко- коэффициентами. Действительному корню ar соответствует слагаемое аг + р ог + р Это слагаемое можно представить в виде ±Л2, гДе знак плюс берется при аг + р > 0, а знак минус берется при аг + р < 0. Пара сопряженных корней аг и а3 дает вклад Fr,s = (аР + p)~ly2 + («р + р)~Ч2- Пусть уг = и + iv и (аг + р)~ху = X + ш, где u,v,\,u — вещественные числа. Тогда ys = u — iv и (as + p)~ly — X — ш. Поэтому Fr,s = 2X(u2 - v2) - 4auv. При и = 0 и при и = 0 форма FrjS принимает значения разного знака, поэтому FriS = и2 - v2. В итоге получаем, что все корни многочлена / вещественны и удо- удовлетворяют неравенству ar > —р в том и только в том случае, когда форма A) положительно определена. Элементы матрицы этой формы имеют вид J ai + р ctn + р Утверждения а) и б) получаются при р = +оо и при р = 0 соответ- ственно. ? Квадратичная форма, появляющаяся в теореме Сильвестра, имеет весьма интересную интерпретацию. Эта интерпретация позволит нам получить другое доказательство теоремы Сильвестра, причем даже для многочленов с кратными корнями. ^. Разделение корней 45 Рассмотрим линейное пространство V = К[х]/(/), состоящее из мно- многочленов, рассматриваемых по модулю многочлена / е Щх]. Будем счи- считать, что старший коэффициент многочлена / равен 1 и deg/ = п. Многочлены 1,х,... ,хп~г образуют базис пространства V. Каждому элементу аеУ можно сопоставить линейное отображение V -+ V, за- заданное формулой v >-*¦ av (элементы пространства V — многочлены; их можно перемножать). Пусть tr(a) — след этого отображения. Рассмо- Рассмотрим симметрическую билинейную форму <p(v,w) = tr(tw). х] и Sk = Теорема 4.5. а) Пусть f(x) = (х - cti) •... • (х - а„) = a* + ... + а*. Тогда матрица формы ср относительно базиса 1,х,... , хп~г имеет вид so Si Si S2 Sn-1 Sn Sn-1 Sn S2ji б) Сигнатура формы ф равна количеству различных вещественных корней многочлена /. Доказательство, а) Разложим многочлен / над полем С на вза- взаимно простые линейные множители: / = /С*1 •... • /^™г. Согласно китай- китайской теореме об остатках (лемма на с. 84) отображение h (mod /) ~ (h (mod задает канонический изоморфизм (mod /"')) В этом разложении множители взаимно ортогональны относительно формы ср. Действительно, пусть многочлены hi и hj относятся к мно- множителям с различными номерами i и j, т.е. hi = 0 (mod ///tmi) и hj = 0 (mod f/f™')- Тогда hthj = 0 (mod /), поэтому отображение v н* hihjV нулевое, а значит, его след равен нулю. Таким образом, ср = tpj + ... + tpr, где фi — ограничение формы ф на пространство C[x]/(jf™*) = С[х]/(х - <Xi)mi¦ Остается проверить, что фгA,х*) = mitxf. Матрица формы ф* легко вычисляется в базисе 1, х—оц,..., (х—щ)т{ -1. Действительно, в этом базисе отображение v >— (х — <ii)kv представля- представляется треугольной матрицей; след этой матрицы равен пц при к = 0 и равен 0 при к > 0. Воспользовавшись тем, что - ТГЦОЦ,
46 Глава!. Корни многочленов получим (fi(l,x) = m^cti. Затем с помощью равенства tp;(l, (x — ctj)fc) =0 индукцией по к получаем cpi(l,a;fc) = т*а*. б) При вычислении сигнатуры нужно оставаться в поле М, поэтому мы разложим многочлен / над полем R на взаимно простые линейные или квадратичные множители: / = /jmi • ... • /™г. Снова рассмотрим разложение [x]/(f) й 1) х ... х ВД(/Рт'). Нам достаточно проверить, что сигнатура ограничения формы tp на R[x]/(//™') равна 1, если deg/j = 1, и равна 0, если ft — неприводимый над R многочлен степени 2. Как мы уже выясняли, в базисе 1,х — а,, (т, 0 . . . 0 \ О О ... О I . . . . . Поэтому о о ... о/ если deg/j = 1, то сигнатура формы tpj равна 1. Если fi — неприводимый над Ж многочлен степени 2, то Щх] /(//"') = =? Ж[х]/(х2 + 1)т'; здесь имеется в виду изоморфизм над Ж. Таким об- образом, достаточно вычислить сигнатуру формы ср на Ш[х]/(х2 + 1)т. Матрицу формы tp удобно вычислять в базисе 1,х2,х2 + 1,х(х2 + 1), (х2 + IJ,... ,х(х2 + 1)т~1, (х2 + 1)т~х. В этом базисе операторы умно- умножения на ж и на х2 представляются матрицами / о 1 о оо.. -10 1 о о ... 0 0 0 1 0 ... 0 0 -1 0 1 ... v ; ; ; ¦;•¦./ /-10 1 0 0.. 0-10 10.. 0 0-101.. 0 0 0-10.. \ ; ; ; ; ; •• Поэтому след оператора умножения на х равен 0, а след оператора умно- умножения на х2 равен -2т. Операторы умножения на ха(х2 + 1)к, где а = = 0,1,2 и А; > 1, представляются диагональными матрицами с нулевыми диагоналями; такие операторы имеют нулевой след. В итоге получаем, что матрица формы tp имеет вид 2т о о .. 0 -2т 0 .. 0 0 0.. 0 0 0.. о о о о о Сигнатура такой формы равны нулю. а 4- Разделение корней 47 4.4. Разделение комплексных корней Теорема Штурма позволяет алгоритмически указать набор отрез- отрезков, которые содержат все вещественные корни вещественного много- многочлена, причем каждый отрезок содержит ровно один корень. Кронекер в серии работ A869-1878) разработал теорию, позволяющую алгоритми- алгоритмически указать набор кругов, которые содержат все комплексные корни комплексного многочлена, причем каждый круг содержит ровно один корень. Точнее говоря, Кронекер показал, что количество комплексных корней, заключенных внутри данного круга, можно вычислить с помо- помощью теоремы Штурма. Пусть z = х + iy. Представим многочлен P(z) в виде P(z) = ср(х, у) + + гф(х,у). Мы будем предполагать, что у многочлена Р нет кратных корней, т. е. если P(z) = 0, то P'(z) ф 0. Корню многочлена Р соответствует точка пересечения кривых tp = = 0 и ф = 0. Поэтому количество корней многочлена Р, лежащих внутри замкнутой несамопересекающейся кривой у> равно числу точек пересе- пересечения кривых tp = 0 и ф = 0, лежащих внутри у- Это число можно вычи- вычислить следующим образом. Будем обходить кривую у в положительном направлении, т. е. против часовой стрелки, и каждой точке пересечения кривых у и tp = 0 будем сопоставлять число Ej = ±1 по следующему пра- правилу: г, = 1, если из области фф > 0 попадаем в область фф < 0; Ej = — 1, если из области срф < 0 попадаем в область срф > 0. В случае общего положения количество точек пересечения кривых у и tp = 0 четно (при каждом прохождении через точку пересечения функция tp меняет знак), поэтому 5Z Ej = 2/г, где к — целое число. Теорема 4.6 (Кронекер). а) Число к равно количеству точек пере- пересечения кривых tp — 0 и ф = 0, лежащих внутри кривой у- б) Если у — окружность данного радиуса с данным центром, то для заданного многочлена Р число к вычисляется алгоритмически. Доказательство, а) Ясно, 4iodP(z) = (cpx +ityx)dx+(ф„-itfy)idy, поэтому срх + гфх = P'{z) = фу - i(fy, а значит, фу = ср* и фж = -ср„ (соотношения Коши-Римана). Таким образом, (fx 9» = ?« + Фу > О- Это означает, что поворот от вектора gradtp = (tp^tp^) к вектору gradф = (фх)фу) происходит против часовой стрелки. Геометрически
48 Глава 1. Корни многочленов это означает, что области фф > 0 и фф < 0 расположены так, как показано на рис. 1. фф SPI Ф = > I т = 0 0 ш Щ ¦ фф I 1 1 > 1 щ = 0 Гая* || if .1 0 Рис. 1 Будем стягивать кривую у в точку. При переходе через точку пе- пересечения* кривых ф = 0 и ф = О число к уменьшается на 1 (рис. 2), а при перестройке, изображенной на рис. 3, число А: не изменяется. Ясно также, что когда кривая у станет достаточно малой, то она не будет пересекаться с кривыми ф = 0 и ф = О, ав таком случае число А; будет равно 0. Yi Ф = 0 Рис. 2 Рис. 3 б) Окружность радиуса г с центром (а, Ь) можно следующим образом параметризовать вещественным параметром t: х = 1-t2 Подставив эти выражения в у(х,у), получим многочлен Ф(?) с веще- вещественными коэффициентами. Вещественные корни этого многочлена со- соответствуют точкам пересечения кривых у и ф = 0. По теореме Штурма 5. Ряд Лагранжа и оценки корней многочлена 49 для каждого корня можно найти отрезок, его содержащий. Вычислив знаки функции фф в концах этого отрезка, можно найти соответствую- соответствующее Ej. ? 5. Ряд Лагранжа и оценки корней многочлена 5.1. Ряд Лагранжа-Бюрмана оо Напомним, что если f(z) = YI cn(z — а)п, то где у — кривая, охватывающая точку а. Этим свойством мы восполь- воспользуемся для того, чтобы получить разложение функции f(z) в ряд по степеням ф(г) - Ь, где Ъ = ф(а). При этом в окрестности точки а функ- функция y(z) должна быть обратима, т. е. ф'(а) ф 0. В таком случае /'(г)ф'(а) _ /'(г)ф'(а) /'(а) , ср(г)-ср(а) ср'(а)(г-а) + ... z-a поэтому Проинтегрировав это равенство, получим а Y Преобразуем полученное выражение, выделяя члены ф(г) - Ь, где Ь = ф'(С) =f'(wW(Q ф(С) y(w) - Ъ - ф(С)' = Л _ V
50 Глава 1. Корни многочленов Изменив порядок интегрирования, получим При вычислении интеграла по ? рассмотрим лишь множители, завися- зависящие от ?: <р(о) (мы учли, что ф(а) -6 = 0). Таким образом, (Ф(С)-ЬГ+1' Рассмотрим такую функцию ф(м), для которой выполняется равенство cp(w) — b w — а' — Ь' A) Для такой функции ф(и>) получаем 1 Г f'(w)dw I f /'(и))(ф(и))) dti; 2jc* у (m(u;)—b)m 2т у (и; — а)т+1 ^ ш=а В самом деле, fc=0 где 5. Ряд Лагранжа и оценки корней многочлена 51 А интересующий нас интеграл равен коэффициенту при (w - а) 1 ряда оо Y, Ck(w -а)к~т~1, т.е. он равен ст. к=0 В итоге получаем следующее разложение /(г) по степеням ср(,г) - Ь: п=\ где ф(ги) определяется формулой A), т.е. ф(ги) = , . _fc. Ряд B) на- называют рядом Бюрмана. Бюрман получил его в 1799 г., обобщая ряд, полученный Лагранжем в 1770 г. Ряд Лагранжа получается из ряда Бюрмана при ср(-г) = Трр гДе h(z) — некоторая функция. В этом слу- случае Ь = ф(а) = 0 и Следовательно, где s = (?{z). В частности, п=0 C) п=0 Таким образом, в том случае, когда ряд C) сходится, он позволяет вы- вычислить корень уравнения z = а + s h(z). Пример. Пусть h(z) — z x. В этом случае ряд C) имеет вид z = i D) n=l Ряд D) сходится при \s\ < |а|2/4. Рассматриваемое уравнение z = а + s/z имеет два корня, а именно, Ряд D) представляет только первый из этих корней.
52 Глава 1. Корни многочленов 5.2. Ряд Лагранжа и оценки корней Ряд Лагранжа позволяет в некоторых случаях получить оценки кор- корней многочлена. Рассмотрим, например, многочлен f(z) = а0 - с) + a2(z - сJ + ... +ak(z - с)к. Уравнение f(z) = О можно записать в виде z — с + s h(z), где s = — 1/ai, h(z) = по + a2(z - сJ + az{z - сK + ... + ak{z - c)k. Ряд Лагранжа для этого уравнения имеет вид < n=l В нашем случае hn(z) = ? «оХ: Vo+V2 + ...+Vt=n поэтому ?i (Л"(*))х=е = n! к vq!v2!-... (*-сJ Vo!v2!- ... ¦ V*! ^%а2 -...а,. A) где суммирование ведется по наборам vo + V2 + ... + v/t, удовлетворяю- удовлетворяющим соотношениям vo + v2 + ... + v/t = n, 2v2 + ... + fcvft = n — 1. Эти соотношения эквивалентны соотношениям n - 1 = 2v2 + ... + bfc, v0 = v2 + 2v3 + ... + (к - l)vfc + 1. Учитывая, что s = — 1/ai, получаем z — c — ад vp Bv2 + ... + bfc)! / а0а2 \  /uq 'a ai A/ vo!v2! • ••• • vt! ^(-oiJ/ '" \(-ai)' , B) где v0 = v2 + 2v3 + ... + (к - l)vfc + 1. Если ряд B) сходится, то определяемое этим рядом число z является одним из корней уравнения f(z) = 0. Задачи к главе 1 53 Теорема 5.1 [Be]. Пусть |ао| + \а2\ + ... + \ак\ < Ы- Тогда ряд B) сходится и для корня z, определяемого этим рядом, выполняется неравенство |Z - C| < - In ( 1 - щ\Ы + l«2| + • • • + Доказательство. Из формулы A) следует, что Поэтому п=1 . D Задачи к главе 1 1.1. Доказать, что многочлен f(x) делится на f'(x) тогда и только тогда, когда f(x) = ао(х - хо)п- 1.2. Доказать, что многочлен a0 + alX имеет не более п положительных корней. 1.3 (Ньютон). Доказать, что если все корни многочлена Р{х) = aoxn l с вещественными коэффициентами вещественны и попарно различны, то a~ > n_ г —ai_iai+i, г = 1,2,...,п-1. 1.4. Доказать, что многочлен axxmi + а2хт2 + ... + апхт" не имеет корней кратности более п — 1, отличных от нуля.
54 Глава 1. Корни многочленов 1.5. Найти число вещественных корней следующих многочленов: х2 хп б) пхп - я" - ... - 1. 1.6. Пусть 0 = mo < mi < ... < тп и ггц = i (mod 2). Доказать, что многочлен хт2 апх а0 + aixmi + а2х п имеет не более п вещественных корней. 1.7. Пусть хо — корень многочлена хп + а\Хп~1 +... + ап- Доказать, что для любого е > О существует такое 8 > 0, что если |а, — а\\ < 8, i = 1,..., п, то у многочлена хп + а\хп~х + ... + а'п есть корень х'о, для которого \хо - х'0\ < е. 1.8. Пусть числа ах,... ,ап попарно различны, а числа Ъ\,... ,Ъп по- положительны. Доказать, что в таком случае все корни уравнения ЕЪк = х — с, х~ак вещественны. 1.9. Найти все корни уравнения (х2-х+1K _ (а2-а + хЦх-1J ~аг(а-1У ' 1.10. Найти число корней многочлена хп +хт — 1, абсолютные вели- величины которых меньше 1. 1.11. Пусть f(z) = zn + a\zn~l + ... + ап, где <ц,... ,а„ е С. Дока- Доказать, что любой корень z многочлена / удовлетворяет неравенствам —р < Rez < а, где а — единственный положительный корень много- многочлена х" + (Кеа1)хп~1 - \a2\xn~2 - ... - \ап\, ар — единственный положительный корень многочлена хп - (Reai)!"-1 - \а2\хп~2 - ... - \ап\. 1.12 [Su]. Пусть f(z) — многочлен степени п с комплексными коэф- коэффициентами. Доказать, что многочлен F — f ¦ f • J'"¦...• /'n-1) имеет по крайней мере п + 1 различных корней. Решекил задач 55 Решения задач 1.3. Положим Q{y) = ynP{y~1)- Корни многочлена Q(y) тоже веще- вещественны и попарно различны, поэтому корни квадратного трехчлена = (п - 2) • (п - 3) ¦... • 4 ¦ 3 {п(п - 1)апу2 + 2(п - 1)а„_ц/ + 2ап_2) вещественны и различны. Следовательно, (п - 1Jа2п_1 > 2п(п - 1)а„а„_2. При i = п — 1 требуемое неравенство доказано. Рассмотрим теперь многочлен Р^-(-^(х) - boxi+1 + bxxl + ... + bi+1x2 + biX + bi-i. Применив к нему уже доказанное неравенство, получим ,2. 2A + 1)^ ,_ А так как то bi+i = (п - i + 1) •... • 4 • 3 ai+i, bi = (п — i) •... ¦ 3 • 2 Of, bi-i = (n-i- 1) •... -2- lai_i, B(n - После сокращения получаем требуемое неравенство. 1.11. При возрастании а: от 0 до +оо функция хп ± Reai монотонно возрастает, а функция |аг|/а; + \а3\/х2 + ... + \ап\1хп~1 монотонно убы- убывает. Поэтому у каждого из рассматриваемых многочленов положитель- положительный корень единствен. Предположим, что f(z) = 0 и Rez > а. Тогда a + Reaj < Re(z + ai) < |z + ax| = |a2/z + a3/z2 + ... + an/zn-l\ < < \a2\/\z\ + ... + lonl/l^l"-1 < |a2|/ct + ... + Kl/ot"-1 (последнее неравенство следует из того, что \z\ > Rez > а). С другой стороны, по условию a + Reai = |a2|/a + ... + \an\l<xn~l. Приходим к противоречию. Оценка снизу для Re z получается как оценка сверху для веществен- вещественной части корня многочлена (~l)nf(-z).
56 Глава!. Корни многочленов 1.12. Пусть zi,...,zm—различные корни многочлена F, и_,(г) — кратность Zj как корня многочлена /<г>, где г = 0,1,..., п — 1. Рассмо- Рассмотрим симметрические функции «*(»") = A) т.е. Sft(r) — сумма к-х степеней корней многочлена /<г'. Элементар- Элементарные симметрические функции от корней многочлена /'г' будем обозна- обозначать Ofc(r); при к > п - г полагаем ак(г) = 0. п Легко проверить, что если /B) = Yl (-l)ka,kZn~k, то fc=O fc=o поэтому ак (п - к)\(п - г)! пк а0 n!(n-Jfc-r)! Оо " Г"^ ¦ (п - г) •... ¦ (п - fc - г + 1). Таким образом, Ofc(r)—многочлен степени к от переменной г, причем afc(n)=0. На с. 93 для к > 1 доказано тождество 1 0 ... О <n l ... о Из этого тождества, в частности, следует, что Sf.{r), где к > 0, можно представить в виде линейной комбинации членов сг/^г).. . ст/ьр(г), где fci ¦+• ... + fcp = к; коэффициенты этой линейной комбинации не зависят от г. Следовательно, если к > 1, то Sk(r) — многочлен степени не выше к от переменной г. Ясно также, что so(r) = ^, Uj(r) =n — r и Sk(n) = 0 при всех А; > 0. Рассмотрим соотношение A) при к = 0,1,...,т— 1 как систему ли- линейных уравнений относительно неизвестных u.j(r), j = l,...,m. По условию числа zi,... ,zm попарно различны, поэтому определитель рас- рассматриваемой системы уравнений не равен нулю (этот определитель Решения задач 57 является определителем Вандермонда). Решив эту систему линейных уравнений по правилу Крамера, получим представление идг) в виде линейной комбинации членов Sfc(r), к = 0,... ,тп-1, причем в этой линей- линейной комбинации коэффициенты не зависят от г. Следовательно, Uj(r) — многочлен степени dj < т — 1 от переменной г. При этом Uj(n) = 0, так как Sk(n) = 0 при всех А;. Предположим, что количество различных корней многочлена F строго меньше п + 1, т.е. т < п + 1. Тогда dj < т — 1 < п, т.е. ixj (г) — многочлен от переменной г степени не выше п — 1. В таком случае A1Uj(r) = u.j(r + 1) — Uj(r) — многочлен степени не выше п — 2, Д2иДг) = AxUj(r + 1) — AxUj(r) — многочлен степени не выше п — 3, ... ..., An-1Uj(r)—константа и AnUj(r)—тождественный нуль. В част- частности, г=0 Чтобы прийти к противоречию, достаточно показать, что Anui@) ф 0. Рассмотрим выпуклую оболочку корней многочлена /. По теореме Гаусса-Люка (теорема 2.1 на с. 22) она совпадает с выпуклой оболочкой точек zi,...,zm. Можно считать, что z\ — вершина выпуклой оболочки корней многочлена /. Тогда точка z\ лежит вне выпуклой оболочки то- точек «2,..., 2т. Пусть u = Ui@) — кратность zi как корня многочлена /. Тогда при 0 < г < и — 1 число z\ будет корнем кратности и — г много- многочлена /*г', а /*"'(zi) Ф 0- Выпуклая оболочка корней многочлена /W содержит 2i, поэтому /'r4zi) Ф 0 ПРИ ^ > и. Таким образом, не _ J _ Ju-r приО<г<и-1; О при г > и. Ясно также, что и < г» — 1, поскольку у / есть по крайней мере один корень, отличный от 2i. Поэтому 0 при 0 < г < п - 1, гфи-1; 1 при г = и — 1. Следовательно, при п > 2 получаем п-2 г=0 а при п = 2 получаем и = 1 и A2ui@) = 1. В обоих случаях Anui@) Ф 0, что и требовалось.
Глава 2 Неприводимые многочлены 6. Основные свойства неприводимых многочленов 6.1. Разложение многочленов на неприводимые множители Пусть /ид — многочлены с коэффициентами из поля к. Говорят, что многочлен / делится на многочлен д, если / = gh, где h — некоторый многочлен (с коэффициентами из поля к). Многочлен d называют общим делителем многочленов /ид, если / и g делятся на d. Общий делитель d многочленов /ид называют наибольшим общим делителем многочленов /ид, если он делится на любой общий делитель многочленов /ид. Ясно, что наибольший общий делитель определен однозначно с точностью до умножения на ненулевой элемент поля к. Наибольший общий делитель d = (/, g) многочленов /ид можно найти с помощью следующего алгоритма Евклида. Для определенно- определенности будем считать, что cleg/ > cleg д. Пусть г\ —остаток от деления / на д, Ti — остаток от деления g на Г\, ..., rk+i — остаток от деления Г/t-i на tv Степени многочленов г, строго убывают, поэтому для неко- некоторого п получим гп+\ = 0, т.е. rn_i делится на гп. При этом /ид делятся на гп, так как на г„ делятся многочлены rn-i,^n-2, • • ¦ Кроме того, если /ид делятся на некоторый многочлен h, то г„ делится на Л, так как на h делятся многочлены ri,r2, • ¦. Таким образом, гп = (/,д). Непосредственно из алгоритма Евклида вытекают важные след- следствия, которые мы сформулируем в виде отдельной теоремы. Теорема 6.1. а) Если d — наибольший общий делитель многочленов / и д, то найдутся такие многочлены а и Ъ, что d = af + bg. б) Пусть /ид многочлены над полем к с К. Тогда если у многочле- многочленов fag есть нетривиальный общий делитель над полем К, то у них есть нетривиальный общий делитель и над полем к. Многочлен / с коэффициентами из кольца А: называют приводимым над к, если / = gh, где д и h — многочлены положительной степени с ко- коэффициентами из кольца к. В противном случае многочлен / называют неприводимым над к. 6. Основные свойства неприводимых многочленов 59 Пусть / = /i •••¦•/« — некоторое разложение многочлена / над по- полем к на множители /ь...,/», являющиеся многочленами над полем к. От разложения на множители с произвольными коэффициентами можно перейти к разложению со старшим коэффициентом 1. В самом деле, если fi{x) = aix' +... — многочлен над полем к, то gi = ajl}i — тоже много- многочлен над полем к, причем его старший коэффициент равен 1. Поэтому разложение f = fi ¦ ¦¦ ¦ ¦ fs можно заменить на разложение / = ад\ ¦... ... gs, где а — a\-...as. Мы не будем различать два разложения такого вида, отличающиеся лишь порядком множителей. Теорема 6.2. Пусть к — поле. Тогда у многочлена / е к[х] есть разложение на неприводимые множители, причем это разложение един- единственно. Доказательство. Существование разложения легко доказывается индукцией по п = deg /. Прежде всего отметим, что для неприводимого многочлена / требуемое разложение состоит из самого многочлена /. При п = 1 многочлен / неприводим. Пусть разложение существует для любого многочлена степени меньше п и / — многочлен степени п. Мож- Можно считать, что многочлен / неприводим, т.е. / = gh, где degg < п и deg Л < п. Но тогда разложения для д и h существуют по предположе- предположению индукции. Докажем теперь единственность разложения. Пусть agi ¦ ... • gs = = bh\ ¦ ... ¦ ht, где a, b e к и gi,...,gs, hi,..., ht — неприводимые мно- многочлены над к со старшим коэффициентом 1. Ясно, что в таком случае а = Ь. Многочлен д\... д3 делится на неприводимый многочлен hi. Это означает, что один из многочленов gi,..., gs делится на hi. Чтобы убе- убедиться в этом, достаточно доказать следующее вспомогательное утвер- утверждение. Лемма. Если многочлен qr делится на неприводимый многочлен р, то один из многочленов q и г делится на р. Доказательство. Пусть многочлен q не делится на,р. Тогда (р, q) = = 1, т. е. существуют такие многочлены а и Ь, что ap + bq = 1. Умножив обе части этого равенства на г, получим apr + bqr = г. Многочлены рг и qr делятся на р, поэтому г делится на p. G Пусть для определенности gi делится на h\. Учитывая, что gitihi — неприводимые многочлены со старшим коэффициентом 1, получаем д\ = = hi. Сократим обе части равенства gi ¦... ¦ gs = hi ¦... ¦ ht на gi —hi. После нескольких таких операций получим s = t и gi = Л»г, ..., э« = Л»,, где {ii,...,is} = {l,...,s}. ?
60 Глава 2. Неприводимые многочлены Для кольца целых чисел Z неприводимость многочленов определя- определяется точно так же, как и в случае поля, т. е. многочлен / е Z[i] непри- неприводим над Z, если его нельзя представить в виде произведения много- многочленов положительной степени с целыми коэффициентами. Но в случае кольца не всегда можно поделить коэффициенты многочлена на стар- старший коэффициент; можно лишь поделить коэффициенты на наибольший общий делитель всех коэффициентов. Это приводит к следующему опре- определению. Пусть f(x) = ^Oii*, где а, е Z. Наибольший общий делитель коэффициентов ао,-¦ ¦ ,ап называют содержанием многочлена /. Содер- Содержание многочлена / обозначают cont(/). Ясно, что f(x) = cont(f)g(x), где g — многочлен над Z с содержанием 1. Лемма (Гаусс), cont(fg) = cont(/)cont(g). Доказательство. Достаточно рассмотреть случай, когда cont(/) = = cont{g)' = 1. В самом деле, коэффициенты многочленов f,gnfg можно разделить на cont(/), cont(G) и cont(/3), соответственно. Пусть f{x) = Y^aiX1, g(x) = ~Z,biX', fg(x) = ?с*а;г. Предположим, что cont(/g) = d > 1 и p — простой делитель числа d. Тогда все коэф- коэффициенты многочлена fg делятся на р, а у многочленов / и g есть ко- коэффициенты, не делящиеся на р. Пусть ат — первый коэффициент мно- многочлена /, не делящийся на р, bs — первый коэффициент многочлена д, не делящийся на р. Тогда cr+s = arbs ar+2bs-2 = arbs ? 0 (mod p), так как bs-i = bs_2 = ... = bo = 0 (mod p), ar_i = ar_2 = ... = a0 = 0 (mod p). Получено противоречие. ? Следствие. Многочлен с целыми коэффициентами неприводим над Z тогда и только тогда, когда он неприводим над Q. Доказательство. Пусть / е Ъ[х] и / = gh, где j,/ie <Q[z]. Можно считать, что cont(/) = 1. Выберем для многочлена д натуральное чи- число тп так, что тпд е Ъ[х\. Пусть п — cont(mg). Тогда рациональное число г = тп/п таково, что гд е Ъ\х\ и cont(rg) = 1. Аналогично выбе- выберем положительное рациональное число s для многочлена h. Покажем, 6. Основные свойства неприводимых многочленов 61 что в таком случае rs = 1, т. е. разложение / = (rg)(sh) является разло- разложением над Z. Действительно, согласно лемме Гаусса cont(rg) cont(sh) — — cont(rsgh), т.е. 1 = cont(rs/). Учитывая, что cont(/) = 1, получаем rs = 1. ? Для вычисления разложения многочлена / eZ[i] на неприводимые множители Кронекер предложил следующий алгоритм (алгоритм Кро- некера). Пусть deg/ = лиг= [п/2]. Если многочлен /(х) приводим, то у него есть делитель д(х) степени не выше г. Чтобы найти этот де- делитель д{х), рассмотрим числа Cj = f(j), j = 0,1,... ,г. Если с, = 0, то х — j — делитель многочлена f(x). Если же Cj ф 0, то g(j) — делитель числа Cj. Каждому набору do,-.. ,dr делителей чисел Со,..., сг соответ- соответствует ровно один многочлен д(х) степени не выше г, для которого 9(j) = dj, j = 0,1,...,г. А именно, 9(*) = i (х) = j=0 Для каждого такого многочлена д(х) нужно проверить, будут ли его ко- коэффициенты целыми числами и будет ли он делителем многочлена f(x). Другие, более эффективные алгоритмы разложения многочленов на неприводимые множители приведены ниже (см. с. 85-87 и 313-323). 6.2. Признак Эйзенштейна Одним из наиболее известных признаков неприводимости многочле- многочленов является следующий признак Эйзенштейна. Теорема 6.3 (признак Эйзенштейна). Пусть f(x) = ao + a\x + ... ... + апхп — многочлен с целыми коэффициентами, причем для некото- некоторого простого числа р коэффициент а„ не делится на р, коэффициенты ао,.. • ,an_i делятся на р, но коэффициент ао не делится на р2. Тогда / — неприводимый многочлен. Доказательство. Предположим, что причем д и h — многочлены положительной степени с целыми коэффи- коэффициентами. Число 6qCo = «о делится на р, поэтому одно из чисел bo и со
62 Глава 2. Неприводимые многоч. делится на р. Пусть, для определенности, 6о делится на р. Тогда со не де- делится на р, так как ао = босо не делится на р2. Если все числа 6j делятся на р, то ап делится на р. Поэтому 6* не делится на р при некотором i, где О < i < deg<? < n; можно считать, что i — наименьший номер чи- числа bi, не делящегося на р. С одной стороны, по условию число щ делится на р. С другой стороны, а* = 6,со + 6,_iCi + ... + бос*, причем все чи- числа bj-iCi,..., bod делятся на р, а число btco не делится на р. Получено противоречие. D Пример 6.1. Пусть р — простое число, а число q не делится на р. Тогда многочлен хт — pq неприводим над Z. Пример 6.2. Если р — простое число, то многочлен f(x) = xp~l + + хр~2 + ... + х + 1 неприводим. В самом деле, к многочлену можно применить признак Эйзенштейна. Пример 6.3. Для любого натурального п многочлен f(x) = l + x + ^ + ... + ^ неприводим. Доказательство. Требуется доказать, что многочлен nlf(x) = хп п(п - 1)х п~2 п! неприводим над Z. Для этого достаточно найти такое простое число р, что п! делится на р, но не делится на р2, т. е. р < п < 2р. Пусть п = 2т или п = 2т + 1. Согласно постулату Бертрана суще- существует такое простое число р, что т < р < 2т (доказательство посту- постулата Бертрана см., например, в [Ч]). При п = 2т неравенства р < п <2р очевидны. При п — 2т + 1 получаем неравенства р < п — I и п - 1 < 2р. Но в этом случае число п - 1 четно, поэтому из неравенства п — 1 < 2р следует неравенство п < 2р. Ясно также, что p<n-l<n. D 6. Основные свойства неприводимых многочленов 63 6.3. Неприводимость по модулю р Пусть ?р — поле вычетов по модулю р. Многочлен с целыми коэф- коэффициентами можно рассматривать и как многочлен с коэффициентами из поля ?р. При этом неприводимый над Z многочлен может оказаться приводимым над полем Fp при всех р. Построение соответствующего примера основано на следующей теореме. Теорема 6.4. Многочлен Р(х) = х*+ах2+Ь2, где a, b над полем Fp при всех простых р. Z, приводим Доказательство. При р = 2 имеется всего 4 многочлена указан- указанного вида, а именно, я4, х*+х2 = х2(х2 + 1), х4 + 1 = (х + 1L, х*+х2 + 1 — = (х2 + х + IJ. Все эти многочлены приводимы. Пусть р — нечетное простое число. Тогда можно выбрать целое чи- число s так, что a = 2s (mod p). В таком случае Р(х) =хА+ ах2 +Ь2 = (х2 + sJ - (s2 - b2) = = (х2 + bJ - B6 - 2s)x2 = = (x2 - bJ - (-26 - 2s)x2 (mod p). Поэтому достаточно доказать, что одно из чисел s2 — Ь2, 26 —2s, —26 —2s является квадратичным вычетом по модулю р. Напомним основные сведения из теории квадратичных вычетов. При отображении х >-*¦ х2 элементы х и —х переходят в один и тот же эле- элемент. Поэтому образ множества ненулевых элементов поля Fp при этом отображении состоит из (р - 1)/2 элементов. С другой стороны, если х = у2, то х'Р"'/2 = ур~1 = 1, т.е. все (р - 1)/2 элементов образа удовлетворяют уравнению х(-р~1^2 = 1, которое не может иметь более (р - 1)/2 решений. Элементы, не лежащие в образе отображения х >—¦ х2 удовлетворяют уравнению х^-р~1^2 = — 1. Поэтому если два целых чи- числа не являются квадратами по модулю р, то их произведение является квадратом по модулю р. Предположим, что 26 - 2s и -26 - 2s не являются квадратами по модулю р. Тогда их произведение 4(s2 - б2) —квадрат по модулю р, а значит, s2 — б2 тоже квадрат по модулю р. О Пример 1. Многочлен х4 + 1 неприводим над Z, но приводим по модулю р при всех простых р.
64 Глава 2. Неприводимые многочлены Доказательство. Достаточно доказать, что многочлен х4 + 1 неприводим над Z. Корни этого многочлена имеют вид (±1 ± 0/2- В любой многочлен с вещественными коэффициентами невеществен- невещественные корни могут входить лишь парами (комплексно сопряженными). Поэтому единственными нетривиальными вещественными делителями многочлена х4 +1 являются многочлены х2 ± \/2х +1 с корнями A ±г)/2 и (-1 ± г)/2. Оба эти многочлена не лежат в Ъ[х). ? ПРИМЕР 2. Пусть с е N и у/с ? Q.'Тогда многочлен Р(х) = х4 + + 2A —с)х2 + A+сJ неприводим над Z,ho приводим по модулю любого простого числа р. Доказательство. Достаточно доказать, что многочлен Р(х) не- неприводим над Z. Легко проверить, что корни многочлена Р равны ± yl + « ± г-^/с = ±1 ± у/с. Объединяя комплексно сопряженные корни в пары, получим многочлены х2 ± 2у/сх + 1 + с. Эти многочлены не лежат в Z[x]. a 7. Признаки неприводимости 7.1. Признак Дюма п Пусть р — фиксированное простое число, f(x) = ?] А{Хг—много- А{Хг—многого член с целыми коэффициентами, причем А0А„ ф 0. Запишем ненулевые коэффициенты многочлена / в виде А{ = а,р°", где а* — целое число, не делящееся на р. Каждому ненулевому коэффициенту щра{ сопоста- сопоставим точку на плоскости с координатами (i,a,-). По этим точкам можно построить диаграмму Ньютона многочлена / (соответствующую про- простому числу р). Делается это следующим образом. Пусть Ро = @, а0) и Pi — (ii,ctjj), где i\—наибольшее целое число, для которого ниже прямой Р(,Р\ нет данных точек. Пусть, далее, Pi = (г'2,а*2), где ii — наибольшее целое число, для которого ниже прямой Р\Рч нет данных точек и т.д. (рис. 4). Самый последний отрезок имеет вид РГ^\РГ, где Pr = (n,ctn). Если звенья ломаной Pq ... Рг проходят через точки с це- целочисленными координатами, то все эти точки мы тоже считаем вер- вершинами ломаной. При этом к вершинам Ро,..., Рт добавляется еще s > > 0 вершин. Полученную в результате ломаную Qo ... Qr+S называют диаграммой Ньютона (здесь Qo = -Ро и Qr+S — Рг). Отрезки 7. Признаки неприводимости 65 и QiQi+i будем называть, соответственно, сторонами и звеньями диа- диаграммы Ньютона, а векторы QiQi+\ будем называть векторами звеньев диаграммы Ньютона. P5=Qe Рассмотрим систему векторов звеньев диаграммы Ньютона, взяв ка- каждый вектор с учетом его кратности, т. е. столько раз, сколько он вхо- входит в число векторов звеньев. Теорема 7.1 (Дюма, [Dum]). Пусть / = gh, где /, д и h—много- h—многочлены с целыми коэффициентами. Тогда система векторов звеньев для многочлена / представляет собой объединение систем векторов звеньев для д и h. (Простое число р для всех многочленов берется одно и то же.) п т Доказательство [W]. Пусть f(x) - ? щрп{х\ д{х) = J2 bjpP'xj и г=0 j=0 п—т h(x) = Yl CkP<kxk (числа a,i,bj,Ck не делятся нар). Возьмем некоторую fc=O сторону Р;Р(+1 диаграммы Ньютона многочлена / (сторона P;P;+i мо- может состоять из нескольких звеньев диаграммы Ньютона). Пусть точки Pi и P(+i имеют соответственно координаты (г_,а$_) и (i+,ai+). Наклон стороны Р/Р/+1 равен м = а»+ ~ оц_ _ 1+-г- Пусть di+ - щ_ = At и г'+ - г_ = It, где t > 0 — наибольший общий делитель чисел а,+ — а;_ и i+ — г_. Тогда М = А/1, причем {А,1) = 1. Рассматриваемая сторона P/Pi+i диаграммы Ньютона лежит на пря- прямой la- Ai = F, где F = Iai+ — Ai+ = 1щ__ - Ai-. По условию все точки (i,otj), г = 0,1,...,п, лежат не ниже этой прямой, т.е. Iati - Ai > F, 3-1010
66 Глава 2. Неприводимые многочлены причем это неравенство строгое при г < г_ и при г > г_|_. Будем на- называть число Iati - Аг весом монома ар°У, где (а,р) = 1. Числа г_ и г+ однозначно определяются как наименьший и наибольший показатели степени х мономов многочлена / с минимальным весом. Для многочлена g рассмотрим величину G = и определим j_ и j+ как наименьший и наибольший индексы, для кото- которых Аналогично для многочлена h рассмотрим величину Я = min {Iyk - Ак] к=О,...,п—т и определим к- и к+ как наименьший и наибольший индексы, для кото- которых Я = /у*_ -Ак_ = 1ук+-Ак+. Ясно, что Вес произведения двух членов равен сумме их весов, поэтому вес слага- слагаемого с j = j_ и fc = fc_ равен G + Н. Веса всех остальных слагаемых строго больше G + H, так как для них j < j- или А; < fc_. В самом деле, пусть, например, j < j_. Тогда вес члена bjp^'x^ строго больше G, а вес члена скр*кхк не меньше Н. Вес члена (bjpP>xj)(ckp<kxk) при j + k = const монотонно возрастает с возрастанием C, + у*> поскольку / > 0. В рассматриваемом случае j -г к = j- + к-, поэтому сумма Cj + у* строго минимальна при j = j- ж к — к-. Следовательно, вес члена a.j_+k_pai~+k- равен G + Н. Ясно также, что при г < j_ + fc_ вес члена (цра'хг строго больше G + Н, а при г > j- + к- вес члена а,;ра'хг не меньше G + Н. Следовательно, G + H = Fiij-+k- = i-. Аналогично доказывается, что j+ -f к+ = i+. Таким образом, - г_ = A) В частности, одно из чисел j+ - j- и к+ - /г_ отлично от нуля. 7. Яризноки неприводимости 67 Если оба числа j+ — j_ и к+ — к- отличны от нуля, то отрезок с кон- концами (j_,pj_) и (j+,Cj+) является стороной диаграммы Ньютона мно- многочлена д, а отрезок с концами (fc_,yfc_) и (А;+,у*;+) является стороной диаграммы Ньютона многочлена h. Наклон сторон в обоих случаях ра- равен М = А/1, так как з+ - з- к+ — к- Соотношение A) показывает, что сумма длин сторон с наклоном М диаграмм Ньютона многочленов д и h равна длине стороны (с тем же самым наклоном М) диаграммы Ньютона многочлена /. Если же одно из чисел j+ —j- и к+ - /г_ равно нулю, то у диаграммы Ньютона одного из многочленов д w h есть сторона с наклоном М, при- причем ее длина равна длине стороны диаграммы Ньютона многочлена /, а у диаграммы Ньютона другого многочлена сторон с наклоном М нет. Итак, вектор стороны с наклоном М диаграммы Ньютона много- многочлена / равен сумме векторов сторон с тем же наклоном М диаграмм Ньютона многочленов д и h. Соотношение A) показывает, что если у одной из диаграмм Ньютона многочленов д и h есть сторона с некото- некоторым наклоном М, то у диаграммы Ньютона многочлена / тоже должна быть сторона с таким наклоном. fa Следствие (Признак Дюма). Если для некоторого простого числар диаграмма Ньютона многочлена / состоит ровно из одного звена (т. е. состоит из отрезка, внутри которого нет точек с целочисленными ко- координатами), то многочлен / неприводим. Приведем теперь три примера применения теоремы Дюма для дока- доказательства неприводимости многочленов. Пример 7.1 (Признак Эйзенштейна). Пусть / = а0 + а\х + ... ... + апхп — многочлен с целыми коэффициентами, причем для некото- некоторого простого числа р коэффициент ап не делится на р, коэффициенты а0,.. ¦ ,an-i делятся на р и коэффициент а0 не делится на р2. Тогда / — неприводимый многочлен. Доказательство. Диаграмма Ньютона многочлена / состоит из одного отрезка с концами @,1) и (п, 0); внутри этого отрезка нет точек с целочисленными координатами. D з*
68 Глава 2. Неприводимые многочлены Пример 7.2. Пусть р— простое число, (с,р) — 1 и (т,п) = 1. Тогда многочлен хп + срт неприводим. Доказательство. Диаграмма Ньютона рассматриваемого много- многочлена представляет собой отрезок с концами @, т) и (п, 0). Из условия (т, п) = 1 следует, что внутри этого отрезка нет точек с целочислен- целочисленными координатами. П Пример 7.3. Пусть р — простое число. Тогда если у многочлена f(x) = хп + рх + Ьр2, где (Ь, р) = 1, нет целых корней, то этот мно- многочлен неприводим. Доказательство. Диаграмма Ньютона многочлена / состоит из отрезка с концами @,2) и A,1) и отрезка с концами A,1) и (п,0). Вну- Внутри этих отрезков нет точек с целочисленными координатами, поэтому нетривиальное разложение многочлена / над Z может состоять лишь из линейного множителя и множителя степени п — 1. ? 7.2. Многочлены с доминирующим коэффициентом В некоторых ситуациях можно утверждать, что многочлен, у кото- которого есть достаточно большой коэффициент, обязательно будет непри- неприводимым. Среди признаков такого рода наиболее известен следующий признак Перрона. Теорема 7.2 [Ре]. Пусть f(x) = хп + <цхп~1 +... + ап — многочлен с целыми коэффициентами, причем ап ф 0. а) Если |d| > 1 + |аг| + ... + \а„\, то многочлен / неприводим. б) Если водим. > 1 + |<x2| + ... + |а„| и /(±1) Ф 0, то многочлен / непри- Доказательство. а) Проверим сначала, что все корни много- многочлена /, за исключением ровно одного корня, лежат строго внутри единичного круга \z\ < 1. Ясно, что требуемым свойством обла- обладает многочлен д(х) = хп + aixn~x, поэтому согласно теореме Руше (см. с. 9) достаточно доказать, что при \z\ = 1 выполняется неравенство \f{z)-g(z)\ < \f(z)\ + \g(z)\. Но при \z\ = 1, с одной стороны, \f(z) - g{z)\ = \a2zn ~2 ап\<\а2\ <\сц\- A) 7. Признаки неприводимости 69 а с другой стороны, = \zn+aiz n-li = \z B) Предположим, что многочлен / можно представить в виде произве- произведения многочленов /i и /2 положительной степени с целыми коэффици- коэффициентами. Произведение корней каждого из многочленов /i и /2 — целое число, не равное нулю, поэтому у каждого из этих многочленов есть ко- корень, модуль которого не меньше 1. Но у многочлена / есть лишь один такой корень. Приходим к противоречию. б) В случае |d| = 1 + |аг| + ¦ ¦ • + |ап| неравенство A) становится не- нестрогим. Но при условии /(±1) Ф 0 становится строгим неравенство B). В самом деле, при |z| = 1 равенство возможно лишь в том случае, когда одновременно выполняются равен- равенства |/(г)| = 0 и \z + ai| = |dI - 1- Последнее равенство может выпол- выполняться лишь в том случае, когда z А так как \z = 1 тог = ±1. ? Теорема 7.3 [Вг]. Пусть d > а2 > ... > ап — натуральные числа, причем п > 2. Тогда многочлен р(х) = хп - а\хп~1 - а2хп~2 — ... — а„ неприводим. Доказательство. Рассмотрим многочлен f(x) = (х — 1)р(х). Ясно, что /(*) = xn+1 - где bi = ai + l,b2 = ai - а2,... ,bn = an_x - an,bn+i = an. Числа bi,... ..., bn+i натуральные и bi = 1 + b2 + ... + 6n+1. Таким образом, много- многочлен f(x) удовлетворяет одному из условий теоремы 7.2 (б). Но он не удовлетворяет второму условию /(±1) Ф 0. Поэтому придется провести чуть более тонкие рассуждения. Покажем сначала, что при всех доста- достаточно малых е > 0 на окружности |z| = 1 + е многочлен h(z) = b\zn — — b2zn~1 — ... — bn+i no модулю строго больше многочлена zn+1 = = f(z) + h(z). В самом деле, если |г| = 1 + е, то |М*)| - l*n+1l > Mi + е)п - Ы1 + Ю" - ¦ ¦ • - Ъп+1 - A + е)п+1 = = t(nbi - (n - 1N2 - •¦• - 26n_i ~bn- (n + 1)) + ...= = t(b2 + 2b3 + ... + (n- l)bn + nbn+1 - 1) + ...
70 Глава 2. Неприводимые многочлены Коэффициент при е положителен, поэтому при достаточно малых е > > 0 выполняется неравенство |Л(.г)| — |zn+1| > 0. В таком случае h(z)\ = \h(z)\ < \f(z)\ + \h(z)\, поэтому согласно теореме Руше многочлен f(z) имеет внутри круга \z\ < 1 + е столько же корней, сколько и многочлен h(z). Но все корни многочлена h(z) лежат строго внутри единичного круга \z\ < 1. В самом деле, если \z\ > 1, то \h(z)\>bl\z\n-b2\zr1~...-bn+1> Устремив е к нулю, получим, что внутри и на границе единичного круга расположено ровно п корней многочлена f(x) = (х - 1)р(х). Поэтому ровно п — 1 корней многочлена р(х) лежит внутри единичного круга и лишь один из его корней лежит вне единичного круга. Следовательно, многочлен р неприводим. ? Признак неприводимости, аналогичный признаку Перрона, но с усло- условием не на коэффициент при хп~1, а на свободный член (младший ко- коэффициент), тоже справедлив, но лишь в том случае, когда свободный член — простое число. Теорема 7.4 [Os]. Пусть f(x) = хп + сцх"'1 + ... + an-ix ± р — многочлен с целыми коэффициентами, причем р—простое число. а) Если р > 1 + |ai| + ... + |an-i |, то многочлен / неприводим. б) Если р > 1 + |ai| + ... + |an_i| и среди корней многочлена / нет корней из единицы, то многочлен / неприводим. Доказательство. Предположим, что f(x) = g(x)h(x), где д и h — многочлены положительной степени с целыми коэффициентами. Произ- Произведение младших коэффициентов многочленов д и h равно ±р. А так как число р простое, один из этих младших коэффициентов равен ±1. Поэтому произведение абсолютных величин корней одного из много- многочленов д и h равно 1. У этого многочлена должен быть такой корень а, что |а| < 1. При этом а. должен быть также и корнем многочлена /. Из равенства /(а) =0 следует, что |а„_1 7. Признаки неприводимости 71 В случае а) приходим к противоречию. В случае б), т. е. в том случае, когда среди корней многочлена / нет корней из единицы, выполняется неравенство |а| < 1, поэтому р< Снова приходим к противоречию. ? 7.3. Неприводимость многочленов, принимающих малые значения Теорема 7.5 (Пойа). Пусть / — многочлен степени п с целыми ко- коэффициентами и т = . Предположим, что для попарно различ- различных целых чисел а\,...,ап выполняются неравенства |/(а*) < 2~тт\ и при этом числа ai:... ,ап не являются корнями многочлена /. Тогда многочлен / неприводим. Доказательство. Нам потребуется следующее вспомогательное утверждение. Лемма (Пойа). Пусть g — многочлен степени к с целыми коэффи- коэффициентами, d0 < di < ... < dk — цечые числа. Тогда \д(сЦ)\ > к\2~к для некоторого i. j Доказательство. Рассмотрим многочлен г=0 Легко проверить, что G(d*) = g(di) при i - 0,..., к и deg G < к. Поэтому G(x)=g(x). Старший коэффициент многочлена G равен г=0 По условию он является ненулевым целым числом, поэтому его абсо- абсолютная величина не меньше 1. Следовательно, одно из чисел \g{di)\
72 Глава 2. Неприводимые многочлены I не к у 2. меньше ! -dj -1 ' -и п Предположим, что / = gh, где g и h — многочлены с целыми коэф- коэффициентами. Можно считать, что degft < deg<? = к. Тогда т < к < п. Ясно, что д(пг) /Ои д{пг) делит /(а,). Поэтому \д{щ)\<\!{щ)\<2-тт\. С другой стороны, согласно лемме Пойа для одного из чисет сц вы- выполняется неравенство |</(а$)| > 2~кк\ (мы применяем лемму Пойа к di — ai-i)- Остается заметить, что если к > т, то 2~кк\ > 2~mm!. В самом деле, если т = к + г, то 2" D Пример. Многочлен (х - 1) • (х - 2) •... • (х - п) + 1 неприводим. Другие признаки неприводимости многочленов, принимающих ма- малые значения, приведены в [Tv]. 8. Неприводимость трехчленов и четырехчленов 8.1. Неприводимость многочленов хп ± хт ± хр ± 1 Пусть f(x) = хп + zxxm + г2хр + Е3, где n>m>p>litZi = ±1. Выясним, следуя [Lj], в каком случае многочлен / неприводим. Ясно, что многочлен / неприводим тогда и только тогда, когда неприводим многочлен xnf(x~1) = 1 + Elz"-m + г2хп~р + г3хп, 8. Неприводимость трехчленов и четырехчленов 73 поэтому достаточно рассмотреть случай, когда т+р > п. В самом деле, если т + р < п, то (п - т) + (п - р) > п. Из дальнейшего рассмотрения можно также исключить тривиальный случай f(x) = (хт + Z2){xp + Ei), Т. е. П = Ш + р И Ез = ElE2- Будем называть многочлен ф(х) степени s возвратным, если (f(x) = = ±xs(f(x~l). Лемма 8.1. Пусть f(x) = ф(ж)ф(ж), где у(х) и ф(ж)—многочлены положительной степени с целыми коэффициентами и со старшими коэф- коэффициентами 1. Тогда по крайней мере один из многочленов ф(х) и ф(ж) возвратен. Доказательство. Пусть г = degф и s = п — г = degф. Рассмотрим многочлены г=0 h(x) = хЩх-^ф) = xnh{x- Ясно, что fi(x)f2(x) =xnf(x~1) = {хп + ?lxm +z2xp + z3)(t3 + z2xn-p + ZiXn-m + 1). / Сравнение коэффициентов при х2п показывает, что сос„ = Ез, поэтому со = ±1 и сп = ±1. Сравнение коэффициентов при хп показывает, что i=0 _г = 1 + t\ = 4, т. е. с? + ... + c^_j = 2. Итак, со = ±1, с„ = ±1, са = ±1 и ср = ±1 для некоторых 1 <а<р<п-1; все остальные коэффициенты с; равны нулю. Поэтому fi(x)f2(x) можно записать в двух видах: сос„х2п + саспх2п~'1 сосах п+а 4хп + ... A) J2n-m \ХП B)
74 Глава 2. Неприводимые многочлены Чтобы сравнить A) и B), упорядочим мономы в порядке возрастания степеней, учитывая лишь три старших монома. Для A) получаем четыре ; варианта: Р < п/2 : 2п >2n-tx>2n-p, Р > п/2, а<п-р : 2п > 2п - а > п + [3, Р > п/2, п/2 > а > п - р : 2п > п + р > 2п - а, Р > п/2, а > п/2 : 2п>п + р>п + а. Для B) получаем два варианта: п > 2т : 2п > 2п — р > 2п — т, 2т > п >п + р : 2п > 2п — р > п + т. Сравнивая три старших монома в A) и B), для пары (а,р) получаем четыре'возможных варианта: (а,р) — (р,т), (р,п — т), (т,п — р) или (п — т,п —р). Если (а,3) = (р,т), то сравнение A) и B) показывает, что СоС„ = Е3, СрС„=Е2, СтСп = Еь поэтому /i(a:) = с„(Е3а:п + Е2:гп-р + ец"- + 1) = сж-Д*)- Следовательно, ф(г) = с„ж8ф(ж~1). Если (а,р) = (п — т,п —р), то аналогично получаем С0Сп — Е3, CoCn_ra=Ei, СоС„_р = Е2, поэтому Л (ж) = Е3) = cof(x). Следовательно, ф(ж) = CQXry{x l). Если (ot,p) = (р, п — т), то в A) встречаются мономы степеней 2п, 2п - р, п + т, п+р, 2п-т, 2п-т-р, п, а в B) встречаются мономы степеней 2п, 2п — р, 2п — т, п + т, п+р, п + т — р, п. 8. Неприводимость трехчленов и четырехчленов 75 Поэтому число 2п — т — р равно одному из трех чисел п + тп, п + р, п + тп—р. Равенства 2п — тп—р = п + т и 2п — т — р = п+р противоречат предположению о том, что п <т+р. Поэтому 2п — т-р=п + т-р, т. е. п = 2т. Следовательно, (а,C) — (р,т). Если (а, C) = {т, п-р), то аналогично получаем п = 2т, т. е. (а, Р) = = (п — т,п — р). D Лемма 8.2. Пусть X и X —корни многочлена f(x). Тогда выпол- выполняется одна из трех пар условий: (I) (И) (III) X = -Е1ЕЗ И = -е2, Доказательство. Условия /(X) = 0 и /(X 1) = 0 можно записать в виде X" + EiX + Е2ХР + Ез = О, X" + Е2Е3ХП-р + EiE3X"-m + Е3 = 0. Вычитая одно равенство из другого, получим Е2ЕзХ ^ + EjE3^ — ElA — Е2Л' — U, т. е. (E2Xm"P + Ei)(E3X"-m - EiE2XP) = 0. Поэтому либо Хр = -ЕхЕгХ, либо Хр = Е!Е2ЕзХп~т. Подставив эти значе- значения Хр в соотношение /(X) = 0, получим, соответственно, либо X" = —Ез, либо (Х™+Е1Е2)(Х"-т-Е1)=0. ? С помощью лемм 8.1 и 8.2 легко доказать следующие две теоремы, которые, в свою очередь, приводят к полному описанию неприводимых многочленов вида хп + t\Xm + е2жр + ез- В обеих теоремах (как и в лем- леммах 8.1 и 8.2) предполагается, что п < т+р и f(x) ф {xm + z-i){xp + z\). Теорема 8.1. а) Если у многочлена f(x) нет корней, являющихся корнями из единицы, то многочлен f(x) неприводим. б) Если у многочлена f(x) есть ровно q корней, являющихся корнями из единицы, то многочлен f(x) можно представить в виде произведения
76 Глава 2. Неприводимые многочлены двух многочленов с целыми коэффициентами, один из которых имеет степень q и все данные q корней из единицы являются его корнями, а другой многочлен неприводим. Доказательство. Пусть f(x) = ср(х)ф(ж), где ср, ф е Ъ[х]. Согласно лемме 8.1 можно считать, что если X— корень многочлена ср, то X" тоже корень многочлена ср. В таком случае, как следует из леммы 8.2, X — корень из единицы. Если не все корни многочлена / являются кор- корнями из единицы, то либо многочлен ф ,неприводим над Z, либо ф = = Ф1Ф2, где фъфг s Щх] и все корни многочлена фх являются корнями из единицы, а у многочлена ф2 есть корень, не являющийся корнем из единицы. В таком случае все корни многочлена срфх являются корнями из единицы. Продолжая аналогичные рассуждения для многочлена фг, получим требуемое разложение многочлена /. ? Остается выяснить, в каких случаях у многочлена / есть корни, явля- являющиеся корнями из единицы. Ответ на этот вопрос дает следующая теорема. Теорема 8.2. Пусть d — наибольший общий делитель чисел п,т,р. Положим Пх = n/d, mi = m/d, p\ = p/d, di = (m,rm -pi), d2 = (mi,m -pi), d3 = (pi,ni - mi). Тогда любой корень из единицы, являющийся одновременно корнем мно- многочлена /, удовлетворяет одному из уравнений хМх = ±1, xdd2 = ±1, xdds = ±1, причем он является некратным корнем многочлен /. Доказательство. Пусть X — корень из единицы, являющийся кор- корнем многочлена /. Тогда X—тоже корень многочлена /. Лемма 8.2 дает три варианта условий на X. Рассмотрим, например, вариант (I): X" = —ез и Хт~р = — EiE2- Ясно, что (п,т — р) = ddi, поэтому суще- существуют такие целые числа и и v, что ddi = nu + (m—p)v. Следовательно, ydd! _ Qn)uQm-py _ ±lj так как Хп = _?з = ±1 и ym-p = _Е1Ез _ ±1 Варианты (II) и (III) рассматриваются аналогично. Остается доказать, что X — некратный корень многочлена /, т.е. Х/'(Х) = пХ" + EimXm + ЕгрХр ф 0. Подставляя соотношения (I), (II) 8. Неприводимость трехчленов и четырехчлепов 77 и (III) в равенство nXn + EimXm + Е2рХр = 0, получим, соответственно, ?2Хр(р - тп) = пез, ?2Хр(р — п) = гпез, EiXm(m - п) = ре2е3. Равенство |Х| = 1 в первом случае выполняться не может, а во втором и в третьем случае это равенство означает, что п = тп + р. При условии п = тп + р соотношения (II) принимают вид Хт = — Е1Е3 и X™ = —е2, а соотноше- соотношения (III) принимают вид W = -е2ез и W = -еь В обоих случаях е3 = EiE2, что соответствует многочлену f(x) = (xm + z2)(xp + ei), исключенному из рассмотрения. D 8.2. Неприводимость некоторых триномов Воспользовавшись результатами, полученными в предыдущем пара- параграфе, несложно выяснить, какие из триномов вида хп ± xm ± 1 непри- водимы. Теорема 8.3 [Lj]. Пусть п > 2m, d = (n,m), m = n/d и mi = m/d. Тогда многочлен g(x) = xn+zxm +z', где? = ±1ие' = ±1, неприводим, за исключением трех случаев, в которых m + mi = О (mod 3): а) m и mi нечетны и е = 1; б) ni четно и е' = 1; в) mi четно и е' = е. Во всех этих случаях д(х) является произведением некоторого не- неприводимого многочлена на x2d + zmz!nxd + 1. Доказательство. Случай, когда п = 2тп и е' = 1, очевиден. По- Поэтому будем считать, что либо п = 2т и е' = — 1, либо п > 2т. В таком случае к многочлену (хп + zxm + z')(xn - z') = х2п + zxn+m - ее'ж - 1 можно применить теоремы 8.1 и 8.2, поскольку 2п>п + т>ти если 2п = (п + тп) + тп, т.е. п = 2т, то Ез Ф EiE2- В обозначениях теоремы 8.2 имеем: Bп,п + m,m) = (n,m) = d, di = Bni,ni) = m, d3 = (mi,ni - mx) = 1 и d2 = (m +mi,2ni —mi) = (m +mi,3ni). Таким образом, d2 = 1, если m + mi ^ 0 (mod 3) и d2 = 3, если m + mi = 0 (mod 3).
78 Глава 2. Неприводимые многочлены Согласно теореме 8.2 корни из единицы, являющиеся одновременно корнями многочлена д, удовлетворяют одному из уравнений xddl = ±1, xdd2 = ±1; xdd3 = ±1. Первое уравнение имеет вид хп = ±1, а третье xd = ±1. Если хп = ±1, то д(х) = ±1 + гхт ± 1 ф 0, а если xd = = ±1, то д(х) — ±1 ± 1 ± 1 ф 0. Остается рассмотреть случай, когда d-2 = 3. В лемме 8.2 случай (I) приводит к соотношениям Х2п = ±1 и X" = ±1, а случай (III) приводит к соотношениям Хт=±1иХп~т = = ±1. В обоих случаях получаем X" = ±1, поэтому д(\) ф 0. Случай (II) приводит к соотношениям Xn+m = е, X2n~m = ее', т. е. Х3п = е', Х3т = ее'. Таким образом, (X3d)ni = е' и (X3d)mi = и1', где (т.пц) = 1 и Гц + mi = = 0 (mod 3). Из условия (ni,m\) = 1 следует, что п\и + m\v = 1 для некоторых целых чисел и w v. Поэтому Если числа ni и mi нечетны, то X3d = е' = ее', поэтому е = 1 и X3d = e'. Если число п\ четно, то е' = 1. Если число mi четно, то гг' = 1. ? Согласно признаку Перрона (теорема 7.2 на с. 68) трином хп ± ± ах" ± 1, где а > 3 — целое число, неприводим. При а = 2 этот трином неприводим, если у него нет корней, равных ±1. Все эти утвер- утверждения верны и для тринома хп ± ах ± 1. Неприводимость триномов хп ± 2хт ± 1 исследована в [Scl]. В заключение приведем формулировки двух теорем о неприводимо- неприводимости триномов. Теорема 8.4 [MS]. Пусть многочлен хп ±рхт ± 1, где п > т и р — простое число, приводим. Тогда п/(п,т) < 4Р . Теорема 8.5 [Raj. а) Многочлен х5 +х + п раскладывается в произ- произведение неприводимых квадратного и кубического многочленов тогда и только тогда, когда п — ±1 или п = ±6. б) Многочлен х5 — х + п раскладывается в произведение неприво- неприводимых квадратного и кубического многочленов тогда и только тогда, когда п = ±15, п = ±22 440 или п = ±2 759640. 9. Теорема неприводимости Гильберта Пусть f(t, x) e <Q{t, x] — многочлен от двух переменных. Много- Многочлен / называют приводимым, если / = gh, где g,h e Q[f,x] —мно- —многочлены положительной степени. 9. Теорема неприводимости Гильберта 79 Теорема 9.1 (Гильберт, [Hi3]). Если f(t,x)—неприводимый мно- многочлен над Q, то существует бесконечно много рациональных чисел <о- для которых многочлен f(to,x) неприводим над Q. Мы приведем доказательство теоремы Гильберта, принадлежащее Дёрге [D6], воспользовавшись теми изложениями этого доказательства, которые приведены в [Л2] и в [Sr]. Более современное доказательство можно найти в [Fr]. Начнем с того, что установим связь между приводимостью много- многочлена f(to. x) и наличием на определенной алгебраической кривой точки с рациональными координатами (to,yo). Пусть f(t,x) e Q[t,x] —непри- —неприводимый многочлен. Запишем его в виде f(t, х) — an(t)xn + .. .+ao(t), где aj(i) e <Q>[?]. Многочлену f{t,x) можно сопоставить многочлен F(x) = = an(t)xn + ... + ao(t) с коэффициентами из поля к = Q(f). Пусть к — алгебраическое замыкание поля к. Тогда F(x) = an{t) ¦ (х - аг) ¦... ¦ (х - ап), где ati,..., an е к — корни неприводимого над к = Q(t) многочлена F(x) = f(t,x). В случае, когда an(to) ф 0, им можно сопоставить корни а[,..., <х'п е Q многочлена f(to,x). Предположим, что многочлен f{to,x) приводим над Q. После пере- перенумерации корней можно считать, что f(to,x) = an(to)go(x)ho(x), где go{x) = (х - <& ¦ ... ¦ {х - а1.) е hQ(x) = (x- a't+l) ¦... • (х - <) ОД. Положим д(х) = (х — ai) •... • (х — as) и h(x) = [х — as+i) ¦... ¦ (х — ап). Тогда F(x) = an(t)g(x)h(x), где д{х), h(x) e к[х]. По условию многочлен F(x) неприводим над к[х], поэтому у многочлена д(х) есть некоторый коэффициент у, лежащий в к \ к. Напомним, что к = Q(i), поэтому элемент у алгебраичен над Q(t), т. е. bm(t)y bo(t) = 0, где В результате получаем некоторую алгебраическую кривую С (с раци- рациональными коэффициентами) на плоскости (t,y). При этом коэффици- коэффициенту у многочлена д соответствует коэффициент j/o s Q многочлена до, который удовлетворяет соотношению = 0, т. е. на кривой С есть рациональная точка {to,
80 Глава 2. Неприводимые многочлены Итак, рассмотрим все многочлены вида (х — а,,) •... • (х - сцк), где l<i<n-l, иу каждого из этих многочленов выберем коэффициент, не лежащий в Q[t]. Эти коэффициентам мы сопоставим плоские алге- алгебраические кривые Ci,..., См с рациональными коэффициентами. При этом если точка t0 e Q такова, что ни на одной из кривых С\,..., См нет рациональных точек вида (t0, yo), то многочлен f(t0, x) неприводим. Займемся теперь исследованием рациональных точек плоской алге- алгебраической кривой С, заданной уравнением bm(t)ym + bm-1(t)ym-1 + ... + bo(t) = 0, где bf(t)eZ{t). Прежде всего сделаем замену переменных у — bm(t)y. В результате по- получим кривую у™ = 0. Если (to,y~o)—рациональная точка этой кривой и t0 e Z, то у0 е Ъ. В дальнейшем ограничимся рассмотрением целочисленных точек кри- кривой. Итак, можно считать, что bm(t) = 1, т. е. кривая задана уравнением 0, где bi(t) Покажем, что в окрестности точки t = оо алгебраическая функция y(t) имеет разложение вида y(t) = a(tl/k)n + ... + Ь + c{tllk)~l + ..., где tl'k —одна из ветвей корня степени к из t (для определенности выберем ту ветвь, для которой tl>k > 0 при t > 0). Отображение (y,t) >— t задает разветвленное накрытие М2 -* СР1, где М2 — риманова поверхность алгебраической функции y(t). Нас интересуют ветви этого разветвлен- разветвленного накрытия чад точкой оо. Возьмем одну из ветвей и рассмотрим ее пересечение с прообразом окрестности точки оо. Ограничение развет- разветвленного накрытия на это множество имеет вид z *-+ zk. Это означает, что функция y(z) однозначна и zk = t. Ясно также, что точка z = оо не является существенно особой точкой функции y(z). Нас интересует случай, когда существует бесконечная возрастаю- возрастающая последовательность натуральных чисел tt, для которых y(ti) —ве- —вещественное (и даже целое) число. Покажем, что в таком случае все ко- коэффициенты разложения y(t) вещественны. Предположим, что не все эти коэффициенты вещественны. Пусть lts/k — член самой старшей сте- степени s/k с невещественным <;. Тогда при вещественных t члены более высокой степени никак не влияют на мнимую часть суммы ряда, а при 9. Теорема неприводимости Гильберта 81 t —¦ +оо члены меньшей степени малы по сравнению с \tslk и не могут уничтожить его мнимую часть. Остается сделать последний шаг — доказать, что числа ?, е N, для которых y(ti) e Z, образуют множество нулевой плотности. Это легко выводится из следующего утверждения. Теорема 9.2. Пусть <p(t) = a{t^k)n + .. . + b+c{txlk)~l+ ... — функ- функция вещественного переменного, представленная вещественным рядом, сходящимся при t > R. Предположим, что ср(?) — не многочлен. Тогда существуют такие константы С > Оие е @,1), что количество нату- натуральных чисел t < N, для которых ep(t) e Z, не превосходит CNZ. Доказательство. Прежде всего заметим, что в разложении про- производной порядка т функции ep(t) = a(tx/k)n + ... нет членов вида Г, где v > (п/к) - т. Поэтому можно выбрать целое число т > 1 так, что tp(m)(?) ~ ct~v при t -»• оо, причём и > 0 и с / 0 (последнее свойство обеспечивается тем, что ср — не многочлен). Лемма. Существуют такие положительные константы С\ и а, что если Т достаточно велико, то отрезок [Т, Т + ciTa] содержит не более т натуральных чисел t, для которых ср(?) е Ъ. Доказательство. Пусть t\ < ... < tm+i- Рассмотрим интерполя- интерполяционный многочлен Лагранжа т+1 (t - tl) ¦... ¦ it - ti-l){t - ti+l) ¦ (t — tm+l) 8=1 ti - ti-i)(ti - u ti — tm+i) Функция tp—/ обращается в нуль в точках t\,..., tm+i i поэтому согласно теореме Ролля на отрезке [ti,im+i] есть такая точка <;, что m+l m( i=l (ti-h)-...-(ti- ti-l)(ti ~ ti+l) -...-{ii- tm + l) ' Таким образом, tp'm'(^) —рациональное число, знаменатель которого не превосходит П (tj~U) < (*m+i -h)m^m+l)l2. С другой стороны, < c2tl !Д. если t\ достаточно велико, то 0 < |ф(т Положим ДТ = tm+i - h. Тогда |/(т)(^)| > ДТ-т<т+1)/2, поэтому С2^ > ДТ~т(т+1)'/2, т.е. ДТ > ciTa, где а = 2и/т(т + 1) и с\ = = с, т т а
82 Глава 2. Неприводимые многочлены Выберем ? так, что 1 - <хе = е, т. е. е = (при этом 0 < е < 1). 1 + а Разобьем отрезок [1, N] на отрезки [1, ./Vе] и [ЛГ?, N]. Согласно лемме лю- любой отрезок длины ci(Nz)a, принадлежащий [NZ,N], содержит не более т натуральных чисел t, для которых cp(i) e Ъ. Поэтому общее количе- количество таких натуральных чисел t на отрезке [1, N] не превосходит c\ at = N* + - 771 Таким образом, в качестве С можно взять 1-\ . ? Пусть B(N)—количество натуральных чисел t < N, для которых (f(t) е 1. Тогда lim (CN'/N) = lim (C/N1-') = 0. Это, в частности, означает, что существует бесконечно много натуральных чисел t, для которых (f(t) ^ Z. 10. Алгоритмы разложения на неприводимые множители 10.1. Алгоритм Берлекэмпа В наиболее эффективных алгоритмах разложения многочлена с це- целыми коэффициентами на неприводимые множители используется раз- разложение этого многочлена над полем Fp для некоторого простого р. По- Поэтому мы сначала обсудим один из алгоритмов разложения многочленов по модулю р, предложенный Берлекэмпом [Berl]. Пусть / — многочлен с коэффициентами из поля Fp. Можно считать, что его старший коэффициент равен 1. Прежде чем применять алгоритм Берлекэмпа, нужно избавиться от кратных неприводимых множителей многочлена /. Делается это следующим образом. Пусть / = Д™1 ... • /?*, где /i,..., fk — попарно различные неприводимые многочлены со старшими коэффициентами 1. Легко проверить, что т-е- i= р\гц Многочлен / разлагается в произведение многочленов d и f/d, причем в разложении многочлена f/d нет кратных неприводимых множителей. 10. Алгоритмы разложения на неприводимые множители 83 Если degd < deg/, то к многочлену d можно применить такую же опе- операцию. Если же 0 < degd = deg/, то d = j] /"{ = gp. Ясно, что degg < р\п{ < deg / и по разложению многочлена g можно восстановить разложение многочлена d. Алгоритм Берлекэмпа основан на следующей теореме. Теорема 10.1. Пусть / е Fp[x] — многочлен положительной сте- степени п с старшим коэффициентом 1. а) Если многочлен h e Fp[ar] удовлетворяет соотношению hp = h (mod /), т. е. ЪР - h делится на /, то б) Пусть / = fi ¦ ... ¦ fk, где /i, ..., fk — попарно различные не- неприводимые многочлены со старшим коэффициентом 1. В таком случае многочлен h удовлетворяет соотношению ЬР = h (mod /) тогда и только тогда, когда h{x) = щ (mod /,), где щ е Fp. При этом каждому набору (ai,...,ajfe) соответствует ровно один многочлен h, степень которого меньше степени многочлена /. Доказательство, а) Положим F(x) = П (f(x),h(x) -а). Мно- F гочлены h(x) — а при различных а взаимно просты, поэтому много- многочлены (f(x),h(x) — а) являются взаимно простыми делителями мно- многочлена f(x). Следовательно, многочлен f(x) делится на их произве- произведение F(x). С другой стороны, в поле ?р справедливо полиномиальное тождество YI {у ~ а) = Ур ~ У, поэтому многочлен делится на f{x), а значит, многочлен F(x) делится на f(x). Итак, мно- многочлены f и F делятся друг на друга, а их старшие коэффициенты равны 1, поэтому F = f. б) Если h(x) = щ (mod fi), то (h(x))p = ap = a, = h(x) (mod fi), а значит, (h(x)) = h(x) (mod f\ ¦ ... ¦ fk). Наоборот, если многочлен (h(x))P - h(x) = ПаеР {^(х) ~ а) делится на /, то он делится на все мно- многочлены /i, ..., fk- Ясно также, что если неприводимый многочлен fi
84 Глава 2. Неприводимые многочлены делит произведение попарно взаимно простых множителей h(x) — о, то он делит один из этих множителей, т. е. h(x) = щ (mod /,). Существование и единственность многочлена h с заданным набором (ai,...,a,k) очевидным образом вытекает из следующего утверждения (китайская теорема об остатках для многочленов). Лемма. Пусть /i, ..., Д — взаимно простые неприводимые много- многочлены над полем F, gi, ..., g^ —произвольные многочлены над тем же полем. Тогда существует такой многочлен h, что h(x) = gi (mod ft), причем этот многочлен определен однозначно по модулю многочлена / = Л ¦••••/*• Доказательство. Многочлены /, и F; = f/fc взаимно просты, по- поэтому существуют такие многочлены щ и 6j, что сц/г + 6jFj = 1. При этом frj-Fj = 1 (mod А) и 6,F, = 0 (mod /,) при j ф i. Положим h = Y,9ihFi. Тогда h = gihFi (mod/j) = gt (mod /*)• Существование требуемого многочлена h доказано. Единственность требуемого многочлена следует из того, что если многочлены hi — gi и /12 ~ 9г делятся на /,, то многочлен hi — h% делится на А ¦ • ¦ ¦ • А- = /• аа Соотношение (h(x)) = h(x) (mod /) эквивалентно системе линей- линейных уравнений над полем F,,. В самом деле, пусть h(x) = to + t\x + ... ...+ tn-\xn~1 (напомним, что deg h < deg / = n). Тогда h(x)p = h(xp) = = to + tixp + .. . + tn-ixpl-"~1K Для каждого монома xPJ', j = 0,1,... ,n—1, найдем его остаток от деления на многочлен /: п-1 г=0 В результате получим систему линейных уравнений п-1 tjQij =U, i = l, ..., п-1. i=O Размерность пространства решений этой системы равна к, где к — ко- количество неприводимых множителей многочлена /. Ясно, что ^оо = 1 и qio = 0 при i > 0. Поэтому система имеет тривиальное решение to = с, ?i = ... = tn-i = 0; это решение соответствует многочлену h нулевой степени. 10. Алгоритмы разложения на неприводимые множители 85 Пусть h\ = 1, /i25 ¦ ¦ ¦, hk —базис пространства решений. Если к = 1, то многочлен / неприводим. Если же к > 1, то находим наибольшие общие делители многочленов f(x) и h?(x) - а для всех а е Fp. В ре- результате получим набор делителей gi, ¦¦ ¦, gs многочлена /. Если s < к, то для каждого gt вычислим (#i,/i3(?) — а), и т. д. до тех пор, пока не получим все к делителей. Легко проверить, что в конце концов мы обязательно получим все к делителей. В самом деле, пусть /i и /г — разные неприводимые дели- делители многочлена /. Рассмотрим набор (ai,a2,... ,а*), где ai ф аг. Ему соответствует многочлен h, для которого h(x) = ai (mod А) и h(x) = a? (mod /2). Поэтому для некоторого базисного многочлена hi должны вы- выполняться сравнения hi(x) = ац (mod А) и Ы{х) = a2i (mod /2), где аи ф U2t- Такой многочлен /ц разъединит множители А и /г- Замечание. Используя идею алгоритма разложения Кантора-Цас- сенхауза [CZ], можно существенно увеличить эффективность алгоритма Берлекэмпа. А именно, вместо многочленов hi(x) — а = hi(x) — ah\(x) можно брать многочлены Н(х) — aihi(x) + .. . + o,khk(x), где ai, ..., a^ — случайный набор элементов Fp, и вычислять наибольшие общие дели- делители многочленов / и Я^'/2 - 1. Если многочлен / приводим и р > 3, то с вероятностью не менее 4/9 мы при этом сразу же получим нетри- нетривиальное разложение. 10.2. Факторизация с помощью леммы Гензеля На с. 61 приведен алгоритм Кронекера разложения многочлена с це- целыми коэффициентами на неприводимые множители, но этот алгоритм требует слишком больших вычислений. Известны и гораздо более эф- эффективные алгоритмы. Наибольший теоретический интерес предста- представляет алгоритм Ленстры-Ленстры-Ловаса, который мы обсудим в До- Дополнении (см. с. 313). Но на практике он нередко оказывается более медленным, чем алгоритм факторизации, который мы сейчас опишем. Пусть / — многочлен с целыми коэффициентами. Если cont(/) / 1, то, поделив / на cont(/), мы получим многочлен с содержанием 1. Пусть / = А™1 • • • • ¦ fkk — разложение многочлена / над Ъ на неприводимые ™1 А?*1 Zj] По ад Ъ / А k множители. Тогда /' = А™1 ™1- ^ гДе ]. Поэтому над Ъ 1 множители. Тогда / А А?^ наибольший общий делитель многочленов / и /' тоже равен f^1 • • ¦' A?*1 как и наД Q- Таким образом, над Ъ многочлен / можно поде- поделить на (А /') и получить многочлен без кратных корней. В дальнейшем будем считать, что cont(/) = 1 и многочлены / и /' взаимно просты.
86 Глава 2. Неприводимые многочлены Существуют многочлены и, v e <Q[ar], для которых uf + vf = 1, поэтому существуют многочлены u,v е Z[x], для которых п/ + vf = — п, п е N. Если простое число р взаимно просто с п, то над полем Fp наибольший общий делитель многочленов / и /' равен 1. Будем по- последовательно вычислять (/, /') над ?р для р — 2,3, о,... до тех пор, пока не окажется, что (/, /') = 1 и при этом старший коэффициент многочлена / взаимно прост с р. Это простое число р мы фиксируем и в дальнейшем будем иметь дело именно с ним. По модулю р у многочлена / нет кратных неприводимых множите- множителей, поэтому к нему можно применить алгоритм Берлекэмпа и получить разложение / = а Д •... • Д (mod р), где /i,..., Д е Ъ[х] — многочлены со старшим коэффициентом 1, а — старший коэффициент многочлена / и deg / = deg Д -I-... + deg Д. Приводимая ниже лемма Гензеля позво- позволяет по этому разложению построить разложение многочлена / по мо- модулю рт. Достаточно рассмотреть следующую ситуацию: / = ДД (mod pm), где /, Д,Д е Z[x], deg/ = deg/x -I- deg/2, старший коэффициент мно- многочлена Д равен 1, старший коэффициент многочлена / взаимно прост ери многочлены Д и Д взаимно просты по модулю р. Последнее усло- условие означает, что существуют многочлены и, v e Ъ[х], для которых ufi + vf2 = 1 (mod р). Если u',v' — другие такие многочлены, то и' = = u + wf2 (mod p) viv1 = v — wfi (mod p), где w e Z[x]. Поэтому условие degu < deg/2, deg v < deg/i однозначно задает многочлены и и v no модулю p. Продолжением Гензеля разложения / = ДД (mod pm) будем назы- называть разложение / = Д/2 (modpm+1) где для многочленов Д и /2 выполняются те же самые условия, что и для многочленов Д и Д, и при этом /i = fi (mod рт) и deg Д = d/ Лемма (Гензель). Если т > 1, то для любого разложения / = = ДД (mod pm), удовлетворяющего указанным выше условиям, суще- существует его продолжение Гензеля / = Д/2 (mod pm+1) и при этом мно- многочлены Д и /2 определены однозначно по модулю рт+1. Доказательство. Мы ищем такие многочлены Д, /2 е Щх], что fi = fi +pm9i, deg/j = deg fi, старший коэффициент Д равен 1 и при этом выполняется сравнение / = Д/2 (mod pm+1) т. е. ДД + РтЫг + gift) + P2m9i92 = / (mod pm+1). 10. Алгоритмы разложения на неприводимые множители 87 Ясно, что p2mSi<?2 = 0 (mod pm+1), поэтому мы приходим к сравнению g2fi+gif2=d(modp), A) где d = p~m(/ — ДД) s Z[x). Решения сравнения A) можно получить с помощью многочленов it и и, для которых ufi + vf2 = 1 (mod p). А именно, <?1 = dv + wfi (mod р) и <?2 = du-wf2 (mod p), где u> <= Z[x] — произвольный многочлен. Из того, что Д = Д 4- pmgi и старшие коэф- коэффициенты многочленов Д и Д равны 1, следует, что deg<?i < deg Д. Поэтому при заданном v многочлен д\ по модулю р определен одно- однозначно. В таком случае многочлен д2 по модулю р тоже определен одно- однозначно. Следовательно, многочлены Д и /2 определены однозначно по модулю pm+1. ? Замечание. Процесс вычисления разложения многочлена по мо- модулю рт, где т велико, можно существенно ускорить, если рассматри- рассматривать поднятия разложений по модулю q до разложений по модулю qr, где г = {p,q). Подробности см. в [Coh]. Чтобы получить разложение многочлена / е Z [х] на неприводимые множители, можно поступить следующим образом. (Мы предполагаем, что cont(/) = 1 и у многочлена / нет кратных корней.) С помощью неравенства Миньотта (теорема 17.6 на с. 171) получим оценку М для коэффициентов делителей многочлена /, степень которых не превосхо- превосходит - deg /. Затем выберем т так, что рт > 2аМ, где а > 0 — старший коэффициент многочлена /. После этого с помощью алгоритма Берлек- Берлекэмпа и леммы Гензеля построим разложение / = а ¦ Д •... • Д (mod pm). где Д,..., Д е Ъ[х] — многочлены со старшим коэффициентом 1. Пусть д(х) = а\х1 + ... <= Ъ[х\ — делитель многочлена /. Тогда а2 = = a/ai е N и многочлен а2д по модулю р имеет вид а • Д • ... • fid. Условие рт > 2аМ показывает, что многочлен а2д однозначно восста- восстанавливается по многочлену а ¦ Д •... ¦ Д (mod pm). В самом деле, коэф- коэффициенты многочлена а2д заключены строго между ±-рт, поэтому они однозначно восстанавливаются по своим остаткам от деления на рт.
Глава 2. Неприводимые многочлены Задачи к главе 2 2.1. Пусть /<= Ъ[х]— многочлен с корнями оц,... ,а„ и M = max|cti|. Доказать, что если /(хо)— простое число для некоторого целого xq, причем |хо| > М + 1, то многочлен / неприводим. 2.2. Пусть р — простое число. а) Доказать, что многочлен хр — х — 1 неприводим. б) Доказать, что многочлен хр — х — а, где а — натуральное число, не делящееся на р, неприводим. 2.3. Пусть для многочлена / ё Z[i] существует такое целое число п, что: 1) все корни многочлена / лежат в полуплоскости Rez < п — -; 2) f(n - 1) ф 0; 3) f{n) — простое число. Доказать, что многочлен / неприводим. 2.4 [К1]. а) Пусть f(x) = fnxn + ... + /0 е Z[x], причем |/0| > 1. Пусть, далее, {ci,...,cr} — все делители числа |/о|. Предположим, что в п различных целых точках <Zi,..., ап многочлен / принимает простые значения pi,... ,рп и при этом |а,-| > 2 и щ не делит с,±1, где i = 1,... ,п и j = 1,..., г. Доказать, что многочлен / неприводим. б) Пусть целые числа а\,... ,ап,г и s таковы, что \а^\ > 2, числа (l)n п, простые и при q = (-l)nai ¦... ¦ ап + s и pk = гак + s, где к = 1,. этом ajt не делит q ± 1. Доказать, что многочлен /(х) = (ж - ai) ¦ ... • (х - an) + rx + s неприводим. 2.5. Пусть f(x) = xn + " + . - - 4- an-ix pan — многочлен с целыми коэффициентами, причем р — простое число. Доказать, что если п-1 р > J2 \ап\п~1~г\п(\, то многочлен / неприводим. 0 t=0 2.6. Пусть ai,...,ап — попарно различные целые числа. а) Доказать, что многочлен (х—а\)-(х—аг)-.. .-(х-ап) — 1 неприводим. б) Доказать, что многочлен (х—ai)-(x—аг)-.. .-(х—а„) + 1 неприводим за исключением следующих случаев: (х - а){х -a-2) + l = (x-o- 1J; (х - а)(х - а - 1)(х - а - 2)(х - а - 3) + 1 = ((х - а - 1)(х - а - 2) - lJ. к главе 2 89 в) Доказать, что многочлен (х — aiJ • (х — агJ ¦ ... • (аг — anJ + 1 неприводим. 2.7. Доказать, что любой многочлен с целыми коэффициентами можно представить в виде суммы двух неприводимых многочленов. 2.8. а) Пусть f(x) — многочлен с целыми коэффициентами, принима- принимающий значение +1 более чем для трех целых х. Доказать, что f(n) ф —1 при neZ. б) Пусть а,Ъ е Ъ и многочлен ах2 + Ьх+1 неприводим. Доказать, что если п > 7 и ai,..., а„ — попарно различные целые числа, то многочлен а(ср(х)) +6ф(х) + 1, где ф(х) = (x-ai)-(x-a2)-.. .-(х-ап), неприводим. 2.9. Пусть F(xi,...,xn) e Z[xi, ...,х„] и /(х) = F(x,... ,х). Дока- Доказать, что если многочлен / неприводим, то многочлен F тоже неприво- неприводим. 2.10. Пусть р > 3 — простое число, п < 2р. Доказать, что многочлен х2р + рх11 — 1 неприводим. 2.11. Пусть р > 3 — простое число а\ + .. .+ар = 2р, п < 2р. Доказать, что многочлен я:»1 •... ¦ ха/ + I? + ... + хпр - 1 неприводим. 2.12. Пусть / — неприводимый многочлен с целыми коэффициен- коэффициентами, D — его дискриминант, р — простое число. Предположим, что многочлен / по модулю р разлагается на к неприводимых множителей. Доказать, что D^'1^2 = (-l)n"fc (mod p). Решения задач 2.1. Предположим, что f(x) = g(x)h(x), где g,h e Z[x] и degg > 1, deg h > 1. Число /(хо) = P простое, поэтому можно считать, что д{хо) = = ±1 и h(x0) = ±р. С другой стороны, корни |3i,..., C* многочлена д являются корнями многочлена /, поэтому |Cj| < М, а значит, где \ао\ > 1 и |хо - |3t| > |ато| - IPil > (Л/ + 1) - М = 1. Следовательно, |д(хо)| > 1- Получено противоречие.
90 Глава 2. Неприводимые многочлены 2.3. Предположим, что f(x) = g(x)h(x), где g,h e Z[x] и degg > 1, deg/i > 1. Число f(n) — p простое, поэтому можно считать, что д(п) = = ±1 и h(n) = ±р. С другой стороны, если д(C,) = 0, то /(C;) = О, поэтому Rep, < п — |, т. е. Re(n — | — C;) > 0. Это означает, что если t > 0, то n-i-fr-f < n-i-p,. + t , поэтому <? (п — | — t) < g(n—\-\-t) . Из условия f(n — l) ф 0 следует, что |ff(n-l)| > 1. Таким образом, \д{п)\ = |$(п-± + ±) > |ff(n-?-?)| = = \д{п — 1)| > 1. Приходим к противоречию. 2.4. а) Предположим, что / = /i/2, где /ь/2 е Z[x]. Пусть /i@) = Ьг и /2@) = с\. Для определенности можно считать, что |6i| < |ci|. Случай 1: \Ь\\ = 1. В этом случае |ci| = |/о| > 1. Из условия f(ak) = = рк, где рк — простое число, следует, что либо /i (ak) = ±рк и /2(а*) = = ±1, либо /i(flfc) = ±1 и /2(a)t) = ±pfc. Предположим сначала, что /2(а*) = ±1. Тогда/2(ofc)-/2@) = -(^±1). С другой стороны, /г(а*)- — /г@) делится на ак. Приходим к противоречию. Остается предпо- предположить, что /i(ajfe) = ±1 = ±bi = ±/i@). Если f\(ak) — -/i@), то ЛЮ - /i@) = 2fi(ak) = ±2. С другой стороны, /i(at) - /i@) делится на afc, поэтому |ajt| < 2, что противоречит условию. Таким образом, /l(fl)t) = /i(ao) = ^i при к = 1,...,п. Учитывая, что степень много- многочлена /i строго меньше п, получаем fi(x) = b\ при всех х. Случай 2: \Ь\\ > 1. В этом случае 6j и ci играют одинаковые роли, поскольку |ci| > |6i| > 1. Пусть для определенности fi(ak) = ±pk и /г(о*) = ±1. Тогда /2@^) - /2@) = -(cj ±1) делится на ак, что проти- противоречит условию. б) Очевидным образом следует из а). 2.5. Как и при доказательстве теоремы 7.4, получаем, что произведе- произведение абсолютных величин корней одного из многочленов д и h не превос- превосходит |an|. Чтобы прийти к противоречию, достаточно показать, что для любого корня а многочлена / выполняется неравенство |а| > |а„|. Предположим, что /(а) = 0 и |а| < |оп|. Тогда |роп| = \ап чего не может быть. п-1 ¦ an_ia| < |an| 2_, КГ * >i| < р\ап\, г=0 Глава 3 Многочлены специального вида 11. Симметрические многочлены 11.1. Примеры симметрических многочленов Многочлен /(хь ... ,хп) называют симметрическим, если для любой подстановки а е Sn выполняется равенство J \*?оA) 1 • • • j ^(п) ) = /(.2-1, . ¦ . , Хп). Основным примером симметрических многочленов служат элемен- элементарные симметрические многочлены a*(xi,...,xn) = ^2 xh-...-Xik, ii<...<ik где 1 < k < п; удобно считать, что «то = 1 и o*(xi,... ,х„) = 0 при к > п. Элементарные симметрические многочлены можно задавать с помо- помощью производящей функции 1=1 Если Xi, ..., хп—корни многочлена хп + а\Хп 1 + ... + ап, то v_b...,xn) = (-l)fcafc. Другим примером симметрических многочленов служат полные од- однородные симметрические многочлены , . . . , Х„) = Им соответствует производящая функция к=0
ш 92 Глава 3. Многочлены специального вида Важным примером симметрических многочленов служат также сте- степенные суммы sk{xi,...,xn) =xf+ ... + Х*. Им соответствует производящая функция k=0 i=l Иногда используются мономиальные симметрические многочлены 1TT'i1...in(Xi, . . . ,ХП) = Производящие функции a(t) и p(t) связаны соотношением a(t)p(—t) — = 1. Приравнивая коэффициенты при tn, n > 1, в левой и правой части, получаем A) г=0 Производящая функция s(t) выражается через p(t) и a(t) следующим образом: , т.е. s(t)p{t)=p'(t); , т.е. 8(-t)a(t) = -a'(t). Приравнивая коэффициенты при ?n+1, получаем г=1 п пап = B) C) г=1 Соотношения C) называют формулами Ньютона. Запишем соотношения A) для п = 1, ..., к. При фиксированных ох,..., Ок эти соотношения можно рассматривать как систему линейных 11. Симметрические многочлены 93 уравнений для рх,..., рк, а при фиксированных pi,..., р* — как систему уравнений для «л, ..., ак. Решая эти системы, находим 1 0 ... О О! 1 ..-О Pi Р2 Pi Pfc-l Pfc-2 P*-3 ••• 1 Рк Рк-1 Рк-2 ••¦ Pi Рк = О2 Ofc-l Ofc_2 Ofc_3 Ok Ofc-l Ofc-2 1 Ol Аналогично с помощью соотношений B) получаем Sk = (" \*-1 Pi 1 2р2 pi Pfc-i Pfc-2 Pi si 82 -1 Si 0 -2 Sfc-l Sk-2 Sk-3 Sk Sk-1 Sk-2 С помощью соотношений C) получаем 1 0 ... ( Ol как Ok-i Ofc-2 ••• 1 Si S2 1 81 Sk-1 Sk-2 Sk-3 Sk Sk-1 Sk-2 0 0 -Jfc + 1 Si 0 0 Jfc-1 «1 11.2. Основная теорема о симметрических многочленах Элементарные симметрические многочлены алгебраически незави- независимы и образуют базис кольца симметрических многочленов. Более точ- точная формулировка этого утверждения выглядит следующим образом. Теорема 11.1. Пусть /(xi,..., х„) — симметрический многочлен. Тогда существует такой многочлен g{yi,- ¦¦ ,уп), что /(xi,...,xn) = = g(oi,... ,ап). При этом многочлен д единствен. Доказательство. Достаточно рассмотреть случай, когда / — однородный многочлен. Будем говорить, что моном х\л ~К" —•" » Ul tin 4" име- имеет более высокий порядок, чем моном х\ \ 4 xw", если \\ = Ui, ...
94 Глава 3. Многочлены специального вида ..., Xjt = Ufc и Xjt+i > u-k+i (возможно, к = 0). Пусть ахх1 ¦ ... ¦ хх" — старший моном многочлена /. Тогда X] > ... > Хп. Рассмотрим симме- симметрический многочлен A) Старший член монома а\ TXi-X \г Х - а^1 равен •...•хп)х" % поэтому порядок старшего монома многочлена /j строго ниже порядка старшего монома многочлена /. Применим к многочлену /i снова опера- операцию A) и т. д. Ясно, что после конечного числа таких операций придем к нулевому многочлену. Докажем теперь единственность представления f{x\,...,хп) = = g(oi,..., ап). Достаточно проверить, что если д(у1,---,уп) = X-'п у Г ¦¦у1п — ненулевой многочлен, то после подстановки у\ = о\ = х\ +... + х„, ... ..., уп = ап = xi ¦... ¦ хп этот многочлен останется ненулевым. Огра- Ограничимся рассмотрением старших мономов получающихся в результате подстановки. Ясно, что самый старший среди этих мономов ни с чем сократиться не может. ? Из доказательства теоремы 11.1 видно, что если f(xi,... ,хп) — сим- симметрический многочлен с целыми коэффициентами, то f(x\,...,xn) = = g(ci,... ,стп), где д — тоже многочлен с целыми коэффициентами. Детерминантное выражение а^ через pi, ..., р^ показывает, что для полных однородных многочленов справедливо аналогичное утвержде- утверждение. Что же касается степенных сумм, то для них выражение вида /(ari,...,xn) = g(si,.-.,sn) тоже существует, но при этом коэффици- коэффициенты многочлена д не обязательно целые. Например, (Si + Х2? - {х\ + Х\) 8\-82 12 = 2 = —2—' Из основной теоремы о симметрических многочленах следует, что если xi, ..., хп — корни многочлена х11 + aix" + ... + ап, то величина 11. Симметрические многочлены 95 представляющая собой симметрический многочлен от х\,... ,х„, поли- полиномиально выражается через а\,...,ап. Эту величину называют дис- дискриминантом многочлена. Назовем многочлен f(x\,..., х„) кососимметрическим, если J (. . . , Xj, . . . , Xj, . . ¦) = —J(...,Xj,...,Xi,...), т. е. при транспозиции любых двух переменных Х{ и Xj многочлен ме- меняет знак. Примером кососимметрического многочлена служит Д = = П (xi - Xj). Ясно, что Д2 = D. Теорема 11.2. Любой кососимметрический многочлен f{x\,..., х„) можно представить в виде Д(х1,...,х„)д(х1,...,х„), где g — симметрический многочлен. Доказательство. Достаточно проверить, что / делится на Д. В самом деле, если //Д — многочлен, то этот многочлен по очевид- очевидным причинам симметрический. Покажем, например, что / делится на xi - х2. Сделаем замену xi = и + v, х2 = и - v. В результате получим /(хьх2,х3,...,х„) =/i(u,i;,X3,...,xn). Если х,\ = х2, то и = 0. Поэтому /i@, г>,хз,... ,хп) = 0. Это означает, что многочлен /i делится на и, т.е. многочлен / делится на хг - х2. Аналогично доказывается, что / делится на х; - Xj при всех г < j. ? Равенство Д2 = D показывает, что представление f = Ад не един- единственно. 11.3. Неравенства Мюрхеда Пусть X = (Xi,..., Х„) — разбиение, т. е. упорядоченный набор целых неотрицательных чисел Xi > Х2 > ... > Х„ > 0. Положим |Х| = Xi + ... ... + Х„. Будем считать, что X > и, если Xi + ... + X* > Ui + ... + и* при к = 1,2,...,п. Каждому набору X можно сопоставить однородный симметрический многочлен Мх(хь...,х„) = ^ ^^1),.,it<w A) ' oeSn Степень этого многочлена равна |Х|.
96 Глава 3. Многочлены специального вида Пример 1. Если X - A,...,1), то Мх(хь... ,xn) = xi-...-xn. В самом деле, сумма A) в этом случае состоит из п\ слагаемых Xi ¦ . .. ¦ Хп. Пример 2. Если X = (п,...,0), то Мх(хь...,хп) = «-...-х^)/п. В самом деле, сумма A) в этом случае состоит из (п - 1)! слагаемых х", (п - 1)! слагаемых х% и т. д. При положительных х\,..., х„ выполняется неравенство xf+ ...+ХЙ ^ > xi ¦... ¦ хп (неравенство между средним арифметическим и средним геометриче- геометрическим). Следующее утверждение является обобщением этого неравен- неравенства. Теорема 11.3 (Мюрхед, [Ми]). Неравенство Мх(х) > Ми(х) B) выполняется при всех х = (xi,...,xn) с положительными xi,...,xn в том и только том случае, когда |Х| = |и| и X > и. При этом равенство достигается лишь в том случае, когда X = и или хг = ... — хп. Доказательство. Предположим сначала, что неравенство B) вы- выполняется при всех х > 0. Пусть xi = ... = хк = а и хк+\ = ¦ ¦ ¦ = хп = 1. Тогда 1 < lim Mx(x)/Mu(x) = lim (а^+-+хЧа^+-+^). Следовательно, Xj + ... + Х^ > их + ... + и^. При к = п, положив х\ = ... = хп = а, получаем равенство ¦l) — a /a При a > 1, как и ранее, получим |Х| > |u|. А при 0 < а < 1 получим N- N Доказательство утверждения в обратную сторону более сложно. Оно использует следующее преобразование Rjj. Пусть Uj > u.j > 0, где г < j. Положим RijU. = и', где и^ = и, + 1, и^ = и^ - 1 и и.'к = ак при к ф i,j. Легко проверить, что и' > и. и |и'| = |и|. 11. Симметрические многочлены 97 Лемма 1. Если X = Л,_,и, то М\{х) > М^(х), причем равенство достигается лишь в том случае, когда х\ = ... = х„. (Предполагается, что числа xi,..., хп положительны.) Доказательство. Для каждой пары индексов p,q, где 1 < р < q < < п, в М\(х) - Mj,(x) входит слагаемое вида р xq xq p v g я Р C) где А — некоторое положительное число. Обозначим для наглядности хр - a, xq = Ь, Uj = а, а,- = [3. Напомним, что X* = а + 1, Xj; = р - 1 и а > р. Выражение C), деленное на А, равно a°+ifcP-i + a?-iy+i - aabP - аНа = (abf-'ia - b)(aa+l^ - ba+1^) > 0, причем равенство возможно лишь в том случае, когда а = Ь. Поэтому М\(х) - Мц(х) > 0, причем если среди чисел хх, ..., х„ есть хотя бы два различных, то неравенство строгое. П Лемма 2. Если X > и и |Х| = |и|, но X / и, то X можно получить из и с помощью конечного числа преобразований Ду. Доказательство. Пусть i — наименьший индекс, для которого Xj ф аг. Тогда из условия X > и следует, что X» > и*. Равенство |Х| = = |и|, означает, что 53(X* -и*) = 0, поэтому \j < iXj для некоторого индекса j. Ясно, что i < j и и,- > 0. Поэтому к и можно применить преобразование Rij. В результате получим последовательность v, для которой Vj = и,- + 1, vj = Uj - 1 и vk = ilk при к ф i,j. Учитывая, что X, > Uj и Xj < u.j, получаем X, - Uj| = |Xj - Vj Таким образом, т. е. с помощью преобразования Rij нам удалось уменьшить на 2 вели- величину J2\^k-u-k\- Поэтому с помощью некоторого числа преобразований Rij эту величину можно сделать равной нулю. ? Из лемм 1 и 2 неравенство Мюрхеда следует очевидным образом. ? 4- 1010
98 Глава 3. Многочлены специального вида 11.4. Функции Шура Пусть X = (Xi,... ,Х„) —разбиение, т. е. упорядоченный набор целых неотрицательных чисел Хх > ... > Хп > 0. Положим |Х| = Xi + ... + Хп. Будем считать, что X > и, если Xi + ... + \к > иц + ... + и* при к = 1, Рассмотрим бесконечную матрицу Р = ( РО Pi P2 0 ро pi 0 0 ро \ : : : •Л ¦•¦/ где pi = Pi(x\,..., хп) — полный однородный многочлен степени п; эле- элемент a,ij матрицы Р равен pj_j. Функцией Шура, или S-функцией, соот- соответствующей разбиению X, называют минор матрицы Р, образованный строками 0, 1, ..., п — 1 и столбцами Xi, Х2 + 1, ..., Х„ -I- п — 1. Эту сим- симметрическую функцию от переменных xi, ..., х„ обозначают sx- В виде определителя функция s\ записывается следующим образом: *х = \Pkt+i-j\i- Косой функцией Шура «х,и, соответствующей паре разбиений X и и, называют минор матрицы Р, образованный строками щ, иг + 1, ... ..., и„ + га - 1 и столбцами Хь Х2 + 1, ..., Х„ + п - 1. Ясно, что при этом s\ = s\fi. Разбиение и называют подразбиением разбиения X, если Xj > и; при г = 1,... ,п. Можно доказать, что если и не является под- подразбиением X, ТО Sx,u = 0. Первоначально функции Шура (еще до Шура) были введены Якоби как отношения кососимметрических функций определенного вида. Пусть а = (<xi,..., otn) —некоторое разбиение, аа —антисимметризация одно- одночлена х ,n , i.e. aa = где (-1)" — знак подстановки ш и о(ха) = х^ •... ¦ Л >. Легко прове- проверить, что многочлен aa(xi,..., хп) равен определителю \х*31"; в частно- частности, этот многочлен кососимметрический. Поэтому если а, = ot,+i для некоторого г, то аа = 0. Таким образом, можно считать, что а = \ + Ь, Г 12. Целоэначные многочлены 99 Теорема 11.4 (тождествоЯкоби-Труди). Пусть5 = (га—1,..., 1,0). Тогда s\ = а\+ь/аь, т. е. |px<+»-j|" = х Доказательство. Пусть а = (cti,...,an) — некоторое разбиение. Рассмотрим матрицы Аа = ||а;||'1г и //a = ||Pa?-n+j||"- Рассмотрим также матрицу М = ||(-1)"-4о„_г(%)||", где Xj = (хь... ,Xj-i,xj+1,... ,хп). Покажем, что эти три матрицы связаны соотношением НаМ = Аа. п-1 Пусть ow)(«) = E fc= = fl(l-xit)-1. Тогда A) и р(') = Ер*** = к=0 Сравнивая коэффициенты при tai в обеих частях этого равенства, полу- получаем Это и есть требуемое соотношение A). Из A), в частности, следует, что detH,,detM = detAa. B) Чтобы вычислить detM, положим a = 8 = (га — 1,.. .,1,0). В таком случае матрица На имеет вид ||pj-i||™- Эта матрица треугольная с эле- элементами ро = 1 на диагонали. Поэтому detifj = 1, а значит, detM = = det A§ = 05. А так как detffa = sa_s, то при a = X -I- 8 равенство B) принимает вид sxas = ax+8, т. e. s\ — ax+e/as. ? 12. Целозначные многочлены 12.1. Базис целозначных многочленов Многочлен р(х) называют целозначным, если он принимает целые значения при всех целых х.
100 Глава 3. Многочлены специального вида 12. Целозначные многочлены 101 Индукцией по к можно доказать, что многочлен (х\ х ¦ (х - 1) -...-(x-k + l) целозначный. В самом деле, при к = 1 это очевидно. Предположим те- теперь, что многочлен (,) целозначный. Легко проверить, что /X + U _ ( х \ _ /х\ Ук + V \k + V ~ \к>- Следовательно, при всех целых т, п разность (к , ^) — (, , ^) является целым числом. Остается заметить, что (. , ,) = 0. В некотором смысле целозначные многочлены исчерпываются мно- многочленами (д.), причем требование р(п) е Ъ при всех п е Ъ можно существенно ослабить. А именно, справедливо следующее утверждение. Теорема 12.1. Пусть рк —многочлен степени к, принимающий це- целые значения при х = п, п + 1, ..., п + к для некоторого целого числа п. Тогда Рк(х) =coQ +ci(f,x_1) ^) где со, с\,..., ск — целые числа. Доказательство. Многочлены образуют базис в пространстве многочленов степени не выше к, поэтому Рк(х) = co{Xk)+ci{kX_1)+... + ck, где со, с\,..., с*. — некоторые числа. Нужно лишь доказать, что эти чи- числа целые. Докажем это индукцией по к. При к = 0 многочлен ро(х) = со при- принимает целое значение при х = п, поэтому число со целое. Предположим теперь, что требуемое утверждение доказано для многочленов степени не выше к. Пусть многочлен Рк+i (х)=со(к^_1)+... принимает целые значения при х = п, п + 1, ..., п + к + 1. Рассмотрим многочлен Apk+i{x) =pk+i(x + l) -pk+i(x) = coQ +ci(fc- i) + --- + C*. Он принимает целые значения при х = п,п + 1, ... ,п + к. Поэтому числа Со, с\,..., ск целые, а значит, число тоже целое. D Теорема 12.2. Пусть R(x)—рациональная функция, принимающая целые значения при всех целых х. Тогда R{x) — целозначный многочлен. Доказательство. Рациональную функцию R(x) можно записать в виде R(x) = f{x)/g{x), где / и g — многочлены. Поделив / на g с остатком, получим R(x) =pk{x) + r(x), где рк — многочлен степени к, а г(х) -*¦ 0 при х -*¦ оо. Таким образом, при больших п значения рк (п) мало отличаются от целых чисел. Пока- Покажем, что Рк{х) — целозначный многочлен. Это делается почти так же, как и при доказательстве теоремы 12.1. Запишем многочлен рк (х) в виде рк(х) - С*. При к = 0 число Со должно сколь угодно мало отличаться от целого числа, поэтому со е Z. Многочлен Ар*(ж) =рк(х + 1) -рк(х) -coi^^ +...+ct_i. при больших целых х тоже принимает почти целые значения, а его сте- степень равна к — 1. Применив к нему предположение индукции, получим, что числа Со, Ci,..., ск-\ целые. Ясно также, что число =Рк(п) -со© -...-ct_i(") тоже целое. Остается доказать, что г(х) = 0. Как мы уже знаем, r(n) e Ъ при п е Ъ и г(п) -*¦ 0 при п -*¦ оо. Следовательно, г(п) = 0 при всех до- достаточно больших целых п. Но любая рациональная функция, имеющая бесконечно много нулей, тождественно равна нулю. ?
102 Глава 3. Многочлены специального вида Следствие. Пусть /(х) и д(х)—многочлены с целыми коэффици- коэффициентами, причем f(n) делится на д(п) при всех целых п. Тогда где со,.. -, ст — целые числа. Пойа [Р6] показал, что если целая аналитическая функция f(z) при- принимает целочисленные значения при целых или натуральных значениях переменной z и при этом возрастает не слишком быстро, то f(z) — цело- целозначный многочлен. Точнее говоря, справедливы следующие утвержде- утверждения: 1) если /(N) с Ъ и \f{z)\ < Cek\z\ где к < In2, то / — целозначный многочлен (доказательство этого утверждения можно найти также на ее. 161-162 книги [Ге2]); 2) если /(Z) с Z и \f(z)\ < целозначный многочлен. Примеры функций 2* и что обе оценки неулучшаемы. \ где к < то / — показывают, 12.2. Целозначные многочлены от многих переменных Базисные целозначные многочлены от п переменных устроены ана- аналогично базисным целозначным многочленам от одной переменной. Теорема 12.3 ([Ost]). Многочлен pdl...dn(xi,- ..,х„), где dt — сте- степень по переменной х,, принимает целые значения при х\ = ai,a\+l,... ..., ai -I- di, ..., xn = an, an + n, ..., an + dn тогда и только тогда, когда pdl...dn = Y, ckl...kn где с^...^ —целые числа. В частности, такой многочлен принимает це- целые значения при всех целых xt,..., хп. Доказательство. Проведем рассуждения при п = 2 (общий слу- случай аналогичен). При фиксированном xi e {ai,... ,ai + di} многочлен 12. Целозначные многочлены 103 Pdi d2 (xi! Х2) принимает целые значения при Х2 = а^,..., с*2+<^2 • Поэтому согласно теореме 12.1 при х\ = а\,..., ai + d\ выполняется равенство A) где cfc2 (ai),..., C)t2 (ai + d\) — целые числа. Если же рассматривать ра- равенство A) как соотношение для многочленов от переменных х\ и х2, то ясно, что Ck2{xi) — однозначно определенный многочлен. Как мы уже выяснили, этот многочлен (степени не выше di) принимает целые зна- значения при xi = ax,..., ai + dx. что и требовалось. ? 12.3. q-аналог целозначных полиномов Биномиальным коэффициентом Гаусса, или q-биномиальным коэф- коэффициентом, называют величину При q -+ 1 биномиальный коэффициент Гаусса переходит в обычный биномиальный коэффициент (?). Биномиальный коэффициент Гаусса является одним из многочисленных q-аналогов элементарных и специ- специальных функций (см., например, [Ки] и [ГР]). Тождество С^1) = Q + (jfc - l) имеет ^-аналог вида L к — [Щ ~ Iklq A) Для доказательства равенства A) достаточно заметить, что после со- сокращения общих частей числителей и знаменателей это равенство при- принимает вид q n+1 - (в* - l)(qn-k+1 - 1) 1 пп-к+1 „п-к+\ ~ 1" В дальнейшем будем считать, что q,nuk — целые числа, причем q > >2ж1<к<п.В таком случае индукция по п на основе формулы A) показывает, что []?] — целое число. Рассмотрим многочлены /о, /ь /г, • ¦ •, где /0 = 1 и (в - 1)(Г - 1) • -..- (в* - 1)
104 Глава 3. Многочлены специального вида 13. Круговые многочлены 105 при к > 1. Легко проверить, что fk(qn)=O при п = 0, -1 и fk(qh) = B) Кроме того, fk (qn) — [^] при п > к. В частности, при всех натуральных п число Д G™) целое. Теорема 12.4. Многочлен Рк(х) степени к принимает целые значе- значения при х = 1, q, q2,..., qk тогда и только тогда, когда Рк{х) = ckfk(x) со, C) где Co,ci,..., Ск—целые числа. В частности, такой многочлен прини- принимает целые значения при всех х = qn (n e N). Доказательство. Многочлены /o,/i,...,/* образуют базис ли- линейного пространства многочленов степени не выше к, поэтому равен- равенство C) выполняется при некоторых со,съ...,с* ^ С Нужно лишь проверить, что со,..., с* е Ъ. Формулы B) показывают, что РкA) =с0, Pk{q) =Ci + С0, Pk{q2) = c2 + c1f1(q2)+c0, Pk(qk) = ck+ cfc_i/t_i(g Поэтому последовательно получаем i{qk) + c0. П Если целая аналитическая функция принимает целые значения в точ- точках 1, q, g2,... и при этом растет не слишком быстро, то эта функция — многочлен. Точную формулировку и доказательство этого утверждения можно найти в книге [Ге2], с. 186-188. 13. Круговые многочлены 13.1. Основные свойства круговых многочленов Многочлен Фп(х) = Yl(x ~ ?fc)> гДе ?ъ ¦ • • i?<p(n) —примитивные корни степени п из единицы, называют круговым многочленом, или многочле- многочленом деления круга порядка п. Например, $\{х) = х — 1, Фг(а:) = х + 1, Ф3(х) = х2 + х + 1, Ф4(х) = х2 + 1. ; При п > 2 в число первообразных корней (из единицы) степени п не входит ±1. Б таком случае первообразные корни разбиваются на пары комплексно сопряженных чисел. Поэтому при п > 2 степень многочлена Ф„ четна. Непосредственно из определения кругового многочлена видно, что d\n Теорема 13.1. Пусть п > 1 — нечетное число. Тогда Ф2„(х) = Ф„(-х). Доказательство. Если ei,... ,?<,,(„)—первообразные корни сте- степени п, то -Ei,...,—?(р(п)—первообразные корни степени 2п. Таким образом, Фп(-я) = (-х - ei) •... • (-х - ц(п)), $2п(х) = (X + ?l) • ¦ ¦ . • (X + ?,,(„)). Остается заметить, что степень многочлена Фп четна. ? 13.2. Формула обращения Мёбиуса Соотношение Цфа(х)=хп-1 d\n позволяет получить явное выражение для Ф„(х) через xd - 1, где d про- пробегает делители п. Для этого имеется достаточно общая конструкция, основанная на функции Мёбиуса г 1 при п = 1; u(n) = (-1)* 0 при п = р2т. Теорема 13.2 (Мёбиус). Если F{n) = ?/(d), то d\n f(n) = ?u d\n d\n
106 Глава 3. Многочлены специального вида Доказательство. Прежде всего проверим, что при всех п > 1 вы- выполняется соотношение ^ u(d) = 0. Пусть п = р\х ¦... ¦ р^к. Тогда d\n Ясно, что a6=n Пусть n/di = т. Тогда Ь\т di\n 1 при п = d\; О при п ф d\. Поэтому ?(/№) E ^) )=/(")¦ D Следствие. Если F(n) = П f(d), то d|n f(n) = Д F(n/d).u(d) = d|n d|n Для круговых многочленов формула обращения Мёбиуса дает выра- выражение d\n Теорема 13.3. Коэффициенты многочлена Ф„(х) — целые числа. Доказательство. Сгруппируем в произведении riding ~ отдельно множители с и. — 1 и множители с и = — 1. В результате полу- получим Ф„(х) = P(x)/Q(x), где Р и Q — многочлены с целыми коэффици- коэффициентами и со старшим коэффициентом 1. Алгоритм деления многочленов 13. Круговые многочлены 107 показывает, что Ф„ — многочлен с рациональными коэффициентами. Поэтому существует такое т, что многочлен тФп имеет целые коэф- коэффициенты, причем их наибольший общий делитель равен 1. Согласно лемме Гаусса наибольший общий делитель коэффициентов многочлена тР = (тФп)<5 равен произведению наибольших общих делителей коэф- коэффициентов многочленов тФп и Q, т. е. он равен 1. С другой стороны, наибольший общий делитель коэффициентов многочлена тР равен т. Поэтому т = ±1, т. е. коэффициенты многочлена Ф„ — целые числа. П 13.3. Неприводимость круговых многочленов В предыдущем параграфе мы показали, что коэффициенты много- многочлена Фп(х) —целые числа. Теорема 13.4. Многочлен Ф„ неприводим над Ъ. Доказательство. Предположим, что Фп = fg, где / и g — мно- многочлены с целыми коэффициентами. Пусть ? — корень многочлена Ф„. Можно считать, что /(е) = 0 и многочлен / неприводим. Пусть р — про- простое число, взаимно простое с п. Тогда zp — корень многочлена Ф„. Мы хотим доказать, что гр — корень многочлена /. Предположим, что гр не является корнем многочлена /. Тогда можно считать, что Ф„ = fgh, где / и g — неприводимые многочлены со старшим коэффициентом 1 и /(е) = 0, 5И = 0. Многочлен хп — 1 и неприводимый многочлен /(х) имеют общий ко- корень ?, поэтому х™ - 1 делится на /(х). Аналогично х™ - 1 делится на д{х). А так как многочлены / и д взаимно просты, то х" - 1 делится на их произведение. Следовательно, дискриминант D многочлена х™ — 1 де- делится на результант R(f,g) (см. теорему 3.4 на с. 34). Легко проверить, что D = ±пп (см. пример 3.4 на с. 34). Чтобы прийти к противоречию, достаточно показать, что R{f, g) делится на р. Лемма. Если р — простое число и /(х) — многочлен с целыми ко- коэффициентами, то (/(х))р = f(xp) (mod p). Доказательство. Пусть /(х) = апхп + ... + ахх + а0. Тогда = Е ко+-+к„=р ко\ -...-кп\ {апхп)к»-...-(а0)к°.
108 Глава 3. Многочлены специального вида 13. Круговые многочлены 109 Число p!/(fc0! •... • кп\) не делится на р лишь в том случае, когда одно из чисел ко,..., кп равно р. Следовательно, (f(x))p = (апх)р + ... + (ао)р (mod р). Воспользовавшись тем, что ар = a (mod p) при всех а, получим требуе- требуемое. D Пусть у\ = ер, у2, ..., ук—корни многочлена д. Согласно лемме /(ер) = (f(t))P = 0 (modp), т.е. f(y\) = pty{y\), где ф — многочлен с целыми коэффициентами. Многочлен /-рф и неприводимый многочлен д имеют общий корень у\, поэтому / — рф делится на д, а значит, /(у*) — ф() = 0 при всех г. Следовательно, R(f,g) = ±f(Vl) •... -f(yk) = ± Выражение ty(y\) •... -<\>(ук) представляет собой симметрический много- многочлен с целыми коэффициентами от корней многочлена д. Таким образом, это выражение — целое число, т. е. R(f,g) делится на рк. Итак, если Ф„ делится на неприводимый многочлен / и ? — корень /, то для любого простого числа р, взаимно простого с п, число гр тоже будет корнем многочлена /. Теперь уже легко показать, что все корни многочлена Ф„ являются корнями многочлена /, т.е. f = ±Ф„. В самом деле, любой корень w многочлена Ф„ имеет вид ?т, где (тп,п) = 1. За- Запишем т в виде т = р\ ¦ ... ¦ ps, где р\,... ,ps — простые числа, среди которых могут быть совпадающие. Из условия (тп,п) = 1 следует, что (pt,n) = 1 при всех г. Поэтому zPl,гР1Р2,... ,гР1'"р' = а> — корни много- многочлена /. ? 13.4. Выражение Фтоте через Фп Круговой многочлен Фтп(х) во многих случаях можно выразить че- через Ф„(х). Мы ограничимся случаем, когда т = р — простое число. Теорема 13.5. Пусть р — простое число. Тогда при (п,р) =р; при (п,р) = 1. Доказательство. Рассмотрим сначала случай, когда п делится на р. Если ? — примитивный корень степени рп, то и = ер — примитив- примитивный корень степени п. При этом корню w соответствуют корни ?j,..., гр так, что (х - ?i) • ¦ • • • (х - ?р) = хр - w. Следовательно, %п{х) = П^ -е) = П (хР ~w) = ф"(хР Ы=Е1> Рассмотрим теперь случай, когда п не делится на р. В этом случае делители рп состоят из делителей п и их произведений на р. Поэтому Фрп(х) = Y[(xd - l)^"/d) = Y[(xd - l)."( d\pn d\n А так как u.(pn/d) = — u.(n/d), то d\n d\n d\n Воспользовавшись теоремой 13.5, можно вычислить Ф„(±1). Начнем с вычисления ФпA)- Если п делится на р, то согласно теореме 13.5 Ф„A) = Ф„/рA). Таким образом, если п = р •... -р?* и т = pi ¦... -рк, то ФпA) = ФтA)- Остается вычислить ФтA). Если т = р — простое число, то ФрA) = р. Если же т = р\ ¦ ... ¦ Рк, где к > 1, то положим р = pi и п = т/р. Согласно теореме 13.5 ФтA) = ^пA)/^пA) = 1- Итак, если п > 1, то при п = рх; Вычислим теперь Ф„(—1). Возможны следующие варианты. 1) п > 1 —нечетное число. Тогда Ф„(-1) = ФгпA) = 1- 2) п = 2к. Тогда Ф„(х) = (хп - 1)/(х"/2 - 1) = (х«/2 + 1). Поэтому Фп(-1) = 0 при п = 2 и Ф„(-1) = 2 при п = 2к, где к > 1. 3) п = 2т, где т > 1 — нечетное число. В этом случае Ф„(-1) = = ФтA). Таким образом, Ф„(-1) = р, если т = ра, и Ф„(-1) = р, если в т входит более одного простого делителя. 4) п = 2кт, где к > 1 и т > 1 — нечетное число. Пусть т = = pi1 ¦ ...-р?. Тогда Ф„(х) = $2r(x3), где г = рх ¦ ... ¦ pt и s - = 2к-1ра11'1 ¦...¦ pat'-\ Поэтому Ф„(-1) = Ф2РA) = 1. 13.5. Дискриминант кругового многочлена Представим круговой многочлен Фп(х) в виде фп(х) = = (хп - d\n d\n,
по Глава 3. Многочлены специального вида Если ? — корень многочлена Ф„, то d\n, d^n Поэтому модуль дискриминанта многочлена Фп равен П1*»М=п'(п) П П!1-6"!"^ ? d\n,d^n е Ясно, что td — примитивный корень степени n/d, т. е. if{n)/if{n/d) поскольку отношение degФn к degФп/(^ равно cp(n)/cp(n/d). Значение многочлена $n/d(x) ПРИ х = 1 может быть отлично от 1 лишь в том случае, когда n/d = рх. С другой стороны, \x(n/d) ф 0 лишь в том случае, когда n/d не делится на квадрат простого числа. Поэтому остаются лишь те значения d, для которых n/d — простое число. Итак, р\п Остается определить знак дискриминанта многочлена Ф„. Восполь- Воспользуемся для этого тем, что у многочлена Ф„ нет вещественных корней, а его степень равна ср(гг). В таком случае знак дискриминанта должен быть равен (-1)<р(п)/2 (см. теорему 3.5 на с. 34). 13.6. Результант пары круговых многочленов Начнем с того, что вычислим результант Д(Фп,а;т — 1). Многочлен хт - 1 делится на Ф\ = х — 1, поэтому Д(Ф1,а;т - 1) = 0. Предположим, что п > 2. Пусть d — (п,т), щ = n/d, 5i,^2) • ¦ • — первообразные корни степени п, t)i,tJ, ... — первообразные корни степени щ. Тогда „,1"" -1)=[[кг -1) = П'1 - 5D = I 13. Круговые многочлены 111 Если щ = 1, т.е. если т делится на п, то ФщA) = 0, поэтому Л(Ф„,з;т-1) =0. Если же гц ф 1, тоФП1A) =рприп! = р^ и ФтA) = 1 при п\ ф р\ Переходя к вычислению Л(Ф„,Фт), заметим, что это — целое чи- число, являющееся делителем как числа Д(Ф„,а;т - 1), так и числа ЩФт,хп - 1). В самом деле, хт — 1 = Фт(з;)/(з;), где f(x) — многочлен с целыми коэффициентами, поэтому ЩФп,хт - 1) = Д(Ф„,Фт/) = Я(Ф„,Фт)Д(Фп,/). Кроме того, если п > т > 1, то Д(Фт, Ф„) = (-1)^т^п'Л(Фп, Фт) = Д(ФП, Фт) и Л(Фт,Фп) > 0. Последнее свойство можно доказать, например, так. Ясно, что > 0. d\m поэтому Я(Фп, Фт) = П Д(Фп, X* - l)"( d\m Если т не делится на п и п не делится на т, то числа m/d и n/d, где d = (т,п), не равны 1 и взаимно просты. Поэтому числа Д(Фп,а;т - 1) и ЩФт, хп - 1) взаимно просты, а значит, Я{Фп, Фт) — 1- Пусть теперь для определенности m делится на п. Если т = п, то Д(Ф„,Фт) = 0. Если т/п ф рх, то Л(Фт,а;п — 1) = 1, поэтому Д(Фп,Фт) = 1. Остается рассмотреть случай т/п = р1. Ясно, что В правой части все множители равны 1, за исключением тех, для кото- которых т/8 = ра. Если (п,р) = 1, то неединичный множитель возникает лишь при 8 = = п. В этом случае Д(Фп,Фт) = ЩФт,Хп - 1) = p?(-»)/?(m/n) =p?W. Если п делится на р, то неединичные множители возникают лишь при 8 = п и при 8 = п/р. В этом случае Д(Фт,х"-1) _
112 Глава 3. Многочлены специального вида где _ y(m) ф(т) а = = ф(ш) Итак, если т > п, то 0 1 при m = п; при т = пр\- в остальных случаях. 13.7. Коэффициенты круговых многочленов Примеры многочленов Ф„(з;) при малых п показывают, что их коэф- коэффициенты равны 0 и ±1. Но в работе [Suz] доказано, что любое целое число служит коэффициентом некоторого кругового многочлена. Это доказательство основано на следующем вспомогательном утверждении. Лемма. Для любого натурального t > 3 существуют такие простые числа pi <Р2< ... <pt, что Pi+p2> Pt- Доказательство. Фиксируем t > 3. Предположим, что для любого набора простых чисел рх < р2 < ... < pt выполняется неравенство рх + + Р2 < Pi- В таком случае 2рх < ри поэтому между 2к~1 и 2к заключено менее t простых чисел. Это означает, что пBк) < kt (здесь k(s) — коли- количество простых чисел между Ins). Согласно теореме Чебышева (см. [ГНШ], [Дэ] или [Ч]) к(х) > ex/ Inх, где с—положительная константа. Поэтому с2к/\п2к < kt, т.е. с2к < < k2tln2. При достаточно больших к это неравенство выполняться не будет. п Пусть t > 3 — нечетное целое число. Выберем простые числа рх < < Р2 < ¦¦¦ < Pt так, что рх +р2 > pt. Положим р = pt. Рассмотрим многочлен Ф„(аг) по модулю хр+1. При нечетном t Фо у**' *¦ J • • • yJu ~ х-1 - 1) Но х*п = 0 (mod XP+1), хр<р>р» = 0 (mod z*>+1) и т. д. Поэтому 13. Круговые многочлены 113 Равенство ФР1...Р( @) = 1 позволяет выбрать знак плюс. Из неравенства Pi +Pj>Pi+P2>Pt=P следует, что Ясно также, что A - а;) = A + х + ... + хр) (mod xp+l). Поэтому ... + xp)(l-xPl -...-xPt){modxp+1). Среди мономов xPi, xp<+1,..., xPi+p моном хр встречается при всех г, а мономы хр~1 и хр~2 встречаются при всех г ф t. Поэтому коэффициент при хр у многочлена ФР1...Р, равен —1 +1, а коэффициент при хр~2 равен Когда t пробегает все нечетные числа начиная с 3, числа — t + 1 и —t + 2 пробегают все отрицательные числа. Чтобы получить в качестве коэффициентов круговых многочленов все положительные числа, рассмотрим многочлен Ф2Р1...Ре, где рх > 3 и Pi +P2 > Pt. Число п = ру...-pt нечетно, поэтому Фгп(а;) = Фп(—х). Это означает, что у многочленов Фгп и Фп коэффициенты как при хр, так и при хр~2 отличаются знаком, т. е. у многочлена Ф2Р1...Р, коэффициенты при хр и хр~2 равны t - 1 и t - 2, соответственно. 13.8. Теорема Веддерберна Одним из наиболее интересных приложений круговых многочленов является доказательство теоремы Веддерберна о коммутативности ко- конечного тела. Такое доказательство предложил Витт [Wt]. Телом называют кольцо, в котором уравнения ах = b и ха = Ь одно- однозначно разрешимы при всех а / 0. Теорема 13.6 (Веддерберн). Конечное ассоциативное тело R ком- коммутативно, т. е. является полем. Доказательство. Пусть ех и е2 — решения уравнений ах = а и ха = а, соответственно. Тогда аеха = а2 = ае2а, поэтому аех = ае2 и ех = ег = е. Покажем, что be = b для любого 6. В самом деле, пусть ха = 6. Тогда be = хае = ха = Ь. Аналогично eb = Ь. Таким образом, тело R содержит единицу 1. Рассмотрим поле Fp, порожденное элементом lei?. Тело R является линейным простран- пространством над полем Fp. Пусть г — размерность этого пространства. Тогда R состоит из рг элементов. Пусть Z — центр тела R, т. е. множество тех
114 Глава 3. Многочлены специального вида элементов R, которые коммутируют со всеми элементами R. Ясно, что Z— поле, содержащее Fp. Поэтому Z состоит из q = ps элементов. Тело R является также и линейным пространством над полем Z. Если раз- размерность R над Z равна t, то R состоит из ql элементов. Таким образом, рг = ql = pst. Мы хотим доказать, что R = Z, т. е. t = 1. Для любого элемента х е R рассмотрим его нормализатор Nx = = {у <= R\xy = ух}. Ясно, что Nx — подтело в R, содержащее Z. С од- одной стороны, тело Nx является линейным пространством над полем Z, поэтому JVj состоит из qd элементов. С другой стороны, тело R явля- является линейным пространством над телом' Nx, поэтому g' = (qd)k = qdk, т.е. d\t. В мультипликативной группе R* для каждого элемента х рассмо- рассмотрим его орбиту Ох = {yxy~l \y e R*}. Ясно, что Ох состоит из \ОХ\ = \R*\/\N*\ = tf-l)/tf-l) элементов. Орбиты разных элементов либо совпадают, либо не пере- пересекаются, поэтому R* разбивается на орбиты, причем орбита любого элемента Z* состоит из одного элемента. Следовательно, ql -l = q- A) где суммирование ведется по некоторым делителям d числа t. При этом d < t (равенство d = t соответствует тому, что х <= Z*; такие элементы выделены в качестве первого слагаемого). С помощью кругового многочлена Ф^(х) мы покажем, что равен- равенство A) возможно лишь при t = 1. Многочлен х* — 1 делится нацело на ФДх). Более того, если d \ t и d < t, то многочлен (х1 — l)/(xd — 1) тоже делится нацело на Фг(х), так как в этом случае многочлены xd — 1 и Ф((х) не имеют общих корней. В частности, числа ql — 1 и (ql - l)/(<7d — 1) делятся на Ф^д)- Соотношение A) показывает, что тогда q — 1 делится на Ф((д). С другой стороны, И ?j ф 1. = П \я ~ е«1 > Ч ~ так как |е4| = 1 П 13.9. Многочлены, неприводимые по модулю р С помощью формулы обращения Мёбиуса можно получить выраже- выражение для числа неприводимых многочленов степени п со старшим коэф- коэффициентом 1 над полем ?р = Ъ/pL. Докажем сначала следующее утвер- утверждение. 13. Круговые многочлены 115 Теорема 13.7. Пусть Fa{x) — произведение всех неприводимых многочленов степени d над со старшим коэффициентом 1 над полем ?р. Тогда d\n Доказательство. Многочлен хрП - 1 взаимно прост со своей про- производной рпхрП~1 - 1 = -1, поэтому у него нет кратных корней. Таким образом, достаточно доказать, что если /(х) — неприводимый много- многочлен степени d со старшим коэффициентом 1, то /(х) делит хр - 1 тогда и только тогда, когда d делит п. Пусть а — корень многочлена / и К = ?р (а) — расширение степени d поля Fp. Оно состоит из pd элементов и все его элементы удовлетворяют уравнению xpd — х = 0. В самом деле, мультипликативная группа поля Fp имеет порядок pd - 1, поэтому любой ненулевой элемент х е ?р удовлетворяет уравнению хр ~1 = 1. Лемма, а) Над произвольным полем многочлен хт - 1 делит х™ - 1 тогда и только тогда, когда т делит п. б) Если а > 2 — натуральное число, то ат - 1 делит а" - 1 тогда и только тогда, когда т делит п. Доказательство, а) Пусть m = qn + r, где 0 < г < п. Тогда -\ хп-1 х хп Многочлен хчп - 1 делится на хп - 1. Поэтому хт - 1 делится на хп - 1 тогда и только тогда, когда хг - 1 делится на хп - 1. Но г < п, поэтому хг - 1 делится на хп - 1 лишь при г = 0. б) Доказывается аналогично. П Предположим сначала, что d делит п. Тогда pd - 1 делит рп - 1, а значит, a;pCl - а; делит а;р" - х. Корень а неприводимого многочлена f(x) является также и корнем уравнения хр = х, поэтому f(x) делит хр - х. Предположим теперь, что /(х) делит хрП - х. Тогда ар - а. Если d й К ! + 62a d~2 () + ... + bd — произвольный элемент поля К, то ... + bd)p = 6iK" )d + ¦. - + bd = M** + ... + bd.
116 Глава 3. Многочлены специального вида Поэтому любой элемент поля К удовлетворяет уравнению хр" — х, т. е. хр — х делится на хр - х. Следовательно, п делится на d. ? Пусть Nd — число неприводимых многочленов степени d со старшим коэффициентом 1 над полем ?р. Тогда степень многочлена Fd равна dNd, поэтому d\n Применив формулу обращения Мёбиуса, получим d\n В частности, Nn ф 0, так как сумма *?,u.(n/d)pd имеет вид pdi± d\n ±pd2 ± ... ± pdk, где числа d, попарно различны. 14. Многочлены Чебышева 14.1. Определение и основные свойства Многочлены Чебышева Тп(х) являются одним из наиболее замеча- замечательных семейств многочленов. Они часто встречаются во многих обла- областях математики, от теории аппроксимации до теории чисел и тополо- топологии трехмерных многообразий. Мы обсудим некоторые наиболее про- простые, но весьма важные свойства многочленов Чебышева. Определение многочленов Чебышева основано на том, что соящ по- полиномиально выражается через cos ф, т. е. существует такой многочлен Тп(х), что Тп(х) = соящ при х = совф. В самом деле, формула cos(n + 1)ф + cos(n - 1)ф = 2 cos ф cos пф показывает, что многочлены Тп(х), определенные рекуррентным соот- соотношением Тп+1(х) = 2хТп(х)-Тп.1(х) и начальными условиями Т0(х) = 1 и Ti(ar) = x, обладают нужным свойством. Эти многочлены Т„(х) называют многочленами Чебышева. Непосредственно из того, что Тп(х) = cosny при х = совф, следует, что |Тп(х)| < 1 при х < 1. А из рекуррентного соотношения следует, чтоТ„(х) = 2п-1хп +а1хп~1 + ... + ап, где <ц,..., а„ — целые числа. Ц. Многочлены Чебышева 117 Наиболее важное свойство многочленов Чебышева было обнаружено самим Чебышевым. Оно заключается в следующем. Теорема 14.1. Пусть Рп(х) = хп + ... — многочлен степени п со старшим коэффициентом 1, причем |Р„(а;)| < ^т при |а;| < 1. Тогда Рп(х) = -1Г=тТп(х). (Иными словами, многочлен -^ггтТп(х)—наименее уклоняющийся от нуля на интервале [-1,1] многочлен степени п со стар- старшим коэффициентом 1.) Доказательство. Мы воспользуемся лишь одним свойством мно- многочлена Тп(х) = 2п~1Хп + ..., а именно тем, что Tn(cos(fcrc/n)) = = cosfcn = (-1)* при к = 0,1,...,п. Рассмотрим многочлен Q(x) = = -^rfTnix) - Рп{х). Его степень не превосходит п - 1, поскольку стар- старшие члены многочленов -^п=тТп{х) и Рп(х) равны. Из того, что |Pn(z)| < < -^^ при |х| < 1, следует, что в точке Хк = cos(kn/n) знак числа Q{xk) Хк-1 Рис. 5 совпадает со знаком числа Тп(хк)- Таким образом, в концах каждого отрезка [хк+1,хк} многочлен Q(x) принимает значения разного знака, поэтому у многочлена Q(x) на этом отрезке есть корень. Чуть более аккуратные рассуждения нужны в том случае, когда Q(x*) = 0. В этом случае либо Хк — двукратный корень, либо внутри одного из отрезков [xk+i,Xk] и [xk,Xk-i] есть еще один корень. Это следует из того, что в точках Xk+i и Xk-i многочлен Q(x) принимает значения одного знака (рис. 14.1). Количество отрезков [xk+i,xk] равно п, поэтому многочлен Q(x) имеет по крайней мере п корней. Для многочлена степени не более п — 1 это означает, что он тождественно равен нулю, т. е. Рп{х) = -^=\Тп{х). ? Если z = cos ср + i sin ер, то z + z~x = 2 cos ф и zn + z~n = 2 cos щ.
118 Глава 3. Многочлены специального вида Поэтому Тп + z . Воспользовавшись этим свойством, можно доказать следующее утверждение. Теорема 14.2. Пусть m = [п/2]. Тогда = ? j=o Доказательство. Пусть х = (z + z~l)/2 и у = (z - z~l)/2. Тогда у2 = х2 - 1 и = (Х + у)П "V г=0 j=0 Остается заметить, что Тп{х) = j=o гп+г~п П Следствие. Пусть р— нечетное простое число. Тогда rp(a:)=ri(a:) (mod р). Доказательство. Запишем р в виде р = 2тп + 1. Тогда га ад = ? B>p~2v - !)'• Если j > 0, то B ¦) делится на р. Поэтому Тр(х) = хр (mod p) = х (mod p) = Ti(ar). П Для пары многочленов Р и Q можно определить их композицию Р о Q(x) = P(Q(x)). Многочлены Р и Q называют коммутирующими, oQ = Q0P, т.е. P(Q(x)) =Q(P(x)). Ц. Многочлены Чебышева 119 Теорема 14.3. Многочлены Тп(х) и Тт(х) коммутирующие. Доказательство. Пусть х = cos ср. Тогда Тп(х) = cos(ncp) = = у и Tm(?/) = cosm(ntp), поэтому Tm(Tn(x)) = cosmntp. Анало- Аналогично Tn(Tm(x)) = cosmncp. Таким образом, равенство Tn(Tm(x)) = — Тт(Тп(х)) выполняется при |а;| < 1, а значит, это равенство выпол- выполняется при всех х. ? Многочлены Чебышева являются единственным нетривиальным при- примером коммутирующих многочленов. Дело в том, что справедлива сле- следующая теорема классификации пар коммутирующих многочленов. Пусть 1(х) = ах + Ь, где а, Ь е С и а ф 0. Будем говорить, что пара многочленов /о/оl~1 yilogo^1 эквивалентна паре многочленов / и д. Теорема 14.4 (Ритт). Пусть / и д — коммутирующие многочлены. Тогда пара многочленов / и д эквивалентна одной из следующих пар: A) хт и ех", где е = 1; B) ±Тт(х) и ±Т„(х), где Тт и Тп — многочлены Чебышева; C) ц($к\х) и z2Q(l)(z), где г\=г\ = 1, Q(x) = xP(x«), Q(D = Q, Эта теорема была доказана в 1922 г. американским математиком Риттом; все известные ее доказательства весьма сложные. Современное изложение доказательства теоремы Ритта приведено в [ПрШ]. В некоторых случаях вместо многочлена Тп{х) удобно рассматри- рассматривать многочлен Рп(х) — 2Т„(х/2) со старшим коэффициентом 1. Мно- Многочлены Рп(х) удовлетворяют рекуррентному соотношению Рп+\{х) = — хР„(х) - Рп-1 (ж), поэтому Рп(х) — многочлен с целыми коэффициен- коэффициентами. Если z = cos ф + г sin tp = elif, то z + z~l = 2costp и zn + z~n = 2cosncp. Поэтому P(z + z~l) = 2Tn(costp) = 2cosntp = zn + z~n, т. е. многочлен Pn(x) соответствует полиномиальному выражению величины zn + z~n через z + z~l. С помощью многочленов Р„ можно доказать следующее утвержде- утверждение. Теорема 14.5. Если оба числа а и cos(cm) рациональны, то число 2cos(ot7t) целое, т.е. cos(om) = 0,±1/2 или ±1.
120 Глава 3. Многочлены специального вида Доказательство. Пусть а = т/п— несократимая дробь. Поло- Положим Хо — 2cosi, где t = ал. Тогда Рп(хо) — 2cos(ni) = 2соз(пал) = = 2соз(тл) = ±2. Поэтому Хо—корень многочлена Р„(х) =F 2 = хп + + b\xn~l + ... + Ъп с целыми коэффициентами. Пусть Хо = 2cos(arc) = = p/q — несократимая дробь. Тогда рп + b\pn~lq + ... + bnqn = 0, а значит, рп делится на q. Но числа р и q взаимно простые, поэтому q = ±1, т. е. 2соз(ал) —целое число. ? Производные многочленов Чебышева удобно вычислять, опираясь непосредственно на соотношение Тп(х) = cosncp, где х = coscp. Напри- Например, ; . . d cos гаер /dcoscpN _ га sin racp 1пУх)= d(? у d(f J sincp ' „. . d /rasinracpN —1 _ га cos cp sin гаер — га2 cos racp sin cp n dtp I sin cp I sin cp sin3 cp Из этих формул следует, что ) A - х2)Г;{х) - arTi(i) + п2Тп{х) = 0. Тождество A — х2)(Т'п{х)) = п2A — Тп(х)) , можно переписать в A) виде 1 = .... sin nq> „ ,, где ип(х) = —.—- и х = coscp. Легко проверить, что мп—многочлен с целыми коэффициентами. Действительно, индукция по п показывает, что sin па: = pn(cosa;) sin a;, cos па- = qn{ где р„ и qn — многочлены с целыми коэффициентами. Тождество A) можно использовать для получения решений уравне- уравнения Пелля x2-dy2 = l. В самом деле, если (xi,yi) —натуральное решение этого уравнения, то = T2n{xl)-d{ylUn{x1)J, Ц- Многочлены Чебышева 121 поэтому (Tn(xi),yiUn(xi)) —тоже натуральное решение этого уравне- уравнения. Замечание. Можно доказать, что если (x\,yi) — наименьшее на- натуральное решение уравнения Пелля, то все его натуральные решения имеют вид (Tn(a:i),j/iWn(a:i)). 14.2. Ортогональные многочлены Многочлены fk{x), к = 0,1,..., называют ортогональными много- многочленами на отрезке [а, Ь] с весовой функцией w(x) > 0, если deg fk — к и о 1 fm(x)fn(x)w{x)dx = 0 при тпф п. В пространстве Vn+1 многочленов степени не более п можно задать скалярное произведение формулой ь (f,g) = J f(x)g(x)w(x)dx = O. а Ортогональные многочлены /о, /ъ • ¦ ¦ > /п образуют ортогональный ба- базис в пространстве Vn+l с таким скалярным произведением. Если задан отрезок [а, Ь] и весовая функция w(x), то ортогональные многочлены определены однозначно с точностью до пропорционально- пропорциональности. В самом деле, они получаются в результате ортогонализации базиса 1,а-,а;2,... Наиболее известны следующие ортогональные многочлены: а -1 -1 -1 -00 0 Ь 1 1 1 00 00 w(x) 1 A-х2I-1/2 {l-x)a(l + xf exp(-i2) хае-х Название многочлены Лежандра многочлены Гегенбауэра многочлены Якоби многочлены Эрмита многочлены Лагерра Теорема 14.6. Многочлены Чебышева образуют ортогональную систему многочленов на отрезке [—1,1] с весовой функцией w(x) = _ 1
122 Глава 3. Многочлены специального вида Доказательство. Сделав замену х = coscp, получим 1 X / Tn{x)Tm(x) . Х = / cosncpcosmcpdcp = -1 О x _ Г cos(m +n)q> + cos(m — n)q> , 0 Остается заметить, что / cos fccp dcp = 0 при /г ф 0. о Следствие. Если Pn(i) — многочлен степени п и 1 ? при fc = 0,1,... ,п — 1, то Р„(а;) = ХТп(а;), где X — некоторое число. Доказательство. В пространстве Vn+l со скалярным произведе- произведением 1 U, 9) = J'/(яМаОтПГ^ -1 ортогональное дополнение к подпространству, порожденному много- многочленами 1,х,х2,.. .,хп~1, порождено многочленом Чебышева Т„(х). ? Следствие теоремы 14.6 бывает полезно при доказательстве того, что некоторый многочлен является многочленом Чебышева. Например, с его помощью можно доказать следующее утверждение. Теорема 14.7. Многочлены Чебышева можно вычислять по фор- формуле l-3-5-...-Bn-l)dxn Ц. Многочлены Чебышева 123 Доказательство. Индукцией по тп легко доказать, что при m <п ^A - ^jn-l/2 = pm(a;)A _ а.2)„-т-1/2> гдеРт(а;) — многочлен степени т, причем Pq(х) = l,Pi(a;) = —Bп — 1)х и Рт+1 = 1 - а;2 - Bп - 2т - 1)жРт(а;) при т > 1. Следовательно, - многочлен степени п. Проверим, что Рп{х) = ХТ„(ж), т. е. при fc = 0,1,..., n — 1. Интегрируя по частям, получаем 1 Первое слагаемое равно нулю, так как 1-х2 =0 при х = ±1. Затем интегрируем по частям второе слагаемое и т. д. Чтобы в конце концов получить нуль, нужно проинтегрировать по частям к + 1 раз. При этом dn-k-l на последнем шаге возникнет дифференциал n-k-i ¦ Это означает, что число п — к — 1 должно быть неотрицательно, т. е. к < п — 1. Остается проверить, что X = (-1)П1 ¦ 3 ¦ 5 ¦ ... • Bп - 1). Для этого можно вычислить РпA)- Дело в том, что при 1 = 1 рекуррентное соот- соотношение Pm+i(x) = 1 - х2 - Bп - 2т - 1)хРт(х) принимает вид - 2ТП - Таким образом, Р„A) = (—1) • 3 ¦ 5 • Г„A) = 1. Bп - 1). Ясно также, что ?
124 Глава 3. Многочлены специального вида 14.3. Неравенства для многочленов Чебышева Многочлены Чебышева мало уклоняются от нуля на отрезке [—1,1]. Это компенсируется тем, что они и их производные быстро возрастают вне этого отрезка. Точнее говоря, справедливо следующее утверждение. Теорема 14.8. [Ro] Пусть многочленр(х) = ao+aiX + .. .+anxn, где а; е С, таков, что \р{х)\ < 1 при -1 < х < 1. Тогда |p(fc)(^)| < при \х\ > 1, х е Ж. Доказательство. Мы воспользуемся лишь тем, что |p(zj)| < 1 при Х{ = cos(n — i)x/n, i = 0,1,..., п. Многочлен р{х) полностью определя- определяется этими значениями p(xi). В самом деле, A) j=0 где gt(x) = Ц(х —Xj). Дифференцируя к раз соотношение A), получим i=0 А так как |р(а;$)| < 1, то г=0 B) Многочлен Тп(х) в точке х% принимает значение cos(n—г)л = (—1)" '¦ Поэтому i=0 -v~" Ясно также, что sgngi{x{) = (—l)n~*. Кроме того, при \х\ > 1 знак числа д\ (х) не зависит от г. В самом деле, все корни многочлена gt(x) принадлежат отрезку [—1,1], поэтому все корни многочлена д\ (х) тоже принадлежат этому отрезку. Следовательно, sgngl '(х) = 1 при х > 1 и sgnfl|fc)(i) = (-!)"-* при аг<1. 14- Многочлены Чебышева 125 В итоге при \х\ > 1 получаем г=0 В таком случае из неравенства B) следует, что p'fc^(i)| < \Т„ (ж)|. ? Из теоремы 14.8 можно извлечь много полезных следствий. Сформу- Сформулируем их в виде отдельных теорем. Теорема 14.9. Пусть многочлен р(х) = а$ + а\х + ... + апхп, где щ е С, таков, что \р{х)\ < 1 при -1 < х < 1. Тогда \а„\ < 2п~1. Доказательство. Напомним, что Тп(х) = Ъо + Ьхх + ... + Ь„хп, где bn = 2™. Поэтому, применив теорему 14.8 при к = п, получим Ы < \Ъп\ = 2". П Теорема 14.10. При х < -1 и при х > 1 выполняется неравенство Доказательство. Для многочлена р(х) — Тп_х(х) выполняется условие теоремы 14.8, поэтому \Т^]х{х)\ = \р{х)\ < |T^fc)(a;)|. D Теорема 14.11 [As]. При х,у > 1 выполняется неравенство Тп(ху) < Тп(х)Тп{у). Доказательство. Фиксируем у > 1 и рассмотрим многочлен р(х) = Тп(ху)/Тп(у). Проверим, что этот многочлен удовлетворяет условию теоремы 14.8, т.е. \р(х)\ = \Тп(ху)\/Тп(у) < 1 при -1 < х < 1. При вещественном s функция |Tn(s)| зависит только от \s\, причем если |s| > 1, то |Tn(s)| монотонно возрастает с возрастанием \s\. Ясно также, что |Tn(s)| < 1 < Тп{у) при |s| < 1. Следовательно, если у > 1 и \Тп(ху)\<Тп(у). Согласно теореме 14.8 при х > 1 выполняется неравенство \р(х) < Тп(х), т.е. Тп(ху) < Тп(х)Тп(у). <
126 Глава 3. Многочлены специального вида 14.4. Производящая функция Для последовательности функций ап(х) можно рассмотреть ряд оо ^ an(x)zn = F(x, z). Если радиус сходимости этого ряда положителен, п=0 то функцию F(x, z) называют производящей функцией последователь- последовательности ап(х). Теорема 14.12. При -1 < х < 1 и \z\ < 1 выполняются следующие равенства: (а) (б) n=l п=\ Доказательство, а) Пусть х = cos ср. Тогда 1 - 2xz + z2 = A - e**z)(l - е~*г), поэтому ln(l - 2xz + z2) = ln(l - el<s>z) + ln(l - e~xts>z). Ясно также, что ±intf n=l при \z\ < 1. Следовательно, - 2xz + z2) " = 2 n n=l n=l б) Продифференцировав по z обе части равенства (а), получим n=l Следовательно, \-z2 n=l -2xz- l-2xz D 14- Многочлены Чебышева 127 С помощью теоремы 14.12 можно получить следующее явное выра- выражение для многочлена Чебышева. Теорема 14.13. Пусть п > 1 и m = [п/2]. Тогда к=0 Доказательство. Согласно теореме 14.12 (а) п=1 p=i ОО Р р=\ к=0 Поэтому Тп{х) = \ М fc=O Суммирование ведется до тех пор, пока п - 2к > 0, поэтому М = [п/2] - ? = т. Более удобная явная формула получается для многочлена Рп{х) = = 2Тп{х/2), а именно: -Йч п-2к A) fc=O где m = [п/2]. Напомним, что многочлен Р„(х) соответствует полиномиальному выражению величины zn + z~n через z Л- z~x (это следует из того, что zn + z~n = 2cosncp и z + z = 2 coscp при z = el(r). Легко проверить, что при п = 2m + 1 выполняется равенство к=0
128 Глава 3. Многочлены специального вида а при п = 2m выполняется равенство m-l fc=O + z 2k-n\ Таким образом, если Ро{х) = 1, а при п > 1 многочлены Рп(х) задаются формулой A), то выполняется соотношение B) fc=0 где m = [n/2]. Соотношения A) и B) можно записать следующим образом. Пусть ап = хп и Ьп = Рп(х), где а: — некоторое фиксированное число. Тогда fc=O C) fc=O (при п = О второе соотношение выглядит как &о = ао)- Покажем, что соотношения C) эквивалентны не только для указанных последователь- последовательностей, но и для произвольных последовательностей. Прежде всего за- заметим, что первое соотношение имеет вид а„ = Ъп + ^Рп-г&п-г, а второе соотношение имеет вид Ьп = ап + ^an_jOn_j, поэтому каж- каждое соотношение однозначно определяет как последовательность ап по последовательности Ьп, так и последовательность Ьп по последователь- последовательности ап. Ясно также, что для последовательностей ап = ^2~kiXf, bn — — J2^iPn(xi), где Xi и Xi —фиксированные наборы чисел, соотношения C) эквивалентны, потому что они эквивалентны для последовательно- последовательностей ап = х?, bn = Pn(xi). Остается проверить, что для любой после- последовательности ао, а\,..., ап можно подобрать такие числа Хо,..., Х„ и п хо,... ,хп, что at = ^2 ~kix\ при / = 0,1,..., п. Выберем произвольные г=0 попарно различные числа хо,... ,хп. Тогда для чисел Хо,..., Хп получим систему линейных уравнений с определителем 1 ... 1 Хо ... Хп #0. Эта система уравнений имеет решение при любых ао,..., ап. щ 15. Многочлены Бернулли 129 Соотношения C) позволяют получать нетривиальные тождества с биномиальными коэффициентами. Положим, например, Ьп = 1 при всех п. Тогда т = 2_, V к > ~ 1 ' fc=0 Bт Bтп к=0 эти тождества легко получаются из разложений A + lJm+! и A + 1Jт по биному Ньютона. В таком случае соотношение принимает вид fc=o к=0 27П+1 2тп fc=0 2m-2k 15. Многочлены Бернулли 15.1. Определения многочленов Бернулли Рассмотрим функцию g(z,t) = I . При t = 2kni знаменатель обращается в нуль, поэтому при таких t функция g(z, t) может иметь особенности. Но при t = 0, как легко убедиться, функция g регулярна. Поэтому функцию g(z,t) можно разложить в ряд п=0 сходящийся при \t\ < 2л. Как мы сейчас увидим, Bn(z) — многочлен степени п. Многочлены Bn(z) называют многочленами Бернулли, а числа Вп = J5n@) называют числами Бернулли. 5 - 1010
130 Глава 3. Многочлены специального вида Ряд для функции g(z,t) представляет собой произведение рядов = ЕЬв- и п=0 п=0 Поэтому Вп(г) п\ Bn-kzk \ ~ 2^ k\(n-k)V п—0 т.е. п=0 Формально это равенство можно записать в виде Bn{z) = (В + z)n, где под Вп~к будет подразумеваться Вп-к- Одно из важнейших свойств многочленов Бернулли заключается в том, что Bn(z+1)-Bn(z)=nzn-1. A) Для доказательства формулы A) достаточно заметить, что = g(t,z + 1) - g(t,z) = tet{z+x) tetz t n=0 n=0 Сложим равенства A) для г = 0,1,...,т-1.В результате получим тп-1 fc=6 Это, в частности, означает, что сумма 1 + 2n~x + ... + (т — I)" представляет собой многочлен степени потт. Именно это свойство было обнаружено Я. Бернулли [Bern]. А производящая функция ( _ = оо ^п = J2 —\Bn{z) была предложена Эйлером в 1738 г. п=0 "• При вычислении многочленов Бернулли удобно пользоваться рекур- рекуррентными соотношениями n>2. C) г=0 15. Многочлены Бернулли 131 Эти соотношения можно доказать следующим образом: поэтому Bn(z + 1) = Е C)Br{z) = Bn(z) + "? C)Br{z). Остается вос- г=0 г=0 пользоваться соотношением A). При 2 = 0 соотношения C) превращаются в рекуррентные соотно- соотношения для чисел Бернулли ?©Яг = 0, п>2. D) г=0 Легко проверить, что Bq = 1, Поэтому из соотношений D) последова- последовательно получаем Bi = -\, В2 = \, В3 = 0, В4 = -±, В5 = 0, .. Несложно показать, что В2к+1 = 0 при к > 1. В самом деле, п=2 поэтому достаточно проверить, что функция ?^Т+2 ~ е*-1 четна. В четности этой функции легко убедиться. В 1832 г. Аппель показал, что многочлены Бернулли связаны соот- соотношением Чтобы доказать это соотношение, продифференцируем по z обе части равенства В результате получим n=0 п=0 п=0 Приравнивая коэффициенты при tn+1, получаем требуемое.
132 Глава 3. Многочлены специального вида 15.2. Теоремы дополнения, сложения аргументов и умножения Многочлены Бернулли обладают следующими свойствами: J5n(l - z) = (—l)nBn(z) (теорема дополнения); п Вп(х + у) = У (n)Bs(x)yn~s (теорема сложения аргументов); «=о m-l / , \ — )> Вп \z Л 1 = тГпBn(mz) (теорема умножения). к=о ч ' Все эти теоремы легко выводятся из соотношения п=0 Для доказательства теоремы дополнения достаточно заметить, что ft" ,. . te't1~*> -te-" f (~tT „ , , ? ^-d -2) = тзг = г=гп = Е —в«^- п=0 п=0 Теорема сложения аргументов доказывается следующим образом: n=0 \s=0 r=0 r, s=0 n=0 s=0 Для доказательства теоремы умножения мы воспользуемся тожде- тождеством t A)t emt-l Из этого тождества следует, что 00 .п . тЛ.т 1 rn.tz n=0 fc=o emt-l то fc=O n=0 I /5. Многочлены Бернулли 133 Теорема умножения показывает, что многочлен Бернулли Вп(х) является решением функционального уравнения A) Jfc=0 Теорема 15.1 [Le]. При фиксированных т,п>1 существует един- единственный многочлен степени п со старшим коэффициентом 1, удовле- удовлетворяющий функциональному уравнению A). Доказательство. Существование требуемого многочлена можно доказать и непосредственно, но мы не будем этого делать, а просто воспользуемся уже известным нам фактом, что многочлены Бернулли удовлетворяют функциональному уравнению A). Пусть р(х) = хп + ... и q(x) = хп + ... — два разных многочлена, удовлетворяющих функциональному уравнению A). Их разность А(х) = = aQXd + ..., где ао ф 0 и d < п, тоже удовлетворяет уравнению A). Сравнение коэффициентов при xd в левой и правой части равенства -V а(х+-) = т-пА(тх) то ^ \ то / v ' показывает, что оо = md~nao- Это противоречит условию га > 1 и предположению о том, что ао ф 0 и d < n. D Сделав замену переменных, функциональное уравнение A) можно привести к виду m-l / ч f(r\ -m'-l V f ( Х+к ) Ю\ k=o ^ ' где s = п. В случае натурального s непрерывные функции / : @,1) -»- С, удовлетворяющие уравнению A), исследовал Кубер [Ки]. В общем слу- случае, т. е. при seC, пространство таких функций двумерно, причем в нем можно выбрать базис /even, /odd так, что (z) = /even(l ~ x) ^) = -/odd(l ~ x). О разных свойствах решений уравнения B) Джон Милнор написал боль- большую интересную статью [Mi].
134 Г л а в а 3. Многочлены специального вида 15.3. Формула Эйлера Пусть s е С, Res > 1. Тогда ряд Yl ~ сходится. Функция ?(s) = п=1 " оо j = 5Z — допускает аналитическое продолжение на всю комплексную п=1 п плоскость. При этом в точке s = 1 она имеет простой полюс, а в осталь- остальных точках регулярна. ОО J При целых s ряд ^ ~т рассматривал еще Эйлер. Но рассматривать п=1 п ?(s) как функцию комплексного переменного первым начал Риман, и именно он обнаружил наиболее глубокие ее свойства и наиболее важные ее приложения. В связи с этим функцию ?(s) называют дзета-функцией Римана. Теорема 15.2 (Эйлер). Если к — натуральное число, то (-1)к+1В2к22к-1к2к B*)! Доказательство. Воспользуемся разложением функции sin z в бес- бесконечное произведение: sin z = z TJ I 1 j-y 1. Продифференцировав логарифмы обеих частей этого равенства, получим sin г п=1 т. е. sin z пк 2fc A) n=l fc=l С другой стороны, подставив t = 2iz в равенство оо т получим т=2 Z— = sin г B) m=2 Сравнение коэффициентов при z в A) и B) дает требуемое равенство. ? 15. Многочлены Бернулли 135 Из формулы Эйлера для CBfc) видно, что число ?Bfc) трансцен- трансцендентное, потому что число к трансцендентное. Что же касается чисел ?Bfc + 1), то для них нет столь удобной формулы. В частности, лишь в 1978 г. Апери (R. Apery) доказал иррациональность числа ?C). Наибо- Наиболее простое из известных мне доказательств иррациональности числа ?C) приведено в [Вей]. 15.4. Теорема Фаульгабера-Якоби Суммированием степенного ряда lm + 2m+3m + ... математики инте- интересовались задолго до Бернулли. В 1617 г. немецкий математик Иоганн Фаульгабер A580-1635) опубликовал книгу, в которой привел суммы таких рядов для т < 11. Затем в 1631 г. в книге [Fa] он продолжил свои вычисления до т = 17. Суммированием степенных рядов занимался и Пьер Ферма. В 1636 г. он писал Мерсенну: «... Мы не хотели здесь на этом останавливаться, однако построили решение, возможно, простейшей во всей арифметике задачи, благодаря которой не только можем найти сумму квадратов или кубов любой прогрессии, но и вообще сумму всех степеней до бес- бесконечности благодаря самому общему методу] квадрато-квадратов, квадрато-кубов и т. д.» Многие историки математики склонны верить, что Ферма действительно получил решение этой задачи почти за сто лет до Бернулли. Фаульгабер в своей книге [Fa] отметил, что все суммы ^ пк полино- полиномиально выражаются через первые две суммы J^n и ^п2. Двести лет спустя, в 1834 г., Якоби переоткрыл теорему Фаульгабера. Известно, что у Якоби была упомянутая книга Фаульгабера, но не известно, чи- читал он ее или нет. Введем для удобства многочлены Формула B) на с. 130 показывает, что Sn(m) = Г +2" + ... + (т - 1)п. Теорема 15.3 (Фаульгабер-Якоби). Пусть U - Si(x) и V = S2(x). Тогда при к > 1 существуют такие многочлены Рк и Q* с рациональ- рациональными коэффициентами, что S2k+i(x) — U2Pk(U) и S2k(x) = VQk(U).
136 Глава 3. Многочлены специального вида Доказательство. Чтобы получить выражение для S2*h-i, восполь- воспользуемся равенством п-1 (п(п - 1))г = 5>Ч* + 1)г - хг(х - If) = х=1 т. е. Эти равенства для можно записать в матричном виде: п3(п - IK I = 2 S3(n) \ Se(n) S?(n) } В полученной бесконечной матрице все главные миноры конечного по- порядка невырожденные, поэтому S»(n) Sr(n) Эта формула показывает, что S2k+i(n) выражается через п(п — 1) = 2U(n) и делится на (п(п — 1)) . Чтобы получить выражение для S2fc, воспользуемся равенством п-1 п г+1 (п - 1)г = - (а; - 15. Многочлены Бернулли 137 Суммы нечетных степеней можно уничтожить с помощью A). В резуль- результате получим „2г-2 т.е. Теперь аналогично предыдущему случаю получаем S2(n) S4(n) Se(n) 2n-l, i-i n(n - 1) \ 7l2(n-lJ П3(П - IK где Ojj — \2(i — j) -t-1/ v2fi — j) -f-1/ ¦ Простые вычисления показывают, что 5г(п) = Поэтому многочлены 54(n), Se(n), ... делятся на S2(n), причем (п) является многочленом от п(п — 1) = 2Щп). П In - 1 n(n - 1) 15.5. Арифметические свойства чисел и многочленов Бернулли В этом параграфе мы докажем некоторые теоремы о знаменателях значений многочленов Бернулли в рациональных точках. Наибольший интерес при этом представляют значения в точке 0, т. е. числа Бер- Бернулли. При формулировке утверждений о знаменателях рациональных чи- чисел бывает удобно пользоваться понятием р-целого числа. Если р — про- простое число, то рациональное число г называют р-целым, если р не входит в знаменатель числа г, т. е. знаменатель t несократимой дроби s/t = г не делится на р. Для рационального числа г запись г = 0 (mod p) будет означать, что числитель s несократимой дроби s/t — г делится на р. Легко проверить, что если г\ = Г2 = 0 (mod р), то г\г2 =0 (mod р) и г\ ± гг = 0 (mod p). Кроме того, если число т\ является р-целым и г2 = 0 (mod p), то г\г2 = = 0 (mod p).
138 Глава 3. Многочлены специального вида Теорема 15.4 (Куммер). Пусть р— простое число. Если натураль- натуральное число п не делится на р — 1, то число Вп/п является р-целым и ВпЛ-р— 1 Вп . , . —, =0 (mod p). п+р-1 п ' Доказательство. Мультипликативная группа поля Z/pZ цикличе- циклическая, поэтому у нее есть образующая. Это означает, что существует натуральное число а, заключенное между 1 и р, для которого ак ? 5^ 1 (mod р) при к = 1,... ,р — 2. Рассмотрим функцию tk-l TTп :-!)!' где Лй_1 = (a*-l)-p Достаточно доказать, что все числа Ak являются р-целыми и р_1 - Ак = 0 (mod p). В самом деле, если п не делится на р — 1, то an j^ I (mod p), поэтому равенство — = -^—- показывает, что число Вп/п тоже будет р-целым. А так как ар~г = 1 (mod p), то Воспользуемся равенством () Положим u = е* — 1. Тогда а \ а eat-l eat-l 1 и 1 и i5. Многочлены Бернулли 139 Все числа сг являются р-целыми, потому что таковы все числа bs/a. Таким образом, ifc=l r=0 где все коэффициенты сг являются р-целыми. Функцию (е* — 1)г можно представить в виде линейной комбинации с целыми коэффициентами функций emi, т = 0,1,..., г. В свою очередь, emt = 1=0 Поэтому Ak можно представить в виде линейной комбинации с р-целыми коэффициентами чисел тк~1. Равенство сг(е* — 1)г = crtr + ... показы- показывает, что эта линейная комбинация состоит из конечного числа слагае- слагаемых. Сумма и произведение р-целых чисел является р-целым числом, по- поэтому Ak — р-целое число. Ясно также, что m (fc-i)+(,-i) _ m*-i = mfc-i(mP-i _ i) = о (mod p). Поэтому число Ak+p-i - Ak представляет собой линейную комбинацию с р-целыми коэффициентами рациональных чисел, у которых числители делятся на р. Это означает, что Ак+p-i - Ак = 0 (mod p). D Теорема 15.5 (фон Штаудт). Пусть п — четное число, р — простое число. Тогда если п не делится на р — 1, то Вп —р-целое число, а если п делится на pj - 1, то рВ„ = — 1 (mod p). Доказательство. Согласно предыдущей теореме, если р — про- простое число и п не делится на р — 1, то р не входит в знаменатель Вп. Поэтому остается рассмотреть случай, когда п делится на р — 1. ер( - Перемножим равенства ^2, Bk-n ~ ~i—г и JZ j— — —т В результате получим pnBkt n+fc-1 р-1 п,к=О n!fc! r=0 Р-1 оо гЧВ s! г=0 s=0
ff 140 Глава 3. Многочлены специального вида Сравнение коэффициентов при tn в левой и правой части показывает, ; что Jfe=0 (n+l-fc)!Jfc! 2-< п\ п\' Учитывая, что Вп+\ = Bn_i = 0, получаем п-1 __ь р-1 fc=0 г=1 Ясно, что при п — к > 2 числор™ к/(п-к+1) являетсяр-целым, поэтому индукция по п показывает, что числа рВ2, ¦ ¦ ¦ ,рВп являются р-целыми. (База индукции: рВо = р, рВ\ = -р/2.) При п — к > 2 число рп~к/(п - к + 1) не только является р-целым, но и его числитель (после возможных сокращений) делится на р, т. е. рп~к/(п ~к+1)=0 (mod p). Следовательно, г=1 В рассматриваемом случае п делится на р — 1, поэтому гп = 1 (mod p) при г = 1,2,... ,р — 1. В итоге получаем рВп = -1 (mod p). ? Положим Bn(t) = Bn(t) - J3n@). Напомним, что в таком случае | Вп(т) = пA"-х + 2"-1 + ... + (т- I)") j при всех натуральных т. ,! Теорема 15.6 (Алмквист-Мойрман). При всех натуральных h, к I и п число knBn{h/k) целое. ; Доказательство [Sur]. Теорему сложения аргументов ' 15. Многочлены Вернулли 141 можно записать в виде Вп(х Вп(у). 8=0 Поэтому требуемое утверждение достаточно доказать для h = 1. Обозначим для краткости knBn(h/k) = ап. Ясно, что Bq{z) = Во. Поэтому t п=1 п=0 п=0 Положим г = l/к и сделаем замену х = kt. В результате получим п=1 п\ екх-1 Запишем это соотношение в двух видах: п=1 Воспользуемся разложениями efcx — 1 = ,кх _ т _ чт f_?_ и ех _ j = J2 ?-. Срав- 5Z r =1 г! г=1 s=l нивая коэффициенты при хп в левой и правой части, в первом случае при всех п > 1 получаем f + Vfc""'= ("+l)U-an)- Во втором случае получаем ai = 1, а при п > 2 получаем п-1 Е (")arsn-' = ~^an> B) C) 1=1 s=0 где so = к и sm = lm + 2т + ... + (fc - l)m- Целочисленность ап мы докажем по индукции с помощью соотноше- соотношений B) и C). Для этого нам понадобится следующее вспомогательное утверждение.
142 Глава 3. Многочлены специального вида Лемма. Пусть р — простое число, 2 < I < г и (p,s) = 1. Тогда (s\ ) делится на pr~l+1. Доказательство. Запишем I в виде I = tpa, где {t,p) = 1. Ясно, что а < I — 1 (равенство возможно лишь в случае I = р = 2). Легко проверить, что ( ) = — ( ,). Поэтому v / ) - ? r-a ,spT - 1\ _ ? r-a p UJp _ ? - tp где N — целое число, а числа s и t взаимно просты с р. Следовательно, число (sj? ) делится на рг~а. В свою очередь, рг~а делится на pr~l+l, так как а < I — 1. ? Из наших обозначений уже давно исчезло к, поэтому напомним, что ап = knBn(h/k). Рассмотрим сначала случай, когда к — простое число. Предположим, что а\,..., ап-\ — целые числа. Тогда из соотношений B) и C) следует, что (п + 1)а„ и кап —целые числа. Если п + 1 не делится на к, то ап —целое число. Пусть теперь п+1 = skr, где г > 1 и (к, s) = 1. Чтобы убедиться в целочисленности ап, достаточно доказать, что число (n + l)an = skran делится на кг. Формула B) показывает, что для этого, в свою очередь, достаточно доказать, что при 1 = 1,2,..., skr - 2 числа ( j )кп~1 делятся на кг. При I < п - г = skr - 1 - г это очевидно. Если же skr — r<l< skr — 2, то рассмотрим число V = skr - I и применим к нему лемму. В результате получим, что число (s, ) = (s,, ) делится на kr~l'+1, а значит, число (п { )кп~1 делится на kn~l+r~l'+1 = кг, что и требовалось. Случай к = р^ •... • р^", где р\,..., рт — различные простые числа, не требует существенно новых рассуждений. Предположим, что числа a.i,...,an-i целые. Тогда из соотношений B) и C) следует, что числа (п + 1)а„ и ка„ целые. Запишем п + 1 в виде п + 1 = pj1 ¦ ... • pb^s, где (s,Pi) = 1. Если bi > 1, то те же самые рассуждения, что и в пре- предыдущем случае, показывают, что (п + 1)ап делится на pbi. Положим st = (п + 1)р^ ' ¦ Тогда (si,pt) = 1 и все числа Si<in целые. Это означает, что в знаменатель рационального числа ап не входят простые множи- множители pi,...,pm. С другой стороны, число кап целое, поэтому в знамена- знаменатель числа ап могут входить только простые множители числа к. ? Задачи к главе 3 143 Задачи к главе 3 Симметрические многочлены 3.1. Пусть oi,...,on — элементарные симметрические функции, а числа а\,...,ап е С удовлетворяют системе уравнений ok(ai,...,an) =ак(ак,...,ак). Доказать, что а\ = ... = а„. В задачах 3.2-3.4 мы будем считать, что х = {х\,...,хп) и у = = B/1,... ,уп), где все числа xi,...,xn,y1,...,yn положительны. Сумма х + у определяется покомпонентно. 3.2 [ML]. Доказать, что при г = 2,...,п для элементарных симме- симметрических функций Oj выполняются неравенства ¦^ - aT-i(x) Or-i(y)' 3.3 [ML]. Доказать, что при г = 1,2,..., п выполняется неравенство у/аг(х + у) > у/ог(х) + \/аг{у). 3.4 [Wh]. Определим функции Тг(х) соотношением Д A + Xit)k при к > О, П A - Xit)k при к < 0. . i=0 г=0 (В частности, если к = 1, то Тг(х) = аг(х) —элементарный симметриче- симметрический многочлен, а если к = — 1, то Тг(х) = рг(х) —полный однородный многочлен.) а) Доказать, что если к > 0, то {/Тг{х + у) > у/Гг(д) + у/Тг{у). б) Доказать, что если к < 0, то {/Тг(х + у) < у/Тг{х) + у/Тг(у). Целозначные многочлены 3.5. Доказать, что если многочлен f(x) степени п принимает целые значения при 1 = 0, 1, 4, 9,... ,п2, то он принимает целые значения при всех х = m2, m e N.
144 Глава 3. Многочлены специального вида 3.6. Пусть т и п — натуральные числа. Доказать, что следующие условия эквивалентны: (а) существуют такие целые числа ао,...,ап, что НОД(о0>...,ап,т) = 1 и значения многочлена апхп + an-ixn~1 +... + ао при всех ieZ делятся на т; (б) п\/т е Z. Многочлены Чебышева 3.7. Доказать, что при п > 2 дискриминант многочлена Чебышева Т„ равен г*"-1»2/!2. 3.8. а) Доказать, что если число п > 3 нечетно, то многочлен Чебы- Чебышева Тп неприводим. б) Доказать, что если п ф 2*, то многочлен Тп неприводим. в) Доказать, что если число п > 3 нечетно, то многочлен Тп(х)/х неприводим тогда и только тогда, когда число п простое. 3.9. Пусть и(х) и v(x) — многочлены с действительными коэффици- коэффициентами, причем -\/1 — и2 — vy/\ — х2. Доказать, что тогда: а) и'(х) = ±nv(x), где п = degu; б) и(х) = ±Тп{х). 3.10. а) Доказать, что функция у = Тп(х) удовлетворяет дифферен- дифференциальному уравнению A - х2)у" - ху'+ пу2 = 0 и любое полиномиальное решение этого дифференциального уравнения имеет вид сТп, где с — некоторая константа. б) Доказать, что функция у = Тп(х) удовлетворяет дифференциаль- дифференциальному уравнению A-*2)(,/J=п2A-2,2), причем это уравнение имеет только два решения, а именно, у = ±Тп(х). 3.11. Пусть Д„(а;) —определитель матрицы порядка п с диагональ- диагональными элементами (х,..., х), наддиагональными элементами A, |,..., |) и под диагональными элементами (|, ...,|); остальные элементы ма- матрицы нулевые, т. е. ац = 0 при \г - j\ > 1. Доказать, что Тп{х) = = 2n~lAn(x). Решения задач 145 i\ 3.12 [Da]. Напомним, что матрицу (a,ij) называют циркулянтной, если aij = bi - bj, где bk = bj при к = I (mod n). Пусть Ап(х) —опре- —определитель циркулянтной матрицы с bo = 1, bi = —2х, b2 — 1. Доказать, что Ап(х) = 2{1-Тп(х)). Решения задач 3.2. При г = 2 требуемое неравенство следует из тождества п / п п \2 Е I xi Е У禦- У' Т, х>) _ _ i=l \ j = l j = l / oi(x) ai(y) ~" 2oi(x)oi(y)oi(x + y) Предположим теперь, что г > 2 и требуемое неравенство уже дока- доказано для г-1. Рассмотрим систему чисел ij = (xi,... ,Xi-i,Xi+i,... ,хп). Легко проверить, что iiOr_i(ii) = rar(x), -i(Xi) + ar(Xi) = ar(x). A) B) Запишем равенства B) для i = 1,..., п и просуммируем их. В результате получим п п г=1 г=1 Вычтя из этого равенства тождество A), получим (Xi) = (n-r)ar(x). C) Ясно также, что ar(x) - ar(xi) ¦¦ Суммируя эти равенства при г получаем п rar(x) = y^ijO г=1 xi) = XiOr-i(x) - x2ar-2{xi). 1,... ,п и учитывая соотношение C),
щ 146 Глава 3. Многочлены специального вида Т. е. ^ у ir2{i ar_!(x) - г I 2- * Z-, ar_!(x) \г=1 t=l \г=1 i~2^ Xi+Or-l(xi)/Or-2(Xi) j " Запишем аналогичные тождества для у та х + у. Требуемое неравенство следует из того, что если Xi,yt, a*, bi,Ci — положительные числа, причем С; > Щ + bi, ТО У,2 уг+ai 4_+ rf pEj+yiJ '<+Oi Xi+yi+ai+bi 3.3. Мы воспользуемся задачей 3.2 и следующим вспомогательным утверждением. Лемма. Если ai,...,ar,b\,... ,br — неотрицательные числа, то \/(ai +bi) ¦... ¦ (ar + br) > \/ai ¦... • ar + y/b\ ¦... ¦ br. Доказательство. Пусть R(z) = {(zi,...,zr) \zi-...-zr = 1, Zi Согласно неравенству между средним арифметическим и средним гео- геометрическим -... +arzr •... • ar = mm R(z) Поэтому V (ai + Oi) ¦... • (ar + br) = mm R(z) .. . + (ar+br)zr > > mm R(z) aTzr mm дB) ... + brzr > ... ¦ ar + {/bi ¦ ...-br. ? Решения задач 147 Представим аг(х + у) в виде произведения oi(x + ar_i(x + y) ar-2(x Согласно задаче 3.2 "Г* Ofc-^x + y) - ak-i(x) Ok-i(y)' Воспользовавшись теперь леммой, получим г/ °т(х) Or-l(x) Ol (ж) Or-i(x) аг_2(х) ¦" 1 3.4. Мы рассмотрим лишь случай к < 0, включающий полные од- однородные многочлены. Пусть / = —к > 0. В таком случае для гамма- функции имеется интегральное представление оо Г@= [ е~Ч'-х eft. При a > 0 можно сделать замену t = as и получить оо Г@=о' I e-assl-lds, т. е. Положим ai = 1 — ij^- При малых \t\ число ai положительно, поэтому -х4*)* = (щ) j...j J{s1,...,sn)ds1...dsn, Ц »=1 о о
148 Глава 3. Многочлены специального вида где Учитывая, что et(xisi+...+xnsn) _ r=0 получаем oo oo 1 ( 1 \n f f Tr(x) - ^ [ щJ /¦••/ (xis1 + ... + xnsn)r<f(s1,...,sn)dsi...dsn, о о о о где cp(si,.. • ,sn) = e~Sl~-"s"(si ¦... -вя)'. Требуемое неравенство сле- следует теперь из неравенства Минковского gr{x)dx\ +Uhr(x)dx где функции g и h неотрицательны на [а, Ь]. 3.11. Несложные вычисления показывают, что Тп(х) = 2п~1Ап(х) при п = 1 и п = 2. При п > 2, раскладывая определитель Ап(а;) по последней строке, получаем соотношение Ап+1(х) = хАп(х) - -Ап-^х). Это соотношение соответствует рекуррентному соотношению Тп+1(х) = 2хТп(х)-Тп-1{х). 3.12. Пусть ?i,...,?n — различные корни степени п из 1, f(t) — cq + •... + cntn. Тогда определитель циркулянтной матрицы с элемен- элементами aij — Ci-j равен f(z\) ¦ /(?2) • ¦ • • ¦ }{zn). В самом деле, например, при п — 3 получаем 1 1 1 \ / со с2 d \ / /A) /A) /A) 1 «1 «? ) I ci со еа 1 = I /A) ei/(ei) t\ 1 ?2 t\ ) \ С2 С! СО / V /A) Е2/(?2) t\ 1 1 1 Решения задач 149 /1 1 1\ А так как определитель матрицы I lei ef J не равен нулю, на него \\tit\l можно сократить. В результате получим требуемое равенство. При п > > 3 рассуждения аналогичны. В нашем случае /(?) = ! — 2xt + t2, поэтому Таким образом, требуется доказать, что п 2A-cosncp) = П^1 Докажем сначала, что 2A- cosncp) = 2" JJ fl-cosfcp+^Лу Это равенство следует из того, что х2п - 2хп cosncp + 1 = (хп - ехр(гпср)) (хп - ехр(-гпср)) ^nb-expiU+^jm^-^ В самом деле, при х = 1 получаем требуемое равенство. Докажем теперь, что 2"ПA-сО8(ср+^))=ПA-2со8ср? к-1 Ч Ч ' ' fc=l где Zk = expB/cra/n). Ясно, что (х - Zk){x - z-k) — х2 - 2xcosBkii/n) + 1. efc + 4),
150 Глава 3. Многочлены специальны о вида Поэтому г\ + 1 = 2tk cosBkK/n), а значит, ТТ XX A ~ 2 coscp?fc + el) = JJ 2zk (cosBkn/n) - coscp) = 22п Остается заметить, что последнее выражение равно В самом деле, П Ч = (-1)"+\ так как хп-1 = П(х- г,) Ясно что при к = 1,...,п- 1 также, 2 + п а при к = п -(?+S) ¦-(*-?)¦ Глава 4 Некоторые свойства многочленов 16. Многочлены с предписанными значениями 16.1. Интерполяционный многочлен Лагранжа Пусть xi,...,xn+i — попарно различные точки комплексной плоско- плоскости С. Тогда существует ровно один многочлен Р(х) степени не выше п, принимающий в точке xt заданное значение щ. Действительно, един- единственность многочлена Р следует из того, что разность двух таких мно- многочленов обращается в нуль в точках Х\,..., хп+\ и имеет при этом сте- степень не выше п. Ясно также, что следующий многочлен обладает всеми требуемыми свойствами: п+1 Р(Х) = (х - Xl) ¦ . . . • (X - Xk-l) • (X - Xk+l) • . . . • (X - Жп+l) к=1 п+1 '" (Хк - Xl) ¦ . . . (Xk - Xk-l) ¦ (Xk ~ ф) ¦ (Xk -Xn где ш(з;) = (x - Xi) ¦... • (x - xn+i)- Многочлен Р{х) называют при этом интерполяционным многочле- многочленом Лагранжа, а точки xi,...,xn+i называют узлами интерполяции. Если cif. = f(xk), где / — некоторая функция, то многочлен Р называют интерполяционным многочленом Лагранжа для функции /. Теорема 16.1. Пусть / е Сп+1([а, &]) и Р — интерполяционный многочлен Лагранжа для функции / с узлами интерполяции Х\,... ...,хп+\ б [а,Ь\. Тогда где М = max |/(n+1)(a;)| и <*(х) - (х - Xi) ¦... ¦ (х - xn+i). о<х<Ь
152 Глава 4- Некоторые свойства многочленов Доказательство. Достаточно проверить, что для любой точки е [а,Ь] найдется такая точка ? е [а,Ь], что При Хо = х,, 1 < i < n, это равенство очевидно, поэтому будем считать, что Хо ф Xi. Рассмотрим функцию и{х) = f(x) - Р(х) - \и>(х), где X — некоторая константа. Поскольку ы(хо) ф 0, эту константу можно выбрать так, что и(хо) — 0. Ясно также, что и(х{) = ... ... = u(xn+i) = 0. Функция и(х) имеет по крайней мере п + 2 ну- нулей на отрезке [а, Ь], поэтому функция и'(х) имеет по крайней мере п+1 нуль на этом отрезке, а функция u'fc' (х) имеет по крайней мере п + 2 — к нулей. При к = п + 1 получаем, что функция u'n+1'(a;) = f(n+1\x) — — (п+1)! X обращается в нуль в некоторой точке ? е [а, Ь]. Это означает, Х /("+1>(?)/( 1)! )!, т.е. - Р(х0) = D Для фиксированного отрезка [а, Ь] и для фиксированной степени п оценка, даваемая теоремой 16.1, оптимальна в том случае, когда о>(а;) — многочлен степени п со старшим коэффициентом 1, наименее откло- отклоняющийся от нуля на отрезке [а,Ь]. Например, если [а,Ь] = [—1,1], то о(х) = yfTn+i(x), где Tn+i(x)—многочлен Чебышева. Напомним, что Тп+\(х) — cos((n +1) arccosjr) при х < 1. Корни многочлена Tn+i имеют вид :, fc = l п + 1. Хк = COS 2(п Для таких узлов интерполяционный многочлен имеет вид Действительно, если и>(х) = ^Тп+1(х), то Тп+1(х) {х-хк)ы'(х) (х - хк)Гп+1(хУ 16. Многочлены с предписанными значениями 153 поэтому требуется доказать, что (п+!)(-!)¦ к-1 ¦ -xi Учитывая, что Tn+i{x) = cos(n + 1)ср, где х = coscp, получаем т, , , _ (п + 1) sin(n + 1)у Если совф = хк, то sinср = у/1 - х\ и sin(n + 1)ф = (—I)*. Помимо чебышевских узлов интерполяции часто используются узлы, равномерно распределенные на отрезке или на окружности. Для узлов хк = ехр к = 1,...,п интерполяционный многочлен имеет вид , п+1 -J. к=1 Для доказательства этой формулы достаточно заметить, что Тх{Х ~1}, Интерполяционный многочлен для узлов = 1,..., п + 1, можно записать в виде = а + (к — l)h, к = Р{х) = {х. а) 2! Д"/(а) (х - а)(х - а - h) ¦ ... ¦ (х - а - (я - !)/>) п\ к ) O 3=0 J Многочлен Р(х) называют при этом интерполяционным многочле- многочленом Ньютона. Легко проверить, что Р(Хк) = f(Xk)- Действительно, Р(а) = /(а), Р{а + h) = f(a) + Д/(а), Р{а + 2Л) = /(а) + 2Д/(а) + т + Д2/(а), ..-, P(a + mh) = ? HAJ/(a) = f(a + mh). Последнее равенство следует из того, что Ак f(x + h) = Ak+1 f(x) + Akf(x).
154 Глава 4- Некоторые свойства многочленов 16.2. Интерполяционный многочлен Эрмита Пусть xi,...,xn — попарно различные точки комплексной плоско- плоскости С, oti,...,an — натуральные числа, сумма которых равна т + 1. Предположим, что в каждой точке х, заданы числа у\ ,у\ ,..., yf' Тогда существует единственный многочлен Нт(х) степени не выше т, для которого выполняются равенства Я Л-.\ _,.@) тг, / ч _ A) "т\хг) — Vi п\Х)У i = 1,... , п. Иными словами, в точке xt многочлен Нт имеет заданные значения производных до порядка а* -1 включительно. Такой многочлен Нт называют интерполяционным многочленом Эрмита. Единственность интерполяционного многочлена Эрмита доста- достаточно очевидна. Действительно, если G(x)—разность двух интерпо- интерполяционных многочленов Эрмита, то degG < m и G(x) делится на (х-х^1 -...-{х-ХпУ". Пусть П(х) = (х — X\)ai ¦... • (х — хп)а". Чтобы построить интерпо- интерполяционный многочлен Эрмита, достаточно указать многочлены ццс(х) (i = 1,..., п и к = 0,1,..., Oj - 1), обладающие следующими свойствами: 1) degcpi/t < m; 2) <?ik(x) делится на многочлен п(х)/(х — Xi)ai, т. е. (pik(x) делится на (х - Xj)a' при j ф г; 3) разложение (?ik(x) по степеням (х — а;*) начинается с —Ах — Х{)к + + (X-Xi)ai. Действительно, ^(Xj) - ... = ф^''^) = 0 при j ф г, (р-^'С^) = 1 и 9ifc (*») = 0 при 0 < I < a, - 1, I -ф- к. Поэтому можно положить г=1 fc=O . 1 (x-Xi)ai Функция т^— . .— регулярна в точке Xi, поэтому в окрестности точки Xi ее можно разложить в ряд Тэйлора: < I *! П(х) aiks(x-Xiy s=0 16. Многочлены с предписанными значениями 155 Здесь lik (х) — многочлен степени не выше otj — к — 1, являющийся на- начальной частью ряда Тэйлора. Несложно проверить, что многочлен а. {hk{x)(x - а*) ) обладает всеми требуемыми свойствами. Свойства 1 и 2 очевидны, а свойство 3 доказывается следующим образом: / ч _ lik(x)(x - Xj)k О - Xi) Записывая в явном виде начальный участок ряда Тэйлора hk(x), по- получаем н (x)- m{)~ п{х) 16.3. Многочлен с предписанными значениями в нулях производной В 1956 г. в заметке [Апг] было анонсировано утверждение, что для любых п комплексных чисел а\,...,ап существует многочлен степени п +1 со старшим коэффициентом 1, принимающий значения а\,..., а„ в нулях своей производной. Но доказано это утверждение было лишь че- через 9 лет Рене Томом [Th]. Мы приведем доказательство, предложенное Яном Мысильским [My]. Теорема 16.2. Для любых заданных чисел ai,. С суще- сущеД ствуют такие числа Ь\,... ,Ьп е С и такой многочлен Р(х) = хп+1 + + pixn +... + х, что P{bi) — at и P'(bi) = 0 для i — 1,... ,п, причем если в последовательности Ь\,... ,Ьп число C встречается к раз, то Р(х) — Рф) — [3)fc+1. делится на (а; — [3) Доказательство. Для Ь = (Ьь...,Ьп) еС" положим Рь(х) = Y[(t - I «=1 bi)dt.
156 Глава 4- Некоторые свойства многочленов Ясно, что Р&@) = 0 и Рь(х)—многочлен степени п + 1 со старшим коэффициентом 1. Кроме того, поэтому Pb'(bi) — 0. Если число [3 встречается к раз в последовательности bi,...,bn, то Рь'ф) = ... = Рь ф) = 0. Отметим, что любое число C является корнем многочлена Рь(х) - Рьф) и (Рь(а:) - Рьф))' = Рь(х)- Поэтому Рь(а;) - Рьф) делится на (а; - P)fc+1. Остается доказать, что отображение ф : С" ->С", заданное фор- формулой ф(&) = (Pbih),..., Рь(Ъп)), сюръективно. Прежде всего покажем, что ф — локальный гомеоморфизм в любой точке b — (b\,...,bn), для которой bi ф bj при i ф j и bi ¦... ¦ Ьп ф 0. Для этого достаточно про- проверить, что det ( яь ) ф 0. Предположим, что det [ —~-^ I = 0. Тогда существуют такие числа С\,..., с„, не все равные нулю, что —- = 0 при г = 1,...,п. A) Легко проверить, что \ - К) dt п (при г = j появляется еще дополнительное слагаемое (п + 1) Д (bi — bs), s=l но оно равно нулю). Поэтому равенство A) можно записать в виде = O при х = о j=i Подынтегральное выражение представляет собой многочлен от t сте- степени не выше п, принимающий значение Cj Д (t — bs) при t = bj. По условию Y\ (t — bs) фОис^ ф0 для некоторого j. Следовательно, F(x) — *Фз ненулевой многочлен степени не выше п+1. С другой стороны, F(x) = 0 при х = 0, Ъ\,..., Ьп. Получено противоречие. 16. Многочлены с предписанными значениями 157 Отображение ф : С™ -*¦ С™ индуцирует отображение ф : СР" -> СР™, заданное формулой Дело в том, что ф(Х&) = Хп+1фF) и ф х@) = 0. Первое свойство доказы- доказывается с помощью замены переменных т = Xi: / ]\(t - bi) dt= П(Х-Ч - h)^1 dx = Х-" / [](т - Xbi) dx. о i=1 о i=1 о i=l Второе свойство доказывается следующим образом. Пусть ф(&ь..., Ьп) = = @,..., 0). Предположим, что последовательность b\,...,bn состоит из fci чисел р1(..., кт чисел (Зт фе ф Pj при i ф j). Тогда многочлен Рь(х) — = Рь(х) — Рьфь) имеет степень п = к\ + ... + кт и делится на а; и на (а; — Pi)*1+1 ¦...- (х — pm)*:*"+1- Это возможно лишь в том случае, когда Ь1 = ... = Ьп = 0. Пусть Д — множество точек (bo :Ь\ : ... : bn) e СР", координаты которых удовлетворяют одному из следующих уравнений: Ьг=0 (i = 0,...,n); bt=bj (l<i<j<n). Ограничение отображения ф на CPn \ Д является локальным гомеомор- гомеоморфизмом. Кроме того, ф(Д) с Д. Действительно, если bo = 0, то ф((Ь0 : Ъп)) = @ : Pb(h) :...); если bj = 0 при i > 1, то Pb(bi) = 0, а если bi = bj при 1 < i < j < п, то Рь(Ьг) = Pb(bj). Образ СРП при отображении ф — компактное множество; в част- частности, оно замкнуто. Образ СР™ \ Д при отображении ф — открытое множество, граница которого принадлежит ф(Д) с Д. Множество Д не разбивает СР™, поскольку оно имеет вещественную коразмерность 2. Следовательно, ф(СР"\Д) з СР™ \Д и замыкание множества <р(СР" \Д) совпадает с СРП. ? Замечание. Неверно, что <р(СР" \ Д) с СР" \ Д. Например, 9A,2,3) = (-9,-8,-9).
158 Глава 4- Некоторые свойства многочленов 17. Высота многочлена и другие нормы 17.1. Лемма Гаусса Пусть К — поле, х у-*- \x\v е К— некоторая функция на К. Эту функцию называют абсолютным значением, если выполняются следу- следующие условия: A) |а;|„ > 0, причем |а;|„ = 0 ¦& х = 0; B) \xy\v = \x\v\y\v; C) \x + y\v <\x\v + \y\v. Если же вместо условия C) выполняется более сильное условие \х + y\v < тах{|а;|„, |у|г,}, то абсолютное значение называют неархи- неархимедовым. Для поля рациональных чисел Q имеется естественное абсолютное значение \x\v = \х\ — модуль (абсолютная величина) числа х. Но есть еще и так называемые р-адические абсолютные значения, которые опре- определяются для каждого простого числа р следующим образом. Запишем рациональное число х в виде х = ргт/п, где тип — целые числа, не де- делящиеся на р. Положим \х\р = р~Т¦ Легко проверить, что это абсолютное значение неархимедово. В самом деле, пусть а; = prmi/ni и у = причем г < s. Тогда тах{|а;|р, \у\р) = р~Г и x + y =pr Поэтому \х + у\р < р г (строгое неравенство возможно лишь в том слу- случае, когда s = г). Высотой многочлена f(x) = ^щх1 относительно данного абсолют- абсолютного значения | ¦ |t, называют величину Я(/) = тах|а*|„. Нас будут i интересовать оценки высоты произведения многочленов через высоты множителей. Наиболее простая оценка получается в том случае, когда абсолютное значение неархимедово. Лемма (Гаусс). Пусть H(f)—высота многочлена / относительно неархимедова абсолютного значения | ¦ |. Тогда H(fg) = H(f)H(g). Доказательство. Пусть f{x) = ап + ... + а0 и д(х) - Ьтхт + ... ... + Ьо. Рассмотрим те из коэффициентов а„,...,а0, для которых абсо- абсолютное значение максимально (их может быть несколько), а затем вы- выберем среди них коэффициент аг с наибольшим номером г. Аналогично выберем максимальный коэффициент bs с наибольшим номером s. 17. Высота многочлена и другие нормы 159 Ясно, что fg(x) = cn+mxn+m +... + cq, где ck = ? а;Ь,. Учитывая, i+j=k что I • I — неархимедово абсолютное значение, получаем \ск\ < max{|ai| • \bj\}. i+J=k Поэтому |с*| < \ar\ ¦ \bs\ при k>r + s, cr+3 = arbs{l + а), где |a| < 1, |cfc| < \ar\ ¦ \bs\ при k<r + s Для неархимедова абсолютного значения из условия |а| < 1 следует, что |1 + а| = 1. В самом деле, |l + a| < max{l, |ot|} = 1и 1 = |1 + а — а| < < max{|l + а|, |а|}, поэтому 1 < |1 + а|. Таким образом, |сг+я| = \аг\ ¦ \bs\, а абсолютные величины всех остальных коэффициентов с& не превосходят \аг\ ¦ \bs\. Поэтому H(fg) — = \cr+s\ = \ar\-\bs\=H(f)H(g). D Гаусс, разумеется, формулировал и доказывал свою лемму на бо- более простом языке. А именно, он доказывал, что наибольший общий делитель коэффициентов произведения многочленов f и g равен произ- произведению наибольшего общего делителя коэффициентов многочлена f и наибольшего общего делителя коэффициентов многочлена д. К такой формулировке можно перейти следующим образом. Для р-адического абсолютного значения Н(/) = р~г, где г — наибольшая степень числа р, на которую делятся коэффициенты многочлена /. Равенство H(fg) — = H(f)H{g) означает, что если в наибольшие общие делители многочле- многочленов /ид простое число р входит в степенях г и s соответственно, то в наибольший общий делитель коэффициентов многочлена fg оно входит в степени г + s. Для многочлена f(xi,...,xn) = J2aii—inx*i ' ¦ ¦ ¦ ' х'п от п пере- переменных высота определяется аналогично: H{f) = тах|а^...<„|. Для доказательства леммы Гаусса в случае многочленов от п перемен- переменных можно воспользоваться так называемой подстановкой Кронекера. Пусть d = deg/ + degg + 1. Сопоставим многочлену h(x\,...,xn) = = ?cfcifca;fcl " • • •"xk" многочлен {Sdh)(y) = h{y,yd, ..., ki+dk2+d2k3+-+dn- 1к„
160 Глава 4- Некоторые свойства многочленов Если deg h < d, то наборы ненулевых коэффициентов у многочленов h и Sdh одни и те же, поэтому H(h) = H(Sdh). Кроме того, Sd(fg) = — Sd{f)Sd{9)- Таким образом, лемма Гаусса для многочленов от п пере- переменных следует из леммы Гаусса для одной переменной. 17.2. Многочлены от одной переменной В случае архимедовых нормирований высота H(f) = max |aj| уже не будет обладать свойством H(fg) = H(f)H(g). Но как раз в случае обыч- обычного модуля (абсолютной величины) оценка высоты многочлена наибо- наиболее интересна. Такие оценки нужны для теории трансцендентных чисел. Оценки высоты многочлена были получены А. О. Гельфондом [Ге1] при решении седьмой проблемы Гильберта: «Если число а ф 0,1 алгебраи- алгебраическое, а число Ь иррациональное алгебраическое, то число ab трансцен- трансцендентное.» Впоследствии упрощенное доказательство оценок Гельфонда получил К. Малер [Ml], [M2]. Для оценки высоты многочлена f(x) = aj(x — <х\) ¦... ¦ (х — otj) Малер использовал величину 8=1 которую теперь называют мерой Малера многочлена /. Ясно, что M(fg) = M(f)M(g). Поэтому оценка сверху и снизу для M(f) че- через H(f) дает возможность получить оценку для H(fg) через H(f) и Н(д). Теорема 17.1. Пусть deg/ = d. Тогда -Ш? < ни) < 2d-4i{f). Доказательство. Начнем с более простого неравенства #(/) < < 2d-1M(f). Ясно, что Ы •|«»1«»2 •¦•••«»*!< Птах{1,|а»|} = М(/). г=1 Поэтому Ы < A) 17. Высота многочлена и другие нормы 161 Опираясь на формулу ( ^ ) = (^ _ ^) + (^), индукцией по d легко дока- доказать, что (.) < 2d~1 при d > 1. Вместе с формулой A) это доказывает требуемое неравенство. Доказательство неравенства М(/) < \/d + 1Н(/) опирается на фор- формулу Йенсена. Лемма (Формула Йенсена). Если функция f(z) голоморфна в круге \z\ < 1 и имеет внутри этого круга нули zi,...,zn (с учетом кратно- стей), то k=\ Доказательство. Рассмотрим вспомогательную функцию wi(z) ¦... ¦ где Wk{z) = —. Легко проверить, что w^ конформно отображает 1 — ZZk I 2 единичный круг в самого себя. В самом деле, если \z\ = 1, то |ги*;(г) = = 1; кроме того, Wk(zk) = 0. У функции /i нет нулей внутри единич- единичного круга, потому что нули z\,..., zn ее числителя f(z) сокращаются с нулями ее знаменателя w\(z) ¦... ¦ wn(z). Поэтому согласно теореме о среднем для гармонической функции 1п|/х(г) = Re(ln/i(z)) получаем 2п Но |/!(е*)| = \Яе*>)\,*Ы\М0)\ = 1п|/@)| - ? ln\zk\ k=i Следствие. Пусть / — многочлен. Тогда 1 = ехр f In\f(e2*u)\dt. B) 6- 1010
162 Глава 4- Некоторые свойства многочленов Доказательство. Обе части требуемого равенства мультиплика- мультипликативны относительно /. Поэтому достаточно рассмотреть случай f(x) = — х — а. При |а| > 1 у функции / нет нулей внутри единичного круга, а при |ot| < 1 внутри единичного круга у нее есть нуль а. Поэтому со- согласно формуле Йенсена 1 2п Jln\f(e2«it)\dt=±Jln\f(eiv)\d9 = = ln|/(O)|-eln|ct| = A-е)Ь|а|, где z = 0 при |а| > 1 и е = 1 при |а| < 1. С другой стороны, M(f) = max{l, |a|} = Jat|х е_ ? Вооружившись формулой B), можно приступить к доказательству неравенства M(f) < \/d + I H(f). Ясно, что аке" dt = Кроме того, из выпуклости функции ехр следует, что для любой функ- функции u(t) выполняется неравенство ехр / u(t)dt < / expu(t)dt. о о При u{t) = 21n|/(e2ltit)| получаем 1 \ V2 = | ехр / u(t) dt о expu(t)dt о 1/2 1/2 D С помощью теоремы 17.1 можно получить следующие оценки для H(fg) через Я(/) и Н(д). 17. Высота многочлена и другие нормы 163 Теорема 17.2. Пусть di = deg/ и d2 = deg#, причем di < d2. Тогда 1 H(f)H(g) < H{fg) < A + d{)H{f)H{g). Доказательство. Неравенство H(fg) < A + di)H(f)H(g) дока- доказывается непосредственно, без использования формулы Йенсена. Пусть f(x) = X>*z\ g(x) - J2bjXj, fg(x) - "?<ckXk. Тогда = \a*oh = A Для доказательства неравенства H(f)H(g) < 2d>+d*~Wdi + d2 - воспользуемся теоремой 17.1. Согласно этой теореме H(f)<2d*-1M(f), H(g)<2d*-1M(g) и y/d1+d2 Остается заметить, что M(f)M(g) = M{fg). < H(fg). ? С помощью меры Малера М(/) можно получить оценки и для длины d L(f) = Yl \ak\ многочлена /. В самом деле, с одной стороны, из нера- к=0 венства A) на с. 160 следует, что d d ft=O fc=0 = 2d 2dM(f). C) С другой стороны, Поэтому 1 M(f) <exp f\nL(f)dt = D) Комбинируя неравенства C) и D), получаем L(f)L(g) <
164 Глава 4- Некоторые свойства многочленов Оценка сверху для L(fg) имеет вид L(fg) < L(f)L(g). Это неравенство следует непосредственно из определения длины много- многочлена: М) (Е М) = Ц/д) < 17.3. Максимум модуля и неравенство Бернштеина Первоначально для оценки высоты многочлена Гельфонд использо- использовал величину max|/(z)|. Он доказал следующее утверждение. Теорема 17.3. Пусть di = deg/, d2 = degg и d = di + d2. Тогда max|/(z)| -тах|я(г)| < 22dmax|/5B)|. |z|—1 |2|—1 1*1=1 Доказательство. Можно считать, что max|/(z)| = | Предположим, что тах|/<7(.г)| < 2~2d. В таком случае при к = 0,1,... ,d одно из чисел |/(?*)| и \а(гк)\, где гк = ехр (;^у Ь не превосходит 2~d. Поэтому либо неравенство |/(?fc)| < 2~d выполняется при d\ + 1 значениях индекса А;, либо неравенство |<7(?*)| < 2~d выполняется при с?2 + 1 значениях индекса к. Пусть для определенности {?0, • • ¦, td} = {ot0,..., otdl} U {[Зх..., [3d2} | Согласно интерполяционной формуле Лагранжа 1=0 17. Высота многочлена и другие нормы 165 Умножим числитель и знаменатель 1-го слагаемого на (aj — |3i) • ... ... • (а/ — [3d2). В результате знаменатель станет равным lim = lim X-'ui X — Так как ot; — корень многочлена xd+l - 1, последнее выражение равно производной функции xd+1 — 1 в точке а;, т. е. оно равно (d + l)ad. В случае, когда \z\ = 1, полученный числитель состоит из d сомно- сомножителей, модуль каждого из которых не превосходит 2. Поэтому если Ы = 1, то <(<*!+ 1J -d 2d _ * d+1 d + 1 ' что противоречит предположению о том, что тах|/(г)| = 1. П Замечание. Для многочленов с коэффициентами из поля F = С или R более точные оценки вида ax|/i(z)| -...•max|/m(z)| < CF(m,n)m^\f(z)\, max где / = /i •... • fm, n — deg /, Cf(tti, n) — константа, получены в статье е [Во]. А именно, пусть /(9) = /lnBcos(?/2)) dt. Тогда о / / Сс("г,п) = f expf —1( — и Си(т,п) = СсB,п). Обе оценки точные. Для нормы II/H = тах|/(,г) выполняется также следующее неравен- |г|=1 ство. Теорема 17.4 (Бернштейн). Пусть deg/ = п. Тогда ||/'|| < п||/||. Доказательство [О]. Нам потребуется следующее вспомогатель- вспомогательное утверждение. Лемма. Пусть deg/ < п и zi,...,zn — корни многочлена zn + 1. Тогда
166 Глава 4- Некоторые свойства многочленов Доказательство. Положим gt(z) = —. Легко проверить, что gt(l) = tf'(t) и gt —многочлен от z степени не выше п — 1. Интер- Интерполяционная формула Лагранжа с узлами z\,... ,zn показывает, что 9t(z) = i k=l " к=\ -1 (мы воспользовались тем, что z% = — При z = 1 получаем / ч 2*к Jt=i Чтобы вычислить сумму J2 l—\\ ^.=1 (Zk — 1) = — tn, поэтому -IJ" 7, положим f(t) = tn. Тогда f(tzk) = ~м7' т. е. Е 2гк (Zk ~ If n "У A) ? Пусть \t\ = l. Тогда 2zk_ (Zk - IJ Покажем, что 2zk/(zk — IJ —вещественное отрицательное число. В са- самом деле, Zk = e'f ф 1, поэтому 2zjt 2eic() 2 1 (г* - IJ (eilf - IJ et!() - 2 + e* cos cp - 1 В таком случае из равенства A) следует, что 2zk 2zk _ п (zk - IJ ~ 2- П 7. Высота многочлена и другие нормы . 167 17.4. Многочлены от многих переменных Для многочлена F(x\,... ,хп) = ^а^..^,^^ •... • х*п от п перемен- переменных оценку высоты H(F) = тах|а*,...*п| тоже удобно производить с помощью меры Малера, как это сделано в [М2]. Меру Малера многочлена от одной переменной можно определить двумя эквивалентными способами: г=1 1 = exp/ln|/(e2"<)|di. Для многочленов от п переменных пригоден лишь второй из этих способов: M(F) = ехр / j ... / In \F(e2^,..., e2jlit") | dh ... J dtn. о V о / Напомним, что для многочленов от одной переменной на с. 160 было доказано неравенство С помощью этого неравенства можно доказать следующее неравенство для многочленов от п переменных: A) где d\,...,dn — степени многочлена F по переменным xi,...,xn. В са- самом деле, запишем многочлен F в виде F{x!,...,xn)= 53 Fkl(x2,...,xn)xk11. Для фиксированных х% — ot2, ..., хп — otn получим где g(x) = F(x,a-2,...,an)-
168 Глава 4- Некоторые свойства многочленов П. Высота многочлена и другие нормы 169 Положим х = e2ltltl, ot2 = е2м'2,..., а„ = е2™'", а затем возьмем ло- логарифмы обеих частей полученного равенства и проинтегрируем их по ti,..., tn от 0 до 1. После этого возьмем экспоненту. Непосредственно из определения видно, что в результате в правой части получим (, 1)M(F). Что же касается левой части, то интегрирование по t\ от 0 до 1 функции, не зависящей от t\, приводит к той же самой функции. А последующие интегрирования по t2,..., tn дают, как видно из определения, M(Fki). Итак, M(Fkl) < (k)M(F). Запишем теперь многочлен Fkl (х2,..., хп) в виде Fkl(x2,...,xn) = ^2 Fftlft2(x3,...,xn)x*2. *2=1 Аналогично доказывается, что и т.д. Ясно также, что M(akl...kn) = akl...kn. Как мы уже говорили, индукцией по d легко доказать, что (¦) < 2d~1 при d > 1. Поэтому из неравенства A) следует, что если dx > 0,..., dn > > 0, то H(F) < 2dl+d*+-+d»-nM(F). B) Если же многочлен F(x\,... ,х„) зависит в действительности лишь от \(F) переменных, а остальные п — \(F) переменных входят в него в нулевой степени, то вместо B) получаем более грубую оценку H(F) < C) Противоположная оценка для H(F) доказывается точно так же, как это делалось на с. 162 для многочленов от одной переменной. Эта оценка имеет вид M{F) < y/di + 1 ¦... ¦ y/dn + IH(F). D) Пусть Fl, ..., Fs —многочлены от переменных xi, ..., х„; dn, ..., din —степени многочлена F(l) по этим переменным; v(Fj) —коли- —количество переменных, от которых F; действительно зависит (т. е. количе- количество индексов j, для которых dtj > 0). Тогда согласно формуле C) Воспользовавшись теперь формулой D), получим H(Fi) •... • H(F.) < 2di+d2+-+d"-ns/d1 + l-... при этом имеется в виду, что \(F) = n, т. е. многочлен F действительно зависит от всех переменных xi,..., хп. Противоположная оценка H(F) < ...¦ H(FS) доказывается без использования меры Малера. Дело в том, что у мно- многочлена Fi количество ненулевых коэффициентов не превосходит A + dn) ¦... ¦ A + din) < 2d'1+di2+-+dl". Поэтому любой коэффициент многочлена F представляет собой сумму не более чем 2dl+d2+-+rfn произведений коэффициентов многочленов Fb...,F.. С помощью меры Малера можно получить и оценки для так называ- называемой длины многочлена Просуммировав неравенства A), получим L(F) < E) Для многочлена F(xi,... ,х„) — A + xi)dl ¦ ... ¦ A + xn)dn неравенство E) превращается в равенство. Противоположная оценка для L(F) получается просто: из очевидного неравенства ^(е271Й1,...,е211"")| <L(F) следует, что M(F) < L(F). F) Для многочлена F{x\,..., хп) = xdl ¦... ¦ xdn неравенство F) превраща- превращается в равенство. Из неравенства E) следует, что S JJ Bd»+d'2+-+d'»M(F,)) = 2dl+d*+-+d"M(F).
170 Глава 4- Некоторые свойства многочленов Учитывая неравенство F), получаем ВД) •... • L(F.) < Противоположная оценка ... ¦ Fa). очевидна. 17.5. Неравенство для пары взаимно простых многочленов Пусть /(ж) и д[х) взаимно простые многочлены над С. Тогда т(ж)=тах{|/(ж)|,|5(ж)|}>0 и т(х) -— оо при х -* оо. Поэтому величина E(f,g) = minm(x) положительна. В теории трансцендентных чисел бывают нужны оценки снизу для E(f,g). Способ, позволяющий получить точную оценку, пред- предложил Н. И. Фельдман. Мы изложим этот способ, следуя статье Малера [МЗ]. Теорема 17.5. Пусть oti,..., ат — корни многочлена /, [3i,... ,р„— корни многочлена д. Тогда E(f,g)> mm A) Доказательство. Фиксируем произвольное число ж е С и рассмо- рассмотрим а = min|x-ot_,| и[3 = min|x-j3j|. При этом а = |ж-а*| и [3 = |ж-C<| для некоторых к и /. Из взаимной простоты многочленов /яд следует, что одно из чисел а и р положительно. Можно считать, что а < р. Рассмотрим сначала случай, когда а > 0. Покажем, что в этом случае для любого i выполняется неравенство К-I - 2 B) П. Высота многочлена и другие нормы 171 В самом деле, если |схд; — р,| < 2а, то А если |а* - р*| > 2а = 2|ж - а*|, то |ж - Pi| = |(ж - а*) + (а* - р*)| > |ж - а*| + |а* - &| > "* 2 ' • Пусть р(ж) = 60(ж - Pi) ¦... ¦ (ж - р„). Из неравенства B) следует, что = 2-п\д(ак)\. г=1 В случае, когда а = 0, т.е. х = а*, неравенство \д{х)\ > 2 n|5(aft)| выполняется очевидным образом. Итак, если a < р, то \д(х)\ > 2~п|5(а*)|. Аналогично доказывается, что если a > р, то |/(ж)| > 2~Г"|/(Р;)|. Поэтому в любом случае п Замечание. Если /(ж) = (ж - 1)т и д(х) = (х + 1)", то неравенство A) превращается в равенство. Таким образом, оценка A) точная. 17.6. Неравенство Миньотта В этой главе мы уже много занимались неравенствами, позволяю- позволяющими оценить коэффициенты множителей данного многочлена. Оценку такого рода дает также следующая теорема, доказанная Миньоттом [Mi]. Теорема 17.6. Пусть /(ж) = а0 + а^х + ... + атхт и д(х) = bo + + b\x + ... + Ьпхп — многочлены с целочисленными коэффициентами. Тогда если / делится нацело на д, то N < ( п-\ где + ¦•¦+<¦
172 Глава 4- Некоторые свойства многочленов Доказательство. Рассмотрим наряду с многочленом /(ж) = о,т Y\(x - otj) и многочлен ?{х)=ат Д (x-ai) Д (flix-l). Докажем сначала, что ||/(х)|| = ||/(ж)||, где ||/(ж)||—корень из суммы квадратов модулей коэффициентов многочлена f(x). Для этого достаточно доказать следующее утверждение. Лемма 17.1. Пусть h(x) — со + с\х + ... + ckxk, hi(x) = (х - a)h(x) и h2(x) = (ах - l)h(x). Тогда \\h\\ = ||А3||. Доказательство. Ясно, что - 2Re(acicTT)) = П У многочлена / коэффициент при старшем члене хт равен ат \\ щ, \<н\<1 а коэффициент при младшем члене равен ±ат \\ ctj (произведение, в которое не входит ни одного множителя, считается равным 1). Положим = д ««. = П **¦ j oti | < 1 Тогда ||/(х)||2 = ||/(х)||2 > |ат|2 (М(/J + т(/J). Следовательно, M(f) < ||/(x)||/|am|. A) Кроме того, где [3i = max{l, |ot,|}. Ясно, что ПРг = Af (/). Теперь нам потребуется еще одно вспомогательное утверждение. I П. Высота многочлена и другие нормы 173 Лемма 17.2. Пусть х\ > 1,..., хт > 1 и хх ¦... ¦ хт = М. Тогда <{)M+( ) Е Доказательство. Можно считать, что х\ < х2 < ... < хт. За- Заменим пару {xm-i,xm} на {1, arm_ixm}. При этом рассматриваемая сумма увеличится на a(arm_i — l)(xm — 1), где о — сумма произведе- произведений ж,! • ... • xik_l, I < i\ < ... < ik-i < т — 2. Таким образом, если хго_1 > 1, то рассматриваемая сумма строго увеличивается. Поэтому она будет минимальна в том случае, когда х\ = ... = xm_i = 1, хт = — М. В этом случае сумма состоит из (/.-l) членов! равных М, и ( , ) членов, равных 1. ? Применив лемму 17.2 к набору [3i,..., [Зго, получим ТП — 1 ( ) /ТП — 1\ ( ) /ТП - \\ т, / ТП — 1 \ /ТП — 1\ /ТП — 1\ /ТП — i\ Если теперь учесть, что (т _ ¦ _ г) = ( . ) и (т _ .) = ( . _ х ), то неравенство B) можно будет записать в виде Аналогично доказывается, что bil < |Ь„| (("J + О) Все корни многочлена g являются корнями многочлена /, поэтому M{g) < M(f). Кроме того, |6„| < \ат\, так как по условию многочлен д делит многочлен /. Учитывая эти неравенства и неравенство A), нера- неравенство C) можно привести к требуемому виду \bj\ < ( п-1 D Следствие. Если /, # и f/g — многочлены с целыми коэффициен- коэффициентами, то 1Ы1BПI/2Ц/И где n =
174 Глава 4- Некоторые свойства многочленов поэтому Доказательство. Ясно, что \ап\ < N^fjVG-i1)) п п 2 Следовательно, \\д\|2 < Y1 (•) ||/||2-Остается проверить комбинаторное j=o J тождество Y1 ( ) = ( )• Для этого достаточно сравнить коэффици- j=o •> енты при tn в обеих частях равенства A + t)n(l + t)n = A + tJn. ? 18. Уравнения для многочленов 18.1. Диофантовы уравнения для многочленов 18.1.1. Теорема Мэйсона в ее следствия При доказательстве неразрешимости многих диофантовых урав- уравнений для многочленов весьма эффективным оказывается следующее утверждение. Теорема 18.1 (Mason). Пусть а{х), Ь{х) и с(х) — попарно взаимно простые многочлены, связанные соотношением а + Ь + с = 0. Тогда сте- степень каждого из этих многочленов не превосходит по(абс) — 1, где щ — количество различных корней многочлена. Доказательство [La]. Положим / = а/с и д = Ь/с. Тогда / и д — рациональные функции, связанные соотношением / 4- д + 1 = 0. Продифференцировав это равенство, получим /' = —д'. Поэтому Ь _ 9 _ f'/f а 7 f 9'/9 ' Рациональные функции / и д имеют специальный вид Ylix ~ P«)rS г; ё Z. Для функции R(x) = Y\(x — pi)Ti выполняется равенство Ё. R '' Пусть а(х) = П(* - oti)aS Цх) = П(х - Р,-N', с(х) = П(* - Y*)Cfc- 18. Уравненная для многочленов 175 Тогда Поэтому после умножения на многочлен степени no(abc) рациональные функции /'// и 9'/я становятся многочле- многочленами степени не выше no(abc) — 1. Таким образом, из взаимной простоты многочленов а(х) и Ь(х) и из равенства Ь = Npf/f a Nog/g' следует, что степень каждого из многочленов а(х) и Ь(х) не превосходит По(аЬс) — 1. Для многочлена с(х) доказательство аналогично. ? Из теоремы 18.1 можно извлечь интересные следствия, которые мы сформулируем как теоремы 18.2-18.4. Теорема 18.2 (Дэвенпорт). Пусть / и д — взаимно простые много- многочлены ненулевой степени. Тогда deg(/3-52)> ideg/ + l. Доказательство. Если deg/3 Ф degg2, то deg(/3 - g2) > deg/3 = 3deg/ > \degf + 1. Поэтому можно считать, что deg/3 = degg2 = 6fc. Рассмотрим многочлены F = f3,G = g2 Ясно, что degH < 6k. Согласно теореме 18.1 = g2viH = max{degF,degG,deg#} < no(FGH) - 1 < deg/ т. e. 6A:<2A: + 3A;-l-deg#-l. Таким образом, deg H > k + 1 = - deg / + 1. = f3— g2 degH ?
176 Глава 4- Некоторые свойства многочленов Замечание. Для многочленов /W='2 + 2, g(t) -tZ +3t неравенство Дэвенпорта обращается в равенство. ТЕОРЕМА 18.3. Пусть f,gn h — взаимно простые многочлены, при- причем хотя бы один из них — не константа. Тогда равенство не может выполняться при п > 3. Доказательство. Согласно теореме 18.1 степень каждого из мно- многочленов /", дп и hn не превосходит deg/ + degg + degh- 1. Сложив эти три неравенства, получим n(deg/ + deg# + deg) < 3(deg/ + degg + degh - 1) - 1. Следовательно,п < 3. ? Диофантово уравнение fa + д$ = W для многочленов /, д, h имеет очевидное решение, если одно из чисел сс,[3,у равно 1. Поэтому будем считать, что ot, C, у > 2. Теорема 18.4. Пусть at,р, у — натуральные числа, причем 2 < at < < |3 < у. Тогда уравнение имеет взаимно простые решения лишь для следующих наборов (а,[3,у): B,2,у), B,3,3), B,3,4) и B,3,5). Доказательство. Пусть a, 6 и с — степени многочленов /, д и h. Тогда согласно теореме 18.1 ota<a ус<а A) B) C) 18. Уравнения для многочленов 177 Следовательно, ot(a + Ь + с) < ota + [36 + ус < 3(a + b + с) - 3, а значит, ot < 3. По условию ot > 2, поэтому ot = 2. При a = 2 неравен- неравенство A) принимает вид а<Ь + с-1. D) Сложив неравенства D), B) и C), получим fib + ус < 3(Ь + с) + а - 3. Учитывая, что [3 < у, и еще раз применяя неравенство D), получаем Р(Ъ + с) < 4F + с) - 4, а значит, [3 < 4, т. е. [3 = 2 или 3. Остается доказать, что если [3 = 3, то у < 5. При C = 3 неравен- неравенство B) принимает вид 2Ь<а + с-1. E) Сложив неравенства D) и E), получим 6 < 2с - 2. В таком случае из неравенства D) следует, что а < Зс - 3. Из двух последних неравенств и неравенства C) следует, что ус < 6с — 6, поэтому у < 5. Многочлены, удовлетворяющие соотношению fa + gP = М, тесно свя- связаны с правильными многогранниками. Подробно эта связь описана в книге Феликса Клейна [Кл]; там же указан способ построения этих мно- многочленов. Мы приведем лишь конечный результат. Случай ot = [3 = 2,y = n связан с вырожденным правильным много- многогранником — плоским n-угольником. Требуемое соотношение имеет вид
178 Глава 4- Некоторые свойства многочленов Случай а = 2, [3 = 3, у = 3 связан с правильным тетраэдром. Соот- Соотношение имеет вид 12iV3(x5 - хJ + (х4 - 2iV3x2 + IK = (х4 + 2iV3x2 + IK. Случай а = 2, [3 = 3, у = 4 связан с кубом и правильным октаэдром. Соотношение имеет вид (х12 - ЗЗх8 - ЗЗх4 + IJ + Ю8(х5 - хL = (х8 + 14х4 + IK. Случай ot = 2, [3 = 3, у = 5 связан с додекаэдром и икосаэдром. Соотношение имеет вид Т2 + h3 — 1728/5, где Т = х30 + 1 + 522(х25 - х5) - 10005(х20 + х10), Я = -(х20 + 1) + 228(х15 - х5) - 494х10, / = x(xlo + llx5-l). П Теорему 18.4 доказал Г. Шварц [Shw]. Решение диофантова уравне- уравнения более общего вида fa + g^ = №*№ приведено в работе [Ev]. Теорема 18.5 [N]. Пусть x(t), y(t)— рациональные функции и тп, п>2. Тогда уравнение х" - у™ = 1 имеет решение лишь при m = п = 2. Доказательство. Представим х и у в виде х = f/g и у = h/k, где / и д — взаимно простые многочлены и h и к тоже взаимно простые многочлены. Тогда рассматриваемое уравнение запишется в виде fmkn-hngm = F) Из взаимной простоты многочленов / и д следует, что если д(<х) — 0, то /(ot) = 0. В таком случае из соотношения F) следует, что к(а) = 0. Аналогично, если fc(ot) = 0, то д(а) = 0. Поэтому g(t) = П(^ ~ a«)ai и k(t) = П(< - «<)*', где щ, bi > 1. Кратность оц как корня многочленов fmkn, hngm и дткп равна nbi, mat и nbi + тсч, соответственно. Если nbi ф mat, то кратность корня а, многочлена fmkn - hngm строго меньше nbi + тщ. Поэтому nbi = mat, т. е. кп — дт. 18. Уравнения для многочленов 179 Уравнение F) после сокращения на к" = дт принимает вид fm-hn=gm. Согласно теореме 18.4 возможны лишь два варианта: т = п = 2 и {т, п} = {2, 3}. Но во втором случае кп = дт = Iе, где / — некоторый многочлен, а уравнение /3 — h2 = l6 решений не имеет. ? 18.1.2. Проблема Варинга для многочленов Классическая проблема Варинга заключается в том, чтобы для дан- данного натурального числа п найти минимальное число к = к(п), для ко- которого любое натуральное число т можно представить в виде т = = т" + ... + т?, где mi,..., гтц — целые неотрицательные числа. Из- Известно много разных обобщений этой проблемы для многочленов. Мы будем подразумевать под проблемой Варинга для многочленов следу- следующую задачу: для данного натурального числа п найти минимальное число к = к(п), для которого любой многочлен g e С[х] можно предста- представить в виде 5 = /Г + • • • + fk, где U е С[х]. При решении проблемы Варинга достаточно ограничиться случаем д(х) = х. Действительно, если х = /™(х) + ... + /?(х) и h(x) — произ- произвольный многочлен, то h(x) = f"(h(x)) + ... + f%(h{x)). Тождество т) — (х ~ I) = х показывает, что кB) — 2. Теорема 18.6 [NM]. Если п > 3, то: а) к(п) > 3; б) к{п) < п < <к2{п)-к(п). Доказательство, а) Предположим, что х = /"(я) + /2"(а;) = п = Y[ (/i + ?г/г); где е — примитивный корень степени п из единицы. г=1 Все множители Д + ?г/2, кроме одного, являются константами. При п > 3 таких множителей по крайней мере два. Поэтому Д + а/2 = а и Д + bJ2 = [3, где а ф b и о, Ь, а, [3 е С. Следовательно, Д, /2 е С, чего не может быть. б) Для многочлена /(х) положим Af(x) = f{x + 1) - f(x) и /V/ = = Д(/У)~1/) ПРИ Р > 2. Легко проверить, что deg(A/) = deg/ - 1. Поэтому degA"^") = 1, т.е. Д"(х") = ах + Ь. С другой стороны, непосредственно из определения видно, что
180 Глава 4- Некоторые свойства многочленов В самом деле, например, Сделав замену х\ = ах + Ь, получим представление х\ — /™(xi) + ... ... + fn(xi); это представление показывает, что к(п) < п. Займемся теперь доказательством неравенства п < к2(п) — к(п). Рас- Рассмотрим представление х = f"(x) + ... + /?(ж), /г- е С[х], для которого число к минимально. Напомним, что вронскиан W(gi,... ,дк) функций gi(x),... ,дк(х) ра- / 9\(х) ... дк(х) \ вен определителю матрицы . Рассмотрим два вронскиана Wi = W(f?, f?,..., Д") и W2 = W(x, /2n,..., Д"). По условию х = f" + ... + fg, поэтому первый столбец вронскиана Wi получается из первого столбца вронскиана W\ добавлением линейной комбинации других столбцов W\. Следовательно, W\ = W-i- Если функции gi,g2,- ¦¦ ,дк линейно зависимы, то их вронскиан WEi>--->5*) тождественно равен нулю. Обратное утверждение не- неверно. Например, если д\{х) = ж2, а д2(х) = х\х\, то xz х\х 2х 2\х\ = 0, но функции д\ и ^2 линейно независимы. Можно доказать, что если вронскиан W{g\,... ,gk) тождественно равен нулю при х е (а, Ь), то существует интервал (а, [3) с (а, 6), на котором функции gi,-.. ,дк ли- линейно зависимы (простое доказательство этого утверждения приведено в [Kru]). В частности, для полиномиальных функций gi,- ¦ ¦ ,дк из того, что вронскиан W(g\,... ,дь) тождественно равен нулю, следует, что эти функции линейно зависимы. Из минимальности представления х = /"(х) + .. - + /?(х) следует, что функции /™,..., /? линейно независимы, поэтому W(f", f?, ¦ ¦ ¦, /?) — ненулевой многочлен. Производная порядка г функции /" делится на /™~г, поэто- поэтому г-й столбец вронскиана делится на fk+1 ™~k+1 а значит, многочлен w(fx, ¦¦¦, Ю делится на П f?~k+1- В частности, deg W(f?,..., Д") > (n - к + 1) J2 deg U A) t=i 18. Уравнения для многочленов 181 С другой стороны, B) j=2 Чтобы доказать это, напомним, что W(f", ..-,/*) = W(x, /2",..., /?). Если мы домножим j-ю строку определителя W(x, /",... ,/?) на а^', то в результате получим определитель матрицы, у которой все ненуле- ненулевые элементы г-го столбца (при i > 2) имеет степень ndeg/j. Поэтому г=2 Сравнивая A) и B), получаем к к (п-к- к I i=2 - 1) deg Л- \ +1. г=1 г=2 т. е. < (Л - Можно считать, что /i — многочлен наибольшей степени. Тогда ndegA < к(к - l)deg/i - ^^ + К *(* - l)deg/i; последнее неравенство следует из того, что 1 - к(к - 1)/2 < 0 при А; > 3. После сокращения на deg/i получаем п < к(к - 1). ? 18.2. Функциональные уравнения для многочленов 18.2.1. Функциональные уравнения, задающие многочлены Для многочлена / степени п + 1 выполняется равенство f № = Ну) + (х- y)f'(x) +... + (х - y)n+l ^г
182 Глава 4- Некоторые свойства многочленов При этом константа, а значит, (g y]n+if{n+1)(y) Таким образом, у функционального уравнения f(x) = 53(x - y)kgk(y)+{x - y)nh(x) A) k=o есть решение следующего вида: (а) / — многочлен степени не выше п + 1; (б) дк{у) = /<*%)/*! при к = 0,1,... ,п - 1; (в) 5пЫ = /(п)ЫЛ*! - 2//(п+1)Ы/(" + 1)! - с; (г) h(x) = z/<"+1>(x)/(n + 1)! + с. Теорема 18.7 [СК]. Пусть f,go,-.-,gn,h ¦ ж -* ж — произвольные функции, которые при всех х, у е Е, % ф У, удовлетворяют уравнению A). Тогда эти функции имеют указанный выше вид (а)-(г). Доказательство. При у = 0 и у = 1 уравнение A) принимает вид к=0 хфО, (x), хф\. B) C) Следовательно, Это равенство выполняется при х ф 0,1. а при п четном нужно еще исключить и х = 1/2. Фиксировав у = 2 и у = 4, аналогичным образом получим равенство h(x) = (я;-2)"-(я:-4)"' которое выполняется при х ф 2,3,4. S. Уравнения для многочленов 183 В итоге получаем h e С°°(Е), но тогда из B) и C) следует, что / е C°°(R). Продифференцировав п раз по х равенство A), получим /<">(*) = п!5„Ы + ^{(х -y)nh(x)). При фиксированном х из этого равенства следует, что дп(у) — полином. Теперь можно продифференцировать равенство A) по х не п, а п — 1 раз, и аналогичным образом получить, что gn-i{y) —полином и т. д. В частности, до,...,дпеС°°(Ш). Продифференцируем равенство A) по у и положим у = 0. В резуль- результате получим 0 = - Из этого равенства следует, что хп 1h(x) — полином степени не выше п. А если равенство A) продифференцировать п раз по у и положить у = = 0, то можно показать, что h(x) —полином (тоже степени не выше п). Но если h(x)—полином, a xn~1h(x)—полином степени не выше п, то h(x) = ах + Ь. Так как h{x) = ах + Ь и / е С°°(М), то из B) следует, что f(x) — полином степени не выше п + 1. Поэтому С другой стороны, заменив х на х + у, соотношение A) можно записать в виде /(ж + у) = хп(ах + ау + Ъ). к=о Это означает, что 5*(y) = :LlfcP При * = 0,1,..-."-I, /(п = а. ?
184 Глава 4- Некоторые свойства многочленов Следствие 1. Пусть / е Сп( полняется равенство и при всех ж, у х ф у, вы- ix - y)n (n + 1)! Тогда / — полином степени не выше п. Следствие 2 [Н]. Если при всех ж,у е К, х ф у, выполняется равенство fix) - gjy) _ fjx) + у(у) х-у 2 то / — полином степени не выше 2, g = / и ф = /'. D) К функциональному уравнению D) сводится также функциональное уравнение fix)-giy) __ х-у 1г\ Дело в том, что если равенство E) выполняется при всех х,у е R, ж ф у, то _ ф(ж) + ф(у) 2 Ф Чтобы доказать это, заменим в E) х на х + у, а у на а; - у. В результате получим /(s + y)-g(*-y) = ф) при всех i,t/el, У ф 0. Заменив теперь у на —у, получим fix - у) - gix + у) ,_ч -2» Следовательно, <р(и + и) = — (/(и + и + у) - я(и + и - у)), ф(и - v) = ^ (/(и - и + т/) - д(и - v - у)) 18. Уравнения для многочленов 185 /(и + v + у) - giu -v-y)- 2(v + у)(?(и), f{u-v + y)-giu + v-y) = -2{v - Поэтому ф(и + и) + ф(и - v) = 2ф(и). Положив и + и = ж, и -v — у, получим требуемое равенство ф(ж) = ф(у) = 2Ф (^±^j . 18.2.2. Полиномиальные решения уравнения /(сеж + Р) = /(ж) При а = ±1 полиномиальные решения уравнения /(ах + [3) = /(х) находятся легко. Если а = 1 и /(ж) = аож™ + а\хп~1 +... + ап, где по ф О, то получаем тождество fix) = аохп ... + о„ = ао(ж + [3)n Такое тождество возможно лишь в том случае, когда а\ = а\ + т.е. р = 0. Если а = —1, то уравнение /(—ж + [3) = /(ж) после замены #(ж) = = /(ж + C/2) сводится к уравнению gix) = g(—ж), решениями которого служат полиномы вида + + ... + а2п- При произвольном а сравнение коэффициентов при старшем члене многочлена /(ж) = аож" + ... показывает, что а" = 1. Таким образом, при а Ф ±1 получаем п > 3. Теорема 18.8 [Oz]. Пусть многочлен / степени п > 3 удовлетворяет соотношению /(аж + [3) = fix), где а ^ ±1 и я" = 1. Тогда +с Доказательство. Достаточно рассмотреть многочлены вида fix) = ж" + ахж" + ... + а„. Требуется доказать, что aj = (") ^ ¦ при j = 1,.. .,п — 1. Доказательство проведем индукцией по j.
186 Глава 4- Некоторые свойства многочленов Сравнение коэффициентов при хп J для многочленов f(x) и /(otx+[3) показывает, что A) 8=0 При,?' = 1 получаем A —а™)^ = (^а™^. По условию а™ = 1, поэтому ,п\ а-13 /П\ 3 «i = (i)r^r = (i)^ri- База индукции доказана. Для доказательства шага индукции (т. е. перехода от j = к к j = k + + 1) мы снова воспользуемся соотношением A) и условием а™ = 1. По OS предположению индукции as = (") , _ ,3 при s =1,...,к. Поэтому * „n-k+lnk+l П\ / П-S \ « Р s=l (а - 1Y Легко проверить, что Q (д. " 11 в) = (* " i) ( s ) • Поэтому Ясно также, что выражение в квадратных скобках равно a-l Следовательно, „n—fc—1 Учитывая, что а" = 1, получаем -( « V_..P* П Преобразования многочленов 187 19. Преобразования многочленов 19.1. Преобразование Чирнгауза В 1683 г. в лейпцигском журнале «Acta eruditorum» Э.В. фон Чирн- гауз A651-1708) опубликовал способ преобразования алгебраических уравнений, который, как ему казалось, позволял решить в радикалах уравнение любой степени. Лейбниц сразу же опроверг заявление Чирн- Чирнгауза о всемогуществе его преобразования. Дело в том, что при решении уравнений 5-й степени с помощью преобразования Чирнгауза прихо- приходится решать уравнение 24-й степени. Несмотря на это, преобразование Чирнгауза имеет важные приложения. Например, с его помощью любое уравнение пятой степени без кратных корней можно привести к виду 2/5 + Ьу = а, решая при этом лишь уравнения второй и третьей степени. Преобразование Чирнгауза уравнения хп + cixn~l + ... + сп = 0 заключается в следующем. Пусть х\,...,хп—корни этого уравнения. Рассмотрим рациональную функцию ф, которая не обращается в беско- бесконечность в точках х\,... ,хп. Положим j/j = ф(хг) и найдем уравнение Уп + + ¦ ¦ ¦ + Qn = 0 корнями которого являются 2/i,... ,уп. Далее мы покажем, что если это уравнение не имеет кратных корней, то Xi можно выразить через yj- Выбирая подходящим образом функцию ф, можно добиться того, чтобы коэффициенты q\,..., qn-\ стали равны нулю. Но для этого потребуется решить уравнение степени (п— 1)!; именно на это обстоятельство указал Лейбниц. Не теряя общности, в качестве рациональной функции ф можно взять многочлен степени не более п— 1. Дело в том, что справедливо следующее утверждение. Теорема 19.1. Пусть xi,... ,хп — корни многочлена / степени п и ф = P/Q, где Р и Q — многочлены, причем Q(xi) Ф 0, i = 1,..., п. Тогда существует многочлен д степени не более п — 1, значения которого в точках х\,..., хп совпадают со значениями функции ф в этих точках. Доказательство. По условию многочлены / и Q не имеют общих корней, поэтому они взаимно просты. Следовательно, существуют мно- многочлены а и Ь, для которых af + bQ = 1. Так как /(ж») = 0, то b(xi) = = 1/Q(xi). Поэтому <р(ж») = P(xi)/Q(xi) = P(xi)b(xi) Таким образом, в качестве требуемого многочлена д можно взять остаток от деления многочлена РЬ на многочлен /. ?
188 Глава 4- Некоторые свойства многочленов В дальнейшем будем считать, что к уравнению применяется преобразование У - д(х) = Ро Покажем, как в этом случае можно вычислить коэффициенты много- многочлена уп 4- 9i2/™~1 + • ¦ • + Qn с корнями j/, = g(xi), i — 1,..., п. Чтобы избежать громоздких обозначений, ограничимся случаем п = = 3. Если х3 — —с\х2 — с2х — сз, то +P2(~cix2 ~с2х-с3) = р'о + р\х + р'2х2. Аналогично ух2 = р'д+р"х+р'2'х2, причем р" —линейные функции пара- параметров pi. Таким образом, если а;, — корень многочлена / и у, = g(xi), то система уравнений - у) 2о + Pi zi + p%z = О, (p[ -y)zi + p'2z=0, A) имеет ненулевое решение B0,2:1,22) ~ (l'x«i •*-?)• Положим P0 Pl P2 Po P'i Pa P'i P'l P'i Тогда det (A — у I) = 0 для yi = g{xi). В том случае, когда многочлен det (А —уI) не имеет кратных корней, он совпадает с искомым многочле- многочленом уп +qiyn~1 +... + qn¦ Так как элементы матрицы А линейно зависят от параметров pi, то коэффициент % является многочленом степени к от параметров р*. В том случае, когда многочлен yn + qiyn~1 + ¦ ¦ -+qn не имеет кратных корней, матрица А не имеет кратных собственных значений. Поэтому каждому собственному значению матрицы А соответствует единствен- единственное с точностью до пропорциональности решение системы A). Это озна- означает, что по корню у, преобразованного многочлена однозначно восста- восстанавливается корень xt исходного многочлена, причем ж* рационально выражается через у г. 19. Преобразования многочленов 189 Преобразование Чирнгауза позволяет решить в радикалах уравне- уравнения третьей и четвертой степени. Кубическое уравнение можно приве- привести к виду У3 + Яз = О, решив систему из линейного уравнения <7i = 0 и уравнения второй сте- степени ^2 — 0, зависящих от параметров poi Pi, Р2- Для этого нужно ре- решить квадратное уравнение. Уравнение четвертой степени можно привести к виду У4 + Q2V2 + 94 = 0. Для этого нужно решить систему из линейного уравнения qi = 0 и урав- уравнения третьей степени ?з = 0, что сводится к решению кубического уравнения. 19.2. Уравнение пятой степени в форме Бринга Уравнение пятой степени можно привести к виду У5 + 942/ + Чь = 0, решив систему уравнений 9i = 92 = 9з = 0. Для этого нужно решить уравнение шестой степени. Более тонкий анализ, проведенный в 1789 г. шведским математиком Брингом, показывает, что в данном случае вме- вместо уравнения шестой степени достаточно решить уравнения второй и третьей степени, поступив следующим образом. Чтобы удовлетворить условию 9i = 0, выразим один из параметров Ро,- ¦ ¦ ,Ра как линейную функцию остальных параметров. Тогда коэффициент q2 будет пред- представлять собой квадратичную форму относительно четырех из пара- параметров Pi. Эту квадратичную форму можно привести к виду где Uj и Vj—линейные функции от р, (для этого понадобится извле- извлекать квадратные корни). Чтобы удовлетворить равенству 92 = 0, до- достаточно решить систему линейных уравнений и\ = v\, u2 = v2. После этого остается два параметра, причем относительно них уравнение 9з представляет уравнение третьей степени. В итоге получаем уравнение вида J/5 + 942/ + 75 =0. В том случае, когда 94 ф 0, с помощью линейной замены это уравнение можно привести к виду уь + Ъу = а.
190 Глава 4- Некоторые свойства многочленов Аналогичным образом уравнение с1х п~1 с„ = 0, п>5, с помощью преобразования у — ра + р\х + р2х2 + рзх3 + привести к виду A) можно При этом понадобится решать лишь уравнения второй и третьей сте- степени. Кроме того, вместо системы уравнений q\ = q2 = qz = 0 можно решить систему q\ = q2 = </4 = 0, т. е. на последнем шаге вместо куби- кубического уравнения <7з = 0 решить уравнение четвертой степени q^ = 0. Тогда уравнение A) будет приведено к виду Используя такие преобразования и замену х *-* ж, уравнение пятой степени можно привести к любому из следующих видов: х5 +рх + q = О, х5 + рх2 + q = 0, х5 + рх3 + q = 0, х5 + рх4 + q = 0. 19.3. Представление многочленов в виде сумм степеней линейных функций Задача о представлении многочлена в виде суммы степеней линейных функций наиболее проста в случае квадратного трехчлена х2 + 2ах + Ь. Эта задача такова: квадратный трехчлен требуется представить в виде Xi(x + ctiJ + ... + Xm(a; + ягоJ; при этом нужно также выяснить каким минимальным количеством базисных линейных функций х + oti,..., х + + ат можно обойтись. Есть два варианта этой задачи: 1) базисные функции одни и те же для всех квадратных трехчленов; 2) базисные функции для каждого квадратного трехчлена выбира- выбираются свои. В первом случае минимальное т равно 3. В качестве базисных функ- функций можно взять любые три различные функции х + аь х + а2, х + аз- Действительно, система уравнений для Х^ХэДз имеет вид Xi+X2+X3 = l, otiXi + a2X2 + а3Х3 =. а, a2Xi + а2Х2 + адХз = Ь. 19. Преобразования многочленов 191 Она всегда имеет решение, так как ее определителем служит ненулевой определитель Вандермонда. Ясно также, что двумя функциями х + oti и х + ot2 нельзя обойтись: Х3 = 0 лишь в том случае, когда a, b, oti и ot2 связаны соотношением a(oti + 012) = 6 + otia2. Во втором случае минимальное т равно 2. Требуемое представление имеет, например, вид 2ах 1 / — - 1х а+ а - Для многочленов степени п задача о выборе универсальных базисных функций х + ati, • • ¦ ,х + otm решается точно так же, как и при п = 2. Сформулируем ответ в виде теоремы (ее доказательство при п > 2 такое же, как и при п — 2). Теорема 19.2. а) Если oti,... ,otn+i — попарно различные числа, то любой многочлен степени п можно представить в виде б) Если числа oti,..., ат таковы, что любой многочлен степени п можно представить в виде Xi(x + otiJ + • • • + Xm(x + otmJ, то т > n + 1. Набор универсальных базисных линейных форм несложно указать и для многочленов степени потга переменных. Для удобства вместо многочлена f(x\,-.., хт) степени п будем рассматривать однородный многочлен Теорема 19.3 [Ss]. Пусть ao,...,an — попарно различные числа, Zj = х0 + otsxi +ot(x2 + ... + <хихт, где ots,ott,... ,а„ е {яо,...,я„}. То- Тогда формы (Zj)n порождают линейное пространство всех однородных многочленов степени п от т + 1 переменных. Замечание. Количество форм {Zj)n равно (n+ l)m, а размерность пространства однородных многочленов степени п от т + 1 переменных (ГП + П\ равна { п )¦
192 Глава 4- Некоторые свойства многочленов Доказательство. Рассмотрим для простоты случай т — 2. В этом случае многочлен p(x,y,z) = требуется представить в виде 71+1 p(x,y,z) = s,t-l n+l s,t=l где cnij = n\ трут_¦ _ -у . Получаем систему уравнений n+l tj = c nij я,<=1 Дополним эту систему уравнениями п+1 a»at = 0 при г + j > n, 1 < i, j < n. s,t=l В результате получим систему линейных уравнений с матрицей V <g> V, где V = ||с^||о — матрица Вандермонда. Для произвольных матриц А и В с помощью приведения их к жордановой нормальной форме легко до- доказывается, что det(^ <8>.В) = (det A)b(detB)a, где а — размер матрицы А, Ь — размер матрицы В. Поэтому det(F <g> V) = (det F)<n+1J ф 0. Для произвольного т аналогично получаем систему линейных урав- уравнений с определителем det(F <g>... ® V) = (det F)<n+1)m. ? В том случае, когда для каждого многочлена выбираются свои ба- базисные линейные функции, задача существенно усложняется. Добавле- Добавление слагаемого bk(x + Pk)n увеличивает число варьируемых параметров на 2. Точное совпадении числа параметров, которыми задается мно- многочлен степени п, и числа параметров в выражении b\(x + [3i)n + ... • ¦ • + bk(x + ftk)n возможно лишь в том случае, когда п нечетно. При этом к = (п + 1)/2. Оказывается, что в случае общего положения мно- многочлен нечетной степени п действительно можно представить в виде суммы (п+1)/2 слагаемых вида 6(х+[3)п. Но в некоторых вырожденных случаях могут оказаться необходимыми и дополнительные слагаемые. 19. Преобразования многочленов 193 Пример. Многочлен х3 +х2 нельзя представить в виде Доказательство. Ясно, что |3i ф |32 и pip2 ф 0. В таком случае из условий biP? + 62pl = 0 и 6ipf + 62[32 = 0 следует, что 61=62 = 0. Приходим к противоречию. ? Уточним теперь, что в рассматриваемой ситуации означает «мно- «многочлен общего положения». Ограничимся при этом случаем п = 5 (для остальных нечетных п рассуждения аналогичны). Запишем многочлен f(x) степени 5 в виде х5 + 5а4х4 + Юазх3 + 10а2х2 а5х5 а0. + p2z2 =p(z). Пусть 1 Z Z3 Z3 ао ai о,2 аз а\ о,2 аз о,4 02 аз 0,4 ав Будем говорить, что f(x) — многочлен общего положения, если p{z) — многочлен, имеющий ровно 3 различных корня (в частности, рз Ф 0). Теорема 19.4 (Сильвестр). Многочлен общего положения нечетной степени п можно представить в виде суммы где к = (п + 1)/2. Доказательство. В случае п = 5 требуется решить систему урав- уравнений K + biK + = «г A) г = 0,1,... ,5. Выберем в качестве Pi,C2 и р3 корни уравнения p(z) = 0. По условию эти три числа различны, поэтому из системы уравнений A) для г = 0,1,2 однозначно находятся 6i,62 и 6з- Остается доказать, что для полученных значений bi и j3j выполняются уравнения A) при г = 3,4,5. Из определения многочлена p(z) следует, что для любых чисел , х\, выполняется равенство ао а\ 02 аз 01 02 03 0,4 0,2 0,3 04 15 + Р2Х1 7 - 1010
194 Глава 4- Некоторые свойства многочленов + Р2Й2 +P1U1 = 0, Т. е. = РО ]Г] bt + фг + Р2 Учитывая, что рз 7^ 0, получаем соотношение A) для г = 3. Беря г = 1 и 2, аналогично получаем соотношения A) для г = 4 и 5. ? 20. Алгебраические числа 20.1. Определение и основные свойства Число а е С называют алгебраическим, если оно является корнем не- неприводимого многочлена с рациональными коэффициентами. Если стар- старший коэффициент равен 1, а все остальные коэффициенты — целые чи- числа, то число ot называют целым алгебраическим. Каждому алгебраиче- алгебраическому числу ot соответствует единственный неприводимый многочлен / со старшим коэффициентом 1. Корни этого многочлена называют чис- числами, сопряженными с ot. Назовем многочлен унитарным, если его старший коэффициент ра- равен 1. Несложно показать, что если ot — корень произвольного (т.е. не обязательно неприводимого) унитарного многочлена с целыми коэффи- коэффициентами, то ot — целое алгебраическое число. Иными словами, если уни- унитарный многочлен с целочисленными коэффициентами представлен в виде произведения двух унитарных многочленов с рациональными ко- коэффициентами, то все эти рациональные коэффициенты — целые числа. Это утверждение — одна из возможных формулировок леммы Гаусса (лемма 6.1 на с. 60). Теорема 20.1. Пусть ot и [3— алгебраические числа, ф(ж,у)— произвольный многочлен с рациональными коэффициентами. Тогда ф(а, Р) — алгебраическое число. ? Кроме того, если строку (х0, х\, х2, хз) заменить на (а,, aj+i, ai+2, сц+з), ¦ где i = 0,1,2, то определитель обратится в нуль. Для г = 0 получаем 20. Алгебраические числа 195 Доказательство. Пусть {otb.. .,<*„} и {(Зь...,[Зт} —наборы чи- чисел, сопряженных сайр соответственно. Рассмотрим многочлен Коэффициенты этого многочлена являются симметрическими функци- функциями от ai,...,an и J3i,...,j3m- Поэтому они являются рациональными числами. С Замечание. Аналогично можно доказать, что если а и [3 — целые алгебраические числа, а ф(х, у) — многочлен с целыми коэффициентами, то ср(а, [3) — целое алгебраическое число. В частности, если а и [3 — алгебраические числа (целые алгебраиче- алгебраические числа), то ар и ot ± [3 тоже алгебраические числа (целые алгебраи- алгебраические числа). Кроме того, если а ф 0 — алгебраическое число, то а тоже алгебраическое число. В самом деле, если а — корень многочлена J2 о-кХк степени п, то а —корень многочлена Y1 аьхп~к. Но если а — целое алгебраическое число, то число а не обязательно целое алгебра- алгебраическое. Таким образом, алгебраические числа образуют поле, а целые алгебраические числа образуют кольцо. Теорема 20.2. Пусть а и р — алгебраические числа, связанные со- соотношением ср(а,р) = 0, где ф — многочлен с рациональными коэффици- коэффициентами. Тогда для любого числа а», сопряженного с а, найдется число р_,-, сопряженное с р, для которого ср(а,,р7-) = 0. Доказательство. Пусть {ai,...,an} и {Pi,...,pm} — наборы чи- чисел, сопряженных сайр соответственно. Рассмотрим многочлен Коэффициенты этого многочлена рациональны и /(а) = 0. Поэтому f(x) делится на Ц{х - at), а значит, /(а*) = 0, т. е. cp(ai5|3j) = 0 для некото- некоторого j. П 7*
196 Глава 4- Некоторые свойства многочленов Теорема 20.3. Пусть а — корень многочлена /(х)=х"+|3„_1х"-1 + ... + [Зо, где [3oj---)Pn-i—целые алгебраические числа. Тогда а — целое алге- алгебраическое число. Доказательство. Рассмотрим многочлен F(x) = П (хп + pn-i,^"-1 + ... + роД г,...,1 где {pn_1;i},..., {|3o,j} —все числа, сопряженные с |3„_1,..., |3о соответ- соответственно. Легко проверить, что коэффициенты многочлена F — целые числа. Ясно также, что а — корень многочлена F. ? Алгебраическое число а называют вполне вещественным, если все сопряженные с ним числа вещественны. Иными словами, все корни не- неприводимого многочлена с корнем а вещественны. Пример. Число а = 2cos(A;7i/n) вполне вещественно. В самом деле, а = е + е, где г = exp(foi/n). Пусть число oti со- сопряжено с а. Из теоремы 20.2 следует, что ai = ei + ef1, где число ei сопряжено с г. Число е удовлетворяет уравнению хп — 1 = 0, поэтому ц тоже будет корнем этого уравнения, а значит, ti — exp(/7i/n). В таком случае oti = 2 cos(/it/n) e Ж. 20.2. Теорема Кронекера В 1857 г. Кронекер [Кг] доказал следующее утверждение. Теорема 20.4 (Кронекер). а) Пусть а ф 0 — целое алгебраическое число. Тогда если а — не корень из единицы, то абсолютная величина одного из чисел, сопряженных с а, строго больше 1. б) Пусть р— вполне вещественное целое алгебраическое число. То- Тогда если р ф 2 cos г л, г е Q, то абсолютная величина одного из чисел, сопряженных с р, строго больше 2. Доказательство, а) Пусть {оц,...,ап} — набор чисел, сопряжен- сопряженных с а. Предположим, что |ае,| < 1, i = 1,..., п. Рассмотрим многочлен (x - «*) = xn ¦a*,o- 20. Алгебраические числа 197 Из того, что а — целое алгебраическое число, следует, что <ц)П_1,... ... ,ajfci0 е Z. А из условия |ot,| < 1, г = 1,.. .,п следует, что |а*,„| < ("). Таким образом, коэффициенты многочленов /i, /г •. • принимают конеч- конечное число значений, поэтому среди многочленов /i, /2 ... будет лишь ко- конечное число различных многочленов. Но тогда множество корней этих многочленов конечно, а все числа a,a2,a3,... входят в это множество. Следовательно, otp = а9, где р, q е N и р ф q. А так как а Ф 0, то ар-" = 1. б) Пусть {Рх,...,|3„} — набор чисел, сопряженных с [3. По условию все они вещественные. Предположим, что |J3j| < 2, г = 1,..., п. В таком случае модули всех чисел, сопряженных с будут равны 1. В самом деле, числа а и [3 связаны соотношением а2 - — [3ot-l-1 = 0, поэтому согласно теореме 20.2 любое число otj, сопряженное с а, является корнем многочлена вида a2 - J3,<*j + 1 = 0. Так как |р,| < 2, то [32/4 < 1, а значит, a,- = '-=¦ Согласно теореме 20.3 число а целое алгебраическое. Поэтому к нему можно применить утверждение а). В результате получим, что a = егта, где г eQ. Поэтому -1 —a + a = 2cosr7t, что и требовалось. ? Приведем один интересный пример использования теоремы Кроне- Кронекера. Теорема 20.5 (Минковский). Пусть А — квадратная матрица с це- целочисленными элементами. Предположим, что все элементы матрицы А — I, где / — единичная матрица, делятся на некоторое натуральное число п > 2, но при этом А ф I. Тогда: а) если п > 2, то Ат ф I при всех натуральных т; б) если п = 2 и при этом А2 ф /, то Ат ф I при всех натуральных т.
198 Глава 4- Некоторые свойства многочленов Доказательство. По условию А = I + пВ, где В — матрица с це- целочисленными'элементами. В частности, все собственные значения ма- матрицы В являются целыми алгебраическими числами. Собственные зна- значения ot матрицы А и собственные значения [3 матрицы В связаны со- соотношением а — 1 + п[3. Предположим, что Ат = I. Тогда otm = 1, а значит, |ot| = 1. Поэтому A) Неравенство A) строгое, за исключением лишь того случая, когда п = 2 и |а — 1| = 2, т. е. а = —1. При п > 2 неравенство A) строгое. В таком случае целое алгебраиче- алгебраическое число [3 и все сопряженные с ним числа по модулю строго меньше 1. Следовательно, [3 = 0, а значит, а = 1. Равенство Ат = I может выполняться лишь в том случае, когда все жордановы клетки матрицы А имеют размер 1x1. Если при этом все собственные значения матрицы А равны 1, то А = I. Рассмотрим теперь случай п = 2. В этом случае а = ±1. Следова- Следовательно, жорданова форма матрицы А представляет собой диагональную матрицу с элементами ±1 на диагонали. Поэтому А2 = I, что противо- противоречит условию. ? Элементарные, но весьма громоздкие оценки позволяют доказать следующее уточнение теоремы Кронекера. Теорема 20.6 [ScZ]. а) Пусть а ф 0 — целое алгебраическое число, причем а — не корень из единицы. Пусть, далее, {ai,...,an} — набор сопряженных с ним чисел. Тогда если среди чисел ai,..., ап содержится 2s невещественных, то max б) Пусть р — вполне вещественное целое алгебраическое число, при- причем [3^2 cos г к, г е Q. Пусть, далее, {Pi,..., [3n } — набор сопряженных с ним чисел. Тогда max Ш >2 + 4~2"-3. I 20. Алгебраические числа 199 20.3. Теорема Лиувилля Эйлер высказывал предположение, что не все числа являются алге- алгебраическими, но доказать это ему не удалось. Впервые существование трансцендентных (т. е. не алгебраических) чисел доказал Лиувилль в 1844 г. А в 1874 г. Кантор показал, что трансцендентных чисел в не- некотором смысле даже больше, чем алгебраических. А именно, алгебра- алгебраические числа образуют счетное множество, тогда как множество всех действительных (или комплексных) чисел несчетно. Доказательство Лиувилля основано на достаточно простом, но важ- важном замечании: иррациональное алгебраическое число не допускает слишком хорошего приближения рациональными числами. Точнее го- говоря, справедливо следующее утверждение. Теорема 20.7 (Лиувилль). Пусть а — корень неприводимого мно- многочлена f(x) — апхп + an-ix"'1 + ... + ао, где п > 2. Тогда существует такое число с> 0 (зависящее только от а), что я | q" для любого целого р и натурального q. A) Доказательство. Если > 1, то неравенство A) выполня- выполняется при с = 1. Поэтому будем считать, что < 1. Запишем мно- многочлен f(x) в виде f(x) = an П (х - а,), где ах = а. Тогда г=1 / * = а„ а-Р- q п п j=2 < \ап а-Р q г=2 где ci —положительное число, зависящее только от \ап\ и а. Будем считать, что ао,..., а„ — целые числа, взаимно простые в со- совокупности. Тогда число \ап\ полностью определяется числом а. Кроме того, число qnf(p/q) = anpn + an-lPn-x + ... + aoqn
200 Глава 4- Некоторые свойства многочленов целое, поэтому |<7п/(р/<7)| > 1- Следовательно, G) ciq" где с = П ТЕОРЕМА 20.8 (Лиувилль). Число а = Y1 2~ы трансцендентное. Доказательство. Для каждого натурального п рассмотрим число п а = Y1 2~*! = p/q, где р— целое число и q = 2"!. При этом k=o 1 1 1 Предположим, что а — алгебраическое число степени N. Тогда со- согласно теореме 20.7 с - q^' а значит, 2ч~п~1 > Cq~N, т.е. с < 2qN~n~1 = 2 ¦ 2n-{N~n-l\ Но lim 2"!'A'~7l~1) = 0. Приходим к противоречию. ? Неравенство A) можно записать в виде \q*-p\>clqn-\ Положим Р(х) =qx -р. Тогда \Р{а)\>с/Нп-\ B) где Я = max{|p|, |g|}—высота многочлена Р. Неравенство, аналогич- аналогичное неравенству B), выполняется и для многочлена Р произвольной сте- степени. Теорема 20.9. Пусть а — алгебраическое число степени п. Тогда существует такое число с > 0 (зависящее лишь от а), что для любого многочлена Р степени к с целыми коэффициентами либо выполняется равенство Р(о) = 0, либо выполняется неравенство \Р(а)\>ск/Нп-\ где Я — высота многочлена Р (т. е. наибольший из модулей коэффици- коэффициентов многочлена Р). 20. Алгебраические числа 201 Доказательство. Пусть Р{х) = a,kXk +... + оцх + а0, где о; е Z, и Р(а) ф 0. Для некоторого натурального г число р = га целое алгебраи- алгебраическое. Зададим многочлен Q соотношением Q(rx) = rkP{x). Ясно, что Q{y) = rhP(y/r) = akyk+rak-iyk~1+. ¦ -+гкао — многочлен с целыми ко- коэффициентами. Поэтому произведение Q(pi)-.. .-<3(р„), гдеCь... ,р„ — все числа, сопряженные с C, является целым числом, отличным от нуля. Следовательно, |Q(p)| • |Q(p2) ¦... • Q(Cn)| > 1, т. е. С другой стороны, C) D) Пусть h(a) = max{|ai|,..., |о„|}. Тогда из неравенств C) и D) следует, что a))" 1)*>1- .1-71 Положив с = r~n(l + h(a)) ", получаем требуемое неравенство. ? При п = 2 теорема Лиувилля неулучшаема в том смысле, что нера- неравенство а-р- q < имеет бесконечно много решений. Но при п > 3 оценку A) последова- последовательно улучшали Туэ, Зигель, Дайсон, Гельфонд, Шнейдер, Рот и др. Например, Рот [Rth] доказал следующее утверждение. ТЕОРЕМА 20.10 (Рот). Пусть а — иррациональное алгебраическое число, а положительное число 8 сколь угодно мало. Тогда неравенство выполняется лишь для конечного числа пар q, p, где число q натуральное, а число р целое. Доказательство теоремы Рота можно найти, например, в книге [К1].
202 Глав а 4- Некоторые свойства многочленов Задачи к главе 4 4.1. Пусть Zi,... ,zn —вершины правильного n-угольника, zq —его центр. Доказать, что если Р— многочлен степени не выше п — 1, то l- ± P{zk) = P(z0). п k=l 4.2. Пусть многочлен Р(х, у) таков, что Р(х, у) — Р(х + 1, у + 1). Доказать, что этот многочлен имеет вид Р(х, у) = ^,ak(x — у)к. 4.3. Пусть f(x) — многочлен степени п без кратных корней, х\,... ... ,хп — его корни. Доказать, что: = 0 при к = i б) 4.4. Пусть P(z)— многочлен степени п, причем тах|Р(г)| < 1. До- Доказать, что если Р(<х) = 0, то max Р(г) - 2 и max P(z) 4.5. Пусть d - х2 + ах + Ь е Ъ[х]. а) Доказать, что уравнение р2 - dq2 — 1 имеет нетривиальные реше- решения р, q e Z[ar] в точности в следующих случаях: A) а нечетно и 46 = а2 — 1; B) а четно и Ь = {а/2J ± 1 или Ь = {а/2J ± 2. б) Доказать, что уравнение р2 - dq2 — -1 имеет нетривиальные ре- решения р, q e Z[x] тогда и только тогда, когда а четно и Ь = (а/2J + 1. 4.6. Доказать, что существует единственный с точностью до ум- умножения на -1 многочлен f(x) степени п, для которого функция (х + 1)(/(а:)) - 1 нечетна. 4.7. Пусть Рп(х) многочлен степени п над полем С. Доказать, что при п = 4, 6 и 8 почти все многочлены Р„(х) можно представить в следующем виде: Рв =и6 +v6 + w6 + Xuvw(u — v)(v - w)(w — и); P8 = u8 + vs + ws + z8\u2v2w2z2 (здесь и, v, w, г—линейные функции, X — число). 4.8. Пусть числа Oi,..., о„ е С таковы, что для всех натураль- натуральных т число Y, аГ Целое. Доказать, что все коэффициенты многочлена Ц(х - о<) целые. Глава 5 Теория Галуа 21. Теорема Лагранжа и резольвента Галуа 21.1. Теорема Лагранжа Пусть К — поле характеристики 0 и ф — рациональная функция от переменных х\,...,хп над полем К. Функции ср можно сопоставить группу G<p, состоящую из тех элементов о группы 5„, которые оста- оставляют ф без изменения, т. е. ф(хоA), . . . , ХО(П)) = <f(Xi ,...,Хп). Например, если функция ср симметрическая, то G,, = Sn, а если ср = = Yl o,iXi, где числа ai,...,an попарно различны, то G<p содержит только тождественную подстановку. Теорема 21.1 (Лагранж). Пусть ср,ф е K(xi,...,xn), причем G9 с Сф. Тогда ф = Д(ф), где R — рациональная функция, коэффи- коэффициентами которой служат симметрические функции от xi,...,xn. Первое доказательство. Разобьем группу G^ на смежные классы hiG9 - G^,h2Gv... ,hkG9. Каждому смежному классу hiG4 соответ- соответствует функция фг — образ ф под действием данного смежного класса. При этом ф, ф cpj при г Ф j. Функция ф инвариантна относительно действия G9, поэтому смеж- смежному классу hiG<p однозначно соответствует некоторая функция ф, (при G9 ф Gty среди этих функций будут совпадающие). Фг Функция инвариантна относительно действия всех подста- i=l f новок группы Sn. Поэтому ^ u(t)' где u(t) = (t - cpi) ¦ ... ¦ (t - ер*) и F(t) — многочлены от t, коэффици- коэффициенты которых являются симметрическими функциями от х\,... ,х„. Из условия (fi Ф <?j при i ф j следует, что П'(ср) ф 0.
204 Глава 5. Теория Галуа Ясно, что Таким образом, Поэтому f 0 ~ \ 1 0 При ф, ф ф; При фг = ф. П(<Р) = ф. п Второе доказательство. Построим функции фХ = ср,..., ср* и J;i = ф,..., ф*, как и в первом доказательстве. Ясно, что sAi = Ts A) — симметрическая функция от х\,...,хп. Рассмотрим равенства A) при s = 0,..., к — 1 как систему линейных уравнений относительно фь ..., ф/fc. Решая эту систему, получим фх = ?>х/Д, где Д = 1 9 к и Dx = То Запишем полученное равенство в виде ф: = ?>iA/A2. Ясно, что Д2 — симметрическая функция. При перестановке любой пары функций ф2,...,ф* оба определителя D\ и Д меняют знак, поэтому DiA — симметрическая функция от (р2, •••,?*• Следовательно, D\A = So + + (f\Si +... + <fi ~1Sk-i, где So,..., Sk-i — симметрические многочлены от ф2) • • • > ф*- Поэтому So, ¦ ¦ ¦, Sk-i выражаются через <*2 = ф2фЗ + • • • , ifc-1 = ф2 • • • • ' ф*"- Теорема Лагранжа и резольвента Галуа 205 Но, как легко проверить, о'2 =о2 - о'з а3 - где oi,o2,...—элементарные симметрические функции от ф1,...,ф*. Поэтому о[,... ,о'к_1 выражаются через oi,... ,<Jjfc-i и cpi. Таким обра- образом, DiA — многочлен от ф1 = ф, коэффициентами которого служат симметрические функции от Х\,..., хп. ? Из теоремы Лагранжа можно извлечь многочисленные следствия. Пусть ф и ф — рациональные функции от переменных Х\,...,хп. Если ф = Д(ф), где R — рациональная функция, коэффициентами которой служат симметрические функции от х\,..., хп, то будем для краткости говорить, что ф рационально выражается через ф. Следствие 1. Любая рациональная функция от переменных ari,... ..., хп рационально выражается через а^ +.. . + апхп, где а\,...,ап — попарно различные числа. Следствие 2. Если Gv = G^, то функции ср и ф рационально выра- выражаются друг через друга. Следствие 3. Если рациональная функция г инвариантна относи- относительно всех подстановок, сохраняющих функции п,... ,гп, то г рацио- рационально выражается через г\,..., гп. Доказательство. Можно считать, что функции г\,..., гп линейно независимы. Пусть ф = a\ri + .. .+anrn, где а\,... ,ап — попарно различ- различные числа. Тогда любая подстановка, сохраняющая ф, должна сохранять и все функции г\,. ¦., гп. Поэтому г сохраняется при всех подстановках, сохраняющих ф. Следовательно, г рационально выражается через ф = + ... + апг„. ? Следствие 4. Пусть многочлен f(x\,..., хп) при всевозможных под- подстановках переменных принимает лишь два различных значения. Тогда / = 5i + Д52, где Sy и 52 — симметрические функции, а Д = f] (х, - Xj).
206 Глава 5. Теория Галуа Доказательство. Если / — не симметрическая функция, то под- подстановки, сохраняющие /, образуют в 5„ подгруппу индекса 2. Поэтому достаточно доказать, что в 5П есть лишь одна подгруппа индекса 2, а именно, знакопеременная группа А„. Пусть G с Sn — подгруппа ин- индекса 2 и h e Sn \ G. Тогда 5„ разбивается на непересекающиеся мно- множества G и hG = Gh. Поэтому /iGTi = G и если hi,h2 e Sn \ G, то /ij/i2 e G. Если бы группа G содержала некоторую транспозицию (ij), то она содержала бы и любую другую транспозицию (pq). В са- самом деле, (pq) получается из (ij) при сопряжении любой подстановкой, переводящей i в р и j в q. Таким образом, все транспозиции лежат в Sn \ G, а значит, их попарные произведения лежат в G. Итак, в G лежат все произведения четного числа транспозиций, а значит, G э Ап. Но \G\ = \А„\, поэтому G = Ап. ? В теореме Лагранжа речь идет о рациональных функциях от пе- переменных Xi,..., хп- Переход от алгебраически независимых х\,..., хп к конкретным значениям этих переменных требует определенной дели- деликатности. Дело в том, что подстановки, сохраняющие значение функции (f(xi,...,xn) при заданных х\,...,хп, могут не образовывать группу. Пусть, например, Хк — ехрBтк/7), к = 1,...,6. Рассмотрим функцию f(xi,. ..,х6) = Xix6. Пусть а = A2)E6) и х = A6)B3). Подстановки а и т переводят / в а/ = х2хь = 1 и х/ = х$Х\ = 1, соответственно, т. е. а и х сохраняют /. Но х переводит of = х2хъ в ха/ = х^хь ф 1. Чтобы избежать подобных неприятностей, Галуа предложил рассма- рассматривать не все подстановки корней уравнения, а лишь те, которые со- сохраняют все рациональные соотношения между ними. Точнее говоря, пусть / = хп + ап~\хп~1 + ... + ао — многочлен с коэффициентами из поля К и Oi,...,on — его корни. Будем рассматривать такие подста- подстановки о, что для любой рациональной функции г е К(х\,... ,хп) из равенства r(cii,...,о„) = 0 следует равенство г(ооA),..., оо(„)) = 0. На современном языке это означает, что подстановка о соответствует ав- автоморфизму поля K(ai,..., оп), сохраняющему основное поле К. Группу всех таких подстановок называют группой Галуа многочлена /. (Эта группа, разумеется, зависит от поля К.) В рассмотренном выше примере подстановки а и х не входят в группу Галуа многочлена хв + х5 + ... + х + 1, корнями которого являются #!,...,#6- В самом деле, подстановки о и х не сохраняют, например, соотношения х2 = х\ и хв = xf. Для любой рациональной функции от корней Oi,..., о„ многочлена / можно рассмотреть те подстановки из группы Галуа, которые со- 21. Теорема Лагранжа и резольвента Галуа 207 храняют ее значение. Ясно, что эти подстановки теперь уже образуют группу. В самом деле, пусть а и х — подстановки из группы Галуа мно- многочлена /, а г(х\,...,хп) — такая рациональная функция, что (ao(i),._.., ао(„)) = r(ai,..., а„), (aT(i),.. •, от(„)) = r(oi,..., о„). B) C) Подстановки а и х можно применять к любым рациональным соотноше- соотношениям между корнями <Х\,..., ап, поэтому, применив х к соотношению B), получим г(атоA), • • • 1ато(п)) = r(aT(i),. • • ,ат(„)). Теперь из соотношения C) следует, что подстановка ха тоже сохраняет значение функции г. 21.2. Резольвента Галуа Пусть f(x) = хп + ап-\хп~1 + ... + ао — многочлен над полем К нулевой характеристики и Oi,... ,а„ —его корни. Предположим, что у многочлена / нет кратных корней, т. е. числа сц,... ,оп. попарно раз- различны. Рассмотрим рациональную функцию ф(хь...,а:„) =rmxi + ... + mnxn, где mi,...,mn — некоторые целые числа. Покажем, что числа mi,... ..., mn можно выбрать так, что все п! значений фо = ф(ооA),.. -, ао(„)) будут различны. В самом деле, рассмотрим функцию где произведение берется по n(ri — l)/2 неупорядоченным парам несо- несовпадающих подстановок стих. Функция D представляет собой произве- произведение ненулевых многочленов от ii,..., tn, поэтому D — ненулевой мно- многочлен над полем К от переменных t\,... ,tn- Но любой ненулевой мно- многочлен принимает ненулевое значение при нехоторых целых значениях ti = mi,... ,tn = тп. Эти целые числа mi,... ,тп и есть искомые. Прежде чем двигаться дальше, докажем одно вспомогательное ут- утверждение. Лемма. Любой симметрический многочлен от корней а2,..., а„ по- полиномиально выражается через корень ai и коэффициенты а0,..., an_i.
208 Глава 5. Теория Галуа 21. Теорема Лагранжа и резольвента Галуа 209 Доказательство. Любой симметрический многочлен от корней 0B,. ¦ •, осп выражается через коэффициенты многочлена (а; - сс2) •... • (ж - а„) = f(x)/(x - сц) - х"'1 + Ьп^хп-2 + ... + Ьо. При этом «71-1 = Ьп-2 - 0A, 0>п-2 — Ь„-з - bn-20Ll, ап-з — bn-i — Ь„_зО11, т. е. Ьп-2 — пп-1 + Ьп-з = ап-2 + , Таким образом, коэффициенты Ьо, ¦. ¦, Ьп-2 полиномиально выражаются через корень ai и коэффициенты а0,..., an_i. ? Выберем числа гп\,...,тпп так, что все п\ значений фо = mioo(i) + ... + mnoo(n) были бы различны, и рассмотрим многочлен - • • ¦ - тп„аа(п)). Коэффициенты этого многочлена—симметрические многочлены с це- целыми коэффициентами от корней многочлена /, поэтому они рацио- рационально выражаются через коэффициенты многочлена /. Таким обра- образом, если / — многочлен над полем К, то F тоже будет многочленом над полем К. Разложим F в произведение неприводимых над К множителей со страшим коэффициентом 1. Любой такой неприводимый множитель G называют резольвентой Галуа многочлена /; для определенности будем считать, что многочлен G имеет корень rriioti + ... + тпап. Теорема 21.2 (Галуа). Любой корень многочлена / рационально выражается (над полем К) через один из корней многочлена G. Доказательство. Рассмотрим многочлен Fi(x) = - ... - т„оо{„)), где произведение берется по подстановкам а е. Sn, для которых оA) = = 1. Коэффициенты многочлена i<\ являются симметрическими много- многочленами от 02, • • • ,с(„, поэтому согласно лемме они рационально выра- выражаются (над полем К) через oti, т. е. F\ (х) = д(х, oi), где д — многочлен от двух переменных над полем К. При этом если ф = rriiOti +... + тпап, (ф) ^(ф) Рассмотрим теперь многочлен m2ao(i) - ... - mnoo(n)), где произведение берется по подстановкам о е Sn, для которых оB) = = 2. Из доказательства леммы видно, что выражения для его коэффи- коэффициентов будут теми же самыми, что и для F\, с точностью до замены ai наа2, т.е. F2(x) =g(x,a2). По условию ф = miOi + ... + тпап ф т^г + т2аоA) + ... + тпао(п), т. е. ^г(ф) ф 0. Таким образом, oti является единственным общим корнем многочленов f(x) и р(ф,х). Это означает, что НОД многочленов f(x) и </(ф, х) равен х — <х\. Но НОД двух многочленов находится по алгоритму Евклида, поэтому oti рационально выражается через ф и коэффициенты многочленов / и д, т. е. ai рационально выражается над полем К через ф. ? Следствие. Все корни резольвенты Галуа рационально выража- выражаются через один из ее корней. Доказательство. Каждый корень резольвенты Галуа имеет вид "^lOtofi) + • • ¦ + т„оо(„). Ясно, что они рационально выражаются через ai,...,а„. В свою очередь, oi,...,an рационально выражаются через ф = miai + ... + тпап. D С помощью резольвенты Галуа удобно строить поле разложения K(ai,...,an). В самом деле, K(ai,...,an) = #(ф), т.е. вместо присо- присоединения к полю К всех корней многочлена можно присоединить один корень его резольвенты Галуа. Другое применение резольвенты связано с тем, что с ее помощью можно построить группу Галуа. (Первоначально Галуа строил группу Галуа многочлена именно с помощью резольвенты.)
210 Глава 5. Теория Галуа Пусть ф: = ф, t]>2 j • • •) фг — корни резольвенты Галуа G. Как было по- показано, все они рационально выражаются через ф, т.е. ф< = Ri(if), где Ri е К{х). Соотношение ф, = Ri{iji) можно рассматривать как соотно- соотношение между элементами поля К(<\>). Поэтому можно считать, что Ri — многочлен степени не выше degG — 1 = г — 1. Этот многочлен опре- определен однозначно. Формула ф* = Ri(fy) остается справедливой, если Ri заменить на Ri + aG, где а — произвольный многочлен. Рассмотрим многочлены G(x) и Gi(x) = G(Ri(x)). Коэффициенты этих многочленов лежат в К и у них есть общий корень ф. А так как по условию многочлен G неприводим, то любой корень ф^- многочлена G является также корнем многочлена Gj, т. е. Д«(ф^) = фр для некото- некоторого р. Это означает, что Д*(Д.,-(ф)) = Др(ф), т. е. Д.-Д,- = Rp (mod G). Таким образом, для любого корня ф8 многочлена G выполняется равен- равенство Ri (Д/(ф«)) = Др(ф8). В частности, набор многочленов i?i,..., Rr и соответствующих им преобразований корней фх..., фг определен инва- инвариантно, т. е. он не зависит от выбора корня фь Числу фг = miaa.(i) + ... + mnao.(n) однозначно соответствует под- подстановка Oj, а ей, в свою очередь, соответствует автоморфизм поля K(a.i, ¦ ¦. ,<хп) = K(ty), который мы тоже обозначим а,. Итак, корням ф!,..., фг резольвенты Галуа соответствуют подстановки о\,..., аг. Со- Сопоставим подстановке Oj многочлен Ri. Учитывая, что оДф) = ф<, полу- получаем т. е. aiOj «-»• Д,-Д,- modG. Таким образом, группа преобразований Ri,... ...,Rr антиизоморфна группе подстановок oi,...,or. Чтобы устано- установить связь с группой Галуа, остается доказать следующее утверждение. Теорема 21.3. Группа Галуа многочлена / состоит из подстановок Доказательство. Требуется доказать, что если оц,..., а„ — корни многочлена / и х е Sn, то условие х е {oi,... ,ог} эквивалентно тому, что для любой рациональной функции ф равенство cp(ai,..., а„) = 0 эквивалентно равенству cp(ax(i), - ¦ •, ат(„)) = 0. Корни oi,..., о„ рационально выражаются через ф1, поэтому cp(ai,...,an) = т„а„), где Ф е К{х). Таким образом, ф(отA),.. .,от(п)) = Ф(ф\), где ф, = = т1Ох(!) + ... + т„оТ(„). Эквивалентность равенств Ф(фх) = 0 и 21. Теорема Лагранжа и резольвента Галуа 211 ) = 0 (для всевозможных рациональных функций Ф) означает, что ф1 и фт — корни одного и того же неприводимого многочлена, т. е. х е {оь...,ог}. ? Следствие. Пусть /—1 многочлен над полем к с попарно различ- различными корнями oi,..., а„. Тогда порядок группы Галуа этого многочлена равен степени расширения [К : к], где К = fc(ai,..., а„). Доказательство. Оба эти числа равны степени резольвенты Галуа многочлена /. ? Для теории Галуа большое значение имеет следующее утверждение. Теорема 21.4. Пусть oi,...,on — корни неприводимого много- многочлена / над полем к и ф е k(xi,..., хп). а) Предположим, что ф(аь... ,о„) = ф(ао,.A),... ,ао.(п)) для всех под- подстановок о, из группы Галуа. Тогда ф(аь ..., о„) е к. б) Пусть Я = {ajj,.. .,Ojs} — такая подгруппа группы Галуа {oi,...,or}, что если ф@1,...,0„) = ф(ооA),... ,оо(„)) для любой под- подстановки а е Н, то cp(ai,... ,an) e к. Тогда Н совпадает со всей группой Галуа. Доказательство, а) Корни oi,..., о„ рационально выражаются че- через фь поэтому cp(oi,.. .,о„) = Ф(ф1), где Ф е к(х). Следовательно, 9(aOi(i),...,oOi(n)) = Ф(ф,). Таким образом, Ф(фх) = ... = Ф(фг), а зна- значит, — рациональная симметрическая функция от корней фг,..., фг резоль- резольвенты Галуа. Поэтому cp(oi,..., о„) = Ф(ф1) е к. б) Рассмотрим многочлен д(х) = Д (х - о(ф)) = (х - ф41) •... • (х - ф,.). о<=Н Его коэффициенты инвариантны относительно действия группы Н, по- поэтому все они лежат в к. Таким образом, коэффициенты многочлена д(х) лежат в к и этот многочлен имеет общие корни с неприводимым над к многочленом G(x) = (х - фх) ¦... ¦ (х - фг). Следовательно, д(х) = G(x) и Я = {оь...,ог}. ?
212 Глава 5. Теория Галуа 21.3. Теорема о примитивном элементе На с. 209 мы упомянули, что поле A:(ai,..., а„), где ai,..., о„ — корни многочлена /, порождено над к одним элементом, а именно, корнем ф резольвенты Галуа многочлена /. Обычно в теории полей для построе- построения элемента, порождающего поле, используется следующая стандарт- стандартная конструкция. Теорема 21.5 (о примитивном элементе). Пусть к— поле нулевой характеристики, oti,...,an — алгебраические над к элементы. Тогда поле k(ai,..-, an) порождено над к одним элементом 0. Доказательство. Рассмотрим сначала случай двух элементов a и р. Пусть f(x) и д(х) — неприводимые над к многочлены с корнями а и C. Пусть, далее, oti = о,О2,...,аг — корни многочлена /, pi = C, р2, • • •, Р« — корни многочлена д. Выберем сек так, что a* + dfij ф а\ + + cCi при j ф 1. Положим 0 = ai + cpi = а + ср. Ясно, что к(в) с к(а, C). Остается доказать, что к(а, C) с к(в). Для этого достаточно доказать, что р е k(Q). Действительно, в таком случае a = 9 — ср е k(Q). Элемент р удовлетворяет уравнениям д(х) = 0 и /@ — саг) = 0, ко- коэффициенты которых лежат в k(Q). Единственным общим корнем мно- многочленов д(х) и /@ - сх) является р, поскольку 0 - ф_,- ф си при j ф 1. У многочлена д(х) кратных корней нет, поэтому наибольший общий де- делитель многочленов д(х) и /@ — саг) равен х — р. Наибольший общий делитель двух многочленов над полем k(Q) является многочленом над jb(9), поэтому р е jb(9). Переход от п = 2 к произвольному п делается очевидной индукцией: если fc(cti,...,an_i) = к (В), то fc(ab ... ,о„) = fc(9,ctn) = к(в'). ? С помощью теоремы о примитивном элементе можно доказать, на- например, следующее утверждение о простых делителях набора многочле- многочленов. Теорема 21.6 [Но]. Пусть fi(x),... ,fn(x) — непостоянные цело- значные многочлены, т.е. fi(m) e Z при т е Z. Пусть, далее, Мг-— множество всех простых делителей всех чисел вида fi(m) e Z, m e Z (fi(m) Ф 0). Тогда множество М — М\ Л ... П Мп бесконечно. Доказательство. Рассмотрим сначала случай п — 1 (в этом случае теорема была доказана Шуром [Shu]). Если fi(x) —целозначный много- многочлен степени к, то все коэффициенты многочлена k\fi(x) целые (см. теорему 12.1 на с. 100). При переходе от многочлена f% к многочлену 21. Теорема Лагранжа и резольвента Галуа 213 klfi к простым делителям значений многочлена Д добавляются лишь простые делители числа &!, т. е. некоторое конечное множество. Таким образом, доказательство достаточно провести в случае многочлена Д с целыми коэффициентами. Многочлен fi(x) принимает значения 0 и ±1 лишь в конечном чи- числе точек. Поэтому у его значений в целых точках есть хотя бы один простой делитель, т. е. Mi ф 0. Предположим, что Mi = {pi,... ,pr} — конечное множество. Пусть а е 7, и fi(a) = Ь ф 0. Покажем, что д(х) = .. .-prx) — многочлен с целыми коэффициентами, причем д(х) = 1 (mod pi •... -pr) при ieZ. Легко проверить, что если с е Z, то (а + саг)' - а1 = chi(x), где Ы{х) —многочлен с целыми коэффициентами. Поэтому ¦prx) - fi(a) =bpi ¦prh(x), где h(x) — многочлен с целыми коэффициентами. Остается заметить, что д(х) = б (/i (a) + Ьрх ¦... ¦ prh(x)) = 1 + рх •... • prh(x). Для некоторого ieZy целого числа д(х) есть простой делитель р. Сравнение д(х) = 1 (mod pi • ... • рг) показывает, что р ф М\ = = {pi,... ,рг}. С другой стороны, число fi(a + Ьрг ¦ ... ¦ ргх) = Ьд(х) делится на р, поэтому р е М\. Полученное противоречие означает, что множество Mi бесконечно. Переход от случая п = 1 к произвольному п делается с помощью теоремы о примитивном элементе. Как и при доказательстве в слу- случае п = 1, мы будем считать, что /i,...,/n е Ъ[х\. Пусть Oj — один из корней многочлена fi- Согласно теореме о примитивном элементе Q(oi,...,on) = Q(a), т.е. аи = срДа), где ср*(*) е ОД. Пусть д — не- неприводимый многочлен над Q, имеющий корень а. Если (р«@) ф 0, то заменим ф, на ф,, где Итак, можно считать, что фг(О) = 0. В таком случае, если N делится на знаменатели всех коэффициентов многочленов ф,, то (fi(Nt) e Z[t]. Многочлены fi(fi(t)),. ¦ ¦ ,fn(fn(t)) e Q[t] имеют общий корень а, поэтому все они делятся на g(t). Рассмотрим многочлены Fi{t) = = fi{fi{Nt)). Ясно, что Fi(t) e Z[x] и Fi(t) делится над Q на g(Nt),
214 Глава 5. Теория Галуа т.е. Fi(t) = g(Nt)gi(t), где gi(t) e Q[t]. Запишем многочлены д и gi в виде р(М) = гЛ(<) и #(t) = sMt), где г,в< е Q, h(t),hi{t) e Z[t] и cont(/i) = cont(ftj) = 1. Тогда Fi{t) = rs,/i(<)/i,(i), причем согласно лемме Гаусса re, = cont(Fj) — целое число. Это означает, что Fi(t) делится над Z на h(t). В частности, все делители значений многочлена ft в целых точках являются делителями значений многочлена F,, которые, в свою очередь, являются делителями значений многочлена /j. Таким обра- образом, множество М содержит бесконечное подмножество, состоящее из простых делителей значений многочлена, ft. О 22. Основы теории Галуа 22.1. Соответствие Галуа Пусть / — многочлен над полем к без кратных корней (но не обя- обязательно неприводимый), oi,...,on—корни многочлена /. Поле К = = k(ai,..., я„) называют полем разложения многочлена /. Теорема 22.1. Любой элемент со е К = k(ai,...,an) является кор- корнем неприводимого над к многочлена ft, все корни которого лежат в К. Доказательство. Элемент со можно представить в виде со = = g{ai,...,an), где д е к[хи... ,хп]. Положим ыо = p(ao(i),... ,ao(n)) и рассмотрим многочлен h(x) = Г7 (х — со0). Ясно, что все корни много- члена ft лежат в К и ft— многочлен над полем к, поэтому ы — корень неприводимого множителя многочлена ft. О Следствие. Если многочлен р(х) неприводим над к и один из его корней лежит в К = к{<х\,...,о„), то и все остальные корни многочлена р(х) лежат в К. Доказательство. Пусть ы е К — корень многочлена р, h — не- неприводимый над к многочлен, все корни которого лежат в К и /i(co) = = 0. Многочлены h и р неприводимы над к и имеют общий корень со, поэтому все корни многочлена р являются корнями многочлена ft, т. е. лежат в К. Q Конечное расширение К поля к называют нормальным расширением, или расширением Галуа, если любой неприводимый над к многочлен, один из корней которого лежит в К, разлагается над К на линейные множители, т. е. все его корни лежат в К. 22. Основы теории Галуа 215 Примером не нормального расширения служит поле Q(v^2): это поле содержит лишь один из корней многочлена а:3 — 2. Согласно теореме 22.1 поле разложения многочлена является нор- нормальным расширением. Справедливо и обратное утверждение. Теорема 22.2. Пусть К г> к — нормальное расширение. Тогда А" — поле разложения некоторого многочлена над к. Доказательство. Пусть К = fe(oi,...,on), /* — неприводимый многочлен над к с корнем а*, / = f\... fn, К' — поле разложения много- многочлена / над к. С одной стороны, элементы ai,..., an являются корнями многочлена /, поэтому К с К'. С другой стороны, поле К нормально над к и содержит корень неприводимого над к многочлена /» (г = = 1,...,п), поэтому К содержит все корни многочлена /, а значит, К => К'. О Следствие. Пусть К zd L r> к, где К — нормальное расширение поля к, L — произвольное промежуточное поле. Тогда К — нормальное расширение поля L. Доказательство. Поле К является полем разложения некоторого многочлена / над к. Этот многочлен можно рассмотреть и как мно- многочлен над L, поэтому К — поле разложения некоторого многочлена над L, т. е. К — нормальное расширение поля L. О Если К — нормальное расширение поля к, то группой Галуа поля К над к называют группу автоморфизмов поля К, оставляющих не- неподвижными все элементы поля к. Группу Галуа поля К над к будем обозначать G(K,k). В том случае, когда К — поле разложения много- многочлена /, для группы Галуа G(K, к) будем также использовать обозначе- обозначение Gk{f). Элементы со, со' поля К п к называют сопряженными над полем к, если со и со' — корни одного и того же неприводимого над к многочлена. Теорема 22.3. Пусть К — нормальное расширения поля к. Эле- Элементы со,сУ е К сопряжены над к тогда и только тогда, когда су- существует автоморфизм о е G(K,k), переводящий со в со'. Доказательство. Пусть со — корень неприводимого над к много- многочлена р. Если сУ = о(со), то р(ы') = р(о(ы)) = о(р(со)) = 0, поэтому элементы со и со' сопряжены над к.
216 Глава 5. Теория Галуа Предположим теперь, что ыиы' — корни неприводимого над к мно- многочлена р. Построение автоморфизма о начнем с того, что построим изоморфизм ср: к(и>) -»¦ к(ы'). Любой элемент поля к(а>) однозначно пред- представим в виде ао + ахи + ... + an-io>n~1, где щ е к и n = degp. Tpe- П-1 71-1 буемый автоморфизм имеет вид JZ <*¦№* к> Y1 ai (<¦>')'• Выберем теперь г=0 г=0 6 е К \ к(ы). Пусть р\ —неприводимый над к многочлен с корнем 0, a q\—неприводимый над &(со) делитель многочлена pi, для которого <7i (9) = 0. При изоморфизме ф:А;(со) ->• к(ы') неприводимый над к(ы) многочлен q\ переходит в неприводимый над к(ы') многочлен q1. Пусть 0' — корень многочлена Щ. Изоморфизм изоморфизм ф : fc(co) -* к(о>') можно продолжить до изоморфизма fc(co,9) —> А;(со',6'). Этот изомор- изоморфизм имеет вид Y1 W н* 5Z ф(&г)F')\ ГДе &г е к(ы). Такие продолжения изоморфизмов позволяют построить изоморфизм поля К в некоторое подполе К' с К, переводящий со в со'. Этот изоморфизм полей явля- является, в частности, изоморфизмом линейных пространств над полем к. В таком случае из конечномерности К следует, что К' = К, т. е. мы получаем автоморфизм поля К. ? Следствие. Если К — нормальное расширение поля к, то элемент ы е К инвариантен относительно действия группы Галуа G(K, к) тогда и только тогда, когда ы е к. Доказательство. Если элемент шей" инвариантен относительно действия группы Галуа G(K,k), то все сопряженные с ним элементы совпадают с ним самим. Это означает, что со — корень многочлена х — — со с коэффициентами из поля к, т.е. ы е к. ? Условие нормальности расширения весьма существенно. Например, любой автоморфизм поля Q(v^2) тождествен, т.е. элемент \/2 ^ Q ин- инвариантен относительно действия всех автоморфизмов. Нормальные расширения отличаются тем свойством, что у них до- достаточно велика группа автоморфизмов. Это позволяет установить вза- взаимно однозначное соответствие между промежуточными полями и под- подгруппами группы Галуа. Пусть К — нормальное расширение поля к. Рассмотрим произволь- произвольное промежуточное поле L: к с L с К. Согласно следствию из тео- теоремы 22.2 поле К является нормальным расширением поля L, поэтому можно рассмотреть группу Галуа G(K, L). 22. Основы теории Галуа 217 Теорема 22.4 (соответствие Галуа). а) Между промежуточными полями к с L с К и подгруппами группы Галуа G(K,k) имеется взаимно однозначное соответствие: полю L соответствует подгруппа G{K,L) с G{K,k), а подгруппе Н с G{K,k) соответствует поле, со- состоящее из элементов поля К, инвариантных относительно действия группы Н. б) Промежуточное поле L является нормальным расширением поля к тогда и только тогда, когда подгруппа G{K, L) с G(K, к) нормальна. В этом случае имеется точная последовательность 0 -* G(K, L) - G{K, к) -. G{L, к) - 0. Доказательство, а) Любой автоморфизм поля К, оставляющий неподвижными элементы поля L, оставляет неподвижными и элементы поля к с L, т. е. G{K, L) с G(K, к). Полю L соответствует группа G{K,L), а группе G(K,L) соответ- соответствует поле L', состоящее из тех элементов поля К, которые инвари- инвариантны относительно всех автоморфизмов поля К, оставляющих непо- неподвижными элементы поля L. Ясно, что ?,' z> L. Но в случае нормаль- нормального расширения любой элемент поля К, инвариантный относительно действия группы G(K,L), лежит в L (следствие теоремы 22.3; другое доказательство —теорема 21.4 (а) на с. 211). Поэтому L = L', т.е. ка- каждому подполю соответствует подгруппа, причем эта подгруппа одно- однозначно определяет подполе. Группе Я с G(K, к) соответствует поле L, а полю L соответствует группа G(K,L) = Я', которая состоит из тех автоморфизмов поля К, которые оставляют неподвижными элементы, инвариантные относи- относительно Я. Ясно, что Я' => Я. Но если подгруппа Я группы Галуа G(K, L) такова, что все элементы поля К, инвариантные относительно действия Я, лежат в L, то Я совпадает со всей группой Галуа G(K, L) (теорема 21.4 (б) на с. 211). Таким образоМ; каждой подгруппе соответ- соответствует подполе, причем это подполе однозначно определяет подгруппу. б) Предположим, что поле L является нормальным расширением поля к. Тогда любой автоморфизм поля К над к переводит поле L в себя (элемент поля L переходит в сопряженный элемент, который снова лежит в L). Таким образом, имеется гомоморфизм G(K,k) -» G(L,k). Ясно, что группа G(K, L) является ядром этого гомоморфизма, поэтому она — нормальная подгруппа в G(K, к).
218 Глава 5. Теория Галуа Предположим теперь, что G(K,L)—нормальная подгруппа в G(K,k), т.е. если ср е G(K,L) и ф е G{K,k), то ф">ф е G(K,L). Пусть а е L; требуется доказать, что все сопряженные с а элементы а],..., щ лежат в L. По условию а\,..., щ е К, причем а, = ф* (а) для некоторого ф; е G(K,k). Если ср е G(K,L), то фгг1фФг G G{K,L). Поэтому ф^фф^а) = а, т. е. ф(аг) = а{. Следовательно, а е L. Точная последовательность О - G(K, L) , A;) - G(L, A;) - О устроена следующим образом. Поле L является нормальным расши- расширением поля к, поэтому любой автоморфизм ф е G(K, к) сохраняет поле L, а значит, <р можно ограничить на L. Так возникает гомомор- гомоморфизм G(K,k) -*¦ G(L,k). Его ядром служат гомоморфизмы поля К, тождественные на L; они образуют группу G(K,L). Эпиморфность гомоморфизма следует из того, что любой автоморфизм поля L над к можно продолжить до некоторого автоморфизма поля К над к. ? Если L — поле разложения над к многочлена д, а К — поле разложе- разложения над к многочлена /, то точная последовательность О - G(K, L) - G(K, к) - G(L, к)-* О имеет вид Теорема 22.5. Пусть L — произвольное расширение поля к и / — многочлен над к. Тогда группа Галуа Gl(/) изоморфна некоторой под- подгруппе в Gh(f). Доказательство. Пусть oi,...,on — корни многочлена /. Авто- Автоморфизм о е Gl(/) переставляет корни ai,...,а„ и оставляет непо- неподвижными все элементы поля L гэ к. Поэтому автоморфизм а сохра- сохраняет поле A:(ai,..., an), т. е. автоморфизму о можно сопоставить авто- автоморфизм a е Gk{f), являющийся ограничением о на поле A:(ai,..., а„). Если а = id, то автоморфизм о оставляет на месте все корни ai,...,an. Кроме того, по определению о оставляет на месте все эле- элементы поля L, а значит, о = id. Таким образом, отображение а >->¦ о — мономорфизм, т.е. группа Gl(/) изоморфна некоторой подгруппе в Gk{f). U 22. Основы теории Галуа 219 22.2. Многочлен с группой Галуа S$ Чтобы привести пример уравнения, не разрешимого в радикалах, нам потребуется многочлен с группой Галуа Sn, n > 5. Мы уже готовы доказать, что многочлен хь — Ах + 2 над Q имеет группу Галуа Ss- Группа G с Sn называется транзитивной, если для любых двух индексов i,j e {1,...,п} существует подстановка а е G, для которой о@ = 3- Теорема 22.6. Многочлен / (без кратных корней) неприводим то- тогда и только тогда, когда его группа Галуа транзитивна. Доказательство. Пусть oi,...,on — корни многочлена /. Если многочлен / неприводим над полем к, то по определению все его корни сопряжены друг с другом, поэтому согласно теореме 22.3 существует автоморфизм поля A:(ai,..., о„), переводящий а; в olj. Предположим теперь, что группа Галуа G многочлена / транзи- транзитивна. Пусть Д — произвольный делитель многочлена / над полем к, о.\ — корень многочлена Д. Возьмем автоморфизм о, е G, для которого <?i(o(i) = аг- При автоморфизме Oi соотношение /i(ai) = 0 переходит в соотношение /i(a;) = 0, т.е. все корни многочлена / являются также корнями многочлена f\. Учитывая, что у многочлена / нет кратных корней, получаем, что /i делится на /, т. е. многочлен / неприводим. ? Теорема 22.7. Если число п простое и транзитивная группа G с Sn содержит хотя бы одну транспозицию (i, j), то G = Sn. Доказательство. Введем на множестве {!,...,п} следующее от- отношение: i ~ j, если либо i = j, либо в группе G есть транспозиция (i,j). Тождество {i,j)(j,k)(i,j) = (г,к) показывает, что это отношение является отношением эквивалентности. Пусть E(i) — класс эквивалентности, содержащий элемент i. Пока- Покажем, что \E{i) | = \E(j) |, т. е. все классы эквивалентности состоят из од- одного и того же числа элементов. Группа G транзитивна, поэтому в ней есть такая подстановка о, что o(i) = j. Пусть a e E(i), т. е. (i,a) e G. Подстановка о • (г,а) ¦ о меняет местами элементы а(а) и а (г), а все остальные элементы оставляет неподвижными, т. е. a -(i,a) a-1 = (o(t),o(a)) = {j,a(a)) e G.
220 Глава 5. Теория Галуа Таким образом, a(E(i)) с E(j), поэтому \E(i)\ < \E(j)\. Неравенство \E(j)\ < j J57(a) | доказывается аналогично. По условию число п простое, поэтому класс эквивалентности ровно один. Это означает, что G = Sn. ? Теорема 22.8. Пусть / — неприводимый многочлен над Q простой степени р, причем у / есть ровно два невещественных корня. Тогда группа Галуа многочлена / над Q равна Sp. Доказательство. Многочлен / неприводим, поэтому его группа Галуа G с Sp транзитивна. Согласно предыдущей теореме достаточно доказать, что группа G содержит некоторую транспозицию. Пример такой транспозиции дает ограничение комплексного сопряжения ги-г на поле разложения многочлена /. Действительно, при комплексном со- сопряжении все вещественные корни многочлена остаются на месте, а оба комплексных корня меняются местами (из этого, в частности, следует, что поле разложения переходит в себя). ? Примером неприводимого многочлена степени 5, у которого есть ровно два комплексных корня, служит многочлен f(x) = х5 - Ах + 2. Неприводимость этого многочлена следует из признака Эйзенштейна. Количество вещественных корней многочлена / не меньше трех, по- поскольку Я-2)<0, /@)>0, /A)<0, /B)>0. С другой стороны, количество вещественных корней не может быть больше трех, потому что иначе у производной f'(x) = ЪхА - 4 было бы больше двух вещественных корней. 22.3. Простые радикальные расширения Поле разложения К многочлена хп - с, где с е к, называют простым радикальным расширением поля к. Теорема 22.9. а) Группа Галуа G(K, к) простого радикального рас- расширения разрешима. б) Если поле к содержит примитивный корень степени п из единицы, то G(K,k) —подгруппа циклической группы Ъ/пЪ. в) Если с = 1, то G(K,k)—подгруппа мультипликативной группы (Z/nZ)". 22. Основы теории Галуа 221 Доказательство, а) Пусть а — корень многочлена х" - с, а е — примитивный корень степени п из единицы. Тогда корни многочлена хп -с имеют вид а, ае,..., ае", поэтому К с к(а, е). С другой стороны, е = (ае)оГ1 е К, поэтому к(а,г) с К, т.е. К = fc(a,e). Пусть о е G(/C, fc). Тогда о(е) — корень многочлена хп-1, т. е. о(е) = = еа. При этом еа не может быть корнем многочлена хт - 1, где т < п, так как иначе элемент е = a~1(za) тоже был бы корнем этого много- многочлена, а это противоречит примитивности е. Таким образом, (а,п) = 1. Автоморфизм о полностью определяется своими значениями на обра- образующих: о(е) = еа, о(а) = еьа. Поэтому такой автоморфизм о можно обозначить [а, 6], где а е (Z/nZ)*, 6 е Z/nZ. При этом если о, = [af,6j], г = 1,2, то т. е. о\О2 = [а\п2, aib2 + h]. Рассмотрим гомоморфизм ip:G(K, к) — (Z/nZ)*, при котором авто- автоморфизму о = [а,Ь] сопоставляется элемент a e (Z/nZ)*. Ядро этого гомоморфизма состоит из элементов вида [1,6]; для таких элементов закон композиции следующий: [1, &i][l, 62] = [1, bi + Ь2]. Ядро и образ го- гомоморфизма 9 — абелевы группы, поэтому группа G(K, к) разрешима. б) Если ? е к, то о(е) = е. Поэтому а = [1,6] е Z/nZ. в) Если с = 1, то можно считать, что a = 1. В таком случае о = = [a,0]e(Z/nZ)*. П 22.4. Циклические расширения Нормальное расширение К поля к называют циклическим расшире- расширением, если группа Галуа G{K,k) является циклической. Теорема 22.10. Если поле к содержит примитивный корень сте- степени п из единицы, то любое циклическое расширение К гэ к степени п имеет вид К = Jb(C), где р — корень неприводимого над к многочлена Доказательство. Нам потребуется свойство линейной независи- независимости характеров группы. Напомним его формулировку и доказатель- доказательство. Пусть G — группа, К — поле, К* — мультипликативная группа этого поля, т. е. множество ненулевых элементов с операцией умно- умножения. Характером группы G называют произвольный гомоморфизм G-*K*.
1 222 Глава 5. Теория Галуа Лемма. Различные характеры группы G линейно независимы над полем К. Доказательство. Пусть {Yi,.-.,Yn} — минимальное непустое множество линейно зависимых характеров, т. е. XiyiE) + -.. + XnynE)=O A) для всех д е G при некоторых фиксированных Xi,... ,Х„ е К*. Ясно, что п > 2. Характеры ух и у„ различны, поэтому yi(/i) Ф yn(h) для некоторого h e G. Умножим равенство A) на X7Jy7l(/i) и вычтем из него равенство Xiyi(/ip) + ... + X7Jy7l(/ip) = 0. После несложных преобразова- преобразований получим Xi(Yn№ - П№)yi(p) + ¦ • • + Xn_i(Yn(A) - yn-i(h))yn-i(g) = 0. Это противоречит минимальности множества {yi,..., у„}. П Если а — автоморфизм поля К, то ограничение о на К* является характером группы К*. Поэтому если о\,..., ап — различные автомор- автоморфизмы поля К и Oi,..., о„ е К*, то oiOi(o) + ... + апа„(а) ф 0 для некоторого а е К* с К. Перейдем непосредственно к доказательству теоремы. Пусть о — образующая циклической группы G(K, k),t — примитивный корень сте- степени п viz единицы, лежащий в к. Рассмотрим резольвенту Лагранжа (е, а)о = а + ео(о) + ... + е"^» ф 0. Автоморфизмы id, о, а2,..., о" различны, поэтому найдется элемент а е К, для которого (е, а)о = C Ф 0. Легко проверить, что а(C) = е-1р и а(C") = (о(р))" = рп. Таким образом, о(C) ^ C, т. е. р ^ Jb, и о''(C") = C" при г = 1,..., п — 1, т. е. C" = с е fc. Рассмотрим многочлен ж - с" = (ж - р)(ж - ер) •...- (х - е^р). Поле А:(р) является его полем разложения, причем А:(р) с К. Автомор- Автоморфизмы id, о, о2,..., оп~1 являются различными автоморфизмами поля &(р), поэтому порядок группы Галуа поля кф) над к не меньше п, т. е. степень расширения &(р) над к не меньше п. С другой стороны, сте- степень расширения К над к равна п, поэтому кф) = К. Группа Галуа многочлена хп - с транзитивна, поэтому он неприводим. ? 23. Решение уравнений в радикалах 223 23. Решение уравнений в радикалах Расширение L поля к называют радикальным, если существует такая последовательность промежуточных полей к = Lo с L\ с ... с Lr = L, что Li = Li_i(pi), где р"; е Lj_i. Иными словами, к полю к после- последовательно присоединяются корни из элементов полей, полученных на предыдущем шаге. Пусть / — неприводимый многочлен над полем к, ai,..., ап — его корни. Уравнение f(x) = 0 называют разрешимым в радикалах, если поле k(ai,... ,ап) содержится в некотором радикальном расширении поля к. Чтобы сформулировать и доказать критерий разрешимости урав- уравнения в радикалах, нам потребуется понятие разрешимой группы. По- Поэтому начнем с того, что напомним основные сведения о разрешимых группах. 23.1. Разрешимые группы Конечную группу G называют разрешимой, если существует такая последовательность вложенных подгрупп {е} = Gr с Gr-i с... с Go = G, что Gi — нормальная подгруппа в Gj_i и факторгруппа Gi-i/Gi абелева (при i = l,...,г). Для любой абелевой группы G можно построить последовательность вложенных подгрупп, для которой все факторгруппы Gj-i/Gj цикличе- циклические (и даже циклические простых порядков). Поэтому в определении разрешимой группы можно считать, что все факторгруппы G;_i/Gj ци- циклические. При выяснении связи разрешимости в радикалах уравнения f(x) = 0 и разрешимости группы Галуа многочлена / используется соответствие Галуа, которое дает точную последовательность 0 ->- Я -* G -+ G/H -*¦ 0. При этом про какие-то из этих трех групп бывает известно, что они разрешимы, и нужно сделать вывод о разрешимости остальных групп. Для этих целей мы будем пользоваться следующими утверждениями.
224 Глава 5. Теория Галуа Теорема 23.1. а) Любая подгруппа Я разрешимой группы G раз- разрешима. б) Пусть Я — нормальная подгруппа группы G, причем группы Н и G/H разрешимы. Тогда группа G разрешима. в) Пусть Я — нормальная подгруппа разрешимой группы G. Тогда группа G/H разрешима. Доказательство, а) Покажем, что последовательность подгрупп Hi = Gi Л Я обладает требуемыми свойствами, т.е. Я*—нормальная подгруппа в Hi-\ и факторгруппа Hi-i/Hi абелева. Так как G* с Gj_i, то Hi = Hi-i П Gi. Поэтому Hi — нормальная подгруппа в Hi-i и Щ-г/Щ = Щ-ЛЩ-! Л GO s GiHi-i/Gi с Gi-t/Gi. б) Для разрешимых групп Н и G/H возьмем последовательности подгрупп {е} = Я„ с Яп_! с...сЯо=Я, {Я} = Лга с Лга_! с ... czAo=G/H. Положим Gi = p~1(Ai), где p:G -*¦ G/H — естественная проекция. Ясно, что Gm = Я и Go = G. Покажем, что последовательность подгрупп {е} = Я„с Нп-1 с ... с Но = Я = Gm с Gm-i с ... с Go = G обладает требуемыми свойствами, т. е- Gj — нормальная подгруппа в Gi-i и Gi-i/Gi — абелева группа. Второе свойство следует из того, что Gi-i/d ~ Ai-x/Ai. Пусть gt <= Gt и &_i e G,-i. Тогда так как Л^— нормальная подгруппа в A,-i. Поэтому 9^}x9i9i-i e Gi, т. е. Gj — нормальная подгруппа в Gj_i. в) Для разрешимой группы G возьмем последовательность подгрупп {е} = Gr с Gr_i с ... с Go = G, и положим Л, —GiH/И. Тогда последовательность подгрупп {Я} = Ат с Д._1 с ... с Ло = G/Я обладает требуемыми свойствами, т. е. Ai — нормальная подгруппа в Ai-x и Ai-i/Ai—абелева группа. В самом деле, пусть gtH e Ai и gi-iH e Ai-x. Тогда xH)~l = g^iHgiHg^ = gi-xgig^H e Л,-. 23. Решение уравнений в радикалах 225 Кроме того, iH n Gi_i) s {Gi-XIGi)l{{GiH n Gi- т.е. группа Л{_х/Л^ изоморфна факторгруппе абелевой группы, по- поэтому Л,_ 1 /Лj — абелева группа. ? 23.2. Уравнения с разрешимой группой Галуа Воспользовавшись соответствием Галуа и теоремой 22.10 о струк- структуре циклического расширения, нетрудно доказать, что уравнение с разрешимой группой Галуа разрешимо в радикалах. Теорема 23.2. Пусть / — многочлен без кратных корней над по- полем к, причем группа Галуа G^(/) разрешима. Тогда уравнение / = 0 разрешимо в радикалах. Доказательство. Если поле к не содержит примитивный корень степени d = |G/t(/)| из единицы, то добавим к к примитивный корень ? степени d из единицы, т. е. рассмотрим поле L — к(г). Группа Галуа GlU) изоморфна некоторой подгруппе разрешимой группы Gk(f), по- поэтому группа Gi(/) разрешима, причем |Gl(/)| делит d. В частности, поле L содержит примитивные корни из единицы любой степени, деля- щей |Gl(/)|. Для разрешимой группы Gl{/) построим последовательность под- подгрупп для которой факторгруппы Gj_i/Gj циклические. Соответствие Галуа позволяет построить последовательность полей К = Lr :э ... r> Lo = L, где К — поле разложения многочлена / над L. При этом расширение Li => L,_i нормально, поэтому последовательность полей К г> Ьг гэ L,_i дает точную последовательность 0 - G(K, Li) - G(K, Li-x) - G(Lh L^x 0. Следовательно, G(Li,Li_i) = G(K,Lt-i)/G(K,Li) = Gi-x/Gi — цикли- циклическая группа, порядок которой делит |Gl(/)|. Учитывая, что поле 8 - 1010
226 Глава 5. Теория Галуа Lj-i ^ L содержит примитивный корень из единицы степени di = = \G(Li,Li^i)\, получаем, что Lt = Lj-^pj), где pj— корень много- многочлена xdi — ct, ct e Lf-i- Таким образом, Li — радикальное расширение поля L,-!, а значит, К — радикальное расширение L. Ясно также, что L — радикальное расширение к. Поэтому поле разложения многочлена / является радикальным расширением поля к, т. е. уравнение / = 0 раз- разрешимо в радикалах. ? 23.3. Уравнения, разрешимые в радикалах Мы только что доказали, что если группа Галуа уравнения разре- разрешима, то это уравнение разрешимо в радикалах. Докажем теперь обрат- обратное утверждение. Теорема 23.3. Пусть / — многочлен без кратных корней над по- полем к, причем уравнение / = 0 разрешимо в радикалах. Тогда группа Галуа Gk (/) разрешима. Доказательство. По условию для некоторого поля L, содержащего все корни многочлена /, имеется такая последовательность полей L = Lr =>...=> Lo = к, A) что Li = Lj_i(Cj), где C"( е L,_i. Расширение L z> к при этом не обязательно нормально, поэтому непосредственно воспользоваться со- соответствием Галуа нельзя. Начнем с того, что построим радикальное расширение К => L, для которого расширение К z> к нормально. Применим индукцию по г. При г = 0 утверждение очевидно, по- поэтому по предположению индукции можно считать, что мы уже постро- построили радикальное расширение Кг-\ :э Lr_b для которого расширение .Kr-i г> к нормально. Положим К' - Кг-Х и V = К'фг) z> L. Шаг индукции заключается в доказательстве следующего утверждения. Лемма. Пусть К' z> к — нормальное расширение и!' = К'ф), где р" е К'. Тогда существует такое радикальное расширение К => V, что расширение К z> к нормально. Доказательство. Рассмотрим неприводимый над к многочлен д(х) с корнем [Зп е К'. Расширение К' => к нормально, поэтому все корни многочлена д(х) лежат в К'. Положим h(x) - д(хп) и рассмотрим 23. Решение уравнений в радикалах 227 поле К — поле разложения многочлена h над К'. Покажем, что поле К обладает всеми требуемыми свойствами. 1. Расширение К n fc нормально. Действительно, расширение К' ^>к нормально, поэтому К' — поле разложения над к некоторого многочлена ф(аг). В таком случае К — поле разложения над к многочлена h(x)(f(x). 2. К => V = К'ф). Действительно, К' с К по определению и^еК, так как Лф) = дфп) =0. 3. Расширение К => L' радикально. Пусть р — корень многочлена h(x). Тогда Р" — корень многочлена д(х), поэтому Р" е К' с V. Оста- Остается заметить, что поле К получается в результате присоединения к полю V всех корней р многочлена h(x). ? Итак, можно считать, что в A) поле L — нормальное расширение поля к. Более того, можно считать, что числа щ простые и степень рас- расширения Li => Li-i равна тц (присоединение корня степени pq можно заменить на присоединение корня степени р и последующее присоедине- присоединение корня степени q). Из нормальности расширения L => к следует нормальность расши- расширения L => Lj_i. Коэффициенты многочлена хП{ — р"; лежат в Lj_i, a его корень р* лежит в L, но не лежит в L,-i- Поэтому у многочлена xni — p"' есть неприводимый над L;_i делитель с корнем р,, причем этот делитель отличен от х — рг- Следовательно, поле L содержит ко- корень многочлена хП{ - C"', отличный от р,, а значит, поле L содержит примитивный корень из единицы степени щ (мы пользуемся тем, что rii — простое число). Поле L содержит примитивные корни из единицы всех степеней щ, поэтому оно содержит примитивный корень е из единицы, степень ко- которого делится на все гц. Положим L\ = Lj(e) и рассмотрим последова- последовательность подполей L = L'r z> L'r_x -d ... => L'o = L0(e) з Lo = к. Соответствие Галуа дает последовательность подгрупп {е} - G{L, L'r) с G(L, L'r_x) с... с G(L, L'o) - G(L, k(t)) с G(L, к). Расширение L\ => L'i_1 нормально, поскольку L\ — поле разложения над L\_x многочлена xni - р™'. Поэтому последовательность полей L\_x с L\d L дает точную последовательность групп 0 - G(L,L\) - G(L,LU) 0-
I 228 Глава 5. Теория Галуа Таким образом, GfL.LJ.J/GCL.LJ) = G^V^) —циклическая груп- группа порядка щ. Следовательно, G(L,k(z)) —разрешимая группа. Следующий шаг — доказательство разрешимости группы G(L,k). Расширение k(z) z> к нормально, поэтому для последовательности по- полей к с k(z) с L получаем точную последовательность групп О - G(L, k(z)) - G(L, к) - G(*(e), к) - 0. Группа G(k(z),k) абелева (теорема 22.9 (в) на с. 220), поэтому группа G(L,k) разрешима. Последний шаг — доказательство разрешимости группы G*(/) = = G(N,k), где N — поле разложения многочлена / над jb. Последова- Последовательность полей k<zNcl дает точную последовательность групп 0 - G(L, N) - G(L, к) -+ G{N, к) - 0. Таким образом, G(N,k)—факторгруппа разрешимой группы G(L,k), а значит, она сама разрешима. ? Пример. Уравнение неразрешимо в радикалах. х5 - 4х + 2 = 0 Доказательство. Группа Галуа многочлена хъ - Ах + 2 = 0 над Q равна 55 (см. с. 220). Остается доказать, что группа 55 неразрешима. Прежде всего заметим, что если Я с G — такая нормальная подгруппа, что группа G/H абелева, то для любых х,у е G элемент хух~ху~х лежит в Я. В группе 55 есть нормальная подгруппа А5, состоящая из четных подстановок. Легко проверить, что любой элемент группы Аь можно представить в виде хух~ху-х, где х, у е Аь. В самом деле, любой элемент группы Аь является либо циклом длины 5, либо циклом длины 3, либо произведением двух транспозиций (ij)(kl) с попарно различными i,j, к,1. Для цикла A2345) положим х = A2534) яу = A2)C5); для цикла A23) положим х = A23) и у = B3)D5); для элемента A2)C4) положим х = A4)B3) и у = A23). Таким образом, если Я с 55 — нормальная подгруппа и группа S5/H абелева, то Я = Аь (или 55). Но в Аь уже нет нормальной подгруппы К, для которой факторгруппа А5/К абелева. ? 23. Решение уравнений в радикалах 229 23.4. Абелевы уравнения В мемуаре «О специальном классе алгебраически разрешимых урав- уравнений» Абель доказал три важных утверждения, относящихся к разре- разрешимости уравнений в радикалах. 1. Если один из корней неприводимого многочлена / рационально выражается через другой корень, то решение уравнения f(x) =0 сво- сводится к решению нескольких уравнений меньшей степени. 2. Если корни неприводимого многочлена / имеют вид х\, Q(xi), Q2(xi) = 0(G(ari)),... ,e"~1(a:i), где 0 — такая рациональная функция, что Qn(xi) = xi, то уравнение f(x) = 0 решается в радикалах. 3. Если корни неприводимого многочлена / имеют вид х\, 62B:1), 63(х\),..., Qn(xi), где 9; — такие рациональные функции, что QiQj(xi) = = 9j9i(xi), то уравнение f(x) =0 решается в радикалах. Более того, если cleg/ = р .. .р%к, то решение уравнения f(x) = 0 сводится к ре- решению п\ уравнений степени pi, ..., Пк уравнений степени Pk- Многочлен /, участвующий в формулировке утверждения 3, назы- называют абелевым, а уравнение f(x) = 0 называют абелевым уравнением. Группа Галуа многочлена g абелева тогда и только тогда, когда резоль- резольвента Галуа многочлена g является абелевым многочленом. Таким обра- образом, теорема Абеля является частным случаем теоремы Галуа: уравне- уравнение с абелевой группой Галуа разрешимо в радикалах. Тем не менее, методы Абеля сохраняют определенное значение, потому что предло- предложенное им решение абелевых уравнений достаточно конструктивно. Многочлен /, участвующий в формулировке утверждения 2, будем называть циклическим абелевым. У такого многочлена группа Галуа циклическая. Для решения циклических абелевых уравнений Абель применил ме- методы, разработанные Лагранжем и Гауссом. Его заслуга состоит в том, что он выделил наиболее общий класс уравнений, к которым применимы эти методы. Кроме того, занимаясь теорией эллиптических функций, Абель нашел новый интересный пример циклического абелева уравне- уравнения, а именно, уравнение деления лемнискаты. Современное доказатель- доказательство того, что уравнение деления лемнискаты является циклическим абелевым уравнением, приведено в [ПрС]. Начнем с утверждения 1. Оно относится к многочленам специаль- специального вида, но с произвольной группой Галуа. Действительно, у резоль- резольвенты Галуа любого многочлена все корни рационально выражаются через один из корней.
230 Глава 5. Теория Галуа Теорема 23.4. а) Пусть / — неприводимый многочлен над полем к (нулевой характеристики), один из корней которого рационально выра- выражается через другой корень. Тогда корни многочлена / можно записать в виде таблицы: х\, xl2=B(x\), r*^-1^), х?, х2п=В(х?), ..., з$=Ф-1(хГ), где 0 — такая рациональная функция, что Qp(x\) = х\, i = 1,..., т. б) Решение уравнения / = 0 сводится к решению уравнения д — 0 степени т с коэффициентами из поля к и циклических абелевых урав- уравнений hi = 0,..., hm = 0, где hi — многочлен степени р, коэффициенты которого рационально выражаются (над полем к) через корень у{ мно- многочлена д. Доказательство, а) Пусть xi,...,xn — корни многочлена / и х2 = = O(ari), где 0 — рациональная функция. Рассмотрим многочлен ф(х) = п = П {х ~ ®(xi))- Коэффициенты этого многочлена являются симметри- »=i ческими функциями от х\,...,хп, поэтому они принадлежат полю к. Многочлены / и ср имеют общий корень х2 — 0(ii). Но многочлен / неприводим и deg/ = deg<p, поэтому Q(xi),... ,В(хп) — некоторая пере- перестановка чисел х\,.. ¦ ,хп, т. е. каждому корню Xi однозначно соответ- соответствует такой корень Xj, что Xj = В(хг). Рассмотрим всевозможные циклы Xi,Q(xi),Q2(xi),... ,0р-1(а;г), где Qp(xi) = X,. Ясно, что любые два цикла (как множества) либо не пере- пересекаются, либо совпадают. Остается лишь доказать, что у всех циклов длина одна и та же. Пусть р — наименьшая длина цикла. Если Вр(х) = х для всех х, то все циклы имеют длину р. Если же Вр(х) ф х, то урав- уравнения 0р(аг) = х и f(x) = 0 имеют общий корень. Из неприводимости многочлена / следует, что 0p(a;i) = Xi для всех i = 1,..., п, поэтому все циклы имеют длину р. б) Чтобы избежать громоздких обозначений, будем считать, что р = = 3 и т = 4. В общем случае доказательство то же самое. Таблицу корней можно записать в виде х3 = Q2(xi), х6 = 92(аг4), х9 = В2(х7), х12 = 02(х1О). xi, х2 = ( Xi, хь= 9(х4), х7, xs = В(х7), х10, хп=9(хю), 23. Решение уравнений в радикалах 231 Пусть q — произвольный симметрический многочлен от трех перемен- переменных над полем к. Тогда <р(хг) = gfci.efrO.e^Zi)) = q{Q(x1),B2(x1),x1) = ф2). Аналогично (p(xi) = <p(x3). Таким образом, если то (f(xi) = if(x2) = (f(x3)=qi, 9B:4)= 9B5) = <?{х6) =q2, 9B:7) = 90*8) = 9(^9) = Чз, <?(хю) = <?(хц) = <?(хи) = 94- 12 1 Поэтому G1+<72 + <7з+<74 = х 5Z f(xi) e ^- Рассматривая вместо функции q функции q2,q3,q4, получаем, что к. Это означает, q фу что коэффициенты многочлена Y[(v ~ Яг) лежат в поле к. Если ) еще один симметрический многочлен от трех переменных, то можно рассмотреть симметрические многочлены rql, I = 0,1,2,3. Определим г* точно так же, как qt. Система уравнений nq{ + r2ql2 + + гз9з "+" Г4?4 = ^ь гДе I = 0,1,2,3 я Щ е к, показывает, что г* = Ф(дг), где Ф — некоторая рациональная функция (одна и та же для всех г). Пусть q = <i + t2 + t3, r = t\t2 + t2tz + hh и г = tit2t3. Тогда q1 = xi + х2 + Х3 — 2/i (корень многочлена \[(у - <&)), п = х\х2 + + x2x3+x3xi = Ф(гл) иг! =хгх2х3 = ФB/0- Поэтому xi,x2,x3 — корни уравнения х3 -у1х2+Ф(у1)х-Ф(у1) = 0, где Ф и Ф — рациональные функции. Это уравнение является цикличе- циклическим абелевым, поскольку х2 = 0(xi), х3 = 62(a;i) и Xi = 93(a;i) D Теорема 23.5. а) Абелево циклическое уравнение разрешимо в ра- радикалах. б) Решения абелева циклического уравнения степени п = рта сво- сводится к решению двух абелевых циклических уравнений степеней р и т. Доказательство, а) Пусть / — абелев циклический многочлен степени п с корнями xi,...,xn; е — примитивный корень степени п из единицы; 9 — такая рациональная функция, что xk+i = 9* B:1) и х\ = Вп(х\). Рассмотрим резольвенту Лагранжа (zr,xx) = Xl+ г'Цхг) + г2гВ2(хг) + ... + е*"-1^"-1^*!).
232 Глав а 5. Теория Галуа Так как xk+i = 9*(an), то (tr,xk+1) = е*(х:) +trBk+1(Xl) + e2rO*+2(x1) + ... = Ясно, 4toO*+5(xi) = ц при s = n-fc, поэтому (ег,х*+1) = e("-*>r(er,xi). В частности, (tr,xk+1)n = (zr,xi)n. Следовательно, >,)" = ur(e), где мг — рациональная функция. Таким образом, при г = 1, ..., n - 1. Кроме того, для г = 0 получаем Xl + х2 + ... ...+хп = -ai, где ai — коэффициент многочлена / при х". Сложим все равенства дляг = 0,1,...,п-1. Сумма коэффициентов при ц будет равна п, а сумма коэффициентов при Вт(х1), 1 < т < п-1, будет равна е2га = о. Итак, Если же равенство с номером г домножить на е-*г, то аналогично лучим ПХк+1 = Oi + ? Несложно получить и чуть более точное выражение: пхк+1 =аг+у + А2у2 + ... + An-iyn~l, = е по- погде у = е ^/Ы1 (е), Л2)..., Л„_! — постоянные величины, рационально выражающиеся через е. Действительно, _ Y ~ Это означает, что Аг рационально выражается через е и симметриче- симметрические функции от ari,..., хп. 23. Решение уравнений в радикалах 233 б) Чтобы избежать громоздких обозначений, будем считать, что р 3 и т = 4. В общем случае доказательство то же самое. Пусть = xi +x5+x9 =xi +04(a:i)+e8(a:i), ю = Q(xi) + 05(ari) + O9(ari), п = e2(an) + &(Xl) + 910(xi), = х2 х6 x7 В рассматриваемой ситуации выполняются условия теоремы 23.4 (с за- заменой 9 на О4), поэтому xi, 04(xi) h08(xi) — корни циклического абелева уравнения степени р = 3, коэффициенты которого являются рациональ- рациональными функциями от j/i- Кроме того, у\,у2,уъ и j/4—корни уравнения степени т = 4 с рациональными коэффициентами. Нужно лишь дока- доказать, что это уравнение является циклическим абелевым. Пусть qi(x) = (еы + е5(х!) + е9(х:)) (Xl + в4(Х1) + е8(хх))г. Тогда qi(xi) = у2у[. Кроме того, (xe + хю + х2){хъ + х9 + xi)' Аналогично qi(xg) = qi{x$). Аналогичные рассуждения показывают, что 2/32/2 = 4i(x2) = qi{xe) = qi{xio), = qi(xu), 2/12/i = 4i{xi) = qi(xs) = qi{x\2). з = /i = 1 12 Следовательно, y2y[ + y3yl2 + j/42/з + 2/i2/l = т E 4i(xi) e А. Система * »=i уравнений y2y' + ... + j/12/4 = Tt, где / = 0,1,2,3 и 7] e fc, показывает, что j/2 = 9B/i), 2/3 = 9B/2), 2/4 = 9B/3) и j/i = 9B/4)- D Следствие. Циклическое абелево уравнение степени 2™ решается в квадратных радикалах. 23.5. Критерий Абеля-Галуа разрешимости уравнения простой степени Эварист Галуа погиб на дуэли, не успев опубликовать своих основ- основных исследований по теории разрешимости уравнений в радикалах. Но некоторые свои результаты он всё же успел опубликовать. В небольшой
234 Глава 5. Теория Галуа заметке в «Bulletin des Sciences mathematiques» A830) Галуа сообщал, что он пришел к следующему результату: , Для того чтобы уравнение простой степени решалось в радикалах, | необходимо и достаточно, чтобы при знании двух каких-нибудь его кор- корней остальные выводились из них рационально. % Интересно отметить, что в 1828 г. Абель писал Креллю, что он на- 1 шел критерий разрешимости в радикалах уравнения простой степени. \ Абель сформулировал свой критерий почти так же, как и Галуа: «В ,j любой тройке корней один корень должен рационально выражаться че- через два других». Но никаких свидетельств о доказательстве Абеля не сохранилось. ТЕОРЕМА 23.6. а) Неприводимое над Q уравнение / = 0 простой степени р разрешимо в радикалах тогда и только тогда, когда его корни можно занумеровать так, что любая подстановка о из группы Галуа будет иметь вид о(г') = ai + b (mod p), где а ф 0 (mod p). б) Неприводимое над Q уравнение / = 0 простой степени р раз- разрешимо в радикалах тогда и только тогда, когда все его корни ра- рационально выражаются через любые два корня. (Иными словами, если Oi,..., <хр — корни уравнения, то Q(oi,..., ор) = Q(aj, а,) для любых раз- различных i и j). Доказательство, а) Для указанной группы закон умножения имеет вид [ai,bi] [0.2,^2] = [01012,011^2 +bi]. Разрешимость такой группы доказана в теореме о простых радикальных расширениях (теорема 22.9 на с. 220). Поэтому остается доказать, что если неприводимое урав- уравнение простой степени р разрешимо в радикалах, то его группа Галуа состоит из преобразований указанного вида. При доказательстве теоремы об уравнениях, разрешимых в радика- радикалах, было показано, что для разрешимого в радикалах уравнения / = 0 существует последовательность радикальных расширений простых сте- степеней L = L'r^ L;.! d...3LJ = L0(e) => U = Q, где e — примитивный корень из единицы степени [L : Q], расширение L =) Q нормально и поле L содержит поле разложения N многочлена /. При этом G(N,Q) —факторгруппа G(L,Q) no G(L,N). Поэтому доста- достаточно доказать, что любой автоморфизм поля L над Q переставляет корни многочлена / указанным выше образом, т. е. корень с номером i заменяется на корень с номером ai + b. 23. Решение уравнений в радикалах 235 Можно считать, что поле L'r_1 содержит не все корни многочлена /. Доказательство теоремы основано на том, что многочлен / неприводим над L'r_l и степень расширения L r> L'r_1 равна р. Это означает, что до самого последнего радикального расширения многочлен / остается неприводимым, а на последнем шаге он сразу разлагается на линейные множители. Требуемое утверждение очевидным образом вытекает из следующей леммы. Лемма. Пусть многочлен / неприводим над полем к, содержащем примитивный корень из единицы степени q, где q — простое число. Пусть, далее, К = кф), где C* е к. Тогда многочлен / над полем К либо неприводим, либо разлагается на q неприводимых множителей одинаковой степени. Доказательство. Пусть L — поле разложения многочлена / над к. Поле к содержит примитивный корень степени q из единицы, поэтому L(C) — поле разложения многочлена / над кф). Последовательности расширений Ьф) z> кф) п к и Ьф) гэ L гэ к дают точные последовательности 0 - С(Ьф), кф)) - С(Ьф), к) - С(кф), к) - 0, G(L,k) Поэтому \С{Ьф),кф))\ = \G(L,k)\ Согласно теореме 22.5 (см. с. 218) группы С(Ьф),кф)) и G(L([3),L) являются, соответственно, подгруппами в G(L,k) и G(fc(C),fc). Кроме того, согласно теореме 22.9 (б) на с. 220 группы G(L(j3),L) и С!(кф),к) являются подгруппами группы Z/gZ. По условию q — простое число. Поэтому в Z/gZ нет нетривиальных подгрупп, а значит, =1илиG, причем индекс равен q лишь в том случае, когда группа G(L(j3), L) три- тривиальна, т.е. G(L(C),fc) =* G{L,k). В этом случае G(L(p),fc(C))—нор- G(L(p),fc(C))—нормальная подгруппа в G(L, к) индекса q.
236 Г л ава 5. Теория Галуа Напомним, что многочлен (без кратных корней) неприводим тогда и только тогда, когда его группа Галуа транзитивно действует на корнях (теорема 22.6 на с. 219). Поэтому нужно рассмотреть лишь случай, ко- когда Н = G(L(P), кф)) — нормальная подгруппа в G = G(L, к) индекса q. В этом случае G/H й Z/gZ, поэтому G = {Н,дН,д2Н,.. .,gq-xH} для некоторого д е G. Пусть ai,..., я„ — корни многочлена /. Положим Hat = {h(cti) | h e H]. Множества Hcti и Holj либо совпадают, либо не пересекаются. Поэтому множества Н<Х\ и дН<Х\ = Нд{<Х\) либо совпа- совпадают, либо не пересекаются. В первом случае группа Н действует на множестве корней транзитивно, а во втором случае множество корней разбивается на q подмножеств одинаковой мощности, на каждом из ко- которых группа Н действует транзитивно. Пусть п = rqw. H транзитивно действует на множестве я^,..., а*,. Тогда Я сохраняет все коэффици- коэффициенты многочлена (аг—я^)-.. .-(х-я*,), азначит, этот многочлен является неприводимым многочленом над полем кф). ? Итак, многочлен / неприводим над полем L'r_1 и разлагается над по- полем L'r = LJ._1(C), где р* е L'r_1, на линейные множители. Это означает, в частности, что q = р. Таким образом, L — L'r — циклическое расши- расширение степени р поля Ь'г_г, причем поле Ыг_1 содержит примитивный корень степени р из единицы. Следовательно, G(L, LJ.^) = Z/pZ. Пусть а — образующая этой группы. Корни ai,..., яр многочлена / можно за- занумеровать так, что a(i) = i + 1, т. е. а переводит я, в я$+1. Группа G{L,L'r_i) является нормальной подгруппой в G(L,L'r_2). Пусть т— произвольная подстановка из группы G(L,L'r_2). Тогда тот е G(L,LJ._j), т.е. тот = аа для некоторого а. Это означает, что то(г) = оат(г'), т. е. т(г + 1) = т(г) + а. Таким образом, тB) = тA) + а, тC) = тB) + а = тA) + 2а, т(г) = тA) + (г - 1)а = ai + (тA) - а) = аг + Ь, где Ь = тA) — о. Подстановка т имеет требуемый вид. Докажем теперь, что если в группе G(L, L'm) все подстановки имеют вид т(г) = аг + Ь, то в группе G(L, L'm_1) все подстановки тоже имеют такой же вид. Для доказательства мы воспользуемся тем, что G(L, L'm) содержит подстановку a(i) = г +1 и G(L, L'm) является нормальной под- подгруппой в G(L, L'm_1). Пусть и. — произвольная подстановка из группы 23. Решение уравнений в радикалах 237 G{L,Vm_x). Тогда uou 1 e G(L,L'm), поэтому uou^) - ai + b. Для j = и-1(г) получаем \io(j) = au(j) + Ь, т. е. u(j + 1) = au(j) + b. Прежде всего докажем, что a = 1. Действительно, (лB) = au(l) + Ь, uC) = auB) +b = a !лD) = auC) +Ь = а3аA) a2b + ab + b, Следовательно, u(l) = u(p+l) = apu(l) + (ap~1 +ap~2 + .. . + a+l)b, т. е. A - ap)u(l) = (a" + ap~2 + ... + a + 1N (mod p). Умножим обе части на 1 — а и воспользуемся тем, что ар = a (mod p). В результате получим A - aJu(l) = A - а)Ь (mod p). Если а ф 1 (mod р), то иA) = A — a)~x6 (mod p). Но тогда те же самые рассуждения показывают, что иB) = A — a)~1b (mod p), чего не может быть. б) Если неприводимое уравнение простой степени разрешимо в ради- радикалах, то его группа Галуа состоит из преобразований вида г >->- ai + 6. Любое преобразование такого вида, имеющее две неподвижные точки, тождественно. Это означает, что после присоединения двух корней с^ и а^ группа Галуа сводится к тождественному преобразованию, т. е. все корни лежат в Q(aj, я^). Предположим теперь, что для любых двух различных корней я, и я^- поле Q(aj,aj) содержит все остальные корни. Это означает, что если преобразование из группы Галуа оставляет неподвижными два корня, то оно оставляет неподвижными и все остальные корни, т. е. любое нето- нетождественное преобразование имеет не более одной неподвижной точки. Группа Галуа G транзитивно действует на р-элементном множестве {я1,..., яр}, поэтому \G\ делится на р. Лемма. Если число элементов группы G делится на простое число р, то группа G содержит элемент порядка р.
238 Глава 5. Теория Галуа Доказательство. Пусть \G\ = п — тр. Применим индукцию по т. При т = 1 утверждение очевидно. Если в G есть собственная под- подгруппа Я, для которой индекс [G : Я] не делится на р, то \Н\ де- делится на р и можно воспользоваться предположением индукции. По- Поэтому можно считать, что индекс любой собственной подгруппы де- делится на р. Для х е G рассмотрим подгруппу Nx — {д е G дхд~1 = х} и класс сопряженных элементов Gx = {дхд * | д е G}. Ясно, что \GX\ = — [G : Nx]. Классы сопряженных элементов либо не пересекаются, либо совпадают, поэтому п = щ + ... + пв, где щ — число элементов в г-м классе сопряженности. По условию число щ либо равно 1, либо делится нар. Если щ = 1, то соответствующий элемент х коммутирует со всеми элементами группы G, т. е. лежит в ее центре Z(G). Количество rii, рав- равных 1, делится на р и отлично от нуля (единичному элементу группы соответствует п, = 1), поэтому Z{G)—абелева группа, порядок кото- которой делится на р. Следовательно, в Z(G) есть элемент порядка p. D Элемент а порядка р в группе G с Sp является циклом длины р. После перенумерации корней можно считать, что a(i) = i +1. Покажем, что элемент а порождает в G нормальную подгруппу. Пусть х е G. Тогда хох ф id и (xox-1)p = id, т.е. хох—цикл длины р. Пусть хах-1(г) = г + а(г) = оа'г'(г). У цикла длинырв группе Sp не может быть неподвижных точек, поэтому a(i) ф О для всех г. Таким образом, функ- функция a(i) на р-элементном множестве принимает не более р-1 различных значений, поэтому некоторое значение а она принимает в двух различ- различных точках г и j. Это означает, что преобразование a~aioi~1 имеет две неподвижные точки. Но любое преобразование из группы G, име- имеющее две неподвижные точки, тождественно. Поэтому хох~1(г) = аа. Из равенства хох (г) = оа следует, что х(г') = аг + Ь, где Ь = хA) — а. Группа, состоящая из подстановок такого вида, разрешима. ? Следствие (Кронекер). Если неприводимое над Q уравнение про- простой степени р > 3 разрешимо в радикалах, то количество его веще- вещественных корней равно 1 или р. Доказательство. Число р нечетно, поэтому уравнение степени р имеет хотя бы один вещественный корень. Если разрешимое в радика- радикалах уравнение простой степени р имеет два вещественных корня а* и ау, то все его корни лежат в Q(oLi, а,-) с Ж. ? ill Г 24- Вычисление групп Галуа 239 24. Вычисление групп Галуа 24.1. Дискриминант и группа Галуа Теорема 24.1. Пусть Ап с Sn—знакопеременная группа (т.е. группа четных подстановок), / е Z [х] — неприводимый многочлен сте- степени п со страшим коэффициентом 1. Тогда группа Галуа многочлена / над Q содержится в Ап в том и только том случае, когда дискриминант D(f) является полным квадратом. Доказательство. Пусть oi,...,an — корни многочлена /. Тогда D(f) = Y\ (я» - ajJ- Рассмотрим число 8 = 8(/) = П (ai ~ aj)- Если а е Gq(f), то По условию многочлен / неприводим. Поэтому, в частности, 8^0. Следовательно, все автоморфизмы о е Gq(f) сохраняют 8 тогда и только тогда, когда Gq(f) сЛ„.С другой стороны, все автоморфизмы а е Gq(f) сохраняют 8 тогда и только тогда, когда 8 е Q. ? Пример. Пусть f(x) = х3 + ах2 + Ьх + с — неприводимый многочлен над Z, D—его дискриминант. Тогда Gq(f) = Л3, если y/D e Q, и Gq(f) = S3, если у/3 ф Q. Доказательство. Многочлен / неприводим, поэтому группа Га- Галуа Gq(f) транзитивна. В 5з есть только одна транзитивная группа, отличная от 5з, а именно, Л3. ? 24.2. Резольвентные многочлены Пусть ф е Щх1 ,...,хп] и G<p — группа, состоящая из подстановок а е Sn, для которых скр = ф, т. е. ?(ЯОA), ¦ • • )Яо(п)) = <?(Х1,. ¦ ¦ ,Хп). Под действием элементов Sn из функции ф получаются различные функ- функции фх = ф, ф2 = Х2ф, ...,9т = Хт9- При ЭТОМ ГП = |Sn|/|G<p|. Пример 24.1. Если ф = х\Х2+х$хь, то G9 состоит из тождественной подстановки и подстановок A2), C4), A2)C4), A3)B4), A4)B3), A324) И A423). При ЭТОМ ф2 = Х\Хз + ХъХц И ф3 = Х\Х\ +
240 Глав а 5. Теория Галуа Легко проверить, что G9i cpi эквивалентно равенству G tpXj 1. В самом деле, равенство стер* = = Tj(p. Поэтому т^от, е G9i, т.е. Пусть f(x) = хп + an-ia;" + • • • + «о — многочлен с целыми коэф- коэффициентами и ср е Z[xi,...,xn]. Определим группу G9i и многочлены ф1> • • • >фт> как и выше. Резольвентным многочленом называют много- многочлен т Res(cp,/)(a;) = JJ(x-<p,- где oti,..., an — корни многочлена /. Коэффициенты резольвентного многочлена целые, поэтому его мож- можно вычислить, приближенно вычислив корни многочлена /. (Коэффи- (Коэффициенты резольвентного многочлена вычисляются с достаточной точно- точностью и округляются до ближайшего целого числа.) Теорема 24.2. Пусть резольвентный многочлен Res(cp, /) не имеет кратных корней. В таком случае группа Галуа многочлена / над Q со- содержится в группе, сопряженной группе G9, тогда и только тогда, когда многочлен Res(cp, /) имеет целочисленный корень. Доказательство. Предположим сначала, что где ер, = тер. Тогда число cpj(cti,..., an), являющееся корнем многочлена Res(cp, /), сохраняется под действием всех преобразований из группы Га- Галуа, поэтому оно рационально. Но числа cti,..., an — целые алгебраиче- алгебраические, а коэффициенты многочлена ср* целые, поэтому число cpj(oti,..., an) целое. Предположим теперь, что число <p,-(ai,...,an) целое. По условию у резольвентного многочлена нет кратных корней. Это означает, что если то \Jxaxi e G<p. Любая подстановка а из группы Галуа сохраняет целое число (pj(ai,...,а„), поэтому для нее г = j, т.е. а е XiG^xi1. ? Воспользовавшись теоремами 24.1 и 24.2, можно вычислить группу Галуа любого неприводимого многочлена f{x) = х4-\-а1Х3+а2х2+азх+а4 24- Вычисление групп Галуа 241 с целыми коэффициентами. Прежде всего заметим, что в 54 с точностью до сопряженности есть лишь следующие транзитивные подгруппы: 1) вся группа 54; 2) знакопеременная группа Л4; 3) группа диэдра порядка 8, описанная в примере 24.1; эту группу обозначим ?>4; 4) группа Клейна порядка 4, состоящая из подстановок A2)C4), A3)B4) и A4)B3); эту группу обозначим V4; 5) циклическая группа Z4, порожденная циклом A234). Имеют место следующие включения: Vi a D4 n Л4 и Z4 с ?>4, причем Z4 ? Л4. Вычисление группы Галуа начнем с того, что вычислим дискрими- дискриминант D многочлена / и результантный многочлен Res((p,/)(a;) для ф = = Х\х2 + Х3Х4. Несложные вычисления показывают, что Res^, f)(x) = х3 — а2х2 — (aia3 - 4а4)а; — сца\ — 4a4a2 - a3. Легко проверить, что у многочлена Res(cp, f)(x) нет кратных корней. Пусть, например, ctia2 + a3a4 = txia3 + a2a4. Тогда (otj - a4)(a2 - a3) = 0. Но у многочлена / нет кратных корней, поэтому oti ф а4 и а2 ф а3. Если у результантного многочлена нет целочисленных корней, то группа Галуа равна 54 или Л4. Различить эти группы можно с помощью дискриминанта D: если D — полный квадрат, то группа Галуа равна Л3; в противном случае она равна 54. Если же у результантного многочлена есть целочисленный корень, то группа Галуа равна Z4, V4 или ?>4. Из этих групп только F4 содержится в .44. Поэтому если у/Т) — целое число, то группа Галуа равна V^; в противном случае она равна Z4 или ?>4. Различить группы Z4 и ?>4 можно с помощью резольвентного мно- многочлена, построенного по функции ср = Х\х\ + Х2х\ + х3х\ + х4х2, для которой G(p = Z4. Но в этом случае у резольвентного многочлена (степени 6) уже могут быть кратные корни. Например, равенство a2a3 a3a4 + <x3a2 эквивалентно равенству - 02)(аз + а4) + a3a4 = 0. A)
242 Глава 5. Теория Галуа ,хп) = . ,хп) = - ... - mnao(n)) искомый. В самом деле, если т 0 G, то многочлены <p(?i,... ,хп) и Тф(х1 ,...,хп) различны, поскольку различны их значения в точке Х\ = = сч,...,хп = ап. ? Но если каждый корень щ заменить на а, + а, то при некотором а ра- равенство A) уже не будет выполняться. В общем случае от кратных корней резольвентного многочлена можно избавиться, применив более сложное преобразование Чирнгауза. Это — практическая рекомендация. Теоретически же можно воспользо- воспользоваться следующим утверждением. Теорема 24.3. Пусть / е Z[x] — многочлен степени п без кратных корней и G с Sn — произвольная подгруппа. Тогда для них существует | такая функция ср е Z[xi,...,xn], что G9 = G и резольвентный много- | член Res((p, /) не имеет кратных корней. щ $, Доказательство. Пусть ai,..., ап — корни многочлена /. При по- S строении резольвенты Галуа мы показали, что существуют такие целые ; числа mi,..., тпп, что для всех подстановок neSn числа miao(i) + ... ... + mnao(n) попарно различны. Положим - . ..-mnao(n)). Для любой подстановки т е 5„ можно рассмотреть многочлен Тф(?, Xi,...,Xn)= <|>(t, ХЦ1),..., ?,(„)). Многочлены тхф и тгф различны тогда и только тогда, когда они раз- различны как многочлены от t при фиксированных х\ ~ oti,... ,хп = ап. Под действием элементов группы 5„ из функции <\t(t,xi,.. .,хп) = = ф получаются различные функции фх = ф, фг, - - -, фт- При этом многочлены от t вида tyi(t, oti,..., an), ..., фт(?, oti,..., an) тоже по- попарно различны. Поэтому существует to e Z, для которого числа tyi(to,ai, ¦ ¦ ¦,ос„), ..., фт(^о,а1,... ,а„) попарно различны. В таком слу- случае многочлен 24. Вычисление групп Галуа 243 24.3. Группа Галуа по модулю р Пусть f(x) = хп + aixn + ... + ап —неприводимый многочлен с целыми коэффициентами. Для любого простого числа р можно рассмо- рассмотреть многочлен / (mod p) над полем Fp (коэффициенты многочлена / заменяются на соответствующие классы вычетов по модулю р). Много- Многочлен / (mod p) может оказаться приводимым; структура его разложения на неприводимые множители тесно связана со структурой группы Га- Галуа многочлена / над Q. Эту связь мы сейчас изучим и воспользуемся ей для вычисления некоторых групп Галуа. Мы будем рассматривать лишь такие простые числа р, для кото- которых многочлен / (mod p) не имеет кратных корней, т. е. многочлены / (mod p) и /' (mod p) взаимно просты. Последнее условие эквивалентно тому, что р не делит R(f,f) = ±D(f). В дальнейшем будем предпола- предполагать, что дискриминант ?>(/) не делится на р. Корни многочлена / (mod p) не обязательно лежат в поле Fp, но суще- существует конечное расширение поля Fp, содержащее все корни многочлена / (mod p). Чтобы построить такое расширение, достаточно научиться к произвольному конечному полю F, присоединять корень неприводимого над F, многочлена h. Легко проверить, что факторкольцо K = Fg[x]/h(x)Fq[x] является полем. Действительно, если многочлен д(х) е Fq [x] не делится на h(x), то он взаимно прост с h(x), поэтому и(х)д(х) +v(x)h(x) = 1 для некоторых u(x),v(x) e Fg[x]. Следовательно, и = д~1 (mod h(x)). Ясно, что К = F,(а), где а — образ элемента х при канонической проекции. При этом h(ot) = О, т. е. а — корень многочлена h. Присоединив к Fp все корни аь ..., ап многочлена / (mod p), полу- получим поле Fp(ai,... ,а„) = ?рг. Пусть Gal — группа Галуа многочлена / над Q, Galp — группа автоморфизмов поля Fp (ai,..., а„) над полем Fp. Любой такой автоморфизм переводит корень 3{ в некоторый корень а^ и подстановка корней однозначно задает автоморфизм. Поэтому после нумерации корней можно считать, что Galp — подгруппа в Sn. Отме- Отметим, что корни многочленов / и / (mod p) лежат в разных множествах, причем между корнями этих многочленов нет естественного взаимно однозначного соответствия. Теорема 24.4. а) При подходящей нумерации корней многочленов / и / (mod p) группа Galp является подгруппой группы Gal.
244 Глава 5. Теория Галуа б) Группа Galp является циклической группой порядка г, где г — степень расширения Fp (cti,..., а„) поля Fp. в) Если многочлен / (mod p) представляет собой произведение не- неприводимых множителей степеней щ,... ,Пк, то группа Galp содер- содержит произведение (непересекающихся) циклов, длины которых равны 711, ... ,71*. Доказательство, а) Многочлен, аналогичный резольвенте Га- Галуа, можно построить, заменив целые числа mi,..., тп на переменные ui,...,un. А именно, пусть Pi,...,pn— корни многочлена /. Рассмо- Рассмотрим многочлен F(x,ui,...,un) = Д (x-uiPo(i) - •••-UnPo(n))- и выделим у него неприводимый над Z множитель G(x,ui,... ,ип), де- делящийся на х - uiPi - ... - и„р„. Точно так же, как и для резольвенты Галуа, доказывается, что группа Галуа Gal состоит из подстановок, со- соответствующих линейным делителям многочлена G. Над полем Fp многочлен G (mod p) разлагается на неприводимые множители Gi (mod p),... ,Gi (mod p). Любая подстановка корней ai,...,а„ многочлена / (modp), принадлежащая группе Galp, пере- переводит многочлен Gi (mod р) в тот же самый многочлен Gi (mod p). Поэтому та же самая подстановка корней Pi,..., р„ не может перево- переводить G{x, щ,... ,и„) в другой неприводимый множитель многочлена F(x,u\,... ,ип), поскольку у многочлена F (mod p) нет кратных дели- делителей. б) В поле характеристики р выполняется соотношение (х + у)р = = хр + ур. Таким образом, если х ф у, то хр — ур = (х — у)р ф 0. Поэтому отображение х i-» xp является автоморфизмом поля ?р<-, оста- оставляющим неподвижными элементы поля Fp. Степени этого автомор- автоморфизма переводят х в хр,хр ,... ,хрГ = х. Поле Fp-- получается из поля Fp присоединением корня ? многочлена хч~1 - 1, где q = рТ. При этом Са Ф С6! если 0<a<b<q-l. Следовательно, автоморфизмы х >-» хр,х I-+ хр ,... ,х I-» хрТ = х попарно различны. С другой сто- стороны, степень расширения Fpr z> Fp равна г, поэтому ? удовлетворяет уравнению степени г над полем Fp. Любой автоморфизм поля Fp>- над полем Fp однозначно задается образом элемента ?, поэтому количество различных автоморфизмов не превосходит г. 24. Вычисление групп Галуа 245 в) Группа Galp циклическая, поэтому она порождена некоторой под- подстановкой ст. Представим эту подстановку в виде произведения непере- непересекающихся циклов: Группа Galp транзитивно действует на элементах каждого цикла, по- поэтому циклы соответствуют неприводимым множителям многочлена / (mod p). U Пример. Группа Галуа многочлена хь - х - 1 над Q равна Ss- Доказательство. По модулю 2 рассматриваемый многочлен рас- раскладывается на неприводимые множители х2+х+1их3-\-х2 + 1, поэтому его группа Галуа содержит подстановку вида (ij)(klm). По модулю 3 многочлен х5 — х — 1 неприводим. В самом деле, если бы этот многочлен был приводим, то у него был бы множитель степени 1 или 2. Произведение всех неприводимых многочленов степени 1 или 2 над полем F3 равно а;9— х (см. теорему 13.7 на с. 115). Поэтому многочлен хъ — х — 1 должен иметь общий делитель либо с многочленом х5 — х, либо с многочленом х5 + х, а этого не может быть. Следовательно, группа Галуа содержит цикл A2345). Группа Галуа содержит подстановку {(ij)(klm)) = (ij). Сопря- Сопрягая транспозицию (ij) элементом A2345)°, получаем транспозицию (г + a, j + а). При а = j — г последовательно получаем транспозиции (ij), Up)i (pq)> (?r)j (r*)i которые порождают всю группу S5. П Фробениус доказал, что если группа Галуа неприводимого много- многочлена / степени п содержит подстановку, представляющую собой про- произведение циклов, длины которых равны щ,... ,п^, то существует бес- бесконечно много простых чисел р, для которых многочлен / (mod p) раз- разлагается на неприводимые множители степеней щ,..., п^. Он вычислил также плотность таких простых чисел р. По поводу теоремы плотности Фробениуса и обобщающей ее теоремы плотности Чеботарева см. [J], [Че], [АТЧ] и [С].
Глава 6 Идеалы в кольцах многочленов 25. Теоремы Гильберта о базисе и о нулях 25.1. Теорема Гильберта о базисе Теорема Гильберта о базисе появилась в знаменитой работе [Hi2]. В этой работе были предложены совершенно новые методы, с помощью которых удалось доказать существование конечного базиса для инвари- инвариантов форм. До этого, в 1868 г., Гордан доказал существование конеч- конечного базиса лишь для бинарных форм, причем сделано это было весьма трудоемким перебором. Гильберту же удалось сразу решить ряд цен- центральных проблем теории инвариантов. Правда, его методы были не- неконструктивны, что побудило Гордана заявить: «Это не математика, это теология!» Пусть К — некоторое поле (например, Q, Ш или С) или кольцо Z, К[х\,... ,хп]— кольцо многочленов от п переменных с коэффициен- коэффициентами из К. Теорема 25.1 (Гильберт). Пусть М с K[xi,...,xn] — произволь- произвольное подмножество. Тогда существует такой конечный набор многочле- многочленов тп\,. . . , тпг е М, что любой многочлен тп е М можно представить в виде тп = \ittii + ... + Xrmr, где X* е K[xi,... ,хп]. Теорему Гильберта удобнее сформулировать на языке идеалов. То- Тогда ее будет проще доказывать. Подмножество / с К[х\,..., хп] называют идеалом, если выполня- выполняются следующие два условия: 1) а, Ь е / => а + Ь е /; 2) ае/, /е K[xi,...,xn) => fa e I. Для любого множества М а К[х\,... ,хп] можно рассмотреть поро- порожденный им идеал 1(М), состоящий из всевозможных конечных сумм вида XiTUi + ... + Xrmr, где Xj e K[xi,... ,хп], тг- е М. Семейство {аа}, аа е /, называют базисом идеала /, если любой элемент а е I можно представить в виде а = Xiaai + ... + Х(аа(, где 25. Теоремы Гильберта о базисе и о нулях 247 X, е К[хх,... ,хп]. Идеал / называют конечно порожденным, если он обладает конечным базисом. Для доказатечьства теоремы 25.1 достаточно доказать, что идеал 1(М) конечно порожденный. В самом деле, в таком случае любой эле- элемент множества М а 1{М) можно выразить через конечный набор эле- элементов ах,..., as e /, а каждый из этих элементов выражается через конечный набор элементов множества М. Теорема 25.2 (теорема Гильберта о базисе). В кольце К[х\,... ,хп] любой идеал конечно порожден. Доказательство. Заметим сначала, что в рассматриваемом коль- кольце К любой идеал конечно порожден. В самом деле, если К — поле, то в нем любой ненулевой идеал совпадает с К и порожден элементом 1. Если же К = Ъ, то любой идеал имеет вид тЪ и порождается элементом т. (Чтобы доказать это, можно рассмотреть наименьший элемент идеала.) Пусть Ln = K[xi ,...,хп] при п > 1, Lo = К. Тогда К[хх,..., хп+\] = = Ln[x], где х = xn+i. Как мы уже отметили, при п — 0 в кольце Ln любой идеал конечно порожден. Поэтому достаточно доказать, что если в кольце L = Ln любой идеал конечно порожден, то в кольце L[x] любой идеал / тоже конечно порожден. Шаг 1. Старшие коэффициенты многочленов из идеала / с L[x] вместе с нулем образуют некоторый идеал J в кольце L. В самом деле, пусть f(x) — ах" +... и д(х) = Ъхт +... — некоторые многочлены из идеала /. Можно считать, что т < п. В таком случае многочлен f(x)+xn~mg(x) лежит в идеале /, а его старший коэффициент равен a+fc. Ясно также, что если X е L и X ф 0, то старший коэффициент многочлена X/ равен Ха. Построение конечного базиса идеала / в L[x] начнем с того, что вы- выберем конечный базис а\,... ,аг идеала J в L. Элементы а\,..., аг явля- являются старшими коэффициентами некоторых многочленов /i,..., /r e I. Шаг 2. Существует такое натуральное число п, что любой много- многочлен из идеала / является суммой многочлена степени ниже п и много- многочлена вида Xi/i + ... + Xr/r, где Xj e L[x]. Покажем, что в качестве п можно взять наибольшую из степеней многочленов /i,...,/r- Возьмем в / произвольный многочлен f(x) =
248 Глава 6. Идеалы в кольцах многочленов axN - axN + ... степени N > п. По определению а е J, поэтому а для некоторых X* е L[x]. Рассмотрим многочлен У многочлена g коэффициент при xN равен а — J2 ^iai = О, поэтому degp < ЛГ — 1. Если ЛГ — 1 > п, то эту конструкцию можно повторить и т.д. Шаг 3. Существует такой конечный набор многочленов д\,... ¦.. ,gs е /, что любой многочлен степени ниже п из идеала / можно представить в виде X\gi + ... + Xsgs, где Х$ e L[x]. Коэффициенты при хп~1 многочленов степени не выше п — 1 из идеала / образуют некоторый идеал кольца L. Пусть b±,...,bk — ба- базис этого идеала, gi, ¦ ¦ ¦ ,gk — многочлены степени п — 1 из идеала / со старшими коэффициентами bi,...,bk- Возьмем в идеале / произвольный многочлен h степени п — 1. Пусть b — старший коэффициент этого мно- многочлена. Тогда b = Xi&i + ... + Xfc&fc, где X, е L[x]. Поэтому степень многочлена Л - XiPi — ... — \k9k не превосходит п — 2. Таким образом, с точностью до элементов идеала, порожденного многочленами д\,..., дк, нам удалось заменить многочлен степени п - 1 многочленом степени не выше п — 2. Аналогично можно выбрать многочлены ^fc+i,... ,gi так, что с точностью до элемента идеала, порожденного ими, многочлен степени п — 2 равен многочлену степени не выше п — 3 и т. д. ? 25.2. Теорема Гильберта о нулях Теорема Гильберта о нулях появилась во второй знаменитой ра- работе Гильберта по теории инвариантов [Hi4]. Эту теорему иногда на- называют также теоремой Гильберта о корнях; ее немецкое название Nullstellensatz общеупотребительно и в англоязычной математической литературе. Теорема 25.3 (теорема Гильберта о нулях). Пусть причем многочлен / обращается в нуль во всех общих нулях много- многочленов /i, ¦. •, /г • Тогда при некотором натуральном q многочлен f принадлежит идеалу, порожденному многочленами /i,..., /г, т. е. f = ff/ + • • • + 9rfr для некоторых дх,..., дГ е С[х1 ,...,хп]. 25. Теоремы Гильберта о базисе и о нулях 249 Доказательство. Сначала мы докажем один частный случай тео- теоремы Гильберта о нулях, из которого можно вывести и общую теорему. А именно, мы рассмотрим случай, когда / = 1. Теорема 25.4. Пусть многочлены /i,...,/r e C[xi,...,xn] та- таковы, что у них нет общих нулей. Тогда существуют такие многочлены #1,..., зу е C[xi ,...,хп], что gifi +••• +gTfr = 1- Доказательство. Пусть I(fi,... ,fr) — идеал кольца C[zi,..., хп], порожденный многочленами /i,...,/r- Предположим, что не суще- существует таких многочленов gi,...,gr, что gifi + ...+grfr = l- Тогда Шаг 1. Пусть / — нетривиальный максимальный идеал кольца К, содержащий I(f\ ,...,fr). Тогда кольцо А = К/1 является полем. В самом деле, достаточно проверить, что в кольце К/1 любой нену- ненулевой элемент имеет обратный. Если f 0 I, то I + /К — идеал, строго содержащий /, поэтому / + /К = К. Это, в частности, означает, что существуют такие многочлены а е / и b е К, что а + bf = 1. В таком случае класс b е К/1 является обратным для класса / е К/1. Пусть Gtj — образ элемента Х{ при канонической проекции р : C[xi ,...,xn]-+ C[xi ,...,хп]/1 = А. Тогда А = С[а\,..., ос„]. Таким образом, А — конечно порожденная ал- алгебра над С, являющаяся в то же время полем. Шаг 2. Если конечно порожденная алгебра А = C[ai,...,an] над полем С сама является полем, то А совпадает с С. Нам понадобится следующее вспомогательное утверждение. Лемма (лемма Нётер о нормализации). В алгебре А = C[oti,..., ап] можно выбрать алгебраически независимые над С элементы ух,..., у/- так, что любой элемент а е А будет удовлетворять нормированному алгебраическому уравнению над C[yi,..., jte], т. е. а' + М' + ... + &/ =0, где b1,...,bteC\y1,...,yk].
250 Глава 6. Идеалы в кольцах многочленов Доказательство. Применим индукцию по п. Если элементы ol\, ... ¦.. ,<хп алгебраически независимы, то утверждение очевидно. Пусть /(<*!,..., ап) =0 — алгебраическое соотношение между ними. Если / — многочлен степени тп, у которого коэффициент при а;™ не равен нулю, то ot™+61<-1 + ... + bm =0, h,...,bm eqab...,an_i]. Остается воспользоваться предположением индукции. Если же коэффициент при а;™ равен нулю, сделаем замену хп = <;„, Xi = & + а^п, i = 1,...,п — 1. Попробуем подобрать числа at e С так, чтобы у многочлена g{li,...,ln-i,ln) =f(xi,...,xn) = f(b +ai5n,... Дп_1 +on_i5n_i,5n) был ненулевой коэффициент при ?™. Этот коэффициент равен gm@,..., 0,1) = /m(ai,..., on_i, 1), где /т и jm — однородные составляющие старшей степени многочле- многочленов /ид. Ясно, что ненулевой однородный многочлен fm(xi,..., хп) не может быть тождественно равен нулю при хп = 1. D Теперь можно приступить непосредственно к доказательству того, что А совпадает с С. Выберем элементы у\,..., у/, е А, о которых идет речь в лемме Нётер о нормализации. Покажем, что в таком случае в алгебре В = C[yi,...,yk] любой ненулевой элемент х обратим, т.е. В — поле. По условию А — поле, поэтому х обратим в А. Кроме того, со- согласно лемме Нётер элемент х~1 удовлетворяет уравнению (x-iy + b1{x-1)l-1+... + bi = o, bu...,bt Умножив обе части этого уравнения на а;', получим = — &i - fox - ... - kx1 e В. В. „-1 Поле В = С[у\,..., ук] представляет собой кольцо многочленов от к переменных над полем С. Но при к ф 0 кольцо многочленов не может быть полем. Поэтому В = С. А любой элемент поля А является корнем многочлена Следовательно, А = С. 25. Теоремы Гильберта о базисе и о нулях 251 Шаг 3. Многочлены Д,..., /г обращаются в нуль в точке (ai,...,ctn)eCn. В самом деле, при канонической проекции Р-.ЦХ! ,...,*„]- q*i,.. .,*„]// = а = с элемент xt переходит в сц е С, поэтому многочлен cp(a:i,... ,хп) пе- переходит в cp(cti,..., а„). А так как многочлены /i,..., /г принадлежат идеалу /, при канонической проекции они переходят в нуль. Итак, предположив, что /(Д,..., /г) ф С[хх,... ,хп], мы получили, что у многочленов Д,..., /г есть общий нуль. А это противоречит усло- условию теоремы. ? Покажем теперь, следуя [R], как из теоремы 25.4 можно получить общую теорему Гильберта о нулях. Для / = 0 утверждение очевидно, поэтому будем считать, что f ф 0. Добавим к переменным xi,...,xn новую переменную хп+\ — z и рассмотрим многочлены Д,..., /г, 1 - zf. У них нет общих нулей, поэтому где hi,... ,hr,h — некоторые многочлены от переменных xi,...,xn,z. Положим z — 1//. После приведения к общему знаменателю получим f"=9ifi где gi,...,gr — многочлены от буемый вид. - + 9rfr, i,..., хг. Это соотношение имеет тре- треЗамечание. Если коэффициенты многочленов /,Д,---,/г веще- вещественные и при этом / обращается в нуль во всех общих комплекс- комплексных корнях многочленов Д,..., /г, то существуют такие многочлены gi,... ,дг с вещественными коэффициентами, что fq = gifi + ¦ ¦ ¦ + grfr- В самом деле, согласно теореме Гильберта о нулях равенство /' = = hifi + ... + hrfr выполняется для некоторых многочленов hi,... ,hr с комплексными коэффициентами. Пусть hj — gj + ipj, где gj и pj — многочлены с вещественными коэффициентами. Тогда fq = Pi/i + ... ... + grfr. Любой набор однородных многочленов имеет общий тривиальный нуль — начало координат. Поэтому в однородном случае аналогом на-
252 Глава 6. Идеалы в кольцах многочленов бора многочленов, не имеющих общих нулей, служит набор многочленов, не имеющих общих нетривиальных нулей. Для однородных многочленов имеется следующий аналог теоремы 25.4. Теорема 25.5. Пусть Fi,...,Fr e С[хх,...,х„] — такие однород- однородные многочлены, что у них нет общих нетривиальных нулей. Тогда по- порожденный ими идеал I(Fi,...,Fr) содержит все однородные много- многочлены степени d > do, где d0 — некоторое фиксированное число. Доказательство. По условию единственным общим нулем много- многочленов Fi,..., Fr является начало координат. Поэтому линейные много- многочлены х\,..., хп обращаются в нуль во всех общих нулях многочленов F\,..., Fr. Согласно теореме Гильберта о нулях х?' е I(Fi,..., FT) для некоторого pi. Положим do = (pi — 1) + ... + (рп - 1) + 1. Тогда любой моном Xd = х\1 ¦... ¦ х„" степени d = ai + ... + ап > do делится на х?{ при некотором i. Поэтому Xd e I(F\,..., Fr). ? Простое прямое доказательство теоремы 25.5 приведено в статье Картье и Тейта [СТ]. 25.3. Многочлен Гильберта Напомним сначала некоторые определения из области коммутатив- коммутативной алгебры. Модулем над кольцом А называют абелеву группу М, на которой линейно действуют элементы кольца А, т. е. для любых aei и тп е М определен элемент am e M и при этом а(тп + п) = am + an, (ab)m = a(bm), (a + b)m = am + bm, \m = m. Например, если А — поле, то модуль над А — это векторное простран- пространство над А. Модуль М над кольцом А называют конечно порожденным, если любой элемент m e M можно представить в виде m — J2aimii гДе mi,..., mn — фиксированный конечный набор элементов М. оо Градуированным кольцом называют кольцо А = ф Ai, где Л, — ад- 8=0 дитивные подгруппы А, удовлетворяющие условию AiAj a Ai+j. Гра- Градуированным модулем над градуированным кольцом А называют мо- 25. Теоремы Гильберта о базисе и о нулях 253 дуль М = 0 Mi, где Mi — аддитивные подгруппы М, удовлетворяю- i=0 щие условию AiMj с Mj+j. В этом параграфе основным примером градуированного кольца бу- будет кольцо А = К[хо, ¦ ¦ ¦ ,хп], где К — поле; при этом Ai состоит из однородных многочленов степени г. Идеал / с К[хо, ¦ ¦¦, хп], называют однородным, если все однородные составляющие любого элемента идеала / тоже лежат в / (однородной составляющей степени г многочлена / е К[хо,... ,х„] называют сумму всех его членов степени г). Легко проверить, что идеал / однороден тогда и только тогда, когда он порожден однородными многочленами /i,..., fk- В самом деле, если идеал / однороден, то однородные соста- составляющие многочленов, порождающих /, лежат в/и порождают /. Если же идеал / порожден однородными многочленами /i,..., Д, то элемент ре/ можно сначала записать в виде g = ?] hafa, а затем разложить каждый многочлен ha на однородные составляющие. В результате ка- каждая однородная составляющая </, многочлена g будет представлена в виде gi = Yl яр/р> ПОЭТОМУ 9i e I- Идеал / однороден тогда и только тогда, когда его можно предста- оо вить в виде / = ф U, где Ii — I П Ai. Поэтому факторкольцо М = г=0 = А/1 является градуированным модулем над А с градуировкой М, = = Ai/(In Ai). Поясним это подробнее. Пусть g, h е А = К[хо,- ¦ .,хп] — некоторые многочлены, gi и hi — их однородные составляющие сте- степени г. Классы д +1 и h +1 совпадают тогда и только тогда, когда при всех г совпадают классы gi + I П Ai и hi + I П At. Поэтому оо оо М = А/1 = 0 Ai/(I n At) = © Mi. г=0 i=0 Действие А на М устроено следующим образом: для д е Ли / + / е М элемент g(f +1) е М определяется как gf + 1 е М. Ясно, что при этом Теорема 25.6 (Гильберт). Пусть К — поле, А = К[хо,...,хп] и оо М = 0 Mi — конечно порожденный градуированный модуль над А. i=0 Тогда существует такой многочлен рм(?) степени не выше п, что при всех достаточно больших г размерность Mi как векторного простран- пространства над полем К равна рм(г)-
254 Глава 6. Идеалы в кольцах многочленов Доказательство. Применим индукцию по п. База индукции: п = = — 1, т.е. А = К. В этом случае М — конечномерное векторное про- пространство над полем К, поэтому М; = 0 при достаточно больших г. Таким образом, рм = 0. Предположим теперь, что п > 0 и утверждение верно для модулей над кольцом А' — K[xq, ... ,хп_{\ [А' = К при п = 0). Положим х = хп и рассмотрим Л-модули М' = {т е М \ хт = 0} и М" = М/хМ. Эти модули конечно порождены над А, причем они аннулируются умноже- умножением на х, т. е. хМ' = 0 и хМ" = 0. Следовательно, М' и М" — конечно порожденные Л'-модули. Поэтому по предположению индукции при до- достаточно больших г выполняются равенства dimM/ = pi(i) и dim М-' = = P2(i), где pi и р2 —многочлены степени не выше п — 1. Для любого натурального i имеется точная последовательность 0 -* М[ Mi+1 - М1' -* 0, где отображение Mi -»¦ Mi+\ — умножение на х. Поэтому dim М[ - dim Mi + dim Mi+i - dim M"+1 = 0, т.е. dim Mi+i - dim Mt = dim M-'+1 - dim M[. При достаточно больших i выполняется равенство dim М"+1 — dim M[ = p2(i + 1) - pi (г) = «/(г), где q(i) — многочлен степени не выше п — 1. Пусть f{i) = dimM,-. При достаточно больших г выполняется равен- равенство /(г + 1) — /(г) = q(i), где q — многочлен степени не выше п — 1. В таком случае / — многочлен степени не выше п (при достаточно боль- больших г). Положим ж(т) = х(х — 1) • ... • (ж — т + 1). Легко проверить, что (ж+ 1)(га' -ж<т) = тх(т~х). Многочлены ж@) = 1,жA),.. .,ж(п~1) обра- образуют базис пространства многочленов степени не выше п — 1, поэтому п-1 многочлен q можно представить в виде q(x) = ^2 asx^a\ В таком случае s=0 n-i а^ многочлен /о(х) = J2 -^^-rx^s+1^ удовлетворяет соотношению /о(г + 1) — —/о W = Q{i)- Ясно также, что функция с(г) = /(г) —/о(г) при достаточно 25. Теоремы Гильберта о базисе и о нулях 255 больших г' удовлетворяет соотношению с(г + 1) -с(г) = 0, поэтому с(г) = п — 1 ^ = с — константа. Таким образом,/(ж) = ^2 *x(s+1> +с — многочлен степени не выше п. ? Многочлен Рм{1) называют многочленом Гильберта модуля М. Ясно, что этот многочлен целозначный (см. с. 100), поэтому его можно представить в виде Рм(г) =со(^1)+с1(тг_1)+...+ст, где со,..., ст — целые числа и т < п. Мы предполагаем, что cq ф 0. В случае, когда М = С[хо,..., хп]/1, где / — однородный идеал, при неко- некоторых естественных ограничениях числа Со и тп допускают следующую геометрическую интерпретацию. Однородному идеалу / соответствует алгебраическое множество V(I) в проективном пространстве СРП, а именно, V(I) = {(ао,...,о„) е СРП | /(ао, • • ¦,ап) = 0 V/ е /}. Идеал / называют простым, если fgel => / е / или gel. Для про- простого идеала / алгебраическое множество F(J) неприводимо, т. е. его нельзя нетривиальным образом представить в виде объединения V(Ii) и V{l2), где /i и /2 —однородные идеалы. Ограничение, о котором шла выше речь, заключается в том, что идеал / должен быть простым. То- Тогда число т совпадает с размерностью проективного алгебраического многообразия V(I), а число со совпадает со степенью этого многообра- многообразия (степень многообразия размерности m в СРп определяется как ко- количество точек пересечения этого многообразия с подпространством размерности п — тп в общем положении, т. е. с почти всеми такими под- подпространствами). Доказательство этого утверждения можно найти в [Мм]. Пример 1. Если М = С[жо,... ,хп], то тп = п и со = 1. В самом деле, М% состоит из однородных многочленов степени i от п + 1 переменных. Моному xtf сопоставим последовательность, в которой сначала идут г'о нулей и одна единица, затем идут i\ нулей и одна единица, ..., а в конце стоят гп нулей. Эта последовательность
256 Глава 6. Идеалы в кольцах многочленов состоит из г + п чисел, среди которых i нулей и п единиц. Количество таких последовательностей равно Л + m _ (t + n) ¦ ¦ ¦ ¦ ¦ (г + 1) __ г" ,,\ v n / п! n! W "•"••¦ Поэтому Рм(г) = dimM* = Q + • • • Пример 2. Если М = A/fdA, где Л = С[хо,. ¦. ,х„], а /</ — однород- однородный многочлен степени d, то m = п — 1 и со = d. В самом деле, умножение на fd дает точную последовательность О i-* О, где Hi — пространство однородных многочленов степени г от п + 1 пе- ременных. В примере 1 показано, что dim/fi = ( „ J, поэтому (п-1)! где Со = Пусть М — градуированный конечно порожденный Л-модуль, рм(г) = со( ) + • • • — многочлен Гильберта модуля М. В таком случае число т = dimM будем называть размерностью модуля М, а число Со = degM—его степенью. Как мы уже упоминали (и примеры 1 и 2 это подтверждают), в случае, когда / с C\xq ,..., хп] — однородный про- простой идеал и М = С[х0,.--,хп]/1, число dimM — это размерность мно- многообразия V{I) с СРп, а число degM — степень этого многообразия. Обсудим теперь некоторые свойства степени и размерности градуи- градуированного Л-модуля М, которые нам потребуются в разделе 25.4. Осо- Особый интерес представляет случай, когда М — А/1, где / — однородный простой идеал. В этом случае М является кольцом без делителей нуля, т.е. М — область целостности. С другой стороны, однородный идеал / прост тогда и только тогда, когда Л-модуль М — А/1 обладает сле- следующим свойством: если / 0 /, то fm ф 0 при т ф 0 (здесь / е Л и т е М). В общем случае Л-модуль М будем называть целостным, если для любого / е Л либо /М = 0, либо fm ф 0 при т ф 0. 25. Теоремы Гильберта о базисе и о нулях 257 До конца этого параграфа будем считать, что Л = K[xq, ... ,хп], где К — некоторое поле, причем кольцо А снабжено естественной градуи- оо ровкой А = ф Ах, где Л*—множество однородных многочленов сте- пени t; M — градуированный конечно порожденный Л-модуль, причем dim М > 0, т. е. рм Ф 0. Теорема 25.7. Пусть модуль М целостный и / нородный многочлен степени d, что /М ф 0. Тогда такой од- одdim(M//M) = dim M - 1 и deg(M//M) = ddegM. На языке геометрии это утверждение выглядит так: гиперповерх- гиперповерхность степени d высекает на проективном алгебраическом многообра- многообразии размерности т и степени г подмногообразие размерности т — 1 и степени dr. Доказательство. Пусть М' = {т е М | /т = 0}. Умножение на / дает точную последовательность 0 - Ml_d (M/fM)i - 0. Из условия теоремы следует, что М' = 0. Поэтому при достаточно боль- больших i выполняется равенство Рм/fMii) = рм{г) - Рм(г - d). Пусть dim М = m и deg М = г. Тогда _ rmd.m-i m'. rd ¦ТП — 1 ? (го-1)Г т. е. pM/fM(i) = dr(m г_ :) + ..., что и требовалось. Подмодуль S с М называют однородным, если он порожден од- однородными элементами (т.е. элементами однородных слагаемых Mi). Эквивалентное условие: 5 = ф 5j, где S* = S П М;. При этом фактор- оо модуль M/S имеет естественную градуировку: M/S = ©(Mj/5j). г=0 9- 1010
258 Глава 6. Идеалы в кольцах многочленов Теорема 25.8. Пусть р— простое число, не делящее degM. Тогда в М есть такой однородный подмодуль S, что фактормодуль N = M/S удовлетворяет следующим условиям: (а) dimiV = dimM; (б) deg N не делится на р; (в) модуль jV целостный. На геометрическом языке это соответствует выделению неприводи- неприводимой компоненты максимальной размерности в случае произвольного ал- алгебраического множества, состоящего из нескольких компонент. Доказательство. Свойства (а) и (б) выполняются для 5 = 0. Кроме того, модуль М конечно порожден над А = К[хо,- ¦ ¦ ,хп], по- поэтому любая возрастающая последовательность подмодулей М ста- стабилизируется. Следовательно, существует максимальный однородный подмодуль S, для которого выполняются свойства (а) и (б). Покажем, что для максимального подмодуля S выполняется и свойство (в), т.е. модуль jV = M/S целостный. Требуется доказать, что если / е А, то либо fn = 0 при всех п е N, либо /п/0 при всех п ф 0. Это утверждение достаточно доказать в случае, когда / — однородный многочлен. В самом деле, для произволь- произвольного многочлена требуемое утверждение тогда можно будет получить следующим образом. Разложим / и п на однородные составляющие: / = = U + /s+i + • • • и п = щ + nt+i + ¦ ¦ ¦, где fa ф 0 и щ Ф 0. Предполо- жим,что fn = 0, т. е. fsnt = 0, fs+\nt + fsnt+i = 0, /8+2Щ + /s+i"t+i + + fsfit+2 = 0,... Из условия щ Ф 0 последовательно получаем fsN = 0, /s+iiV = 0, fs+2N = 0,... Следовательно, /N = 0. Итак, пусть / — однородный многочлен степени d и /N ф 0. Поло- Положим N' = {п е N | fn = 0}. Умножение на / дает точную последова- последовательность о (N/fN)i - 0, т.е. 0 - Ni-d/N!_d -*Nt^ (N/fN)t - 0. Поэтому при больших i выполняется равенство Pjv(») = PN/fw(i) + Pn/n' (г ~ d). A) 25. Теоремы Гильберта о базисе и о нулях 259 Условие fN ф 0 означает, что /М + S ф S. Из максимальности S следует, что модуль N/fN = (M/S)/f (M/S) =¦ M/(S + /M) не может одновременно обладать свойствами (а) и (б). Поэтому либо dim(N/fN) < dim ЛГ = dim M, либо dim(N/fN) = dim M, но deg(N/fN) делится на р. Согласно формуле A) в первом случае Pn/n' (г ~ Щ = —f- + ..., где п = dim N, г = deg ЛГ. Во втором случае -d) = -^— + где г\ = deg(N/fN). Так как г не делится на р, а г\ делится на р, то в обоих случаях dim(N/N') = п = dimM и число deg(N/N'), равное г или г — ri, не делится на р. Таким образом, для модуля ЛГ/ЛГ' выполняются свойства (а) и (б). При этом модуль ЛГ/ЛГ' имеет вид M/S', где 5' — од- однородный подмодуль М, содержащий 5. Из максимальности S следует, что S" = 5, т. е. ЛГ' = 0, что и требовалось. D Теорема 25.9. Пусть I а А = К[х0,... ,хп] —однородный простой идеал, причем размерность целостного Л-модуля М = А/1 равна нулю, а его степень равна г ф 0, т. е. рм(г) = г ф0. Тогда а) хМ ф 0 для некоторого х — ху, б) L = М/(х - \)М — поле, являющееся расширением степени г поля К. Доказательство, а) Если XjM = 0 при j = 0,..., п, то Xj e / при всех j, а значит, М = К. Таким образом, рм(*) = 0, что противоречит условию рм(г) — г ф0. б) Фиксируем х = Xj так, что хМ ф 0. Тогда хт ф 0 при т ф 0, так как модуль М целостный. Это означает, что отображение М -? М мо- номорфно. При достаточно больших г выполняется равенство dimMj = = Рм(г) = г, поэтому dimMj+i = dimM*. Следовательно, при доста- достаточно больших i отображение М, -*¦ Mi+X взаимно однозначно.
260 Глава 6. Идеалы в кольцах многочленов Рассмотрим в М неоднородный подмодуль (а; - 1)М. Пусть л: М -*¦ -*¦ М/(х-\)М = L — естественная проекция. Тогда п(хт) = п(т). Ясно также, что хп(т) = л(отп). Поэтому L ™ L — тождественное отобра- отображение. Пусть для определенности отображение Mj -<- Mj+i взаимно одно- однозначно при i > а. Покажем, что тогда L = л(Ма) = n(Ma+i) = ... Запишем элемент т е М в виде т — то + ... + та + ma+i + ... + m*, где ms e Ms. Ясно, что п(т0 + ... + та) = -к(хат0 + xa~lm\ + ... + тпа) = л(т'), где тп' = хат0 + ха~1тп\ + ... + тпа е Ма. Кроме того, ma+i = xma,i, ma+2 = x2ma,2, ...,тпк = xk~ama,k-a, где ma,s e Ma. Поэтому 7t(ma+i mk) = n( где m" = mo,i + ... + ma^-a e Ma. Итак, естественная проекция Ма -<- L эпиморфна. С другой сто- стороны, эта проекция по очевидным причинам мономорфна: если п(тпа) = = 0, то тпа = (х — 1)т, но однородный элемент тпа ф 0 нельзя предста- представить в виде (а; — 1)гп. Поэтому проекция Ма -*¦ L взаимно однозначна и dim L — dim Ma = г. В рассматриваемой ситуации L является r-мерной алгеброй над по- полем К (т. е. коммутативным кольцом и одновременно линейным про- пространством над К). Покажем, что в алгебре L нет делителей нуля. Пусть l',l" e L и VI" — 0. Выше было показано, что /' = п(т') и I" = п(т") где тп',т" е Ма. Поэтому 0 = VI" = n(m'm"), где тп'т" е Mia- При Ъ > а проекция Мь -* L — изоморфизм, а значит, гтг'тп" — 0. По усло- условию идеал / простой, поэтому в кольце М = А/1 нет делителей нуля. Следовательно, тп' — 0 или тп" = 0, т. е. Г = 0 или I" = 0. Теперь уже легко показать, что L — поле, т.е. любой ненулевой эле- элемент I e L обратим. В самом деле, отображение х >-> lx, x e L, пред- представляет собой линейное отображение L -* L с нулевым ядром. В конеч- конечномерном случае такое отображение — изоморфизм, поэтому, в частно- частности, 1х = 1 для некоторого х е L. ? 25.4. Однородная теорема Гильберта о нулях для р-полей Следующее утверждение было впервые доказано в статье Гильберта [Hi4], хотя и его использовали многие математики XIX в. без строгого обоснования. 25. Теоремы Гильберта о базисе и о нулях 261 Теорема 25.10. Пусть К — алгебраически замкнутое поле, А = = К[хо, ¦ ¦ ¦ ,хп], где п > 1. Тогда любые однородные многочлены /1(... ...,/„ е А имеют общий нуль, отличный от начала координат. Аналогичное утверждение можно доказать и для так называемых р- полей, к которым относится, в частности, поле действительных чисел Ш, Пусть р — простое число. Поле К называют р-полем, если степень любого его конечного расширения имеет вид р$. В частности, любое алгебраически замкнутое поле является р-полем для всех простых р, а поле К является 2-полем. Теорема 25.11. Пусть К — некоторое р-поле, А = K[xq,... ,xn], где п > 1. Тогда любые однородные многочлены /i ,...,/„ е А, степени которых не делятся на р, имеют общий нетривиальный нуль. Доказательство (Г. Фендрих; см. [Pf2], ch. 4). Мы будем поль- пользоваться результатами предыдущего параграфа, а именно, теоремами 25.7-25.9. Начнем с того, что построим последовательность целостных ко- конечно порожденных градуированных Л-модулей Mq = A, Mi = A/I\,... ...,Мп = А/1п, для которых dimMt = n - i, degM* не делится на р и однородный простой идеал It содержит многочлены /0,...,/«. Модуль Mq = А удовлетворяет этим условиям, так как dim Mo = п и deg Mo = 1 (см. пример 1 на с. 255). ¦ Предположим, что модули M0,...,Mj (i > 0) уже построены. По- Покажем, как по модулю М, = A/Ii и многочлену fi+i можно построить модуль Mj+i- При этом возможны два случая. Случай 1: /i+i ф: It, т. е. /i+iM, ф 0. Положим Согласно теореме 25.7 dim Ni+i = dim Mj - 1 = n - (г + 1) и degjVj+1 = = deg/i+i degMj. Число degjVi+1 не делится на р, так как оба числа deg/i+i и degMj на р не делятся. Случай 2: fi+\ e ij. Из условия dimMj > 0 следует, что х ? Ц (т.е. хМ{ ф 0) для некоторого х = Xj. В самом деле, если хо,.. - ,хп е /;, то Mi — К или 0, поэтому pMi = 0. Положим Ni+i = Mi/xMi. Согласно теореме 25.7 dim Ni+1 =dim Mt - — 1 = n — (i + 1) и deg./V,+i = deg Mj, так как степень многочлена х равна 1.
262 Глава 6. Идеалы в кольцах многочленов В обоих случаях мы получили некоторый модуль iVj+i, но он не обя- обязательно целостный. Чтобы получить целостный модуль, воспользуемся теоремой 25.8. Согласно этой теореме в Ni+\ есть такой однородный подмодуль 5j+i, что фактормодуль обладает всеми требуемыми свойствами: dimMj+i = dinuVj+i — n - - (г + 1), degMj+1 не делится на р и модуль M,+i целостный; при этом /,+1 —однородный идеал, содержащий многочлены Д,..., fi+1. Размерность последнего из построенных модулей Мп равна нулю, поэтому к нему можно применить теорему 25.9. В результате получим поле L — Mn/(xj — 1)Мп = А/1. Здесь / — неоднородный простой идеал, обладающий двумя важными для наших целей свойствами: A) Xj = 1 (mod/); B) / э JB э/i /„. Поле L является расширением степени deg Mn поля К. Но, с одной стороны, deg Mn не делится на р, а с другой стороны, степень любого расширения поля К имеет вид ps. Поэтому L = К. Пусть щ е К — образ элемента Xi при естественной проекции А = k[x0,.. .,xn]-* A/I — L = К. Из свойства A) следует, что ctj = 1, поэтому а = (uq, ..., ап) ф 0. А из свойства B) следует, что /i(a) = ... = /n(a) =0. ? Теорема 25.11 позволяет чисто алгебраически доказать в полиноми- полиномиальном случае известную теорему Борсука-Улама об общем нуле не- нечетных функций на сфере. Теорема 25.12. Пусть qi,... ,qn e M[a;i,... ,?n+i] нечетные много- многочлены, т.е. Qi(—x) = —qi(x). Тогда эти многочлены имеют общий нуль на единичной сфере х\ + ... + х^+1 = 1. Доказательство. Перейдем от qi к однородному многочлену щ, введя дополнительную переменную хо. При этом в многочлене qi моном ... - х% ™1 я™1 заменяется на х™1 я • х™п, где mo = deg qi— .. .-тп. У нечетного многочлена степени всех членов нечетны, поэтому числа deg<ft и mi +... +тп нечетны, а значит, число то четно. Заменив на х\ +. , из многочлена q~i получим однородный многочлен 26. Базисы Грёбнера 263 нечетной степени. Согласно теореме 25.11 многочлены Д,... ,/„ имеют общий нуль а = (ai,. -., an+i) Ф 0. При всех tel точка ta тоже будет нулем однородных многочленов Д,..., /„, поэтому можно считать, что а\ + ... + <4+1 = 1. В таком случае <&(а) = <ji(l,a) = fi{a) = 0, что и требовалось. ? Из теоремы 25.12 можно получить и обычную теорему Борсука- Улама для нечетных непрерывных функций gi,.-.,gn, приближая эти функции многочленами. 26. Базисы Грёбнера Для решения различных вычислительных задач, связанных с идеа- идеалами в кольцах многочленов, весьма удобны базисы Грёбнера. Это поня- понятие было введено Бруно Бухбергером в его диссертации [Bui], написан- написанной под руководством Вольфганга Грёбнера; см. также [Ви2]. Бухбергер предложил также удобный алгоритм вычисления базиса Грёбнера, что и превратило базисы Грёбнера в эффективный вычислительный аппарат. Наше изложение теории базисов Грёбнера во многом опирается на первую главу книги [AdL]. Более подробно познакомиться с различными аспектами теории базисов Грёбнера можно по книге [ВиЗ]. 26.1. Многочлены от одной переменной В случае многочленов от одной переменной над полем К алгоритм нахождения базиса идеала основан на делении с остатком одного много- многочлена на другой. Первый шаг деления с остатком делается следующим образом. Пусть f(x) = апхп + ... + ао, д(х) = Ьтхт + ... + bo, при- а хп чем п > т. Положим fi(x) = f(x) - " тд(х). Если degfi > degg, то применим к Д аналогичную процедуру и т. д. В конце концов получим / = qg + г, где deg г < degg (или г = 0). При этом многочлены q и г определены однозначно. Теорема 26.1. Любой идеал / в кольце К[х] многочленов от одной переменной главный, т. е. порожден одним элементом. Доказательство. Выберем в / многочлен д минимальной степени. Пусть /е/. Тогда / = qg + г, где degr < degg. Но г = / - qg e J, поэтому г = 0. Это означает, что идеал / порожден многочленом д. ?
264 Глава 6. Идеалы в кольцах многочленов Пусть /(/i,...,/n)—идеал, порожденный многочленами Д(а;),... ¦¦¦ifn{x). Многочлен g(x), порождающий этот идеал, называют наи- наибольшим общим делителем (НОД) многочленов Д,..., fn и обозначают (Л,- • • ,/п)- Наибольший общий делитель обладает следующими свой- свойствами: A) все многочлены /i,..., /п делятся на д; B) если все многочлены /i,..., /п делятся на некоторый многочлен h, то h делится на д. Свойство A) следует из того, что /i,...,/n <= /(/i,.. .,/„) = 1{д). Свойство B) следует из того, что д е /(Д,...,/„), т. е. д = mfi + ... ¦¦¦ + unfn, где щ,...,ип е К[х]. Свойства A) и B) определяют многочлен д однозначно с точностью до пропорциональности. В самом деле, если многочлены дх и д2 делятся друг на друга, то они пропорциональны. Наибольший общий делитель (Л, /г) многочленов Д и /2 можно най- найти с помощью следующего алгоритма, называемого алгоритм Евклида. Для определенности будем считать, что deg Д > deg /2. Пусть ri — остаток от деления Д на /2, г2—остаток от деления /2 на ri, ... •-•> rfc+i—остаток от деления г*_1 на г*. Степени многочленов г* строго убывают, поэтому для некоторого п получим rn+i = 0, т. е. rn_i делится на гп. При этом Д и /2 делятся на гп, так как на гп делятся многочлены rn_i,rn_2,... Кроме того, если Д и /2 делятся на некото- некоторый многочлен h, то гп делится на h, так как на h делятся многочлены П, г2,... Таким образом, г„ = (Д, /2). Опираясь на свойства A) и B), легко проверить, что Это замечание сводит вычисление НОД п многочленов к вычислению НОД двух многочленов. 26.2. Деление многочленов от многих переменных Чтобы определить деление с остатком для многочленов от многих переменных, нужно фиксировать некоторый порядок на множестве мо- мономов. В дальнейшем мы будем считать, что мономы упорядочены лек- лексикографически, т. е. моном ха — х^1 ¦ ... ¦ х^п старше монома х$ = = ху ¦... ¦ хх, если ai = Pi,... ,01* = Pfc,otfc+i > pfc+1 (возможно k = 0). 26. Базисы Грёбнера 265 Запись / = ааха + ... будет означать, что ааха —старший член мно- многочлена /, т. е.ха — старший моном, входящий в /. Пусть / = ааха + ... и g = Ьра;Р + ... — два многочлена от п пере- переменных. Если некоторый член с^х^ многочлена / делится на х$, поло- положим Д = / *-!г<7- Если некоторый член многочлена Д делится на браг х&, применим к Д аналогичное преобразование и т. д. Чтобы этот про- процесс сходился за конечное число шагов, можно поступить, например, следующим образом. В качестве с^х"* будем брать старший из всех чле- членов многочленов /, делящихся на х$. Тогда порядок старшего члена /, делящегося на х^, будет строго убывать. А любая строго убывающая последовательность мономов от п переменных конечна. В самом деле, сначала за конечное число шагов пропадет х\, затем за конечное число шагов пропадет а;2 и т. д. Аналогично можно определить деление с остатком многочлена / на несколько многочленов Д,...,/«. В результате получим представление / = u\fi + ... + usfs + г, где у многочлена г нет членов, делящихся на старшие мономы многочленов Д,..., Д. В таком случае будем говорить, что г — остаток от деления многочлена / на многочлены Д,..., Д. Следует отметить, что многочлен г определен не однозначно. Одно из возможных определений базиса Грёбнера как раз и заключается в том, что Д ,.••,/» — базис Грёбнера, если остаток от деления любого много- многочлена / на Д,...,/, определен однозначно. 26.3. Определения базисов Грёбнера Будем говорить, что (ненулевые) многочлены gi,...,gt e / обра- образуют базис Грёбнера идеала /, если у любого (ненулевого) многочлена / е / старший член делится на старший член одного из многочленов Теорема 26.2. Многочлены gi,...,gt образуют базис Грёбнера иде- идеала / тогда и только тогда, когда выполняется одно из следующих экви- эквивалентных условий: ' (а) / е / ^ остаток от деления / на д\,..., gt равен 0; (б) / е / <=> / = 53 hi9i и старший моном многочлена / равен старшему из произведений старших мономов /ц и gf, (в) идеал L(I), порожденный старшими членами элементов идеала /, порожден старшими членами многочленов gi, ¦ ¦ ¦ ,gt-
266 Глава 6. Идеалы в кольцах многочленов Доказательство. Покажем сначала, что если gi,...,gt — базис Грёбнера идеала /, то выполняется условие (а). Достаточно доказать, что если г — остаток от деления многочлена / е I на д±,... ,gt, то г = 0. Ясно, что г = / — ^2 hi9i е I- Поэтому если г ф 0, то старший член г делится на старший член одного из многочленов д\,.. ¦ ,gt, что противоречит определению многочлена г. (а) => (б) Согласно определению деления с остатком / = ? Kgt + г, где старший моном / равен старшему из произведений старших мономов hi к д^. Из (а) следует, что если / е /, то г = 0. (б) => (в) Если / = axa + ... е /, то / = ]Г /ц^, где hi = Ь{Х&* + ... и gj = Cj3:Yi + ..., причем все мономы х^х^( не старше жа. Поэтому axa = ^6i^'Cj^YS где суммирование ведется по тем г, для которых г жР'яТ* = ?а. А так как Cja;^ е L(J), то аа;а е L(I). Остается доказать, что если выполняется условие (в), то gi,... ,gt — базис Грёбнера. Пусть / = axa + ... е I. Тогда axa = 2_. biX^' CiX^i, i где CiXb —старшие члены некоторых из многочленов gi,...,gt. Ясно, что моном ха делится на моном х^' при некотором г. ? Следствие. Если gi,...,gt—базис Грёбнера идеала /, то много- многочлены д\,..., gt порождают идеал /. Это следует из условия (а). Теорема 26.3. У любого ненулевого идеала / с K[xi,... ,хп] есть базис Грёбнера. Доказательство. Рассмотрим идеал L(I), порожденный стар- старшими мономами Ха всех многочленов да = ааХа + ... е /. Ясно, что / е L(I) тогда и только тогда, когда любой моном многочлена / де- делится на некоторый моном Ха. По теореме Гильберта о базисе идеал L(I) порожден конечным числом многочленов /i,..., Д. Каждый моном любого из этих многочленов делится на некоторый моном Ха. В ре- результате получаем конечный набор мономов Х\,. ¦. ,Xt, порождающих идеал L(I). Эти мономы являются старшими мономами многочленов gi,...,gt. Согласно теореме 26.2 (в) многочлены gi,-.-,gt образуют базис Грёбнера идеала /. ? 26. Базисы Грёбнера 267 Будем говорить, что многочлены gi,...,gt образуют базис Грёбнера, если они образуют базис Грёбнера порожденного ими идеала. Теорема 26.4. Ненулевые многочлены gi,...,gt образуют базис Грёбнера тогда и только тогда, когда остаток от деления любого мно- многочлена / на pi,...,gt определен однозначно. Доказательство . Предположим сначала, что многочлены gi,...,gt образуют базис Грёбнера. Пусть г\ и т^ — остатки от деления / на <7i,..., <7t- Тогда многочлены / - Т\ и / — г2 лежат в идеале /, поро- порожденном gi,...,gt. Поэтому гч — гг = (/ — гг) - (/ — ri) e/. Согласно определению базиса Грёбнера старший моном многочлена г\ — г2 делится на старший моном одного из многочленов gi,... ,gt- С другой стороны, ни у многочлена г\, ни у многочлена г2 нет членов, делящихся на стар- старшие мономы многочленов gi,...,gt- Поэтому п - г2 = 0. Предположим теперь, что остаток от деления любого многочлена / на д\,..., gt единствен. Требуется доказать, что если / е /, то остаток г от деления / на д\,..., gt равен нулю. Покажем сначала, что если а — некоторое число, то многочлены / и / — axagi, где ха — моном, дают одинаковые остатки при делении на gi,...,gt- Напомним, что при делении с остатком элементарное пре- преобразование заключается в уничтожении некоторого монома Cy?Y мно- многочлена / посредством замены / на / - dxbgi. Пусть дг = Ьх^ +... Если у одного из многочленов / и / - axagi коэффициент при мономе ха+^ ра- равен нулю, то многочлен с ненулевым коэффициентом при этом мономе элементарным преобразованием приводится к многочлену с нулевым ко- коэффициентом. Если же у обоих многочленов / и f — axagi коэффициенты при мономе ха+$ отличны от нуля, то оба многочлена элементарным пре- преобразованием приводятся к многочлену /-схад, с ненулевым коэффици- коэффициентом при мономе ха+Р. Во всех случаях многочлены / и f — axagi приво- приводятся элементарным преобразованием к одному и тому же многочлену, поэтому при делении на многочлены gi,- ¦¦ ,gt они дают одинаковые остатки. (Мы пользуемся предположением о единственности остатка.) Теперь уже легко доказать требуемое. Если / е /, то / = X^^iffj- Записав каждый многочлен hi в виде суммы мономов, получим / = = J2 ааХад^. Многочлены / и f~YlaaxCl9i. — 0 дают одинаковые остатки при делении на д\,..., gt ¦ Но для нулевого многочлена остаток от деле- деления равен нулю, поэтому для многочлена / остаток от деления тоже равен нулю. ?
268 Глава 6. Идеалы в кольцах многочленов 26.4. Алгоритм Бухбергера Все предшествующие определения базиса Грёбнера не позволяли выяснить за конечное число шагов, будет ли набор gi,...,gt базисом Грёбнера. Приведем наконец определение, которое позволяет это вы- выяснить. Пусть / = аха + ..., g — bxp + ... и х^ — наименьшее общее кратное мономов ха и хл. Положим S(f,g) — —^-f—j-^-g', многочлен S(f,g) стро- к аха охр ится так, чтобы старшие члены двух его составляющих сократились". Теорема 26.5 (Бухбергер). Многочлены gi,..-,gt образуют базис Грёбнера тогда и только тогда, когда при всех г ф j остаток от деления многочлена S(gi,gj) на gi,... ,gt равен нулю. Доказательство. Если многочлены gi,...,gt образуют базис Грёб- Грёбнера, то согласно теореме 26.2 (а) многочлен S(gt,gj), принадлежащий порожденному ими идеалу /, при делении на них дает остаток 0. По- Поэтому нужно лишь доказать, что если при всех г ф j остаток от деления многочлена S(gi,gj) на gi,.. ¦ ,gt равен нулю, то многочлены gi,- ¦ ¦ ,gt образуют базис Грёбнера, т. е. любой многочлен /е/ можно предста- представить в виде / = Ylhidi, где старший моном многочлена / равен стар- старшему из произведений старших мономов hi и </; (см. теорему 26.2 (б)). Предварительно докажем одно вспомогательное утверждение. Лемма. Пусть /i,...,/» — многочлены с одним и тем же старшим мономом ха. Тогда если старший моном многочлена f = Y1 ^t/t, где X* — числа, строго меньше ха, то / = ^Г u-ijS(fi,fj). Доказательство. По условию fi = сцха + ... поэтому S(fi,fj) — — -. Ясно также, что Cti (Xj и fj — a,jXa + ..., ) — Остается заметить, что Xiai +. • • + Xsas = 0. В самом деле, у многочлена f = ^2 Xj/j коэффициент при мономе ха как раз и равен X\ai +... + Xsa5, а по условию старший моном многочлена / строго меньше ха. ? 26. Базисы Грёбнера 269 Многочлен / = аха +... е / разными способами можно представить в виде f = Yl hi9i- Пусть hi = biX^ + ... и <# = Qa^1 + ... Старший из мономов jp'xi', г = 1,...,?, обозначим а;8. Выберем представление / = ^2Ыд^ так, чтобы моном а;8 был минимален. Требуется доказать, что в таком случае я8 = ха. Ясно, что моном ха не может быть старше монома а;6. Предположим, что моном а;8 старше монома ха. Можно счи- считать, что хР'хЧ* = я5 при г = 1,..., М, а при г = М + 1,..., t моном а;8 старше монома х$' жт*. м Рассмотрим многочлен д = ? biX^gt. Коэффициенты при мономе а;8 г=1 у этого многочлена и у многочлена / совпадают, поэтому многочлен д является линейной комбинацией многочленов со старшим мономом а;8, причем все старшие мономы взаимно сокращаются. В таком случае со- согласно лемме g = ^2\iijS{^'gi,a»'gJ), A) где суммирование ведется по таким i,j, что 1 < i < j < N. Старшие мономы* многочленов x&gi и х$> gj совпадают, поэтому ж5 ж6 х8 S (x^gi,x^gj) t ^gj где хЧ" — наименьшее общее кратное мономов а^' и х^'. По предположению многочлен S(gi,gj) дает остаток 0 при делении на pi,... ,gt- Многочлен 5 {зР1 gi,ofi'gj) делится на S(gi,gj), поэтому он тоже дает остаток 0 при делении на gi,...,gt- Алгоритм деления с остатком дает представление S (x^gi,x^jgj) = ^^«jvfl'v, где наиболь- наибольшее из произведений старших мономов многочленов /iyv и gs совпа- совпадает со старшим мономом многочлена S [x^'gi,x?J <?,¦); последний моном строго меньше а;8. Подставим полученное представление многочлена S (x^gi^x^'gj) в A), а затем подставим полученное представление мно- многочлена д в / = д +... В результате получим представление многочлена /, которое противоречит предположению о минимальности я8. Это про- противоречие показывает, что х& = ха. D С помощью теоремы 26.5 легко показать, что следующий алго- алгоритм позволяет найти базис Грёбнера идеала, порожденного многочле- многочленами /ь ..., fs. Вычислим остатки от деления многочленов S(fi,fj) на Л,..., /я и все ненулевые остатки добавим к набору fi,...,fs- Повто- Повторим эту процедуру для полученного набора многочленов и т. д. Ясно, что эта последовательность операций завершается за конечное число
270 Глава 6. Идеалы в кольцах многочленов шагов, а согласно теореме 26.5 в итоге получаем базис Грёбнера иде- идеала, порожденного многочленами /i,... ,/я. Этот алгоритм вычисления базиса Грёбнера называют алгоритм Бухбергера. 26.5. Приведенный базис Грёбнера Для одного и того же идеала I алгоритм Бухбергера приводит к разным конечным результатам в зависимости от выбора образующих идеала и последовательности операций. Но этот алгоритм можно мо- модифицировать так, чтобы конечный результат зависел лишь от самого идеала /; эта модификация также принадлежит Бухбергеру. Первым делом добьемся, чтобы однозначно определено было число элементов базиса Грёбнера. Назовем базис Грёбнера gi,...,gt минималь- минимальным, если <7, = ха' + ... и мономы ха* и xaj не делятся друг на друга при г ф j. У любого идеала / есть минимальный базис Грёбнера. В са- самом деле, пусть д\,..., gt — некоторый базис Грёбнера идеала /. Можно считать, что gt = xai + Если xai делится на ха2, то gi, ¦ ¦ ¦ ,gt —базис Грёбнера идеала /. Действительно, если / = ха + ... е /, то согласно определению базиса Грёбнера ха делится на xai при некотором i. Но хаг делится на хй2, поэтому ха делится на xai при i > 2. Это означает, что <72; • • • ,gt —базис Грёбнера идеала /. Последовательно убирая мно- многочлены, старшие мономы которых делятся на старшие мономы других многочленов, от базиса Грёбнера gi,- ¦ ¦ ,gt можно перейти к минималь- минимальному базису Грёбнера. Теорема 26.6. Если gi,. ¦ ¦ ,gt и Л,..., /s — два минимальных ба- базиса Грёбнера одного и того же идеала /, то s = t и старшие мономы многочленов gi и /„(,), где а — некоторая подстановка, совпадают. Доказательство. Пусть gt = xai + ... и fj = х^1: + ... С одной стороны, /i e I n gi,...,gt — базис Грёбнера идеала /. Поэтому х^1 делится на xai при некотором г. После перенумерации можно считать, что г = 1. С другой стороны, д\ е/и/i,...,/, — базис Грёбнера идеала /. Поэтому xai делится на x$j при некотором j, а значит, х^1 делится на хР'. Из минимальности базиса Грёбнера /i,--.,/« следует, что j = I. Мономы xai и х^1 делятся друг на друга, поэтому х^1 = xai. Аналогичные рассуждения показывают, что х$2 делится на xai. Из минимальности базиса Грёбнера /i,...,/s следует, что xai ф х$1, т.е. г Ф 1. Поэтому после перенумерации получаем ха2 = х& и т.д. Ясно, 26. Базисы Грёбнера 271 что при этом многочлены новременно, т. е. s — t. и /i,..., fs должны исчерпаться од- одD Теперь уже можно добиться, чтобы однозначно было определено не только число элементов базиса Грёбнера, но и сами эти элементы. Назо- Назовем базис Грёбнера gi,...,gt приведенным, если g, = xai + ... и остаток от деления gt на дх,... gt-i, gi+i ,...,gt совпадает с gi, т. е. ни один из входящих в gi мономов не делится на ха' при j ф i. Ясно, что любой приведенный базис является также и минимальным. С помощью минимального базиса Грёбнера gi,..., gt приведенный базис идеала /, порожденного многочленами gi,.--,gt, можно постро- построить следующим образом. Пусть hi — остаток от деления д\ на gi,. ¦ ¦,gt', /12 —остаток от деления gi на hi,gs,... ,gf, /13 —остаток от деления рз на hi,h2,gi,...,gt; •••; Ы — остаток от деления gt на hi,h2,... ,ht-i- Тогда h\,..., ht — приведенный базис Грёбнера идеала /. В самом деле, из минимальности базиса Грёбнера gi,- ¦ ¦ ,gt следует, что старшие мо- мономы многочленов hi и gi совпадают при всех г. Поэтому h\,..., ht — минимальный базис Грёбнера идеала /. Кроме того, при делении gi на hi,... hi-i,ffi+i,... ,gt получается остаток hi, который не содержит чле- членов, делящихся на старшие мономы многочленов hi,... /ц_1 и <7i+i>... ... ,gt, последние мономы совпадают со старшими мономами многочленов /i,+i,-.. ,ht- Таким образом, hi,.. .ht — приведенный базис Грёбнера. Теорема 26.7 (Бухбергер). Для любого идеала / существует ровно один приведенный базис Грёбнера. Доказательство. Существование приведенного базиса Грёбнера только что было доказано. Остается доказать его единственность. Пусть fi,..., ft и д\,..., gs — два приведенных базиса Грёбнера иде- идеала /. Приведенные базисы минимальны, поэтому согласно теореме 26.6 выполняется равенство s = t и можно считать, что старшие мономы многочленов fi и gt совпадают. Предположим, что fi — gi ф 0. Тогда старший моном многочлена fi - gi e / делится на старший моном некоторого многочлена gj. При этом j ф i, так как старший моном многочлена fi — р, строго меньше старшего монома многочлена р,. С другой стороны, если старший моном многочлена д^ делит старший моном многочлена fi — gi, то он должен делить какой-либо моном од- одного из многочленов /, и gi, а это противоречит приведенности базисов fi,... ,ft и pi,..., gt (напомним, что старшие мономы многочленов gj и fj совпадают). ?
Глава 7 Семнадцатая проблема Гильберта 27. Суммы квадратов: введение 27.1. Некоторые примеры Нетрудно доказать, что любой многочлен р(х) с действительными коэффициентами, принимающий неотрицательные значения при всех х е Ж, можно представить в виде суммы квадратов двух многочленов с действительными коэффициентами. В самом деле, корни многочлена с действительными коэффициентами разбиваются на действительные корни и пары комплексных корней. Поэтому s t р(х) = аЦ(х - Zj)(x -zj)Y[(x- <хк)т\ j=i k=i где Gtfc е К. Если р(х) > 0 при всех х е К, то а > 0 и все числа mf. четны, поэтому действительные корни тоже разбиваются на пары. Следовательно, A (vG f[(x - zj) j=l где некоторые из чисел Zj могут быть действительными. Пусть i у/а Y[(x - Zj) = q(x) + ir{x), j=i где q и г — многочлены с действительными коэффициентами. Тогда i - zj) = q(x) - ir(x). В итоге получаем р(х) = (q(x)) + (r(x)) . Но для многочленов от нескольких переменных аналогичное утвер- утверждение уже не всегда верно, т. е. существуют неотрицательные мно- многочлены (так мы будем называть многочлены с действительными коэффициентами, которые при всех действительных значениях перемен- 27. Суммы квадратов: введение 273 ных принимают неотрицательные значения), которые нельзя предста- представить в виде суммы квадратов многочленов с действительными коэффи- коэффициентами. Первым это доказал в 1888 г. Гильберт [Hil], но он не при- привел явный пример такого многочлена. Первый простой пример привел Т. Моцкин в 1967 г. Пример 27.1 [Мо]. Многочлен F(x,y)=x2y2(x2+y2-3) + l неотрицателен, но его нельзя представить в виде суммы квадратов мно- многочленов с действительными коэффициентами. Доказательство. Проверим сначала, что F(x,y) > 0. Если х = 0 или у = 0, то F(x,y) — 1. Поэтому будем считать, что ху ф 0. В таком случае числа х2,у2 и х~2у~2 положительны и их произведение равно 1. Следовательно, х2 + у2 + х~2у~2 > 3, а значит, х2у2(х2 + у2 - 3) + 1 > 0, что и требовалось. Предположим теперь, что F(x,у) = ^2 fj{x, уJ, где /,• — многочлены с действительными коэффициентами. Тогда ^2fj(x,0J = F(x,0) = 1. Следовательно, fj(x, 0) = с,- —некоторая константа, а значит, fj(x, у) = = cj + ygj{x,y). Аналогичные рассуждения показывают, что fj{x,y) = = c'j + xg'j(x,y). Ясно, что при этом с,- = c'j и fj{x,y) = с, + xyhj(x,y). Таким образом, 2у2 т.е. х2у2(х2 + у2 - 3) + 1 = х2у х2у2(х2 +у2 -3) Все одночлены, встречающиеся в правой части этого равенства, имеют степень не больше 3, а все одночлены, встречающиеся в левой части этого равенства, имеют степень не меньше 4. В самом деле, deghj = deg/j - 2 < i degF - 2 = 1. Следовательно, х2у2(х2у2 - 3) - x2y2 Y, Щ = 0, а значит, x2 + y2 - 3 = = ? Щ. Получено противоречие, так как х2 + у2 - 3 < 0 при х = у = 0. ? 10 - 1010
274 Глава 7. Семнадцатая проблема Гильберта Пример 27.2 (R. M. Robinson, 1973). Многочлен S(x,y) = х2(х2 - IJ + у2(у2 - IJ - (х2 - 1)(у2 - 1)(х2 +у2-!) неотрицателен, но его нельзя представить в виде суммы квадратов мно- многочленов с действительными коэффициентами. Доказательство. Проверим сначала, что S(x,y) > 0. Это оче- очевидно для точек, лежащих в незаштрихованной на рис. 6 области, так как для любой такой точки либо х2 + у2 - 1 < 0 и (х2 - 1)(у2 - 1) > 0, либо х2 + у2 - 1 > 0 и (ж2 - 1)(у2 - 1) < 0. Но S(x,y) можно записать и по-другому, а именно, S(x, у) = (х2 +у2- 1)(х2 - у2J + (х2 - \){у2 - 1). При такой записи очевидно, что S(x, у) > 0 для точек, лежащих в за- заштрихованной области, так как для любой такой точки х2 + у2 - 1 > 0 и (х2 - 1)(у2 - 1) > 0. . = 1 .'/ = -1 -1 х = - х= 1 Рис. 6 -1 Рис. 7 Предположим теперь, что S(x,y) = ^2fj{x,yJ. Функция S обраща- обращается в нуль в 8 точках, отмеченных на рис. 7. Следовательно, в этих точках обращается в нуль каждая из функций fj. Но deg/j < - degS = = 3, а если кривая степени не более 3 проходит через указанные 8 точек, то она обязательно проходит и через точку @,0); это мы докажем чуть позже. Итак, fj @,0) = 0 при всех j, поэтому 5@,0) = 0. Но, как легко убедиться, 5@,0) = 1. Полученное противоречие показывает, что мно- многочлен S(x, у) нельзя представить в виде суммы квадратов многочленов. 27. Суммы квадратов: введение 275 Доказательство того, что кубическая кривая, проходящая через 8 точек пересечения прямых pi и qj (i, j = 1,2,3), обязательно проходит и через девятую точку, можно найти в книге [ПрС]. Но для рассматрива- рассматриваемой конфигурации точек можно привести и более простое доказатель- доказательство. Припишем точкам (±1,±1) вес 1, точкам (±1,0) и @,±1) вес -2, а точке @,0) вес 4. Рассмотрим сумму по этим точкам значений функ- функции хруя, умноженных на соответствующие веса. Если pq = 0, то сумма нулевая. Если р > 0 и q > 0, то ненулевой вклад в сумму дают только точки (±1, ±1). При этом сумма окажется ненулевой лишь в том случае, когда оба числа р и q четны. Но у многочлена fj степени не больше 3 таких одночленов нет. Поэтому взвешенная сумма многочлена fj по рас- рассматриваемым 9 точкам равна нулю. В частности, если fj обращается в нуль в восьми точках, то fj обращается в нуль и в девятой точке. ? Пример 27.3 (R. M. Robinson, 1973). Многочлен Q{x,у,z) =х2(х- IJ +у2(у- IJ + z2(z - IJ + 2xyz(x + y + z-2) неотрицателен, но его нельзя представить в виде суммы квадратов мно- многочленов. Доказательство. Предположим, что Q(x,y,z) = ^2fj(x,y,zJ. То- Тогда степень каждого многочлена fj не превосходит 2. А так как функ- функция Q(x,y,z) обращается в нуль во всех точках (х, у, z) с координатами х, у, z = 0 или 1, за исключением точки A,1,1), то во всех этих точках обращаются в нуль функции fj. Как мы сейчас убедимся, из этого следует, что /j(l, 1,1) = 0. Но тогда Q(l,l,l) = 0, а непосредственные вычи- вычисления показывают, что <5A,1,1) = 2. Припишем восьми рассматриваемым точкам веса ±1 так, как это показано на рис. 8, и рассмотрим сумму по этим точкам функции fj(x,y,z) с соответству- соответствующими весами. Легко проверить, что рас- рассматриваемая сумма равна нулю для следующих функций: 1,х,ху,х2. Поэтому она равна нулю и для функции fj(x,y,z), так как ее степень не превосходит 2. Следовательно, если в семи из восьми рассматриваемых точек функция fj обращается в нуль, то она обращается в нуль и в восьмой точке. 10* Рис. 8
276 Глава 7. Семнадцатая проблема Гильберта Докажем теперь, что Q(x, у, z) > 0. Запишем для этого многочлен Q по-другому: Q = х2(х - IJ + {у(у - 1) - z(z -1)J+QX = = у\у ~ IJ + (z(z - 1) - х(х - I)J + Qy = = z\z - IJ + (х(х - 1) - у(у - I)J + Qz, где Qz=2xy(x + z- Достаточно доказать, что в любой точке (x,y,z) одна из функций Qx,Qy,Qz неотрицательна. Но эти функции не могут быть одновре- одновременно отрицательными, так как их произведение представляет собой квадрат многочлена 2y/2xyz(x + y- l)(x + z- l)(y + z-l). ? Пример 27.4 (Anneli Lax, Peter D. Lax, 1978). Форма A{x) = A\ (x)+ + A2(x) + A3(x) + A4(x) + As(x), где х = {xi,x2,x3,x4,x5) и At(x) = = П (xt ~ xj), неотрицательна, но ее нельзя представить в виде суммы квадратов форм. Замечание. Рассматриваемая форма зависит только от разностей переменных, поэтому ее можно представить в виде формы от четырех переменных. Поделив эту новую форму на четвертую степень одной из переменных, можно получить многочлен степени 4 от 3 переменных. Проверим сначала, что А(х) > 0. Значение формы А(х) не изменя- изменяется при любой перестановке переменных, поэтому можно считать, что Xi > х2 > Хз > Xi > х5. В таком случае А1{х) + А2(х) = = (х1-х2)((х1-х3){х1-х4)(х1-х5)-(х2-х3)(х2-х4)(х2-хъ)) > 0, так как хх - х2 > 0,хг — х3 > 0,х2 - х3 > 0 и т. д. Аналогично дока- доказывается, что А4(х) + Аъ{х) > 0. Ясно также, что А3(х) представляет собой произведение двух неположительных и двух неотрицательных со- сомножителей, поэтому А3(х) > 0. 27. Суммы квадратов: введение 277 Предположим теперь, что А(х) — ^2Qj{xJ, где Qj—квадратичные формы. Если каждая переменная Xi равна какой-то другой переменной Xk, то А{х) = 0, а значит, Qj(x) = 0. Поэтому квадрика Qj(x) = 0 в ЕР4 содержит проективную прямую х\ = х2,х3 = х4 = хъ. При пе- перестановках координат получаем 10 прямых такого вида (для задания прямой нужно выбрать 2 координаты из 5). Эти прямые пересекают гиперплоскость общего положения в 10 точках, причем через эти точки должна проходить квадрика Qj(x) = 0. Но в трехмерном пространстве не через любые 10 точек проходит квадрика, поэтому можно ожидать, что форма Qj тождественно равна нулю. Мы сейчас убедимся, что это действительно так, и тем самым придем к противоречию. Пусть Q{x) = Y^CijXiXj,Cij — Cji. По предположению 0 = Q(s, s, t, t) = (cu + 2ci2 + c22)s2 + C14 + C15 + C23 + C24 + C2b)st + C44 + c55 + 2c34 + 2c35 + 2c45)t2. Следовательно, сц + 2с12 + с22 = 0, A) С13 + С14 + С15 + С23 + С24 + С25 = 0, B) СЗЗ + С44 + С55 + 2С34 + 2с35 + 2с45 = 0. C) Кроме того, выполняются аналогичные равенства, получающиеся в ре- результате любой перестановки индексов. В частности, из A) следует, что сзз + 2с34 + с44 = 0. D) Вычитая D) из C), получаем С55 + 2С35 + 2С45 = 0. Пусть сьь = X. Тогда при попарно различных г и j, отличных от 5, выполняется равенство с^ + Cj$ = —Х/2. Следовательно, cis = C25 = = С35 = С45 = —Х/4. Аналогично С21 = С31 = С41 = С51 = С15 = —Х/4 и т. д. В результате получаем сц = X и сц = —Х/4 при i ф j. Но в таком случае из B) следует, что X = 0, т. е. Q(x) = 0 при всех х. 27.2. Теорема Артина-Касселса-Пфистера В параграфе 27.1 мы привели примеры неотрицательных многочле- многочленов, которые нельзя представить в виде суммы квадратов многочле-
278 Глава 7. Семнадцатая проблема Гильберта нов. В дальнейшем мы покажем, что любой неотрицательный многочлен можно представить в виде суммы квадратов рациональных функций. Но для многочленов от одной переменной нет существенной разницы между представлением в виде суммы квадратов многочленов и представлением в виде суммы квадратов рациональных функций. Дело в том, что спра- справедливо следующее утверждение. Теорема 27.1. Пусть К— поле, характеристика которого не рав- равна 2, f(x) —многочлен над К. Предположим, что f{x) = am (а;J + ... + anrn{xf, где at, е К, г^х) —рациональные функции над К. Тогда fix) = оцр^хJ + ... + <xnpnixJ, где Piix) — многочлены над К. Эта теорема имеет долгую историю. В 1927 г. Артин [Аг] доказал, что где т — некоторое число, не обязательно равное п. Затем в 1964 г. Кас- селс [Са] доказал, что можно считать, что т = п. А в 1965 г. Пфистер [Pfl] доказал, что можно считать, что р^ = оц. Теорему 27.1 можно применить и к многочлену /(xi,... ,хп) от п переменных над полем L. Для этого нужно положить, например, х = = х\ и К = L(x2, ¦ ¦ ¦ ,хп)—поле рациональных функций от перемен- переменных Х2,...,хп над полем L. В результате получим, что в представлении многочлена / в виде суммы квадратов рациональных функций в зна- знаменателях этих рациональных функций можно избавиться от любой из переменных (но нельзя избавиться от всех переменных одновременно). Доказательство. При п = 1 утверждение очевидно, поэтому в дальнейшем будем считать, что п > 1 и все a; ^ 0. Доказательство удобно провести на языке квадратичных форм над полем Kix). Пусть v = (i>i,...,wn) — вектор с координатами из Kix). Положим <p(u,w) = = ^2агЩУ{. Требуется доказать, что если / е К[х\ и / = <p(u,u), где щ е Kix), то / = <piw,w), где u;, e К[х]. Квадратичная форма <p(u,u) может быть либо изотропной (т.е. <р(и,и) = 0 для некоторого и ф 0), либо анизотропной (т.е. tp(u,и) ф 0 при и ф 0). 27. Суммы квадратов: введение 279 Случай 1: форма ср(«,и) изотропна. В этом случае нам даже не по- потребуется условие / = cp(u,u) для щ е Kix). Иными словами, для лю- любого многочлена / найдется такой вектор и с координатами из К[х], что / = <р(и,«). В равенстве ср(и, и) = 0 можно считать, что и — многочлен; для этого достаточно рациональные функции щ привести к общему знаме- знаменателю. Можно также считать, что многочлены и\,...,ип взаимно про- просты в совокупности. Тогда существуют такие многочлены vi,...,vn, что uivi + ... 4- unvn — 1. В самом деле, в виде u\f\ + U2/2 можно предста- представить НОД(/1,/г); затем в виде A*1/1+1*2/2M1 +"з/з можно представить НОД(/ь/2,/з) и т. д. Поделив каждый многочлен Vi на число 2а,, полу- получим такой вектор v, что <p(w, v) = 1/2. А так как cp(u, v + Xu) = cp(u, v) и <p(w + Xu, v + Xu) = <p(w, v) + X, то после замены v на v — cp(u, v)u можно будет считать, что ср(и, v) ~ 0. Равенство vfifu + v, fu + v) = /2<p(«, и) + 2/cp(u, v) + <p(v, v) = f показывает, что любой многочлен / можно представить в виде / = = cp(w, w), где w = fu + v. Случай 2: форма ср(ы, и) анизотропна. В этом случае без условия / = = ср(ы, и) для щ е Kix) обойтись уже нельзя. Это видно из следующего примера: К = Ш, fix) = -1 и ср(ы, и) = и\ + ... + и2п. Умножим обе части равенства / = ср(ы, и) на общий знаменатель ра- рациональных функций wb... ,un. В результате получим равенство вида aiul + ... + anu2 = ful, где и0,.. ¦, «„ — многочлены. Среди всех ра- равенств такого вида можно выбрать равенство, в котором многочлен щ имеет минимальную степень г. Требуется доказать, что г = 0. Предпо- Предположим, что г = deguo > 0. Поделим многочлен щ на щ с остатком и тем самым найдем такой многочлен Vi, что deg(iij - "о^) < г — 1. Помимо векторов u = (i*i,..., и„) и w = («i ,...,«„) рассмотрим век- векторы и = («о, ¦¦¦ ,ип) и и = («о, • • •, vn), где «о = 1- Рассмотрим также форму Щх, у) = (fix,у) - fxoVo- По условию ср(й,и) = <p(u,u) - ful = 0. Кроме того, cp(v,u) = <р(и,и) — /> так как ио = 1. Поэтому равенство ф(?|, г>) = 0 противоречит условию г > 0. В дальнейшем будем считать, что ср(и,г>) # 0. Это, в частности, означает, что векторы ииине про- пропорциональны. В таком случае вектор w = cp(u, u)u - 2ср(й, гУ)и ненулевой и ф(г|5, п5) = 0, так как ср(Хй - ии, Хп - uv) = и(-2Хф(и, г;) + jJ9(u, v)) = 0 при X = ф(и, г?) и и = ф(й,и).
280 Глава 7. Семнадцатая проблема Гильберта Итак, мы построили ненулевой вектор w = (wo,w) с полиномиаль- полиномиальными координатами, удовлетворяющий равенству y(w,w) - /wq — 0. Чтобы прийти к противоречию, достаточно убедиться, что degwo < г. Учитывая, что vq = 1, получаем (п \ / п \ ? OLiVJ - / Ы0 - 2( ? OiUiVi - fu0 ) = так как ct;u ;u 2 = /ujj. Напомним, что deg(uj — degw0 = < г - 1. Поэтому J ) -degu0 < 2(r - 1) - r = r - 2. П С помощью теоремы 27.1 можно указать неотрицательный много- многочлен от п переменных, который нельзя представить в виде суммы п квадратов рациональных функций. Теорема 27.2. Многочлен х\ + .. .+х^ + 1 нельзя представить в виде суммы п квадратов рациональных функций от переменных xi,...,xn над полем Ж. Доказательство. Положим К = Е(хх,... xn_i) и х = хп в условии теоремы 27.1. Предположим, что многочлен х\ +... +х2п +1 представлен в виде суммы п квадратов рациональных функций от х\,...,хп. Это означает, что многочлен х2 + d, где d = х\ + ... + xl_x + 1 е К, можно представить в виде суммы п квадратов элементов поля К(х). В таком случае согласно теореме 27.1 многочлен x2+d можно представить в виде суммы п квадратов элементов кольца К[х], т. е. (а г0 ai2x2 Ясно, что при этом должно выполняться равенство oj2 = а,з = ¦ ¦. = 0. Таким образом, х2 +d = ^2(сцх + biJ, г=1 К. 27. Суммы квадратов: введение 281 Подставим в полученное равенство такое значение х = с, что с2 = = (апс + ЬпJ, т. е. A ± а„)с ± Ьп = 0 (при ап ф ±1 можно взять лю- любой знак, а при ап = ±1 допустим только один знак). В результате "-1 получим d = Yl (a»c+ h) 1 гДе с,пг,Ь, е К. Иными словами, многочлен «=i х\ + ... +х2п-\ +1 допускает представление в виде суммы п -1 квадратов рациональных функций от переменных xi,..., xn-\ над полем М. Повто- Повторяя аналогичные рассуждения, в конце концов получим, что многочлен х\ + \ является квадратом рациональной функции от х\ над полем К. Получено противоречие. п 27.3. Неравенство между средним арифметическим и средним геометрическим Неравенство между средним арифметическим и средним геометри- геометрическим заключается в следующем. Если х\,...,хп — неотрицательные числа, то Заменим х, на t2n. Тогда это неравенство примет вид Теорема 27.3 (Гурвиц [Ни]). Многочлен P(h,...,tn) можно пред- представить в виде суммы квадратов многочленов. Доказательство. Положим у, = t\. Для функции /(уь... ,у„) рас- рассмотрим Sf(yi,---,Vn) = Например, A)
282 Глава 7. Семнадцатая проблема Гильберта Рассмотрим функции фп-1 = Легко проверить,что Ф1 = Sy? + Sy Аналогично ~ У2)УЗУ4 ¦¦¦¦¦ Уп), Ф„_1 = 25j/ij/2J/3 • • - • • J/n-i - 25j/ij/2 • • - ¦ • Уп- Следовательно, ф1 + ф2 + ¦ • • + фп-i = 25у" - 25j/ij/2 • • • 2/п- Учитывая соотношения A), получаем т.е. где 2n I л.2п _i _i л.2п 1 1 + 4 T..-ttn 22 2 X / . " 44 ¦¦¦¦¦tn = ^у(ф1 + ф2 ф* = 5((»Г* - l#~*)(Vi ~ Ы2/з2/4 • • • ¦ • Vk+i) = ¦¦¦¦ yk+i) = Таким образом, ф* — сумма квадратов многочленов от t\,..., tn. П 27. Суммы квадратов: введение 283 27.4. Теорема Гильберта о неотрицательных многочленах Пусть pk обозначает многочлен степени к. В параграфе 27.1 мы при- привели примеры неотрицательных многочленов типа рв{х,у) и рц{х,y,z), которые нельзя представить в виде суммы квадратов многочленов. Для многочленов типа ръ(х\,..., хп) таких примеров не существует. В самом деле, многочлену pa(^i,.. • ,х„) соответствует квадратичная форма F2(yi,-..,Уп+i) = u- ¦ ¦,Уп/Уп+i)- Любую квадратичную форму можно представить в виде /? + ... + /? — - /|+1 - ... - fn+1, где /i,..., /n+i — линейные формы. Ясно, что мно- многочлен р2 будет неотрицательным лишь в том случае, когда fk+i = • - • ... = /„+1=0. Гораздо сложнее доказать, что любой неотрицательный многочлен типа pi(x,y) можно представить в виде суммы квадратов многочленов. Теорема 27.4 (Гильберт). Любой неотрицательный многочлен типа Р4(х,у) можно представить в виде суммы трех квадратов многочленов. Мы приведем два доказательства этой теоремы. Первое доказатель- доказательство более простое, но оно позволяет доказать лишь более слабое утвер- утверждение, а именно, будет показано, что р*(х,у) можно представить в виде суммы нескольких (не обязательно трех) квадратов многочленов. Второе — оригинальное доказательство Гильберта. Оба доказательства нам будет удобнее проводить не для многочле- многочленов, а для однородных форм F±{x, y,z). Первое доказательство (Choi-Lam). Мы будем доказывать, что любую неотрицательную однородную форму F^(x,y,z) можно предста- представить в виде суммы квадратов однородных форм. Первая часть доказа- доказательства относится к формам любой степени от любого числа перемен- переменных. Двум формам Р и Q степени п от т переменных можно сопоставить форму ХР + \xQ, т. е. на множестве всех таких форм имеется естествен- естественная структура линейного пространства. Поэтому формы можно считать точками аффинного пространства; начало координат соответствует ну- нулевой форме.
284 Глава 7. Семнадцатая проблема Гильберта Неотрицательные формы образуют замкнутый выпуклый конус С с вершиной в начале координат О. Ясно, что если Q —ненулевая форма и Q е С, то — Q ф. С. Поэтому любая плоскость, проходящая через О и Q, пересекает С по (замкнутому) углу QiOQ2, величина которого строго меньше тс. При этом форма Q является выпуклой линейной комбинацией форм Q\ и Q2- Проведем опорные гиперплоскости к конусу С, проходящие через лучи OQi и OQ2- Они пересекают конус С по некоторым выпуклым конусам строго меньшей размерности. Рассмотрим сечение каждого из этих конусов плоскостью, проходящей через точки О и Q. После несколь- нескольких таких операций мы обязательно придем к конусам размерности 1 (лучам). Точку А замкнутого выпуклого конуса С называют экстремальной, если для нее существует опорная гиперплоскость, пересекающая конус С лишь по лучу О А. Иными словами, точка А экстремальная, если она не является внутренней точкой отрезка, концы которого принадлежат конусу С, но не лежат на луче О А. Описанная выше конструкция пока- показывает, что любая неотрицательная однородная форма Q является вы- выпуклой линейной комбинацией экстремальных неотрицательных форм. До сих пор мы рассматривали формы любой степени от любого числа переменных. Но следующее утверждение справедливо лишь для форм степени 4 от 3 переменных. Лемма 27.1. Любую неотрицательную однородную форму степе- степени 4 T(x,y,z) ф 0 можно представить в виде где q ф 0 — квадратичная форма, 1\ — неотрицательная форма. Следствие. Любая экстремальная неотрицательная форма степе- степени 4 T(x,y,z) является полным квадратом. Следствие вытекает из леммы очевидным образом: для экстремаль- экстремальной неотрицательной формы Т разложение Т = q2 + T\ должно быть тривиальным, т. е. формы q2 и Т\ должны быть пропорциональны. В свою очередь, из следствия очевидным образом вытекает теорема. В самом деле, выпуклая линейная комбинация экстремальных неотрица- неотрицательных форм степени 4 от 3 переменных представляет собой сумму квадратов квадратичных форм. 27. Суммы квадратов: введение 285 Доказательство. Пусть Z{T)— множество нулей формы Т, рас- рассматриваемых с точностью до пропорциональности (т. е. множество ну- нулей этой формы в ЕР2). Случай 1: Z{T) = 0. На единичной сфере х2 + у2 + z2 = 1 фун- функция Т принимает минимальное значение и > 0, поэтому T(x,y,z) > > и(х2 + у2 + z2J при всех (x,y,z). Случай 2: Z{T) состоит из одной точки; без ограничения общности можно считать, что ТA,0,0) = 0. В таком случае коэффициент при х4 равен 0, поэтому T(x,y,z) = x3{aLiy + <x2z)+x2f(y,z) + 2xg(y,z) + h{y,z). Если ati Ф 0 или а.2 ф 0, то при х -*¦ ±оо можно получить отрицательные значения Т. Поэтому T{x,y,z)=x2f + 2xg+h. Ясно также, что / > 0 и h > 0. В разложении fT = (xf + gJ + (fh-g2) форма fh — g2 неотрицательна. В самом деле, если fh — g2 < 0 в точке (а,Ь), то f{a,b) ф 0. Положив х = —g(a,b)/f{a,b), получим /Т < 0 в точке (х,а,Ь). Неотрицательную квадратичную форму f{x,y) можно представить в виде квадрата линейной формы или в виде суммы двух квадратов линейных форм. В соответствии с этим разберем два варианта. (а) / = /х2, где /i = сф + р-г. В точке (-C,а) получаем fh-g2 = -g2 < < 0, поэтому <?(-C, at) = 0, так как форма fh-g2 неотрицательна. Таким образом, g = figi- Следовательно, /Т > (х/ + дJ = (х/2 + /шJ = /2(хЛ + д1J = /(х/х + 9lJ, а значит, Т > (хД + д\J. (б) / = /2 + /|, где /i и /г —линейные формы, не имеющие нетри- нетривиальных (т. е. отличных от начала координат) общих нулей. В таком случае f(y,z) > 0 при (y,z) ф @,0). Предположим, что fh - д2 = 0 при (у,z) = (а,Ь) ф @,0). Тогда Т = 0 при (x,y,z) = {-g(a,b)/f(a,b),a,b). Приходим к противоречию, так как по предположению у Т есть только один нуль в ШР2, а именно A,0,0). Итак, fh-g2 > 0 при (y,z) ф @,0), а значит, {fh - fl2)//3 > u > 0 на единичной окружности. Следовательно, fh-g2 > \if3 при всех {у,z). Поэтому T>{fh- g2)/f > u/2 = (^п/J
286 Глава 7. Семнадцатая проблема Гильберта Случай 3: Z(T) содержит не менее двух точек; без ограничения общ- общности можно считать, что ТA,0,0) = Т@,1,0) = 0. Как и в случае 2, форма Т не может содержать членов с х4 и х3, а также членов су4 и у3. Поэтому Т(х, у, z) = x2f(y, г) + 2xzg(y, z) + z2h(y, z). В разложении fT = (xf + zgJ+z2(fh-g2) форма fh — g2 неотрицательна. При разборе варианта (а) случая 2 мы не пользовались тем, что у формы Т есть ровно один нуль. Поэтому если / = /2 (или h = h2), то можно применить те же самые рассуждения. Остается рассмотреть случай, когда / > 0 и g > 0. Мы снова разберем два варианта. (a) fh—g2 имеет нетривиальный нуль (а, Ь). Пусть <х= —g(a, b)/f(a, b), Ti (х, у, z) = Т(х + olz, у, z) = x2f + 2xz(g + af) + z2(h + 2ag + a2/). В точке (a, b) получаем Поэтому h+2ag+0L2f = h\. Таким образом, Тг(х,y,z) > {zh{f, азначит, T(x,y,z) = Ti(x-ctz,y,z)> (z/ii(a;-ctz,2/,z)J. F) fh - g2 > 0. В таком случае а значит, /Г = (х/ + zgJ + z2(fh - д2) > z2(fh - д2) > az2(y2 + z2)f. В итоге получаем Т > (,/uzyJ + (y/uz2J > (^/uz2J. П П Второе доказательство. (Гильберт) Основная идея этого дока- доказательства заключается в том, чтобы рассмотреть множество А, состо- состоящее из тех вещественных форм от трех переменных, которые можно представить в виде /2 +д2 + h2, где /, д, h — вещественные квадратич- квадратичные формы, не имеющие нетривиальных общих нулей над полем ком- комплексных чисел. 27. Суммы квадратов: введение 287 Лемма 27.2. Множество А открыто. Доказательство. Коэффициенты ay* формы 53 а^кх'у^гк можно считать координатами в Жп. Поэтому отображение представляет собой алгебраическое отображение Ж18 -* Е15 (квадра- (квадратичная форма от 3 переменных задается 6 коэффициентами, а форма степени 4 задается 15 коэффициентами). Достаточно доказать, что если (f,g,h) e А, то дифференциал ЙФ отображения Ф в точке (/, g, h) имеет ранг 15, т. е. сИткегФ = 3. Ясно, что (и, г», w) = 2(u/ + vg + wh), где (и, v, w) e M18 —тройка квадратичных форм, uf + vg + wh — форма степени 4. Квадратичные формы f,g,h не имеют нетривиальных общих нулей над С. Покажем, что в таком случае из равенства uf + vg + wh = 0 (и, v,w — квадратичные формы) следует, что и = \д — u/i, v = Xh - v/, w = \if -\g для некоторых X, u, v e С Достаточно доказать, что A) v = w = u2/ - В самом деле, тогда (Xi - X2)hg + (u2 - ui)//i + (v! - \2)fg = 0. Кривые / = 0,5 = 0и/г = 0 попарно различны, поэтому на кривой / = 0 есть точка, не принадлежащая кривым д = 0 и h = 0. Рассмотрев зна- значения /, д и h в этой точке, получим Xi = X2. Аналогично доказывается, что Ui = u2 и vi = v2. Докажем, например, что w = u2/ - X2g. По теореме Гильберта о нулях идеал, порожденный формами /, д и h, содержит некоторую сте- степень любого многочлена, так как эти формы не имеют общих нулей. В частности, хп при некотором п можно представить в виде хп = rf + sg + th, B)
288 Глава 7. Семнадцатая проблема Гильберта где r,s,t — формы степени п - 2. Рассмотрим равенство B) с минималь- минимальным п. Из A) и B) следуют равенства uft + vgt + wht = О, xnw = rfw + sgw + thw, поэтому xnw = (rw - ut)f + (sw - vt)g -af + bg, C) где а и b — формы степени п. Если n = 0, то мы получаем требуемое равенство. Если же п > О, то мы получаем противоречие с минимально- минимальностью п. В самом деле, при х = О равенство C) превращается в ао/о + hgo = О, где ао = а@,y,z) и т.д. При этом /о и до не имеют общих нулей, a значит, ао = dogo и 6о = —dofo для некоторого многочлена do{y,z). Положим d(x,y,z) = do(y,z) и рассмотрим многочлены ai = а - dg и Ь\ — b + dg. Ясно, что ai/ + Ьгд = af + bg = xnw и ai@,y,z) = bi(O,y,z) = 0, т.е. ai и 6i делятся на х. Сократив на х, получим равенство вида аг/ + b2g = xn~1w, что противоречит мини- минимальности п. Итак, ядро отображения d$: (u,v,w) >-* 2 состоит из векторов вида (v<? - uh, \h - v/, u/ - \g) = X@, h, -5) + u(-/i, 0, /) + v(ff, -/, 0), поэтому размерность ядра равна 3. П Лемма 27.3. Пусть F ^ А\А, где А — замыкание А. Тогда либо F имеет нетривиальный вещественный нуль, либо над полем С кривая F = 0 имеет по крайней мере две двойные точки. Доказательство. Ясно, что F = /2 + д2 + h2, где f,g и h имеют общий нетривиальный нуль (а,Ь,с). Если этот нуль не вещественный, то точки (a, b, с) и (а, Ъ, с) будут двумя различными двойными точками кривой F = 0. В самом деле, эти точки являются нулями функций f,g,h, поэтому они являются двукратными нулями функций f2,g2,h2, а зна- значит, они являются двукратными нулями функции F = f2 + д2 + h2. О 28. Теория Артина 289 Займемся теперь непосредственно доказательством теоремы. Нужно доказать, что любая неотрицательная форма лежит в А. Открытое мно- множество А ограничено поверхностью ЭА = А \ А. Пусть Fi — произволь- произвольная неотрицательная форма степени 4 от 3 переменных. Если F± e А, то доказывать уже нечего. Поэтому будем считать, что i<\ ф А. В таком случае отрезок FoF\, где Fo e A — произвольная точка, дол- должен пересекать дА в некоторой точке Ft. Достаточно доказать, что точку Fo можно выбрать так, что точка Ft совпадет с F\ (тогда F\ = = Ft е дА d "А). Будем считать, что Ft — внутренняя точка отрезка FqFi. Точку Fo можно выбрать так, что Ft имеет нетривиальный ве- вещественный нуль. Дело в том, что согласно лемме 27.3 формы из дА, не имеющие нетривиальных вещественных нулей, соответствуют кри- кривым с двумя двойными точками, а такие формы образуют множество коразмерности не менее 2. Действительно, кривая F = 0 имеет двойную точку, если система уравнений F = 0, Fx = 0, Fy — 0, Fz = 0 имеет решение. Первое уравнение можно не учитывать, так как xFx + yFy + + zFz = nF, где n — степень формы F (в нашем случае п = 4). Кривые Fx = 0 и Fy = 0 пересекаются в (п — IJ точках. Кривая F = 0 имеет к двойных точек, если кривая Fz - 0 проходит через к точек пересе- пересечения кривых Fx = 0 и Fy = 0. Это накладывает к алгебраических соотношений на коэффициенты формы F. Итак, форма Ft = (l — t)Fo + tFi имеет нетривиальный вещественный нуль. Но это противоречит тому, что Ft ф F\. В самом деле, Fo > > 0 и Fx > 0, поэтому при t ф 1 форма A - t)F0 + tFi принимает строго положительные значения во всех точках, отличных от начала координат. ? 28. Теория Артина Эта глава в основном посвящена решению Артина семнадцатой про- проблемы Гильберта о представимости любого неотрицательного много- многочлена в виде суммы квадратов рациональных функций. Доказательство Артина не дает никаких оценок достаточного количества этих рацио- рациональных функций в представлении многочлена от п переменных. Такую оценку получил Пфистер: неотрицательный многочлен от п переменных можно представить в виде суммы 2" квадратов рациональных функций. Теорию Пфистера мы обсудим в разделе 29.
290 Глава 7. Семнадцатая проблема Гильберта В параграфах 28.1 и 28.2 приведены необходимые сведения из те- теории вещественных полей; результаты этих параграфов принадлежат Артину и Шрайеру [ArS]. Собственно решение семнадцатой проблемы Гильберта содержится в 28.3. Это доказательство основано на теореме Сильвестра, позволяющей вычислить количество вещественных корней многочлена как индекс некоторой квадратичной формы (см. с. 45). Наше изложение опирается на [Sa]. 28.1. Вещественные поля Поле К называют упорядоченным, если оно разбито на три непере- непересекающихся подмножества К = N U {0} U Р так, что N = —Р (N — отрицательные числа, Р— положительные чи- числа), причем сумма и произведение двух положительных чисел положи- положительны. Для упорядоченного поля можно ввести обозначение х — у > 0, если х - у е Р (х > у, если х - у е Р или х = у). Положим {а при а > 0, 0 при а = 0, -а при а < 0. Легко проверить, что \ab\ = \а\ ¦ \Ь\ и \а + Ц < \а\ + \Ь\. В любом упорядоченном поле 1 > 0, так как обратное неравенство — 1 > 0 приводит к противоречию: 1 = (—1)(—1) > 0. В частности, характеристика любого упорядоченного поля равна нулю, поскольку 1 + ... + 1 > 0. В любом упорядоченном поле х2 > 0. В самом деле, оба неравенства х > 0 и — х > 0 приводят к одному и тому же неравенству х2 > 0. Упорядочение поля Q единственно, а именно, p/q > 0 тогда и только тогда, когда pq > 0. Действительно, числа p/q и pq получаются друг из друга умножением на q±2 > 0. Примером поля, которое нельзя упорядочить, служит любое поле L, в котором элемент —1 является суммой квадратов (и характеристика L не равна 2). В самом деле, любой элемент а поля L является суммой квадратов: 28. Теория Артина 291 Поле К называют формально вещественным, если элемент —1 не- нельзя представить в виде суммы квадратов элементов К. Эквивалентное условие: если Ь\ + ... + Ъ2п = 0, где Ь\,..., Ьк е К, то h = ... = Ьп = 0. Для краткости будем называть формально вещественные поля просто вещественными. Любое вещественное поле имеет характеристику 0. В самом деле, если характеристика равна р, то -1 = I2 + ¦.. + I2,. р-1 Теорема 28.1. Пусть К — вещественное поле, а е К. а) Если элемент а является суммой квадратов элементов К, то поле К(у/а) вещественно. б) Если поле К(у/а) не вещественно, то элемент —а является суммой квадратов элементов К. Доказательство. Пусть поле К(у/а) не вещественно. Тогда, в частности, К(у/а) Ф К, т. е. у/а ф К. Кроме того, элемент -1 является суммой квадратов элементов поля К(у/а), т.е. в К существуют такие элементы 6j,Cj, что + а?с2. A) Формула A) показывает, что если ф 0, то л/а е К. Поэтому Ес1 B) Пусть а — сумма квадратов элементов К. Формула B) показывает, что в таком случае предположение (с которого мы начинали доказатель- доказательство) о том, что поле К(у/а) не вещественно, приводит к противоречию. Это доказывает утверждение а). Чтобы доказать утверждение б), запишем формулу B) в виде Остается заметить, что если р и q — суммы квадратов, то p/q = pq{q~1J тоже сумма квадратов. ? Следствие. Для вещественного поля К одно из полей К(у/а) и К(у/—а) обязательно вещественно. Доказательство. Если поле К(у/а) не вещественно, то элемент -а является суммой квадратов, поэтому поле К(у/^а) вещественно. G
292 Глава 7. Семнадцатая проблема Гильберта Теорема 28.2. Пусть К — вещественное поле и / е К[х]— не- неприводимый многочлен нечетной степени. Тогда поле К(<х), где а — ко- корень /, вещественно. Доказательство. Пусть п = deg/. Предположим, что поле К (а) не вещественно. Тогда где gi — многочлены степени не выше п - 1. Многочлен 1 + имеет корень а, поэтому он делится на /, т. е. где h — некоторый многочлен. Предположим, что h = 0. Тогда -1 = = Л9г(хJ. Если max(deg<?j) = т > 0, то сумма квадратов коэффици- коэффициентов многочленов gt при хт равна нулю. А если gt = Ci е К, то -1 = = 53 е?- Оба варианта противоречат вещественности поля К, поэтому МО. Степень многочлена J2 9i(xJ четна и не превосходит 2п-2. Поэтому степень многочлена h нечетна и не превосходит п — 2. У многочлена h есть неприводимый множитель hi, степень которого нечетна и не пре- превосходит п - 2. Пусть C — корень многочлена hi. Тогда -1 = ]Cffi(CJ, т. е. элемент —1 является суммой квадратов элементов поля Кф). Повто- Повторив для многочлена hi те же самые рассуждения, что и для многочлена /, получим, что элемент -1 является суммой квадратов элементов поля К(у), где у — корень некоторого неприводимого многочлена нечетной степени, не превосходящей п - 4 и т. д. Приходим к противоречию. ? Поле К называют вещественно замкнутым, если оно вещественно и любое его вещественное алгебраическое расширение совпадает с К. Из теоремы 28.2 следует, что в вещественно замкнутом поле любой многочлен нечетной степени имеет корень. Вещественным замыканием вещественного поля К называют веще- вещественно замкнутое поле R, алгебраическое над К. У любого вещественного поля К есть вещественное замыкание. В самом деле, рассмотрим частично упорядоченное множество всех веще- вещественных полей, алгебраических над К. Согласно лемме Цорна в этом множестве есть по крайней мере один максимальный элемент R. Ясно, что поле R вещественно замкнуто. 28. Теория Артина 293 Теорема 28.3. Вещественно замкнутое поле R допускает ровно одно упорядочение, а именно, ненулевой элемент а е R положителен тогда и только тогда, когда он является квадратом. Доказательство. Ясно, что равенства а = t\ и -а = t\, где ti,t2 e R, не могут выполняться одновременно, так как иначе — 1 = = {hlhJ- Поэтому достаточно доказать, что ±а = t2, где te? Если а Ф t2, то поле i?(i/a) является собственным расширением поля R, поэтому оно не вещественно. В таком случае согласно теореме 28.1 (б) элемент -а является суммой квадратов элементов R. Тогда согласно теореме 28.1 (а) поле Riy^a) вещественно, поэтому оно совпадает с R. Это означает, что У^а е R, т. е. -а = t2, где tefl. ? Теорема 28.4. Пусть К — вещественное поле, причем элемент а е К нельзя представить в виде суммы квадратов. Тогда существует упорядочение поля К, при котором а < 0. Доказательство. Согласно теореме 28.1 (б) поле К{у/^а) веще- вещественно. Пусть R — вещественное замыкание поля А"(^/—«)• Согласно теореме 28.3 поле R имеет упорядочение, при котором элемент —а = = (.у/3^J положителен, т. е. элемент а отрицателен. Ограничение этого упорядочения на К a R и есть требуемое упорядочение. П Введем для алгебраического замыкания поля R обозначение R. Теорема 28.5. Поле R вещественно замкнуто тогда и только тогда, когда R^ R и R = R(y/--1). Доказательство. Предположим сначала, что поле R вещественно замкнуто. Тогда уравнение х2 + 1 = 0 не имеет решений в R, поэтому Я Ф R. Докажем, что R — R(y/^T)- Введем для краткости обозначение i = у/-Л- Прежде всего пока- покажем, что в поле R(i) любое квадратное уравнение имеет корень. Кор- Корни квадратного трехчлена х2 + 2рх + q находятся по формуле xi,2 = = — р ± у/р2 — q, поэтому достаточно доказать, что если a,b e К, то л/а + ib e K(i). Иными словами, нужно подобрать c,d <в К так, что (c + diJ =a + bi,T.e.c2-d2 = а и 2cd = Ь. Ясно, что а2 + Ъ2 = (с2 -bd2J. Поэтому подходящими кандидатами являются , \/а2 + Ь2 + а ., \/а2 + Ь2 - а пг1 /7 — I-1 л Iм* Л
294 Глава 7. Семнадцатая проблема Гильберта Прежде всего проверим, что так определенные числа end действи- действительно лежат в R. Так как а2 > 0 и Ъ2 > 0, то а2 + Ь2 > О, поэтому согласно теореме 28.3 у/а2 + Ь2 е R. Далее, у/а2 + Ь2 > у/а2 > ±a (здесь у/а2 + Ь2 и у/а?— неотрицательные числа). Поэтому у/а2 + Ь2 ± а > О, т.е. си d лежат в R. Равенство с2 -d2 — а выполняется автоматически, а равенство 2cd = Ь будет выполняться, если правильно выбрать знаки чисел с и d. Рассмотрим теперь произвольный многочлен /, неприводимый над R. Запишем его степень п в виде п = 2mq, где q — нечетное число. Докажем индукцией по т, что / имеет корень в R(i). При т = 0 это следует из теоремы 28.2. Предположим теперь, что т > О и требуемое утверждение уже доказано для чисел 1,..., т - 1. Пусть ati,..., о„ — корни многочлена / в некотором расширении по- поля R. Выберем число с е R так, чтобы все числа сс^сц + с(сс* + а*), где к Ф I, были попарно различны. Эти числа являются корнями мно- многочлена g степени п(п — 1)/2 с коэффициентами из R (коэффициенты лежат в R, так как они являются симметрическими функциями от oti,... ..., <хп). Число degg = п(п — 1)/2 имеет вид 2m~1q(n — 1), где q(n — 1) — нечетное число. Поэтому к многочлену g можно применить предположе- предположение индукции. Без ограничения общности можно считать, что корень ctict2 + c(cti + ct2) многочлена g лежит в R(i). Докажем, что i?(aiot2,ai + a2) = -R(ctia2 + c(cti + a2)). Рассмотрим для этого многочлен F с корнями ct^ct/ и многочлен G с корнями ot/t + at/; коэффициенты многочленов F и G лежат в R. Пусть 9 = ctict2 +c(cti +a2). Ясно, что G(cti + a2) = 0 и F{B - c(cti + ct2)) = F(ctict2) = 0, т. е. eti + + ct2 —общий корень многочленов G(x) и F(B — ex) с коэффициентами из R(B). Из условия 9 — с(а* + <х/) ф a^ct; при к, I ф 1,2 следует, что eti + ct2 — единственный общий корень этих многочленов. Кроме того, этот общий корень некратный, так как он является некратным корнем многочлена G. Следовательно, наибольший общий делитель многочленов G(x) и F(B—cx) имеет вид х — (cti+ot2). Коэффициенты этих многочленов лежат в R(B), поэтому eti + a2 e R(B) и ctitx2 = 9 - c(ai + a2) e R(B) = i?(ctitx2 tx2)). Обратное включение i?(cti(x2 + c(cti + ct2)) с i?(ctia2,cti + ct2) очевидно. Итак, aict2, eti +ct2 e i?(otict2 + c(cti +ct2)) с R(i). Поэтому ai и a2 — корни многочлена (степени 2) с коэффициентами из R(i). Но мы уже доказали, что корни любого квадратного многочлена с коэффициентами 28. Теория Артина 295 из R(i) лежат в R(i). Таким образом, у многочлена / есть корень ati, лежащий в R(i). Это означает, что R = R(i). Обратное утверждение (если R Ф R и R = R(i), то поле R веще- вещественно замкнуто) доказывается существенно проще. Между R и R = = R(i) нет промежуточных полей, поэтому достаточно доказать, что поле R вещественно, т.е. —1 не является суммой квадратов элементов R. По условию г $ё Д, т.е. -1 не является квадратом. Таким обра- образом, достаточно доказать, что в R сумма квадратов сама является ква- квадратом. Поле R(i) алгебраически замкнуто, поэтому если a, b e R, то у/а + Ы е R(i), т. е. в R существуют такие элементы end, что а + Ы — = (с + ейJ. В таком случае а -Ы — (с - diJ. Поэтому а2 + Ь2 = (а + Ы)(а - Ы) = (с + diJ{c - diJ = (с2 + d2J. Остается заметить, что если сумма двух квадратов является квадратом, то и сумма любого числа квадратов тоже будет квадратом. ? 28.2. Теорема Сильвестра для вещественно замкнутых полей Пусть К— упорядоченное поле, / — неприводимый многочлен над К. Будем называть вещественно замкнутое поле R г> К вещественным за- замыканием поля К, если R алгебраично над К и упорядочение К, инду- индуцированное упорядочением R, совпадает с исходным упорядочением К. Количество различных вещественных корней вещественного много- многочлена можно вычислить, не выходя за пределы поля К. Это можно сде- сделать двумя способами: с помощью теоремы Штурма и с помощью тео- теоремы Сильвестра. Обе эти теоремы можно доказать и для упорядочен- упорядоченных полей полей. Важнейший вывод из этого таков: если / — многочлен над упорядоченным полем А", то в любом вещественном замыкании R поля К число корней многочлена / одно и то же. Первоначально теория Артина опиралась на теорему Штурма; более современное построение теории Артина на основе теоремы Штурма приведено в книге [Л1]. Но теорема Сильвестра во многих отношения более удобна. Мы, следуя [Sa], приведем решение 17-й проблемы Гильберта на основе теоремы Сильве- Сильвестра. Сигнатура квадратичной формы ср над упорядоченным полем К определяется следующим образом. Над полем К квадратичную форму ф можно привести к виду ...+Xnz2. A)
296 Глава 7. Семнадцатая проблема Гильберта Как и в случае поля Ж, количество положительных X, и отрицатель- отрицательных не зависит от того, как именно мы приводим форму ср к виду A). Действительно, предположим, что есть два разложения V+ ф V_ ф Vo = = W+ ф W- ф Wo. Тогда V+ П (W- ф Wo) = 0, поэтому dim V+ +dim W~ + + dim Wo < 0, а значит, dimV+ < dimW+. Аналогично, dimW+ < Пусть R — вещественное замыкание поля К. Из теоремы 28.5 сле- следует, что степень неприводимого над полем R многочлена равна 1 или 2. Поэтому очевидная модификация рассуждений, использованных при до- доказательстве теоремы 4.5 (см. с. 45), позволяет доказать следующее утверждение. Теорема 28.6. Пусть / — многочлен над полем К и ср(х, у) — били- билинейная симметрическая форма на пространстве K[x]/(f), равная следу оператора умножения на ху. Тогда сигнатура формы ср равна количе- количеству различных корней многочлена /, лежащих в вещественном замы- замыкании R поля К. В частности, как мы уже говорили, количество различных корней многочлена / для всех вещественных замыканий поля К одно и то же. Форму ф мы будем называть формой следа на пространстве K[x]/(f). Теорема 28.7 (Артин-Шрайер). Пусть К — упорядоченное поле и R, R' — его вещественные замыкания. Тогда существует ровно один изо- изоморфизм a: R —>- R' над К, причем этот изоморфизм сохраняет порядок. Доказательство. В вещественно замкнутом поле условие х > у эквивалентно тому, что х — у является квадратом. Поэтому любой изо- изоморфизм o:R-*R' сохраняет порядок. Поле R алгебраично над К, поэтому любой элемент а е R является корнем неприводимого многочлена / над К. Из теоремы 28.6 следует, что в R и R' многочлен / имеет одинаковое число корней. Пусть этими корнями будут cti < ... < ап и а[ < ... < <х'п соответственно. Выберем в R элементы tt так, что i\ = cti+i - ctj. Согласно теореме о примитивном элементе K(au...,an,ti,...,tn-1) = где бей — корень некоторого неприводимого над К многочлена д. В поле R1 многочлен д имеет столько же корней, сколько в поле R. В част- частТеория Артина 297 ности, у него есть некоторый корень 8' е R'. Над К существует изо- изоморфизм jF^(9) —- -^(9'). Он представляет собой вложение а: К(ац, ¦.., а„, R. Легко проверить, что a(ct,) = ctj. В самом деле, а переводит корень мно- многочлена / в корень многочлена /, причем a(txi+i) - a(ctj) = o(t?) > 0. На К(т,..., an) отображение а определено однозначно. В частности, одно- однозначно определен образ элемента а. Теперь с помощью леммы Цорна мож- можно построить однозначно определенный изоморфизм R на R' над К. О Докажем теперь, что у любого упорядоченного поля есть веществен- вещественное замыкание. Теорема 28.8. Пусть К — упорядоченное поле, К'—его расшире- расширение, в котором нет соотношений вида — 1 = ^ Xiaf, где Xf — положи- положительные элементы К и сц е К'. Тогда поле L, полученное из К' при- присоединением квадратных корней из всех положительных элементов К, вещественно. Доказательство. Предположим, что поле L не вещественно. То- Тогда -1 = ^Щ, где h e L. Поэтому в L есть соотношение вида -1 = = 5Z ^гЩ-: гДе ^* — положительные элементы К и 6, е L. По условию все 6j не могут одновременно лежать в К'. Поэтому определено наименьшее натуральное число г, для которого выполняется некоторое соотношение указанного вида с 6, е К'(т/п^,..., v^r)> гДе "ъ ¦ ¦ • i "г —положитель- —положительные элементы К. Запишем bt в виде bt = хг + Уг^/п^, где Xi,yt e К'(у/пг,..., ^/ur_i). Тогда Если J2xiVi Ф 0> то минимальности г. Поэтому где Xj и X,ur — положительные элементы К и ж,, ^ Это тоже противоречит минимальности г. jff'(\/ur,..., -\/ur_i), что противоречит ? Следствие 1. У любого упорядоченного поля К есть вещественное замыкание.
298 Глава 7. Семнадцатая проблема Гильберта Доказательство. Положим К' = К. В К нет соотношений вида -1 = Х}Х*а2 c положительными X,. Поэтому поле L, полученное из К присоединением квадратных корней из всех положительных элементов К, вещественно. Вещественное замыкание поля L и есть требуемое ве- вещественное замыкание поля К. П Следствие 2. Пусть К — упорядоченное поле и К' — его расшире- расширение. Упорядочение поля К можно продолжить на К' тогда и только тогда, когда в К' нет соотношений вида -1 = Х^а?, гДе *•«— положи- положительные элементы К и щ е К'. Доказательство. Ясно, что если соотношения указанного вида есть, то упорядочение нельзя продолжить на К'. Предположим, что таких соотношений нет. Тогда можно построить вещественное поле L з К'. Рассмотрим его вещественное замыкание R. Упорядочение R индуцирует требуемое упорядочение К'. П 28.3. Семнадцатая проблема Гильберта В этом параграфе мы наконец докажем, что если вещественная раци- рациональная функция r(xi,..., хп) неотрицательна для всех вещественных х\,..., хп, то ее можно представить в виде суммы квадратов веществен- вещественных рациональных функций. Это доказательство годится не только для поля К, но и для произвольного вещественно замкнутого поля R. Требу- Требуемое доказательство легко получить из следующей достаточно трудной теоремы. Теорема 28.9 (Артин-Ленг). Пусть R — вещественно замкнутое поле и К — R(xi,...,xn)—упорядоченное конечно порожденное рас- расширение поля R, причем упорядочение поля К согласовано с упорядо- упорядочением поля R. Тогда существует гомоморфизм Д-алгебр тождественный на R. Доказательство. Рассмотрим сначала случай, когда степень транс- трансцендентности К над R равна 1. Можно считать, что элемент х\ = х трансцендентен над R. Тогда поле К является конечным алгебраиче- алгебраическим расширением поля R, поэтому согласно теореме о примитивном 28. Теория Артина 299 элементе К = R(x)[y]. Точно такие же рассуждения, как при доказа- доказательстве леммы Нётер о нормализации (см. с. 250), показывают, что элемент у можно выбрать так, чтобы он удовлетворял уравнению у1 + + ci(x)yl~l + ... + с;(х), где Ci(x),... ,с((х) е 1[х]. При этом будем счи- считать, что степень I минимальна. Рассмотрим многочлен f(X, Y) = Yl + ci{X)Y1'1 +... + q{X) от независимых переменных X nY. Любой паре элементов а, Ъ е R, удо- удовлетворяющих соотношению /(а, Ь) = 0, соответствует гомоморфизм Д-алгебр a: R[x, у] -* R, заданный формулами а(х) = а и а(у) = Ъ. По- Покажем, что таких пар а, Ь е R бесконечно много. Пусть Rk—вещественное замыкание поля К. Многочлен f(Y) = = f(x, Y) e R(x)[Y] имеет в поле RK корень у, поэтому согласно тео- теореме 28.6 сигнатура формы следа ср на пространстве R(x)[Y]/(f) <* R(x)[y]/R(x) = K/R(x) положительна. Эту форму можно привести к диагональному виду с эле- элементами hi(x),..., hs(x) e R[x] на диагонали. Над вещественно замкнутым полем R любой многочлен раскладыва- раскладывается на линейные и неприводимые квадратичные множители. При этом квадратичные множители имеют вид (х + аJ + (З2, где а,р е й. Поэто- Поэтому они положительны как элементы R(x), и при всех а е R элементы (а + аJ + (З2 е R тоже положительны. Пусть х — Xi,..., х - Х( — все различные линейные множители, вхо- входящие в разложения многочленов hi(x),..., h9(x). Упорядочим элементы x,Xi,... ,Xt e R{x); при этом возможны следующие варианты: ... < X, < х < Xj < ...; ... < h < х; х <\j < ... Пусть а—любой элемент поля R, удовлетворяющий, соответственно, неравенствам Х< < а < X/, X, < а; а < Х^ (таких элементов а бес- бесконечно много). Тогда знаки элементов hk(a) и hk{x) совпадают при всех к = 1,..., s. Поэтому сигнатура формы ср равна сигнатуре формы с диагональными элементами /п(а),..., hs(a). Покажем, что для почти всех а форма следа сра на простран- пространстве R[Y]/(f(a,Y)) приводится к диагональному виду с элементами /ii(a),. ¦ ¦, hs(a) на диагонали. Действительно, пусть А(х) = (оу(х)) — матрица формы ср в базисе 1,У,.. .,Yl~l, а В(х) = (Ьц(х)) —матрица, для которой (В(х))ТА(х)В(х) = diag(Mx), ¦ • •, М*)).
300 Глава 7. Семнадцатая проблема Гильберта Тогда если det B(a) /Оини один из знаменателей рациональных функ- функций bij(x) не обращается в нуль при х = а, то (В(а))ТА(а)В(а) = diag(fti(a),..., hs(a)). Остается заметить, что А(а)—матрица формы ф„ в базисе 1,У,... ...,Y'-K Итак, существует бесконечно много элементов aefl, для которых сигнатура формы ф„ положительна. Для всех таких а многочлен f(a,Y) имеет корень Ь е R, т. е. f(a, b) = 0. Как мы уже говорили, любой такой паре (а, 6) соответствует гомоморфизм Д-алгебр a: R[x, у] -» R. Покажем, что почти все такие гомоморфизмы можно продолжать на R[x,у,Х2, ¦ ¦ ¦,хп] z> R[x,у]. Напомним, что х2,...,хп е R[xi,...,хп] — — К = R(x)[y], поэтому Xi = Pi(x,y)/qi(x), где pt и q\— многочлены. Пусть q = qi ¦ ... ¦ qn. По построению a(q(x)) = q(a) Ф 0 для почти всех а. В таких случаях гомоморфизм а можно продолжить на R[x,y] q(x) R[x,y,x2,...,xn] =>Д[хь...,хп] = K. Переход от случая, когда степень трансцендентности К над R рав- равна 1, к случаю степени трансцендентности m > 1 делается простой ин- индукцией по т. Предположим, что существование требуемого гомомор- гомоморфизма доказано для всех полей К, степень трансцендентности которых над R строго меньше т. Рассмотрим поле К = R(xi,... ,хп), степень трансцендентности которого над R равна т. Выберем промежуточное поле F: R с F с К, для которого степень трансцендентности К над F равна 1. Пусть Rp с Rk—вещественные замыкания F и К. Степень трансцендентности Rk над Rf равна 1, поэтому существует гомомор- гомоморфизм Д^-алгебр ф:Rf[x\,¦¦¦,хп] -*¦ Rp. Степень трансцендентности Rp над R равна т - 1, поэтому степень трансцендентности поля Rfy(xi),... ,ф(хп)) с Rp над R не превосхо- превосходит т — 1. Ясно также, что на поле R{§(x\),... ,ф(а;п)) можно задать упорядочение, индуцированное упорядочением поля Rp. Поэтому суще- существует гомоморфизм Д-алгебр o:R[ty(xi),... ,ф(хп)] -> R. Ограничение композиции отображений ф и а на алгебру ..,xn] с RF[xu...,xn] и есть требуемый гомоморфизм. ? 28. Теория Артина 301 Теперь уже легко доказать теорему Артина о неотрицательных ра- рациональных функциях. Пусть к — упорядоченное поле. Рациональную функцию r(xi,...,xn) = —г ,... ,хп) , где p,qek[xi,...,xn], называют неотрицательной, если r(ai,...,an) > 0 при всех ai,... ..., ап е к, для которых q(ai, ...,ап)ф0. Теорема 28.10 (Артин). Пусть R — вещественно замкнутое поле, г е R(x\,... ,хп)—неотрицательная рациональная функция. Тогда г можно представить в виде суммы квадратов элементов R{x\,... ,хп). Доказательство. Предположим, что г не является суммой квадра- квадратов элементов поля R(xi,... ,хп). Тогда согласно теореме 28.4 суще- существует упорядочение поля R(xi,..., хп), для которого г < 0. Представим г в виде несократимой дроби p/q, где p,q e R[xi,... ,хп]. Рассмотрим содержащую г Д-алгебру R 1 г' q(xi,...,xn)\ ' В вещественном замыкании упорядоченного поля R{x\,... ,хп) есть та- такой элемент у, что у2 = — г > 0. Поле R(xi,..., хп, у) содержится в веще- вещественном замыкании R(xx,... ,х„), а значит, в этом поле можно ввести упорядочение, индуцированное упорядочением вещественного замыка- замыкания. По теореме Артина-Ленга существует гомоморфизм тождественный на R. Ясно, что ф(у) ф ( - 1 = 1 и (f(q) ф I - ) = 1, поэтому ф(у) ф 0 и ф(д) Ф 0. Следовательно, ф(г) = — ф(у2) = -(ф(у)) < 0. Но p(ai,... ,а„) При этом q{a\,..., ап) = y(q) ф 0. Неравенство r(ai,..., а„) < 0 проти- противоречит условию теоремы. ?
302 Глава 7. Семнадцатая проблема Гильберта Для произвольного (т. е. не обязательно вещественно замкнутого) упорядоченного поля теорема Артина неверна (первый пример та- такого поля приведен в [Dub]; более простой пример можно найти на с. 86 книги [Pf2]). Но, слегка дополнир доказательство теоремы 28.10, для произвольного упорядоченного поля к можно доказать следующее утверждение. Теорема 28.11. Пусть к — упорядоченное поле и R — его веще- вещественное замыкание. Если рациональная функция г е к(х\,... ,хп) та- такова, что r(ai,..., an) > 0 при всех а\,..., ап ей (если, конечно, значе- значение r(ai,... ,an) при этом определено), то г можно представить в виде суммы квадратов элементов к(х\,..., хп). Доказательство. Если г не является суммой квадратов элементов к(х\,... ,хп), то существует упорядочение поля к{х\,... ,хп), для кото- которого г < 0. Пусть R' — вещественное замыкание поля к(х\,.. .,хп) с таким упорядочением. Можно считать, что R с R' (вещественное замы- замыкание поля к(х\,..., хп) содержит некоторое вещественное замыкание Ri поля к, а Ri и R изоморфны как вещественные замыкания одного и того же поля). В поле R' есть такой элемент у, что у2 = — г > 0. Введем на Д-алгебре упорядочение, индуцированное упорядочением R'. Дальнейшие рас- рассуждения в точности те же самые, что и при доказательстве тео- теоремы 28.10. • ? Следствие. Если упорядоченное поле к таково, что из условия r(xi,...,хп) < 0 при всех xi,...,xn e к следует, что r(xi,...,xn) < 0 при всех Xi,...,xn e R, где R — вещественное замыкание к, то для поля к верна теорема Артина. В частности, теорема Артина верна для поля рациональных чисел Q, т. е. любая неотрицательная рациональная функция с рациональными коэффициентами является суммой квадратов рациональных функций с рациональными коэффициентами. В заключение приведем формулировки двух интересных теорем, до- доказательства которых опираются на теорему Артина. Точнее говоря, первая из этих теорем выводится из теоремы Артина, а вторая — из первой. 29. Теория Пфистера 303 Теорема 28.12 [Ri]. Пусть / — идеал в кольце M[xi,... ,хп]. Тогда следующие условия эквивалентны: A) любой многочлен, обращающийся в нуль во всех общих веще- вещественных нулях многочленов из идеала J, сам лежит в J; B) если сумма квадратов многочленов из кольца M[xi,..., хп) лежит в J, то и сами эти многочлены лежат в J. Теорема 28.13 [St]. Однородная форма F неотрицательна тогда и только тогда, когда существует однородное полиномиальное соотноше- соотношение вида ф(--Р) = 0, где ф(и) = u2n+l + (ци2п + ... + а2П и коэффициенты а\,..., агп являются суммами квадратов однородных форм. 29. Теория Пфистера 29.1. Мультипликативные квадратичные формы В этом параграфе мы будем рассматривать квадратичные формы над произвольным полем к, характеристика которого не равна 2. Ква- Квадратичная форма ф на пространстве кп задается симметрической ма- матрицей А порядка п. При этом если х = (xi,.. .xn) e кп, то ф(х) = хАхт = y^XiXjujj. Квадратичные формы ф и ф называют эквивалентными, если суще- существует такая невырожденная матрица Р порядка п, что ф(х) = ф(Рх). В таком случае ф задается матрицей РАРТ. Для эквивалентных форм будем использовать обозначение ф = ф. Будем говорить, что форма ф представляет элемент а е к, если а = ф(х) для некоторого х е к". Например, форма ф(х) = х\ + ... + х\ представляет элемент а тогда и только тогда, когда а можно предста- представить в виде суммы п квадратов. Основным инструментом теории Пфистера служат введенные им мультипликативные формы специального вида. Квадратичную форму ф называют мультипликативной, если формы ф и щ эквивалентны для любого ненулевого элемента а, представимого формой ф.
304 Глава 7. Семнадцатая проблема Гильберта Любая мультипликативная форма ср обладает следующим замеча- замечательным свойством: если элементы аи ii представимы формой ср, то элемент ab тоже представим формой ср. Дело в том, что эквивалентные формы представляют одно и то же множество элементов поля к. А если мультипликативная форма ср представляет элементы а и 6, то форма аср эквивалентна ей и представляет элемент ab. Введем следующие обозначения. Форму ф(х) = а\х\ + .. .+апх2п будем обозначать (ai,...,an). Для форм ср = (ai,...,aro) и ф = Fb...,6n) положим cp©c|>=(ai,...,am,6i,...,6n), ср<Е)ф = (oibi,... ,ambi,aib2,... ,amb2,... ,aibn,... ,ambn). Формы вида (l,ai) eg) A,аг) ® . • • eg) A,0, где a\. ..an ф О, введенные Пфистером, играют главную роль в его теории. Будем для краткости обозначать такие формы {(а\,... ,ап)). Наибольший интерес для нас представляет форма (A,..., 1)), т. е. сумма 2" квадратов. Но при дока- га зательствах индукцией по п не удается избежать рассмотрения общего случая ((ab...,an)). Теорема 29.1 (Пфистер). Форма ((ai,...,an)) мультипликативна. Доказательство. Рассмотрим сначала случай п = 1. Пусть форма ((ai)) = x^+aix?, представляет элемент Ь ф О, т. е. b = с2 +aic2. Положим ) Р 1 2). Легко проверить, что РАРТ = ЬА и А = и Р = -01С2 \ ) detP ф 0. Это означает, что ((ai)) = Ь{{а\)). Форма ((ai,...,an)) имеет вид фФа„ф, где ф = ((oi,...,an_i)). По- Поэтому достаточно доказать, что если форма ф мультипликативна и а ф Ф 0, то форма ф Ф щ тоже мультипликативна. Пусть Ь = ф(х) + щ{у) = = 2; + ar] Ф 0, где элементы 2; и т) представимы формой ф. Если 2; = 0, то у] ф 0, поэтому г]ф = ф, а значит, 6(ф ф acp) = аг](ф ф аф) = аф ф а2ф = ф ф аф, так как а2ф й ф. Случай т) = 0 рассматривается аналогично. Остается рассмотреть случай ?у)Ф 0. В этом случае ср = ?ф и ф = ^-1ф — (л?1)?- Следовательно, 6(ф ф аф) = E + аг])(ф Ф аф) ^ A + а^'^Сф Ф (ат^-^ф) = 29. Теория Пфистера 305 При разборе случая п = 1 было показано, что форма ({а типликативна. Эта форма представляет элемент 1 -f at)^ Следовательно, A + ат)^~1)((ат)^~1)> = ((ат)^)), а значит, Ь(ф ф acp) S ((ат^" что и требовалось доказать. = ср 2 ф 0 аср, муль- муль1 ^ 0. ? При доказательстве теоремы Пфистера мы не пользовались тем, что char к ф 2, поэтому она верна для любого поля. Особенно интересен слу- случай а\ = ... = а„ = 1ч В этом случае из теоремы Пфистера следует, что в любом поле произведение элементов, представимых в виде суммы 2" квадратов, тоже представимо в виде суммы 2" квадратов. При п = 1,2,3 для такого представления есть явные формулы общего вида. Например, при п = 1, т. е. для суммы двух квадратов, требуемое тождество имеет вид {х\ + х\){у\ + yl) = (хц/! + х2у2? + О1У2 - х2у{J. Но при п > 3 тождеств такого вида уже быть не может. Нам потребуется следующее вспомогательное утверждение. Лемма 29.1. Запишем форму ф = ((ai,. ..,an)), где а\.. .ап ф 0, в виде ф = A) ф ф'. Пусть форма ф' представляет элемент Ь\ ф 0. Тогда ф ^ (Fi,...,bn)) для некоторых ненулевых Ь2,...,Ь„. Доказательство. Применим индукцию по п. При п = 1 форма ф' имеет вид aixf. Если 6i = а\С2, то Ь\х\ = ai(cxiJ = aixf. Таким образом, (ai) ^ Fi), а значит, ((ai)) = ((h)). Предположим теперь, что требуемое утверждение доказано для всех форм вида ((ci,..., cn_i)), где С\... cn_i ф 0. Чтобы доказать требуе- требуемое утверждение для формы ф = {(o-i, ¦ ¦ ¦ >Яп)), рассмотрим форму ф = = (<ai,...,an_i)) = A) фф'. Ясно, что ф = ф ф апф и ср' = ф' Ф апф. Поэтому элемент bi, представимый формой ф', можно записать в виде Ьх = b[ + anb, где элементы Ь[ и Ь представляются формами ф' и ф, соответственно. Пусть сначала Ь = 0. В таком случае Ь[ = &i. Согласно предположе- предположению индукции ф = (Fi,...,6n_i)), а значит, ср = ((bi,...,bn~i,an)). Рассмотрим теперь случай Ь ф 0. В этом случае форма ф предста- представляет ненулевой элемент Ъ. Согласно теореме Пфистера форма ф муль- мультипликативна, поэтому ф = 6ф. Следовательно, ф' = ф' ф (ап6)(с)-1ф) S = ф' ф с„ф, где с„ = а„Ь. При этом Ь\ - Ь[ + с„. Пусть Ь[ = 0. Тогда t>! =с„ и ф = ((с„))®ф = ((cn,ai,...,an-i}) = «bi,ai,...,an_i)>. п - 1010
306 Глава 7. Семнадцатая проблема Гильберта Остается рассмотреть случай, когда 6i = b[ + сп, причем Ъ^Сп ф 0. Форма ф' представляет элемент Ь[, поэтому согласно предположению индукции ф = {(Ь[,Ь2,...,Ь„_1». Следовательно, Пусть X = Ъ[ и и = сп. Тогда \ + u = 6i ф 0. Равенство llWxoWifi^ / \1 -\ ) \0 р) \1 -\) \ ? показывает, что (б'^с,,) = {bi,b\b\cn). Поэтому «bi,cn» = A, Ь\, с„, b[cn) 2 (I, bi, b[cn, bib[cn) = ((bi.bicn» Положим bn = b{cn. Тогда ф^ ((bi,bn)) ® ({h,¦ ¦ ¦ ,Ъп)) - ((bi,...,bn)). 29.2. Ci-поля В предыдущем параграфе мы познакомились с одним из инстру- инструментов теории Пфистера— мультипликативными формами. Другой ин- инструмент этой теории, Cj-поля, был создан в 1933-1936 гг. китайским математиком Чунжцзе Дзеном и в 1952 г. переоткрыт Ленгом. Поле К называют d-полем, если любая система однородных много- многочленов для которых d\+ ... + <РГ <п, где ds = deg/s, имеет общий нетривиаль- нетривиальный нуль. Теорема 29.2 (Дзен-Ленг). Если поле L алгебраически замкнуто, то поле К = L(ti,...,U) (т.е. поле рациональных функций от i пере- переменных над полем L) является Cj-полем. Доказательство. Применим индукцию по г. При г = 0 поле К совпадает с L, т.е. поле К алгебраически замкнуто, а условие d\ + ... .. . + dj. < n означает, что г < п. В таком случае требуемое утверждение совпадает с однородной теоремой Гильберта о нулях (теорема 25.10 на с. 261). 29. Теория Пфистера 307 Шаг индукции заключается в том, чтобы доказать, что если поле L является Cj-полем, то поле К = L(t) является Cj+i-полем. Пусть Д,... ...,/г е К[х\,... ,хп] — однородные многочлены, причем d[+1 + ... ... + dj.+1 < n, где ds = deg/g. Требуется доказать, что многочлены /ъ... ,/г имеют общий нетривиальный нуль в К. Коэффициенты мно- многочленов /ь..., /г лежат ъ К = L(t), т. е. они являются рациональными функциями над полем L от переменной t. Умножив все эти коэффици- коэффициенты на подходящий многочлен из кольца L[t], можно будет считать, что коэффициенты многочленов /ь...,/г лежат в L[t], т.е. эти ко- коэффициенты являются многочленами от t над полем L. Степени этих многочленов ограничены некоторым числом т, поэтому любой коэффи- коэффициент а можно представить в виде amt При р = 1,..., п положим где ao,...,a XpstS, L. A) B) где Хро,..., xps — независимые переменные над полем L, а число s доста- достаточно велико (это число мы определим чуть позже). Заменим в каждой однородной форме /i,..., /г коэффициенты и переменные выражениями A) и B), соответственно. В результате форма /, запишется в виде rfl,eN — sdj+m ngo,.-.,gN — формы степени dj от (s + l)n переменных xpq над полем L. Согласно предположению индукции все формы g для многочленов /i,..., /г имеют общий нетривиальный нуль, если выпол- выполняется неравенство т. е. По условию n - J2 d*+1 > 0, поэтому требуемое неравенство выполняется при достаточно больших s, например, при s > (т + 1) ][] dj. ?
308 Глава 7. Семнадцатая проблема Гильберта 29.3. Теорема Пфистера о суммах квадратов рациональных функции В двух предыдущих параграфах мы приготовили основные инстру- инструменты для доказательства теоремы Пфистера. Нам понадобится еще следующее свойство квадратичных форм: если невырожденная квадра- квадратичная форма ф над полем К изотропна (т. е. ф(и) = 0 для некоторого и ф 0), то она универсальна (т.е. представляет все элементы поля К). В самом деле, невырожденной квадратичной форме ф соответствует не- невырожденная билинейная симметрическая форма (*> у) = х (ф(х + у) - <?(х) - Поэтому найдется такой вектор v, что f(u,v) = 1. В таком случае ф(к + Хы) = ф(г>) + tp(Xu) + 2f(v, Xu) = q>(«) + 2X. Для любого b e К можно выбрать такое X, что ф(г») 4- 2Х = Ь. Из теоремы 29.2 следует, что если поле L алгебраически замкнуто, то любая невырожденная квадратичная форма ф от 2" переменных на полем К = L(t\,... ,tn) универсальна. В самом деле, пусть г е К. Рас- Рассмотрим вспомогательную квадратичную форму ф(и, t) = <j>(u) — rt2 от 2" + 1 переменных. Согласно теореме 29.2 форма ф имеет нетривиальный нуль (ыо,?о). Если t0 = 0, то ф(и0) = 0, причем щ ф 0. Это означает, что форма ф изотропна, а потому универсальна. Если же t0 ф 0, то ф(^1ыо) = г, т. е. форма ф представляет г. Теорема 29.3 (Пфистер). Пусть R — вещественно замкнутое поле и ф — ((ai,... ,ап)) — невырожденная квадратичная форма от 2" перемен- переменных над полем R(xi,... ,хп). Тогда если Ь — сумма квадратов элементов R(x\,..., хп), то форма ф представляет Ъ. Доказательство. Если форма ф изотропна, то она универсальна. Поэтому можно считать, что форма ф анизотропна, т. е. ф(ы) ф 0 при и ф 0. По условию Ь — Ь\ +... + Ь2т. Применим индукцию по т. При т = = 1 утверждение очевидно, так как любая мультипликативная форма представляет элемент 1, а значит, она представляет и элемент Ь\ ¦ 1. Пусть теперь т = 2, т. е. Ь — Ь\ + Щ, причем 6i62 ф 0. Пусть L = = R(i) — алгебраическое замыкание поля R. Элемент C = Ь\ + ibx поро- 29. Теория Пфистера 309 ждает поле L{x\,... ,хп) над полем R(xi,... ,хп), т.е. Поле R вещественное, поэтому г ф R(x^,... ,х„) и C ф R(x\,... ,хп). Форму ф можно рассматривать и как форму над полем L(x\,..., xn)z> э R(xi,. ..,хп). Над этим полем она универсальна, так как поле L алге- алгебраически замкнуто. Поэтому найдутся такие 2п-мерные векторы u,v с коэффициентами из R(xi,... ,х„), для которых ф(ы 4- fiv) = C, т. е. Ф(Ы)+2р/(Ы,?;) + р2фН = Р. A) где / — билинейная симметрическая форма, соответствующая ф. При этом v ф 0, так как иначе [3 = ф(и) е Д(х1?... ,ж„). Из анизотропности формы ф следует, что ф(г») Ф 0. Неприводимое над R(xi,.-., хп) уравнение для р имеет вид (р—biJ-4- + &2 = °i т. е. (З2 - 2biC + 6 = 0. B) Сравнивая A) и B), получаем, в частности, Ъ = ф(и)/ф(г>). Из муль- мультипликативности формы ф следует, что она представляет как элемент 1/ф(г>), так и произведение элементов ф(ы) и 1/ф(г»), т. е. элемент Ъ. Предположим теперь, что требуемое утверждение доказано для неко- некоторого т > 2, т. е. любая форма ф вида ф = ((ai,... ,an)) представляет любой элемент вида Ь\ + ... + Ь2,,. Нужно доказать, что форма ф пред- представляет любой элемент вида Ъ\ +.. . + Ь271 + b^+i, где bm+i ф 0. Запишем этот элемент в виде b^+^b+l), где 6 — сумма т квадратов. Достаточно доказать, что форма ср представляет элемент с = Ь + 1. Можно считать, что с ф 0. Чтобы воспользоваться леммой 29.1 (см. с. 305), запишем форму ф в виде ф = A) ф ф'. Согласно предположению индукции форма ф предста- представляет элемент Ь, т. е. Ь = Ь^+Ь', где элемент Ъ' представляется формой ф'. Рассмотрим мультипликативную форму ф = ф (8) A,—с) от 2n+1 пере- переменных. Ясно, что где форма ф' = ф' ф (—сф) представляет элемент При этом -1 - 6д Ф 0, так как г ф. R(x\,... ,хп). В таком случае можно применить лемму 29.1 к форме ф и элементу — 1 — Щ. В результате по-
310 Глава 7. Семнадцатая проблема Гильберта лучим, что в поле R(x\,... ,хп) существуют такие ненулевые элементы сь...,с„, что т.е. ф й (-1 - Ъ%) ® х = X© ( - bg)x, где х = (id, • • • ,сп)). Применим снова предположение индукции, на этот раз к форме х- Элемент 1 + б2, является суммой не более чем т квадратов, поэтому форма х его представляет. В таком случае из мультипликативности формы х следует, что х — A + &о)Х> а значит, Ф 8 (-сф) = ф = X ® (-1 - Ьо)Х = A + *>о)Х © (-1 - Ьо)Х- Пусть ? = A + 6§)х- Тогда ф(Рх + Qy) - c<?(Rx + Sy) = l(x) где = U — невырожденная матрица порядка 2". Положив х = = у, получим ф(Лх) = сф(Вх), где A = P + QnB = R + S. Из невыро- невырожденности матрицы G следует, что если х ф 0, то (Ах, Вх) ^ @,0). Если бы одна из матриц Аи В оказалась вырожденной, то форма ф была бы изотропной, а мы рассматриваем случай анизотропной формы. Если же обе матрицы невырожденные, то ф = сф, а значит, мультипликативная форма ф представляет элемент с. ? Согласно теореме Артина любой неотрицательный элемент поля i?(xi,... ,хп), где R — вещественно замкнутое поле, является суммой квадратов. Поэтому мультипликативная форма (A,...,!)) предста- представляет любой неотрицательный элемент поля R(x\,...,хп), т.е. любой неотрицательный элемент этого поля можно представить в виде суммы 2" квадратов. На с. 280 приведен пример элемента поля M(xi,.. .,хп), который нельзя представить в виде суммы п квадратов. Таким образом, если N — наименьшее число, для которого любой элемент поля M(xi,..., хп) можно представить в виде суммы N квадратов, Ton + l<iV<2n.B об- общем случае для N никаких других оценок не известно. Лишь при п = 2 известно, что N = 4. Это утверждение доказано двумя разными спо- способами, но оба доказательства весьма сложные. Одно доказательство использует теорию эллиптических кривых над полем С(х) (см. [СЕР] и [Chr]). Другое доказательство опирается на теорему Нётера-Лефшеца о том, что на поверхности общего положения степени d > 4 в трехмерном 29. Теория Пфистера 311 1\ проективном пространстве любая кривая высекается некоторой другой поверхностью (см. [Со]). При доказательстве теоремы Пфистера существенно используется то, что поле R вещественно замкнуто. Для поля Q теорема Пфистера неверна. Это видно уже при п = 0. Действительно, не любое положи- положительное рациональное число является квадратом рационального числа. Но при п = 0 требуемая оценка известна: любое положительное рацио- рациональное число является суммой квадратов четырех рациональных чисел. В самом деле, согласно теореме Мейера (см. [БШ], [К2] или [С]) любая невырожденная квадратичная форма над полем Q от п > 5 перемен- переменных (нетривиально) представляет нуль, если она представляет нуль над полем Ж. В частности, если г > 0, то форма х\ + х\ + х| + х\ — гх\ представляет нуль над Q. При п = 1, т.е. для многочленов над Q от одной переменной, пер- первым получил оценку Э. Ландау в 1906 г. в работе [L]. Он показал, что любой неотрицательный многочлен (от одной переменной) с рациональ- рациональными коэффициентами можно представить в виде суммы 8 квадратов многочленов с рациональными коэффициентами (простое доказатель- доказательство теоремы Ландау приведено в главе 7 книги [Pf2]). Но эта оценка не точная. Точную оценку получил Пурше [Ри]: любой неотрицательный многочлен над Q можно представить в виде суммы квадратов 5 много- многочленов над Q (подробному изложению теоремы Пурше посвящена глава 17 книги [Raj]). Для многочленов, обладающих некоторыми специальными свойства- свойствами, можно получить и более точные результаты. Например, в [DLS] показано, что если значения многочлена f(x) при всех целых х явля- являются суммами квадратов двух целых чисел, то многочлен /(х) является суммой квадратов двух многочленов с целыми коэффициентами. Пример неотрицательного многочлена, который над Q нельзя пред- представить в виде суммы квадратов четырех многочленов, строится доста- достаточно просто. Дело в том, что если ах2 + Ьх + с = + btJ, 8=1 то 4ас — б2 — сумма квадратов трех рациональных чисел. Действи- Действительно,
312 Глава 7. Семнадцатая проблема Гильберта а если рассмотреть произведение кватернионов ai + a2i + 03,7 + 0,4k и Ь\ — b2i — b2j — Ь2к, то можно убедиться, что B_J &?) = + сумма трех квадратов. Теперь легко показать, что квадратный трехчлен х2 + х + 4 нельзя представить в виде суммы квадратов четырех многочленов. Для этого нужно доказать, что 15 нельзя представить в виде суммы квадратов трех рациональных чисел. Если бы 15 равнялось р2 + q2 + г2, то после приведения к общему знаменателю мы получили бы сравнение а2 + Ь2 + с2 = 15d2 (mod 8) = -d2 (mod 8), где хотя бы одно из чисел а, Ь, с, d нечетно. Такое сравнение невозможно. Дополнение 30. Алгоритм Ленстры-Ленстры-Ловаса В 1982 г. в работе [LLL] был предложен алгоритм (LLL-алгоритм, или алгоритм Ленстры-Ленстры-Ловаса), позволяющий разложить многочлен над Z на неприводимые множители за полиномиальное время. / п \ V2 Точнее говоря, если /(х) = ^ щх1 е Z[x] и |/| = I YL а1) > т0 Д-*1"- i=0 \t=0 / разложения многочлена / на неприводимые множители по этому алго- алгоритму потребуется не более О(п12 +п9Aп|/|K) операций. LLL-алгоритм имеет большой теоретический интерес, но с практи- практической точки зрения он не более эффективен, чем сравнительно про- простой алгоритм, описанный в разделе 10.2. Вначале оба алгоритма ра- работают одинаково: многочлен / разлагается на неприводимые множи- множители по модулю простого числа р с помощью алгоритма Берлекэмпа, а затем с помощью леммы Гензеля с некоторой точностью вычисляется р-адический неприводимый множитель h многочлена /. Но после этого LLL-алгоритм действует по-другому: для h ищется неприводимый де- делитель ho многочлена / в кольце Z[x], делящийся на h по модулю р. При этом условие делимости ho на h означает, что коэффициенты мно- многочлена ho являются координатами точек некоторой решетки, а усло- условие делимости / на ho означает, что коэффициенты многочлена ho не слишком велики. Для вычисления многочлена h0 используется алгоритм построения приведенного базиса решетки. Следует отметить, что по- последний алгоритм имеет также многочисленные применения, не относя- относящиеся к факторизации многочленов. ЗОЛ. Общее описание алгоритма Перейдем непосредственно к описанию алгоритма факторизации. Будем считать, что многочлены / и /' взаимно просты и cont(/) = 1. Начнем с того, что вычислим результант R(f,f) e Z. Пусть р — наи- наименьшее простое число, не делящее R(f,f). Тогда степень многочлена / (mod р) равна п и многочлены / (mod p) и /' (mod p) взаимно про- просты. Чтобы доказать это, достаточно заметить, что R(f, /') = ±anD(f) (а потому ап не делится на р) и R{f, /') = ср/ + ф/', где ср, ф е Z[x]. У многочлена / (mod p) нет кратных делителей, поэтому его можно разложить на неприводимые множители по алгоритму Берлекэмпа.
314 Дополнение Пусть h (mod р) — один из неприводимых множителей многочлена / (modp). В дальнейшем мы будем считать, что h e Z[x], старший коэффициент многочлена h равен 1 и коэффициенты многочлена h при- приведены по модулюр, т.е. заключены между 0 и р — 1. Рассмотрим разложение многочлена / на неприводимые множители над Z и перейдем от этого разложения к разложению по модулю р. У многочлена / (mod p) нет кратных неприводимых множителей, по- поэтому многочлен h (mod p) соответствует ровно одному неприводимому делителю Ло многочлена / над Z. Таким образом, существует ровно один неприводимый делитель h0 многочлена / над Z, для которого ho (mod p) делится на h (mod p). Если известен алгоритм, позволяющий по многочлену h вычислять многочлен /io, то факторизация многочлена / производится просто. Действительно, пусть над Z задано разложение / = /i/г, где для мно- многочлена fi известно полное разложение над Z, а для многочлена /2 из- известно полное разложение по модулю р (на первом шаге Д = 1 и /г = /). Возьмем неприводимый делитель h (mod p) многочлена /2 (mod p) и вы- вычислим неприводимый делитель ho многочлена /2 над Z, для которого ho (mod р) делится на h (mod p). Заменим Д на /i/io, а /2 на /г/^о- После этого повторяем операцию до тех пор, пока не получим полное разложение многочлена /. Алгоритм, который для данного многочлена h (mod p) вычисляет многочлен ho, мы опишем чуть ниже, в разделе 30.3. Этот алгоритм ис- использует алгоритм вычисление приведенного базиса решетки. Поэтому мы сначала обсудим понятие приведенного базиса решетки и алгоритм вычисления приведенного базиса (этот алгоритм также был предложен в работе [LLL]; его тоже часто называют LLL-алгоритмом). 30.2. Приведенный базис решетки Подмножество Let" называют решеткой ранга п, если в Ж" су- существует такой базис bi,..., bn, что L= Ег.-Ь Определителем решетки L называют число d(L) = \det(bu...,bn)\, где под bi подразумевается столбец координат вектора 6,. Определитель 30. Алгоритм Ленстры-Ленстры-Ловаса 315 решетки равен объему параллелепипеда, натянутого на векторы 6Ь ... ., Ьп. Базис решетки не единствен, но определитель матрицы перехода одного базиса решетки к другому равен ±1, поэтому число d{L) не от зависит от выбора базиса. Пусть bi,...,bn — базис решетки L. При ортогонализации Грама- Шмидта получаем ортогональный (не обязательно ортонормирован- ный) базис где F4i = Определение. Базис 6Ь..., Ъп решетки L называют приведенным, если Ы < \ при 1 < 3 < i < п и \Ъ* + ^i-ibU? > \\bU\2 при 1 < г < п. Теорема 30.1 (неравенство Адамара). d(L) < П N> T-e- объем параллелепипеда не превосходит произведения длин его ребер. Доказательство. Векторы Щ попарно ортогональны, поэтому Кроме того, d{L) = ? В следующей теореме собраны основные неравенства для векторов приведенного базиса. Теорема 30.2. Пусть h,...,Ьп — приведенный базис решетки L. Тогда: а) d(L) < ft N < 2^n-^4d(L). б) \bj\ < 2^-1^2\Щ\ при 1 < j < г < п. )|| г) Если х е L, х ф 0, то |6г| < 2^~1)/2\х\. д) Если векторы xi,...,xt e L линейно независимы, то Щ < <2(n-1V2max{\x1\,...,\xt\} при 1 < j < t.
316 Дополнение Доказательство, а) Из определения приведенного базиса следует, ЧТО поскольку |и^_1| < 1/2. Простая индукция показывает, что \bj\2 < 2'~-7|6*|2 при i > j. По- Поэтому v '-1 ' 1+2+.., 3=1 Следовательно, ftl^|2< ,2^1+1 1+2 2 2 1+2" П I6»*!2 ^12- ¦ ¦•2"~1^J = 2n("-1)d(LJ. t=l б) Из неравенств \Ц\2 < 21~ЦЬ;\2 при г > j и |6,|2 < *+^ [Ь*|2 < < 2j~1\b*j\2 получаем \bj\2 < 2'~> ¦ 2'~1\Ц\2 = 2i~1\b^\2 при i > j. в) Согласно б) имеем неравенства |6i|2 < \ЬЦ2, \bi\2 < 2J&212э - - - • • • j l^i|2 < 2"~1|6^|2. Перемножив их, получим 2n(n-l)/2 8=1 г) Запишем х в виде х = J2 гфг = 53 si&*) гДе ri e Z, s; e E. Пусть i=i i=i г — наибольший индекс, для которого г* ^ 0. Тогда п = s^. Поэтому № > s2\b*\2 = г2\Ъ*\2 > \Ъ*\2 > 21~i\b1\2 > 21~П\Ъ1\2. д) Векторы xi,...,xt не могут все лежать в подпространстве, по- порожденном векторами bi,.. .,bt-i, поэтому для некоторого вектора xs выполняется неравенство |х„| > |6*|2, где г > t (см. доказательство г). Следовательно, при j < i получаем Ы2 > \Ь*|2 > 2>-Щ\2 > 2j-1 ¦ 21~j\bj\2 = 21~%\2 > 21-n\bj\2. П Опишем теперь алгоритм вычисления приведенного базиса решет- решетки L. Предположим, что векторы Ь\,... ,bk-\ образуют приведенный базис порождаемой ими решетки (мы начинаем с одного вектора, т. е. с к = 2). Добавим к ним вектор 6*, принадлежащий решетке L, но не 30. Алгоритм Ленстры-Ленстры-Ловаса 317 лежащий в пространстве, порожденном векторами bi,..., bk-i- Построе- Построение базиса решетки, порожденной векторами Ъ\,... ,bk выполняется сле- следующим образом. Шаг 1 (выполнение условия |u/fej| < 1/2). Напомним, что Uf,- = = .*' v.. Предположим, что \\ikj\ < 1/2 при I < j < к (мы начинаем с I = к). Заменим Ь^ на 6* - qbi, где q — ближайшее к и^ целое число. Это преобразование сохраняет и.^ при j > I (так как b*j ± bi при I < < j) и заменяет и^ на \iki - q (так как (bj,bj*) = (bf,&;*))• Ясно, что \и.ы — q\ < 1/2, поэтому после такой модификации условие |и^| < 1/2 будет выполняться при I — 1 < j < к. Затем повторяем эту операцию. Шаг 2 (выполнение условия \Ь*к\2 > C/4 - u^ A._1)|bJ_1|2). Пред- Предположим, что \Ь*к\2 < C/4 — u2. fc г) 1^*% хI2- В таком случае заменим упорядоченный набор (bi,... ,6*_2,Ь*_1,Ь*) на упорядоченный набор (bi,...,bk-2,h,bk-i)- При этом bj_x заменится на Ь*к + Uk,k-ib*k_i, по- поэтому Ibj^J2 заменится^а ( ^ II2 II/.* | — \h* - 4 I0*:—1 Рассматриваем приведенный базис b\,..., bk-2 и применяем для него первый шаг алгоритма. Из того, что |&?_!|2 уменьшается, можно вы- вывести сходимость алгоритма (строгое доказательство сходимости алго- алгоритма можно найти в [LLL] и в [Coh]). 30.3. Решетки и факторизация многочленов Напомним, что нам осталось построить алгоритм, который позво- позволяет для неприводимого делителя h (mod p) многочлена / (mod p) без кратных делителей вычислить неприводимый делитель ho многочлена /, для которого ho (mod p) делится на h (mod p). При этом можно считать, что h — многочлен со старшим коэффициентом 1. Для промежуточных вычислений нам потребуется рассматривать делимость по модулю р*. Поэтому рассмотрим более общий случай: будем считать, что h (mod p*) — неприводимый делитель многочлена / (mod pk) без кратных делителей, старший коэффициент многочлена h равен 1 и ho — неприводимый делитель многочлена /, для которого h0 (mod p) делится на h (mod p). Легко проверить, что в таком случае
318 Дополнение ho (mod pk) делится на h (mod pk). Действительно, многочлен f/ho (mod p) не делится на неприводимый многочлен h (mod р), т. е. эти многочлены взаимно просты. Следовательно, Xh + ixf/ho = 1 — pv для некоторых X,u, v e Ъ[х\. Умножим обе части этого равенства на (l+pv+.. .+pk~1\k~1)ho. В результате получим Xih+ixif = /io (mod pk). Но / (mod рк) делится на h (mod pk), поэтому ho (mod pk) делится на h (mod pk). Пусть n = deg/ и I = degh. Фиксируем целое число т > I и рассмо- рассмотрим множество всех многочленов с целыми коэффициентами степени не выше т, которые по модулю рк делятся на h. Как мы только что показали, многочлен h0 входит в это множество, если degho < т. Сопоставим многочлену д(х) = по + ¦ ¦. + атхт точку (ао,..., ат) е g Шт+1. При таком сопоставлении рассматриваемые многочлены обра- зуют некоторую решетку L. Ясно также, что норма \д\ = (?а?) является просто евклидовой длиной в Em+1. Базис решетки L состоит из многочленов ркхг, О < г < I, и много- многочленов h(x)x:>, 0 < j < т — I. Координаты этих векторов относительно ' Рк1, * ' базиса 1, х,..., хт образуют матрицу вида о /' , где 7/ — единич- ная матрица порядка I, а V — верхняя треугольная матрица с единицами на диагонали. Поэтому d(L) = pkl. Прежде чем перейти к описанию алгоритма вычисления многочлена ho, докажем две теоремы, дающие нужные для этих целей оценки. Теорема 30.3. Если многочлен bet таков, что |6|" • \f\m < pkl, то Ь делится на /г0. (В частности, (/, Ь) ф 1, где (/, 6) —наибольший общий делитель многочленов / и 6.) Доказательство. Можно считать, что Ь ф 0. Положим д = (f,b). Мы хотим доказать, что д делится на ho- Для этого достаточно дока- доказать, что д (mod р) делится на h (mod p). В самом деле, если д (mod p) делится на h (mod р) и f/д е Щх], то f/g не делится на ho, поскольку h (modp) — однократный делитель многочлена / (mod p). Следова- Следовательно, д делится на ho. Предположим, что многочлен д (mod p) не делится на h (mod p). Многочлен h (mod p) неприводим, поэтому многочлены д (mod p) и h (mod p) взаимно просты, т. е. существуют такие многочлены Xi,ui,vi e Ъ\х\, что f = 1 -pvi. A) 30. Алгоритм Ленстры-Ленстры-Ловаса 319 Пусть е = degg и т' = deg 6. Ясно, что 0 < е < т' < т. Положим М = {Х/ + и6 | X, u e Z[x], degX < т' — е, degu < n - е} с Обозначим через М' образ М при естественной проекции на Z • хе + ... .. . + Z-xn+m ~e~l. Прежде всего покажем, что если элемент X/+u6 e M проецируется вОё М', то X = [л = 0. Действительно, в таком случае deg(X/+u6) < е, но Х/ + и6 делится на д, a deg д = е. Поэтому Xf+\ib = 0, т. е. Х(//д) = —и.(Ь/д). Многочлены f/g и Ь/д взаимно просты, поэтому и делится на f/g. Но deg u < n - е = deg(//g). Следовательно, и = 0, а значит, X = 0. Таким образом, проекции множеств {x'f | 0 < i < т' - е} и {х^Ь | 0 < j < n — е} на М', с одной стороны, линейно независимы, а с другой стороны, они порождают М'. Это означает, что проекции этих двух множеств образуют базис решетки М'. В частности, ранг решетки М' равен п + т' — 2е. Кроме того, согласно неравенству Ада- мара d(M') < |/|m'-e|6|"-e. По условию |/Р|Ь|" < РЫ- Учитывая что т' <т, получаем d(M') < \f\m\b\n < pkl. B) Покажем, что если v е М и degv < е + /, то р~к\ е Щх]. В самом деле, многочлен \ — Xf + цЬ делится на д = (f,b), поэтому, умножив равенство A) на A +pvi + ... +p*~1vf~1)v/(/, получим X2h = \/д (mod pk). C) Мы рассматриваем ситуацию, когда многочлен / (mod pk) делится на h (mod рк). Кроме того, Ь е L, поэтому b (mod pk) делится на h (mod pk). Из того, что v е М, следует, что v = X/ + ab, поэтому v (mod pk) де- делится на h (mod рк). В таком случае из C) следует, что \/д (mod pk) тоже делится на h (mod рк). Но deg(\/g (mod pk)) <e + l-e = l, a h (mod pk)—многочлен степени I со страшим коэффициентом 1. По- Поэтому \/д = 0 (mod рк), а значит, v = 0 (mod pk). В М' можно выбрать такой базис be, be+i, • ¦ •, bn+m'-e-i, что degbj = = j. Легко проверить, что е+1—1 < п+т'—е—1. В самом деле, многочлен Ь делится на д, поэтому е = degg < degb = т', а многочлен f/д (mod p) делится на h (mod р), поэтому I = deg h < deg/-degg = n-e. Элементы be,..., be+t-i e M' получаются из многочленов, которые лежат в М и делятся на р*, посредством проекции, уничтожающей члены степени
320 Дополнение ниже е. Поэтому все коэффициенты многочленов Ье,... ,6e+i-i (в том числе и их старшие коэффициенты) делятся на рк. Ясно, что дискриминант d(M') равен модулю произведения старших коэффициентов многочленов Ье,. ..,Ьп+т/_е_!, поэтому он не мень- меньше произведения модулей старших коэффициентов многочленов Ье,... ...,6e+<-i- Следовательно, d(M') > pkl. Это противоречит неравен- неравенству B). D В следующей теореме мы, как и ранее, предполагаем, что h — мно- многочлен со старшим коэффициентом 1, причем многочлен / (mod рк) де- делится на h (mod р*); L — решетка, состоящая из многочленов степени не выше т, которые по модулю рк делятся на h; I = deg h и тг = deg /; h0 — неприводимый делитель многочлена /, для которого ho (mod p) делится на h (mod р), т. е. Ло (mod pk) делится на h (mod pk). Теорема 30.4. Пусть bi,&2,...,bm+i—приведенный базис решетки L. Предположим, что а) В таком случае deg ho < m тогда и только тогда, когда Ы< (р*71/ГI/п- б) Предположим, что для некоторого базисного вектора bj выполня- выполняется неравенство N< (р*71/ГI/п- (*) Пусть ?— наибольшее из всех таких чисел j. Тогда: = m + l-t; h0 = НОД(ЬЬ.. .,bt); неравенство (*) выполняется при j — 1,..., t. Доказательство, а) Предположим сначала, что |bi| < {pkll\f\m)l^n, т.е. |bi|n • |/|m < pkl. Тогда согласно теореме 30.3 многочлен b\ e L делится на ho. С другой стороны, из условия b\ e L следует, что deg Ь\ < < т. Поэтому deg ho <m. 30. Алгоритм Ленстры-Ленстры-Ловаса 321 Предположим теперь, что deg/io < т, т.е. ho e L. Согласно след- следствию из теоремы Миньотта (см. с. 173) |Ло| < (т) |/|- Применив теорему 30.2 (г) для х = ho, получим D) По условию 2тп/2B^)"/2|/Г < Р*71/Г. т.е. 2т/2BГI/2|/К (р*71/Г) 1/п E) Из D) и E) получаем требуемое неравенство |bi| < (p*7l/|m) "• б) Пусть J — множество всех индексов j, для которых выполняется неравенство (*). Согласно теореме 30.3, если j e J, то bj делится на ho- Таким образом, многочлен hi — НОД(Ь^ | j e J) делится на ho- При этом, если j e J, то bj делится на hi и degfy < т, т. е. bj принадлежит решетке F) Векторы bi,..., 6m"линейно независимы, поэтому |J|<m + l-degfti, где | J\ — количество элементов множества J. Согласно следствию из теоремы Миньотта (см. с. 173) При i = 0,1,... ,т — deg/io по определению hox* e L и эти векторы линейно независимы. Поэтому к ним можно применить теорему 30.2 (д): \bj\ < 2m/>0^| < 2m/2B^)/|/l при 1 < j < т + 1 - deg/ю. По предположению 2ml2^)'2\f\ < {pkl/\f\mI/n, поэтому {l,2,...,m + l-deg/i0} <= J. Многочлен hi делится на ho, поэтому deg/ii < deg/io, а значит, |J| >m + l -deg/io > m + 1-deghi. G)
322 Дополнение Сравнивая неравенства F) и G), получаем, что deg/io = deg/ii = t и J = {l,2,...,t}. Остается проверить, что ho = ±/ii- Многочлен ho является делите- делителем многочлена / с содержанием 1, поэтому cont(/io) = 1- Пусть j e J и dj = cont(bj). Согласно теореме 30.3 многочлен bj делится на Ло. Следо- Следовательно, многочлен bj/dj тоже делится на ho- Учитывая, что ho e L, получаем bj/dj e L. Но bj —элемент базиса решетки L, поэтому dj = = 1. Это означает, что cont(/ii) = 1, так как bj делится на hi. Итак, многочлен hi делится на ho и cont(/ii) = 1, поэтому ho — ±h\. ? Теперь уже можно описать алгоритм вычисления многочлена h0. Вспомогательный алгоритм. (При фиксированном т алгоритм вы- выясняет, верно ли, что deg ho < m\ если это верно, то он вычисляет мно- многочлен h0.) Исходные данные: • многочлен / степени п; • простое число р; • натуральное число к; • многочлен h со старшим коэффициентом 1, для которого / (mod рк) делится на h (mod рк); при этом многочлен h (mod p) неприводим и / (mod p) не делится на h2 (mod р); мы считаем, что коэффициенты многочлена h приведены по модулю рк, т.е. заключены между Оир* (при этом \h\2 < 1 + lp2k); • натуральное число т > I = deg h, для которого выполняется не- неравенство / Работа алгоритма. Для решетки L с базисом {ркх* | 0 < i < 1} U {hkxj \Q<j<m-l} находим приведенный базис Ь\,..., bm+i- Если |bi| > (pkl/\f\m) , то deg/io > тптл алгоритм останавливается. Если же \bi\ < {pkl/\f\mI/n, то deg/i0 < m и h0 = НОДFЬ... ,bt), где число t определено в формулировке теоремы 30.4 (б). Основной алгоритм. (Вычисление неприводимого множителя ho мно- многочлена /, для которого ho (mod р) делится на h (mod p).) Можно считать, что I — deg h < deg f = п и коэффициенты много- многочлена h приведены по модулю р, т. е. заключены между 0 и р. 30. Алгоритм Ленстры-Ленстры-Ловаса 323 Работа алгоритма. Сначала вычисляем наименьшее натураль- натуральное к, для которого неравенство (8) выполняется при т — п — 1: Затем для разложения f = hg (mod p) вычисляем его поднятие Ген- зеля f = hg (mod p*), где к — только что вычисленное натуральное чи- число. При этом h = h (modp); коэффициенты многочлена h считаем приведенными по модулю р*. Пусть и — наибольшее целое число, для которого I < (п- 1)/2". По- Гп-11 следовательно выполняем вспомогательный алгоритм для т = , L ^ J fn-ll \п~Ц , , ,ц_1 , ¦ • •, —5— , п — 1 до тех пор, пока не вычислим многочлен ho- Если же это не произойдет, то deg h0 > п - 1 и h0 = /, т. е. многочлен / неприводим.
Литература [АТЧ] Алгебраическая теория чисел, / Ред. Дж. Касселс, А. Фрёлих., М.: Мир, 1969. [ББ] Беккенбах Э., Беллман Р., Неравенства, М.: Мир, 1965. [БШ] Боревич 3. И., Шафаревич И. Р., Теория чисел, М.: Наука, 1972. [Бу] Бугаенко В. О., Коммутирующие многочлены, Математическое Просвещение (третья серия) Вып. 1 A997), 140-163. [B] Ван дер Варден Б. Л., Алгебра, М.: Наука, 1976. [ГНШ] Галочкин А. И., Нестеренко Ю. В., Шидловский А. Б., Введение в теорию чисел, М.: Изд-во МГУ, 1995. [Г] Галуа Э., Сочинения, М.-Л.: ОНТИ, 1936. [ГР] Гаспер Дж., Рахман М., Базисные гипергеометрические ряды, М.: Мир, 1993. [Ге1] Гельфонд А. О., Трансцендентные и алгебраические числа, М.: ГИТТЛ, 1952. [Ге2] Гельфонд А. О., Исчисление конечных разностей, М.: Наука, 1967. [Дэ] Дэвенпорт Г., Мультипликативная теория чисел, М.: Наука, 1971. [К1] Касселс Дж. В. С, Введение в теорию диофантовых приближений, М.: ИИЛ, 1961. [К2] Касселс Дж., Рациональные квадратичные формы, М.: Мир, 1982. [Ки] Кириллов А. А., Что такое число?, М.: Наука, 1993. [Кл] Клейн Ф., Лекции об икосаэдре и решеиии уравнений пятой степени, М.: Наука, 1989. [Л1] Ленг С, Алгебра, М.: Мир, 1968. [Л2] Ленг С, Основы диофантовой геометрии, М.: Мир, 1986. [М] Макдональд И., Симметрические функции и многочлены Холла, М.: Мир, 1985. [Мм] Мамфорд Д., Алгебраическая геометрия 1. Комплексные проективные мно- многообразия, М.: Мир, 1979. [О] Островский А. М., Решение уравнений и систем уравнений, М.: ИИЛ, 1963. [ПС] Полна Г., Сеге Г., Задачи и теоремы из анализа, В 2-х ч. М.: Наука, 1978. [По1] Постников М. М., Теория Галуа, М.: ГИФМЛ, 1963. [По2] Постников М. М., Устойчивые многочлены, М.: Наука, 1981. [Пр1] Прасолов В. В., Наглядная топология, М.: МЦНМО, 1995. [Пр2] Прасолов В. В., Задачи и теоремы линейной алгебры, М.: Наука, 1996. [ПрС] Прасолов В. В., Соловьев Ю. П., Эллиптические функции и алгебраические уравнения, М.: Факториал, 1997. [ПрШ] Прасолов В. В., Шварцман О. В., Азбука римановых поверхностей, М.: Фа- Фазис, 1999. [C] Серр Ж.-П., Курс арифметики, М.: Мир, 1972. [Т] Табачников С. Л., Многочлены, М.: Фазис, 1996. [ТУ] Тихомиров В. М., Успенский В. В., Десять доказательств основной теоремы алгебры, Математическое Просвещение (третья серия) Вып. 1 A997), 50-70. Литература 325 [Хов] Хованский А. Г., Малочлены, М.: Фазис, 1997. [Ч] Чандрасекхаран К., Введение в аналитическую теорию чисел, М.: Мир, 1974. [Че] Чеботарев Н. Г., Основы теории Галуа, Л.-М.: ОНТИ, 1937. [ЭЭМ] Энциклопедия элементарной математики, ки. 2 (Алгебра), М.-Л.: ГИТТЛ, 1951. [AdL] Adams W. W., Loustaunau Ph., An introduction to Grobner bases, AMS, 1994. [An] Anderson В., Polynomial root dragging, Amer. Math. Monthly 100 A993), 864-866. [AnSV] Anderson N., SaffE. В., Varga R. S., On the Enestrom- Kakeya theorem and its sharpness, Linear Algebra and Appl. 28 A979), 5-16. [Anr] Andrushkiw J. W., Polynomials with prescribed values at critical points, Bull. Amer. Math. Soc. 62 A956), 243. [Ar] Artin E., Uber die Zerlegung definiter Funktionen in Quadrate, Abh. Math. Sem. Hamburg 5 A927), 100-115. [ArS] Artin E., Schreier O., Algebraische Konstruktion reeler Korper, Abh. Math. Sem. Hamburg 5 A927), 85-99. [As] Askey R., An inequality for Tchebycheff polynomials and extensions, i. Approx. Theory 14 A975), 1-11. [Ay] Ayoub R. G., On the nonsolvability of the general polinomial, Amer. Math. Monthly 89 A982), 397-401. [Az] Aziz A., On the zeros of composite polnomials, Pacific J. Math. 103 A982), 1-7. [B] van den Berg F. J., Nogmaals over afgeleide Wortelpunten, Nieuw Archiev voor Wiskunde 15 A888), 100-164. [Be] Berg L., Abschdtzung von Nullstellen eines Polynoms, Z. angew. Math. Mech. 67 A987), 57-58. [Berl] Berlecamp E. R., Factoring polynomials over finite fields, Bell System Tech. J. 46 A967), 1853-1859. [Ber2] Berlecamp E. R., Factoring polynomials over large finite fields, Math. Сотр. 24 A970), 713-735. [Bern] Bernoulli J., Ars conjectandi, Basileae, 1713. [Beu] Beukers F., A note on the irrationality o/?B) and ?C), Bull. London Math. Soc. 11 A979), 268-272. [Bo] Boyd D. W., Sharp inequalities for the product of polynomials, Bull. London Math. Soc. 26 A994), 449-454. [Br] Brauer A., On algebraic equations with all but one root in the interior of the unit circle, Math. Nachrichten 4 A950/51), 250-257. [Bui] Buchberger В., Ein Algorithmus zum Auffinden der Basiselemente des Restklassen- ringes nach einem nulldimensionalen Polynomideal, Ph.D. Thesis, Inst. University of Innsbruck, Austria, 1965. [Bu2] Buchberger В., Grobner bases: An algorithmic method in polynomial ideal theory, in Multidimensional systems theory (N. K. Bose ed.), Reidel, Dordrecht, 1985, 184-232.
326 Литература [Bu3] Buchberger В., Winkled F. (Editors), Grobner bases and applications, London Math. Soc. Lecture Notes Series, V. 251, 1998. [BP] Burnside W. S., Panton A. W., The theory of equations, Dublin Univ. Press, Dublin-London, 1928. [CC] Cahen P.-J., Chabert J.-L., Integer-valued polynomials, AMS, 1997. [CZ] Cantor D. G., Zassenhaus H., A new algorithm for factoring polynomials over finite fields, Math. Сотр. 36 A981), 587-592. [CT] Cartier P.,Tate J., A simple proof of the main theorem of eliminating theory in algebraic geometry, L'Enseignement Math. 24 A978), 311-317. [Ca] Cassels J. W. S., On the representation of rational functions as sums of squares, Acta Arithm. 9 A964), 79-82. [CEP] Cassels J. W. S., Ellison W. J., Pfister A., On sums of squares and on elliptic curves over function fields, i. Number Theory 3 A971), 125-149. [Chr] Christie M. R., Positive definite rational functions of two variables which are not the sum of three squares, i. Number Theory 8 A976), 224-232. [Chu] Chung-Chun Yang, A problem on polynomials, Rev. Roumaine Math. Pures Appl. 22 A977), 595-598. [Co] Colliot-Thelene J.-L., The Noether-Lefschetz theorem and sums of 4 squares in the rational function field Ш(х, у), Compositio Math. 86 A993), 235-243. [CS] Cohen G. L., Smith G. H., A simple verification of Ilieff's conjecture for polyno- polynomials with three zeros, Amer. Math. Monthly 95 A988), 734-737. [Coh] Cohen H., A course in computational algebraic number theory, Springer, Berlin e.a., 1993. [CK] Cross G. E., Kannappan PI. A functional identity characterizing polynomials, Ae- quat. Math. 34 A987), 147-152. [Da] Das M., Sur un determinant й permutation circulaire pour les polynomes de Tchebychev de premiere espede, C. R. Acad. Sci. Paris 268 A969), A385-A386. [DLS] Davenport H., Lewis D. J., Schinzel A., Polynomials of certain special types, Acta Arithm. 9 A964), 108-116. [DS] Dobbertin H., Schmieder G., Zur Charakterisierung von Polynomen durch ihre Null- und Einsstellen, Arch. Math. 48 A987), 337-342. [Do] Dorge K., Einfacher Beweis des Hilbertschen Irreduzibilitdtssatzes, Math. Ann. 96 A927), 176-182. [Dub] Dubois D. W., Note on Artin's solution of 17th Hubert's problem, Bull. Amer. Math. Soc. 73 A967), 540-541. [Dum] Dumas G., Sur quelques cas d'irreductibilite des polynomes a coefficients rationels, i. Math. Pures Appl. 2 A906), 191-258. [Ed] Edwards H. M., Galois theory, Springer, New York e.a., 1984. [Ev] Evyatar A., On polynomial equations, Israel J. Math., 10 A971), 321-326. [Fa] Faulhaber J., Academia algebrae, Augsburg, 1631. Литература 327 [Fr] Fried M., On Hubert's irredusibility theorem, J. Number Theory, 6 A974), 211-231. [GG] Gardner R. В., Govil N. K., On the location of zeros of a polynomial, J. Approx. Theory 76 A994), 286-292. [Ga] Garling D. J. H., A course in Galois theory, Cambridge Univ. Press, Cambridge e.a., 1986. [Gr] Grosswald E., Recent applications of some old work of Laguerre, Amer. Math. Monthly 86 A979), 648-658. [H] Haruki Sh., A property of quadratic polynomials, Amer. Math. Monthly 86 A979), 577-578. [Hil] Hilbert D., Ueber die Darstellung definierter Formen als Summe von Formen- quadraten, Math. Ann. 32 A888), 342-350. [Hi2] Hilbert D., Ueber die Theorie der algebraische Formen, Math. Ann. 36 A890), 473-534. [Hi3] Hilbert D., Uber die Irreduzibilitat ganzer rationaler Funktionen mit ganzzahligen Koeffizienten, J. reine angew. Math. 110 A892), 104-129. [Hi4] Hilbert D., Ueber die vollen Invariantensysteme, Math. Ann. 42 A893), 313-373. [Ho] Hornfeck В., Primteiler von Polynomen, J. reine angew. Math. 243 A970), 120. [Hu] Hurwitz A., Ueber der Vergleich des arithmetischen und des geometrischeh Mittels, J. reine angew. Math. 108 A891), 266-268. [J] Janusz G. J., Algebraic number fields, AMS, 1996. [Kl] Kleiman H., Irreducibility criteria, i. London Math. Soc. B) 5 A972), 133-138. [Kr] Kronecker L., Zwei Satze ueber Gleichungen mit ganzzahligen Coefficienten, i. reine angew. Math. 53 A857), 173-175. [Kru] Krusemeyer M., Why does the Wronskian work? Amer. Math. Monthly 95 A988), 46-49. [Ku] Kubert D., The universal ordinary distribution, Bull. Soc. Math. France 107 A979), 179-202. [L] Landau E., Uber die Darstellung definiter Funktionen als Summe von Quadraten, Math. Ann. 62 A906), 290-329. [La] Lang S., Old and new conjectured diophantine inequalities, Bull. Amer. Math. Soc. 23 A990), 37-83. [Le] Lehmer D. H., A new approach to Bernouilli polynomials, Amer. Math. Monthly 95 A988), 905-911. [LLL] Lenstra A. K., Lenstra H. W., Lovasz L., Factoring polynomials with rational coefficients, Math. Ann. 261 A982), 515-534. [Lj] Ljunggren W., On the irreducibility of certain trinomials and quadrinomials, Math. Scand. 8 A960), 65-70. [Ml] Mahler K., An application of Jensen formula to polynomials, Mathematika 7 A960), 98-100.
328 Литература [М2] Mahler К., On some inequalities for polynomials in several variables, J. London Math. Soc. 37 A962), 341-344. [M3] Mahler K., An inequality for a pair of polynomials that are relatively prime, J. Austral. Math. Soc. 4 A964), 418-420. [ML] Marcus M., Lopes L., Inequalities for symmetric functions and Hermitian matri- matrices, Canad. J, Math. 8 A956), 524-531. [Mai] Marden M., Geometry of polynomials, AMS, 1966. [Ma2] Marden M., The search for a Rolle's theorem in the complex domain, Amer. Math. Monthly 92 A985), 643-650. [Mi] Mignotte M., An inequality about factors of polynomials, Math. Comput. 28 A974), 1153-1157. [MS] Mikusihski J., Schinzel A., Sur la reductibilite de certains trinomes, Acta Arithm 9 A964), 91-95. [Mi] Milnor J., On poly logarithms, Hurwitz zeta functions, and the Hubert identities, L'Enseignement Math. 29 A983), 281-322. [Mo] Motzkin T. S., Algebraic Inequalities, в книге Inequalities, Editor O. Shisha, New York: Academic Press, 1967, 199-203. [Mu] Muirhead R. F., Some methods applicable to identities and inequalitiies of sym- symmetric algebraic functions of n letters, Proc. Edinburgh Math. Soc. 21 A9031 144-157. [My] Mycielski Y., Polynomials with predesigned values at their branching points, Amer. Math. Monthly 77 A970), 853-855. [N] Nathanson M. В., Catalan's equation in Kit), Amer. Math. Monthly 81 A9741 371-373. [NM] Newman D. J., Slater. M. Waring's problem for the ring of polynomials, J. Number Theory 11 A979), 477-487. [O] O'Hara P. J., Another proof of Bernstein's theorem, Amer. Math. Monthly 80 A973), 673-674. [Os] Osada H., The Galois groups of the polynomials xn + ax1 + b, J. Number Theory 25 A987), 230-238. [Ost] Ostrowski A., Uber ganzwertige Polynome in algebraischen Zahlkorpern, J. reine angew. Math. 149 A919), 117-124. [Oz] Ozeki K., A certain property of polynomials, Aequat. Math. 25 A982), 247-252. [Pe] Perron O., Algebra II, Leipzig: de Gruyter, 1933. [Pfl] Pfister A., Multiplikative quadratische Formen, Arch. Math. 16 A965), 363-370. [Pf2] Pfister A., Quadratic forms with applications to alrebra, geometry and topology, London Math. Soc. Lecture Notes Series, V. 217, 1995. [Po] Polya G., Ueber ganzwertige ganze Funktionen, Rend. Circ. Matem. Palermo 40 A915), 1-16. [Pu] Pourchet, On the representation in sums of squares for definite functions in one variable over an algebraic number field, Acta Arithm. 19 A971), 89-109. Литература 329 [R] Rabinowitsch S., Zum Hilbertschen Nullstellensatz, Math. Ann. 102 A929), 520. [Ra] Rabinowitz S., The factorization ofx5±x + n, Math. Mag. 61 A988), 191-193. [Raj] Rajwade A. R., Squares, London Math. Soc. Lecture Notes Series, V. 171, 1993. [Ri] Risler J.-J., Une caracterisation des ideaux des varietes algebriques reeles, C. R. Acad. Sci. 271 A970), Serie A, 1171-1173. [Ro] Rogosinski W. W., Some elementary inequalities for polynomials, Math. Gaz. V. 39, N. 327A955), 7-12. [Roi] Roitman M., On roots of polynomials and of their derivatives, J. London Math. Soc. B) 27 A983), 248-256. [Ros] Rosen M. I., Niels Hendrik Abel and equation of the fifth degree, Amer. Math. Monthly 102 A995), 495-505. [Rth] Roth K. F., Rational approximations to algebraic numbers, Mathematika 2 A955), 1-20 (Corrigendum p. 168). [Ru] Rubinstein Z., Remarks on a paper by A. Aziz, Proc. Amer. Math. Soc. 94 A985), 236-238. [S] Salmon G., Lesson introductory to the modern highers algebra, 5th ed., NY.: Chelsea, 1964. [Sa] Scharlau W., Quadratic and hermitian forms, Springer, Berlin e.a., 1985. [Scl] Schinzel A., Solution d'un problime de K. Zarankiewicz sur les suites des puis- puissances consecutives de nombres irrationnels, Colloc. Math. 9 A962), 291-296. [Sc2] Schinzel A., Reducibility of polynomials, в книге Actes Congres intern, math. 1970. Tome 1, 491-496. [ScZ] Schinzel A., Zassenhaus H., A refinement of two theorems of Kronecker, Michigan Math. J. 12 A965), 81-85. [Scm] Schmeisser G., On Ilieff's conjecture, Math. Z. 156 A977), 165-173. [Sho] Schoenberg I. J., Math, time exposures, MAA, 1982. [Shu] Schur I., Uber die Existenz unendlich vieler Primzahlen in einige speziellen arith- metischen Progressionen, S.-B. Berlin. Math. Ges. 11 A912), 40-50. [Shw] Schwarz H., Ueber dienige Falle, in denen Gaussische Reihe F(a,fi,y,x) eine al- gebraische Function ihres vierten Elementen ist, Borchardt's J. 75 A872). [Sr] Serre J.-P., Lectures on the Mordell- Weil theorem, Vieweg, 1989. [Ss] Sonnenschein H., A representation for polynomials in several variables, Amer. Math. Monthly 78 A971), 45-47. [St] Stengle G., Integral solution of Hubert's seventeenth problem, Math. Ann. 246 A979), 33-39. [Sti] Stillwell J., Galois theory for beginners, Amer. Math. Monthly 101 A994), 22-27. [Str] Strelitz Sh., On the Routh - Hurwitz problem, Amer. Math. Monthly 84 A977), 542-544. [Stu] Sturmfels В., Grobner bases and convex polytopes, AMS, 1996.
330 Литература [Su] Sudbery A., The number of distinct roots of a polynomial and its derivatives, Bull. London. Math. Soc. 5 A973), 13-17 [Sur] Sury В., The value of Bernouilli polynomials at rational points, Bull. London Math. Soc. 25 A993), 327-329. [Suz] Suzuki J., On coefficients of cyclotomic polynomials, Proc. Japan Acad. A63 A987), 279-280. [Sw] Swan R. G., Factorization of polinomials over finite fields, Pacific J. Math. 12 A962), 1099-1106. [Th] Thorn R., L'equivalence d'une fonction differentiable et d'un polynome Topology 3, Suppl. 2 A965), 297-307. [Tv] Tverberg H., On the irreducibility of polynomials taking small values, Math. Scand. 32 A973), 5-21. [W] Wahab J. H., New cases of irreducibility for Legendre polynomials, Duke Math. J. 19 A952), 165-176. [We] Weber H., Lehrbuch der Algebra, Bd. 1-3, Braunschweig, 1908. [Wh] Whiteley J. N., Some inequalities concerning symmetric functions, Mathematika 5 A958), 49-57. [Wi] Wilf H. S., Perron-Frobenius theory and the zeros of polynomials, Proc. Amer. Math. Soc. 12 A961), 247-250. [Wt] Witt E., Uber die Kommutativitat endlicher Schiefkorper, Abh. Math. Sem. Ham- Hamburg 8 A931), 413. Предметный указатель Ci-поле, 306 LLL-алгоритм, 313 р-поле, 261 д-биномиальный коэффициент, 103 5-функция, 98 Абелев многочлен, 229 абелево уравнение, 229 абсолютное значение, 158 р-адическое, 158 неархимедово, 158 Адамара неравенство, 315 алгебраическое число, 194 вполне вещественное, 196 целое, 194 алгоритм Берлекэмпа, 83 — Бухбергера, 270 — Евклида, 58, 264 — Кронекера, 61 — Ленстры-Ленстры-Ловаса, 313 Алмквиста-Мойрмана теорема, 140 аполярные многочлены, 16 Артина-Ленга теорема, 298 Артина-Шрайера теорема, 296 Базис Грёбнера, 265, 267 минимальный, 270 приведенный, 271 — решетки приведенный, 315 Бернулли многочлены, 129 — числа, 129 Бернштейна неравенство, 165 биномиальный коэффициент Гаусса, 103 Борсука-Улама теорема, 262 Бухбергера алгоритм, 270 Ван ден Берга теорема, 23 Варинга проблема для многочленов, 179 вектор звена диаграммы Ньютона, 65 вещественно замкнутое поле, 292 вещественное замыкание, 292, 295 — поле, 291 вполне вещественное алгебраическое число, 196 высота многочлена, 158 Галуа группа, 206, 215 — расширение, 214 — резольвента, 208 — соответствие, 217 Гаусса-Люка теорема, 22 Гаусса биномиальный коэффициент, 103 — лемма, 60, 158 Гензеля лемма, 86 — продолжение, 86 Гильберта многочлен, 255 — теорема неприводимости, 79 о базисе, 247 о корнях, 248 о нулях, 248 Грёбнера базис, 265, 267 минимальный, 270 приведенный, 271 градуированное кольцо, 252 градуированный модуль, 252 группа Галуа, 206, 215 — разрешимая, 223 — транзитивная, 219 Декарта правило, 39 деления круга многочлен, 104
332 Предметный указатель дзета-функция Римана, 134 диаграмма Ньютона, 64 дискриминант, 34, 95 длина многочлена, 163, 169 Дюма признак, 67 — теорема, 65 Евклида алгоритм, 58, 264 Замыкание вещественное, 292, 295 звено диаграммы Ньютона, 65 Идеал, 246 — конечно порожденный, 247 — однородный, 253 — простой, 255 интерполяционный многочлен Лагранжа, 151 Ньютона, 153 Эрмита, 154 Йенсена круги, 25 — формула, 161 Квадратичная форма мультипликативная, 303 квадратичные формы эквивалентные, 303 китайская теорема об остатках для многочленов, 84 кольцо градуированное, 252 композиция многочленов, 19 конечно порожденный идеал, 247 модуль, 252 косая функция Шура, 98 кососимметрическии многочлен, 95 Коши теорема, 11 Кронекера алгоритм, 61 — подстановка, 159 — теорема, 47, 196 круги Йенсена, 25 круговая область, 16 круговой многочлен, 104 Куммера теорема, 138 Лагранжа резольвента, 222, 231 — теорема, 203 лексикографический порядок, 264 лемма Гаусса, 60, 158 — Гензеля, 86 — Нётер о нормализации, 249 — Пойа, 71 Ленстры-Ленстры-Ловаса алгоритм,313 Лиувилля теорема, 199, 200 Мёбиуса функция, 105 Малера мера, 160, 167 матрица Сильвестра, 31 мера Малера, 160, 167 минимальный базис Грёбнера, 270 Миньотта неравенство, 171 многочлен абелев, 229 — Гильберта, 255 — деления круга, 104 — кососимметрическии, 95 — круговой, 104 — неотрицательный, 272 — неприводимый, 58 — приводимый, 58, 78 — резольвентный, 240 — симметрический, 91 — унитарный, 194 — устойчивый, 20 — целозначный, 99 многочлены аполярные, 16 — Бернулли, 129 Предметный указатель 333 — ортогональные, 121 модуль, 252 — градуированный, 252 — конечно порожденный, 252 — целостный, 256 модуля степень, 256 мономиальный симметрический многочлен, 92 мультипликативная квадратичная форма, 303 Нётер лемма о нормализации, 249 наибольший общий делитель, 58, 264 неотрицательная рациональная функция, 301 неотрицательный многочлен, 272 неприводимый многочлен, 58 неравенство Адамара, 315 — Бернштейна, 165 — Миньотта, 171 нормальное расширение, 214 Ньютона-Сильвестра теорема, 40 Ньютона диаграмма, 64 — формулы, 92 Общий делитель, 58 однородный идеал, 253 — подмодуль, 257 определитель решетки, 314 ортогональные многочлены, 121 остаток от деления, 265 Островского теорема, 11 Пелля уравнение, 120 перемен знака число, 38 Перрона признак неприводимости, 68 подмодуль однородный, 257 подразбиение, 98 подстановка Кронекера, 159 Пойа лемма, 71 — теорема, 71 поле вещественно замкнутое , 292 — вещественное, 291 — разложения, 214 — упорядоченное, 290 — формально вещественное, 291 полный однородный симметрический многочлен, 91 порядок лексикографический, 264 последовательность Штурма, 42 правило Декарта, 39 приведенный базис Грёбнера, 271 решетки, 315 приводимый многочлен, 58, 78 признак Дюма, 67 — Перрона, 68 — Эйзенштейна, 67 проблема Варинга для многочленов, 179 — Гильберта, седьмая, 160 продолжение Гензеля, 86 производная относительно точки, 15 производящая функция, 91, 126 простое радикальное расширение, 220 простой идеал, 255 Радикальное расширение, 223 простое, 220 разбиение, 95 размерность модуля, 256 разрешимая группа, 223 разрешимое в радикалах уравнение, 223
334 Предметный указатель Предметный указатель 335 ранг решетки, 314 расширение Галуа, 214 — нормальное, 214 — радикальное, 223 — циклическое, 221 рациональная функция неотрицательная, 301 резольвента Галуа, 208 — Лагранжа, 222, 231 резольвентный многочлен, 240 результант, 31 решетка, 314 Римана дзета-функция, 134 Рота теорема, 201 ряд Бюрмана, 51 — Лагранжа, 51 Сильвестра матрица, 31 — теорема, 43, 193 симметрический многочлен, 91 мономиальный, 92 полный однородный, 91 элементарный, 91 содержание многочлена, 60 соответствие Галуа, 217 сопряженные над полем числа, 215 — числа, 194 степенная сумма, 92 степень модуля, 256 сторона диаграммы Ньютона, 65 сумма степенная, 92 Тело, 113 теорема Алмквиста-Мойрмана, 140 — Артина-Ленга, 298 — Артина-Шрайера, 296 — Артина-Касселса-Пфистера, 277 — Борсука-Улама, 262 — ван ден Берга, 23 — Веддерберна, 113 — Гаусса-Люка, 22 — Гильберта о базисе, 247 о корнях, 248 о неотрицательных многочленах, 283 о нулях, 248 — Гурвица, 281 — Дюма, 65 — Коши, 11 — Кронекера, 47, 196 — Куммера, 138 — Лагранжа, 203 — Лиувилля, 199, 200 — неприводимости Гильберта, 79 — Ньютона-Сильвестра, 40 — о примитивном элементе, 212 — Островского, 11 — Пойа, 71 — Рота, 201 — Сильвестра, 43, 193 — Фаульгабера-Якоби, 135 — фон Штаудта, 139 — Фурье-Бюдана, 38 — Штурма, 42 — Энестрёма-Какейа, 12 тождество Якоби-Труди, 99 точка экстремальная, 284 транзитивная группа, 219 трансцендентные числа, 199 Узлы интерполяции, 151 унитарный многочлен, 194 упорядоченное поле, 290 уравнение абелево, 229 — Пелля, 120 —, разрешимое в радикалах, 223 устойчивый многочлен, 20 Фаульгабера-Якоби теорема, 135 фон Штаудта теорема, 139 форма следа, 296 формально вещественное поле, 291 формула Йенсена, 161 формулы Ньютона, 92 функция Мёбиуса, 105 — производящая, 91 — Шура, 98 косая, 98 Фурье-Бюдана теорема, 38 Характер группы, 221 Целое алгебраическое число, 194 целозначный многочлен, 99 целостный модуль, 256 центр масс, 13 относительно точки, 13 циклический абелев многочлен, 229 циклическое расширение, 221 Числа Бернулли, 129 — трансцендентные, 199 число р-целое, 137 — перемен знака, 38 Штурма последовательность, 42 — теорема, 42 Шура функция, 98 Эйзенштейна признак, 67 эквивалентные квадратичные формы, 303 экстремальная точка, 284 элементарный симметрический многочлен, 91 Энестрёма-Какейа теорема, 12 Эрмита интерполяционный многочлен, 154 Якоби-Труди тождество, 99
Научное издание Пр ас о лов Виктор Васильевич МНОГОЧЛЕНЫ Директор издательского проекта И. В. Ященко Технический редактор М. Ю. Панов Лицензия ЛР №01335 от 24/Ш 2000 г. Подписано в печать 18/ХП 2000 г. Формат 60x90 Vie- Бумага офсетная JV«1. Печать офсетная. Объем 21,00 печ. л. Тираж 1000. Заказ JV» 1010. Издательство Московского Центра непрерывного математического образования. 121002, Москва, Г-2, Бол. Власьевский пер., 11. Отпечатано с готовых диапозитивов в ППП «Типография „Наука"». 121099, Москва, Г-99, Шубинский пер., 6.