Автор: Артин Э.  

Теги: алгебра   математика   теория галуа  

ISBN: 5-94057-062-3

Год: 2004

Текст
                    Э. АРТИН
ТЕОРИЯ ГАЛУА
Перевод с английского А. В. Самохина
Москва
Издательство МЦНМО
2004


УДК 512 Издание осуществлено при поддержке РФФИ ББК 22.14 (издательский проект № 02-01-14082). А86 (Y Серия КЛАССИЧЕСКИЕ МОНОГРАФИИ: МАТЕМАТИКА Артин Э. А86. Теория Галуа / Пер. с англ. А. В. Самохина.— М.: МЦНМО, 2004.— 66 с.— (Классические монографии: математика). ISBN 5-94057-062-3 В книге изложены основы теории Галуа. Она написана ясным языком, материал тщательно подобран, ее автор — известный математик. Впервые она была опубликована в 1944 г. и затем неоднократно переиздавалась. Отдельная глава посвящена вопросу о разрешимости алгебраических уравнений в радикалах и построению правильных многогранников с помощью циркуля и линейки. Для студентов и аспирантов физико-математических специальностей. ББК 22.14 ISBN 5-94057-062-3 © МЦНМО, перев. на русск. яз., 2004.
Предисловие к русскому изданию Эмиль Артин A898—1962) родился в Вене. В возрасте 18 лет он поступил в Венский университет, но проучившись там меньше года, попал в армию. После войны закончил Лейпцигский университет под руководством Герглотца и защитил диссертацию о квадратичных функциональных полях. Наиболее творческие годы он провел, преподавая в Гамбургском университете. Нацизм заставил его, как и множество других замечательных математиков, эмигрировать в 1937 году в Америку, где он создал еще большую научную школу, чем в Германии, особенно за годы преподавания в Принстоне. В 1958 году он вернулся в Гамбург. Артин не был математиком-мономаном. Кроме математики он интересовался механикой, теорией относительности, химией, биологией, астрономией (он показывал ученикам телескоп, сделанный своими руками), хорошо знал и любил музыку (играл на флейте, фортепиано и клавесине). Его вклад в алгебру, теорию чисел и топологию огромен. Он решил семнадцатую проблему Гильберта, открыл расширения Артина—Шрайе- ра, закон взаимности Артина в теории полей классов, создал теорию кос, ввел артиновы кольца и разрешимые группы, предложил функциональный аналог гипотезы Римана (теперь теорема Хассе—Вейля), гипотезу Артина о примитивных корнях, гипотезу Артина о голоморфности L-ря- дов и многое другое. Артин писал: «Математика — это искусство» и относил это в полной мере к книгам по математике. Он автор по меньшей мере шести классических книг: «Теория Галуа», «Кольца с условиями минимальности» (с Несбитом и Траллом), «Геометрическая алгебра» (имеется русский перевод), «Алгебраические числа и алгебраические функции», «Гамма- функция» и «Теория полей классов» (с Тейтом). Мне представляется, что самые замечательные из них — первая и последняя. Первая — перед вами. М.А.Цфасман
Глава 1 Линейная алгебра 1.1. Тела Телом0 называется множество, в котором заданы две операции — умножение и сложение, аналогичные умножению и сложению в множестве действительных чисел (которое является частным случаем тела). В любом теле F существуют однозначно определенные элементы — так называемые 0 и 1, которые взаимодействуют с другими элементами тела относительно операций умножения и сложения так же, как их аналоги в системе действительных чисел. Эта аналогия с действительными числами неполна в двух отношениях: 1) умножение не всегда предполагается коммутативным, 2) тело может иметь конечное число элементов. Точнее говоря, тело — это множество, которое является аддитивной абелевой группой относительно вышеупомянутой операции сложения, а ненулевые элементы этого множества образуют группу по умножению. Наконец, эти две групповые операции связаны между собой законом дистрибутивности. Кроме того, произведение нуля с любым элементом тела полагается равным нулю. Если умножение в теле коммутативно, то тело называется полем. 1.2. Векторные пространства Аддитивная абелева группа V, элементы которой обозначаются через Л, В, ..., называется (левым) векторным пространством над телом Т7, элементы которого обозначаются а, Ьу ..., если для каждой пары а е F и А е V определен элемент а • Л, принадлежащий группе V, и выполняются следующие условия: 1) а • (А + В) = а • А + а • В, 3) а • (Ь • А) = (а • Ь) • Л, 2) (а + 6)-Л = а-Л + 6-Л, 4) \-А=А. Читатель без труда проверит, что если V — векторное пространство над Z7, то 0 • А = 0 и а • 0 = 0. Например, первое соотношение следует из !)В иностранной литературе кольцо, в котором всякий ненулевой элемент обратим, часто называется полем. Если же умножение в таком кольце коммутативно, то оно называется коммутативным полем. В русской же литературе поля принято называть телами, а коммутативные поля — полями. — Прим. ред. 4
уравнений а.у4 = (а + 0)-у4 = а-у4 + 0-Л. Иногда произведения элементов тела F с элементами пространства V записываются в виде А • а. В этом случае мы называем V правым векторным пространством над F, чтобы подчеркнуть разницу с предыдущим случаем, когда элементы тела F действуют слева. В дальнейшем если левые и правые векторные пространства не встречаются одновременно, то мы будем просто использовать термин «векторное пространство». 1.3. Однородные линейные уравнения Если в теле F заданы т • п элементов aih / = 1, 2, ..., га, / = 1, 2, ... ... , я, то часто бывает необходимо знать условия, гарантирующие существование таких элементов тела Т7, что выполнены следующие равенства: аи*\ + Я|2*2 + ... + аХпхп = О, C.1) ат\Х\ + ат2х2 + ... + атпхп = 0. Читатель, возможно, помнит, что такие уравнения называются линейными однородными, а множество элементов лгь х2, ..., хп тела Z7, для которых эти равенства верны, называется решением системы уравнений. Если не все элементы лгь х2, ..., хп равны нулю, то решение называется нетривиальным; иначе оно называется тривиальным. Теорема 1. Система линейных однородных уравнений всегда имеет нетривиальное решение, если число неизвестных превосходит число уравнений. Доказательство этой теоремы проводится методом, знакомым большинству школьников старших классов, а именно, методом последовательного исключения неизвестных. Если имеется пустое множество уравнений для п неизвестных, то на эти неизвестные нет никаких ограничений и мы полагаем их равными 1. Далее будем действовать по полной индукции. Предположим, что любая система из k уравнений с более чем k неизвестными имеет нетривиальное решение при k < т. Допустим, что для системы уравнений C.1) выполняется неравенство п > т, и обозначим выражение а{\Х\ + ... + ainxn через Lh i = 1, 2, ..., т. Мы ищем такие элементы х[у ..., хпу не все равные нулю, что Lx= L2 = ... = Lm = 0. Если а/7 = 0 для всех / и /, то любой набор лгь ..., хп будет решением. Если же не все а1} равны нулю, то можно считать, что аи ^0, переупорядочив переменные и уравнения подходящим образом. Существование нетривиального решения исходной системы уравнений равносильно 5
существованию нетривиального решения следующей системы: /-1=0, L2-a2{auxL{ = 0, Lm -amXa\\Lx = 0. Действительно если хх, ..., хп — решение последней системы уравнений, то, поскольку L\ = 0, второй член каждого из оставшихся уравнений равен нулю, и тем самым L2 = Ц = ... = Lm = 0. Обратно, если выполнено C.1), то, очевидно, новая система имеет решение. Читатель может заметить, что новая система была подобрана таким образом, что переменная хх исключается из последних т - 1 уравнений. Кроме того, если существует нетривиальное решение последних т — 1 уравнений, рассматриваемых как система от переменных х2, ..., хП1 то, полагая Х\ = —а^(а\2х2 + ai3*3 + ... + а\пхп), мы получим решение исходной системы. Однако система из последних т — 1 уравнений имеет решение по индуктивному предположению, откуда и следует утверждение теоремы. Замечание. Если бы мы записали линейные однородные уравнения в форме ^лгуа/у = 0, / = 1, 2, ..., я, то теорема по-прежнему осталась бы верной и ее доказательство проходило бы без изменений. 1.4. Зависимость и независимость векторов Векторы А1, ..., Ап векторного пространства V над телом F называются линейно зависимыми, если существуют такие элементы этого тела Х\, ..., хП1 не все равные нулю, что Х\А\ + х2А2 + ... + хпАп = 0. В противном случае векторы называются (линейно) независимыми. Размерностью векторного пространства V над телом F называют максимальное число линейно независимых векторов в V. Так, размерность пространства V равна я, если в V есть п линейно независимых векторов, но любое множество из (п+ 1) векторов линейно зависимо. Система векторов у4ь...,у4т в V называется системой образующих, если любой вектор А из V может быть линейно выражен че- т рез Ль ..., Лш, т.е. А = £аИ/ для подходящих а,, / = 1, ..., m, a, € F. /=i Теорема 2. В любой системе образующих максимальное число линейно независимых векторов равно размерности векторного пространства. Пусть А\у ..., Ап — система образующих векторного пространства V размерности п. Обозначим через г максимальное число линейно независимых векторов в системе образующих. Переупорядочивая векторы 6
подходящим образом, мы можем считать, что Ль ..., Лг линейно независимы. По определению размерности отсюда следует, что г < п. Для любого / векторы Ль ..., Лг, Ar+j линейно зависимы и в равенстве ахАх + а2А2 + ... + агАг + ar+jAr+j = О, выражающем зависимость, коэффициент ar+j Ф О, ибо в противном случае мы получили бы противоречие с предположением о линейной независимости векторов Ль ..., Аг. Поэтому, Ar+j = -а^'ДаИ, + а2А2 +... + агАг\ Следовательно, множество векторов Ль ..., Аг также является системой образующих, так как в соотношении, представляющем любой вектор пространства V как линейную комбинацию векторов Ль ..., Ап, слагаемые, содержащие Лг+У, / ф О, можно заменить на линейные комбинации векторов Ль ..., Аг. Пусть теперь Вь ..., Bt—любой набор векторов пространства V, г где t > г. Тогда существуют такие а/у, что Ву = J2 а/Иь /=1,2,...,/, поскольку Л, — система образующих. Если мы сможем показать, что Si, ..., Bt линейно зависимы, то мы получим оценку r^ n и тем самым, учитывая неравенство г < п, доказанное выше, получим доказательство теоремы. Таким образом, мы должны предъявить нетривиальное решение уравнения ххВх + х2В2 + ... + xtBt = О, где Xi eF. С этой целью найдем значения xiy которые удовлетворяют системе линейных уравнений ^лгуа/у = 0, /=1,2, ...,г. Этого будет достаточно, потому что выражения в левой части уравнений суть коэф- / г фициенты при Л, в сумме J2 xjBji гДе Bj заменены на J2 Я/И/ и приведены /=1 i=i подобные слагаемые. Но нетривиальное решение системы ^лгуа/7 = 0, /=i / = 1, 2, ..., г, всегда существует по теореме 1. Замечание. Любые п независимых векторов Ль ..., Ап в векторном пространстве размерности п являются системой образующих. Для любого вектора Л векторы А, Ах, ..., Ап зависимы и коэффициент при Л в линейном соотношении не может быть равен нулю. Выражая Л через Ль • • •, Л„, мы видим, что Ль ..., Ап — система образующих. Подмножество векторного пространства называется подпространством, если оно является подгруппой пространства, рассматриваемого 7
как абелева группа, и, кроме того, инвариантно относительно умножения на элементы тела F. Если А1у ..., As — векторы пространства V, то множество векторов вида ахАх +... + asASy очевидно, образует подпространство в V. Из определения размерности также видно, что размерность любого подпространства не превосходит размерности объемлющего пространства. Набор из 5 элементов тела F вида (аь ..., as) будем называть вектор-строкой. Все вектор-строки длины 5 образуют векторное пространство, если положить 1) (аь а2, ..., as) = (bx, Ь2, ..., bs)y если и только если а, = bh I = =1,...,5, 2) (а,, а2, ..., as) + (bu fc2, ..., bs) = (а, + bly a2 + b2, ..., as + 6S), 3) ft(ab a2, ..., as) = (ftab fta2, ..., bas) для ft из F. fax\ Наборы из s элементов тела Z7, записываемые вертикально: I ; 1, называются вектор-столбцами. Теорема 3. Вектор-строки (столбцы) длины п, элементы которых принадлежат телу F, образуют векторное пространство размерности п над F. Это пространство обозначается через Fn. Заметим, что п векторов е,=A,0, 0,..., 0), е2 = @, 1,0, ...,0), е„ = @, 0, 0, ..., 1) независимы и порождают Р. Оба свойства следуют из соотношения (а,, а2, ..., an) = J2a^i- Мы будем называть прямоугольную таблицу /а\\ а\2 ... а\п\ [ 021 022 • • • 0>2п | \ат\ ат2 ... атп) из элементов тела F матрицей. Правым строчным рангом матрицы называется максимальное число линейно независимых вектор-строк среди строк (ал, ..., ain) матрицы, если умножение на элементы поля задано справа. Аналогичным образом определяются левый строчный, правый и левый столбцовый ранги. Теорема 4. В любой матрице правый столбцовый ранг равен левому строчному рангу и левый столбцовый ранг равен правому 8
строчному рангу. Если тело является полем, то все четыре ранга равны одному и тому же числу и это число называется рангом матрицы. Обозначим столбцы матрицы через Сь ..., Сп и строки через /?ь ... /°\ ... , Rm. Нулевой вектор-столбец 0 равен I • 1, и любая линейная зависимость вида С\Х\ + С2х2 + ... + Спхп = О эквивалентна существованию решения системы уравнений аХ\Хх + аХ2х2 + ... + аХпхп = О, C.1) ат\хх + ат2х2 + ... + атпхп = 0. Любая перестановка строк матрицы приводит к той же самой системе уравнений и, тем самым, не изменяет столбцового ранга матрицы. Строчный ранг при этом также не изменяется, потому что у новой матрицы вектор-строки будут теми же. Обозначим правый столбцовый ранг через с и левый строчный ранг матрицы через г. Учитывая предыдущие замечания, мы можем считать, что первые г строк линейно независимы. Векторное пространство, порожденное вектор-строками матрицы, имеет размерность г по теореме 1 и порождено первыми г строками. Следовательно, любая строка с номером, большим г, линейно выражается через первые г строк. В итоге любое решение первых г уравнений системы C.1) будет решением всей системы, поскольку последние п — г уравнений получаются как линейные комбинации первых г уравнений. Обратно, любое решение системы C.1) также будет решением первых г уравнений. Это означает, что у матрицы (аХ\ а\2 ... а\п\ а2\ а22 ... а2п \ : I • йг\ йг2 ... urn/ состоящей из первых г строк исходной матрицы, правый столбцовый ранг такой же, как у исходной матрицы. Кроме того, у нее такой же левый строчный ранг, так как эти г строк выбирались независимыми. Но столбцовый ранг усеченной матрицы не может быть больше г по теореме 3. Тем самым, с < г. Аналогично, обозначая через с' левый столбцовый ранг и через г1 правый строчный ранг, имеем с' ^ г1. Если транспонировать исходную матрицу, т. е. заменить строки на столбцы, а столбцы на строки, то левый строчный ранг транспонированной матрицы будет равен левому столбцовому рангу исходной. Если применить предыдущие 2* Теория Галуа 9
соображения к транспонированной матрице, то мы придем к неравенствам г^сиг'^с'. 1.5. Неоднородные линейные уравнения Система неоднородных линейных уравнений апхх + а12х2 +... + а1пхп = Ьх, а2\Х\ + 0,22*2 + • • • + #2 А = Ь2, E.1) °>т\*\ + #ш2*2 + • • • + йтпхп — Ьп /by имеет решение тогда и только тогда, когда вектор-столбец I • ) лежит в озна- Ьп подпространстве, порожденном векторами ( \ ),...,( \ 1. Это \ат\/ \атп/ чает, что решение существует, если и только если правый столбцовый ранг матрицы <а\\ а\2 ... а\п\ й2\ A22 ••• 0-2п 1 \р>т\ 0>т2 • • • CLmn/ такой же, как и правый столбцовый ранг расширенной матрицы fa\\ a\2 ... а\п Ь\\ й2\ 0,22 ... 0-2п ^2 \йт\ CLm2 ••• CLmn Ьт) поскольку векторное пространство, порожденное столбцами исходной матрицы, должно совпадать с векторным пространством, порожденным столбцами расширенной матрицы, и в обоих случаях размерность пространств равна рангу матрицы по теореме 2. Из теоремы 4 следует, что строчные ранги2) равны. Обратно, если строчный ранг расширенной матрицы такой же, как строчный ранг исходной матрицы, то столбцовые ранги будут равны и система уравнений будет иметь решение. Если система уравнений E.1) имеет решение, то любое соотношение между строками исходной матрицы сохраняется и для строк расширенной матрицы. Для системы E.1) это просто означает, что линейные комбинации равных выражений равны друг другу. Обратно, если любое соотношение между строками исходной матрицы сохраняется и для строк 2)Речь идет о левых строчных рангах. — Прим. ред. 10
расширенной матрицы, то строчный ранг расширенной матрицы равен строчному рангу исходной матрицы. В терминах уравнений это означает, что решение нашей системы существует, если и только если система уравнений совместна, т. е. любое соотношение между левыми частями системы выполнено также и для правых частей. Теорема 5. Если для системы E.1) выполнено равенство т = п, то решение существует и единственно, если и только если соответствующая однородная система уравнений а>\\Х\ + ах2х2 + ... + аыхп = О, #21*1 Н" #22*2 Н~ • • • Н~ #2я*я = О, ап\Х\ + ап2х2 + ... + аппхп = О имеет только тривиальное решение. Если однородная система имеет только тривиальное решение, то ее вектор-столбцы линейно независимы. Следовательно, если у исходной системы существует какое-нибудь решение, то оно будет и единственным, поскольку, предполагая наличие двух различных решений и вычитая решения почленно, мы бы получили нетривиальное решение однородной системы. Как минимум одно решение, однако, существует всегда, так как п линейно независимых вектор-столбцов порождают все я-мерное пространство вектор-столбцов. Обратно, предположим, что наша система уравнений имеет одно и только одно решение. В таком случае, складывая почленно решения однородной системы с решениями исходной системы, получаем новое решение исходной системы. Следовательно, однородная система может иметь только тривиальное решение. 1.6. Определители^ Теория определителей, которая развивается в этой главе, не является необходимой для теории Галуа. По этой причине читатель может без ущерба пропустить этот раздел. Здесь мы предполагаем, что тело является полем. Рассмотрим квадратную матрицу (а\\ а\2 ... а\п\ а2: а:22 ••• аН F.D ап\ ап2 ... апп/ 3)Из всего изложенного материала здесь используется только теорема 1 для однородных уравнений и понятие линейной зависимости. 11
с п строками и п столбцами. Мы определим некоторую функцию от этой матрицы со значениями в исходном поле. Эта функция называется определителем и обозначается через an а2\ 012 а22 а\п й2п F.2) \ап\ аП2 или через D(AX, А2, ..., Ап)у если мы хотим рассматривать ее как функцию вектор-столбцов Ль Л2, ..., Ап матрицы F.1). Если мы зафиксируем все столбцы, кроме £-го, и будем рассматривать определитель как функцию £-го столбца, то получившуюся функцию будем обозначать через Dk(Ak), а иногда и просто D. Определение. Функция от вектор-столбцов называется определителем, если она удовлетворяет трем следующим аксиомам. 1. Как функция любого столбца Ak она линейна и однородна, т.е. Dk{Ak + К) = Dk{Ak) + Dk(A'k), F.3) Dk(cAk) = cDk(Ak). F.4) 2. Она принимает значение 0, если соседние столбцы Ак и Ак+\ совпадают. 3. Она принимает значение 1 на следующем наборе векторов: о и,= и* = о и„ = о F.5) W W W Вопрос о том, существует ли такая функция, пока остается открытым. Но мы тем не менее выведем несколько следствий из аксиом. a. Если в формуле F.4) положить с = 0, то мы получаем, что определитель равен 0, если один из столбцов равен 0. b. Справедливо равенство Dk(Ak) = Dk(Ak + cAk±l). Другими словами, определитель не изменяется, если прибавить кратное одного столбца к соседнему. Действительно, Dk(Ak + сАк±х) = Dk(Ak) + cDk(Ak±l) = Dk(Ak) по аксиоме 2. c. Возьмем два столбца: Ак и Ак+\. Мы можем заменить их на Ак и на Л*+1 + Ак\ вычитая второй из первого, мы заменяем их на — Ак+\ и Л*+1 +у4*; складывая первый со вторым, получаем — Ак+\ и Ак, наконец, делим —Ак+\ на — 1. Вывод: при перестановке соседних столбцов определитель меняет знак. 12
d. Определитель обращается в ноль, если любые два столбца совпадают. Действительно, меняя местами соседние столбцы, мы можем сделать соседними исходные два столбца. После этого применим аксиому 2. Действуя так же, как и в пп. b и с, можно доказать более общие правила. e. Прибавление кратного одного столбца к другому столбцу не меняет значения определителя. /. Перестановка любых двух столбцов меняет знак определителя D. g. Пусть (vb v2, ..., v„) — какая-то перестановка символов A,2,... ... , п). Если переставить столбцы в D(y4V|, y4V2, ..., АУп) так, чтобы они были упорядочены естественным образом, то видно, что D(AVl, Л,2, ..., AVn) = ±D(A ,,4..., Ап). Знак ± в этом равенстве корректно определен и не зависит от выбора столбцов Ak. Подставляя вместо Ak векторы Uk, мы видим, что D((/V|, (/V2, ..., Uy,n) = ±1 и знак зависит только от перестановки единичных векторов. Заменим теперь каждый вектор Ak на линейную комбинацию векторов Л,, Л2, ..., Ля: A'k = bxkAx + b2kA2 + ... + bnkAn. F.6) Для вычисления D(A\y Л2, ..., А'п) применим сначала к столбцу А\ аксиому 1, позволяющую представить определитель в виде суммы; затем в получившейся сумме проделаем почленно такие же выкладки со столбцом А'2 и т.д. В результате получим D(A\,A'2,...,A'n) = ^2 D{b^A^K22Av2, ...,b^nAJ = = ]С bVllbV22...bv„„D(Av„AV2,...,AJ, F.7) vj,v2 v„ где индексы v, независимо пробегают значения от 1 до п. Но, если какие-либо два индекса v, совпадают, то D(y4V|, y4V2, ..., А^п) = 0; поэтому мы должны учитывать только те слагаемые в которых (vb v2, ..., v„) является перестановкой символов A, 2, ..., п). Это приводит нас к равенству я(л;,л2,...,л;) = оD„4...,л„) ]Г ±ь^2...кпП, F.8) (v, v„) где набор (vb v2, ..., v„) пробегает все перестановки множества A,2,... ... , п) и символ ± обозначает знак данной перестановки. Важно отме- 13
тить, что мы бы пришли к той же самой формуле F.8), если бы наша функция D удовлетворяла только первым двум аксиомам. Из равенства F.8) можно вывести массу следствий. Во-первых, предположим, что аксиома 3 имеет место, и в качестве столбцов Ak возьмем единичные векторы Uk из F.5). Тогда A'k — Bky где Bk — вектор-столбец матрицы с элементами bik. Теперь из F.8) следует, что D(BuB2,...,Bn) = £ ±^А22..ЖЛ,, F.9) (V| V„) Это явная формула, показывающая также, что определители однозначно определяются нашими аксиомами, если только они существуют. Учитывая F.9), вернемся к формуле F.8) и получим D(A\,A'2,...,A'n) = D(AuA2,...,An)D(BuB2,...,Bn). F.10) Это так называемая теорема об умножении определителей. В левой части равенства F.10) стоит определитель матрицы из п строк, элементы которой суть п с/* = ]Г^/А*. F.11) v=l Элемент cik получается, если умножить элементы /-й строки матрицы (Ль Л2, ..., Ап) на элементы k-vo столбца матрицы (Вь В2, ..., Вп) и сложить получившиеся произведения. Заменим теперь D в равенстве F.8) на функцию F(A\y Л2, ..., Л„), удовлетворяющую лишь первым двум аксиомам. Сравнивая с F.9), мы находим F(A\,A'2,...%A'n) = F(AuA2%...,An)D(BuB2%...,Bn). Взяв в качестве векторов Ak единичные векторы UKl мы приходим к формуле •F(Bu B2,...,Bn) = cD(Bu S2, ..., fi„). F.12) nec = F(UuU2,...,Un). Рассмотрим теперь частный случай равенства F.10): если / — некоторый индекс, принимающий значения от 1 до п — 1, то положим Ak = Uk для к ф /, / + 1, Aiг = Ut + £/,+,, Д+, = 0. Тогда D{AU Л2, ..., Ап) = 0, поскольку один из столбцов нулевой. Таким образом, D(A\, Л2,..., А'п) = 0, но этот определитель отличается от определителя матрицы с элементами bjk только тем, что (/ + 1)-ю строку мы приравняли к /-й строке. Итак, мы получаем следующий результат. 14
Определитель обращается в ноль, если две соседние строки равны. Каждое слагаемое в F.9) является произведением, в котором в точности один сомножитель находится в данной строке, скажем в /-й. Это показывает, что как функция данной строки определитель линеен и однороден. Если, наконец, для каждой строки мы возьмем соответствующий единичный вектор, то определитель будет равен 1, поскольку в этом случае матрица совпадает с той, у которой единичные векторы расположены по столбцам. Отсюда мы видим, что определитель, рассматриваемый как функция вектор-строк, также удовлетворяет нашим трем аксиомам. Ввиду единственности определителя отсюда следуют такие результаты. Определитель не меняется, если поменять местами строки и столбцы, т е. транспонировать матрицу. Определитель обращается в ноль, если две строки совпадают. Он меняет знак, если мы меняем местами любые две строки. Определитель не меняется при прибавлении кратного одной строки к другой строке. Докажем теперь существование определителей. Для матрицы ап, состоящей из одной строки, ее единственный элемент и является ее определителем. Предположим, что определители матриц из п — 1 строк существуют. С матрицей из п строк F.1) можно связать некоторый набор определителей (п — 1)-го порядка следующим образом: пусть aik — какой-нибудь элемент матрицы F.1). Вычеркнем из матрицы 1-ю строку и k-й столбец и рассмотрим определитель получившейся матрицы. Этот определитель, умноженный на (—1)/+*, мы назовем алгебраическим дополнением элемента aik и будем обозначать через Aik. Правило знаков (—I)'4"* соответствует правилу расположения клеток в шахматном порядке, а именно /+ - + - -л - + - + + - + - - + - + V- Пусть / — любой индекс, принимающий значения от 1 до п. Рассмотрим следующую функцию D от матрицы F.1): D = апАц + адЛа + • • • + аыАш. F.13) Это сумма произведений элементов /-й строки и их алгебраических дополнений. Изучим, как зависит D от данного столбца, скажем, от Ak. Если v ф k, то Аы линейно зависит от Ak и аы не зависит от Ak\ если v = k, то Aik не зависит от Aky в то время как aik является одним из элементов этого 15
столбца. Следовательно, аксиома 1 выполнена. Предположим, далее, что два соседних столбца Ak и Ak+{ совпадают. Если v ф &, к + 1, то в Аы есть два одинаковых столбца, поэтому Аы — 0. Вычисляя алгебраические дополнения элементов aik и а,-,*+ь мы видим, что соответствующие определители равны, но берутся с противоположными знаками, откуда следует, что Aik = — ALk+\. Однако aik = a,-,*+i • Поэтому D = 0 и аксиома 2 имеет место. В частном случае А„ = A (v = 1, 2, ..., п) мы получаем, что аы = 0 для v ф /, в то время как аа = 1, Аи = 1. Следовательно, D = 1, что и составляет формулировку аксиомы 3. Данное рассуждение доказывает как существование определителей для матриц п-го порядка, так и формулу F.13) —так называемую формулу разложения определителя по /-й строке. Формулу F.13) можно обобщить следующим образом: заменим в нашем определителе /-ю строку на у-ю и разложим его по этой строке. Для [ф] такой определитель равен нулю, а для / =/ он равен D: (D, j = /, Я/1 Ai + dj2Ai2 + ... + ajnAin = < I 0, у ф l F.14) Если поменять строки со столбцам*, то получится следующая формула: ГА h = &, aiHi* + a2hA2k + ... + anhAnk = l F.15) Пусть теперь А и В — квадратные матрицы порядка пит соответственно. Через |Л|, |В| обозначим их определители. Пусть С — матрица с п строками и т столбцами. Образуем тогда квадратную матрицу размера п -f m следующего вида: (и). F.16) где 0 обозначает нулевую матрицу из т строк и п столбцов. Если мы рассмотрим определитель матрицы F.16) как функцию столбцов матрицы Л, то очевидно, что такая функция удовлетворяет первым двум аксиомам. Из F.12) мы выводим, что значение этого определителя равно с\А\, где значение с равно определителю матрицы F.16) после замены столбцов матрицы А на единичные векторы. Это число с все же зависит от В и как функция от строк матрицы В также удовлетворяет первым двум аксиомам. Следовательно, определитель матрицы F.16) равен d|/4||B|, где d — частное значение этого определителя, если вместо столбцов матриц А и В подставить соответствующие единичные векторы. Вычитая кратные столбцов матрицы А из столбцов матрицы С, можно добиться того, что матрица С станет нулевой. Это доказывает, соотношение d = 1 16
и, тем самым, формулу |ов|=ИЦЯ|. F-17) С помощью подобных рассуждений можно было бы доказать, что \с в\ = \А\\в\- F18> Формулы F.17) и F.18) являются частными случаями общей теоремы Лагранжа, которую можно вывести из них. Мы отсылаем читателя к любому учебнику по определителям за доказательством, поскольку в большинстве приложений формул F.17) и F.18) оказывается достаточно. Теперь мы должны понять, какими свойствами обладает матрица с нулевым определителем. Легко установить следующие факты. a. Если столбцы Ль Л2, ..., Ап линейно зависимы, то D(A{, Л2, ... ... , Ап) = 0. Действительно, в этом случае один из столбцов, скажем Ak, является линейной комбинацией остальных; вычитая эту линейную комбинацию из столбца Ak, получаем ноль в k-м столбце. Значит, D = 0. b. Если любой вектор В можно представить как линейную комбинацию векторов Л1, Л2, ..., Л„, то D(A\, Л2, ..., Ап) ф 0. Возвращаясь к формулам F.6) и F.10), выберем значения blk таким образом, чтобы каждый столбец А\ был равен Ut. Для таких значений левая часть равенства F.10) равна 1, откуда следует, что определитель 0(ЛЬ Л2, ..., Л„) в правой части не равен нулю. c. Пусть векторы Ль Л2, ..., Ап линейно независимы и В — произвольный вектор. Если мы распишем уравнение А\Х\ + А2х2 + ... ... + Апхп + Ву = 0 покомпонентно, то получим п линейных однородных уравнений от п + 1 переменных xlt х2у ..., хп, у. Следовательно, должно существовать нетривиальное решение. Компонента у должна быть отлична от нуля, иначе векторы Ль Л2, ..., Ап были бы линейно зависимы. Но тогда мы можем выразить В через А{, А2, ..., Ап. Собирая вместе полученные результаты, делаем следующий вывод. Определитель обращается в ноль тогда и только тогда, когда вектор-столбцы {или вектор-строки) линейно зависимы. Вот другая формулировка того же самого свойства: Множество п линейных однородных уравнений а-1\Хх -f ai2x2 + ... + ainxn = 0 (/ = 1, 2, ..., п) от п переменных имеет нетривиальное решение, если и только если определитель, составленный из коэффициентов системы, равен нулю. 3* Теория Галуа 17
Другой результат, который можно вывести из предыдущих рассуждений, таков. Если даны векторы А\, А2, ..., Ап, то любой вектор В представим как их линейная комбинация, если и только если D(A[y Л2, ... ...,Л„)^0. Иначе это можно сформулировать так. Система линейных уравнений di\X\ + ai2x2 + ... + ainx„ = bi (i = 1, 2, ..., п) F.19) имеет решение для произвольных значений Ьь если и только если определитель матрицы с элементами aik не равен нулю. В этом случае решение единственно. В заключение мы явно выразим решение системы F.19) с помощью определителей, считая, что определитель D матрицы (aik) не равен нулю. Для данного k умножим 1-е уравнение системы на Aik и сложим получившиеся уравнения. Из формулы F.15) следует, что Dxk = Alkbi+A2kb2 + ... + Ankbn (£=1,2, ...,л). F.20) и отсюда можно выразить xk. Правую часть уравнения F.20) тоже можно записать в виде определителя, который получается из D заменой k-vo столбца на столбец с элементами Ь\, Ь2, ..., Ьп. Факт, который мы только что установили, называется правилом Крамера. 18
Глава 2 Теория полей 2.1. Расширения полей Если Е — поле, a F — подмножество поля Е, замкнутое относительно операций сложения и умножения в Е, т. е. F само является полем, то поле Е мы будем называть расширением поля F. Тот факт, что поле Е — расширение поля F, мы будем кратко обозначать следующим образом F С Е. Если а, р, у, ... — элементы поля £, то под ^(а, р, у, • • •) мы будем подразумевать множество элементов в £, которые рационально выражаются через элементы а, р, у, ... с коэффициентами из F. Ясно, что множество ^(а, р, у» • • •) является полем и притом наименьшим расширением поля Z7, содержащим (а, р, у,...). Мы будем называть F(ay р, у, ...) полем, полученным присоединением элементов (а, р, у, ...) к полю /\ или полем, порожденным элементами (а, р, у, ...) над F. Аналогично можно определить и расширение тел, но в дальнейшем мы ограничимся только изучением полей и их расширений. Если F с Е, то, забывая про операцию умножения в £, мы можем рассматривать Е как векторное пространство над F. Под степенью пространства Е над Z7, которую мы будем обозначать через (E/F), подразумевается размерность векторного пространства Е над F. Если размерность (E/F) конечна, то расширение Е будет называться конечным расширением над F. Теорема 6. Если F, В, Е — такие три поля, что F С В с Е, то (E/F) = (B/F)(E/B). Пусть Л1, Л2, ..., Аг— элементы поля £, которые линейно независимы над В, и пусть Сь С2, ..., Cs — элементы поля В, линейно независимые над F. Тогда произведения C-tAh где / = 1, 2, ..., s и у = 1, 2, ..., г, являются линейно независимыми над F элементами поля £, поскольку если 5Za//CH/ = 0, то Хд^Я/уСЛЛу—линейная комбинация элементу / ^ i ' тов Aj с коэффициентами в поле В, и из того что элементы А} линейно независимы над В, следует равенство 5Za,7C; = 0 ^пя каждого у. Из 19
независимости элементов С} над полем F следует равенство aVl = 0. Поскольку количество элементов СИ,- равно rsy мы доказали, что для каждой пары г ^ (Е/В) и s ^ (B/F) степень (E/F) ^ rs. Следовательно, (E/F) ^ (B/F)(E/B). Если одна из размерностей в правой части бесконечна, то утверждение теоремы доказано. Если обе размерности в правой части конечны и равны, скажем, г и s соответственно, то можно предполагать, что элементы А} и С, являются системами образующих в полях Е и В соответственно. Докажем, что набор произведений CiAj — система образующих в поле Е над полем F. Каждый элемент А е Е можно выразить через A-f с коэффициентами из В. Тем самым, A = ^2BjAj. Затем, каждый элемент В} принадлежит полю В, следовательно, его можно линейно выразить через С, с коэффициентами из Z7, т. е. Bj = = Y^ QijCi, / = 1» 2, ..., г. Таким образом, А = ^2 aij^iAh и набор С/Л,- — линейно независимая система образующих поля Е над полем F. Следствие. Если F с Fx с F2 С ... С Fn, тогда (Fn/F) = (FjF) x x(F2/Fl)...(Fn/Fn.l). 2.2. Многочлены Выражение вида а0хп + й\Хп~х + ... + ап называется многочленом степени п с коэффициентами в поле Z7, если коэффициенты a0, ..., ап являются элементами поля F и а0 ф 0. Умножение и сложение многочленов определяется обычным образом0. Многочлен называется приводимым над полем Z7, если он равен произведению двух многочленов с коэффициентами в поле F, каждый из которых имеет степень не меньше единицы. Многочлены, которые не являются приводимыми над полем F, называются неприводимыми над полем F. Если соотношение f(x) = g(x)h(x) выполнено для многочленов f(x), g(x), h(x) с коэффициентами в поле Z7, то мы будем говорить, что многочлен g(x) делит многочлен f(x) над полем F или что g(x) —делитель многочлена f(x). Легко видеть, что степень многочлена f(x) равна сумме степеней многочленов g(x) и h(x). Таким образом, если ни один из многочленов g(x)f h{x) не является константой, то степень каждого из них строго меньше, чем степень многочлена f{x). Из этого следует, что произвольный многочлен можно выразить как произведение неприводимых многочленов с коэффициентами в поле F за конечное число разложений на множители. '*Говоря о множестве всех многочленов степени, меньшей чем п, мы условимся включать в это множество нулевой многочлен, хотя он и не имеет степени в собственном смысле слова. 20
Для любых двух многочленов f(x)y g(x) можно применить алгоритм деления с остатком, т.е. верно равенство f{x) = q(x)g(x) -f r(x), где q(x) и r(x) —однозначно определенные многочлены с коэффициентами в поле F и степень многочлена г(х) строго меньше, чем степень многочлена g(x). Этот факт можно доказать с помощью рассуждения, подобного тому, которое встречалось в элементарной алгебре в случае вещественных или комплексных чисел. Видно также, что г(х) —такой однозначно определенный многочлен степени, меньшей чем степень многочлена g(x), что разность f(x) — г(х) делится на g(x). Мы будем называть многочлен г(х) остатком многочлена f{x). Точно также, стандартным способом можно доказать, что если а — какой-нибудь корень многочлена f(x) в поле Z7, то многочлен х — а является делителем многочлена f(x). Как следствие получаем, что число корней многочлена в поле не превосходит его степени. Лемма. Если f(x) — неприводимый многочлен степени п с коэффициентами в поле F, то не существует двух многочленов с коэффициентами в поле F, каждый из которых имел бы степень, меньшую чем п, и произведение которых делилось бы на f(x). Предположим противное: пусть g(x) и h(x) — многочлены, степень которых меньше я, и пусть их произведение делится на f(x). Среди всех таких пар многочленов выберем ту, в которой многочлен g(x) имеет наименьшую степень. Тогда, поскольку f(x) —делитель произведения g(x)h(x)y существует такой многочлен k(x)y что k(x)f(x) = g(x)h(x). Воспользовавшись делением с остатком, запишем f(x) = q(x)g(x) + r(x), где степень многочлена г(х) меньше степени многочлена g(x). При этом г(х) ф 0, поскольку многочлен f(x) неприводим по предположению. Умножая равенство f(x) = q(x)g(x) + r(x) на многочлен h{x) и меняя местами слагаемые, получаем равенства r(x)h(x) = f(x)h(x) - q(x)g(x)h(x) = f(x)h(x) - q(x)k(x)f(x), из которых следует, что многочлен r(x)h(x) делится на многочлен f(x). Поскольку степень многочлена г(х) меньше, чем степень многочле- на g(x), это приводит к противоречию с выбором многочлена g(x)y из чего следует утверждение леммы. 21
Как мы видели, многие теоремы элементарной алгебры выполняются для любого поля F. Однако так называемая основная теорема алгебры, по крайней мере в своей привычной форме, не имеет места. Ее место займет теорема Кронекера, гарантирующая существование расширения поля F, в котором данный многочлен с коэффициентами в поле F имеет корень. Мы докажем также, что над заданным полем произвольный многочлен можно не только разложить на простые множители, но и что это разложение однозначно с точностью до константы. Доказательство однозначности также опирается на теорему Кронекера. 2.3. Алгебраические элементы Пусть F — поле и Е — какое-нибудь расширение поля F. Если а — произвольный элемент из поля £, то можно задаться вопросом, существуют ли такие многочлены с коэффициентами в поле Z7, для которых а является корнем. Если такие многочлены существуют, то элемент а называется алгебраическим над F. Пусть теперь а — алгебраический элемент; выберем из всех многочленов над полем Z7, для которых а является корнем, многочлен наименьшей степени. Обозначим его через f(x). Можно предполагать, что старший коэффициент многочлена f(x) равен единице. Мы утверждаем, что такой многочлен f(x) однозначно определен, что он неприводим и что каждый многочлен с коэффициентами в поле Z7, для которого а является корнем, делится на f(x). Действительно, если g(x) — многочлен над F и g(a) = 0, то g(x) можно представить в виде g(x) =f(x)q(x) -f r(x), где степень многочлена г(х) меньше, чем степень многочлена f(x). Подставляя х = а в равенство, получаем, что г(а) = 0. Отсюда следует, что многочлен г(х) тождественно равен нулю, поскольку иначе элемент а был бы его корнем и его степень была бы меньше степени многочлена f{x). Следовательно, g{x) делится на f(x). Это также доказывает единственность многочлена f(x). Если бы многочлен f(x) был приводим, то а был бы корнем одного из его делителей, что опять приводило бы к противоречию с выбором многочлена f(x). Пусть п — степень многочлена f(x). Рассмотрим теперь подмножество £(ь состоящее из следующих элементов 0 поля Е: . 6 = g(<x) = с0 + CiOL 4- c2ol2 + ... + сп_х<хп-\ где g(x) —многочлен над полем Z7, степень которого меньше п. Множество Е0 замкнуто относительно сложения и умножения. Последний факт можно проверить следующим образом. 22
Если g(x) и h(x) —два многочлена, степени которых меньше п, то положим g(x)h(x) = q(x)f(x) + г(х), откуда следует, что g(a)/z(a) = r(a). Мы видим, наконец, что константы с0, сь ..., сп_\ однозначно определены элементом G. Действительно, из двух различных выражений для одного и того же элемента G после вычитания можно было бы получить уравнение относительно а, степень которого была бы меньше п. Заметим, что внутренняя структура множества Е0 зависит не от природы числа а, а лишь от неприводимого многочлена f(x). Информация об этом многочлене позволяет нам выполнять операции сложения и умножения в нашем множестве Е0. Скоро мы убедимся, что множество Е0 является полем; на самом деле Е0 — не что иное, как поле ^(а). Как только это будет доказано, мы тут же сможем сделать вывод, что степень (F(ol)/F) равна п, поскольку пространство ^(а) порождено линейно независимыми элементами 1, а, а2, ..., ал_|. Теперь мы попытаемся сымитировать конструкцию множества Е0 так, как если бы в нашем распоряжении не было расширения Е поля F и элемента а. Мы будем лишь предполагать наличие неприводимого многочлена f(x) = хп + ап_ххп~х + ... + а0. Введем символ 5 и через Е\ обозначим множество всех формальных многочленов вида g(l) = c0 + c£ + ... + сп_£п-\ степень которых меньше п. Это множество образует группу по сложению. Теперь мы введем, помимо обычного умножения, новый закон умножения на множестве Е\. Произведение двух элементов g(^) и /г(£) относительно нового закона умножения будет обозначаться через gd) x /г(£). Оно определяется как остаток r(Q от обычного произведения многочленов £(?)/*(?) при делении на /(£). Заметим сперва, что произведение любых т многочленов вида gi(?), ^(?)» • • • > gmd) опять является остатком от обычного произведения g\(i)g2(K) - - -gmd)- Это свойство верно по определению при т = 2 и будет выполняться для любого т по индукции. (Чтобы убедиться в этом, достаточно доказать простую лемму: остаток произведения двух остатков (от пары многочленов) является остатком произведения самих двух многочленов.) Этот факт доказывает, что наше новое умножение ассоциативно и коммутативно, а также что новое произведение g\(l) x g2(Q x ... х gm(l) будет совпадать со старым произведением g\E)^E) •••gmE), если степень последнего не превосходит п. Легко проверить дистрибутивность нашего умножения. Множество Е\ содержит наше поле /% и умножение в Е\ для поля F имеет старый смысл. Одним из элементов множества Е\ является £. 23
Умножая его на себя / раз, мы, очевидно, будем получать элемент £', до тех пор, пока выполняется неравенство / < п. При / = п это уже неверно, поскольку в этом случае мы получаем остаток многочлена £". Этот остаток равен 1п - № = -ап^1п~' - ап_2Ъп~2 - ... - а0. Забудем теперь полностью о старом умножении и будем иметь в виду только новое; мы изменим также обозначения и будем использовать точку (или просто приписывание рядом) в качестве символа для нового умножения. Вычисляя в этих терминах с0 + с£ + с2?2 + • • • + Cn-\Zn~\ мы приходим к тому же самому элементу, поскольку все степени в этом выражении меньше п. С другой стороны, Ъп = -ап_£п-' - ап_2Ъп-2 - ... - а0. Перенося все слагаемые в левую часть, мы видим, что /(!;) = 0. Тем самым, мы построили некоторое множество £ь в котором определены законы сложения и умножения, удовлетворяющие большинству аксиом поля. Множество Е\ содержит F как подполе, и элемент 5 удовлетворяет уравнению /(£) = 0. Следующим шагом мы должны показать, что верно следующее утверждение: если g(Q ф 0 и Л(£) —два элемента из £"i, то существует такой элемент в £"i, что g(^)X(^) = Л(£). Чтобы доказать это, будем считать коэффициенты Xi в выражении для Х(Е) неизвестными и вычислим произведение в левой части равенства, подставляя вместо больших степеней ^ их выражения через меньшие степени. В результате мы получим выражение вида LQ + Li£ + ... + Ln_\<in~\ где каждый элемент Lt является некоторой линейной комбинацией элементов xt с коэффициентами из F. Это выражение должно быть равно /г(£), что приводит нас к п уравнениям с п неизвестными: L0 = b0y L{=b\, ..., Ln_\=bn_\, где bt — коэффициенты многочлена h(Q. Эта система разрешима, если соответствующая однородная система уравнений L0 = 0, L,=0, ..., L„_,=0 имеет только тривиальное решение. Нетривиальное решение однородной системы задавало бы элемент Х(£), удовлетворяющий равенству g(^)X(^) =0. Если вернуться на секунду к старому умножению, то это будет означать, что обычное 24
произведение многочленов gCQXfe) при делении на /(£) имеет остаток О и, тем самым, делится на /(£). Согласно лемме на с. 21, это может случиться только в случае, когда Х(Е>) = 0. Следовательно, Е\ — поле. Предположим теперь, что у нас есть наше старое расширение Е с корнем а многочлена f(x)y из которого получается множество Е0. Видно, что множество Е0 имеет в некотором смысле ту же структуру, что и множество £"i, если отобразить элемент g(£) из Е\ в элемент g(at) из Е0. Это отображение будет обладать тем свойством, что образ суммы элементов равен сумме образов и образ произведения равен произведению образов. Итак, введем следующее определение: биективное отображение а из одного поля в другое, удовлетворяющее свойствам а(а -f P) = а(а) + оф) и а(ар) = а(а)а(р) называется изоморфизмом. Если рассматриваемые поля совпадают, т. е. являются одним и тем же полем, то изоморфизм называется автоморфизмом. Два поля, для которых существует какой- нибудь изоморфизм, отображающий одно поле на другое, называются изоморфными. Если не всякий элемент второго поля является образом какого-либо элемента из первого поля под действием а, то а называется изоморфизмом первого поля во второе поле. Ясно, что при любом изоморфизме а@) =0 и аA) = 1. Мы видим, что Е0 также является полем и что оно изоморфно полю Ех. Мы приведем теперь несколько теорем, которые следуют из наших рассуждений. Теорема 7 (Кронекер). Если f(x)—многочлен над полем F, то существует расширение Е поля F, в котором многочлен f(x) имеет корень. Доказательство. Строим расширение поля, в котором неприводимый делитель многочлена f{x) имеет корень. D Теорема 8. Пусть а — изоморфизм, отображающий поле F на поле F'. Пусть f(x) — неприводимый многочлен над F и f'(x) — соответствующий многочлен над полем F'. Если Е = F(fi) и Е' = Рф') — расширения полей Fи F' соответственно, где/ф) = 0в Еи /'ф') = 0 в Е', то изоморфизм о можно продолжить до изоморфизма между полями Е и Е'. Доказательство. Оба поля £и£' изоморфны полю Е0. D 2.4. Поля разложения Если Z7, В и Е — такие три поля, что F С В С £, то поле В мы будем называть промежуточным полем. Если Е — расширение поля Z7, в котором многочлен р(х) над полем F можно разложить на линейные множители, и если ни в каком промежу- 4* Теория Галуа 25
точном поле р(х) не раскладывается на такие множители, то поле Е называется полем разложения для р(х). Тем самым, если Е—поле разложения многочлена р(х)у то корни многочлена р(х) порождают поле Е. Поле разложения имеет конечную степень, поскольку оно получается с помощью присоединения конечного числа алгебраических элементов, каждый из которых задает расширение конечной степени. Из следствия на с. 20 вытекает, что общая степень также конечна. Теорема 9. Если р(х) —многочлен над полем F, то поле разложения Е для многочлена р(х) существует Разложим многочлен р(х) в поле F на неприводимые сомножители: р(х) = f\(x) ...fr{x). Если каждый неприводимый многочлен в этом разложении имеет степень один, то поле F само является полем разложения. Предположим, что степень многочлена f\(x) больше единицы. По теореме 7 существует расширение Fx поля Z7, в котором многочлен fi(x) имеет корень. Разложим каждый из сомножителей f\(x), ..., fr(x) на неприводимые сомножители в F\ и повторим предыдущее рассуждение. В конце концов мы придем к полю, в котором многочлен р(х) можно разложить на линейные множители. Поле, порожденное над F корнями многочлена р(х)у и есть требуемое поле разложения. Следующая теорема утверждает, что поле разложения многочлена единственно с точностью до изоморфизма. Теорема 10. Пусть о — изоморфизм, отображающий поле F на поле F'. Допустим, что р(х) —многочлен над F и р'{х) —многочлен над F', коэффициенты которого являются образами коэффициентов многочлена р(х) под действием а. Пусть, наконец, Е — поле разложения многочлена р(х) и Е' — поле разложения многочлена р'{х). При этих условиях изоморфизм а можно продолжить до изоморфизма между Е и Е'. Если f(x) — неприводимый делитель многочлена р(х) в поле Z7, то Е содержит корень многочлена f(x). Действительно, пусть р(х) = = (х — <х\)(х — <х2)... (х — <xs) — разложение многочлена р(х) на линейные множители в Е. Тогда (х - а\)(х - <х2)... (х - ols) = f(x)g(x). Рассмотрим f(x) как многочлен в поле Е и построим расширение поля Б = £(а), в котором /(а)=0. Тогда (а - ai)(a - а2)... (а - as) = /(a)g(a) = 0, и, поскольку сомножители а — а, являются элементами поля Б, их произведение может равняться нулю, только если один из сомножителей, скажем первый, т.е. а — аь равняется нулю. Таким образом, a = ai, и cti —корень многочлена f{x). Если все корни многочлена р(х) принадлежат полю Z7, то Е = F и р(х) разлагается в F. Образ этого разложения в поле F' под действием a будет разложением на линейные множители для многочлена р'(х)у по- 26
скольку изоморфизм а согласован с операциями сложения и умножения при перемножении сомножителей многочлена р(х) и приведении подобных слагаемых. Поскольку р'(х) можно разложить в поле Р, получаем равенство Р = Р. В этом случае сам изоморфизм а является требуемым продолжением, и теорема доказана, при условии, что все корни многочлена р(х) лежат в поле F. Далее будем действовать по полной индукции. Предположим, что теорема доказана для всех случаев, когда число корней многочлена р(х)у не лежащих в поле F, меньше чем п > 1. Пусть число корней многочлена р(х)у не лежащих в поле Z7, равно п. Разложим многочлен р(х) на неприводимые сомножители в поле F т.е. запишем р(х) = f\(x)f2(x)... • •• fm(x). В этом разложении найдутся сомножители, степень которых больше единицы, поскольку иначе многочлен р(х) разлагался бы в поле Z7, что противоречит предположению. Следовательно, можно предполагать, что степень многочлена f\{x) больше единицы и равна г. Пусть f\{x)f'2(x)... f'm(x) = p'{x) — разложение многочлена р'{х) в произведение многочленов, соответствующих /i(x), ..., fm(x) под действием а. Многочлен f\(x) неприводим в поле Р, ибо его разложение на множители в поле Р под действием а-1 индуцировало бы2) разложение многочлена /i(x), который, однако, неприводим по условию. По теореме 8 изоморфизм а можно продолжить до изоморфизма о\ между полями F(<x) и Р(а'). Из условия FcF(ol) следует, что р(х) — многочлен над F(<x) и £ — поле разложения для многочлена р(х) в поле ^(а). Аналогичное утверждение верно и для р'{х). Теперь над новым основным полем ^(а) число корней многочлена р(х), не принадлежащих этому полю, меньше п. По нашему индуктивному предположению изоморфизм о\ между полями ^(а) и Р(а;) можно продолжить до изоморфизма а2 между полями Е и Р. Поскольку о\ —продолжение изоморфизма а и а2 — продолжение изоморфизма аь мы заключаем, что а2 является продолжением изоморфизма а, откуда и следует утверждение теоремы. Следствие. Если р(х)—многочлен над полем F, то любые два поля разложения для р(х) изоморфны. Это следует из теоремы 10, если взять /Г = Р и положить а равным тождественному отображению, т. е. а(х) = х. Из этого следствия мы делаем вывод, что употребление названия «поле разложения многочлена р(х)» корректно, поскольку любые два таких поля одинаковы с точностью до изоморфизма. Поэтому если многочлен р(х) имеет кратные корни в одном поле разложения, то и в любом другом ^Определение отображения а ' см. на с. 31. 5* Теория Галуа 27
его поле разложения у него будут кратные корни. Утверждение «многочлен р(х) имеет кратные корни» будет иметь смысл без обращения к какому-либо конкретному полю разложения. 2.5. Однозначное разложение многочленов на неприводимые сомножители Теорема 11. Если р(х) —многочлен над полем F, и если р(х) = = р\(х)р2(х)...pr(x) = qx(x)q2(x) ...qs(x) — два разложения многочлена р(х) на неприводимые сомножители, где степень каждого неприводимого сомножителя не меньше единицы, то r = s и после подходящего переупорядочивания сомножителей в правой части верно равенство pt(x) = Ciqt{x), i = 1, 2, ..., г и ct Е F. Пусть ^(a)— расширение поля Fy в котором /?i(a) = 0. Можно предположить, что старшие коэффициенты многочленов pi(x) и qt(x) равны 1, поскольку, выделяя старшие коэффициенты во всех многочленах в обеих частях равенства и собирая их вместе, мы получим, что постоянный множитель в обеих частях равен старшему коэффициенту многочлена р(х). Следовательно, его можно сократить. Поскольку О = р\(<х)р2(<х)... Pr(oi) = p(ol) = qx(a)... qs(v) и поскольку произведение элементов поля ^(a) может быть равно нулю, только если один из них равен нулю, отсюда следует, что один из множителей <7/(°0» скажем q\(v), равен нулю. Это приводит к равенству (см. с.22) р\{х) = = q{(x). Следовательно, р\(х)р2(х) ...pr(x) = pi(x)q2(x) ...qs(x), или Р\(х)[р2(х) ...pr(x) - q2(x) ...qs(x)] = 0. Поскольку произведение двух многочленов равно нулю, если и только если хотя бы один из двух многочленов — нулевой, отсюда следует, что многочлен в квадратных скобках равен нулю, т.е. р2{х)...pr{x) = q2{x) ...qs(x). Повторяя то же рассуждение г раз, мы получаем равенства р^х) = qi(x), I = 1, 2, ..., г. Поскольку произведение оставшихся многочленов qi(x) равно 1, отсюда следует, что r = s. 2.6. Характеры групп Если G — мультипликативная группа, F — поле и a — гомоморфизм, отображающий группу G в поле Z7, то а называется характером группы G в F. Под гомоморфизмом подразумевается такое отображение а, что для двух любых элементов а, р из G имеется равенство a(a)a(P) = a(ap) и a(a) ф 0 для любого а. (Если а(а) = 0 хотя бы для одного элемента а, то а(х) = 0 для всех х е G, поскольку а(ау) = а(а)а(у) = 0 и ау пробегает все значения в G, когда у принимает все значения в G.) 28
Характеры аь о2, ..., оп называются зависимыми, если в поле F существуют такие элементы аь а2, • ., anj не все равные нулю, что ахо\(х) + а2о2(х) + ... + ала„(*) = 0 для всех х е G. Такая линейная зависимость называется нетривиальной. Если характеры не являются зависимыми, то они называются независимыми. Теорема 12. Если G — группа и аь а2, • • • * °п — я попарно различных характеров в поле F, то характеры аь а2, • • •» а* независимы. Один единственный характер не может быть зависим, поскольку в силу предположения ai(x)^0 из равенства aiai(x) = 0 следует, что ах=0. Пусть я> 1. Сделаем индуктивное предположение, что никакое множество характеров, состоящее из менее чем п элементов, не является зависимым. Предположим теперь, что существует нетривиальная зависимость между характерами а, которая имеет вид а\0\(х) + + а2о2(х) + ... + апоп(х) = 0. Никакой из элементов а, не равен нулю, иначе бы имелась зависимость между менее чем п характерами, что противоречило бы индуктивному предположению. Поскольку о\ и ап различны, существует такой элемент а из G, что с\(а) ф оп(а). Умножим соотношение между характерами а на а. Мы получим соотношение 6,а,(х) + ... + Ьп-Хап-Х(х) + ап(х) = 0, bt = а~ха> ф 0. F.1) Заменив в этом соотношении элемент х на сие, получим b\Q\ip)a\{x) + ... + ft«_ia«_i(a)an_i(*) + оп(*)оп(х) = 0, или on(a)-lblol(a)ai(x) + ... + on(x) = 0. Вычитая последнее равенство из F.1), мы получаем [ftI-a„(a)-,ft,aI(a)]aIW + ... + ^_Ia„_IW=0. F.2) Коэффициент при о\ в этом соотношении не равен нулю, иначе мы бы имели b\ =a„(a)~l&iai(a), поэтому выполнялись бы равенства a«(a)fti =ftiai(a)=ai(a)fti и, поскольку Ь\ф0, мы бы получили a„(a) = ai(a), что противоречит выбору а. Таким образом, F.2) является нетривиальным соотношением между ai, a2, ..., a„_i, вопреки нашему предположению. Следствие. Если Е и Е' — два поля и аь а2, ..., оп — п попарно различных гомоморфизмов, отображающих Е в Е', то аь а2, ..., ап независимы. («Независимость» вновь означает, что не существует нетривиального соотношения а\0\(х) + ... + апоп(х) = 0, которое выполняется для любого х е Е.) 29
Это следует из теоремы 12, поскольку ненулевые элементы поля Е образуют группу и гомоморфизмы а, этой группы в поле Е — попарно различные характеры. Если аь а2, ..., оп — изоморфизмы поля Е в поле Е\ то каждый элемент а поля £, удовлетворяющий свойствам о\(а) = а2(а) = ... = оп(а) называется неподвижной точкой поля Е относительно аь а2, •••» °п- Такое название выбрано по той причине, что в случае, когда элементы о являются автоморфизмами и oi — тождественный автоморфизм, т.е. о\(х) = х, для неподвижной точки имеются соотношения Oi(x) = х. Лемма. Множество неподвижных точек в поле Е является под- полем в Е. Мы будем называть это подполе неподвижным полем. Действительно, это так, поскольку для неподвижных точек а и b верны соотношения а^а + b) = Oi(a) + a,(ft) = аДа) + Oj(b) = Oj(a + b) и Oi(ab) = Oj(a)oi(b) = Oj(a)oj(b) = о,(аЬ). Наконец, из соотношения Gi(a) = Gj(a) получаем, что (о,(а))~1 = (аДа))-1 = Oi(a~l) = аДа-1). . Следовательно, сумма и произведение двух неподвижных точек являются неподвижной точкой, и обратный элемент к неподвижной точке — опять неподвижная точка. Ясно, что обратный элемент к неподвижной точке в смысле сложения также неподвижен. Теорема 13. Если аь а2, ..., оп — п попарно различных изоморфизмов поля Е в поле Е и если F — неподвижное поле в Е, то (E/F) > п. Предположим противное, т. е. допустим, что (E/F) = г <п. Мы покажем, что такое предположение приводит к противоречию. Пусть o>i, од, ..., со, — элементы, порождающие поле Е над F. В однородной системе линейных уравнений а, (<о,)х, + а2(<о,)х2 + • • • + оп(шх)хп = О, а,(<о2)х, + а2(<о2)х2 + ..'. + ал(<о2)х„ = О, а,(<ол)х, + а2(<ол)х2 + ... + ап{^г)хп = О больше неизвестных, чем уравнений, откуда следует существование нетривиального решения. Обозначим это решение через хи х2, ..., хп. Для любого элемента а из поля £ мы можем найти такие элементы аь а2, ..., аг поля F, что а = ахи>\ + ... + аги>г. Умножим первое уравнение системы на ai(ai), второе на о\(а2) и т.д. Используя тот факт, что ateF и, следовательно a\(ai) = a7(a,-), а также аДа^аДса,) = a7(a/<0/), получаем а\{а\(*\)хх + ... + on(aiG>i)xn = 0, a, (arur)xi + ... + an{arur)xn = 0. 30
Складывая эти уравнения и используя равенство аДа,g>i) + Oi(a2G>2) + • • • + о^а^г) = a/(ai<o, + ... + ar^r) = а/(а), получаем, что ai(a)x{ + о2(<х)х2 + ... + оп(а)хп = 0. Это равенство, однако, является нетривиальным соотношением между характерами о\, о2, ..., оп, что невозможно в силу следствия из теоремы 12. Следствие. Если аь а2, ..., оп — автоморфизмы поля Е и £ — неподвижное поле, то (£/£) ^ п. Если F — подполе поля £ и а — автоморфизм поля £, то мы будем говорить, что а оставляет поле F неподвижным, если для каждого элемента а из £ выполнено равенство а(а) = а. Если а и т — два автоморфизма поля £, то отображение а(т(л:)), которое для краткости мы обозначим ат, является автоморфизмом, что читатель может непосредственно проверить. (Например, ат(хг/)=а(т(л:г/))=а(т(л:)т(г/))=а(т(л:))х х а(т(г/)).) Мы будем называть ат произведением автоморфизмов а и т. Если а— автоморфизм (о(х)=у), то обратным к а мы будем называть отображение а, которое отображает у в х, т.е. а (у) = х. Читатель легко может проверить, что а —автоморфизм. Автоморфизм, для которого 1(х) =х, будет называться единичным автоморфизмом. Лемма. Если Е — расширение поля F, то множество G автоморфизмов, которые оставляют F неподвижным, является группой. Ясно, что произведение двух автоморфизмов, оставляющих поле £ неподвижным, обладает тем же свойством. Аналогично обратный к любому автоморфизму из множества G также принадлежит G. Читатель может заметить, что множество автоморфизмов, оставляющих поле £ неподвижным, не обязательно имеет своим неподвижным полем поле £. Может случиться так, что некоторые элементы из поля £, не принадлежащие полю £, остаются неподвижными относительно действия любого автоморфизма, который оставляет неподвижным поле £. Следовательно, неподвижное поле для G может оказаться больше, чем £. 2.7. Приложения и примеры к теореме 13 Теорема 13 является очень мощным средством, что иллюстрируют следующие примеры. 1. Пусть k — поле. Рассмотрим поле E = k(x) всех рациональных функций от переменной х. Если мы отобразим каждую функцию f(x) из £ в функцию /(-), то получим, очевидно, некоторый автоморфизм поля £. 31
Рассмотрим шесть автоморфизмов, при которых f(x) отображается соответственно в f(x) (тождественный автоморфизм), /A-х), /(-), /П J, /(- J и /( г J. Пусть F — неподвижное поле. Поле F состоит из всех рациональных функций, удовлетворяющих равенствам /(,)=/(!-,)=/A)=/A-1)=/(т^)=/(^т)- G-1) Достаточно проверить два первых равенства, поскольку остальные будут следовать из них. Функция l = l(x)={x2~x+lj\ G.2) xz(x - \у как легко видеть, принадлежит полю F. Следовательно, поле S = k(I) всех рациональных функций от / будет содержаться в поле F. Мы утверждаем, что F = S и (E/F) = 6. Действительно, из теоремы 13 мы получаем, что (E/F)^6. Поскольку S С F, достаточно доказать неравенство (E/S) ^ 6. Кроме того, E = S(x). Поэтому достаточно найти какое-нибудь уравнение шестой степени с коэффициентами из S, которому удовлетворяло бы значение х. Следующее уравнение, очевидно, подходит: (х2-х+\K-/х2(х- 1J = 0. Читатель обнаружит, что исследование таких полей является полезным упражнением. В дальнейшем мы сможем описать и все промежуточные поля. 2. Пусть k — поле и Е = k(xx, х2, ..., хп) — поле всех рациональных функций от п переменных *,, х2, ..., хп. Пусть (v,, v2, ..., v„) — какая-нибудь перестановка элементов A, 2, ..., п). Заменим в каждой функции /(*,, х2, ..., хп) из поля Е аргумент хх на jcVi, х2 на xV2, ..., хп на х„п. Отображение поля Е в себя, полученное таким образом, является, очевидно, автоморфизмом, и аналогичным путем мы можем построить п\ автоморфизмов (включая тождественный автоморфизм). Пусть F—соответствующее неподвижное поле, т.е. множество так называемых «симметрических» функций. Теорема 13 показывает, что (E/F) ^ п\. Введем многочлен f{t) = {t - xx){t - х2) ...(t - хп) = Г + axtn-' + ... + а„, G.3) где а, = -(*, +х2 + ... + хп)\ а2 = +(ххх2 + хххъ + ... + хп_\Хп) и т.д., т.е. коэффициент а, равен сумме всех произведений из / различных 32
сомножителей, принадлежащих множеству переменных *,, х2, ..., х„, умноженной на (-1)'. Функции аь а2, ..., ап называются элементарными симметрическими функциями, и поле S = k(ai, а2, ..., ап) всех рациональных функций от переменных аь а2, ..., ап является, очевидно, подполем поля F. Если бы нам удалось доказать неравенство (E/S) < я!, то этим бы были доказаны равенства S = F и (E/F) = п\. С этой целью мы построим следующую цепочку полей: S = SncSn.icSn.2c...cS2cSi=E1 где по определению Sn = S; Si = S(x1+i, X/+2, • • •, хп) = Sj+\(xi+i). G-4) Достаточно будет доказать, что (S/_i/S/) ^ /, или что порождающий элемент Xi поля S,-_i над полем S, удовлетворяет уравнению степени / с коэффициентами из S,-. Такое уравнение легко предъявить. Положим F(t\ = [У1 = А+'М G ъ и Fn(t)=f(t). Выполняя деление, мы видим, что F-Xt) — многочлен от / степени / со старшим коэффициентом единица, а остальные его коэффициенты являются многочленами от переменных аь а2, ..., ап и Х/+1, xi+2j •••» *п- Коэффициенты этих многочленов являются целыми числами. Остается заметить, что *,- — корень многочлена Fi(t). Пусть теперь g(x\, х2, ..., хп) —многочлен от переменных *,, х2, ... ... , хп. Поскольку уравнение Fi(x\) = 0 относительно переменной хх имеет степень, равную единице, хх можно выразить через многочлен от а, и x2j лг3, ..., хп. Подставим это выражение для хх в многочлен g(x\, x2j ..., хп). Поскольку F2(x2) = 0, квадрат переменной х2 или ее высшие степени можно выразить через многочлены от х3, ..., хп и at. Поскольку F3(x3) = 0, то куб переменной х3 или ее высшие степени можно выразить через многочлены от х4, х5, ..., хп и а,. Подставляя эти выражения в g(xi, x2j ..., *„), мы видим, что этот многочлен можно выразить через многочлены от х3, ..., хп и а,, причем степень вхождения переменной xt будет меньше, чем /. Поэтому g(x\, x2, ..., хп) является линейной комбинацией следующих п\ слагаемых: jc>v22...jC, где^<|-1. G.6) Коэффициенты при этих слагаемых являются многочленами от а,-. Поскольку выражения G.6) линейно независимы над S (это наш предыдущий результат), такое представление единственно. 33
Это — обобщение теоремы о симметрических функциях в ее привычной форме. Она утверждает, что произвольный симметрический многочлен можно представить в виде многочлена от аь а2, ..., ап. Действительно, если многочлен g(xXj х2, ..., хп) симметрический, то у нас уже есть выражение для него через линейные комбинации слагаемых вида G.6), где только один член, соответствующий vi = v2 = ... = v„ = 0 и равный единице, имеет ненулевой коэффициент в S, а именно g(x\, x2l ... ... , хп). Поэтому g(xu х2, ..., хп) — многочлен от аь а2, ..., ап. Наша теорема, однако, дает выражение для любого многочлена, не обязательно симметрического. 2.8. Нормальные расширения Расширение Е поля F называется нормальным расширением, если группа G автоморфизмов поля £, которая оставляет неподвижным поле Z7, имеет F своим неподвижным полем и степень (E/F) конечна3). Хотя результат теоремы 13 и нельзя усилить в целом, есть случай, в котором неравенство становится равенством, а именно, когда множество автоморфизмов аь а2, ..., оп образует группу. Мы докажем такую теорему. Теорема 14. Если аь а2, ..., а„ — группа автоморфизмов поля Е и F — неподвижное поле для аь а2, ..., оп, то (E/F) = п. Если множество аь а2, ..., ап образует группу, то оно содержит тождественный автоморфизм, скажем ох. Неподвижное поле состоит из тех элементов х, которые переходят в себя под действием любого автоморфизма а,, т.е. Oj(x) = х, i = 1, 2, ..., п. Предположим, что (E/F) > п. Тогда существует п + 1 элемент аь а2, ..., ал+! поля £, которые линейно независимы над F. По теореме 1 в Е существует нетривиальное решение системы уравнений *i<Ji(ai) + x2a,(a2) + ... + хп+хО\(*п+\) = О, *i<*2(ai) + х2о2(а2) + ... + *я+102(ая+1) = 0, (R n Xi<*n(*i) + x2an(a2) + ... + xn+ian(an+i) = 0. Заметим, что, поскольку о\ —тождественный автоморфизм, решение не может принадлежать полю Z7, иначе из первого уравнения мы получили бы линейную зависимость между аь ..., ал+!. 3)Современное определение нормальных расширений значительно более слабое — оно не требует ни конечности, ни сепарабельности. То, что здесь называется нормальным расширением, в современной терминологии называется конечным расширением Галуа. — Прим. ред. 34
Выберем среди всех нетривиальных решений (*,, х2, ..., хп+1) то, для которого наименьшее количество значений xt отлично от нуля. Можно предположить, что это решение имеет вид (аь а2, ..., аЛ, 0, ..., 0), где первые г членов отличны от нуля. Более того, гф\, потому что из равенства aiai(ai) = 0 следовало бы, что ах = 0, поскольку ai(ai) = си Ф 0. Мы можем предположить также, что аг = 1, так как если умножить данное решение на а~\ то получится новое решение, в котором г-й член равен 1. Итак, мы имеем aia;(ai) + a2a/(a2) + ... + а^аДа,.,) + аДа,) = 0 (8.2) для / = 1, 2, ..., п. Поскольку все коэффициенты аь ..., аг_х не могут принадлежать полю /% один из них, скажем ах лежит в £, но не в F. Найдется автоморфизм а*, для которого ок(а\)фах. Если вспомнить, что автоморфизмы аь а2, ..., ап образуют группу, то мы увидим, что (a*ai, Gko2, ..., okon) — перестановка элементов (аь а2, ..., а„). Применяя ok к выражениям (8.2), получаем аЛ(а,)аЛа/(а1) + ... + аЛ(а,_1 )аЛау(a,_i) + аЛау(аЛ) = 0 для / = 1, 2, ..., п. Полагая okOi = a7, получаем a*(a,)a/(a,) + • • • + ak(ar-i)ai(oLr-i) + af(ar) = 0. (8.3) Если мы вычтем (8.3) из (8.2), то получим [а, - ok(ai)]oi(oLi) + ... + [аЛ_, - a*(a,_i)]a/(a,_i) = 0, что дает нетривиальное решение системы (8.1), в котором количество координат, отличных от нуля, меньше чем г, а это противоречит выбору г. Следствие 1. Если F — неподвижное поле для конечной группы G, то любой автоморфизм а, который оставляет F неподвижным, должен принадлежать группе G. Степень (E/F) равна порядку группы G, который равен п. Предположим, что найдется автоморфизм а, не принадлежащий группе G. Тогда поле F должно сохраняться всеми п + 1 элементами, состоящими из а и элементов группы G, что противоречит следствию из теоремы 13. Следствие 2. Не существует различных конечных групп G\ и G2 с одним и тем же неподвижным полем. Это немедленно вытекает из следствия 1. Многочлен f(x) над полем F называется сепарабельным, если у его неприводимых сомножителей нет кратных корней. Пусть Е — какое- нибудь расширение поля F. Тогда элемент поля Е называется сепарабельным, если он является корнем сепарабельного многочлена f(x) над 35
полем F. Расширение Е называется сепарабельным расширением, если каждый элемент в этом поле сепарабелен. Теорема 15. Поле Е — нормальное расширение поля F, если и только если Е является полем разложения сепарабельного многочлена р(х) над полем F. Достаточность. Докажем, что Е — нормальное расширение поля £, в предположении, что Е является полем разложения для р(х). Если все корни многочлена р(х) лежат в £, то наше утверждение тривиально, поскольку тогда Е = F и лишь тождественный автоморфизм оставляет поле F неподвижным. Предположим, что р(х) имеет п > 1 корней в поле £, но не в F. Сделаем индуктивное предположение, что для всех пар полей, для которых многочлен р(х) имеет менее чем п корней вне £, наше утверждение верно. Пусть р(х) =р\(х)р2(х) ...рг(х) — разложение многочлена р(х) на неприводимые многочлены. Можно предполагать, что степень одного из этих многочленов больше единицы, ибо иначе р(х) разлагался бы в F. Пусть степень многочлена рх(х) равна s> 1. Пусть cxi —корень многочлена Р\(х). Тогда (F(ql\)/F) = degpi(x) = s. Если мы рассмотрим поле £(oti) как новое основное поле, то число корней многочлена р(х), не принадлежащих этому полю, будет меньше чем п. Из того, что многочлен р(х) имеет коэффициенты в поле £(cxi) и Е — поле разложения многочлена р(х) над полем £(cxi), по нашему индуктивному предположению следует, что Е—нормальное расширение поля £(cxi). Таким образом, каждый элемент поля £, который не лежит в £(ai), не переходит в себя под действием как минимум одного автоморфизма, оставляющего поле £(cxi) неподвижным. В силу сепарабельности многочлена р(х) корни аь а2, ..., а5 многочлена Р\(х) являются различными элементами поля Е. По теореме 8 существуют изоморфизмы аь а2, ..., а*, отображающие поле £(cxi) на поля £(cxi), £(сх2), •-., F(ols) соответственно. Каждый из этих автоморфизмов является тождественным на поле F и отображает cxi в on, а2,..., а5 соответственно. Применим теперь теорему 10. Поле Е является полем разложения многочлена р(х) над полем £(cxi), а также полем разложения многочлена р(х) над полем £(<Х/). Поэтому изоморфизм а,, который переводит многочлен р(х) над полем £(cxi) в тот же многочлен над полем £(а,), можно продолжить до изоморфизма, отображающего поле £ на себя, т.е. до автоморфизма поля £. Обозначим этот автоморфизм также через а,-. Следовательно, аь а2, ..., as — автоморфизмы поля £, оставляющие поле F неподвижным и отображающие оп на аь а2, ..., а„. Пусть теперь 9 — какой-нибудь элемент, который остается неподвижным относительно всех автоморфизмов поля £, оставляющих 36
неподвижным поле F. Мы уже знаем, что такой элемент принадлежит полю F(ql\) и, следовательно, имеет вид 9 = с0 + с,а, + с2а\ + ... + Cs-iot*, где коэффициенты с{ принадлежат полю F. Если применить а, к этому равенству и учесть, что а,(9) = 9, то мы получим 9 = с0 + схщ + с2а? + • • • + Cs-ia-. Многочлен cs_\Xs~x + cs_2xs~2 + • • • + cs_xx + (с0 — 9), тем самым, имеет 5 различных корней аь а2, ..., as. Число этих корней больше степени многочлена. Следовательно, все коэффициенты этого многочлена должны равняться нулю, в том числе и с0 — 9. Это доказывает, что 9 принадлежит полю F. Необходимость. Если Е — нормальное расширение поля Z7, то Е — поле разложения некоторого сепарабельного многочлена р(х). Докажем сперва одну лемму. Лемма. Если Е — нормальное расширение поля F, то Е се- парабельно. Более того, любой элемент из Е является корнем некоторого многочлена над полем F, который разлагается на линейные множители над Е. Пусть аь a2, ..., os — группа G автоморфизмов поля £, неподвижное поле которой есть F. Пусть a — некоторый элемент поля Е и а, а2, аз, ..., а, — множество различных элементов в последовательности ai(a), a2(a), ..., as(a). Поскольку G — группа, мы имеем о, (a,-) = ay (a* (a)) = ауал(а) = am(a) = a„. Тем самым, элементы a, a2, ..., ar переставляются элементами группы G. Коэффициенты многочлена f(x) = (х - a) (x - a2)... (х - аг) остаются неподвижными под действием каждого автоморфизма из G, потому что такой автоморфизм переставляет сомножители в этом разложении. Поскольку элементы поля £, которые остаются неподвижными под действием всех автоморфизмов группы G, принадлежат полю F, мы заключаем, что f(x) — многочлен над полем F. Если g(x) — многочлен над Z7, для которого а также является корнем, то, применяя автоморфизмы из G к выражению g(a) = О, мы получим, что g(a,) = 0. Поэтому степень многочлена g(x) не меньше 5. Отсюда следует, что многочлен f(x) неприводим и лемма доказана. Для завершения доказательства теоремы обозначим через a>i, <о2, ... ... , (О/ систему образующих векторного пространства Е над F. Пусть //(*) — построенный в лемме сепарабельный многочлен, корнем которого 37
является (о,. Тогда Е— поле разложения многочлена р(х) =f\(x) x xf2(x)...ft(x). Если f(x) — многочлен над полем F и Е — поле разложения многочлена f(x), то группу автоморфизмов поля Е над полем F мы будем называть группой уравнения f(x) = 0. Мы приходим теперь к теореме, известной в алгебре под названием основной теоремы теории Галуа, которая связывает структуру поля разложения со структурой его группы автоморфизмов. Теорема 16 (Основная теорема). Если р(х) — сепарабельный многочлен над полем F, G — группа уравнения р(х) = 0, а Е — поле разложения многочлена р{х), то справедливы следующие утверждения. 1) Любое промежуточное поле В является неподвижным полем для некоторой подгруппы GB группы G, причем неподвижные поля разных подгрупп также различны. Мы говорим, что В и GB «принадлежат» друг другу. 2) Промежуточное поле В является нормальным расширением поля F, если и только если подгруппа GB — нормальная подгруппа в G. В этом случае группа автоморфизмов поля В, оставляющая поле F неподвижным, изоморфна факторгруппе (G/GB). 3) Для каждого промежуточного поля В степень (B/F) равна индексу подгруппы GB, а степень (Е/В) равна порядку подгруппы GB. Первая часть теоремы следует из того наблюдения, что Е — поле разложения для /?(*), причем р(х) можно рассматривать как многочлен над произвольным промежуточным полем. Следовательно, поле Е—нормальное расширение любого промежуточного поля В, и поле В — неподвижное поле для подгруппы группы G, состоящей из автоморфизмов, которые оставляют поле В неподвижным. Тот факт, что неподвижные поля разных подгрупп различны, вытекает из следствия 2 теоремы 14. Пусть В — произвольное промежуточное поле. Поскольку В — неподвижное поле для подгруппы GB группы G, по теореме 14 степень (Е/В) равна порядку подгруппы GB. Обозначим4) через o(G) порядок группы G и через /(G) — ее индекс. Тогда o(G) = o(GB)i(GB). С другой стороны, (E/F) = o(G) и (E/F) = (£/В)(В//г), из чего следует равенство (B/F) = /(Gfl), что и доказывает третью часть теоремы. Число i(GB) равно числу левых смежных классов группы GB. Элементы группы G, будучи автоморфизмами поля £, являются изоморфизмами поля В, т.е. они отображают В изоморфно на некоторое другое подполе поля Е и являются тождественными на F. Элементы группы G, 4)Обозначения вводятся не для группы G, а для ее произвольной подгруппы, причем индекс рассматривается по отношению к группе G. — Прим. ред. 38
лежащие в одном и том же смежном классе по модулю Gfl, дают один и тот же изоморфизм поля В. Действительно, пусть оо\ и оо2—два элемента из смежного класса aGB. Поскольку о\ и а2 оставляют поле В неподвижным, для каждого а из поля В выполняются равенства оо\(а) = а(а) = аа2(а). Элементы из разных смежных классов дают разные изоморфизмы, так как если а и т дают один и тот же изоморфизм, т.е. а(а) = т(а) для каждого а из В, то а"'т(а) = а для каждого а в поле В. Следовательно, а~'т = а|, где о\ некоторый элемент из и в- Но z = oo\ и zGB = og\Gb = oGBj так что а и т лежат в одном и том же смежном классе. Каждый изоморфизм поля В, тождественный на Z7, задается некоторым автоморфизмом, принадлежащим группе G. Действительно, пусть а — изоморфизм, отображающий В на В' и тождественный на F. Тогда под действием а многочлен р(х) переходит в себя и Е является полем разложения многочлена р(х) над В и над его образом В'. По теореме 10 изоморфизм а можно продолжить до автоморфизма а' поля £, и, поскольку а' оставляет поле F неподвижным, он принадлежит группе G. Тем самым, число различных изоморфизмов поля В равно числу смежных классов подгруппы GB и, следовательно, равно (B/F). Полю оВ, на которое изоморфизм а отображает поле В, очевидно, соответствует подгруппа oGBo~\ поскольку элементы поля аВ инвариантны в точности относительно этой подгруппы. Если В — нормальное расширение поля Z7, то число различных автоморфизмов поля В, оставляющих F неподвижным, равно (B/F) по теореме 14. Обратно, если число автоморфизмов равно (В//7), то В — нормальное расширение. Действительно, если F' — неподвижное поле для всех таких автоморфизмов, то F с F' с В, и по теореме 14 степень (B/F) равна числу автоморфизмов в этой группе, откуда следует, что (B/F) = = (B/F). Из равенства (B/F) = (B/F')(F'/F) получаем, что (F'/F) = 1, или, что равносильно, F = F. Итак, В — нормальное расширение поля F, если и только если число автоморфизмов поля В равно (B/F). Суммируя вышесказанное, заключаем, что поле В является нормальным расширением поля Z7, если и только если любой изоморфизм поля В в поле Е является автоморфизмом поля В. Это следует из того, что каждое из предыдущих условий эквивалентно утверждению о том, что число изоморфизмов и автоморфизмов одинаково. Поскольку для любого а равенство В = оВ эквивалентно включению aGBo~x С Gfl, мы можем наконец заключить, что В является нормальным расширением поля F тогда и только тогда, когда GB — нормальная подгруппа группы G. Как мы показали, каждый изоморфизм поля В описывается действием элементов некоторого левого смежного класса подгруппы Gfl. Если 39
В — нормальное расширение, то все эти изоморфизмы являются автоморфизмами, а смежные классы являются элементами факторгруппы (G/GB). Таким образом, каждый автоморфизм поля В взаимно однозначно соответствует некоторому элементу группы (G/GB). Поскольку умножение в группе (G/GB) получается как композиция отображений, построенное соответствие — это изоморфизм между (G/GB) и группой автоморфизмов поля В, которые оставляют поле F неподвижным. Это завершает доказательство теоремы 16. 2.9. Конечные поля Часто возникает вопрос о структуре конечного подмножества поля, относительно операции умножения в этом поле образующего группу. Ответ на этот вопрос особенно прост. Теорема 17. Если S — конечное подмножество поля F (S ф {0}), которое является группой относительно умножения в F, то S — циклическая группа. Доказательство основано на следующих леммах об абелевых группах. Лемма 1. Если А и В — два элемента произвольной абелевой группы порядка а и b соответственно, и с — наименьшее общее кратное чисел а и Ь, то в этой абелевой группе существует элемент С, порядок которого равен с. Доказательство. 1) Если а и Ь взаимно просты, то элемент С = АВ имеет нужный порядок. Порядок элемента Са = Ва равен Ь, следовательно, с делится на Ь. Аналогичным образом, с делится на а. Поскольку СаЬ = 1, мы заключаем, что с = ab. 2) Если d — какой-нибудь делитель числа а, то в нашей группе найдется элемент порядка d. Действительно, Aa/d является таким элементом. 3) Рассмотрим теперь общий случай. Пусть рь р2, ..., рг — простые числа, делящие либо а, либо Ь, и пусть а = pf'p? •••#'. Ь = рГр?...р7. Обозначим через /, наибольшее из двух чисел щ и mt. Тогда с = р'>р'*...р<;. Согласно 2) в нашей группе можно найти элементы порядка /?"' и порядка р?'. Следовательно, найдется элемент, порядок которого равен /?,-'. Пункт 1) показывает, что произведение таких элементов будет иметь нужный порядок, равный с. □ 40
Лемма 2. Если в абелевой группе есть элемент С, порядок с которого максимален (что всегда имеет место в случае конечных групп), то с делится на порядок а любого элемента А в этой группе\ следовательно, каждый элемент группы является решением уравнения Xе = 1. Доказательство. Если бы число а не делило с, то наименьшее общее кратное чисел а и с было бы больше с, а значит, нашелся бы элемент такого порядка. Но это противоречит выбору с. □ Докажем теперь теорему 17. Пусть п — порядок группы S, и г — наибольший порядок элемента, встречающийся в S. Тогда все элементы группы S удовлетворяют уравнению хг — 1 = 0. Поскольку число корней многочлена степени г в нашем поле не может быть больше чем г, отсюда следует, что г ^ п. С другой стороны, г ^ п потому, что порядок любого элемента делит п. Тем самым, S — циклическая группа, состоящая из элементов 1, е, е2, ..., г", где zn = 1. Теорему 17 можно было бы также доказать опираясь на структурную теорему о разложении для конечнопорожденных абелевых групп. Поскольку эта теорема понадобится нам позднее, мы вкратце наметим ее доказательство. Пусть G — абелева группа с групповой операцией, записываемой аддитивно. Мы будем говорить, что элементы gu ..., gk порождают группу G, если каждый элемент g из G можно записать в виде суммы кратных элементов g\, ..., gkj т. е. g = nigi + ... + nkgk. Если никакое множество, состоящее менее чем из k элементов, не порождает G, то множество элементов gi,...,g* называется минимальной системой образующих. Любая группа, имеющая конечную систему образующих, допускает минимальную систему. В частности, конечная группа всегда допускает минимальную систему образующих. Из тождества nx(g\ + mg2) + (n2 - nxm)g2 = n\g\ + n2g2 следует, что если элементы gu g2l ..., gk порождают группу G, то набор g\ + mg2j g2, • • •, gk также порождает группу G. Уравнение mxg\ + m2g2 +... + mkgk = 0 будем называть соотношением между образующими, a mx,...,mk — коэффициентами соотношения. Мы будем говорить, что абелева группа G является прямым произведением своих подгрупп Gi, G2, ..., G*, если любой элемент geG однозначно представляется в виде суммы g = хх + х2 + ... + xkl где х{ е G/, /=1,2 Л. Теорема о разложении. Каждая абелева группа с конечным числом образующих является прямым произведением циклических подгрупп Gi, ..., Gk, где порядок группы G, делит порядок группы G,+i, / = 1, ..., k — 1, и где k — число элементов в минимальной 41
системе образующих. (Группы Сл, Сл+Ь •••, Gk могут быть бесконечными. В этом случае утверждается, что o(Gi) делит o(G,+i) для /=1, ..., г-2.) Предположим, что теорема верна для всех групп с минимальной системой образующих, состоящей из k — 1 элементов. Если k= 1, то такая группа циклическая и теорема становится тривиальной. Предположим теперь, что G — абелева группа, имеющая минимальную систему образующих из k элементов. Если минимальная система образующих не удовлетворяет никакому нетривиальному соотношению, то обозначим через gXy g2y ..., gk минимальную систему образующих и через Gi, G2, ..., Gk — циклические группы, порожденные этими образующими. Для каждого geG можно записать g = nxgx + ... + nkgk> причем такое представление однозначно; иначе бы мы получили нетривиальное соотношение между образующими. Следовательно в этом случае теорема верна. Предположим теперь, что для минимальной системы образующих есть нетривиальные соотношения. Среди всех этих соотношений выберем такое соотношение mxgx +... + m*g* = 0, (9.1) в котором встречается наименьший положительный коэффициент. После подходящего переупорядочивания образующих можно предполагать, что этот коэффициент равен тх. В любом другом соотношении между элементами g,, ..., gk вида nxgi+... + nkgk = 0 (9.2) будет выполняться свойство делимости тх\пх. Действительно, в противном случае мы имеем пх = qmx + г, 0 < г < тх, и если из соотношения (9.2) вычесть соотношение (9.1), умноженное на qy то мы придем к другому соотношению, в котором встретится коэффициент г, меньший чем тх. В соотношении (9.1) выполняется также свойство mx\mh i = 2, ..., k. Действительно, предположим, что тх не делит какой- нибудь коэффициент, скажем т2. Тогда т2 = qmx + г, 0 < г < тх. Между образующими gx + g2j g2j ..., gk будет выполняться соотношение m\(gi + Qg2> + rg2 + m3g3 +... + mkgk = Oy где значение коэффициента г противоречит выбору тх. Отсюда следует, что т2 = q2mx, m3 = *7з^ь • • • . •., rnk = qkmx. Система образующих gx = gx + q2g2 + ... + qkgk, g2l ... ... , gk минимальна, и mxgx =0. Заметим, что поскольку тх —один из коэффициентов в некотором соотношении между gx, g2y ..., gk> из нашего предыдущего рассуждения мы получаем, что для любого соотношения 0 = nxgx + n2g2 + ...nkgk число тх делит пХу а значит, nxgx =0. Пусть G' — подгруппа группы G, порожденная элементами g2l ..., gk, и G| —циклическая подгруппа порядка тх, порожденная элементом gx. 42
Тогда G — прямое произведение групп Gx и G'. Действительно, каждый элемент g из G может быть записан в виде g = nxgx + n2g2 + ... + nkgk = nxgx + g'. Такое представление единственно, поскольку из равенства nxgx + g' = = n\gi+ g" следует, что (пх - n\)gx + (g/ - g") = 0. Отсюда получаем (пх - n\)gx = 0, так что nxgx = n\gx и также g' = g". По нашему индуктивному предположению группа С является прямым произведением k — 1 циклической подгруппы, порожденных элементами g2y g3, ..., gk> порядки которых t2y ... tk удовлетворяют свойствам делимости /|-|/|+ь / = 2, ..., k — 1. Применив приведенные выше рассуждения к образующим gXy g2y g3y ..., gk> мы получим, что mx\t2, откуда и следует утверждение теоремы. Говоря о конечном поле, мы будем иметь в виду поле, состоящее из конечного числа элементов. Следствие. Ненулевые элементы конечного поля образуют циклическую группу. Если а — какой-нибудь элемент поля Z7, то обозначим /г-крат- ное элемента а, т. е. элемент поля /\ который получается сложением элемента а с собой п раз, через па. Очевидно, что п(та) = (пт)а и (na)(mb) = (nm)(ab). Если для какого-нибудь элемента а^О найдется такое целое я, что па = 0, то nb = 0 для каждого b в поле /% поскольку nb = (na)(a~lb) =0a~lb = 0. Если найдется такое положительное целое число р, что ра = 0 для каждого а из /% причем р — наименьшее целое число с таким свойством, то говорят, что поле F имеет характеристику р. Если такого положительного целого числа не существует, то мы будем говорить, что поле F имеет характеристику ноль. Характеристика поля всегда является простым числом, ибо если допустить, что р = rsy то мы получим, что pa = rsa = r(sa). Однако, sa = b ф 0, если а^О и rb^O, поскольку числа г и s меньше /?, следовательно ра ф 0, что противоречит определению характеристики. Если па = 0 для а ф 0, то р делит я, поскольку n = qp + г, где 0 ^ г < р и па = (qp + r)a = qpa + га. Следовательно, если па = 0, то га = 0 и, учитывая, что г < ру мы получаем равенство г = 0 в соответствии с определением характеристики. Если F—конечное поле, состоящее из q элементов, и Е—какое- нибудь расширение поля F степени (E/F) — пу то поле Е состоит из qn элементов. Действительно, если g>i, о>2, ..., и>п — базис поля Е над F, то каждый элемент поля Е можно единственным образом представить в виде линейной комбинации jcicoi + х2ы2 + ... -I- хпсоПу где xt принадлежит полю F. Поскольку каждый элемент xt может принимать q зна- 43
чений в поле /\ существует qn различных способов выбрать элементы Х\, х2, . •., хп и, следовательно, qn различных элементов поля Е. Поле Е конечно, поэтому существует такой элемент а поля Е, что Е = F(a). (Ненулевые элементы поля Е образуют циклическую группу, порожденную элементом а.) Если мы обозначим через Р = {0, 1, ..., р — 1} множество кратных единичного элемента в поле F характеристики р, то Р — подполе поля /\ состоящее из р различных элементов. На самом деле, Р изоморфно полю целых чисел по модулю р. Если F — конечное поле, то степень поля F над Р конечна, скажем, (F/P) = п, и поле F содержит рп элементов. Другими словами, порядок любого конечного поля является степенью его характеристики. Если F и F' —два конечных поля, имеющих один и тот же порядок q, то, как следует из предыдущего рассуждения, у них одна и та же характеристика, поскольку q является ее степенью. Кратные единицы в F и F' образуют два поля Р и Р\ изоморфные между собой. Ненулевые элементы полей F и F' образуют группу порядка q — 1 и, тем самым, удовлетворяют уравнению xq~x = 1. Поля F и F' являются полями разложения уравнения xq~x = 1, рассматриваемого как уравнение над Р и над Р' соответственно. По теореме 10 изоморфизм между Р и F можно продолжить до изоморфизма между F и F. Итак, доказана следующая теорема. Теорема 18. Два конечных поля, состоящие из одного и того же числа элементов, изоморфны. Производная. Если f(x) = а0 + ахх + ... + апхп — многочлен надполем /% то определим f = ах +. 2а2х + ... -I- папхп~х. Читатель легко может проверить, что для каждой пары многочленов / и g выполняются равенства (f + g)' = r + g. №' = № + &, (П' = пГ1Г. Теорема 19. Многочлен f имеет кратные корни, если и только если в его поле разложения многочлены f и f имеют общий корень. Это условие эквивалентно утверждению о том, что f и f имеют общий делитель положительной степени в поле F. Если а — корень многочлена f(x) кратности /г, то /= (х - v)kQ(x), где Q(ol) ф 0. Это приводит к равенству f' = (x- а)*<?'(*) + k(x - 0L)k~xQ(x) = (x- <x)*-'[(jt - *)<?(х) + kQ{x)\ Если k > 1, то а—корень многочлена /', кратность которого не меньше чем ft - 1. Если k = 1, то f(x) = Q(x) + (х - а)ф(х) и /'(а) = (?(а) ф 0. Тем самым, / и /' имеют общий корень а, если и только если а — корень многочлена /, кратность которого больше чем 1. 44
Если / и /' имеют общий корень а, то неприводимый многочлен над полем F, имеющий а своим корнем, делит как /, так и /'. Обратно, любой корень общего делителя многочленов / и /' является корнем этих многочленов. Следствие. Если F — поле характеристики О, то любой неприводимый многочлен над F сепарабелен. Предположим противное, т. е. допустим, что у неприводимого многочлена f(x) найдется корень а, кратность которого больше 1. Тогда f'(x) — многочлен, не равный тождественно нулю (его старший коэффициент является кратным старшего коэффициента многочлена f(x) и поэтому не равен нулю, поскольку F — поле нулевой характеристики) и имеющий степень на единицу меньше, чем многочлен f(x). Но а также является корнем многочлена f'(x), что противоречит неприводимости многочлена f(x). 2.10. Корни из единицы Если F — поле характеристики р и Е — поле разложения многочлена хп — 1, где р не делит я, то мы будем говорить, что поле Е получается присоединением примитивного корня степени п из единицы к полю F. Многочлен хп — 1 не имеет кратных корней в поле £, поскольку его производная пхп~х имеет своим единственным корнем 0 и, тем самым, не имеет общих корней с хп — \. Итак, Е — нормальное расширение поля F. Если еь е2> • • • у Ел — корни многочлена хп — 1 в £, то они образуют группу по умножению, и по теореме 17 эта группа будет циклической. Если 1, е, г2, ..., г"-1 —элементы этой группы, то будем называть е примитивным корнем степени п из единицы. Наименьшая степень, при возведении е в которую получается единица, равна п. Теорема 20. Если Е — поле, порожденное над F примитивным корнем степени п из единицы, то группа G поля Е над F является абелевой для любого п и циклической, если п — простое число. Заметим, что Е = F(s)y поскольку корни все многочлена хп — 1 являются степенями элемента е. Далее, если с и т — различные элементы группы G, то а(е) ф т(е). Но а(е) — корень многочлена хп — 1 и, следовательно, является степенью элемента е. Поэтому а(е) = еЛ°, где па — целое число, 1 < па ^ п. Более того, та(е) = т(еЛ°) = (т(е))Л° = гПх"а = ат(е). Итак, п^ = папх mod п. Следовательно, отображение, переводящее с в пау является гомоморфизмом группы G в мультипликативную подгруппу целых чисел по модулю п. Поскольку из неравенства т ф с следует, что т(г)фс(г)у мы получаем, что пафпх mod n при тфс. Поэтому 45
данный гомоморфизм является изоморфизмом. Если п — простое число, то мультипликативная группа вычетов по модулю п является циклической группой. 2.11. Уравнения Нётер Пусть Е—поле иС = (о,т,...) — группа автоморфизмов поля Е. Мы будем говорить, что множество элементов (хау хХУ ...) в поле Е является решением уравнений Нётер5\ если для каждых с и т в группе G верно равенство хао(хх) = х^. Действительно, если хотя бы один элемент ха равен нулю, то хх = 0 для любого т Е G. Если символ т пробегает всю группу G, то произведение ат принимает все значения в G, и в нашем уравнении х^ = 0, когда ха = 0. Итак, в любом решении уравнений Нётер ни один из элементов ха не равен нулю, за исключением случая, когда решение полностью тривиально. В дальнейшем мы будем предполагать, что случай тривиального решения исключен. Теорема 21. Система ха, хх, ... является решением уравнений Нётер, если и только если существует такой элемент а в Е, что ха = а/а(а) для каждого а. Ясно, что для каждого элемента а множество элементов ха = а/а(а) является решением уравнений Нётер, поскольку <х/а(<х) • а(а/т(а)) = = а/а(а) • а(а)/ат(а) = а/ат(а). Обратно, пусть хау хх, ... —нетривиальное решение. Поскольку автоморфизмы а, т, ... различны, они линейно независимы и уравнение xao(z) + xxt(z) + ... = 0 относительно z не является тождеством. Поэтому существует такой элемент а в £, что хао(а) + хх\(а) + ... = а ф 0. Применение а к а приводит к соотношению о(*) = ^2о(хх)от(а). Умножая на хау получаем хаа(<х) = ]Г xao(xx)<rz(a). x€G 5)Термин «уравнения Нётер» в настоящее время вышел из употребления в связи с развитием теории когомологий. Современная терминология такова: множество ненулевых элементов (ха, хх, .. •) поля £, удовлетворяющих условиям хао(хх) = Хох, называется 1-коциклом группы G в мультипликативной группе Е* поля Е. При этом множество элементов ха = а/а(а) называется 1-кограницей. Ясно, что все 1-коциклы образуют абелеву группу, а 1-кограницы являются в ней подгруппой. Факторгруппа 1-коциклов по 1-кограницам называется группой первых когомологий Галуа мультипликативной группы поля. В современной формулировке теорема 21 гласит, что первые когомологий мультипликативной группы поля равны нулю. Эта теорема была сформулирована в обзоре Д. Гильберта «Die Theorie der algebraischen Zahlkorper» и сейчас известна как теорема Гильберта-90. — Прим. ред. 46
Заменяя хао(хх) на х^ и замечая, что от принимает все значения в G, когда т пробегает всю группу G, получаем хво(а) = ]Г^ххт(а) = а, откуда ха = а/о(а). Всякое решение уравнений Нётер задает отображение С из группы G в £, а именно С(а) = jcct. Если F — неподвижное поле группы G и элементы ха лежат в поле /\ то С — характер группы G. Действительно, С(ат) = jc^ = хас(хх) = хахх = С(а)С(т), поскольку о(хх) = = хХУ если хх е F. Обратно, каждый характер С группы G в F задает решение уравнений Нётер. Действительно, обозначим С(о) = ха. Тогда, поскольку xxeFy мы имеем о(хх)=хх. Итак, хао(хх) = хахх = = С(а)С(т) = С(ат) =хах. Объединяя этот факт с теоремой 21, мы приходим к следующей теореме. Теорема 22. Если G — группа нормального расширения Е поля F, то для каждого характера С группы G в поле F существует такой элемент а в Е, что С(о) = <х/а(<х), и, обратно, если а/а(а) лежит в поле F для каждого а, то С(с) = а/а(а) —характер группы G. Если г—наименьшее общее кратное порядков всех элементов группы G, то аЛ е F. Мы уже доказали все утверждения этой теоремы, кроме последнего. Для его доказательства необходимо лишь проверить, что а(<хЛ) = <хЛ для каждого а е G. Но аг/о{аг) = (<х/а(<х))Л = (С(о))Г = С(аг) = СA) = 1. 2.12. Куммеровы расширения Пусть F содержит примитивный корень степени п из единицы. Любое поле разложения Е многочлена (хп — ах)(хп — а2)... (хп — аг), где щ Е F при / = 1, 2, ... г, будет называться куммеровым расширением поля /\ или, более кратко, куммеровым полем. Если поле F содержит примитивный корень степени п из единицы, то число п не делится на характеристику поля F. Предположим обратное, т. е. допустим, что характеристика поля равна р и n = qp. Тогда ур - 1 = (у - \у, поскольку в разложении выражения (у - \)р все коэффициенты, за исключением первого и последнего, делятся на р и, тем самым, являются кратными элемента р • 1, где 1 —единица поля F. Следовательно, в поле F они равны нулю. Итак, хп — 1 = (xq)p — 1 = (xq — 1)р, следовательно, многочлен хп — 1 имеет не более чем q различных корней. Но по предположению поле F содержит примитивный корень степени п 47
из единицы, а в этом случае элементы 1, е, г2, ..., г" представляют собой п различных решений уравнения хп — 1. Отсюда следует, что п не делится на характеристику поля F. В куммеровом поле Е ни один из множителей хп — ah at ф О, не имеет кратных корней, поскольку производная пхп~х такого многочлена имеет своим единственным корнем 0 и, тем самым, не имеет общих корней с многочленом хп — aiy at ф 0. Итак, неприводимые множители многочленов хп - щ сепарабельны, а значит, Е — нормальное расширение поля F. Пусть а,-— корень многочлена хп — а, в Е. Если еь е2> • • • > %п — п различных корней степени п из единицы в поле /\ то ос/Еь а/£2, ..., а/ея — п различных корней многочлена хп — а,, а следовательно, это все корни данного многочлена. Итак, Е — F(a\y <х2, • • • > схг). Пусть а и т — два автоморфизма из группы G поля Е над F. Оба этих автоморфизма отображают каждый из а,- в некоторый другой корень многочлена хп - ah Таким образом, т(а,-) = е^а,- и а(а,) = е,-аа,-, где е/а и е/х — корни степени п из 1 в основном поле F. Отсюда следует, что т(а(а,)) =т(е/ста/) =е/стт(а/) = = eiaeix0Li = а(т(а/)). Поскольку а и т коммутируют на образующих поля £, они коммутируют и на всех элементах этого поля. Следовательно, группа G коммутативна. Если с е G, то а(а/) = г/ста/, а2(а/) = г2ста/ и т.д. Таким образом, а"'(а,) = а, для такого значения nh при котором е£ = 1. Поскольку порядок любого корня степени п из единицы является делителем числа я, щ делит п, и наименьшее общее кратное т чисел П\, п2> ..., пг является делителем числа п. Поскольку om(oLi) = oLi для /= 1, 2, ..., г, отсюда следует, что порядок автоморфизма с равен т. Следовательно, порядок любого элемента группы G является делителем числа /z, и, тем самым, наименьшее общее кратное г порядков элементов группы G также является делителем числа п. Если е — примитивный корень степени п из единицы, то гп/г — примитивный корень из единицы степени г. Эти замечания можно сформулировать воедино в виде следующей теоремы. Теорема 23. Если Е — куммерово поле, т е. поле разложения многочлена р(х) = (хп - а\)(хп - а2)... (хп - at), где at лежат в F, и F содержит примитивный корень степени п из единицы, то (а) Е — нормальное расширение поля F; (Ь) группа G поля Е над F абеле- ва\ (с) наименьшее общее кратное порядков элементов группы G является делителем числа п. Следствие. Если Е — поле разложения многочлена хр — а и F содержит примитивный корень степени р из единицы, где р — простое число, то либо Е = F и многочлен хр - а разлагается над F на линейные множители, либо многочлен хр — а неприводим и группа поля Е над F — циклическая группа порядка р. 48
По теореме 23 порядок каждого элемента группы G, является делителем числа р и, тем самым, равен ру если только элемент не является единицей. Если а — корень многочлена хр — ау то а, га, ..., гр~'а — все корни многочлена хр — ау так что F(a) = Е и (E/F) ^ р. Тем самым, порядок группы G не превосходит р. Поэтому если G содержит хотя бы один элемент, отличный от единицы, то степени такого элемента должны исчерпывать всю группу G. Поскольку в G есть р различных элементов и их поведение определяется их действием на а, у элемента а должно быть р различных образов. Поэтому неприводимый многочлен элемента а над полем F должен иметь степень ру а значит, он равен хр — а. Свойства (а), (Ь) и (с) теоремы 23 на самом деле характеризуют кум- меровы поля. Предположим, что Е — нормальное расширение поля F с абелевой группой G. Предположим, далее, что F содержит примитивный корень из единицы степени rs, где г — наименьшее общее кратное порядков элементов группы G. Группа характеров X группы G со значениями в группе корней степени г из единицы изоморфна самой группе G. Более того, для каждого а е G, оф 1, существует такой характер С еХу что С(о) ф 1. Действительно, представим G в виде прямого произведения циклических групп Gi, G2, ...,G, порядков m\\m2\...\mt. Каждый элемент oeG может быть записан в виде с = а]1а^ ... а*'. Обозначим через С/ характер, переводящий Gi в е/, где е/ — примитивный корень степени mt из единицы, a Gj в 1 при \ф1. Пусть С — произвольный характер, C(gi) = г?1. Тогда С = С*1 С£2... С?. Обратно, соотношение С = Cf1 С£2... С^ определяет некоторый характер. Поскольку порядок характера С/ равен mh группа характеров X группы G изоморфна группе G. Если а ф 1, то в разложении g = g]1g*22 ...g? по крайней мере один показатель V/, скажем vb не делится на Ш\. Тогда C\(g) = eV) ф 1. Пусть А обозначает множество тех ненулевых элементов а из £, для которых <хл е F, и пусть F\ — множество ненулевых элементов поля F. Очевидно, что А — мультипликативная группа, и F\ — подгруппа группы А. Пусть Аг обозначает множество r-х степеней элементов из А и F\ — множество r-х степеней элементов из F\. Следующая теорема предлагает удобный способ для вычисления группы G в большинстве приложений. Теорема 24. Факторгруппы {A/Fx) и (Ar/F\) изоморфны друг другу, а также группам G и X. Отобразим группу А на группу АГУ используя возведение в степень г: сне А переходит в агеАг. Если areF\y где aeFiy то ЬеА переходит в агу если и только если br = агу т. е. если b — решение уравнения 49
xr - ar = 0. С другой стороны, а, га, е2а, ..., гг~ха — различные решения этого уравнения, и, поскольку г и а принадлежат F\, отсюда следует, что b должен быть одним из этих элементов и должен лежать в F\. Таким образом, множество, состоящее из прообразов в А элементов из F\, совпадает с F\. Следовательно, факторгруппы (A/F{) и (Ar/F[) изоморфны. Если а — элемент группы Л, то (а/а(а))г = аг/о(аг) = 1. Поэтому а/а(а) — корень степени г из единицы и лежит в Fx. По теореме 22 а/а(а) определяет характер С(о) группы G со значениями в поле F. Отобразим а на соответствующий характер С. По теореме 22 каждый такой характер С является образом некоторого а. Более того, аа' переходит в характер С*(о) = <ха'/а(а<х') = аа'/а(а)а(а') = С(о)С'(с) = СС'(о), а значит, это отображение — гомоморфизм. Ядро этого гомоморфизма — множество тех элементов а, для которых а/а(а) = 1 для каждого а, т.е. F\. Тем самым, мы получаем, что группа (A/F\) изоморфна группе А', а следовательно, и группе G. В частности, (A/Fx) — конечная группа. Установим теперь эквивалентность между куммеровыми полями и полями, удовлетворяющими свойствам (а), (Ь) и (с) теоремы 23. Теорема 25. Если Е — расширение поля F, то Е является кумме- ровым полем, если и только если Е нормально, его группа G абелева и F содержит е, где е — примитивный корень степени г из единицы, а г — наименьшее общее кратное порядков элементов группы G. Необходимость уже показана в теореме 23. Докажем достаточность. Пусть vl\F\, 0L2F\y ..., oLtF\ —все левые смежные классы по подгруппе F\ в группе А. Поскольку a,- G Л, мы получаем, что а[ = а,- G F. Следовательно, а,- — корень уравнения хГ — at = 0, и, поскольку га/, г2а/, ..., е^'а,- также являются корнями этого уравнения, многочлен хг — а{ должен разлагаться в £ на линейные множители. Докажем, что поле Е является полем разложения многочлена (хг — ах)(хг — а2)... (xr — at), что завершит доказательство теоремы. Для этого достаточно показать, что /^cti, <х2, ..., а,) = Е. Предположим, что F(cl\, <х2, ..., а,) ф Е. Тогда F(ol\, <х2, ..., а,) —промежуточное поле между F и Е и, поскольку Е нормально над F(a\y <x2, ..., а/), найдется некоторый автоморфизм об G, оф 1, оставляющий F(olu <x2, ..., а,) неподвижным. Далее, существует такой характер С группы G, что С(о) ф 1. Наконец, найдется такой элемент а в поле £, что С(о) = а/а(а) Ф 1. Но <хл G Fx по теореме 22, откуда следует, что a G А. Более того, А с F(olx, <х2, ..., а/), так как все смежные классы а,-/7! содержатся в F(ol\, <x2, ..., а,). Поскольку по предположению автоморфизм а оставляет поле F(aLU <x2, ..., а,) неподвижным, а(а) = а, что противоречит неравенству <х/а(<х) Ф 1. Тем самым, F(oL\y <х2, ..., а,) = Е. 50
Следствие. Если Е—нормальное расширение поля F простого порядка р, и если F содержит примитивный корень степени р из единицы, то Е—поле разложения неприводимого над полем F многочлена хр — а. Поле Е порождено элементами oti, ..., <хЛ, где <xf е F. Пусть oti не лежит в F. Тогда многочлен хр - а неприводим6), ибо иначе поле F(ol\) было бы промежуточным полем между F и £, степень которого меньше чем р, и по теореме о произведении степеней р не было бы простым числом, что противоречило бы предположению. Следовательно, E = F(ol\) — поле разложения многочлена хр — а. 2.13. Простые расширения Изучим вопрос, при каких условиях расширение некоторого полей порождается одним элементом (такой элемент называется примитивным). Докажем следующую теорему. Теорема 26. Конечное расширение Е поля F обладает примитивным элементом над F, если и только если существует лишь конечное число промежуточных полей между Е и F. a) Пусть Е = F(a)y и пусть f(x) = 0 — неприводимый многочлен для а над F. Пусть В — какое-нибудь промежуточное поле и g(x) — неприводимый многочлен для а над В. Присоединив к полю F коэффициенты многочлена g(x)y мы получим поле В\ лежащее между F и В. Многочлен g(x) неприводим над В, а следовательно, и над В'. Поскольку Е = В'((х.)у мы видим, что (Е/В) = (Е/В'). Это доказывает, что В' = В. Таким образом, поле В однозначно определяется многочленом g(x). Но g(x) —делитель многочлена f(x), a f(x) имеет лишь конечное число различных делителей над Е. Отсюда следует, что существует лишь конечное число различных полей В. b) Предположим, что существует лишь конечное число промежуточных полей между Е и F. Если F состоит из конечного числа элементов, то Е порождено одним элементом над F по следствию на с. 43. Поэтому можно предполагать, что F содержит бесконечное число элементов. Докажем следующий факт: для любых двух элементов а, р найдется такой элемент у в £, что F(ay р) = F(у). Пусть у = а + ар, где aeF. Рассмотрим все поля F(y), которые получаются таким образом. Поскольку в нашем распоряжении имеется бесконечное число значений а, можно найти хотя бы два таких элемента, скажем ах и а2, что соответствующие элементы yi = а + aip и у2 = <х + а2р приводят к одному и тому же полю F(y\) = F(y2)- Поскольку оба элемента yi и у2 лежат в /^yi), их 6)Например, для а = лр. — Прим. ред. 51
разность (а значит, и р) лежит в этом же поле. Следовательно, то же самое верно и для Yi - Д1Р = ex. Таким образом, F(oLy р) С F(y\). Поскольку F(y\) С F(oLy р), наше утверждение доказано. Выберем теперь г) в Е так, чтобы степень (F(r\)/F) была максимальной возможной. Каждый элемент е из Е должен принадлежать F(r))y ибо иначе мы смогли бы найти такой элемент 8, что F(b) содержит как т), так и е. Это доказывает равенство Е = F(r)). Теорема 27. Если Е = F(a\y <х2, ..., ая) — конечное расширение поля F, и аь а2, ..., а„ — сепарабельные элементы в Е, то существует такой примитивный элемент 6 в Ег что Е = F(B). Доказательство. Пусть /,(*) — неприводимый многочлен для oti над F, и пусть В — расширение поля £, в котором многочлен f\(x)f2(x)... ... fn(x) полностью разлагается7*. Тогда В нормально над F и, тем самым, содержит лишь конечное число промежуточных полей (количество которых равно числу подгрупп группы G). Таким образом, его подполе Е содержит лишь конечное число промежуточных полей. Применение теоремы 26 завершает доказательство. D 2.14. Существование нормального базиса Следующая теорема справедлива для произвольного поля, хотя мы доказываем ее лишь для случая, когда поле F бесконечно. Теорема 28. Если Е— нормальное расширение поля Fи с\, о2, ... ... , оп — элементы группы G поля Е, то найдется такой элемент 0 в Е, что п элементов aiF), a2F), ..., a„F) линейно независимы над F. В соответствии с теоремой 27 найдется такой элемент а, что Е = F(ol). Пусть f(x) —неприводимый многочлен для а над F. Положим a/(a) = а,, 8{Х) = (х-!оП«) " g'(X) = °,Ш) = (х-П«)Г(аиУ Т0ГДЗ ёМ ЯВЛЯСТСЯ многочленом над полем £, элементы а* при k ф i — его корни, и поэтому gi(x)gk(x)=0 (modf(x)) при 1фк. A4.1) В уравнении gi(x)+g2(x) + ... + gn(x)-\=0 A4.2) степень левой части не превосходит п - 1. Если уравнение A4.2) справедливо для п различных значений ху то левая часть должна тождественно равняться нулю. Но такими п различными значениями являются oti, <х2, ..., a„, поскольку £,-(а,-) = 1 и g*(a,) = 0 при k ф i. 7) Точнее говоря, В — поле разложения для f\ (х)... fn(x) над F. — Прим. ред. 52
Умножение уравнения A4.2) на gi(x) с учетом равенства равенства A4.1) приводит к соотношению (gi(x)K = g,(x) (mod/(*)). A4.3) Вычислим теперь определитель D(x) = \aiak(g(x))l /, к = 1, 2, ..., л, и докажем, что D(x) ф 0. Если возвести соответствующую матрицу в квадрат, и рассмотреть ее по модулю f{x), то, как следует из A4.1), A4.2) и A4.3), мы получим единичную матрицу. Следовательно, (D(x)J=\ (mod/(*)). Значит, число корней многочлена D(x) в поле F конечно. Исключая эти корни, мы можем найти такое значение а для переменной jc, что D(a) ф 0. Положим теперь 6 = g(a). Тогда |о/а*(е)|^0. A4.4) Рассмотрим любое линейное соотношение Х\С\(в) + х2а2F) +... ... + xnon(Q) = 0, где Xi лежат в F. Применяя автоморфизм а, к этому выражению, мы приходим к п однородным уравнениям с п неизвестными xt. Но неравенство A4.4) показывает, что xt = 0, и, таким образом, наша теорема доказана. 2.15. Теорема о естественных иррациональностях Пусть F — поле, р(х) — многочлен над F, неприводимые множители которого сепарабельны, и пусть Е — поле разложения для р(х). Пусть В — произвольное расширение поля F. Обозначим через ЕВ поле разложения многочлена р(х), где р(х) рассматривается как многочлен над В. Если <хь ..., <xs — корни многочлена р(х) в поле ЕВ, то /^cti, ..., <xs) — подполе поля ЕВ, которое, как легко видеть, является полем разложения для р(х) над F. По теореме 10 поля Е и /^oti, ..., <xs) изоморфны. Тем самым, без ограничения общности в дальнейшем мы можем предполагать, что Е = F(ab ..., as) и что Е — подполе поля ЕВ. Кроме того, £B = B(a,,...,as). Обозначим через Е П В пересечение полей Е и В. Легко видеть, что Е П В — поле, лежащее между F и Е. Теорема 29. Если G — группа автоморфизмов поля Е над F, и И — группа автоморфизмов поля ЕВ над В, то Н изоморфна подгруппе группы G, неподвижное поле которой есть ЕпВ. 53
Каждый автоморфизм поля ЕВ над полем В некоторым образом переставляет элементы ось ..., <xs и оставляет поле В, а стало быть и поле F, неподвижными. Поскольку элементы поля ЕВ являются частными полиномиальных выражений от <хь ..., <xs с коэффициентами из В, автоморфизм полностью определяется своим действием на oti, ..., <xs. Следовательно, каждый автоморфизм поля ЕВ над В определяет автоморфизм поля E = F(ol\, ..., as), который оставляет поле F неподвижным. Поскольку ot|, ..., as принадлежат £, различные автоморфизмы действуют по-разному на Е. Следовательно, группу Н поля ЕВ над В можно рассматривать как подгруппу группы G поля Е над F. Каждый элемент группы Н оставляет поле ЕГ\ В неподвижным, поскольку такой элемент оставляет неподвижным даже все поле В. Однако любой элемент поля £, не лежащий в Е П В, не лежит в В и, следовательно, не переходит в себя под действием хотя бы одного автоморфизма из Н. Отсюда следует, что Е П В — неподвижное поле для Н. Следствие. Если в условиях теоремы 29 группа G имеет простой порядок, то либо Н = G, либо Н состоит лишь из единичного элемента. 54
Глава 3 Приложения (А.Н.Мильграм) 3.1. Разрешимые группы Прежде чем перейти к приложениям, нам необходимо обсудить некоторые вопросы из теории групп. Будем предполагать известными несколько следующих простых утверждений, а) Если /V — нормальная подгруппа группы G, то отображение f(x) = xN является гомоморфизмом группы G на факторгруппу G/N. Гомоморфизм / называется естественным гомоморфизмом. Ь) Образ и прообраз нормальной подгруппы относительно гомоморфизма — нормальные подгруппы, с) Если / — гомоморфизм группы G на группу G', то, полагая /V' = f(N) и определяя отображение g соотношением g(xN) = f(x)N\ мы, как легко видеть, получим что g — гомоморфизм факторгруппы G/N на факторгруппу G'/N'. Более того, если /V — обратный образ подгруппы N', то g—изоморфизм. Докажем теперь такую теорему. Теорема 1 (Цассенхауз). Если U и V — подгруппы группы G, и, v — нормальные подгруппы подгрупп U и V соответственно, то следующие три факторгруппы изоморфны между собой: u(U П V)/u(U П v), v(U П V)/v(u П V), (U П V)/(u nV)(vn U). Очевидно, что U П v — нормальная подгруппа в U П V. Пусть / — естественное отображение из U на 1I и. Обозначим образ f(U Г\ V) через Н и f(Udv) через К. Тогда f~l(H) = u(Un V) и f~l(K) = u(UПи), из чего следует, что группа u(UП V)/u(UC\v) изоморфна группе Н/К. Если, однако, мы ограничим гомоморфизм /на U П V, то получим, что f-l(K)=[un(UCiV))](Unv) = (unV)(UCiv)9 так что группа (UnV)/ (unV)(UПи) также изоморфна Н/К. Итак, первая и третья из этих факторгрупп изоморфны друг другу. Аналогично изоморфны друг другу вторая и третья факторгруппы. Следствие 1. Если И — подгруппа и N — нормальная подгруппа группы G, то группа Н/Н П /V изоморфна группе HN/N, которая является подгруппой в G/N. Доказательство. В теореме 1 положим G = Uy N = и, Н =V и v=\. П 55
Следствие 2. Если в условиях следствия 1 группа G/N абелева, то абелевой является и группа Н/Н П N. Назовем группу G разрешимой, если существует последовательность подгрупп G = Go D G\ D ...D Gs= 1, каждая из которых нормальна в предшествующей группе и каждая группа G/_i/G/ абелева. Теорема 2. Любая подгруппа разрешимой группы разрешима. Действительно, пусть Н — подгруппа группы G и пусть Н{ = НП G/. Тогда группа Hi_jHi абелева, что вытекает из следствия 2, если положить G = G/_i, N = G/ и И = Я,_|. Теорема 3. Гомоморфный образ разрешимой группы разрешим. Пусть /(G) = G'; положим G\ = /(G,), где G, принадлежит последовательности, устанавливающей разрешимость группы G. Тогда по свойству с) существует гомоморфизм, отображающий G/.i/G, на G'-^jG'^ Но гомоморфный образ абелевой группы абелев, так что последовательность групп G\ устанавливает разрешимость группы G'. 3.2. Группы перестановок Любое взаимно однозначное отображение множества из п элементов на себя называется перестановкой. Композиция двух таких отображений называется их произведением. Можно легко проверить, что множество всех таких отображений образует группу, единицей которой служит тождественное отображение. Эта группа называется симметрической группой из п элементов. Обозначим для простоты элементы множества из п элементов числами 1, 2, ..., п. Отображение S, которое действует по правилу S(i) = / + 1 mod A2, будет обозначаться через A23...я). Вообще говоря, через (// • • • т) будет обозначаться такое отображение Г, что T(i) = j, ... ..., Т(т) = i. Если (//... т) состоит из k чисел, то такой элемент группы перестановок будет называться й-циклом. Ясно, что если T=(ij...s), то Г-1 = (s...//). Установим теперь следующую лемму. Лемма 1. Если подгруппа U симметрической группы из п элементов (п > 4) содержит каждый 3-цикл, и если и — такая нормальная подгруппа группы U, что U/u абелева, то и содержит каждый 3-цикл. Доказательство. Пусть / — естественный гомоморфизм, f(U) = = и/и, и пусть x = (ijk), y = (krs)—два элемента подгруппы {/, где /, /', k, г, s — произвольные пять различных чисел. Тогда, поскольку группа U/и абелева, полагая f(x) = x', f(y) = у', мы получаем, что f(x~~ly~lxy) = (х')~1(у')~1х'у' = I, а значит, х~*у~1ху ей. Но 56
x~xy~xxy = (kji)(srk)(ijk)(krs) = (kjs) и для любых &, /, 5 мы заключаем, что (kjs) ей. □ Теорема 4. Симметрическая группа G из п элементов не разрешима при п > 4. Если бы такая группа обладала последовательностью подгрупп, устанавливающей разрешимость, то, поскольку G содержит любой 3-цикл, каждая из подгрупп в этом ряду тоже содержала бы любой 3-цикл и последовательность не могла бы обрываться на единичной группе. 3.3. Разрешимость уравнений в радикалах Расширение Е поля F называется радикальным расширением, если существуют промежуточные поля Т7 = В0, В|, В2, ..., Вг = £ и fi/ = fi/_i(a/), где каждый элемент а, — корень некоторого уравнения вида хщ — а, = 0, а, е В,_|. Многочлен f(x) над полем F называется разрешимым в радикалах, если его поле разложения лежит в некотором радикальном расширении. Мы предполагаем, если не оговорено противное, что характеристика основного поля равна нулю и что F содержит столько корней из единицы, сколько нам необходимо для справедливости наших дальнейших утверждений. Заметим вначале, что любое радикальное расширение поля F всегда можно продолжить до нормального радикального расширения над F. Действительно, В\ — нормальное расширение поля В0, поскольку оно содержит не только ot|, но и еаь где е — любой корень степени П\ из единицы, откуда следует, что Вх —поле разложения многочлена хПх - ах. Если f\(x) = Y[(x — 0@2))» где а принимает все значения в группе автомор- физмов поля В\ над В0, то f\ лежит в В0; присоединяя последовательно корни уравнения х — о(а2), мы придем к расширению В2, нормальному над F. Продолжая действовать таким образом, мы придем к радикальному расширению £, которое будет нормальным над F. Докажем теперь следующую теорему. Теорема 5. Многочлен f(x) разрешим в радикалах, если и только если его группа разрешима. Предположим, что f(x) разрешим в радикалах. Пусть Е — нормальное радикальное расширение поля /% содержащее поле разложения В многочлена f(x). Обозначим через G группу поля Е над F. Поскольку для каждого / поле В/ является куммеровым расширением поля В/_|, группа поля В,- над В,-_| абелева. В последовательности групп G = GBq Э GBx Э ... Э GBr = 1 каждая подгруппа нормальна в предыдущей, поскольку Gb._, —группа поля Е над В/_ь а В, — нормальное расширение группы Bf_|. Но GBi_jGBi—группа поля В, над В/_ь и 57
потому она абелева. Следовательно, G разрешима. С другой стороны, GB — нормальная подгруппа группы G, a G/GB — группа поля В над F и, тем самым, группа многочлена f(x). Группа G/GB является гомоморфным образом разрешимой группы G и потому сама разрешима. Теперь предположим, что группа G многочлена f(x) разрешима, и пусть Е—его поле разложения. Пусть G = G0D G\ D ... D Gr= 1 —последовательность групп с абелевыми присоединенными факторами. Обозначим через Bi неподвижное поле для группы G,. Поскольку G/_i — группа поля Е над В/_| и G,— нормальная подгруппа группы G/_i, поле Bt нормально над В,_| и группа G/_i/G/ абелева. Таким образом, fi, является куммеровым расширением поля /?,-_,, а значит, оно является полем разложения многочлена вида (хп - а{)(хп - а2)... (хп - as). Последовательно строя поля разложения многочленов хп — ak, мы видим, что Bi — радикальное расширение поля /?,-_,, откуда следует, что и само Е является радикальным расширением. Замечание. Предположение, что F содержит корни из единицы, не является необходимым в доказанной теореме. Действительно, если многочлен f(x) обладает разрешимой группой G, то мы можем присоединить к F примитивный корень степени п из единицы, где п, скажем, равно порядку группы G. Группа многочлена /(*), рассматриваемого как многочлен над полем F\ по теореме о естественных иррациональностях является подгруппой G' группы G, и поэтому она разрешима. Таким образом, поле разложения многочлена f(x) над F можно получить с помощью присоединения радикалов. Обратно, если поле разложения Е многочлена f(x) над F можно получить с помощью присоединения радикалов, то, присоединяя подходящий корень из единицы, мы получим расширение Е' поля £, которое все еще нормально над F. Но поле Е' можно было бы получить также присоединяя сперва к полю F корень из единицы, а затем радикалы; сначала бы мы получили расширение F' поля Т7, а затем от F' перешли бы к £'. Обозначая через G группу поля Е' над F и через G' — группу поля Е' над/7', мы видим, что группа G' разрешима и что G/G' — группа поля F' над Т7, а потому она абелева. Поэтому группа G разрешима. Факторгруппа G/GE является группой многочлена f(x) и, будучи гомоморфным образом разрешимой группы, сама разрешима. 3.4. Общее уравнение степени п Если F—поле, то множество рациональных выражений от переменных Ы|, и2, ..., ип с коэффициентами в Fявляется полем F(u\, u2,..., ип). Под общим уравнением степени п мы подразумеваем уравнение f(x) =хп- иххп~х + и2хп~2 - ... + (~1)яия. D.1) 58
Пусть Е— поле разложения многочлена f(x) над F(u\y и2, ..., ип). Если Уь v2j ..., vn — корни многочлена f(x) в поле £, то ii\=V\+v2 +... ... +Vnj U2 = VlV2 + V]Vz + ... + Vn-\V„, ..., Un = VlV2...Vn. Мы сначала докажем, что группа поля Е над F(u\y u2t ..., w„) — симметрическая группа. Пусть F(xx, x2l ..., хп) — поле, порожденное над F переменными (*,, х2, ..., хп). Пусть aj =Х| +*2 + ... + хл, a2 = X|X2 + X|X3 + ... ... + *„_!*„, ..., а„ = Х\Х2... хп — элементарные симметрические функции, т.е. {Х- Х\)(Х- Х2) ...(X -Хп)=Хп -<Х\Хп-1 + ...+ (-\)nOLn=f*(x)- Если g(ab a2, ..., a„) — многочлен от переменных аь ..., а„, то g(ot|, а2, ..., а„) = 0, только если g— нулевой многочлен. Действительно, если g(Ylxi' Ylxixk, • • •) = О» то это соотношение выполняется также и при подстановке vt вместо xt. Таким образом, g(%2 Vh ]С у/у*» • • •) = О или g{ii\, u2, ..., ип) = 0, откуда следует, что многочлен g тождественно равен нулю. Мы установим следующее соответствие между подполем F(ait..., a„) поля F(x\, ...ухп) и полем F(uu ...,ип)\ пусть ' 1у'"' п> —произвольный элемент поля F(u\,...,un). Поставим этому элементу в соответствие Аа''---,«я; Зто, очевидно, сюръективное отображение ^(а|,...,ал) F(uu...,un) на F(tti,...,oO- Более того, если П*1'-*ъ) Ш'---**«) g(a\,..., QLn) ^i(ai,...,a«) то fg\ ~ gf\ — 0- Но отсюда, учитывая предыдущее, мы получаем, что f(u\, ..., u„)g\(ux, ..., un)-g(ulj ..., un)fl(ulj ..., ия)=0, а значит, -^ 7 = 1-~ г- Из этого соотношения легко сле- g(U\, ...yUn) g\(U\, ..., Ы„) дует, что отображение из F(ii\, ..., ип) на F(a\, ..., ая) является изоморфизмом. Под действием этого отображения многочлен f(x) переходит в многочлен f*{x). Поскольку Е и F(x\,x2y ...,xn) являются полями разложения многочленов f(x) и f*(x) соответственно, по теореме 10 наш изоморфизм можно продолжить до изоморфизма между Е и F(x\, x2l ..., хп). Тем самым, группа поля Е над F(uu u2t ..., ип) изоморфна группе поля F(x\, х2, ..., хп) над F(d\, a2, ..., a„). Каждая перестановка элементов лгь х2, ..., хп оставляет ot|, а2, ... ... , а„ на месте и, тем самым, индуцирует автоморфизм поля F(x\, x2j ... ...,jt„), оставляющий поле F(oli, a2, ..., a„) неподвижным. Обратно, каждый автоморфизм поля F(x\, x2, ..., хп), который оставляет поле F{vl\, a2, ..., a„) неподвижным, должен переставлять корни Х\у х2, ... ... ,х„ многочлена f*(x). Такой автоморфизм полностью определяется 59
своим действием на переменные Х\, х2, ..., х„. Таким образом, группа поля F(X\y х2у ..., хп) над F(v.\, <х2, ..., ая) — симметрическая группа из п элементов. В силу изоморфизма между F(xu лг2, ..., хп) и Е группа для поля Е над F(u\y иъ ..., ип) также является симметрической. Замечая, что симметрическая группа при п > 4 неразрешима, из теоремы о разрешимости уравнений мы получаем знаменитую теорему Абеля. Теорема 6. Группа общего уравнения степени п — симметрическая группа из п элементов. Общее уравнение степени п неразрешимо в радикалах при п > 4. 3.5. Разрешимые уравнения простой степени Группу уравнения всегда можно считать некоторой группой перестановок. Действительно, пусть f(x) — какой-нибудь многочлен над полем /% и пусть ой, <х2, ..., а„ — корни многочлена f(x) в его поле разложения E = F(<x\, ..., а„). Тогда каждый автоморфизм поля Е над F переводит каждый корень многочлена f(x) в некоторый корень того же многочлена, т.е. переставляет корни. Поскольку поле Е порождено корнями многочлена f(x), различные автоморфизмы должны производить разные перестановки. Итак, группа поля Е над F — это группа перестановок, действующая на корнях аь а2, ..., а„ многочлена f(x). Для неприводимого многочлена эта группа всегда транзитивна. Действительно, пусть а и а' — два корня многочлена f(x), где f(x) неприводим. Поля F(a) и F(u!) изоморфны, причем изоморфизм тождествен на поле F и может быть продолжен до автоморфизма поля Е (теорема 10 гл. 2). Таким образом, существует автоморфизм, переводящий любой заданный корень в любой другой корень, что и устанавливает транзитивность группы. Перестановка а чисел 1,2, ...,# называется линейной подстановкой по модулю q, если найдется такое число b^O (mod q), что a(i) =Ы-\-с (mod q), i = 1, 2, ..., q. Теорема 7. Пусть f(x) — неприводимый многочлен простой степени q над полем F. Группа G многочлена f(x) (являющаяся некоторой группой перестановок корней, или чисел 1,2, ...,#) разрешима тогда и только тогда, когда после подходящей перенумерации корней она становится группой линейных подстановок по модулю que ней встречаются все такие подстановки с Ь= 1, т.е. o(i) =i + c (mod q) (c= 1, 2, ..., q). Пусть G — некоторая транзитивная группа подстановок на множестве 1, 2, ..., qy и пусть G\ —нормальная подгруппа группы G. Пусть 1, 2, ..., k — образы единицы под действием перестановок из G\\ мы 60
будем говорить, что 1, 2, ..., k — область транзитивности^ группы G\. Если / ^ q — некоторое число, не принадлежащее этой области транзитивности, то найдется элемент о eG, который переводит 1 в /. Тогда аA, 2, ..., к) — область транзитивности подгруппы aG\a~x. Поскольку G\ —нормальная подгруппа группы G, мы получаем, что G\ = oG\o~l. Итак, множество аA, 2, ..., k) вновь является областью транзитивности группы G|, эта область содержит число / и состоит из k элементов. Поскольку число / выбрано произвольным, все области транзитивности группы G\ содержат k элементов. Таким образом, множество 1, 2, ..., # разбивается на несколько попарно непересекающихся множеств, каждое из которых содержит k элементов, откуда следует, что k делит q. Поэтому в случае когда q — простое, либо k = 1 (и тогда G\ состоит лишь из единицы), либо k = q и группа G\ также транзитивна. Чтобы доказать теорему, рассмотрим случай, когда группа G разрешима. Пусть G = G0 D G\ D ... D Gs+i = 1 —последовательность подгрупп, устанавливающая разрешимость группы G. Поскольку группа Gs абелева, выбрав циклическую подгруппу в Gs, мы можем предполагать, что последняя нетривиальная подгруппа в этом ряду, т.е. группа Gs, циклическая. Если а — образующая группы Gs, то а должна являться циклом, содержащим все q чисел 1, 2, ..., #, поскольку в противном случае группа Gs не была бы транзитивной (если а = A//...т)(п...р)..., то степени элемента а переводили бы 1 только в 1, /,/,..., га, что противоречило бы транзитивности группы Gs). Перенумеровав, если это необходимо, переставляемые числа, мы можем предполагать, что о(/)=/+1 (mod q) и ac(i)=i-\-c (mod q). Пусть теперь т — произвольный элемент группы Gs_|. Поскольку Gs — нормальная подгруппа в Gs_i, элемент хат-1 принадлежит группе Gs, т.е., например, хох~1=оь. Пусть т(/)=/ или т (/)=/, тогда хат (у) = ob(j) =j + b (mod q). Тем самым, то(/) = т(/) + b (mod q)t т.е. т(/+ 1) =х(/) + Ь для каждого /. Итак, полагая т@) = с, мы получаем, что х(\) = с-\-Ь, тB) =тA) + b = c + 2b и в общем случае т(/) = c-\-ib (mod q). Итак, любая подстановка в группе Gs_i является линейной. Более того, единственные элементы группы Gs_i, не имеющие неподвижных элементов, принадлежат группе Gs, поскольку для каждого а ф 1 найдется такой элемент /, что ai + b = i (mod q) (возьмем такой элемент /, что (а — 1)/ = —Ь). ')Иначе говоря, речь идет об орбитах действия группы G\ на множестве 1, ..., q. Далее доказывается, что в силу транзитивности группы G и нормальности подгруппы G\ все орбиты равномощны. — Прим. ред. 61
Докажем по индукции, что все элементы группы G являются линейными подстановками, и что все циклы длины q лежат в Gs. Предположим, что утверждение верно для группы Gs-n. Пусть т G Gs_n_i, и пусть а — цикл, принадлежащий группе Gs (а следовательно, и группе Gs-n). Поскольку образ цикла является циклом, элемент т-,ат является циклом в группе Gs_„ и поэтому принадлежит Gs. Итак, т~*от=оь для некоторого Ь. В силу рассуждений из предыдущего пункта, т — линейная подстановка вида Ы -f с, и если сама т не принадлежит группе Gs, то т оставляет хотя бы одно число неподвижным и поэтому не может быть циклом длины q. Докажем теперь вторую часть теоремы. Предположим, что G — некоторая группа линейных подстановок, содержащая подгруппу N вида о(/) = / -f с. Поскольку единственные линейные подстановки, не имеющие неподвижных элементов, принадлежат подгруппе /V и поскольку образ произвольного цикла из q элементов тоже является циклом из q элементов, N — нормальная подгруппа в группе G. В каждом смежном классе ЛЛс, где т(/) = Ы + с, встречается подстановка а_,т, где а = / + с. Но о"'т(/) = (Ы + с) - с = Ы. Более того, если т(/) = Ы и т'(/) = b'i, то тт'(/) = bb'i. Итак, факторгруппа (G/N) изоморфна мультипликативной подгруппе чисел 1, 2, ..., q — 1 mod q и, тем самым, является абелевой. Поскольку как (G/N), так и N — абелевы группы, группа G разрешима. Следствие 1. Если G — разрешимая транзитивная группа на q буквах {где q — простое число), то единственная подстановка в G, оставляющая неподвижными две или более буквы, является тождественной. Это следует из того факта, что каждая подстановка является линейной по модулю q и уравнение Ы-\-с = I mod q либо вообще не имеет решений (Ь= 1, с^О), либо имеет в точности одно решение (Ьф 1), за исключением случая Ь = 1, с = 0, в котором подстановка является тождественной. Следствие 2. Неприводимый разрешимый многочлен простой степени над полем, которое является подмножеством множества вещественных чисел либо имеет ровно один вещественный корень, либо все его корни вещественны. Группа такого многочлена является разрешимой транзитивной группой подстановок на q (q — простое число) буквах. В поле разложения (содержащемся в поле комплексных чисел) автоморфизм комплексного сопряжения оставляет неподвижными все элементы, которые принадлежат полю действительных чисел. По следствию 1 если хотя бы два корня остаются неподвижными, то и все корни остаются неподвижными. Поэтому если уравнение имеет хотя бы два вещественных корня, то и все его корни вещественны. 62
3.6. Построения с помощью циркуля и линейки Предположим, что на плоскости задано конечное число элементарных геометрических фигур, т.е. точек, прямых и окружностей. Наша задача — найти способ построения других фигур, удовлетворяющих некоторым условиям относительно фигур, заданных изначально. Допустимыми операциями в таких конструкциях являются выбор произвольной точки, лежащей внутри заданной области, проведение прямой, проходящей через две точки, построение окружности с данным центром и радиусом и, наконец, построение точек пересечения пары прямых, окружностей или прямой и окружности. Поскольку прямая или отрезок определяются двумя своими точками, а окружность — тремя своими точками или центром и одной точкой, построение циркулем и линейкой можно рассматривать как нахождение точек, удовлетворяющих некоторым условиям, по другим заданным точкам. Если нам даны две точки, то мы можем соединить их прямой, восстановить перпендикуляр к этой прямой, скажем, в одной из данных точек и, принимая расстояние между некоторыми двумя точками за единицу, с помощью циркуля отложить любое целое расстояние п на прямой. Более того, применяя стандартный прием, мы можем проводить параллельные прямые и строить частное т/п. Используя пару прямых в качестве осей декартовой системы координат, с помощью циркуля и линейки мы можем построить все точки с рациональными координатами. Если а, 6, с, ... — числа, являющиеся координатами точек, которые определяют заданные фигуры, то можно построить сумму, произведение, разность и частное любой пары этих чисел. Итак, можно построить любой элемент поля Q(a, by с, ...), которое порождают эти числа над полем рациональных чисел. Мы можем выбрать произвольную точку заданной области. Если построение циркулем и линейкой возможно, то мы всегда можем выбрать наши произвольные точки так, чтобы их координаты были рациональны. Если соединить прямой две точки, координаты которых принадлежат полю Q(a, by с, ...), то коэффициенты уравнения этой прямой будут принадлежать Q(a, by Су ...), и координаты точки пересечения двух таких прямых также будут принадлежать полю Q(a, by с, ...). Если окружность проходит через три точки с координатами из того же поля или ее центр и одна ее точка имеют координаты в поле Q(a, by с, ...), то уравнение самой окружности будет иметь коэффициенты в том же поле. Однако для определения координат точек пересечения двух таких окружностей или прямой и окружности требуется привлечение квадратных корней. 63
Отсюда следует, что если какую-нибудь точку можно построить с помощью циркуля и линейки, то ее координаты должны получаться из поля Q(a, b, с, ...) по формуле, содержащей лишь квадратные корни. Иными словами, координаты такой точки должны лежать в некотором поле вида Es э Es-\ э ... Э Ех = £(а, 6, с, ...), где каждое поле £, является полем разложения некоторого квадратного многочлена х2 — а над полем £/_|. Отсюда следует (теорема 6, с. 19), что (Es/E\) является степенью числа 2, поскольку либо E-t = £/_i, либо (£,/£/_ |) = 2. Если х — координата построенной точки, то (Ex(x)/E\)(ES./E\(x)) = (Es/E\) = 2V, так что значение (Е\(х)/Е\) также должно быть степенью двойки. Обратно, если координаты какой-нибудь точки можно получить из Q(a, 6, с, ...) по формуле, использующей только квадратные корни, то такую точку можно построить с помощью циркуля и линейки. Действительно, с помощью циркуля и линейки можно выполнить сложение, вычитание, умножение и деление а если использовать равенство 1 : г = г: гь то можно осуществить и извлечение квадратного корня г— у/гг В качестве иллюстрации этих рассуждений докажем, что трисекция угла в 60° невозможна. Предположим, что мы провели окружность единичного радиуса с центром в вершине угла. Введем координатную систему таким образом, чтобы ось абсцисс совпадала с одной из сторон угла, а начало координат совпадало с вершиной угла. Трисекция угла была бы эквивалентна построению точки с координатами (cos20°, sin 20°) на единичной окружности. Из уравнения cos 36 = 4 cos3 6 — 3cos6 следует, что абсцисса такой точки удовлетворяет уравнению 4л:3 — Зх = 1/2. Читатель может легко проверить, что у этого уравнения нет рациональных корней, поэтому оно неприводимо над полем рациональных чисел. Но поскольку мы предположили, что нам даны только прямая и отрезок единичной длины, и поскольку построение угла в 60° возможно, то поле Q(a, 6, с, ...) можно считать изоморфным полю Q рациональных чисел. Однако корень а неприводимого уравнения 8л:3 — 6л: —1=0 обладает тем свойством, что (Q(a)/Q) = 3, и степень этого расширения не является степенью двойки. 64
Оглавление Предисловие к русскому изданию 3 Глава 1. Линейная алгебра 4 1.1. Тела 4 1.2. Векторные пространства 4 1.3. Однородные линейные уравнения 5 1.4. Зависимость и независимость векторов 6 1.5. Неоднородные линейные уравнения 10 1.6. Определители 11 Глава 2. Теория полей 19 2.1. Расширения полей 19 2.2. Многочлены 20 2.3. Алгебраические элементы 22 2.4. Поля разложения 25 2.5. Однозначное разложение многочленов на неприводимые сомножители 28 2.6. Характеры групп 28 2.7. Приложения и примеры к теореме 13 31 2.8. Нормальные расширения 34 2.9. Конечные поля 40 2.10. Корни из единицы 45 2.11. Уравнения Нётер 46 2.12. Куммеровы расширения 47 2.13. Простые расширения 51 2.14. Существование нормального базиса 52 2.15. Теорема о естественных иррациональностях 53 Глава 3. Приложения (А. Н.Мильграм) 55 3.1. Разрешимые группы 55 3.2. Группы перестановок 56 3.3. Разрешимость уравнений в радикалах 57 3.4. Общее уравнение степени п 58 3.5. Разрешимые уравнения простой степени 60 3.6. Построения с помощью циркуля и линейки 63 65
Эмиль Артин ТЕОРИЯ ГАЛУА Редакторы А. Г. Кузнецов, О. А. Васильева Лицензия ИД № 01335 от 24.03.2000 г. Подписано в печать 5.04.2004 г. Формат 60 х 90 Уш. Бумага офсетная № 1. Печать офсетная. Печ.л. 4,25. Тираж 1000 экз. Заказ № 208т Издательство Московского центра непрерывного математического образования 119002, Москва, Большой Власьевский пер., 11. Тел. 241—05—00. Отпечатано с готовых диапозитивов во ФГУП «Полиграфические ресурсы». Книги издательства МЦНМО можно приобрести в магазине «Математическая книга», Большой Власьевский пер., д. 11. Тел. 241—72—85. E-mail: biblio@mccme.ru