Автор: Чашкин А.В.   Жуков Д.А.  

Теги: алгебра   математика  

ISBN: 978-5-7038-4354-3

Год: 2016

Текст
                    Московский государственный технический университет
имени Н.Э. Баумана
А. В. Чашкин, Д. А. Жуков
ЭЛЕМЕНТЫ
КОНЕЧНОЙ АЛГЕБРЫ
группы, кольца, поля,
линейные пространства
ш
£1
Ιι
Москва
ИЗДАТЕЛЬСТВО
МГТУ им. Н. Э. Баумана
2016


УДК 512.6 ББК 22.14 4-29 Издание доступно в электронном виде на портале ebooks.bmstu.ru по адресу: http://ebooks.bmstu.ru/catalog Факультет «Информатика и системы управления» Кафедра «Информационная безопасность» Рекомендовано редакционно-издательским советом МГТУ им. Н. Э. Баумана в качестве учебного пособия Рецензенты: профессор механико-математического факультета МГУ им. М. В. Ломоносова С. Б. Гашков; доцент факультета ВМК МГУ им. М. В. Ломоносова М. А. Черепнев Чашкин, А, В, 4-29 Элементы конечной алгебры: группы, кольца, поля, линейные пространства: учебное пособие / А. В. Чашкин, Д. А. Жуков — Москва: Издательство МГТУ им. Н. Э. Баумана, 2016. — 368 с.: ил. ISBN 978-5-7038-4354-3 Учебное пособие основано на материалах лекций и семинаров, проводимых в МГТУ им. Н. Э. Баумана для студентов, специализирующихся в области защиты информации. В пособии рассмотрены основные алгебраические структуры и их свойства. Все утверждения снабжены подробными доказательствами и проиллюстрированы большим числом примеров. Основное внимание уделено конечным полям и линейным пространствам над конечными полями. Для чтения пособия достаточно уверенного владения математикой в объеме средней школы. ISBN 978-5-7038-4354-3 УДК 512.6 ББК 22.14 © МГТУ им. Н. Э. Баумана, 2016 © Оформление. Издательство МГТУ им. Н. Э. Баумана, 2016
Оглавление Предисловие 6 Глава 1. Множества и отображения 9 1.1. Множества 9 1.2. Отношения на множествах 11 1.3» Отображения 13 1.4. Конечные множества и их мощности 17 Задачи 23 Глава 2. Целые числа 25 2.1. Делимость. Алгоритм Евклида 25 2.2. Разложение на простые множители 33 2.3. Теорема Чебышёва 35 2.4. Сравнения 39 2.5. Классы вычетов 41 2.6. Решение сравнений 43 2.7. Китайская теорема об остатках 44 2.8. Функция Эйлера 47 Задачи 50 Глава 3, Группы 52 3.1. Определения и примеры 52 3.2. Группа подстановок 59 3.3. Смежные классы и фактор-группы 66 3.4. Изоморфизмы групп 71 3.5. Гомоморфизмы групп 80 Задачи 84
4 Оглавление Глава 4. Кольца 87 4.1. Кольца и поля 87 4.2. Морфизмы колец 93 4.3. Фактор-кольца 96 4.4. Кольцо многочленов 98 4.5. Арифметика многочленов 106 4.6. Число неприводимых многочленов 115 4.7. Кольцо остатков и поле многочленов 119 4.8. Китайская теорема об остатках для многочленов . . . 122 Задачи 131 Глава 5* Линейные пространства 134 5.1. Линейные пространства и их свойства 134 5.2. Линейные операторы 143 5.3. Матрицы 147 5.4. Определители 156 5.5. Свойства определителей 162 Задачи 174 Глава 6. Пространства с операторами 177 6.1. Системы линейных уравнений 177 6.2. Обращение невырожденных матриц 180 6.3. Решение линейных матричных уравнений 184 6.4. Инвариантные подпространства 194 Задачи 217 Глава 7. Структура конечных групп 220 7.1. Действие группы на множестве 220 7.2. Теоремы Силова 228 7.3. Прямые произведения групп 232 7.4. Конечные абелевы группы 236 7.5. TpynnaZ* 244 Задачи 250 Глава 8* Конечные поля 253 8.1. Мультипликативная группа поля 253 8.2. Разложение хрП — χ на множители 258
Оглавление 5 8.3» Структура конечного поля 265 8.4» Арифметика в конечных полях 277 8.5. Порядки многочленов 295 Задачи 306 Глава 9, Алгоритмы 309 9.1. Свободные от квадратов многочлены 309 9.2. Алгоритм Берлекемпа. Общий случай 322 9.3. Логарифмирование. Метод согласования 327 9.4. Метод Полига — Хеллмана — Нечаева 332 9.5. Коды, исправляющие ошибки 337 Задачи 348 Литература 351 Приложение А. Примитивные элементы поля Ър . 354 Приложение В. Разложение на простые множители чисел вида рп — 1 356 Приложение С* Неприводимые и примитивные многочлены 359 Предметный указатель 363
Предисловие Это учебное пособие основано на лекциях и семинарах, которые вот уже более десяти лет проводятся авторами в МГТУ им. Н.Э.Баумана для студентов, специализирующихся в области защиты информации, одной из составных частей которой является криптография. В современной криптографии активно используются результаты таких разделов математики, как теория вероятностей, теория чисел, теория сложности и т. д. В этом ряду одно из первых мест, безусловно, принадлежит алгебре, так как в основе подавляющего числа криптографических конструкций и методов лежат алгебраические структуры — группы, кольца, поля, линейные пространства. Изучению этих структур и посвящена настоящая книга. Алгебра (как общая, так и линейная) давно является неотъемлемой частью подготовки инженеров и научных работников. Благодаря этому сейчас существует обширная и качественная учебная литература, посвященная тем разделам алгебры, которые традиционно изучаются в высших технических учебных заведениях и на математических и естественных факультетах университетов. Вместе с тем следует отметить, что эти разделы в основном имеют дело с «бесконечной» частью алгебры — с алгебраическими структурами, так или иначе связанными с полями действительных и комплексных чисел. «Конечной» части — конечным полям, линейным пространствам над конечными полями и т. п. — уделяется значительно меньше внимания, в то время как в современных задачах, имеющих дело с различными преобразованиями больших объемов информации, наиболее востребованы именно методы конечной алгебры. Такое положение было одной из главных причин, побудивших авторов к написа-
Предисловие 7 нию учебного пособия по алгебре, в котором основное внимание было бы уделено конечной алгебре и, в частности, конечным полям и линейным пространствам над конечными полями. При этом авторы стремились создать максимально независимое и подробное пособие, для чтения большей части которого достаточно уверенного владения математикой в объеме средней школы. В результате получилась книга с подробными доказательствами и большим числом разнообразных примеров, для работы с которой нет необходимости прибегать к дополнительной литературе1). Книга состоит из девяти глав. Первая глава содержит простейшие сведения из теории множеств и носит в основном справочный характер. Вторая глава является простым введением в элементарную теорию чисел. Часть результатов второй главы обобщается в следующих главах для групп и колец и используется в качестве примеров появляющихся там общих конструкций и результатов. Материал третьей главы достаточно традицио- нен и содержится в большинстве начальных курсов алгебры — в ней изучаются группы и их основные свойства. В четвертой главе рассматриваются кольца. Значительная часть этой главы посвящена изучению колец многочленов над конечными полями. В частности, для любого простого ρ и любого натурального η доказывается существование поля из рп элементов как поля вычетов многочленов по модулю неприводимого многочлена. В пятой и шестой главах подробно рассматриваются линейные пространства над конечными полями и их линейные преобразования. Рассматриваются методы решений систем линейных уравнений над конечными полями, изучаются циклические пространства. Материалы, составляющие четвертую, пятую и шестую главы, достаточно сильно отличаются от материалов, содержащихся в аналогичных разделах большинства курсов общей и линейной алгебры, где основное внимание уделяется кольцам многочленов и линейным пространствам над полями действительных и комплексных чисел. В этих главах, в частности, нет основной 'Это ни в коем случае не рекомендация для работы с книгой, это возможность!
8 Предисловие теоремы алгебры и теоремы о жордановой нормальной форме линейного оператора. Основная задача глав 4—б — создать необходимые инструменты для изучения в восьмой главе конечных полей. В седьмой главе подробно изучаются конечные группы. Дается описание строения произвольной абелевой группы и, в частности, группы целых чисел с операцией умножения по составному модулю. В восьмой главе рассматриваются конечные поля, их структура, особенности выполнения в них арифметических операций и т. п. Доказывается единственность, с точностью до изоморфизма, поля из рп элементов и устанавливается отсутствие других конечных полей. Не сильно преувеличивая, можно сказать, что восьмая глава является центром, вокруг которого построена книга. Причина этого в том исключительном положении, которое занимают конечные поля в создании и применении современных алгоритмов работы с дискретными данными. Наконец в девятой главе приводятся примеры таких алгоритмов: алгоритмы дискретного логарифмирования в конечных полях, алгоритм разложения на неприводимые множители многочлена над конечным полем и алгоритм исправления ошибок в примитивных БЧХ-кодах. Авторы надеются, что настоящая книга позволит ее читателям продолжить изучение алгебраических структур и методов на более высоком уровне и, кроме того, облегчит знакомство как с другими областями математики, имеющими важные практические приложения, так и с самими приложениями.
Глава 1 Множества и отображения Понятия «множества», «отношения», «отображения» и пр. являются базовыми для всей математики — и дискретной, и непрерывной. Они закладывают необходимую основу для всех дальнейших построений, зачастую весьма сложных. Алгебраические структуры на множествах являются основным объектом практически всех теоретических и прикладных математических дисциплин, в частности математической криптографии. 1.1· Множества Понятие «множества» — одно из фундаментальных неопределяемых понятий математики. Под множеством понимают любую определенную совокупность объектов, называемых элементами множества. Элементы множества различны и отличимы друг от друга. Множества обычно обозначаются прописными буквами, а их элементы — строчными. Для некоторых особо важных множеств приняты стандартные обозначения: N — множество натуральных чисел, Ъ — целых, Q — рациональных, R — действительных, С — множество комплексных чисел. Если объект χ является элементом множества М, то говорят, что χ принадлежит Μ (Μ содержит χ) и используют обозначение χ € М. В противном случае говорят, что χ не принадлежит Μ и пишут χ φ Μ. Например, у/2 φ Q и у/2 в R. Множество Μ — подмножество множества N (М содержится в 7V, N включает М), если каждый элемент Μ есть элемент N. Это
10 Глава 1. Множества и отображения свойство обозначается Μ С N или Μ С Ν: Μ С N <^> Ух е Μ :х € N. Например, N С Ζ. Два множества называются равными, если в них входят одни и те же элементы: Μ = N о (М С 7V, N С М). Пустое множество 0, не содержащее элементов, по определению является подмножеством любого множества: V Μ 0 С М. Если McJV, но Μ / Λί и Μ / 0, то Μ называется собственным подмножеством JV. Множество с конечным числом элементов называется конечным. Конечные множества могут быть описаны явным перечислением всех их элементов, при этом принято заключать их в фигурные скобки. Например, Μ = {2,3,5,7} — множество всех простых натуральных чисел, меньших 10. По нашему определению, множество является неупорядоченным объектом, в частности, {2,3,5,7} = {5,2,7,3}. Число элементов конечного множества Μ называют его мощностью. Оно обозначается |М|. Например, |0| = 0, но |{0}| = 1. Факт конечности Μ часто обозначается \М\ < ос, в противном случае используют запись \М\ = оо. Над множествами обычно рассматриваются следующие операции: 1) объединение Μ U N = {х : χ е Μ или χ € Ν}\ 2) пересечение MC\N = {x:xeMnxe JV}; 3) разность M\N = {x:xeMnx<£ N}; 4) симметрическая разность Μ Δ Ν = (Μ U Ν) \ (Μ Π 7V), причем легко убедиться, что также Μ AN = (Μ \N)\J(N\ Μ); 5) дополнение Μ = {χ : χ £ Μ}. Операция дополнения подразумевает некое универсальное множество (У, такое, что Μ С U и¥ = [/\М. Если Μ Π Ν = 0, то говорят, что Μ и N не пересекаются. Операции объединения и пересечения допускают обобщение: если / — некоторое множество, элементы которого используются как индексы, то \jMi = {x:3iel xe MJ, f]Mi = {x:VieI χ e Mi}. iei iei
1.2. Отношения на множествах 11 Пусть U — универсальное множество и М, N, К С U — произвольные подмножества. Нетрудно убедиться, что введенные операции над множествами обладают следующими свойствами: 1) идемпотентность: МиМ = М,МГ\М = М; 2) коммутативность: M\JN = N\JMyMDN = NnM\ 3) ассоциативность: (М U N) U К = Μ U (N U К), (М Г\ Ν)Γ\ ΠΚ = ΜΠ(ΝηΚ); 4) дистрибутивность: (Μ U Ν) Π Κ = (Μ U Κ) Π (JV U Κ), (Μ Π JV) U Κ = (Μ Π tf) U (Ν Π Κ)] 5) поглощение: (Μ U ΛΓ) Π Μ = Μ, (Μ Π JV) U Μ = Μ; 6) свойство нуля: MU0 = M, МП0 = 0; 7) свойство единицы: MuU = U,MnU = M; 8) инволютивность: Μ = Μ; 9) правила де Моргана: Ми Ν = Μ Π 77, Μ Π N = МиЖ Равенства |М U 7V| = |М| + |JV| - |М Π ΛΓ|, |М \ N\ = |М|- -|MniV|, |ΜΔΛ^| = |Μ| + |ΛΓ|-2|ΜίΊΛΠ и пр. легко следуют из определений. 1.2. Отношения на множествах Если a G А и b £ Л, то через (а, 6) обозначим упорядоченную пару. Две упорядоченные пары (а, 6) и (с, d) считаются равными тогда и только тогда, когда а = с и b = d Вообще говоря, (а,Ь) ^ (&, а). Прямым или декартовым произведением двух множеств Л и В называется множество всех различных упорядоченных пар, в которых первый элемент каждой пары из А, а второй — из В: Αχ Β= {(α,6) : аеА,ЬеВ}. Степенью множества А называется его прямое произведение самого на себя: Ап = А х ... χ Α (η раз). Очевидно, что для конечных множеств А и В справедливо | Ах£?| = |Α|·|Β|. Отсюда следует \Ап\ = |А|П, Пусть А и В — два множества. Тогда произвольное подмножество R их прямого произведения А х В называется отношением из множества А в множество В (от англ. relation — от-
12 Глава 1. Множества и отображения ношение), или, точнее, бинарным отношением. Для бинарных отношений принято использовать инфиксную форму записи: если Л С А х £, то пишут aRb в том и только в том случае, когда (а,Ь) £ Л. Если А = В и R С А2, то говорят об отношении тш множестве А. В качестве примера можно привести известные отношения =, <, <, определенные на множестве натуральных чисел. Обобщением бинарного отношения является тг-арное отношение R С А\ χ ... χ Ап, где множества Ai не обязательно различны. Далее рассматриваются только бинарные отношения, которые для краткости называются просто отношениями. Пусть Ri С А х В, R2 С В χ С — отношения из А в В и из В в С соответственно. Тогда отношение Ri0 R2 = {(α,с) :ае А,сеС : ЗЬе В aR\b, bR2c} называется композицией отношений R\ и R2. Пусть R С А2 — некоторое отношение на А. Тогда отношение Л-1 = {(а, 6) : (6, а) £ Л} называется обратным к отношению Л, а отношение Л = {(а, Ь) : (а, 6) ^ Л} — его дополнением. Отношение {(а, а) : а £ А} называется тождественным или отношением равенства на А. Например, отношение ^ является дополнением к отношению равенства на множестве N. Отношение Л С А2 называется рефлексивным, если для всех а £ А выполнено аЛа* Если для всех а, 6 £ А из aRb следует bRa, то отношение Л называется симметричным, а если для всех а, 6, с £ А из аЛ6, 6Лс следует aRc, то отношение Л называется транзитивным. Нетрудно убедиться в справедливости следующего утверждения. Лемма 1Л* Отношение Л на множестве А является рефлексивным в том и только в том случае, когда оно содержит тождественное отношение. Отношение R симметрично тогда и только тогда, когда Л = Л-1. Отношение Л транзитив· но тогда и только тогда, когда Л о Л С Л. Рефлексивное, симметричное и транзитивное отношение называется отношением эквивалентности. Эквивалентность элементов а и b обозначается а ~ Ь.
1.3. Отображения 13 Пусть ~ — отношение эквивалентности на множестве А и аеА Подмножество А~ множества Д состоящее из всех таких элементов χ 6 А, что χ ~ α7 называется классом эквивалентности элемента а. Лемма 1,2, Всякое отношение эквивалентности на множестве А определяет разбиение множества А на непустые классы эквивалентности. Различные классы эквивалентности не пересекаются: если а ~ Ь, то А^ = А^, и если а ^ Ъ, то А~Г\А£ = 0. Обратно, всякое разбиение множества А на непустые непересекающиеся подмножества определяет некоторое отношение эквивалентности на множестве А. Если ~ — отношение эквивалентности на множестве А, то множество классов эквивалентности называется фактор-множеством множества А по эквивалентности ~ и обозначается А/~ = {А~:аеА}. 1.3. Отображения Пусть R — отношение из А в В. Отношение R называется однозначным или функциональным, если для каждого элемента α из Л из того, что aRb и aRc, следует b = с. Отношение R называется тотальным, или всюду определенным на А, если для каждого a G А найдется такой элемент b £ В, что выполнено aRb. Однозначное всюду определенное1) на множестве А отношение R С А х В называется отображением или функцией из А в В. Для однозначных отношений (отображений) вместо записи aRb используется запись b = Д(а), а сами они обозначаются строчными латинскими или греческими буквами: /, р, у>, ^> и т. д. Для отображения / из А в В используется обозначение «/ : А —► 1' Наряду со всюду определенными функциями важную роль в дискретной математике играют также функции частичные (однозначные нетотальные отношения). Однако далее они почти не встретятся, поэтому для удобства будем считать, что значения функции / : Л —► В определены на всем множестве А.
14 Глава 1. Множества и отображения —> В». Множество А называется областью определения, а В — областью значений /. Если b = /(α), то а называется аргументом, а Ь — значением функции / на аргументе а. Сужением функции / : А —*► В на множество С С А называется функция f\c = {(a,b)ef:aeC}. Пример 1.1* Пусть N — произвольное множество, А — подмножество N. Функция Ха{%) ' N —> {0,1} называется характеристической функцией множества А, если \а(х) — 1 ПРИ ж € А и Хл(^) = 0 при χ £ Α.Ώ Множество Im/ = {/(α) : α € Л} С Б называется образом отображения / из А в В. Наряду с Im / для образа часто используется и обозначение f(A). Множество /_1(6) = {а £ А : 6 = /(а)} С А называется прообразом элемента b £ В. Отображение / : А —► В называется сюрьективным в случае Im/ = В, т.е. тогда, когда прообраз любого элемента из В непуст. Отображение / называется инъектиеным, когда из а ф af следует f(a) φ /(<*')> т-е- все значения / на элементах из А различны. Инъективное и сюръективное отображение называется биективным или взаимно однозначным. Отметим, что задание области определения и области значений отображения существенны для его определения. Так, отображения /:N—^NnpiR—^R, будучи определены одним правилом /(а) = а3 и д(а) = а3, имеют разные свойства: / инъективно, но не сюръективно, а д — биекция. По определению, равенство двух отображений /, д означает совпадение областей определения и значений: f : А —> В и д : А —> В, причем /(а) = д(а) для всех а £ А. Композицией, а также суперпозицией или произведением1^ отображений g:A^Bnf:B^C называется отображение / о g : А —> С, определяемое при каждом χ £ А равенством (fog)(x) = f(g(x)). -'Определение композиции отображений является следствием определения композиции отношений, однако ввиду его особой важности мы дали его явно.
1.3. Отображения 15 В дальнейшем вместо / о д мы будем часто писать просто fg. Отметим, что композиция определена не для любых отображений / и д: область определения / должна совпадать с областью значений д. Следующая теорема формулирует важнейшее свойство композиции отображений, которое неоднократно будет использовано ниже. Теорема 1.1* Композиция отображений ассоциативна. Точнее, если h : А ^> В, д : В ^> С и f : С ^> D — три отображения, то / о (д о h) = (/ о д) о h. Доказательство. Сравним значения отображений fo(goh) : А —*► D и (/ о д) о h : А —* D на произвольном элементе χ € А. Согласно определению композиции, (/ о (д о h))(x) = /((</ о h)(x)) = f{g(h(x))). С другой стороны, ((fog)oh)(x) = (fog)(h(x))=f{g(h(x))). Сравнивая правые части двух последних равенств, убеждаемся в том, что (/ о {д о h))(x) = ((/ о д) oh) (x) при любом х. Следовательно, отображения fo(goh) и {fog) oh совпадают согласно определению равенства отображений. Приведенные рассуждения наглядно демонстрирует диаграмма, изображенная ниже на рисунке. Про подобные диаграммы A D Ι Χ ίο s* f в - .с говорят, что они коммутативны: результат перехода от одной ее фиксированной вершины к другой не зависит от пути из ориентированных ребер. Так, пунктирное ребро φ соответствует
16 Глава 1. Множества и отображения композиции φ = д о /г, а результат перехода от А к С (согласно определению композиции) не зависит от того, сделать ли это сразу по пунктирному ребру, или через В по ребрам, помеченным h и р. Аналогично другое пунктирное ребро диаграммы задает отображение ф = / од. Ориентированный путь φ, f приводит из А туда же, куда и путь /ι, ψ (а также путь /&,#,/), поэтому отображения / о φ и ψ о h равны. Теорема доказана. Далее ввиду доказанной ассоциативности в выражениях вида / ° (9 ° h) будем опускать скобки и писать просто f о д oh. Заметим, что композиция отображений, вообще говоря, некоммутативна, т.е. fog ф д о f даже в том случае, когда оба эти выражения имеют смысл (например /, ρ : А —>► А). Однако если мы обозначим ел отображение, переводящее каждый элемент χ € А в себя (такое отображение называется тождественным или единичным), то очевидно получим / о ел = е>А° f = f Для любого / из А в А. Если композиция fog отображений f:B^Ang:A^>B совпадает с тождественным отображением е^7 то говорят, что / — левое обратное отображение к #, a g — правое обратное к /. Если одновременно / о g = ел и g о f = ев, то говорят, что отображение / — обратное к д, отображение д — обратное к /, и пишут, соответственно, / = д~1 и д = /_1. Отображение называется обратимым (слева, справа), если оно имеет (левое, правое) обратное отображение. Следующую простую теорему об обратимости отображений приведем без доказательства. Теорема 1*2. Отображение: 1) обратимо слева тогда и только тогда, когда оно инъективно; 2) обратимо справа тогда и только тогда, когда оно сюръективно-, 3) обратимо тогда и только тогда, когда оно биективно. Пример 1*2. Пусть / отображает множество А = {0,1,..., 5} в множество В = {0,1,..., 10} по правилу f{x) = 2ж, a g отображает В в А по правилу д(х) = [ж/2_|· Легко видеть, что / инъективно, а д сюръективно. При этом д о / = ел, и хотя композиция fog существует, она не равна ев- Π Так как композиция биективных отображений биективна, то,
1.4· Конечные множества и их мощности 17 очевидно, имеет место следующее утверждение об обратимости композиции обратимых отображений. Теорема 1*3. Композиция обратимых отображений обратима. Пример 1.3· Рассмотрим множество целых чисел Ζ и его несобственное подмножество 2Ζ, состоящее из всех четных чисел. Нетрудно видеть, что отображение / : Ζ —► 2Ζ, действующее по правилу f{n) = 2га, является взаимно однозначным и обладает обратным /_1 : 2Z —> Z, действующим по правилу f~1(2n) = га. Также взаимно однозначным будет сужение /2Z отображения / на множество 2Z. Поэтому композиция /2Z ° /> отображающая целые числа в множество 4Z, состоящее из всех целых кратных четырем, является обратимым отображением с обратным д~1 : 4Z —> Z, действующим по правилу р(4га) = п. □ Говорят, что множества Аи В равномощны, если существует взаимно однозначное отображение А в В (очевидно, что одновременно существует и взаимно однозначное отображение В в А). Легко видеть, что два конечных множества равномощны, если их мощности равны. Поэтому никакое конечное множество не равномощно никакому своему собственному подмножеству. Для бесконечных множеств это не так. Пример 1.4* В силу предыдущего примера множества Ζ, 2Ζ и 4Z равномощны. □ 1.4. Конечные множества и их мощности Пусть А = {αϊ, ·.. j an} — конечное множество. Совокупность из к элементов множества А (не обязательно различных) называется к-выборкой множества А. Выборка называется упорядоченной^ если каждому ее элементу поставлен в соответствие номер — натуральное число, не превосходящее к так, что разным элементам соответствуют разные числа. Упорядоченные выборки будем называть также наборами. Элементы упорядоченных выборок будем заключать в круглые скобки, а элементы неупорядоченных выборок — в фигурные скобки. Например,
18 Глава 1. Множества и отображения (αϊ, α2, аг) и (&2> αϊ, аг) — две различные упорядоченные выборки, а {αι,α2,α2} и {α2,αι,α2} — одна и та же неупорядоченная выборка. Перестановкой η-элементного множества А = {αι,...,α«,} называется любой набор (а^,..., йгп)> состоящий из элементов А, в котором каждый элемент из А встречается ровно один раз. Например, у трехэлементного множества {αϊ, аг, аз} существует ровно шесть различных перестановок: (αϊ, 02, аз), (αϊ, аз, аг), (а2, αϊ, аз), (а2, аз, αϊ), (аз, αϊ, аг), (аз, а% αϊ). Найдем число Рп различных перестановок га-элементного множества. Для этого из η-элементного множества будем последовательно выбирать элементы и формировать из них упорядоченную выборку: первый выбранный элемент станет первым элементом упорядоченной выборки, второй — вторым и т. д. Нетрудно видеть, что первый элемент можно выбрать га способами. Второй элемент будет выбираться из (га — 1) оставшихся элементов, поэтому его можно выбрать (га — 1) способом. Продолжая выбор, заметим, что после выбора первых к элементов останется (га — к) невыбранных элементов. Следовательно, (& + 1)-й элемент можно выбрать (га — к) способами. Перемножив числа способов, которыми можно выбрать первый, второй, ..., (га — 1)-й и га-й элементы, получим величину, равную числу способов, которыми можно упорядочить га-элементное множество. Таким образом, Ρη = η·(η-1)·...·2· 1 =nl (1.1) Размещением из га элементов по к называется произвольная перестановка ^-элементного подмножества га-элементного множества. Для обозначения числа размещений из га элементов по к используется символ А£. Рассуждениями, аналогичными приведенным выше при определении величины Рп, нетрудно показать, что Λ*=η(η-1)....·(η-* + 1) = ^-ή^. (1.2)
1.4· Конечные множества и их мощности 19 Сочетанием из η элементов по к называется произвольное к- элементное подмножество η-элементного множества. Число сочетаний из η элементов по к обозначается через (^) (иногда также используется символ С^). Так как у одного fc-элементного подмножества существует ровно к\ различных перестановок, то из (1.2) легко следует, что С) п\ _ п{п- 1) · ... -(п-к + 1) ( , (п-к)\к\ *(*-!)....-2-1 Из равенства (1.3) легко вытекают следующие часто используемые свойства сочетаний: п \ _ / п к) \п-к GbG-XV) ("> Сочетанием с повторениями из η элементов по к называется неупорядоченная fc-выборка η-элементного множества. Например, из трех элементов αϊ, аг и аз можно составить шесть сочетаний с повторениями по два элемента: αιαι, aiu2, aids, аъаъ, α<ια$, а$а$. Каждое сочетание с повторениями из η элементов по к однозначно определяется тем, сколько раз каждый элемент множества входит в рассматриваемое сочетание. Пусть в некоторое такое сочетание элемент а% входит Шг раз, где г = 1,2,...,п. Этому сочетанию поставим в соответствие набор Н^Л О Ь^Л О °L^S (L5) mi mi m<n из к единиц, сгруппированных в η блоков, и η — 1 нулей, разделяющих эти блоки. В этом наборе первый блок из гп\ единиц соответствует элементу mi, второй блок из πΐ2 единиц — элементу а2, и т.д. Приведенным выше двухэлементным сочетаниям соответствуют следующие шесть наборов: 1100, 1010, 1001, ОНО, 0101, ООН.
20 Глава 1. Множества и отображения Очевидно, что набор вида (1.5) однозначно определяет соответствующее ему сочетание с повторениями. Поэтому число Н^ сочетаний с повторениями из η элементов по к равно числу наборов из к единиц и η — 1 нулей. Каждый такой набор можно рассматривать как набор значений характеристической функции fc-элементного подмножества (п + к — 1)-элементного множества. Следовательно, Тк fn + k-l\ (n + fc-1)! Ип \ к J (n-l)Ufc! Числа сочетаний (£) называются также биномиальными коэффициентами, так как они появляются в формуле бинома Ньютона (ΐ+*Οη = Σ (£)**· (1-6) Справедливость равенства (1.6) следует из того, что после раскрытия скобок в выражении (1+х)п коэффициент при fc-й степени переменной χ будет равен числу способов, которыми можно выбрать к раз переменную χ из η двучленов (1 + х). Пример 1,5, В η-элементном множестве найдем число подмножеств четной и нечетной мощности. Очевидно, эти числа равны Σΐ=ο (2/с) и ΣΪ=ο (2Д1)' Для вычисления этих сумм воспользуемся формулой бинома Ньютона. Подставляя в (1.6) вместо χ единицу и минус единицу, получим тождества ς(ΙΗ ς<-ι>·©=* к=0 х ' к=0 х ' Вычисляя сумму и разность этих тождеств и деля результаты пополам, получаем, что \п/2\ , N [п/2\ и—η > ' ^—η ν / Таким образом, в η-элементном множестве существует ровно 2п~1 подмножеств четной мощности и столько же подмножеств нечетной мощности. D
1.4· Конечные множества и их мощности 21 Полезным средством при подсчете числа элементов различных множеств является формула включений и исключений, которая выражает мощность объединения множеств через мощности их пересечений. Для двух множеств эта формула выглядит достаточно просто: \ΑΌΒ\ = \Α\ + \Β\-\Α(ΛΒ\. В общем случае справедлива следующая теорема. Теорема 1,4, Для любых конечных множеств Αι,. >., Ап справедливо равенство \A1\J---uAn\= Σ \Α*\- Σ Ι^ι П А^| + ... ••• + (-l)fc+1 £ \Ahn---nAik\ + ... (1.7) ••· + (-1)η+1|Λ1η...ηΛ,|. Доказательство. Пусть целое т не меньше нуля и не больше т. Допустим, что некоторый элемент а принадлежит ровно т множествам. Тогда а принадлежит (™) попарным пересечениям множеств Αι,..., An, (™) тройным пересечениям этих множеств, и в общем случае (™) пересечениям по к множеств. Следовательно, в сумме, стоящей в правой части (1.7), этот элемент будет учтен ровно (:Н™)+ +(-i)t+t)+ +(-^ <Le> раз. Из (1.6) следует, что ('-«-='-(Т)+(?)--+ Поэтому сумма (1.8) равна единице. Следовательно, в правой части (1.7) каждый элемент, принадлежащий объединению множеств А$, учитывается ровно один раз, и поэтому вся сумма равна мощности объединения этих множеств. Теорема доказана.
22 Глава 1. Множества и отображения Пример 1.6. Найдем число N(n, га) сюръективных отображений η-элементного множества А = {αϊ,..., ап} в т-элемент- ное множество В = {&ь ..., Ьт}. Каждое такое отображение / однозначно определяется набором образов (/(ai),...,/(an)) = (6il)...,bin) (1.9) всех элементов множества А, в котором встречается каждый элемент множества В. Легко видеть, что существует ровно тп отображений (не обязательно сюръективных) множества А в множество В. Из всех таких отображений составим т подмножеств iVi,. · ♦ j 7Vm, так, что Ni будет состоять из всех тех отображений, при которых элемент bi не имеет прообраза в А, т.е. этот элемент отсутствует в наборе (1.8). Тогда N(n,m) = _ тп _ |д^ у ... у Nm\, где мощность объединения находится при помощи формулы включений-исключений. Следовательно, Щп, т) = тп - \Ni U · · · U Nm\ = ••• + (-l)fc £ |iVnn--.ni\y+... ••• + (-i)m|^in---nJVm|. Отображения из множества Ν^Π- · -ΠΛ^ можно получить отображая элементы множества А в множество {Ь*1? ♦ *., hk }. Следовательно, l^n-.-nTNy = (га-А;Г- Подставляя это равенство в предыдущую формулу и учитывая, что число различных множеств N^ П · · · Π Λ^ равно (™), получаем искомое число /С—U гС—U
Задачи 23 Задачи 1.1. Пусть R = {(а, Ь) : а, Ь £ N, а = Ь2}. Какими свойствами обладает отношение R? 1.2. Доказать, что если \А\ = п, то число различных бинарных 2 отношений на множестве А равно 2П . Сколько среди них рефлексивных, симметричных? 1.3. Привести примеры отношений: 1) не рефлексивного, но симметричного и транзитивного; 2) не симметричного, но рефлексивного и транзитивного; 3) не транзитивного, но симметричного и рефлексивного. 1.4. На множестве прямых на плоскости рассмотрим отношения: 1) параллельности прямых; 2) перпендикулярности прямых. Определить, будут ли эти отношения отношениями эквивалентности. 1.5. Доказать, что пересечение двух отношений эквивалентности на некотором множестве также является отношением эквивалентности на нем. 1.6. Отношение R на множестве А называется антисимметричным, если для любых а, Ь € А из aRb и bRa следует а = Ъ. Рефлексивное, антисимметричное и транзитивное отношение называется отношением частичного порядка на множестве А и обозначается символом =4. Множество А с отношением =4 называется частично упорядоченным. Показать, что множество 2х всех подмножеств конечного множества X с отношением включения «С» является частично упорядоченным и что всякое частично упорядоченное множество X изоморфно некоторой системе своих подмножеств, частично упорядоченной отношением включения. 1.7. Доказать, что если R — частичный порядок, то R~x — также частичный порядок. 1.8. Отношение частичного порядка на множестве А, для которого любые два элемента сравнимы, т. е. а *$ Ъ или b =4 а для любых a, b £ € А, называется отношением линейного порядка. Доказать, что всякий частичный порядок на конечном множестве может быть продолжен до линейного порядка. 1.9. Привести пример линейного порядка на множестве Ν χ N. 1.10. Доказать леммы 1.1 и 1.2. 1.11. Доказать теорему 1.2 для отображений на конечных множествах.
24 Глава 1. Множества и отображения 1.12. Установить взаимно однозначное соответствие между множествами целых и рациональных чисел. 1.13. Найти сумму ΣΣ=ο*(*)· 1.14. Найти число п-элементных перестановок (ii,..., гп) множества {1,..., п} таких, что к ^ ύ для к = 1,..., п. 1.15. Найти число прямоугольных таблиц из η строк и m столбцов с элементами ±1, у которых произведения всех элементов каждой строки и каждого столбца положительны. 1.16. За круглым столом сидят η человек. Сколькими способами из них можно выбрать к человек так, чтобы среди выбранных не было соседей. 1.17. Найти число натуральных решений уравнения х\-\ \-х& = = п. 1.18. Сколько существует натуральных десятичных п-разрядных чисел, у которых цифры следуют в невозрастающем порядке? 1.19. Доказать, что (*1+ ··· + **)*= Σ п\ т\\ ♦ · · mfc! τπ\-\-·· -\-гпк=ть 1.20. Выразить функцию χΑλυ· иАп(%) через функции χ^{χ). 1.21. Используя предыдущую задачу, доказать формулу включений-исключений.
Глава 2 Целые числа Эта глава является кратким введением в элементарную теорию чисел. В ней содержатся простые и в то же время необходимые для изучения появляющихся далее алгебраических структур сведения о целых числах и их свойствах. 2.1. Делимость. Алгоритм Евклида Будем говорить, что целое число а делится на целое число 6^0, если существует такое целое с, что а = be. Если целое а делится на целое 6, то число Ь будем называть делителем а, и будем говорить, что Ь делит а и обозначать это так: Ь \ а. Очевидно, что для каждого а Ф 0 числа ±а и ±1 являются делителями а. Такие делители будем называть тривиальными. Если Ъ не делит а, то запишем b \ а. Свойство одного числа делить другое задает на множестве целых чисел отношение делимости «|», которое, как нетрудно видеть, является транзитивным (если Ь|аис|Ь7тос|а)и обладает следующими простыми свойствами: если а \ b и b \ а, то а = ±6; если с \ а и с \ 6, то с \ а ± 6; если с \ 6, то с \ ab. Доказываемая далее теорема играет фундаментальную роль при изучении свойств целых чисел и называется теоремой о делении с остатком. Теорема 2.1. Для любых целого а и натурального b найдут· ея, и притом единственные, такие целые q иг, что а = qb + r, где 0 ^ г < Ь.
26 Глава 2. Целые числа Доказательство. Рассмотрим множество целых неотрицательных чисел вида а — Ък, где к — целое. Пусть г = а — bq — наименьший неотрицательный элемент этого множества. Тогда О ^ г < Ь. Если это не так и г = а — bq ^ 6, то неравенство О < α — (q + 1)Ь < г противоречит минимальности г. Докажем единственность указанного представления. Предположим, что а = qb + г = qfb + rf и 0 < г < г' < 6. Отсюда {q! — q)b = rf — r, т.е. неотрицательное число г' —г делится на Ь. С другой стороны г* — г < Ь. Противоречие. Следовательно, г = т1 и (qf — q)b = О, т. е. q = </. Теорема доказана. Число г из теоремы 2Л называется остатком от деления α на 6, а число g — (не)полным частным или целой частью дроби ^ и обозначается 1^1. Целое 6, которое делит каждое из целых чисел αϊ, аг,..., αη, называется общим делителем этих чисел. Наибольшее число среди общих делителей чисел αϊ, α2,..., ап называется их наибольшим общим делителем и обозначается символом (αϊ, α2,..., αη) или Н0Д(а1,а2,..., ап). Например, (2,4,6) = 2. Легко видеть, что если целые а и Ъ не имеют нетривиальных общих делителей, то (а, Ь) = 1. Такие числа называются взаимно простыми. Теорема 2,2 (Евклид). Для любых двух натуральных а и Ь минимальное натуральное d, для которого справедливо равенство d = ax + by, где χ и у целые, является наибольшим общим делителем чисел а и Ь. Доказательство. Рассмотрим множество {ax + by} всех линейных комбинаций чисел α и b с различными целыми коэффициентами χ и у. Пусть d = axo + byo — минимальное натуральное число этого множества. Покажем, что а делится на d. Для этого разделим a us, d с остатком и представим его в виде а = qd + г, где 0 ίζ τ < d. Тогда г = a — qd = a — q(axo + Ьуо) = = а(1 - qx0) - b(qy0) = ах\ + byh где χι = l—qxo и у\ = — qyo> Так как d — минимальное натуральное число множества {ax+by} и г < d, то г = 0 и, следовательно,
2.1. Делимость. Алгоритм Евклида 27 а делится на d Аналогичным образом доказывается делимость на d числа Ь. Следовательно, d является общим делителем чисел а и Ъ. Теперь покажем, что d будет наибольшим общим делителем. Действительно, если а и b делятся на d · d', где df > 1, то в равенстве d = ахо + Ьуо правая часть будет делиться на d * d', a левая не будет Следовательно, d = (α, b). Теорема доказана. Рассмотрим алгоритм нахождения наибольшего общего делителя двух натуральных чисел а и Ь. Будем полагать, что а > Ь. Тогда а = q\b + ri, где 0 ^ Т\ < Ь. Легко видеть, что (а,Ь) = {Ь,Г\)> Поэтому вместо (а,Ь) будем искать (6,п). Продолжая подобные рассуждения, получим цепочку равенств a=bqi+ru (α, 6) = (6,η), b=nq2 + r2j (6, П) = (rbr2), П =r2q$ + r3, (η, r2) = (r2, r3), (2.1) ^n-2 =rn-iq<n + rn, (rn_2,r^_i) = (rn_brn), в которой последний положительный остаток гп и будет наибольшим общим делителем чисел а и Ь. Приведенный алгоритм нахождения наибольшего общего делителя называется алгоритмом Евклида, а вычисление очередного остатка Г; называется г-м шагом этого алгоритма. Алгоритм (2.1) состоит из (п + 1) шагов, а если тп = 1, то из η шагов, так как последнее деление на единицу можно не выполнять. Заметим, что остатки Ti в алгоритме Евклида убывают, оставаясь положительными, поэтому очевидно, что алгоритм остановится за конечное число шагов. Оценим число шагов в алгоритме Евклида. Для этого рассмотрим последовательность {an}'£>=v которая начинается с чисел 1,2, 3, 5,8,13, 21,34, 55,89,144,..., (2.2) и в которой каждый член, начиная с третьего, равен сумме двух предыдущих. Применяя алгоритм Евклида к числам ап+2
28 Глава 2. Целые числа и Огн-1, нетрудно убедиться, что для определения наибольшего общего делителя этих чисел потребуется ровно η шагов алгоритма и что (αη+2? Дп+i) = 1. Например, для η = 2 наибольший общий делитель чисел а± = 5 и аз = 3 определяется за два шага: 5 = 3-1 + 2, 3 = 2-1 + 1. Теперь покажем, что определение наибольшего общего делителя чисел αη+2 и &η+ι требует максимального количества шагов алгоритма Евклида среди всех пар натуральных чисел χ и у, в которых меньшее число не превосходит αη+χ. Сделаем это индукцией по п. Далее везде полагаем, что у < х. Если з/^а1,топ = 0и(£, у) = I определяется без выполнения делений. Если у<й2 = 2, топ=1и легко видеть, что (#, у) можно найти, выполнив только один шаг алгоритма Евклида. Два эти случая (п = 0,1) положим в основание индукции. Предположим, что наибольший общий делитель любых натуральных xf и yf можно найти, выполнив самое большее η шагов алгоритма Евклида, если только х1 > у* и у1 < ап+1< Рассмотрим натуральные χ и у такие, что χ > у, у < αη+2 и тг > 1. Тогда χ = yqi +r\. Если г ι ^ fln+ъ то в силу предположения индукции наибольший общий делитель чисел у и Г\ можно найти, выполнив не более чем η делений, и, следовательно, для определения (#, у) потребуется выполнить не более чем (п + 1) шагов алгоритма Евклида. Пусть теперь η > θη+\· В этом случае у = ri<?2 + ^2? гДе Т2 ^ У — Τι < αη_|_2 — G>n+1 = ctri- Следовательно, в силу предположения индукции наибольший общий делитель чисел η и Г2 можно найти, выполнив не более чем (п — 1) делений. Поэтому для определения (ху у) достаточно выполнить самое большее (п + 1) шагов алгоритма Евклида. Полученный результат сформулируем в виде следующей теоремы о сложности алгоритма Евклида. Теорема 2*3. Если меньшее из двух натуральных чисел не превосходит αη+ι, то наибольший общий делитель этих чисел
2.1. Делимость. Алгоритм Евклида 29 можно найти, выполнив самое большее η тагов алгоритма Евклида. Вычисление наибольшего общего делителя чисел αη+2 и αη_|_ι требует выполнения ровно η шагов алгоритма Евклида. Покажем, что при каждом натуральном к для членов последовательности (2.2) имеет место равенство ак = ±(ак^-Рк+1), (2.3) в котором постоянные а = ι у 5 и β = 1-2 являются корнями уравнения х2 — χ — 1 = 0. Сделаем это индукцией по к. Так как а + β = 1, αβ = -1, α2 = а + 1, /З2 = β + 1 и α - β = л/5, то легко видеть, что α2 - β2 = (α - /3)(α + β) = л/5, α3 - /З3 = (α - β) (α2 + α/3 + β2) = (α - /3) {α + β + 1) = 2\/5. Поэтому -J- (α2 - /32) = 1 = αϊ и -J- (α3 - /33) = 2 = α2. Таким образом, два первых члена последовательности (2.2) удовлетворяют равенству (2.3). Эти равенства положим в основание индукции. Предположим, что равенство (2.3) также справедливо при всех fc, не превосходящих некоторое га. Тогда из предположения индукции и равенства αη+2 = αη+ι + ап имеем Ят+2 — Ят+1 + ат = = ±={ат+2 -(Г+2) + -^(ат+1-ат+1) = = 1=(ат+1{а + 1)-рт+1{р + 1))=^={ат+3-рт+3). Равенство (2.3) доказано. Воспользуемся теоремой 2.3 и равенством (2.3) для оценки числа шагов алгоритма Евклида, достаточного для нахождения наибольшего общего делителя натуральных чисел а и 6. Допустим, что меньшее число b удовлетворяет неравенствам
30 Глава 2. Целые числа о»п < Ь < αη+ι· Тогда из теоремы 2.3 следует, что для вычисления (а, Ь) потребуется не более η шагов. Величину η оценим при помощи (2.3). Из этого неравенства легко следует, что ап ^ αη. Поэтому loga Ь > loga an > loga an = п. Так как ί1^) > 10, то, переходя к десятичным логарифмам, получим следующую оценку числа п: η < loga 6=5 loga5 6 < 51og10 6. Из полученного неравенства немедленно следует теорема Ламе о максимально возможном числе шагов в алгоритме Евклида. Теорема 2.4 (Ламе). Число шагов алгоритма Евклида при определении наибольшего общего делителя двух чисел не превосходит пятикратную длину десятичной записи меньшего из этих чисел. Заметим, что алгоритм Евклида можно использовать для вычисления целых χ и у, удовлетворяющих равенству (а, Ь) = = ах + by (такие х, у называются коэффициентами Везу для чисел а, 6)* Для этого с помощью предпоследнего равенства из (2.1) надо выразить (а, 6) через гп-\ и гп-2- Затем в полученном равенстве вместо rn-\ надо подставить его выражение через гп_2 и г^_з, и т.д. Рассмотрим этот алгоритм на следующем примере. Пример 2.1, Ниже в левом столбце вычисляется наибольший общий делитель 73 и 14, а в правом находятся целые χ и у, для которых (73,14) = 73х + 1%: 73 = 14-5 + 3, 1=3-2, 14 = 3-4 + 2, 1 =3- (14 -3-4), 3=2-1 + 1. 1 = (73 - 14 · 5) - (14 - (73 - 14 - 5)4) = = 73(1+4)-14(5+ 1 + 20) = = 73-5-14-26· Таким образом, (73,14) = 1, χ = 5, у = —26. D
2.1. Делимость. Алгоритм Евклида 31 Предложенный выше способ вычисления коэффициентов Везу можно условно разделить на два этапа: прямой ход (вычисление остатков Г{ и неполных частных <fe при возрастающем г) и обратный ход (последовательное вычисление коэффициентов линейных комбинаций Τχ и rvi при убывающем г). Это не всегда удобно, поскольку требует дополнительных затрат памяти на хранение r^ qi и рекурсию. Существует модификация алгоритма Евклида, свободная от этого недостатка. Ее формулировка использует арифметические операции над упорядоченными наборами чисел, называемыми векторами. Подробнее о векторах мы расскажем в главе 5, а здесь просто будем пользоваться записью q · (ж, у, ζ) для обозначения упорядоченной тройки (qx, qyy qz) и записью (χ, у, ζ) ± (χ', у', zf) для тройки (х±х\ y±yf, z±zf), считая, как обычно, что умножение имеет более высокий приоритет, чем сложение и вычитание, а равенство упорядоченных наборов означает равенство всех их компонент. Лемма 2Л (Расширенный алгоритм Евклида). Пусть а, 6 G € N и а > Ь. Рассмотрим последовательность {Xi,yi,Zi) € Ί?7 г = —1,0,1,2,..., такуюу что (2.4) х% Уг I = I Уг-2 I - Qi I Уг-1 I , (2.5) ,ζ. где qi = L^-2/^-iJ· Тогда 1) числа Zi, г ^ 1 совпадают с остатками, полученными на %-м шаге деления в алгоритме Евклида поиска НОД(а, Ь) (см. (2.1)); 2) при любом г ^ — 1 выполнено равенство CtXi + Ьуг = Zi; (2.6) 3) если η — число делений с остатком в алгоритме Евклида, то ζη = (а, Ь), причем хп и уп — искомые коэффициенты Везу линейной комбинации ахп + Ьуп = (а, 6),
32 Глава 2. Целые числа Доказательство. 1. Равенство (2.5) показывает, что для третьей координаты вектора [x^y^Zi) выполнено z% = z%-2 — — \_Zi-2lZi-\\ Zi-i, т.е. Zi является остатком от деления Zi-2 на Zi-i. Поэтому последовательность {zi} совпадает с последовательностью {и} остатков алгоритма Евклида для r_i = Ζ-\ = α, го = ζο = Ь. 2. Докажем искомое равенство по индукции. При г = —1,0 оно верно в силу выбора начальных условий (2.4). Пусть аХ{-2 + +byi-2 = Zi-2 и aXi-i + Ьуг-\ = Ζχ-\. Тогда из (2.5) имеем aXi + Ьуг = а(Хг-2 - QiXi-i) + Ь{уг-2 - ftj/i-l) = = (aXi-2 + Ьуг-2) - qi{axi-i + %-ι) = = Zi-2 - QiZi-l = Zi. 3, Искомое утверждение непосредственно следует из пи. 1—2. Лемма доказана. Пример 2*2* Применим алгоритм леммы 2.1 к числам из примера 2.1. Вычисления, производимые этим алгоритмом, удобно сводить в таблицу: 1 0 73 0 1 14 1 -5 3 -4 21 2 5 -26 1 0 Два ее первых столбца являются начальными условиями (2.4). Согласно (2.5), каждый очередной столбец таблицы, имеющий номер г ^ 1, вычисляется как линейная комбинация двух стоящих слева от него столбцов с коэффициентами 1 и (—ф). Нижняя строка таблицы содержит остатки алгоритма Евклида. Вычисления оканчиваются, как только в нижней строке появился нуль. Тогда последний ненулевой остаток — это НОД(73,14), а над ним в таблице находятся коэффициенты Везу искомой линейной комбинации: 1 = (73,14) = 73-5 + 14-(-26). Отметим, что объем дополнительной памяти для данного алгоритма весьма скромен: для проведения вычислений по формуле (2.5) достаточно всего 10 целочисленных переменных. □
2.2. Разложение на простые множители 33 Целое положительное 6, которое делится на каждое из целых чисел αι,α-2,.. · ,αη, называется общим кратным этих чисел. Наименьшее положительное число среди общих кратных чисел αι,α2,.. .,<Хп называется их наименьшим общим кратным и обозначается символом ΗΟΚ(αι, а2,.**, α™)- Например, Н0К(2,4,6) = 12. Можно показать, что НОД(а, Ь) - НОК(а, Ь) = = ab для любых натуральных а и 6. 2.2· Разложение на простые множители Натуральное число ρ называется простым, если у него есть ровно два различных натуральных делителя — единица и само число р. Среди первых тридцати натуральных чисел простыми являются 2, 3, 5, 7, 11, 13, 17, 19, 23, 29. Из определения простого числа легко следует, что любое натуральное число можно разложить в произведение простых, например 12 = 2-2-3. Покажем, что такое разложение единственно с точностью до порядка следования сомножителей. Сначала докажем две простые леммы. Лемма 2*2. Если произведение ab натуральных а и b делится на простое р, то хотя бы один из сомножителей также делится на р. Доказательство. Допустим, что утверждение леммы не верно. Тогда ни один из сомножителей не делится на р. Следовательно, (α,ρ) = 1 и (6, р) = 1, и из утверждения теоремы 2.2 следует, что найдутся такие целые ж ι, ж 2 и УъУ2-> что 1 = Х\а + х2р, 1 = у\Ь + у2р~ Перемножив эти равенства, получим, что 1 = (Xla + х2р){у\Ь + у2р) = = {х\У\)аЬ + р{х2У\Ъ + х\у2а + Х2У2Р),
34 Глава 2. Целые числа т.е. в силу теоремы 2.2 числа ab и ρ взаимно просты. Противоречие. Лемма доказана. Лемма 2*3. Если произведение a\d2 * · · ап натуральных а% делится на простое ρ, πιο хотя бы один из сомножителей также делится на р. Доказательство. Лемму докажем индукцией по числу сомножителей. Случай η = 2 доказан в предыдущей лемме. Допустим, утверждение леммы справедливо для любых произведений, содержащих не более к сомножителей. Тогда если произведение (αι<ϊ2 * · · Q<k)ak+1 делится нар, то из леммы 2.2 следует, что либо а\й2 · · · йкч либо ajfe+i делится на р. В первом случае утверждение леммы следует из предположения индукции. Во втором случае справедливость леммы очевидна. Лемма доказана. Теперь можно доказать основную теорему арифметики о единственности разложения целого числа на простые сомножители. Теорема 2.5, Любое натуральное число единственным образом раскладывается в произведение простых сомножителей и притом единственным образом, с точностью до их порядка. Доказательство. Теорему докажем методом математической индукции. В основание индукции положим число 2, единственность разложения которого очевидна. Предположим, что каждое натуральное число, не превосходящее Ν, разлагается на простые множители единственным образом. Покажем, что из этого предположения следует единственность разложения числа N + 1. Действительно, если натуральное N + 1 имеет два различных разложения в произведение простых сомножителей, то где р\ < р2 < · · < Рп и q\ < 42 < * < Ят* Покажем, что ρλ = qlt Так как простое р\ делит произведение ίΐ · · · ίΐ 92 · · · ί2 · 'Ягп''Чт, (2.7) si раз 32 раз згп раз
2.3. Теорема Чебышёеа 35 то в силу леммы 2.3 число р\ также делит один из его сомножителей. В (2.7) все сомножители — простые числа. Следовательно, р\ совпадает с одним из них. Так какрх — минимальный простой делитель ЛГ + 1, то легко видеть, что р\ = q\. Сокращая левую и правую части равенства (2.7) на pi, получим ^=^^2'-^=9Г^2--е^ (2^8) Pi По предположению индукции натуральное (Ν+1)/ρι раскладывается на простые множители единственным образом. Поэтому в (2.8) η = т и для каждого г G {1,... ,гс} справедливы равенства pi = Qi и ki = Si- Теорема доказана. 2.3. Теорема Чебышёва Нетрудно показать, что простых чисел бесконечно много. Если это не так, то найдется максимальное простое число п. Очевидно, что п\ = Π£=ι ^ Делится без остатка на каждое простое, и, следовательно, остаток от деления п! + 1 на каждое простое равен единице, т. е. п\ + 1 не делится ни на одно из простых чисел. Поэтому либо п\ + 1 само простое, либо содержит простой делитель, больший п. Получившееся противоречие доказывает бесконечность числа простых чисел. Этот факт был известен еще Евклиду в III в. до н. э. Однако естественный вопрос о том, как часто среди натуральных чисел встречаются простые, долго оставался без ответа. Через π(χ) обозначим количество простых чисел, не превосходящих х. Если рассмотреть первые простые числа 2 3 5 7 11 13 17 19 23 29 31 37 41 43 47 53 59 61 67 71 73 79 83 89 97 101 103 107 109 113 127 131 137 139 149 151 157 163 167 173 179 181 191 199 211 223 и вычислить разности между соседними, то можно заметить, что промежутки
36 Глава 2. Целые числа 122 42424626 42 4 6 626 42646842 42 4 14 462 10 2664662 10 8 12 12 между соседними простыми в среднем возрастают, поэтому можно предположить, что π(η)/η —► 0 с ростом п. Это действительно так. Более того, Гаусс и Лежандр, в конце XVIII в. независимо друг от друга численно изучавшие функцию тг(тг) (количество вычисленных ими значений π(η) исчислялось сотнями тысяч), предположили, что имеет место асимптотическое равенство1) Φ) ~ г~> (2-9) но доказать это предположение не смогли. И только в самом конце XIX в. Адамар и Валле-Пуссен, также независимо и одновременно, установили справедливость равенства (2.9), называемого асимптотическим законом распределения простых чисел. Отметим, что первое существенное продвижение в изучении распределения простых чисел было сделано П. Л. Чебышёвым, который в середине XIX в. нашел порядок роста функции π(η), установив для нее достаточно близкие верхнюю и нижнюю оценки. Далее в теореме 2.6 докажем ослабленные оценки Чебышёва. Для этого потребуются простые неравенства ?<(2")<2- 2η \ η / для среднего биномиального коэффициента, справедливость которых при всех η > 1 легко следует из формулы бинома Ньютона. Теорема 2,6 (Чебышёв), Существуют такие постоянные С\ и С2, что для любого целого η > 2 справедливы неравенства η . , , , η с\- ^ 7г(п) sS С2-Л . log2 n log2 n Формула α (η) ~ 6 (η) означает, что lima (η)/6 (η) = 1 при η —► οο.
2.3. Теорема Чебышёеа 37 Доказательство. Сначала получим верхнюю оценку функции тг(га)* Для этого рассмотрим биномиальный коэффициент 2га\ _2η(2η-1).··(η + 1) га/ η(η—1)···2 Нетрудно видеть, что каждое простое число, которое больше га и не больше 2га, присутствует в числителе правой части (2.10) и не сокращается ни с одним из множителей знаменателя, все множители которого не превосходят га. Поэтому коэффициент ( ™) делится на все простые числа, которые больше га и не больше 2га. Всего таких чисел ровно π (2га) — π (га). Так как {^) < 22п, то справедливы неравенства (га + 1)*С*0-*(») < (2Л < 22п7 из которых после логарифмирования и несложных преобразований получим оценку разности значений функции тг на четном аргументе 2га и его половине га: 2га π(2η)-π(η) < -л . (2.11) log2ra Для степеней двойки последнее неравенство, очевидно, эквивалентно следующей рекуррентной оценке функции π (га): π(2*)<π(2*-1) + ]^. (2.12) Теперь, используя полученное рекуррентное неравенство, индукцией по к покажем, что π(2*) < -г. (2.13) В основание индукции положим очевидный случай к = 3. Далее в силу (2.12) при к > 4 имеем π(2*) < π(2*-1) + -^— ^ ^— + -±_ = |-L ^ ±-L. fc-1 k-1 k-1 k-1 к
38 Глава 2. Целые числа Наконец, при η ^ 2к < 2га из последнего неравенства следует, что 4·2к 4 · 2п тг(га) < π(2*) < < log2ra Верхняя оценка теоремы доказана. Для доказательства нижней оценки теоремы снова воспользуемся биномиальным коэффициентом ( ™). Покажем, что в его разложении '2n\ fcl fc t.„ ^214) η — Pi Pi Pm на простые множители каждый множитель р^ не превосходит 2га. Для этого определим степень £(р), с которой простое число ρ входит в разложение числа га! на простые множители. Нетрудно видеть, что среди первых η натуральных чисел ровно ^ делятся на р, -5н чисел делятся нар2, -5$- чисел делятся на р3 и т. д. Поэтому т = | LP' + η , (2.15) ™ /2η\ (2η)! 1ак как i J = , , , то степень вхождения числа ρ в разложение (2.14) равна разности степеней вхождения числа ρ в числитель и знаменатель. Из равенства (2.15) немедленно следует, что искомая величина равна сумме 2п Ρ -2 + ··· + 2п pi -2 + ... (2.16) в которой только первые Ll°gp 2nJ слагаемых могут быть отличны от нуля, так как -£ = 0 при рг > 2га. Теперь, учитывая неравенства 0 ^ \2х\ — 2\_х\ ^ 1, получаем, что сумма (2Л6), а следовательно, и степень к, с которой число ρ входит в (2Λ4), не превосходят величины [logp2raJ. Поэтому рк ^ p[\ogp2n\ ^ p\ogp2n = 2п
2.4- Сравнения 39 Таким образом, разложение (2.14) содержит не более π(2η) сомножителей, каждый из которых не превосходит 2п. Поэтому справедливы неравенства из которых после логарифмирования и несложных преобразований получим нижнюю оценку функции π для четных аргументов: 2п 1 2п π(2η) 7? -. — - 1 7? - · , —. log22n 2 log22n Аналогичная оценка справедлива и для нечетных аргументов функции π. Действительно, так как каждое четное число большее двух не является простым, то тг(2п - 1) = тг(2п) > - · —- > - · — — ν ; ν ; 2 log22n 2 log2(2n-l) для любого η ^ 2. Теорема доказана. 2 А. Сравнения Будем говорить, что целые а и b сравнимы по модулю натурального ш, если совпадают их остатки от деления на т. Сравнимость α и Ъ по модулю m будем обозначать равенством а = b (mod m), которое называется сравнением. Легко видеть, что если целые а и b сравнимы по модулю га, то их разность а — b делится наш и существует такое целое fc7 что1) а = b + km. Используя это равенство, покажем, что сравнения можно почленно складывать, вычитать и умножать. ^ Верно и обратное, поэтому а = b (mod πι) тогда и только тогда, когда найдется такое целое /с, что а = b -\- km.
40 Глава 2. Целые числа Пусть а\ = 6i(modm) и а,2 = 62 (mod m). В этом случае найдутся такие целые к\ и £;2, что αϊ = Ь\ + к\т, а,2 = &2 + А:2т. Тогда, так как αϊ + &2 = (&1 + fci^) + (&2 + к2гп) = bi + b2 + (fci + fc2)m, то αϊ + α2 = 6ι + 62 (mod га). Аналогичным образом из равенства αϊ — α2 = (δι + fcim) - (&2 + &2^) = 61 - 62 + (fci - k2)rn следует, что αχ — α2 = δι - &2 (mod m). Наконец, поскольку αι<22 = (bi + k\m){b2 + к2гп) = 6162 + (feifo + &2&i + k\k2rn)my TO а!й2 = 6162 (mod m). Если а = 6(modm), то ad = 6d(modmd) для любого натурального d. Действительно, из того, что разность b — а делится на ш, легко следует, что bd — ad делится на md> Аналогичным образом легко видеть, что если m = mid, α = aid и b = 6id, то из сравнения а = 6(modm) следует сравнение αϊ = b\ (modmi), т. е. обе части сравнения и модуль можно разделить на их общий делитель. Пусть теперь а = 6 (mod mi) и α = 6(modm2). В этом случае b — а делится на mi и Ш2 и, следовательно, делится на их наименьшее общее кратное, т. е. а = b (mod HOK(mi,m2)). Если α = b (mod miшг), то найдется такое целое fc, что а = b + k(mirri2) = b + (kmi)rri2 = b + {кгп2)га\. Следовательно, а и b сравнимы по модулям mi и m2. Отсюда видим, что из сравнения а = 6(modm) следует сравнимость α и b по модулю, равному любому делителю т*
2.5. Классы вычетов 41 2.5. Классы вычетов Сравнение чисел по модулю фиксированного натурального числа т определяет на множестве целых чисел отношение эквивалентности и разбивает это множество на классы эквивалентности, называемые классами вычетов по модулю т. Символом Mm будем обозначать класс вычетов, состоящий из всех целых чисел, сравнимых с г по модулю т. Такое обозначение неоднозначно, например, [8]з и [2]з обозначают один и тот же класс, состоящий из чисел, сравнимых с двойкой по модулю три. Такая неоднозначность доставляет определенные неудобства, избежать которые можно, используя для обозначения классов вычетов минимальные неотрицательные элементы этих классов. Множество классов вычетов по модулю т будем обозначать символом Zm, т.е. Zw = {[0]w, [l]w,..., [πι - l]w}. Выше было установлено, что сравнения по одинаковому модулю можно складывать и умножать. Воспользуемся этим и определим в Zm операции сложения и умножения классов вычетов, положив [i\rn+[j}rn= [i+j]rn, [i\m\j\m = [U'W (2.17) Пример 2,3, [5] ю + [6] ю = [П]ю = [1]ю, [5]ю[б]ю = [30] ю = [0]ю, [5]8 + [б]8 = [П]в = [3]8, [5]8[6]8 = [30]8 = [6]8. □ Введенные операции обладают многими свойствами, присущими операциям сложения и умножения целых чисел. Так, нетрудно показать, что для них справедливы законы ассоциативности (Щт + \j\rn) + [Щт = Щт + ([j]m + Mm), (MmL?]m)Mm = Щт{[з]т[Щт),
42 Глава 2. Целые числа коммутативности [i]m + \}\т = \3\m + [<]т, Щт\з\т = Lf'UMm, закон дистрибутивности ([i]m + [j]m)[k]m = ЩтЩт + [j]m[fc]m и свойства сложения с нулем и умножения на единицу [i]m + [0]т = Mm, [*]m[l]m = йт< Операции (2.17) называются сложением и умножением по модулю т. Часто бывает удобно, рассматривая классы вычетов, отождествлять сами классы вычетов и их минимальные неотрицательные элементы — использовать символ г как для целого числа из множества {0,1,..., га — 1}, так и для класса [i]w. Поэтому далее через Ът будем обозначать не только множество классов вычетов по модулю га, но и множество {0,1,..., т — 1}, подразумевая при этом, что его элементы, называемые также вычетами, складываются и умножаются по модулю га как соответствующие им классы. Если числа 5 и 6 рассматривать в качестве элементов Z§, то в соответствии с примером 2.3 их сумма равна 3, а произведение 6. Любые га чисел, принадлежащие разным классам эквивалентности в Zm, называются полной системой вычетов по модулю т. Например, четные и нечетные числа образуют классы вычетов по модулю два, а пара (3,4) является полной системой вычетов по этому модулю. Теорема 2.7. Пусть (а, т) = 1 и {х\,..., хт} — полная система вычетов по модулю т. Тогда множество {axi + b}™Llf где Ъ — произвольное целое, будет полной системой вычетов. Доказательство. Допустим, что axi + b = axj + ft(modm). Тогда в силу рассмотренных выше свойств сравнений аХ{ = = axj (modm) и, следовательно, a(xi — Xj) = fern. Так как а и га взаимно простые, то т должно делить разность Х{ — Xj, что, очевидно, невозможно. Таким образом, все га различных чисел axi + b попарно несравнимы по модулю т. Теорема доказана.
2.6. Решение сравнений 43 2.6. Решение сравнений Будем говорить, что линейное сравнение ах = Ь (mod га) разрешимо относительно переменной ж, если существует такое целое тг, что справедливо сравнение an = Ь (mod га). Если η — решение рассматриваемого сравнения, то и η + km при любом целом к также будет решением этого сравнения, т. е. решением сравнения будет класс вычетов по модулю т. Теорема 2.8. Сравнение ах = Ь (mod га) разрешимо тогда и только тогда, когда (а,т) делит Ь. Если d = (α, m) делит b7 то па множестве Ъш сравнение имеет ровно d решений, сравнимых по модулю m/d. Доказательство. Пусть xq — решение сравнения и (а, га) = = d. Тогда а = o!d и т = m!d, где а! и га' — целые. Из равенства ахо = Ь(modга) следует, что Ь = α!άχ^ — km!d = ά{α!χ$ — km!), где к — целое, т. е. d является делителем Ъ. Теперь покажем, что если d делит 6, то решение существует. Из теоремы 2.2 следует, что существуют такие целые ρ и д, что d = ap + mq. Пусть b = b!d. Тогда b = db! = a(pbf) +m(qb/) и, следовательно, a(pbf) = 6(modm). Таким образом, pb! — решение рассматриваемого сравнения. Теперь найдем число решений системы на множестве Ъш. Пусть га = m!d и Х{ и Xj — решения. Тогда afd(xi — Xj) = = O(modra'd), или после сокращения на общий множитель d, a!(xi — Xj) = 0(modга'), где (а!\т!) = 1. Из последнего равенства следует, что т* делит Xi — х^ т.е. Xi и Xj сравнимы по модулю т!'. Поэтому если xq — минимальное неотрицательное решение, то решениями в Ъш будут также числа Xq + km!\ где fc = l,...,cf—1. Теорема доказана. Будем говорить, что число а обратимо по модулю т, если разрешимо сравнение ах = 1 (mod га). Если это сравнение разрешимо, то его решение обозначим через а~1 и назовем обратным к α по модулю га* Из теоремы 2.8 легко извлекается необходимое и достаточное условие обратимости одного целого числа по модулю другого.
44 Глава 2. Целые числа Теорема 2.9. Число а обратимо по модулю т тогда и только тогда, когда (а, т) = 1. Если а обратимо по модулю т, то оно имеет единственное обратное по этому модулю. Пример 2 Л. На множестве Z73 решим сравнение 14а? = = 1 (mod 73). Так как (14, 73) = 1 (см. пример 2.1), то в силу теоремы 2.9 сравнение имеет единственное решение 14-1 (mod 73). Для нахождения обратного воспользуемся найденным в примере 2.1 равенством 1 = 73 · 5 — 14 · 26, из которого следует, что 14"1 = -26 = 47 (mod 73). □ Пример 2.5, На множестве Zr20 найдем все решения сравнения 8х = 12 (mod 20). Так как (8,20) = 4, 4 делит 12 и 20 = 4 · 5, то в силу теоремы 2.8 сравнение имеет четыре решения. Разделив элементы исходного сравнения на 4, получим новое сравнение 2х = 3(mod5), имеющее на множестве Z5 единственное решение. Так как (2, 5) = 1 = -2 · 2 + 5, то 2"1 = -2 = 3 (mod 5). Следовательно, χ = 3 · 3 = 4 (mod 5) и xq = 4 (mod 20) — решение сравнения на Z20· Остальные три решения сравнимы с найденным Xq по модулю 5. Поэтому Х\ = 97#2 = 14, #з = 19. Π 2.7. Китайская теорема об остатках Будем рассматривать системы линейных сравнений простейшего вида χ = ai (mod Pi) с попарно взаимно простыми модулями р^ Решение таких систем ниже полностью описывается в двух теоремах. Вторая из этих теорем называется китайской теоремой об остатках. Теорема 2ЛСК Пусть pi,... ,ρη — попарно взаимно простые положительные, а\у..., ап — целые. Система сравнений χ = а\ (modpi), χ = α2 (modp2), χ = αη (mod pn), имеет решение, причем все решения системы (2.18) сравнимы по модулю р\р2 ... Рп- (2.18)
2.7. Китайская теорема об остатках 45 Доказательство. Без ограничения общности будем считать, что в (2.18) каждое сц принимает значение от 0 до pi — 1. Поэтому легко видеть, что при фиксированных числах Pi,... ,Рп существует ровно Μ = ρι χ · · · χ рп различных систем вида (2.18). Столько же существует и целых чисел, принадлежащих множеству Ζμ · Так как каждое число из Ъм является решением некоторой системы (2.18), то общее число решений систем (2.18) на множестве Zjvf равно числу этих систем. Поэтому для доказательства теоремы достаточно показать, что в Ъм нет двух чисел, являющихся решениями одной и той же системы вида (2.18). Сделаем это методом от противного. Допустим, что некоторая система (2.18) имеет такие решения ζ и у, что 0 < у < ζ < Μ. В этом случае разность ζ — у удовлетворяет неравенствам 0<z-y<M (2.19) и является решением системы сравнений χ = 0 (mod pi), χ = 0 (mod p2)? ι v F h l (2.20) χ = 0 (mod pn) * Из (2.20) следует, что каждое pi делит ζ — у и, следовательно, входит в каноническое разложение ζ — у на простые множители. Поэтому ζ — у > М, что противоречит (2.19). Таким образом, каждая система вида (2.18) имеет не более одного решения среди целых неотрицательных чисел из Ζ^. Теорема доказана. Теперь найдем решение системы (2.18). Сделаем это в следующей теореме. Теорема 2Л1 (Китайская теорема об остатках)* Пусть р\, Р2> · · · >Рп — взаимно простые натуральные, αϊ,..., ап — целые, Μ = Π£=ιΡί- Единственным решением системы сравнений χ = а\ (modpi), χ = α2 (modp2), χ = αη (mod p„),
46 Глава 2. Целые числа на множестве Ъм является Χο = αιΜ1Νι + ··+αίΜίΝί^ +anMnNn (modM), (2.21) где Mi = Μ/pi и Ni = M~l (mod pi) для г = 1,2,..., п. Доказательство. Существование и единственность решения рассматриваемой системы на множестве %м следуют из предыдущей теоремы. Так как χ (mod Pi) = (χ (mod Μ)) (mod Pi) для любого х и каждого г = 1,2,...,η и, кроме того, в силу условий теоремы справедливы равенства Mj = 0 (mod Pi) при г ^ j, Μ^Λ^ = 1 (mod ρ*), то легко видеть, что Хо действительно является решением рассматриваемой системы сравнений. Теорема доказана. Пример 2.6. Решим систему сравнений χ = 1 (mod 3), Ϊ χ = 2 (mod 4), > α? = 3 (mod 5). J Нетрудно видеть, что Μ = 60, Μι = 20, М2 = 15, Мз = = 12. Кроме того, так как М\ = 2 (mod3), М2 = 3 (mod 4) и М3 = 2 (mod5), то Mf1 = 2 (mod3), M2_1 = 3 (mod4) и M^"1 = 3 (mod 5). Подставляя полученные значения в формулу (2.21), находим χ = 1 · 20 · 2 + 2 · 15 · 3 + 3 · 12 · 3 = 238 = 58 (mod 60). Следовательно, число 58 является единственным решением рассматриваемой системы на множестве Ζβο- □ Китайская теорема об остатках является мощным средством, облегчающим вычисления с большими составными модулями.
2.8. Функция Эйлера 47 Пример 2.7. Решим уравнение Xs + 12а;+15 = 0 (mod 35). Из свойств сравнений следует, что решение рассматриваемого уравнения равносильно решению системы £3 + 2z = 0 (mod5), I х3 + Ьх + 1=0 (mod 7). J Эту систему решим, последовательно подставляя в первое уравнение все элементы из Zs, а во второе — из Ζγ. В результате получим единственное решение, удовлетворяющее системе сравнений χ = 0 (mod 5), 1 χ = 1 (mod 7), J решив которую, находим единственное решение исходного уравнения χ = 15 (mod 35). Π 2.8. Функция Эйлера Функция φ{τη)ι равная количеству натуральных чисел, не превосходящих т и взаимно простых с га, называется функцией Эйлера. В следующей таблице представлены первые двенадцать значений этой функции: η φ{η) 1 0 2 1 3 2 4 2 5 4 6 2 7 6 8 4 9 б 10 4 И 10 12 4 Легко видеть, что φ(ρ) = ρ — 1 для каждого простого р. Также несложно найти значение функции Эйлера для степени простого числа. Лемма 2.4, Пусть ρ — простое. Тогда <р(рк) = pk —pk~l для любого натурального к. Доказательство. Среди первых рк натуральных чисел ровно рк~1 делится на р. Каждое из рк — рк~1 остальных чисел взаимно просто с р. Следовательно, <р{рк) = рк —рк~1. Лемма доказана.
48 Глава 2. Целые числа Лемма 2*5. Для любых взаимно простых натуральных а и b справедливо равенство ip(ab) = φ(α)φ(ΰ). Доказательство. Каждое из (p(ab) взаимно простых с ab и не превосходящих ab натуральных чисел взаимно просто одновременно саиб. Все эти числа находятся в таблице 1 α + 1 2α+ 1 ja + 1 -1)о + 1 (b- 2 ·· α + 2 ·· 2α+ 2 ·· ja + 2 .. -1)α + 2 ·· • (b- г · · а + г · · 2а + г · · ja + i .. -1)а + г ·· а 2а За • О' + 1)а Ьа из 6 строк и а столбцов. В каждой строке этой таблицы находится полная система вычетов по модулю а и, следовательно, φ(α) чисел, взаимно простых с а. В каждом столбце таблицы все элементы одного столбца имеют одинаковые вычеты по модулю а. Таким образом, в таблице есть φ(α) столбцов, полностью состоящих из чисел, взаимно простых с а. В силу взаимной простоты а и b и теоремы 2.7 в каждом из этих столбцов находится полная система вычетов по модулю b и, следовательно, <р(Ь) чисел, взаимно простых с Ь. Следовательно, в таблице находится ровно φ(α)φ(υ) чисел, одновременно взаимно простых саиб. Лемма доказана. Теорема 2.12· Если т = р^р^ ' ·Ρηη> шо φ{τη) = rail - -) (l - -) ... (l - —). V PlJ\ p2J V pnJ Доказательство. Из доказанных выше лемм 2.4 и 2.5 легко следует, что ψ{ρ\ιΡ22 · · · vkn) = φ(&)φ(Ρ2*) · · · ψ(Ρηη) = = (Pi1 - р'Г'М2 - РкГ2) - · · bfr - pfr"1)· Теорема доказана.
2.8. Функция Эйлера 49 Пример 2.8. Найдем <р(120). Так как 120 = 23 · 3 · 5, то V?(120) =4-2-4 = 32. D Докажем имеющую многочисленные приложения классическую теорему элементарной теории чисел — теорему Эйлера. Теорема 2ЛЗ (Эйлер). Если (α,η) = 1, то αφ{η) = 1 (mod n). Доказательство. Будем полагать, что все встречающиеся далее числа принадлежат Ζη. Пусть αϊ, α2,..., α^(τζ) — подмножество полной системы вычетов по модулю п, состоящее из всех взаимно простых с η вычетов. Такое множество называется приведенной системой вычетов. Если а взаимно просто с га, то в силу теоремы 2.7 числа ααι, αα2,..., ο>ο>φ(η) образуют ту же самую приведенную систему вычетов, взятую, в общем случае, в другом порядке. Поэтому 0*1 · в>2 ' · · а<р(п) = аа1 ' аа2 · · * 0>0>φ(η) = = αφ^η)α\ · α2 · · · α^(Λ) (mod n). Сокращая в (2.22) одинаковые множители, приходим к равенству αφ^ = 1 (mod η). Теорема доказана. Простым следствием теоремы Эйлера является ее частный случай — малая теорема Ферма. Теорема 2,14 (Ферма), Если а ф 0 (mod ρ), то αΡ-ι _ J (mod ρ). Пример 2.9. Воспользуемся малой теоремой Ферма для решения уравнения ζ124+2ζ4 + 1 = 0 (mod 55). Так как в силу малой теоремы Ферма хА = 1 (mod 5) и х10 = 1 (mod 11) и, кроме того, 124 = 0 (mod 4) и 124 = 4 (mod 10), то решаемое уравнение равносильно системе 4 = 0 (mod 5), 1 З^4 + 1 = 0 (mod И). J
50 Глава 2. Целые числа Очевидно, что первое уравнение системы решений не имеет, и, следовательно, исходное уравнение также не имеет решений. □ Задачи 2.1. Доказать, что отношение делимости а \ Ъ является отношением частичного порядка на множестве натуральных чисел. Построить диаграммы частично упорядоченных множеств делителей для чисел 71 = 6,12,18,24,36. 2.2. Показать, что если а делит с, Ъ делит си (а, Ь) = 1, то аЪ делит с. 2.3. Доказать, что |Ш 1а*-1 для любых натуральных х,к,г. 2А. Доказать, что для любых натуральных αϊ,..., αη существуют такие целые Ьь ..., Ьп? что αι^ι + · · · + αη6η = (αϊ,..., αη). 2.5. Доказать, что множество пар коэффициентов Безу для натуральных чисел а, Ь, т. е. множество всех таких целых х, у £ Ζ, что ах + Ъу = (α,ί>), бесконечно. Как по одной известной паре коэффициентов Безу найти все остальные такие пары? 2.6. Доказать, что оба алгоритма из примера 2.1 и леммы 2.1 находят минимальные по модулю числа среди всех пар коэффициентов Безу. 2.7. Доказать, что существует пара коэффициентов Безу, которая удовлетворяет или неравенству \х\ ζ (α, Ъ) · |, или неравенству \у\ ζ 2*8. Доказать, что 1) (2а -1,2Ь-1) = 2^Ь) -1; 2) (ка — 1, кь — 1) = &(а,ь) — 1 для любого натурального к =£ 1. 2.9. Найти все целые решения уравнений: 1) 83а: + 115у = 1; 2) 2015х - 1286у = 5; 3) 426х + 12% = 14. 2Л0. Сформулировать и доказать критерий разрешимости в целых числах уравнения а\х\ + · · · + апхп = Ь, где а^, Ъ 6 Ζ. L Аг* J
Задачи 51 2.11. Сколько различных делителей имеет число р™1 .. .р£т\ где Pi — различные простые числа? Чему равна сумма всех его делителей? 2.12. (Теорема Вильсона) Доказать, что целое ρ > 1 является простым тогда и только тогда, когда [р — 1)! = —1 (mod p). 2.13. Показать, что если η — не простое число, то (п — 1)! = О (mod η) за исключением случая η = 4. 2.14. Найти вычет, обратный к вычету 777 по модулю 1000. 2Л5. Решить уравнение А2х = 87 в Ζ123· 2.16. Решить уравнение х11 + Зх4 + 4 = 0 в Ζ42ο· 2.17. Доказать, что система сравнений χ = αϊ (modmi), 1 χ = α2 (modm2), ί имеет решение тогда и только тогда, когда (mi, тг) делит αϊ — <Х2, и это решение единственно на множестве 2нок(тьт2)· 2Л8. Решить систему сравнений χ = 2 (mod 18), 1 х = 8 (mod24). J 2.19. Каким числом нулей оканчивается число 1000! в десятичной записи? 2.20. Доказать, что (5п + Зга, 13п + 8т) = (п,т) для всех натуральных т, п. 2.21. Числа а^ (см. (2.2)), для которых было получено равенство (2.3), называются числами Фибоначчи. Доказать, что 1) ак-\-т = ак-1ат + акат+Ъ 2) (afe,a*+i) = 1, 4) J2k=0 a2* = 0>2n+l — 1, 5) (afe,aTO) = a(fcjm). 2.22. Найти число подмножеств в множестве чисел от 1 до /с, в которые не входят соседние числа. Как связан ответ с числами Фибоначчи? 2.23. Доказать, что φ{ηπι) = φ(η)φ(τη)— -.
Глава 3 Группы В этой главе начинается изучение одного из важнейших объектов современной математики — множества с заданной на нем бинарной операцией, удовлетворяющей нескольким определенным свойствам. Простейшими примерами таких множеств являются целые числа с операцией сложения, действительные числа без нуля с операцией умножения, все взаимнооднозначные отображения конкретного множества в себя с операцией композиции. Каждый такой объект называется группой. Группы образуют фундамент, на котором построены все остальные алгебраические структуры. В силу этого многие свойства групп наследуются более сложными структурами, такими как кольца, поля и линейные пространства, при этом достаточно часто задачи, связанные с этими алгебраическими структурами, сводятся к задачам, решаемым в рамках теории групп, основы которой закладываются ниже. 3.1. Определения и примеры 1. Понятие группы. Бинарной операцией на множестве Μ называется произвольное отображение множества упорядоченных пар элементов из Μ в само множество М. Как правило, факт применения бинарной операции к элементам χ и у обозначают, связывая эти элементы при помощи символа операции, например: χ + у, χ χ у, χ о у и т. д. Бинарными операциями на множестве натуральных чисел будут операции сложения и умножения, на множестве целых чисел — сложение, вычитание и ум ноже-
3.1. Определения и примеры 53 ние. На множестве всех подмножеств множества Μ бинарными операциями будут объединение и пересечение, а на множестве функций / : Μ —► Μ — композиция функций. Бинарная операция на множестве Μ не обязана быть бинарной операцией на произвольном подмножестве N этого множества. Например, сложение не будет бинарной операцией на множестве нечетных целых чисел. Если же бинарная операция остается таковой на подмножестве 7V, то будем говорить, что N замкнуто относительно этой бинарной операции. Среди всевозможных пар (множество, бинарная операция) будем рассматривать специальные пары — группы. Множество G с определенной на нем бинарной операцией о, называется группой (G, о), если: (1) операция о ассоциативна, т. е. д\ о (д2 о р3) = (#1 ° 92) ° #3 для всех дид2,дз из G; (2) существует единичный (нейтральный) элемент е G G такой, что goe = eog = g для любого g € (?; (3) для каждого элемента g e G существует обратный элемент g~l G G такой, что g о g~l = g~l о g = е* Нетрудно видеть, что группами будут множество целых чисел, множество рациональных чисел, множество действительных чисел и множество комплексных чисел, в которых в качестве групповой операции используется обычное сложение, а нейтральным элементом является нуль. Натуральные числа группу с операцией сложения не образуют, так как для пары (N, +) справедливо свойство (1), но не выполняются свойства (2) и (3) из определения группы. Множества Q\ {0}, R\ {0} иС\ {0} образуют группы с операцией умножения. Единичным элементом в этих трех группах будет единица. Целые числа без нуля группу с операцией умножения не образуют, так как ни одно целое число, кроме единицы и —1, не имеет обратного относительно умножения. Часто групповую операцию называют либо сложением, которое обозначают знаком «+», либо умножением, для которого используются знаки « х» или «·». В первом случае говорят об аддитивной форме записи группы, во втором — о мультипликатив-
54 Глава 3. Группы ной форме. При использовании мультипликативной формы знак умножения часто опускают, так же как это делают при умножении чисел. Далее, как правило, будем использовать мультипликативную форму. При использовании аддитивной формы единичный элемент будем называть пулевым. Группа G называется конечной, если она состоит из конечного числа элементов. Это число называется порядком группы G и обозначается |G|. Пример ЗЛ, Множество Ъш = {0,1,... ,т — 1} образует группу с операцией сложения по модулю т. Нулевым (нейтральным) элементом в этой группе будет 0, а т — к будет обратным элементом для к. □ Обозначим через ZJ^ множество натуральных чисел, не превосходящих т и взаимно простых с т. Например, Ъ\ — {1,5}, Z? = {l,2,3,4,5,6},ZS = {l,3,5,7}1Z2n = {l,3,5)...)2n-l}. Пример 3.2* При простом ρ множество Ζ* образует группу с операцией умножения по модулю р. Действительно, из равенства ab = 0 (mod p) следует делимость ab на р, откуда в свою очередь в силу леммы 2.2 и простоты ρ следует делимость на ρ хотя бы одного из чисел а, 6, что очевидно невозможно, так как 1 < a, b ^ ρ — 1. Таким образом, ab ^ 0 (mod p), и, следовательно, множество Ζ* замкнуто относительно умножения по модулю р. Очевидно, что 1 будет единичным элементом, а существование обратного для каждого элемента в Ζ* следует из простоты ρ и теоремы 2.9 об обратимости по простому модулю. Аналогичным образом можно показать, что группой является и множество Ζ^ с операцией умножения по модулю т при составном га. □ Группа G называется абелевой (или коммутативной), если для любых элементов д\ и #2 из G справедливо равенство д\д% = = д?д\. Все упомянутые до сих пор группы абелевы. Пример 3*3* Важным примером неабелевой группы является множество взаимно однозначных отображений произвольного множества Μ на себя с операцией композиции. Ранее было показано, что композиция ассоциативна (теорема 1.1). Замкнутость рассматриваемого множества отображений очевидна, так
3.1. Определения и примеры 55 как композиция двух биективных отображений снова будет биективным отображением. Единичным элементом в группе является тождественное преобразование, а существование обратных элементов следует непосредственно из биективности отображений. Если множество Μ состоит из конечного числа элементов, например из га, то группа взаимно однозначных отображений множества Μ на себя называется симметрической группой Sn порядка п, или группой подстановок на га элементах, а ее элементы называются подстановками. Если элементы множества Μ обозначить числами 1,2,... ,га, то подстановку, отображающую 1 в г ι, 2 в %2 и т.д., можно представить в виде таблицы из двух строк, в первой строке которой находятся числа от 1 до га, а во второй их образы: 1 2 ... к ... га—1 га i\ %2 ♦♦· ik ··· in-i in Для вычисления произведения двух подстановок надо найти композицию отображений. Например, в произведении подстано- (1 2 3 4\/1 2 3 4\ Л 1 вок (9 l . qJIo q л ι J пРавая подстановка отображает 1 в 2, левая 2 в 1, и, следовательно, произведение оставляет 1 на месте. Определив аналогично образы для 2,3 и 4, находим, что 1 2 3 4\ /1 2 3 4\ _ /1 2 3 4 2 1 4 3/ ^2 3 4 l) ~ \1 4 3 2 Перемножив эти подстановки в обратном порядке, видим, что 1 2 3 4\ /1 2 3 4\ _ /1 2 3 4 2 3 4 1/ ^2 1 4 Зу " \3 2 1 4 Таким образом, группа 54 не является абелевой. D Конечную группу G = {#ъ<72> · · · >#п} можно задать при помощи таблицы умножения, в которой на пересечении г-й строки и j-ro столбца стоит элемент, равный произведению QiQj элементов Qi и gj. Такая таблица называется таблицей Кэли, по имени английского математика XIX в. Артура Кэли, который первым в 1854 г. ввел в математику современное определение группы. До Кэли рассматривали только группы подстановок.
56 Глава 3. Группы Пример 3.4* Для групп Z4 и Щ таблицы Кэли выглядят следующим образом: + 0 1 2 3 0 0 1 2 3 1 1 2 3 0 2 2 3 0 1 3 3 0 1 2 X 1 2 3 4 1 1 2 3 4 2 2 4 1 3 3 3 1 4 2 4 4 3 2 1 В приведенных выше таблицах Кэли групп Z4 и Ъ\ каждая линия (строка или столбец) состоит из различных элементов. Покажем, что подобное свойство справедливо для таблицы Кэли произвольной группы. Если в таблице какой-либо группы G = — {#Ъ#2? * · · j9n} в j-м столбце fc-й и г-й элементы равны, то 9к9з — 9i9j- Умножив правую и левую части этого равенства справа на д~1, придем к противоречию д^ = д%- Π Нетрудно заметить, что в каждой из рассмотренных выше групп есть ровно один единичный элемент, и любой элемент каждой группы имеет ровно один обратный. Покажем, что эти два свойства справедливы для любой группы. Теорема 3.1. В группе существует ровно один единичный элемент, и у каждого элемента существует ровно один обратный элемент. Доказательство. Допустим, что в некоторой группе G есть два единичных элемента е и е'. Тогда из свойств единичного элемента следует, что е = е · е' = е' · е = е'. Таким образом, е = е'. Теперь допустим, что у элемента g есть два обратных элемента gi и #2- Тогда из свойств обратного элемента следует, что 91 = 91 · е = 91 · {д · дт) = {д\ - д) · §2 = е · #2 = #2- Следовательно, pi =52- Теорема доказана.
3.1. Определения и примеры 57 Воспользуемся доказанной теоремой для нахождения обратного элемента произведения нескольких элементов группы. Так как ί9ΐ92)(9219ϊ1) = 9ι{92921)9ΪΧ = 9ι9Ϊ1 = ^ то единственным обратным элементом произведения g\Q2 является произведение p^Vf1 обратных элементов сомножителей, взятых в обратном порядке. Нетрудно видеть, что аналогичная формула (9\92'-9k)~l =9kl'"92l9T1 справедлива для любого числа сомножителей. 2. Подгруппы* Подмножество Η группы G называется подгруппой этой группы, если Η является группой относительно операции группы G. Пусть Η — подгруппа группы G. Будем говорить, что элемент а сравним с элементом Ъ по модулю подгруппы Η а = b (mod Я), если ab~l € Н. Так как (αίτ1)-1 = ba~l G if, то и элемент b сравним с α по модулю подгруппы if, т. е. из сравнения а = = b (mod Η) следует сравнение b = a (mod H)t Поэтому можно говорить, что а и b сравнимы по модулю подгруппы if. Пример 3*5. Множество целых чисел образует подгруппу в группе рациональных чисел с операцией сложения. Нетрудно видеть, что рациональные χ и у сравнимы по модулю подгруппы целых чисел, если равны их дробные части. В свою очередь рациональные числа образуют подгруппу в группе действительных чисел с операцией сложения, и два действительных числа сравнимы по модулю подгруппы рациональных чисел, если их разность — рациональное число. □ Пример 3.6. Для любого целого т в группе целых чисел с операцией сложения подгруппой будет множество mZ, состоящее из всех целых кратных т. Теперь покажем, что в Ζ нет подгрупп, отличных от подгрупп вида тЪ. Пусть Η — подгруппа в Ζ. Положим т = min(x — у), где минимум берется по всем парам целых чисел из if, в которых χ > у. Так как т £ if,
58 Глава 3, Группы то и все кратные т числа также лежат в Н. Допустим, что в Η найдется тг, которое не делится на га. Тогда η = km + г, где О < г < т. Но в этом случае г = п—кт < га также принадлежит ίί, что невозможно в силу выбора т. Следовательно, Η = mZ.D Теорема 3*2. Пусть G — группа, Η и К — ее подгруппы. Тогда Η ПК будет подгруппой группы G. Доказательство. Очевидно, что единичный элемент принадлежит множеству Η Π К. Поэтому для доказательства теоремы достаточно показать, что Η Π К замкнуто относительно групповой операции и что для любого g из Η ПК его обратный элемент также лежит в Η ПК. Пусть д\ ^НПКид2^НпК) тогда gig2 £ Η и gig2 £ К и, следовательно, д\д2 G Η Π Κ. Таким образом, множество Η Π К замкнуто относительно операции группы G. Если д € Η Π /ί, то д~1 е Η и g~l £ К и, следовательно, д~х е Η ПК. Теорема доказана. Пример 3,7. В группе целых чисел пересечение подгрупп 6Ζ и 4Ζ состоит из всех целых, делящихся на б и 4. Следовательно, 6Ζ р| 4Ζ = 12Ζ. Нетрудно видеть, что в общем случае для любых целых тип справедливо равенство raZp|nZ = HOK(m?n)Z. D Для группы G и ее подгрупп Η и К определим произведение Η К = {х е G | χ = /ifc, где /г € Я, fc e К} этих подгрупп. Имеет место следующая теорема. Теорема 3.3, Пусть G — группа, Η и К — ее подгруппы. Множество НК будет подгруппой группы G тогда и только тогда , когда Η К = КН. Доказательство. Покажем достаточность условия НК = = КН. Из этого условия следует, что для любых k G К и h G Η найдутся такие к* G К и hf £ -if, что /i& = ///ι'. Тогда (h1k1)(h2k2) = h1(k1h2)k2 = hi{h!2k!x)k2 = (/ii//2)№2), т. е. множество ifif замкнуто относительно групповой операции. Аналогичным образом из условия Η К = К Η следует существование обратного элемента hfkf для произвольного hk: е = (hk^hk)-1 = (hk^k^h-1) = {hk)(h'V).
3.2. Группа подстановок 59 Следовательно, НК — группа. Теперь установим необходимость условия НК = КН. Пусть НК — подгруппа в G. Тогда для произвольного произведения h!k! элементов из Η и К в Η К лежит его обратный элемент hk. Поэтому tik1 = ((//fc')"1)"1 = (hk)'1 = k~lh-\ Следовательно, НК = КН. Теорема доказана. Так как в абелевой группе hk = kh для любых ее элементов h и &, то из теоремы 3.3 вытекает следующее простое утверждение. Следствие ЗА. Пусть G — абелева группа, Η и К — ее подгруппы. Тогда Η К — подгруппа группы G. Пример 3.8, Нетрудно видеть, что в силу теоремы 2.2 при любых целых тип произведением подгрупп тЪ и пЪ в группе Ζ будет подгруппа Н0Д(т,п)2. □ 3. Полугруппы и моноиды. Множество G с определенной на нем ассоциативной бинарной операцией называется полугруппой. Множество G с определенной на нем ассоциативной бинарной операцией называется полугруппой с единицей (или моноидом), если в нем существует единичный элемент. Пример 3.9* Множество целых чисел Ζ с операцией умножения образует моноид, а множество 2Ζ с той же операцией — лишь полугруппу. D 3.2. Группа подстановок Напомним (см. пример 3.3), что множество взаимно однозначных отображений тг-элементного множества {1, 2,... ,гс} на себя с операцией композиции называется симметрической группой 5П7 ее элементы называются подстановками, и каждая подстановка тг представляется в виде /1 2 ... к ... п-1 η π = I . . (3.1)
60 Глава 3, Группы где if* = т:(к) — образ элемента к. В (3.1) первая строка состоит из упорядоченных аргументов отображения π, а вторая — из их образов. Если аргументы подстановки π не упорядочивать, то ее можно представить п\ различными способами вида _ (ч к ♦ ·· ik ··· in-i in ~ \ji η ··· Зк ··■ jn-i in где jk = n(ik)· Подстановка π из 5n называется циклом длины га, если найдутся такие ii,..., гт, что π(ή) = г2, 7т(г2) = г3, ..., π(ί™_ι) = гт, 7r(im) = ή, я"Ш = J Для всех j £ {гь ..., гт}. Цикл будем представлять строкой (ii · · · г^ · · · гт), в которой каждый элемент является образом предыдущего, а первый элемент — образом последнего. Заметим, что для цикла длины га есть ровно т различных представлений. Например, цикл (12345) можно записать следующими способами: (12345) = (23451) = (34512) = (45123) = (51234). Циклы длины два называются транспозициями. Пример ЗЛО. В группе 5з все подстановки, кроме тождественной, являются циклами. Это три транспозиции (12), (13) и (23), и два цикла длины три (123) и (132). D Циклы называются непересекающимися (или независимыми), если не пересекаются множества их элементов. Пример 3.11. В 5з все циклы пересекаются. В 54 есть три пары непересекающихся транспозиций: (12) и (34), (13) и (24), и (14) и (23). В #5 есть 15 пар непересекающихся транспозиций и 20 пар непересекающихся циклов, состоящих из транспозиции и цикла длины три. Так как три непересекающихся цикла неединичной длины содержат не менее шести различных элементов, то ни в 54, ни в 5б нет трех непересекающихся циклов. □ (3.2)
3.2. Группа подстановок 61 Пример 3.12. Рассмотрим произведение двух непересекающихся циклов. Так как перестановка столбцов в (3.2) не изменяет подстановку, то для любых непересекающихся циклов из равенств (*1<2 • · ifc)(j Л ι h \l2h (i\ k \4 h (h h \h h 0'i h ■ hh ■■■ 3m) = ... ik h h · · ... h h h ·· ·■■ ik h h ■ ■ ... ч h h · ■■■ jm Ч h ■ ... ji i\ h . ■■ jm)(ili2 ■■■ • 3m\ • jm) ■ jm\ -ji) ■· ik\ ■ ■ ik) ik) fi\ h ... \%\h ··■ _ (h 32 \J2 h fj\ h ■■■ V'l J2 ■■■ ik ji J2 ... jm\ . ik J2 33 ... j\ ) ... jmh h ■■■ ik .. . ji %2 iz ■ ■ · h jml\l2 ·■■ ik\ . jm %2 h ■■■ h) следует, что эти циклы коммутируют. Более того, индукцией по числу сомножителей нетрудно показать, что произведение любого числа непересекающихся циклов не зависит от порядка сомножителей. □ Теорема 3.4. Каждая нетождественная подстановка π £ Sn представляется в виде произведения непересекающихся циклов, и притом единственным с точностью до порядка сомножителей образом. Доказательство. Так как подстановка π — взаимно однозначное отображение множества {1,2,... ,га} на себя, то для каждого элемента г этого множества найдется такое минимальное натуральное ki) что nki(i) = г. Воспользуемся этим свойством и разобьем множество {1,2,... ,га} на непересекающиеся упорядоченные наборы. Первый набор составим из элементов 1,тг(1),... ,7Tfcl-1(l). Если к\ < га, то среди элементов, не попавших в первый набор, выберем минимальное г и второй набор составим из элементов ζ,π(ζ),... ,nki~l(i). Если k\ + ki < га, то построим третий набор и т.д. Допустим, что множество {1,2,..·,га} указанным способом разбито на непересекающиеся наборы Αι,..., А*, где Aj = (ij,n(ij),K2(ij), · ·. ,тг ij~l{ij))·
62 Глава 3. Группы Переместив в каждом наборе Aj первый элемент в конец, получим s новых наборов A*j = (τγ(^),τγ2(^), . ., , π %з~ (ij)^ij)·, причем Aj = Aj тогда и только тогда, когда kj = 1. Так как г-и элемент ттг(г^) в A!j является образом i-го элемента nz~l(ij) из Aj, то столбцы в (ЗЛ) можно упорядочить так, чтобы подстановка π выглядела следующим образом: /Αι А2 ... Aj ... А8 \Αι А2 ... Aj ... As Теперь заметим, что возникшее в рассмотренном выше примере 3.12 равенство (α α α λϊα α α \ Λι *2 ... ik h h ··· jm\ легко обобщается на любое число непересекающихся сомножителей. Поэтому нетрудно видеть, что подстановка (3.3) является произведением непересекающихся циклов {А\){А2) * · · (As). Единственность указанного представления следует из однозначности определения множеств Aj и А'-. Теорема доказана. Пример 3.13* Следуя доказательству теоремы 3.4, разложим подстановку в произведение непересекающихся циклов: Л 234567 8\_/l 243578 б\_ ^2 431758 6/ V2 413786 Ъ) ~ = (12 4)(3)(5 7 8 6) = (1 2 4)(5 7 8 6). Записывая произведения циклов, часто пропускают циклы длины один, каждый из которых является тождественной подстановкой. Выше в последнем произведении так пропущен цикл (3). D Теорема 3*5* Каждая подстановка тг £ Sn представляется в виде произведения транспозиций. Доказательство. Из равенства (12 3 4... А?) = (1А?) · - · (14)(13)(12) (3.4) (3.3)
3.2. Группа подстановок 63 следует, что любой цикл разлагается в произведение транспозиций. А так как каждая подстановка представляется в виде произведения непересекающихся циклов, то очевидно, что ее можно представить и как произведение транспозиций. Теорема доказана. Пример ЗЛ4« Разложим в произведение транспозиций подстановку (1234)(12). Из равенства (3.4) легко следует, что (1234X12) = (14)(13)(12)(12) = (14)(13). С другой стороны, (1234) = (2341), и поэтому (1234)(12) = (2341)(12) = (21)(24)(23)(12). Таким образом, представление подстановки в виде произведения транспозиций неоднозначно и разные представления могут состоять из разного числа транспозиций. D Теорема 3*6. Если подстановка g e Sn раскладывается двумя способами в произведение транспозиций πγκ<ι · · · π* = g = σ\σ2 · · · <rm9 (3.5) mo k = т (mod 2). Величина sgng = (—l)k называется знаком подстановки g. Доказательство. Пусть г < j и s < t. Будем говорить, что транспозиция (ij) меньше транспозиции (si) (пишем (ij) < (si)), если г < $ или г = s и j < t. Произведение транспозиций ττιπ2 * · * 7Г/с назовем упорядоченным, если тгг_|_1 < πΓ для г = 1,2, ...,& — 1. Покажем, что любое произведение транспозиций можно перестроить в равное ему упорядоченное произведение. Сделаем это индукцией по числу сомножителей. В основание индукции положим произведения из двух сомножителей. У сомножителей могут совпадать минимальные элементы, максимальные элементы, максимальный элемент первого с минимальным элементом второго, транспозиции могут не пересекаться. Во всех этих случаях произведения можно упорядочить
64 Глава 3. Группы следующим образом: (12)(13) = (23)(12), (13)(23) = (23)(12), (12)(23) = (23)(13), (12)(34) = (34)(12). [ ' } Допустим, что любое произведение из к транспозиций можно упорядочить. Тогда в произвольном произведении πιπ2· · · π^π^+ι упорядочим к левых транспозиций. Если в преобразованном произведении тт^я^ · · · π^τΓ^+ι транспозиции π^π^+ι упорядочены (я'к > π/e+i или ягк = 7Γ^_|_ι)? то упорядочено и все произведение. Если нет, то упорядочиваем пару π^π^+ι при помощи подходящего равенства из (3.6) и получаем новое произведение πίτΓ2 · · · τγ£._|_ιϊ правая транспозиция 7Гк+1 которого меньше правой транспозиции π^+ι исходного произведения. Если произведение тг^тг^ * · '^k+i не упорядочено, то повторяем выполненные действия до тех пор, пока это возможно. Так как в каждом новом произведении правая транспозиция меньше правой транспозиции в предыдущем, то после конечного числа повторений выполнить очередное преобразование будет невозможно, т. е. произведение станет упорядоченным. Теперь допустим, что для подстановки д из Sn справедливы равенства (3.5). Тогда 6 = 7Г№ · · · Ък°т * * * σ2 σ\ * (3-7) Упорядочим произведение в правой части (3.7) и удалим из него пары стоящих рядом одинаковых транспозиций. Очевидно, что четность числа транспозиций г в новом произведении π^π^ · · · π£ совпадает с четностью к + т. Пусть s — минимальный элемент, встречающийся в транспозициях нового произведения. В этом произведении выберем самую левую транспозицию с элементом S — пусть это будет (si), где t > 5. Тогда транспозиции справа от (si) не содержат элемент ί, а транспозиции слева от (st) не содержат элемент s. Поэтому все произведение отображает t в s, т. е. не может быть тождественным. Возникшее противоречие исчезает, если г = 0. Таким образом, к + т = 0 (mod 2), и, следовательно, к = т (mod 2). Теорема доказана.
3.2. Группа подстановок 65 Подстановка тг называется четной^ если sgnTT = 1, и нечет- но% если sgn π = — 1» Очевидно, что тождественная подстановка является четной подстановкой. Кроме того, нетрудно показать, что sgn (π) sgn (π') = sgn (тгтг') для любых подстановок π и π'. Из последнего равенства и четности тождественной подстановки следует, что sgn (π) = sgn(7r_1) для любой подстановки тг. Таким образом, четные подстановки образуют в Sn подгруппу. Такая подгруппа называется знакопеременной группой Ап порядка п. Покажем, что А^ состоит из п\/2 элементов. Пусть 7Γι,..., тг5 — все четные подстановки в 5η, σι,..., σ* — все нечетные подстановки в этой группе. Тогда подстановки (12)πι,. .., (12)π5 будут нечетными, и, следовательно, ί > s. С другой стороны, четными будут подстановки (12)σι,..., (12)σ*, следовательно, s ^ t. Объединяя получившиеся неравенства, видим, что s = ί, т.е. четные подстановки составляют ровно половину из п\ подстановок в Sn. Пусть Τ — подмножество группы G, (Т) — множество всех элементов из G, представимых в виде произведений элементов из Τ и обратных к ним. Множество (Т) называется системой образующих (порождающих) элементов этой группы G, если (T)=G. Пример 3.15. Ζ = (1), тЪ = {га), D Пример 3.16. Из теоремы 3.5 следует, что в Sn множество всех транспозиций является системой образующих. D Пример 3,17. Множество всех циклов длины 3 является системой образующих в Ап при η > 3. Действительно, любое произведение четного числа транспозиций можно разбить на пары транспозиций так, что они имеют вид (ij)(jk) = {ijk) или (ij)(kl) = (ikj)(ikl).n Подмножество Τ группы G называется минимальной системой образующих или базисом этой группы, если G = (Т) и G φ (Τ') для любого собственного подмножества Т1 множе-
66 Глава 3. Группы ства Т. Можно легко убедиться, что минимальность системы Τ равносильна тому, что χ £ {Τ \ {χ}) для всех χ е Т. Пример ЗЛ8* Нетрудно видеть, что при η ^ 3 системы образующих из двух последних примеров не являются минимальными. Минимальную систему можно получить, если заметить, что (у) = (li)(lj)(li), откуда Sn = ((H) : г = 2,...,п). Более того, (23 .. . тг)(12)(23.. . п)-1 = (13), откуда по индукции следует, что (1г) = (23 ...гг)г_2(12)(23 ... п)~^г~2\ Очевидно, что (23...п)"1 = (23...п)п"2, (12) £ <(23...тг)> и (23...п) £ <(12)>. Таким образом, система Τ = {(12), (23 *. .η)} является минимальной порождающей Sn системой. D Отметим, что минимальная система образующих группы G не обязательно имеет минимальную среди ее образующих систем мощность. Так, система (12), (13),..., (In) из предыдущего примера очевидно является минимальной в Sn (выбрасывание любой транспозиции делает ее неполной), однако число образующих системы (12), (23 .. .п) меньше. 3.3. Смежные классы и фактор-группы 1* Смежные классы и теорема Лагранжа. Рассмотрим произвольную группу G = {ди...,дп, ··.} и ее подгруппу Я = = {/ii, *.., /im,.. * }. Левым смежным классом группы G по подгруппе Η называется множество дН = {gh\,... ,ghm>... }, где д — фиксированный элемент группы G. Правым смежным классом группы G по подгруппе Η называется множество Нд = = {higy..., ftm#,... }. Множество левых (правых) смежных классов называется левым (правым) фактор-множеством G/ Η группы G по подгруппе Η. В абелевых группах левые и правые смежные классы совпадают, поэтому в случае абелевой группы говорят просто о смежных классах и фактор-множествах. Пример ЗЛЭ. Смежными классами группы Ζ по подгруппе 3Ζ будут: подгруппа 3Ζ; множество 1 + 3Ζ, состоящее из всех целых, сравнимых с единицей по (mod 3); множество 2 + 3Z, состоящее из всех целых, сравнимых с двойкой по (mod 3). Легко видеть, что фактор-множество Z/3Z будет множеством Z3. □
3.3. Смежные классы и фактор-группы 67 Теорема 3*7. Два левых (правых) смежных класса группы G по подгруппе Η либо совпадают, либо не пересекаются. Доказательство. Покажем, что если два левых смежных класса группы G по подгруппе Η имеют хотя бы один общий элемент, то тогда эти классы совпадают. Допустим g € g\H яде giH* Тогда в Η найдутся такие элементы hi и h^ что д = g\hi = дг^у Поэтому д\ = g2^h~x и, следовательно, для любого gihk Ε д\Н справедливо равенство gihk = g2(hjh~lhk)· Так как hjh~lhk € Я, то gihk € дгН, и, следовательно, д\Н С д^Н. Включение g<iH С д\Н доказывается аналогично. Таким образом, д\Н = р2#* Доказательство для правых смежных классов аналогично. Теорема доказана. Теорема 3.8 (Лагранж), Порядок конечной группы делится на порядок любой ее подгруппы. Доказательство. Пусть G — конечная группа, Η — подгруппа группы G. Каждый элемент группы G принадлежит некоторому левому смежному классу G по подгруппе if, причем каждый смежный класс состоит ровно из \Н\ элементов. Поэтому |G| равно числу смежных классов, умноженному на \Н\. Теорема доказана. Пусть g — произвольный элемент группы G. Произведение к элементов g называется fc-й степенью дк этого элемента. Из ассоциативности умножения легко следует, что gkgl=glgk=gl+k (38) для любых натуральных I и к. Так как (дк)~1 = (д~1)к, то для упрощения вычислений положим д~к = (д~1)к- Если G — конечная группа порядка п, то среди степеней р, д2)..., дп найдется такая степень к) что дк = е. Допустим, что такой степени нет. Тогда среди η степеней д будет не более η — 1 различных элементов (7, и, следовательно, по крайней мере две степени, например gs и #*, где s > t, будут равны. Умножая левую и правую части равенства д*д3~* = дг слева на #"*, приходим к равенству дв~г = е, которое противоречит сделанному
68 Глава 3. Группы предположению. Следовательно, одна из степеней р,#2, ♦ ♦. ,#п равна единичному элементу. Пусть к — минимальное натуральное, для которого дк = е. Такое к называется порядком элемента g и обозначается обычно |р|, о{д) или ord(#). Множество {е,р,... ,дк~1} замкнуто относительно умножения, которое (см. (3.8)) коммутативно на нем. Это множество содержит единичный элемент е, и каждый его элемент дг φ е имеет обратный дк~г. Следовательно {е,р,... >дк~1} является абелевой группой и подгруппой в G. Такая группа называется конечной циклической группой, порожденной элементом р, и обозначается (д). Элемент д называется порождающим элементом группы {д}. В общем случае группа G называется циклической с порождающим элементом д и обозначается (д) или {g)k для конечной группы порядка fc, если каждый ее элемент является целой степенью д. Пример 3,20, Легко видеть, что циклическими группами будут Ζ = (1) = (-1) πΖμ (2) = (3). D Из теоремы Лагранжа следует, что в конечной группе порядок каждого элемента делит порядок группы. Если η — порядок группы, к — порядок элемента д и η = km, то дп = {дк)ш = е. Таким образом, в конечной группе любой элемент в степени, равной порядку группы, равен единичному элементу Простым следствием этого факта являются доказанные в главе 2 теорема Эйлера и малая теорема Ферма. Пример 3,21, Рассмотрим группу G простого порядка р. Каждый неединичный элемент д этой группы порождает в ней циклическую подгруппу {д}. Порядок этой подгруппы должен делить р, а так как ρ — простое, то порядок (д) равен р, те. (д) = G. Следовательно, любая группа простого порядка будет циклической. D Лемма 3*1, Пусть в группе G с единичным элементом е выполнено равенство дк = е для некоторых g 6 G и k Ε N. Тогда число к нацело делится на порядок элемента д. Доказательство. Пусть η = |#|, тогда дп = е и дш φ е для любого натурального т < п. Разделив к на η с остатком,
3.3. Смежные классы и фактор-группы 69 получим k = nq + г7 где 0 ^ г < га. Отсюда дк = дпч+г = — (9п)я9г — Рг* Так как по условию дк = е, то и #г = е. Но г < га, поэтому г = О, иначе получим противоречие с определением порядка элемента д. Лемма доказана. 2. Φ актор-группы. Пусть G — абелева группа, Η — ее подгруппа. На фактор-множестве G/H введем операцию умножения, полагая, что (giH)(g2H) = (gl92)H. Прежде всего отметим, что для любых hi,hj из Η ((91кг)Н)((д2^)Н) = (91Ы)(д2^)Н = = (gmXhihjH) = (gm)H, (3.9) т. е. результат умножения не зависит от выбора представителей смежных классов. Следовательно, операция умножения определена корректно. Также заметим, что из ассоциативности групповой операции легко следует и ассоциативность введенного умножения. Далее, так как для любого д £ G дНН = НдН = дН, дНд-1Н = д-1НдН = Н) то фактор-множество G/H с такой операцией умножения будет группой, в которой единичным элементом является подгруппа Η, а смежный класс д~1Н является обратным к смежному классу дН. Оказывается, что для справедливости (3.9) и (ЗЛО) группа G не обязательно должна быть абелевой. Нетрудно видеть, что для этого достаточно, чтобы подгруппа Η была перестановочна с каждым элементом группы, т. е. дН = Нд для любого а е Gl\ Такая подгруппа Η называется нормальной подгруппой (обозначается #«(?), а фактор-множество по этой подгруппе — фактор-группой G/H группы G по нормальной подгруппе Н. Таким образом, справедлива следующая теорема. г> Равенство дН = Нд эквивалентно равенству дНд~1 = Н.
70 Глина 3. Группы. Теорема 3*9* Фактор-мно:ж:естьо группы С по норлтльпой подгруппе Η является группой. Пример 3.22. Так как sgi^ = sgn7r_1 для любой подстановки π из 5,?1, то множество πΑηπ~ι состоит только из четных подстановок. Следовательно, πΑηπ~ι — Л,п т.е. Ап — нормальная подгруппа в Sn. Факторгруппа Sn/An с(к:тоит из двух смежных классов: подгруппы Ап и множества нечетных подстановок. D Пример 3.23. В конце XIX в. американским изобретателем игр и головоломок Сэмюэлем Лойдом была предложена следующая задача, называемая игрой в «пятнашки». Квадратная коробочка разделена на 16 полей. В полях установлены 15 квадратных фишек, занумерованных числами от 1 до 15. Одно поле коробочки остается свободным. Ниже на рисунке слева изображено начальное расположение фишек в коробочке. За один ход можно передвинуть на свободное поле любую из соседних с ним фишек (например, на левом рисунке это фишки 12 и 15). Требуется получить из начального расположения фишек их расстановку, изображенную на рисунке справа, 1 5 9 13 2 6 10 14 3 7 11 15 4 8 12 1 5 9 13 2 6 10 15 3 7 11 14 4 8 12 Головоломка быстро стала очень популярной не в последнюю очередь благодаря обещанному за ее решение крупному вознаграждению. Обогатиться, однако, было невозможно: задача не имеет |>ешения. Действительно, сопоставив свободному полю число 16, каждое расположение фишек можно представить некоторой перестановкой π из группы £ю>. Перемещение фишки на свободное место означает перестановку ее номера с числом 16,
3.4- Изоморфизмы групп 71 т.е. каждый ход является транспозицией и меняет sgn7r. Поэтому перестановки, получаемые четным числом ходов, должны иметь одинаковый знак. Чтобы пустое поле вернулось на прежнее место, число 16 должно переместиться вверх столько же раз, сколько и вниз, а влево столько же раз, сколько и вправо, т. е. количество ходов должно быть четным. Однако подстановки слева и справа на рисунке имеют разные знаки. D 3.4. Изоморфизмы групп 1. Изоморфизмы. Пусть G и Η — группы с операциями * и о соответственно. Взаимно однозначное отображение / : G —*> Η называется изоморфизмом, если равенство Да* Ъ) = Да) о f(b) (3.11) справедливо для любых элементов а и b из G. Про отображение, удовлетворяющее равенству (3.11), говорят, что оно сохраняет групповую операцию, а группы СиЯ, для которых существует изоморфизм, называются изоморфными. Для обозначения изоморфизма групп используется символ =. Пример 3*24* Покажем, что Z4 = Щ. Обе группы являются циклическими: в Z4 порождающим элементом является 1, а в Ъ\ — 2. Изоморфизм / группы Z4 в группу Ъ\ определим, отобразив порождающий элемент в порождающий, т.е. положим /(1) = 2, а значения на оставшихся элементах группы Z4 зададим, используя свойство сохранения групповой операции: /(2) = /(1 + 1) = /(1) · /(1) =2-2=4 (mod 5), /(3) = /(2 + 1) = /(2) · /(1) =4-2=3 (mod 5), /(0) = /(3 + 1) = /(3) · /(1) =3-2 = 1 (mod 5). Непосредственной проверкой легко убедиться в том, что / действительно является изоморфизмом. D Пример 3,25, Покажем, что Ζ = 2Ζ. Для этого зададим отображение Ζ в 2Ζ по правилу f(k) = 2k. Очевидно, что такое отображение взаимно однозначно и, кроме того, сохраняет
72 Глава 3. Группы групповую операцию, так как равенства /(* + /) = 2{к + l)=2k + 2l = /(*) + /(/) справедливы для любых целых к и L Следовательно, / является изоморфизмом. D Пример 3*26* Рассмотрим функцию f(x) = 2х, отображающую взаимнооднозначно множество R действительных чисел на множество R+ положительных действительных чисел. Легко видеть, что f(xi + Х2) = 2Х1+Х2 = 2Х1 · 2х" = /(-η) · f(x2) для любых действительных х\ и #2. Так как множество R. с операцией сложения и множество R+ с операцией умножения являются группами, то функция f(x) = 2х устанавливает изоморфизм этих групп. D Изоморфизмы, построенные в рассмотренных выше примерах, обладают несколькими общими свойствами. Так, например, нетрудно заметить, что каждый изоморфизм отображает единичный элемент одной группы в единичный элемент другой группы. Также нетрудно видеть, что в каждом из трех примеров выполняется равенство f(g~l) = /(#)-1? и кроме того, обратное отображение каждого из рассмотренных изоморфизмов само является изоморфизмом. Например в третьем примере такое обратное отображение задается функцией log2 у, которая отображает R+ в R и для которой равенство !og2(|/i · Ы = log2 3/1 + log2у2 справедливо при всех положительных Уь 2/2· Это обстоятельство не является случайным. Покажем, что каждым из трех указанных свойств обладает любой изоморфизм / : G —> Η произвольных изоморфных групп G и Н. Теорема ЗЛО, Пусть G и Η — изоморфные группы с единичными элементами е и ef. Любой изоморфизм / : G —> Η обладает следующими свойствами:
3.4- Изоморфизмы групп 73 1) /(e) = е'; 2) f(g l) = f(g) г для каждого g € G; 3) обратное отображение является изоморфизмом. Доказательство. Покажем, что изоморфизм / отображает единичный элемент е группы G в единичный элемент е' группы Я, т.е. /(e) = е'. Действительно, из свойств единичного элемента следует, что е*д = д*е = е для любого д из (7, а из взаимной однозначности / следует, что для любого h из if в G найдется такой элемент #, что h = /(<?)* Поэтому для любого h (и его прообраза д) hof(e) = f(g)of(e) = f(9*e) = = f(9) = f(e*9) = f(e)of(g) = f(e)oh. Следовательно, /(e) — единичный элемент. Теперь покажем, что изоморфизм / отображает д~1 в элемент, являющийся обратным элементом к /(#), т.е. f(g~l) = — f(g)~l- Для этого воспользуемся установленным выше свойством /(e) = е' и определением обратного элемента: f(9)of(g-1) = f(g*g-l) = f(e) = = е' = /(e) = Пд~1 * д) = /(«Г1) о f(g). Наконец покажем, что обратное отображение /_1 : Η —* G также является изоморфизмом. Так как / — взаимно однозначное отображение, то оно, очевидно, имеет обратное, которое также взаимно однозначно. Поэтому нам достаточно доказать справедливость равенства /_1(/ΐιο/ι2) = /~1(^ι)*/~1(^2) для произвольных h\ и /i2 из группы Н. Пустьд\ = f~l{hi) и д^ = /_1(^2)· Тогда r1(hloh2) = r1(f(gi)of(g2)) = = Г\П91 * 92)) = 91*92 = r'ih) * f-\h2). Таким образом, справедливость всех трех свойств установлена. Теорема доказана.
74 Глава 3. Группы Среди всевозможных изоморфизмов различных групп отметим изоморфизмы группы на себя, называемые автоморфизмами. В частности, автоморфизмами группы G являются сопряжения ha : д —► ада-1 относительно произвольного элемента а группы. Нетрудно показать, что автоморфизмы произвольной группы G образуют группу относительно операции композиции. Такая группа называется группой автоморфизмов группы G и обозначается Aut((?). Все сопряжения группы G образуют подгруппу в группе Aut(G). 2* Теорема Кэли. Ранее было отмечено, что до середины XIX в. в математике рассматривались только группы подстановок. Распространив понятие группы на произвольное множество с бинарной операцией, Артур Кэли показал, что каждая конечная группа изоморфна некоторой подгруппе симметрической группы подходящего порядка. Теорема ЗЛ1 (Кэли), Любая конечная группа порядка η изоморфна некоторой подгруппе Sn. Доказательство. Рассмотрим множество взаимно однозначных отображений Η = {fa} группы G в себя, действующих по правилу fa : g —► ад. Такие отображения называются сдвигами. Рассматриваемое множество является группой относительно операции суперпозиции, так как суперпозиция ассоциативна, а из равенства (faofb)(g)=Wb(9)) (3.13) легко следует, что для любого элемента а группы G и единичного элемента е этой группы /е ° fa = fa° /е = fa, fa ° /α"1 = /α"1 ° fa = fey т. е. в группе Η элемент /е будет единичным элементом, а /α-ι — обратным к fa. Элементы группы Η являются подстановками на п-элемент- ном множестве элементов группы G. Следовательно, Η — подгруппа группы Sn. Отображение φ : а —► fa определяет изоморфизм групп G и ίί, так как оно биективно и равенство <р(аЬ) = fab = fa о fb = φ(α) о <р(Ь)
3.4- Изоморфизмы групп 75 легко следует из (3.13). Теорема доказана. Пример 3*27* Найдем в группе S& подгруппу, изоморфную группе (Ζί|, х). Отображения fa : д —► ар, использованные в доказательстве теоремы 3.11, действуют на множестве Ъ\ следующим образом: 11 12 13 14 2 2 2 4 2 1 2 3 /ι:3^3' /2Ι3^1' /з:3^47 /413^2* 4 4 4 3 4 2 4 1 Поэтому подгруппа группы 54, изоморфная группе (Z|, x), состоит из тождественной подстановки /χ, двух циклов длины четыре /2 = (1243) и /з = (1342) и произведения транспозиций /4 = (14)(23). Π 3. Циклические группы. Среди всех конечных групп наиболее просто устроены циклические группы, в каждой из которых все элементы являются степенями одного порождающего элемента. Поэтому все конечные циклические группы одного порядка устроены одинаково. Точнее, справедлива следующая теорема. Теорема 3.12, Любая конечная циклическая группа порядка η изоморфна группе (Ζη,+). Доказательство. Пусть конечная циклическая группа порядка η порождается элементом д. Рассмотрим отображение / : gk —*> к. Тогда для любых элементов д\ = дк и #2 = Qm группы G имеем: 1(9192) = f(9k9m) = f(9k+m) = [k + m\n = = \к\п + [т\п = f(gk) + /(«Л = /Ы + /Ы· Таким образом, / — изоморфизм. Теорема доказана. Теорема 3.13, Пусть т делит п. В любой конечной циклической группе порядка η существует единственная подгруппа порядка га. Все подгруппы циклической группы циклические.
76 Глава 3. Группы Доказательство. В силу теоремы 3.12 достаточно показать, что доказываемое свойство справедливо для (Zn, +). Прежде всего отметим, что по крайней мере одна подгруппа порядка т существует. Эта подгруппа образована числами, делящимися на d = п/т: 0, d,.. ·, (m — l)d, порождается элементом d и поэтому является циклической. Отсутствие других подгрупп следует из того, что по следствию теоремы Лагранжа для каждого элемента а такой подгруппы должно выполняться равенство т ♦ а = 0 (mod n), т.е. каждый ее элемент должен делиться на d, В Ъп таких чисел ровно ш, и все они принадлежат первой подгруппе. Теорема доказана. Теорема 3,14, В любой циклической группе порядка η существует ровно φ(η) порождающих элементов. Доказательство. Снова воспользуемся теоремой 3.12. Покажем, что в (Ζη, +) порождающими элементами будут все числа, взаимно простые с тг, и только они. В силу теоремы 2.2 взаимная простота чисел η и α эквивалентна существованию таких целых /сит, что кп + та = 1. Из этого равенства следует, что m-a = l (mod п). (3.14) Поэтому единица — порождающий элемент в (Zns +) — является суммой т элементов а. Следовательно, а — порождающий элемент в (Zn,+). С другой стороны, если а — порождающий элемент, то единица должна быть суммой некоторого числа элементов а, т. е. должно существовать целое т, для которого справедливо (3.14), откуда в свою очередь следует взаимная простота η и а. Теорема доказана. Простым следствием двух предыдущих теорем является следующее утверждение. Теорема 3,15, Пусть т делит п. В любой конечной циклической группе порядка η существует ровно φ{πι) элементов порядка га. Доказательство. Каждый элемент порядка т порождает подгруппу такого же порядка. Так как в циклической группе
3.4- Изоморфизмы групп 77 есть только одна подгруппа порядка га, то все элементы порядка т принадлежат одной и той же подгруппе и являются ее порождающими элементами. Теорема доказана. Теорема 3.16. В циклической группе порядка η с порождающим элементом g для порядка элемента gk справедливо равенство 1/1 = <йг Доказательство. Согласно теореме 3.12, достаточно доказать формулу в циклической группе (Ζη, +) с порождающим вычетом 1. Порядком произвольного вычета к £ Ζη является наименьшее натуральное решение χ сравнения χ к = О (mod га). Все его целочисленные решения составляют множество {гп/(щк) : г £ Ζ} (см. доказательство теоремы 2.8)» Наименьшим положительным из них будет χ = η/(η,к). Теорема доказана. Из теоремы 3.16 легко извлекается следующее полезное утверждение. Следствие 3.2. Элемент дк является порождающим элементом циклической группы {д)п тогда и только тогда, когда (ra,fc) = 1. Пример 3.28. Если g — элемент некоторой (не обязательно циклической или коммутативной) группы, имеющий порядок 18, то порядок элемента д1Б равен щ^щ = 6. D Пример 3.29. Рассмотрим уравнение zs = д12 в циклической группе G = (#}20· Каждый элемент ζ G G имеет представление вида ζ = дх при некотором χ G Z20, откуда ζ8 = д8х = д12. Последнее равенство равносильно сравнению 8х = 12 (mod 20). В примере 2.5 были найдены все его решения χ = 4, 9,14,19. Поэтому элементы д4, д9, д14, д19 являются решениями исходного уравнения в группе (?, и других решений в G у него нет. Аналогичным образом нетрудно установить, что уравнение ζα = дъ в группе {д)п либо не имеет решений, когда (α,η) \ 6, либо имеет ровно (а, га) решений в противном случае. Отметим, что и этот пример основан на теоремах 2.8 и 3.12. D
78 Глава 3. Группы 4. Прямое произведение групп* Внешним прямым произведением G\ χ · · χ Gk групп G\y..., Gk называется множество всех упорядоченных наборов (#ъ ... ,р&) длины &, где <& Ε Gj, с определенной на этом множестве покомпонентной операцией умножения (Зи · · ^яМъ ···>0а) = (Wi, * · · ^fcffjfe)» в которой умножение по г-й компоненте является умножением в Gi- Легко видеть, что такое умножение ассоциативно, множество Gi χ ··· χ Gk замкнуто относительно этого умножения, содержит единичный элемент е = (ei,...,efc), составленный из единичных элементов групп Gi,...,Gfc? и для каждого набора g = (<7ι,.. ·,</*) существует такой обратный набор р-1 = (д^1,..., РдГ1)) что gg~l = д~1д = е. Таким образом, внешнее прямое произведение групп само является группой. Пример 3*30* Перечислим все подгруппы в прямом произведении Z4 X Zg Групп Z4 И Zg. Группа Z4 X Zg СОСТОИТ ИЗ 36 пар (а,Ь), где а € Z4, 6 € Zg, и поэтому порядки ее нетривиальных подгрупп содержатся среди чисел 2,3,4,6,9,12,18. Покажем, что для каждого из этих чисел найдется единственная подгруппа соответствующего порядка. Так как групповыми операциями в Z4 и Zg являются сложения по mod 4 и mod 9, то для Z4 х Zg будем использовать аддитивную форму записи. Пусть к — порядок элемента (1,1), тогда &(1,1) = (k,k) = (0,0). Последнее равенство эквивалентно тому, что к = 0 (mod 4) и к = 0 (mod 9). Из китайской теоремы об остатках следует, что к кратно 36. Следовательно, Z4 x Zg — циклическая группа с порождающим элементом (1,1). Поэтому в силу теоремы 3.13 о циклических группах Z4 х Zg содержит ровно по одной подгруппе порядка 2,3,4, 6,9,12,18» Нетрудно видеть, что такими подгруппами будут 2Ζ4 χ {0}, {0} χ 3Ζ9, Ζ4 χ {0}, 2Ζ4 χ 3Ζ9, {0} χ Zg, Ζ4 χ 3Ζ9 и 2Ζ4 χ Ζ9. Заметим, что все приведенные выше рассуждения применимы и к группе Z9 χ Ζ4. Следовательно, Z4 x Zg = Zg x Z4. □ Некоторые свойства группы Ζ4 x Zg из рассмотренного примера справедливы для любых внешних прямых произведений
3.4- Изоморфизмы групп 79 групп. Можно легко показать, что G\ χ G2 — G2 x G\ для любых Gi и (?25 и если Hi — подгруппа в Gi, то Н\ χ Н2 будет подгруппой в Gi х G2. Пример 3,31, Пусть ρ и q — различные простые, А = (а) и В = (Ь) — циклические группы порядков ρ я q. Покажем, что прямое произведение А х В также будет циклической группой. Повторяя рассуждения из предыдущего примера, найдем порядок к элемента (а,Ь). Так как (а,Ь)к = (акуЬк) = (е,е), то к = О (mod ρ) и к = 0 (mod 4). Из китайской теоремы об остатках следует, что к кратно pq. Следовательно, А х В — циклическая группа порядка pq. D Теорема 3.17. Пусть га = q\q2 - · -<?ь где все qi попарно взаимно простые. Тогда Ъп = Zqi χ ЪЯ2 χ · · · χ Zgfc, Ζη = Ζ^1 χ Ζ^2 χ · · · χ %qk. Доказательство. Для каждого α из Zn и каждого г из {1,2, ...,&} положим di = α (mod &). Из китайской теоремы об остатках следует, что отображение /(α) = (αϊ, аг,..., а&) из Ζη в Zgi χ Ζ^2 χ · · · χ Zqk будет взаимно однозначным. Сравнения можно складывать, поэтому /(а + 6) = (αϊ + Ьъ а2 + Ь2у..., ак + Ьк) = = (αϊ, θ2,...,а/с) + (Ьь &2, - - ·, Μ = /(а) + /(δ) для любых а и Ъ из Zn. Таким образом, / — изоморфизм из группы Zn в группу Zqi х Zq2 χ · · · χ Zgfc. Далее заметим, что если а взаимно просто с п, то оно взаимно просто и с любым его делителем. Поэтому если α € Ζ*, то di G Z*r Верно и обратное, если все di взаимно просты с га, то и соответствующее им α из Ъп будет взаимно просто с га» Следовательно, если (ц G Z*. при каждом г из {1,2,..., &}, то a G Zn. Теперь из китайской теоремы об остатках следует, что отображение f(a) = (аь α2,..., α*) из Ζ£ в Ζ*α χ Ζ*2 χ · · · χ Z*fc будет взаимно однозначным. Так как сравнения можно умножать, то f(ab) = (αι&ι, а2Ь2,..., афк) =
80 Глава 3. Группы = (αι,α2,...,α*)(&ι,62>-.. А) =/(α)/№) для любых α и 6 из Ζ*. Следовательно, / — изоморфизм из группы Ъ*п в группу Ζ*χ χ Ζ*2 χ · · · χ Z*fc* Теорема доказана. Лемма 3*2. Пусть д € G, h £ Η. Тогда порядок элемента {g^h) в прямом произведении G х Η групп G и Η равен наименьшему общему кратному НОК(|#|, \h\) порядков элемента g и элемента h. Доказательство. Положим η = \{g,h)\ к Ν = Н0К(|р|, \h\). Тогда {g,h)n = (gn,hn) = (ес,е#), и по лемме 3.1 имеем, что число η делится и на |р|, и на \h\. Следовательно, η делится на N. С другой стороны, (g,h)N = {gN,hN) = (eG,eH) в силу делимости N на \д\ и |/ι|, откуда следует, что N делится на п. Поэтому η = N. Лемма доказана. Следствие 3.3* Пусть д = (pi,..., дь) Ε G\ x ... х Gk, тогда Ы = нок(|Ы---,Ы)· 3.5* Гомоморфизмы групп Пусть G и Η — группы с операциями * и о соответственно. Отображение / : G —► Η называется гомоморфизмом группы G в группу Я, если /(а * Ь) = /(а) о /(b) для всех элементов а и b группы G. Ядром гомоморфизма / называется множество Ker/ = {g G G | /(р) = е}· Нетрудно видеть, что всякий изоморфизм является гомоморфизмом, ядро которого состоит только из единичного элемента. Пример 3.32. Отображение / : Ζ —► Ζ2, определенное равенством f(k) = [fc]2, является гомоморфизмом с ядром 2Z. Действительно, равенство /(А? + ш) = [fc + т}2 = [к}2 + [т}2 = /(А?) + /(т) справедливо для любых целых к и га, а каждое четное / отображается в нулевой элемент группы Z2: /(/) = [/]2 = [0]2* Π
3.5. Гомоморфизмы групп 81 Теорема 3.18. Пусть / : G —> Η — гомоморфизм группы G в группу Η с ядром К. Тогда К — нормальная подгруппа в G. Доказательство. Покажем, что ядро К гомоморфизма / образует подгруппу в G. Для любых &ι,&2 € ii и единичного элемента е' группы Η имеем f(kik2) = f(k1)-f(k2) = e-e = e, т.е. fcifo € К и ядро гомоморфизма замкнуто относительно групповой операции. Единичный элемент е группы G принадлежит ядру гомоморфизма, так как при к € К е' = № = f(k ■ е) = ДА;) · /(e) = ё ■ /(e) = ё. Для каждого к из К и его обратного fc_1 справедливы равенства ё = /(fcfc-i) = /(*) · /(*-i) = е' · /(к-1) = f(k~l). Следовательно, k~l G К. Таким образом К — подгруппа группы G. Так как для каждого g из G f(9Kg-1) = f(g) ■ f(K) · /(g-1) = = f(9)-f(9-1) = f(99-l) = m = e, то К — нормальная подгруппа. Теорема доказана. Укажем два простых, но важных свойства гомоморфизмов. Первое состоит в том, что для любого гомоморфизма / группы G в группу Η и каждого элемента g e G имеет место равенство f{g~l) = f{g)~l- Доказательство этого факта дословно повторяет рассуждения, приведенные в доказательстве теоремы 3.10 (последовательность равенств (3Λ2)) о свойствах изоморфизмов. Второе свойство заключается в том, что если f{g\) = /(#2)) то 01 и 02 принадлежат одному и тому же смежному классу группы G по ядру гомоморфизма /. Действительно, так как № ι9ύ = тг)П91) = /Ы"7Ы = /Ы"7Ы = е',
82 Глава 3. Группы где е' — единичный элемент группы Я, то д^ д\ £ Кег/ или 5i ^ #2Кег /. Очевидно, что верно и обратное свойство: если элементы 01 и р2 принадлежат одному и тому же смежному классу группы G по ядру гомоморфизма /, то f(gi) = /(02)· Из принадлежности 01 и 02 одному и тому же смежному классу следует существование такого элемента ядра h, что 0i = 02/i. Тогда /Ы = f(92h) = f(g2)f(h) = f(g2)e' = f(g2). Легко видеть, что образ гомоморфизма Im/ = {/(0) | д £ G} является подгруппой в Я (в отличие от ядра не обязательно нормальной). Пример 3,33, Выясним, какие группы могут быть образами гомоморфизмов группы 5з· Из теоремы 3.18 следует, что необходимым условием существования гомоморфизма является наличие в S$ нормальной подгруппы, являющейся ядром гомоморфизма. Будем рассматривать гомоморфизмы, ядра которых не совпадают с самой группой 5з и состоят более чем из одного элемента. Нетрудно видеть, что в группе 5з есть три подгруппы #! = {€,(12)}, Я2 = {е,(13)} и Я3 = {е,(23)} порядка два, и одна подгруппа порядка три — знакопеременная группа Аз = {е, (123), (132)}, являющаяся нормальной подгруппой в S3. Ни одна из подгрупп порядка два не является нормальной. Убедиться в этом можно прямой проверкой, которую выполним для подгруппы Н\. Действительно, так как (132)(12)(123) = = (13), то (132)Я1(132)"1 φ Яь Аналогичные неравенства можно получить и для подгрупп Η<ι и Яз. Таким образом, нет ни одного гомоморфизма группы 5з, ядром которого является подгруппа порядка два. Теперь построим гомоморфизм / с ядром А^. Для этого воспользуемся равенством sgn(7r)sgn(7r') = sgn^Tr'), справедливым для любых подстановок π и π'. Очевидно, что отображение / : π —► sgn (π) сохраняет групповую операцию и, следовательно, является гомоморфизмом 5з в группу G = {1, —1} с операцией умножения. Также легко видеть, что / отображает четные подстановки в 1 — единичный элемент G, т.е. А$ — ядро /. Так как Аз единственная нетривиальная нормальная подгруппа
3.5. Гомоморфизмы групп 83 в 5з, то любой нетривиальный гомоморфный образ группы 5з изоморфен группе G. Π В следующей теореме рассмотренный выше пример обобщается на произвольную группу и любую ее нормальную подгруппу. Теорема ЗЛЭ. Пусть К — нормальная подгруппа в G. Тогда существует гомоморфизм f : G —► G/K, ядром которого является подгруппа К. Доказательство. Рассмотрим отображение / : g —► gK, ставящее в соответствие элементу д смежный класс, которому он принадлежит. Так как подгруппа К нормальна в G, то f{gi92) = gigiK = тъкк = 9i^g2K = f(gi)f(g2) для любых д\ и д2 из G. Следовательно, / сохраняет групповую операцию и поэтому является гомоморфизмом. Теорема доказана. Теорема 3*20* Пусть f : G —► Η — гомоморфизм группы G в группу Η с ядром К. Тогда G/K = Im/. Доказательство. Рассмотрим отображение φ : gK —> /(#), ставящее в соответствие смежному классу дК образ элемента д при гомоморфизме /. Из свойства сохранения операции гомоморфизмом следует, что ψ{9ιΚ · д2К) = (p(gig2K) = f{gig2) = = f(9i)f(92) = φ(9ιΚ)φ(92Κ) для любых д\ и д2 из G. Поэтому φ сохраняет групповую операцию и, таким образом, является гомоморфизмом. Теперь покажем, что φ — биективное отображение. Так как \πιφ = Im/ в силу определения φ, то оно сюръективно. Покажем инъективность φ. Действительно, если найдутся д\ и д2 такие, что tp{g\K) = (р(д2К), то f(gi)=<p{giK) = <p(g2K) = f(92),
84 Глава 3. Группы и, следовательно, элементы #ьР2 принадлежат одному и тому же смежному классу группы G по К, т. е. д\К = #2^· Таким образом, (р(д\К) φ {р^д^К), если д\К φ д2&. Теорема доказана. Задачи ЗЛ. Определить, образует ли группу множество с указанной операцией, и если оно является группой, то найти ее порядок и выяснить, абелева она или нет, циклическая она или нет; если циклическая, то найти число ее образующих: 1) все взаимнооднозначные отображения / : Ζ5 —► Ζ5 относительно операции композиции отображений; 2) все булевы функции двух аргументов относительно операции / V д; 3) все булевы функции двух аргументов относительно операции / е д; 4) все необратимые по умножению вычеты из Ζχ024 относительно сложения вычетов; 5) все необратимые по умножению вычеты из Ζ216 относительно сложения вычетов. 3.2. Пусть х, у — элементы некоммутативной группы G. Доказать, что порядки элементов ху и ух совпадают. 3*3. Доказать, что если ху = ух и (χ) Π (у) = е, то порядок элемента ху равен наименьшему общему кратному порядков элементов χ и у. Показать на примере, что каждого из условий ху = ух и (χ) Π {у) = е в отдельности недостаточно. 3.4. Пусть а = (01)(23)(456)(769), β = (0423)(196758). Найти знаки и порядки подстановок α, β. Определить, коммутируют ли они. Вычислить а-1 и /З2014. Решить уравнение ах = /?. Решить уравнение х1 = а. 3*5. (Эквивалентное определение знака подстановки) Пусть π — некоторая подстановка из Sn. Доказать, что ее знак удовлетворяет равенству Sgn(7T)= Π — %—r. ±-L тгт — 7г(г) 3*6. Найти при η = 3,4,..., 12 максимальный порядок элемента в группе Sn и число элементов максимального порядка.
Задачи 85 3.7. Найти при η = 3,4,..., 12 максимальный порядок элемента в группе Ап и число элементов максимального порядка. 3.8. Пусть η ^ 3. Доказать, что Ап = (Т), где Τ — множество, состоящее из циклов: 1)(123),(124),...,(12п), 2)(123),(234),...,(η-2,η-1,η). Являются ли эти множества минимальными порождающими группу Ап системами? 3.9. Пусть число η G N является произведением двух различных простых чисел. Показать, что сравнение a^+^w = χ (mod n) справедливо для всех вычетов χ € Ζη, а не только для обратимых по модулю η (следствие теоремы Эйлера, на котором основана корректность системы RSA). 3.10. Пусть G — группа порядка η, Η — ее подгруппа, и элемент g € G таков, что gk е Я, причем (к, п) = 1. Доказать, что д е Д\ ЗЛ1. Перечислить все неизоморфные группы порядка 4. 3.12. Существует ли в группе Ап минимальная образующая система из двух элементов? 3.13. Найти Em|n?(m). ЗЛ4. Пусть G — циклическая группа порядка 600 с образующим элементом а. 1) Найти порядок элемента а70 € G и число элементов из G порядков 16,20,100; 2) найти число подрупп группы G; 3) решить уравнения х70 = 1 и х8Б = а100 в группе G, определить, множество решений какого из них образует подгруппу в G; 4) построить изоморфизм между группой G и группой Η = = (Z6oo,+)· 3.15. Показать, что автоморфизмы произвольной группы образуют группу относительно операции композиции. 3.16. Показать, что сдвиги группы G образуют подгруппу в группе Aut(G). ЗЛ7. Показать, что сопряжения группы G образуют подгруппу в группе Aut(G). 3.18. Найти группы Aut(Z), Aut(Z5), Aut(Z6). ЗЛ9. Найти число автоморфизмов конечной циклической группы порядка п.
86 Глава 3. Группы 3.20. Показать, что при изоморфизме групп образ любого элемента имеет тот же порядок, что и прообраз, подгруппы переходят в подгруппы (того же порядка), а системы образующих — в системы образующих. 3.21. Пусть G — конечная группа, Η и К — ее подгруппы. Показать, что \HC\K\- \НК\ = \Н\ · \К\. 3.22. Пусть φ : G —> Η — гомоморфизм. Доказать, что порядок χ делится на порядок φ(χ) для всех χ £ G. 3*23. Показать, что композиция гомоморфизмов будет гомоморфизмом. 3.24. Пусть (£>:G^Httijj:H^>K — гомоморфизмы группы G в группу Η и группы Η в группу К. Показать, что Кег (ф ο φ)/Кег φ = Кег ф. 3*25. Построить все возможные гомоморфизмы / : (а)во —> (ϊ>)40· Указать среди них все такие, что | Кег/| = 6. 3.26. Найти все гомоморфизмы / : {а)ю —► 5* и д : 54 —» (α)ιο· 3.27. Найти все нормальные подгруппы Η в группе подстановок 54, построить фактор-группы S±/H. 3.28. На примере группы А± показать, что нормальная подгруппа Hi нормальной подгруппы Я2 группы G не обязательно является нормальной в (?. 3.29. Выяснить, для каких групп G отображение / : G —► G, определенное правилом: 1) f(x) = χ2; 2) f(x) = #-1, является гомоморфизмом. При каком условии оно является изоморфизмом? 3.30. Пусть H±<G, H2<G и Н^СхНъ = е. Доказать справедливость равенства х\Хъ = Х2Х\ для всех χι G Щ.
Глава 4 Кольца В этой главе вводятся алгебраические структуры с двумя операциями — кольца и поля. Кольцом называется множество с двумя заданными на нем бинарными операциями, удовлетворяющими некоторым определенным свойствам и называемыми сложением и умножением. Поле представляет собой важный частный случай кольца, в котором операция умножения подчиняется дополнительным требованиям. Примерами кольца и поля являются, соответственно, целые и действительные числа с операциями сложения и умножения. Ниже рассматриваются основные свойства произвольных колец. После этого подробно изучаются кольца многочленов. Эти кольца играют важную роль при подробном изучении полей в восьмой главе. 4.1. Кольца и поля Множество К с определенными на нем бинарными операциями сложения + и умножения · называется кольцом, если: (1) множество К с операцией + является абелевой группой; (2) множество К с операцией · является полугруппой; (3) для всех a, b и с из множества К выполняются законы дистрибутивности: а * (6 + с) = а · Ь + а · с, (Ь + с) · а = Ь * а + с * а. Группа (К, +) называется аддитивной группой кольца, а ее единичный элемент — нулевым элементом кольца. Нулевой элемент
88 Глава 4- Кольца кольца обозначается символом 0. Полугруппа (К, ·) называется мультипликативной полугруппой кольца. Кольцо К называется кольцом с единицей, если существует такой элемент 1, что а · 1 = 1 · а = а для любого а £ К. Кольцо называется конечным, если оно состоит из конечного числа элементов. Пример 4.1, Множество целых чисел с обычными операциями сложения и умножения является кольцом с единицей, а множество 2Ζ четных целых чисел с такими же операциями — кольцом без единицы. Конечным кольцом с единицей будет множество Zm с операциями сложения и умножения по модулю m, a конечным кольцом без единицы — множество четных элементов из Z2m с операциями сложения и умножения по модулю 2т. D Пример 4.2, Обозначим через Z[>/2] все числа, которые можно получить из целых чисел и л/2 при помощи сложений и умножений. Это множество состоит из чисел вида а + Ъ^/2, где a, b — целые, и с обычными операциями сложения и умножения является кольцом с единицей. □ Подмножество L кольца К называется подкольцом, если оно замкнуто относительно сложения и умножения, т. е. если a, b Ε L, то а + b Ε L и ab Ε L. Пример 4.3, Множество 2Z является подкольцом в Z, 2Z2m — подкольцом в Z2m, Z — подкольцом в Ζ[λ/2] и кольце R действительных чисел. D Пример 4.4. Из примера 3.6 на с. 57 легко следует, что в кольце целых чисел все подкольца имеют вид тЪ. D Кольцо называется коммутативным, если операция умножения коммутативна. Все кольца в рассмотренных выше примерах коммутативные. Пример некоммутативного кольца можно найти на с. 150. Выполняя действия над элементами произвольных колец, будем использовать ряд соглашений и свойств, позволяющих упростить выкладки и имеющих очевидные аналогии в кольце целых чисел. Обратный элемент по сложению к элементу а
4-1. Кольца и поля 89 будем обозначать —а. Сумму элементов α и —Ь будем обозначать как а — 6, введя по сути дополнительную операцию вычитания. Теорема 4*1 ♦ Пусть К — кольцо. Для любых его элементов а и b αΟ = θα = О, a(-b) = {-a)b = -{ab), (-a){-b) = ab. Если К — кольцо с единицей, то (_1)α = -α, (-1)(-1) = 1. Доказательство. Так как а + О = а для любого а, то а2 + О = а2 = α(α + 0) = а2 + аО =Ф аО = 0. Аналогичным образом устанавливается равенство θα = 0. Далее, используя предыдущее свойство, видим, что 0 = аО = a(b - b) = ab + а(-Ь) =* -ab = а(-Ь). (4.1) Так как —(—6) = 6, то, подставляя это равенство в (4.1), приходим к равенству (—a)(—b) = ab. В свою очередь из этого равенства легко следует, что (—1)а = —а и (—1)(—1) = 1. Теорема доказана. Кольцо К называется кольцом без делителей нуля или целостным^ если из равенства ab = 0 следует либо а = 0, либо 6 = 0. Ненулевые элементы a, b € К называются делителями пуля в кольце К, если ab = 0. Например, кольцо Ζβ содержит делители нуля (это вычеты 2, 3,4), а в кольце Ζ5 их нет. Лемма 4.1· В кольце без делителей пуля выполняется закон сокращения: если с Φ 0 и ас = be, то а = Ь. Доказательство. Из равенства ас = be следует, что (а— —Ь)с = 0, и так как с / Оив кольце нет делителей нуля, то а— 6 = 0, т.е. а = Ь. Лемма доказана.
90 Глава 4- Кольца Пусть К — кольцо с единицей 1. Тогда элемент χ е К называется обратимым (по умножению), если в К найдется такой элемент ж-1, что хх~х = χ~ι -χ = 1. Элемент х~1 в этом случае называется (мультипликативным) обратным к х. Из теоремы 4.1 очевидно, что нулевой элемент 0 любого кольца необратим, так как 0^1. В отличие от обратимости по сложению, не каждый элемент кольца обратим по умножению. Если а, 6 Ε К — делители нуля, т. е. ab = 0, то ни а, ни b не имеют обратного в К: из предположения 1 = а~1а домножением обеих частей этого равенства на 6 немедленно получаем 6 = 1 · Ъ = a~lab = а-1 -0 = 0. Рассмотрим множество всех обратимых по умножению элементов кольца К: K* = {xgK:3o;-1 gK}. Например, (Ζβ)* = {1, 5}. Обозначение К* полностью согласуется с введенным ранее на с. 54 обозначением Ζ^ Для множества взаимно простых с т вычетов и обобщает его на произвольное кольцо: по теореме 2.9 вычет [х] кольца Zm имеет обратный вычет тогда и только тогда, когда представляющее его целое число χ взаимно просто с т. Лемма 4.2* Пусть К — произвольное кольцо с единицей, не обязательно коммутативное. Тогда множество К* является группой относительно умножения кольца К. Доказательство. Ясно, что единица 1 кольца К лежит в множестве К*, так как I-1 = 1 в силу равенства 1 · 1 = 1, и является его единичным элементом. Ассоциативность умножения следует из аксиом кольца. Далее, множество К* замкнуто относительно умножения. Действительно, пусть элементы χ и у обратимы, тогда (ху) · (у~1х~1) = x(yy~l)x~l = xlx~l = 1, (у~хх~1) · (ху) = 1, а это означает, что произведение ху также обратимо и (ху)-1 = — 1 —1 = у 1х \ Наконец, в силу тождества (х-1)-1 = χ обратный к элементу χ G К* элемент также лежит в К*. Лемма доказана.
4-1. Кольца и поля 91 Группа К* называется мультипликативной группой кольца К. Например, Z* = {1, — 1}· Коммутативное кольцо с единицей 1 ^ 0, в котором каждый ненулевой элемент обратим по умножению, называется полем. Множество ненулевых элементов поля замкнуто относительно операции умножения, так как если произведение двух ненулевых элементов а и b равно нулю, то цепочка равенств а = афЪ'1) = (ab)b~l = Об"1 = О немедленно приводит к противоречию с условием а ^ 0. Таким образом, в поле нет делителей нуля, а все его ненулевые элементы образуют коммутативную группу, которая называется мультипликативной группой поля. Воспользуемся этим свойством и дадим новое, независимое от понятия кольца определение поля. Множество F с определенными на нем бинарными операциями сложения + и умножения · называется полем, если: (1) множество IF с операцией сложения является абелевой группой (F, +) и эта группа называется аддитивной группой поля, а ее нулевой элемент 0 — нулевым элементом (нулем) поля; (2) множество F* = F\ {0} с операцией умножения является абелевой группой (F*,·) и эта группа называется мультипликативной группой поля, а ее единичный элемент — единичным элементом (единицей) поля; (3) для всех a, b и с из множества F выполняются законы дистрибутивности: а · (Ь + с) = а · b + а · с, (Ь + с) · а = b · а + с · а. Нетрудно видеть, что полями являются множества Q, R, С с обычными для этих множеств операциями сложения и умножения. Поле называется конечным, если оно состоит из конечного числа элементов. К основным арифметическим операциям в поле относятся сложение, вычитание, умножение и деление. Под вычитанием а — 6, как и в кольце, понимается сложение с аддитивным обратным, т.е. а + (—6). Аналогично деление ^ определяется как умножение на мультипликативный обратный элемент α -б-1, где 6^0.
92 Глава 4- Кольца Пример 4.5. Обозначим через Q[\/2] все числа, которые можно получить из рациональных чисел и \/2 при помощи сложений и умножений. Это множество состоит из чисел вида а + Ьл/2, где а, Ъ — рациональные. Так как то каждый ненулевой элемент в Q[\/2] имеет обратный по умножению и поэтому Q[\/2] с обычными операциями сложения и умножения является полем. Про поле((]>[\/2] говорят, что оно получено расширением поля рациональных чисел при помощи корня уравнения х2 — 2 = 0. Аналогичным образом можно сказать, что поле комплексных чисел является расширением Щг\ поля действительных чисел при помощи корня уравнения х2 + 1 = 0. D Теорема 4.2. Конечное коммутативное кольцо без делителей нуля является полем. Доказательство. Для доказательства теоремы достаточно показать, что в конечном коммутативном кольце без делителей нуля есть единичный элемент и каждый ненулевой элемент такого кольца имеет обратный по умножению. Пусть а — произвольный ненулевой элемент коммутативного кольца без делителей нуля, αϊ, α2,... ,<Xn — все его ненулевые элементы. Если среди произведений ααι, аа2,.. * ,аап найдутся два равных, например αα* = dd^ то равенства α(α* — uj) = ααι — actj = 0 приводят к противоречию с отсутствием делителей нуля. Поэтому все произведения αα^ различны и среди этих произведений найдется произведение ddj> равное а. В этом случае из равенства aa,j = adjdj следует, что a(dj — dj) = 0 или a,j = а%. Отсюда для любого ненулевого di справедливы равенства didj = didj = (didj)dj = dj(ai(lj),
4-2. Морфизмы колец 93 а так как все произведения α^αι, а?а2, · · · > <^ап различны, то а? является единичным элементом. Теперь заметим, что среди произведений ααι, αα2, ♦.♦, ααη найдется произведение αα&, равное единичному элементу. Следовательно, а-1 = а&, т. е. каждый ненулевой элемент коммутативного кольца без делителей нуля имеет обратный по умножению. Теорема доказана. Следствие 4,1. При простом ρ множество Ър с операциями сложения и умножения по модулю ρ является полем1). 4.2. Морфизмы колец 1. Изоморфизм колец. Пусть (К, +, ·) и (К', ®, 0) — кольца. Взаимно однозначное отображение / : К —► К' называется изоморфизмом, если оно сохраняет операции, т.е. равенства /(а + Ъ) = /(а) ф /(ft), f(ab) = /(α) Θ f(b) справедливы для любых а и Ъ из К. Для обозначения изоморфизма колец используется символ =. Пример 4.6. Отображение / : Z[\/2] —> Z[\/2], преобразующее а + Ьу/2 в а — Ъ\/2, является изоморфизмом кольца Ъ\\р2\. U Прямой суммой Κι ® · · · <g> Km колец Κι,..., Кщ называется множество всех упорядоченных наборов (αϊ,...,От) длины га, где (ц £ К^, с определенными на этом множестве покомпонентными операциями умножения и сложения (аь...,ат)(а/1,...,а^) = {а\а\>... ,ата'т), (аь..., от) + К,..., а'т) = (αϊ + а'1?..., ат + О, в которых умножение и сложение по г-и компоненте является умножением и сложением в К;. Такие операции на множестве ^Отметим, что этот факт следует независимо от теоремы 4.2 также из расширенного алгоритма Евклида и результатов раздела 2.4.
94 Глава 4- Кольца Κι 0 · · · <g> Km ассоциативны, и для них справедливы законы дистрибутивности, а само множество является абелевой группой относительно операции сложения и полугруппой относительно операции умножения. Поэтому прямая сумма Κι &· · *&Κτπ, является кольцом с нулевым элементом 0 = (0,..., 0), составленным из нулевых элементов колец Κι,..., Km. Если каждое кольцо К* является кольцом с единицей, то и Κι ® · · · ® Кт будет кольцом с единицей (1,..., 1), состоящей из единиц колец К$. Пример 4.7. Прямая сумма R<g)R является коммутативным кольцом с единицей, но не является полем. D Пример 4.8. Прямая сумма Ъп ® Ъш является коммутативным кольцом с единицей. D Следующее утверждение является очевидным следствием теоремы 3.17 и поэтому приводится без доказательства. Теорема 4.3. Пусть η = q\q2 · · · qk, где все ^ попарно взаимно простые. Тогда Как и теорему 2.11, теорему 4.3 часто называют китайской теоремой об остатках. 2. Гомоморфизм колец. Пусть (К, +, ·) и (К7, ф, 0) — кольца. Отображение / : К —► К' называется гомоморфизмом, если оно сохраняет операции, т.е. равенства f(a + Ь) = /(α) θ /(b), f(ab) = /(α) Θ /(b) справедливы для любых а и b из К. Ядром гомоморфизма / называется множество Кег/ = {а£К | /(а) = 0}. Легко видеть, что ядро гомоморфизма / : К —► К7 будет под- кольцом в К. Пример 4,9. Гомоморфизмом кольца Ζ в кольцо Ъш будет отображение / : а —> [а]т. Ясно, что Кег/ = тЪ является под- кольцом в Z. D
4-2. Морфизмы колец 95 Следующая теорема легко следует из свойств гомоморфизмов групп. Эту теорему, как и сформулированную выше теорему 4.3, приведем без доказательства, которое оставляем читателю в качестве несложного упражнения. Теорема 4,4, Если / : К —> К' гомоморфизм колец К и К', то: 1) /(0) = 0; 2) /(—а) = —f{d) для любого α G К. Подмножество / кольца К называется (двусторонним) идеалом^ если оно является подгруппой аддитивной группы кольца и ab G / и Ьа £ I для любого α £ / и любого 6 е К. Про идеал говорят, что он выдерживает умножение на любой элемент кольца. Если b Ε Кег /, то для любого α Ε К /(об) = f(a)f(b) = /(a) 0 = 0, /(6α) = f(b)f(a) = 0 · /(α) = 0. Поэтому ab Ε Кег/ и ba Ε Ker/. Следовательно, ядро гомоморфизма является идеалом в К. Выше было отмечено, что в кольце целых чисел каждое под- кольцо имеет вид raZ. Так как тЪ состоит из всех целых кратных га, то легко видеть, что raZ будет идеалом в Z, т. е. каждое подкольцо в Ζ является идеалом. В общем случае это не так, например, целые числа в Ζ[\/2] образуют подкольцо, но не идеал. С другой стороны, аналоги идеалов в кольце целых чисел существуют в произвольном коммутативном кольце. Так как для любого такого кольца К и любых его элементов а, х, у ах + ау = а(х + у), (ах)у = а(ху), то аК будет идеалом в К. Такой идеал называют главным идеалом, порожденным элементом а. Если каждый идеал / кольца К главный, τ е. существует порождающий его элемент a Ε /, такой, что / = аК, то кольцо К называется кольцом главных идеалов. Пример 4,10, Кольца Ζ и Zm при любом τη £ N являются кольцами главных идеалов. D
96 Глава 4- Кольца 4.3. Фактор-кольца В произвольном кольце К любой идеал / является подгруппой аддитивной абелевой группы этого кольца. Поэтому в силу теоремы 3.9 фактор-множество К//, элементы которого складываются по правилу (a + I) + (b + I) = (a + b) + I, (4.2) будет абелевой группой. На этом фактор-множестве введем операцию умножения, полагая, что (a + I)(b + I) = ab + I. (4.3) Эта операция ассоциативна, что легко следует из ассоциативности умножения в К, а так как для любых ii,i2 из / ((а + h) + I)((b + i2) + I) = (a + h)(b + %2)+I = = ab + i\b + a%2 + I = ab + /, то результат умножения не зависит от выбора представителей смежных классов. Следовательно, операция умножения определена корректно, и фактор-множество К/1 будет полугруппой относительно этой операции. Для операций сложения и умножения на К/1 справедливы законы дистрибутивности, что нетрудно видеть из следующих равенств: (а + /)((&+ I) + (с + I)) = (а + /)((& + с) + /)) = = а(Ь + с) + I = = ab + ac + I = ab + I + ac + I = = (a + I)(b + I) + (a + I)(c + I). Таким образом, фактор-множество К/1 с операциями (4.2) и (4.3) будет кольцом. Оно называется фактор-кольцом кольца К по идеалу /. Подводя итог, видим, что аналог теоремы 3.9 для групп и их нормальных подгрупп имеет место для колец и их идеалов.
4.3. Фактор-кольца 97 Теорема 4*5. Фактор-множество кольца К по идеалу I является кольцом. Две следующие теоремы о гомоморфизмах колец делают отмеченную аналогию между нормальными подгруппами и идеалами более полной. Теорема 4.6. Пусть I — идеал в кольце К. Тогда существует гомоморфизм f : К —► К//, ядром которого является идеал I. Доказательство. Рассмотрим отображение / : α —> α + /, ставящее в соответствие элементу α смежный класс, которому он принадлежит. Так как /(αϊ +0,2) =0,1+0,2+1 = 0,1+С12 + I + I = = αι + Ι + α2 + Ι = /(αϊ) + /(α2), /(αια2) = αια2 + / = (αχ + /)(α2 + /) = /(αι)/(α2) для любых αϊ и α2 из К, то / сохраняет операции и поэтому является гомоморфизмом. Теорема доказана. Теорема 4.7, Пусть / : К —> К' — гомоморфизм кольца К β кольцо Ж! с ядром I. Тогда К/1 = Im/. Доказательство. Рассмотрим отображение φ : α + / —> —*> /(α), ставящее в соответствие смежному классу α + / образ элемента α при гомоморфизме /. Из свойства сохранения операции гомоморфизмом следует, что ¥>((αι + I) + (α2 + I)) = ρ((αι + α2) + Ι) = /(α! + α2) = = /(αΟ + /(α2) = φ(α1 + Ι) + φ(α2 + /), φ((αχ + Ι){θ2 + Ι)) = φ(α1α2 + Ι) = /(αια2) = = /(αι)/(α2) = φ(α1 + Ι)φ(α2 + Ι) для любых αϊ и α2 из К. Поэтому φ сохраняет операции и, таким образом, является гомоморфизмом. Теперь покажем, что φ — биективное отображение. Так как ϊτηφ = Im/ в силу определения φ, то оно сюръективно. Покажем
98 Глава 4- Кольца инъективность φ. Действительно, если найдутся а\ и а2 такие, что φ{μ\ + Ι) = φ{&2 + /), то /(αϊ) = φ(α1 +1) = φ(α2 +1) = /(α2), и, следовательно, элементы а\ и а,2 принадлежат одному и тому же смежному классу кольца К по идеалу /, т. е. αχ + / = 0,2 + /. Таким образом, ς^(αι + /) Φ φ(α2 + /), если а\ + I ф а2 + I. Теорема доказана. 4.4. Кольцо многочленов 1. Основные свойства. Пусть К — кольцо, χ — переменная, η — целое неотрицательное. Выражение апхп + αη-ιχη~ι -\ \- йгХг -\ h a\x + а0 с коэффициентами αο? αϊ,..., ап из кольца К назовем многочленом а(х) над кольцом К степени η относительно переменной #, если ап ф 0. Степень многочлена а(х) обозначим через dega(#). Суммой многочлена а(х) = апхп +αη-ιχη~ι -\ \-ао степени η и многочлена Ь(х) = Ьшхт + 6m_i#m_1 + · · · + Ьо степени т называется многочлен сгхг + сТ-\ХТ~1 + · · - + Со? где а = щ + Ь% и г = тах(га,га)· Произведением этих многочленов называется многочлен dkXk + dk-\Xk~l + · · · + cfo, где d* = a^bo + α;_ι&ι+ H— * + аобг и k = η + m. Нетрудно проверить, что определенные так сумма и произведение многочленов удовлетворяют свойству дистрибутивности и другим аксиомам кольца. Значением а(а) многочлена а(х) = апхп + αη_ι£™-1 + · · · + +ao на элементе a £ К называется такой элемент β кольца К, что β = αηαη + α^-ΐα^-1 + · · · + αο· Корнем многочлена α(#) называется элемент a £ К, для которого а{а) = 0. Будем говорить, что многочлен а(х) делится на многочлен Ь(х) ф 0, если существует такой многочлен с(х), что а(х) = = Ь(х)с(х). Если многочлен а(х) делится на многочлен Ь(х), то многочлен Ь(х) будем называть делителем а(х), и будем говорить также, что Ь(х) делит а(х) (обозначение b(x) \ а(х))>
4-4- Кольцо многочленов 99 Множество, состоящее из всех многочленов любой конечной степени над К называется кольцом многочленов Щх]. Нетрудно показать, что Щх] будет кольцом, содержащим кольцо К. Более того, если К — кольцо без делителей нуля, то и Щх] будет кольцом без делителей нуля. Действительно, если произведение многочлена а(х) степени η и многочлена Ь(х) степени т равно нулю, то равен нулю и коэффициент апЬт при старшей степени произведения, что, очевидно, невозможно, так как ап и Ьт элементы кольца без делителей нуля. Если кольцо коэффициентов К является полем, то в кольце многочленов над К справедлива теорема об однозначности деления с остатком, аналогичная теореме о делении с остатком в кольце целых чисел. Теорема 4*8. Пусть ¥ — некоторое поле. Тогда для любых многочленов а(х)>Ь(х) £ Щх], где degb(x) > 0, существуют и притом единственные многочлены q(x)> г (χ) 6 Щх], такие, что а(х) = Ь(х) · q(x) + r(x)> degr(x) < degb(x). (4.4) Многочлен г(х) называется остатком, a q(x) — неполным частным при делении а(х) на Ь(х). Доказательство. Обозначим η = dega(x), πι = degb(x), и пусть а(х) = Σ^οΟ,ίΧ1) b(x) = Y™L0biXl. Можно считать, что η > πι > 0, так как все остальные случаи либо сводятся к этому, либо являются тривиальными. Заметим, что старшие коэффициенты ап,Ьш не равны нулю, поэтому существует Ь^ € F. Обозначим а{х) = а(х) — Ь(х) · anb^-xn~m £ F[x]. Коэффициент при хп в разности а(х) — Ь(х) 'апЬ^хп~т равен ап—Ьш-апЬ^ = О, поэтому deg ά(χ) < η. Получили равенство а(х) = Ь(х) · апЬ^г1хп~ш + а(х), dega(x) < п. Применив по индукции эти рассуждения к а(х) и Ь(х), найдем такие q(x)yr(x) € ¥[х], для которых а(х) = Ь(х) · q(x) + г (χ), причем deg q < η-πι и deg r < m. Тогда q(x) = апЬ^хп~ш+^(х) и г (χ) дают искомое представление (4.4).
100 Глава 4- Кольца Теперь докажем единственность представления (4.4). Допустим, что а = bq + г = bq' + г', 0 ^ deg г < deg Ь, 0 < deg r' < deg 6. Тогдаb{q—q!) = rf — r. Hodeg(r' — r) < degb, 3,degb(q—q/) ^ degb при q — qf ^ 0. Противоречия не будет только в случае, когда q = qf и г = г'. Теорема доказана. Пусть F — поле. Если коэффициент при старшей степени многочлена над полем ¥ равен единице, то многочлен называется нормированным. Без доказательства приведем следующее очевидное утверждение. Теорема 4*9. Пусть ¥ — поле. Тогда¥[х] — коммутативное кольцо с единицей и без делителей нуля. Применяя в кольце многочленов теорему о делении с остатком, можно легко убедиться, что если ¥ — поле, то ¥[х] — кольцо главных идеалов. Доказательство этого факта аналогично доказательству того, что каждый идеал кольца Ζ главный. Любой многочлен с(ж), который делит многочлены а(х) и &(#), называется общим делителем этих многочленов. Нормированный многочлен наибольшей степени среди общих делителей многочленов а(х) и Ь(х) называется их наибольшим общим делителем (сокращенно НОД) и обозначается символом (а(ж), Ь(х))> Многочлены, не имеющие общих делителей ненулевой степени, называются взаимно простыми. Легко видеть, что (а(#), Ь(х)) = 1 для любых взаимно простых многочленов а(х) и Ь(х). Теорема 4Л0. Пусть ¥ — поле. Тогда для любых ненулевых многочленов а(х) и Ь(х) над полем ¥ ненулевой нормированный многочлен минимальной степени d(x), удовлетворяющий равенству d(x) = a(x)s(x) + b(x)t(x), (4.5) где s(x) и t(x) — многочлены над ¥, является наибольшим общим делителем многочленов а(х) и Ь(х).
44- Кольцо многочленов 101 Доказательство. Покажем, что а(х) делится на d(x). Представим а(х) в виде а(х) = p{x)d(x)+q(x), где degq(x) < degd(x). Тогда q(x) = а(х) —p(x)d(x) = а(а?) -p(x)(a(x)s(x) + b(x)t(x)) = = а(х)(1 - p(x)s(x)) - b(x)(p(x)t(x)) = a(x)s'(x) + b{x)t'{x), где s'{x) = 1 — p(x)s(x) и tf(x) = —p(a?)i(a?). Так как d(x) — ненулевой нормированный многочлен минимальной степени, удовлетворяющий (4.5), то q(x) = 0 и, следовательно, а(х) делится на d{x). Аналогичным образом доказывается делимость на d(x) многочлена Ь(х). Следовательно, d(x) является общим делителем многочленов а(х) и Ь(х). Теперь покажем, что d(x) будет наибольшим общим делителем. Действительно, если а(х) и Ь(х) делятся на d(x)df(x), где degdf(x) > 0, то в (4.5) правая часть будет делиться на d(x)df(x)^ а левая не будет. Следовательно, d(x) = (α(χ), &(#)). Теорема доказана. Многочлен р(х) называется неприводимым над полем F, если из равенства р(х) = а(х)Ь(х)) где a(x),b(x) G ¥[х], следует dega(x) = 0 или degb(x) = 0. Из определения неприводимого многочлена легко следует, что любой многочлен можно представить в виде произведения неприводимых многочленов, например, в Z2M имеет место равенство хА + χ = х(х + 1)(х2 + х + 1). Лемма 4,3, Если произведение а(х)Ь(х) многочленов а{х) и Ь(х) над полем ¥ делится на неприводимый многочлен р(х), то хотя бы один из сомножителей также делится на р(х). Доказательство. Допустим, что утверждение леммы неверно. Тогда ни один из сомножителей не делится на р(х). Следовательно, (а(х),р(х)) = 1 и (Ь(х),р(х)) = 1, и из теоремы 4.10 следует, что найдутся такие многочлены S\(x),S2(x) и ti(x),t2(x), что 1 = 8\{х)а{х) + S2{x)p{x), 1 = ti(x)b(x) + t2{x)p{x)·
102 Глава 4- Кольца Перемножив эти равенства, получим 1 = (si(x)a(x) + s2(x)p(x)) · (h(x)b(x) + t2(x)p(x)) = = (si(x)ti(x)) · a{x)b{x)+ + {s2(x)ti{x)b{x) + si(x)t2{x)a(x) + s2{x)t2(x)p(x)) -p(x), т.е. в силу теоремы 4.10 многочлены а(х)Ь(х) и р(х) взаимно просты. Противоречие. Лемма доказана. Лемма 4Л. Если произведение αι(#)α2(#) * · · о,п(х) многочленов di(x) над полем¥ делится на неприводимый многочленр(х), то хотя бы один из сомножителей также делится на р{х). Доказательство. Лемму докажем индукцией по числу сомножителей. Случай η = 2 доказан в предыдущей лемме. Допустим, утверждение леммы справедливо для любых произведений, содержащих не более к сомножителей. Тогда если произведение {ai(x)a,2(x) - - - ak(x))o>k+i{x) делится на р(я), то из леммы 4.3 следует, что либо а\(х)а2(х) · · · а^(ж), либо dk+i(x) делится нар(я). В первом случае утверждение леммы следует из предположения индукции. Во втором случае справедливость леммы очевидна. Лемма доказана. Теорема 4.11* Каждый нормированный многочлен над полем F единственным, с точностью до порядка следования сомножителей, образом раскладывается в произведение нормированных неприводимых многочленов. Доказательство. Далее все многочлены считаем нормированными. Теорему докажем методом математической индукции. В основание индукции положим многочлены степени 1, единственность разложения которых очевидна. Предположим, что каждый многочлен, степень которого не превосходит п, разлагается на неприводимые множители единственным образом. Покажем, что из этого предположения следует единственность разложения любого многочлена степени п+ 1. Действительно, если некоторый многочлен t(x) степени η + 1 имеет два различных разложения в произведение неприводимых сомножителей, то t(x) = ρΪ4χ)ρΪ(χ) ■■Pt(x) = q?(x)q?(x) · · · С (ж)·
44- Кольцо многочленов 103 Покажем, 4τορι(χ) совпадает с одним из многочленов qi{x)> Так как неприводимый многочлен р\{х) делит произведение Qi(oc) * · · 910*0 Q2(x) * · · Я2(х) · · Ягп(х) · · · ?т(ж), (4.6) 4 ν 'V ν ' Ч ν ' 51 раз 52 раз 5т раз то в силу леммы 4.4 многочлен ρι(χ) также делит один из его сомножителей. В (4.6) все сомножители — неприводимые многочлены. Следовательно, р\(х) совпадает с одним из них. Без ограничения общности будем полагать, что р\{х) = q\{x). Сокращая левую и правую части равенства (4.6) на р\{х), получим v\1-\x)p^{x) ■ ■ Ркпп{х) = 9?1-l(a0#(a0 · · · СЧя)· (4-7) По предположению индукции многочлен t(x)/p\(x) раскладывается на неприводимые множители единственным образом. Поэтому в (4.7) η = т и для каждого г е {1,... , п} справедливы равенства Pi(x) = q%(x) и кг = s^ Теорема доказана. Лемма 4*5 (теорема Безу), Многочлен f(x) над полем ¥ делится на двучлен х — а, где а £ F, тогда и только тогда, когда /(а) = 0. Значение многочлена f(x) в точке а равно остатку от деления f(x) на χ — а. Доказательство. Если многочлен f(x) делится на χ — α, то f(x) = h(x)(x — α). Тогда f(a) = h(a)(a — a) = 0. С другой стороны, f(x) = h(x)(x - a) + /?, и если /(α) = 0, то легко видеть, что β = 0. Следовательно, f(x) делится на χ — а. Лемма доказана. Теорема 4,12, Многочлен f степени η над полем ¥ имеет в поле ¥ не более η корней. Доказательство. Теорему докажем индукцией по степени многочлена. Очевидно, что ненулевой многочлен нулевой степени не имеет корней. Этот случай (deg/ = 0) положим в основание индукции. Допустим, что утверждение теоремы справедливо для всех многочленов степени не более к. Пусть deg f = k + 1.
104 Глава 4· Кольца Если многочлен f(x) в поле F не имеет корней, то утверждение теоремы очевидно. Пусть а — корень многочлена /(#)* Тогда в силу леммы 4.5 многочлен f(x) делится на χ — α, т.е. f(x) = h(x)(x — α), где многочлен k-й степени h(x) по предположению индукции имеет в F не более к корней. Следовательно, / имеет в поле IF не более к + 1 корней. Теорема доказана. При доказательстве теорем 4.8—4.12 было существенно, что множество коэффициентов К является полем. В случае, когда К не является полем, все они, вообще говоря, неверны. Действительно, пусть, например, К = Ъ§. Кольцо Ze[x] является ассоциативным, коммутативным кольцом с единицей, но, как и Ζβ, содержит делители нуля: например, 2х · За? = 0. В рассматриваемом кольце для х2 и 2х не существует таких многочленов q(x) и г(х), что х2 = 2х · q(x) + г (χ) и degr < < deg2# = 1, иначе для старшего коэффициента а £ Zq частного q(x) должно быть выполнено равенство 2а = 1, но вычет 2 необратим в Ζβ. А для многочленов 2х3 и 2#2 + 2х +1 таких пар (<7, г) несколько: 2х3 = (2х2 + 2я + 1)(ж + 5) + χ + 1 = = (2х2 +2х + 1)(4я? + 2) + 4а? + 4. Таким образом, в Ζ^χ] неверна и теорема о делении с остатком. Многочлен х2 + 3# + 2 имеет в Ζβ четыре корня а? = 1, 2,4, 5, что больше, чем его степень. В кольце Ze[x] он также неоднозначно разлагается на неприводимые множители: х2 + Зх + 2 = = {х + 1)0 + 2) = (х + 4)(х + 5). Наконец, равенство (2х2+х)(Зх + 1) + (2х + 1)(х2+х + 1) = 1 иллюстрирует неприменимость теоремы 4.10 в кольце Z±[x]: оба многочлена а(х) = 2х2 + χ = х(2х + 1) и 6(ж) = 2х + 1 делятся на Ь(ж), однако нормированного делителя максимальной степени у них нет. Таким образом, кольца Щх] и F[#] имеют серьезные отличия. 2* Евклидовы кольца* Формулировки и доказательства утверждений о разложении в кольце многочленов очень похожи на аналогичные формулировки и доказательства в кольце целых
44· Кольцо многочленов 105 чисел. Это не случайно, так как оба эти кольца являются евклидовыми кольцами. Целостное кольцо (без делителей нуля) К называется евклидовым, если каждому его ненулевому элементу а поставлено в соответствие целое неотрицательное число Δ(α) так, что: (1) А(аЬ) ^ Δ(α) для всех a, b φ 0 из К; (2) для всех а,Ь Φ 0 из К существуют такие g,reK, что а = qb + r и А(г) < А(Ь) или г = 0. В кольце целых чисел значение Δ(α) совпадает с |а|, а в кольце многочленов равно степени многочлена. В целостном кольце необратимый элемент ρ называется простым, если не существует таких необратимых элементов а и 6, что ρ = α6. На множестве ненулевых элементов целостного кольца отношение делимости определяется аналогично отношениям делимости в кольце целых чисел и кольце многочленов. Наибольшим общим делителем элементов α и 6 целостного кольца называется их общий делитель, делящийся на все общие делители этих элементов. Нетрудно показать, что в евклидовом кольце для любых ненулевых элементов а и Ъ существует их наибольший общий делитель, обладающий такими же свойствами, что и наибольшие общие делители в Ζ и ¥[х]. Целостное кольцо называется факториалъпым, если каждый его ненулевой элемент а можно представить в виде произведения α = 6ρί1Ρ^···ρ^, (4.8) где b — обратимый элемент, а различные простые элементы РъР2> · · · >Рп определены однозначно с точностью до обратимых множителей. В кольце Ζ есть ровно два обратимых элемента 1 и — 1, поэтому каждое число р^, являющееся простым элементом кольца Ζ в разложении (4.8) целого числа а, определено с точностью до множителя ±1. Следуя доказательствам утверждений данного раздела, нетрудно показать, что любое евклидово кольцо является факториальным.
106 Глава 4· Кольца 4*5* Арифметика многочленов Из доказательства теоремы 4.8 извлекается известный со школы алгоритм деления многочленов в столбик (уголком). Пример 4.11. Рассмотрим многочлены а(х) = х5+2х4+2хг + +х + 1 и Ь(х) = х4 + х2 + 2х + 2 над полем Ζ3 и найдем неполное частное q(x) и остаток г(х) от деления а(х) на Ь(х)> При делении в столбик удобно записывать не сами многочлены, а только их коэффициенты, объединенные в упорядоченный набор, называемый вектором1^. Так, например, многочлен а(х) представляется вектором 122011. Соответствие между многочленами и векторами их коэффициентов взаимно однозначно, если договориться записывать старшие коэффициенты слева. Для сравнения приведем деление а(х) на Ь(х) в стандартной записи и в векторной, которая, очевидно, более компактна: х4 + х2 + 2х + 2 х + 2 122011 10122 21121 20211 10122 12 х5 +2х4 +2хг +х + 1 э?_ + Xs + 2х2 + 2х 2хА + Xs + х2 + 2х + 1 2х4 +2х2 +х + 1 х3 +2х2 +х 1210 Таким образом, q(x) = χ + 2 = 12 и т(х) = х3 + 2х2 + χ = 1210. Следовательно, хъ + 2х4 + 2хг + χ + 1 = (х4 + х2 +2х + 2)(х + 2)+хг + 2х2 + ж, или 122011 = 10122 · 12 + 1210 в векторной записи. Ниже, тоже в векторной форме, приведено умножение и сложение полученных многочленов, которые можно считать про- г> Векторам и векторным пространствам посвящена глава 5. Здесь мы не будем забегать вперед и ссылаться на пример 5.5, векторное представление многочлена будет пока использоваться нами только в целях укорочения его записи. Арифметика таких «векторов» является арифметикой просто переобозначенных по-другому многочленов.
4-5. Арифметика многочленов 107 веркой правильности деления: 10122 12^ 121101 20211 1^10. 101^2 122011 121101 п Полезно знать, что умножение и деление в столбик являются не наилучшими по числу затраченных операций в поле коэффициентов алгоритмами. Их широкая распространенность обусловлена главным образом простотой реализации и привычностью (данью традициям). Начиная со второй половины XX в. было разработано много альтернативных методов1) (алгоритмы Карацубы, Тоома, Шёнхаге — Штрассена, Фюрера и пр.). Для многочленов большой степени их сложность гораздо меньше, чем у умножения — деления в столбик. Далее для удобства будем использовать введенную выше векторную запись η α(χ) = (апап_!... ахао) = ^а^г г=0 многочлена а(х) G ¥[х] уже без пояснений, особенно когда из контекста ясно, что вектор является вектором коэффициентов некоторого многочлена. Пример 4.12 (схема Горнера), Удобный способ вычисления значения многочлена f(x) = апхп + ... + й\Х + ао € Щх] в точке χ = а € F вытекает из следующего равенства: f(a) = ((... (((ana + an-i)ot + ап-2)ос + ап-г) ...)<* + αύα + αο, полученного последовательным вынесением за скобки общих множителей одночленов. Он сводится к рекуррентному вычислению последовательности &о = αη, bi =boa + αη-ι, ... ft* = δ*-ι<* + а>п-и i < га. (4-9) ^См. [5, 23, 29, 30].
108 Глава 4· Кольца По индукции нетрудно установить, что ее последний член Ьп является искомым значением /(а). Также легко видеть, что элементы последовательности {bi} совпадают с коэффициентами неполного частного <?(х), вычисляемого при делении в столбик f(x) на χ — а (Ьо является старшим коэффициентом, a bn_i — свободным членом q{x))> Результат работы принято записывать таблицей вида а ап Ь0 an-i bi ап-2 Ъ2 ai Ьп-1 а0 Ьп = f (а) Из (4.9) следует мнемоническое правило: каждый элемент ее нижней строки (начиная с Ь\) равен сумме соседа сверху с произведением соседа слева на а. По теореме Безу данное вычисление значения f(a) является одновременно вычислением остатка от деления f(x) на х — а и, как оказывается, заодно и неполного частного. В качестве примера найдем значение многочлена f(x) = х8 + +4х7 + 2х5 + х4 + х3 + дх + 2 в точке χ = 3 над полем Ъ$\ 3 1 | 1 4 2 0 1 2 0 1 1 1 4 0 2 3 4 2 4 Таким образом, /(3) = 4. Попутно мы установили, что (в векторной записи) 140211032 = 12101424 12 + 4. Схема Горнера использует η = deg/ сложений и η умножений коэффициентов в поле F. Можно показать1^, что данное число операций является минимально возможным для любого алгоритма, находящего /(а) и не использующего деление в поле F. Таким образом, схема Горнера оптимальна для вычисления f(x) в одной точке. Для вычисления значений f(x) одновременно в т точках при большом т существуют способы с меньшей сложностью, чем независимое вычисление в каждой точке по отдельности, например, быстрое преобразование Фурье2). □ х)См. [1, с. 227-232]. 2)См. 3, 5, 23, 30].
4-5. Арифметика многочленов 109 Из теоремы 4.8 о делении с остатком в кольце многочленов ¥[х], где ¥ — поле, следует, что для вычисления НОД многочленов можно применять те же способы, что и для вычисления НОД в кольце Ζ (см. с. 30—32). В частности, аналогично лемме 2.1 доказывается следующее утверждение, в котором, как и ранее, запись (X, У, Ζ) — Q{Xf, Y\ Zf) означает упорядоченную тройку (X — QXf,Y — QYf>Z — QZf), только уже не чисел, а многочленов. Лемма 4*6. Пусть а(х),Ь(х) £ ¥[х], dega(x) > deg6(x) и Ь(х) Φ 0, Рассмотрим последовательность троек многочленов (Χί,Υί,Ζί) над полем ¥, такую, что {Х-и Y-ъ Ζ-ι) = = (1,0, а(х)), (Хо, Ή, Ζο) = (0,1, Ь{х)) и Хг\ (Хг-2\ /Хг-Л Yi] = [ Yi-2 \-Qi\ Yi-1 ZiJ \Zi-2J \Zi-l) при г ^ 1, где Qi = [^-2/^-1 J — неполное частное от деления многочлена Z^_2 на Zi-γ. Тогда существует наименьшее такое η > 0, что Ζη+ι = 0, и многочлен Ζη является с точностью до постоянного нормирующего множителя наибольшим общим делителем многочленов а(х) и Ь(х). Более того, а- Χχ + Ъ -Yi = Zi при всех г ^ — 1. В частности, a-Xn + b-Yn = Zn. (4.10) Многочлены последовательности Zi,..., Ζη из леммы 4.6 — это остатки алгоритма Евклида. Значит, на последнем шаге имеем Zn | НОД (а, Ь) и НОД(а, b) \ Zn. Остаток от деления даже нормированных многочленов не обязательно нормирован, а НОД, по нашему определению, должен иметь старший коэффициент 1. Поэтому если с € F, с φ 0 — старший коэффициент многочлена Ζη(χ)^ то делением обеих частей (4.10) на с получаем равенство а . *1 + Ь . *» = ^ = нОД(а, 6), (4.11)
по Глава 4· Кольца гарантированное нам теоремой 4.10» Отметим, что равенству (4.5) теоремы 4.10 удовлетворяет бесконечное число пар многочленов s(x),t(x) € F[x]. Многочлены s(x) и t(x) (в частности многочлены Хп/с и Υ^/c), как и в случае целочисленной линейной комбинации, называются коэффициентами Везу. Справедливо следующее утверждение. Лемма 4,7* Степени найденных алгоритмом леммы 4.6 коэффициентов Хп/с и Yn/c являются наименьшими из всех возможных степеней коэффициентов Безу s, t для многочленов a,b в равенстве (4.5). Пример 4,13, Найдем НОД и коэффициенты Безу для многочленов а{х) = х5 + 2х4 + 2xs + χ + 1 = 122011 и Ь{х) = = х4 + х2 + 2х + 2 = 10122 над полем Z3 аналогично тому, как сделали это для чисел в примере 2.2. Первый шаг леммы 4.6 (деление с остатком Ζ_ι = а на Zq = b) был проделан в примере 4.11. Отсюда Qi = 12, Χι = 1-12 0 = 1 и Υι = 0-12-1 = 21. Переходим к шагу г = 2. Поделив с остатком Zo на Zj, получаем Q2 = 11, Z2 = 112 и 10122 = 1210 · 11 + 112, откуда Х2 = 0 - 11 1 = 22, У2 = 1 - 11 21 = 100. Действуя и далее подобным образом, заполним таблицу: 1 0 122011 0 1 10122 1 21 1210 22 100 112 122 2221 11 2102 11220 2 0 В данном случае число делений η оказалось равно 4 (так как Ζ5 = 0, Ζ4 Φ 0)* В силу degZ4 = 0 многочлены а(х) и Ь(х) взаимно просты. Из последнего столбца таблицы по формуле (4.10) имеем 122011 · 2102 + 10122 · 11220 = 2. Найденный многочлен Z\ = 2 не нормирован, следовательно, поделив обе части последнего равенства на его старший коэффициент с = 2, получим а(х) · 1201 +Ь(х) -22110 = (а{х),Ь(х)) = 1. (4.12)
4-5. Арифметика многочленов 111 Таким образом, многочлены хг + 2х2 + 1 и 2х4 + 2xs + χ2 + χ являются искомыми коэффициентами Безу. D Лемма 4.8. Пусть а(х),Ь(х) € ¥[х] и degb(x) ^ dega(x) ^ < N. Тогда число операций поля IF, потраченное для вычисления наибольшего общего делителя (а(х),Ь(х)) и коэффициентов Безу алгоритмом леммы 4.6, не превосходит по порядку величины N2. Доказательство. Действительно, из равенств Ζ_ι = QiZo + Ζι, Zo = Q2Z\+Z2i .♦♦ Zn_2 = QnZn_i + Zn следует, что η Z-i = Zr^i]lQi+h{x), i=l где h(x) — некоторый многочлен, степень которого строго меньше N = degZ_b Поэтому degflQ; = У>ё<2* = deg ^—- < Ν. г=1 г=1 Δη~1 Чтобы найти коэффициенты представления Z^_2 = Q%Zi-\ + Z^ достаточно (9(deg Zi_2 degQi) операций поля ¥ при использовании деления в столбик. Последовательность степеней остатков алгоритма Евклида монотонно убывает: degZ; < degZ;_i. Отсюда следует, что сложность вычисления всех коэффициентов последнего ненулевого остатка Zn не превосходит по порядку величины η η Σ deg Ζί-2 degQi<NY^deg Qi < N2. i=l i=l Аналогично получаются квадратичные оценки сложности и для нахождения XnjYn. Лемма доказана. Пример 4*14* Найдем все неприводимые многочлены над полем Z2, степень которых не превосходит четырех.
112 Глава 4· Кольца Из определения неприводимого многочлена следует, что все многочлены первой степени неприводимьь Над полем Ζ2 их имеется всего два: это многочлены fi(x) = X и /2(2?) = X + 1- Среди многочленов второй степени и выше уже есть приводимые, например хп = хп~1 · х. Тем не менее для многочленов степени 2 и 3 имеется очень простой способ проверки приводимости. Его дает вышеупомянутая теорема Безу: если / € ¥[х] и deg / ^ 3, то многочлен / неприводим над IF в том и только в том случае, когда он не имеет корней в поле F. В самом деле, если / = gh — приводим, то deg<?, h ^ 1, что в сочетании с неравенством deg/ ^ 3 дает degg = 1 или degh = 1, а многочлен первой степени всегда имеет корень в поле коэффициентов. Осталось выбрать среди всех нормированных многочленов степени 2, а именно среди многочленов х2, х2 +1, х2+х, х2+х + 1 те, у которых нет корней в Z2. Таким, а значит неприводимым, будет единственный многочлен /з(х) = X2 + X + 1. Вместо того, чтобы перебирать все нормированные многочлены третьей степени1) (а их всего 23 = 8), заметим, что 0 — корень многочленов с нулевым свободным членом и только их, а единица является корнем многочлена из Z2[#] тогда и только тогда, когда число слагаемых в нем четно. Из восьми многочленов третьей степени только два имеют нечетное число одночленов и одновременно ненулевой свободный член, это многочлены /4(ж) = х3 + χ + 1 и f5(x) = xs + χ2 + 1. Из шестнадцати многочленов 4-й степени только четыре не имеют корней в Z2: χ4 + χ + 1, х4 + х2 + 1, х4 + Xs + 1, х4 + Xs + χ2 + χ + 1. Теперь, однако, этого недостаточно для неприводимости: приводимый многочлен 4-й степени может являться произведением ^ Легко видеть, что число нормированных многочленов степени η над конечным полем ¥q равно qn, а число всех многочленов степени η равно (д — l)qn (старший коэффициент не может быть нулем).
4-5. Арифметика многочленов 113 двух неприводимых многочленов 2-й степени и не иметь корней в поле коэффициентов. Так как неприводимый многочлен 2-й степени у нас один, то приводимый многочлен 4-й степени без корней в Z2 также единственен и является его квадратом, в частности это многочлен (χ2 + χ + I)2 = хА + х2 + 1. Значит, остальные многочлены /б(#) = х4 + х + 1, fo{%) = х4 + хг + 1 и fs(x) = χ4 + χ3 + χ2 + χ + 1 неприводимы. Иных неприводимых многочленов, кроме /ι,...,/s, в заданном диапазоне степеней нет. □ Результаты вычислений примера 4.14 составляют часть приводимой ниже таблицы неприводимых над Z2 многочленов степени не больше 5. Таблица Неприводимые многочлены над Z2 степени ζ 5 степень 1 степень 2 степень 3 степень 4 степень 5 полином X х+1 χ2 + χ + 1 Xs + χ + 1 Xs + х2 + 1 χ4 + χ + 1 х4 + х3 + 1 χ4 + χ3 + χ2 + χ + 1 х5 + х2 + 1 х5 + х3 + 1 χ5 + χ3 + χ2 + χ + 1 χ5 + χ4 + χ2 + χ + 1 х5 + х4 + я3 + χ + 1 х5 + х4 + Xs + х2 +1 векторное представление 10 11 111 1011 1101 10011 11001 11111 100101 101001 101111 110111 111011 111101 Пусть / — многочлен степени п. Покажем, что / неприводим тогда и только тогда, когда он не делится ни на какой неприводимый многочлен степени \-£\ и менее. Действительно, если
114 Глава 4· Кольца f неприводим, то он не делится ни на какой многочлен меньшей степени, в том числе неприводимый. Если же / приводим, то / = gh, где deg д ^ 1 и deg h ^ 1. Так как deg д + deg h = η, то степень одного из многочленов д и h не превышает п/2. Пусть для определенности это многочлен д. Если он неприводим, то мы нашли у многочлена / искомый неприводимый множитель степени не более га/2. В случае, когда д приводим, в качестве искомого множителя можно взять любой неприводимый множитель д — он имеется, так как каждый многочлен разлагается в произведение неприводимых, и степень этого множителя не превосходит deg g ^ га/2. Поэтому для проверки многочлена степени η на приводимость достаточно проверить его делимость на каждый неприводимый многочлен степени не выше га/2: если он не делится ни на один из них, то он неприводим1). Для этого можно воспользоваться заранее вычисленной таблицей неприводимых многочленов. Например, таблица на с. 113 позволяет проверять на неприводимость все многочлены над Ζ2 вплоть до 11-й степени. Пример 4.15. Проверим многочлен f(x) = χ9 + χ4 + 1 на неприводимость над Ζ2. Так как /(0) ^0и /(1) φ 0, то f(x) не делится ни на х, ни на χ + 1. Делимость на остальные неприводимые многочлены проверим делением с остатком. В результате получим следующие равенства: 1000010001 = 111 · 11011101 + 10, 1000010001 = 1011 · 1011110 + 11, 1000010001 = 1101. 1110111 + 10, 1000010001 = 10011 . 100111 + 1000, 1000010001 = 11001 . 111100 + 1101, 1000010001 = 11111 . 110000 + 00001. Ни один из шести остатков не равен нулю, т. е. f(x) не делится ни на какой неприводимый многочлен степени 4 и менее, поэтому f(x) неприводим. D ^Имеются и более эффективные способы проверки приводимости, основанные на строении конечных полей, см. пример 8.7.
4-6. Число неприводимых многочленов 115 Пример 4Л6. Найдем число неприводимых нормированных многочленов второй степени над полем Zig. Нормированный многочлен второй степени из Zig[x] имеет вид х2 + ах + 6, где a, b € Zig произвольны. Легко видеть, что существует ровно 192 = 361 таких многочленов. Если нормированный многочлен приводим, то он представляется произведением х2 + ах + Ъ = (х + с)(х + d) (4.13) двух нормированных двучленов, где коэффициенты с, d лежат в поле Zig и не обязательно различны. Значит, число приводимых нормированных многочленов равно числу различных представлений вида (4.13). Если с φ d, то имеется (2) = —^— = 171 таких произведений, так как (x + c)(x + d) = (x + d)(x + c). Если с = d, то их ровно 19. Следовательно, число неприводимых нормированных многочленов равно разности числа всех нормированных многочленов и числа приводимых нормированных многочленов1^, т.е. равно 192 — (( 2 ) + Щ = 171. □ Аналогично нетрудно установить, что в кольце Ър\х\ имеется ровно р2 — у ^ ) — (X) — Р 2~Р неприводимых нормированных многочленов второй степени, а значит при достаточно больших ρ вероятность неприводимости наугад выбранного нормированных квадратного трехчлена близка к 2- В следующем разделе мы убедимся, что найти точное число неприводимых нормированных многочленов степени η даже для больших значений η достаточно просто. 4.6· Число неприводимых многочленов Число нормированных неприводимых над полем Ър многочленов степени η из Ър[х\ обозначим через Ν(ρ, η). Найдем это число, установив ключевой результат — лемму 4.9 — при помощи метода производящих функций2). "^Можно было сразу заметить, что число приводимых многочленов вида (4.13) равно числу сочетаний с повторениями из 19 по 2. 2'Ниже утверждение леммы 4.9 будет получено без использования производящих функций в разделе 8.2.
116 Глава 4· Кольца Лемма 4.9. Для последовательности N(p,ri) справедливо рекуррентное равенство рп= J2™>N(pym). (4.14) т\п Доказательство. Пусть pim,p2m,. . ^PN(P)m)m — все неприводимые нормированные многочлены степени т. Нетрудно видеть, что, раскрывая скобки в произведении оо ΛΓ(ρ,τη) Π Π (1+РЛт + (РЛт)2 + "- + (РЛтУ + ...), (4.15) т=1 k—\ получим сумму всевозможных произведений неприводимых многочленов, причем каждое произведение встретится в этой сумме ровно один раз. Так как каждый нормированный многочлен единственным образом раскладывается в произведение неприводимых нормированных многочленов, то в рассматриваемой сумме будет содержаться ровно рп произведений степени п. Каждому неприводимому многочлену степени т поставим в соответствие одночлен #ш, а произведению (4.15) — произведение оо N(p,m) J] Γ] (1 + хт + (хт)2 + ... + (хт)1 + ···) = m=l fc=l (416) -nte " rn—l s Так как существует ровно рп многочленов степени гс, у которых коэффициент при хп равен единице, то легко видеть, что в ряду, получившемся после раскрытия скобок в (4.16), коэффициент при хп будет равен рп. Следовательно, ι °° / ι \ N(pym) τ^ = Π т^) · <«7> Логарифмируя правую и левую части (4.17), получим новое равенство 1 In N(p,m) = У^ N(p,m)\n- 1-рх ^ 1-х71 тп=1
4-6. Число неприводимых многочленов 117 Теперь, применяя формулу In y^j — Σ^ϋι пж™> разложим в ряд правую и левую части последнего равенства: ,п Σ ηρΗχη = Σ Σ jb^cp. m)xkm = Σ Σ ^>™) ιχ' η—1 rn=l k=l η—\ \km-n / Приравнивая в получившемся равенстве коэффициенты при п-й степени х, находим 1?η= Σ ^(P,m) = X;^JV(p,m). кт=п т | η Лемма доказана. Для того чтобы из равенства (4.14) в явном виде выразить функцию Ν(ρ, η), воспользуемся формулой обращения Мёбиуса, которую докажем далее в лемме 4Л1. Сначала определим функцию Мёбиуса μ(η) = { 1, если η = 1; (— l)fc, если η — произведение к простых чисел; О, если η делится на квадрат простого числа, и покажем, что имеет место следующее утверждение. Лемма 4Л0* Справедливо равенство Σ, , | 1, если η = 1; , Л „лч μ(η)={' ' (4.18) О, если η > 1. га |тг V Доказательство. Если η = 1, то единица является единственным делителем, и, следовательно, μ(1) = 1. При η > 1 представим η в виде произведения простых чисел: η = р\г · - -pfr. Легко видеть, что в сумме (4.18) нужно учитывать только делители без кратных множителей. Поэтому Σ Mm) = J2 Σ μλι · · ·%) = Σ (Ι)(-1)* = °· πι\η к=0 1^ч< <гк^г к=0 ^ ' Лемма доказана.
118 Глава 4 · Кольца Лемма 4.11 (Обращение Мёбиуса)* Функции f(n) и h(n), определенные на множестве целых положительных чисел, удовлетворяют равенству f(n) = 2_j h{m) при всех η Ε Ν (4.19) т\п тогда и только тогда, когда h(n) = ^2μ( — μ{τη) при всех η е N. (4.20) т | η Доказательство. Покажем, что из (4Л9) следует (4.20). Для этого прежде всего заметим, что т\п т\п так как суммы, стоящие в обеих частях равенства, отличаются только порядком следования слагаемых. Затем в правую часть последнего равенства вместо /(га) подставим правую часть равенства (4Л9). Меняя в получившейся двойной сумме порядок суммирования и применяя лемму 4.10, получим следующую цепочку равенств: Σ **»)/(£) = Σ "Μ Σ **) = т\п т\п к\ — = Σ Σ М(т)Ь(А) = Σ Ai(m)fc(A) = τη Ι η k\ — km I η = Σ Σ M(m)/»(fc) = £>(*) Σ ^т) = Чп). k\n m\j: k\n mlf Таким образом, справедливость равенства (4.20) установлена. Обратное утверждение доказывается аналогично. Лемма доказана. Теорема 4.13. Для числа Ν(ρ,ή) неприводимых многочленов степени η справедливо равенство *<р.·» 4 Σ О" т | η
4.7. Кольцо остатков и поле многочленов 119 Доказательство. Из леммы 4.9 следует, что первое равенство леммы 4.11 справедливо при f(n) = рп и h(n) = nN(p,n) для всех натуральных п. Поэтому утверждение теоремы следует непосредственно из леммы 4.11. Теорема доказана. 4.7* Кольцо остатков и поле многочленов Множество многочленов из Ър\х\ степени не выше η — 1 с операциями сложения и умножения по модулю многочлена h(x) степени η является кольцом. Оно называется кольцом остатков по модулю h(x) и обозначается Zp[x]/h(x). Нетрудно видеть, что кольцо Zp[x]/h(x) изоморфно фактор-кольцу К/1 кольца К = Ър[х\ по идеалу / = /Ж, образованному всеми многочленами из Ър\х\, кратными многочлену h(x): элемент а € Zp[x]/h(x) представляет смежный класс a + /cZp[4 Очевидно, что кольцо Zp[x]/h(x) состоит из рп элементов, где η = degh(x). Также нетрудно видеть, что Zp[x]/h(x) содержит в себе Zp как под- кольцо и является коммутативным кольцом с единицей. Более того, справедлива следующая теорема. Теорема 4Л4* Пусть ρ — простое и h(x) — многочлен из Zp[x] степени п. Тогда фактор-кольцо Zp[x]/h(x) является полем из рп элементов в том и только в том случае, когда h(x) неприводим над полем Zp. Доказательство. Кольцо Zp[x]/h(x) является коммутативным кольцом с единицей и состоит из рп элементов. Поэтому достаточно показать, что любой ненулевой элемент этого кольца имеет обратный по умножению, если h(x) неприводим. Так как (f(x),h(x)) = 1 для любого ненулевого f(x) из Zp[x]/h(x)) то в силу теоремы 4.10 найдутся такие многочлены s(x) и ί(#), что 1 = s(x)f(x) +t(x)h(x). Поэтому f(x)s(x) = 1 (mod h(x)), т.е. f(x) имеет обратный элемент в Zp[x]/h(x). С другой стороны, если h(x) = a(x)b(x), то а(х) и Ь(х) являются делителями нуля в кольце Zp[x]/h(x) в силу равенства а(х) · Ь(х) = 0 (mod /ι(χ)). Поэтому если многочлен h(x)
120 Глава 4· Кольца приводим над Ζρ) то кольцо Zp[x]/h(x) не является полем. Теорема доказана. Теорема 4Л5* Для любого простого ρ и любого натурального η существует конечное поле из рп элементов. Доказательство. Существование поля из рп элементов для простого ρ и натурального η легко следует из теоремы 4.14 и существования в Ър[х] неприводимого над Ър многочлена любой степени п. В свою очередь существование такого многочлена является простым следствием теоремы 4.13 о числе неприводимых многочленов. Действительно, по определению функции Мёбиуса μ(^) ^ —1 при всех га | гг. Следовательно, "<*»> = ;; £"(£>"> τη\η \ т\п,тфп J \ m=Q / _l/n Pn-l\_pn+1-2pn + l^ 1 ^ 0^ η \ p— 1 J n(p — 1) "" n(p — 1) так как pn+1 ^ 2pn в силу того, что р ^ 2. Мы доказали, что при всех натуральных η и при всех простых ρ величина Ν(ρ,ή) положительна. Кроме того, 7V(p, п) — целое число. Значит, Ν(ρ, η) > 1 и неприводимый многочлен степени η найдется в Ър\х] при всех пир. Теорема доказана. Пример 4.17. Найдем асимптотику числа 7V(p, п) неприводимых над Ър многочленов при η —► оо и фиксированном простом р. Оценим Ν(ρ,ή) сверху и снизу функциями с одинаковым асимптотическим поведением. Так, из теоремы 4.13 очевидно следует, что, во-первых, Ν(ρ, η) ^ ρη/η при всех пир. Во-вторых, Щр,п)^-(рп-прп/2)у η V / так как у числа η не больше η делителей, и наибольший ере-
4.7. Кольцо остатков и поле многочленов 121 ди них (отличный от п) не превосходит п/2. Отсюда следует1), что Ν{ρ} η) ~ рп/п при η —> оо. Π Замечание 4.1* Отметим, что из того, что Ν(ρ,η) —> оо при η —> оо, не следует, что Ν(ρ,η) > 0 при всех п, а только при достаточно больших п. Иными словами, теорема 4.15 не является следствием рассмотренного выше примера. Замечание 4*2. Пусть η > 1 и h(x) = αη#η +... + а\Х + αο — произвольный многочлен над Ζρ, не обязательно неприводимый. Рассмотрим фактор-кольцо К = Zp[x]/h(x) и его элемент — вычет2 ^ [х] = \x\h* Подставим [х] в многочлен h(x) в качестве аргумента — это действие корректно, так как поле Ър коэффициентов многочлена h(x) изоморфно вложено3) в К: h([x\) = ап[х]п + αη-ι[χ\η~ι + ... + αϊ [яг] + а0 = = Ы[х]п + [оп-гЫ7^1 + ... + Ы[х] + Ы = = [апхп + ... + агх + αο] = [f(x)} = [0]. Мы видим, что значение /ι([ж]) является нулем кольца К. Таким образом, каким бы ни был многочлен /ι, вычет [х] является его корнем в кольце остатков по модулю h и вдобавок самым «просто устроенным» корнем среди всех остатков. Поэтому определение корня многочлена, данное на стр. 98, может быть естественным образом обобщено с кольца его коэффициентов на другие алгебраические структуры. ^Напомним, что запись fn ~ дп при η —> оо означает, что существует предел limn^oo fn/gn = 1. Согласно известной теореме из анализа (мажоритарный признак сходимости последовательностей), если последовательности an, bn и Сп таковы, что ап ~ сп и ап ^ bn ^ с^ при всех п, начиная с некоторого по, то Ьп ~ ап и Ьп ~ Сп. ^Элементы кольца остатков Zp[x]/h(x) иногда обозначаются [д]н по аналогии с вычетами из Zn (стр. 41), чтобы подчеркнуть, по какому модулю берется вычет д. Также запись в квадратных скобках используется вместо обозначающей остаток по модулю записи д (mod n) или д (mod h) для компактности, например [—5]з = 1. Обычно, однако, квадратные скобки и индексы к ним опускаются, когда модуль и природа аргумента ясны из контекста. 3^Изоморфизм Zp с подкольцом в К определен равенством φ(α) = [α]&.
122 Глава 4· Кольца Теорема 4Л4 позволяет задавать конечные поля в явном виде и выполнять в этих полях операции сложения и умножения. Для задания поля из рп элементов выберем в Ър\х\ неприводимый над Ър многочлен п-й степени h(x). Элементы поля будем представлять в виде упорядоченных наборов (ап-ь..., αο) длины η с элементами из Ζρ. При этом операция сложения выполняется покомпонентно, а для умножения элементов а = = (αη_ι,..., αο) и b = (Ьтг-ъ · · · > δο) надо вычислить произведение г(х) = тп-\Хп~1 + · · · + Го многочленов а{х) = an-ixn~1+ + - · · + αο и b(x) = bn-ixn~l + · · · +bo no модулю многочлена h(x) и в качестве произведения ab взять набор (rn_i,·.., Го) коэффициентов многочлена г(х). Пример 4.18· Построим поле ¥ из 27 элементов. Для этого понадобится неприводимый нормированный многочлен третьей степени из Ъ$[х}. Так как любой приводимый многочлен третьей степени над Z3 имеет корень в Ъ$, то многочлен х(х + 1)(х + 2) + + 1 = х3-\-2х+1 будет неприводимым над Z3. Поэтому в качестве поля ¥ можно взять фактор-кольцо йз[#]/(#3 +2ж + 1). Элементы такого поля удобно представлять наборами коэффициентов многочленов α2#2 + αι# + αο из Х^[х]/(хг +2х + 1), т.е. наборами вида (а^сцао), где а% £ Ζ3* Найдем сумму и произведение элементов (111) и (220). Легко видеть, что (111) + (220) = (001). Далее, так как (χ2 + χ + 1)(2я2 + 2х) = 2х4 + Xs + х2 + 2х = = (Xs + 2х + 1)(2х + 1) + (х + 2), то (111)-(220) = (012). D 4.8. Китайская теорема об остатках для многочленов Доказательство теоремы 4.14 указывает удобный способ нахождения обратного элемента в К = Zp[x]/h(x) не только в том случае, когда многочлен h(x) неприводим, но и когда этот многочлен приводим, а кольцо К не является полем. В частности,
4.8. Китайская теорема об остатках для многочленов 123 f(x) G К обратим, т.е. f(x) e К*, тогда и только тогда, когда найдутся многочлены s(x)>t(x) такие, что в кольце Ър[х\ выполнено равенство s{x)f{x) + t(x)h(x) = 1. (4.21) Установить такие s(x), t(x) или доказать их отсутствие, а значит и необратимость /(ж), помогает алгоритм Евклида (см. с. 109). Действительно, для любых многочленов f{x),h{x) £ %р[х] этот алгоритм находит нормированный наибольший общий делитель d(x) = (/, h) и коэффициенты Безу sf(x)^t/(x), так что s'(x)f(x)+t'(x)h(x) = d(x). Если d(x) φ 1, то это противоречит равенству (4.21), так как его левая часть делится на d(x), а значит f(x) ^ К*. Иначе, рассмотрев остатки от деления обеих частей (4.21) на Л(я), имеем s(x)f(x) = 1 (mod h(x))} а значит f~l{x) = s{x) (mod h(x)). Пример 4Л9, Полученное на с. 110 в кольце Z$[x] тождество 122011 · 1201 + 10122 · 22110 = 1 показывает, что вычет f(x) = 10122 обратим в кольце К = = 2зМ/Л(ж), где h(x) = 122011, причем f~\x) = 22110. Нетрудно также убедиться, что НОД (122011,1111) = 101 φ 1, поэтому вычет 1111 не имеет обратного в К. Так как 122011 = = 101 · 1211, где многочлены а(х) = 101 и Ь(х) = 1211 неприво- димы над Ζ3, то делителями нуля в К будут кратные а(х) или Ь(х) вычеты, и других делителей нуля в К нет. D Другой способ производить арифметические действия в фактор-кольце К = Zp[x]/h(x) при составном модуле h(x) описан ниже в данном разделе. Он основан на строении кольца К, и в его основе лежит следующая теорема, называемая китайской теоремой об остатках для многочленов. Теорема 4,16, Пусть mi(x),.., ,тп(х) — попарно взаимно простые многочлены над полем F, М(х) = т\{х) · · · тп(х) — их произведение, ai(cc),..., ап{х) — такие многочлены над полем¥,
124 Глава 4· Кольца что degdi(χ) < degnii(x). Единственным решением сравнений b(x) = а\{х) (mod mi{x)), Л b(x) = a>2{x) (mod rri2{x)), I b(x) = an(x) (mod mn(x)), ) в кольце Ψ[χ]/Μ{χ) является многочлен η b0{x) = (22<n(x)Mi(x)Ni{xY) (mod M{x)\ (4.23) г=1 где Mi(x) = M(x)/rrii(x) и Ni(x)Mi(x) = 1 (mod rrii(x)) для г = = l,2,...,n. Доказательство. Допустим, что система (4.22) имеет два различных решения с(х) и d(x) Ε F[#]/M(#). В этом случае их разность Ь(х) = с(х) — d(x) φ О удовлетворяет неравенствам О ^ deg Ь{х) < deg Μ (χ) (4.24) и является решением системы сравнений Ь(х) = 0 (mod mi), Ί b(x) = 0 (mod ГП2), I Ь(ж) = 0 (mod mn). J Из (4.25) следует, что каждое Шг(х) делит с(х) — d(x) и, следовательно, входит в разложение с(х) — d(x) на неприводимые многочлены. Поэтому deg(c(x) —d(x)) ^ degM(#), что противоречит (4.24). Таким образом, каждая система вида (4.22) имеет не более одного решения в кольце ¥[х]/М(х). Найдем это решение. Прежде всего отметим, что многочлены М{(х) и гпг(х) взаимно простые. Поэтому в силу теоремы 4.10 существует такой многочлен Ni(x), что системы (4.22) (4.25) Мг(х)Щх) = 1 (mod пы(х)).
4.8. Китайская теорема об остатках для многочленов 125 Так как Ь(х) (mod гпъ{х)) = (Ь(х) (mod Μ (χ))) (mod Шг(х)) для любого b(x) и каждого г = 1,2,..., га, и, кроме того, в силу условий теоремы М>(ж) = 0 (mod rrii(x)) при г φ j, то легко видеть, что многочлен 6о(х), определяемый формулой (4.23), действительно является решением рассматриваемой системы сравнений. Теорема доказана. Пример 4.20. Найдем решение системы над полем Ъ$\ Ь(х) = 4 (mod х + 1), 1 b(x) = l (mod я + 2), \ Ь(х)=2 (mod^ + 3). J Очевидно, что двучлены х + 1, χ + 2 и χ + 3 попарно взаимно просты. Тогда по теореме 4.16 имеем Ь(х) = 4 · Мг · ΛΓι + 1 · М2 · Ν2 + 2 · М3 · Ns (mod М(ж)), где М(х) = {х + 1){х + 2){х + 3) = χ* + χ2 + χ + 1 и Μι (а?) = (я? + 2)(х + 3) = х2 + 1, М2{х) = (х + 1)(х + 3) = я2 + 4х + 3, М3(х) = (х + 1)(х + 2) = х2 + Зх + 2. Как следует из доказательства теоремы 4.16, многочлен Ni является обратным к многочлену Mi по модулю га^, а каждый многочлен πΐί в данном случае имеет вид χ — а для некоторого а е Ζ5. Поэтому можно воспользоваться теоремой Безу и найти Μι (ж) = М(-1) = 2 (mod χ + 1), М2(х) = М(-2) = 4 (mod χ + 2), Ms(x) = М(-3) = 2 (mod x + 3),
126 Глава 4· Кольца откуда в силу изоморфизма Ζ5[χ]/(# — α) = Z5 следует, что Νλ = Ν3 = 2"1 = 3 (mod 5) и N2 = 4"1 = 4 (mod 5). Отсюда получаем ответ Ь(х) = 4 · 3 · (х + 2)(ж + 3) + 1 · 4 · (х + 1)(х + 3)+ + 2-3-(я?+1)(я? + 2) = = 2(х2 + 1) + А(х2 + Ах + 3) + (ж2 + Зх + 2) = 2я2 + 4ж + 1. Таким образом, 6(ж) = 2х2 + Ах + 1 является единственным решением системы в кольце Z^[x]/M(x)1 а в кольце Ъ*\х\ система имеет бесконечно много решений вида Ь(х) + с(х) · М(х), где с(х) — произвольный многочлен из кольца Ъ§\х\. Проверить найденный ответ можно также с помощью теоремы Везу: нетрудно видеть, что действительно Ь(—1) = 4, 6(—2) = 1, Ь(—3) = 2. D Пример 4.21. Решим в кольце многочленов Z2[x] систему сравнений Ь(ж) = 10 (mod 111), λ b{x) = 101 (mod 1101), I 6(a?) = 1111 (mod 10011). J Многочлены m\{x) = 111 = x2+x+l, rri2(x) = 1101 = x3+x2 + l, гпз(х) = 10011 = χ4 + ж + 1 неприводимы над Z2 (см. с. 113) и, следовательно, взаимно просты. Применим теорему 4Л6. Последовательно находим: М(х) = 1001010101, Μι(χ) = 11000111, М2(х) = 1111001, М3(х) = 100011. Далее находим М\{х) = ll(modmi(a;)), М2(х) = 110(modm2(a)) и Мз(х) = 101(пкх1тз(х)). Отсюда Νι(χ) = Μι (χ)"1 = 10 (mod mi(x)), N2{x) = M2{x)~1 = 10 (mod m2{x)), N${x) = Мз(я)"1 = 1011 (mod т3(ж)).
4.8. Китайская теорема об остатках для многочленов 127 Последние равенства были получены с помощью алгоритма Евклида. Подставляя полученные значения в формулу (4.23), находим Ъ(х) = а\(х) · Μχ{χ) · Νχ{χ) + а2(х) · М2(х) · N2(x)+ + а3{х) - М3(х) - N3{x) = = αχ(χ) -110001110 + а2(х)· 11110010 + а3(я?)· 101111101 = = 110110111101 = 100001 l(modAf (ж)). Следовательно, многочлен Ь(х) = 1000011 является единственным решением рассматриваемой системы в кольце Z2[x]/M(x). Множество ее решений в кольце Z2[x] выражается формулой Ь(х) = 1000011 + с(х) · М(х), где с(х) G Ъ2\х\ — произвольный многочлен. D Китайская теорема об остатках для кольца многочленов (теорема 4.16) имеет следствие, аналогичное теореме 3.17 для колец числовых вычетов (и аналогично доказываемое), которое удобно формулировать на языке изоморфизмов и прямых сумм. Теорема 4,17, Пусть д(х) и h(x) — произвольные многочлены положительной степени из Ър[х\. Если д(χ) и h(x) взаимно просты, то фактор-кольцо Zp[x]/f(x), где f(x) = g(x) · h(x), изоморфно прямой сумме фактор-колец Ър[х]/д{х) и Zp[x]/h(x). Заметим, что если (ρ, Κ) φ 1, то последнее утверждение, вообще говоря, неверно. Итак, пусть М{х) = т\{х) - - - тп{х) — разложение многочлена М(х) G Ър[х\ в произведение различных взаимно простых многочленов ггц{х). Тогда, применяя по индукции теорему 4.17, получим Ър\х\/М{х) 9ё Zp[x]/mi(x) ® · · · ® Ър\х\/тп(х). (4.26) Каждый элемент Ь(х) кольца Ζρ[χ]/Μ(χ) однозначно определяется системой остатков αι(χ),... ,ап(х) по формулам (4.22) и (4.23). Для сокращения запишем это одним из двух следующих способов: Ь = [αϊ, . . . , αη]πιλ^ηπιη ИЛИ Ь = [αϊ, . . . , Оп\м,
128 Глава 4· Кольца причем будем опускать внешние индексы в случае, когда из контекста ясно, по какой системе взаимно простых делителей какого многочлена представлен вычет 6. Данное представление гомоморфно (сохраняет обе операции кольца Ζρ[#]/Μ), т.е. если 6 = [αϊ, ...^nJH^K,..., aJJ, то b + У = [αϊ + a'x, ...,αη + <4Ь Ь · Ъ* = [αϊ · а\>..., αη · а!п]. Подчеркнем, что здесь в г-й компоненте di о а[ упорядоченного набора [αχ о a'l5..., ап о а'п] используется операция о 6 {+, · } кольца 7tp[x]/mi. Будем называть такое представление вычетов кольца Ър[х\/М{х) представлением системой остатков. Представление многочленов системой остатков имеет много полезных следствий. Изоморфизм колец (4.26) влечет изоморфизм их мультипликативных групп. В частности, элемент b = [αϊ,..., ап] обратим по умножению тогда и только тогда, когда обратимы все а*, причем б-1 = [а^1,..., а"1], где обратный к αι вычет берется в кольце Ър[х}/тг. При всяком I € Ζ справедливо и более общее свойство Ь1 = [а\,... , ajj. Поэтому (лемма 3.2) мультипликативный порядок элемента Ь £ (Zp[x]/M)* равен наименьшему общему кратному порядков элементов a* Ε G (Z^[ar]/mi)*. Пример 4.22. Как мы убедились в примере 4.20, над полем Z5 справедливо равенство 2х2 + Ах + 1 = [4, 1,2\χ+ι>χ+2,χ+$- Легко также видеть, что Зх + 2 = [4,1,3]. Поэтому разность 2х2 + χ + 4 многочленов 2х2 + 4^ + 1 и Zx + 2 представляется системой остатков [4,1,2]-[4,1,3] = [4-4,1-1,2-3] = [0,0, 4], а их произведение [4,1,2]· [4,1,3] = [4 · 4,1 · 1, 2 · 3] = [1,1,1] равно единице, т. е. эти многочлены являются взаимно обратными вычетами в кольце Ъь[х\/{х + 1){х + 2){х + 3). D Пример 4.23. Рассмотрим кольцо вычетов Ъп по составному модулю η = α&, где a, b > 1. Если (a, b) = 1, то, согласно теореме 4.3, ЪаЬ = Ъа® Ъъ. Следовательно, Ζ*6 = Ζ* χ ZJ. Число обратимых по модулю η вычетов совпадает с порядком группы Ъ*п и равно φ(η), где φ — функция Эйлера. Число элементов
4.8. Китайская теорема об остатках для многочленов 129 в прямом произведении Ζ* χ Ъ\ равно φ(α)φ(δ). Таким образом, мы убедились в мультипликативности функции Эйлера, т.е. в равенстве (p(ab) = <р(а)(р(Ь) при (а, Ь) = 1, независимо от леммы 2.5. □ Пример 4.24. Порядок мультипликативной группы кольца Ζ9ι = Ζ7 ® Ζΐ3 равен у>(91) = у>(7) - ^(13) = б * 12 = 72. Поэтому х72 = 1 (mod 91) для любого χ € Ζ^ по теореме Эйлера (теорема2.13). Воспользуемся изоморфизмом Ζ^ = ЩхЩ% и рассмотрим элемент я = (х\, Х2) GZ^x Zj^* Заметим, что х\ = 1 (mod 7) и #22 — 1 (mod 13), поэтому порядки элементов х\ £ Z£ и Х2 G Z|3 являются делителями чисел б и 12 соответственно. Порядок элемента χ = (χι,Χ2) равен наименьшему общему кратному порядков элементов Х\ и #2? причем НОК(б?12) = 12. Следовательно, в данном случае теорема Эйлера может быть немного усилена: в действительности х12 = 1 (mod 91) для любого χ взаимно простого с 91. Аналогичным образом нетрудно установить, что х^п^ = 1 (mod η), где ip(n) равно наименьшему общему кратному чисел φ(ρ*?) = ρ*? - р^~\ если η = р\1 .. .pksa и (х, п) = 1. D Пример 4.25. В примере 4.21 было показано, что 1000011 = [10, 101, 11111мм, где М(х) = 111 · 1101 · 10011 = 1001010101. Порядок мультипликативной группы К* кольца К = Ър[х\/М{х) равен 3 · 7х х15 = 315 в силу неприводимости многочленов 111,1101,10011. Нетрудно убедиться, что порядки элементов 10, 101 и 1111 в мультипликативных группах полей Ър[х\/{111), Ζρ[#]/(1101) и Ър[х]/(10011) равны 3, 7 и 5 соответственно. Поэтому порядок элемента 1000011 е К* равен НОК(3,7,5) = 105 и является максимально возможным в К*. D Аналогичные китайской теореме об остатках утверждения справедливы для многих колец и идеалов1). Подобные факты ценны тем, что помогают свести изучение составного кольца, например кольца Ζ % кв, к изучению более просто2) устро- Р\ —Рз 1^См., например [23]. ^Строению кольца Ζη посвящен раздел 7.5.
130 Глава 4· Кольца енных колец типа Zpk> В частности, справедливо, что Z300 — ^ Ζ22 Θ Ζ3 Θ Ζ52, однако Ζ30ο ^ Ζ15 Θ Ζ20. Теорема 4.18 (интерполяционная теорема Лагранжа). Пусть ¥ — поле, f(x) е ¥[х] и #сь#ъ... ,хп € F, £; т^ £j ~~ попарно различные элементы поля F. Пусть deg f = η и известны значения многочлена f в η + 1 точках: Дяо) = Иъ /fai) = 3/ъ · · ·, /(яп) = Уп, тогда ^ = у^ (а? - so). ■ ■ (а? - a?j-i)(x - ж»-ц) ... {χ - хп) ~ 1(Хг ~ Хо) · · · (Ж* - Ж*-1)(Жг ~ 3?i+l) . . . (ж* - Я?п) * (4.27) Равенство (4.27) называется интерполяционной формулой Лагранэюа, а многочлен в его правой части — интерполяционным полиномом Лаграноюа. Доказательство. По теореме Безу /(ж*) = у% тогда и только тогда, когда f(x)=Vi (mod (x-Xi)). (4.28) Многочлены rtii(x) = χ — Xi попарно взаимно просты, поэтому, применяя к системе равенств (4.28) при 0 ^ г ^ η китайскую теорему об остатках, можно найти f(x). Действительно, в обозначениях теоремы 4.16 (Ц(Х) = Уг е F, М{х) = JJfr-a?*), Mi(x) = J\(x-Xk) = М(х) } л ι / - Χ Χ% причем Ni(x)Mi(x) = 1 (mod (#—#$)), откуда с учетом того, что Mi(x) = Мг(а?г) (mod (x-Xi)) и Mi(x{) φ 0, следует, что ЛГ*(ж) = = Mi(xi)~l, т.е. многочлен Л^(ж) является некоторой константой из F. Применяя формулу (4.23), имеем η ί=ο М%(-Хг) ί=ο j&Xl хз
Задачи 131 так как степень каждого ее слагаемого di(x)Mi(x)Ni(x) строго меньше степени многочлена М(х). Под делением в поле, как обычно, понимается умножение делимого на обратный к делителю элемент. Теорема доказана. Следствие 4.2. Любой многочлен степени η над полем ¥ однозначно определяется своими значениями вп+1 различных точках поля ¥. Последнее утверждение имеет естественное ограничение: в поле ¥ должно быть не менее η + 1 элементов. Пример 4,26, Найдем многочлен f(x) наименьшей степени над полем Ζγ, принимающий значения 2,6, 3 в точках 1, 2,3 соответственно. Из формулы (4.27) получаем fM_o (*-2)(я-3) (а?-1)(а?-3) (х-1)(х-2) _ /W (1-2)(1-3) ^ (2-1)(2-3) ^ (3-1)(3-2) = (х2 + 2х + 6) + (х2 + Зх + 3) + Ь{х2 + Ах + 2) = Ах + 5, где деление в поле Ζγ — это умножение на обратный вычет. D Задачи 4.1. Будет ли множество Q[\/2? >/3] с обычными операциями сложения и умножения кольцом? Полем? 4.2. Показать, что любой гомоморфизм поля будет либо изоморфизмом, либо будет отображать все элементы поля в нулевой элемент. 4*3. Доказать, что над полем F множество всех линейных функций вида ах + 6, α ψ 0 образует группу относительно операции суперпозиции. Найти ее порядок при |F| = q и исследовать ее структуру (коммутативность, цикличность, система образующих и пр.). 4.4. Доказать, что если идеал кольца содержит обратимый элемент, то он совпадает со всем кольцом. 4.5. Образуют ли идеал необратимые элементы кольца 1) Z, 2) Zn, 3) Zp[x], 4) Щх], 5) ОД? 4*6. Доказать, что при любых простом р, натуральном η и h(x) G Zp[x] все идеалы в кольцах Ζ, ηΖ, Ζη, Ζρ[χ] и Zp[x]/h(x) — главные.
132 Глава 4· Кольца 4.7. Доказать, что кольцо Щх] и кольцо ^[х, у], состоящее из всевозможных многочленов от двух переменных я, у с коэффициентами из Ъъ, не являются кольцами главных идеалов. 4.8. На стр. 97 была отмечена схожесть идеалов с нормальными подгруппами. Показать, что аналогично тому, как образ гомоморфизма групп является подгруппой (не обязательно нормальной), так и образ гомоморфизма колец является подкольцом (но уже не обязательно идеалом). 4*9. Найти все гомоморфизмы колец 1) Ζ —► mZ, 2) 2Z —► 2Z, 3) 2Z^ 3Z, 4) Zn ^Zm. 4Λ0. Останется ли верной теорема 4.8, если F — кольцо без делителей нуля, не являющееся полем? 4Λ1. Доказать леммы 4.6 и 4.7. 4.12. Доказать теорему 4.17. 4.13. Определить, изоморфны ли фактор-кольца Z2[x]/(xs + 1) и Z2[x]/(x3+x+l). 4.14. Пусть f(x) = Σ&=οα*^ — неприводимый многочлен над Ζ2. Показать, что многочлен Y^=QQ>k%n~k неприводим. 4.15. Найти число правильных несократимых дробей со знаменателем f(x) = χ8 + χ7 + χ4 + χ3 + 1 е Ζ2[χ]. 4.16. Найти с помощью расширенного алгоритма Евклида для кольца многочленов обратный вычет к вычету χ4 + χ3 + 2 в кольце Zs[x]/f(x), где f(x) = х6+ 2х3 + х2 + 2. 4.17. Доказать, что если многочлен f(x) неприводим над Zp, то многочлен f(ax + b) также неприводим при всех а, Ъ £ Ζρ, α ^ 0. 4.18. Показать, что в целостном кольце наибольший общий делитель определен однозначно с точностью до обратимого множителя. 4.19. Показать, что в евклидовом кольце для любых ненулевых элементов аиб существует их наибольший общий делитель d, который можно представить в виде d = аи + bv, где и и ν — элементы кольца. 4*20. Доказать факториальность произвольного евклидова кольца. 4*21. Показать, что всякое евклидово кольцо является кольцом главных идеалов. 4*22. В кольце 2Ζ привести примеры элементов с неединственным разложением на простые элементы. 4*23. Является ли определенная на стр. 129 функция ф(п) мультипликативной, т.е. верно ли, что ф(аЪ) = ф(а)ф(Ь) при (а, Ь) = 1?
Задачи 133 4.24. Доказать, что функция Мёбиуса μ(η) так же, как и функция Эйлера φ(η), мультипликативна, т.е. что μ(α&) = μ{α)μ{\)) для всех взаимно простых натуральных а и Ъ. Доказать, что при всех η е N ΨΚ j V m ■ |0,n>2. 4*25. Доказать мультипликативный вариант формулы Мёбиуса (ср. с леммой 4.11): функции /:N-^lnfe:N-^l удовлетворяют равенству f(n) = \\ш\п h(m) при всех η £ N тогда и только тогда, когда при всех η е N выполнено равенство h(n) = Y[f(mr(%). тп\п Данное утверждение справедливо и для функций /, h : N —► G, где G — произвольная абелева группа с операцией, обозначаемой умножением. 4*26. Доказать, что произведение всех нормированных неприводимых над Zp многочленов степени η равно Πτηΐηί^ — χ)μ{™Κ 4.27. (Обобщенная китайская теорема об остатках.) Пусть К. — коммутативное кольцо с единицей, а /, J С К - такие его идеалы, что / + J = К. Доказать, что произведение IJ является тогда пересечением ΙΠ J, а также что K/(IJ) = К/1 <g> К/J. Более того, изоморфизм φ : К// <g> К/J —> K/(/J) можно задать равенством <р(х,у) = гх + jy, где элементы г G /, j G J таковы, что г -j- j = 1.
Глава 5 Линейные пространства Возникшая при взаимодействии физики, геометрии и математического анализа теория линейных (векторных) пространств успешно используется практически во всех непрерывных разделах современной математики. Не менее эффективно линейные пространства можно использовать и при изучении дискретных объектов, в частности конечных полей. В этой главе вводятся основные понятия теории линейных пространств и устанавливается ряд ее фундаментальных результатов, необходимых для различных приложений этой теории. 5.1· Линейные пространства и их свойства Множество V с операциями сложения и умножения на элементы поля F называется линейным (векторным) пространством над полем F, если: (1) V — абелева группа относительно операции сложения; (2) a(v + w) = αν + aw для любых и, w £ V и a £ F; (3) (a + β)ν = αν + βν для любых ν е V и α, β £ F; (4) (αβ)ν = α(βν) для любых ν £ V и α, β £ F; (5) lv = ν для любого ν £ V и единицы 1 поля F. Элементы линейного пространства называются векторами, нейтральный элемент группы называется нулевым вектором. Рассмотрим некоторые примеры линейных пространств. Пример 5 Л* На множестве наборов из F™ введем две операции: операцию покомпонентного сложения «+», отображающую
5.1. Линейные пространства и их свойства 135 наборы и и ν в их сумму и + ν, и операцию покомпонентного умножения «♦» набора на константу из F. Для г-х разрядов суммы и + ν и произведения α · га (г = 1,2,..., га) положим (ω + v)i = щ + vu (α · и)» = au*. Легко видеть, что множество W1 с операциями «+» и «♦» будет линейным пространством, в котором нулевым элементом будет нулевой набор 0 = (0, ...,0). Скалярным произведением (х,у) векторов х,у из F71 называется величина (ж, у) = xiyi + ... + хцл + ...+ хпУп* Векторы называются ортогональными, если их скалярное произведение равно нулю. Отметим, что линейную функцию с нулевым свободным членом ol\X\ + ... + αη#η можно рассматривать как скалярное произведение вектора ее коэффициентов α = (αϊ,..., On) и вектора переменных χ = (#ι,..., χη). Ο Пример 5*2. Поле Ζ^[χ]/(χ3 + 2χ + 1) из примера 4.18 образует линейное пространство над своим подмножеством — полем Ζ$ с операцией сложения «+», и операцией умножения «♦» на элементы из Ζ3* □ Пусть a?i,..., Xk € V, αϊ,..., α* £ F. Вектор aia?i + h -\-а^Хк называется линейной комбинацией векторов Х{ с коэффициентами а*. Множество всех линейных комбинаций векторов Χι, ·.., Xk называется линейной оболочкой этих векторов и обозначается (a?i,..., а?*.}. Легко видеть, что линейная оболочка любых векторов a?i,..., а?& будет линейным пространством. Если линейное пространство V совпадает с линейной оболочкой конечного числа векторов, то пространство называется конечномерным, в противном случае пространство называется бесконечномерным. Пример 5.3. На множестве F00, состоящем из бесконечных наборов вида (αι,α2,... ,Οί,...)? где α» G F, введем операции покомпонентного сложения и покомпонентного умножения набора на константу из F, так же как
136 Глава 5. Линейные пространства и в примере 5.1. Нетрудно видеть, что множество F°° с такими операциями будет бесконечномерным линейным пространством. D Векторы Ж1,...,ж& называются линейно зависимыми, если в поле IF найдутся такие одновременно не равные нулю элементы αχ, *.., α&, что линейная комбинация векторов Хг с коэффициентами oti равна нулевому набору: a\U\ + ... + одгед. = 0. Если при любых одновременно не равных нулю элементах сц линейная комбинация векторов ж$ с коэффициентами oti не равна нулевому набору, то векторы Жх,..., х^ называются линейно независимыми. Легко видеть, что для линейной оболочки векторов справедливы следующие простые свойства: \Χ\ι . . . , Х%у . . . j Xjy . . . j Xk) = \Xly · · · ? xj) · · · j xi-> · · · ? ^Jfc/ ДЛЯ любых г, j; (#1,..., ж*,) = (жх,..., OiXk) для любого ненулевого а; (а?!,..., ж*) = <a?i,..., a?jfe_i, ж^-ι + ж*). Из этих свойств следует, что для любого ненулевого сц и произвольных Oil, . . · , Uff-l, Off+l, . . . , Oik \X\y . . . , Ж^, . . . , Xк) = = <a?i,.. ·, «ia?i + · · · + aiXi + · · · + а^жд,,..., a?*). Лемма 5Л« Пусть χχ,..., хп и уъ ..., ут — линейно независимые системы векторов, и каждый yi Ε (жх,..., ж„). Тогда т ίξ п. Доказательство. Допустим, утверждение леммы неверно и т > п. Без ограничения общности будем полагать, что j/j зависит от Ж1, т. е. в равенстве у γ = Σ£=ι ctijXi коэффициент αϊ,ι отличен от нуля. В системе векторов Жх,..., хп вектор ж χ заменим вектором у |. Из (5.1) следует, что {уъ ж2,..., хп) = <Ж1,...,жп). Среди векторов ж2, ·.., хп и у2у..., ут найдем пару Ж;, у^ в которой yj зависит от ж*. Пусть такую пару образуют векторы Ж2 и у2* В системе векторов уь Ж2,..., жп вектор ж2 заменим вектором у2. И снова из (5.1) следует, что {уъ у2) жз,..., хп) =
5.1. Линейные пространства и их свойства 137 = (a?i,..., хп). Будем проводить такие замены, пока это возможно. Предположим, что это сделано s раз и в результате получена система векторов у1у... , ι/θ, xs+i> · · · > xm линейная оболочка которой совпадает с (χι,... ,жп). Следующую замену нельзя сделать по одной причине — среди векторов χ3+ι, - · · ιχη и Уз+и * ♦ ♦ >Ут нельзя найти пару векторов х^ у^? в которой вектор fjj зависит от х^ Следовательно, все векторы у3+1> · · · > Vm зависят только от векторов уъ ..., t/s, т. е. справедливо включение где s ^ η < m. Очевидно, что это включение противоречит линейной независимости векторов i/i,...,J/m. Таким образом, га < гг. Лемма доказана. Пусть V — произвольное линейное пространство. Система векторов a?i,..., а?*, называется базисом в V, если эти векторы линейно независимы и их линейная оболочка совпадает с V. Например, в рассмотренном в примере 5.1 пространстве ¥п базисом будет следующая система векторов Еп: ei = (l,0,0,...,0,0), е2 = (0,1,0,...,0,0), е3 = (0,0,1,...,0,0), е„ = (0,0,0,...,0,1), в которой каждый из векторов содержит ровно одну единичную компоненту. Базис Еп называется стандартным базисом в Fn. Так как конечномерное линейное пространство V совпадает с линейной оболочкой конечного числа векторов, то отсюда и из леммы 5.1 легко получаем следующее утверждение. Теорема 5Л. В каждом конечномерном линейном пространстве V найдется базис. Все базисы V состоят из одинакового числа векторов. Будем говорить, что векторы V\y... yVk порождают линейное пространство V, если V = (νι,...,ν*.). Очевидно, что любое линейное пространство порождается своим базисом, но не
138 Глава 5. Линейные пространства всякая система векторов, порождающая линейное пространство, является базисом этого пространства. Например, система векторов €ι,..., еп, е\-\-е2 порождает пространство Fn, но не является его базисом. Число векторов в базисе пространства V называется размерностью пространства V и обозначается через dim V. Пространство размерности к часто называют ^-мерным пространством. Из леммы 5.1 и теоремы 5.1 легко извлекаются следующие простые и полезные утверждения. Лемма 5,2, При т > к в к-мерном линейном пространстве любые т векторов линейно зависимы. Лемма 5,3, В k-мерном линейном пространстве любые к линейно независимых векторов являются базисом этого пространства. Пример 5,4, Найдем число различных базисов в Z£. Прежде всего заметим, что каждый базис в Z£ состоит ровно из η векторов. Это легко следует из леммы 5.1 и существования базиса В Ζρ выберем η линейно независимых векторов. Сделаем это, последовательно выбирая векторы из Ζ™ так, чтобы выбранный на очередном шаге вектор не принадлежал линейной оболочке ранее выбранных векторов. Первый вектор V\ можно выбрать рп — 1 способами: подойдет любой ненулевой вектор. Второй вектор V2 можно выбрать рп — ρ способами: подойдет любой вектор, отличный от a.V\, где а € Zp. На k-м шаге можно выбрать любой вектор, не принадлежащий линейной оболочке векторов vi,..., Vfc_i. Так как линейная оболочка (vi,..., ν^_ι) состоит из рк~1 векторов, то вектор ν& можно выбрать рп — рк~1 способами. Таким образом, все η векторов можно выбрать (рп - 1){рп - р) ·... · (рп - рк) · ... · {рп - рп~1) (5.2) способами. Следовательно, число различных базисов в Ζ™ равно произведению (5.2). D
5.1. Линейные пространства и их свойства 139 Очевидно, что каждый вектор ν, лежащий в ^-мерном пространстве V, представляется в виде линейной комбинации ν = ol\V\ + -> + akvk (5.3) базисных векторов vj,..., vk этого пространства. Величины сц называются координатами вектора ν в базисе νι,...,ι?&. Нетрудно видеть, что представление (5.3) единственно. Действительно, допустим, что найдутся две различные линейные комбинации базисных векторов, каждая из которых равна вектору v. Тогда «1*1 + · · · + akvk = βλνλ + · · · + 0kvk. Вычисляя разность этих линейных комбинаций, получаем, что (αϊ - /?i)t?i + · · · + (ak - pk)vk = О, причем среди коэффициентов сц — β{ обязательно найдется хотя бы один, не равный нулю. Следовательно, векторы и ι,..., vk линейно зависимы, т. е. эти векторы не образуют базис в V. Противоречие. Лемма 5.4* При т < к в к-мерном линейном пространстве любые т линейно независимых векторов можно дополнить до базиса пространства. Доказательство. В ^-мерном линейном пространстве V рассмотрим линейно независимые векторы V\,..., vm. Так как т < fc, то в V найдется вектор ν, не являющийся линейной комбинацией векторов Vi,... ,ит. Положим vm+i = v. Если т + 1 = п, то в силу леммы 5*3 система v\,..., vm+\ будет базисом в V. Если т + 1 < &, то в V найдется новый вектор и, не являющийся линейной комбинацией векторов V\,..., t;m_j_i, который вместе с этими векторами образует линейно независимую систему. Повторяя эту процедуру в общей сложности k — т раз, получим базис пространства V, в котором содержатся векторы t?i,..., vm. Лемма доказана. Линейные пространства V и W над полем F называются изоморфными^ если существует такое взаимно однозначное отображение φ : V —> W, что:
140 Глава 5. Линейные пространства (г) ψ(χ + у) = φ(χ) + (р(у) для всех ж, у е V; (гг) φ(αχ) = αφ(χ) для всех а е F и а? е V» Отображение у? : V —> W называется изоморфизмом, а факт изоморфизма пространств V и W обозначается через V = W. Пример 5.5, Пусть V = {/ € ¥[х] : deg/ < η} — множество, состоящее из всех многочленов степени η — 1 и менее с коэффициентами из поля F. Оно очевидно замкнуто относительно операций сложения многочленов и их умножения на константы из поля F1). Также из свойств кольца ¥[х] следуют свойства (1)—(5) определения на с. 134. Таким образом, V образует линейное пространство над F, причем dim V = п. Оно изоморфно пространству ¥п из примера 5.1. D Пример 5.6, Множество ¥[х] всех многочленов над полем F относительно операций предыдущего примера изоморфно пространству W всевозможных бесконечных последовательностей элементов из F, имеющих конечное число ненулевых членов. Изоморфизм φ : ¥[х] —► W ставит в соответствие многочлену ао + ... + апхп набор его коэффициентов (ао,..., с*п, 0,0,...), дополненный нулями. D Из определения изоморфизма легко следует, что изоморфизм φ : V —*> W отображает нулевой вектор пространства V в нулевой вектор пространства W и что композиция изоморфизмов ^:V-^Wh^:W->U является изоморфизмом пространства V в пространство U. Теорема 5.2. Два линейных конечномерных пространства V и W над полем ¥ изоморфны тогда и только тогда, когда их размерности совпадают. Доказательство. Покажем, что произвольное fc-мерное линейное пространство V над полем ¥ изоморфно линейному пространству ¥к наборов длины к из примера 5.1. Пусть v\,..., ν^ — базис пространства V и βχ,..., е& — стандартный базис пространства ¥к. Так как каждый вектор ж из V единственным ^Степень суммы многочленов не превосходит наибольшей степени слагаемых, степень многочлена а/ не превосходит степени / при любом а € F.
5.1. Линейные пространства и их свойства 141 образом представляется в виде суммы χ = x\V\ + · · · + xkvk и любая сумма такого вида принадлежит V, то отображение φ : V —*> ¥к, определяемое равенством φ(χιν1 + --- + XkVk) = (ai,...,a*), является взаимно однозначным. Для такого отображения и любых Векторов X = XyV\ + - · · + ZfcV/c И J/ = 3/1^1 + · ♦ · + J/fcVfc ИЗ пространства V φ(χ + у) = ¥>((зц>1 + · · · + α?*ν*) + {yivi + · · · + j/fct;*)) = = р((ж1 + j/i)«i + · · · + (хк + Ук)^к) = = (я1+1/ъ...,я*+!/*) = = (жь * - - , Хк) + (з/ъ - - ·, ifc) = ¥>(ж) + <Р(У)· Также легко видеть, что для любого а из F и любого ж из V φ(αχ) = φ(αχιν1 Η h axkvk) = = (ажь ..., axk) = а(жь · · · ? afe) = а<р(ж). Таким образом, V = F*. Рассмотрим изоморфизм ψ пространства V в пространство ¥к и изоморфизм ψ пространства F^ в пространство U. Так как композиция изоморфизмов является изоморфизмом, то композиция ψοφ будет изоморфизмом V в U. Следовательно, любые два линейных ^-мерных пространства V и U над полем F изоморфны. Теперь покажем, что если к ^ т, то никакое fc-мерное пространство V над полем F неизоморфно никакому т-мерному пространству U над тем же полем. В силу доказанного выше для этого достаточно показать, что ¥к неизоморфно Fm. Пусть т > к. Допустим, что существует изоморфизм φ : Fw —> ¥к и ^(βχ),..., φ(Βγη) — образ стандартного базиса Fw. Тогда в силу леммы 5.2 найдется ненулевой набор коэффициентов αϊ,..., am, для которого ai^(ei) + · · · + аш(р{еш) = 0.
142 Глава 5. Линейные пространства В этом случае приходим к противоречию со свойствами изоморфизма, так как φ{αχΒι -\ ь ашет) = αι<ρ(βι) Η h аш(р{ет) = О, т.е. φ отображает ненулевой вектор а\е\ + · · · + ашеш из Fm в нулевой вектор пространства Ffc? что, очевидно, невозможно. Следовательно, пространства ¥к и Fm неизоморфны. Теорема доказана. Пусть V — линейное пространство над полем IF, V7 С V. Множество V7 называется линейным подпространством пространства V, если: (1) сумма ж + j/gV для всех ж, у € V7; (2) ах € V7 для всех а € F и для всех ж € V. Пример 5.7* Пространство W, рассмотренное выше в примере 5.6, является бесконечномерным подпространством пространства F°° из примера 5.3. D Пример 5,8. Найдем число различных fc-мерных подпространств в Zp. Каждое такое подпространство определяется базисом, состоящим из к линейно независимых векторов. Повторяя рассуждения из примера 5.4, видим, что число таких базисов равно (р«_1)(рП_р).....(рП_р*-1). При этом в каждом подпространстве существует (р*-1)(р*-р).....(р*-р^) различных базисов. Следовательно, число различных ^-мерных подпространств в Z™ равно (j)k - 1)(рк —#)·...·(#* -рк~1) * Пусть U — подпространство пространства V над полем F. Так как U и V абелевы группы, то U, очевидно, будет подгруппой в V, и существует фактор-группа V/U группы V по подгруппе U. Непосредственной проверкой свойств (2)—(5) определения
5.2. Линейные операторы 143 линейного пространства нетрудно убедиться в том, что факторгруппа V/U будет линейным пространством над F. Такое пространство называется фактор-пространством пространства V по подпространству U. 5«2. Линейные операторы Пусть V и U — линейные пространства над полем F. Отображение А : V —>> U называется линейным оператором, если A{v + w) =A(v)+A(w), (5.4) A(av) = aA(v) для любых v,k?gVh любого α £ F. Пусть Vi,..., vn — базис в V, ι/χ, ...,иш — базис в U. Тогда для любого вектора χ = X\V\ + ... + xnvn из первого пространства в силу свойств (5*4) выполнено равенство А(х) = Α(χινι + ... + xnvn) = %\A{v\) + · · - + xnA(vn). (5.5) Следовательно, значение линейного оператора однозначно определяется его значениями на векторах базиса. С другой стороны, рассмотрим образы базисных векторов v^ выразив их через элементы базиса в U: A(vi) = vuui + v2iU2 + · · · + vmium, i = 1,2,..., η, (5.6) Подставив равенства (5.6) в (5.5), видим, что А(х) = χιΑ(νι) + ... + XnA(vn) = = Xl(VllUi + · · · + VrniUm) + . . . • · · + Xn{V\nU\ + · · · + VmnUm) = (5.7) = Oll^l + · ' · + VinXn)Ui + . . . Если Л(а?) = у = yitei Η + ymum) то из (5.7) следует, что Уг = VilXi + Vi2X2 Η h Шт^, ί = 1, 2, . . . , Ш. (5.8)
144 Глава 5. Линейные пространства Очевидно и обратное: если отображение А{х) = у задано формулами (5.8), то оно является линейным оператором. Функции УЪ'-чУт называются его компонентами. Таким образом, выбрав базисы в пространствах V и ϋ, линейный оператор из V в U можно рассматривать как отображение из F™ в Fm, все компоненты которого являются линейными функциями с нулевыми свободными членами. Каждый такой оператор будем называть линейным (п, т)-оператором. Суммой линейных операторов Л:У—►UhjSiV—>U называется такой оператор (А + В) : V —> U, что (А + В)(х)=А(х)+В(х) для каждого χ € V. Очевидно, что сумма линейных операторов также будет линейным оператором. Второе равенство в (5.4) определяет произведение линейного оператора и элемента поля, над которым определено линейное пространство. Нетрудно показать, что множество линейных операторов А из V в U с указанными операциями сложения и умножения на элементы поля является линейным пространством, размерность которого равна произведению размерностей пространств V и U. Композицией В о А линейного оператора А : V —> U и линейного оператора В : V —> W называется такой оператор С : V -> W, что С(х) = В(А(х)) (5.9) для каждого χ из V. Покажем, что композиция линейных операторов является линейным оператором. Рассмотрим композициюС(х) = В(А(х)), зафиксировав базисы в пространствах V, U, W. Пусть в этом случае компоненты операторов Аи В определяются следующими равенствами: йг = auxi + ... + dijXj + ... + ainxny г = 1,2,..., πι; (5.10) bi = buyi + ... + bijyj + ... + ЬгтУт, г = 1,2,..., fc, (5.11) где п = dimV, πι = dimU, k = dimW. Выразим компоненты а оператора С через коэффициенты операторов БиЛ Для
5.2. Линейные операторы 145 этого компоненты оператора А из (5Л0) подставим в (5.11) вместо переменных j/χ,..., ут. В результате при г = 1, 2,..., к для г-компоненты С получим a = bii(anxi + ... + auxt + ... + аыХп) + ... &mtXt ~г . . . ~r Q>mn%n) — = (δχίαιι + .. · + δχίΟίΐ + .. · + 6»mflmi)^i + ... Следовательно, каждая компонента с* оператора С является линейной функцией, для j-ro коэффициента которой справедливо равенство Cij = ftiiaij + ... + 6itatj + ... + bimdmj. (5.12) Таким образом, композиция линейных операторов является линейным оператором. Оператор £ : V —> V называется тождественным, если £(ж) = х для каждого χ из V. Легко видеть, что тождественный оператор является линейным. Оператор А : V —*> V называется обратимым или невырожденным, если существует обратный оператор Д-1 такой, что Д"1^)) = ДОД-Ча?)) = £ (ж). В силу теоремы 1.2 оператор невырожден тогда и только тогда, когда он биективен. Нетрудно показать, что оператор, обратный к линейному невырожденному оператору, также будет линейным. Поэтому (см. теорему 1.3) множество всех невырожденных операторов А : V —► V образует группу относительно операции композиции. Тождественный оператор € является ее единичным элементом. Эта группа называется общей линейной группой пространства V и обозначается GL(V) или GL(ra,F), если V = F"". Также отметим, что множество всех операторов Д : V —*> V образует кольцо операторов с операциями суммы и композиции, мультипликативной группой которого является группа GL(V). Ядром линейного оператора Д : V —> U называется множество всех таких χ £ V, для которых А(х) = 0. Ядро оператора
146 Глава 5. Линейные пространства А обозначается через КегА Образом оператора А называется множество всех таких yeU, что у = А{х). Образ оператора А обозначается через ImA Нетрудно показать, что ядро и образ любого линейного оператора являются линейными подпространствами в V и U соответственно. Размерность образа линейного оператора А называется его рангом и обозначается через rank А, Теорема 5,3, Пусть dimV = п. Для любого определенного на V линейного оператора А η = dim Ker A + dimlm Α. Доказательство. Пусть векторы ν\,..., vk образуют базис в Кег А Произвольным образом дополним этот базис до базиса всего пространства V. Новые базисные векторы обозначим через г>&_|_1,..., νη. Теперь для доказательства теоремы достаточно показать, что образ оператора А порождается векторами A(vk+1),...,A{vn), т.е. Im А = (A(vk+1),..., Α{νη))> Прежде всего убедимся, что векторы A(vk+i),·.., Α(νη) линейно независимы. Действительно, если это не так, то найдутся такие одновременно не равные нулю постоянные α^+ι,... ,αη, что ak+1A(vk+i) + ... + anA(vn) = 0. Откуда, используя линейность оператора Д, легко получаем, что 0 = ah+iA{vk+1) + ... + anA(vn) = = A(Q>k+lVk+l + . . . + OLnVn), т. е. вектор (ак+\vk+i +... +ocnvn) принадлежит ядру оператора А· Противоречие с выбором векторов vk+i, ..., νη. Следовательно, векторы A(vk+\),..., Α{νη) линейно независимы. Теперь покажем, что каждый вектор из образа А выражается в виде линейной комбинации векторов A(vk+i), ♦.., Α(νη). Для этого произвольный вектор α из V разложим по базису t>i,..., νη и применим к этому вектору оператор А: А{а) = A{pc\vi + ... + anvn) =
5.3. Матрицы 147 = Λ{αχνλ + ... + akvk) + Л(ак+1 vk+1 + ... + anvn) = = ak+iA{vk+1) + ... + anA(vn). Таким образом, любой элемент из 1тА выражается в виде линейной комбинации векторов A(vk+i), -. · ,A(vn). Так как эти векторы линейно независимы, то они образуют базис в Im А. Следовательно, dimlm A = п— к. Теорема доказана. Пусть dimV = η и А : V —► V. Если dimKer.4 = 0, то линейный оператор А биективен. Действительно, из теоремы 5.3 следует сюръективность А. Если найдутся такие неравные а и 6, что Д(а) = А(Ь), то А(а — Ь) = 0, что очевидно противоречит равенству dimKer.4 = 0, т.е. А инъективен. Таким образом, оператор А невырожден тогда и только тогда, когда его ранг равен п. 5.3. Матрицы Далее полагаем, что во всех рассматриваемых пространствах зафиксированы базисы. Пусть V — n-мерное линейное пространство над полем F, U — m-мерное линейное пространство над тем же полем. Удобным средством описания линейных операторов из V в U являются матрицы. Матрицей линейного (га, т)- оператора А = (αϊ,..., ат) с компонентами αι = απΕι + αι2#2 + + αιηχη, 0,2 = 0,21X1 +а22%2 + + αιη£η, am — 0>ml%l τ 0>m2%2 τ τ Q>mn%n называется прямоугольная таблица из т строк и га столбцов /ац ··· dij ··· din\ А = CL%\ . . . GL%j . . . Q,ir, (5.13)
148 Глава 5. Линейные пространства составленная из коэффициентов а^ оператора А* Величины а^- называются элементами матрицы (5.13). Матрицу из т строк и η столбцов с элементами из поля ¥ будем называть (т>п)- матрицей А = {dij) над полем F или матрицей размера т х η над полем F. Если т = п, то (п, п)-матрицу будем называть квадратной матрицей порядка п, или просто матрицей порядка п. В частности, легко видеть, что матрицей тождественного оператора будет квадратная матрица Έη = (е^), элементы которой определяются равенством = ί1' приг= j, [О, пригтМ- Матрица Еп называется единичной матрицей порядка п. Матрица Ат = (a\j) размера т χ η называется транспонированной матрицей к матрице А = (а^) размера η χ т, если a\j = aji. Легко видеть, что для любой матрицы А справедливо равенство (Ат) т = А. Квадратная матрица А называется симметрической, если Ат = А, и кососимметрической, если Ат = -А. (О 1 2\ Кто Ат = Определим операцию умножения матрицы на элемент поля и операции сложения и умножения матриц. Сделаем это так, чтобы матрица произведения аА элемента а и оператора А была равна произведению а и матрицы А оператора Д, матрица суммы А + В линейных операторов А и В была равна сумме матриц этих операторов, а матрица композиции Во А линейных операторов В и А — произведению матриц этих операторов. Произведением элемента а и матрицы А называется такая матрица С = (с^), что щ = αα^. Очевидно, что матрица С является матрицей оператора а А. Суммой А + В двух (ш, п)-матриц А = (а^) и В = (bij) называется такая (т,п)-матрица С = (с^), что c%j = ац + Ь^. Нетрудно видеть, что матрица суммы двух линейных операторов равна сумме матриц этих операторов.
5.3. Матрицы 149 Произведением ΒΑ (fc, гд)-матрицы В = (bij) и (га, ^-матрицы А = (aij) называется такая (ку п)-матрица С = (с^), что1) Cij = bnuij + . . . + frit^t; + . . . + bimdjnj. Если матрицы В и А являются матрицами операторов В и *4, заданных равенствами (5.10) и (5.11), то из определения произведения матриц и равенства (5.12) легко следует, что матрица В А действительно будет матрицей композиции В о А Множество (т,п)-матриц над полем F с указанными операциями сложения и умножения на элементы поля образует линейное пространство размерности тп над F. Нетрудно показать, что это пространство матриц изоморфно линейному пространству соответствующих матрицам операторов. Если рассматривать набор χ из lFn в качестве матрицы, состоящей из единственного столбца высоты гс, то из определения матриц легко следует, что значение линейного (га, т)-оператора Л на наборе χ можно найти, вычислив произведение Ах матрицы этого оператора и набора х. Далее, говоря о произведении Аа?, набор χ будем иногда называть вектором-столбцом для того, чтобы подчеркнуть его «вертикальное» положение в этом произведении. Пример 5ЛСК В линейном пространстве над полем Ζ5 рассмотрим оператор Л = (αι,α2) с компонентами а\ = Х\ + х^ и CL2 = Χι + 2^2 + 3#з- Найдем его значение при Х\ = х<± — х$ = 1. Сделаем это, умножив матрицу оператора Л на вектор-столбец (111): ^-Gi!)(i)-(U- Следовательно, образом вектора (111) является вектор (21), т.е. а\(х1,Х2,Хз) = 2, а2(#1,а?2>#з) = 1* Аналогичный результат получается после вычисления .4(1,1,1) по формулам его компонент. D ^Заметим, что элемент Cij равен скалярному произведению г-й строки матрицы В и у-го столбца матрицы А.
150 Глава 5. Линейные пространства Как и при вычислении композиции линейных операторов, произведение ВА матриц В и А определено не всегда, а только в том случае, когда число столбцов матрицы В равно числу строк матрицы А. Поэтому легко видеть, что произведения АВ и ВА матриц В и А определены одновременно только для квадратных матриц одного порядка. Отметим, что операция умножения квадратных матриц не коммутативна, т. е. найдутся такие матрицы А и В одного порядка, что АВ φ ΒΑ. Пример 5,11, Рассмотрим две треугольные матрицы второго порядка А=(|5)иВ = (£})с элементами из Ζ2. Для произведений АВ и ВА этих матриц справедливы равенства "-G!)C.:)-Ci)· —GOGH?!)· Следовательно, АВ φ ΒΑ. □ Непосредственно из определений операции умножения и сложения матриц следует, что каждая из этих операций ассоциативна, и кроме того, эти операции связаны законами дистрибутивности: для любой матрицы А размера га χ η, любых матриц В и С размера η х к и любой матрицы D размера к xl справедливы равенства А(В + С) = АВ + АС, (В + C)D = BD + CD. Отсюда следует, что множество квадратных матриц одного порядка образует некоммутативное кольцо с единицей, которое, очевидно, изоморфно кольцу соответствующих матрицам операторов. Матрицы можно разбивать на блоки — матрицы меньших размеров и при условии подходящего выбора размеров блоков выполнять поблочное сложение и умножение матриц. Например, рассмотрим разбитые на четыре блока (га, тг)-матрицу А и (п, &)-матрицу В: А_(А„ ЛВ\ В_/В„ Вв\ VA21 А22/ \В21 Ь22/
5.3. Матрицы 151 Если размеры блоков А^ и В^ таковы, что произведения А^В^· определены для всех 1 ^ г, i, j < 2, то для произведения С = АВ справедливо равенство £ _ /АцВп + Αι2Β2ι АцВ12 + А12В22\ \A2iBn + А22В21 A2iBi2 + А22В22/ ' С каждой матрицей свяжем три линейных пространства: пространство строк, пространство столбцов и ортогональное пространство. Пространством строк матрицы А называется линейное пространство А, порожденное строками этой матрицы. Пространство строк матрицы А будем обозначать также через (А). Если А — пространство строк матрицы А, то матрица А называется порождающей матрицей пространства А. Пространством столбцов матрицы А называется линейное пространство, порожденное столбцами этой матрицы. Легко видеть, что для любой матрицы А пространство ее столбцов совпадает с пространством строк транспонированной матрицы. Поэтому пространство столбцов матрицы А будем обозначать через (Ат) и Ат. Ортогональным пространством матрицы А называется линейное пространство А1, состоящее из всех тех векторов г;, для которых Αν = 0. Матрицу, столбцы которой образуют базис ортогонального пространства матрицы А, назовем матрицей, ортогональной к А, и обозначим через А-1. Заметим, что ортогональная матрица в общем случае определена не однозначно. Нетрудно видеть, что ядро и образ любого линейного оператора А совпадают с ортогональным пространством и пространством столбцов матрицы А этого оператора, т. е. А-1 = КегД, Ат = Im A (5.14) Поэтому из теоремы 5.3 вытекает следующее утверждение. Теорема 5,4. Для любой матрицы А, состоящей из η столб- цов, справедливо равенство dim A1 +dimAT = п.
152 Глава 5. Линейные пространства Введем три элементарных преобразования строк произвольной матрицы: (1) умножение г-й строки матрицы на ненулевую константу; (2) перестановку г-й и j-R строк матрицы; (3) прибавление г-й строки матрицы к ее j-и строке. Если матрица В получена из матрицы А при помощи элементарных преобразований строк, то будем говорить, что эти матрицы эквивалентны. Эквивалентность матриц А и В будем обозначать через А ~ В. Теорема 5*5* Для любых эквивалентных матриц А и В их ортогональные пространства совпадают, т. е. А1- = В-1. Доказательство. Очевидно, что при умножении компоненты линейного преобразования на ненулевую константу и при перестановке компонент линейного оператора его ядро не изменяется. Поэтому в силу первого равенства в (5.14) элементарные преобразования 1-го и 2-го типов над строками матрицы не изменяют ее. Следовательно, для доказательства теоремы достаточно показать, что третье элементарное преобразование строк также не изменяет ортогонального пространства. Рассмотрим линейное пространство V, порожденное векторами tii,.. *7*>ь и линейное пространство V, порожденное векторами Vj, · · ♦, vfk. Будем полагать, что вторая система получена из первой прибавлением ее г-го вектора к j-му, т. е. vft = vt при t φ j Hvfj = Vi+Vj. Легко видеть, что в этом случае Vj = v*j — v\. Докажем равенство V^ = (V') . Для этого рассмотрим произвольный вектор и из пространства V-1. Очевидно, что (tx, vt) = 0 для каждого вектора Vt первой системы. Поэтому О = (и, Vj) + (U, Vi) = (U, Vj + Vi) = (и, Vlj). Следовательно, и е (ι/) , и, таким образом, пространство Υ1- содержится в пространстве (V) . С другой стороны, если и Ε (V') , то (и, vft) = 0 для каждого вектора v*t второй системы. Поэтому О = (и, vfj) - (и, v[) = (и, vfj - г/;) = (и, Vj). Следовательно, и е V-1-, и пространство (V') содержится в пространстве V1. Таким образом, Y1- = (V7) . Теорема доказана.
5.3. Матрицы 153 Теорема 5*6. Для любой (га, п)-матрицы А справедливо равенство dimA = dimAT. (5.15) Число (5.15) называется рангом матрицы А и обозначается через rank А. Доказательство. Пусть dim A = к. Вез ограничения общности будем полагать, что первые к строк матрицы А линейно независимы, а остальные т — к строк матрицы являются их линейными комбинациями. При помощи элементарных преобразований строк преобразуем матрицу А в эквивалентную ей матрицу В, в которой только первые к строк не будут нулевыми. Для этого из каждой из последних га — к строк матрицы А надо вычесть равную ей линейную комбинацию первых к строк. В силу предыдущей теоремы А1- = В-1. Так как все ненулевые компоненты столбцов матрицы В сосредоточены в ее первых к строках, то легко видеть, что размерность пространства столбцов матрицы В не превосходит к. Таким образом, из предыдущих рассуждений и теоремы 5,4 имеем dim Ат =п — dim A-1 —n — dim В1 = dim Ет ^ к = dim А. Следовательно, dimAT ^ dim А. Применяя приведенные рассуждения к матрице Ат , получаем неравенство dimAT ^ dim А. Теорема доказана. Теорему 5.6 можно переформулировать так: у любой матрицы ранг системы ее строк совпадает с рангом системы ее столбцов и равен рангу задаваемого ею оператора. Теперь рассмотрим вопрос о том, как, зная матрицу оператора в одном базисе, найти матрицу этого оператора в другом базисе. Пусть νγ,ν%..*,νη и г/1? vf2,.. *, vfn — два базиса п-мер- ного пространства V, и векторы второго базиса выражаются через векторы первого следующими формулами v\ = anvi + αΐ2 ν2 + ... + аы vny Л v'2 = θ2ΐνι + a22 ν2 + ... + a2n vny I > (5.16) v'n = dnivi + an2 v2 + · · · + ann vn. J
154 Глава 5. Линейные пространства В этом случае будем говорить, что переход от первого базиса ко второму задается матрицей А = /an ^21 й\2 CL22 .. ап1\ - а>п2 (5.17) \а\п (12п · - · 0>пп/ столбцы которой являются наборами координат векторов второго базиса в первом и которая называется матрицей перехода от базиса ι?ι, V2,..., νη к базису i/1? vf2,..., v^· Рассмотрим в пространстве V прюизвольный вектор χ и его координаты (щ,..., un) и (Ц,..., itJJ в этих базисах. Тогда X = ttiVi + U2V2 ~\ l· UnVn, х =u[v[ +u'2v'2 + .··+«. Найдем формулы, выражающие набор координат ге = (iti,..., un) вектора х в первом базисе через его координаты uf = (и[у..., w£J во втором базисе. Для этого в правой части последнего равенства вместо векторов г/ подставим соответствующие формулы из (5Л6) и соберем вместе слагаемые с одинаковыми множителями V{. В результате имеем χ = u[v[ + uf2vf2 Η l· ufnvfn = = u\{anvi + ai2v2 +... + αιηυη)+ + u'2(a2ivi + α22 ν2 + ... + a2n vn)+ + ufn{anivi + an2V2 + -' + ann vn) = = {u[an + u2a2i + ... + ufnani)v\+ + {u\a\2 + u2a22 + ... + u'nan2)v2+ + (u[aln + и2а2п + · · · + ufnann)vn. Сравнивая последнюю сумму с координатами вектора χ в базисе
5.3. Матрицы 155 Vl,V2,'..,Vn, ВИДИМ, ЧТО U\ = аци[ + 0,214*2 + < < . + OnlKi U2 = ai2tti + tt22^2 + · · . + fln2^i. ^n = ainu'i + avnvb + ... + <wC Равенства (5.18) можно записать в матричной форме — умножая матрицу перехода А на вектор-столбец и1: Αν! = и. Пусть В — матрица линейного оператора В : V —*> V в базисе t>i, «2? · · · > νη· Найдем матрицу В' этого оператора в базисе г/1?^2,. * * ,ΐ>ή· Для ЭТ0Г0 потребуется понятие обратной матрицы. Квадратная матрица А-1 называется обратной матрицей квадратной матрицы А, если А"2А = АА"1 = Е. Не каждая квадратная матрица имеет обратную матрицу. Подробно обратные матрицы будут рассмотрены ниже в разделе 6.2. Здесь же достаточно того очевидного факта (легко следующего из изоморфизма кольца квадратных матриц и кольца соответствующих операторов), что матрица любого невырожденного оператора имеет обратную. Легко видеть, что линейный оператор с матрицей А из (5.17) невырожден, так как ранг этой матрицы равен п. Поэтому матрица А-1 существует. Если Αν! = и, В'гг' = wf и Bv = w, то Агс/ = w. Следовательно, ВАге' = w = Ак/. Умножив на матрицу А-1 правую и левую стороны последнего равенства, видим, что A^BAu' = A~lAw' = w'. Таким образом, произведение А-1 В А, где А — матрица перехода от базиса t>i, V2, ·. ·, νη к базису v\, vf2,..., xfn, будет матрицей В7 оператора В в базисе vflyv^ · ·., v!n. Заметим, что так как В' = А_1ВА, то, очевидно, что справедливо и равенство В = АВ'А-1. Поэтому нетрудно показать, что матрица А-1 будет матрицей перехода от базиса г/1? г/2,..., vfn к базису vb v2,..., vn.
156 Глава 5. Линейные пространства 5.4. Определители Будем рассматривать функции вида /(αχ,..., α^,..., αη) = = у, где di — вектор из n-мерного линейного пространства IF*1, a у — элемент поля F. Функция / называется полилинейной (линейной по каждому своему аргументу), если /(αϊ,... ,α; + α·,.. .,αη) = = /(αϊ,... , α;,...,αη) + /(аь ... ,α·,. . .,αη), /(αϊ,..., λα;,...,αη) = А/(аь... , α;,...,αη) для каждого г £ {1,..., η} и каждого A £ F. Функция / называется кососимметрической, если для всех 1 ^ г φ j ^ η /(αϊ,... ,Οί,... ,α,,.. . ,an) = -/(ab... ,a^,..., a*,... , an). Покажем, что каждая полилинейная функция /, обращающаяся в нуль, если среди ее аргументов есть два одинаковых, является кососимметрической. Для этого вычислим значение /, полагая, что при любом к Φ г, j ее fc-й аргумент равен вектору а*,, а г-й и j-й аргументы равны сумме щ + a>j. В этом случае О = /(<*ι,..., a; + aj,..., щ + aj,..., ап) = = /(»ь ♦ ♦., ai?..., ai?..., αη) + /(αϊ,..., а*,..., а,,..., αη)+ + /(аь ..., α,,..., ai?..., αη) +/(аь ..., α7·,..., α,,..., αη) = = /(a1,...,a,,...,ai,...,an) + /(a1,...,ai,...,a,,...,an). Следовательно, /(αϊ,... ,α*,... ,α^,.. . ,αη) = —/(αϊ,... ,α^,... ,α*,..., αη), и / — кососимметрическая функция. Верно и обратное — значение кососимметрической функции с двумя одинаковыми аргументами равно нулю. Действительно, если a^ = a,j = а, то /(αϊ,... ,а,... ,α, ...,αη) = /(аь ..., а*,... ,а^,... ,ап) = = —/(αϊ,..., aj,..., а»,..., αη) = = — /(αϊ,..., а,..., а,..., On).
5.4- Определители 157 Таким образом, f(a1,...,a,...,a,...,an) = -f(al,...,a,...,a,...,an) = 0. Часто оказываются полезными функции /(αϊ,..., αη), позволяющие разделять линейно зависимые и линейно независимые системы векторов. В линейных пространствах над полем действительных чисел такой естественной функцией векторов αϊ,. ч , ап является ориентированный объем V(a\y..., ап) параллелепипеда, построенного на этих векторах. Нетрудно показать, что F(ai,..., ап) — полилинейная функция, и эта функция равна нулю, если среди ее аргументов есть два одинаковых вектора1). Пример 5.12, В двумерном действительном пространстве R2 найдем площадь параллелограмма ABCD, построенного на векторах (1,0) и (1,2). Поместив вершину А в начало координат, получим координаты остальных вершин: В = А + (1, 0) = (1,0), С = А + (1,2) = (1,2), D = А + (1,0) + (1,2) = (2,2). Очевидно, что ABCD — параллелограмм с основанием \АВ\ = 1 и высотой \СВ\ = 2, и его площадь равна 2. Такой же результат нетрудно получить, пользуясь полилинейностью двумерного объема: K((l,0),(l,2)) = V((l,0),(l,0) + (0,2)) = = V((1,0),(1,0)) + K((1,0),(0,2)) = = 0 + 2К((1,0), (0,1)) = 0 + 2 = 2. □ Для n-мерного линейного пространства над произвольным полем F найдем функцию /, обладающую свойствами, аналогичными указанным выше свойствам объема. Эта функция должна быть полилинейной и кососимметрической. Покажем, что среди таких функций есть функции, равные нулю, если их аргументы линейно зависимы, и не равные нулю в противном случае. Будем полагать, что векторы αι,α2,...,αη заданы своими координатами в базисе Vi, г>2,..., νη. Сначала рассмотрим случай трех векторов αι,α2,α3, заданных координатами в базисе См., например, [15].
158 Глава 5. Линейные пространства vbv2>v3- Воспользовавшись полилинейностью искомой функции /, получим следующие равенства: ззз /(аь а2, а3) = /(Σ ацуи ^ a2jVjy ^ а3/^) = i=l j=l fc=l 3 3 3 = Σαι*^ν*>Σα2^'Σα3^) = i=l j = l fc=l 3 3 3 = Σαι* Σ a2j/(v*j rJ j Σ α3^ν^) = i=l j=l Jfe=l 3 3 3 = Σau Σα^' Σ α3*/(ν*> ч?> ν^) = i=l j=l Jfe=l 3 3 3 = ΣΣΣαΗα2^3^^^'^'Vfc)· Затем из последней суммы удалим все слагаемые с нулевыми множителями /. Так как такими будут все с двумя равными аргументами, то в результате получим равенство ззз Σ Σ Σ a^^2j^kf{Vi, Vj, Vk) = i=l j=l k=l = Σ aua2ja3kf(vi,vj,vk)) в правой части которого в каждом слагаемом индексы i,j и к попарно различны. Поэтому каждый из этих индексов пред- ставим как результат действия подстановки π = I . . , I из симметрической группы S$ на единицу, двойку или тройку, после чего снова воспользуемся кососимметричностью функции /, чтобы в каждом слагаемом упорядочить ее аргументы — векторы Ui,u2ji>3· При этом величина /(ΐλ^χ), νπ(2), ^тг(з)) совпадаете /(vi, г?2? г?з), если знак подстановки π совпадает со знаком тождественной подстановки, т.е. π является четной, и совпадает с
5.4- Определители 159 величиной —/(vi, i?2? ^з)? если подстановка π является нечетной. Таким образом, Σ o,iia2ja3kf(vh Vj,vk) = = 2J α1π(1)α2π(2)α3π(3)/(νπ(1)^7Γ(2)?νπ(3)) = = Χ) ^ιπ(1)α2π(2)Λ3π(3)8Κηπ·/(ι;ι,ν2?ι;3)· Объединяя получившиеся равенства и вынося /(1?1,^2,1?з) из- под знака суммирования видим, что /(аьа2,а3) = f{vuv2,vs) ^ sgriTr ♦ аМ1)а27г(2)а3?г(з). (5·19) π£53 Формула (5.19) легко обобщается на η векторов αχ, α2?..., αη, заданных координатами в базисе Vi, t>2,. · ·, t;n. Нетрудно показать, что имеет место равенство /(αι,α2,... ,αη) = =/(t;i,V2,--.,t;n) J^ 8№7Γ·αι1Γ(ΐ)α27Γ(2)···αΛπ(η)· ^5'20^ Из равенства (5.20) видно, что любая полилинейная кососиммет- рическая функция / однозначно определяется своим значением на базисных1^ векторах Vi, г>2,..., νη, т. е. для полного определения функции / достаточно задать ее значение на векторах νΐ,ν2,..·,νη. Далее рассмотрим наиболее интересный частный случай равенства (5.20), в котором векторы αχ,α2, ...,αη задаются координатами в стандартном базисе βχ, β2,..., βη, и при этом значение /(ei, €2,..., β™) полилинейной кососимметрической функции / на векторах этого базиса равно единице. Такую функцию "^Подчеркнем, что равенство (5.20) выполнено не только в случае, когда vi, V2,..., vn — базис, но и когда векторы vi, V2,.. ♦, vn линейно зависимы, причем a,ij являются уже не координатами, а просто коэффициентами линейных комбинаций.
160 Глава 5. Линейные пространства назовем определителем системы векторов и обозначим символом det. В этом случае равенство (5.20) записывается в виде det (аь α2,..., αη) = J^ sgn7r · α1π(ΐ)α2π(2) · · · αηπ{η). (5.21) 7r€Sn Пример 5,13, Для трех векторов (5.21) превращается в формулу det (αϊ, α2, аз) = ^11^22^33 - ^п^23^32 - ^12^21^33+ + ^12^23^31 + ^13^21^32 _ ^13^22^3Ь слагаемые в правой части которой упорядочены в соответствии с лексикографическим порядком на множестве вторых строк (ijk) (1 2 3\ . , ) из 5з* □ В следующей теореме покажем, что функция det разделяет линейно зависимые и линейно независимые системы векторов, т.е. является искомой функцией. Теорема 5.7, В линейном n-мерном пространстве для любых векторов а\у.. > уап det(ai,...,an) < = 0, если αϊ,.,., On линейно зависимы] Φ 0, если αϊ,.,., On линейно независимы. Доказательство. Допустим, что векторы αϊ, α2, *.,, αη линейно зависимы и ап = Σ£=ι \,а%- Тогда п-\ det (αϊ, α2,..., αη) = det (αϊ, α2?... ,αη_ι, 2_^ λ%<4) — η-ι = ^2 Xidet (αϊ, α2,,,., αη_ι, α») = 0, ί=1 так как в последней сумме каждый определитель содержит два одинаковых аргумента. Пусть теперь векторы αϊ, α2,..., αη линейно независимы. В этом случае векторы стандартного базиса ei, е2,..., еп можно
5.4- Определители 161 выразить через векторы αχ, α2,..., αη. Пусть е$ = Σ?=ιβ*?α;>· Из свойств функции det и равенства (5.20) видим, что 1 =det(ebe2,...,en) = = det(aba2,...,an) ^ Следовательно, det (αϊ, α2,· ♦., αη) ^ 0. Теорема доказана. Определителем det А квадратной матрицы А = (a^) называется определитель системы ее строк det А = Σ SSn7r · α1ττ(1)^2π(2) ' · · Α*π(η)· (5-22) Пример 5Л4* Как и в предыдущем примере, легко видеть, что (an ai2 ai3\ Λ21 ^22 0,23 J =^11^22^33 ~ ^11^23^32 ~ ^12^21^33 + 031 ^32 ^33/ + ^12^23^31 + ^13^21^32 ~ ^13^22^31- Π Из теоремы 5*7 легко следует, что если ранг квадратной матрицы совпадает с ее порядком, то ее определитель отличен от нуля, а если ранг меньше порядка, то определитель равен нулю. Из сказанного выше видно, что определитель квадратной матрицы — это полилинейная кососимметрическая функция строк матрицы, которая равна единице на единичной матрице. Пример 5.15. Следующее равенство справедливо в силу линейности определителя по первой строке: (an ai2 ai3\ / 1 0 0 \ ^21 ^22 ^23 = andet Ι α2ΐ ^22 а^з + fl3i <*32 азз/ \аз1 аз2 язз/ / 0 1 0 \ /00 1 \ + ai2det a2i а22 ^23 + ai3det a2i ^22 а^з -С \а31 а32 азз/ \аз1 аз2 а3з/ (5.23)
162 Глава 5. Линейные пространства 5.5. Свойства определителей В этом разделе перечислим основные свойства определителей, обеспечивающие успешное применение последних в решении различных задач линейной алгебры. 1) Пусть А — квадратная матрица порядка η, αϊ,..., ап — ее строки, А' — матрица размера (п — 1) χ тг, получающаяся из А удалением первой строки. Тогда в силу полилинейности и кососимметричности определителя det ία\ + λ2α2 Η l· ληα^\ det ( ^ J + A2det \V,) + · · · + Andet г£ ) = det A, так как при г = 2,... ,гс в матрице ί Λ j есть две одинаковые строки, и, следовательно, определитель каждой такой матрицы равен нулю. Очевидно, что установленное равенство справедливо не только для первой строки. Поэтому если к любой строке квадратной матрицы прибавить линейную комбинацию других ее строк, то определитель матрицы не изменится, 2) Покажем, что определитель произведения двух квадратных матриц равен произведению их определителей. Теорема 5.8. Для любых квадратных матриц Α η В одного порядка det АВ = det A det В. Доказательство. Пусть С = АВ, а^ — элемент, стоящий на пересечении j-й строки и г-го столбца в матрице А, Ь{ — г-я строка матрицы В, Cj — j-я строка матрицы С. Тогда η Cj = у ^ Cijibi, г=1 т.е. j-я строка матрицы С является линейной комбинацией строк матрицы В с коэффициентами, взятыми из j-й строки
5.5. Свойства определителей 163 матрицы А. Поэтому для вычисления значения определителя строк матрицы С можно воспользоваться формулой (5.20): det АВ = det С = det (ci, С2,..., с^) = = det (ЬЬ Ь2, · · · , Κ) Σ Sgn™l7r( 1)^(2) · · · ^ηπ(^) = iv€Sn = det В · det A = det A · det B. Теорема доказана. 3) Пусть А и А7 — матрицы оператора Л : V —► V в базисах vi, i?2> · · · ? vn и ι?!, г?2? ...5v'ft пространства V, В — матрица перехода от первого базиса ко второму. Так как А' = В_1АВ, то в силу теоремы 5.8 det A' = det (В-1 АВ) = det В"1 * det A · det В = ι (5.24) = det (B_1B) · det A = det Ε · det A = det Α. Таким образом, определитель матрицы оператора не зависит от выбора базиса, и поэтому можно говорить об определителе линейного оператора. Для вычисления определителя линейного оператора надо в пространстве выбрать базис и найти определитель матрицы оператора в этом базисе. 4) Найдем значение определителя транспонированной матрицы Ат = (а\Л. Так как sgr^ = sgiiTr-1, то поменяем порядок суммирования и перейдем к элементам матрицы А. В результате получим равенства det Ат = ^ sgn7r · <(1)4π(2) · · · <£π(η) = 7TGSn = Σ 8§Ππ · α1π-4ΐ)α2π-ΐ(2) ' ' ' αηπ"ΐ(η) = ir€Sn = Σ δ§η7Γ ' απ-ΐ(1)1^π-ΐ(2)2 " ' ' ^π-ΐ(η)η· π€5η Далее в каждом слагаемом последней суммы упорядочим множители по возрастанию первого индекса: 22 sgn7r · α7Γ-ΐ(1)1απ-1(2)2 ' ' ·απ-ΐ(η)η = 7vesn
164 Глава 5. Линейные пространства = 22 S§n7r * α1π(1)^2π(2) * * * Οηπ(η)· Таким образом, из (5.22) следует, что detAT =detA, (5.25) и определитель любой квадратной матрицы А является полилинейной кососимметрической функцией столбцов этой матрицы. В следующем примере используем это свойство определителей для разложения определителей из правой части равенства примера 5.15. Пример 5.16. Для первого определителя из правой части (5.23) имеем: /1 0 0 \ Л ° ° \ det 02ΐ ^22 ^23 = det О α22 <*23 + \α3ι α32 азз/ \0 α32 азз/ О О О \ /000 + det [ α2ΐ ^22 ^23 + det 0 α22 ^23 О α32 α33/ \α3ΐ <*32 а33у ΊΟ 0 \ = det [0 α22 ^23 = det <0 α32 α33/ /α22 а2з\ \α32 α33/ ' Переставляя столбцы во втором и третьем определителях так, чтобы их первые строки совпали с первой строкой первого определителя, видим, что справедливы равенства: /О 1 0 \ / 1 0 0 \ (а а \ det α2ΐ а>22 &23 = -det α22 &2ΐ <*23 = -det ( 21 23 J, Wi ^32 α33/ \α32 α3ί α33/ ^ 31 33' 0 0 1 \ / 1 0 0 \ /α α \ det ( α2ΐ α22 ^23 = (-l)2det α23 α2ΐ ^22 I = det f 21 22 J. <*3ΐ ^32 α33/ \α33 α3ι α32/ ^ 31 32'
5.5. Свойства определителей 165 Подставляя найденные формулы в (5.23), приходим к равенству /an an αιΛ det 02ΐ Д22 ^23 Ι = andet an 021 fl3i an &22 ^32 ai3 ^23 азз ^22 ^32 Й21 &31 &2$ ^33 <W ass -a12det(a21 a2S) + a13det (й21 a22) \a3i assj \a3i a32/ являющемуся частным случаем следствия (5,25) и доказываемой ниже в теореме 5.9 формулы разложения определителя по столбцу. D 5) В квадратной матрице А порядка η удалим г-ю строку и j-й столбец. Определитель получившейся квадратной матрицы порядка η — 1 называется минором М^- матрицы А. Произведение (—l)i+JM^ называется алгебраическим дополнением А^· элемента a%j матрицы А. Теорема 5.9. Пусть А — квадратная матрица порядка п. Тогда для любого j € {1,2,..., η} справедливо равенство η det A = ^2 OijAij- (5.26) Равенство (5.26) называется разложением определителя по j-y столбцу. Доказательство. Перечислим несколько простых фактов о матрицах и их определителях, совокупность которых позволит легко доказать настоящую теорему. 1. Из равенства (5.22) легко следует, что det Λ» Ο ... О \ (а22 ... а2п Ρ й22 ;;; ^ Uandet ; ■·. ; | =апА1Ь \0 ап2 ... апп) \а^ ··· а™У (5.27) 2. Преобразуем матрицу А в матрицу A(ij), передвинув ее г-ю строку на место первой строки, а j-й столбец на место первого столбца. Для перестановки строк нужно последовательно
166 Глава 5. Линейные пространства выполнить г — 1 транспозицию строк — поменять г-ю строку местами с г — 1-й, затем с г — 2-й и далее совершать такие перестановки со всеми предшествующими строками вплоть до первой. Аналогичные действия надо проделать и над столбцами. Поэтому в силу кососимметричности определителя det A(ij) = (-l)i+'"2det A = (-l)i+J'det А. (5.28) 3. Если i-я строка и j-й столбец квадратной матрицы А содержат единственный ненулевой элемент ау, то в силу (5.27) и (5.28) det A = aiji-iy^Mij = ау Ay. (5.29) 4. Воспользуемся линейностью определителя матрицы по первому столбцу и представим определитель матрицы А в виде суммы η определителей: det Απ ai2 ... <*21 ^22 . · · \dni аП2 · · · / 0 αΐ2 det ^21 ^22 аы\ α>2η &ηη/ = det fan α ΐ2 0 α22 *. · \ 0 αη2 ... ·.· αΐη\ / 0 ♦ . . 0,2η + · • · + det 0 αι^ ^2/г &ηη/ αΐ2 α22 + •. . αιΛ ♦ . . 0,2η \ 0 αη2 &ηη/ \α •ηΐ &η2 г) (5.30) 5. Используя линейность определителя по первой строке, первый определитель из суммы в правой части равенства (5*30) представим в виде суммы det fan 0 0 а22 V 0 <*п2 а>2п &пп/ + det /0 αΐ2 0 0 Й22 ^23 а>2п + • + det \0 аП2 апз ... апп/ /0 0 ... 0 а1п\ 0 Й22 ·** 02η-1 ^2п \0 ап2 &пп—1 &пп/
5.5. Свойства определителей 167 η определителей, из которых только первый отличен от нуля. Поэтому det /an an ··· Q>in\ 0 α22 .. · α2η\ \0 аП2 ... a>nn/ det /an 0 0 α22 Я2п \ 0 αη2 ацАп. &пп/ 6. Повторив рассуждения из предыдущего пункта для г-го слагаемого из суммы в правой части равенства (5.30), видим, что /0 αΐ2 ... аы\ det ttil Oi2 = αα А. ■il^-il· &пп/ \ 0 αη2 · 7. Из (5.30) и последнего равенства следует, что справедлива формула разложения определителя по первому столбцу: det A = y^ajiAji. г=1 8. Нетрудно видеть, что рассуждения п.п. 4—7 справедливы для произвольного столбца определителя. Таким образом det A = \J ciijAij. г=1 Теорема доказана. Из теоремы 5.9 и равенства (5.25) немедленно следует формула разложения определителя по г-й строке: det A = y^OjjAij. (5.31) 6) Из теоремы 5.9 легко следует, что определитель любой верхнетреугольной (aij = 0 при г > j) матрицы А равен произ-
168 Глава 5. Линейные пространства ведению ее диагональных элементов: det (an О αΐ2 &22 V О О 0>2η 0>пп/ 0,110,22 · ' -Опп- (5.32) Равенство (5.32) позволяет достаточно просто вычислять определители больших матриц. Чтобы воспользоваться формулой (5.32), покажем, что произвольная матрица может быть преобразована в верхнетреугольную при помощи двух элементарных преобразований: (2) перестановки строк; (3') прибавлении к i-й строке линейной комбинации остальных строк. Заметим, что первое из этих преобразований умножает определитель матрицы на —1, а второе, по свойству 1), определитель матрицы не изменяет. Рассмотрим произвольную квадратную матрицу α2ι Wi ai2 U22 аП2 Oln\ 02η 0"пп/ (5.33) порядка п. Если все элементы первого столбца равны нулю, то det А = 0. Если это не так, то в первом столбце найдется ненулевой элемент ац. В матрице А из каждой j-й строки (при j φ г) вычтем г-ю строку, умноженную на α^α^1, и переставим первую и i-ю строки (при г φ 1). В результате получим новую матрицу А' 0 «12 а22 °>2п \ \о ьп2 J определитель которой либо равен определителю исходной матрицы, либо, если an =0, отличается от него множителем — 1. Проделав аналогичные преобразования с последними тг— 1 строками матрицы А7, либо обнаружим, что первые два столбца матрицы А7 линейно зависимы, т. е. det A' = 0, либо получим новую
5.5. Свойства определителей 169 матрицу А" = (< 0 0 а\2 а22 0 а13 а23 ' ' а33 * * • «?„ • a'L a2n \0 0 <3 ··· <п/ Повторив в общей сложности подобные преобразования не более η — 1 раз, придем к верхнетреугольной матрице, определитель которой равен определителю исходной матрицы, умноженному на (—1)*, где к — общее число сделанных перестановок строк. Пример 5Л7. Вычислим определитель матрицы А с коэффициентами из Ζ5. Преобразуем эту матрицу к верхнетреугольному виду: А = /0 2 2 3\ 12 3 0 3 4 11 ^/ /1 2 3 0\ 0 2 2 3 3 4 11 г^> \2 2 2 1/ V2 2 2 1у/ /1 2 3 0\ /1 2 3 0\ /1 2 3 0\ 0 2 2 3 0 3 2 1 - 0 2 2 3 0 0 4 4 г^> 0 3 2 1 0 0 4 4 \0 3 1 1/ \0 0 3 4/ \0 0 0 1/ Определитель последней матрицы равен 12 = 2 (mod 5), при этом строки переставлялись ровно один раз на первом шаге. Следовательно, det А = —2 = 3. □ 7) Пусть А и В — произвольные квадратные матрицы порядков тип соответственно. Покажем, что det А О 2)- det A · det В. (5.34) Последовательно раскладывая определитель матрицы Ά О ,0 Еп по последним η строкам, видим, что ее определитель равен определителю матрицы А. Аналогичным образом находим, что опре-
170 Глава 5. Линейные пространства делитель матрицы I ™ I равен det В. Следовательно, -(ов)^(оЕ°„)(^в) = = det(o Е„) det(^ B)=detAdetB Теперь покажем, что равенство (5.34) является частным случаем равенства det I ^ S ) = det A · det В (5.35) с произвольной матрицей С* Прежде всего заметим, что если det В = 0, то строки матрицы в (5.35) линейно зависимы, и, следовательно, ее определитель равен нулю. Если же det В φ 0, то строки матрицы В линейно независимы, и каждая строка матрицы С является линейной комбинацией строк матрицы В. В этом случае справедливость равенства (5.35) следует из свойства определителей, установленного в п. 1). 8) Матрица А = (а^) называется присоединенной матрицей квадратной матрицы А, если ее ij-й элемент 3^· равен алгебраическому дополнению1^ Aji матрицы А. /1 2\ Пример 5 Л 8* Для матрицы А = I ) над полем Z5 найдем присоединенную матрицу А. Так как Ац = 4, Ai2 = —3 = = 2, А21 = —2 = 3 и А22 = 17 то А = I I. Далее легко видеть, что det A = 3 и 1 2\ /4 3\ = /4 3\ /1 2\ = /3 0\ /1 0 3 4/ 12 1/ V2 1/ U 4/ \0 3 \0 1 т.е. AA = detAE. D ^Подчеркнем, что присоединенная матрица является не матрицей алгебраических дополнений, а транспонированной к ней.
5.5. Свойства определителей 171 Покажем, что произвольная матрица А и ее присоединенная матрица А связаны соотношениями АА = det А Е = АА. (5.36) Прежде всего заметим, что из двух равенств в (5.36) достаточно доказать одно, второе равенство будет простым следствием первого и (5.25). Поэтому ограничимся доказательством левого равенства. Нетрудно видеть, что сумма в правой части равенства (5*31) является произведением г-й строки матрицы А и i-ro столбца присоединенной матрицы А: η η Qet Ά. — У (lijJ\<ij — У (lijJ\ji. 3 = 1 3=1 Таким образом, для доказательства (5.36) достаточно показать, что произведение г-й строки А и j-το столбца А равно нулю при В матрице А заменим г-ю строку ее j-й строкой и разложим определитель новой матрицы А' по г-й строке. Так как алгебраические дополнения элементов г-й строки новой матрицы совпадают с соответствующими алгебраическими дополнениями матрицы А, то η det A7 = y^gjjfeAflfe. k=l С другой стороны, i-я и j-я строки в матрице А7 одинаковы. Следовательно, определитель матрицы А' равен нулю. Таким образом, при г φ j приходим к равенствам η η к=1 к=1 которые завершают доказательство (5.36). Из (5.36) следует, что каждая матрица А = {ац) с ненулевым определителем имеет обратную матрицу, найти которую можно
172 Глава 5. Линейные пространства по формуле1^ /ац αΐ2 V^nl ^2 -1 ^21_ det A det A Ai2 Mi det A det A \ Ain A2n \detA detA ) detA A^2 detA Апгг detA (5.37) /1 2\ Пример 5Л9* Для матрицы A = I J над Z5 из предыдущего примера найдем обратную матрицу. Так как detA = 3, то З"1 = 2 (mod 5) и А= (^ Ъ\ ГГ- 2-4 2-3 2-2 2-1 3 1 .D ч4 2> Пример 5*20* Обобщая предыдущий пример, получаем ι а Ь с d d ad — be V —с Нахождение обратных матриц по формуле (5.37) слишком трудоемко для матриц больших порядков, и поэтому эта формула имеет в основном теоретический интерес. Подробнее обратные матрицы и способы их вычисления будут рассмотрены ниже в разделе 6.2. 9) Рассмотрим важный пример вычисления определителя имеющей многочисленные приложения матрицы Вандермонда vn = ( 1 χι \хГ1 χ: 1 х2 ,η-1 1 \ X. п-1 (5.38) / с элементами из поля F. аЬ~\ ' Здесь и далее дробь ^ используется для обозначения произведения
5.5. Свойства определителей 173 Лемма 5.5. Для определителя матрицы Вандермонда Vn справедливо равенство detKn= Π (Xi-Xj). (5.39) Доказательство. Лемму докажем индукцией по п. В основание индукции положим очевидный случай η = 2. Допустим, что утверждение леммы верно при η ^ т. Покажем, что оно справедливо и при η = т + 1. Прежде всего заметим, что если Х{ = Xj, то матрица Fm+i будет содержать два одинаковых столбца, и, следовательно, ее определитель будет равен нулю. Поэтому в этом случае равенство (5.39) верно. Далее будем полагать, что все Xi различны. В матрице Vm+i заменим Xm+i переменной #, после чего определитель разложим по последнему столбцу. Нетрудно видеть, что в этом случае определитель преобразованной матрицы будет многочленом степени т от х: /1 1 ... 1 1\ Х\ 3/2 ♦ · ♦ Χγγι Χ D(x) = det = dmxm + ... + d\x + do, \гр7П фГП грГП фГП Ι •Μ χ2 · · * xm ^ / где коэффициент dm — определитель матрицы Vm. Многочлен D(x) имеет ровно m корней — Х\,..., хш. Поэтому D(x) = dm{x - χι)(χ -χ2)·-{χ- xm)y где dm G F. Так как по предположению индукции имеет место равенство dm = П^чцт^ " xi)> TO detFw+i =D(xm+i) = = Π (α* " xi) Π (α"+ι ~ хз) = Π (α* " xi)· Лемма доказана. Из леммы 5.5 следует, что определитель матрицы Вандермонда отличен от нуля тогда и только тогда, когда все Xi в (5.38) различны.
174 Глава 5. Линейные пространства Задачи 5Л. Доказать эквивалентность двух следующих определений базиса линейного векторного пространства: 1) множество векторов V является базисом пространства V, если векторы V линейно независимы и V является линейной оболочкой V; 2) множество векторов V является базисом пространства V, если V является линейной оболочкой 7ине является линейной оболочкой никакого его собственного подмножества V. 5.2. Определить, является ли каждое из указанных множеств линейным пространством, и если является, то найти его размерность, мощность и указать базис: 1) все булевы функции трех аргументов относительно операции / V д (над полем Z2); 2) все булевы функции трех аргументов относительно операции 3) множество матриц размера 3 χ 3 с элементами из Ζ7; 4) все симметрические матрицы размера 3 χ 3 с элементами из Ζγ; 5) все кососимметрические матрицы размера 3 χ 3 с элементами из Ζγ; 6) множество всех многочленов двух переменных степени не более 3 с коэффициентами из Ζγ. 5*3. Найти число векторов из пространства Ζ32, ортогональных вектору и = 102002220101. Привести пример ненулевого вектора этого пространства, ортогонального самому себе. 5.4. Найти число к-мерных подпространств пространства Щ, содержащих данный вектор. 5*5. Как изменится матрица перехода от одного базиса к другому, если: 1) поменять местами два вектора первого базиса; 2) поменять местами два вектора второго базиса; 3) записать векторы обоих базисов в обратном порядке? 5.6. Найти матрицу перехода от базиса 1 базису 1, χ — а, (х — а)2,..., (х — а)п пространства многочленов степени не выше η над полем действительных чисел. 5.7. Найти число различных линейных операторов /, действующих из пространства Ζ£ в пространство Ζ™. Сколько из них имеет полный ранг (то есть dimlm/ = m)? 5*8. Найти число различных матриц порядка η над Ζρ, ρ — простое, имеющих ранг т.
Задачи 175 5.9. Найти число различных линейных операторов / : Z2 —► Ζ™, которые переводят фиксированный вектор и ^ 0 в нулевой вектор. 5.10. Пусть Vb V2 — произвольные линейные подпространства в некотором пространстве размерности η над полем F. Доказать, что их сумма Vi +V2 = {χι + χ2 : Χι € Vbx2 e V2} и пересечение ¥х Π V2 также являются подпространствами. Привести пример подпространств Vi и V2, объединение которых Vi U V2 не является подпространством. 5.11. Пусть Vi = {12011,21102, 12121), V2 = (20210,02001,11012) над полем Z3. Найти dim(Vi + V2), dim(Vi Π V2) и указать базисы в пространствах Vi + V2 и Vi Π V2. 5.12. Пусть Vi и V2 — подпространства пространства V. Показать, что dim(Vi + V2) = dim Vi + dimV2 - dim(Vi П V2). 5.13. Пусть V — линейное пространство и U — его произвольное подпространство. Доказать, что (U-1)-1 = U. 5.14. Привести пример такого подпространства U в линейном конечномерном пространстве над конечным полем, что V1 = U. 5.15. Показать, что существует ровно одна полилинейная функция / : (Z2)n —► Z2, равная нулю на линейно зависимых аргументах и равная единице в противном случае. 5.16. Найти число различных полилинейных кососимметрических функций / : (Zp)n —► Ζρ, ρ — простое, равных нулю на линейно зависимых аргументах и неравных нулю в противном случае. 5.17. Показать, что для любых квадратных матриц А и В одинакового порядка det (А + В) < det A + det В. 5.18. Пусть А — квадратная^матрица порядка η и ранга к. Найти ранг присоединенной матрицы А. 5.19. Показать, что если в квадратной матрице есть строка из единиц, то сумма всех алгебраических дополнений этой матрицы равна ее определителю. 5.20. Матрица Нп над R порядка 2П называется матрицей Ада- мара, если Н\ = ί J и Hk+\ = ( г/5 τ/)- Найти detЯn и н-к
176 Глава 5. Линейные пространства 5.21. Воспользовавшись методом индукции, указать способ вычисления произведения Нпх матрицы Нп на произвольный действительный вектор-столбец χ длины 2п, использующий по порядку не более п2п операций с действительными числами. 5.22. Доказать, что матрица Адамара обладает максимальным (по модулю) определителем среди всех матриц порядка 2П над R с элементами ±1. 5.23. Матрица Fn = (fij) над С порядка η называется матрицей дискретного преобразования Фурье, если /^· = ξη , где ξη — первообразный корень n-й степени из единицы (££ = 1 и £* ^ 1 ПРИ О < к < п). Найти detFn и F'1.
Глава б Пространства с операторами В этой главе рассматриваются различные вопросы, связанные с решением систем линейных уравнений, и изучается структура линейных пространств с заданными на них линейными операторами. Материал этой главы существенным образом используется далее в восьмой и девятой главах при изучении конечных полей и алгоритмов. С таким, ориентированным на конечные поля, «прикладным» характером данной главы связан ряд особенностей, основная из которых порождена тем, что при вычислениях в конечных полях отсутствуют ошибки округления. Поэтому в излагаемых ниже методах решения линейных систем вопросы точности не рассматриваются, и точность этих методов в «бесконечной» линейной алгебре может оказаться неудовлетворительной. 6.1· Системы линейных уравнений Над полем F рассмотрим систему из т линейных уравнений a\\xi + ai2X2 + ... +а\пХп = Ьь a>2\Xi + C122X2 + . . · + (12η Χη = &2, flmlff 1 + &т2 Х2 + · · · + аШпХп = Ьш с коэффициентами а*?, свободными членами Ь% и с η неизвестными Xi. Эту систему можно записать в виде матричного урав- (6.1)
178 Глава 6. Пространства с операторами нения 0>12 а>22 а>2п (ьл (6.2) \0>ml &rn2 * * * с (т,п)-матрицей А = (α^·)? составленной из коэффициентов функций системы (6.1), вектором-столбцом свободных членов Ь — (bi) и вектором-столбцом неизвестных χ = (#$). Матричное уравнение называется согласованным, если оно имеет хотя бы одно решение. Далее будем изучать решения уравнения (6.2), а следовательно, и решения системы (6.1). Прежде всего выясним, в каких случаях уравнение (6.2) согласовано. Для этого из матрицы А и вектора b рассматриваемого уравнения составим новую матрицу (А | Ь), добавив к матрице А в качестве нового столбца вектор Ь и отделив его при этом от А вертикальной линией. Получившаяся матрица (an an ··· α in I bi\ \flml Q>m2 bm/ называется расширенной матрицей уравнения (6.2) (а также и системы (6.1)). Имеет место следующий критерий согласованности матричного уравнения. Теорема 6.1 (Кронекера — Капелли). Уравнение Ах = Ь с (га, га)-матрицей А имеет решение тогда и только тогда, когда ранг матрицы А равен рангу расширенной матрицы (А|Ь). Доказательство. Если rank A = rank(A|6), то вектор Ь является линейной комбинацией столбцов αι,...,αη матрицы А, т.е. Ь = αιαι Η \- anan. (6.3) Так как равенство (6,3) эквивалентно матричному равенству Аа = Ь, то очевидно, что вектор а = (αι,...,αη) будет решением уравнения Аж = Ь.
6.1. Системы линейных уравнений 179 С другой стороны, если вектор-столбец α = (αϊ,..., ап) является решением уравнения Ах = 6, то, очевидно, справедливо равенство (6.3), из которого немедленно следует равенство рангов матриц А и (А | Ь). Теорема доказана. Теорема 6*2. Если уравнение Ах = Ь с {т,п)-матрицей А имеет хотя бы одно решение^ то все решения этого уравнения образуют смежный класс пространства ¥п по ортогональному пространству матрицы А. Доказательство. Допустим, что уравнение Ах = 6 имеет решение xq. В этом случае для доказательства теоремы достаточно показать, что любой вектор, лежащий с вектором Xq в одном смежном классе пространства W1 по ортогональному пространству матрицы А, является решением уравнения Ах = 6, и наоборот, любое решение рассматриваемого уравнения принадлежит тому же смежному классу пространства ¥п по ортогональному пространству матрицы А, что и вектор xq. Рассмотрим ортогональное пространство А1- матрицы А. Для каждого вектора ν из пространства А1- справедливы равенства А(а?о + ν) = Ахо + Αν = 6 + 0 = 6. Следовательно, вектор xq + ν является решением уравнения Ах = 6. С другой стороны, если у — решение рассматриваемого уравнения, то А(у - xq) = Ay - Аа?о = 6 — 6 = 0. Поэтому, у — xq £ А"1. Следовательно, у принадлежит тому же смежному классу пространства F™ по А-1-, что и вектор Xq. Теорема доказана. Из доказанной теоремы следует, что для нахождения всех решений уравнения Ах = 6 достаточно решить две задачи: 1) найти хотя бы одно решение Xq этого уравнения, такое решение называется частным; 2) найти ортогональное пространство матрицы А.
180 Глава 6. Пространства с операторами Ортогональное пространство матрицы А является решением однородного уравнения Аж = 0 (соответствующая этому уравнению система линейных уравнений также называется однородной) , а базис этого пространства называется фундаментальной системой решений уравнения (6.2) (и системы (6.1)). Решения задач 1) и 2) рассматриваются в двух следующих разделах. 6.2. Обращение невырожденных матриц Квадратная матрица А называется невырожденной , если ее строки линейно независимы. Из равенства (5.25) и теоремы 5.7 следует, что столбцы невырожденной матрицы также линейно независимы. Лемма 6.1 (Алгоритм Гаусса). Квадратную невырожденную матрицу при помощи элементарных преобразований строк можно преобразовать в единичную матрицу. Доказательство. Теорему докажем индукцией по порядку матрицы. В основание индукции положим очевидный случай матрицы первого порядка. Далее предположим, что утверждение теоремы верно для всех невырожденных матриц, порядок которых не превосходит (п— 1). Рассмотрим произвольную невырожденную матрицу /ап а\2 ··· αιη\ \αηι ап2 - · * о>пп/ порядка п. Так как матрица невырождена, то в ее первом столбце найдется хотя бы один ненулевой элемент. В матрице А переставим строки так, чтобы после перестановки первый элемент первой строки стал ненулевым. После этого умножим первую строку матрицы на константу из ¥ так, чтобы ее первый элемент стал равным единице. Затем из каждой строки вычтем первую (6.4)
6.2. Обращение невырожденных матриц 181 строку, умноженную на первый элемент уменьшаемой строки. В результате получим новую матрицу Л «'и А' = α'ΐηλ О d. 22 Чп \0 < п2 апп/ в которой в первом столбце ненулевой элемент встречается только один раз — в первой строке, где он равен единице. Так как последние (п — 1) строк матрицы А; линейно независимы, то, следовательно, матрица, получающаяся из матрицы А' удалением первой строки и первого столбца, будет невырожденной матрицей порядка (п — 1), и по предположению индукции эту матрицу можно преобразовать в единичную матрицу при помощи элементарных преобразований строк. Легко видеть, что аналогичные преобразования, выполненные над последними (п — 1) строками матрицы А7, преобразуют ее в матрицу А" /1 <2 О 1 а' 1п\ О \0 О 1/ в которой на пересечении последних (п — 1) строк и последних (п — 1) столбцов стоит единичная матрица. Теперь из первой строки матрицы А" вычтем вторую строку, умноженную на а'12, третью строку, умноженную на а'13, и т.д. вплоть до последней строки, умноженной на о!1п. Очевидно, что в результате получим единичную матрицу. Лемма доказана. Вместе с элементарными преобразованиями строк будем также рассматривать и аналогичные элементарные преобразования столбцов. Легко видеть, что справедливо следующее утверждение. Лемма 6.2, Квадратную невырожденную матрицу при помощи элементарных преобразований столбцов можно преобразовать в единичную матрицу.
182 Глава 6. Пространства с операторами Заметим, что применение первого элементарного преобразования строк к данной матрице, т. е. умножение ее г-й строки на константу а, сводится к умножению этой матрицы на единичную матрицу, в которой вместо единицы на пересечении г-й строки и г-ro столбца стоит а, применение второго элементарного преобразования к сводится к умножению матрицы слева на единичную матрицу с переставленными г-й и j-й строками, а применение третьего элементарного преобразования — к умножению слева на единичную матрицу с дополнительной единицей, стоящей на пересечении j-Ш строки и i-ro столбца. Например, для перестановки первой и четвертой строк нижнетреугольной матрицы четвертого порядка имеем 1 1/ а для прибавления к первой строке этой матрицы ее четвертой строки — /0 0 0 1\ 0 10 0 0 0 10 \1 0 0 θ) /0 0 0 0 0 1 0 1 1 V 1 ι Л 0 0 \о 1 1 1 0 1 1 111 0 0 1 /1 0 0 1\ 0 10 0 0 0 10 \0 0 0 l) /0 0 0 1\ 0 0 11 0 111 V ι ι У /1 1 1 2\ 0 0 11 0 111 V ι ι У Таким образом, для каждой невырожденной матрицы А найдется матрица В, являющаяся произведением матриц, соответствующих выполненным элементарным преобразованиям строк, и такая, что ВА = Е. Аналогичным образом можно показать, что каждое элементарное преобразование столбцов матрицы эквивалентно умножению этой матрицы справа на соответствующую ему матрицу. Поэтому в силу леммы 6.2 для каждой невырожденной матрицы А найдется матрица С, являющаяся произведением матриц, соответствующих элементарным преобразованиям столбцов, преобразующих А в единичную матрицу, такая, что АС = Е. Так как С = (ВА)С = В(АС) = В,
6.2. Обращение невырожденных матриц 183 -ι то С = В = А % т. е. каждая невырожденная матрица порядка η имеет единственную обратную матрицу А-1 такую, что А"1 А = АА -1 Е, Отметим, что множество невырожденных матриц одного порядка образует группу с операцией умножения1). Из сказанного выше следует простой способ обращения невырожденной матрицы А. Сначала элементарными преобразованиями строк матрица А преобразуется в единичную матрицу, или, что эквивалентно, матрица А умножается слева на некоторую матрицу В такую, что ВА = Е. Затем аналогичные преобразования производим над единичной матрицей, т.е. умножаем единичную матрицу на ту же матрицу В и, следовательно, имеем BE = В. Очевидно, что матрица, получившаяся из единичной матрицы, будет обратной к матрице А. Пример 6Л, Применим сформулированный выше алгоритм /О О 1N обращения невырожденных матриц к матрице I 0 1 1 Z3. Элементарные преобразования над обращаемой и единичной матрицами будем выполнять одновременно, разделив эти матрицы вертикальной линией. Легко видеть, что справедливы следующие соотношения: над Ό О Г Таким образом, (011 Д 1 1, -1 ^Этот факт, так же как и существование обратной матрицы, является следствием изоморфизма колец матриц и операторов.
184 Глава 6. Пространства с операторами 6.3* Решение линейных матричных уравнений 1. Систематические матрицы. Матрица А называется систематической, если она состоит из двух блоков — единичной матрицы порядка га и следующей за ней матрицы размера т х (п — т), т.е. /10... 0 0 aim+i А= 0 1 ... 0 0 a2m+i \0 0 ... 0 1 aww+i Покажем, что произвольную матрицу простыми преобразованиями строк и столбцов можно превратить в систематическую. Имеет место следующее утверждение. Лемма 6*3. Любую матрицу при помощи элементарных преобразований строк, удаления нулевых строк и перестановки столбцов можно преобразовать в систематическую матрицу. Доказательство. Рассмотрим (ш, тг)-матрицу А ранга к. Переставим строки и столбцы этой матрицы так, чтобы в новой матрице первые к строк и столбцов были линейно независимы. Затем из каждой из последних т — к строк матрицы А вычтем равную ей линейную комбинацию первых к строк. В преобразованной матрице А7 последние к строк станут нулевыми. Удалим эти строки. Далее рассмотрим матрицу А*., состоящую из первых к столбцов матрицы А7. Очевидно, что эта матрица будет невырожденной. Следовательно, найдется последовательность элементарных преобразований строк Д, переводящая матрицу Ak в единичную матрицу порядка fc. Легко видеть, что эта же последовательность R преобразует матрицу А7 в эквивалентную ей систематическую матрицу. Лемма доказана. Матрицы А и В называются перестановочно эквивалентными, если матрицу А можно преобразовать в матрицу В элементарными преобразованиями строк и перестановкой столбцов. Заметим, что любая (т,п)-матрица В ранга к может быть получена перестановкой столбцов из подходящей (га, ^-матрицы А ранга к с первыми к линейно независимыми столбцами. ain\ 0>тп/ (6.5)
6.3. Решение линейных матричных уравнений 185 Следовательно, любая (т,п)-матрица ранга к перестановочно эквивалентна некоторой систематической (&, тг)-матрице. Для преобразования матрицы в перестановочно эквивалентную ей систематическую матрицу удобно использовать модификацию приведенного в предыдущем разделе алгоритма преобразования невырожденной матрицы в единичную. Отличие модификации от исходного алгоритма состоит только в том, что при выполнении очередного шага алгоритма над произвольной матрицей может возникнуть ситуация, когда преобразуемый на этом шаге столбец будет равен линейной комбинации предыдущих столбцов. В этом случае преобразуемый столбец надо просто пропустить и продолжить выполнение алгоритма со следующим столбцом. Заканчивается выполнение алгоритма удалением нулевых строк (если такие строки появятся) и перестановкой пропущенных столбцов в конец матрицы. Пример 6.2* Преобразуем указанную далее матрицу А над Z3 в перестановочно эквивалентную ей систематическую матрицу А'. Применяя для этого описанный выше алгоритм, последовательно получим пять приведенных ниже матриц. Первые четыре матрицы эквивалентны матрице А, а последняя, являющаяся систематической, — перестановочно эквивалентна: \0 О О О О О/ /1 1 0 1 1 0\ 2 0 110 1 0 110 12 /1 1 0 1 1 0\ 0 112 11 0 110 12 \0 2 2 1 2 2/ \0 2 2 1 2 2/ /1 1 0 1 1 0\ /1 1 0 1 1 0\ 0 112 11 0 0 0 2 0 2 r>j 0 110 12 0 0 0 10 1 \0 0 0 0 0 0/ \0 0 0 0 0 О/ /1 0 2 0 0 0\ 0 110 12 0 0 0 10 1 - /1 0 0 2 0 0\ 0 10 112 0 0 10 0 1, На первом шаге алгоритма первая строка матрицы А прибавлена к ее второй строке. На втором шаге вторая строка новой
186 Глава 6. Пространства с операторами матрицы прибавлена к удвоенной третьей и четвертой строкам. Легко видеть, что в полученной матрице третий столбец является линейной комбинацией первых двух столбцов. Поэтому на третьем шаге третий столбец оставлен без изменений, преобразован четвертый столбец — третья строка матрицы удвоена и прибавлена ко второй. На четвертом шаге к первой строке прибавляются удвоенные вторая и третья строки. Наконец на последнем шаге переставлены третий и четвертый столбцы, а последняя строка, состоящая только из нулей, удалена. Полученная в результате преобразований матрица является систематической. D 2* Решение однородного уравнения* Приведем алгоритм, который находит базис ортогонального пространства произвольной (т,п)-матрицы. Сначала рассмотрим частный случай — опишем алгоритм, решающий данную задачу для систематической матрицы. Для этого систематической матрице А = (ЕтА1 поставим в соответствие (п, ш)-матрицу А! = I ], которая состоит из двух \*Чг—га/ блоков — матрицы —А и находящейся под ней единичной матрицы порядка {п — т). Легко видеть, что для произведения А А' справедливы равенства: Таким образом, пространство А/Т, порожденное столбцами матрицы А', входит в ортогональное пространство матрицы А. Так как размерность этого пространства равна n — m, а размерность пространства строк матрицы А равна т, т. е. dim A'T +dim A = = п, то из теоремы 5.4 легко следует, что А1- = А^. Таким образом, в качестве базиса ортогонального пространства матрицы А можно взять столбцы матрицы А'. Приведенный алгоритм очевидным образом модифицируется в алгоритм нахождения базиса ортогонального пространства произвольной матрицы. Матрицу А надо преобразовать в
6.3. Решение линейных матричных уравнений 187 перестановочно эквивалентную ей систематическую матрицу В. При этом следует запомнить все выполненные в процессе преобразования перестановки столбцов — действующую на множестве столбцов подстановку π € Sn. Затем для матрицы В описанным выше способом строится матрица В', столбцы которой порождают ортогональное пространство матрицы В. Наконец на строки матрицы В7 действуем подстановкой π-1, восстанавливая исходный порядок координат Полученная матрица С будет порождать ортогональное пространство исходной матрицы А. Пример 6*3. Для матрицы А из рассмотренного выше примера 6.2 построим матрицу, порождающую ее ортогональное пространство. Сначала преобразуем матрицу А в перестановочно эквивалентную ей систематическую матрицу В. Из примера 6.2 имеем А = /1 1 0 1 1 0\ 2 0 110 1 0 110 12 \0 2 2 1 2 2/ Ί 0 0 2 0 0λ В= [0 1 0 1 1 2 ,001001, При преобразовании А в В переставлялись третий и четвертый столбцы. Для матрицы В легко находим порождающую ее ортогональное пространство матрицу В': умножая матрицу /2 0 0\ /10 0\ В = I 1 1 2 1 на — 1, получаем матрицу 12 2 1 I, к кото- \0 0 1/ \0 0 2/ рой снизу приписываем единичную матрицу третьего порядка. Затем в матрице В7 выполняем обратную к ранее выполненной перестановку строк — снова меняем местами третью и четвертую строки. В результате имеем В' = /1 2 0 1 0 \о 0 2 0 0 1 0 °\ 1 2 0 0 V с = Л 2 1 0 0 \о 0 2 0 0 1 0 о\ 1 0 2 0 V
188 Глава 6. Пространства с операторами Непосредственной проверкой легко убедиться в справедливости равенства АС = 0, и так как rank С + rank А = б, то С — искомая матрица. D Используя приведенный в предыдущем разделе алгоритм обращения невырожденных матриц, можно легко решить уравнение Ах = Ь с невырожденной квадратной матрицей А. Для решения этого уравнения достаточно обратить матрицу А и умножить найденную матрицу А-1 на вектор Ь. Действительно, умножая матрицу А-1 на левую и правую части рассматриваемого уравнения, видим, что А_1Ь = А_1Аж = Ех = ж. Следовательно, решением уравнения Ах = Ь с невырожденной матрицей А является вектор А_1Ь. Рассмотрим простой пример. Пример 6*4. Решим над Z3 матричное уравнение Матрица из этого уравнения была обращена в примере 6.1. Используя его результат, имеем Θ - (Π ί) Θ - (ί) ■ Таким образом, решением рассматриваемого уравнения является вектор-столбец (121). D Заметим, что для решения уравнения Ах = 6 с невырожденной матрицей А необязательно эту матрицу обращать. Достаточно выполнить над вектором Ь действия, преобразующие матрицу А в единичную матрицу. Пример 6.5* Решим уравнение Ах = Ь, в котором матрица А такая же, как и в предыдущем примере, а вектор Ь равен
6.3. Решение линейных матричных уравнений 189 (110). Элементарные преобразования над матрицей А и вектором Ь будем выполнять одновременно, добавив вектор Ь к столбцам матрицы А. Выполняя такие же преобразования, как и в примере 6.1, видим, что Ό ο ι I 1 о 2> Следовательно, χ = (201). D Рассмотренный выше алгоритм нахождения базиса ортогонального пространства матрицы позволяет показать, что любое подпространство линейного пространства является в некотором смысле аналогом нормальных подгрупп и идеалов, а любой линейный оператор — аналогом гомоморфизма. Точнее, справедливо следующее утверждение. Теорема 6.3, Для любого подпространства U конечномерного пространства V найдется такой линейный оператор Л : V^ V, что U = Кег А. Доказательство. Зафиксируем в n-мерном пространстве V базис V. Пусть k = dimU, векторы ui,...,ujt образуют базис в U и являются строками матрицы U. Пусть, далее, векторы V\y ·.., vn-k образуют базис ортогонального пространства матрицы U и являются строками матрицы U'. Так как строки матрицы U образуют базис ортогонального пространства матрицы U', то подпространство U будет ядром оператора Л, матрицей которого в базисе V является U'. Теорема доказана. 3. Общий случай. Теперь приведем алгоритм нахождения решения согласованного уравнения Ах = 6 в общем случае с ненулевой правой частью. Для этого сначала найдем частное решение этого уравнения в случае, когда матрица А = (ЕтВ) систематическая. Такое решение находится легко. Например, из равенств
190 Глава 6. Пространства с операторами (ЕШВ) (§ =ЕтЬ + ВО = Ь следует, что вектор I I будет частным решением рассматриваемого уравнения Ах = Ь. Далее рассмотрим уравнение с несистематической (га, п)- матрицей А ранга т, в которой первые га столбцов линейно независимы. Легко видеть, что при помощи только элементарных преобразований строк матрица А может быть преобразована в эквивалентную ей систематическую матрицу В. Ранее было показано (с. 182), что выполнение любого элементарного преобразования строк квадратной матрицы сводится к умножению этой матрицы слева на некоторую матрицу определенного вида. Аналогичное утверждение справедливо и для матриц произвольных размеров. Например, легко видеть, что умножение произвольной (га, тг)-матрицы А слева на квадратную матрицу порядка т, получающуюся из единичной матрицы того же порядка добавлением единицы на пересечение г-й строки и j-ro столбца, соответствует добавлению к г-й строке матрицы А ее j-й строки. Следовательно, для любой (ш,п)-матрицы А ранга га, в которой первые т столбцов линейно независимы, найдется квадратная матрица С порядка т, умножение на которую слева преобразует матрицу А в эквивалентную ей систематическую матрицу В. Так как Вх = САх = СЬ, то одновременное выполнение над строками матрицы А и над координатами вектора Ь элементарных преобразований, переводящих А в В, преобразует уравнение Ах = Ь в уравнение Вх = СЬ, решения которого совпадают с решениями исходного уравнения. Так как матрица В систематическая, то вектор- столбец (Ь', 0), где Ь' = СЬ, будет частным решением уравнения Ах = Ь. Очевидным образом приведенный алгоритм можно использовать и для решений уравнений с произвольными матрицами.
6.3. Решение линейных матричных уравнений 191 Пример 6.6. Найдем все решения уравнения /1 1 0 1 1 0\ 2 0 110 1 0 110 12 \0 2 2 1 2 2/ (χλ х2 Ufi/ (*\ 2 1 W (6.6) Решения однородного уравнения с такой же матрицей, как и в (6.6), были найдены в примерю 6.3, где, в частности, был найден ранг этой матрицы, равный трем. Поэтому для определения всех решений уравнения (6.6) надо определить, будет ли это уравнение согласованным, и если оно согласовано, то найти какое-нибудь его частное решение. Сделаем это описанным выше способом. Элементарные преобразования над строками матрицы и координатами вектора будем выполнять одновременно, добавив в матрицу коэффициентов в качестве дополнительного столбца вектор свободных членов. Из двух следующих преобра- 2 1 1/ зовании /1 2 0 U 1 0 1 2 0 1 1 2 1 1 0 1 1 0 1 2 0 1 2 2 /110 110 0 112 11 0 110 12 \0 2 2 1 2 2 /110 110 0 112 11 0 0 0 2 0 2 \0 0 0 0 0 0 0 1 1/ 1\ 0 2 1/ которые аналогичны двум первым преобразованиям из примера 6.2, видно, что ранг расширенной матрицы равен четырем. Таким образом, система (6*6) решений не имеет. D Пример 6.7. Поменяем вектор в правой части (6.6) и найдем все решения нового уравнения /1 1 0 1 1 0\ 2 0 110 1 0 110 12 \0 2 2 1 2 у хЛ Х2 \Хб/ Л\ 1 1 W (6.7)
192 Глава 6. Пространства с операторами Для этого над расширенной матрицей системы (6.7) выполним первые четыре преобразования из примера 6.2. Эти преобразования состоят в следующем: 1) первую строку расширенной матрицы прибавим к ее второй строке; 2) вторую строку новой матрицы прибавим к удвоенной третьей и четвертой строкам; 3) третью строку матрицы удвоим и прибавим ко второй строке; 4) к первой строке прибавим удвоенные вторую и третью строки. В результате этих преобразований получим последовательность эквивалентных матриц /110 110 2 0 110 1 0 110 12 \0 2 2 1 2 2 /110 110 0 112 11 0 0 0 2 0 2 \0 0 0 0 0 0 1 1 υ Л 2 1 о) /*ч^ /^ч/ rs/ /110 110 0 112 11 0 110 12 \0 2 2 1 2 2 /110 110 0 110 12 0 0 0 10 1 \0 0 0 0 0 0 /10 2 0 0 0 0 110 12 0 0 0 10 1 \0 0 0 0 0 0 2 1 V 1 2 о/ 1\ 1 2 о/ последняя из которых с точностью до перестановки двух столбцов является систематической. Легко видеть, что ранг матрицы нового уравнения /1 0 2 0 0 0\ ίχΛ 0 1 1 0 1 2 I «2 0 0 0 1 0 1 Mil \о о о о о о/ \XJ 1 2 равен рангу расширенной матрицы. Следовательно, решение существует. В матрице нового уравнения сумма первого, второго и удвоенного четвертого столбцов равна вектору, стоящему в правой части этого уравнения. Поэтому вектор (110200) будет частным решением последнего уравнения, а следовательно, и
6.3. Решение линейных матричных уравнений 193 уравнения (6.7). Наконец каждое решение этих уравнений является суммой найденного частного решения и некоторого вектора из ортогонального пространства матрицы из (б.6), которое было найдено в примере 6.3. Следовательно, каждое решение уравнения (6.7) представляется в виде суммы (110200) + λι(121000) + λ2(020010) + λ3(010201), где λι, λ2 и Аз — произвольные константы из Ζ3. □ 4. Формулы Крамера* Снова рассмотрим уравнение Ах = Ь с невырожденной квадратной матрицей А. Из (5.37) следует, что для его решения χ = А_1Ь справедливо равенство /хЛ OCj \%п/ >ύ±_ detA detA 1 А\п \detA ^L detA Ajj detA detA detA * Anj detA Ann detA / ъ, \bnj /V? . Ъ- A*' \ Aii 2^i=l ^detA Α^η ш '«detA/ (6.8) С другой стороны, пусть Aj — матрица, полученная из матрицы А заменой ее j-ro столбца столбцом свободных членов 6. Так как detA = Σ£=ι αυΑ^·, то, разложив detA^ no j-y столбцу, получим /ап .. \ Оц ♦. Wi . · . 61 .. . h .. . bn .. • a>in\ &in &nn/ J>Ay. (6.9) i=l det Aj = det Сравнивая (6.8) с (6.9), видим, что «ί = ^ j = l,2,...,n. (6.10) Таким образом, для нахождения г-й компоненты решения уравнения Ах = Ь с невырожденной квадратной матрицей А следует: 1) в матрице А заменить г-й столбец вектором Ь; 2) вычислить определитель новой матрицы; 3) разделить найденный определитель на определитель матрицы А.
194 Глава 6. Пространства с операторами Формулы (6.10) называются формулами Крамера. Вычисление определителей даже для матриц относительно небольших порядков достаточно трудоемкая задача. Поэтому формулы Крамера имеют более теоретическое, нежели прикладное значение. 6.4· Инвариантные подпространства 1* Циклические подпространства. Будем рассматривать п- мерное линейное пространство V над полем ¥ вместе с определенным на этом пространстве линейным оператором А : V —► V. Подпространство U С V называется инвариантным относительно оператора А7 если A(V) С ILL Если ν е КегД, то Α(ν) = 0 £ Кег*4. Следовательно, ядро оператора является его инвариантным пространством. Так как Α(ν) 6 1гл*4 для любого г;, то образ оператора также будет его инвариантным пространством. Пусть ν — вектор из V* Найдем минимальное инвариантное подпространство U, содержащее v. Действуя на ν оператором Д, получим последовательность векторов г>, Α(ν),..., Αι{ν), Если в этой последовательности первые к векторов линейно независимы, а вектор Ak{v) является линейной комбинацией Ah{v) = ak-iAk-\v) +ak-2Ak-2{v) + · · -+a1A(v) + a0v (6.11) предыдущих, то векторы г>, Α(ν),... ,Ak~l(v) образуют базис инвариантного пространства, так как они линейно независимы и для любой линейной комбинации vov+v\A(v)-\ \-vk-iAk~l{v) этих векторов их образ Α(ν0ν + νιΑ(ν) Η h vk-iAk~x{v)) = = v0A(v) + viA2{v) + · · · + vk-2Ak~1(v)+vk-1Ak(v) = = v/c-i^ot; + (vq + vk-\ai)A{v) + (vi + vk-ia2)A2{v) + ... • · · + {vk_2 + vk-iak-i)Ak~l(v)) также является их линейной комбинацией. Вектор ν называется циклическим вектором, порождающим пространство U. Про-
6.4- Инвариантные подпространства 195 странство с циклическим вектором называется циклическим пространством. Пример 6,8. В примере 4.18 на с. 122 было построено поле F из 27 элементов — поле 2з[х]/(#3 + 2х + 1) вычетов по модулю неприводимого над Z3 многочлена х3 + 2х + L Нетрудно показать, что элементы f(x) этого поля составляют трехмерное линейное пространство V над полем Z3 с базисом 1,#, я2, а отображение А : f(x) —> xf(x) будет линейным оператором. Так как Л(1) = х, А(х) = х2 и *Д(х2) = χ + 2, то V с действующим на нем оператором А будет циклическим пространством, порожденным циклическим вектором 1. D В циклическом пространстве U с циклическим вектором и, для которого справедливо (6Л1), матрицей оператора А в базисе V = {г, Α{ν),..., Ак~г{у)} будет матрица /О 0 ··· 0 а0 \ Av = О О 1 о о о αϊ α2 (6Λ2) \0 0 ... 1 αΑ_ι/ В справедливости (6.12) легко убедиться, последовательно умножив матрицу Ау на базисные векторы-столбцы: ι; = (1,0,0,...,0,0), Д(17) = (0,1,0,...,0,0), д*-1^) = (о,о, о,..., ο,ΐ). Далее будем рассматривать многочлены из F[i], в которые вместо переменной t будем подставлять оператор А Легко видеть, что значение f(A) многочлена /(f) на операторе А также будет линейным оператором. Так как степени любого оператора А коммутируют, АтАп = Ат+п = АпАт, то нетрудно показать, что коммутирует и произведение произвольных многочленов /(ί) и Λ(ί), т.е. что выполняется равенство f(A)h(A) = h(A)f(A). (6.13)
196 Глава 6. Пространства с операторами Действительно, если /(<) = / · tk, где / е F, то равенство (6.13) очевидно: fAk{hnAn + · · · + />о£) = fAkhnAn + · · · + fAkhoS = = hnAnfAk + · · · + hQ£fAk = (hnAn + · · · + hQS)fAk. Теперь для произвольного /(f) имеем (fmAm + ■■■ + f0S)h(A) = fmAmh(A) + ■■■ + f0£h(A) = = h(A)fmAm + ■■■ + h(A)f0£ = h(A)(fmAm + ■■■ + fQS). Равенство (6.13) доказано. Отметим еще одно простое свойство рассматриваемых многочленов: если пространство U инвариантно относительно оператора Д, то оно также инвариантно и относительно оператора f{A) при любом многочлене /. 2. Аннуляторы и минимальные многочлены векторов. Ненулевой многочлен f(t) называется апнулятором вектора ν (говорим, что f(t) аннулирует и), если f(A)(ν) = О· Из (6.11) следует, что многочлен tk — dk-\tk~l a\t — αο будет аннуля- тором вектора v. Отметим, что аннулятор вектора ν аннулирует и вектор Α(ν). Нормированный аннулятор вектора и минимальной степени называется минимальным многочленом этого вектора. Так как в конечномерном пространстве любой ненулевой вектор порождает циклическое подпространство, то в силу предыдущих рассуждений у каждого вектора найдется минимальный многочлен. Более того, справедливо следующее утверждение. Лемма 6*4, В конечномерном пространстве каждый вектор обладает единственным минимальным многочленом. Доказательство. Существование минимального многочлена показано выше. Допустим, что у некоторого вектора и есть два различных минимальных многочлена / и h. Тогда разность / — h этих многочленов будет ненулевым многочленом меньшей степени, который аннулирует вектор и. Противоречие. Лемма доказана.
6.4- Инвариантные подпространства 197 Лемма 6.5. Минимальный многочлен вектора и делит каждый аннулятор этого вектора. Доказательство. Допустим, что минимальный многочлен т вектора и не делит его аннулятор /. Тогда, разделив с остатком / на га, видим, что f(A)(u) = q(A)(m(A)(u)) + r(A)(u) = = q(A)(0)+r(A)(u)=r(A)(u) = Oy где степень г меньше степени т и г аннулирует и. Противоречие. Лемма доказана. Лемма 6.6. Если взаимно простые многочлены ρ и q одновременно аннулируют вектор и7 то и — нулевой вектор. Доказательство. Из взаимной простоты ρ и q следует существование таких / и /ι, что 1 = f(t)p(t) + h(t)q(t). Тогда £(u) = (f(A)p(A)+h(A)q(A))(u) = = f(A)(p(A)(u)) + h(A)(q(A)(u)) = =/(A)(0)+h(A)(0) = 0, т. е. и = 0. Лемма доказана. Лемма 6.7. Если произведение р\Р2 взаимно простых многочленов р\ и р2 аннулирует вектор и, то и молено представить в виде суммы Ui + 112, где многочлен р\ аннулирует вектор и\, а многочлен р2 — вектор U2- Доказательство. Существуют такие многочлены qi и (^ что 1 = q\{t)pi{t) + q2(t)p2(t). Тогда и = qi(A)pi(A)(u) + q2(A)p2(A)(u) и в силу предыдущей леммы р2(А)ЫА)Р1(А)(и)) = д1(А)(р1(Л)Р2(А)(и)) = Я1(А)(0) = 0, Р1(А)ЫА)Р2(А)(и)) = 92(Л)(Р1(Л)р2(Л)(«)) = q2(A)(0) = 0. Положим и\ = q2{A)p2{A)(u) и и2 = q\(A)p\(A)(u). Лемма до- казан а.
198 Глава 6. Пространства с операторами Покажем, что имеет место и «обратное» утверждение. Лемма 6,8. Если минимальный многочлен р\ вектора и\ и минимальный многочлен р2 вектора и2 взаимно просты^ то произведение р\р2 будет минимальным многочленом суммы U\ + 1/2· Доказательство. Пусть q — минимальный многочлен суммы «ι +1/2- Тогда О =Piq(A)(ui +i/2) = qpi{A){ui) + p\q{A){u2) = = q(A){Pl{A)(ui)) +PiQ(A)(u2) = = q(A)(0) +piq(A)(u2)=piq(A)(u2). Следовательно, р2 делит произведение p\q и поэтому в силу взаимной простоты р\ и р2 делит q. Аналогично устанавливается делимость q на р\. Так как q — многочлен минимальной степени, делящийся на взаимно простые pi и р2, то q = р\р2. Лемма доказана. Индукцией по числу взаимно простых многочленов нетрудно установить справедливость следующих обобщений лемм 6*7 и 6.8. Лемма 6.9. Если произведение ΠίϋιΡ* взаимно простых многочленов р^ аннулирует вектор ι/, то и можно представить в виде суммы Σ^α1^, 6 которой многочлен pi аннулирует вектор щ. Лемма 6.10. Если минимальные многочлены pi векторов щ взаимно просты, г = 1, ...,т, то произведение ΠϋιΛ будет минимальным многочленом суммы J^Li1^· 3. Аннуляторы и минимальные многочлены пространств. Ненулевой многочлен / называется аннулятором пространства U относительно действующего на нем оператора *4, а также аннулятором оператора А на пространстве U, если / аннулирует все векторы этого пространства. Нормированный аннулятор
6.4- Инвариантные подпространства 199 пространства U минимальной степени называется минимальным многочленом этого пространства или минимальным многочленом оператора Л на пространстве U. Из доказательства леммы 6.4 легко следует единственность минимального многочлена любого конечномерного пространства, а из доказательства леммы 6.5 — делимость всех аннуляторов пространства на его минимальный многочлен. Нетрудно видеть, что минимальный многочлен любого конечномерного пространства должен делиться на минимальный многочлен каждого вектора пространства и поэтому будет наименьшим общим кратным минимальных многочленов векторов произвольного базиса этого пространства. Отсюда легко следует, что минимальный многочлен циклического пространства равен минимальному многочлену его циклического вектора, а минимальный многочлен любого подпространства делит минимальный многочлен всего пространства. Будем говорить, что пространство V является суммой V = — YllLi Ui своих подпространств Ui,... ,Um, если каждый вектор ν из V можно представить в виде суммы v = ui + ---+um (6.14) векторов и\ € Ui,...,!^ € Um. Если каждый вектор ν из V представляется в виде суммы (6.14) единственным образом, то говорят, что пространство V разлагается в прямую сумму V = Ф^Юг своих подпространств Ui,...,Um. Из единственности представления (6.14) следует, что объединение базисов } прямых слагаемых Ui будет базисом V пространства V. Отметим следующий простой, но важный факт: если все прямые слагаемые Ui являются инвариантными подпространствами, то матрица Ау оператора Л в базисе V будет иметь блочно-диагональный вид /Αχ 0 · · · О \ О А2 ··· О Ау = (6.15) \0 О -Аш) где Αχ,..., Aw — матрицы оператора Л на инвариантных пространствах Ui,..., Urn в базисах Ui,..., Um. Такое представле-
200 Глава 6. Пространства с операторами ние оператора А в базисе V позволяет сводить изучение оператора А на пространстве V к нескольким более простым задачам — изучению этого оператора на пространствах Uj меньшей размерности. В связи с этим выясним, при каких условиях пространство с оператором разлагается в прямую сумму своих инвариантных подпространств. Оказывается, такое разложение тесно связано с видом минимального многочлена пространства. В частности, из перечисленных выше свойств минимальных многочленов следует, что минимальный многочлен прямой суммы подпространств равен наименьшему общему кратному минимальных многочленов прямых слагаемых. Имеет место и «обратное» утверждение. Теорема 6.4. Пусть Π™ ι Pi ~ разложение на взаимно простые множители минимального многочлена ρ пространства U с оператором А. Тогда U единственным с точностью до порядка слагаемых образом разлагается в прямую сумму ф™^ U;, где Vi — инвариантное подпространство с минимальным многочленом pi. Доказательство. В силу леммы 6.9 каждый вектор и пространства U можно представить в виде суммы и = ui -\ Ь Щ Η Ь «ш, (6.16) в которой многочлен pi аннулирует вектор щ. Очевидно, что для каждого г = 1, 2,..., т вектор Ui лежит в ядре оператора Рг(А), ядро является инвариантным пространством и его минимальным многочленом будет делитель многочлена pi. Покажем, что представление (6.16) единственно для каждого и из U· Для этого достаточно установить, что любая сумма (6.16), в которой не все слагаемые нулевые, не равна нулевому вектору. Предположим, что это не так и такая сумма uh + V Щк = 0 из к ненулевых векторов нашлась. Тогда минимальным многочленом такой суммы, с одной стороны, будет тождественная единица, а с другой — произведение минимальных многочленов векторов щ0 (в силу леммы 6.10). Полученное противоречие доказывает единственность представления (6.16),
6.4- Инвариантные подпространства 201 из которого в свою очередь немедленно следует разложение U в прямую сумму ф^КегРг{А). Единственность установленного разложения следует из однозначности определения ядер операторов Pi(A). Теперь заметим, что pi аннулирует пространство Kerpi(A) и поэтому обязан быть минимальным многочленом Шг этого пространства, так как в противном случае делитель Шг Ylj^iPj многочлена Π?1ι Pj будет аннулятором пространства U. Теорема до- казан а» Пространство с минимальным многочленом равным степени неприводимого многочлена называется примарным пространством. Теорема 6.4 утверждает, что каждое пространство однозначно раскладывается в прямую сумму своих инвариантных примарных подпространств. В свою очередь каждое примарное пространство можно представить в виде прямой суммы примарных циклических пространств, и в общем случае такое представление не единственно. Теорема 6.5, Примарное пространство можно представить в виде прямой суммы примарных циклических подпространств. Доказательство. Теорему докажем индукцией по размерности пространства. В основание индукции положим одномерные пространства, для которых утверждение теоремы тривиально. Допустим, что теорема справедлива для каждого примарно- го пространства размерности не больше η — 1. Пусть ρ — неприводимый многочлен степени г. В примар- ном пространстве V размерности η с минимальным многочленом рт найдем вектор xii, минимальный многочлен которого совпадает с минимальным многочленом рт пространства V, τ е. рш{А){и\) = 0 и рш~1{А){и\) ^ 0. Пусть Ui — порожденное этим вектором примарное циклическое подпространство в V. Если Ui = V, то V — циклическое пространство, и в этом случае теорема доказана. Пусть теперь Ui не совпадает с V. По предположению индукции, фактор-пространство V пространства V по подпростран-
202 Глава 6. Пространства с операторами ству Ui можно представить в виде прямой суммы Φί=2 U* при- марных циклических подпространств. Будем полагать, что для каждого г € {2,..., fc} подпространство Vi порождается циклическим вектором ι/ί + Ui и их минимальный многочлен (вектора и подпространства) равен рт% где rrii < т. Так как degp = г, то dimU-ί = ηΐΐΤ. Покажем, что в каждом смежном классе U* найдется вектор щ + v^ где Vi G Ui, минимальный многочлен которого также равен pWi. Так как pmi{A){u\) e Ui, то этот вектор является линейной комбинацией векторов А*(и{) и поэтому найдется такой многочлен /i, что pmi(A){v,i) = fi(A)(u\). Из равенства prn~rniprni{A){u\) = 0, следует, что многочлен рт_ш* аннулирует вектор fi(A)(ui). Поэтому многочлен /; должен делиться на рт% т.е. его можно представить в виде произведения fi = pm*/i. Положим ν^ = — fi(A)(u\). Тогда рт'(А)(щ + Vi) = рт'(А)Ы + pmi(A)(vi) = = /<Μ)(«ι) +рт'М)(-ЛИ)(«1)) = = МА)(иг) - МА)(иг) = Q. Таким образом, pmi аннулирует вектор щ +1?^ Теперь убедимся в том, что рт* будет минимальным многочленом этого вектора. Если это не так, то из равенства рт*~1(А)(щ + Vi) = 0 легко следует, что рШ1~1{А){щ + ν) Ε ϋχ для любого t; из Ui. Но в этом случае многочлен рш*-1 аннулирует подпространство Ui, что противоречит минимальности многочлена pmi для U*. Таким образом, каждый вектор щ +Vi порождает в пространстве V инвариантное циклическое подпространство Ui размерности ТПгГ. По предположению индукции, каждый элемент фактор-пространства V однозначно представляется в виде суммы (tt2+Ui) + + · ♦ ♦ + (иь + Ui) векторов подпространств U2,..., U&. Отсюда легко следует, что каждый вектор w из V можно представить в виде сумы векторов Wi из и*. Поэтому для доказательства теоремы достаточно показать, что для любых одновременно неравных нулю векторов Wi G Ui сумма Σ*=ι Wi не Равна нулевому
6.4- Инвариантные подпространства 203 вектору. Действительно, если ^i=iwi — О, то из предположения индукции и равенств к к к 53(u>i + Ui) = ^ti>i + ^Ui = -ti>i+Ui =Ui i—2 i=2 i=2 следует, что все W{ равны нулю. Теорема доказана. Объединяя теоремы 6.4 и 6.5, видим, что справедливо следующее утверждение. Теорема 6.6. Пространство с действующим на нем оператором можно представить в виде прямой суммы примарных циклических подпространств. 4. Теорема Гамильтона — Кэли. Рассмотрим вопрос о нахождении инвариантных примарных подпространств в пространствах с операторами. Пусть в пространстве V с базисом νχ,..., νη действует оператор Л с матрицей А. Прежде всего заметим, если / — минимальный многочлен оператора А, то матрица А будет корнем /, и этот многочлен можно назвать минимальным многочленом матрицы А. Поэтому если минимальный многочлен / = ΠΙΊιΡ'Μ гДе iPuVj) — 1) известен, то в соответствии с теоремой 6.4 для нахождения инвариантных пространств U; достаточно найти ортогональные пространства матриц Ρί(Α). Таким образом, задачу нахождения инвариантных примарных подпространств в общем случае можно свести к нахождению минимального многочлена пространства и разложению этого многочлена на взаимно простые множители. Найти минимальный многочлен можно с помощью алгоритма, рассматриваемого в двух следующих примерах. Пример 6.9. Пусть в трехмерном пространстве V над полем /2 1 0\ Z3 действует оператор Л с матрицей А = I 0 2 0 1. Найдем \0 0 2/ минимальный многочлен пространства V. Так как степень минимального многочлена циклического пространства равна размерности пространства, то в силу теоремы 6.6 степень минимального многочлена любого пространства не превосходит его
204 Глава 6. Пространства с операторами размерности. Поэтому минимальный многочлен пространства V будем искать в виде многочлена ао -\-a\t + a,2t2 + a^t3 с неизвестными коэффициентами а^ Так как этот многочлен аннулирует матрицу А, А2 = А3 = то справедливо матричное равенство Ί 1 + + а3 которое, очевидно, эквивалентно системе из девяти линейных уравнений 2 0 0\ 0 2 0 = 0 0 2/ /0 0 0 = 000 000 /1 2 1 2\ 0 110 0 0 0 0 ^12 12^ /а0\ αϊ а2 W = /о\ 0 0 W (6.17) Нетрудно видеть, что для матрицы из системы (6.17) справедливы эквивалентности /1 2 1 0 1 1 0 0 0 0 2\ 0 /1 2 1 2\ /1 0 2 2\ ^о ι ι ο) ~ \ο ι ι о) · \1 2 1 2/ Поэтому фундаментальная система решений системы (6.17) состоит из векторов (12 10) и (1 0 01), соответствующих многочленам l+2t + t2 и 1 + ί3, первый из которых и будет минимальным многочленом оператора Л. Π
6.4- Инвариантные подпространства 205 Пример 6*10* Пусть в трехмерном пространстве V над по- /1 1 0> лем Zs действует оператор Л с матрицей А = I 0 1 2 \0 0 2; Найдем минимальный многочлен my(t) пространства V. Минимальный многочлен будем искать как наименьшее общее кратное минимальных многочленов стандартного базиса этого пространства. Пусть mv(t) = αο + a\t + a,2t2 + аз*8. Тогда матрица ray (A) = αοΕ + αϊ А + агА2 + аз А3 аннулирует пространство V и, в частности, вектор (10 0) этого пространства. Подставляя А3 = в ту (А) и умножая получившуюся матрицу на вектор (100), видим, что Последнее равенство эквивалентно уравнению Ί 1 1 V 0 0 0 0 ,0 0 0 0; αϊ α2 w 0 0 W ,0) фундаментальная система решений которого состоит из векторов (2100), (2 010) и (2 001), соответствующих многочленам 2 + ί, 2 + ί2 и 2 + ί3, первый из которых будет минимальным многочленом оператора вектора (100). Выполнив аналогичные вычисления для векторов (010) и (001), найдем их минимальные многочлены l + t + t2nl + t.
206 Глава 6. Пространства с операторами Таким образом, την(ί) = НОК(2 + t, 1 +1 +12,1 + t) = = (1 +t + t2)(l + t) = (t - l)2(t - 2). Π Если в двух рассмотренных выше примерах продолжить вычисления и найти инвариантные подпространства, то окажется, что в обоих пространствах есть одномерные инвариантные подпространства. В первом примере такое подпространство задается вектором (00 1), а во втором — вектором (111). Нахождение одномерных инвариантных подпространств — важная практическая задача1^. Поэтому рассмотрим ее подробнее. Найдем одномерные инвариантные подпространства (в том случае, когда такие подпространства существуют). Если U — одномерное инвариантное подпространство, то оно состоит из всех векторов вида αϊ/, где и — некоторый вектор из V, а а — произвольный элемент поля F. Очевидно, что Л(и) = Хи для некоторого λ из поля F. Вектор и называется собственным вектором оператора *4, а элемент λ — собственным значением этого оператора, отвечающим собственному вектору и. Так как (АЕ - А)и = ХЕи - Аи = Хи - Хи = 0, (6.18) то вектор и лежит в ортогональном пространстве матрицы АЕ — А, и, следовательно, эта матрица вырождена, а ее определитель det (АЕ — А) равен нулю. Если ί — независимая переменная, то определитель det (ίΕ — А) будет элементом кольца F[i], корни которого в силу равенства (6.18) будут собственными значениями оператора А Многочлен det (ίΕ — А) называется характеристическим многочленом матрицы А, а так как определитель матрицы оператора не зависит от выбора базиса (см. (5.24)), то многочлен det (ίΕ — А) также называется характеристическим многочленом оператора А Вычислив корни Хг характеристического уравнения и найдя ортогональные пространства матриц А^Е — А, можно найти все одномерные инвариантные пространства. ^Особое значение она имеет в пространствах над полями комплексных и действительных чисел.
6.4- Инвариантные подпространства 207 Пример 6.11. Рассмотрим двумерное пространство над полем Z3. Пусть в этом пространстве зафиксирован базис Ε = /2 Г = {^ι,β2} и действует оператор Л с матрицей А = ( выбранном базисе. Тогда его характеристический многочлен <4(ί?Η$)-4ν ,!.)-<<-'*-*> имеет два корня λχ = 1 и λ2 = 2. Так как λ-Ε-Α=(ο ο)" λ2Ε"Α=(ο I то у оператора Л в базисе Ε будет два собственных вектора: 1/1 = (1 2) с собственным значением 1, и и^ = (10) с собственным значением 2. Легко видеть, что двучлен t — 1 будет минимальным многочленом вектора t/i, а двучлен t — 2 — минимальным многочленом вектора 1/2 · Поэтому в силу леммы 6*8 характеристический многочлен (t — 1)(ί — 2) будет и минимальным многочленом Л. Матрицей оператора Л в базисе U = {1/1,1/2} будет диагональная матрица Ац = ( п 0 ) · Так как (Α«-Ε><Α"-2Ε>=(ϋ ?)(2 ο)=°· то матрица А<у будет корнем своего характеристического многочлена. D Пример 6.12. Рассмотрим трехмерное линейное пространство V из примера 6.8. Это пространство состоит из элементов поля Zs[x]/(xs + 2х + 1), и на нем действует линейный оператор Л умножения на х. Нетрудно видеть, что Л(1) = х, Л2(1) = х2 и ^43(1) = Л(х2) = χ + 2. Поэтому (<3 + 2t + 1)СА)(1) = Л8(1) + 2.4(1) + 5(1) = 0.
208 Глава 6. Пространства с операторами Следовательно, многочлен ί8 + 2ί + 1 аннулирует вектор 1. Далее видим, что (i3 + 2t + ί)(Λ)(χ) = (t3 + 2t + 1)CA)(.A(1)) = = ί(ί3 + 2ί + 1)(Λ)(1) = 0, (ί3 + 2t + 1)(Λ)(χ2) = (t3 + 2t+ 1)04)042(1)) = = ί2(ί8 + 2ί + 1)(Λ)(1)=0, т.е. ί8 + 2ί + 1 аннулирует базис {Ι,χ,χ2} пространства V и, следовательно, все V. Так как многочлен t3 + 2ί +1 неприводим, то он будет минимальным многочленом V. В соответствии с (6.12) матрицей Ау оператора Л в базисе V из векторов-столбцов 1 = (100),# = (010), х2 = (001) будет мат- /0 0 2\ рица I 1 0 1 I , и, следовательно, эта матрица будет корнем \о ι о/ многочлена <3 + 21 + L Вычисляя характеристический многочлен det (ίΕ - Αν) = det матрицы Ау, видим, что он совпадает с минимальным многочленом А, и поэтому матрица Ау будет корнем своего характеристического многочлена. □ В двух последних примерах минимальные и характеристические многочлены совпадали. В n-мерном пространстве тождественный оператор £ с характеристическим многочленом (t—l)n и минимальным многочленом ί — 1 показывает, что эти многочлены совпадают не всегда. В общем случае характеристический многочлен делится на минимальный. Это следует из доказываемой далее теоремы Гамильтона — Кэли. Теорема 6,7 (Гамильтон — Кэли). Минимальный многочлен линейного оператора делит его характеристический многочлен.
6.4- Инвариантные подпространства 209 Доказательство. В силу теорем 6.4 и 6.5 пространство V с действующим на нем оператором А можно представить в виде прямой суммы Ф^! Ui инвариантных примарных циклических подпространств U*. Из (6.15) следует существование базиса V, в котором матрица оператора А будет иметь блочно- диагональный вид: ^v /Αχ Ο О А2 V О О О aw/ где Ai,...,Am — матрицы этого оператора на инвариантных пространствах Ui,... ,Um· Следовательно, определитель det (ίΕ - Av) = det /ίΕ -Αι 0 0 ίΕ - А2 V О О О О \ ίΕ - Ато/ будет характеристическим многочленом /д оператора А. Из последнего равенства немедленно следует, что fA(t) = det (ίΕ - Ay) = Ц det (ίΕ - A*). (6.19) ί=1 Покажем, что характеристический многочлен / оператора А на каждом циклическом подпространстве U равен минимальному многочлену этого подпространства. Пусть ν — циклический вектор в U. Допустим, что векторы ν,Α(ν),..., Ak~1(v) линейно независимы и Α* (ν) = ak_iAk [{v) + ак_2Ак 2{v) + · · · + a\A{v) + a0v. Тогда m(t) = tk - ак-\1к~1 - α*_2ίΑ~2 - * · · - a\t - ao — минимальный многочлен U. Возьмем матрицу оператора А в базисе
210 Глава 6. Пространства с операторами vy Λ{ν)}..., Α (ν) и найдем характеристический многочлен /t /(f) = det (<E - А) = det 0 -1 ί О -1 V О О О О О -αϊ -02 -1 t-dk-i/ Для вычисления определителя к его первой строке прибавим вторую, умноженную на ί, затем третью, умноженную на ί2, и т. д. В конце прибавим последнюю строку, умноженную на tk~l. В результате получим определитель /0 det 0 -1 t 0 -1 о о о m(i) \ -αϊ -а2 \0 0 ··· -1 i-Ofc_i/ раскладывая который по первой строке видим, что f(t) = (-l)k+1(-l)k-1rn(t) = m(t). Таким образом, если гад — минимальный многочлен Л на пространстве V, Шг — минимальный многочлен подпространства Ui, то из свойств минимальных многочленов и (6.19) следуют равенства гад = НОК(шь ..., mm), /д = mi χ ... χ mm, из которых в свою очередь легко следует делимость /д на гад. Теорема доказана. Теорему Гамильтона — Кэли можно переформулировать в терминах матриц и их характеристических многочленов. Нетрудно видеть, что на этом языке она превращается в следующее утверждение. Теорема 6.8 (Гамильтон — Кэли). Каждая квадратная матрица является корнем своего характеристического многочлена.
6.4- Инвариантные подпространства 211 Докажем теорему Гамильтона — Кэли еще раз. В новом прямом доказательстве не будем использовать теорему о разложении пространства в прямую сумму инвариантных примарных циклических подпространств. Вместо этого воспользуемся равенством (5.36), утверждающим, что произведение произвольной матрицы Μ и ее присоединенной матрицы Μ равно единичной матрице, умноженной на detM. Доказательство. Пусть А — квадратная матрица порядка η с элементами из поля F, ί — независимая переменная, В — присоединенная матрица матрицы ίΕ —А. Определитель матрицы ίΕ —А является многочленом п-й степени из F[i], а элементы матрицы В — минорами {п — 1)-го порядка матрицы ίΕ — А и, следовательно, многочленами (п — 1)-й степени H3F[i]. Поэтому det (ίΕ - А) = tn + dn-itn-1 + dn.2tn~2 + · · · + dii + do, В = Bn-itn~ + Bn-2tn~ + - · · + Βχί + Bo, где Bn_i, Bn_2,..., Βχ,Βο — матрицы с элементами из поля F. В силу равенства (5.36) Β(ίΕ - А) = (det (ίΕ - А))Е. Тогда (Βη-ιί"-1 + Βη_2ί"-2 + ... + Bit + B0)(tE - A) = = (tn + dn.xtn-1 + dn-2tn-2 + · · · + dit + do)E. Приравнивая коэффициенты при одинаковых степенях ί в правой и левой частях (6.20) приходим к равенствам Β^_ι = Е, В^_2 — Bn_iA = d^-iE, B^_3 — Bn_2A = drc_2E, B0-BiA = diE, -B0A = doE.
212 Глава 6. Пространства с операторами Умножив первое из этих равенств справа на А™, второе на Ап 1 и т.д., получим новые равенства В^А" = A", Bn_iA™ = dn- Bn_3An^ - B^_2An"1 = dn.2A Bn_2An — Βη_ιΑ™ = dn-iAn , n-2 ϋ лп-1_^ .Л п-2 B0A-BiA2 = d1A, -В0А = d0Ey сложив которые получим равенство О = An + dn-iAn~l + dn-2An-2 + · · · + diA + d0E, в правой части которого видим характеристический многочлен матрицы А, где вместо переменной t стоит сама матрица А. Теорема доказана. Дополним теорему Гамильтона — Кэли следующим простым утверждением. Лемма 6.11. Пусть Πί^ιΡ* > ΓΚιΡ/ — разложения на неприводимые множители характеристического и минимального многочленов оператора Л. Тогда Kerpv*(*4) = КегрдД) для каждого г. Доказательство. Если ki = U для каждого г, то утверждение леммы тривиально. Поэтому далее без ограничения общности будем полагать, что к\ > 1\. Если Кегр^(Д) φ Кегр^Д), то существует такой вектор ν, что его аннулирует р^1 и не аннулирует pi1. При га = 1 существование ν противоречит минимально- сти многочлена р^. При т > 1 ненулевой вектор и = Ρι(Λ)(ν) аннулируется двумя взаимно простыми многочленами р^~ λ и 112:2 Р/· Следовательно, в силу леммы 6.6 и = 0. Противоречие. Лемма доказана. Теорема Гамильтона — Кэли и лемма 6.11 показывают, что для нахождения инвариантных примарных подпространств не
6.4- Инвариантные подпространства 213 обязательно находить минимальный многочлен пространства. Вместо него можно воспользоваться характеристическим многочленом, который относительно легко вычисляется в пространствах небольшой размерности. Пример 6,13, Рассмотрим трехмерное пространство V над полем Z3. Пусть в этом пространстве зафиксирован базис Ε = /1 2 1> = {^ι, β2 ез} и действует оператор Л с матрицей А = I 0 2 2 \2 2 h в выбранном базисе. Тогда у его характеристического многочлена Н-1 1 2 \ det ( 0 ί - 2 1 = (t - l)2(t - 2) 1 1 ί-1/ есть корень λι = 1 кратности два и простой корень Аг = 2. Вычисляя (t — 1)2(А), видим, что /О 2 1\ /0 2 1\ /2 1 1\ (А - Е)2 = 0 1 2 0 1 2 = 1 2 2 I ~ (l 2 2) . \2 2 0/ \2 2 0/ \0 0 0/ Следовательно, столбцы ортогональной матрицы II 0 I об- \о ι/ разуют базис {ιΐι,ι^} двумерного инвариантного подпространства. Вычислив аналогичным образом <'-'><А>=Л-2Б=(о »|)~(i J!)' находим одномерное инвариантное подпространство, порожденное собственным вектором и% = (12 0). Так как Α«ι = 0 2 2 1 = 2 = 2 1 + 0 = 2«! + «2,
214 Глава 6. Пространства с операторами Аи2 = 0 2 20 = 2=21= 2и /2 2 0\ и Аг^з = 2ι/3, то матрица II 0 0 1 будет матрицей оператора \0 0 2/ Д в базисе {ui,U2,u$}. □ 5* Циклические пространства. Далее будем рассматривать циклические пространства и их минимальные многочлены. Из доказательства теоремы Гамильтона — Кэли следует, что степень минимального многочлена циклического пространства совпадает с его размерностью. Дадим простое независимое доказательство этого факта. Лемма 6.12. Если U — циклическое пространство, то степень его минимального многочлена равна его размерности. Доказательство. Пусть и — циклический вектор, порождающий U. Допустим, что степень минимального многочлена т пространства U меньше его размерности га, т.е. т(А) = αη-ιΛη~ι + ап-2Лп~2 Η + ахА + а0£. Тогда для каждого вектора из пространства U, в том числе и для циклического вектора к, справедливо равенство an-iAn~l{u) + ап-2Лп~2(и) + · · · + αχΛ(η) + а0и = О, из которого немедленно следует линейная зависимость векторов Ап~1(и))..., A{u)yU) что, очевидно, противоречит цикличности вектора ге. Следовательно, степень т равна га. Лемма доказана. Заметим, что степень минимального многочлена пространства не превосходит степени характеристического многочлена, и, следовательно, размерности пространства. В трех следующих леммах покажем, что верно обращение леммы 6*12 — пространство будет циклическим, если его размерность равна степени его минимального многочлена.
6.4- Инвариантные подпространства 215 Лемма 6.13. Если в пространстве V найдется такой вектор и, что степень его минимального многочлена равна размерности V, то и — циклический вектор и U — циклическое пространство. Доказательство. Пусть k = dimU и степень минимального многочлена и равна к. Если векторы иу А(и)у >.., Ак~1(и) линейно зависимы, то найдутся такие не равные одновременно нулю элементы αο, αϊ,..., ак-ъ что ak-iAk~l{u) + ак-2Ак~2{и) + · · · + αλΑ{η) + а0и = 0. (6.21) В этом случае {ak-itk~l + ak-2tk~2 + · · · + αιί + а0){А)(и) = О, τ е. многочлен степени меньшей к аннулирует вектор и. Противоречие. Следовательно векторы иуА(и)у... уАк~1(и) линейно независимы и U порождается вектором и. Лемма доказана. Лемма 6Л4. Если размерность примарного пространства U равна степени его минимального многочлена, то U — циклическое пространство. Доказательство. Пусть рк — минимальный многочлен HJ. В силу леммы 6.13 пространство V будет циклическим, если найдется такой вектор 1/, что его минимальным многочленом будет многочлен рк. Допустим, что такого вектора нет. Тогда из леммы 6.5 следует, что каждый вектор в U аннулируется многочленом рк~1, т.е. рк~1 будет аннулятором U. Противоречие. Лемма доказана. Лемма б Л 5. Если размерность пространства U равна степени его минимального многочлена, то U — циклическое пространство. Доказательство. Лемму докажем индукцией по размерности пространства. В основание индукции положим очевидный случай пространства единичной размерности. Предположим, что лемма верна для всех пространств размерности не
216 Глава 6. Пространства с операторами более п. Пусть ρ — минимальный многочлен (п + 1)-мерного пространства U. Если ρ является степенью неприводимого многочлена, то в силу леммы 6.14 пространство U будет циклическим. Если ρ разлагается в произведение р\р2 взаимно простых многочленов меньшей степени, то в силу теоремы 6.4 пространство U разлагается в прямую сумму подпространств Ui и U2, сумма размерностей которых равна η + 1 и, очевидно, совпадает с суммой степеней их минимальных многочленов р\ и р2> Так как степень минимального многочлена подпространства не превосходит его размерности, то degp; = dimU^ для г = 1,2. Поэтому из предположения индукции следует, что в Ui и U2 найдутся циклические векторы и\ и v>2 с минимальными многочленами р\ и р2* В свою очередь из леммы 6.10 следует, что минимальным многочленом суммы U\ + U2 будет произведение Ριί>2- А так как degpii>2 = dimU, то в силу леммы 6.13 вектор U\+U2 будет циклическим вектором в U. Лемма доказана. Объединяя утверждения лемм 6.12 и 6.15, получаем следующую полезную теорему. Теорема 6.9* Пусть Л — линейный оператор в конечномерном пространстве U. Пространство U будет циклическим относительно Л тогда и только тогда, когда его размерность равна степени его минимального многочлена. Нетрудно видеть, что утверждение теоремы 6.9 можно переформулировать следующим образом. Теорема 6.10. Пространство с оператором будет циклическим тогда и только тогда, когда его минимальный и характеристический многочлены совпадают. Пример 6.14. Вернемся к трехмерному пространству V с действующим на нем оператором Л из примера 6.13. Так как А(и{) = 2и\ +1/2, то подпространство (ι/χ,112) будет циклическим с циклическим вектором и\ и минимальным многочленом (ί — I)2. Поэтому V также будет циклическим пространством с циклическим вектором и\ + и% и минимальным многочленом (ί-1)2(ί-2). □
Задачи 217 Задачи 6.1. Найти все идеалы кольца верхнетреугольных матриц размера 2 χ 2 с элементами из: 1) Z; 2) Zp. 6.2. Доказать, что квадратные матрицы размера η χ η, в каждой строке и каждом столбце которых одна единица, а остальные элементы — нули, с операцией умножения образуют группу, изоморфную группе Sn. 6.3. Решить над полем Z5 систему уравнений /01321 2 2 0 14 3 0 2 4 3 ^43142 4\ 0 1 зУ 6*4. Решить систему уравнений над полем Zs[x]/(x2 -far + 2): (Зх + 2)α + (4а? -f Ι)β = 2χ -f 3, λ (2χ + 4)α + (За? -f 4)β = χ -f 4. ί 6.5. Даны матрицы над полем Ζ3: А = В = с = /2 1 о \2 1 2 Найти их определители и ранги. Найти присоединенные и обратные к ним матрицы (если они обратимы). Вычислить detC2015. Выяснить, коммутируют ли матрицы А и В. Решить матричное уравнение АХВ = В3. 6.6. Найти все целые решения уравнения: 1) 10а?1+2а?2+12а?з+8х4+14а?5 = 2; 2) 3χι+5α?2+7χ3+9^4+11^5 = 15. 6.7. Привести пример линейного оператора над полем Z3, ядром которого является линейная оболочка векторов 12011 и 21102. 6.8. Найти какой-либо базис пространства, ортогонального пространству V = (12011, 21102} С Щ. 6.9. Известно, что линейный оператор / над полем Z3 переводит векторы стандартного базиса β ι = 10000, ..., е$ = 00001 в векторы 121, 022, 221, 101, 212 соответственно. Найти ядро и образ оператора /. Найти образ вектора /(20112) и полный прообраз вектора 210.
218 Глава 6. Пространства с операторами 6.10. Пусть А — подмножество, не обязательно являющееся подпространством, в некотором линейном пространстве V. Будем называть множество 41 = {ж 6 V : а; 1 А}, состоящее из векторов, ортогональных каждому вектору из А, ортогональным к А. Является ли А1- подпространством в V? 6.11. Оценить сложность метода Гаусса (в худшем случае) для системы линейных уравнений с квадратной матрицей размера η χ п. 6.12. Показать, что линейный оператор невырожден тогда и только тогда, когда свободный член его минимального многочлена отличен от нуля. 6.13. Пусть многочлен pi аннулирует вектор viy г = 1,..., к. Показать, что многочлен ΗΟΚ(ρι,... ,рь) аннулирует любую линейную комбинацию векторов V\,..., υ^. 6.14. Оператор А действует в fc-мерном пространстве и имеет к собственных векторов vu ..., vk с попарно различными собственными значениями. Показать, что собственные векторы линейно независимы и в базисе υ ι,..., ν^ матрица оператора Л диагональна. 6.15. В пространстве Ζ| действует линейный оператор Л с мат- /2 0 1\ рицей 10 2 0 I . Указать два различных разложения Zf в прямую \0 0 2/ сумму циклических подпространств. 6Λ6. Пусть А — линейный оператор и f(t) — многочлен. Показать на примере, что инвариантное относительно оператора /(-4) пространство не обязательно инвариантно относительно А. Доказать, что пространство Ker f(A) инвариантно относительно А при любом f(t). 6.17. Доказать, что минимальный многочлен циклического пространства совпадает с минимальным многочленом его циклического вектора. 6.18. Пусть V — примарное циклическое пространство с минимальным многочленом рк. Найти все инвариантные подпространства в V. 6.19. Используя примеры 6.9 и 6.10, сформулировать и обосновать алгоритм вычисления минимального многочлена пространства. Оценить число операций над элементами поля, выполняемых при работе этого алгоритма. 6.20. Пусть Т> — оператор дифференцирования в пространстве V многочленов над R степени не выше трех. Показать, что этот оператор линейный. Найти его ранг, минимальный и характеристический
Задачи 219 многочлены. Разложить V в прямую сумму инвариантных примарных циклических подпространств. 6*21» Решить предыдущую задачу для оператора дифференцирования в пространстве многочленов над К степени не выше п. 6.22. Пусть Л — оператор умножения на χ в пространстве многочленов из Z2[x]/(x4 -f χ + 1). Показать, что этот оператор линейный. Найти его ранг, минимальный и характеристический многочлены. Разложить пространство в прямую сумму инвариантных примарных циклических подпространств. 6.23. Решить предыдущую задачу для оператора умножения на χ в пространстве многочленов из: 1) Ζ2[χ]/(χ5 +х2 + 1); 2) Z2[x]/(x5 + х3 + 1); 3) Z2[x]/(xn - 1). 6.24. Пусть оператор Л действует в пространстве многочленов над Z5 степени не выше четырех и отображает многочлен / в набор его остатков от деления на многочлены ее, χ -f 1, χ + 2, χ + 3. Будет ли этот оператор линейным? Если будет, то найти его ранг и ядро. 6.25. Пусть оператор Л : Ζ| —> Ζ| отображает коэффициенты многочлена / над Ζ5 степени не выше четырех в набор его остатков от деления на многочлены #, х + 1, χ + 2, χ + 3, χ + 4. Будет ли этот оператор линейным? Если будет, то найти его ранг, минимальный и характеристический многочлены. Разложить пространство Ζ| в прямую сумму инвариантных примарных циклических подпространств и выяснить, единственно ли полученное разложение. Указать базис пространства, в котором матрица оператора имеет наиболее простой вид. 6.26. Пусть степень минимального многочлена примарного пространства V равна его размерности. Доказать, что V нельзя представить в виде прямой суммы двух инвариантных подпространств.
Глава 7 Структура конечных групп В этой главе для произвольной конечной группы устанавливаются критерии существования в этой группе подгруппы данного порядка. Затем на основе полученных результатов показывается, что конечная группа является прямым произведением своих подгрупп специального вида. В конце главы подробно изучается структура мультипликативной группы кольца Zm. 7.1. Действие группы на множестве Будем говорить, что группа G действует на множестве X, если каждому элементу g группы G поставлено в соответствие взаимно однозначное отображение φ{ο) множества X в себя так, что (p{g\g2) = <£(#1)^(52) для любых д\ и #2 из G. Иначе говоря, группа G действует на множестве X, если определен гомоморфизм φ группы G в множество взаимно однозначных отображений множества X в себя. Рассматривая далее действие группы G на множестве X, будем опускать символ гомоморфизма и будем рассматривать элементы группы G непосредственно как преобразования множества X: результат действия элемента д группы G на элементе χ множества X будем обозначать через д(х). Пусть группа G действует на множестве X. Стабилизатором элемента Xq из X называется множество St(xo) = {j G £ G I g(xo) = xq}> Орбитой элемента Xo из Х называется множество Ог(#о) = {# € X | χ = <7(#ο)ϊ где 9 £ G}, число элементов орбиты называется ее длиной. Орбита единичной длины называется неподвижной {или стационарной^) точкой.
7.1. Действие группы на множестве 221 Пример 7Л. G — произвольная конечная группа, Η — ее подгруппа. Пусть подгруппа Η действует сдвигами на множестве элементов группы G, т.е. элемент h подгруппы Η преобразует элемент д группы G в произведение hg. В этом случае элементы группы G образуют |<7|/|Я| орбит, каждая из которых является смежным классом группы G по подгруппе Я, и для каждого д е G его стабилизатор состоит только из единичного элемента. D Пример 7.2, Рассмотрим действие сопряжениями подгруппы {(12)) группы 5з на множестве всех элементов этой группы. Напомним, что при сопряжениях элемент h подгруппы Я преобразует элемент д группы G в произведение hgh~l. Так как (12)(12)(12) = (12), (12)(13)(12) = (23), (12)(23)(12) = (13) (12)(123)(12) = (132), (12)(132)(12) = (123), (12)е(12) = е, то множество элементов группы 5з распадается на две неподвижные точки {е} и {(12)} и две двухэлементные орбиты {(13), (23)} и {(123), (132)}. Стабилизатором элементов е и (12) будет подгруппа ((12)), а стабилизаторы остальных элементов состоят из одного единичного элемента. □ Покажем, что при действии группы G на множестве X стабилизатор любого элемента χ является подгруппой в группе G. Для этого достаточно установить, что множество St(cc) замкнуто относительно групповой операции, единичный элемент группы G принадлежит St (ж) и вместе с любым элементом д £ St (о?) элемент д~1 также принадлежит St (ж). Замкнутость множества St(x) следует из того, что если д\ и #2 принадлежат St (ж), то 9т(х) = 9i(92(x)) = 9i(x) = х> и поэтому произведение д\д2 также принадлежит St (ж). Принадлежность единичного элемента группы G стабилизатору элемента χ очевидна, так как единичный элемент оставляет на месте все элементы множества X. Таким образом осталось показать, что если элемент д принадлежит стабилизатору #, то вместе с ним в стабилизаторе χ присутствует и его обратный элемент д~1.
222 Глава 7. Структура конечных групп Действительно, так как для любого χ £ X и любого д £ St(x) справедливы равенства χ = д~1д(х) = д~\д(х)) = д~\х), то р-1 £ St(x). Таким образом, St(χ) — подгруппа группы G. Теорема 7Л. Пусть конечная группа G действует на конечном множестве X. Тогда для любого χ из X \Ox{x)\-\$t{x)\ = \G\. Доказательство. Покажем, что длина орбиты произвольного элемента χ из X равна числу смежных классов группы G по подгруппе St(#). Для этого достаточно показать, что элементы из одного смежного класса переводят χ в один и тот же элемент множества X, а элементы из разных смежных классов — в разные элементы множества X. Если д\ и #2 лежат в одном и том же смежном классе группы G по подгруппе St(x), то #2 = 9isi гДе s ^ St (ж). Поэтому 92(х) = 9is(x) = 9i(s(x)) = gi(x), т. е. элементы из одного и того же смежного класса группы G по подгруппе St(#) отображают χ в один и тот же элемент множества X. Теперь покажем, что элементы из разных смежных классов группы G по подгруппе St(#) отображают χ в разные элементы множества X. Допустим, что д\{х) = </2(#), тогда х = 9Ϊ19\{χ) = 97l(9i(x)) = 9T1(92(x)) = fff1»^), и, следовательно, g~[lg2 £ St(#)* Но тогда в St(#) найдется такой элемент 5, что д<± = д\$ и поэтому д\ и д<± лежат в одном и том же смежном классе группы G по подгруппе St(x). Так как число смежных классов группы G по подгруппе St(#) равно |<7|/|St(a?)|? а длина орбиты элемента χ равна числу смежных классов группы G по подгруппе St (ж), то |Ог(ж)| · |St(cc)| = |G|. Теорема доказана.
7.1. Действие группы на множестве 223 Пример 7*3. Пусть G — произвольная конечная группа, {Щ} — множество всех ее подгрупп. Будем говорить, что группа G действует сопряжениями на {Щ}, если элемент д группы G преобразует подгруппу Η в дНд~1. Прежде всего заметим, что поскольку в каждой группе G для любых элементов hi, hj и h из ее подгруппы Η дЫд'1 · gh0g~l = ghihjg'1, дед'1 = е, ghg~l · gh~lg~l = е, то множество дНд~1 также будет подгруппой в G. Кроме того, если hi е Щ и £ Hj, то дЫд'1 е дЩд~1 и дЫд~х £gHjg~l, те. сопряжение элементом д является инъективным преобразованием конечного множества подгрупп группы G в себя, и, следовательно, является подстановкой на этом множестве. Таким образом, действие группы сопряжениями на множестве подгрупп определено корректно. Рассмотрим группу 5з и действие этой группы сопряжениями на множестве всех ее несобственных (отличных от {е} и самой группы) подгрупп. Таких подгрупп в 5з ровно четыре — три подгруппы #ι = {е,(12)}, Я2 = {е,(13)} и Я3 = {е,(23)} порядка два и одна подгруппа #4 = {в, (123), (132)} порядка три. Так как сопряжения оставляют единичный элемент на месте и (12) (12) (12) = (12), (13)(12)(13) = (23), (23)(12)(23) = (13) (12) (13) (12) = (23), (13)(13)(13) = (13), (23)(13)(23) = (12) (12)(23)(12) = (13), (13)(23)(13) = (12), (23)(23)(23) = (23), то легко видеть, что (12)^(12) = Нг, (13)tfi(13) = Я3, (23)^(23) = Я2 (12)Я2(12) = Я3, (13)Я2(13) = Я2, (23)Я2(23) = Щ (12)Я3(12) = Я2, (13)Я3(13) = Яь (23)Я3(23) = Я3. Откуда в свою очередь видно, что подгруппы Д]_, Η^ и Н% образуют орбиту длины три, а стабилизатором каждой подгруппы является сама подгруппа. Подгруппа Н\ является единственной подгруппой порядка три. Поэтому она образует самостоятельную орбиту, а ее стабилизатором будет вся группа 5з- □
224 Глава 7. Структура конечных групп Пример 7Л. Рассмотрим действие сопряжениями подгруппы Н\ на множестве нетривиальных подгрупп группы 5з- Из предыдущего примера видно, что это множество разбивается на две орбиты {Н\} и {Н^} единичной длины и одну орбиту длины два из подгрупп Я2 и Яз. Стабилизатором подгрупп Н\ и Щ будет подгруппа Н\, а стабилизатор подгрупп Ή.2 и 7?з состоит только из единичного элемента. D Нормализатором N(H) подгруппы Η группы G называется стабилизатор этой подгруппы при действии группы G сопряжениями на множестве своих подгрупп, т. е. N(H) = {geG\gHg-1CH}. Очевидно, что нормализатор является подгруппой группы G и подгруппа Η является нормальной подгруппой в своем нормализаторе. Центром Ζ группы G называется множество таких ее элементов, каждый из которых коммутирует со всеми элементами G, те. Z(G) = {zeG\gz = zg VgeG}. Легко видеть, что центр является коммутативной нормальной подгруппой группы G и состоит из неподвижных точек действия группы G сопряжениями на множестве ее элементов: Z{G) = {ζ £ G\gzg~l = ζ Уд £ G}. Неформально можно сказать, что размер центра является мерой «коммутативности» группы — чем больше центр, тем больше в группе коммутирующих элементов, например Z(G) = G для любой абелевой группы G. Элементы a, b группы G называются сопряженными, если они лежат в одной орбите при действии G на себя сопряжениями, те. если найдется такой элемент д 6 (?, что а = gbg~l. Элемент д в этом случае называется сопрягающим а с 6, а орбита — классом сопряженности. Нетрудно убедиться, что сопряженность является отношением эквивалентности на элементах группы G. Пример 7.5* Группа подстановок ^2 коммутативна, поэтому Z(S2) = <$2* Найдем центр некоммутативной группы 5з- В
7.1. Действие группы на множестве 225 примере 7.3 были вычислены произведения вида gzg для всех транспозиций д, ζ из 5з, откуда видно, что для любой транспозиции ζ найдется такая транспозиция д, что gzg~l φ ζ, т.е. gz ф zg. Иными словами, никакая транспозиция из 5з не коммутирует со всеми элементами группы. Легко видеть, что это верно и для циклов длины 3, например (12)(123)(12) = (132) φ (123). Таким образом, Z(Ss) = {e}. Из двух следующих примеров следует, что Z(Sn) = {е} при всех η ^ 3. □ Пример 7*6* Рассмотрим подстановку / = ghg~l, сопряженную в группе Sn с подстановкой /ι. Результат ее применения f(x) = g(h(g~1(x))) к элементу χ £ {Ι,.,.,η} можно представить коммутативной диаграммой, приведенной ниже на рисунке слева. Подобные диаграммы уже встречались нам ранее при ис- ghg г и -и ч х >ghg '(a?) Г1(х) h - hg l(x) д(у) * g(z) следовании композиции отображений (см. диаграмму на с. 15). Отображения д,Ь,,д~г являются биекциями, поэтому элементы у = д~1(х) и ζ = h(y) определяются по х, д и h однозначно. Перерисуем нашу диаграмму с использованием новых обозначений yyz и того факта, что равенство у = д~1(х) равносильно χ = д(у) (на рисунке справа). Пунктирное ребро соответствует подстановке д = (#_1)~\ обратной к д~г. Полученная на рисунке справа диаграмма также является коммутативной. Она показывает, что если подстановка h переводит элемент у в некоторый элемент ζ (не обязательно отличный от у), то подстановка ghg~l переводит элемент д(у) в g(z). Отсюда следует, что сопряженная подстановка ghg~l получается применением сопрягающей ее с h подстановки g ко всем числам из разложения подстановки h на независимые циклы.
226 Глава 7. Структура конечных групп Например, если д = (1234567) и ft = (12)(34)(567), то для нахождения разложения ghg~l на независимые циклы не обязательно искать подстановку д~х и находить ее композицию с дик: так как д(1) = 2, д(2) = 3, ..., д{7) = 1, то ghg~l = = (23)(45)(671). □ Пусть разложение подстановки д из симметрической группы Sn на независимые циклы состоит из кг циклов длины г, где г = = 1,..., η и fei + 2^2 + . ·. + пкп = п. Назовем упорядоченный набор tg = (fci, /ί2, ·.., fcn) типом подстановки р. Каждая транспозиция имеет тип (0,1, 0,..., 0), а тождественная подстановка является единственной подстановкой типа (п, 0,..., 0) в Sn. Подстановка д = (12)(345) £ S$ имеет тип (0,1,1,0, 0). Каждое из 5! произведений (iii2)(hUh)i где ij — попарно различные числа от 1 до 5, определяет некоторую подстановку ft того же типа, что и д. Так как {%\ΐ2) = {%2%\) и {%z4h) = (Uhfa) = (hisU), то име" ется всего 2-3 = 6 различных способов записи подстановки ft. Поэтому группа £5 содержит всего 5!/6 = 20 подстановок, тип которых совпадает с типом подстановки д. Аналогичные рассуждения позволяют получить общую формулу \{geSn:tg = (kuk2,..., кп)}\ = πη .fc... (7Л) 11г=0г *к*! для числа подстановок типа (&ι, &2,..., &?г) в Sn. Действительно, каждый цикл длины г может быть записан г способами независимо от остальных циклов той же длины, причем к{ независимых циклов одинаковой длины можно переставить к£ способами, не изменяя их произведения. Пример 7.7. Рассмотрим действие группы Sn сопряжениями на множестве всех своих элементов. Тогда стабилизатором St (ft) подстановки ft будет множество всех таких д из Sn, что ghg~l = = ft (что равносильно gh = ftp), т.е. множество всех подстановок, коммутирующих с ft. Орбита Or(ft) подстановки ft состоит из всех сопряженных с ней подстановок. Пример 7.6 показывает, что сопряженными в группе Sn могут быть только подстановки с одинаковой цикловой структу-
7.1. Действие группы на множестве 227 рой, т. е. подстановки одного типа. Более того, любые две подстановки одного типа действительно сопряжены, так как для любых двух упорядоченных наборов, состоящих из η различных чисел множества {1, 2,... , п}, найдется подстановка, переводящая один из них в другой. Например, последовательность 351462 является образом последовательности 123456 при подстановке д = (13)(4)(25б), поэтому ghg~l = (351)(462) = (135)(246) при h = (123)(456). Таким образом, орбита Or(/i) содержит все подстановки того же типа, что и h. Поэтому по теореме 7.1 с учетом (7.1) получаем, что число всех подстановок, коммутирующих с подстановкой h типа (Α?1,&2>.··>*η), РаВНО I п |St(/l)l = ]0^|=n^!· (7·2) Отсюда следует, что коммутировать с h будут все возможные произведения независимых циклов, входящих в ее разложение, и только они. Заметим также, что |Or(/i)| = 1 только когда подстановка h тождественная. Во всех остальных случаях выражение (7.2) строго меньше, чем тг!, поэтому h коммутирует не со всеми подстановками из Sn. Таким образом, число орбит (классов сопряженных элементов), на которые распадается группа Sn при действии сопряжением на своих элементах, равно числу различных типов подстановок, т. е. числу неотрицательных решений (k\, &2> · · · > кп) уравнения к\ +2&2 + · ·. + пкп = п. В частности, группа #4 состоит из пяти орбит: орбита тождественной подстановки с длиной 1, орбита подстановки (1)(2)(34) длины 4!/(2!-2) = 6, орбита подстановки (12) (34) длины 4!/(2!·22) = 3, орбита подстановки (1)(234) длины 4!/3 = 8 и орбита подстановки (1234) длины 4!/4 = 6. Π Пример 7.8* Покажем, что в каждой группе G порядка рп, где ρ — простое и η ^ 1, центр Z(G) будет нетривиальной {Z(G) Ф {е}) подгруппой. Для этого рассмотрим действие группы G сопряжениями на множестве ее элементов. При таком действии рп элементов группы распадаются на орбиты, сумма длин которых равна рп. Из теоремы 7.1 следует, что длины всех орбит
228 Глава 7. Структура конечных групп делят порядок группы и поэтому являются степенями р. Следовательно, число неподвижных точек (это число больше нуля, так как неподвижной точкой будет единичный элемент) кратно р, т. е. центр группы состоит не менее чем из ρ элементов. D Пример 7*9* Воспользуемся предыдущим примером и покажем, что любая группа G порядка р2 абелева. Каждая такая группа имеет нетривиальный центр Ζ, порядок которого равен либо р2, либо р. Если \Ζ\ = ρ2, то G совпадает со своим центром и является абелевой. Если же \Ζ\ = ρ, то фактор-группа G/Z будет циклической. Пусть αΖ — порождающий элемент этой фактор-группы. Тогда произвольный элемент группы G представляется в виде произведения akz, где ζ € Ζ и ар = е. В этом случае для любых ahZ\ и alZ2 из равенств akz\ · alZ2 = akalziZ2 = alahZ2Z\ = alZ2 * akzi следует перестановочность этих элементов и, следовательно, коммутативность всей группы G, что, очевидно, противоречит рассматриваемому случаю \Z\ = p. □ 7.2. Теоремы Силова Пусть группа G состоит из рпт элементов, где ρ — простое и (р?т) = 1. Подгруппа из рп элементов называется силовской р-подгруппой группы G. Теорема 7.2 (первая теорема Силова). Пусть группа G состоит из рпт элементов, где ρ — простое и (р,т) = 1. Тогда в G существует силовскал р-подгруппа. Доказательство. Рассмотрим множество М, состоящее из всех р^-элементных подмножеств группы G. Это множество состоит из /рпгп\ = γ;1 pnm-k \Рп ) Η Рп ~ k различных подмножеств. Покажем, что ни одна из дробей в правой части (7.3) не делится на р. Для этого заметим, что если
7.2. Теоремы Силова 229 числитель дроби р'TZ^ Делится на рг, то на рт обязательно делится и число к. В этом случае положим к = prkf, где к* на ρ не делится. Тогда рпш — к pnm — prkf pn~rm — kf рп-к ~ рп - ргк! ~ рп~г - к* ' и так как г < тг, то легко видеть, что рассматриваемая дробь действительно не делится на р. Следовательно не делится на ρ и произведение дробей — число элементов множества М. Теперь рассмотрим действие группы G на множестве М, при котором каждый элементу группы G преобразует подмножество {9и 92, ·.., дР*} в подмножество {gghдд2, ..., ддР»}. В результате такого действия группы G множество Μ разобьется на орбиты, сумма длин которых равна (ррТ)· Так как (?р™) не делится нар, то среди орбит обязательно найдется по крайней мере одна, число элементов в которой также не делится на р. Далее заметим, что каждая орбита множества Μ состоит не менее чем из m элементов. Это следует из того, что в объединении всех подмножеств, составляющих одну орбиту, обязательно присутствуют все элементы группы G, в то время как каждое подмножество состоит ровно из рп элементов. Наконец рассмотрим подмножество χ из М, длина орбиты которого не делится на р. В силу теоремы 7.1 для χ справедливо равенство \Ог(х)\ · \$t(x)\ = рпт. Так как в левой части этого равенства первый множитель не меньше т и при этом не делится на р, то второй множитель равен рп. Таким образом, стабилизатор подмножества χ состоит ровно из рп элементов и, следовательно, является искомой подгруппой группы G. Теорема доказана. Теорема 7*3 (вторая теорема Силова)* Пусть группа G состоит из рпт элементов, где ρ — простое и (р, т) = 1. Тогда все силовские р-подгруппы группы G сопряжены. Доказательство. Пусть группа G состоит из рпт элементов, где (р, га) = 1. Предположим, что 5 и Sf — две силовские
230 Глава 7. Структура конечных групп р-подгруппы группы G. Рассмотрим действие подгруппы S* на фактор-множестве G/S, при котором элемент д подгруппы Sf преобразует смежный класс {#ь#2>... ,#рп} в смежный класс {0fli,fl02,...,flflp«}. Порядок подгруппы S1 равен рп, поэтому в силу теоремы 7.1 длины всех орбит в G/S являются степенями числа р. Фактор-множество G/S состоит из т смежных классов, и так как т не делится нар, то среди орбит должна найтись хотя бы одна неподвижная точка (длина орбиты равна р° = 1). Пусть смежный класс aS является такой неподвижной точкой. Тогда gaS = aS для любого д из Sf. Домножив правую и левую части последнего равенства на а-1, получим, что gaSaT1 = aSa~l для любого д из S". Так как aSa~l является подгруппой группы G и умножение этой подгруппы на элементы S1 не выводит за пределы aSa-1, то Sf С α5α_1. Теперь, учитывая, что S и Sf имеют один и тот же порядок, заключаем, что Sf = aSa~l. Теорема доказана. Теорема 7Л (третья теорема Силова). Пусть группа G состоит из рпт элементов, где ρ — простое и {р,т) = 1. Тогда число силовских р-подгрупп группы G сравнимо с единицей по модулю р. Доказательство. Пусть Μ — множество всех силовских р-подгрупп группы G. Все силовские р-подгруппы группы G сопряжены в силу теоремы 7.3, и поэтому любую силовскую р-подгруппу S1 можно представить в виде aSa~l, где 5 — некоторая фиксированная силовская р-подгруппа, а а — элемент группы G. Рассмотрим действие подгруппы 5 на множестве М, при котором элемент а подгруппы S преобразует подгруппу S" = {</ι,02ϊ · ·· ,9рп} в сопряженную подгруппу aSfa~l = = {agia~l^ag2u~1y..^agpna~1}. Покажем, что при таком действии в Μ существует единственная неподвижная точка — подгруппа S. Допустим, что некоторая подгруппа Sf является неподвижной точкой рассматриваемого действия. Тогда gS'g~l С Sf для любого g £ S. Следовательно, подгруппа S содержится в нормализаторе подгруппы Sf> Очевидно, что и подгруппа Sf также содержится в своем нормализаторе. Поэтому S и S1 являются
7.2. Теоремы Силова 231 силовскими р-подгруппами нормализатора подгруппы 5;, и, следовательно, эти подгруппы сопряжены в силу теоремы 7.3, т.е. в нормализаторе 5' найдется такой элемент а, что aS!a~x = 5. Теперь заметим, что S* — нормальная подгруппа в своем нормализаторе, те. gSfg~l = Sf для любого элемента д из нормализатора S", в том числе и для элемента а из предыдущего равенства. Таким образом, из двух последних равенств заключаем, что 5 = S*. Следовательно, при рассматриваемом действии подгруппы S на множестве Μ в этом множестве существует единственная неподвижная точка — подгруппа S. Порядок подгруппы 5 равен рп, и поэтому в силу теоремы 7.1 длины всех орбит в Μ являются степенями числа р. Так как среди этих орбит есть только одна орбита длины р° = 1, то число элементов в Μ сравнимо с единицей по модулю р. Теорема доказана. Теорема 7.5* Пусть группа G состоит из рпт элементов, где ρ — простое и (р, га) = 1. Число силовских р-подгрупп группы G делит порядок этой группы. Доказательство. Рассмотрим действие группы G сопряжениями на множестве всех ее силовских р-подгрупп. Так как все силовские р-подгруппы сопряжены, то все они попадают в одну орбиту, длина которой в силу теоремы 7.1 является делителем порядка группы G. Таким образом, число силовских р-подгрупп является делителем порядка группы. Теорема доказана. Пример 7Л0. Рассмотрим группу G из 15 элементов. Из первой теоремы Силова следует, что в этой группе есть подгруппы из трех и пяти элементов. Так как три и пять — простые числа, то все эти подгруппы будут циклическими. Из третьей теоремы Силова следует, что количество трехэлементных подгрупп равно одному из чисел 1,4, 7, 10, 13 и при этом в силу теоремы 7.5 делит 15, т.е. совпадает с одним из чисел 1, 3, 5. Очевидно, что в G есть ровно одна подгруппа А = (а) порядка три. Аналогичным образом можно показать, что в G содержится ровно одна подгруппа В = (Ь) порядка пять. Из второй теоремы Силова следует, что эти подгруппы нормальные. Так как порядки
232 Глава 7. Структура конечных групп подгрупп А и В взаимно просты, то эти подгруппы пересекаются только по единичному элементу. Покажем, что элементы таких подгрупп А и В коммутируют. Так как akbma~k = bs и bma-kb-m = а\ то ak+t = ak(bma-kb-m) = (akbma-k)b-m = bs~m =ϊ => akbma-kb-m = e => akbm = bmak. Поэтому, начиная с тривиального тождества (ab)1 = α1^1 и предполагая справедливость равенства (ab)k~l = ak~1bk~i) из цепочки равенств (ab)k = {ab)k~lab = ak~lbk~lab = ак~1аЬк~1Ь = akbk индукцией по к заключаем, что (ab)k = akbk. Следовательно, (ab)3 = а3Ъ3 = б3 φ е и (ab)5 = а565 = а2 φ е. Произведение ab φ е лежит в группе из 15 элементов, и поэтому его порядок d должен быть отличным от единицы делителем 15. Но d φ 3, 5. Тогда d = 15 и G — циклическая группа. Таким образом, любая группа порядка 15 является циклической. D 7.3* Прямые произведения групп Напомним, что для групп Gi,...,Gfc их внешним прямым произведением Gi x · · · xG/- называется множество всех упорядоченных наборов (pi,..., gk) длины к, где д% € Gj, с определенной на этом множестве покомпонентной операцией умножения {9ъ · · .,9к){9ъ ···>5а) = (919ь · · · ,ш4), в которой умножение по г-й компоненте является умножением в группе Gi. Будем говорить, что группа G является внутренним прямым произведением Н\Н2'Нп своих нормальных подгрупп Ηι,Ηϊ,..., ifn, если любой элемент g е G единственным образом представляется в виде g = /11/12 · · * hn^ где hi G Щ.
7.3. Прямые произведения групп 233 Пример 7.11. В абелевой группе Щ есть две циклические подгруппы (2) = {1,2,4} и {6} = {1,6}. Так как в Щ 1 = 1-1, 2 = 2-1, 3 = 4-6, 4 = 4-1, 5 = 2-6, 6 = 1-6, то все шесть произведений а&, где α G {2} и Ь G (6) различны и представляют все элементы Щ. Следовательно, группа Щ является внутренним прямым произведением своих нормальных подгрупп (2) и (6). D Пример 7.12. Рассмотрим циклическую группу G = {а) порядка ре/, где ρ и q — простые числа. В G есть две подгруппы порядков ρ и q — это подгруппа Gq = {aq) и подгруппа Gp = (αρ), которые пересекаются только по единичному элементу. Покажем, что любой элемент g e G единственным образом представляется в виде произведения (aq)k(ap)m7 где 0 < к < ρ и 0 ^ т < q. Так как таких произведений ровно pq, то достаточно показать, что все они различны. Допустим, это не так и два произведения равны: (aq)kl(ap)mi = (aq)k2(ар)Ш2. Тогда из этого равенства и коммутативности группы G следует, что (а*)*1"*2 = (ap)W2-mi, |fci - к2\ < ρ и \т2 - mil < <?> Последнее равенство возможно только в том случае, когда (ая)к1~к2 = е, т. е. разность к\—к2 должна быть кратна р, что, очевидно, невозможно в силу неравенства |fci — к2\ <р. Таким образом, группа G является внутренним прямым произведением своих нормальных подгрупп Gq и Gp. D Из примеров 3.31 и 7Л2 следует, что при простых ρ и q циклическая группа порядка pq является внутренним прямым произведением подгрупп порядкари q и изоморфна внешнему прямому произведению этих подгрупп. В следующей теореме покажем, что это частный случай более общей ситуации. Теорема 7.6. Пусть группа G является внутренним прямым произведением Н\Н2 · · · Нп своих нормальных подгрупп #1, #2? · ·· > Нп. Тогда G*HixH2x---xHn.
234 Глава 7. Структура конечных групп Доказательство. Покажем, что Щ Π Hj = е для всех г и j. Если это не так и д е Щ Π Hj, то элемент # можно представить двумя разными способами в виде произведений элементов нормальных подгрупп. Рассматривая д как элемент подгруппы Щ, получим произведение д = ei · · е;_15ет ... ej · · · еп, (7.4) где et = е — элемент подгруппы ϋί^. Рассматривая д как элемент подгруппы tfj, получим второе произведение д = βι · · · е* · · · ej-ifl^+i — еп, (7.5) где tt — е — элемент подгруппы Ht. Если д φ е, то равенства (7.4) и (7.5) противоречат единственности представления каждого элемента группы G в виде произведения fti · · · /^ · · · hn, где hi е Щ. Следовательно, ЩП Hj = е для всех г и j. Теперь легко видеть, что для любых hi е Щ и hj e Hj hihjh~lh~l = hi{hjh~xh~l) = ft*ft< £ ff*, hihjh^hj1 = (hihjh-^hj1 = h!jh~l e Hj. Следовательно, tnhjh^hj1 = e и h%hj = hjhi, т.е. элементы из разных нормальных подгрупп коммутируют. Используя это свойство, нетрудно показать, что для умножения произведений /&i ··· /&f ··· ton и /&ί ···/&£·· · ftn, состоящих из элементов hi, ft£, попарно пересекающихся только по единичному элементу нормальных подгрупп Hi, можно воспользоваться равенством (hi · · · ft» · · · ftnXft'i · · · hfi · · · /4) = ftift'j · · · hihfi · * · ftX. (7.6) Зададим отображение φ группы G = Н\Н2 · · Нп в прямое произведение Н\ χ #2 х * х йп ее нормальных подгрупп равенством V?(fti/i2 •••hn) = (fti, ft2,. · -, ftn). (7.7) Взаимная однозначность этого отображения следует из единственности представления каждого элемента группы G в виде
7.3. Прямые произведения групп 235 произведения h\h2 · · · hn. Пусть g = h\h2 - < hn n gf = h\h!2 -*mh!n — произвольные элементы группы G. Тогда в силу свойства (7.6) = ipihih'fabh * · · hnh'n) = {h\h!u h2h2, · · · > ^n^) = = (Ль ft2,..., Λη)(ΛΊ, Λ'2,..., /4)) = ^(5MfiO, т. е. у> сохраняет групповую операцию и, следовательно, является изоморфизмом. Теорема доказана. Говоря далее о разложении группы в прямое произведение ее нормальных подгрупп, как правило, не будем различать внешние и внутренние произведения, так как эти произведения изоморфны, а использованный в доказательстве теоремы 7.6 изоморфизм (7.7) позволяет все технические действия во внешних и внутренних произведениях проводить совершенно идентичным образом. Теорема 7*7* Группа G порядка ρχι · · -ρ*"- является прямым произведением своих силовских pi-подгрупп тогда и только тогда, когда эти подгруппы нормальны в G. Доказательство. Необходимость следует из того простого факта, что любой множитель в прямом произведении является нормальной подгруппой произведения. Для группы G = Н\Х х · · χ Нп и ее прямого множителя Щ это следует из равенств (hu ..., Ы,. · ·, hn)(ei,..., Щ,..., en)(/^ \..., h~\ ..., h~l) = = (ΑιΑ^1,..., hiHihr1,..., hnh~l) = (eb ...,#*,..., en), где ht € Ht и et — единичный элемент Щ, Докажем достаточность. Сначала покажем, что каждый элемент g группы G единственным образом представляется в виде g = h\h2 · · · hn, где hi € Щ и Щ — нормальная силовская подгруппа порядка р*4. Если это не так, то в силу того, что в G есть ровно р^1 · · -р^1 произведений вида h\h2 * * * hn) в G найдется такой элемент р, что h\... hi · · · /4 = g = /ι'/... h" · · · Λ£,
236 Глава 7. Структура конечных групп где h^ Щ G Η% и hfj Φ Щ хотя бы для одного j\ Так как Щ р| ii? = = е (если д е Hif]Hj и # ^ е, то порядок элемента # будет кратен p^Pj, что, очевидно, невозможно), то в силу (7.6) е = fc'/fc'fL... ЛЭД"1.../гХ"1 = h1>-hi>-hn) причем среди элементов hi = h!(hf^1 есть хотя бы один неединичный элемент hj. Так как hi Ε Щ, то его порядок d* равен р™\ Положим d = Yli^j d%- Тогда (см. (7.6)) е = (Λι... /ϋ · · Л· · · · Md = hdl...hf->>hdr->hi = hdj. С другой стороны, d и d, взаимно просты, и поэтому Щ φ е. Пришли к противоречию, из которого следует, что все Ργ · · · р^1 произведений вида h\* ♦ · ftn, где hi € Щ, представляют различные элементы группы G. Следовательно, G является внутренним прямым произведением своих силовских р;-подгрупп* Теперь достаточность условия теоремы легко следует из теоремы 7.6. Теорема доказана. 7.4· Конечные абелевы группы Коммутативность накладывает сильные ограничения на возможную структуру группы. Одно из таких ограничений состоит в том, что любая подгруппа абелевой группы является нормальной. Из этого факта и теоремы 7.7 легко извлекается следующая простая теорема1^. Теорема 7.8, Каждая конечная абелева группа является прямым произведением своих силовских р-подгрупп. Пример 7ЛЗ* Рассмотрим абелеву G группу порядка η = = Pi * * *Рь гДе Ρί — различные простые числа. Из теоремы 7.8 и простоты порядков всех силовских подгрупп группы G следует, что G является прямым произведением циклических подгрупп ^Полезно сравнить эту и следующую теоремы с теоремами о строении конечномерных линейных пространств из раздела 6-4.
7.4- Конечные абелевы группы 237 с взаимно простыми порядками: G = {д\) χ · · · χ {^), где \{д%)\ = = pi. Положим щ = n/pi. Покажем, что порядок произведения 9 — 9i' * * 9k равен п. Для этого достаточно убедиться в том, что gUi φ е при г = 1,..., fc. Покажем, что это так для г = 1. В этом случае п\ = р2 · · ·Рк и д™1 = е при г = 2,..,,к так как jf = e и Pi делит п\, и ρ™1 φ е, так как η ι и pi взаимно просты. Тогда в силу коммутативности группы G Таким образом, порядок элемента д совпадает с порядком группы, те. G — циклическая группа. Следовательно, циклическая группа порядка η = р\ · · · рь где pi — различные простые числа, является единственной, с точностью до изоморфизма, коммутативной группой данного порядка. D Группу порядка рп, где ρ — простое, будем называть при- марной группой, или р-группой. Далее рассмотрим абелевы р-группы, в прямое произведение которых разлагается произвольная абелева группа. Оказывается, каждая такая группа имеет достаточно жесткую внутреннюю структуру. Эту структуру опишем в следующей теореме. Теорема 7.9* Каждая конечная абелева р-группа является прямым произведением циклических групп. Доказательство. Покажем, что любая абелева группа порядка рп является прямым произведением своих циклических подгрупп. Сделаем это индукцией по п. В основание индукции положим очевидный случай η = 1. Допустим, что при всех η < т утверждение теоремы справедливо. Рассмотрим произвольную абелеву группу G порядка рт и выберем в ней элемент g максимального порядка. Если порядок g равен pw, то утверждение теоремы очевидно, так как в этом случае G будет циклической группой. Далее полагаем, что порядок элемента g равен рк) где к < т. Фактор-группа Η = G/{g) состоит из рш-к элементов и по предположению индукции является прямым произведением Я = #ι χ · xHiX-xHr (7.8)
238 Глава 7. Структура конечных групп циклических подгрупп Hi = (hi(g)) = {{9)M9),---A{9),---,hf-\9)}, где hi € G, I#г| = ρ*4, k% < к и fci Η h fcr = m — к. Из равенства (7.8) и теоремы 7.6 следует, что любой элемент h(g) группы Η можно единственным образом представить в виде произведения Λ<0)=Λί45>···Λ?<^ (7-9) где О ίζ U <рк\ Так как h^ г {д} = (р), то найдется такое s^, что /ι? * = gSi. Порядок элемента hi в группе G не превосходит р*. Поэтому из равенств дРк = е = hf = hf'pk~ki = gs^k~ki следует, что произведение Sipk~ki кратно рк. Значит, существует такое k, что Sipk~ki = 1%рк или Si = Upk\ Положим #; = Ыд~1\ Нетрудно видеть, что (Ы{д)) = {д%{д))> и поэтому д\ £ (д) при О < / < р*4. А так как #* = (/ад^)^ = ^ Vй* = 9Si9~Si = e, то каждая циклическая группа G% = {д%) будет в группе G такой подгруппой порядка рк% которая пересекается с (д) только по единичному элементу. Заметим, что равенство Я\1 ■ ■ ■ 9Ϊ ■ ■ ■ 9ΪΤ = 9* (или <# · · · дЬ ■ ■ ■ д*/д~* = e) (7.10) возможно только в том случае, когда t и все ti равны нулю. Действительно, из (7.10) и определения элементов gi следует соотношение tit · · · hf ■ ■ ti; = (W1)'1 ■ ■ ■ (9ί9ιφ ■ ■ ■ (grg1^ = = 9*ι ■■gti-· ■gtrrghtl+-+1^ = 9*+*ι*ι+"·+*τίτ € ^ которое в силу (7.9) возможно только тогда, когда все ti равны нулю. Но д\ ■ ■ ■ д® ■ ■ ■ д® = е, т. е. t также равно нулю. Отсюда
7.4- Конечные абелевы группы 239 следует, что все pfci+-+fcr+fc _ ^т Прюизведений д\г · · -дЬ · · · д1ггд1 являются различными элементами G, т. е. каждый элемент G единственным образом представляется в виде такого произведения. Следовательно, G = G\ χ · · χ Gi χ χ Gr x {g). Теорема доказана. Пример 7,14, Воспользуемся доказанной теоремой и покажем, что в любой абелевой группе порядка рп для любого т <п найдется подгруппа из рш элементов. Заметим, что это верно для циклических групп. В циклической группе G с порождающим элементом д требуемую подгруппу будет порождать элемент др . Пусть теперь G — произвольная абелева группа порядка рп. Тогда G = Gix· · -xGr, где |G;| = pni ип\-\ \-nr = η. Очевидно, что существуют такие mi,...,mr? что т% < щ и га ι + · · · + тпт = т. Выбирая в группах Gi подгруппы Щ порядка pWi, видим, что произведение Н\Х · · · χ Нг будет подгруппой порядка рш в группе G. □ Теорема 7Л0* Если конечная абелева р-группа G разлагается двумя способами в прямое произведение циклических подгрупп G = Αι χ · χ Аг = В\ χ · χ Bs, где \А\\ > \А2\ >···> \АГ\ и \Βχ\ > \В2\ >···> \BS\, то г = s и \Аг\ = \В%\ для всех г G {1,2, , г}. Доказательство. Для группы из ρ элементов утверждение теоремы очевидно. Допустим, что при всех η < т утверждение теоремы также справедливо. Рассмотрим абелеву группу G порядка pw, которая разлагается двумя способами G = <αι> χ · ·· χ (аг) = {Ьг)х---х (bs) (7.11) в прямое произведение циклических подгрупп (а*) и {bj}, где \{a>i)\=pki, ki ^ k2 > ··· >ku > ku+ι = ··· = К = 1, \Фз)\ = Pnji ™i > n2 > · · · > nv > nv+i = · · = ns = 1.
240 Глава 7. Структура конечных групп Легко видеть, что множество Gp = {др \ д G G} является подгруппой группы G. Из (7.11), (7.12) и теоремы 7.6 следует, что произвольный элемент д группы G можно представить в виде двух произведений οί11···α{<·.·α*Γ = </ = 6?1···6?···^, (7.13) где 0 < U < pki и 0 < dj < рпэ , причем для каждого д существует единственный набор показателей ti,..., tr и единственный набор показателей d\y..., ds, для которых справедливо (7.13). В свою очередь из (7.12) и (7.13) следует, что произвольный элемент др подгруппы Gp также можно представить в виде двух произведений «У1 ■ ■ ■ (о?)* · · · (α£)«· =gp = (φ* · · · (φ* · · · (65)*·, (7.14) где 0 ^ U < р^_1? 0 ^ dj < pnJ~1) и для каждого др существует единственный набор показателей ίχ,..., tr и единственный набор показателей di,.. ·, d5, для которых справедливо (7.14). Отсюда при помощи теоремы 7.6 немедленно получаем, что Gp = (α?) χ ·· χ (ари) = (%) χ ·<· χ (Щ), где |<а<)| = phi~l и |<6,)| = рп^\ Так как \GP\ = pm~r+u = _ рпг-s+v ^ р^-1^ то по предположению индукции и = v, ki—1 = = щ — 1 для г £ {1,..., и} и, следовательно, г = s и hi = щ для ί € {Ι,.,.,γ}. Теорема доказана. Если конечная абелева р-группа G разлагается в прямое произведение своих циклических подгрупп G\ χ - · · χ GV, то порядки pkl,..., pkr этих подгрупп называются инвариантами, или unea- риантными делителями группы G. В следующей теореме покажем, что любая конечная абелева р-гру π па определяется своими инвариантами с точностью до изоморфизма. Теорема 7.11* Конечные абелевы ρ-группы изоморфны тогда и только тогда1 когда они имеют одинаковые инварианты.
7.4- Конечные абелевы группы 241 Доказательство. Пусть А = (αϊ) χ ··· χ <аг), |{о*)| = pki, Α = Βκφ:Α^>Β — изоморфизм А в В. Так как каждый элемент А однозначно представляется в виде произведения а^а<2 *··ί4Γ, то очевидно, что и каждый элемент В однозначно представляется в виде произведения φ(αιΥ1φ(α2)ί2 · · · (p(ar)tr, и, следовательно, В = {φ(αι)) χ ··· χ (φ(αν)). Таким образом, pkl,.. .,ркт — инварианты группы В, т.е. инварианты групп А и В совпадают. Пусть теперь абелевы группы А и В имеют одинаковые инварианты. Тогда А = (αϊ) χ · · · χ (ar), В = (&ι) χ · · · χ (br) и (di) = (bi). Если отображение φι : (a;) —► {h} — изоморфизм (di) в (6i), то легко видеть, что отображение φ{χ\)... ухт) = = (y>i(#i),... ,yv(#r)) будет изоморфизмом группы Л в группу В, Теорема доказана. Пример 7Λ5* Найдем все неизоморфные абелевы группы порядка 16. Так как 16 = 8 · 2 = 4 · 4 = 4 · 2 · 2 = 2 · 2 · 2 · 2, то любая абелева группа порядка 16 изоморфна одной из следующих групп: Ζ16, Ζ8 χ Ζ2, Ζ4 χ Ζ4, Ζ4 χ Ζ2 χ Ζ2, Ζ2 χ Ζ2 χ Ζ2 χ Ζ2. D Объединяя теоремы 7.8 и 7.10, видим, что справедливо следующее утверждение, достаточно точно описывающее структуру конечной абелевой группы. Теорема 7,12, Каждая конечная абелева группа является прямым произведением циклических р-подгрупп. Любые два произведения состоят из одинакового числа множителей одного порядка. Как и в случае р-групп, порядки множителей в разложении конечной абелевой группы G в произведение циклических р-подгрупп называются инвариантами группы G. Нетрудно видеть, что имеет место следующая теорема, доказательство которой почти дословно повторяет доказательство теоремы 7.11. Теорема 7,13. Конечные абелевы группы изоморфны тогда и только тогда1 когда они имеют одинаковые инварианты.
242 Глава 7. Структура конечных групп Пример 7.16. Частный случай теоремы 7ЛЗ был рассмотрен выше в примере 7ЛЗ, где было показано, что все абелевы группы с простыми несовпадающими инвариантами Pi,... ,р& изоморфны. □ Пример 7,17, Рассмотрим абелеву группу G порядка 3 · 103 с инвариантами 52,5, 3,22,2. Эту группу можно представить в виде произведения G25 x G$ х Gs x G4 χ G^ где Gi — циклическая подгруппа порядка г. Так как G25 х Gb х Gz x G4 x G2 = (G25 x G3 χ G4) χ (G5 χ G2), то, повторяя рассуждения примера 7.13, можно показать, что G является прямым произведением двух циклических подгрупп, чьи порядки равны 300 и 10. □ Пример 7,18, Перечислим все неизоморфные абелевы группы порядка 100. Так как 100 = 25-4 = 25-2-2 = 5-5-4 = 5-5-2-2, то любая абелева группа порядка 100 изоморфна одной из следующих групп: Z25 х Ζ4, Ζ25 χ Ζ2 χ Ζ2, Ζ5 χ Ζ5 χ Ζ4, (7.15) Ζ5 χ Ζ5 χ Ζ2 χ Ζ2. Заметим, что Ζ25 χ Ζ4 ^ Ζιοο, ^25 xZ2xZ2 = Ζ50 χ Ζ2, Ζ5 χ Ζ5 χ Ζ4 = Ζ20 χ Ζ5, Ζ5 χ Ζ5 χ Ζ2 χ Ζ2 ^ Ζί0 χ Ζω, т.е. каждую из групп в (7.15) можно представить в виде произведения меньшего числа циклических сомножителей. D Обобщим рассуждения из примера 7.17 на произвольную абелеву группу G с инвариантами Р?\ VT, p7\ · · ·, P22m2, «2i > n22 > n23 > ... > n2w2, Pfcfcl- Pfc*2» P**8»···» Pfc m*' nfci ^nfc2 >nfc3 ^ ... >nkmk.
7.4- Конечные абелевы группы 243 Положим т = max(rai,..., rrik)- Можно считать, что все Шг равны т. Если это не так, то к инвариантам с основанием pi добавим т—гПг единиц. Группа G разлагается в прямое произведение Gn х G12 χ · · · х Gim, χ · · · χ Gki x Gfc2 χ · · · x Gkm (7.16) своих циклических р;-подгрупп Gij порядка pitj (подгруппы, соответствующие добавленным к инвариантам единицам, будут тривиальными единичными подгруппами). Объединяя в (7.16) подгруппы с одинаковыми вторыми индексами, получим новое представление (Gn х G2i х · · · х Gki) χ · · · χ (Gim x G2m χ · · · x Gkm) группы G. Так как при s φ t порядки подгрупп Gsi и Gn взаимно просты, то для каждого г = 1, 2,. >., т произведение Gu χ G^i χ · · · χ Gki будет циклической подгруппой G% порядка <& = р^ир^ · · *Р/?Ы, причем qi+i будет делить <& для i = 1,..., т - L Таким образом, произвольную абелеву группу G можно представить в виде произведения G = Gi χ G2 χ · χ Gm ее циклических подгрупп G^, где порядок подгруппы G^+i делит порядок подгруппы Gi. Порядок подгруппы Gi называется показателем группы G. В группе с показателем q максимальный порядок элемента равен д, и порядок каждого элемента группы делит q. Легко видеть, что абелева группа является циклической тогда и только тогда, когда ее порядок и показатель равны. Следующая теорема является обращением теоремы Лагран- жа для абелевых групп и обобщением примера 7.14. Теорема 7Л4« Пусть т делит п. В абелевой группе порядка η существует подгруппа порядка т.
244 Глава 7. Структура конечных групп Доказательство. Рассмотрим абелеву группу G порядка η = Ρ?1 · · · р£fe · Эта группа является прямым произведением G\ х · · х Gk своих силовских р^-подгрупп Gi. Каждый делитель т порядка группы η представим в виде произведения РТ1 * * 'Ρ™1*' где mi € {0,1, · · ·, щ} и mi < щ. Из разобранного выше примера 7.14 следует, что в каждой подгруппе Gi порядка р™* найдется подгруппа Щ порядка р™\ Поэтому прямое произведение Ηι χ · · · χ Η^ этих подгрупп будет подгруппой порядка т в группе G. Теорема доказана. Теперь покажем, что утверждение теоремы 7.14 нельзя обобщить на неабелевы группы. Для этого рассмотрим симметрическую группу S$> Порядок этой группы равен 120, а максимальный порядок ее элемента равен шести. Таким элементом, например, будет произведение двух циклов (123)(45). Ранее в примере 7.10 на с. 231 было показано, что любая группа порядка 15 является циклической. Следовательно, в S$ нет подгруппы порядка 15, хотя 120 = 15-8. 7.5. Группа Z; Ζ\ χ Ъ\2 χ · · Ρί Р2 • · х Ζ\ Рта Из доказанной в главе 3 теоремы 3.17 следует, что группа Z^ при η = р±1р22 · · *ρίϊΓ> гДе все Pi различные простые, изоморфна прямому произведению (7.17) В приводимых далее леммах перечисляются все циклические группы Ζ£· Эти леммы позволят полностью описать структуру всех множителей в (7.17). Лемма 7Л* При каждом простом ρ группа Ζ£ — циклическая. Доказательство. Пусть т — показатель группы Ζ*. Так как порядок каждого элемента группы делит ее показатель, то каждый элемент Ζ* является корнем двучлена хт — 1. С другой стороны, двучлен хт — 1 в поле Ζρ имеет не более т корней.
7.5. Группа Z^ 245 Следовательно, т = ρ — 1 и2* - циклическая группа. Лемма доказана. Лемма 7.2* При любом простом ρ группа Ζ*2 — циклическая. Более того, среди порождающих ее элементов существует элемент h, удовлетворяющий равенству hp~l = 1 + пр, где целое η не делится на р. Доказательство. Покажем, что в качестве требуемого элемента h можно взять либо порождающий элемент g группы Z*, либо элемент g + p. Рассмотрим элементg +ίρ, где t £ {0,1}, и пусть d — порядок этого элемента в группе Z*2. Нетрудно видеть, что (g + tp)d = = gd (mod ρ). Кроме того, из равенства (д + tp)d = 1 (mod p2) следует, что (д + tp)d = 1 (mod ρ). Поэтому gd = 1 (mod p), и, следовательно, d должно делится на ρ — 1, т. е. либо d = ρ — 1, либо d = р(р — 1) в силу того, что |Z*2| = р(р —1). Таким образом для того, чтобы показать, что д + tp является порождающим элементом в группе Z*2, достаточно показать, что d ^ ρ — 1. Так как д — порождающий элемент группы Z*, то найдется целое т, для которого рр_1 = 1 + тр. Тогда р-1 = 1 +р(т - </-2) +pV"2 + Σ (Р fc ^ (*Р) V"1"*· Каждое произведение, стоящее под знаком суммы в последнем равенстве, делится на р2. Следовательно, найдется такое целое &, что (9 + tp)p~l = 1 + p(m - tgv~2) + kp2 = l+ p{m - tgp~2 + kp). Теперь покажем, что по крайней мере при одном из двух возможных значений t величина η = т — tgp~2 + kp не делится на р. Если т не делится нар, то полагаем ί = 0. Тогда η = т+кр и легко видеть, что η не делится на р. Если же т делится на р,
246 Глава 7. Структура конечных групп то полагаем t = 1. В этом случае η = πι — др~2 + kp. Так как д и ρ взаимно простые, то др~2 не делится на р. Поэтому η также не делится на р. Таким образом, найдется ί, равное нулю или единице, при котором η = га — tgp~2 + kp не делится на р, и, следовательно, произведение рп не делится на р2. Поэтому {д + tpY~l = 1 + пр φ 1 (mod p2), т.е. h = д +tp является порождающим элементом в группе Z*2 и hp~l = 1 + рп, где η не делится на р. Лемма доказана. Лемма 7.3, Если ρ — простое нечетное, то при каждом натуральном к группа Z*fe — циклическая. Доказательство. Покажем, что при к > 2 порождающим элементом в группе Z\ будет порождающий элемент h группы Z*2, указанный в лемме 7.2. Пусть d — порядок элемента h в группе Z*fc. Тогда из равенства hd = 1 (mod pk) следует, что hd = 1 (mod ρ2). Поэтому d должно делиться на р(р — 1), те. d равно произведению ps(p — 1). Покажем, что это равенство возможно только при s = к — 1. Из леммы 7.2 следует, что hv~l = 1 +пр, где η не делится на р. Тогда, учитывая, что (?) делится на ρ при i ^ 0, р, Λρ(ρ-ι) = (ι +пр)Р = ι + /Ρjnp + J2 №)(прУ = = 1 + пр2 + rip* = 1 + р2(п + rip) = 1 + pV, где очевидно η ι на ρ не делится1). Возводя аналогичным образом получившееся равенство hp^p~1^ = 1 + р2П\ в степени р,р2,..., легко видеть, что для любого натурального s справедливо равенство /ιΡ5(ρ-ΐ) = ι+ρ3+ιη5? "^ Последнее равенство со свойством ρ \ п\ справедливо только при ρ > 2, поэтому и лемма 7.3 неверна для единственного четного простого числа ρ = 2, — см. далее лемму 7.5 и ср. с леммой 7.2.
1.5. Группа Z^ 247 где ns не делится на р. Следовательно, ftp*-2(p-i) ^ ι (mod A Таким образом порядок h в группе Z*fe равен рк~1(р — 1), т.е. этот элемент является порождающим элементом группы. Лемма доказана. Пример 7 Л 9* Рассмотрим группу Zg. В Ъ\ порождающим элементом является 2. Так как 22 = 4 (mod 9), то 2 — порождающий элемент в Ζ£. □ Пример 7.20. Найдем порождающий элемент в группе Z*g2. Так как 26 — 1 и 29 — 1 не делятся на 19, то 2 будет порождающим элементом в Щ$. Теперь проверим, выполняется ли равенство 218 = 1 (mod 192). Так как 192 = 361 и 21S - 1 = (29 - 1)(29 + 1) = 511 · 513, то легко видеть, что ни 511, ни 513 не делятся на 361. Также легко видеть, что 511 и 513 не могут одновременно делиться на 19. Следовательно, 21S ^ 1 (mod 192), и 2 является порождающим элементом в Z*g2. Π Лемма 7Л. Если ρ — простое нечетное, то при каждом натуральном к группа Z* fc — циклическая. Доказательство. Прежде всего заметим, что группа Z* k состоит из (р — 1)р*-1 натуральных чисел, каждое из которых нечетно, не делится на ρ и меньше, чем 2рк'. Пусть g — порождающий элемент группы Z%. Если g нечетное число, то g принадлежит группе Z* к. Его порядок в этой группе обозначим через d. Тогда из равенства gd = 1 (mod 2pk) следует, что gd = 1 + 2рк · η = 1 + рк · 2п = 1 (mod pk). Таким образом, d = (ρ — 1)рк~1, и, следовательно, g будет порождающим элементом в группе Z* к.
248 Глава 7. Структура конечных групп Если д — четное, то нечетным будет число д + рк, вычет которого по четному модулю 2рк очевидно принадлежит группе Z* к. Пусть d — порядок этого вычета в группе Z* fc. Тогда из равенства (д + pk)d = 1 (mod 2рк) и четности д следует, что d ,д 1 + 2рк · η = {д + pk)d = gd + ^ I . \рк1да~1 = gd + 2рк · т, т. е. gd = 1 (mod pfc). Таким образом, d = (ρ— ljp*"1, и, следовательно, вычет числа д + рк по модулю 2рк будет порождающим элементом в группе Z* к. Вообще говоря, утверждение леммы 7.4 сразу следует из разложения (7.17) и леммы 7.3, так как при нечетном ρ z;^z*xz;^{i}xz;^z;b Однако доказательство с явным указанием порождающего элемента группы Z* к, как это было сделано в предыдущих леммах, дает дополнительную полезную информацию об этой группе. Лемма доказана. Лемма 7,5, При к > 3 группа Z*fe не является циклической и изоморфна прямому произведению группы порядка 2 и циклической группы порядка 2к~2. Доказательство. Преобразуя разность 52 —1 по формуле разности квадратов, приходим к равенству 52fc"2 - 1 = (52° - 1) П(52< + 1) = 4 · Π(52ί + 1), г=0 г=0 в правой части которого первый множитель равен 4, а остальные к — 2 четные. Таким образом, разность 52 — 1 делится на 2к) и, следовательно, 52 =1 (mod 2k). Теперь рассмотрим разность 52 — 1. Так как 5 = 1 (mod 4), то и Ъп = 1 (mod 4) при любом натуральном п. Поэтому в правой части равенства б2*"3 - 1 = 4 П(5* + 1) г=0
7.5. Группа Z^ 249 ни один из сомножителей вида (52* + 1) не делится на 4, и, следовательно, все произведение не делится на 2к. Таким образом, порядок 5 в группе Z*fc больше, чем 2к~3 и, следовательно, равен 2к~2. Далее заметим, что 5η φ —5 (mod 2^) ни при каком га, так как в этом случае также справедливо равенство 5П = — 5 (mod 4), которое, очевидно, противоречит равенствам 5П = 1 (mod 4) и —5 = 3 (mod 4). Поэтому все числа вида (—1)г5·?, где г = 0,1 и j = 1,... j 2fc~2, различны по модулю 2к) и так как все эти числа нечетные, то они образуют группу Z^. Теперь легко видеть, что отображение φ : Z*fc —> Z2 х Z2fc-2, преобразующее число (—1)г57 в пару чисел (i,j)i является изоморфизмом, т.е. Z*fc = Z2 х Z2*-2. Лемма доказана. Лемма 7.6* Пусть га = mirri2, где mi и Ш2 взаимно простые и не равные 2. Тогда группа Z£ не является циклической. Доказательство. Прежде всего заметим, что в силу теоремы 3.17 группа Z^im2 изоморфна прямому произведению Z£j2 χ ZJ^2. Так как т^чщ > 2, то группы ZJ^ и Z^2 состоят из четного числа элементов, и поэтому каждая из этих групп имеет элемент порядка 2. Следовательно, в Ζ^α χ ZJ^2 найдутся два различных элемента второго порядка, что невозможно в циклической группе. Лемма доказана. Собирая вместе результаты доказанных лемм 7.1—7*6, получаем следующую теорему, позволяющую с учетом (7.17) исчерпывающе описать структуру мультипликативной группы кольца вычетов по модулю га. Теорема 7.15. Группа Z£ является циклической тогда и только тогда, когда га = 2,4, или га = рк, или га = 2рк, где ρ — нечетное простое, к — произвольное натуральное. При к ^ 3 группа Z*fc не является циклической, однако Ζ*λ = Ζ2 x Z2fc-2. Пример 7.21. Теорема 7.12 показывает, что абелева группа Zg3ooo разлагается в прямое произведение своих циклических
250 Глава 7. Структура конечных групп р-подгрупп. Воспользуемся результатами этого раздела и найдем явный вид этого произведения. Так как 63000 = 23 · З2 · 53 · 7, то ^63000 — ^23 Х ^З2 Х ^53 Х ^7· (7Ί8) Имеем Z*3 = Ζ2 χ Ζ2, Ζ*2 ^ Ζ* ^ Ζ6 ^ Ζ2 χ Ζ3 и Ζ*3 ^ Ζ100 = = Ζ4 Χ Ζ25 по леммам 7.1—7.5. Таким образом, Ζ63θοο - ζ22 χ Ζ2 χ Ζ2 χ Ζ2 χ Ζ2 χ Ζ3 χ Ζ3 χ Ζ52, (7.19) и инвариантами группы Ζ£3οοο являются 52,3,3, 22, 2,2, 2, 2. Следовательно, максимальный порядок ее элементов (показатель группы), совпадающий с наименьшим общим кратным ее инвариантов, равен 52 · 3 · 22 = 300. Найти любой конкретный элемент, порядок которого делит 300, можно с помощью порождающих элементов циклических разложений групп Ζ*3, Ζ*2, Ζ*3, Щ и китайской теоремы об остатках. D Пример 7,22, Изоморфизмы (7.18) и (7.19) помогают и решать уравнения в Ζ£3οοο> и легко находить число их корней, не решая явно. Например, сравнение х2 = 1 (mod 63000) имеет 25 = 32 корня, так как в циклических группах порядка 2 и 4 уравнение х2 = 1 имеет по 2 корня, а в циклических группах порядка 3 и 25 только один (единицу группы). Одним из искомых корней будет, например, вычет #, равный 5 по модулю 23 и (—1) по модулям З2, 58 и 7. Его явный вид χ = 15749 (mod 63000) можно найти по формуле теоремы 2.11 (стр. 45). Π Задачи 7.1. Почему мощность любого класса сопряженных элементов конечной группы делит ее порядок? Перечислить все группы, имеющие ровно три класса сопряженных элементов. 7.2. Пусть подстановки f,h G Sn имеют тип (fci, Ai2,..., kn). Найти число сопрягающих их подстановок, то есть число таких д, что / = = ghg'1.
Задачи 251 7.3. Пусть подстановка π G Sn имеет тип (fci, &2> · · · ? &п) и пусть rn = ki + fc2 + ... + кп. Доказать, что sgn (π) = (—l)n_m. 7.4. Привести пример двух четных подстановок, сопряженных в группе Sn и не сопряженных в группе Ап. 7.5. Найти число орбит в группах S$, А$, Sq, Aq, Sr и Аг при их действии сопряжением на себя. 7*6. Найти число неизоморфных групп порядков 2,3,4,5, б, 7,8. 7.7. Найти число неизоморфных групп порядков 35,65,77,175. 7*8. Пусть группа G имеет порядок р\Р2, где ρι,ρ^ — различные простые числа, такие, что ργ = 1 (modp2)· Доказать, что G = (α, ί>), где порядки элементов а и Ъ равны р\ и ρ<χ соответственно, причем ЬаЪ~х = с, где с — образующий элемент подгруппы (а). 7.9. При каких значениях га, η группа {а)т χ {b)n — циклическая? 7.10. Пусть G = (а) 12 χ (Ь)зо- Найти максимальный порядок элемента в G. Сколько различных подгрупп в G имеет порядок б? Найти число различных гомоморфизмов φ : G —► (с) ι8 и ψ : (с) i8 —► С?. 7.11. Пусть Z(G) — центр некоммутативной группы G. Доказать, что фактор-группа G/Z(G) не может быть циклической. 7.12. Пусть G — произвольная группа. Доказать, что группа G/Z{G) изоморфна группе всех сопряжений G. 7ЛЗ. Показать, что в группе порядка рк, где ρ — простое, существует нормальная подгруппа порядка pfe_1. 7.14. Найти все нормальные подгруппы в симметрической группе 54 и построить все гомоморфизмы φ : S^ —► S±. 7.15. Найти число неизоморфных абелевых групп порядков 8,9, 48,60,900,1000. 7.16. Доказать теорему Коши: если порядок конечной группы G делится на простое число р, то в G существует элемент порядка р. 7.17. Показать, что в группе порядка рк, где ρ — простое, для любого т < к существует подгруппа порядка рш. 7.18. Найти число силовских 2-подгрупп и 3-подгрупп в группе £4. 7.19. Для простого ρ найти порядок силовской р-подгруппы в группе Sn.
252 Глава 7. Структура конечных групп 7.20. Для простого ρ найти число силовских р-подгрупп в Sp. 7.21. Пусть р, q — простые, ρ < q и q — 1 не делится на р. Доказать, что любая группа порядка pq коммутативна. 7.22. Для простого ρ в некоммутативной группе порядка р3 найти число классов сопряженности и число элементов в каждом таком классе. 7.23. Доказать, что центр прямого произведения групп G и Η равен произведению центров, т.е. Z(G χ Η) = Z{G) χ Ζ (Η). 7.24. В группе G найти максимальный порядок элемента и число элементов максимального порядка, если: 1) G = Щ^^\ 2) G = 22J3io> 3) G = Ζ|οοοο· 7*25. Решить уравнение х95 = 1 в кольце йзоозо* 7.26. Доказать, что показатель любой абелевой группы равен максимальному порядку ее элементов. 7.27. Разложить в прямое произведение циклических р-подгрупп циклическую группу порядка: 1) 12; 2) 24; 3) 60; 4) 900. 7*28. Пусть Τ — множество всех элементов максимального порядка конечной абелевой группы G. Доказать, что G = (Г). 7.29. Показать, что если в конечной коммутативной группе порядок каждого неединичного элемента равен ρ, ρ — простое, то группа изоморфна группе Ζί;. 7.30. Пусть А — подмножество элементов группы G. Множество N(A) всех элементов д е G таких, что дАд~х — А, называется нормализатором множества А. Показать, что N(A) — подгруппа в G. 7.31. Найти нормализатор N{H) подгруппы Η в группе 54, если: 1) Я = {(12)); 2) Я = {(1234)); 3) Я = {е, (12)(34), (13)(24), (14)(23)}.
Глава 8 Конечные поля В этой главе подробно изучаются конечные поля, их основные свойства, внутренняя структура. Рассмотрены особенности выполнения вычислений с элементами конечных полей. 8.1. Мультипликативная группа поля Из доказанной в предыдущей главе леммы 7.1 следует цикличность мультипликативной группы поля Ър. Ниже покажем, что циклической будет мультипликативная группа любого конечного поля. Сделаем это, в отличии от доказательства леммы 7.1, не используя понятие показателя группы. Лемма 8.1. В группе G порядкап, где η = рхх .. .р^г — разложение числа η па простые множители, элемент h £ G имеет порядок п, т.е. является порождающим в G, тогда и только тогда, когда выполнено условие hn/Pi φ γ для 6сех i = 1? _ ш ? γ (8Λ) Доказательство. Необходимость. Если хотя бы для одного значения г неравенство (8.1) превращается в равенство, то порядок элемента h строго меньше, чем п, так как из hn/pi = 1 следует, что порядок h делит njpi. Для доказательства достаточности воспользуемся теоремой Лагранжа. Заметим, что порядок элемента h является делителем числа η = |G|, а значит имеет вид ρψ .. .р*г, где 0 < Χχ < k% при всех г. Из условия (8.1) следует, что при каждом г = 1,..., г
254 Глава 8. Конечные поля порядок h не делит р\1.. .р^Г11р^~1р^11 ... р£% откуда ж* = А*. Следовательно, |Л| = η и элемент /ь — порождающий в G, Лемма доказана. Теорема 8.1. Мультипликативная группа конечного поля циклическая. Доказательство. Рассмотрим поле ¥q, состоящее из q элементов. Пусть q — 1 = pj1 · · · p£r _ разложение числа q — l = |F*| на простые множители. При каждом г многочлен #(?_1)М _ \ имеет в мультипликативной группе поля ¥q не более (q — 1)/р% корней, поэтому для каждого г в этой группе найдется элемент gi такой, что д1я-1)/п φ L (8β2) Положим hi = gq , /ι = ΠΙ=ι ^ и покажем, что h будет порождающим элементом в F*. По лемме 8.1 для этого достаточно доказать, что h(q-l)/Pi φ ι для каждого г. Сделаем это только для г = 1, так как легко видеть, что доказательства для разных значений г аналогичны. Так как группа F* абелева, то А^-ЧМ = Щ=1 h\q~l)/p\ Далее заметим, что произведение ((q — 1)/р/) · {q — 1)/ί>ι кратно q — 1, если г ^ 1· Поэтому ft(g-l)/pi =1 при . ^ L (83) fei Теперь найдем порядок элемента h\. Так как Л,^1 = gq~ = 1, то порядок элемента h\ равен р\, где s ^ k\. Но из неравенства (8.2) следует, что ή* = ^«-^/ρι ^ L Поэтому порядок элемента h\ равен р-^1. Учитывая, что (q — 1)/ρι не делится на р^, то заключаем, что д(<7-1)/Р1 φ L (8-4) Из (8.3) и (8.4) следует, что &(ϊ-ι)/ρι ^ ι. Теорема доказана. Пример 8Л« Покажем, что в поле из примера 4Λ8 порождающим элементом мультипликативной группы
8.1. Мультипликативная группа поля 255 будет элемент χ = (010). Используя равенство1' Xs = х+2, легко находим все степени х: χ 0 = (001), (010), х2 = (100), ЯГ = (012), ж10 = (110), х7 = (122), X8 = (202), х9 = (011), 10 х4 = (120), ж5 = (212), .11 = (112), хы = (020) X15 = (200) ж16 = (021) X17 = (210) = (121) X 18 X (in), Л 2 „13 ж" = (Ю2), (002), £ 19 20 х- = (222) (211) х21 =(Ю1), х22 = (022), х23 = (220), χ 24 = (221), 25 = (201). D Образующий элемент мультипликативной группы поля ¥q (т.е. имеющий порядок q — 1 = |F*|) называется примитивным элементом этого поля. Теорема 8.1 утверждает, что примитивный элемент есть в любом конечном поле. Более того, поле порядка q содержит ровно ip{q — 1) примитивных элементов, т. к. циклическая группа порядка (q — 1) имеет ровно ip{q — 1) образующих (см. теорему 3.14). Пусть а — примитивный элемент поля ¥q и β — ненулевой элемент этого поля. Минимальное неотрицательное число г, для которого β = аг, называется индексом или дискретным логарифмом элемента β по основанию а и обозначается г = loga/3. В примере 8.1 фактически построена таблица логарифмов поля F27 = 2гз[#]/(#3 + 2х +1) по основанию а = х. Из нее, например, следует, что loga(a:2 + а) = 10. Все примитивные элементы поля можно легко получить, зная один из них. Действительно, по теореме 3.16 в группе, образованной элементом α порядка п, порядок элемента ах равен п/(п,х) и, следовательно, совпадает с порядком а тогда и только тогда, когда η и χ взаимно просты. Например, зная, что вычет а = 2 является примитивным в поле Ζ13, получаем, что г*Строго говоря, надо было написать [х]3 = [х] + [2], так как это равенство вычетов, но мы, начиная с этого момента, опускаем лишние скобки, чтобы они не загромождали запись. Равенство х4 = (120) следует из того, что χ4 = χ · хг = х[х -|- 2) = х2 + 2х, откуда х5 = х(х2 -\- 2х) = хг -\- 2х2 = = 2х2 -\-х + 2 = (212), и т. д.
256 Глава 8. Конечные поля вычеты 25 = б, 27 = 11 и 211 =7 также являются примитивными, и других примитивных элементов в Z13 нет. Пример 8,2, В поле F^s любой элемент а φ 0,1 является примитивным, так как порядок его мультипликативной группы I^i2sl = 127 — простое число (см. пример 3.21). D Указать конкретный примитивный элемент в конечном поле ¥q часто помогает проверка неравенств леммы 8.1 в группе G = F*. Так, для доказательства примитивности элемента х € Хз[а?]/(ж3 + 2х -\- 1) из примера 8.1 достаточно было проверить, что ж2/1и χ13 φ 1. Для этого, вообще говоря, не нужно строить всю таблицу логарифмов. Пример 8,3, Найдем какой-либо примитивный элемент в Ζιΐ3· Число 113 является простым (оно не делится ни на одно из простых чисел 2,3,5,7, меньших \/ПЗ), поэтому Ъ\\г — конечное поле и по этой причине содержит примитивные элементы. Разложим на простые множители порядок его мультипликативной группы 113 — 1 = 112 = 24 ♦ 7 и проверим выполнение условия (8Л). Претендентов на примитивность а € Щ^ будем перебирать в порядке возрастайия1). Отметим, что при наших вычислениях можно легко обойтись без калькулятора и компьютера. Действительно, возьмем вычет β = 2 и возведем его в степень 112/2 = 56: 223'7 = 1288 = 158 = (152)4 = 2254 = (-1)4 = 1 (mod 113). Следовательно, вычет β = 2 не примитивен. Попутно мы нашли, ^Один из результатов аналитической теории чисел, выходящий за рамки данного курса, гласит, что если справедлива расширенная гипотеза Ри- мана, то наименьший примитивный корень из Ζρ при всяком простом ρ не превосходит величины α log6 ρ, где а и Ь — некоторые константы, не зависящие от р. Значит, в предположении, что гипотеза верна, перебор малых вычетов из Ър должен дать положительный результат. Расширенная гипотеза Римана утверждает, что все комплексные нули ζο функции Lx(z) = ΣίΓ=ι Χ(η)/η*> называемой рядом Дирихле, которые находятся в полосе 0 < Rezo < 1 комплексной плоскости С, должны лежать на прямой Re ζο = ψ Гипотеза в настоящий момент не доказана, но нули функций Lx(z) численно проверены для астрономически больших значений Im^o-
8Λ. Мультипликативная группа поля 257 что его порядок равен 28, так как 24 φ 1 (mod 113) и 214 φ Ι (mod 113). Перейдем к следующему вычету а = 3. Действуя аналогичным образом, видим, что З23'7 = (З7)23 = (243 · З2)8 = (17 · 9)8 = 1538 = 408 = = (402)4 = 16004 = 184 = 3242 = 982 = (-15)2 = 152 = = 225 = —1^1 (mod 113). При этом честно поделить с остатком нам пришлось всего один раз на шаге, отмеченном значком = (а можно было заметить, что 1600 = ИЗО + 470 = 470 = 18 (mod 113)). Все остальные приведения по модулю 113, которые мы выполняли на каждом шаге, свелись к одному-двум вычитаниям числа 113 из текущего результата. Указанный способ1) значительно проще честного возведения в степень с последующим взятием остатка, так какЗ56 = 523 347633027360 537213 511521. Наконец, З24 = (З4)4 = 814 = (-32)4 = (2 · 16)4 = (4 · 256)2 = = (4 . 30)2 = 72 = 49 φ 1 (mod ИЗ). Таким образом, мы доказали, что вычет 3 примитивен. D Пример 8.4* В силу взаимной простоты чисел 7 и 26 = ψ\^\ элемент а7, так же как и элемент а, будет примитивным в поле F27 из примера 8.1. Найдем дискретный логарифм элемента а10 = а2 + а по основанию а7. Это нетрудно сделать, зная, что logaa10 = 10. Действительно, равенство {аТ)г = а10 равносильно сравнению 7г = 10 (mod 26). Его наименьшим положительным решением будет г = 10 7-1 = 10-15 = 20 (mod 26), поэтому loga7 α10 = 20. D Обобщая это простое наблюдение на произвольное конечное поле ¥q и его примитивные элементы а, 7? получим равенство log7/3 = {^, (8.5) 7 loga 7 ^ Модификация бинарного возведения в степень, см. [16].
258 Глава 8. Конечные поля где β — произвольный элемент из F*, а под делением понимается умножение на обратный вычет по модулю q — L Равенство (8.5) является дискретным аналогом известной формулы перехода под знаком логарифма к другому основанию над полем R. Оно показывает, что, зная логарифм по одному примитивному основанию, его нетрудно найти и по всем остальным. Вычислению дискретных логарифмов посвящен раздел 9*3. 8.2* Разложение хрП — χ на множители При изучении конечных полей особую роль играет двучлен хр — х. Ниже в теореме 8.2 найдено разложение этого двучлена на неприводимые над Ζρ множители. Далее это разложение позволит легко установить структуру и основные свойства любого конечного поля. Лемма 8*2* Пусть ρ — простое, д(х) — произвольный многочлен над полем Ър. Тогда Доказательство. Так как ρ простое, то в правой части равенства (a + bf = ap+(Aap-lb+... '-•+(t)aP~kbk+'--+(р_ W-^^ все коэффициенты (|) при к φ 0, ρ делятся нар. Поэтому (a + b)p = ap + ff (8.6) для любых а и b из Ър. Используя равенство (8.6) в качестве основания индукции, индукцией по числу слагаемых нетрудно показать, что (οι + · · · + апУ = а? + · · · + о£ (8.7)
8.2. Разложение хрП — χ на множители 259 для любого η и любых αϊ,...,On Ε Ζρ. Так как ар = α для каждого α из Ζρ, то для любого многочлена д(х) ШГ = (9пхп + ■ ■ ■ + 9ΐχ + до)р = = (9пХрГ + ■■■ + (9ix)p + Ыр = = 9п(хрГ + ---+91Хр+9о=9(хр)- Лемма доказана. Следствие 8.1· Для всех целых неотрицательных п, простых ρ и любого многочлена д(х) Ε Ър[х\ выполнено равенство (д(х))рП=д(хП- Формальной производной многочлена f(x) = апхп + Ь -\-a\X + ао называется многочлен ff(x) = папхп~1 + \- й\. Заметим, что преобразование многочлена в его формальную производную является линейным преобразованием. Используя это свойство, нетрудно показать, что для формальной производной произведения двух многочленов справедлива формула Лейбница (f(x)h(x))' = f{x)h{x) + f(x)ti(x). (8.8) Действительно, для одночленов f(x) = ахп и h(x) = bxm равенство (8.8) очевидно, поэтому по линейности оно верно и для случая f(x) = апхп +... + а\х + ао и h(x) = tem, откуда следует его справедливость для многочленов f(x) и h(x) общего вида. По индукции из (8.8) получаем следующий способ вычисления производной произведения т многочленов: га (/ι·...·/ηθ' = Σ/Μΐ/;> откуда следует равенство (/т) = т/ш_1 · /'. Теорема 8.2. Для всех простых ρ и целых неотрицательных η хрП -x = Y[h(x), (8.9) где произведение берется по всем нормированным неприводимым надЪр многочленам из Ър[х\, степени которых делят п.
260 Глава 8. Конечные поля Доказательство. Пусть h(x) — неприводимый многочлен степени га. Так как Zp[x]/h(x) является полем, которое состоит из рт элементов, то в мультипликативной группе этого поля порядок любого элемента, в том числе и одночлена х, является делителем числа рт — 1, и, следовательно, хрт=х (mod/г(я)). (8.10) Представим η в виде η = кт+г7 где 0 < г < т. Тогда, учитывая равенство (8Λ0), имеем хр« = хРк^г = ^у = хрг (mod /φ.)). (8Λι) Если η делится на га, τ е. г = 0, то в силу предыдущего равенства хрП - χ = 0 (mod h(x)), и, следовательно, двучлен хрП — χ делится на многочлен h(x). Теперь предположим, что двучлен хр —х делится на h(x) и η не делится на ш, τ е. г > 0. В этом случае хрп — χ = 0 (mod h(x)), и из (8.11) следует равенство хр = χ (mod h(x)). Далее заметим, что в силу леммы 8.2 для любого элемента д поля Zp[x]/h(x) из предыдущего равенства следует, что Ш)рТ =д{хрТ)=д{х) (mod h(x)). Таким образом, порядок любого элемента поля Zp[x]/h(x) не превосходит рг — 1. Так как г < т, то в этом поле нет порождающего элемента, что противоречит теореме 8.1. Поэтому двучлен хрп —х является произведением всех неприводимых многочленов, степени которых делят гг. Пусть h(x) — один из таких многочленов. Покажем, что хрП — χ не делится на
8.2. Разложение хрП — χ па множители 261 (h(x))2. Для этого рассмотрим формальную производную произведения квадрата h(x) и произвольного многочлена д{х)* Легко видеть, что (h(x)2g(x))' = 2h(x)ti(x)g(x) + h(x)2g'(x) = = h(x)(2ti(x)g(x) + h(x)g'(x)). Поэтому производная произведения (h(x))2g(x) либо делится на h(x), либо равна нулю (если 2h!(x)g{x) +h(x)gf(x) = 0). Дифференцируя хрп —χ, легко находим, что производная этого двучлена равна минус единице. Таким образом, в разложении хрП — χ на неприводимые многочлены нет кратных множителей. Следовательно, хрП — χ = JJ/i(x), где произведение берется по всем неприводимым многочленам, степени которых делят п. Теорема доказана. Пример 8.5* В Z2[x] при η = 3 равенство (8.9) принимает вид х23 - χ = х(х + 1)(х3 + х2 + 1)(х3 + χ + 1), D Из теоремы 8*2 легко извлекается доказанное на с. 116 с использованием метода производящих функций рекуррентное равенство для числа N(p, m) неприводимых над Ζρ многочленов степени га: рп = V^ mN(p,m). т\п Пример 8*6* Чтобы проиллюстрировать это утверждение, найдем число неприводимых многочленов степени 15 над Z2 с помощью теоремы 8.2, независимо от результатов раздела 4.6. Обозначим через Fi(x) произведение всех различных неприводимых над Z2 многочленов, степень которых равна г. Тогда, согласно (8.9), х215 -х = Fi(x)Fs(x)F5(x)F15{x)y причем F\(x)Fs{x) = х2% — х и Fi(x)Fs(x) = χ2* - χ. Отсюда 915 915 F15{X) = (FiF3)(FiF5) ' Fl = (χ*-χ)(χ*-χ) ' ^ ~Χ)'
262 Глава 8. Конечные поля Следовательно, степень многочлена Fi5(x) равна 215 - 23 - 25+ +2 = 32730. Зная эту степень, можно найти число сомножителей в Fi57 не выписывая сам многочлен F15 явно. Очевидно, что оно равно 32730/15 = 2182. Таким образом, JV(2,15) = 2182 при ρ = 2. D Теорема 8.2 исключительно важна для теории конечных полей и многочленов над конечными полями. Приведем еще один пример ее применения. Пример 8.7* Используем двучлены хр — χ для проверки неприводимости. Пусть / = f(x) € Ър[х] — многочлен, который мы хотим проверить на неприводимость, и пусть η = deg/. Очевидно, что / приводим в том и только в том случае, когда он имеет неприводимый делитель д = д(х) степени г < [п/2\. С другой стороны, как мы убедились выше, каждый неприводимый над Ър многочлен степени г является делителем двучлена хрГ — х. Отсюда получаем простой тест (не)приводимости: многочлен / приводим, если он не взаимно прост с одним из двучленов хрт — χ при 1 ^ г < [ть/2\. В противном случае / неприводим. На рис. 8.1 представлена возможная реализация этого алгоритма на псевдокоде. Она использует подпрограмму gcd вычисления НОД двух многочленов, подпрограмму deg, определяющую степень многочлена, и две вспомогательные переменные — целочисленную г и переменную D типа «многочлен». i· D = x ; 2. for( r = l ; r< [n/2\ ; r++ ) { 3. D = DP (mod/) ; 4. if( deg gcd(D — x9f) >0 ) print «/ приводим»;} 5. print «/ неприводим» Рис. 8Л В обоснование ее корректности отметим, что (#, К) равен (д mod /ι, h) для всех g,h E Zp[cc], поэтому для сокращения вычислений переменная D на очередном шаге цикла 2—4 вместо
8.2. Разложение хр — χ на множители 263 самого одночлена хрТ содержит его остаток от деления на /. Поэтому на каждом шаге цикла происходит проверка взаимной простоты многочлена / с многочленом хр — #, то есть со всеми неприводимыми многочленами степени г (и, возможно, некоторых меньших степеней, а именно остальных делителей числа г). Оценим сложность предложенного алгоритма. Самым трудоемким является вычисление НОД в строке 4. «Школьная» реализация алгоритма Евклида требует для нахождения НОД двух многочленов степени не выше η около п2 операций в поле их коэффициентов. При использовании эффективных алгоритмов деления многочленов и «быстрой» реализации алгоритма Евклида1^ их число снижается до 0(n\og2 n). Шаги 3 и 4 будут повторены не более \п/2J раз. Таким образом, общая сложность алгоритма даже при «наивной» реализации составляет не более 0(п3) операций в Zp и может быть снижена до 0(п2 log2 n). Для больших η это существенно лучше, чем последовательное деление f(x) на все неприводимые многочлены степеней до [п/2\ включительно: уже только размер таблицы неприводимых многочленов растет не медленнее, чем сп для некоторой константы с > 1 (см. пример 4.17), а значит табличный способ экспоненциален. Тем не менее он удобен тем, что однажды построенную таблицу можно использовать многократно. В заключение заметим, что данный алгоритм легко может быть улучшен: вычислять НОД в строке 4 можно не при всех г, а только начиная с г = [п/4\ + 1. Например, для многочлена / степени 20 достаточно проверить его взаимную простоту только с двучленами хрГ —х для г = 6,7,8,9,10, так как, например, двучлен хр — χ делит хр — х. О Замечание 8.1. Количество неприводимых над Zp многочленов степени η асимптотически равно рп/п, как было показано в разделе 4.7. Отсюда следует, что доля неприводимых среди всех нормированных многочленов степени η примерно равна 1/п. Это наблюдение дает простой вероятностный алгоритм построения неприводимого многочлена заданной степени п: выбрать его наугад из рп нормированных многочленов степени η а)См. [5, 9, 29, 30].
264 Глава 8. Конечные поля и проверить на неприводимость, используя, скажем, метод примера 8.7» Если выбранный многочлен окажется приводимым, то проверить другой случайный многочлен и т.д. Среднее число итераций при этом равно п, и поэтому данный вероятностный метод полиномиален, но в худшем случае оно может оказаться и большим. Детерминированные полиномиальные алгоритмы для этой задачи появились только в 80-х годах XX века. На данный момент лучшим из них является метод Шоупа. Самый быстрый вероятностный алгоритм принадлежит ему же1). Теперь сформулируем два простых, но важных свойства формальной производной многочлена над конечным полем, на которые будем опираться в дальнейшем в разделах 8.5 и 9.1. Лемма 8*3* Пусть f(x) 6 Zp[x]. Тогда f(x) = 0 β том и только в том случае, когда найдется такой многочлен д(х) £ е Ζρ[χ\, что f(x) = д(хр). Доказательство. Предположим, что f(x) = д(хр) = (д{х))р (лемма 8.2), тогда многочлен имеет вид f(x) = Σ£=ο aixP%'-> где η = degρ, сц £ Ζρ· Отсюда имеем η η fix) = j2ai'pi' χΡί~λ = Σα* * ° · χΡί~λ = °> i=l i=l так как в кольце Ър\х\ сумма любых ρ одинаковых слагаемых равна нулю. С другой стороны, если f(x) = 5^£=о^г#г и f(x) = 0, то все коэффициенты многочлена f{x) нулевые. Согласно определению производной, коэффициент при хг~1 в f(x) равен г · &$. Нетрудно убедиться, что г · b = 0 при г ^ 0 и b € Ър тогда и только тогда, когда г = 0 mod ρ или Ъ = 0. Поэтому bi = 0 при всех г = 0,..., п, не кратных р. Следовательно, f(x) = g(xp) для некоторого д(х) € Ър[х\. Лемма доказана. Лемма 8,4, Пусть f(x) G Ър\х\. Тогда в разложении многочлена f(x) в произведение неприводимых над Ър делителей отсутствуют кратные множители тогда и только тогда, когда он взаимно прост со своей производной. ^Эти алгоритмы см. в [31] и [32].
8.3. Структура конечного поля 265 Доказательство. В одну сторону утверждение было уже получено при доказательстве теоремы 8.2: если (/,/') = 1, то в разложении / отсутствуют кратные множители. Предположим теперь, что (/,/') φ 1. В этом случае существует неприводимый многочлен /г, делящий одновременно и /, и /;. Поэтому / = ah, f = 6/i, где α, b € Zp^r]. Дифференцируя / = α/ι, получаем /' = (ah)' = afh + ati = ftfc, откуда следует, что h делит произведение ah!. При этом не может случиться так, что ah1 = 0, иначе ft' = 0 и по лемме 8.3 многочлен h является степенью некоторого другого многочлена, что противоречит его неприводимости. Кроме того, degft/ < cleg ft. и поэтому h \ ft'. Но h | aft', следовательно, h | а, откуда а — ah и / = ah = ah2, т.е. в разложении / присутствуют кратные множители. Лемма доказана. 8.3. Структура конечного поля 1. Характеристика поля. Сумму к одинаковых элементов χ поля F будем обозначать через к · х. Характеристикой поля ¥ называется минимальное натуральное число т, для которого т - 1 = 0, а если такого числа нет, то говорят, что характеристика поля равна нулю. Характеристика любого конечного поля является простым числом. Действительно, если это не так и существует конечное поле ¥ характеристики т = fcs, то в силу дистрибутивности (к · 1)(з · 1) = (1 + · · · + 1)(1 + · · · + 1) = к единиц s единиц = (1 + ■■··■■·■■ + 1) = (Ь) -1 = 0, к χ s единиц откуда следует, что в ¥ есть делители нуля, что, как было показано выше (с. 91), невозможно. Подмножество F; элементов поля F называется подполем поля F, если F' замкнуто и является полем относительно операций
266 Глава 8. Конечные поля поля F. Если F; — подполе поля F, то F называется расширением поля F'. Поле называется простым, если оно не имеет собственного подполя. Очевидно, что при любом простом ρ поле Ζρ будет простым, и порядок любого простого поля будет простым числом. Также нетрудно видеть, что в любом конечном поле существует простое подполе, порожденное его единичным элементом, и других простых под полей в нем нет. Пример 8*8* В рассмотренном выше поле Ъ$[х\/{х^-\-2х + 1) из примера 8.1 его единица порождает поле Ζ3, которое и будет простым подполем исходного поля. D Два поля F и F; называются изоморфными, если существует такое взаимно однозначное отображение φ поля F в поле F', что (p(ab) = φ(ά)φ(δ) и φ(α + b) = φ{ά) + (p(b) для любых элементов а и b поля F. Лемма 8.5. Пусть ρ — простое. Любое конечное поле F из ρ элементов изоморфно полю Ζρ. Доказательство. Пусть 1 — единица поля F. Любой элемент поля F можно представить в виде fcl — суммы к единиц этого поля. Очевидно, что nl = [п]р1 при любом η из N. Тогда для отображения φ из F в Ζρ, заданного равенством φ{η1) = η, и для любых к и т из {0,1,... ,р — 1} справедливо равенство ^(fcl + ml) = tp{{k + m)l) = <р(\к + m]pl) = = [к + m}p = [к]р + [m]p = <p(kl) + φ(πιί). Аналогичное равенство имеет место для умножения: φ{Ηΐ · ml) = φ{{Ιζ - τή)ί) = y>([& · m]pl) = = [к · m]p = [к]р · [m]p = <p{kl) · <p(ml). Следовательно, φ — изоморфизм. Лемма доказана. 2, Корни неприводимых многочленов. Далее будем вычислять значения многочленов из Ър[х] на элементах полей характеристики р, рассматривая одночлены ахк, где а £ Ζρ, как сумму а одночленов хк. В свете леммы 8.5 будем также отождествлять простые подполя полей характеристики ρ с полем Ζρ.
8.3. Структура конечного поля 267 Теорема 8.3. Любое конечное поле ¥ характеристики ρ состоит из рп элементов, где η — целое неотрицательное, и χρη ~х = Π(χ~α)- (8·12) Доказательство. В поле F характеристики ρ существует простое подполе F' из ρ элементов, порожденное единичным элементом. Легко проверить, что поле F будет линейным конечномерным пространством над своим простым подполем F', и поэтому число элементов в поле F будет натуральной степенью числа элементов в его простом подполе F'. Теперь равенство (8.12) легко следует из единственности разложения многочлена над полем на множители, леммы 4.5 и того, что каждый ненулевой элемент поля F в степени, равной порядку мультипликативной группы, равен единице, т. е. является корнем двучлена хрП~1 — 1. Теорема доказана. Пример 8.9. Поле F из примера 8Λ является трехмерным линейным пространством над полем Ζ3. Его элементы 1 = = (001), χ = (010) и х2 = (100) образуют базис. Каждый элемент из F является простым корнем двучлена х27 — х) а каждый элемент из F* — корнем х26 — 1. D Теорема 8.4. В любом поле F из рп элементов каждый элемент поля является простым корнем неприводимого над Ър многочлена, степень которого делит п. Доказательство. Каждый элемент поля F является корнем двучлена хрП —х, который в силу теоремы 8.2 разлагается в произведение всех нормированных неприводимых над Ζρ многочленов, степени которых делят п. Так как хрП — χ не имеет кратных множителей, то каждый элемент поля ¥ будет простым корнем одного из этих неприводимых над Ър многочленов. Теорема доказана. Пример 8.10. Рассмотрим произвольное πoлeF из 27 элементов. По крайней мере одно такое поле характеристики 3 существует, оно было рассмотрено в примере 8.1. В ¥ найдутся изоморфное Ζ3 простое подполе F' и элемент α — корень неприводимого над Zs многочлена х3 + 2х +1. Поле F будет трехмерным
268 Глава 8. Конечные поля линейным пространством над подполем F*\ элементы которого можно обозначить 0,1, 2. Здесь 0 и 1 являются нейтральными по сложению и умножению элементами вР, а значит, и в F; элемент 2 = 1 + 1 является третьим в простом подполе. Так как а3 = а + 2, то, повторяя вычисления примера 8.1, находим все степени а (ниже выписаны наборы коэффициентов (а, Ь, с) линейных комбинаций ао? -\-ba-\-c над полем F', представляющих элементы ak € F*): а° а1 а2 а3 а4 а5 а6 = (001), = (010), = (юо), = (012), = (120), = (212), = (111), а7 а8 а9 а10 а11 а12 а13 = (122), = (202), = (он), = (но), = (112), = (102), = (002), аи а15 а1в а17 а18: а19 а20 = (020), = (200), = (021), = (210), = (121), = (222), = (2И), а21 а22 а23 а24 а25 = (101), = (022), = (220), = (221), = (201). (8.13) Из этой таблицы нетрудно видеть, что элементы от, а и 1 образуют базис пространства F над F;, и каждый элемент поля F можно однозначно представить набором координат в этом базисе. Сравнивая таблицы (8.13) и (8.1), несложно показать, что ¥ — произвольное поле из 27 элементов, — изоморфно полю Z$[x]/(xs + 2х + 1). Это не случайный факт, а частный случай общей ситуации, рассматриваемой ниже в теореме 8.8. D Теорема 8*5. Пусть поле ¥ состоит из рп элементов, а его элемент а — корень неприводимого над Ър многочлена степени п. Тогда любой элемент поля F единственным образом представляется линейной комбинацией элементов 1, се,..., αη_1 с коэффициентами из его простого подполя. Доказательство. Прежде всего заметим, что существует ровно рп различных линейных комбинаций из элементов 1, а,..., ап~1 с коэффициентами из простого подполя, и каждая линейная комбинация является элементом поля F. Более того, среди этих линейных комбинаций нет двух, равных одному и тому же
8.3. Структура конечного поля 269 элементу поля F, так как в противном случае разность двух равных линейных комбинаций будет ненулевой линейной комбинацией, равной нулевому элементу поля. Нетрудно показать, что существование такой линейной комбинации равносильно тому, что а будет корнем многочлена степени не больше п— 1, что, очевидно, противоречит тому, что а является корнем неприводимого многочлена степени гг. Теорема доказана. Теорема 8.5 показывает, что поле ¥ из рп элементов с простым подполем ¥р можно представить как множество многочленов Fp[oi], где а — корень неприводимого над Ър многочлена h(x) степени п, со сложением и умножением по модулю многочлена h(a). Пример 8Л1. Построим поле Ζ2[α] из 16 элементов, добавив к полю Ζ2 корень а неприводимого над Ζ2 многочлена х4 +х +1 и все те элементы, которые можно получить из 0, 1 и о; при помощи операций сложения и умножения. Легко видеть, что ^[а] состоит из различных многочленов / от а с коэффициентами из Ζ2. А так как а4 = а +1, то каждая степень а большая трех будет линейной комбинацией первых четырех степеней. Таким образом, Ъ^[о\ содержит ровно 16 элементов и является линейным пространством над Ζ2, порожденным элементами α3, α2, а, 1* Если произведение /(а) · д(а) разделить с остатком на а4 + а + 1, то f(a) · д(а) = (а4 + а + 1) · q(a) + г (а) = г (а) для любых /(а) и g(ot). Поэтому умножение в ^[а] определим как умножение многочленов по модулю многочлена а4 + а + 1. Про поле Ζ2[α] будем говорить, что оно получено расширением поля Ζ2 элементом а. Покажем, что Ζ2[α] действительно будет полем. Для этого проверим единственное нетривиальное в данном случае свойство поля — установим существование обратного по умножению для каждого ненулевого элемента /(а). Так как а4 + а + 1 и f(a) взаимно простые, то в силу теоремы 4.10 найдутся такие многочлены s(а) и ΐ(α), что 1 = s(a)(a4 + а + 1) +ί(α)/(α), причем степени s(a) и t(a) не превосходят трех (если это не так, то вместо многочленов s(a) и
270 Глава 8. Конечные поля t{a) можно взять их остатки от деления на а4 +а +1). Поэтому t(a)f(a) = 1 + s(a)(a4 + а + 1) = 1 + s(a) -0 = 1, и ί(α) будет обратным элементом по умножению для /(а). Таким образом, Ζ2[α] — поле из 16 элементов. Так как α3 φ 1 и а5 = а2 + а ф 1, то а будет порождающим элементом мультипликативной группы поля. Представляя элементы поля Ζ2[α] наборами их коэффициентов в базисе (а8, а2, а, 1), видим, что степени а в этом поле выглядят следующим образом: «° а1 а2 а3 а4 = (0001), = (0010), = (0100), = (1000), = (0011), а5 а6 а7 а8 а9 = (ОНО), = (1Ю0), = (1011), = (οίοι), = (1010), а10 = а" = а12-- а13-- аи-- = (0111), = (1110), = (1111), = (1101), = (1001). D Теорема 8.6. В любом поле ¥ из рп элементов для любого т, являющегося делителем п, существует единственное подполе из рш элементов. Других подполей в поле ¥ нет. Доказательство. Если F' — подполе поля F, то F будет линейным пространством над своим подполем F'. В этом случае найдется натуральное к такое, что рп = \¥'\к. Очевидно, что последнее равенство возможно только в том случае, когда η = km. Теперь покажем, что если т делит гс, то в F существует подполе изрт элементов. Рассмотрим множество N элементов поля F, являющихся корнями всех неприводимых многочленов, степени которых равны т или делят т. Из теоремы 8.4 следует, что каждый из этих элементов является корнем двучлена хр — х. Покажем, что сумма и произведение любых двух элементов из N также принадлежат этому множеству. Если аР™ — а = 0 и ifm — b = 0, то в силу равенства (8.6), справедливого, очевидно,
8.3. Структура конечного поля 271 в любом поле характеристики р, (a + bfm -(a + b) = (a?m +V>™)-(a + b) = = (а?т -а) + (№т - Ъ) = О, т. е. сумма α + b принадлежит N. Аналогичная цепочка равенств имеет место и для произведения ab: (abfm -ab = dTlT -ab = ab-ab = 0. Таким образом множество N замкнуто относительно сложения и умножения. Также нетрудно видеть, что если а является корнем двучлена хр™ — х, то и его обратные элементы по сложению и умножению будут корнями этого двучлена. Следовательно, N является полем. Наконец заметим, что мультипликативная группа подполя будет подгруппой мультипликативной группы поля. Поэтому единственность подполя из рш элементов в поле из рп элементов легко следует из теоремы 3.13. Теорема доказана. Пример 8.12, В поле Ζ2[α] из предыдущего примера есть два нетривиальных подполя — простое подполе Ζ2 и подполе из четырех элементов, состоящее из нуля, единицы и элементов а5 и а10. Из таблицы 8.14 степеней а видно, что ненулевые элементы второго подполя связаны равенством а10 + а5 = 1. □ 3. Изоморфные поля. Пусть а — произвольный элемент поля 2 к — 1 к из рп элементов. Элементы αρ,αρ г..,ар , где аР = а, называются сопряженными с а. Так как в поле из рп элементов арП = а, то а имеет не более тг — 1 сопряженных элементов. Теорема 8,7, Если а — корень неприводимого над Ζρ многочлена h(x) степени к, то корнями этого многочлена являются все элементы, сопряженные с а, и других корней многочлен h(x) не имеет. Доказательство. Так как (h(x))p = h(xp), то очевидно, что любой элемент, сопряженный с си, будет корнем многочлена h(x). Поэтому для доказательства теоремы достаточно показать, что 2 к— 1 все элементы а, ар, ар ,..., ар различны. Допустим, что это
272 Глава 8. Конечные поля не так и арт = а при т < к. Тогда а будет корнем многочлена хрт — χ и, в силу теоремы 8.2, будет также корнем неприводимого многочлена д(х) степени ί, где t является делителем т. Разделив неприводимый многочлен h(x) на #(#), получим, что h(x) = g(x)f(x) + г(х), где г(х) Φ 0 и degr(x) < t < πι < к. Так как h(a) = 0 и д(а) = 0, то очевидно, что и г(а) = 0. Вместе с α корнями многочлена г(х) должны быть и все элементы, сопряженные с а, т. е. число корней многочлена г(х) не меньше ш, что, очевидно, невозможно, так как его степень строго меньше га. Таким образом, сделанное предположение ложно и т = к. Теорема доказана. Пусть F — поле из рп элементов, а — элемент этого поля. Нормированный многочлен f(x) из Ър[х\ называется минимальным многочленом элемента а, если /(а) = 0 и степень многочлена / минимальна среди всех многочленов положительной степени из Ър[х\, для которых а является корнем. Из леммы 8.2 и доказательства теоремы 8.5 легко следует, что для любого а существует единственный минимальный многочлен, этот многочлен является неприводимым над Zp[#], и его корнями в ¥ являются вместе с а все элементы, сопряженные с а. Минимальный многочлен элемента а обозначается та(х). Пример 8ЛЗ. Найдем минимальный многочлен элемента (212) поля F из примера 8.10. Так как элемент (212) является пятой степенью примитивного элемента а, то с (212) = а5 будут сопряжены два элемента (а5)3 = а15 и (а5)9 = а45 = а19. Поэтому ^(212)(я) = (х ~ ос5)(х - а15)(х - а19). Раскрывая скобки и приводя подобные слагаемые при помощи таблицы (8.13), находим минимальный многочлен: ^(212)0*0 = (х- а5)(х - а15)(х - а19) = = х3 - (а5 + а15 + а19)*2 + (а20 + а24 + as)x - а13 = = Xs - х2 + χ - 2 = х3 + 2х2 + χ + 1. D
8.3. Структура конечного поля 273 Пример 8Л4« Покажем, что мультипликативные порядки всех корней неприводимого многочлена совпадают. Действительно, согласно теореме 8.7, все корни неприводимого многочлена f(x) Ε Ър[х\ сопряжены. В частности, если/3,7 — корни f(x) в поле Fpn, то найдется такое целое £, что 7 = βΡ · В циклической группе (/3), образованной элемен- к ι том /3, порядок элемента βΡ равен |/3|/(|/3|,р ), где |/3| — порядок к элемента /3. Одновременно порядки элементов β и βρ должны быть делителями порядка рп—1 мультипликативной группы F*n. Но любой делитель числа рп — 1 взаимно прост с числом рк. Поэтому (|/3|,р*) = 1 и |/3^| = |/3|. D Теорема 8*8. Любые два конечных поля, состоящие из одного и того лее числа элементов, изоморфны. Доказательство. Пусть ρ — простое, h(x) — нормированный неприводимый над Ър многочлен степени η из Ър[х\. Покажем, что произвольное поле из рп элементов изоморфно полю Zp[x]/h(x). В силу леммы 8.5 далее без ограничения общности будем полагать, что простое подполе поля F совпадает с полем Zp. В поле IF выберем элемент а, являющийся корнем многочлена h(x). Покажем, что отображение п—1 п—1 ψ : ^2 αία% ~^ Σ aiX% i=0 i=0 поля IF в поле Zp[x]/h(x) будет искомым изоморфизмом. Очевидно, что φ взаимнооднозначно, линейно и в силу своей линейности сохраняет операцию сложения. Поэтому для доказательства теоремы достаточно показать, что φ сохраняет умножение. Каждый элемент а = Σ?=Γο αία% поля F будем рассматривать как многочлен а(а) относительно а. В силу законов дистрибутивности умножение элементов а = Σ™Γ0 α*α* и ^ = Σ£ο ^^ поля F производится так же, как и умножение многочленов. Поэтому справедливо равенство ab = а{а)Ь{а) = c(a)h(a) + г(а),
274 Глава 8. Конечные поля где г(а) —остаток отделения многочлена а(а)Ь(а) на многочлен h(a)> Так как h(a) = 0, то ab = г (а). Поэтому <р(а(а))<р(Ь(а)) = а(х)Ь(х) = г(х) = φ(ν(α))) т. е. ^ действительно сохраняет умножение. Теорема доказана. Конечные поля, отличные от полей Ζρ? впервые появились в работе французского математика Эвариста Галуа в 1830 г. в виде множества корней двучлена хрП —х. Сейчас любое конечное поле называется полем Галуа, и для поля из рп элементов часто используется единое обозначение GF(pn). 4. Примитивные многочлены* Многочлен h(x) из Ър[х\ называется примитивным многочленом, если он является минимальным многочленом примитивного элемента поля из рп элементов. Из примера 8.14 следует примитивность всех корней примитивного многочлена. Поэтому в силу теорем 8.7 и 3.14 справедливо следующее утверждение. Теорема 8.9* В кольце Ър[х\, где ρ — простое, существует ровно φ(ρη — 1)/п примитивных многочленов степени п. Пример 8Л5. Так как у>(15) = 8, то в Ъ£$[ существует ровно два примитивных многочлена четвертой степени. В то же время из теоремы 4.13 следует существование в Ъ^[х\ трех неприводимых многочленов четвертой степени. Таким образом, один из этих трех неприводимых многочленов не является примитивным. Найдем такой многочлен. Для этого воспользуемся полем Ъ^\а\ из примера 8.11, где а — корень неприводимого многочлена х*+х+1. Среди 15 ненулевых элементов поля Ζ2[α] непримитивными будут следующие степени а: 0,3, 5, б, 9,10,12. Из этих степеней 5-я и 10-я будут корнями единственного неприводимого многочлена второй степени χ2 + χ + 1, а нулевая степень — корнем х + 1. Следовательно, четыре оставшиеся степени 3, б, 9, 12 — корни искомого многочлена f(x) = х4 + /зхг + f2X2 + fix + /ο· (8.15)
8.3. Структура конечного поля 275 Подставив в (8.15) вместо переменной χ его корни а3,ав,а .9 и Л 2 а , получим систему из четырех линейных уравнений с четырьмя неизвестными: (а3)4 + /з (а3)3 + /2 (а3)2 + h (а3) + /о = 0, 1 ,.6\4 ..6\3 6\2 (аТ + /з {аУ + /2 (α Υ + Д (а0) + /о = О, > (8.16) (а9)4 + /з (а9)3 + h (а9)2 + /ι (а9) + /о = О, (а12)4 + /з(а12)3+ /2Ю2+ h(a12)+ /о = 0. j Так как многочлен /(а?) неприводим над Z2, то его свободный член равен единице. Поэтому в (8Λ6) вместо /о подставим единицу, после чего из системы удалим последнее уравнение — для нахождения трех оставшихся коэффициентов достаточно трех уравнений. В результате получим (учитывая, что 1 = —1 в поле Z2) новую систему /з^ + /2^6 + /ια3 = 1 + α12=αη, /aa3 + /2a12 + /ia6 = l+a9 =α7 , ha12 + f2a3 +/ι^9 = 1 + α6 =αλ\ Для решения последней системы воспользуемся формулами Крамера. Вычислив необходимые для этого определители а* аи det la3 а12 det I а7 π а" vCt 12 αυ α° а α3 12 α* det α3 ,α 12 α9 α» det a3 ,α 12 ο; α7 α3 η\ α 11 и подставив найденные значения в (6.10), видим, что все коэффициенты искомого многочлена равны единице. Таким образом, f(x) = х4 + х3 + х2 + х + 1. □ 5* Нормальный базис* Покажем, что в поле GF(pn) найдется такой элемент а, что все элементы а, ар,. >., арП , сопряженные с ним, образуют базис поля GF(pn), рассматриваемого как линейное пространство F71 над его простым подполем F. Такой базис называется нормальным базисом поля.
276 Глава 8. Конечные поля Теорема 8*10* В поле GF(pn) существует нормальный базис. Доказательство. В пространстве ¥п рассмотрим линейный оператор А : а —> ар, линейность которого является простым следствием справедливых для любых α, β из F™ и любого а из F равенств Α{α + β)=Α(α)+Α{β), А(аа) = аА(а), которые в свою очередь легко следуют из леммы 8.2. Заметим, что Ап(а) = арП = а. Поэтому (хп — 1)(А)(а) = О для каждого а. Таким образом, двучлен хп — 1 является анну- лятором каждого элемента из Fn, а следовательно, и всего пространства ¥п с действующим на нем оператором А. Если окажется, что хп — 1 не только аннулятор, но еще и минимальный многочлен n-мерного пространства Ш™, то в силу теоремы 6.9 это пространство будет циклическим, т. е. в нем найдется базис a,A{a),A2{a)^..,An-\a), (8.17) порождаемый некоторым вектором а. Так как А (а) = ар , то базис (8.17) будет нормальным базисом поля GF{pn). Таким образом, для доказательства теоремы достаточно установить, что двучлен хп — 1 будет минимальным многочленом пространства F™. В свою очередь хп — 1 будет минимальным многочленом, если для любого многочлена а(х) = ао + а\Х+ -\ Ь ап-\Хп~1 меньшей степени в поле GF(pn) найдется такой элемент а, что а(х)(А)(а) = а0а + агар + · · · + αη-ιαρη_1 φ 0. (8.18) Допустим, что это не так, и в поле GF(p) найдутся такие одновременно не равные нулю Ьо, · · · > Ьп-ь что 6о/3 + 6ι/3ρ Ч + bn-ip^'1 = 0 для каждого β е GF(pn). (8.19)
8.4- Арифметика в конечных полях 277 Пусть «о ~~ порождающий элемент мультипликативной группы поля GF(pn). Из предположения (8.19) следует, что равенство (8.20) 0 = b0ak0 + ЬМУ + ■■■ + Ьп-МТ"'1 = = boaS + 6ιΚ)* + · · · + 6n-i(of "У справедливо при к = 0,1,... ,тг — 1. Переписывая равенства (8.20) в матричной форме, видим, что они эквивалентны равенству \ / ι «о W"1 «о «о 1 п-1 кг1 ... (οΓ1)*-1/ bi \bn-l) /0\ 0 w (8.21) с матрицей Вандермонда. Так как Oq /Oq при 0 < г ^ j < ^ η — 1, то в силу леммы 5.5 матрица Вандермонда невырождена, и, следовательно, (8.21) справедливо только если все bi = 0. Полученное противоречие гарантирует, что в поле GF(pn) для любого многочлена, степень которого меньше п, найдется элемент а, удовлетворяющий неравенству (8.18)» Следовательно, хп — 1 будет минимальным многочленом Fn. Теорема доказана. Пример 8Л6. Пусть F — рассмотренное в примере 8.10 на с. 267 поле из 27 элементов с примитивным элементом а. Так как а1 = (010), а3 = (012), а9 = (011), а2 = (100), а6 = (111), а18 = (121), то легко видеть, что элементы а, а3, а3 не образуют нормальный базис bF, вто время как элементы а2, (а2)3, (а2)3 такой базис образуют. D 8·4· Арифметика в конечных полях В практических приложениях теории конечных полей приходится производить вычисления в конкретном поле, обычно представленном как поле вычетов по какому-либо модулю. Первые
278 Глава 8. Конечные поля примеры данного раздела посвящены развитию навыков подобных вычислений в простейших случаях и могут быть без ущерба пропущены подготовленным читателем. Еще несколько примеров иллюстрируют полученные в предыдущих разделах общие свойства полей и многочленов над ними, которые часто помогают такие вычисления значительно упростить. Разберем сначала вопросы о примитивных многочленах и примитивных элементах в полях-расширениях. Пример 8Л7* Неприводимый над Z3 многочлен f(x) = х{х + 1)(х + 2) + 1 = Xs + 2х + 1 из примера 4.18 является примитивным, и, как показывает пример 8.1 и замечание 4.2, любой ненулевой элемент поля F27 = = %з[х]//(х) представляется степенью вычета а = χ (порядок которого в группе F^7 равен 26) и а — корень многочлена /(х). Полученная при этом таблица, сопоставляющая каждому ненулевому вычету его логарифм по «основанию» а, называется таблицей дискретных логарифмов поля Z^[x]/f(x). Отметим, что для доказательства примитивности элемента α = χ и, как следствие, многочлена /(#), не обязательно было строить всю таблицу целиком: по лемме 8.1 достаточно было лишь проверить, что χ2 φ 1 (mod /) и что χ13 φ 1 (mod /). Первое из этих неравенств очевидно. Второе можно проверить, например, поделив хп на f(x) в столбик: х1г = 2 (mod /). D Корень многочлена большой степени имеет, вообще говоря, большой порядок. В таком случае деление в столбик или составление таблицы логарифмов слишком громоздки и значительно проще произвести несколько приведений по модулю, как в примере 8*3» Пример 8Λ8* Покажем, что многочлен f(x) = х9+х4 + 1 примитивен над Z2- Он неприводим (см. пример 4.15 на с. 114). Так- 23 же это следует из его взаимной простоты с двучленами аг — χ и χ2 — χ (пример 8.7), в чем нетрудно убедиться непосредственно. Так как 29 — 1 = 511 = 7-73, где 7 и 73 — простые числа, и очевидно χ1 φ 1 (mod /), то достаточно проверить, что х7г φ 1
8.4· Арифметика в конечных полях 279 (mod /). Вычислим остаток х73: х™ = (χη*.χ = (χ4 +1)8. χ = (χ16 +1)4 .х = = (χ9 . х7 + I)4 . χ = ((ж4 + 1) · х7 + I)4 · χ = = (я11 + ж7 + I)4 · χ = (х7 + х6 + х2 + I)4 · χ = = (χ14+χ12+χ4 + ΐ)2·χ = = (х5(х4 + 1) + х3(х4 + 1) + х4 + I)2 · χ = = (х9 + х5 + х7 + х3 + х4 + 1)2 · з = = (х4 + 1 + х5 + х7 + х3 + х4 + I)2 -х = = (χ7 + χ5 + χ3)2 · χ = (х14 + х10 + х6) · χ = = (х5(х4 + 1) + (х5 + х) + х6) · х = = (х6 + х4+х + 1) -х = = χ7 + χ5 + χ2 + χ φ 1 (mod (χ9 + χ4 + 1)). Здесь мы неоднократно воспользовались тем, что х9 = х4 + 1 (mod /), а также леммой 8*2. Таким образом, многочлен / примитивен. D Пример 8.18 наглядно показывает, что число битовых операций (в общем случае операций в поле коэффициентов) по модулю многочлена / пропорционально числу его ненулевых коэффициентов. Поэтому с точки зрения сложности вычислений в поле остатков по модулю / выгоднее тот многочлен, у которого больше нулевых членов. Таблицы таких многочленов составлены для весьма значительных степеней и могут быть найдены в специальной литературе. Перейдем теперь к арифметическим операциям в полях- расширениях. Пример 8Л9* Найдем обратный к вычету д(х) = х7 + х6 + +х3+х+1 по модулю многочлена f(x) = х9 + х4 + 1 € ^[х]. Мы уже доказали примитивность многочлена /(х) в примере 8.18, следовательно, вычет д(х) φ О обратим по модулю /(х). Чтобы найти g~l (mod /), воспользуемся расширенным алгоритмом Евклида из леммы 4.6 (ниже многочлены представлены в
280 Глава 8. Конечные поля векторной записи, а таблица алгоритма, приведенная в конце примера, транспонирована). В этой таблице первые два столбца отведены под коэффициенты Везу, третий — столбец остатков, четвертый — неполные частные очередного шага. На последнем шаге получаем, что (1101011) · / + (100100110) ·£ = (1), или, в алгебраической форме, (я6 + х5 + х3 + χ + 1) · / + (х8 + х5 + х2 + х) · д = 1. Рассмотрев остатки от деления на / обеих частей этого равенства, находим, что (xs + χ5 + χ2 + χ) · g = 1 (mod /), то есть g~l(x) = xs +х5 +х2 +х (mod f(x)). 1 0 1 10 11101 1101011 0 1 111 1111 1011101 100100110 1000010001 11001011 1100000 1011 10 1 111 10 1110 101 Аналогично находятся обратные и к другим элементам рассматриваемого поля Z2 [#]//(#). □ В случае, когда поле Zp[x]/f(x) относительно небольшое, а количество вычислений с его элементами велико, операции по модулю многочлена / удобно осуществлять не непосредственно, как в предыдущем примере, а сводить их к поиску по вспомогательной таблице. Таблица Кэли для этих целей подходит плохо, так как ее размер, равный квадрату порядка группы, требует относительно большого объема памяти. Компромиссным решением является таблица логарифмов (или ее часть), построенная на основе свойства цикличности мультипликативной группы (Zp[x]/f)* и имеющая линейный, относительно ее порядка, размер. Проиллюстрируем этот подход несколькими примерами.
8.4· Арифметика в конечных полях 281 Пример 8.20* Построим таблицу дискретных логарифмов поля F8 = Z2[x]/(x3 + x + l). Многочлен f(x) = χ3 +x + 1 неприводим над Z2 (см. с. 113). Поэтому группа F§ = (Z2M//)* — циклическая, то есть существует такой вычет a G F|, что F§ = {α)γ> В силу того что |F|| = 7 — простое число, многочлен f(x) примитивен. Поэтому для удобства будем считать, что а является его корнем χ в Fs, хотя в ¥$ есть и другие примитивные элементы. Каждый элемент β нашего поля имеет как минимум три представления — он является вычетом по модулю /, вектором линейного векторного пространства Fg размерности 3 над простым подполем Z2, и, наконец, если β φ О, то он является некоторой степенью элемента а: существует такое число k = loga β) 0 ^ к < 6, что β = ак. Первые два представления связаны очевидным образом: вектором, представляющим какой-либо элемент поля, является набор коэффициентов соответствующего многочлена как вычета по модулю / (старшие коэффициенты записываются, как обычно, слева). В частности, а = [х] = (010) и а0 = [1] = (001). Найдем представления остальных элементов поля Fg. Для этого будем последовательно рассматривать подряд идущие степени а и вычислять их остатки по модулю /. Так, очевидно, а2 = [х2] = (100). Однако при к = 3 многочлен Xs не является вычетом по модулю /, и необходимо найти его остаток. Вместо деления с остатком можно заметить, что а3 + a + 1 = 0 (так как а — корень /), откуда а3 = а + 1. (8.22) Следовательно, а3 = [я3] = [х + 1] = а + 1 = (011). Далее, а4 = а · а3 = а{а + 1) = а2 + а = (110). Здесь мы сложили ранее найденные векторные представления а2 = (100) и а = (010). Применяя тождество (8.22), также находим а5 =а-а4 = а(а2 + а) = а3 + а2 = = а2 +а + 1 = (111) = [χ2 +Χ + 1].
282 Глава 8. Конечные поля Наконец, aQ = α · α5 = α(α2 + a + 1) = a3 + a2 + a = = a + l+a2 + a = a2 + l = (101) = [x2 + 1]. В заключение можно произвести проверку того, что а7 = 1. Действительно, а7 = а(а2 + 1) = а3+а = 1. Результаты наших вычислений занесем в таблицу: ¥8=¥2[х]/{хг+х + 1) - 1 а а2 а5 а4 а5 а6 000 001 010 100 011 110 111 101 [0] [1] [X] [х2] [х + 1\ [х2 + х] [χ2 + χ + 1] [X2 + 1] Нулевой вычет, не являющийся элементом группы F| и не имеющий дискретного логарифма по основанию а, включен в таблицу для полноты картины (вместо его мультипликативного представления стоит прочерк). Третий столбец нашей таблицы — столбец вычетов — не несет никакой дополнительной информации по сравнению со вторым, и поэтому в дальнейшем будем его отбрасывать (однако отметим, что он иллюстрирует теорему 8*5). Чем полезна такая таблица? При осуществлении аддитивных операций удобно пользоваться векторным представлением элемента поля, а мультипликативных — его дискретным логарифмом, так как аг · а? = аг+^ и аг/а? = аг~К Иначе говоря, вместо умножения двух элементов можно просто сложить их логарифмы, а вместо деления — вычесть (и привести по модулю порядка группы). Таблица же позволяет быстро переходить от одного представления к другому. Пусть, например, надо вычислить аг + а4. По таблице устанавливаем, что а8 = (011) и а4 = (110). Складывая соответствующие векторы, получаем (011) + (110) = (101). Из таблицы
8.4· Арифметика в конечных полях 283 видим, что вектор (101) представляет элемент а6* Таким образом1), а3 + а4 = а6. Другой пример. Предположим, что нам требуется найти векторное представление произведения (011) · (111). Из таблицы следует, что (011) = а3 и (111) = а5, поэтому (011) - (111) = а3 · а5 = а8 = а * а7 = а и а = (010). Следовательно, (011) * (111) = (010). Пусть, наконец, нам надо найти обратный вычет (ПО)-1. Тогда опять-таки по таблице устанавливаем, что (ПО)-1 = = (α4)~ = α~4 = α7-4 = а3 = (011). Алгоритм Евклида не потребовался! □ Замечание 8*2. Тех же самых результатов можно было достичь, выписывая остатки от деления одночленов хк, 0 < к < 6, на неприводимый многочлен χ3 + χ + 1. Однако при больших значениях степени неприводимого многочлена наш подход оптимальнее, т. к. при таком подходе используется меньше операций над элементами поля. Произведенные выше вычисления ак можно рассматривать и как доказательство (неоптимальное) примитивности многочлена χ3 + χ + 1. В примере 8.11 на с. 269 было построено поле из 16 элементов путем расширения поля Ζ2 корнем а неприводимого над Ζ2 примитивного многочлена х4-\-х-\-\. Там же для всех ненулевых элементов этого поля были найдены логарифмы по основанию элемента а. Приведем эти логарифмы здесь в более компактной форме: 1 а а2 а3 а4 а5 а6 а7 а8 а9 а10 а11 а12 а13 а14 0 0 0 1 0 0 1 0 0 1 0 0 1 0 0 0 0 1 0 1 0 1 1 1 1 0 0 0 1 0 0 1 1 0 1 1 1 0 1 0 0 1 1 1 1 1 1 0 1 1 1 1 1 1 0 1 1 0 ■ 0 1 (8- ^Это можно было установить, и просто умножив обе части равенства (8.22) на а3.
284 Глава 8. Конечные поля Для построения поля из 16 элементов можно было выбрать и другой примитивный многочлен четвертой степени х4 + х3 + 1 из 7*2[%] и аналогично построить таблицу логарифмов в поле Ъ^[х\){х4 + х3 + 1) по основанию его корня — вычета а. Как нетрудно убедиться, она будет отличаться от приведенной выше таблицы. Поэтому при вычислениях в конечном поле необходимо указывать способ его построения (примитивный многочлен и примитивный элемент). Выше было доказано, что поля Ъ2[х\/{хА -\-x-\-1) и %2\x\/{xA +xs + 1) изоморфны; читателю рекомендуется построить этот изоморфизм явно, основываясь на доказательстве теоремы 8.8. Пример 8,21. Вычислим значение выражения 4 ι 7 ι 8 ι Ί4 \ 2015 где а — примитивный элемент поля Fi6 = Ζ2[χ]/{χ4 + χ + 1). Для этого воспользуемся приведенной выше таблицей (8.23). Сначала вычислим числитель и знаменатель дроби, заменяя элементы α4, α7, α8, α14 и а2, а10, а11 = а5 · а6 их векторными представлениями: [ 0100 = а2 0111 =а10 1110 =ап ООН 1011 0101 1001 0100 = а4 = а7 = а8 = аи = а\ 13 1101 =а Отсюда а4 + а7 + а8 + а14 = а2 и а2 + а10 + а11 = а13. Таким образом, значение дроби равно а2/а13 = а~п = а4. Далее, а4 + а3 = а7. Наконец, возведем а7 в степень 2015 = = 15-134 + 5 и получим ответ а7'2015 = (а15)7'134*(а7)5 = Ьа5 = = а5. D Пример 8,22, Для элемента а5 из поля Ζ2[χ}/(χ4 + χ + Ϊ) найдем минимальный многочлен над простым подполем. Простым подполем поля F^ является поле ^2, его характеристика равна ρ = 2. Воспользуемся теоремой 8.7 и свойствами
8.4· Арифметика в конечных полях 285 сопряженных элементов. Найдем все сопряженные с а5 элементы. Для этого рассмотрим последовательность а5'2\ г = 0,1,... . Прямым вычислением убеждаемся, что она содержит всего два различных члена, а5 и а10, так как а20 = а5 (период последовательности равен двум). Следовательно, искомый многочлен не имеет других корней, кроме а5 и а10. Отсюда таь{х) = таю(х) = (х — аь)(х — а10) = = χ2 + (α5 + а10)а; + а5а10 = χ2 + χ + 1. В последнем вычислении мы воспользовались таблицей (8.23), чтобы найти а5 + а10 = 1. D Пример 8.23, Найдем минимальный многочлен πιαδ(χ) из предыдущего примера другим способом — применим метод неопределенных коэффициентов. Из теорем 8.2 и 8.7 следует, что степень минимального многочлена любого элемента поля F24 не превосходит четырех, поэтому искомый многочлен имеет вид таъ(х) = ао + а\х + аъх2 + а$х3 + адя4, а* e Ъ<2. Подставив вместо аргумента в таь(х) его корень χ = α5, получим та5(^5) = ао + о>1®5 + <ϊ2<^10 + а>з&° + а^а5 = 0. Последнее равенство можно переписать в векторном виде, используя векторное представление элементов поля ¥\β над простым подполем (см. таблицу (8.23)): ао 0 0 + а>1 1 1 + а2 1 1 I (0\ 0 0 + θ4 1 1 0 0 W W W W W V Получаем однородную систему линейных уравнений над про стым подполем: /00000 0 110 1 0 110 1 \ι с 1 1 1 0 I о \ 0 0 о t I 7 )
286 Глава 8. Конечные поля откуда находим /00000 0 110 1 0 110 1 ^ 1 0 1 1 0 о\ 0 0 о) /10 110 "Л о ι ι о ι Μ oj' /скЛ αϊ α2 «з \aj = λι /Λ 1 1 0 W + λ2 (Λ 0 0 1 W + λ3 (°\ 1 0 0 W применяя метод раздела 6.2. Последняя матрица систематическая, поэтому общее решение системы имеет вид (8.24) где λι, А2,Аз 6 Ζ2 — произвольны. Последнее равенство задает целое семейство многочленов над Ζ2, корнем которых является а5. Ненулевым многочленом наименьшей степени среди них, очевидно, является многочлен с коэффициентами λι = 1,λ2 = = Аз = 0. Заметим, что это можно было сказать заранее, не выписывая общее решение (8.24), из-за того, что свободная переменная Хг с меньшим номером отвечает за меньшую степень одночлена в таь{х). Таким образом, искомым ответом является первый базисный вектор (11100) найденной фундаментальной системы решений, кодирующий многочлен 1 + х + х2. D Подчеркнем, что метод решения примера 8*23 является достаточно общим и удобным: чтобы найти минимальный многочлен Ώΐβ(χ) элемента β Ε Fpn над простым подполем Fp, достаточно решить систему линейных уравнений над Fp, которая получается из уравнения с неопределенными коэффициентами πΐβ(β) = 0, если заменить в нем все множители из ¥рп их векторными представлениями над ¥р. При этом набор коэффициентов многочлена ηΐβ{χ) автоматически получится равным первому из базисных векторов в ортогональном пространстве этой системы, если элементарные преобразования при ее решении производить так, чтобы в конце главными оказались те переменные, которые соответствуют младшим коэффициентам πΐβ(χ)^ а свободными — те, которые соответствуют старшим.
8.4- Арифметика в конечных полях 287 Пример 8.24* Нам уже известны все неприводимые многочлены небольшой степени над полем Z2 (см. с. 113)» На основании этого запишем равенства х4 + χ = χ . (χ + 1)(х2 + χ + 1) = Ц (ж - /3), Xs +х = Х'(х + 1)(х3 +х + 1){хг +х2 + 1) = ]J (х-β), Я16 + χ = χ . (χ + 1)(χ2 + χ + 1)(χ4 + χ + 1) · • (х4 + ж3 + 1)(х4 + χ3 + χ2 + χ + 1) = = (х- 0){х - 1)(х - а)(х - а2)(х -а3)... (х- а14), являющиеся частным случаем равенств (8.9) и (8.12). Действуя аналогичным примеру 8.22 или примеру 8.23 образом, нетрудно найти минимальные многочлены для всех элементов поля Fi6 = Ъ^[х\1{х4 + х + 1). В результате можно составить таблицу элементов этого поля с указанием их минимальных многочленов: О 1 α α2 α3 α4 а5 а6 а7 а8 а9 а10 а11 а12 а13 а14 00 00100110101111 00 01001101011110 00 10011010111100 0100010011010111 χ т\ газ газ ^5 ms ГП2 гпь т^ ms гпь rri2 πΐ4 габ т\ т^ Минимальные многочлены в последней строке данной таблицы для компактности записи занумерованы следующим образом: mi (ж) т2{х) т3(х) (х + 1) (х2 + х + 1) (хА+х + 1) (χ4 + χ3 + 1) (ж4 + χ3 + χ2 + χ + 1), а сама таблица наглядно демонстрирует разбиение циклической
288 Глава 8. Конечные поля группы ¥\6 на классы сопряженных элементов: (а) = { 1 }υ{α5?α10}υ{α?α2?α4?αδ}ϋ V-V-' Ч V ' V * ' mi(x) rri2(x) ms(x) U {α7, α11, α18, α14} U {α3, α6, α9, α12} Ν ν ' V S, ' rri4{x) тщ{х) Заметим также, что mi (χ) ♦ m2(#) · ... ♦ тб(ж) = χ15 + 1. D Пример 8.25. Согласно теореме 8.6, поле F^ = F24 содержит подполя F2 и F22 и не содержит других собственных под- полей. Ее доказательство указывает возможный способ нахождения элементов, лежащих в F2 и F22. Так, подполе F22 состоит из корней уравнения хА + χ = 0, a F2 — из корней уравнения χ2 + χ = 0. Иными словами, F4 и F2 состоят из корней неприводимых делителей двучленов хА + х и х2 +#, которые сами являются делителями двучлена #16 +х. Отсюда с учетом уже найденных минимальных многочленов для элементов ¥χ$ находим, что F4 = {0,1, а5, а10} и F2 = {0,1} (последнее очевидно). Альтернативный и значительно более удобный способ основан на строении группы Fj6 = (α). Как циклическая группа 15-го порядка, она содержит единственную подгруппу порядка 3 = IF4I, и это подгруппа (а5). Значит, FJ = (а5), откуда F4 = {0}UF£ = {0,1,α5,α10}. D Вернемся к вопросу нахождения числа неприводимых многочленов над простым полем. Ранее уже были предложены два подхода к решению этой задачи (теорема 4.13 и пример 8.6). Разберем третий метод, основанный на строении конечного поля, похожий на них, но имеющий немного другое обоснование. Пример 8*26* Найдем число неприводимых многочленов степени 12 над Z2. Заметим, что каждый неприводимый над Z2 многочлен степени η является минимальным для некоторых η элементов поля F2n согласно результатам раздела 8.2. Эти η элементов сопряжены, имеют одинаковый порядок и не лежат ни в каком собственном подполе поля F2™. Таким образом, все элементы (8.25)
8.4- Арифметика в конечных полях 289 поля F2n, не входящие в подпол я, разбиваются на непересекающиеся равномощные подмножества D^ каждое из которых является множеством корней одного неприводимого многочлена степени η (корни минимальных многочленов меньших степеней лежат в подполях). Следовательно, число элементов Μ = Σ% \&г\* не входящих в подполя поля F2^ , и число N неприводимых многочленов степени η связаны равенством N = —. Осталось найти число М. Напомним, что 1FV С ¥2ь тогда и только тогда, когда а | b (теорема 8.6). На рис. 8.2 слева приведена так называемая решетка подполей поля F2i2. Она представляет собой граф, вершины которого соответствуют подполям, а ребра — отношению F2* С ¥2ь (транзитивные ребра опущены). По теореме 8.6 решетка подполей поля ¥рп всегда совпадает с решеткой делителей числа п. Рис. 8,2 Справа на этом же рисунке приведена диаграмма максимальных подполей в F2i2. Отсюда, применяя принцип включений и исключений, находим Μ = 212 - 24 - 26 + 22 = 4020, поэтому существует ровно ^^ = 335 двоичных неприводимых многочленов степени 12. D Пример 8*27. На с. 275 было введено понятие нормального базиса поля и доказано его существование в любом конечном поле. Одно из основных применений нормальных базисов — упрощение вычислений в конечных полях. В частности, возведение элемента в степень, равную характеристике поля, в нормальном
290 Глава 8. Конечные поля базисе равносильно циклическому сдвигу вектора координат этого элемента в нем. Действительно, пусть а, ар,..., арП — нормальный базис поля ¥рп и β = b0a + biap + b2ap2 +... + Ьп-юР"'1, где bi Ε Fp, — разложение элемента β по этому базису. Тогда, учитывая, что арП = а, имеем βΡ = (b0a + ЪюР + ... + bn^-y = = b0ap + biap2 +... + 6η_2αρ""1 + Ьп-ХарП = 2 η — 1 = bn-ια + b0ap + biap +... + bn-20tp Таким образом, координаты р-й степени элемента с координатами (6ο,6ι,..., bn-i) равны (bn_i,bo)bi,... ,6П_2). На большинстве современных процессоров для подобного преобразования вектора, умещающегося в одно машинное слово, достаточно всего одного такта работы, а схемная реализация циклического сдвига вообще не требует функциональных элементов. Таким 2 образом, вычисление степеней βρ)βρ ,... — очень эффективная операция в нормальном базисе. Остальные степени можно вычислить по формулам βν% = (/?г)р и βν%+ί = βρτβΐ при j < ρ, хотя умножение в нормальном базисе — уже не столь простая операция. D Пример 8.28* В примере 8.16 был рассмотрен нормальный базис В поля F27 = Ъя\х]/{х^ +2х+ 1), состоящий из элементов α2, α6, α18. Согласно предыдущему примеру, если элемент β имеет в базисе В координаты (012), то β3 = (201). Чтобы найти координаты элементов β и /?3 в стандартном базисе В\ то есть в базисе а2, а, 1, можно воспользоваться матрицей перехода А от £?' к В) введенной на с. 154. Обратная к ней матрица А-1 будет матрицей перехода от В к В\ она позволяет по координатам вектора в базисе В найти его координаты в базисе В1 * Учитывая, что
8.4- Арифметика в конечных полях 291 а2 = (100), а6 = (111) и а18 = (121) (это устанавливается легко), имеем /1 1 1\ /10 2 А = 0 1 2 , А"1 = 0 2 2 \0 1 1/ \0 1 2 применив метод раздела 6*2. Следовательно, в стандартном базисе β = А(012)т = (020)т и β3 = А(201)т = (021)т. Подчеркнем, что при вычислениях нам не потребовалась таблица дискретных логарифмов из примера 8.10. При ее наличии задача становится тривиальной, так как β = аи и β3 = аи'3 = а16. Также заметим, что матрицы А и А-1 вычисляются единожды, а применять их для возведения различных элементов в степени 3 и 9 можно многократно. D Пример 8.29. Рассмотрим фактор-кольцо К = Ъ2[х]/{К)^ где h{x) = (χ3 + χ + 1)(х4 + χ + 1) £ Ъ2\х\. Очевидно, что |К| = 27 = 128. Исследуем структуру мультипликативной группы К*. Для этого воспользуемся китайской теоремой об остатках (теорема 4.17): кольцо К изоморфно прямой сумме колец Κι = Ъ2\х\/{х3 + χ + 1) и К2 = Ζ2\χ}/{χ4 + χ + 1). В силу неприводимости над Έ2 многочленов f(x) = χ3 + χ + 1 и д(х) = хА + χ + 1, кольца Κι и К2 являются полями, состоящими из 28 = 8 и 24 = 16 элементов соответственно. Следовательно, их мультипликативные группы — циклические с порядками 8 — 1 = 7и 16 — 1 = 15. Из изоморфизма колец следует изоморфизм их мультипликативных групп: К ^ К! ® К2 => К* 9? KJ х Щ. В частности, мультипликативная группа К* — циклическая как прямое произведение двух циклических групп Κ^,Κ^ взаимно простых порядков, и |К*| = |KJ|-|K2| = 7-15 = 105. Образующим элементом группы К* будет элемент прямого произведения а = = (аъОД), где 0ίΐ,0ί2 — примитивные элементы полей Κι и К2. Нетрудно видеть, что fug — примитивные многочлены. Следовательно, а\ = χ (mod /) и а2 = х (mod g). Представление остатками из китайской теоремы дает нам равенство χ =
292 Глава 8. Конечные поля — [x>x]ftg- Поэтому корень xgK многочлена h(x) является образующим элементом в К*. Таким образом, получен пример приводимого и заведомо непримитивного многочлена /ι, корень которого тем не менее является образующим в мультипликативной группе (Z2[x]/(h))*. D Многие важные задачи теории конечных полей решаются практически без вычислений в них. Так, в приложениях встречаются задачи, в которых требуется оценить или найти точное число решений некоторого уравнения, не решая его, или по элементу поля-расширения необходимо установить степень его минимального многочлена, не находя сам этот многочлен, или выяснить, сопряжены ли два каких-то элемента поля. Разберем несколько примеров на эту тему. Пример 8*30. Найдем корни многочлена f(x) = хг+х2+х+1 в поле F39. Выясним сначала, приводим или нет этот многочлен над простым подполем F3. При проверке сразу убеждаемся, что 0,1 G F3 — не корни /(#), а двойка является корнем. Значит, f(x) приводим и делится на χ — 2 = χ + 1 е Гз[ж], Поделив, например, в столбик, находим Xs +х2+х + 1 = (х2 + 1) -(х + 1). Квадратичный множитель х2 + 1 не имеет корней в F3 и, следовательно, неприводим. Перебором найдены все решения (а именно χ = 2) данного уравнения в простом подполе. Кроме поля F3 и поля F33 в поле F39 нет других собственных подполей (1, 3,9 — это все делители числа 9). Следовательно, элементы из F39 \ F3 являются корнями всевозможных неприводимых многочленов 3-й и 9-й степени из ¥з[х] и только их. Так как ни один из этих многочленов не делится на многочлен х2 + 1, то f(x) не имеет корней среди элементов множества F3q \F3- Таким образом, единственным решением уравнения является χ = 2. D Пример 8.31* Найдем число решений уравнения х7 + хъ-\- +хг +ж2 + 1 = 0в поле F2e.
8.4- Арифметика в конечных полях 293 Заметим, что ответ зависит от разложения левой части уравнения на неприводимые множители. Действительно, если многочлен f(x) = χ7 +#5 + х3 + х2 + 1 неприводим, то решений нет, так как никакой неприводимый над Z2 многочлен 7-й степени не делит двучлен х2 — х, а каждый элемент поля F26 является корнем этого двучлена. Если же / делится на некоторый неприводимый многочлен д степени к, где к — делитель числа 6, то каждый из к корней многочлена д одновременно и является корнем многочлена /, и лежит в поле F26. Нетрудно видеть, что данный многочлен / является произведением двух неприводимых многочленов #ι,#2> таких, что deggi = 3 и degp2 = 4. Таким образом, данное уравнение имеет три решения. Обобщая вышесказанное, получаем, что число различных решений уравнения f(x) = 0 в поле ¥рп равно степени наибольшего общего делителя многочленов f(x) и хрп — χ над Ζρ (без учета их кратности). Из условия задачи нетрудно установить, что (fyx2 — х) = х3 +х + 1. □ Пример 8,32, Пусть а — примитивный элемент поля F2i2. Найдем степень минимального многочлена элемента а546 над простым подполем F2, не вычисляя сам многочлен явно. Мы уже пользовались следствием теоремы о строении поля- расширения (см. пример 8.26): если элемент ак лежит в поле ¥рш и не лежит ни в каком его собственном подполе, то степень минимального многочлена так(х) Ε Ър[х] равна т. Осталось узнать, в какое подполе попал данный элемент. Оказывается, что это легко можно установить по его порядку. Действительно, согласно теореме 3.16, I 546, N _ 212-1 _ 4095 _40Э5 |а ' (N,546) (212- 1,546) (4095,546) 273 Следовательно, элемент а546 образует циклическую подгруппу 15-го порядка в F2i2. Эта подгруппа является группой F2<4, так как иных подгрупп порядка 15 в поле F2i2 нет в силу цикличности его мультипликативной группы. Следовательно, элемент
294 Глава 8. Конечные поля а лежит в поле F24 С F2i2 и не лежит ни в каком его подполе (порядки элементов подполей поля F24 являются делителями числа 3 = |IF*21)« Поэтому degmQ546 = 4. D Пример 8.33. Выясним, являются ли сопряженными элемент β = α546 из предыдущего примера и элемент 7 = с*273 в поле F2i2. Сделать это можно по определению: если найдется такое г, что /?2* = 7? то β и 7 сопряжены. Равенство β2% = η равносильно сравнению 546 · 2i = 273 mod 212 - 1. Решению уравнений такого типа посвящен раздел 9.3. Однако в данном случае применять никакие специальные алгоримы не требуется, т. к. по теореме о строении поля F2i2 неизвестное г не превосходит числа 12 и потому может быть найдено полным перебором (более того, г должно делить 12). Вместо перебора можно применить еще одну хитрость. Представим дискретный логарифм Ъ элемента β = ab из поля ¥2п в позиционной двоичной системе счисления: b = b0 + 2bi+ 2% + ...+ 2п-1Ъп-Ъ Ьг е {О,1}. Заметим, что 02 = а2Ь = а2Ь0+22Ь1+...+2пЬп-1 = аЬп-1+2Ьо+22Ь1+...+Г-1Ьп-2 в силу того, что \а\ = 2п — 1. Иными словами, двоичная запись (bn_i,6ojbi,... ,6П_2)2 логарифма элемента β2 оказалась равна циклическому сдвигу двоичной записи (Ьсь&ь ·· * > ^-1)2 логарифма элемента β на один разряд (ср. с примером 8.27). То же самое верно и для элемента β2 , и т.д. Отсюда следует простое правило: в поле характеристики 2 сопряжены те и только те элементы, двоичные записи логарифмов которых по основанию примитивного элемента поля переходят друг в друга циклическими сдвигами. Множества таких чисел принято называть циклотомическими классами. В частности, легко видеть, что 546 = (001000100010)2, 273 = (000100010001)2,
8.5. Порядки многочленов 295 откуда заключаем, что β и η сопряжены, причем г = 3. В цик- лотомическом классе числа 546 всего четыре числа (включая его само), поэтому а546 сопряжен с четырьмя элементами поля F2i2. Следовательно, его минимальный многочлен имеет степень 4 (доказали независимо от предыдущего примера). D Пример 8,34. Разбиение (8.25) мультипликативной группы поля Fie на классы сопряженных элементов равносильно следующему разбиению множества всех целых чисел от 0 до 14 на циклотомические классы: {0} U {5,10} U {1,2, 4,8} U {7,11,13,14} и {3,6,9,12}, или, более наглядно, в двоичной системе: {0000} U {0101,1010} U {0001, 0010, 0100,1000} U U {0111,1011,1101,1110} U {ООН, ОНО, 1100,1001}. □ Пример 8,35. Циклотомический класс числа 9 по основанию 26 — 1 = 63 состоит всего из трех чисел: 9 · 2° = 9, 9 · 2 = 18 и 9 · 22 = 36, так как 9 · 26 = 9 mod 63. Поэтому элемент а , где а — примитивный элемент поля F26, лежит в подполе F23. Следовательно, degmQg(#) = 3. D 8.5. Порядки многочленов Пусть f(x) 6 Zp[#] и пусть /(0) ^ 0, т.е. свободный член у многочлена f(x) не равен нулю. Тогда наименьшее натуральное число п, при котором двучлен хп — 1 делится на /(#), называется порядком1^ многочлена f(x) (а также иногда его периодом, или экспонентной) и обозначается ord /: ord/ = mm{n e N : f(x) \ xn - l}. ^B теории регистров сдвига с линейной обратной связью над конечным полем (Linear Feedback Shift Register, LFSR) рассматриваются также порядки многочленов с нулевым свободным членом. Если /(0) = 0, то многочлен f(x) однозначно представим в виде f(x) = xrg(x), где г ) 1и <у(0) Φ 0. Тогда порядком многочлена / по определению является порядок многочлена </. Далее такие многочлены рассматривать не будем.
296 Глава 8. Конечные поля Пример 8.36. Порядок многочлена f(x) = χ2 + х + 1 е Z2[x] равен трем, так как х2+х-\-1\х — 1,х2 — 1 мх2 -\-x-\-l \ х3 — 1. D Нетрудно заметить, что данное выше определение порядка многочлена равносильно следующему: порядок многочлена f(x) совпадает с порядком его корня χ в мультипликативной группе кольца Zp[x]/f(x). Действительно, хп = 1 (mod f(x)) тогда и только тогда, когда f(x) \ хп — 1. Из предположения /(0) φ 0 следует, что f(x) и его корень χ взаимно просты, поэтому χ £ (Zp[x]/f(x))*. Отсюда следует корректность определения порядка многочлена: обратимый вычет χ имеет конечный мультипликативный порядок, который к тому же является делителем порядка группы {Ър[х\//(#))* по теореме Лагранжа. Далее, как и раньше, порядок элемента а в конечной группе будем обозначать \а\. В случае, когда многочлен f(x) неприводим над Zp, фактор- кольцо Zp[x]/f(x) является полем ¥ из рт элементов, где т = = deg/. В этом поле многочлен f(x) имеет т различных сопряженных корней, причем вычет χ является одним из них при условии т > 1. Порядки всех корней одинаковы, как было установлено в примере 8.14, и потому равны ord /. Для неприводимого многочлена степени т = 1 с одним ненулевым корнем это очевидно. Выше мы убедились, что все конечные поля одинакового порядка изоморфны между собой. Таким образом, получаем следующую теорему. Теорема 8.11* Пусть ¥ — поле из рт элементов, т > 1, и f(x) φ χ — неприводимый над Ър многочлен степени т. Тогда ord / = \β\ для любого корня β из сопряженных в поле ¥ корней многочлена /. Отметим, что в этом утверждении важна неприводимость многочлена /(#). Оно остается верным и для любого поля F', содержащего поле F = ¥р™. Следствие 8.2. Порядок любого неприводимого надЪр многочлена степени т является делителем числа рт — 1.
8.5. Порядки многочленов 297 Следствие 8.3. Многочлен степени т над Ър является примитивным тогда и только тогда^ когда его порядок равен рт — 1. Последнее следствие можно считать эквивалентным определением примитивного многочлена. Пример 8.37. Как было установлено выше, имеются всего три неприводимых многочлена 4-й степени над Z2. Это многочлены хА + χ + 1, х4 + х3 + 1 и χ4 + χ3 + χ2 + χ + 1, Из таблицы минимальных многочленов элементов поля ¥\в на с. 287 имеем, что первые два из них являются примитивными, так как порядок их корней равен 15. У последнего же многочлена порядок корня а3 равен 5, поэтому ord(x4 +xs+x2 + x + l) = 5 (см. также пример 8.15). D Пример 8.38. Воспользовавшись разложением на множители числа 210-1 = 1023 = 3-11-31, можно найти количество неприводимых многочленов / степени 10 над Z2, имеющих конкретный порядок. При этом ord / делит 210 — 1. У числа 210 — 1, как и у всякого числа, являющегося произведением трех различных простых чисел, имеется восемь делителей, два из которых тривиальны. В данном случае делители составляют множество А = {1,3,11,31,33,93, 341,1023}, причем ord / G А. Для всякого d G А в поле F2io содержится φ{ά) элементов порядка d, каждый из которых является корнем некоторого неприводимого многочлена. Порядок этого многочлена совпадает с порядком корня, а степень — с порядком расширения того подполя поля F2io, в котором лежит его корень, т.е. является делителем числа 10. Поле F2io содержит подполя F2, F22 и F25. Других собственных подполей в нем нет. Порядки мультипликативных групп подполей F2,F22,F25 равны 1,3,31 соответственно. Поэтому многочлены с порядками 1,3,31 (и их нетривиальными делителями, если бы они были) имеют степени 1,2, 5. Все остальные многочлены с порядками из множества А \ {1, 3,31} = {11,33,93,341,1023} имеют степень 10.
298 Глава 8. Конечные поля Итак, многочлен порядка d и степени т имеет т корней (порядка d каждый), поле-расширение содержит всего φ(ά) таких элементов, и каждый из них является корнем одного многочлена, следовательно, число различных неприводимых многочленов порядка d равно <£^- (сравните с примером 8.26). Поэтому существует ^р = 1 многочлен порядка 11 и У(ЗЗ) у(93) _ £(341) у(1023) _ 10 ' 10 ' 10 ' 10 многочленов степени 10 порядка 33,93,341,1023 соответственно. D Заметим, что из рассмотренного только что примера следует простое комбинаторное объяснение интересного факта из теории чисел: если ρ — простое и т — наименьшее натуральное число, при котором число d является делителем числа рш — 1, то φ(ά) нацело делится на т. Выше в примере 8.37 мы воспользовались готовой таблицей дискретных логарифмов и минимальных многочленов поля F^. Если же такой таблицы нет или ее построение слишком громоздко, то порядок неприводимого многочлена можно найти тем же способом, что и порядок элемента χ произвольной конечной группы G в случае, когда известно разложение числа |G| на простые множители, а для возведения χ в степень в группе G имеется эффективный алгоритм. (См. также посвященный идейно близкому методу раздел 9.4.) Действительно, если / е Ър\х] — неприводим, η = ord / и т = cleg/, то η делит число рт — 1 (следствие 8.2). Разложим число рт — 1 на простые множители (это наиболее трудный при больших т этап метода; для его облегчения для чисел такого вида составлены специальные таблицы делителей): Тогда η = pi1 ·.. р£*, где 0 < Si < г^. Для каждого г = 1,.,., к найдем вычеты #(Pm_1)M по модулю f(x). Если при этом окажется, что x(pm-^)/Pi^l (mod f{x)),
8.5. Порядки многочленов 299 то число η делится на р£% а значит Si = r% (см. доказательство леммы 8.1 и теоремы 8Л). Иначе s% < г*. В последнем случае, чтобы найти Si, надо выяснить, будет ли делиться число η на числа р£*~ , р£*~ , ..., ρι. Это можно сделать, вычисляя вычеты я.(р"-1)/р?) ^-D/p?, ..., я.(р--1)/р? (mod/(я:)) и сравнивая их с единицей. Производя такие действия для каждого простого делителя pi числа рт — 1, найдем все неизвестные Si и искомое число п. Для иллюстрации этого метода приведем пример. Пример 8.39. Нетрудно убедиться в том, что многочлен f(x) = χ4 -f χ2 -\- 2х + 1 взаимно прост с двучленом Xs — χ и, следовательно, неприводим над Ζ3. Найдем его порядок. Пусть η — порядок многочлена /. Тогда η является делителем числа рт — 1 = З4 — 1 = 80 = 5 ♦ 24 и, следовательно, имеет вид η = 551 - 2S2. Для нахождения Si и S2 нам необходимо вычислить о?80/5 = х16 (mod /) и х80/2 = я40 (mod /). Вычисления будем производить в поле ¥ = Fgi = Z^[x]/f(x). Очевидно, что хА = 2х2 + χ + 2 = 0212 (mod /). Тогда χ1β = (Ж4)3Х4 = (2χ2 + χ + 2^3χ4 = (2ХЬ + ^3 + 2^4 = = (2х2 - х4 + х3 + 2)х4 = (2х2(2х2 + ж + 2) + х3 + 2)хА = = (х4 + 2х3 + х2 + х3 + 2)х4 = (я4 + х2 + 2)хА = = (2х2 + х + 2 + х2 + 2)х4 = {х + 1)х4 = = (х + 1)(2х2 + χ + 2) = 2я8 + 2 (mod /(x)). Так как х16 ^ 1 (mod /), то η делится на 5, т.е. Si = 1. Далее, ^40 = (ж20)2) где х20 = ж16ж4 = (2ж3 + 2)(2х2 + ж + 2) = = ж5 + 2ж4 + ж3 + ж2 + 2ж + 1 = = (2ж3 + ж2 + 2ж) + 2(2ж2 + χ + 2) + Xs + х2 + 2х + 1 = = (2 + 1)ж3 + (1 + 1 + 1)ж2 + (2 + 2 + 2)х + (1 + 1) = = 2 (mod /(ж)).
300 Глава 8. Конечные поля Имеем х20 = 2 φ 1 (mod /) и χ40 = 22 = 1 (mod /). Следовательно, η делится на 8 и не делится на 16, те. S2 = 3. Таким образом, ord / = 5 · 8 = 40. Π Теперь рассмотрим ряд утверждений, позволяющих находить порядки приводимых многочленов. Лемма 8.6, Пусть многочлены f(x),g(x) £ Ър[х\ взаимно просты. Тогда порядок их произведения равен наименьшему общему кратному их порядков: ord(/$) = HOK(ord/,ord$). Доказательство. Величина ord(/ · g) равна порядку вычета χ в кольце Zp[x]/(f · g). Из условия (/,<?) = 1 по китайской теореме об остатках (теорема 4.17 на с. 127) следует, что это кольцо является прямой суммой: ад/(/#) = ад// ® ад/*· В частности, вычет χ (mod {fg)) представляется парой вычетов [х,#]^р. Следовательно, его порядок в группе обратимых по модулю fg вычетов равен порядку этой пары [х,х] в группе (ад// ® ад/я)* = (ЗД//Г χ (ад/$Г, который в свою очередь равен наименьшему общему кратному порядков вычетов χ (mod /) и χ (mod g) no лемме 3.2. Лемма доказана. Следствие 8.4, Пусть Л(ж),...,Д(ж) в Ър[х\ и (fi>fj) = 1 при г Φ j. Тогда ord(/i...../fc) = HOK(ord/i,...,ord/fc). Лемма 8,7. Двучлен ха — 1 делит двучлен хъ — 1 тогда и только тогда, когда а делит 6, Это справедливо над любым полем.
8.5. Порядки многочленов 301 Доказательство. Необходимость. Воспользуемся формулой суммы геометрической прогрессии ус — 1 = (у — 1)(ус~1 + ... + +3/+1). Пусть а | Ъ. Тогда найдется такое с, что b = ас, и поэтому хь -1 = (хау -1 = (χ* -1)(х(с~1)а + Х(с-^а +.. .+х2а + ха + 1), то есть ха — 1 | я* — 1. Достаточность. Пусть ха — 1 | хь — 1. Следовательно, b ^ а. Рассмотрим деление с остатком двучлена хъ—1 на двучлен #а — 1: я* - 1 = (ха - 1)хь~а + хь~а - 1 = = (ха - 1)(хь~а + хь~2а) + хь~2а - 1 = = {ха - 1)(хь~а + хь~2а + хь~га) + хь~га -1 = ...= s = (я* _ i)(j2xb~^a)+xb~sa - L Процесс деления закончится на таком шаге s, что 0 ^ Ъ — sa < α. Из условия ха — 1 | хь — 1 следует, что остаток равен нулю, то есть хь~ш — 1 = 0. Отсюда имеем b— sa = 0. Значит, а | 6. Лемма доказана. Лемма 8.8* Пусть f(x) Ε %р[х], /(0) φ 0 и а Е N. Двучлен ха — 1 без остатка делится на многочлен f(x) тогда и только тогда, когда число а делится на его порядок ord /. Доказательство. Обозначим η = ord /. Пусть η \ а. Тогда хп — 1 | ха — 1 согласно лемме 8.7. Кроме того, / | хп — 1 по определению порядка. Отсюда следует, что / | ха — 1. Теперь предположим, что / | ха — 1. Тогда из определения порядка η = ord / следует, что η ^ а. Разделим α на η с остатком: а = qn + г, где 0 < г < п. Двучлен #а — 1 можно тогда представить в виде ха-1= х*п+г - 1 = {χ** - \)хг + (хг - 1), Из последнего равенства с учетом того, что многочлен / делит двучлены ха — I и xqn — 1, следует, что / делит хТ — 1. В случае, когда г > 0, это противоречит определению η в силу неравенства г < п. Значит, г = 0. Лемма доказана.
302 Глава 8. Конечные поля Отметим, что многочлены /,# в лемме 8.6 и многочлен / в лемме 8.8 могут быть любыми — как приводимыми, так и неприводимыми. Пример 8.40. Рассмотрим многочлен f(x) = χ4 + χ3 + х2+ +х + 1 Ε %ъ[х\. Ранее было установлено, что ord/ = 5. Найдем теперь порядок многочлена /3. Пусть η = ord/3. Так как хп — 1 делится на /3, а значит и на /, то η делится на 5 по лемме 8.8. Кроме того, так как хъ — 1 делится на /, то многочлен (х5 — I)4 = х20 — 1 делится на /4, а значит и на /3 (здесь мы воспользовались леммой 8*2). Применив лемму 8.8 теперь к многочленам /3 и х20 — 1, получим, что η является делителем числа 20 = 22 5. Так как 5 | η и η | 22 · 5, то искомое η имеет вид η = 2к · 5, где 0 < к < 2. Если к < 2, например, к = 1, то двучлен х10 — 1 = = {хъ — I)2 должен делиться на /3. Однако это невозможно в силу неприводимости /: двучлен хъ — 1 делится на / и не делится на /2. Альтернативный аргумент: многочлен / не имеет кратных корней в поле Fie = Z2 [#]//, значит кратность каждого корня многочлена f8 в этом поле равна трем; однако кратность корней двучлена х2 *5 — 1 = (хБ — I)2 не превосходит 2к) и поэтому /3 \ х2к'5 - 1 при к < 2. Таким образом, ord /3 = 20. D Обобщение метода предыдущего примера с многочленов над полем Z2 на многочлены над Ър позволяет получить следующую полезную формулу для порядка такого многочлена, который является степенью неприводимого. Лемма 8*9* Пусть f(x) € Ър[х\ — неприводимый многочлен, отличный от х, и пусть fflGN. Тогда ord(/m) = ps · ord(/), где s — наименьшее целое число, удовлетворяющее неравенству р3 > т. Доказательство. Обозначим η = ord / и N = ord(/w). Число N делится на η по лемме 8.8, так как /m | xN — 1, а значит и / | χΝ — 1. Далее, двучлен хп — 1 делится на /(#), и потому (хп—1)т делится на fm(x). А значит, двучлен (χη—1)ρ* = хпр* -1 также будет делиться на многочлен fm{x) при условии, что ps ^ т.
8.5. Порядки многочленов 303 Положим s = |~logpπι\. По лемме 8.8 из того, что fm делит χηρ8 _ ^ получаем, что N делит прв. В силу того, что η \ Ν и N | пр3) число N имеет вид N = прк1 где 0 ^ к ^ S. Осталось выяснить, чему равно fc. Рассмотрим теперь фактор-кольцо ¥ = Zp[x]/f(x), которое в силу неприводимости / является полем. Многочлен / имеет столько корней в F, какова его степень, причем кратность каждого его корня равна единице. Заметим, что по следствию 8.2 число η = ord / не делится на р. Следовательно, двучлен хп — 1 не имеет кратных делителей, как следует из леммы 8.4. Поэтому все его корни из поля ¥ простые, так же как простыми являются и все корни многочлена /\ Более того, так как η делит число |F* |, то двучлен хп — 1 имеет именно столько корней в поле F, какова его степень, то есть п. Значит, кратность каждого корня многочлена /т и каждого корня многочлена (хп — 1)т в этом поле равна т. к к и Итак, двучлен (хп — 1)р = хпр — 1 имеет корни кратности ρ . к Многочлен fm делит хпр — 1 и имеет корни кратности га. Сравнивая кратности корней, получаем, что га < рк. Поэтому к = s и N = nps. Лемма доказана. В кольце Ър[х\ всякий многочлен f(x) положительной степени единственным с точностью до порядка множителей образом раскладывается в произведение степеней неприводимых многочленов (см. теорему 4.11, такое разложение по аналогии с разложением целых чисел в произведение степеней простых часто называют каноническим): /(*) = /ГЧ*) ·····/№· (8-26) Если /(0) т^ 0? то в разложении (8.26) отсутствует неприводимый многочлен х. Порядок каждого неприводимого делителя fi(x) можно найти методом, аналогичным методу из примера 8.39. Зная ord /г, можно определить ord /гш* по лемме 8.9» Наконец, применяя по индукции к взаимно простым делителям /гш* лемму 8.6, получим ord /. Все вместе это дает следующее выражение для порядка произвольного многочлена над полем Zp.
304 Глава 8. Конечные поля Теорема 8.12. Пусть многочлен f(x) e Zp[#] имеет положительную степень и ненулевой свободный член. Рассмотрим его каноническое разложение (8.26) в кольце Ър\х\, где rtli Ε Ν, α /ΐ(#)? · · · ? Λ(#) ~~ различные нормированные неприводимые над Ър многочлены, отличные от х. Тогда ord/ = ps · HOK(ord/b ... ,ord Л), (8.27) где s — наименьшее целое число, удовлетворяющее неравенству ps ^ max(mi,...,mjfe). Пример 8*41* Найдем порядок многочлена f{x) = (χ2 +χ + 1){хА + х + 1)(х4 + Xs +х2 +х + I)3 е Ъ2\х\. В рассмотренных выше примерах было установлено, что огсЦя2 + χ + 1) = 3, ord(^4 + χ + 1) = 15, ord(z4 + ж3 + χ2 + χ + 1) = 5, ordO4 + χ3 + χ2 + χ + Ι)3 = 20. По теореме 8.12 получаем, что порядок многочлена / равен НОК(3,15,20) = 22 НОК(3,15,5) = 60. Отметим, что ord/ не делит число 2de§ f — 1=21S — 1. Это означает, что в общем случае для приводимых многочленов следствие 8.2 не выполняется. D Пример 8*42* Рассмотрим последовательность {αη}^0 над полем Ζ3, заданную линейным рекуррентным равенством ап+г = αη+ι + 2αη, ап е Ζ3, η > 0, (8.28) с начальными условиями αο = αϊ = 0, а2 = 1* Эта последовательность является периодической, так как при любом фиксированном η тремя ее членами αη,αη+ι,(ΐη-\-2 все последующие ее члены определяются однозначно по формуле (8.28), а число различных наборов (αη> йп+ъ fln+2) над конечным полем конечно. Найдем период последовательности Т, для чего рассмотрим последовательность о^ € Z3 [#]//(#) вычетов по модулю f(x) = χ3 + 2х + 1, такую, что On+i(x) = xan(x) (mod (χ3 + 2χ + 1)).
8.5. Порядки многочленов 305 Заметим, что xsa(x) = ха(х) + 2а(х) (mod (χ3 + 2х + 1)) при любом а(#), поэтому хгап(х) = хап(х) + 2ап(#), что равносильно On+s(x) = On+i(a;) + 2ап(я). Положив ап(х) = 6nx2 + CnX+dn = (Ьп, <Vi,dn), где Ьп, <Vi,dn G Z3, перепишем последнее равенство в векторном виде Ьп+з\ /Ьп+Л /Ьп\ Сп+З = Сгг+1 I + 2 I Cn I . dn+з/ yk+i/ \<W Сравнивая компоненты векторов этого равенства с (8.28), убеждаемся, что ап = Ьп для всех га, если совпадают начальные члены последовательностей {an} и {Ьп}. Как нетрудно видеть, последнее выполняется при ао(х) = 1. Более того, период последовательности {ап} совпадаете периодом последовательности {an}. В силу того, что ап = хп (mod /(#)), период последовательности {ап} равен порядку многочлена /(#). В примере 8.1 была доказана его примитивность, поэтому Τ = ord / = 26. Многочлен, вектор коэффициентов которого совпадает с вектором коэффициентов линейного рекуррентного уравнения (после перенесения всех его членов в левую часть), называется его характеристическим многочленом. Так, многочлен f(x) = = #3+2# + 1 является характеристическим для уравнения (8.28). Применяя аналогичные рассуждения к уравнению On+4 + dn+2 + 2αη+ι + ап = 0 (8.29) с начальными условиями uq = αϊ = й2 = 0, аз = 1 и его характеристическому многочлену х4 + х2 + 2х + 1 и учитывая, что в примере 8*39 уже был найден его порядок, устанавливаем, что период последовательности (8.29) равен 40. Очевидно, что период линейной рекуррентной последовательности максимален тогда и только тогда, когда ее характеристический многочлен примитивен. D Порядок многочлена является важным понятием теории циклических помехоустойчивых кодов и теории псевдослучайных
306 Глава 8. Конечные поля последовательностей над конечным полем. Формула (8.27) сводит вычисление порядка многочлена к его разложению на неприводимые множители. В начале следующей главы будет показано, как это можно сделать достаточно эффективно. Задачи 8.1. Выяснить, какие из перечисленных колец являются полями: Z, Q, М, С, Ζβ, Ζτ, Zs, Z9, Z7[ar], Ί^[χ\/{χ + 1), Z7[x]/(x2 + 1), множество матриц вида ( Д £) с коэффициентами из R, множество матриц такого же вида, но с коэффициентами из Ζ5ί Ζ7. 8*2. Привести пример бесконечного поля конечной характеристики. (Указание: рассмотреть множество рациональных дробей над конечным полем ¥.) 8.3. Пусть х, у и ζ — линейно независимые векторы линейного векторного пространства над конечным полем F^, состоящим из q элементов. Найти все значения <?, при которых векторы χ + у, χ + ζ и у -\- ζ будут линейно зависимы. 8*4. Доказать, что неприводимый над полем GF{q) многочлен степени η остается неприводимым над его расширением GF(qm) тогда и только тогда, когда пит взаимно просты. 8.5. Пусть многочлен f(x) неприводим над GF{q) и degf = п. Доказать, что над полем GF(qrn)^ т > 1 многочлен f(x) разлагается на (п7т) неприводимых сомножителей одинаковой степени ,п,. 8.6. Разложить многочлен х256-|-а:128 + 1 £ Z2[x] на неприводимые множители. 8.7. Определить, является ли многочлен х6 + а;4 + х1 + χ-\-1 £ Ζ2[χ] примитивным. Найти какой-либо примитивный многочлен степени 7 над полем Ζ2. 8.8. Пусть т,п £ N. Найти наибольший общий делитель многочленов #рПг — χ и #рП — х. 8.9. Найти наибольший общий делитель двучленов ха —х ихь — х, где a, b £ N. 8.10. Построить решетки подполей в полях F24, F2e, F2s, IF^18 ? ^230 · Сколько элементов каждого такого поля не лежит ни в одном из его подполей? Как связано это число с числом неприводимых многочленов степени 4,6,8,18,30 над полем Z2?
Задачи 307 8.11. Описать все конечные поля, решетка подполей которых является деревом. 8.12. Построить таблицы дискретных логарифмов в полях F4, Fs, F9, F16, F25, F27. Указать все примитивные элементы и подполя. Для всех элементов найти их минимальные многочлены над простыми под- полями. 8.13. Найти минимальное поле характеристики 3, в котором многочлен f(x) e Zs[x] раскладывается на линейные множители, если: 1) f(x) = *3 + а: + 2; 2) /(*) = *4 + 2а:3+а: + 2; 3) f(x) = а*+а? + 2х + 1. В каждом случае указать все корни многочлена f(x) в этом поле и их кратности. 8.14. Выяснить, в каких подполях поля F2i2 лежит элемент а260, где а — примитивный элемент поля F2i2. Найти степень его минимального многочлена πια2&ο(χ) е 2^[а:], не вычисляя сам многочлен явно. 8Λ5. Пусть α е Fe4 — корень многочлена f(x) = χ6 + χ4 -f χ2+ -\-x-\-l € Ίί2[χ\. Найти минимальный многочлен элемента α18 разными способами. 8.16. Построить поле GF( 16) двумя способами: используя примитивный многочлен степени 4 над полем GF{2) и используя примитивный многочлен степени 2 над полем GF(4). Установить изоморфизм между двумя полученными полями. 8.17. Пусть ¥ — конечное поле и F' — подполе в F. Нормированный многочлен т(х) с коэффициентами из F' называется минимальным многочленом элемента а £ F, если га (а) = 0 и степень многочлена т(х) минимальна среди всех многочленов положительной степени над F', для которых α является корнем. Это определение является естественным обобщением понятия минимального многочлена над простым подполем (см. с. 272) на произвольное подполе. Воспользовавшись решением предыдущей задачи, найти минимальные над GF(4) многочлены для всех элементов поля GF(16) и сравнить полученный результат с примерами 8.24, 8.34 и теоремой 8.2. 8.18. Найти порядок многочлена над полем Z2: 1)*2 + * + 1; 2) (х2+х + 1)2; 3) (х2 + χ + 1)2(х4 + χ + 1). 8.19. Найти количество и степени неприводимых множителей в разложении следующих двучленов над полем Ζ2: 1)я21 + 1; 2)ж23 + 1; 3) х4Ъ + 1; 4) х63 + 1; 5) х84 + 1. Для каждого из них указать минимальное поле характеристики 2, над которым он разлагается на линейные множители.
308 Глава 8. Конечные поля 8.20. Найти Е1^1<<2<»3<125 αή<*;2<*;3> гДе <*ъ € GF(53). 8.21. Пусть риг — различные простые числа. Доказать, что многочлен η^ϊγ раскладывается над Ζρ на различные неприводимые многочлены, каждый из которых имеет степень, равную порядку вычета ρ (mod г) в группе Z*. 8*22. Пусть а и β — примитивные элементы поля GF(pn). Будет ли их произведение примитивным элементом? 8.23. Пусть хр = χ mod f(x), где f{x) — многочлен степени η над полем Ζρ. Является ли f(x) неприводимым? 8.24. Найти период последовательности {ап}^=0 над полем Z3, если αη+5 + <*п+4 + а>п+з + 2αη = 0, где ао = ... = аз = 0, а^ = 1. 8.25. Пусть А: — делитель рп — 1. Многочлен Qk{x) — ПаXх ~ а*)> где произведение берется по всем корням fc-й степени из единицы в поле GF(jpn), имеющим порядок /с, называется k-круговым многочленом над GF(pn). Доказать, что Qk(x) Ξ GF(p)[x]. 8.26. Доказать, что хк - 1 = Цш\к Qm(x)· 8.27. Доказать, что Qh{x) = ]\ш\к{хш - 1 )*(*/"*>. 8.28. Доказать, что Qkpfa) = Qk(xp) при всех натуральных к и простых р. 8.29. Доказать, что круговые многочлены Qig(x) и Q27(%) непри- водимы над полем GF{2). Совпадают ли они? 8.30. Показать, что многочлен f(x) степени η неприводим над Ър тогда и только тогда, когда f(x) делит хрП — χ и при этом взаим- но прост с каждым из двучленов вида хр — х, где pi — простои делитель числа η (см. пример 8.7). 8.31. Доказать, что элементы а, ар,..., ар образуют нормальный базис поля GF{pn) тогда и только тогда, когда многочлены хп — 1 и αχη_1 + архп~2 + ... + ар χ + ар взаимно просты.
Глава 9 Алгоритмы Эта глава является небольшим введением в современные приложения конечной алгебры. В ней рассматриваются примеры алгоритмов, находящих решения алгебраических задач разной природы. Эти задачи условно можно отнести к одному из трех видов. Задачи первого вида естественным образом возникают в самой алгебре, такова задача разложения многочлена на неприводимые множители, и затем появляются в качестве составных частей решений многочисленных прикладных задач. Задачи второго вида лежат на стыке алгебры и ее приложений. Ярким примером такой задачи является задача логарифмирования в конечном поле, которая интересна и как чисто математическая, и как криптографическая задача. Наконец, к третьему виду можно отнести задачи, в которых алгебраические конструкции являются средством для решения практических задач, возникающих за пределами математики. К таким задачам относится задача передачи информации при наличии помех, в основе решения которой лежат коды, исправляющие ошибки. 9.1. Свободные от квадратов многочлены С помощью алгоритма Берлекемпа можно эффективно раскладывать многочлен на неприводимые множители над небольшим конечным полем. В основе этого метода лежит китайская теорема об остатках для кольца многочленов (см. теорему 4.17 на с. 127) и ее очевидное следствие, которое сформулируем в виде следующей теоремы.
310 Глава 9. Алгоритмы Теорема 9Л. Пусть ρ — простое число и /(Ж) = /Г(ж)·..··/£*(*) (9.1) — разложение многочлена f(x) e Ър[х] в произведение степеней различных многочленов f%{x), неприводимых над Ър. Тогда ZP[x]/f(x) * ЗД/ДП1 (χ) ® ■ · · ® Zp[x]/f%k(x). Нам также потребуется обозначение а = [ai,...,afc] = [аи ..., ак] fni fnk (9.2) для системы остатков, представляющей элемент а(х) фактор- кольца Ър[х\/ f{x) так, что α{χ) = αχ{χ) (mod ft1 {χ)) λ >, α{χ) = ak(x) (mod f^k(x)) J введенное нами ранее в разделе 4.8. Рассмотрим вначале многочлены f{x) одного частного вида, у которых все показатели степеней щ в разложении (9.1) равны единице. Они называются свободными от квадратов. Иными словами, многочлен свободен от квадратов, если квадрат любого его нетривиального делителя не является его делителем. Итак, предположим, что f(x) = /ι(#)·.·. * fk{x)-> и установим способ нахождения всех неприводимых над Ър делителей /$. Согласно теореме 9.1 и теореме 4.14 (с. 119), в разложении ЭД/Д*) * Zp[a?]//i(aO ® · · · ® Zp[x]/fk(x) (9-3) каждое из фактор-колец Zp[x]/fi является полем. Множество вычетов-констант {h £ Zp[x]/fi | deg/ι = 0} является его единственным простым подполем, изоморфным полю Zp. При доказательстве теоремы 8.6 (с. 270) было отмечено, что элемент поля-расширения лежит в подполе порядка рт тогда и только тогда, когда он является корнем двучлена хр™ —х. Отсюда следует важное наблюдение, что принадлежность вычета h простому подполю поля Zp[x\/fi эквивалентна условию hp = h.
9.1. Свободные от квадратов многочлены 311 В разложении (9*3) неизвестны и число множителей fc, и сами множители fa. Найдем сначала fc. Рассмотрим множество V = { g e Zp[x]/f | g = [gi, · ■ ·,9kl (g 4) где degfift = 0 для всех ρ* e Zp[x]/fi }, состоящее из тех многочленов ρ, остатки которых от деления на все неприводимые делители fi являются константами1). Из свойств представления g = [pi,...,р/с] (см· с· 127) следует, что множество V С Ζρ[#]// является линейным векторным пространством размерности к над Ър (оно часто называется пространством или алгеброй Берлекемпа): α€Ζρ, g.geY => g + geY, ag gV, g*geY. Кроме того, degp; = 0 тогда и только тогда, когда g? = git Поэтому система вычетов [р]\...,р£] = [pi,.. · ,ρ*]? представляющая др в случае, когда deg(p (mod fi)) = 0, одновременно представляет и р. Значит, geY & др=д * др-д = 0. Пусть η = deg/. Тогда произвольный вычет ρ € Ър\х\/f имеет вид д(х) =а0+ а\х + а2х2 Η l· αη-ιχη~ι, сц е Ζρ· Следовательно, в силу леммы 8.2 (см. с. 258) др{х) = д(хр) = = ао + αιχρ + й2Х2р-\ ha^-i^™-1^ . Приводя подобные слагаемые при неизвестных Oj, получим равносильное условию ρ 6 V равенство дР - д = а0 · О + αι(^ρ - ж) + а2(^2р - х2) + ... ... + α._ι(^("-1)ί? - ж""1) = 0 (mod /). (9.5) 1^Из того, что все остатки некоторого многочлена при делении на /», г = 1,..., к являются константами, не следует, что сам многочлен является константой по модулю /. Это справедливо только в случае, когда все остатки одинаковы.
312 Глава 9. Алгоритмы Обозначим через Tj(x) остаток от деления двучлена х^р — х*7 на f{x): Tj(x) = rofj + TijX H h Tn-ijX71'1, Tij в Zp. Тогда уравнение (9.5) можно переписать как Σ?=Γο азгз(х) = ^, или, перегруппировав члены, в виде (ао · 0 + airo,i + а2Го,2 Η l· an-iro,n-i)+ + х(а0 · 0 + airi?i + а2г^2 Η l· α™-ι?%η-ι) + ... ... + хг(а0 · 0 + α\τίΛ + a2riy2 Η l· Οη-ιη,η-ι) + ... = 0. Приравнивая каждый коэффициент многочлена в левой части этого равенства к нулю, получим однородную систему линейных уравнений над Ър: [0 год 0 η ι Г0,2 П,2 \0 ГП_1Д rn_i>2 Пуп-1 Гп-1,п-1/ ( й° \ αϊ W-i/ /0\ 0 (9.6) Обозначим ее матрицу размера η х п, состоящую из коэффициентов r^j, через R. Отметим, что матрица R однозначно определяется многочленом /. Лемма 9Л. Число неприводимых делителей к свободного от квадратов многочлена f степени η удовлетворяет равенству к = п — rank R, где R = R^xn — матрица, j-й столбец которой является столбцом коэффициентов остатка Tj(x) = х^р — χί (mod f{x))f j = 0,1,...,η-1. Доказательство. Из определения пространства V и китайской теоремы об остатках следует, что k = dimV. Ранее мы убедились, что g е V тогда и только тогда, когда На = 0, где а = (αο, αϊ,..., αη-ι) — вектор коэффициентов вычета д. Иначе
9.1. Свободные от квадратов многочлены 313 говоря, подпространство V является ортогональным пространством матрицы R. Поэтому к равно размерности пространства решений системы (9.6) и искомое утверждение является тривиальным следствием теоремы 5.3 (с. 146) об образе и ядре линейного оператора. Лемма доказана. Таким образом, получен еще один способ проверки неприводимости свободного от квадратов многочлена над конечным полем: многочлен неприводим, если его матрица остатков R имеет ранг η — 1. Это условие эквивалентно линейной независимости многочленов п,..., rn_i. Найти ранг матрицы R можно, например, методом Гаусса из раздела 6.2. Попутно с рангом метод Гаусса позволяет найти еще и некоторую фундаментальную систему решений (ФСР) однородной системы Ra = 0, т.е. базис подпространства V. Покажем, что любую ФСР системы (9.6) можно использовать для разложения f(x) на множители. Действительно, пусть к > 1, а В = {βι, β2,..., е&} — какой- либо базис в ортогональном пространстве V матрицы R. Каждый базисный многочлен Bj = Bj(x) имеет два представления. Во-первых, тг-1 ej = Σ bj№1 = (&?,о, bjtiy..., bjyn-i) 1=0 как вычет кольца Zp[#]//, где bjj £ Zp и младшие коэффициенты векторной записи многочлена, как и везде выше в этом разделе, расположены слева. Во-вторых, как элемент прямого произведения (9.3) он представляется также системой остатков ej = [ej,...,e^] = [ej,...,e^]/l_/, по неприводимым делителям, где ё[ Ε 7*p[x]ffi. Первое представление нам известно после решения системы (9.6), второе — нет, как неизвестны и сами /*. Однако известно, что все остатки е\ по каждому модулю fi имеют нулевую степень, те. являются константами из Zp в силу того, что ej e V*
314 Глава 9. Алгоритмы Заметим также, что вне зависимости от многочлена / первый столбец матрицы R = R(/) всегда нулевой. Это означает, что пространство V обязательно содержит все вычеты нулевой степени из Ър\х\/f', что следует непосредственно из определения V. Поэтому без ограничения общности рассуждений можно считать, что первый среди найденных методом Гаусса базисных многочленов е\у..., е^ будет единичным: е1(ж) = 1 = (1,0,0,...,0) = [1Д,...,11/1|Л,...,Л. Данное решение (как и любая другая константа кольца Zp[x]//, в чем убедимся далее) не дает никаких сведений о делителях / и отбрасывается. Все остальные решения β2, ...,β& при к > 1 линейно независимы cei и являются нетривиальными многочленами. Для дальнейшей работы может понадобиться каждый из них. Пусть д е Zp[x\/f и пусть д φ 0. Тогда (/,#) φ /, так как degp < deg/. В силу неприводимости fi многочлены д и / = /1/2· — /к могут быть не взаимно просты тогда и только тогда, когда д делится на некоторые из многочленов /;. Рассмотрим систему остатков многочлена д = [#ι,,.. ,<Ы/Ь...,/*· Получаем, что (/,</) φ 1 тогда и только тогда, когда существует такое г, что <^ = 0* В силу (f,g) φ f должно также существовать такое j, что gj φ 0. Многочлен д называется в этом случае f-разлагающим, так как он позволяет разложить / на множители d = (/, д) и //d, причем d φ 1 и f/d φ 1. Очевидно, что <* = Пг:^=0 fi И f/d = Ui:9i^0 /i· Ключевым является наблюдение, что в V содержится много /-разлагающих многочленов. Действительно, пусть а € Zp. Тогда константе а соответствует вычет а £ V С Zp[#]//, который можно представить системой остатков [а,. · ♦, a\fiy...jk· При различных многочленах д(х) из Ър[х\/ f неприводимый делитель fi может делить как d(x) = (f{x),g{x) - α), так и f(x)/d(x)> Рассмотрим разность д(х) — а и ее систему остатков: д(х)-а= [flfi,...,flffc] - [α,.,.,α] = [flfi-a,...,flf*-a]. Если д G V, то для каждого остатка #; существует такое a G Zp,
9.1. Свободные от квадратов многочлены 315 зависящее от г, что ^ = а. При таком (и только таком) значении а разность д% — а равна нулю, и, следовательно, многочлен д(х) —а делится на /$. Поэтому разность д(х) — а является /-разлагающим многочленом при условии, что д(х) φ α. Это заведомо так, например, в случае, когда д(х) еВ\ {βι} в силу линейной независимости многочленов βι,..., еь Линейная независимость векторов базиса В оказалась, таким образом, полезным свойством. Следующее утверждение основано на втором свойстве базиса — линейной полноте. Оно показывает, что любые два неприводимых делителя могут быть отделены друг от друга вычислением НОД многочленов f(x) и е(х) — а при подходящем выборе базисного многочлена е(х) и константы а: один из них войдет в НОД, а другой — нет. Лемма 9,2. Пусть i,j £ {1, ·..,&}, i φ j — произвольные индексы. Тогда найдется такое s, 2 ^ s < к, что е* Φ ej. Иными словами, фундаментальная система решений В содержит нетривиальный вектор es> остатки которого по модулю fi и по модулю fj различны. Доказательство. Докажем лемму от противного. Фиксируем i, j и предположим, что е| = е^ для всех s = 1,..., к (базисный вектор βι также обладает этим свойством). Тогда и остатки любой линейной комбинации λχβι + ♦. · + А^е^ при делении на fi и fj также совпадают. Однако из (9.3) следует, что пространство V содержит вычеты с разными остатками. Получили противоречие с тем, что V — линейная оболочка В, Лемма до- казана. Итак, для любых г Φ j найдется хотя бы одно s = s(i, j), такое, что константы es (mod fi) и es (mod fj) различны. Пусть es = α (mod /i), где a G Ър. Тогда пара многочленов f(x) и es(x) — а имеет нетривиальный общий делитель d = (/, es — α), который делится на fi и не делится на fj. Возможно, впрочем, что d делится и на некоторый многочлен /т такой, что т φ Φ iyj, но для пары гут по доказанному утверждению найдется свой индекс sf и своя константа а1. Следовательно, перебирая константы α G Zp с индексами s = 2,..., к и вычисляя (/, es — α),
316 Глава 9. Алгоритмы можно отделить все множители /$ друг от друга. При этом на следующем шаге разложения вместо / удобно использовать его делители d и //d, найденные ранее. Резюмируя все сказанное выше, полученный метод нахождения неприводимых множителей можно условно разделить на три этапа (см, рис. 9.1), Алгоритм Берлекемпа Вход: свободный от квадратов многочлен f(x) € %р[х] Выход: список его неприводимых делителей /ь .. ♦,Λ 1· Найти матрицу остатков R = R(/). 2. Найти базис В = {βχ,..., е*.} ортогонального пространства матрицы R. 3. Используя базис В, разложить / на множители вычислением НОД с многочленами es — a. Рис. 9.1 Реализация первых двух этапов очевидна и предоставляется читателю в качестве упражнения. Они используют вычисление остатков по модулю / (например, делением «в столбик») и метод Гаусса. Псевдокод одной из возможных реализаций последнего этапа приведен на рис. 9.2. Поясним работу этой подпрограммы. На каждом ее шаге множество найденных нетривиальных делителей / объединено в список 5. Список выбран в качестве основной структуры данных потому, что сложность добавления (или выбрасывания) нового члена списка независима от его длины. Вначале (строка 1) список делителей S содержит только сам многочлен /. Еще потребуется вспомогательный список Stmp промежуточных делителей текущего шага. Программа перебирает базисные векторы в2, ...,е*.· Фиксируем очередной вектор es (строка 2). Пока вспомогательный
9.1. Свободные от квадратов многочлены 317 Вспомогательная процедура: разложить / с помощью В Вход : f€Zp[x], базис В = {е\,... ,β&} в V Вспомогательная память: списки делителей S и 5tmp Выход: S = {/ι,·.., Л}, где ft неприводимы, Πί=ι/» = / 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. S = {/} ; for( s = 2 ; s < k ; s++ ) { *->tmp — *-> > while ( Stmp 7^0 ) { F(x) = Очередной множитель (Stmp) ; \№)} ; α = 0 ; while ( α < ρ — 1 ) { d{x) = H0R(F(x),es{x)-a) ; if ( d = 1 ) a++ ; else if ( d = F ) a = ρ ; else { S = S\{F(x)} ; S = Su{d(x),F(x)/d(x)} ; if( |5| = fe ) return S ; else { a++ ; F(x) = F(x)/d(x) ; > > } } } Рис, 9.2
318 Глава 9. Алгоритмы список ранее найденных нетривиальных делителей / непуст, возьмем очередной делитель F и выбросим его из 5tmp (строки 7—8). Начнем перебирать всевозможные константы а из основного поля (цикл в строке 10). Для данных es, F и а вычислим НОД d многочленов es — а и F (строка 12). В зависимости от значения d возможны следующие варианты. Либо е8 — а и F взаимно просты — это означает, что многочлен е8—а не является F-разлагающим, но, возможно, будет им при другом значении а. Либо d = F — такое возможно, когда все остатки многочлена es по модулю всех неприводимых делителей F одинаковы и равны а, В этом случае дальнейший перебор констант а бесполезен («неудачный» es), и надо перейти к следующему делителю или даже к следующему базисному вектору, если список делителей исчерпан, — возможно, с ним повезет больше. Этой цели служит присваивание а = ρ в строке 15, которое выводит из цикла строки 10. Во всех остальных случаях многочлен es — а будет F-разлагающим, и мы переходим к строкам 18—24. Здесь мы имеем два нетривиальных делителя d и F/d, которые добавим к списку 5, и при этом выбросим F из S. Список Stmp играет роль списка старых делителей, а список S — вновь найденных, причем Stmp обновляется всякий раз при смене вектора базиса. После увеличения списка S необходимо проверить, совпадает ли его длина \S\ с к (строка 20). Если да, т.е. число делителей / равно размерности пространства V, то все они различны и неприводимы (лемма 9.1). Следовательно, получен искомый ответ. Если \S\ < fc, то следует продолжить вычисления со следующего значения а. При этом для всех значений Ь > а остатки многочлена es — Ь по модулю всех неприводимых делителей F, входящих в d, будут заведомо не равны нулю (но только для данного es). Поэтому имеет смысл упростить вычисления НОД, понизив степень многочлена F делением на d (строка 24). Здесь мы пользуемся очевидным свойством: остатки многочлена е3 — Ь по модулю неприводимых делителей многочлена F/d совпадают с остатками по модулю тех неприводимых делителей F, которые не входят в d, но входят в F/d.
9.1. Свободные от квадратов многочлены 319 Таким образом, данная подпрограмма всегда заканчивает свою работу и выходит из цикла в строке 20. Ее корректность следует из леммы 9.2. По ее окончании список S содержит все неприводимые делители многочлена /. Пример 9Л. Многочлен/(ж) = х7+xQ+2x5+x4+2x2 + 2x + 2 с коэффициентами из поля Z3 разложим в произведение неприводимых над этим полем многочленов. При помощи алгоритма Евклида нетрудно убедиться, что многочлен f(x) взаимно прост со своей производной f(x) = х6+х4+х3+х+2, и следовательно, свободен от квадратов. Поэтому для разложения f(x) на неприводимые множители можно воспользоваться изложенным выше алгоритмом Берле- кемпа. В соответствии с этим алгоритмом сначала найдем многочлены Tj(x): го(х) = 0; г\{х) = хг - χ = 0001020 (mod /), г2(х) = Xе — х2 = 1000200 (mod /), Гз(х) = х9 - х3 = 2022212 (mod /), п{х) = х12 - х4 = 2122010 (mod /), г$(х) = х15 - хъ = 2001120 (mod /), г6(х) = х18 - х6 = 0211120 (mod /). При этом удобно использовать вспомогательный многочлен у(х) для вычета х^р по модулю / и вычислять х&+1)р = х& - χ? как у(х) - хр по модулю /. Из коэффициентов Vij найденных многочленов составим матрицу R = (° 0 0 0 0 0 \о 0 0 0 1 0 2 0 1 0 0 0 2 0 0 2 0 2 2 2 1 2 2 1 2 2 0 1 0 2 0 0 1 1 2 0 о\ 2 1 1 1 2 0
320 Глава 9. Алгоритмы и найдем базис ее ортогонального пространства. Для этого элементарными преобразованиями строк преобразуем ее в матрицу /0 1 0 0 0 1 0\ 0 0 10 0 2 2 0 0 0 10 0 0' \0 0 0 0 1 0 2/ которая перестановочно эквивалентна систематической. Последняя матрица имеет полный ранг, поэтому rankR = 4 и к = = η — rankR = 7 — 4 = 3. Следовательно, исходный многочлен f(x) разлагается в произведение трех различных неприводимых над Z3 многочленов. Воспользовавшись последней матрицей, находим также базис 5bV = KerR: 1000000, 0210010, 0010101. Для дальнейшей работы (деление многочленов с остатком) коэффициенты этих векторов удобнее переписать в обратном порядке, чтобы старшие разряды оказались слева: ei = 0000001 = 1, е2 = 0100120 = х5 + х2 + 2ж, е3 = 1010100 = хв + хА + х2. Найдя базис В = {в1,е2,ез} в V, переходим к финальной стадии алгоритма. Список делителей многочлена / вначале положим состоящим только из него самого, т.е. S = {/}. Будем вычислять наибольшие общие делители / и е^—а для всех аЕ^з и всех базисных многочленов е$, начиная со второго. Имеем а = 0 и (/, в2) = 1. Но уже на следующем шаге, при а = 1, получаем общий делитель d = (/, е2 — 1) = χ2 + χ + 2 = 112, откуда f/d = 100121 и 5 = {FbF2}, где Fx{x) = χ2 + χ + 2, F2(x) = хъ + Χ2 + 2χ + \ — нетривиальный список делителей многочлена /(ж). Число делителей |5| пока еще меньше /с, поэтому продолжаем вычисления. Так как (Fi, е2 — 2) и (F2, е2 — 2) тривиальны, то переходим к следующему, последнему базисному вектору ез. Вычисляя наибольшие общие делители ез — α с очередным членом списка 5,
9.1. Свободные от квадратов многочлены 321 имеем (Fi,e3) = (Ή,^3) = 1, но (F2,e3 - 1) = χ3 + 2х + 1, ^2/(^2) ез — 1) = ж2 + 1. После этого шага список делителей / содержит многочлены х2 + χ + 2, χ2 + 1 и χ3 + 2х + 1. Сравнивая их количество с найденным ранее числом делителей к = 3, убеждаемся, что получен окончательный ответ: f(x) = (χ2 + χ + 2)(х2 + 1)(хг + 2я + 1) или 11210222 = 112 · 101 · 1021 в векторной записи. Нетрудно проверить, что каждый из найденных множителей неприводим. D Замечание 9Л. Сложность последней части алгоритма существенно зависит от найденного базиса. Базис в свою очередь зависит от способа решения системы На = 0. Так, в нашем примере, как нетрудно убедиться, мы получили е2 = [1,2, 2]д,/2,/3 и е3 = [2,2,1]/ь/2,/з, где Д = 112, /2 = 101, /3 = 1021. «Китайские» векторные представления [1,2,2] и [2,2,1] содержат много совпадающих координат и совсем не содержат нулей, поэтому нами было произведено достаточно много вычитаний и делений. При другой последовательности элементарных преобразований строк матрицы R можно было получить, например, базис ef2 = [0,1,2], е% = [0,1,0]. В этом базисе уже первые три шага алгоритма (Д е2) = Д, (/,е'2 - 1) = /2, (Де'2 - 2) = Д дадут полное разложение, и другой базисный вектор даже не потребуется. Лемма 9.3, Сложность предложенного алгоритма разло- снсения свободного от квадратов многочлена над Ър на неприводимые множители составляет 0(пг +ркп2) арифметических операций в поле Έρ. Доказательство. На первом шаге (см. рис. 9.1) требуется вычислить га—1 остатков по модулю многочлена степени га. Если вычисления проводить независимо делением в столбик, то на это потребуется (га — 1) · 0(п2) = 0(п3) операций, хотя возможны и другие способы1). Решение однородной системы с нахождением а)См. [23, 29, 30].
322 Глава 9. Алгоритмы базиса на втором шаге также имеет сложность <Э(пг), если применить метод Гаусса. Наконец, в худшем случае на последнем шаге мы переберем все к — 1 нетривиальных базисных векторов es и для каждого из них все ρ констант а из поля Ζρ (рис. 9.2). Для каждой из (к — 1)р таких пар (е3уа) состоится менее к вычислений НОД с делителями F(x), причем Y^Fes^sgFix) — п- Сложность этого равна 0(п2)^ откуда получаем искомое. Вычислительные эксперименты1^ показывают, что в среднем к & log п. Из-за перебора констант а € Ър на третьем шаге алгоритм будет эффективен лишь для сравнительно небольших значений ρ, τ е. только для небольших полей. Лемма доказана. 9.2· Алгоритм Берлекемпа. Общий случай Осталось выяснить, что делать с несвободным от квадратов многочленом. В этом разделе мы покажем, как нахождение разложения многочлена /(*) = я* ω ··■··#*(*) (9-7) сводится к нахождению разложения некоторого многочлена, не имеющего кратных неприводимых множителей. Пусть а(х) | Ь(х). Под кратностью делителя а(х) будем понимать такое натуральное число г, что аТ \ Ъ и ar+1 \ b. Лемма 9*4. Пусть h(x) — неприводимый делитель многочлена f(x) G %tp[x], имеющий кратность г > 0 β разложении (9.7). Тогда кратность h(x) как делителя НОД f(x) и его производной f(x) равна г — 1 в случае, когда ρ \ г, и равна г, когда ρ \ г. Доказательство. Если г — кратность h как делителя многочлена /, то / = hr · g и (ρ, h) = 1. Тогда /' = rhT-lg + hrg' = hr-\rg + hg!), откуда hr~l | /'. а)См. [16].
9.2. Алгоритм Берлекемпа. Общий случай 323 Первый случай. Если ρ \ г, то гд = О и /' = ffg1'. Поэтому hr делит (/, /'), a /ir+1 не делит (/, /'), так как не делит /. Отметим, что, вообще говоря, кратность h как делителя /' может оказаться больше его кратности как делителя /. Второй случай. Если ρ \ τ, то гд φ 0 и h \ гд. Поэтому h \ (rg + hgf), и, следовательно, Ы не делит /', откуда Ы \ (/, /'). Лемма доказана. Пусть А = {г | ρ делит щ} — множества номеров тех неприводимых делителей fi(x)i кратности которых в разложении (9.7) делятся нар, В = {г | ρ не делит тг^} — множества номеров тех неприводимых делителей fi(x), кратности которых в разложении (9.7) не делятся на р. Положим Ф) = П№ К*) = П/Г(*)· Тогда f(x) = a(x)b(x). Так как степени всех неприводимых делителей а(х) кратны р, то а(х) = (д(х))р = д(хр), где ρ (ж) G Ζρ[ε]. Значит, о!{х) = 0, откуда /'(я) = (а(х) · 6(я?))' = а'(ж)6(я?) + а(я?)6'(я?) = аф^О*)· Если f!{x) = 0, то В = 0 и /(ж) = а(#). В этом случае задача разложения многочлена f(x) = (g{x))p сводится к нахождению разложения многочлена д(х), имеющего меньшую степень. Если f(x) φ О, то из леммы 9.4 следует, что (/,/') = (ab,aif) = a(b,b') = а(х) ■ Ц f?-\x). г€В Поэтому многочлен ,J~ = Пгев fi(x) свободен от квадратов, и к нему можно применить метод разложения на множители из предыдущего раздела. Это позволит найти неприводимые делители fi(x) для всех г € В. После этого их кратности щ можно определить пробными делениями, и в результате мы получим многочлен Ь(ж). По частному а(х) = f(x)/b(x) легко находится такой многочлен д(х), что а(х) = д{хр). Если д(х) отличен
324 Глава 9. Алгоритмы от константы, то, применив к нему и его производной предыдущие рассуждения, по индукции получим все неприводимые делители fi(x), iG А. Кратность каждого такого делителя многочлена д(х) умножим на ρ и получим его кратность как делителя /(#). С учетом уже найденного разложения многочлена Ь(х) это даст нам искомое представление (9.7) целиком. Факторизация многочлена (рекурсивный алгоритм Берлекемпа) Вход: / G Zp[x] Выход: (S,JV), где S = {Д,...,/*}, Ν = {щ,... ,пк), где f?...f?=f 1. S = {fu...fm} = ДелителиСвобОтКв (//(/, /')) ; 2. for( j = 1 ; j <m ; j++ ) 3. { η j = 1 ; 4. while ( fjj+l\f ) nj++ ; > 5. N= {nu. ...rim}; S' = 0; N' = 0; 6. р=(//(/Г1.../й»))1/Р; 7. if (deg# > 0) then 8. (Sf,Nf) = Факторизация многочлена (g) ; 9. return (SUS'9NUp-N'); Рис, 9.3 На рис. 9.3 представлена схема этого рекурсивного алгоритма. Результатом его работы с произвольным многочленом / над Zp будет список S всех неприводимых делителей / и список их кратностей N. Теорема 9,2, Алгоритм Берлекемпа (рис. 9.3) работает корректно и находит полное разложение произвольного многочлена f(x) G Ър\х\ на множители. Доказательство. Вначале (строка 1) вычисляется производная /', наибольший общий делитель (/, /') и частное //(/, /')·
9.2. Алгоритм Берлекемпа. Общий случай 325 К свободному от квадратов многочлену //(/, /') применяется описанный выше метод разложения на множители (см. рис. 9.1). Если /' = 0, то //(/, /') = 1, S = N = 0, га = 0 и можно сразу переходить к строке 7 при д(х) = (/(#)) . В строках 2—4 пробным делением / вычисляются кратности его неприводимых делителей. В строке 6 не требуется извлечение корня степени р, так как коэффициенты многочлена д(х) содержатся среди коэффициентов многочлена а(х) = //(/χ11 •♦♦/mm)· Строка 8 содержит рекурсивный вызов процедуры поиска неприводимых делителей и их кратностей у многочлена д(х). Ответом являются объединения списков делителей и списков кратностей, при этом каждый элемент списка Nf надо умножить на р. Таким образом, искомое утверждение следует из корректности процедуры разложения свободного от квадратов многочлена, т.е. из лемм 9.1 и 9.2. Теорема доказана. Замечание 9.2. Лемма 9.3 показывает, что при небольших ρ алгоритм Берлекемпа полиномиален. Таким образом, кольцо целых чисел и кольцо многочленов над малым конечным полем имеют фундаментальное различие: многочлены можно сравнительно легко разлагать на множители, в то время как для целых чисел никаких полиномиальных алгоритмов разложения неизвестно до сих пор, хотя детерминированный полиномиальный способ проверки простоты числа недавно был обнаружен1). Пример 9.2. Применим рекурсивный алгоритм Берлекемпа к разложению над полем Ζ3 многочлена f(x) = χΙΊ + 2х16 + 2х1Ъ + 2хи + + х12 + 2х11 + х9 + 2х7 + χ4 + χ2 + χ + 2 = = 122201201020010112. Так как f(x) = 2х16 + 2х15 + х13 + χ1Ό + 2х6 + χ3 + 2х + 1 и (/,/') = 101101101202101 = = хы + х12 + хп +х9 + х8 +х6 + 2хъ + 2хъ + х2 + 1, См., например, [9].
326 Глава 9. Алгоритмы то / = 1212 = ж3 + 2ж2 + ж + 2. Раскладывая последний (заведомо свободный от квадратов) многочлен на неприводимые множители, получаем х3+2х2+х + 2 = = (х + 2)(х2 + 1). Найдем кратность ж + 2иж2 + 1 как делителей многочлена /. Для двучлена χ+ 2 = χ — 1 удобно воспользоваться схемой Горнера (в конце очередной строки остаток от деления на этот двучлен выделен жирным шрифтом): 1 1 1 1 1 1 1 1 1 1 1 2 0 1 2 0 1 2 2 0 2 2 0 2 1 1 0 2 2 0 1 2 2 1 0 1 2 1 0 1 1 2 1 2 2 0 1 0 1 0 2 2 0 1 2 2 1 0 0 0 2 1 2 2 2 2 1 2 1 0 2 0 1 0 1 1 0 0 1 1 2 0 0 1 2 0 2 2 2 0 2 2 1 0 1 0 2 0 1 1 0 2 0 Из этой таблицы следует, что искомая кратность равна 4 и что /(ж) (ж + 2)1 = 10221102020102 = = ж13 + 2хп + 2х10 + х9 + х8 + 2ж6 + 2ж4 + х2 + 2. Делением последнего многочлена на ж2 + 1 убеждаемся, что его кратность равна двум, и получаем многочлен № (х + 2)4(ж2 + I)2 = 1002000002 = х9 + 2ж6 + 2. Его производная равна нулю, поэтому он является полным кубом: f№ - fr3 ι or2 + 213 (ж + 2)4(х2 + 1)2~1 j " Разлагая стоящее в скобках выражение на множители, получим хг + 2х2 + 2 = (х + 1)(х2 + χ + 2). Отсюда окончательно имеем f(x) = (χ2 + 1)2{χ + if {χ2 +χ + 2f{x + 2)\ D
9.3. Логарифмирование. Метод согласования 327 Замечание 9.3. Данный пример приведен исключительно для иллюстрации алгоритма разложения на множители. На практике все делители небольшой степени проще находить схемой Горнера и пробным делением на многочлены из таблицы неприводимых многочленов. Минимальная степень, начиная с которой алгоритм Берлекемпа становится выгоднее полного перебора неприводимых делителей, зависит от его реализации. Эта тема выходит за рамки данного курса, интересующийся вопросами оптимизации читатель найдет все необходимое в энциклопедических библиографиях книг, приведенных в списке литературы ^. 9.3. Логарифмирование. Метод согласования Пусть а — примитивный элемент поля Fq, q = ρ™, и β — ненулевой элемент этого поля. Теорема 8.1 показывает, что уравнение ах = β (9.8) имеет решение при всех таких а, /3. Напомним, что минимальное неотрицательное решение уравнения (9.8) называется индексом, или дискретным логарифмом элемента β по основанию а, и обозначается logQ β. Такой χ фактически является вычетом из Ζ^_ι. Задача нахождения loga β называется задачей дискретного логарифмирования в поле Wq. В полях действительных и комплексных чисел известны многочисленные эффективные способы вычисления логарифмов по произвольному основанию, базирующиеся в основном на методе последовательных приближений (деление отрезка, метод Ньютона, разложение специальных функций в ряды и т.п.). Они позволяют вычислить логарифм с любой наперед заданной точностью и небольшим числом операций в поле. В случае конечного поля ситуация принципиально иная. Метод последовательных приближений неприменим в нем из-за отсутствия аксиомы Архимеда и невозможности определить антисимметричное, тран- См., например, [7, 20, 30].
328 Глава 9. Алгоритмы зитивное и связное бинарное отношение, согласованное с какой- нибудь операцией. Несмотря на многолетние усилия многих специалистов, полиномиальные алгоритмы для задачи дискретного логарифмирования до сих пор неизвестны. Это привело к широкому использованию функции ах в различных криптографических протоколах и схемах. Тем не менее известно немало методов, позволяющих найти log^/З значительно быстрее, чем полным перебором. Наиболее сильные из них, основанные на решете числового поля, имеют субэкспоненциальную сложность, но требуют глубокой подготовки в области аналитической теории чисел и выходят за рамки данного курса1). Здесь мы изложим только два особенно простых для реализации метода. Первый алгоритм называется методом согласования. Рассмотрим решение χ уравнения (9.8) как целое неотрицательное число, меньшее q — 1. Положим а = \y/q — l] и рассмотрим две последовательности элементов поля ¥q: А = iaai | 0 ^ г < а\ и В = {/? · a~j | 0 ^ j < aV Лемма 9.5* Множества А и В имеют непустое пересечение. Доказательство. Равенство ах = β выполнено при некотором #, где 0 ^ χ < q — 1. Любое число χ из промежутка О < χ < q — 1, разделив с остатком на а, можно представить в виде x = ai+j, (9.9) где 0 < г, j < α. Это следует из того, что а2 = \yfq — l] ^ q — 1. Из (9.9) имеем aai+j = /?, откуда (аа)г = βα~Κ Отметим, что по теореме о делении целых чисел с остатком представление χ ^ (г, j) однозначно. Лемма доказана. Обзор таких методов можно найти в [9].
9.3. Логарифмирование. Метод согласования 329 С практической точки зрения положительные степени а удобнее для расчетов, чем отрицательные. Поэтому от представления (9.9) перейдем к представлению χ = aif — jf с помощью биекции г' = г + 1, f = а — j. Отсюда (аа)г = βα3 , а значит и пересечение множеств А! = {aai' | 1 < гЧ а} и В* = {β · с?' | 1 < f < a} также непусто. Резюмируя сказанное, получаем следующий алгоритм (см. рис. 9.4). Алгоритм согласования Вход: α,ββΥς Выход: χ е Zq-i, где ах = β 1. Присвоить а = \yjq — l] и найти аа 2. Составить таблицу А1 = {(г, ааг) : 1 < г < а} 3. Отсортировать Af по ключу ааг 4. for( j = l; j^a; j++ ) if( βα? = aai ) break; 5. return χ = ai — j (mod q — 1); Рис. 9,4 Лемма 9.6, Сложность метода согласования не превосходит 0{yfq\ogq). Доказательство. Таблица А* шага 2 имеет размер 0{y/q). Все степени ааг элемента аа можно последовательно вычислить за а умножений в поле ¥Я) используя равенство аа^г+1^ = αα* -о*. Поэтому общая сложность шагов инициализации не превосходит по порядку величины ^fq. На шаге 3 применяется алгоритм быстрой сортировки массива Af длины а со сложностью 0(а log а). На шаге 4 мы перебираем элементы последовательности В\ проверяя, входит ли очередной элемент в Af. Поиск элемента в упорядоченном массиве
330 Глава 9. Алгоритмы длины а требует по порядку не более log α операций (в отличие от а операций в неупорядоченном). В худшем случае потребуется а попыток, поэтому общая сложность есть 0(a\oga) = — Ό(y/Ql°gЯ)· Шаг 4 может быть заменен построением и сортировкой таблицы В1 с последующим поиском коллизий в ней и А'. Таким образом, наиболее ресурсоемкими частями метода являются сортировка и поиск (при использовании медленных алгоритмов сортировки, например пузырьковой сортировки, метод согласования может оказаться даже хуже полного перебора). Объем дополнительной памяти, требуемой алгоритму, не превышает 0(y/q) элементов поля Fg. Лемма доказана. Метод согласования был предложен советским математиком А. О. Гельфондом в 1962 г. В зарубежной литературе он более известен как метод Шенкса. Пример 9*3. Рассмотрим поле Fgi = Zs[x]/(x4 + χ + 2). Корень а многочлена f(x) = χ4 + χ + 2 является его примитивным элементом. Для элементов поля будем, как обычно, использовать следующие обозначения: а^а3 + а2а2 + а\а + а0 = [а^х3 + а2х2 + а\ + a0]f^ = (a3a2aiao), где сц g Z3, опуская иногда лишние скобки. Найдем логарифм элемента β = 2α2 + 1 = 0201 методом согласования. Имеем а = \у/Щ = 9 и а9 = аг + а2 + а = 1110. Здесь и далее при вычислении степеней применяется модификация бинарного алгоритма и тождество а4 = 2а + 1 = 0021. Составим таблицу Af: а9 = 1110, а18 = 1110- 1110 = 1020, а27 = 1020 1110 = 1210, а36 = 1210 · 1110 = 2221, а45 = 2221 · 1110 = 0120,
9.3. Логарифмирование. Метод согласования 331 0120- 1110 = 0110, 0110-1110 = 2022, 2022 1110 = 2101, а = 0010. При этом использовались полезные тождества а5 = 2а2 + а = = 0210 и а6 = 2а3 + а2 = 2100. После лексикографической сортировки по второму столбцу получаем модифицированную таблицу Af: «9 «1S «27 «36 «45 «54 «63 «72 «S1 1110 1020 1210 2221 0120 ОНО 2022 2101 0010 а81 «54 а45 «1S а9 а27 «63 а72 «Зб 0010 оно 0120 1020 1110 1210 2022 2101 2221 Перейдем к вычислению элементов последовательности В! = = {/3 * G^}. Вначале убеждаемся, что /3 = 0201 ^ А\ поэтому значение j = а не подходит. При j = 1 получаем /3 · а = 0201 χ хООЮ = 2010 ^ А'. При j = 2 нас также ждет неудача, ибо /5 . а2 = (/3α)α = 2010 · 0010 = 0112 φ А!. Далее продолжаем аналогично: β · α3 = 0112 · 0010 = 1120 g Л7, β · α4 = 1120 · 0010 = 1221 £ А', /3 · α5 = 1221 · 0010 = 2201 £ Α\ β · α6 = 2201 · 0010 = 2022 € Λ'. Получили совпадение: /За6 = α68. Отсюда /3 = α63-6 = α57, значит, искомый логарифм loga/3 = loga(2o;2 + 1) равен 57. D α54 «63 α72 «81
332 Глава 9. Алгоритмы 9.4. Метод Полига — Хеллмана — Нечаева Снова рассмотрим уравнение (9.8) в поле Fr Допустим, что q — 1 = ркп, где (ρ, η) = 1. Так как ρ делит q — 1, то элемент 7 = crg-1)'p порождает подгруппу С = С(р) = {1ЛЛ2,...,7р-1} = (7), — множество решений уравнения хр = 1 в поле F^. Если ρ невелико и элемент χ содержится в С, то показатель ζ £ Ζρ, для которого выполняется χ = 7^> легко может быть найден, например, с помощью перебора или поиска в таблице С. На этом свойстве и основан наш следующий алгоритм. Представим решение уравнения (9.8), взятое по модулю pfc, в виде χ loga β = хо + xip + ... + Xk-iPk * (modp*), (9.10) где Xi € Zp. Такое представление однозначно, так как фактически является записью остатка целого числа #, взятого по модулю рк, в позиционной системе счисления с основанием р. Разряды Xi представления (9.10) можно последовательно определить, сочетая возведение обеих частей уравнения ах = β в подходящую степень с поиском логарифма в сравнительно малой подгруппе С(р). Действительно, заметим, что в силу равенства апр = 1 (ах)прк1 = a(a?o+a!iP+-+a?A-iPfc~1),nPfc~1 = (аХо)прк1. Отсюда, вспоминая, что ах = /?, получаем уравнение nfc-l решение которого xq находим перебором хо = 0,1,... ,р — 1 или с помощью таблицы логарифмов группы С(р) = {а<я-№). Далее, (о*-3*)"**-2 = аХ1Прк~\ откуда Прк-2 Ш -(О4·
9.4· Метод Полига — Хеллмана — Нечаева 333 Из последнего уравнения, зная хо> находим #χ, и т.д. Значение Жг+ι находим из уравнения ( * Л""'"'"' = Н-'Г', (9.П) которое справедливо в силу того, что Наши вычисления фактически сводятся к пошаговому нахождению остатков χ (mod ρ), я (mod ρ2), ..., χ (mod рг) дискретного логарифма χ. Основная работа при этом заключается в делении промежуточного числа β/αχο-\-χΐΡ+~·+χί-ΐΡτ на ахгРг^ Где значение Xi найдено на предыдущем шаге, с последующим возведением результата в степень. На последнем шаге мы узнаем, чему равен остаток χ (mod рк). Так как умножение, деление и возведение степень в конечном поле осуществляются достаточно просто, то алгоритм эффективен. Повторив указанные действия со всеми простыми делителями pi числа получим систему сравнений χ = z\ (mod Pi1), (9.12) χ = zr (mod PyT), где Zj удовлетворяет сравнению (9.10) при ρ = ρ,,·, j = 1,..., г. Остается применить к полученной системе формулу (2.21) китайской теоремы об остатках и получить х. Схема алгоритма приведена ниже на рис. 9.5. В следующей лемме оценим сложность приведенного алгоритма. Лемма 9.7. Если q — 1 = pkl . ..p£r, mo число операций в поле ¥q, которые потратит алгоритм Полига — Хеллмана —
334 Глава 9. Алгоритмы Нечаева, по порядку не превысит величины г Y^kjifogq + pj). i=i Доказательство. Сложность шага 1 очевидно не превосходит по порядку Y?j=1{\ogq + pj). На шаге 2 для нахождения очередного разряда числа Zj требуется возвести в степень (вычислить a~XipZ)> умножить на промежуточное значение величины βα~χ°~ΧιΡ~-~Χί-ιρϊ , снова возвести в степень прк~г~2 и пройти по таблице С{р). Возведение в степень $ < q требует 0{\ogs) = 0{\ogq) умножений и должно быть повторено ki раз. Поиск в таблице размера ρ имеет в среднем сложность 0(р) (простой перебор), при специальном упорядочении таблицы сложность может быть еще уменьшена. При фиксированном j имеем всего 0(kj(\ogq +Pj)) операций. На последнем, третьем шаге арифметика поля F^ не используется. Для решения системы (9.12) в целых числах достаточно выполнить 0(г2) операций. Лемма доказана. Алгоритм Полига—Хеллмана—Нечаева Вход: arfe¥q, ff-1 =р?1. ..р^ Выход: χ е Zq-i у где ах = β 1. Составить таблицы логарифмов C(pj) в подгруппах порядков (q — l)/pj> 3 = 1,...,г· 2. Для каждого j = 1,...,г с помощью C(pj) к ■ найти разряды числа Zj = χ (mod p/), применяя по индукции формулу (9.11). 3. Решить систему (9.12). Рис. 9.5
9.4· Метод Полига — Хеллмана — Нечаева 335 Замечание 9.4* К недостаткам алгоритма Полига — Хеллмана — Нечаева можно отнести необходимость разложения q — 1 на множители. Однако в случае, когда каждый простой делитель числа q — 1 не превосходит величины log ^ q, — такие q иногда называют гладкими (smooth) числами, — сложность алгоритма оказывается полиномиальной по длине записи q. Если же q — 1 имеет большой простой делитель, то сложность экспоненциальна. Также отметим, что алгоритм эффективно распараллеливается . Пример 9.4, Проиллюстрируем метод Полига — Хеллмана — Нечаева вычислением того же дискретного логарифма, что был ранее получен методом согласования в примере 9*3» Возьмем β = 0201 в поле FSi = Ζ^[χ]/(χ4 + χ + 2). Так как |FgjJ = 80 = 24 5, то нам потребуются таблицы подгрупп порядков 2 и 5 в Fgj. Они образованы соответственно элементами а40 и а16, причем а40 лежит в простом подполе. Получаем С(2) = %1 = {1,2} = {0001,0002}. Далее находим η = α16 = 2α3 + α + 2 = 2012 и элементы циклической подгруппы (7): С(5) = {1 = 0001, 7 = 2012, η2 = 1202, 78 = 0222, ηΑ = 0202}. Рассмотрим простой делитель 2 и вычислим остаток логарифма χ = loga/3 по модулю 24 = 16. Имеем χ = (^3^2^1^0)2 — = 8#з + 4^2 + 2χι + х0) где Xi e {0,1}, и находим младший разряд xq из уравнения β^ = /?40 = ^40*0, Для этого вычисляем /З40 = (2а2 + I)40 = 0002, откуда заключаем, что хо = L Формула (9.11) показывает, что для наших вычислений может потребоваться деление на величину аХф\ если Xi φ 0. Поэтому заранее найдем а~х и несколько первых его квадратов: α4 + α + 2=0 => 1 = α4 + α => α~ι = α3 + 1 = 1001,
336 Глава 9. Алгоритмы а~2 = 1001-1001 = 1101, а"4 = 1101 · 1101 = 1112. Теперь из (9Л1) при г = 0 получим уравнение для следующего разряда χ ι: (έΓ=(ΐΓ=<*Τ· (»■!») Вычислим β/α = β · α-1 = 0201 · 1001 = 1021, затем (β/а)20 = = 0001. Тогда из (9.13) получаем (а40)Ж1 = 1, откуда Х\ = 0. Переходим к разряду Х2) учитывая, что χ = х% - 28 +Х2 · 22 +1: Из (β/а)10 = 0001 следует #2 = 0. Наконец, / а \ 40/23 откуда х$ = 1, поскольку {β/а)5 = (а3+2а + 1)5 = 0002. Итогом всех этих вычислений является равенство 40\^2 χ = (1001)2 = 9 (mod 16). Теперь переходим к простому делителю ρ = 5. Формула /?24 = (2a2 + l)16 = a16-*(mod5) вместе с таблицей С(5) дает χ = 2 (mod 5), так как /З16 = 1202 = = 72· Решая систему ж = 9 (mod 16)1 χ = 2 (mod 5) J ' находим ж = 9 · 5 · (5-1 (mod 16)) + 2 · 16 · (16_1 (mod 5)) = = 9 · 5 · 13 + 2 · 16 · 1 = 617 = 57 (mod 80). Таким образом, мы подтвердили полученный ранее ответ. D
9.5. Коды, исправляющие ошибки 337 Замечание 9.5* Оба изложенных метода логарифмирования (Гельфонда и Полига — Хеллмана — Нечаева) являются универсальными в том смысле, что они применимы не только в мультипликативной группе конечного поля, но и вообще в любой конечной группе. Идея метода согласования находит еще более широкое применение, например в декодировании линейных кодов, криптоанализе (атака «встречей посередине») и пр. 9.5· Коды, исправляющие ошибки Рассмотрим следующую задачу По каналу связи из пункта А в пункт В передается информация в виде последовательности слов длины η из символов поля Fr Под воздействием внешних факторов в каждом передаваемом слове ν произвольным образом могут измениться не более t символов. Такое изменение слова ν можно рассматривать как его покомпонентное сложение со словом с, содержащим не более t ненулевых компонент и называемым вектором ошибок. Для безошибочной передачи информации можно поступить следующим образом. Надо ограничить множество передаваемых слов так, чтобы любые два передаваемых слова Vi и Vj отличались друг от друга не менее чем в 2ί+ 1 компонентах. Такое множество слов называется кодом длины η с минимальным расстоянием 2t + 1. В этом случае в пункте В для извлечения переданной информации из полученного слова и достаточно найти кодовое слово, отличающееся от и в минимальном числе компонент. Поиск такого слова называется декодированием. В теории кодирования рассматриваются задачи построения и декодирования кодов. Основная трудность состоит в том, что по ряду причин необходимо использовать коды большой длины и с большим минимальным расстоянием, и поэтому для декодирования таких кодов нужен простой алгоритм, сложность которого не превосходит полинома небольшой степени от η и t. Очевидно, что существуют тривиальные алгоритмы построения кода и его декодирования. Для построения кода G с расстоянием 2ί + 1 достаточно начать с одноэлементного кода и последовательно добавлять в него элементы так, чтобы новый
338 Глава 9. Алгоритмы добавляемый элемент отличался от уже принадлежащих коду не менее чем в 2ί +1 компонентах. Для декодирования полученного слова и можно последовательным перебором элементов G (или перебором векторов ошибок с не более чем t ненулевыми компонентами, если их меньше, чем число элементов в G) найти ближайший к и элемент кода. Легко видеть, что оба этих алгоритма в общем случае имеют экспоненциальную относительно η сложность. И если с такой сложностью построения кода можно смириться — один раз перебрать и затем много раз использовать, — то для декодирования это неприемлемо. Эффективное решение указанных задач, построение и декодирование кодов при больших длинах и расстояниях, оказалось возможным благодаря использованию алгебраических структур — конечных полей и линейных пространств. Далее рассматриваются алгоритмы построения и декодирования примитивных БЧХ-кодов, составляющих основу современной алгебраической теории кодирования. Эти коды были открыты в 1959 г. А. Хоквингемом и независимо от него в 1960 г. Р. К. Боузом и Д. К. Рой-Чоудхури. Они предложили простую и эффективную конструкцию, позволяющую строить коды с различными минимальными расстояниями. Впоследствии эта конструкция была обобщена, и построенные на ее основе коды стали называться кодами Боуза — Чоудхури — Хоквингема или кратко БЧХ-кодами. Пусть F™ — линейное п-мерное пространство над полем F^ из q элементов. Расстоянием Хеммипга d(x> у) между векторами χ и у из F£ называется число компонент, в которых эти векторы не совпадают. Весом \\х\\ вектора χ из F™ называется число ненулевых координат этого вектора. Нетрудно видеть, что d(x,y) = \\x-y\\. (9.14) Подмножество G = {gi,... , gm} множества векторов из F™ называется q-ичпым кодом длины η с минимальным расстоянием d, если для любых двух его элементов gi и g7- расстояние Хемминга между ними не меньше d и найдутся два элемента, расстояние между которыми равно d. Множество Ct = {с е £ ^q | IIеII ^ О называется множеством ошибок веса не более ί,
9.5. Коды, исправляющие ошибки 339 а его элементы — векторами ошибок или ошибками. Ненулевые компоненты вектора с из Ct указывают положение ошибок, а их величины называются значениями ошибок. Будем говорить, что код G исправляет t независимых ошибок, если для суммы ν = = g + с любого g € G и любого с е Ct d(v, g) < d(v, gi) для всех g; в G, таких, что g; φ g. Легко видеть, что код G исправляет t ошибок тогда и только тогда, когда его минимальное расстояние d не меньше 2ί + 1. Если ν = g+c и вес с равен &, то будем говорить, что в векторе g произошло к ошибок. Отображение Т>: ν = g+c —*► g называется декодированием кода G, или исправлением ошибок в векторе v. Код G называется линейным (п, к) -кодом, если он является fc-мерным подпространством в F£. Теорема 9*3* В каждом линейном коде G минимальное расстояние d равно минимальному весу его ненулевого элемента: d= min ||g||. Доказательство. Так как нулевой набор всегда принадлежит линейному коду, то очевидно, что минимальное расстояние не превосходит веса минимального ненулевого элемента. Допустим, что d < min ||g||. В этом случае в G найдутся два элемента gi и g2> расстояние между которыми меньше d. Следовательно, ||gi -g2|| =d(gi,g2) <d. С другой стороны, разность gi — g2 обязательно принадлежит G, Поэтому ||gi — g2|| > d. Пришли к противоречию. Теорема доказана. Пространство многочленов степени не выше η — 1 над полем ¥q изоморфно пространству F£. Задающее такой изоморфизм отображение φ ставит в соответствие многочлену ν вектор его коэффициентов ν. Этот изоморфизм позволяет при конструировании кодов использовать развитую теорию многочленов над конечными полями. Код G называется полиномиальным кодом
340 Глава 9. Алгоритмы длины η с порождающим многочленом h(x)7 если множество многочленов, соответствующих элементам кода G, состоит из всех тех многочленов степени не выше η — 1, каждый из которых без остатка делится на многочлен h(x). Такими кодами являются рассматриваемые ниже примитивные коды Боуза — Чоудхури — Хоквингема. Пусть η = qm — 1, а — примитивный элемент поля GF(qm)^ h(x) — наименьшее общее кратное минимальных многочленов элементов α, α2,... , α2ί поля GF(qm). Примитивным БЧХ~ко· дом G длины η с конструктивным расстоянием 2ί + 1 и порождающим многочленом h(x) будем называть идеал h(x)¥q[x]/(xn — 1) кольца Fq[x]/(xn - 1). Теорема 9.4* Минимальное расстояние примитивного Б ЧХ- кода не меньше его конструктивного расстояния. Доказательство. Пусть G — примитивный БЧХ-код длины η = qm — 1 с конструктивным расстоянием 2t + 1, h(x) — его порождающий многочлен. Для доказательства теоремы достаточно показать, что никакой многочлен из Fg[#]/(£n — 1) с не более чем 2ί ненулевыми коэффициентами не делится на h{x). Допустим, что утверждение теоремы не верно, и такой многочлен g(x) = h(x)g(x) = ^j=i9j^Zj существует. Тогда среди его корней будут элементы а, а2,..., α2ί, и, следовательно, имеет место система уравнений gha^ + gi2a^ + ... + 9i2t<*' tit ο,Ι Pii (α2)*1 + ife(a2)i2 + ··· + 9i2t{oc2)i2t = 0, 9ή(α2ψ + 9i2(a2tY2 + ··· + sU»2*)'2' = 0, J которая в матричной записи выглядит следующим образом: / а* а .*2 αίι·2 α*2·2 ai2t \ а' ■*2*·2 ya*V2t αί2·2ί ач,.ау #ί2 W/ 0 Vo7 (9.15)
9.5. Коды, исправляющие ошибки 341 Так как / а* det а ,п a*1'2 ai2'2 ai2t \ а ,i2f2 \a^2t a^2t ... a^'2tJ ( 1 1 = ailai2--ai2tdet a1 a *2 a Я21 7^0, ^ι·(2ί-1) ai2-{2t-\) ai2t.(2t-\)J то в силу леммы 5.5 матрица в (9.15) невырождена и, следовательно, это уравнение не имеет ненулевых решений. Противоречие. Теорема доказана. Пример 9.5. Найдем порождающий многочлен h(x) троичного примитивного БЧХ-кода длины 26, исправляющего три ошибки. В качестве поля из 27 элементов возьмем построенное в примере 8.10 поле ^з[«], где « — корень примитивного многочлена х3 +2ж+1. Напомним, что в этом поле степени «выглядят следующим образом: «° = (001), а1 = (010), «2 = (100), «3 = (012), а4 = (120), «5 = (212), а6 = (111), а7 = (122), «8 = (202), а9 = (011), «10 = (НО), а11 = (112), «12 = (102), «13 = (002), аи = (020), а1Ь = (200), «16 = (021), «1? = (210), а18 = (121), «ί9 = (222), «20 = (211), а21 = (101), а22 = (022), а23 = (220), «24 = (221), а25 = (201). (9.16) Так как х3 + 2х + 1 является минимальным многочленом для а и а3, а минимальные многочлены а2 и а6 совпадают, то для нахождения h(x) надо найти минимальные многочлены элементов α2, α4 и а5. Используя равенства (9.16), последовательно находим эти многочлены:
342 Глава 9. Алгоритмы та2(х) = (х - а2)(х - а6)(ж - а18) = = х3 - (а2 + а6 + а18)*2 + (а8 + а20 + а24)х - а26 = = х3 - 2х2 + χ - 1 = χ3 + χ2 + χ + 2; та4(х) = (х — а4)(х — а12)(х — а10) = = х3 - (а4 + а10 + а12)х2 + (аы + а16 + а22)х - а26 = = х3 - 2х2 - 1 = х3 + х2 + 2; таъ(х) = (х — а5)(х — а1Ь)(х — а19) = = х3 - (а5 + а15 + а19)х2 + (а20 + а24 + а28)х - а13 = = χ3 - χ2 + χ - 2 = я3 + 2х2 + χ + 1. Умножая х3 + 2х + 1 на найденные минимальные многочлены £3+£2+#+2, #3+х2+2 и#3+2х2+я + 1, находим порождающий многочлен h(x) = χ12 + χ11 + 2я6 + х3 + 2х2 + 2х + 1 (9.17) троичного примитивного БЧХ-кода длины 26, исправляющего три ошибки. D Построим алгоритм исправления ошибок в примитивных БЧХ-кодах. Для этого найдем вектор ошибок с, если известна сумма ν = g + с. Прежде всего заметим, что так как д(осг) = О для 1 < г ^ 2ί, то г;(а<)=р(а*)+с(а<) = с(а<), и, следовательно, значение многочлена υ на аг зависит только от многочлена ошибок с. Для 1 < г < 2< положим я/(аг) = S^. Набор S = (Si, S2, · · ·) S2i) называется синдромом многочлена υ (или синдромом вектора ν). Допустим, что многочлен ошибок с содержит ровно г ^ t ненулевых слагаемых и равен Σΐ=ι с3гх^· Для ^ = 1> · · · > Т ввеДем локаторы ошибок Х% = с^*, при этом величину с^ ошибки, соответствующей локатору Xi, обозначим через У$. Нетрудно видеть, что первые г компонент синдрома S многочлена ν выражаются
9.5. Коды, исправляющие ошибки 343 через локаторы и величины ошибок следующим образом: Х2 ■ (Χι Iх *1 Ά xi ХЛ /УЛ χι \уЛ W ХГг/ /ΥιΧι + YiXl + -\- YrXr \ + ΥτΧΐ (SX\ s2 \ΥιΧί + · · · + YrX;) \Sr) (9.18) Как и в (9.15), матрица в левой части равенства (9.18) невырождена. Поэтому если известны локаторы ошибок Х±, то величины ошибок Yi можно найти из (9.18). Для нахождения локаторов ошибок воспользуемся многочленом локаторов ошибок А(х) = (1 - хХх)(1 - хХ2)... (1 - хХг) = = Агхг + Ar_i^r_1 Η h A\x + 1. Если многочлен А(х) известен, то, вычислив его корни, можно определить позиции ошибок. Так как переменная χ может принимать не более чем η различных значений, то корни А(х) можно найти, последовательно вычисляя значения А(х) на всех элементах поля GF{qrn). Для этого достаточно выполнить в общей сложности 0(tn) действий над элементами поля GF{qm)t Сначала для каждого г = 1, ...,г и каждого j = 1,...,г умножим многочлен локаторов ошибок на произведение и подставим вместо переменной χ его корень X"1. В результате получим систему равенств ArY%Xl + Ar-iYiX^1 + · · · + АМХ1+'-1 + YiX гГ+j О, (9.19) где г = 1,..., г и j = 1,..., г. Суммируя при фиксированном j равенства из (9.19) по всем г от 1 до г, получим, что для каждого 3 = 1,.. .,г J2(ArYiX} + Ar-MXt1 + · · · + YiXl+J) = ί=1 = ατΣ Yin+Ar-i Σ γ#ί+1 + · · ·+Σ γ*χΐ+ί = °· ί=1 %=1 %=ι
344 Глава 9. Алгоритмы Так как суммы, умножаемые в последнем равенстве на коэффициенты Л^, являются компонентами синдрома, то ArSj+Ar-1Sj+i + -+AiSr+j-i+Sr+j = 0, j = l,...,r. (9.20) Из равенств (9.20) составим систему уравнений относительно коэффициентов Л*. В матричной форме эта система имеет следующий вид: /Si S2 S2 S3 Sr \ Sr+1 /ЛР \ \Sr SV+1 * ♦ ♦ S2T-1J v-i /-Sr+i\ \Ai/ -s, r+2 (9.21) V -#2r / Пусть Sr — матрица из (9.21) и r ^ ί ^ ί. Покажем, что матрица Sj невырождена, если I = г, и вырождена, если I > г. Для того чтобы убедиться в этом, достаточно представить матрицу S/ в виде произведения /Si S2 S2 S3 Si+i \Si Si+i ... S21-1/ (YlXl Y2X2 YyX\ Y2xl ΥιΧι\ YiXf /1 Xi 1 x2 \YiX\ Y2Xl2 ... YiX\) \1 Χι rl-Ъ ч rl- L2 rl-1 χ\Λ χ1-1 х]-Ч в котором левый множитель также можно представить в виде произведения (ΥλΧλ Υ2Χ2 Yxxl y2x% ΥιΧΛ ΥιΧ? \ΥιΧ\ Υ2Χι2 ... ΥιΧ}/ /1 1 ... 1 \ Χι Χ2 . * ♦ Χι (Υ\Χ\ ο \χ\-^χ^...χ\-η ο \ 0 Υ2Χ2 ... 0 V ο ο ... YiXj
9.5. Коды, исправляющие ошибки 345 Таким образом, видим, что матрица S/ является произведением трех квадратных матриц, две из которых невырождены тогда и только тогда, когда различны все Х^ а третья — диагональная матрица, невырождена тогда и только тогда, когда все Χι и Yi отличны от нуля1). Следовательно, матрица S/ невырождена тогда и только тогда, когда все Хг различны и все Yi отличны от нуля, т. е. когда / = г\ Теперь можно сформулировать алгоритм декодирования примитивного БЧХ-кода. Пусть БЧХ-код длины η = qm — 1 исправляет t ошибок. Тогда для декодирования вектора ν выполняем следующие действия. 1. Вычисляя значения г;(а), ι>(α2),..., v(a2t)) находим компоненты синдрома Si, #2,..., >$2t и полагаем г = t. 2. Составляем матрицу /Si S2 ... Sr \ β _ I S2 S3 ... Sr+i \ O7- iJj r+1 $2г-\) и определяем, вырождена эта матрица или нет. 3. Если матрица Sr вырождена, то уменьшаем г на единицу и возвращаемся к п. 2. Если матрица Sr невырождена, то определяем, что число ошибок равно г, и переходим к следующему пункту. 4. Решая матричное уравнение /Si S2 ... Sr \ ( Ъ\ S2 S3 ... Sr+i I I Ar_i \Sr S2r-l/ —Sr-\-2 \Ai/ V -s2r) Sr+l · ·· Z>2r-\j находим коэффициенты Л* многочлена локаторов ошибок. 5. Последовательно вычисляя на всех элементах поля GF(qm) значения многочлена А(х) = Агхг + ΛΓ_ι£Γ-1 Η Ь Αχχ + 1, "^Для выполнения при t ^ I > г указанных матричных равенств положим Yi = 0 при г < г < t, а индексы позиций фиктивных ошибок ji для г < г ^ t выберем произвольными.
346 Глава 9. Алгоритмы находим его корни χ ι,... ,хг, обращая которые, находим локаторы ошибок Χι,..., Хг. Затем из равенств JQ = а?1 определяем позиции ошибок fa. 6. Решая матричное уравнение 'Χι Χ2 χ\ χξ ,х\ хг2 хл хГ xi) (ΥΛ \Уг) (Sl\ U/ находим величины ошибок Υί,..., Yr, 7. Пусть, как и ранее, е, — j-й базисный вектор стандартного базиса. Вычисляя разность «-Σ* ieji> г=1 находим кодовый вектор g. Приведенный алгоритм декодирования называется алгоритмом Питерсона — Горенстейна — Цирлера. Нетрудно видеть, что для реализации этого алгоритма достаточно выполнить 0(t4 + nt) действий над элементами поля GF(qm), Пример 9*6* Рассмотрим работу алгоритма на примере исправления ошибок в векторе ν = (01222222222222222222222222) троичным БЧХ-кодом длины 26 с построенным в предыдущем примере порождающим многочленом (9.17). 1. Вычисляя при помощи (9.16) значения многочлена ν(χ) = χ^ + 2х16 + 2х" -\ +2аГ + 2х + 2 на элементах α, α2, а4 и а5, найдем первую, вторую, четвертую и пятую компоненты синдрома: Si = = a, S2 = = ОГ, S4 = = сЛ 55 = = а ю
9.5. Коды, исправляющие ошибки 347 Далее находим 5з = (5ι)8 = α3 и 5б 2—3. Положим г = 3. Так как (з2У а ,24 'Si S2 53 det I S2 Ss S4 au+aio + aio a a a 24 0, то заключаем, что произошло не более двух ошибок. Положим г = 2. Так как **(%%)=** (5 ίΗ-«'νο, то заключаем, что произошло две ошибки. 4. Найдем коэффициенты многочлена локаторов ошибок. Для этого решим матричное уравнение Si S2\ (А2\ (-SA S2 S3 UJ \-Sj ' преобразуя левую часть расширенной матрицы уравнения в единичную. Так как а а а8, сг —а —а 25 fa а8\аы\ (\ а7 \as a3\al2)~\l α2λ 1 а7 0 а21 - а7 а4 - а15 а21 1 а1 0 а3 15 а а4 1 а' 0 1 а15\ /1 01 а15 - оЛ /1 <j~(,0 1 α20 J Л° о 0 1 v20 то А2 = а и Λι = а" 5. Вычисляя значения многочлена А(х) = α2Άχ2 + а20х +1 на всех ненулевых элементах поля Хз[а], найдем его корни Х\ = а и х2 = о?· Обращая корни, находим локаторы ошибок Х\ = = а25 и Х2 = а24, которые, очевидно, соответствуют двум левым позициям.
348 Глава 9. Алгоритмы 6. Для определения значений ошибок Y\ и Υ2 решим матрич- 'Χι Ъ\ fYi\ fSA π ное уравнение ( v2 v2 J ( ^ J = ( я ) - Так как Ά *l ίά 25 24 α \ /ία С *25 „24 ,0 αΛ-α· α10 - α2 /1 α25| α2\ /10 [θ 1 | c*13J ~ \0 1 α2 — α 1 α25 0 α14 ί) "Κ. Λ^ 0 1 το Υί = 1 и >2 = 2. Следовательно, в векторе ошибок с последние 24 компоненты равны нулю, первая компонента равна двум, а вторая — единице. 7. Вычитая из полученного вектора ν найденный вектор ошибок с: ν - с = (01222222222222222222222222)- - (12000000000000000000000000) = = (22222222222222222222222222), находим искомый элемент кода g, у которого каждая компонента равна 2. D Задачи 9.1. Показать, что если ¥q — конечное поле нечетной характири- стики, то элемент а е F* имеет в ¥q квадратный корень β, τ. е. такой элемент, что β2 = α, тогда и только тогда, когда а^-1^2 = 1. Как можно его вычислить? 9.2. Доказать, что а = 2 является примитивным элементом поля Ζιοι и найти логарифм вычета 59 по основанию а. 9*3. Найти логарифм элемента α3 + α2 + 1 по основанию примитивного элемента а поля Fsi = Рз[х]/(а:4 + χ + 2) из примера 9.3. 9.4. Решить уравнение 2х = 195 (mod 192). 9.5. Решить уравнение 3х = 132 (mod 257).
Задачи 349 9.6. Пусть q — 1 = pxl . ..р*г. Построить алгоритм, решающий задачу дискретного логарифмирования в поле F9? число операций которого по порядку не превосходит £^=1 kj(\ogq + y/Pjlog2Pj). 9.7. Многочлены xs ^х6 ^х4 -\-х3 -\-1 и χ12 -\-хг -\-хБ -\-х4 -\-х3 -\-х2^ + 1 разложить на неприводимые множители над полем Z2 с помощью алгоритма Берлекемпа. 9.8. Доказать неприводимость над Z3 многочлена х3 + 2х2 + χ + 1 с помощью алгоритма Берлекемпа. 9.9. Доказать, что число /-разлагающих многочленов в определенном на с. 311 пространстве V равно рк — (р — 1)к — 1. Получить отсюда, что взятая наугад линейная комбинация векторов базиса В в V будет /-разлагающей с вероятностью не менее 1/р. 9.10. Пусть многочлен / € Ζρ[χ] свободен от квадратов и д(х) € G Zp[x]/f, причем degg > 1. Пусть др = д (mod /). Доказать, что /(*)= Π (/(*)> ^*)-а)' причем правая часть этого равенства является нетривиальным разложением f(x) на взаимно простые множители. Останется ли верным это утверждение, если / не свободен от квадратов? 9.11. Пусть / = fi'--fk — свободный от квадратов многочлен степени η над полем Ζρ, множители /f неприводимы и щ = deg/f. Положим Μ = ΗΟΚ(ηι,... ,пА) и Τ {χ) = χ + χρ + χρ2 + ... + ζρΜ. Пусть Ti(x) = Т(#г) (mod /(а?)). Показать, что по крайней мере один из многочленов Т\(х)^..., Tn_i(a;) является /-разлагающим. 9Λ2. Пусть G — линейный (п, &)-код. Матрица из η — к строк и η столбцов называется проверочной матрицей кода G, если ее строки образуют базис ортогонального пространства кода G. Показать, что матрица Η будет проверочной матрицей линейного кода с минимальным расстоянием не меньшим d тогда и только тогда, когда ее любые d — 1 столбцов линейно независимы. 9.13. Написать проверочную матрицу двоичного БЧХ-кода длины 15, исправляющего две ошибки. 9.14. Найти порождающий многочлен и размерность двоичного БЧХ-кода длины 15, исправляющего три ошибки. 9.15. Пусть qm — 1 = ab, α — порождающий элемент поля GF(qm). Показать, что минимальное расстояние полиномиального кода длины Ь, порожденного многочленом ΗΟΚ(τηαα (χ), та2а (#),..., ma2ta (x)), не меньше, чем 21 + 1.
350 Глава 9. Алгоритмы 9.16. Код G называется циклическим, если вместе с каждым своим элементом ((?ь<?2><?з> · · · ,9п) код G содержит и его циклический сдвиг (92,93, ·· · ,9η,9ι)- Показать, что любой примитивный БЧХ- код — циклический. 9.17. Найти порождающий многочлен двоичного (21,11)-кода, исправляющего две ошибки. 9.18. Показать, что существует исправляющий шесть ошибок двоичный полиномиальный (80,40)-код. Для этого кода описать алгоритм построения порождающего многочлена и алгоритм исправления ошибок. 9.19. При передаче по каналу с помехами кодового слова двоичного кода БЧХ длины 15 с корнями в поле %2[%]/(%4 + х3 + 1), исправляющего три ошибки, получено слово ν = (011000000111101). Декодировать его. 9.20. Пусть G — примитивный двоичный БЧХ-код. Доказать, что если g £ G, то и g £ <7, где вектор g отличается от g во всех разрядах. 9.21. Привести пример примитивного двоичного кода БЧХ, истинное минимальное расстояние которого строго больше конструктивного. 9*22. Пусть V(g) = g + Ci. Показать, что множества V(g) и V(g') не пересекаются при различных g,g' € G, если G — примитивный двоичный код БЧХ длины η = 2m — 1, иправляющий одну (ί = 1) ошибку. Показать, что UgeG ^(б) = Щ _1· 9.23. Найти максимальное п, для которого существует двоичный линейный код длины п, исправляющий одну ошибку, проверочная матрица которого содержит ровно три строки. 9.24. Пусть G — линейный (п, к)-код. Матрица А = А^хп называется его порождающей матрицей, если ее строки образуют базис в G, Найти число различных порождающих матриц (п, &)-кода. 9.25. Показать, что у всякого линейного (п, &)-кода найдется систематическая порождающая матрица. Используя это, доказать, что для любого (п, &)-кода с минимальным расстоянием d выполнено неравенство d ζ η — k + 1, называемое неравенством Синглтона.
Литература 1. Абрамов С. А. Лекции о сложности алгоритмов. Москва: МЦНМО, 2009. 256 с. 2. Айерлэнд К., Роуз en М. Классическое введение в современную теорию чисел. Москва: Мир, 1987. 416 с. 3* Андерсон Дот. А. Дискретная математика и комбинаторика. Москва: Вильяме, 2004. 960 с. 4. Алексеев В. Б. Теорема Абеля в задачах и решениях. Москва: МЦНМО, 2001. 192 с. 5. Ахо Α., Хопкрофт Дэю., Ульман Дж. Построение и анализ вычислительных алгоритмов. Москва: Мир, 1979. 536 с. 6. Берлекэмп Э. Алгебраическая теория кодирования. Москва: Мир, 197L 479 с. 7. Болотов Α. Α., Гашков СБ., Фролов А. Б., Часовских А. А. Элементарное введение в эллиптическую криптографию. Алгебраические и алгоритмические основы. Москва: Ком- книга, 201L 328 с. 8. Блейхут Р. Теория и практика кодов, контролирующих ошибки. Москва: Мир, 1986. 576 с. 9. Василенко О. Н. Теоретико-числовые алгоритмы в криптографии. Москва: МЦНМО, 2003. 328 с. 10. Випберг Э.Б. Начала алгебры. Москва: МЦНМО, 1998. 192 с. 11. Випберг Э.Б. Курс алгебры. Москва: Факториал, 2002. 544 с. 12. Виноградов И. М. Основы теории чисел. Москва — Ижевск: НИЦ «Регулярная и хаотическая динамика», 2003. 176 с.
352 Литература 13. Гашков С. Б. Современная элементарная алгебра в задачах и решениях. Москва: МЦНМО, 2006. 328 с. 14. Гельфанд И. М. Лекции по линейной алгебре. Москва: МЦНМО, 1998. 320 с. 15. Зорин В. А. Математический анализ. Т. 1. Москва: МЦНМО, 2002. 664 с. 16. Кнут Д. Искусство программирования. Т. 2. Москва: Вильяме, 2001. 788 с. 17. Коблиц Н. Курс теории чисел и криптографии. Москва: ТВП, 2001· 254 с. 18. Кострикин А. И. Введение в алгебру. Ч. 3. Основные структуры алгебры. Москва: Физматлит, 2001. 272 с. 19. Сборник задач по алгебре: учеб. пособие под ред. А. И. Ко- стрикина. Москва: Факториал, 1995. 454 с. 20. Лидл Р.} Нидеррайтер Г. Конечные поля. Москва: Мир, 1988. 822 с. 21. Мендельсон Э. Введение в математическую логику. Москва: Наука, 1984. 320 с. 22. Нечаев В. Я, Элементы криптографии (основы теории защиты информации). Москва: Высшая школа, 1999. 109 с. 23. Ноден П., Китте К. Алгебраическая алгоритмика. Москва: Мир, 1999. 720 с. 24. Питерсон У, Уэлдон Э. Коды, исправляющие ошибки. Москва: Мир, 1976. 594 с. 25. Проскуряков И. В. Сборник задач по линейной алгебре. Москва: Лаборатория базовых знаний, 2003. 384 с. 26. Фаддеев Д. К. Лекции по алгебре. Москва: Наука, 1984. 416 с. 27. Фрид Э. Элементарное введение в абстрактную алгебру. Москва: Мир, 1979. 261 с. 28. Чашкин А. В. Дискретная математика. Москва: Академия, 2012. 352 с. 29. Cohen H. A course in computational algebraic number theory. Berlin: Springer-Verlag, 1993. 534 p. 30. von zur Gathen J., Gerhard J. Modern computer algebra. 3rd ed. Cambridge University Press, 2013. 808 p.
Литература 353 31» Shoup V. New algorithms for finding irreducible polynomials over finite fields // Math. Сотр. 54, 1990, pp. 435-447. 32. Shoup V. Fast construction of irreducible polynomials over finite fields // J. Symbolic Comput. 17, 1994, pp. 371-391.
Приложение А* Примитивные элементы поля Zp Таблица первых 195 простых чисел» Во втором столбце перечислены простые числа р, в третьем — минимальные примитивные корни amin из Zp. η 1 2 3 4 5 б 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Рп 2 3 5 7 11 13 17 19 23 29 31 37 41 43 47 53 59 61 67 71 73 79 83 89 97 101 103 107 109 113 а 1 2 2 3 2 2 3 2 5 2 3 2 6 3 5 2 2 2 2 7 5 3 2 3 5 2 5 2 6 3 η ~бТ 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 Рп 283 293 307 311 313 317 331 337 347 349 353 359 367 373 379 383 389 397 401 409 419 421 431 433 439 443 449 457 461 463 а ~1Г 2 5 17 10 2 3 10 2 2 3 7 6 2 2 5 2 5 3 21 2 2 7 5 15 2 3 13 2 3 η ~зТ 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Рп 127 131 137 139 149 151 157 163 167 173 179 181 191 193 197 199 211 223 227 229 233 239 241 251 257 263 269 271 277 281 а ~Ύ~ 2 3 2 2 6 5 2 5 2 2 2 19 5 2 3 2 3 2 6 3 7 7 6 3 5 2 6 5 3
Приложение А. Примитивные элементы поля Ър 355 η 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 ПО 111 112 ИЗ 114 115 116 117 118 119 120 121 122 123 124 125 Рп 467 479 487 491 499 503 509 521 523 541 547 557 563 569 571 577 587 593 599 601 607 613 617 619 631 641 643 647 653 659 661 673 677 683 691 а 2 13 3 2 7 5 2 3 2 2 2 2 2 3 3 5 2 3 7 7 3 2 3 2 3 3 11 5 2 2 2 5 2 5 3 η 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 Рп 701 709 719 727 733 739 743 751 757 761 769 773 787 797 809 811 821 823 827 829 839 853 857 859 863 877 881 883 887 907 911 919 929 937 941 а 2 2 11 5 6 3 5 3 2 6 11 2 2 2 3 3 2 3 2 2 11 2 3 2 5 2 3 2 5 2 17 7 3 5 2 η 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 Рп 947 953 967 971 977 983 991 997 1009 1013 1019 1021 1031 1033 1039 1049 1051 1061 1063 1069 1087 1091 1093 1097 1103 1109 1117 1123 1129 1151 1153 1163 1171 1181 1187 а 2 3 5 6 3 5 6 7 11 3 2 10 14 5 3 3 7 2 3 6 3 2 5 3 5 2 2 2 11 17 5 5 2 7 2
Приложение В. Разложение на простые множители чисел вида рп — 1 22-1 23-1 24-] 25-] 26-] 27-] 28-1 29-1 210-] 211-] 212-] 213-1 214-1 215-] 216-] 217-] 218-] 219-1 220-1 221-] 222-] 223-] 224-1 225-1 226-] 227-] 228-] 229-] 230-! 231-1 232-] 233-] 234-] 235_] [ = [ = 1 = ι = = = [ = [ = ι = ι = = [ = [ = ι = ι = = = [ = [ = ι = ι = = [ = [ = ι = ι = = = [ = [ = ι = ι = = [ = 3 7 15 31 63 127 255 511 1023 2047 4095 8191 16383 32767 65535 131071 262143 524287 1048575 2097151 4194303 8388607 16777215 33554431 67108863 134217727 268435455 536870911 1073741823 2147483647 4294967295 8589934591 17179869183 34359738367 = = = = = = = = = = = = = = = = = = = = = = = = = = 3-5 32·7 3-5-17 7-73 311-31 23-89 32 · 5 · 7 · 13 3 · 43 · 127 7-31-151 3-5-17-257 33 · 7 · 19 · 73 3 · 52 - 11 · 31 · 41 72 · 127 · 337 3 · 23 · 89 · 683 47 ·178481 32· 5-7-13-17-241 31 · 601 · 1801 3-2731-8191 7 · 73 · 262657 3-5-29-43-113-127 233 1103 2089 32· 7-11-31- 151-331 3 · 5 · 17 · 257 · 65537 7 · 23 · 89 · 599479 3 · 131071 · 43691 31-71-127- 122921
Приложение В. Разложение на простые рп — 1 357 236_ 237_ 23S_ 239_ 240_ 241_ 242_ 243_ 244_ 245_ 246_ 247_ з2- з3- з4- з5- з6- з7- 3s- з9- з10- 3й- з12- 313_ з14- з15- 316_ З17- з18- з19- з20- з21- з22- 323_ з24- з25- -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = 68719476735 137438953471 274877906943 549755813887 1099511627775 2199023255551 4398046511103 8796093022207 17592186044415 35184372088831 70368744177663 140737...355327 8 26 80 242 728 2186 6560 19682 59048 177146 531440 1594322 4782968 14348906 43046720 129140162 387420488 1162261466 3486784400 10460353202 31381059608 94143178826 282429536480 847288609442 = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = З3 · 5 · 7 · 13 · 19 · 37 · 73 · 109 223 · 616318177 3·174763·524287 7 · 79 · 121369 · 8191 3 · 52 · 11 · 17 · 31 · 41 · 61681 164511353·13367 З2 · 72 · 43 · 127 · 337 · 5419 431 · 2099863 · 9719 3 · 5 · 23 · 89 · 397 · 683 · 2113 7 · 31 · 73 · 151 · 631 · 23311 3 · 47 · 178481 · 2796203 2351 · 4513 · 13264529 23 2 13 24·5 2-112 23·7· 13 2·1093 25 · 5 · 41 2 · 13 ·757 23 · II2 · 61 2 · 23 · 3851 24 · 5 · 7 · 13 · 73 2 · 797161 23 · 547 · 1093 2 · И2 · 13 · 4561 26 · 5 · 17 · 41 · 193 2·1871-34511 23 · 7 · 13 · 19 · 37 · 757 2 · 1597 · 363889 24 · 52 · И2 · 61 · 1181 2 · 13 · 1093 · 368089 23· 23-67-661-3851 2 · 47·1001523179 25 · 5 · 7 · 13 · 41 · 73 · 6481 2 · II2 · 8951 · 391151
358 Приложение В. Разложение на простые рп — 1 52- 53- 54- 55- 56- 57- 58- 59- 510- 511- 512- 513- 514. 515- 516- 517- 518- 519. 520. 72- 73- 74- 75- 7б- 77- 78- 79- 710 . 7". 712 . 713 . 714 . 715 . у16 . 717- 718 . -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = 24 124 624 3124 15624 78124 390624 1953124 9765624 48828124 244140624 1220703124 6103515624 30517578124 152587890624 762939453124 381469...65624 190734...28124 953674...40624 48 342 2400 16806 117648 823542 5764800 40353606 282475248 1977326742 13841287200 96889010406 678223072848 474756...09942 332329...69600 232630...87206 162841...10448 = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = 23-3 22·31 24 · 3·13 22 · И · 71 23 · З2 · 7 · 31 22 · 19531 25 · 3 · 13 · 313 22· 19 -31 -829 23 - 3 11 · 71 · 521 22·12207031 24 · З2 · 7 · 13 · 31 · 601 22 · 305175781 23 · 3 · 29 · 449 · 19531 22· И-31-71 181 1741 26-3-13-17-313-11489 22 · 409 · 466344409 23 · З3 · 7 · 19 · 31 · 829 · 5167 22 · 191 · 6271 · 3981071 24 - 3-11-13-41-71-521-9161 24-3 2 · З2 · 19 25·3 · 52 2 · 3 · 2801 24 · З2 · 19 · 43 2 · 3 · 29 · 4733 26 · 3 · 52 · 1201 2 · З3 · 19 · 37 · 1063 24 · 3 · И · 191 · 2801 2 · 3 · 1123 · 293459 25 · З2 · 52 · 13 · 19 · 43 · 181 2·3 · 16148168401 24 · 3 · 29 · 113 · 911 · 4733 2 · З2 · 19 · 31 · 2801 · 159871 27 · 3 · 52 · 17 · 1201 · 169553 2 · 3 · 14009 · 2767631689 24·33·19·37·43·1063·117307
Приложение С. Неприводимые и примитивные многочлены Ниже приведены векторы коэффициентов неприводимых многочленов над Z2, 2з и Z5* Непримитивные многочлены обозначены курсивом. Старшие разряды расположены слева. Многочлены п = 2 111 η = 3 1011 η — 4 10011 η = 5 100101 111011 η = β 1000011 1100001 1110101 η = 7 10000011 10011101 10111111 11010101 11110111 η = 8 100011011 100111001 101100011 101110111 110001101 110110001 111010111 111110101 над Ζ2 степени η = 2,3, 1101 11001 101001 111101 1001001 1100111 10001001 10100111 11000001 11100101 11111101 100011101 100111111 101100101 101111011 110011111 110111101 111011101 111111001 11111 101111 1010111 1101101 10001111 10101011 11001011 11101111 100101011 101001101 101101001 110000111 110100011 111000011 111100111 4,5,6,7,8, i 110111 1011011 1110011 10010001 10111001 11010011 11110001 100101101 101011111 101110001 110001011 110101001 111001111 111110011
360 Приложение С. Неприводимые многочлены η = 9 1000000011 1000010001 1000010111 1000011011 1000100001 1000101101 1000110011 1001001011 1001011001 1001011111 1001100101 1001101001 1001101111 1001110111 1001111101 1010000111 1010010101 1010011001 1010100011 1010100101 1010101111 1010110111 1010111101 1011001111 1011010001 1011011011 1011110101 1011111001 1100000001 1100010011 1100010101 1100011111 1100100011 1100110001 1100111011 1101001001 1101001111 1101011011 1101100001 1101101011 1101101101 1101110011 1101111111 1110000101 1110001111 1110100001 1110110101 1110111001 1111000111 1111001011 1111001101 1111010101 1111011001 1111100011 1111101001 1111111011 Многочлены над Ζ3 степени η = 2,3,4,5,6 п = 2 101 η = 3 1021 1211 η — 4 10012 11002 12002 η = 5 100021 101102 102122 110021 111211 112201 120212 122002 112 1022 1222 10022 11021 12011 100022 101122 102202 110101 111212 112202 120221 122021 122 1102 10102 11101 12101 100112 101201 102211 110111 112001 120001 121012 122101 1112 10111 11111 12112 100211 101221 102221 110122 112022 120011 121111 122102 1121 10121 11122 12121 101011 102101 110002 111011 112102 120022 121112 122201 1201 10202 11222 12212 101012 102112 110012 111121 112111 120202 121222 122212
Приложение С. Неприводимые многочлены 361 η = 6 1000012 1001012 1002011 1010201 1011022 1012112 1021021 1022102 1100111 1101212 1102202 1110221 1111222 1120121 1121212 1122202 1201001 1202002 1210001 1211021 1212121 1220212 1221211 1222222 1000022 1001021 1002022 1010212 1011122 1020001 1021102 1022111 1101002 1102001 1110001 1111012 1112011 1120222 1121221 1122221 1201111 1202021 1210021 1211201 1212122 1221001 1222022 1000111 1001101 1002101 1010222 1012001 1020101 1021112 1022122 1101011 1102111 1110011 1111021 1112201 1121012 1122001 1200002 1201121 1202101 1210112 1211212 1212212 1221002 1222102 1000121 1001122 1002112 1011001 1012012 1020112 1021121 1100002 1101101 1102121 1110122 1111111 1112222 1121102 1122002 1200022 1201201 1202122 1210202 1212011 1220102 1221112 1222112 1000201 1001221 1002211 ЮНОН 1012021 1020122 1022011 1100012 1101112 1102201 1110202 1111112 1120102 1121122 1122122 1200121 1201202 1202222 1210211 1212022 1220111 1221202 1222211 Многочлены над Ζ5 степени η = 2,3,4 η = 2 102 133 η — 3 1011 1042 1131 1213 1302 103 134 10 Ц 1043 П34 12Ц 1304 111 141 1021 1101 1141 1222 1311 112 142 1024 1102 1143 1223 1312 123 1032 1113 1201 1242 1322 124 1033 1114 1203 1244 1323
362 Приложение С. Неприводимые многочлены 1341 1431 η = 4 10002 10102 10Ц1 10303 10412 1Ю04 11042 11Ц2 11234 П344 12004 12042 12201 12311 12401 13004 13044 13201 133Ц Щ01 Ц004 14043 ЦЦ4 14242 Ц331 1343 Ц34 10003 10111 10203 10311 10413 11013 11101 11202 И244 11402 12013 12102 12203 12312 щц 13012 13102 13203 13322 13413 Ц011 ЦЮ1 14202 Ц243 14402 1403 1442 10014 10122 10221 10313 10421 11023 11113 11212 11301 1Ц11 120Ц 12121 12211 12324 12422 13023 13121 13232 13323 13423 14012 ЦП2 14214 Ц301 14411 Ц04 1444 10024 10123 10223 Ю341 10431 11024 1ПЦ 11213 11303 11414 12021 12123 12222 12332 12433 13031 13Щ 13234 13334 13424 14022 14123 Ц224 14303 14413 ЦП 10034 10132 10231 Ю343 10442 11032 11124 11221 11321 1Ц41 12022 12131 12224 12333 12434 13032 13131 13241 13341 13432 14033 Ц134 Ц231 14312 14441 1412 10044 10133 10233 10402 10443 1Ю41 11133 11222 11342 11443 12033 12Щ 12302 12344 Щ43 13043 13133 13302 13342 13444 Ц034 14143 Ц232 цзц 14444
Предметный указатель А Автоморфизм группы 74 Алгебраическое дополнение 165 Алгоритм — Берлекемпа для свободных от квадратов многочленов 316 общий 324 — Гаусса 180 — Евклида 27 расширенный 31, 110 — Питерсона — Горенстейна — Цирлера 346 — По лига — Хеллмана — Нечаева 332 — согласования 329 Аннулятор — вектора 196 — оператора 198 — пространства 198 Асимптотический закон распределения простых чисел 36 Б Базис — линейного пространства 137 — нормальный 275 — стандартный 137 Бином Ньютона 20 В Вектор 134 — нулевой 134 — ошибок 339 — собственный 206 — -столбец 149 — циклический 194 Векторы — линейно зависимые 136 — линейно независимые 136 — ортогональные 135 Взаимно простые — многочлены 100 — числа 26 Вычет 42 — обратный 43 Г Гомоморфизм — групп 80 — колец 94 Группа 53 — абелева (коммутативная) 54 — автоморфизмов 74 — аддитивная поля 91 — знакопеременная 65 — конечная 54 — мультипликативная кольца 91 — мультипликативная поля 91 — примарная 237 — симметрическая (подстановок) 55, 59 — циклическая 68, 75 д Действие группы — на множестве 220 — сопряжениями 223
364 Предметный указатель Делитель нуля (в кольце) 89 Дискретный логарифм 255 з Знак подстановки 63 И Идеал 95 — главный 95 Изоморфизм — групп 71 — колец 93 — линейных пространств 140 — полей 266 Инварианты (инвариантные делители) группы 240 Индекс элемента поля 255 К Класс — вычетов 41 — смежный 66 — сопряженности 224 — циклотомический 294 — эквивалентности 13 Код — БЧХ примитивный 340 — линейный 339 — полиномиальный 339 — с расстоянием d 338 — циклический 350 Кольцо 87 — без делителей нуля (целостное) 89 — главных идеалов 95 — евклидово 105 — коммутативное 88 — многочленов 99 — с единицей 88 — факториальное 105 Коммутативная диаграмма 15, 225 Композиция — операторов 144 — отношений 12 — отображений 14 Компонента оператора 144 Координаты вектора в базисе 139 Корень — многочлена 98, 121 — примитивный 274 Коэффициенты Безу 30, ПО Крамера формулы 194 л Линейная — комбинация векторов 135 — оболочка векторов 135 Линейного пространства — базис 137 — размерность 138 Линейное подпространство 142 Линейные пространства — изоморфные 139 Μ Матрица — Вандермонда 172 — единичная 148 — кососимметрическая 148 — невырожденная 180 — обратная 155, 172, 183 — оператора 147 — перехода 154 — порождающая кода 350 — присоединенная 170 — проверочная кода 349 — расширенная 178 — симметрическая 148 — систематическая 184 — транспонированная 148 Матрицы эквивалентные 152 — перестановочно 184
Предметный указатель 365 Минор 165 Многочлен 98 — /-разлагающий 314 — круговой 308 — локаторов ошибок 343 — минимальный вектора 196 матрицы 203 оператора 199 пространства 199 элемента поля 272, 307 — неприводимый 101 — нормированный 100 — порождающий 340 — примитивный 274, 297 — свободный от квадратов 310 — характеристический матрицы 206 оператора 206 последовательности 305 Многочлены взаимно простые 100 Η Наибольший общий делитель 26 — многочленов 100 Наименьшее общее кратное 33 Неподвижная точка 220 Нормализатор 224, 252 О Образ оператора 146 Оператор — линейный 143 — невырожденный 145 — обратимый 145 — обратный 145 — тождественный 145 Операция бинарная 52 — ассоциативная 53 Определитель — матрицы 161 — оператора 163 — системы векторов 160 Орбита 220 Отношение 11 — антисимметричное 23 — линейного порядка 23 — обратное 12 — рефлексивное 12 — симметричное 12 — транзитивное 12 — частичного порядка 23 — эквивалентности 12 Отображение 13 — биективное (взаимно однозначное) 14 — инъективное 14 — обратимое 16 — обратное 16 левое 16 правое 16 — сюрьективное 14 Π Перестановка 18 Подгруппа 57 — несобственная 223 — нормальная 69 — силовская 228 Подкольцо 88 Подпространство — инвариантное 194 Подстановка 55, 59 — нечетная 65 — четная 65 Показатель группы 243 Поле 91 — Галуа 274 — конечное 91 — простое 266 Полная система вычетов 42 Полугруппа 59
366 Предметный указатель — с единицей (моноид) 59 Поля — подполе 265 — расширение 266, 269 — характеристика 265 Порядок — группы 54 — многочлена 295 — элемента 68 Представление системой остатков 128 Производная формальная 259 Пространство — линейное 134 бесконечномерное 135 конечномерное 135 — ортогональное 151 — порожденное системой векторов 137 — прим арное 201 — столбцов матрицы 151 — строк матрицы 151 — циклическое 195 Прямая сумма — колец 93 — подпространств 199 Прямое произведение — внешнее 78, 232 — внутреннее 232 — множеств 11 — нормальных подгрупп 235 Ρ Разложение — многочлена на неприводимые сомножители 102 — определителя по столбцу 165 по строке 167 — числа на простые сомножители 34 Размещение 18 Ранг — матрицы 153 — оператора 146 Расстояние Хемминга 338 Решение частное 179 С Синдром вектора 342 Система — вычетов приведенная 49 — линейных сравнений 44 — линейных уравнений 177 однородная 180 согласованная 178 — образующих (порождающих) 65 — решений фундаментальная 180 Собственное значение 206 Сопряжение 74 Сопряженные элементы — в группе 224 — в поле 271 Сочетание 19 — с повторениями 19 Сравнение 39 Стабилизатор 220 Сумма — подпространств 199 Схема Горнера 107 Τ Таблица К эли 55 Теорема — Везу 103 — Гамильтона — Кэли 208 — Евклида 26 — Китайская об остатках 45 для многочленов 123 — Кронекера — Капелли 178 — Кэли 74 — Лагранжа 67
Предметный указатель 367 — Лагранжа интеполяционная 130 — Ламе 30 — о делении с остатком 25, 99 — о нормальном базисе 276 — о подполях в GF(pn) 270 — о разложении хр — χ 259 — о разложении в прямую сумму циклических подпространств 203 — о разложении конечной абе- левой группы 241 — о строении группы Ζ* (критерий цикличности) 249 — о цикличности мультипликативной группы поля 254 — о числе неприводимых многочленов 118 — об изоморфизме полей 273 — Силова вторая 229 — Силова первая 228 — Силова третья 230 — Ферма малая 49 — Чебышёва 36 — Эйлера 49 Тип подстановки 226 Транспозиция 60 У Уравнение — однородное 180 — согласованное 178 Φ Фактор-группа 69 Фактор-кольцо 96 Φ актор-множество 66 Фактор-пространство 143 Формула — включений и исключений 21 — Крамера 194 — Лагранжа интерполяционная 130 — обращения Мёбиуса 118 Функция 13 — кососимметрическая 156 — Мёбиуса 117 — полилинейная 156 — характеристическая 14 — Эйлера 47 ц Центр группы 224 Цикл в симметрической группе 60 Циклотомический класс 294 Циклы непересекающиеся (независимые) 60 ч Число — обратимое по модулю 43 — простое 33 — Фибоначчи 51 э Элемент — единичный (в группе) 53 — единичный (в поле) 91 — нулевой (в поле) 91 — обратный (в группе) 53 — порождающий (в группе) 68 — примитивный 255 — простой 105 Элементарные преобразования матриц 152 Элементы поля сопряженные 271 Я Ядро — гомоморфизма 80, 94 — оператора 145