Текст
                    Μ. Μ. Глухов, В. П. Елизаров, А. А. Нечаев
Алгебра
Том I
Допущено Министерством образования Российской Федерации
в качестве учебника для студентов высших учебных заведений,
обучающихся по группе специальностей в области
информационной безопасности
Москва
«Гелиос АРВ»
2003


УДК512 8 ББК 22 19 Г22 Глухов Μ. Μ., Елизаров В. IL, Нечаев А. А. Г22 Алгебра Учебник В 2-х τ Τ Ι — Μ Гелиос АРВ, 2003 —336 с, ил. ISBN 8-85438-071-4 Учебник содержит полное и систематическое изложение материала, входящего в федеральный компонент дисциплины «Алгебра» Государственных образовательных стандартов по специальностям «Криптография» и «Компьютерная безопасность» В отличие от традиционных курсов высшей алгебры, изучаемых на математических факультетах университетов, данный курс характеризуется углубленным изучением дискретных алгебраических объектов конечных колец, полей, линейных пространств, полугрупп преобразований, групп подстановок Том I содержит основные понятия и теоремы современной алгебры в объеме годового курса высшей алгебры для студентов математических специальностей университетов ББК 22.19 Учебное издание ГЛУХОВ МИХАИЛ МИХАЙЛОВИЧ, ЕЛИЗАРОВ ВИКТОР ПАВЛОВИЧ, НЕЧАЕВ АЛЕКСАНДР АЛЕКСАНДРОВИЧ АЛГЕБРА ТОМ I Заведующая редакцией Τ А Денисова Корректор Ε И Клитина Компьютерная верстка Μ Μ Королевой, Η Μ Хусаинова Издательство «Гелиос АРВ» Издательская лицензия ЛР № 066255 от 29 12 1998 ι 107140, г Москва, Верхняя Красносельская ул , 16 Тел /факс (095) 264-44-39, e-mail info@gelios-arv ru Адрес в Internet www gehos-arv ru Формат 60x84/16 Объем 21 π л Бумага офсетная Тираж 3000 экз Заказ № 573 Отпечатано с готовых диапозитивов в РГУП «Чебоксарская типография № 1» 428019, г Чебоксары, пр И Яковлева, 15 © Глухов Μ Μ , Елизаров В Π , Нечаев А А , 2003 ISBN 8-85438-071-4 © Оформление Шачек Ε С , 2003
Предисловие Учебник состоит из двух частей, издаваемых отдельными книгами: том I и том II. Том I содержит, в основном, традиционный для математических специальностей алгебраический материал и потому вполне может использоваться студентами математических факультетов университетов и педагогических вузов. В основу учебника положены лекции по курсу «Алгебра», читавшиеся авторами на протяжении ряда лет в Институте криптографии, связи и информатики для слушателей специальностей «Криптография» и «Компьютерная безопасность». В учебнике авторам удалось реализовать ряд оригинальных методических подходов к изложению материала. Вместе с тем при подготовке учебника авторы использовали опыт изложения алгебраического материала другими авторами, а также свой опыт научно-исследовательской работы над математическими проблемами криптографии. Современная криптография является одной из наиболее наукоемких областей естествознания. В частности в ней находят применение практически все разделы современной алгебры. Именно этим объясняется тот факт, что "Алгебра" является одной из базовых дисциплин, широко используемых при изучении других дисциплин из Государственных образовательных стандартов по указанным специальностям. Учитывая, что подлежащая криптографической защите информация обрабатывается, как правило, в дискретном виде, наиболее востребованными в криптографии являются знания по конечным алгебраическим объектам — конечным группам, полугруппам, кольцам, полям, векторным пространствам, функциям и многочленам над конечными полями и кольцами, группам подстановок и др. Авторы по возможности учитывали это при подготовке данного учебника. Усиленное внимание к конечным алгебраическим объектам является одной из особенностей предлагаемого учебника. Еще одна его особенность, также обусловленная практическими потребностями, заключается в алгоритмичности изложения материала, в стремлении к упрощению и четкому описанию алгоритмов решения рассматриваемых задач. В учебнике авторы стремились выделять наиболее важные и законченные алгебраические результаты. Эти результаты оформлялись в виде теорем. Все остальные, более мелкие и вспомогательные факты, формулировались в виде лемм и утверждений. 3
Большинство рассматриваемых в книге понятий и результатов иллюстрируется примерами. После каждой главы приводятся задачи на закрепление и углубление соответствующего материала. Содержащиеся в учебнике параграфы, определения, теоремы, утверждения, леммы, примеры, замечания и формулы нумеруются по главам. Ссылки на них имеют двойную нумерацию. Например «Теорема З.Х» означает теорему 3 главы X. При ссылках внутри одной главы номер опускается. В конце книги предлагаются списки использованной учебной и монографической литературы, а также перечень сборников задач по алгебре. Для удобства пользования книгой приведены авторский и предметный указатели. Данный учебник предназначается в первую очередь лицам, обучающимся в вузах по специальностям, относящимся к области информационной безопасности: «Криптография» — 075100, «Компьютерная безопасность»—075200, «Организация и технология защиты информации»—075300, «Комплексная защита объектов информатизации» — 075400, «Комплексное обеспечение информационной безопасности автоматизированных систем» — 075500, «Информационная безопасность телекоммуникационных систем» — 075600, «Противодействие техническим разведкам» — 075700. Авторы выражают признательность всем специалистам, прочитавшим рукопись данного учебника и сделавшим свои замечания. 4
Глава I ВВЕДЕНИЕ § 1. Предмет алгебры Предмет и содержание алгебры претерпевали существенные изменения в ходе ее развития. До середины XIX века алгебраические исследования были связаны, в основном, с задачей нахождения корней многочленов, то есть решения уравнений ъид$. а^х"+а\хп~1+...+ап-\х+ап = = 0 , называемых теперь алгебраическими уравнениями. Рассматривались также уравнения и системы уравнений со многими неизвестными. Термин "алгебра" происходит от названия сочинения узбекского математика IX века Мухаммеда ал-Хорезми "Альджебр аль-Мукабала", в котором были систематизированы сведения о правилах действий с числами и общих приемах решения задач, сводящихся к алгебраическим уравнениям 1-й и 2-й степеней. До XVI в. для записи уравнений применялись громоздкие словесные описания, что существенно сдерживало развитие алгебры. В XVI веке в алгебру постепенно проникает символический язык. Решающий вклад в его развитие внес французский математик Ф. Виет (1540 — 1603). Он первым стал обозначать буквами не только неизвестные, но и коэффициенты уравнений. Это позволило свойства уравнений и их корней записывать общими формулами. В частности, Виет вывел формулы, связывающие корни алгебраического уравнения с его коэффициентами. В XVII - XVIII в. исследованию алгебраических уравнений и их приложениям большое внимание уделяли такие крупные ученые как французские математики Р. Декарт (1596 -1650), П. Ферма (1601 -1665), Ж. Л. Лагранж (1736 -1813), английский физик и математик И. Ньютон (1643-1727), немецкий математик К. Ф. Гаусс (1777 -1855) и др. Ферма и Декарт являются основоположниками аналитической геометрии. Они внесли значительный вклад в дальнейшее совершенствование алгебраического языка и в разработку алгебраических методов решения геометрических задач. Декарт широко применял алгебраические уравнения к классификации и изучению кривых на плоскости, разработал метод оценки числа действительных корней многочлена. Ферма занимался также решением уравнений в целых числах. В частности он сформулировал утверждение о том, что 5
уравнение хп + у11 = zn не имеет целых (нетривиальных) решений при целом η > 2. Это утверждение, называемое большой (или великой) теоремой Ферма, удалось доказать лишь в 1993 г. Последний рубеж на пути к этому результату преодолел математик из США А. Вилес (A.Wiles). К настоящему времени ошибок в этом доказательстве не обнаружено. Ла- гранж построил теорию исключения неизвестных из систем алгебраических уравнений, указал формулу для нахождения многочлена степени η по его значению вп+1 точках, разработал метод отделения действительных корней многочлена. Ньютон, основываясь на связи алгебраических уравнений с кривыми плоскости, указал метод приближенного вычисления корней уравнения. Гаусс установил связь между решением уравнения вида хп — 1 = 0 и построением η-угольников с помощью циркуля и линейки. В частности, на этом пути ему удалось описать все значения п, при которых правильный η-угольник может быть построен с помощью циркуля и линейки. Оказалось, что такими являются все числа 2т и 2mpi...pr, где га Ε No, Рь...,рг — различные простые числа вида 22 -Ы. В 1799 г. он впервые доказал, что любой многочлен с комплексными коэффициентами имеет хотя бы один корень. До сих пор эта теорема по традиции называется основной теоремой алгебры. Среди различных задач об уравнениях центральной долгое время оставалась задача нахождения формул, выражающих корни уравнений через их коэффициенты с помощью основных арифметических операций и извлечения корней, по аналогии с известной из древности формулой для корней квадратных уравнений (проблема разрешимости уравнений в радикалах). Для уравнений 3-й и 4-й степеней эта задача была решена итальянскими математиками Н. Тарталья (1500 — 1557), Д. Кар- дано (1501 -1576), Л. Феррари (1522-1565). Вот, к примеру, как выглядит формула для корней кубического уравнения вида хг + рх + q = 0, называемая формулой Кардано: Много усилий было затрачено математиками на отыскание формул для корней уравнения 5-й степени и более высоких степеней. В 1799 г. итальянский математик П. Руффини (1765 - 1822) опубликовал теорему, утверждающую отсутствие общей формулы для корней уравнений степени η > 5. Однако доказательство Руффини содержало пробел. 6
Впервые полное доказательство указанной теоремы Ьыло предложено в 1824 г. норвежским математиком Н. X. Абелем (1802 - 1829). Теорема Руффини — Абеля и другие имеющиеся к тому времени результаты по теории уравнений помогли молодому французскому математику Э. Галуа (1811 — 1832) сформулировать более общую задачу — о разрешимости в радикалах произвольного конкретного алгебраического уравнения. Им же был найден и доказан критерий разрешимости. Этот результат Галуа имеет принципиальное значение не столько потому, что закрыл проблему о разрешимости уравнений в радикалах, сколько потому, что положил начало новому этапу развития алгебры. Дело в том, что для решения указанной проблемы Галуа развил зарождавшиеся к тому времени теорию групп и теорию полей. Позднее эти теории нашли глубокие приложения как в самой алгебре, так и в других областях науки (в геометрии, кристаллографии, физике, химии и др.). Так, например, в 1872 г. немецкий математик Ф. X. Клейн (1849 — 1925) в работе, известной под названием "Эрлангенская программа", предложил новый подход к классификации и изучению геометрий, основанный на инвариантах групп, рассматриваемых в геометриях преобразований пространств. В 1890 г. русский кристаллограф и геометр Е. С. Федоров (1853 — 1919), основываясь на свойствах групп преобразований, дал полную классификацию пространственных решеток кристаллов. С современной точки зрения, группы и поля являются типичными примерами множеств с операциями, или, как говорят, алгебраических структур. Общее определение операции сформировалось путем абстрагирования от известных операций сложения и умножения чисел. В соответствии с этим, под операцией / на произвольном множестве А понимают правило, по которому любым двум элементам из Л, взятым в определенном порядке, сопоставляется элемент того же множества А. Точнее, так определенные операции называются бинарными операциями. Примерами бинарных операций являются операции сложения и умножения действительных чисел, операция сложения векторов плоскости (или пространства), операции сложения и умножения многочленов, операция композиции геометрических преобразований и др. По аналогии с бинарной операцией можно определить п-арную операцию на множестве А при любом натуральном п, как правило, сопоставляющее каждому упорядоченному набору (αχ,α2,... ,αη) элементов из А вполне определенный элемент множества А. При η = 1 такие операции называются унарными. 7
Задача исследования множеств с операциями остается главной задачей алгебры с XIX в. по настоящее время. В связи с этим современную алгебру называют наукой о множествах с операциями. К развитию алгебры, как науки о множествах с операциями, привела также и задача исследования и решения систем линейных уравнений со многими неизвестными. А именно, построение общей теории систем линейных уравнений потребовало изучения таких алгебраических структур, как многомерные векторные пространства и кольца матриц. В настоящее время основные алгебраические структуры — группы, полугруппы, квазигруппы, кольца, поля, модули, линейные алгебры, линейные пространства и др. используются и в таких сравнительно новых прикладных областях математики, как криптография, теория автоматов, теория графов, теория информации и т. д. Потребности этих и других наук служат, в свою очередь, главной движущей силой развития алгебры. Развитие алгебры в дореволюционной России связано с именами таких выдающихся математиков как Л. Эйлер (1707—1783), который жил и работал в Петербурге более 30 лет, Н. И. Лобачевский (1792-1856), П. Л. Чебышев (1821-1894), Д. А. Граве (1863-1939), Ф. Э. Молин (1861—1941) и др. Создателем первой отечественной алгебраической школы был ученик Д. А. Граве, известный математик, полярный исследователь и общественный деятель О. Ю. Шмидт (1891-1956). В 1916 г. в Киеве была издана его книга "Абстрактная теория групп", в которой впервые в мировой литературе основы теории групп излагались без предположения о конечности рассматриваемых групп. В 1939 г. О. Ю. Шмидт организовал при Московском университете семинар по теории групп, который со временем стал одним из основных центров деятельности российских алгебраистов. К настоящему времени крупные алгебраические школы сложились и в ряде других городов России: в Санкт-Петербурге, Новосибирске, Екатеринбурге и др. 8
§ 2. Первоначальные понятия и обозначения из теории множеств и математической логики Непосредственно из трактовки современной алгебры, как науки о множествах с операциями, следует, что в алгебре не обойтись без использования основных понятий теории множеств. Само понятие множества считается в математике основным, неопределяемым понятием. Создатель теории множеств немецкий математик Г. Кантор (1845—1918) пояснил его следующим образом: "Под множеством понимают объединение в одно общее объектов, хорошо различаемых нашей интуицией или нашей мыслью". Говорят также, что множество — это совокупность (собрание, семейство) каких-либо реально существующих или мыслимых объектов, объединенных по некоторому признаку. Предполагается, что объекты, входящие в множество, попарно различны. Объекты, из которых составлено множество, называются его элементами. Множества и элементы множеств обозначаются различными буквами без индексов и с индексами. При этом, как правило, множества и элементы отождествляются с их обозначениями. Например, вместо фразы "элемент, обозначенный буквой а, содержится в множестве, обозначенном буквой А", говорят короче: "элемент а содержится в множестве А (или принадлежит множеству А)", и пишут а € А. Запись а £ А означает, что а не является элементом множества А. Множества Л, В называют равными, что записывают в виде А = В, если каждый элемент множества А содержится в В, и, наоборот, каждый элемент множества В содержится в А. В противном случае говорят, что множества А, В не равны, и пишут А ф В. Множество обычно задают или перечислением всех его элементов, или указанием правила перечисления, или указанием каких-либо характеристических свойств его элементов. В первом случае множество обозначается в виде заключенного в фигурные скобки списка его элементов, например {а, в, г}, {5}. 9
Во втором случае записывают в фигурных скобках несколько первых элементов с многоточием, например {0,2,4,6,...}. Если же множество А задается системой свойств Р\,..., Pk его элементов, то пишут А = {а : Ри..., Рк} или А = {а \ Ри ..., Рк} и говорят, что А есть множество всех элементов а, обладающих свойствами Pi,... ,Pfc. Иногда приходится говорить о множестве, про которое неизвестно заранее, содержит оно хотя бы один элемент. Так, мы говорим о множестве решений уравнения, не решая его и, значит, не зная еще, имеет ли оно хотя бы одно решение. В связи с этим вводится множество, совсем не содержащее элементов. Оно называется пустым и обозначается символом 0. Для некоторых, часто используемых ниже и известных из средней школы числовых множеств введем стандартные обозначения: N = {1,2,3,...} — множество натуральных чисел; No = {0,1,2,3,...} — множество целых неотрицательных чисел; Ζ = {0, ±1, ±2,...} — множество целых чисел; Q — множество рациональных чисел, т. е. чисел, представимых дробями вида £, где а, 6 Ε Ζ, 6 φ 0; R — множество действительных (или вещественных) чисел, т. е. чисел, представимых бесконечными десятичными дробями; гЩп — {га, га + 1,..., п}, где т, η € Ζ и т < п. Если каждый элемент множества А является элементом множества В, то говорят, что А есть подмножество множества В (или А входит в В, или В включает А), и пишут А С В. В частности, подмножествами любого множества А являются А и 0. Все остальные его подмножества называются собственными. Если хотят подчеркнуть, что подмножество с А множества В не совпадает с В, то пишут А Ф В и говорят, что В строго включает А. Например, для указанных выше числовых множеств имеют место строгие включения: 10
В математике и на практике часто приходится получать из одних множеств другие, используя различные операции над множествами. Определим четыре такие операции. Определение1. Объединением множеств А, В называется множество Ли В, состоящее из всех тех элементов, каждый из которых принадлежит хотя бы одному из множеств Л, В: Ли В = {т : т £ Л или га € В}. Определение 2. Пересечением множеств А, В называется множество ЛПВ, состоящее из всех тех элементов, которые содержатся в обоих множествах А, В: ЛПВ = {т:т€Аите В}. Заметим, что пересечение двух множеств может оказаться пустым множеством. В этом случае исходные множества называют непересекающимися. Определение 3. Декартовым произведением множеств А, В называют множество А х В, состоящее из всевозможных упорядоченных пар вида (а, 6), где а € А, Ь € В: Ах В = {(а, 6) : а € А, Ь € В}. Определение 4. Разностью множеств А, В называют множество А\ВУ состоящее из всех элементов множества А, не содержащихся в В: Л\В = {га : га € А,т£ В}. В том случае, когда В С А> множество А\В называется дополнением множества В до А. По аналогии с определениями 1 — 2 можно определить объединение и пересечение произвольного семейства множеств {Аг : г £ 1} (здесь J -— любое конечное или бесконечное множество индексов): [J Аг = {а : а € Аг хотя бы для одного г € /}, г€/ [| Аг = {а : а € Аг для всех г € /}. 11
В частности, если / = {1,2,..., п}, то указанные множества записывают η η в виде (J Ах% Π А% ι или подробнее: А\ U ... U Ап, А\П...ПАп. Пред- ставление любого множества А в виде объединения непустых и попарно непересекающихся множеств называют разбиением множества А. Определим еще декартово произведение η множеств: Αχ χ ... χ Ап = {(аь...,ап) : аг € At,i € Ϊ7η}. В том случае, когда А\ = ... = Ап = А, мы получим гс-ю декартову степень множества А: Ап = {(аь...,ап) :аг € Дг = Т7п}. Таким образом, Ап есть множество всевозможных наборов длины η из элементов множества А. Подчеркнем, что в отличие от множества, в котором все элементы считаются различными по определению, набор (αι,...,αη) может содержать и одинаковые элементы. В дальнейшем упорядоченные наборы (не обязательно различных) элементов из А будут называться также системами элементов из А. Важную роль в дальнейшем будет играть понятие отображения множеств. Определениеб. Пусть А, В — произвольные множества. Отображением множества А в множество В называют всякое правило /, по которому каждому элементу множества А сопоставляют вполне определенный (единственный) элемент множества В. Тот факт, что / есть отображение А в В, кратко записывают в виде: f:A-+B. Если при этом элементу а из А сопоставлен элемент Ь из В, то Ь называют образом элемента а, а а — прообразом элемента Ь при отображении /, что записывается в виде /(а) = 6. Из определения отображения / следует, что у каждого элемента а из А существует единственный образ, однако, для элемента Ь £ В прообразов может быть много, а может и вообще не быть. Множество всех прообразов элемента Ь из В называется его полным прообразом и обозначается через f~l(b). Таким образом, f~l(b) = {а : а € A, f(a) = 6}, 12
или, несколько короче, f~l{b) = {а € А : /(а) = 6}. Естественным путем определяется образ f{A\) подмножества А\ из А и полный прообраз f~l(B\) подмножества В\ из Б при отображении /: f(Ai) = (J {/(а)}, и Γ^Βι) = (J ГЧЬ). a£Ai beBi Отображение множества А в В называют также функцией, заданной на множестве А со значениями в множестве В, При этом элемент f(a) называют значением функции f в точке а, а множество всех пар вида (а, 6) где а € Л, 6 € -В и /(а) = 6, — графиком функции, или отображения, /. Замечание!.. Приведенное выше определение отображения не является математически строгим, поскольку в нем используется неопределенный термин "правило". Для строгого определения понятия отображения используется подход через график. А именно, отображение f:A—>B отождествляется с его графиком, который уже определяется строго, как подмножество Μ декартова произведения Α χ В, содержащее для каждого элемента а € А единственную пару с первым элементом а. При таком определении отображения / равенство /(а) = 6 означает наличие в Μ пары (а, 6). В зависимости от свойств образов и прообразов различают отображения сюръективные, инъективные и биективные. Определеннее. Отображение f:A—>B называется сюръек- тивным , если каждый элемент из В является образом хотя бы одного элемента из А, то есть f(A) = В. Определение?. Отображение f:A—*B называется инъек- тивныму если оно разные элементы множества А отображает в разные элементы множества В. Инъективные отображения называют также вложениями. Определеннее. Отображение f:A—*B называется биективным, или взаимно однозначным отображением А на В, если оно сюръективно и инъективно. Π ρ и м е ρ 1. Определим отображение /ι: Ζ —» No, положив для α€Ζ: /ι(α) = Ν, где \а\ — абсолютная величина числа α. Очевидно, что f\ — сюръективное, но не инъективное отображение. 13
Π ρ и м е ρ 2 Отображение /2 Ζ -> Ν0, определенное равенством Λ , ч Ι 2α, если α > 0. fo(a) = < ~~ •^ ' \|2α|-1, еслиа<0, является биективным отображением Примером биективного отображения множества А на себя является тождественное отображение ед, или просто е, которое любой элемент из А отображает в себя ед(а) = а Определен ие9 Композиций отображений Д В —> С и /г -4 —* В называется отображение /ι о /2 Л —» С, определенное условием (ЛоШ = Л(/,(о)) (1) для любого элемента а £ А То же самое отображение называю! еще произведением отображений /г и /ι и обозначают в виде /г /ь или /г/ι Таким образом, (Λ/ι)(α) = /ι(/2(α)) Отметим некоторые свойства введенных операций Утверждение1 ^слг* /ι А —» В, /2 -В —* С, /з С -* D, то {hof2)ofl=f3o(f3of1) (2) D Найдем образ элемента α из А при действии отображений, записанных в левой и правой частях равенства (2) Из (1) имеем ((/з о h) о /ι)(β) = (/з о /2)(/ι(α)) = /s(/a(/i(a))), (/з о (/, о /х))(а) = /з((/2 о /0(a)) = /3(/2(/ι(α))) Отсюда и следует (2) D С использованием операции умножения равенство (2) запишется в виде fi(f2h) = (/ι/2)Λ Утвержден и е2 £^слг* отображения f\ А —> -В, /2 В —* С сюръективны, иньективны или биективны, то соответственно таким же будет и отображение φ = fo° fi = /1 /2 D Действительно, из сюръективности /г и /ι, следует соотвегсавен- ио для любого с € С существует такой элемент Ь € В, что /2(6) = с, и 14
такой элемент а £ А, что /ι(α) = 6. Отсюда имеем: ψ(α) = /2(/ι(α)) = = /2(6) = с, и отображение φ сюръективно. Если же /ι, /г инъективны ка\ Φ α<ι, то /ι(αϊ) ^ /1(^2) и /2(/ι(αι)) τ^ 7^ /2(/ι(αι)), т. е. 0(αι) ^ ^(аг), и ψ — инъективно. D Заметим, что обратные утверждения в общем случае неверны. Так, например, тождественное отображение ε® представляется в виде композиции £м = /г о /ь где /ι — не сюръективное отображение N в Ν, определенное условием /ι(χ) = χ + 1, а /г — не инъективное отображение N в N, определенное следующим образом: . , ν ία; — 1, если а; € N и χ > 1, /г(*) = < л II, если χ = 1. Вместе с тем имеет место Утверждение 3. Пусть ψ = /ι · /2. Тог^а: если ^ — сюръективно, то f<i — сюръективно; если ψ — инъективно, то f\ — инъективно. Утверждение 3 легко доказывается методом от противного (докажите в качестве упражнения). Характерной особенностью биективных отображений является наличие для них обратных отображений. Определение 10. Отображение f:A—*B называется обра- тимым, если существует такое отображение f':B-+A, что //' = ε а, f'f = εβ. При этом отображение /' называется обратным для / и обозначается через /-1. Имеет место следующий критерий обратимости. Утверждение^ Отображение f:A—>B обратимо тогда и только тогда, когда оно биективно. D Если / — обратимо, то его биективность (и биективность обратного к нему отображения /') следует из утверждения 3. Обратно, пусть отображение /: А —> В биективно. Определим отображение /': В —* А, положив для Ь € В : /'(6) = α, если /(α) = 6. Такое а найдется в силу сюръективности / и это а единственно в силу инъективности /. Следовательно, отображение /' определено корректно. Очевидно, что оно является обратным для /. G Определение 11. Множества А и В называют равномощными, и пишут \А\ = \В\, если существует биективное отображение /: А —* В. Определение^. Множество А называется конечным, если оно пусто или равномощно отрезку 1, η натурального ряда N. В послед- 15
нем случае число η называют мощностью множества А, а само А — η-элементным множеством. Мощность пустого множества считается равной нулю. Все остальные множества называются бесконечными. Мощность конечного множества А обозначается через |А|, тот факт, что А — конечно, записывается в виде |Л| < оо. Заметим, что в определении 12 конечного и бесконечного множества используется знание натурального ряда чисел. В принципе без этого можно обойтись, если воспользоваться следующим характеристическим свойством бесконечных множеств. Любое бесконечное множество рав- номощно некоторому своему собственному подмножеству. Однако мы не будем здесь вдаваться в тонкости теории множеств, а будем считать, что множества натуральных, целых, рациональных и действительных чисел читателю известны из средней школы. Для отображений конечных множеств справедливо Утверждениеб. Если Ау В — конечные и равномощные множества, то для любого отображения f:A—*B эквивалентны условия: а) / — сюръективно; б) / — инъективно; в) / — биективно. D Из определений 6 — 8 видно, что для доказательства утверждения 5 достаточно установить эквивалентность а) и б). Пусть / — сюръективно, т. е. f(A) = В. Тогда |В| = \f{A)\ = U {/(«)} а€А Так как |{/(а)}| = 1 при любом а € А, то равенство \А\ возможно лишь в том случае, когда /(αϊ) φ /(аг) U if (А)} а€А при любых значениях αι,α2 € А. Это означает, что / — инъективно Обратно, пусть / — инъективно. Тогда оно разные элементы отображает в разные, и поэтому \f{A)\ \А\. Отсюда и из условия U {/(«Ж |а€А I \А\ = \В\ имеем: \f(A)\ = \В\. Теперь, учитывая включение f(A) С В и конечность множества Б, получаем: f(A) = В. Следовательно, / — сюръективно. D Наряду с понятиями теории множеств в современной математике широко используются язык и средства математической логики. Подробно они будут изучаться в отдельном курсе. Здесь же мы остановимся 16
лишь на обозначениях основных логических операций и их использовании для сокращений записи утверждений. Основным неопределяемым понятием математической логики является понятие высказывания. Обычно под высказыванием понимают любое утверждение, про которое можно сказать, что оно истинно или ложно, и не может быть одновременно истинным и ложным. Если высказывание а истинно (ложно), то говорят, что оно имеет значение "истина" ("ложь") и пишут а = и (а = л ). Основными логическими операциями над высказываниями являются: конъюнкция &, дизъюнкция V, импликация => и отрицание ". Первые три из них соответствуют в русском языке соединению двух утверждений союзами "и", "или", "если ..., то", отрицание соответствует вставке частицы "не". Значения получаемых таким образом высказываний определяются значениями исходных высказываний и соответствующими операциями на множестве {и, л}, которые определяются следующей таблицей. Таблица 1 а ι л л и и Ь л и л и а&6 л л л и аУЬ л и и и а => Ь и и л и а и 1 и л л | Обратите особое внимание на импликацию а => b высказываний а, 6. Она является ложной лишь в том случае, когда а — истинное, а 6 — ложное высказывания. В частности, если а = л, то высказывание а => b истинно, но это не означает, что истинно высказывание 6, оно может быть любым. В связи с этим говорят: "из лжи следует все, что угодно". Кроме утверждений, имеющих вполне определенные значения — истину или ложь, в математике широко используются предложения, зависящие от переменных со значениями из заданных множеств и превращающиеся в высказывания при замене в них всех переменных любыми значениями из рассматриваемых множеств. Такие утверждения называют предикатами. В целях общности к предикатам относят и высказывания. Примером предиката может служить неравенство "х < у" на множестве R. Само оно не является выска- 17
зыванием Однако при замене х, у действительными числами становится высказыванием "2 < 3" — истинное высказывание, м5 < 1" — ложное высказывание К предикатам относятся, в частности, все уравнения с неизвестными на множестве Μ или любом его подмножестве Μ Заметим, что строго предикат ρ οτ η переменных на множестве А можно определить как отображение ρ Лп —> {и, л} К предикатам, так же, как и к высказываниям, можно применить операции конъюнкции, дизъюнкции, импликации и отрицания В результате из заданных предикатов будут поучаться новые, более сложные предикаты Так, например, дизъюнкцией предикатов "у < х", м2 = = уп будет предикат "(я < у) V (х = у)", который короче записывается в виде "х < у" Приведем для указанных операций над предикатами теоретико-множественную интерпретацию Для просюты ограничимся рассмотрением предикатов от одного переменного χ на фиксированном множестве А Каждому такому предикату р(х) сопоставим подмножество его истинности А(р) = {а € А р(а) = и} Непосредственно из свойств логических и теоретико-можественных операций следуют соотношения а) A(pikp2) = Α(ρι) Π Α(ρ2), б) A{p1Vp2) = A{p1)UA{p2), в)А{р1=*р2) = А\{А(р1)\А(р2))> г) Α(ρϊ) = A\A(Pl) Кроме указанных бинарных логических операций к предикатам часто применяются еще две унарные операции навешивания кванюров Пусть р(х\, , хп) — предикат, зависящий от переменных х\, , хп со значениями из множества А Тогда из нею можно построить новые предикаты "Для всякого х\ € А имеет месю р{х\, *хп)" "Существует х\ € А такое, что р(х\, ,хп)" Говорят, что они получены из ρ(τι, ,χπ) путем навешивания соответственно квантора всеобщности и квантора существования по переменному τι Кратко они обозначаются в виде Vxi £A ρ(χι, ,τη), (3) Эй € A p(zi, ,srn). (4) 18
Аналогично определяются операции навешивания кванторов по любому другому переменному хг,г € 2, п. Заменив в (3), (4) переменные #2ι · · · » Хп соответственно элементами аг,..., αη € А, получим высказывания: Vxi € Α :ρ(χι,α2ι...,αη), (3') 3χι £ Α: ρ(χι ,α2,..., αη). (4') Первое является истинным тогда и только тогда, когда высказывание ρ(αι,α2,... ,αη) является истинным при любом а\ £ А. Второе истинно в том и только том случае, когда высказывание ρ(αι,α2, ...,αη) истинно хотя бы при одном а\ из А. Таким образом, высказывания (3'), (4') не зависят от переменного хь и потому (3), (4) являются предикатами от η — 1 переменных χ<ι,..., χη. К ним можно применять операции навешивания кванторов по любому из переменных Х2,... ,.τη и т. д. Следует помнить, что истинность высказывания, полученного из предиката путем навешивания кванторов по разным переменным, в общем случае зависит от порядка кванторов. Так, например, высказывание "Vx € N,3y € Ν : (χ < у)" истинно, а высказывание "Зу € N,Vx € € Ν : (χ < у)" ложно. С помощью логических операций &, V, =4>, —, V, 3 можно из заданных высказываний и предикатов естественным образом строить выражения или формулы, которые будут задавать новые высказывания и предикаты. Две формулы от одних и тех же переменных, принимающих значения из одного множества, называют равносильными или эквивалентными, если они принимают одинаковые значения (истину или ложь) при любых, одинаковых для обеих формул наборах значений переменных. Условимся равносильность формул обозначать знаком =. С помощью равносильностей формул можно записать свойства логических операций над предикатами. Приведем примеры: ркр = ру pkq^qkp.p^ q = qVp, {ркд)кг = рк{дкг), pkq = p\Jq, pk(qVr) = {pkq) V(p&r), Ρ V ρ = ρ, ρ V q = q V ρ, (pVq) Vr =pV((?Vr), JVq = pkq, pV {qkr) = (pV^)&(pVr). 19
Обратим особое внимание на следующие равносильности, которые часто используют при доказательствах: Vxp(x) = Зхр(х),3хр(х) = Vxp(x). Справедливость выписанных равносильностей проверяется непосредственно с использованием определения логических операций. Заметим, что логическая символика зачастую бывает полезной как в целях сокращения записи утверждений, так и с целью достижения их лучшей обозримости. Для примера запишем условия инъективности и сюръективности отображений f: A-* В: ^аъа2 € А: ((аг φ α2) =* (/(αϊ) φ /(α2))), V&€£,3a€ Α: (/(α) = 6). § 3. О математических утверждениях и методах их доказательства Типичной формой математического утверждения, или теоремы, является импликация: А =» В, (5) которая читается как "Из А следует В", или "Если истинно А, то истинно В", или "А влечет В", или "А достаточно для В", или "В необходимо для А". Напомним, что утверждение: В =* А (6) называется обратным к (5), а утверждение: А =» В (7) противоположным к (5). 20
В общем случае утверждения (6), (7) не равносильны утверждению (5). В частности, может оказаться, что импликация (5) истинна, в то время как импликации (6), (7) ложны. Иначе говоря, для заданной теоремы обратная и противоположная теоремы могут не иметь места. Приведите примеры. С другой стороны, из определений импликации и отрицания легко следует, что формула (5) равносильна формуле В => А. Значит, любая теорема равносильна противоположной к обратной ей теореме, и вместо доказательства импликации (5) можно доказывать импликацию: Так зачастую и поступают. В том случае, когда для теоремы (5) верной является и обратная теорема (6), их обычно объединяют в одно утверждение: (А =» В) L· {В =» А), которое записывают в виде: А&В и словесно читают в одной из следующих формулировок: "А имеет место тогда и только тогда, когда имеет место J5"; "А выполняется в том и только в том случае, когда выполняется В"; "Для выполнения А необходимо и достаточно выполнение В"; "Для выполнения В необходимо и достаточно выполнение А" и т. д. Доказать теорему (5) — значит установить истинность импликации (5). Подчеркнем, что в общем случае истинность импликации (5) не означает истинности В. Из определения операции импликации видно, что при ложном утверждении А импликация (5) истинна при любом (в частности, и при ложном) J5, и в этом случае никакого доказательства не требуется. Значит, доказывать теорему (5) надо лишь в том случае, когда утверждение А истинно, и в этом случае для доказательства нужно установить истинность утверждения J5. Не вдаваясь в строгие логические формулировки, можно сказать, что любое математическое доказательство представляет собой конечную последовательность логических умозаключений, основанных на известных ранее математических фактах и логических правилах (законах логики). Приведем, для примера, некоторые широко используемые 21
в доказательствах правила логики, позволяющие из истинности одних утверждений получать истинность других. Если при этом из истинности утверждений А\,..., Ап получается истинность утверждения В, то будем записывать это в виде: (АЬ...,А„)=>В. 1. Правило заключения: (А, А =Ф В) =Ф В. 2. Правило силлогизма: (А =Ф В, В =Ф C)j=* (А_=> С). 3. Правило контрапозиции: (А =Ф В) =Ф (В =Ф А). 4. Правила двойного отрицания: А =Ф А, А =Ф А. 5. Правило сложения посылок: (А =Ф С, J5 =4- С) =Ф (А V J5 =Ф С). 6. Правило умножения заключений: (Л =Ф В,А =4- С) =Ф (А => =!>В&С). Отдельные доказательства явно выделяются своей спецификой. Укажем три типа таких доказательств. 1. Метод непосредственной проверки Этим методом обычно доказывают равенства или некоторые другие соотношения, а само доказательство заключается в осуществлении последовательности действий, существо и порядок которых определяются самой формулировкой доказываемого утверждения. Примером такого доказательства может служить доказательство формул сокращенного умножения. Так, для доказательства формулы (а + Ь)(а — Ь) = а2 — Ь2 достаточно перемножить многочлены α + Ьиа-б привести подобные члены и сравнить результат с выражением а2 — б2. 2. Метод доказательства "от противного" Для доказательства этим методом некоторого утверждения А допускают, что утверждение А ложно, то есть истинно его отрицание А. Далее, с использованием утверждения А доказывают некоторое заведомо ложное утверждение F и из этого делают вывод о том, что сделанное предположение о ложности А неверно, и поэтому А — истинно. В основе этого метода лежит логическое правило (А =ф F, F = л) =Ф А. В том случае, когда доказываемое утверждение имеет вид А => В и утверждение А истинно, в доказательстве методом "от противного" допускают, что верно утверждение β, и из А и β выводят некоторое ложное утверждение F. Отсюда делают вывод о том, что из истинности А следует истинность J5. В этом случае используется логическое правило: {АкВ =» F,F = л) =» {А =» В). 22
В некоторых случаях, исходя из А и В, доказывают утверждение А. В этой ситуации роль F играет ложное утверждение А & А. В качестве примера доказательства методом "от противного" приведем известное утверждение о действительных числах. "Произведение двух, отличных от нуля, действительных чисел отлично от нуля". Символически это утверждение можно записать так: Vx,</ € R : ((χ φ 0) h (у φ 0) =* (х</ ^ 0)). Для его доказательства нужно показать, что предикат (χ φ 0 & у Φ 0) =Ф => (ху φ 0) принимает истинное значение при любых значениях х, у из R. Допустим, что это не так, то есть при некоторых а ложна импликация: (а ф 0) & (6 φ 0) =» (αά # 0). Это означает, что ее посылка "(а =^ 0) & (6 ^ 0)" = А истинна, а заключение u(ab Φ 0)" = В ложно, т. е. аЬ = 0. Умножив обе части последнего равенства на число а"1, обратное к а (которое существует в силу условия а ф 0), и воспользовавшись известными свойствами умножения, получим равенство 6 = 0, которое свидетельствует об истинности утверждения А. Таким образом, наше допущение о том, что утверждение теоремы неверно, привело нас к противоречию с условием А. Значит такое допущение неверно, и тем самым наше утверждение доказано. 3. Метод полной математической индукции Этот метод применяют для доказательства таких утверждений, в формулировке которых участвует числовой параметр £, принимающий все значения из множества N натуральных чисел. По существу, такое утверждение A(t) является предикатом от переменного t на множестве N, а доказать требуется истинность формулы VtA(t). Сам процесс доказательства методом полной математической индукции состоит из двух этапов. 1. Доказывают, что утверждение A(t) истинно при t = 1 (это чаще всего удается сделать непосредственной проверкой). 2. Исходя из допущения, что утверждение A(t) верно для произвольного фиксированного значения t = η доказывают его истинность при t = n+ 1. После выполнения обоих этапов доказательства делается вывод об истинности утверждения A(t) для всех значений t из множества N. 23
Первый этап доказательства обычно называют началом индукции, второй — индуктивным шагом, или переходом отпкп+1. С содержательной точки зрения метод полной математической индукции обычно не вызывает возражений. Интуитивно всем кажется ясным, что указанные два этапа метода вполне законно заменяют перебор бесконечного ряда значений параметра t = 1,2,3,... . Теоретической основой метода является одна из аксиом натурального ряда чисел, называемая аксиомой полной математической индукции. Аксиоматическое построение арифметики натуральных чисел независимо было осуществлено в 1888 г. немецким математиком Р. Дедекиндом (1831—1916) и в 1889 г. итальянским математиком Д. Пеано (1858—1932). Натуральный ряд чисел Пеано определил как произвольное множество N с заданным на нем отношением "следовать за", удовлетворяющим аксиомам: 1. Существует элемент множества N, не следующий ни за каким элементом из N (любой из них назовем единицей и обозначим символом 1); 2. Для каждого элемента η € N существует единственный элемент, следующий, за η (обозначим его через п')\ 3. Для каждого элемента η € N существует не более одного элемента, за которым следует п\ 4. (Аксиома полной математической индукции.) Пусть Μ подмножество множества Ν, удовлетворяющее условиям: а) 1 € М; б) Vn Ε Ν : (η € Μ =» η' € Μ). Тогда Μ = Ν. В приведенном определении множествам ничего не говорится о природе его элементов. Она может быть какой угодно, лишь бы их совокупность удовлетворяла аксиомам 1—4. Выбирая в качестве N некоторое конкретное множество с определенным отношением "следовать за", удовлетворяющем аксиомам 1—4, мы получим интерпретацию, или модель множества натуральных чисел. В качестве стандартной модели обычно берут выработанный в процессе исторического развития человечества ряд символов 1,2,3,4,... Используя аксиомы 1 — 4, можно определить операции сложения и умножения натуральных чисел, отношения "меньше", "больше" и др. на множестве натуральных чисел и доказать известные факты арифметики. Мы не будем здесь этим заниматься. Сделаем лишь отдельные замечания. 24
1 Операции сложения и умножения в N однозначно определяются равенствами (Va, 6 € Ν) а+1 = а', а 1 = а, а + Ь' = (а + &)', а 6' = аб + а 2 Неравенства < , > для чисел а, 6 € N определяются с использованием операции сложения a<b<*b>a<=s>3k€N (b = a + k) Подчеркнем, что, наряду с другими известными свойствами неравенств, из аксиом 1—4 следует свойство, называемое аксиомой Архимеда 1 Va,6€JV,3<?€N (a<bq) 3 Для обоснования изложенного выше метода доказательства утверждения VtA(t) достаточно взять в качестве фигурирующего в аксиоме 4 множества Л/ множество тех значений параметра t, при которых утверждение A(t) истинно, и заметить, что п' — η ■+■ 1 4 С помощью аксиом 1—4 можно обосновать и несколько более общий метод доказательства утверждений вида VtA(t) с параметром t, принимающим все целые значения, начиная с некоторого целого числа по А именно, можно доказать следующую теорему Если утверждение A(t) истинно при некотором t = no € Ζ и для любого фиксированного целого числа η > щ из истинности A(t) при всех значениях t € п$,п следует истинность A(t) при t — η + 1, то утверждение A(t) истинно при всех целых t > no Особо подчеркнем тот факт, что здесь допускать истинность доказываемого утверждения A(t) можно не только для t = η, но и для всех £, удовлетворяющих неравенствам по <t <п 5 Используя аксиомы 1—4, можно доказать, что в любом не пустом подмножестве Μ множества целых неотрицательных чисел No существует наименьшее число Это утверждение в арифметике называют принципом наименьшего числа Заметим, что, используя указанные выше аксиомы 1 — 3 и принцип наименьшего числа, можно доказать аксиому полной математической индукции В этом смысле говорят, что Архимед — древнегреческий математик (287—212 до н э ) 25
принцип наименьшего числа эквивалентен принципу полной математической индукции. В заключение данного параграфа приведем одну известную из средней школы теорему, доказываемую методом полной математической индукции. Любое натуральное число, большее единицы, либо является простым, либо разлагается в произведение простых чисел. (Напомним, что натуральное число ρ > 1 называется простым, если оно делится лишь на 1 и на себя. В противном случае, оно называется составным. Единица не относится ни к простым, ни к составным числам.) G Докажем теорему методом полной математической индукции. При этом в качестве t выберем то самое число, которое фигурирует в формулировке данной теоремы. По условию оно может быть любым натуральным числом, начиная с числа 2. Так как 2 — простое число, то для t = 2 утверждение теоремы верно. Допустим, что оно верно для всех t € 2, η при любом фиксированном натуральном η > 2, и докажем его истинность для t = η + 1. Если число η 4- 1 простое, то для него утверждение теоремы верно. Пусть η 4- 1 — составное. Тогда оно делится на некоторое число а, такое, что 1 < а < η -Ы. Следовательно, η +1 = α · 6, где 1 < Ь < η +1. По предположению индукции каждое из чисел а, Ь или простое, или разлагается в произведение простых чисел, то есть имеем: α=ρι ...£*,& = <?ι ···<?£, -Pk,<li · · -Qe — простые числа, к,£ € N. Отсюда и из равенства аЬ получаем разложение числа п + 1 в произведение простых п + 1 =pi...p*9i...ft. □ Задачи 1. Выразить операцию объединения (пересечения) множеств через операции пересечения (объединения) и вычитания множеств. 2. Выразить операцию объединения (пересечения) подмножеств фиксированного множества А через операции пересечения (объединения) и дополнения. 26
3. Доказать равенства (для любых множеств А, В, С): АГ)(А1)В) = Аи{АГ)В) = А, Α Π (В U С) = {А П В) U (А П С), A U {В Π С) = (A U В) П (A U С). 4. Показать, что из любого семейства η множеств с помощью операции пересечения и объединения можно построить лишь конечное число различных множеств. 5. Доказать, что для любых двух конечных множеств А, В справедливо равенство \АиВ\ = \А\ + \В\-\АПВ\. 6. Найти мощность декартова произведения конечных множеств Αι,...4Αη. 7. Сколько существует различных отображений /: А —» В, если А, В — конечные множества и \А\ =т,\В\ = п? 8. Пусть /: Μ —* Ν\ АьАг С М,В\,В2 С N. Выяснить, какие из следующих равенств справедливы в любых случаях, а какие — не всегда: f(Al*A2) = f(A1)*f(A2), Γ\Βχ * в2) = гЧвх) * ГЧв*), (* е {и, п, \}). 9. В обозначениях задачи 8 выяснить условия, при которых справедливы равенства: Г1(НА1)) = А1,НГ1(В1)) = В1. 10. Пусть /ь/г.' А —> В и φι>φ2- В —* С. Выяснить, при каких условиях справедливы импликации /ι<£ι = /ι<£2 => φι = ψ2, ί\ψ\ = ΪίΨΙ => /ΐ = /2· 11. Доказать методом полной математической индукции следующие утверждения: а) £ г-2 = nfr+iffan+i). »=1 27
в) если Μι,..., Мп конечные множества, то NJmJ = £|m,|- £ |мплм,а| + |ι=1 Ι ι=1 1<»1<»2<»г + J! |MlinMt2nMtJ|-... + (-l)n-1|MinM2n...nM„|. \<1\<12<1Л<П Это равенство называется формулой включения-исключения. 12. Пользуясь аксиомами натурального ряда, доказать свойства ассоциативности и коммутативности операций сложения и умножения натуральных чисел.
Глава II ЭЛЕМЕНТЫ КОМБИНАТОРИКИ Комбинаторика, или комбинаторный анализ, является большим самостоятельным разделом современной математики, играющим важную роль во всех других областях математики и ее приложениях. В комбинаторике изучаются методы построения и перечисления различных комбинаций объектов, удовлетворяющих тем или иным условиям. Простейшими комбинациями объектов некоторого множества являются его произвольные подмножества, его системы элементов, расположенных в определенном порядке, разбиения множества и др. При изучении алгебры часто возникает необходимость построения и подсчета числа различных комбинаций элементов, их упорядочиваний и группирований. В связи с этим приведем простейшие сведения комбинаторного характера. § 1. Отношения на множествах. Отношения эквивалентности и частичного порядка В теории и на практике обычно приходится иметь дело с такими множествами, между элементами которых существуют определенные связи, или отношения. Так можно рассматривать в коллективах людей отношения родства, соседства, старшинства и др., на множестве прямых пространства отношения параллельности, перпендикулярности и др., на множестве целых чисел отношения равенства, делимости и др. Попытаемся, исходя из знакомых примеров, сформулировать строгое определение понятия отношения на множестве. С этой целью проанализируем один пример подробнее. Рассмотрим отношение "а делит 6" на множестве целых чисел Μ = {2,3,4,5,6,7,8}. Это отношение задается известным правилом, позволяющим выяснить, делится одно целое число на другое, или нет. Пользуясь этим правилом, из всех пар чисел (а, 6) множества Μ выпишем все те пары, в которых число а делит 6. Получим множество пар: 29
(2,2), (2,4), (2,6), (2,8), (3,3), (3,6), (4,4), (4,8), (5,5), (6,6), (7,7), (8,8). Аналогично, множеством пар можно задать отношение "больше" на множестве Μ (перечислив все пары {а, 6}, в которых а, Ь € Μ и а > 6), и другие отношения. Эти примеры делают естественным Определение!.. Бинарным отношением на множестве А называют любое подмножество ρ множества А2 (т. е. декартова квадрата множества А), По аналогии с этим, η-арным отношением на множестве А называют любое подмножество множества Лп. Ниже мы будем рассматривать лишь бинарные отношения и потому слово "бинарное" будем опускать. Если ρ — отношение на А и (а, 6) € р, то говорят, что элемент а находится в отношении ρ к элементу 6. Этот факт записывают также в виде apb (например, а < 6, а > Ь, а || Ь, a J_ Ь и т. д.). Отношения на множестве могут обладать различными свойствами. Наиболее важные свойства отношений выделяются следующим определением. Определение 2. Отношение ρ на множестве А называется: 1) рефлексивным, если Va € А : {ара), 2) симметричным, если Va, Ь € А : (apb =Φ· бра), 3) транзитивным, если Va, 6, с € Л : (арб, брс => аре), 4) антисимметричным, если Va, 6 € -А : (арб, бра => а — 6). Например, отношение делимости и отношение " < " на множестве N рефлексивны, антисимметричны и транзитивны. Отношение параллельности прямых симметрично, транзитивно. Отношение перпендикулярности прямых симметрично и не обладает другими свойствами из 1)—4). Через свойства 1) — 4) определяются важнейшие для всей математики отношения эквивалентности и частичного порядка. Определение 3. Бинарное отношение ρ на множестве А называется отношением эквивалентности, если оно рефлексивно, симметрично и транзитивно. При этом элементы, находящиеся в отношении р, называют эквивалентными (точнее, р-эквивалентными). Значение отношений эквивалентности на множестве А определяется, главным образом, тем, что они индуцируют разбиения множества А на непересекающиеся классы эквивалентных элементов. А именно, имеет место 30
Теорема1. Если ρ — отношение эквивалентности на множестве А, то А распадается на непересекающиеся подмножества так, что для любых а,Ь € А : а,Ь содержатся в одном подмножестве в том и только том случае, когда арЬ. D Обозначим через [а]р подмножество элементов из А, эквивалентных а, т. е. [а]р = {х € А : хра}, и докажем, что A=\J[a]P (1) и Va, Ь € А : ([α]ρ Π [b]p = 0 или [а]р = [6]р). (2) Так как ρ — рефлексивно, то a € [а]р для любого а € А, и равенство (1) верно. Вместо утверждения (2) докажем эквивалентное ему утвержеде- ние: Va, Ь € А : ([а}р П [Ь]р φ 0) =» [α]ρ = [6]р. (3) Пусть с — общий элемент множеств [а]р, [6]р их — любой элемент из [а]р, т. е. ера, срЬ, хра. Отсюда и из свойств симметричности и транзитивности отношения ρ следует xpb. Таким образом, для любого χ € А справедлива импликация: хра => xpb. Это означает, что [а]р С [6]р. Аналогично получается и обратное включение. Следовательно, [а]р = [Ь]р , и утверждение (3) доказано. Если в правой части равенства (1) оставить лишь все попарно различные множества, то получим искомое разложение множества А в объ- еденение непустых и попарно непересекающихся подмножеств. D Разложение (1) называют разбиением множества Л, индуцированным отношением эквивалентности р. При этом подмножества [а]р называют классами эквивалентности отношения р. Легко показать что 31
любое разбиение множества индуцируется подходящим отношением эквивалентности. Покажите, что разбиение (J Аг множества А индуциру- ется следующим отношением эквивалентности ρ на А: Va, Ь € А : (apb <4> Зг € / : а, Ь € Ах). Известными из средней школы примерами отношений эквивалентности являются: отношения равносильности уравнений с одним неизвестным χ (ему соответствует разбиение множества всех уравнений от χ на классы равносильных уравнений), отношение "параллельны или равны" на множестве прямых пространства (ему соответствует разбиение всех прямых на классы параллельных прямых), отношение подобия треугольников на плоскости (ему соответствует разбиение множества всех треугольников на классы подобных треугольников). Определение! Бинарное отношение на множестве А называется отношением частичного порядка, если оно рефлексивно, транзи- тивно и антисимметрично. Множество с заданным на нем отношением частичного порядка называют частично упорядоченным. Типичными примерами частичного порядка являются отношение теоретико-множественного включения на множестве всех подмножеств некоторого множества, отношение делимости на множестве N, отношение < на множестве R и др. § 2. Сочетания, размещения и перестановки элементов конечного множества Определение 5. Сочетанием из η элементов множества А = {ai,...,an} no k называется любое /^-элементное подмножество множества А. Определеннее. Размещением из η элементов множества А = {αι,...,αη} по к называется любой упорядоченный набор к различных элементов множества А. В частности, любой упорядоченный набор всех η элементов множества А, взятых по одному разу, называется перестановкой элементов множества А. Размещение из элементов 32
множества А по к обычно записывают в виде (аг1Уаг2У агк). В дальнейшем нам наиболее часто придется встречаться с перестановками. В связи с этим для множества всех перестановок из элементов множества А введем специальное обозначение Ρ {А). Найдем число различных сочетаний, размещений и перестановок из элементов множества А. Так как эти числа, очевидно, не зависят от природы элементов множества Л, то можно взять А = {1,2,...,п} = 17га. В этом случае говорят просто о сочетаниях и размещениях из η по к. Введем следующие обозначения: С% или (£) — число различных сочетаний из га по к, а£ или (га)/- — число различных размещений из η по /:, п! = 1 · 2 ·... · η (читается: га-факториал), О! = 1. Теорема 2. Для любых натуральных чисел к и η > к имеют место равенства: л* = (^Tjl* (4) |Р(М)|=п!, (5) П! А;!(п-А;)!' (6) D Сначала индукцией по к докажем утверждение (4) (для любого η > к). При к = 1 оно проверяется непосредственно. Допустим, что оно верно для всех к < т, и докажем его для к = т + 1. С этой целью укажем метод построения всех размещений из η по m-Ы, использующий размещения из η по т. Возьмем любое размещение из η по т: s = (г*1,г2,...,гт), и будем поочередно добавлять к нему в конце по одному из оставшихся (т. е. не вошедших в s) элементов множества 1,п. Получим η — т 33
различных размещений вида (г'ь*2, · · ·,гт, j) из η по т+1. Если такую же процедуру провести, начав с другого размещения s' из η по га, то получим еще η — га различных размещений из η по га 4-1, причем все они будут отличны от ранее полученных, поскольку различны s и sf. Отсюда видно, что, перебрав все размещения из η по га, получим ровно А%-(п-т) (7) различных размещений из η по т + 1. Заметим еще, что среди полученных размещений содержится любое размещение (6χ, &2, · · ·, &m+i) из ппот + 1. Действительно, к размещению (6χ, 62,..., Ьт) из η по т мы добавляли в конце каждый из оставшихся элементов, а поэтому должны были добавить и элемент 6m+i. Таким образом, (7) есть в точности число всех размещений из η по га 4-1. Отсюда, используя предположение индукции, получим лг ■=*> -»)=5г^(» -») - (п.(:'+1))!. что и свидетельствует о справедливости утверждения (4) для к = га-Ы. Тем самым, по аксиоме полной математической индукции, равенство (4) доказано для любого к и любого η > /:, или, что все равно, для любого η и любого к € 1,п. Формула (5) получается из формулы (4) при к = п. Докажем формулу (6). Для этого заметим, что, осуществляя всевозможные перестановки элементов в любом сочетании из η по к, мы получим из него к\ различных размещений. При этом размещения, получаемые из разных сочетаний, будут различными, и таким образом могут быть получены все размещения из η по к. Следовательно, число размещений из η по А: в к\ раз больше числа сочетаний из η по к, т. е. А„ = С„ · fc!. Подставляя сюда значения А^ из формулы (4), получим формулу (6). D Замечание1.В целях общности и в соответствии с содержательным смыслом числа Α^,Ο^ определяются также и для к = О при любом π, включая η = 0. А именно, при η = 0 или к = 0 они считаются равными 1. "Физический" смысл этого соглашения понятен. Существует ровно одно сочетание и одно размещение из элементов пустого множества. Легко видеть, что формулы (4) — (6) остаются в силе и для этих значений п, к. 34
Числа С% обладают рядом интересных и широко используемых в математике свойств. Так, непосредственной проверкой с учетом формулы (6) доказывается Следствие. Для любых чисел к,п€ No, удовлетворяющих условиям к <п или 1 < к < п, выполняются соответственно равенства: а) Ск = СГк, б) Ск = С*_, + CknZ\. (8) ТеоремаЗ. Для любого натурального числа η и любых чисел а, Ь справедливо равенство: (а + Ъ)п = С^ап + С\ап- 1Ь + ... + Скап~кЪк + ... + О". (9) D Доказательство проведем методом полной математической индукции по числу п. При η = 1 равенство (9) очевидно. Допустим, что оно верно для всех η < га, где га € N, и докажем его справедливость для η = m 4-1. Используя предположение индукции, получим (а + 6)m+1 = (а + 6)(а + 6)ш = (а + &)(С*ат + С1шаш^Ь + ... + С™6т). Перемножив выражения в правой части последнего равенства и воспользовавшись равенством (8)6) для чисел С*, будем иметь: (а + 6)m+1 = (£α·"+1 + (С4 + С^а-б + (С* + С^)а"1"162 + ... • · · + (С* + С*-1)ата+1-*6* + ... + (С% + С^-1)^"* + C£&m+1 = = C°m+1am+l + ^+1α·"6 + ... + C^+1am+1~kbk + ... + С^ЦЬт+\ Отсюда видно, что формула (9) справедлива и для η = га + 1. D Замечание 2. Формула (9) носит название формулы бинома Ньютона. Она позволяет находить в явном виде все натуральные степени двучлена, или бинома a -f 6. В связи с этим числа Ск называют биномиальными коэффициентами. Следствие!.. Для любого η € N выполняются соотношения: r)CS-C»+C«-... + (-irCS = 0; D Равенства в), г) получаются из формулы (9) соответственно при а = 1,6=1иа = 1,&= — 1. Равенство д) следует непосредственно из в), г). D 35
Если учесть, что С% есть число fc-элементных подмножеств η-элементного множества, то из в) получим Следствие2. Число всех подмножеств η-элементного множества равно 2П. § 3. Перестановки и их классификация Рассмотрим всевозможные перестановки множества 1,п. Определение?. Говорят, что числа г^, г ι в перестановке s = (ti,t2,... гп) образуют инверсию (или беспорядок), если большее из них расположено левее меньшего, т. е. it > i^wl <k или ik > it и к < I. Число инверсий в заданной перестановке s G P(l,n) можно найти, например, следующим образом. Сначала найдем, сколько чисел образуют инверсии с единицей, т. е. расположены в s левее единицы, затем — сколько чисел, отличных от 1, образуют инверсии с двойкой, т. е расположены в s левее двойки, и т. д. Сумма полученных чисел и будет искомым числом инверсий. Пример!..В перестановке (3,2,5,1,7,4,6) инверсии образуют следующие пары чисел: {3,1}, {2,1}, {5,1}, {3,2}, {5,4}, {7,4}, {7,6}. Следовательно, в ней 7 инверсий. Определение 8. Перестановку называют четной, если она содержит четное число инверсий, и нечетной в противном случае. Легко видеть, что при любом η > 1 среди всех перестановок из Р(1,п) имеются как четные, так и нечетные. Например, перестановка (1,2,3,...,п) имеет 0 инверсий и, значит, является четной. Переставив в ней 1 и 2, мы получим перестановку с одной инверсией, то есть нечетную перестановку. 36
Определение 9. Преобразование перестановки, заключающееся в перемене местами каких-либо двух ее элементов, называется транспозицией. Теорема 4. Если перестановка s' получена из перестановки s с помощью одной транспозиции, то s и s' являются перестановками разной четности. D Рассмотрим два случая. 1. Элементы г, j, меняющиеся местами при транспозиции, находятся в перестановке s рядом. Тогда условно перестановки s и s' можно записать в виде: s = (si,ij,s2), s' = (si,j,i,s2), где «ι и 52 — перестановки чисел, расположенных в s соответственно левее г и правее j. Пусть {а, 6} — любая пара чисел из перестановки s. Если {а, 6} φ Φ {hj}, т0> очевидно, числа а, 6 образуют или не образуют инверсии одновременно как в s, так и в s'. Если же {а, 6} = {i,j}, то ясно, что в одной из перестановок s, s' числа α, Ь образуют инверсию, а в другой — нет. Значит, число инверсий в перестановке s' отличается от числа инверсий в перестановке s ровно на 1 (в ту или другую сторону), и поэтому перестановки s, sf имеют разную четность. 2. Элементы i,j, меняющиеся местами при транспозиции, не находятся в перестановке s рядом, т. е. S = (Si,t,ii,t2,...,tfc, j,£2). В этом случае транспозицию чисел г, j можно осуществить следующим образом. Сначала г поменяем последовательно местами с гьг'г,... ..., iky а затем j поменяем местами последовательно с г, г^,..., г*2, h- При этом будет произведено 2k + 1 транспозиций соседних элементов, и по доказанному в случае 1, четность при переходе от s к s' изменится 2к + 1 раз. Так как число 2А: Ч- 1 нечетное, то отсюда и следует, что перестановки s и s' имеют разную четность. G Следствие. Если η > 1, то число четных перестановок множества 1,п равно числу нечетных перестановок этого множества и равно п\/2. D Пусть Αο,Αχ — соответственно множества всех четных и всех нечетных перестановок из Р(1, п). Зафиксируем различные числа /:, I G 37
€ Ι,η и в каждой перестановке s € Р(1,п) поменяем местами элементы, расположенные на к-м и £-м местах. Этим задается отображение σ: Р(1,п) —* Р(1,п). Заметим, что σ разные перестановки s и s' переводит в разные. Действительно, если в s и s' на месте с номером г были разные элементы и г ^ (fc, ί) то на r-м месте будут разными элементы и в перестановках a(s),a(s'). Если же г = к или г = Д то в перестановках a(s),a(s') разными будут элементы соответственно на £-м и к-м местах. Следовательно, отображение σ инъективно, и так как (Ι,η) — конечное множество, то σ биективно. Из теоремы 4 следует, что σ переводит Aq в Αχ и Αχ в Ло. Значит |Д}| < |Αι|, |j4i| < |Ло|, и поэтому \Αο\ = \Αι\=η\/2.Π Введем на множестве Р(1,п) функцию четности 5(з) = (-Ι)™, где Y(s) — число инверсий в перестановке s. Укажем некоторые свойства функции S(s). Утверждение 1. Если (ii, г*2, - · · ,гп) — перестановка множества (1,п) и таблица А = ι γ *{? "" ^ 1 получена из таблицы В = ( . ' " . ) перестановкой столбцов, то \i\ %2 ... гп/ i(jli J2, · · · , Jn) = i(ib »2, · · -An)· (10) D С любой таблицей вида: С = (Гг Г2 '" ГЛ \ti t2 ... in)" в которой верхняя и нижняя строки являются перестановками множества Р(1,гг), сопоставим число Д(С) = ί(η, r2,..., rn) · S(tu to, · · ·, *n). Пусть таблица получена из С перестановкой двух столбцов. Тогда перестановка (г'г»г2» · · · > гп) получена из перестановки (гι, гг,.. ·, гп) с помощью одной 38
транспозиции, и поэтому числа У(г\,Г2, ·. · ,rn),y(ri,r2,.. -,г'п) имеют разную четность. По этой же причине числа Υ(t\, £г» · · · , tn), Y(t[, tf2, ·.. . ,t'n) также имеют разную четность. Отсюда следует, что А(С) = = А(С"). Так как таблицу В можно получить из таблицы А с помощью последовательности транспозиций столбцов то А(Л) = Δ(Β), или <Нл,.72, -·,3η) ί(1,2,...,η) = ί(1,2,...,η)·ί(«ι,22,...,2η). Отсюда следует равенство (10). D Замечание 3. Точно так же, как для перестановок чисел 1,2, ,п, можно определить понятия инверсии, транспозиции, четности и нечетности, функции четности для перестановки из любых попарно различных чисел αχ,α2, ...,αη. Ниже при необходимости мы будем без оговорок пользоваться этими понятиями. Утверждение2 Если s = (ii,... ,гп) € Р(1,п) и к € 1,п, то 5(s) = 5(iu...,ik)S(ik+u. .,гп)(-1)г, (11) где г = ii + ... + гк - (1 + ... + к). D Из определения функции четности имеем равенство: J(s) = <5(zi, . ,tjb)$(tfc+i,. ,гп)(-1)г, где г — число инверсий, которые образуют числа из множества М\ = = {ii,...,ifc}, с числами из множества Мг = {г^+1,...,гп}. Подсчитаем число г. Выберем сначала наименьшее число из Μι, пусть это есть гЛ1. Чисел, меньших чем гЛ1, во множестве 1,п существует ровно гЛ1 — 1 и все они лежат в Мг, поскольку в М\ га1 — наименьшее. Таким образом, число га1 из Μι с числами из Мг образует iQl — 1 инверсий. Теперь возьмем в Μ число га2, следующее по величине за гЛ1, и таким же образом найдем число инверсий, которые образует га2 с элементами из Мг Так как все числа, меньшие его, кроме ιαι, лежат в Мг, то получим число га2 — 2. Продолжая этот процесс, найдем: г = {ιαι - 1) + (га2 - 2) + .. + (га, - к) = (и + ... + tfc) - (1 + ... + к). D Утверждение 3. .Если β перестановке s £ Р(1,п) имеется t инверсий, то от нее можно перейти к перестановке sq = (1,... ,η) с помощью последовательности из t транспозиций соседних элементов. (Докажите в качестве упражнения, используя указанный в начале параграфа способ подсчета числа инверсий.) 39
Задачи 1. Сколько различных бинарных отношений можно задать на множестве из 5 элементов. Сколько среди них отношений эквивалентности? 2. Является ли бинарное отношение ρ отоношением эквивалентности на множестве А: а) А = N/{1}; арЬ & 3d <Е А : d \a,d\ 6; б) А = R\apb & \а - 6| € Q; в) А = Р(1,п); sps' <* У (в) = У (в'); г) А = Р(1,п); sps' <* £(s) = ί(β'). 3. На множестве А4, где А = {0,1}, заданы бинарные отношения рг,р2 так, что для а = (αϊ, α2, α3, α4), /? = {βι, А, /?з, Α) € Α4: αρχ/? 4Φ <=> Зг € Ι,η : аг < @г, αρ2β <$ Vi € Ι,η : аг < /?г. Выяснить, являются ли они отношениями частичного порядка. 4. Сколькими способами можно расставить на книжной полке книги η различных наименований, если имеется rrik экземпляров книг fc-ro наименования, t G Ι,η, при условии, что книги одного наименования неразличимы? 5. Сколько в множестве Ап существует наборов, содержащих не менее η — 1, η — 2 различных элементов, если \А\ = п? 6. Сколько существует последовательностей из нулей и единиц, в которых встечается ровно ρ нулей и ровно q единиц? Сколько из них не содержат рядом стоящих единиц? 7. Сколькими способами, с учетом порядка слагаемых, можно представить натуральное число η в виде к натуральных слагаемых? 8. Сколько существует различных инъективных, сюръективных и биективных отображений множества из т элементов в множество из η элементов? 9. Доказать равенства: а) Σ СгтС*-г = С^п· т,щк eN;k< т;к < щ 1=0 б) Σιση = η·2η'\ ι=0 10. Пусть перестановки з\9 52 из Р(1,п) содержат соответственно U, $2 инверсий. Доказать, что от S\ к 52 можно перейти с помощью t\ + £2 транспозиций. 40
Глава III ОСНОВНЫЕ АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ § 1. Бинарные операции и их свойства Как было отмечено в § 1 главы I, бинарной операцией на множестве А называют отображение А2 в А. Если /: А2 —* А — бинарная операция на А и (а, 6) € А2, то образ пары (а, 6) при отображении / называют значением операции f на элементах а, 6 или результатом применения операции / к элементам а, 6, и обозначают в виде /(а, 6), или а/6 (например, а + 6, а · 6,α U Ь и т. д.). Особо подчеркнем, что значение операции определено однозначно для любых элементов а, Ь из А и обязательно принадлежит А. Приведем примеры бинарных операций. Π ρ и м е ρ 1. Известные из средней школы правила сложения и умножения чисел задают бинарные операции на любом из множеств N,N0,Z,Q,R. Π ρ и м е ρ 2. Правило нахождения разности чисел задает бинарные операции на множествах Z, Q, R и не задает операции на множествах N и Ν0. 2 Π ρ и м е ρ 3. Пусть /ι,/г — отображения множества (1,п) в 1,п, определенные равенствами: /ι(α, 6) = max{a, 6}, /2 (a? 6) = min{a, 6}. Так как для любых элементов а, 6 из 1, η максимум и минимум однозначно определены и содержатся в 1, п, то отображения /ι, /г, являются бинарными операциями на множестве 1,п. Π ρ и м е ρ 4. Рассмотрим множество Μ всех подмножеств фиксированного множества М. Так как пересечение и объединение любых двух подмножеств из Μ являются вполне определенными подмножествами из М, то пересечение и объединение множеств являются бинарными операциями на А/. 41
Π ρ и м е ρ 5. Пусть П(М) — множество всех преобразований фиксированного непустого множества Μ (т. е. множество всевозможных отображений множества Μ в себя). Бинарными операциями на множестве П(М) являются введенные в § 2.1 умножение и композиция отображений. Примерб. Обозначим через В(М) множество всех бинарных отношений на непустом множестве Μ. Для каждой пары отношений РьР2 из В(М) определим отношение р, положив Va, Ь € Μ : (арб & Зс € М: (apic)&(cp2&))· Отношение ρ называется произведением отношений рьР2> и обозначается через ριΡ2· Умножение отношений есть бинарная операция на множестве В(М). Из приведенных примеров видно, сколь разнообразными по своей природе могут быть бинарные операции на множествах. В связи с этим для облегчения изучения множеств с операциями их классифицируют по свойствам операций. Определение!.. Бинарная операция * на множестве Μ называется ассоциативной, если для любых элементов а, 6, с € Μ выполняется равенство: (а * Ь) * с = а * (Ь * с). Ассоциативными являются все операции из примеров 1, 3, 4, 5, б. Для операции примера 1 это известно из средней школы, для операции примеров 3, 4 это очевидно. Для операции примера 5 это следует из утверждения 1.1. Для операции примера б это устанавливается ниже. Утверждение1. Пусть Μ — произвольное непустое множество. Операция умножения бинарных отношений, определенных на множестве Μ, ассоциативна. О Непосредственно из определения произведения бинарных отношений следует, что каждое из соотношений: Q>{PiP2)pzb, api(p2ps)b, выполняется тогда и только тогда, когда 3c,d € Μ : ар\с, cp^d, фз· Следовательно, {р\Р2)Ръ =Pi{P2Pz)· □ 42
Заметим, что операции примера 2 (вычитание на множествах чисел Z, Q, R) не ассоциативны. Главная роль свойства ассоциативности заключается в том, что оно позволяет не расставлять скобки при оперировании со многими элементами. Определение 2. Бинарная операция * на множестве Μ называется коммутативной, если для любых элементов а, 6 € Μ выполняется равенство: а* Ь = 6*а. (1) Легко видеть, что операции примеров 1, 3, 4 коммутативны. Операции примера 2 не коммутативны. Вопрос о коммутативности операций примеров 5, б решается в зависимости от мощности множества М. Утверждение2. Операции умножения и композиции на множестве преобразований ЩМ), а также умножения на множестве бинарных отношений В(А1), коммутативны в том и только в том случае, когда \М\ = 1. D Если \М\ = 1, то |ЩА/)| = 1,|В(М)| = 2, и коммутативность указанных в утверждении операций очевидна. Пусть |А/| > 1 и αι,θ2 — различные элементы из М. Определим отображения /ι,/г: А/ —► М, положив f\{x) = αϊ, /г(х) = &ί для всех χ € Μ. Тогда: (/ι ο /2)(αι) = /ι(/2(αι)) = аи (Λ ο /iKm) = /2(/ι(αι)) = α2. Следовательно, /ι ο /2 φ /2 о /ь а потому и /ι/2 Φ /2/ι. Пример, показывающий некоммутативность умножения бинарных отношений на множестве М, постройте в качестве упражнения. D Замечание1. Для отдельных элементов а, 6 € Μ равенство (1) может выполняться и в том случае, когда операция * не коммутативна. Такие элементы называются перестановочными (или коммутирующими) друг с другом. Так, например, любой элемент множества Μ перестановочен сам с собой при любой операции *. Замечание 2. Свойства ассоциативности и коммутативности операций независимы, т. е. существуют операции, обладающие любым одним из этих свойств и не обладающих другим. Примеры ассоциативных, но не коммутативных операций уже встречались. Примером коммутативной, но не ассоциативной операции на множестве R может служить операция нахождения среднего арифметического числа для 43
действительных чисел: , а + Ь а* о = . 2 В том случае, когда на одном и том же множестве определены несколько операций, можно говорить о свойствах, связывающих различные операции. Определение 3. Бинарная операция * на множестве называется лево или право дистрибутивной относительно бинарной операции о, если для любых элементов выполняется соответственно равенство: а * (Ь о с) = (а * 6) о (а * с) или (6 о с) * а = (6 * а) о (с * а). Если выполняются оба этих свойства, то говорят просто о дистрибутивности операции * относительно операции о. В частности, если операция * коммутативна, то правая (левая) дистрибутивность совпадает с дистрибутивностью. Так, из средней школы известно, что в числовых множествах операция умножения дистрибутивна относительно операции сложения. Заметим, что операция сложения чисел не дистрибутивна относительно умножения. В примере 4 операция пересечения на множестве Μ дистрибутивна относительно операции объединения, а операция объединения дистрибутивна относительно операции пересечения. В том случае, когда операция * не коммутативна, свойства левой и правой дистрибутивности могут не совпадать. Так, например, на множестве Μ операция вычитания право дистрибутивна, но не лево дистрибутивна относительно объединения. Покажите это в качестве упражнения. § 2. Алгебраические структуры с одной бинарной операцией Алгебраической структурой или, просто, алгеброй называют множество, наделенное системой операций. Область алгебры, изучающая произвольные алгебраические структуры, называется универсальной или общей алгеброй. Несмотря на большую общность этого раздела, в нем 44
имеется ряд интересных содержательных результатов о произвольных алгебраических структурах. Вместе с тем, в связи с потребностями развития математики и ее приложений, наиболее глубоко изучены отдельные узкие классы алгебраических структур, а именно, алгебраические структуры с одной и двумя бинарными операциями, удовлетворяющими определенным условиям. В этой главе будут рассмотрены простейшие свойства таких структур. Более обстоятельное их изучение будет проведено позже, после ознакомления с некоторыми важнейшими примерами таких структур. Определение 4. Множество G с одной бинарной операцией * называют группоидом и обозначают через (G; *). Из определения 4 видно, что для задания группоида нужно задать множество G и то правило, по которому можно найти значение операции * для любых двух элементов из G. В том случае, когда множество G конечно, всю эту информацию можно записать таблицей, в которой входной строкой и входным столбцом является список элементов множества G, а на пересечении строки с входом а и столбца с входом 6 располагается значение операции а * Ь. Такая таблица называется таблицей Кэли для группоида (G; *) в честь английского математика А. Кэли (1821—1895). Если G = {αϊ,..., αη} то таблица Кэли для группоида (G; *) имеет следующий вид: Таблица 2 αϊ аг ι ап аг а3 аг * aj an Исходя из такого задания группоида, легко подсчитать, сколько различных операций можно определить на множестве G порядка п. В каждую из п2 клеток таблицы Кэли можно записать любой из η элементов множества G. Отсюда видно, что таблицу Кэли можно составить в пп вариантах, то есть на множестве G из η элементов существует пп различных группоидов. 45
Определение 5. Подмножество G\ группоида (G; *) называют замкнутым относительно операции *, если выполнено условие: Va,&€ G : (a,&€ G\ =>a*b€ Gi). При этом группоид (Gi;*) называют подгруппоидом в (G;*). Например, группоиды (Z;-f), (No;+), (N;-f) являются подгруппоидами группоида (М;Ч-). Из всех группоидов особо выделяются группоиды с коммутативной операцией. Они называются коммутативными. Очевидно, что коммутативность группоида равносильна симметричности его таблицы Кэли относительно главной диагонали. В некоторых группоидах могут существовать так называемые нейтральные элементы. Определеннее. Элемент Λ группоида (G; *) называют нейтральным, если для любого а € G выполняются равенства: а*А = А*а = а. (2) Так, в группоидах (No;o),(Q;o) нейтральным элементом является единица, в группоидах (No;-f), (Q;-f) — нуль, в группоидах (Z;—), (N; -Ь) — нейтральных элементов нет. В группоиде бинарных отношений (В(М);о) нейтральным элементом является отношение равенства (проверьте). Легко видеть, что элемент аг конечного группоида является нейтральным в том и только в том случае, когда строка и столбец с входами аг таблицы Кэли этого группоида совпадают соответственно с входной строкой и входным столбцом. Утверждение 3. Если β группоиде (G; *) существует ней- тральный элемент, то он единственный. D Пусть Λι,Λ2 — нейтральные элементы группоида (G;*). Так как Λι — нейтральный элемент, то Λι*Λ2 = Аг, атак как Λ2 — нейтральный, то Λι * Λ2 = Λι. Следовательно, Λι = Λ2. Π В группоиде (G; *) с нейтральным элементом Λ для элемента а могут существовать такие элементы а', что а' * а = Λ, а*а' = Λ. (3) Определение?. Элемент о! группоида (G; *) с нейтральным элементом Λ, удовлетворяющий равенствам (3), называют симметричным для а. 46
В общем случае в группоиде с нейтральным элементом Л элемент а может не иметь симметричных элементов и может иметь один или несколько симметричных элементов. Постройте соответствующие примеры. Более определенно о числе симметричных элементов решается вопрос в группоидах с ассоциативной операцией. Определеннее. Группоид (G; *) с ассоциативной операцией называется полугруппой. Примерами полугрупп могут служить группоиды, указанные в примерах 1, 3, 4, 5, б предыдущего параграфа. Все они являются полугруппами с нейтральным элементом. Утверждение 4. Если в полугруппе (G;*) с нейтральным элементом Л для элемента а существует симметричный элемент, то он единственный. D Пусть а', а" два симметричных элемента для элемента а. Тогда, используя равенства (2), (3) и ассоциативность операции *, получим: о! = о! * Л = о! * (а* а") = {а' * а) * а" = Л * а" = о!'. D Из всех группоидов наибольшую роль в математике играют группоиды, называемые группами. Определение 9. Группоид (G; *) называется группой, если выполнены условия: 1) операция * ассоциативна; 2) в (G; *) существует нейтральный элемент Л; 3) для каждого элемента а € G существует симметричный элемент a' €G. Если, кроме того, выполняется еще условие коммутативности операции *, то группа (G;*) называется коммутативной, или абелевой (в честь Н. X. Абеля). Приведем примеры групп. Из рассмотренных выше группоидов группами являются (Z; -f )> (Q; -Ь), (R; 4-). Все эти группы коммутативны, нейтральным элементом в них является число 0, а симметричным к числу а — противоположное ему число —а. Заметим, что группоиды (Q; ·), (R; ·) являются коммутативными полугруппами с нейтральным элементом 1, однако группами они не являются лишь из-за того, что для нуля не существует симметричного (в данном случае обратного) элемента. Удалив из Q и R число нуль, мы получим множества Q*, R*, которые являются группами относительно операции умножения. Легко видеть, что 47
группами относительно умножения являются одноэлементное множество чисел {1} и двухэлементное {1,-1}. Приведем еще пример некоммутативной группы. Из всех таких групп в дальнейшем особую роль будут играть группы подстановок. ОпределениеЮ. Подстановкой непустого множества Μ называют любое биективное отображение множества Μ на себя. Множество всех подстановок множества Μ обозначим через S(M). Из утверждения 2.1 следует, что множество S(M) замкнуто относительно операций умножения · и композиции о отображений. Следовательно, на множестве 7 определены два группоида (S(M); ·) и (S(M); о). Теорема 1. Группоиды (S(M); ·) и (S(M); о) являются группами. Эти группы коммутативны тогда и только тогда, когда \М\ < 2. D Ассоциативность операций «иона множестве S(M) следует непосредственно из утверждения 1.1. Нейтральным элементом группоидов (S(M);·), (S(M);o) является тождественное отображение е: Μ —> Μ. Симметричным для преобразования g € S{M) является преобразование 5Г~1, обратное для д. Его существование гарантируется утверждением 4.1. Необходимо подчеркнуть, что отображение д~г, обратное для подстановки д, также является подстановкой (т. е. д~г € S(M)). Это также обеспечивается утверждением 4.1, поскольку равенства дд~1 = = 9~l9 = e означают не только обратимость д, но и обратимость д~1. Итак, рассматриваемые группоиды являются группами. Рассмотрим вопрос о коммутативности этих групп. Если \М\ = 1 или \М\ = 2, то S(M) состоит соответственно из одной или двух подстановок и коммутативность рассматриваемых групп очевидна. Пусть \М\ > 2, а,6,с € М. Построим подстановки д\,д2, множества Μ следующим образом. Положим дг{а) = 6, дг{Ь) = а,дг{х) = χ для χ € Μ\{α,6}; д2{Ь) = с, g2{c) = 6 и g2{x) = x для χ € Μ \ {6,с}. Так как {9i °92){о) = (91(92(0))) = 01 (а) = &, {92 одг)(а) = (д2(дг(а))) = д2{Ь) = с, то д\ од2 φ д2одг, а поэтому и д\д2 φ д2д\, т. е. рассматриваемые группы не коммутативны. D 48
Группу (S(M);·) условимся в дальнейшем называть симметрической группой подстановок множества М. В том случае, когда множество Μ конечно, любую подстановку g из S(M) можно задать таблицей из двух строк, выписав в первой строке все элементы множества М, а во второй — под каждым элементом его образ при отображении д. Так, если Μ = {αϊ,... ,αη} и д(аг) = aQl,i G Ε I7H, то /αϊ а,2 ... αη λ \ aQl <*α2 · · · αα„ / ' В частности, тождественная подстановка имеет вид: f о.\ CL2 ... αη \ αχ α,2 ... αη обратную подстановку для д можно записать в виде: ι _ / aQl aQ2 ... aQn \ αχ 0,2 ... an Вернемся к определению группы. Из него и утверждений 3, 4 получаем: в группе есть один нейтральный элемент и для каждого элемента a — один симметричный элемент о!. Кроме того, из равенства (3) видно, что (a!)f = a^(a* b)' = Ь' * а'. При изучении алгебр и в приложениях многие задачи сводятся к решению уравнений и систем уравнений в этих алгебрах. Поэтому вопросы об условиях разрешимости и методах решения уравнений являются важными в любых алгебраических структурах. В связи с этим, в дальнейшем при изучении конкретных группоидов и других алгебр мы, как правило, будем затрагивать и вопрос о решении простейших уравнений. В группах на этот вопрос отвечает Теорема 2. В любой группе (G; *) для любых элементов а, Ь однозначно разрешимы уравнения а * χ = 6, у * а = 6. (4) D Непосредственной проверкой легко убедиться, что уравнениям (4) удовлетворяют соответственно элементы χ = а' * b н у = b * а', где о! — элемент, симметричный а. Остается доказать единственность этих ■ ■ 49
решений. Допустим, что уравнение а * χ = Ь имеет два решения: х\,Х2- Тогда имеем равенство: а * χι = а * χ2· Умножив обе его части слева на элемент а', получим х\ = χ<ι. Аналогично доказывается единственность решения и второго уравнения из (4). D В заключение этого параграфа сделаем одно замечание по терминологии и обозначениям. Само собой разумеется, что свойства группоида не зависят от того, как названа и как обозначена его бинарная операция. В связи с этим, с целью избежания лишних значков и терминов, операции в группоидах обычно называют, как и для чисел, сложением и умножением и обозначают соответственно знаками -Ьи-. Употребляемую при этом терминологию и форму записи называют соответственно аддитивной и мультипликативной. Приведем сравнительную таблицу этих терминов и обозначений. Таблица 3 Название Операция Результат операции Нейтральный элемент Симметричный элемент к а Решение уравнения х * а = 6 Решение уравнения а *х = 6 Обознач. * а*Ь Л о! Ь*а' о! *Ь Название Сложение Сумма Нуль Противоположный к а Разность Разность Обознач. + а + Ь 0,0 —а Ь — а -а + Ь Название Умножение Произведение Единица Обратный к а Правое частное Левое частное Обознач. • ab Ι,ε,ε α"1 ba~l a~lb Заметим, что аддитивная терминология чаще всего используется для коммутативных группоидов. В дальнейшем, в основном, будут рассматриваться лишь ассоциативные группоиды. В них результат операций над несколькими элементами не зависит от расстановки скобок и сами скобки, указывающие 50
порядок выполнения операций, чаще всего опускаются. В связи с этим корректной является запись вида: αϊ * а,2 * ... * αη. (5) Если при этом αϊ = α<ι = ... = αη = α, то вместо (5) пишут: αη при мультипликативной форме и па при аддитивной форме записи. Элементы ап и па называют соответственно n-й степенью и п-кратным элемента а. Непосредственно из определения элементов ап и па легко следует Утверждение 5. Если (G; ·) или (G; +) — полугруппы, то для любого элемента a Ε G и любых натуральных чисел п\, П2 выполняются равенства: аП1 . аП2 = аП1+П2^ (аП1)П2 _ аПЩ2. (g) п\а 4- пга = (ηι 4- ^2)α, ηι(η2α) = {п\П2)а. (7) Проверьте эти равенства в качестве упражнения. Если группоид (G; ·) или (G; +) является группой, то понятия п-й степени и η-кратного элемента a € G можно распространить на любое η € Ζ, положив соответственно a° = e, an = a-m = (am)-\ Оа = 0, па = (—т)а = —(та) для η = — т < 0. Нетрудно проверить, что в группе (G;·) (или (G;+)), равенства (6), (соответственно (7)) выполняются для любого a € G и любых п\, пч € Z. § 3. Кольца и поля Определение 11. Кольцом называется множество R с бинарными операциями сложения 4- и умножения ·, удовлетворяющими условиям: 1) (Я; +) — абелева группа, 2) (Я; ·) — полугруппа, 51
3) операция умножения дистрибутивна относительно сложения. При этом группа (Д; -Ь) называется аддитивной группой кольца Д. Кольцо (Д;+) называется коммутативным, если операция умножения коммутативна, и кольцом с единицей, если (Д; ·) — полугруппа с единицей. Примерами коммутативных колец с единицей являются числовые кольца: (Z;+,.),(Q;+, ·).(»;+. ·)· Примером коммутативного кольца без единицы может служить множество 2Z всех четных чисел относительно обычных операций сложения и умножения. Заметим, что любую абелеву группу (G; +) можно сделать кольцом, задав на ней операцию умножения следующим образом: Va,6GG:(a6 = 0). Определение 12. Кольцо Λ, в котором произведение любых двух элементов равно нулевому элементу, называется кольцом с нулевым умножением. Приведем еще один пример кольца. Π ρ и м е ρ 7. Рассмотрим множество R2 упорядоченных пар действительных чисел: R2 = {(a,6) :a,&ER}. Введем на множестве R2 операции сложения и умножения, положив (a,6)-f (c,d) = (a + c,6 + d), (a, 6)(c,d) = (ас, bd). Так как операции над парами производятся покомпонентно, то из свойств действительных чисел имеем: операции 4- и · в R2 коммутативны и ассоциативны, а операция · дистрибутивна относительно -К Нулевым элементом является пара (0,0), единицей — пара (1,1) противоположной для пары (а, 6) — пара (-а,-6). Следовательно, (R2;+,·) является коммутативным кольцом с единицей. В дальнейшем будет рассмотрено много других колец, в том числе и некоммутативных. Здесь же укажем на некоторые простейшие свойства, верные для любых колец и хорошо известные для чисел. 52
ТеоремаЗ. Для любых элементов а, 6, с произвольного кольцо R с нулем 0 справедливы равенства: а) а · 0 = 0 · а = 0; б) -(-а) = а; в) (-а)б = -(аб),а(—б) = -(аб); г) (-а)(-6) = аб; д) а(б — с) = аб — ас; е) га(аб) = {та)Ь = а(габ);га Ε Z; ж) (mia)(m26) = (mim2)(a6);mi,m2 Ε Ζ. D а) Так как 0 + 0 = 0 по определению нулевого элемента кольца, то a · 0 = a · (0 4- 0) = a · 0 4- a · 0. Прибавив к обеим частям полученного равенства —(а · 0), получим а · 0 = 0. Аналогично доказывается равенство 0 · a = 0. б) Непосредственно из определения противоположного элемента имеем: a + (—a) = (—a) 4- a = 0. Из этих равенств видно, что если —а — противоположный элемент для а, то а — противоположный для —а. Последнее и означает, что —(—а) = а. в) Так как — (аб) есть элемент, противоположный к аб, то в силу утверждения 4 для доказательства равенства (—а)Ь = — (аб) достаточно показать, что (—а)Ь также противоположен к аб, то есть выполняется равенство ab+ (—а)6 = 0. Используя свойство дистрибутивности умножения относительно сложения в кольце R и свойство а), получим: аЬ 4- (-а)б = (а 4- (-а))6 = 0-6 = 0. Аналогично доказывается равенство а(—6) = — (аб). г) Используя свойства б), в), получим: (-„)(-&) = -(а(-6)) = -(-(аб)) = аб. д) а(6 — с) = а(Ь 4- (-с)) = аб 4- а(—с) = аб 4- {-(ас)) = аб — ас. е) Для доказательства равенств е) достаточно воспользоваться определением m-кратного, а также свойством дистрибутивности при т € N, равенствами а) при т = 0 и равенствами в) при m = —η, где η € N. ж) Доказывается аналогично утверждению е). D 53
Если (Д; -f, ·) — кольцо с единицей е, то в нем для элемента а Φ О может не быть обратного элемента. Вместе с тем для некоторых элементов кольца Д (например, для е) обратные элементы существуют. Такие элементы играют в кольце особую роль. Определение 13. Элемент а кольца R с единицей называется обратимым, если для него в R существует обратный элемент а-1. Множество всех обратимых элементов кольца R обозначают через R* Например, Q* = Q\{0},Z* = {1,-1}. Обратимыми элементами кольца (R2; -4-, ·) из примера 7 являются все пары вида (а, 6), в которых α φ О и Ь Φ О, при этом (а, б)"1 = (а"1, б"1). Заметим, что в рассмотренных примерах множества Q*, Z*, (R2)* являются группами относительно операции умножения. Этот факт не случаен. Теорема 4. Если R — кольцо с единицей, то множество всех его обратимых элементов замкнуто относительно операции умножения в R и является группой. D Покажем сначала, что множество R* замкнуто относительно операции умножения, определенной в кольце Д. Пусть а, Ь € Д* и а"1, б-1 — обратные к ним элементы. Тогда имеем: (аЬ)(Ь-га-г) = {а{ЬЬ~1))а-1 = {ае)а~г = аа"1 = е и, аналогично, (6~1α~1)(α6) = е. Следовательно, элемент 6~1а~1 является обратным для а · 6, и потому α · Ь € Я*. Таким образом, R* можно рассматривать как множество с операцией умножения (определенной на R). Эта операция на R* ассоциативна, так как она ассоциативна на Д. Единичный элемент е обратим, поскольку ее = е, и потому лежит в Д*. Очевидно, что е — единичный элемент группоида (Д*;·)· Если а € Д* и а-1 обратный элемент для а, то а является обратным для а-1, и значит, а"1 € Д*. Из всего сказанного и определения 9 следует, что (Д*;·) — группа. D Определение 14. Группа (Д*;·) всех обратимых элементов кольца Д с единицей называется мультипликативной группой кольца Д. Рассмотрим еще вопрос о решении уравнений: ах = 6, уа = Ь (8) в произвольном кольце Д с единицей. 54
Утверждение 6. В кольце Я с единицей уравнения (8) разрешимы при любых 6 € R (и фиксированном а € Я) в том и только в том случае, когда а € R*. В последнем случае као/сдое из уравнений (8) имеет единственное решение. D Если а обратим, то точно так же, как и в теореме 2, доказывается, что χ = α"16, у = 6а"1 являются единственными решениями уравнений из (8). Обратно, пусть уравнения (8) разрешимы при любом 6, и χ = α', у = о!' — их решения при 6 = е. Используя равенства αα' = е, α"α = е и ассоциативность умножения, получим: α = а е = α (αα ) = (α α)α = еа = а . Следовательно, α' = α" = α"1, т. е. а обратим. D Определение 15. Пусть R — коммутативное кольцо и а, 6 € Л. Говорят, что элемент 6 делится на а, или а делит 6, если существует такой элемент с € Я, что 6 = ас. Тот факт, что α делит 6 кратко записывают в виде α | 6. Если α | 6, то говорят также, что 6 кратно а, а — делитель 6. Отношение делимости на коммутативном кольце обладает рядом свойств, сходных с известными из средней школы свойствами делимости целых чисел. Утверждение?. Для любых элементов а, 6, с коммутативного кольца R справедливы импликации: а) α | 6, 6 | с => а | с; б) а | 6, α | с =ϊ α \ (Ь±с); в) а | 6 =Φ· α | 6с. £&/ш Я — коммутативное кольцо с единицей е, то оно обладает такэюе свойствам: г) Va € Я,Уг € Я* : (г | a,ar | a); д) Va,6 € Я,Угьг2 € Я* : (а | 6 <=► an | 6r2). D Импликации а), б), в) доказываются непосредственно на основании определения 15. Проделайте это в качестве упражнения. Свойство г) следует из очевидных равенств a = г(г~га), а = (ar)r~l. Докажем д). Пусть а,6 € Я, п,Г2 € Я*. Если а | 6, то 6 = ас при некотором с € Я. Отсюда имеем равенство 6r2 = {о.г\)г^1сг2^ которое означает, что аг\ | 6г2. Обратная импликация доказывается аналогично. D Заметим, что указанные в пункте г) делители г и аг элемента a называются несобственными, или тривиальными. 55
Кроме обратимых элементов особую роль в кольцах имеют элементы, называемые делителями нуля. В связи с термином "делитель нуля" необходимо сделать следующее замечание. В соответствии с определением 15 нуль делит нуль и потому нулевой элемент кольца следовало бы относить к делителям нуля. Однако в ряде случаев этого удобнее не делать. Поэтому здесь (как во многих других книгах по алгебре) термин "делитель нуля" будет использоваться только в смысле следующего определения. Определение 16. Делителем пуля в произвольном кольце R называется любой его элемент а Φ О, для которого в R существует элемент b фО, удовлетворяющий условию аЬ = 0 или Ьа = 0. Для приведенных выше примеров колец имеем: в кольцах Ζ, 2Ζ, Q, R делителей нуля нет; в кольце с нулевым умножением делителями нуля являются все ненулевые элементы; в кольце (R2;-t-,·) из примера 7 делителями нуля являются все пары (а, 6), в которых а = 0, Ь Φ 0 или а ф 0, Ь = 0. ЗамечаниеЗ. Если в коммутативном кольце R а делит 6, то элемент с из условия Ь = ас находится в общем случае неоднозначно. Однако если а Ф 0 и а не является делителем нуля, то с находится однозначно, поскольку из ас\ = ас2 следует а(с\ — сг) = 0, а потому и с\ — С2 = 0, т. е. с\ = С2. В этом случае однозначно определенный элемент с называют частным от деления 6 на α и обозначают в виде £. Определение 17. Коммутативное кольцо с единицей и без делителей нуля называют областью целостности. Примерами областей целостности являются кольца Z, Q, R. Из всех областей целостности особо выделяют поля. Определение^. Полем называют коммутативное кольцо с единицей, отличной от нуля, в котором каждый ненулевой элемент обратим. Примерами полей являются кольца Q и R. Их называют соответственно полем рациональных и полем действительных чисел. В качестве примера нечислового поля построим поле из двух элементов 0, е с операциями сложения и умножения, заданными следующими таблицами Кэли: 0 е 0 0 0 е 0 е + 0 е 0 0 е е е 0 ι 56
Читателю предлагается проверить, что множество {0, е} с указанными операциями является полем с нулем 0 и единицей е. Это поле называют полем Галуа из двух элементов и обозначают через GF(2). Ниже мы познакомимся со многими другими полями. Так как поля являются кольцами, то они обладают всеми общими свойствами колец. Вместе с тем, поля обладают и некоторыми специфичными свойствами. Утверждение 8. а) если а, 6 — элементы поля Ρ и а Ф О, то уравнение ах = Ь имеет единственное решение в Р. б) В любом поле Ρ отсутствуют делители нуля, т. е. Va, Ь Ε Ρ : (ab = 0 <=» а = 0 или Ь = 0). D Свойство а) следует непосредственно из утверждения 6, если учесть что в поле все ненулевые элементы обратимы. б) Если аЬ — 0 и α φ 0, то, умножив обе части равенства аЬ = 0 на а"1, получим а~г(аЬ) = 0, то есть Ь = 0. В другую сторону утверждение б) следует из теоремы 3 а) для колец. D Определение 19. Подмножество R\ кольца (Д; +, ·) замкнутое относительно операций +,«вйи являющееся кольцом (полем) относительно этих операций, называют подколъцом (подполем) кольцо Л. Из определения 19 следует, что кольцо Ζ является подкольцом кольца Q, которое само является подкольцом и подполем поля R. § 4. Изоморфизм множеств с операциями При изучении множества с операциями в алгебре обращают внимание лишь на те его свойства, которые обусловлены определенными на нем операциями, и не интересуются свойствами, обусловленными природой его элементов. Множества, устроенные одинаково с точки зрения определенных на них операций, называются изоморфизмами (т. е. имеющими одинаковое строение). Прежде чем дать этому понятию строгое определение, приведем простейший пример. Рассмотрим группоид G\ = {1,—1}с обычной операцией умножения чисел. Его таблица Кэли имеет вид: 57
1 -1 1 1 -1 -1 -1 1 Сравним группоид G\ с другим группоидом G2, состоящим из двух отображений множества Ζ в себя: тождественного отображения ε и отображения ί, определенного условием Va € Ζ: δ(α) = —α легко видеть, что множество G<i = {ε, J} замкнуто относительно операции композиции отображений, и мы имеем группоид {G2',0) с таблицей Кэли: о | ε J δ ε\ε\δ δ Ι δ \ ε Сравнивая группоиды (G\\ ·) и (G2; о), замечаем, что, заменив в таблице Кэли для Gi, элементы 1,-1 соответственно на ε, J, а операцию · на о, мы получим таблицу Кэли для группоида (G2; о). Таким образом, с точки зрения операций группоиды G\ и G2 отличаются лишь обозначением элементов и операций. Теперь заметим, что замена элементов 1, — 1 на ε, δ это есть биективное отбражение φ множества G\ на G2, удовлетворяющее условию: Va, 6, с € G\ : (ab = с <=> <р(а) о φ{ο) = <р(с)). Нетрудно видеть, что так записанное условие равносильно условию: Va, Ь € Gi : Mafc) = y>(a) о φ(ο)). Теперь должно быть понятным и естественным Определение 20. Группоиды (G; *) и (Я; о) называют изоморфными, если существует биективное отображение φ: G —► Я, такое, что для любых элементов а, 6 € G выполняется равенство: <р(а * 6) = φ(α) о <р(6). (9) При этом само отображение φ называют изоморфизмом группоида (G, *) на группоид (Я; о). Тот факт, что группоиды G, Я изоморфны, записывается в виде G*LH. 58
Легко видеть, что если φ — изоморфизм группоида (G;*) на (Я; о), то отображение φ"1 является изоморфизмом группоида (Я; о) на (G; *). Докажите это в качестве упражнения. Понятие изоморфизма группоидов встречается и используется даже в школьной математике (без употребления слова изоморфизм). Так, отображение φ множества положительных чисел Д+ во множество всех действительных чисел Д, определенное равенством φ(α) = lg α, является изоморфизмом группоида (Д+;·) на группоид (Д;-Ь). Условие (9) в данном случае записывается равенством: lg(afc) = lga + lg&. Если в группоидах G, Я операция обозначается одним и тем же символом, например *, то равенство (9) принимает вид: φ[α * 6) = φ(α) * φ{ο). В этом случае говорят, что отображение φ является изоморфизмом относительно операции *. В алгебре, изучающей множества лишь с точки зрения свойств операций, изоморфные группоиды попросту не различают, то есть изучают группоиды (да и другие множества с операциями) лишь с точностью до изоморфизма. Это объясняется тем, что операции в изоморфных группоидах обладают одними и теми же свойствами. Частично это утверждается в следующей теореме. Теорема 5. Пусть φ — изоморфизм группоида (G; *) па группоид (Я; о). Тогда: а) если группоид (G; *) коммутативный или ассоциативный, то соответственно таким оке является и (Я; о); б) если Λ — нейтральный элемент в (G; *), то φ(Α.) — нейтральный β (Я; о); в) если в (G; *) элемент д' является симметричным для д, то в (Я; о) элемент <р(д') — симметричный к ц>{д). D а) Пусть операция * коммутативна и h\ , /12 — любые элементы из Я. Так как отображение φ сюръективно, то 3^ь^2 € G : <р{дх) = Ль φ&) = h2. Теперь, используя коммутативность операции * и условие (9), получим: h\oh2 = <£i (01)0^2(02) = φ{9ι*92) = <p{g2*gi) = φ{92)°φ(9ι) = h2ohi. 59
Следовательно, операция о также коммутативна. Аналогично доказывается утверждение а) и для свойства ассоциативности. б) Пусть, как и в a), h\ Ε Н,(р(д\) = h\. Тогда: </>(Λ)οΛι = φ{Λ)οφ(9ι) = <p(A*gi) = <p{gi) = ЛЬ и аналогично h\ οφ(Κ) = h\. Следовательно, φ(Α) — нейтральный элемент в (Я; о). в) Из равенств д * д1 = д1 * д = Л, учитывая, что φ — изоморфизм, получим: Ч>(9) ° V>W) = <Р&) ° *>Ы = У(А). (Ю) Так как <р(Л) — нейтральный элемент в (Я; о) (по доказанному в п. б), то равенства (10) и означают, что <р(д') — симметричный элемент для <р(д). О Следствие. Если группоиды (G; *), (Я; о) изоморфны и (G; *) есть или полугруппа, или коммутативная полугруппа, или группа, то соответственно таким же является группоид (Я; о). В заключение данного параграфа докажем два утверждения о группах подстановок. Утверждение 9. Для любого множества Μ группы (S(M), ·) и (S(M);o) изоморфны. О Покажем, что изоморфизмом является отображение φ: S(M) —> —> 5(М), определенное следующим образом: VgeS(M):<p(g) = g-\ где д"1 — обратный элемент для д в группе (S(M); ·). Так как каждый элемент из S(M) является обратным для обратного к нему, то у? — сюръективно. Инъективность φ легко доказывается от противного. Допустим, что д^1 = д^1 для д\ Φ дъ. Умножив обе части последнего равенства на д\ слева и на д% справа, получим противоречащее условию равенство #2 = <7ι· Итак, φ — биективно, и осталось проверить условие (9). Оно проверяется с использованием известного равенства (ffi»r1=ff21fff1: Ч>(9\92) = (9i92)~l = 9219ΪΧ = 4>{92)<p(9i) = <P(9i) ° ¥>Ы· п 60
Утверждение 10. Если множества М, М1 — равномощны, то (5(М;-) = (5(М');·)· D По определению равномощности множеств существует биективное отображение а: Л/ —> Μ'. Сопоставим каждой подстановке д € S(M) отображение <р{д) = а"1 да: М' —> А/'. Так как отображения а~1,д,а биективны, то по утверждению 2.1 биективным будет и их произведение. Следовательно, ip(g) Ε S(Mf). В итоге определено отображение φ: S(M) —> 5(Л/'). Отображение φ сюръективно, поскольку в подстановку д* из S(M') отобразится подстановка ад'а~1 из S{M). Действительно, по определению φ имеем: ip(ag'a~l) = аГ1(ад'а~1)а = (аГ1а)д'(а~1а) = εΜ · З^л/' = #'· Отсюда и из утверждения 5.1 следует, что φ — биективно, и остается проверить для φ условие (9): ψ(9ι92) = a'l(gig2)a = {a"lgia)(a"lg2a) = <p{gi)ip(g2). □ Утверждения 9 — 10 хорошо иллюстрируют значение понятия изоморфизма. Оказывается, для изучения групп (S(M);-),(S(M);o) при всевозможных Μ достаточно из каждого бесконечного семейства равно- мощных множеств выбрать какое-либо одно и изучать лишь симметрическую группу подстановок этого множества (т. е. множество подстановок с операцией умножения). В конечных случаях в качестве таких множеств обычно выбираются множества Ι,η,η Ε N. Группа подстановок множества 1,п называется симметрической группой подстановок степени η и обозначается через 5П. Подстановки из Sn записывают обычно в виде: = / 1 2 ... η \ 9 \ii i2 ... in J ' где is — образ элемента s при действии подстановки д. Понятие изоморфизма группоидов естественным образом обобщается на алгебры со многими операциями. Здесь мы ограничимся лишь частным случаем, когда алгебры являются множествами с двумя бинарными операциями. Определение 21. Алгебры (Яь+, ·)>(Ή2ι+γ) с бинарными операциями сложения и умножения называют изоморфными, если существует такое биективное отображение φ: R\ —> R2i при котором для 61
любых элементов α, Ь € R\ выполняются равенства: φ(α + b) = φ(α) + <р(Ь)% φ(αο) = φ(α)φ(ϋ). При этом отображение φ называют изоморфизмом алгебры (Ri,+, ·) па №,+,·). Изоморфизм алгебр (Дь +, ·), (Й2, +, ·) обозначается тем же знаком =, что и изоморфизм группоидов. В дальнейшем нам окажется полезной Теорема 6. Если алгебры (Яь+, ·) и (J?2i+»#) изоморфны и ((Дь +1 ·) ~ кольцо (поле), то (Дг, +, ·) также является кольцом (полем). Выполнение всех аксиом кольца (поля), кроме дистрибутивности, для /?2 следует непосредственно из теоремы 5. Проверим условия дистрибутивности. Пусть φ — изоморфизм R\ на Дг, и а, 6, с — любые элементы из R^. Так как φ — сюръективно, то 3 ai,6bci € R\ :φ(αχ) = α;^(6ι) = 6;<p(ci) = с. Применяя к обеим частям равенства (ai + b\)ci = a\C\ + 6jCi отображение у? и учитывая, что <р — изоморфизм, получим соответственно: φ((αι + 6i)ci) = φ(αχ + &iMci) = (φ(αχ) + y>(&i))y>(ci) = (a + 6)c, <p(aici +61C1) = y>(aici) + ^(6ici) = y?(ai)^(ci)+ y>(6i)y>(ci) = ac + 6c. Следовательно, в Дг операция · право дистрибутивна относительно операции +. Аналогично проверяется и свойство левой дистрибутивности. Задачи 1. Сколько различных бинарных операций можно определить на п- элементном множестве? В скольких случаях получатся группоиды: а) коммутативные, б) с нейтральным элементом, в) с условием разрешимости любого уравнения вида ах = 6, г) с условием разрешимости любого уравнения вида ха = 6? 2. Привести пример множества с двумя бинарными операциями *, о, из которых одна является лево дистрибутивной, но не право дистрибутивной относительно другой. 62
3. Определим на множестве R2 операции: (а, 6) + (с, d) = (а + с, b + d), (а, 6)(с, d) = (α, d). Являются ли эти операции коммутативными, ассоциативными, лево (право) дистрибутивными одна относительно другой? 4. Найти нейтральный элемент и описать все обратимые элементы в полугруппе В(М) всех бинарных отношений на конечном множестве М. 5. Доказать, что если д — подстановка конечного множества Μ и α € € Μ, то в последовательности а, д{а), д2(а),... первым из повторившихся элементов будет а. 6. Являются ли группами: а) множество всех подстановок множества Μ Φ 0, оставляющих на месте фиксированный элемент а € М\ б) множество отношений эквивалентности на множестве Μ Φ 0 относительно операции умножения; в) множество всех подмножеств множества Μ Φ 0 относительно операции *, где А * В = (A U В)\(А Π В); г) множество действительных чисел промежутка [0,1) с операцией *, где а * Ь — дробная часть числа а + 6? 7. Доказать, что если в группе (G; ·) любой элемент а удовлетворяет условию а2 = е, то G — абелева. 8. Доказать, что все группы порядка 3 изоморфны между собой и существуют ровно две не изоморфные группы порядка 4. 9. Изоморфны ли группоиды: a)(N0;+),(No;·); 6)(Z;+),(2Z:+); b)(Z;.),(2Z;.)? 10. Являются ли кольцами (полями) относительно операций сложения и умножения чисел множества: а) {а + Ь\/2 :α,6€Ζ}; б) {a + by/2:a,b€Q}; в) {a + 6\/2:a,&€Q}? 11. Является ли кольцом (полем) множество R2 с операциями: (а, 6) + (с, d) = (а + с, Ь + d); (а, 6)(с, d) = (ad + 6с, Μ)? 12. Доказать, что в любом кольце с единицей множества обратимых элементов и делителей нуля не пересекаются. 63
13. Доказать, что отношение изоморфизма является отношением эквивалентности на любом множестве группоидов. 14. Изоморфизм группоида G на себя называют автоморфизмом группоида. Доказать, что множество Aut(G) всех автоморфизмов группоида G является группой относительно операции умножения (композиции) отображений.
Глава IV ЧИСЛОВЫЕ КОЛЬЦА И ПОЛЯ § 1. Отношение делимости в кольце Z. Деление целых чисел с остатком Кольцо целых чисел Ζ является одним из основных числовых колец. Методы решения многих задач в кольце Ζ нередко служат основой для аналогий при изучении других колец. Так, например, изложенный в данной главе материал по теории делимости в Ζ послужит в главе IX основой для изучения сходных вопросов в кольцах многочленов. Кольцо Ζ является коммутативным кольцом с единицей и потому в нем отношение делимости обладает свойствами а) — д) из утверждения 7.Ш. В дополнение к ним докажем. Утверждение1. Для любых а, 6 € Ζ: а) а | 6 <& ±а | ±6; б) α|6,6#0=Ηα| < Η; в) а | 6,6 | а<& \а\ = |6|. D а) Свойство а) является уточнением свойства д) из утверждения 7.Ш, поскольку обратимые элементы кольца Ζ исчерпываются числами 1,-1. б) Из условия а \ Ь следует, что 6 = aq при некотором q Ε Ζ. Отсюда по свойству модулей чисел имеем: |6| = \а\ · \q\. Так как 6 Φ О, то \q\ > О, т. е. |ρ| = 1 4-1, где t G No- Следовательно, |6| = |α|(1 4-1) = \a\ -Ь fc, где. к = \a\t > 0, и потому |6| > \а\. в) Пусть α | 6 и 6 | а. Тогда числа а, 6 или оба равны нулю, или оба не равны нулю. В первом случае равенство \а\ = |6| очевидно, во втором оно следует из свойства б). Обратная импликация следует из утверждения а), если учесть, что \а\ = |6| =^ 6 = ±а. О Заметим, что множество делителей любого целого числа а не пусто. Действительно, если а = 0, то его делителями являются все целые числа (включая и 0). Если же а Ф 0, то оно имеет, по крайней мере тривиальные делители ±1,±а (см. замечания к утверждению 7.Ш). 65
Свойство а) сводит описание всех делителей и всех кратных для данного числа к описанию лишь положительных (натуральных) делителей и кратных. Из свойства б) следует конечность числа различных делителей у любого отличного от нуля целого числа, что дает принципиальную возможность нахождения всех делителей числа. В том случае, когда одно натуральное число не делится на другое, алгоритм деления "уголком" приводит к неполному частному и остатку от деления. Оказывается, что понятие деления с остатком можно обобщить на любые целые числа. Определение1. Разделить с остатком целое число а на целое число Ь — это значит найти целые числа q и г, удовлетворяющие условиям: a = bq + r, (1) О < г < \Ь\. (2) Числа q и г, удовлетворяющие условиям (1) — (2), называют соответственно неполным частным и остатком от деления а на 6. Теорема 1. Если а, 6 € Ζ и Ь Φ О, то а можно разделить на Ь с остатком, причем неполное частное и остаток определяются однозначно. D Сначала докажем существование чисел q и г, удовлетворяющих условиям (1) — (2). Рассмотрим отдельно три случая. а) а > О, Ь > 0. По аксиоме Архимеда существует такое натуральное число к у что а < Ьк. Отсюда (согласно принципу наименьшего числа) следует существование такого целого неотрицательного числа q, что bq < а < b{q + 1), т. е. 0 < а - bq < b. Следовательно, числа q и г = a — bq удовлетворяют условиям (1), (2). б) а < 0, b > 0. Тогда — а > 0, и по доказанному в пункте а) существуют такие числа q\, r\, что -а = bq\ + Γχ, 0 < η < 6. Если η = 0, то а = 6(—ςι), и условия (1) —(2) выполняются при q = — q\, г = 0. Если же Γι φ 0, то а = b(-qi) - η = b(-qx - 1) + (b - η) = bq + г, 66
где q = —qi — 1, г = Ь — r\. Так как 0 < г\ < 6, то 0 < г < 6, и для чисел q, г условия (1) — (2) выполнены. в) α — любое, Ь < 0. Тогда по доказанному в пунктах а) и б) найдутся такие числа </ι, π, что a = (-&)<?i +ri,0<ri < -6= |6|. Отсюда имеем a = 6(-gi) + rb0<r1 < |6|. Таким образом, существование неполного частного и остатка доказано во всех случаях. Докажем единственность. Допустим, что для целых чисел а, 6, q, r, q\, г\ выполняются соотношения (1) — (2) и соотношения: а = bq\ +ri,0 < r\ < \Ь\. Тогда имеем bq + г = bqi + r\, и потому Η·|9-9ιΙ = In -rl· Так как г, ri — неотрицательные числа, меньшие |6|, то \г\ — г\ < \Ь\. Однако при q φ q\ из последнего равенства и утверждения 1 б) следует, что \т\ — г\ > |6|. Значит, q = ςι, а тогда и г = п. D Ниже остаток от деления α на 6 будем обозначать через гь{а). Сравнивая определение 15.III отношения делимости и определение 1 деления с остатком и учитывая единственность неполного частного и остатка, получим Следствие. Если a,b €Z и b ф0, mob\a& гъ{а) = 0. § 2. Наибольший общий делитель и наименьшее общее кратное целых чисел Определение 2. Наибольшим общим делителем (НОД) чисел αι,...,αη € Ζ, называют любое целое число d, удовлетворяющее условиям: 67
a) d есть общий делитель чисел αχ,..., αη, т. е. d\ αχ,...,rf I αη; 6) d делится на любой общий делитель чисел а\,.. .,αη, τ. е. Vdi G Ζ : (di | аь..., di | On =* di | d). Множество всех наибольших общих делителей чисел αχ,..., αη, обозначим через НОД {αχ, ...,αη}. Ниже мы докажем, что множество НОД {αχ,..., αη } не пусто при любых αχ,..., αη € Ζ. Пока же установим лишь более слабое Утверждение 2. Если αχ = · · · = αη = 0, то для чисел αχ,...,αη, существует единственный НОД, равный 0. .Если целые числа αχ,..., αη, we все равны 0 ti для над; существует хотя бы один НОД, то они имеют ровно два НОД, которые отличаются только знаком. О При αχ = · · · = αη = 0 число d = 0 удовлетворяет условиям определения 2, а число d Φ 0 удовлетворяет условию а) и не удовлетворяет условию б), поскольку, например, d + 1 | 0, но d + 1 { d. Следовательно, НОД {0,...,0} = {0}. Пусть теперь целые числа αχ,...,αη, не все равны 0, и d G НОД {αχ,...,αη}, т. е. d удовлетворяет условиям определения 2. Тогда d =^ 0, и из утверждения 1 а) следует, что этим условиям удовлетворяет также число — d. Если целое число d\ также является НОД чисел αχ,...,αη, то по условию б) определения 2 d\ \ d и d | d\, а тогда по утверждении 1 в) имеем |dx| = |d|, т. е. d\ = d или dx = —d. Таким образом, в рассматриваемом случае НОД {αχ,..., αη} = {-d, d}. D Из утверждения 2 следует, что если множество НОД {αχ,...,αη} не пусто, то в нем содержится единственное неотрицательное число. Условимся обозначать его через (αχ,... ,αη). Для решения вопроса о существовании НОД чисел αχ,..., αη ограничимся сначала рассмотрением случая η = 2. В этом случае для нахождения НОД существует известный алгоритм, описанный на геометрическом языке Евклидом 2. Пусть даны два целых числа а, Ь. Если 6 = 0, то, очевидно, НОД {а, 6} Э а. Поэтому будем считать, что 6^0. 2 Евклид — древнегреческий математик (365—300 лет до н. э.), впервые осуществивший систематизацию и аксиоматическое изложение накопившихся геометрических знаний. 68
Алгоритм Евклида для целых чисел а, Ь при условии 6^0 заключается в следующем. Сначала делим с остатком а на Ь: а = bqi+ri, 0 < г\ < |6|. Если Γχ = 0, то алгоритм окончен. В этом случае Ь | а, и, очевидно, Ь Ε НОД{а,6}. Если же г\ Φ 0, то делим с остатком 6 на η : Ь = = П<72 + 7*2, 0 < Г2 < п. Если гч = 0, то алгоритм окончен, в противном случае делим с остатком г ι на 7*2 и т. д. до тех пор, пока не получим остаток, равный нулю. Такой момент обязательно наступит, поскольку получающиеся остатки являются целыми неотрицательными числами и образуют строго убывающую цепочку т\ > 7*2 > ... . Если остатки Π,...,гп отличны от нуля, a rn+i = 0, то имеем следующую систему соотношений: а = bq\ +n, 0 < п < |6|, Ь = nq2 + 7*2, 0 <т*2 < |п|, Т\ = 7*2(?3 + 7*3, 0 < 7*3 < |т*2|, ,«v 7п-2 = 7*п-1(?п + 7*п, 0 < Гп < |rn_i|, 7*п-1 = 7*п^п+Ь Прослеживая систему равенств из (3) снизу вверх, нетрудно заметить последовательно, что т*п делит числа τ*η_ι, т*п_2>..., Γχ, 6, а. Следовательно, гп есть общий делитель чисел а, 6. Если di какой-либо другой их общий делитель, то, прослеживая систему равенств (4) сверху вниз, получим последовательно: di делит τ*ι,τ*2,.. . ,т*п. Следовательно, гп = (а, 6). Отсюда, с учетом утверждения 2, можно сделать вывод о том, что справедлива Теорема2. Для любых целых чисел а, Ь существует единственный неотрицательный наибольший общий делитель (а, 6). При этом, если а | Ь или Ь | а, то соответственно (а, Ь) = а или (а, Ь) = Ь, в противном случае (а, 6) совпадает с последним не равным нулю остатком в алгоритме Евклида для чисел а, 6. Теорем аЗ. Для любого натурального числа η > 2 и любых целых чисел а\,..., ап существует НОД, причем единственный неотрицательный НОД чисел а\,..., ап находится по формуле: (αϊ,..., ап) = ((... ((αϊ, α2), α3),..., αη_ι), αη). 69
D Докажем это утверждение индукцией по п. При η = 2 оно следует, из теоремы 2. Допустим, что оно верно для η = к > 2 и докажем его для η = к + 1. По теореме 2 ^ι = ((•••((аьа2),аз),...)>а*)>с'2 = ((· ·· ((аьа2),аз), ·· ·)>αΜ-ι) являются вполне определенными числами из Л^, и для доказательства теоремы достаточно показать, что cfo € НОД {αϊ,..., α&, α^+ι}. Из определения чисел di, di и из предположения индукции получаем равенства: d2 = (di,afc+i), di = (ai,a2,...,afc). (4) Пользуясь равенствами (4), нетрудно проверить, что d2 удовлетворяет обоим условиям определения НОД чисел αϊ,...,α&, α*+ι. Проверьте это самостоятельно. D Используя алгоритм Евклида, нетрудно представить любой НОД чисел αϊ,... ,am в виде целочисленной линейной комбинации этих чисел. Сделаем это сначала для т = 2. Теорема 4. Если г\,..., rn, q\,..., qn — последовательности остатков и неполных частных в алгоритме Евклида для чисел а, 6, то выполняются равенствах rk = auk + bvk, к € T7n, (5) где Uk,Vk — целые числа, определяемые рекуррентными соотношениями: Uk = Ufc-2 - Ufc-i(fc, Vk = Vk-2 - Vk-iqk (6) и начальными условиями: u0 = 0, u\ = 1, v0 = 1, vi = -q\. (7) D Сначала заметим, что числа щ,..., un, v\,..., νη однозначно определяются условиями (6), (7). Теперь индукцией по к докажем, что они удовлетворяют соотношениям (5). При к = 1 равенство (5) имеет вид ri = а — bqi и легко получается из 1-й строки системы (3). Допустим, что соотношение (5) выполняется для к € 1,га, где 1 < т < п, и докажем его для к = т +1. Из т + 1-го равенства системы соотношений (3), используя предположение индукции, получим при т + 1 > 2: 7*m+i = Гт-1 - гшЯтп+\ = (aum_i + £wm_i) - (aum + bvm)qm+i = = a(um_i - umqm+i) + b(vm~i - vmqm+i) = atim+i + 6vm+i; 70
при га + 1 = 2: Г2 = Ь - r\q2 = 6 - (aui + 6vi)<j2 = а(-и1<Ы+ + 6(1 - v\q2) = a(u0 - uitfz) + b(v0 - V\q2) = au2 + bv2* Следствие. Если a,b € Ζ и d = (a, 6), то существуют такие целые числа и, и, что выполняется равенство: au + bv = d. (8) D Если d = α или d = 6, το утверждение очевидно. Если άφ а,афЪ, то по теореме 2 d = rn, и искомыми целыми числами и, υ могут служить числа un,vn из равенства (5) при к = п. Процесс вычисления чисел Uk,Vk из (5) и, в частности, чисел u, v из (8) удобно проводить с помощью следующей таблицы. D Таблица 4 к Як Uk Vk 0 0 0 1 Я\ 1 -Яг 2 Яч U2 = Uq - Ui<j2 ^2 = VO - ^1^2 m <?m Um = Um_2~" ~~^m—l^m Vm = Vm-2- η <?n и = un \ V = Vn \ Используя теорему З и следствие теоремы 4, нетрудно индукцией по η доказать Утвержден иеЗ. Пусть αι,...,αη € Ζ, η > 2. £?сли (αϊ,.. .,αη) = = d, то существуют такие целые числа ui,..., ип, что cl\U\ + ... + апип = d. Заметим, что обратное утверждение в общем случае неверно. Приведите соответствующий пример. Определение 3. Целые числа αϊ,..., αη называются взаимно простыми (в совокупности), если (αϊ,... ,αη) = 1. Утверждение^ Целые числа αχ,..., αη взаимно просты тогда и только тогда, когда существуют и\,..., ип € Ζ такие, что а\и\ Η h anun = 1. (9) 71
D Если (αϊ,...,αη) = 1, то нужные числа щ,..., ип существуют по утверждению 3. Обратно, если при некоторых ui,...,un выполняется равенство (9) и d | αϊ,..., d | αη, то d | 1. Следовательно, (αϊ,..., αη) = = 1. D Приведем наиболее часто используемые свойства взаимно простых чисел. Теорема 5. Для любых целых чисел а, 6, с, справедливы утверждения: а) (а, 6) = 1, (а, с) = 1 => (а, 6с) = 1; б) а | be, (а, 6) = 1 => а \ с; в) а | с, 6 | с, (а, 6) = 1 =Ф ab | с; г) (а, 6) = с, с ^ 0 =Ф (а/с, 6/с) = 1. D а) Из условия и утверждения 4 следует существование целых чисел щ, v\, U2, ^2, удовлетворяющих равенствам: aui + bv\ = 1, au2 + evi = 1. Перемножив эти равенства почленно, получим: au + (6с)ν = 1, где U = aUiU2 + 6V1U2 + CU1V2, V = ^1^2. Отсюда по утверждению 4 имеем (а, 6с) = 1. б) По условию при подходящих ς, и, υ € Ζ выполняются равенства: 6с = ας, au + bv = 1. Умножив последнее равенство на с и заменив после этого 6с на aq, получим a(cu)+a(qv) = с и a(cu+qv) = с. Следовательно, α | с. в) Как и в случае б), имеем равенства: с = a<ji,c = bq2,au + bv = 1, {q\,q2,u,v € Ζ). Умножив последнее равенство на с и учитывая два предыдущих равенства, получим: а6(?2^ + abq\v = с. Отсюда видно, что аб | с. г) Из условия и утверждения 3 следует, что с | а, с | 6 и существуют целые числа и, ν, удовлетворяющие равенству au + bv = с. Отсюда имеем a 6 „ (а Ь\ , _ -и + -ν = 1, т. е. (-,-)= 1. U ее \с с/ 72
Определение 4. Наименьшим общим кратным (НОК) целых чисел αϊ,..., ап при η > 2 называется любое целое число А:, удовлетворяющее условиям: а) к есть общее кратное чисел αϊ,...,αη, т. е. αϊ | λ,...,αη \ к\ б) к делит любое общее кратное чисел αϊ,..., αη, т. е. V*i € Ζ(αι Ι &ι,...,αη | к\ => к \ кг). Множество всех НОК чисел αϊ,..., αη обозначим через НОК {αϊ,... ...,αη}. Утверждение 5. Если η > 2 и хотя бы одно из целых чисел αϊ,..., αη равно О, то для них существует единственное НОК, равное 0. Если целые числа αϊ,... ,αη отличны от 0 и для них суще- ствует хотя бы одно НОК, то они имеют ровно два НОК, которые отличаются только знаком. Доказательство аналогично доказательству утверждения 2. Проведите его в качестве упражнения. Из утверждения 5 видно, что если НОК чисел αϊ,..., αη существует, то их неотрицательное НОК определено однозначно. Будем обозначать его через [αϊ,..., αη]. Следующие два утверждения решают вопрос о существовании НОК любых целых чисел и дают метод нахождения НОК. Утверждение 6. Если хотя бы одно из целых чисел а, Ь отлично от 0, то для них НОК существуют и единственное неотрицательное НОК находится по формуле: D Обозначим (а, 6) = d и покажем, что число Qjr удовлетворяет условиям определения 4. Так как γ = α А = 6т, то α Ν*, 6 \γ. Пусть к € Ζ и α | Л, 6 | Л. Тогда, очевидно, d | *» g §» j д. Отсюда по утверждениям в) —г) теоремы 5 имеем ^т\к. Следовательно, γ € НОК {а, 6}. Тогда по утверждению 5 ^- € НОК {а, 6}. А так как J—Д > 0, то [а, 6] = L-J· .□ Теорема 6. Для любого η > 2 и любых целых чисел αϊ,..., αη существует единственное неотрицательное НОК, которое находится 73
по формуле: [αι,α2,...,αη] = [... [[αι,α2],α3],.. .,αη]. Доказательство теоремы 6 проведите самостоятельно по аналогии с доказательством теоремы 3. § 3. Простые числа. Основная теорема арифметики Определениеб. Натуральное число ρ Φ 1 называется простым, если оно не имеет натуральных делителей, отличных от 1 и р, в противном случае оно называется составным. Число 1 не относится ни к простым, ни к составным числам. Укажем некоторые свойства простых чисел. Утверждение?. Пусть ρ — любое простое число. Тогда а) Va € Ζ : (ρ \ а или (α,ρ) = 1); б) Va, Ь € Ζ : (ρ \ ab => (ρ \ а или р\Ь))\ в) если q — простое число, то q = ρ или (q,p) = 1. D а) Пусть ρ \ α. Тогда так как (α,ρ) = d € {Ι,ρ} и d \ α, то d = 1. б) Пусть ρ I ab. Если ρ { α, то по свойству а) (α, ρ) = 1, и тогда по теореме 5 б) ρ \ Ь. в) Если q — простое число и q Φ ρ, то по определению 5 ρ \ ς, а тогда по свойству а) (ς,ρ) = 1. D Заметим, что свойство б) можно обобщить на η > 2 сомножителей. Докажите это индукцией по п. Роль простых чисел в арифметике во многом определяется следующим утверждением, называемым основной теоремой арифметики. Теорем а7. Всякое натуральное число пф\ либо является простым, либо разлагается в произведение простых чисел, причем такое разложение единственно с точностью до перестановки сомножителей. Этой теореме, учитывая коммутативность кольца Ζ, можно придать следующую, более компактную, форму. Любое натуральное число η φ 1 одназначно представляется в виде: n=pi...ps, (10) 74
где s > Ι,ρι,... ,ps — простые числа и р\ < ... < ps. D Существование искомого разложения для числа η было доказано в § 3.1 в порядке иллюстрации метода полной математической индукции. Единственность разложения (10) докажем индукцией по параметру s(n), где s(n) — наименьшее значение s по всем разложениям вида (10) для числа п. При s(n) = 1 это очевидно. Допустим, что это верно для всех η при s(n) < s и любом фиксированном s > 1, и докажем для η при s(n) = 5. Пусть наряду с (10) существует представление n = q\...qt, (11) где <7i,...,<fc — простые числа и ςι < ... < qt. Так как р\ | п, то по обобщению свойства б) р\ \ q% при некотором г € 1,£, и тогда по свойству в) pi = дг. Отсюда и из неравенства q\ < qt получаем: q\ < рь В силу симметрии имеем также р\ < q\. Следовательно, р\ = q\. Теперь из (10), (11), учитывая отсутствие делителей нуля в Z, получаем два представления для числа п/р\: η/ρι = р2 .. .ps = Я2 ... qt* По предположению индукции эти разложения совпадают, а потому совпадают и разложения (10), (11). D Определеннее. Представление целого числа η в виде: n = ep?p?...pf\ где ε = ±1,ρχ,ρ2,... ,ps — простые числа, ρχ < рч < · · · < ps и ai,c*2,... ..., as € Ν, называется каноническим разложением числа п. Из теоремы 5 очевидным образом получается Следствие. Для любого целого числа η φ 0 существует каноническое разложение, и оно единственно. Каноническое разложение числа η дает хорошее представление о строении числа η и часто позволяет довольно легко решать многие вопросы, связанные с делимостью чисел. В качестве примера приведем известный из средней школы способ нахождения НОД и НОК целых чисел а, 6. С этой целью, добавляя, если надо, к их каноническим разложениям в качестве сомножителей нулевые степени простых чисел, мы всегда сможем записать числа а, Ь в виде: 75
где ει,ε2 £ {1, -1}, аг > О, Д > О, г Ε 1, s р\ < · · · < р9. Тогда нетрудно получить формулы: (а,Ь) = Пр»'»(«.А), [в,6] = JJp^(-A). ι=1 г=1 Докажите их в качестве упражнения. В связи с большой ролью, которую играют простые числа в арифметике и особенно в таком ее разделе, как теория делимости, множество простых чисел издавна привлекало к себе внимание математиков. Изучением свойств этого множества занимались такие выдающиеся математики, как Евклид, Ферма, Эйлер, Лежандр 3, П. Л. Чебышев и др. Многие вопросы из теории простых чисел очень легко формулируются, но чрезвычайно трудно решаются. Особенно много вопросов, связанных с простыми числами, относится к их распределению в натуральном ряду. Непосредственно из имеющихся таблиц усматривается, что простые числа распределены в натуральном ряду весьма неравномерно. Так, например, в первой сотне насчитывается 25 простых чисел, во второй — 21, в сорок девятой — 8, в пятидесятой — 15. Однако, несмотря на неравномерность распределения, наблюдается общая тенденция к постепенному уменьшению количества простых чисел на все более удаленных отрезках натурального ряда одинаковой длины. При удалении по натуральному ряду в сторону возрастания чисел начинают появляться все более длинные промежутки, не содержащие простых чисел. В связи с этим можно отметить следующий интересный факт. Каково бы ни было натуральное число п, можно найти η составных чисел, непосредственно следующих друг за другом, например (п + 1)! + 2, (п + 1)! + 3,..., (п + 1)! + (п + 1). В связи с этим естественно возникает вопрос: не является ли множество простых чисел конечным? Отрицательный ответ на этот вопрос дал еще Евклид. Приведем доказательство этого факта. Теорема8. Множество простых чисел бесконечно, D Предположим, что множество простых чисел конечно. Выписав все их в порядке возрастания, получим ряд чисел: 2,3,5,...,рг. (12) 3А. М. Лежандр — французский математик (1752—1833). 76
Рассмотрим число N = 2 · 3 ·... -рг +1. Так как каждое число из (12) делит число 2 · 3 · ... · рг, но не делит 1, то число N не делится ни на одно из чисел (12), т. е. ни на одно простое число. А так как оно больше единицы, то это противоречит теореме 7. D Обозначим через π(χ) число простых чисел, не превосходящих х. Тогда теорему 8 можно записать в следующем виде: если χ —» оо, то π(χ) —> оо. Заметим, что теорема Евклида была обобщена немецким математиком П. Г. Л. Дирихле (1805-1859), который доказал, что любая арифметическая прогрессия, первый член и разность которой взаимно просты, содержит бесконечное множество простых чисел. Ни теорема Евклида, ни теорема Дирихле ничего не говорят о порядке роста функции π(χ). Некоторое представление об этом дает следующая теорема, сформулированная впервые Эйлером: π(#) если χ —» оо, то ——- —> 0. χ Таким образом, хотя простых чисел "бесконечное много", однако встречаются они в натуральном ряду "бесконечно реже", чем натуральные. В 1737 г. Эйлер доказал, что ряд чисел, обратных простым числам, т. е. ряд 1/2 + 1/3 4- 1/5 + ... расходится. Из этой теоремы следует также, что простые числа расположены в натуральном ряду "гуще", чем числа, являющиеся квадратами, поскольку известно, что ряд 1/124- +1/22 + 1/32 + ... сходится. В 1808 г. Лежандр опубликовал эмпирически найденную формулу г \ х V; tax-1,08366· которая при больших значениях χ давала приближенные значения для π(χ). В 1848 г. П. Л. Чебышев доказал, что если предел отношения π(χ): χ/tax при χ —» оо существует, то он равен единице. Существование же этого предела было доказано в 1896 г. одновременно французским математиком Е. Адамаром (1865—1963) и бельгийским математиком Ш. Ла Балле Пуссеном (1866-1962). Таким образом, было доказано асимптотическое равенство π(χ) ~ х/1пх. В ходе развития теории чисел математиками выделялись и изучались отдельные классы простых чисел. Так, например, Ферма, рассмат- 77
ривая числа вида 22" -Ы, выдвинул гипотезу о том, что эти числа являются простыми при всех натуральных η (проверив ее лишь для η € 1,4). Однако позднее Эйлер показал, что число 22° +1 — составное. В настоящее время числа вида 22" + 1 называются числами Ферма. К настоящему времени известно много составных чисел Ферма и не найдено ни одного нового простого числа Ферма. Французский математик М. Мер- сенн (1588—1648) особо интересовался простыми числами вида 2П — 1, называя их совершенными. Теперь они называются простыми числами Мерсенна. Большое внимание математиков привлекла гипотеза Гольдбаха 4 — Эйлера о возможности представления любого четного числа η > 4 в виде суммы двух простых чисел, а любого нечетного η > 7 в виде суммы трех простых чисел. Для нечетных чисел, больших некоторой константы, эта проблема была положительно решена советским академиком И. М. Виноградовым (1891—1982). Для четных чисел она остается открытой. Приведенные здесь проблемы, как и многие другие проблемы теории чисел, носят, на первый взгляд, чисто познавательный характер. В действительности же результаты, полученные в ходе решения проблем теории чисел, не только отвечают на загадки натурального ряда чисел, но и находят применение в самых различных областях науки и техники. Так, например, числа Мерсенна и алгоритмы разложения натуральных чисел на простые множители находят приложения в теории кодирования и в теории линейных рекуррентных последовательностей, метод тригонометрических сумм, созданный И. М. Виноградовым для решения проблемы Гольдбаха — Эйлера, применяется при вычислении неэлементарных интегралов, при исследовании статистических свойств последовательностей и т. д. § 4. Числовые поля. Поле комплексных чисел Поле (кольцо), элементами которого являются числа, а операциями — арифметические операции сложения и умножения, называют чис- 4 X. Гольдбах (1690—1764) — немецкий математик. С 1725 г. жил в России, в 1725— 1740 гг. был секретарем Петербургской академии наук. 78
ловим полем (кольцом). Из приведенных выше примеров полей числовыми полями являются Q и R. Существует много и других числовых полей. Так, например, нетрудно убедиться в том, что полем является множество чисел {а 4- Ьу/р : а, Ь € Q} из R, где ρ — фиксированное простое число. Для читателей, знакомых с математикой лишь в объеме средней школы, поле R является самым широким числовым полем. Однако в математике и ее приложениях используются и не входящие в R числовые поля. Самым широким числовым полем (по определению) считают поле комплексных чисел. Это поле возникло в результате попыток построить поле, содержащее в качестве подполя поле действительных чисел R и лишенное известного недостатка поля R — неразрешимости в нем квадратных уравнений с отрицательными дискриминантами. Так как этот недостаток объясняется невозможностью извлекать в R квадратный корень из — 1, то мы будем строить поле комплексных чисел, исходя из двух основных требований: оно должно содержать подполе, изоморфное полю R, и корень уравнения х2 + 1 = 0. (13) В качестве исходного множества возьмем множество упорядоченных пар действительных чисел: С = {(а,6) :a,6€R}. Подчеркнем, что две пары (а, 6), (c,d) из С считаются равными в том и только том случае, когда а = с, Ь = d. Определим на множестве С операции сложения и умножения, положив для любых пар (а, 6), (c,d) € С: (а,6) + (c,d) = (а + с, 6 + d)f (14) (а, 6) · (с, d) = [ас - bd, ad + be). (15) Теорема 9. Множество С с операциями сложения и умножения, определяемыми равенствами (14) и (15), является полем. В нем содержится подполе, изоморфное R, и разрешимо уравнение (13). D Ассоциативность и коммутативность операции сложения в С следуют непосредственно из соответствующих свойств сложения в R. Нулевым элементом группоида (С; +) является пара (0,0), а противоположным к (а, 6) — пара (—а,—6). Следовательно, (С;-Ь) — абелева группа. 79
Ассоциативность и коммутативность умножения в С, а также дистрибутивность умножения относительно сложения, доказываются непосредственной проверкой (которая предоставляется читателю). Тем же путем легко показать, что единицей кольца (С; +; ·) является пара (1,0), а элементом, обратным к (а, Ь) Φ (0,0), пара (α/α2+62, -6/α2+62). Последняя находится из уравнения (а,Ь)(х,у) = (1,0). Таким образом, С — поле. Рассмотрим в С подмножество d = {(α,0) :a€R}. Нетрудно видеть, что множество С ι замкнуто относительно операций +, · в С, а именно: (α,0) + (6,0) = (α + 6,0)> (16) (α,0)·(6,0) = (α6,0). (17) Отсюда следует, что отображение σ : R —» Ci, определенное условием Va G R : σ(α) = (α,Ο), является изоморфизмом относительно операций -4-, ·. Следовательно, по теореме 6.Ш Ci есть поле, изоморфное полю R. Для завершения доказательства теоремы остается заметить еще, что уравнению (13) удовлетворяет пара (0,1). D Определение?. Построенное поле С называется полем комплексных чисел, а его элементы — комплексными числами. Из равенств (16), (17) видно, что операции над числами (α,Ο), (6,0), по существу, сводятся к соответствующим операциям над действительными числами а, 6. В связи с этим естественно отождествить комплексное число (а,0) с действительным числом а и тем самым включить множество R в С. Заметим, что такой способ включения R в С является частным видом более общей конструкции (см. гл. XII). Если теперь ввести обозначение (0,1) = г, то можно будет получить новое представление для любого комплексного числа: (а, 6) = (а, 0) + (0,6) = (а, 0) + (6,0)(0,1) = а + Ы. В такой форме чаще всего и используются комплексные числа на практике. При этом г называют мнимой единицей, а — действительной частью числа а + Ы, Ь — коэффициентом перед мнимой единицей, Ы — мнимой частью числа α -Ь 6г. Заметим, что название "мнимая единица" за числом г сохранилось лишь в силу исторических традиций, поскольку символ г использовался вначале для обозначения "несуществующего" квадратного корня из —1. 80
В новых обозначениях равенства (14), (15), определяющие операции сложения и умножения комплексных чисел, примут вид: (а + Ы) + (с + di) = (а + с) + (6 + d)i, (а 4- Ы){с 4- di) = (ас — 6d) 4- {ad 4- 6с)г. Запишем еще в новой форме разность двух комплексных чисел и частное от деления на комплексное число, отличное от 0: (а 4- W) - (с 4- di) = (а - с) + (6 - d)i, а 4- 5г ас 4- Μ —ad + bc. ч £+л = 7Т^ +7Ϊ7"·· (18) Определеннее. Комплексное число а — 6г называется сопряженным к числу ζ = а 4- Ьг и обозначается через г. Утверждениев. Длл любых комплексных чисел г, ζ\ имеют место равенства: 1) ζ = ζ, 2) г + 2ι = г + 2ι, 3) 22ι = 2 · 2ι· Если ζ Φ 0, то выполняется также равенство 4) "* = ζ"1. Равенства (1) — (4) доказываются непосредственной проверкой. Проделайте ее в качестве упражнения. Наряду с представлением комплексных чисел в виде а + Ы в математике и ее приложениях часто используется их представление в тригонометрической форме. Для определения такого представления введем сначала геометрическую интерпретацию комплексных чисел. Возьмем на плоскости декартову систему координат ΧΟΥ и изобразим комплексное число ζ = а + Ы точкой плоскости ΧΟΥ с координатами а, Ь (см. рисунок). 81
В итоге комплексному числу ζ будет сопоставлена точка Μ плоскости. Легко видеть, что это соответствие между комплексными числами и точками координатной плоскости ΧΟΥ биективно, поэтому иногда множество комплексных чисел отождествляют с множеством точек координатной плоскости. Определение!). Расстояние от точки О координатной плоскости ΧΟΥ до точки М, изображающей комплексное число 2, называют модулем числа ζ и обозначают в виде \ζ\. Наименьший угол, на который нужно повернуть ось ОХ против часовой стрелки до совпадения ее направления с направлением вектора ОМ, называется аргументом числа ζ φ 0 и обозначается в виде arg 2. Для ζ = 0 аргумент не определяется. Непосредственно из чертежа 1 видно, что модуль числа ζ = а + Ы находится по формуле: 1*1 = уД?Ть*, где V'о? 4- Ь2 есть арифметический корень из неотрицательного действительного числа а2 4- б2, а аргумент числа ζ = а + ЫΙ φ 0 находится из соотношений: cos (arg г) = :, sin (arg 2) = , 0 < arg 2 < 2π. Отсюда видно также, что комплексное число ζ = а + Ы представимо в виде ζ = |2|(cos(arg2) -Msin(arg2)). (19) Определение 10. Тригонометрической формой комплексного числа ζ называется любая его запись вида ζ = p(cos φ + г sin φ), (20) где ρ, φ € R и ρ > 0. Утверждение 9. Всякое комплексное число ζ представимо в тригонометрической форме. Если ζ ф 0 и (20) есть представление его в тригонометрической форме, то ρ = \ζ\, α φ = arg ζ + 2π&, Α: € Ζ. D Из (19) и очевидного равенства 0 = 0(cos0 4- isinO) видно, что тригонометрическая форма существует для любого ζ € С. Пусть теперь ζ Φ 0, и выполняется равенство (20). Разделив обе части равенства (20) на соответствующие части равенства (19) (по формуле (18)), получим: 1 = г-rCOs(v? — arg ζ) -Ьг—sin(v? — arg 2). 82
Отсюда имеем: r-r cos(v? - arg ζ) = 1, — sin(v? - arg 2) = О, и потому ρ = \ζ\, φ = arg ζ + 2π&, к € Ζ. D Тригонометрическая форма комплексного числа полезна тем, что в ней проще, чем в алгебраической форме, осуществляется умножение, деление, возведение в степень комплексных чисел и извлечение корней из комплексного числа. Τ е о ρ е м а 10. Для любых комплексных чисел z\ — pi(cos</?i 4- -Hsin</?i), 22 = P2(cos</?2 4- ι$\χιψ2) справедливы равенства- а) z\ 22 = PiP2(cos(^i + φ2) + zsin(v?i + φ2))\ б) 2™ = p™{cosrrupi + zsinmy>i), m € N. Если оке 22 7^ 0, mo выполняется также равенство: в) *i/*2 = Pi/P2(cos(v?i - <£>2) + zsin(v?i - v?2). D Равенства а) и в) проверяются непосредственно с использованием определения операций над комплексными числами. Проделайте это в качестве упражнения. Равенство б) есть следствие равенства a). D Равенство б) из теоремы 10 называют формулой Муавра в честь английского математика А. де Муавра (1667—1754). Наряду с этой формулой им же была выведена и формула извлечения корня n-й степени из комплексного числа ζ = p(cos<£> 4- zsin<£>), т. е. формула нахождения всех корней уравнения: хп = ζ (21) относительно неизвестного х. Как и для действительных чисел, множество всех корней n-й степени из комплексного числа ζ обозначают в виде yfz. Пусть а = r(cos0 4- гБтф) есть решение уравнения (21). При 2 = 0 уравнению (21) удовлетворяет лишь число 2 = 0. Поэтому далее будем считать 2^0. Подставив в (21) числа α и 2 в тригонометрической форме и воспользовавшись формулой Муавра, получим: rn(cos(n-0) 4 isin(n0)) = p(cos</? 4- г sin v?). Отсюда и из утверждения 9 имеем: гп = р, пф = φ + 2жк, 83
или ... φ + 2пк τ=ψρ,ψ = , η где к — некоторое целое число, rfp — арифметический корень из действительного неотрицательного числа р. Таким образом, корнями п-й степени из числа ζ могут быть лишь числа: _/ <ρ + 2πΑ; . . (p + 2nk\ . _ /ЛЛЧ оск = S/p cos + ism - , к е Ζ. (22) \ η η J Непосредственной проверкой, путем возведения в n-ю степень по формуле Муавра, легко убедиться в том, что число (22) при любом целом к является корнем n-й степени из числа 2. Выясним, сколько среди чисел вида (22) различных. По теореме 1 любое число к представляется в виде к = nq+r, где г € € {0,..., п—1}. Отсюда и из очевидного равенства аП9+г = аг получаем: \fi С {αο,αι,... ,αη_ι}. С другой стороны, из утверждения 9 следует, что числа αο,αι,.. .,αη-ι различны. Значит, *\β = {αο,αι,... ,αη_ι}. В итоге доказана ТеоремаП. Для любого π € N корень п-й степени из комплексного числа: ζ — p(cos φ 4- г sin φ) Φ О имеет ровно η различных значений и все они находятся по формуле (22) при /с=0,1,...,п- 1. Следствие. В поле комплексных чисел разрешимо любое квадратное уравнение αχ2 +βχ + η = 0, и его корни находятся по формуле: χ = — , где Δ е у/β2 - 4α7· 2α D Доказательство проводится по аналогии с выводом формулы для корней квадратного уравнения в R. Следует учесть, что здесь множество у/β2 — 4α7 всегда не пусто. D Рассмотрим несколько подробнее множество Гп всех корней n-й степени из 1. При небольших значениях п, пользуясь формулой (22) при ζ = 1 = cos 0 + г sin 0, получим: Γι = {1}, Γ2 = {1,-1}, 84
Г3 = {1, -1/2 + <л/з72- -1/2 - «д/зТг}, Γ4 = {1,-1,ζ\-ί}. В общем случае Γη = {εο»εΐι··· ,£η-ι}} где 2пк . . 2пк , /ЛЛЧ бк = cos И sin , А;€0,гс-1. (23) η η Утверждение 10. При любом натуральном η множество Гп всех корней п-й степени из 1 является группой относительно операции умножения комплексных чисел. D Множество Гп замкнуто относительно умножения, поскольку ens = 1, εϊ = 1 =► (eset)n = 1, Гп содержит 1 = ε0 и вместе с каждым элементом ей — обратный ему элемент £п-ь Ассоциативность операции умножения в Гп следует из ее ассоциативности в С. D Следствие. Для любого натурального числа η существует абелева группа из η элементов. Отметим одно замечательное свойство группы Гп. Из равенства (23) и формулы Муавра следует, что е* = е*, т. е. все элементы группы Гп являются степенями одного ее элемента ε\. В связи с этим говорят, что группа Гп порождается элементом εχ. Возникает вопрос, есть ли в Гп другие элементы, обладающие таким свойством? Прежде чем ответить на этот вопрос, докажем УтверждениеП. Для любого η € N выполняется равенство r„ = (Jrd, d\n где объединение множеств Yd берется по всем делителям d Ε N числа п. D Обозначим (J Г<* = Кп. Включение Гп С Кп следует из делимости d\n η I п. Обратное включение доказывает импликация: ed = 1 =* εη = 1, которая, очевидно, истинна для любого делителя d числа п. D 85
Таким образом, среди всех корней n-й степени из 1 содержатся корни из 1 всех меньших степеней, являющихся делителями числа п. Например, имеем: Γχ С Гг С Г4. В связи с этим естественно выделить из Гп корни собственно n-й степени из 1. ОпределениеИ. Корень n-й степени из 1 называется примитивным, или первообразным, если он не является корнем m-й степени из 1 при т <п. Следующая теорема отвечает на поставленный выше вопрос и дает описание всех примитивных корней n-й степени из 1. Теорема12. Следующие утверждения эквивалентны при любых η € N и к € 0,...,гс- 1: а) ε к порождает группу Г, га. е. Г = {ε°,ε£,... ,ε^""1}; б) ε к — примитивный корень п-ой степени из 1; в) число к взаимно просто с п. D Для доказательства достаточно установить истинность импликаций а) => б) =» в) =» а). а) =>б). Если ε к — не примитивный корень, то ε™ = 1 при некотором т < η и т > 0. Следовательно, ε к € Гт, а потому ε£ € Гт при любом I € Ζ. Следовательно, ε к не порождает Гп, и импликация а) => => б) истинна. б) =$> в). Если (η,Α;) = d > 1, то e? = (ei)*=(*?)*-l*=l. и корень ε^ — не примитивный, что противоречит условию. в) => а). Если (к,п) = 1, то по следствию из теоремы 2 найдутся числа £/, V € Ζ, такие, что &ί/ 4- пУ = 1, и потому (kU + nV)s = s при любом s € Ζ. Следовательно, для любого s € 0, η — 1 имеем: ε8-ει-ει ~ \ει ) ~ \ει) ~ек - Таким образом, любой корень ε8 n-й степени из 1 является степенью корня ε к, т. е. ε к порождает группу Гп. D В заключение укажем на связь корней n-й степени из любого числа ζ с корнями п-й степени из 1. Сравнивая формулы (22) и (23), получаем &к = θίρ · ε&, к € 0, η - 1 . Отсюда следует Утверждение 12. Все корни п-й степени из комплексного числа ζ получаются путем умножения одного из них на все корни п-й степени из 1. 86
Задачи 1. Доказать, что при любом целом к > 1 и любом η € N число а € 0, кп — 1 можно однозначно представить в виде а = ао + а\к + а,2к Ч \- ап-\кп~1, где аг € О, А; — 1. (Такое представление числа α называют /с-ичным.) 2. Доказать, что при любом целом к > 1 и любом η £ N каждое число a € 0, (п + 1)! — 1 можно однозначно представить в виде a = ао · 1! + αϊ · 2! + ... + αη · η!, где аг € 0, г. (Такое представление числа называют факториальным.) 3. Пусть а, 6, га € Ζ и га φ 0. Если числа а, 6 дают при делении на т одинаковые остатки, то (а, га) = (6, га). 4. Доказать равенство (для любых целых чисел аг,6г): (αϊ,..., αη, &ι,..., Ьп) = ((αϊ, &ι),..., (αη, 6η)). 5. Если αι,...,αη,& € Ζ,η > 2 и (αϊ,... ,αη,&) = d, то существуют такие с2,..., сп € Ζ, что (αϊ + c2a2 + ... + cnan, 6) = d. 6. Пусть п > 2,αϊ,...,αη — попарно взаимно простые натуральные числа и Ьг = ala2^--ant Доказать, что (&ь... ,&п) = 1. 7. По каноническому разложению натурального числа найти число и сумму его положительных делителей. 8. В скольких вариантах можно восстановить пару натуральных чисел а, Ь по их НОД и НОК? 9. Пусть η > 2,αι,...,αη € Z\{0},d € N. Следующие утверждения эквивалентны: а) (ab...,an) = d\ б) для чисел αϊ,..., αη число d является общим делителем вида U\a\ + ... + ί/ηαη, где ί/ι,..., ί/η € Ζ; в) d — наименьшее натуральное число вида U\a\ +... 4- Unan, U\,... ...,tf„€Z; г) d — максимальный общий делитель чисел аь... ,ап. 10. Пусть expg(n) — показатель степени простого числа q в каноническом разложении числа п, и [х] — целая часть числа χ € R. Доказать, что 87
[log,, n) a)exp,(n!)= £ [j], 1=1 6) βχρς (CJi) = η - exp9 m. 11. Для любых чисел α € Ζ, τη,η € N справедливо равенство: (aw-l,an-l) = a(m'n)-l. (Указание: предварительно доказать равенство (kq + r,k) = (г,/с) для любых k,q,r € Ζ.) 12. Пусть αι,...,αη € N,(ab... ,αη) = d,M = {αχί/χ + ... + αηί/η : t/i C/n€N0}. Существует такое q € Ν, что все числа из Ν, кратные d и большие или равные qd, принадлежат М. 13. По аналогии с НОД чисел αι,...,αη определите НОД для бесконечного множества Μ целых чисел и докажите, что он совпадает с НОД некоторого конечного подмножества чисел из М. 14. Сформулируйте и докажите аналог теоремы о делении с остатком в кольце целых гауссовых чисел (см. задачу 11, III), определив предварительно в нем понятие о делении с остатком (по аналогии с Ζ). 15. Докажите, что отображение т: С => С, определенное равенством τ(ζ) = ζ, является изоморфизмом поля С на себя. 16. Для корня Sk n-й степени из 1 (см. (23)) найти наименьшее натуральное т, при котором Sk € Гт.
Глава V КОЛЬЦА И ПОЛЯ ВЫЧЕТОВ В данной главе будут построены бесконечные серии конечных колец и конечных полей, играющих важную роль в математике и ее приложениях. § 1. Сравнения целых чисел по модулю Зафиксируем натуральное число га, которое условимся называть модулем. Определение1. Два целых числа а, Ь называются сравнимыми по модулю га, если они при делении на га дают одинаковые остатки. Утверждение: "а сравнимо с 6 по модулю га" кратко записывается в виде соотношения а = fr(modra), называемого сравнением. Теорема1 (критерий сравнимости). Для любых целых чисел а, Ь: а = 6(mod га) <=> га | а — 6. D Разделим числа а, 6 с остатком на га: а = mq\ +r\, Ь = mqi 4- Г2, 0 < г, < га,г € 172. Если а = 6(modга), то г\ = Г2 и разность а — Ь = m{q\ — φ) делится нага. Обратно, если га | а—6, то из равенства а—6 = m{q\ — <72) + (ri — ^г) следует, что га | π — Г2. А так как \г\ — гг| < га, то по утверждению 1 6).IV |п - Г2| = 0, т. е. η = Г2, или а = fc(modra). D Теорема 2. а) Отношение сравнимости целых чисел по модулю га является отношением эквивалентности на га. б) Для любых а, 6, с, d € Ζ а = 6(modга), с = d(modга)=Фа*с = 6*d(modга), 89
где * — любая из операций +, —, · (га. е. сравнения можно почленно складывать, вычитать и перемножать). в) Если d — общий делитель чисел а, 6, т из Z, то а = fr(modm) о a/d = 6/d( mod m/d), (га. е. обе части сравнения и модуль можно делить и умножать на одно и то же число). г) Если d — общий делитель чисел а,Ь и (d,m) = 1, то а = fr(modm) Ф> a/d = 6/d(modm), (т. е. обе части сравнения моэ/сно умножать и делить на число, взаимно простое с модулем). О а) Непосредственно из определения 1 видно, что отношение сравнимости по модулю т рефлексивно, симметрично и транзитивно, т. е. является отношением эквивалентности. б) Из условия, согласно критерию сравнимости чисел, имеем: а — Ь = = ragi, с — d = 77wj2, т. е. а = 6 4- mqi, с = d + mq2, где </ь</2 € Ъ. Складывая, вычитая и перемножая последние равенства, получим: a+c=6+d+ m(qi + φ), a-c = b-d + m(qi - φ), ас = bd 4- m{q\d 4- 6ф 4- rnqiq2). Отсюда видно, что разность (a * с) — (6 * d) делится на m при любой операции * € {4-, —,·}. Следовательно, a * с = 6 *d(modm). в) Так как d — общий делитель чисел а, 6, т то существуют целые числа ai,&i,mi, такие, что: a = aid,6 = b\d,m = mid. Отсюда и из определения делимости чисел, учитывая отсутствие делителей нуля в Z, получим: т | a — 6 Φ» mid | (αϊ — &i)d &m\\a\ — b\. Теперь свойство в) следует непосредственно из теоремы 1. г) Как и в случае в), имеем: m | a — 6 Ф» m | (ai — 6i)d. 90
Так как числа m,d взаимно просты, то по теореме 5 б).IV: т | (αχ — b\)d =Ф т \ а\ — Ь\. Обратная импликация следует из утверждения 7 в).III. Теперь осталось применить теорему 1. D Следствие 1. Для любых целых чисел а, 6, с и натурального к справедлива импликация: а = fr(modra) =ф а*с = 6*c(modra),afc = 6fc(modm), где * — любая из операций +, —, · . Приведенными свойствами сравнений можно воспользоваться для нахождения остатков от деления чисел на заданное число га. Следствие 2. Для любых целых чисел а,Ь и любой операции * € {+,—,·} верно равенство: rm(a *b) = rm{rm{a) * гт{Ь)). (1) D Так как а = rm(a)(mod m), Ь = rm(6)(mod m), то по теореме 2 б) a*b = rm(a) *rm(6)(modm). Отсюда по определению 1 имеем (1). D Π ρ и м е ρ 1. Найти остаток от деления числа а = 128148 - 148129 на число 13. По следствию 2 пз(а) = Г1з(г1з(128148) - Пз(148129)). Поэтому найдем сначала остатки Г1з(128148), Г1з(148129). Заметим, что 128 = = —2(mod 13). Отсюда последовательно находим: 1282 = (-2)2(mod 13), т. е. 1282 = 4(mod 13), 1284 = 42(mod 13), т. е. 1284 = 3(mod 13), 1286 = 4 · 3(mod 13), т. е. 1286 = -l(mod 13), 12812 = (-l)2(mod 13), т. е. 12812 = l(mod 13). Так как 148 = 12-12 + 4, то 128148 = (12812)12 · 1284 = 3(mod 13), и потому Г1з(128148) = 3. Аналогично найдем, что Г1з(148129) = 5. В итоге имеем искомый остаток: ri3(a)=r13(3-5) = r13(-2) = ll. 91
§ 2. Классы вычетов и операции над ними По теореме 2 а) отношение сравнимости по модулю т является отношением эквивалентности на Z, и потому множество Ζ разбивается на непересекающиеся классы чисел, сравнимых по модулю т, т. е. дающих одинаковые остатки при делении на т (см. теорему 1.П). Определение 2. Класс всех целых чисел, сравнимых с числом а по модулю т, называют классом вычетов по модулю т и обозначают через [а]т. Множество всех классов вычетов по модулю m обозначим через Z/m. Из определения 2 имеем: [а)ш = {xeZ: rm{x) = гт{а)}, Nm = Щт <=> α = 6(mod m). Так как различные остатки от деления целых чисел на т исчерпываются числами 0,1,..., m — 1, то число классов вычетов по модулю m равно т, и ZM={[0|m,[l]m [m-l|mK Определим на множестве Z/m операции сложения (+) и умножения Определение 3. Для любых [a]m, [6]m € Z/m положим: [а)т + [Ь]т = [а + 6]т, [а]т · [6]т = [аЬ]т. Таким образом, чтобы сложить (перемножить) классы [а]т, [6]т, нужно выбрать из них по одному представителю, сложить(перемножить) их как числа и взять класс, содержащий полученное число. В определении 3 в качестве таких представителей выбраны числа α и 6. Однако в классах [а]т, [6]т содержится много других чисел, и мы заранее не уверены в том, что результат сложения (умножения) классов не зависит от выбора представителей. Если бы результат зависел от выбора представителей, то, складывая одни и те же классы, мы могли бы получать разные результаты. Это бы означало, что операции определены не корректно. Докажем, что определение 3 корректно. 92
Действительно, пусть, αχ € [a]m,&i G [6]m. Тогда αχ ξ a(modm), fci = b(mod) m и по теореме 2 имеем: αχ+Ьх = a-t-6(modm),ai&i = afr(modra), т. e. [αχ + bx)m = [a + 6]m, [ai&i]m = [afc]m. Следовательно, результаты операций над классами не зависят от выбора представителей, т. е. операции определены корректно. ТеоремаЗ. Множество Z/ra всех классов вычетов по модулю т с определенными выше операциями сложения и умножения является коммутативным кольцом с единицей. (Оно называется кольцом вычетов по модулю га.) D Так как операции сложения и умножения над классами сводятся к соответствующим операциям над целыми числами, то обе они ассоциативны и коммутативны, кроме того, операция умножения дистрибутивна относительно сложения. Очевидно, что классы [0]т и [1] т ЯВЛЯЮТСЯ В Z/ra нейтральными элементами относительно операций соответственно +, ·, и для любого [а]т класс [—а] т является противоположным элементом, т. е. -[а]т = [-a]w. D Следующее утверждение описывает в кольце Z/ra обратимые элементы и делители нуля. Τ е о ρ е м а 4. В кольце Z/ra каждый элемент [а]т Φ [0]m или обратим, или делитель нуля, причем: а) [а]т — обратим <& (а, га) = 1, б) [о]т — делитель нуля <=> (а, га) Φ 1. D а) Пусть (а, га) = 1. Тогда по следствию из теоремы 4.1 V существуют такие U, V G Ζ, что aU+mV = 1. Следовательно, [aU+mV]m = [l]m, и согласно определению 3: [а)т · [U]m + Нт · [V)m = [l]m· Отсюда и из равенства [т)т = [0]т имеем: [а]т · [U]m = [l]m. Следовательно, элемент ат обратим, и [a]^1 = [U]m. б) Пусть (а,га) = d > 1. Тогда а = άαχ, где ai G Ζ, и Так как [а]т φ [0]т по условию, \Щ\ Φ [0]т в силу неравенства d > 1, то [а]т — делитель нуля. D 93
Из теорем 3 — 4 получаем Следствие!. Порядок мультипликативной группы (Ζ/τη)* кольца Ζ/τη равен числу натуральных чисел, не превосходящих τη и взаимно простых с т. С л е д с τ в и е 2. Кольцо Ζ/τη является полем тогда и только тогда, когда т — простое число. (В последнем случае оно называется полем вычетов по модулю га.) Рассмотрим вопрос о вычислении порядка группы (Ζ/τη)*. Определение 4. Отображение φ: Ν —> Ν, сопоставляющее каждому числу т € N число φ(τή), равное количеству натуральных чисел а < τη и взаимно простых с га, называется функцией Эйлера. Π ρ и м е ρ 2. φ(1) = 1,<р(2) = 1,</>(10) = 4,<р(р) = р- 1 для любого простого р. Из определения 4 и следствия 1 теоремы 4 имеем: \{Ζ/τηγ\ = ψ{τη). Приведем формулу для вычисления φ(τη). Теорема 5. Если натуральное число т имеет каноническое разложение т = р11р22 · · ·ρ£% mo Pi Р2 Ps О Найдем сначала φ(ρ^1)- Так как рг — простое число, то (a,pf4) Φ Ι в том и только том случае, когда рг \ а. Следовательно, написав ряд чисел от 1 до pf * и удалив из него все числа, кратные рг, получим: <Р{Рг)=Рг ~Рг = Рг [1 ~ ~) · Теперь для доказательства теоремы достаточно воспользоваться свойством мультипликативности функции Эйлера: Vrabra2 € N : ((mi,ra2) = 1 => φ(τη\,τη2) = φ(τη\)ψ(τη2)), которое мы пока примем без доказательства (оно будет получено попутно при изучении групп в § 4.ΧΙ). D Докажем одно из замечательных свойств функции Эйлера. 94
Теорема 6. Если натуральные числа а, т взаимно просты, то a*<m> = l(modm). (3) D Выпишем по одному представителю из всех классов группы (Z/ra)* ai,a2, ...,ap(m). Умножив все эти числа на а, получим ряд чисел: αχα,α2α,... ,а^т)а. (4) По теореме 5 а).IV все числа из (4) взаимно просты с га. Кроме того все они попарно несравнимы по модулю га поскольку в силу теоремы 2 г) ага = a3a(modm) => аг = a^ (mod га). Отсюда, учитывая, что |(Z/ra)*| = φ{τη), получаем: (4) есть система представителей, взятых по одному из каждого класса множества /га)*. Следовательно, имеет место система сравнений: а\а = an(modra), а,2а = al2(modra), <V(m)a = \(m)(modm), где ii,22, ...,г^(т) "~ некоторая перестановка чисел 1,2,... , <р(га). Перемножив почленно эти сравнения и разделив обе части полученного сравнения на число αϊ · аг · ... · а^(т)» которое взаимно просто с га, получим (3). D Следствие. Если ρ — простое число и а € Ζ, то а) аР~1 = l(modp) при {α,ρ) = 1, б) а? = a(modp) при любом а. D Для доказательства утверждения а) достаточно заметить, что φ{ρ) = ρ - 1. Утверждение б) при (α,ρ) = 1 следует из а) и следствия 1 теоремы 2, а при (α,ρ) Φ 1 очевидно, поскольку в этом случае a = 0(modp). D Заметим, что утверждение а) следствия впервые доказал Ферма, оно называется малой теоремой Ферма. Теорема 6 была позднее доказана Эйлером и носит название теоремы Эйлера — Ферма. Она находит широкое применение в математике и ее приложениях и, в частности, может оказаться полезной при нахождении остатков от деления степеней числа на заданное число, при решении сравнений с неизвестными и т. д. 95
Так, в примере 1 для нахождения остатка от деления 128148 на 13 мы нашли предварительно сравнение 12812 = l(mod 13). С учетом теоремы Эйлера — Ферма для его нахождения достаточно заметить, что <р(13) = = 12. Подчеркнем еще, что при любом простом ρ поле Ζ/ρ — не числовое, поскольку оно не является подполем поля комплексных чисел. Больше того, оно обладает рядом специфических свойств, не имеющих места в числовых полях. Приведем примеры таких свойств. Утверждение1. Для любого элемента а поля Ζ/ρ выполняются равенства: а) ра = α + ... -f q = 0, где θ — нуль поля Ζ/ρ; ρ б) αρ = α. D Равенство а) очевидно, равенство б) следует из утверждения б) предыдущего следствия. D Замечание1. На практике в целях упрощения записей часто вместо кольца (поля) вычетов Z/ra используют изоморфное ему кольцо (поле) Zm, элементами которого являются наименьшие неотрицательные представители 0,1,...,т — 1 классов. При этом под операциями сложения и умножения понимают обычные арифметические операции над числами с последующей заменой результата остатком от его деления на га. Кольцо Zm также называют кольцом вычетов по модулю га. § 3. Решение сравнений Рассмотрим вопрос о решении в кольце Z/ra простейшего уравнения: [а)т · [х]т = [Ь]т- Из (2) и определения 3 следует, что задача описания всех решений этого уравнения в кольце Z/ra эквивалентна задаче описания всех решений сравнения: ах = ra(mod га) (5) в целых числах относительно неизвестного х. 96
Рассмотрим более общее сравнение по модулю га с неизвестным х: аохп 4- а\хп~1 + ... 4- ап-\х + ап = O(modm). (6) Определение 5. Решением сравнения (6) называется любое целое число хо, при подстановке которого вместо χ сравнение (6) становится верным числовым сравнением. Определение 6. Два сравнения (по одному или по разным модулям) называются равносильными, если множества их решений совпадают. Прежде чем решать сравнение (5), сделаем два общих замечания, следующих непосредственно из теоремы 2. Замечание 2. Если в сравнении (6) любой из коэффициентов аг заменить сравнимым с ним по модулю числом, то получится сравнение, равносильное исходному. Следовательно, сравнение (6) всегда можно привести к сравнению с коэффициентами из множества 0,ш — 1. ЗамечаниеЗ. Если целое число хо является решением сравнения (6), то его решениями являются все числа класса [хо]ш- Все эти решения называют одинаковыми по модулю га. Решения же, не сравнимые по модулю т, называют различными по модулю т. Следовательно, для нахождения всех решений сравнения достаточно найти по одному представителю из каждого класса чисел по модулю га, удовлетворяющих данному сравнению. Число этих представителей называют числом решений по модулю га. Вернемся к вопросу о решении сравнения (5). Исчерпывающий ответ на него дают две нижеследующие теоремы. Теорема 7. Если (а, га) = 1, то сравнение (5) имеет единственное решение по модулю га. О Так как (а, га) = 1, то существуют такие Е/, V € Ζ, что mU + aV = l. (7) Отсюда следует, что аУ = 1 (mod га), и потому a(Vb) = fr(modra). Значит, число Vb удовлетворяет сравнению (5), и сравнение (5) разрешимо. Допустим, что х\, #2 — Два решения сравнения (5). Тогда имеем αχχ = ax2(modra), и в силу теоремы 2 г) х\ = ^(modra). 97
Следовательно, сравнение (5) имеет единственное по модулю т решение Vb: х = V4>(modm). D (8) Теорема 8. Если (а, га) = d, то сравнение (5) разрешимо в том и только том случае, когда d \ b. При выполнении последнего условия сравнение (5) имеет равно d решений по модулю т. D Если сравнению удовлетворяет некоторое число хо> то по теореме 4 т | а — 6, и потому d \ а — 6. Отсюда и из условия d \ а следует, что d \ Ь. Пусть теперь выполнено условие d | 6. Тогда по теореме 2 сравнение (5) равносильно сравнению: a/d · χ = 6/d(mod m/d). (9) Так как (a/d^m/d) = 1, то по теореме 7 сравнение (9) имеет единственное по модулю m/d решение хо· Остается выяснить, сколько различных по модулю т чисел содержится в классе чисел [xo]mi> где т\ = = m/d. По определению классов вычетов: [xo)rm ={x + rniq : q € Ζ}. Покажем, что числа: хсь^о + rai,x0 + 2т1,...,жо + (d- l)mi (10) попарно не сравнимы по модулю m и любое другое число из [хо]т1 сравнимо с одним из чисел ряда (10). Действительно, если хо + гт\ = = хо + jmi(modm), где 0 < г < j < d - 1, то т \ (j - i)mi, что невозможно, поскольку 0 < (j - i)mi < dm\ = m. Пусть теперь хо + m\q — любое число из класса [xo]mi· Разделив q на d с остатком, получим: q = dq\+r, 0<r<d-l, хо + m\q = хо + m\dq\ + rm\ = хо 4- rm\ + q\m = io + rmi(modm). Таким образом, сравнение (5) в рассматриваемом случае имеет ровно d решений по модулю т: Xk = х0 + /:mi(modm), к = 0,1,.. .,d- l. D 98
Из доказательства теоремы 8 видно, что нахождение решений сравнения (5) сводится к случаю, когда (а, га) = 1. В этом случае решение сравнения (5) при небольших га можно найти перебором и непосредственной проверкой представителей из классов кольца (например, чисел 0,1,... ,га — 1). В общем случае можно воспользоваться методом, указанным при доказательстве теоремы 7. С этой целью необходимо найти сначала целые числа [/, У, удовлетворяющие равенству (7), после чего решение находится по формуле (8). При этом для нахождения числа V можно воспользоваться алгоритмом, указанным в § 2.IV. Напомним, что для этого нужно найти последовательность неполных частных 4ь 42» · · · > 4п в алгоритме Евклида, примененном к числам га, а, а затем, положив Vo = 1, V\ = —41» найти по рекуррентной формуле Vk = Vfc_2 — Vfc_i4fc последовательность чисел Vo,..., Vn. Последнее число Vn равно искомому V. Π ρ и м е ρ 2. Решить сравнение: 2775x = 825(mod264). (11) Заменив коэффициенты этого сравнения остатками от деления их на модуль 624, получим сравнение: 279x = 201(mod264), (12) равносильное сравнению (11). Применяя к числам 624, 278 алгоритм Евклида, получим их НОД 3 и систему неполных частных: 41 =2, 42 = 4, 4з = 4, q4 = 2. Так как 201 делится на 3, то сравнение (12) разрешимо, имеет ровно 3 решения по модулю 624 и эквивалентно сравнению: 93x = 67(mod208). (13) Для решения этого сравнения нам нужна последовательность частных в алгоритме Евклида для чисел 208, 93. Однако легко видеть, что она будет той же, что и для чисел 624, 279. Для нахождения чисел V\,..., V4 = = V удобно воспользоваться таблицей 4.IV. ГкГ Як \ Ук 0 1 1 2 -2 2 4 9 3 4 -38 4Ί 2 85 99
Теперь по формуле (8) находим решение сравнения (13) по модулю 208: x==79(mod208). Отсюда, пользуясь теоремой 8, найдем все три решения сравнения (11) по модулю 624: хх = 79, х2 = 79 + 208 = 287, х3 = 79 + 208 · 2 = 495. Рассмотрим еще вопрос о решении простейшей системы сравнений. ТеоремаЭ (китайская теорема об остатках). Если натуральные числа mi, Ш2,..., га^ попарно взаимно просты, то система сравнений: х = αχ (mod mi), х = а2(тоатг), ..., xsa^modmjt) (14) имеет единственное решение по модулю га = πΐ\πΐ2 ... гпк Щи любых ai,a2,...,ajb € Ζ. D Докажем теорему индукцией по к. При к = 1 ее утверждение верно согласно теореме 7. Пусть к > 1. По предположению индукции система, составленная из первых к — 1 сравнений системы (14), имеет единственное решение по модулю га' = т\т2 ... wifc-i : χ = a(mod га'). Так как класс [a]m совпадает с множеством всех чисел вида: х = а + га'у, (15) где у — любое целое число, то для нахождения всех решений системы (14) остается найти те значения у, при которых числа вида (15) удовлетворяют последнему сравнению системы (14). С этой целью заменим в нем χ на а 4- га'у и решим полученное сравнение: т'у = ufc — a(mod ra^) относительно у. Так как (τη',τη^) = 1, то по теореме 7 оно имеет единственное решение по модулю га^. Пусть это будет класс [Ь]тк1 т. е. множество чисел {6 + rrikt : t € Ζ}. Отсюда и из (15) имеем: множество решений системы (14) совпадает с множеством чисел вида a + bm' + mt, т. е. с классом [а 4- Ьт!)т. D Заметим, что из доказательства теоремы 9 виден и алгоритм решения системы (14): 1) из первого сравнения находим χ = αϊ 4- raiy; 100
2) подставив во второе сравнение а\ + т\у вместо χ и решив полученное сравнение относительно у, получим, у = Ь\ + гпг^ и потому х = αχ 4- т\Ь\ + mim2t\ 3) подставляем найденные значения χ в третье сравнение системы и находим ί, и т. д. Задачи 1. Пусть рьрг — отношения сравнимости целых чисел по модулям т\,т,2 соответственно. Выяснить, являются ли отношениями сравнимости по подходящим модулям отношения р\ Πρ2,ρι Up2»Pi * Ρ2· В каком случае имеет место включение р\ С рг? 2. Показать, что все натуральные числа любого класса вычетов [а]т образуют бесконечную арифметическую прогрессию. Найти ее первый член и разность. Сколько чисел, попарно не сравнимых по модулю mi, содержится в [а]т для любого т\ € Z? 3. Элемент а любого кольца R называется нилъпотентным, если существует такое η € Ν, что ап = 0. Описать все нильпотентные элементы кольца Z/m и выписать формулу для нахождения числа таких элементов. При каком условии все необратимые элементы кольцам Z/m являются нильпотентными? 4. Найти условия, при которых все элементы группы (Z/m; +) являются кратными одного ее элемента [а]т. Сколько таких элементов существует в группе (Z/m; +)? 5. Найти наименьшее натуральное число к, удовлетворяющее равенству к[а]т = [0]т, а также число классов [а]т € Z/m, удовлетворяющих указанному равенству при данном значении к. 6. Выписать группы обратимых элементов колец Z/16 и Z/24. Существуют ли в них элементы, степенями которых являются все элементы соответствующих групп? Изоморфны ли эти группы? 7. Выписать все подкольца кольца Z/18. Какие из них изоморфны кольцам вычетов по другим модулям? 8. В кольце Z/975 найти элементы, обратные к элементам [13]975» [223]975· 9. Доказать, что любое простое число делит число (р — 1)! 4-1. (Это утверждение называют в теории чисел теоремой Вильсона в честь английского математика Д. Вильсона (1741-1793).) 101
Глава VI КОЛЬЦА МАТРИЦ § 1. Матрицы над кольцом и операции над ними Зафиксируем произвольное кольцо R. 0пределение1. Матрицей размеров га χ η (или га χ η-матрицей) над кольцом R называют прямоугольную таблицу элементов кольца Д, состоящую из га строк и η столбцов. Условимся обозначать матрицы большими латинскими буквами, а их элементы — малыми латинскими буквами с двумя индексами; первый индекс всегда будет номером строки, а второй — номером столбца, в котором расположен рассматриваемый элемент. Например, матрица А размеров га χ η с элементами агз подробно запишется в виде: А = Иногда, ради краткости, эту матрицу будем обозначать (агз)тхп. Две матрицы считаются равными, если они имеют одинаковые размеры и одинаковые элементы на соответствующих местах. Множество всех матриц размеров га χ η над кольцом R будем обозначать через Rm%n. Если строку и столбец с номером г матрицы А обозначить соответ- 2 л1 ац 0,21 а>т\ а\2 . а22 . ат2 · .. аХп \ . . CL2n 0>тп J ственно через AtiA*, то можно записать: \Ат) , А — (Α1Α2"Άη). Укажем некоторые названия и обозначения для отдельных частных видов матриц. 102
Матрицы размеров η χ η называют квадратными матрицами порядка п. Матрицы размеров 1 χ η и η χ 1 называют соответственно вектор-строками и вектор-столбцами. Квадратные матрицы: / an О а\2 а\2 \ О О ciin \ din Clnn J ап α2ΐ О 0.22 \ (1) 0„ι Оп2 называют соответственно верхне- и нижнетреугольными; матрицы / αϊ О О а2 О О \ О О О / / αϊ О О О О а2 О О \ О О О о О \ О / называют диагональными и обозначают в виде diag(ai,аг,... ,at)mXn, где t = min{ra,n}. К диагональным матрицам относятся, в частности, нулевая матрица 0тХп (все элементы которой равны нулю) и скалярная матрица diag(a, a,... ,a)nxn. Если R — кольцо с единицей е, то в Rn%n среди скалярных матриц содержится матрица diag(e, е,..., е)пхп. Она называется единичной и обозначается через ЕпХп. Матрицу из Дт,п» в которой элемент на месте (i,j) равен г, а остальные элементы — нули, обозначим через Е^^п(г) и, в частности, через Ε^χη при г — е. Индексы га, η у матриц -Бпхп»Отхп,-Б^хп зачастую опускаются. Введем операции над матрицами. Определение 2. Суммой матриц А = (а^)тХп и В = (6г^)тХп называется матрица С = (с^)тхп, в которой Схд = а^ 4- Ь%3 для любых г € 1, m, j € 1, п. Обозначение: А + В = С. Подчеркнем, что сложение определено лишь для матриц одних и тех же размеров над кольцом R. Утверждение!. Для любого кольца R множество матриц Дт,п с определенной выше операцией сложения является абелевой группой. D Свойства ассоциативности и коммутативности сложения матриц следуют из соответствующих свойств сложения в Д. Нейтральным эле- 103
ментом является нулевая матрица Отхп, а противоположной для матрицы А = {аго)тхп — матрица -А = {-al0)mxn. D Определение 3. Транспонированием матрицы А = (агз)тХп называется преобразование матрицы А в матрицу АТ = (a^)mxn, в которой а^ = азг, для любых г € 1,га, j € Ι,η. При этом матрица Ат называется транспонированной к А. Геометрически, транспонирование матрицы — это преобразование симметрии относительно главной диагонали (т. е. прямой линии, проходящей через элементы ац, α22ι · · ·)· Определение 4. Произведением матрицы А = (агз)тхп на элемент г € R называется матрица В = {Ьгэ)тхп, в которой Ь1Э = а%3г для всех г € 1, га, j € 1, п. Матрицу Б обозначают через А «г и называют также результатом умножения А на г справа. Аналогично определяется умножение матриц из Дт,п на элемент г £ R слева, результат обозначается через г · А. Если кольцо R — коммутативное, то Аг = г А. Заметим, что умножение матриц из R слева или справа на фиксированный элемент г € R является унарной операцией на множестве Ят,п. Из определений 2 — 4 и свойств операций в кольце R легко следует Утверждение2. Для любых элементов г\,г2 кольца R и матриц А, В Ε Дт,п выполняются равенства: (г\Г2)А = г\(г2А), (пА)г2 = η (Агг), A(nr2) = (Ari)r2, Ο·γι=γι·Ο = 0·Α = Α·0 = Ο, (η ■+■ гг)А = η А + г2А, А(п 4- гг) = Аг\ + Агг, п(А + В) = пА + пВ, (А + В)п = An + Вги (А + Я)Т = АТ + Ят, (п А)т = η Ат. Проверьте эти равенства в качестве упражнения. Пользуясь операциями сложения матриц и умножения матриц на элементы кольца R (слева и справа), из заданных матриц Αι,..., А* € € Rm,n можно получать матрицы вида: Π Αι + r2A2 + ... + rfcAfc, Ain + A2r2 + ... + Akrk, гг Ε R. Такие матрицы называют линейными комбинациями матриц А\,... ..., Α^ над R (соответственно левыми и правыми). 104
Определение 5. Произведением матрицы А = (а^)тХп на матрицу В = (bl3)nXk называется матрица С = (сг^)тх*, в которой сгз = 2jals6SJ,i Ε 1,га, j € Ι,Λ. Обозначение: А · Б = С или УШ = С. Таким образом, для нахождения элемента с%э нужно все элементы г-й строки матрицы А умножить на соответствующие элементы j-ro столбца матрицы В и результаты сложить, или короче, г-ю строку матрицы А умножить на j-й столбец матрицы В. Если воспользоваться записями матриц через их строки и столбцы, то правило умножения матриц можно записать следующим образом: АВ = А} \ А2 {в\в1. Ат ) AiBJ; £ΧΒ± А2В\ А2В\ AmB\ ■Βί) = Щ \ А2В[ АтВ1к ) Из определения 5 видно, что умножать матрицу А на матрицу В можно лишь в том случае, когда число столбцов матрицы А равно числу строк матрицы В. Всюду далее в тех случаях, когда говорится о произведении матриц или записывается произведение матриц, указанное условие на размеры сомножителей предполагается выполненным. 3 а м е ч а н и е 1. На первый взгляд правило умножения матриц выглядит искусственным. В действительности к использованию именно такого правила умножения приводят многочисленные применения матриц в теории и на практике. О естественности определения 5 свидетельствует также Теорема!.. Для любых матриц А, В, С подходящих размеров над кольцом R выполняются равенства: 1) (АВ)С = А{ВС), 2) А(В + С) = АВ + АС, 3) {А + В)С = АС + ВС. 105
Если кольцо R коммутативно, то выполняется таксисе равенство: 4) (АВ)Т = ВТАТ. D Доказываются свойства 1) — 4) непосредственной проверкой. А именно, находят и сравнивают элементы из г-й строки и j-ro столбца матриц в левой и правой частях доказываемого равенства. Докажем для примера свойство 1. С этой целью введем обозначения: А = (аг<7)тхп, В = (&u)nXfc, С = (Cl3)kxl, АВ = X = (Xij)mxb XC = Y = (уг,)тх*, BC = U = K,W, AU = V = (ti„)mx*. Для доказательства равенства 1) достаточно доказать, что угз = v%3 для любых г G l,m,jf G Ι,ί. Пользуясь определением 4 и свойствами операций в кольце Д, находим: к к η к η η к η к к = Σ Σ а"*(^*с*:?)= Σ α*Γ(Σ k·*^)= Σ a*rUrJ= v*r Свойства 2 — 4 докажите в качестве упражнения. D Заметим, что произведение двух матриц из Яп,п всегда определено и является матрицей из Яп,п· Следовательно, умножение матриц является бинарной операцией на Rn%n при любом η € N. Из утверждения 1 и теоремы 1 следует Теорема 2. Множество Rn,n квадратных матриц порядка η над кольцом R является кольцом относительно операций сложения и умножения матриц. Выясним, в каких случаях кольцо (Яп,п;-Ь·) обладает некоторыми дополнительными свойствами. Теорема 3. а) Кольцо (Яп,п; +»·) коммутативно в том и только том случае, когда либо 1) η = 1 « й - коммутативно, либо 2) η > 1 и R — кольцо с нулевым умножением. б)Кольцо (Дп,п; +, *) является кольцом с единицей в том и только в том случае, когда единица есть в кольце R. О а) Коммутативность кольца ДПэП в случаях 1) — 2) очевидна. Докажем обратное утверждение. Пусть кольцо Rn^n коммутативно. При 106
η = 1 это равносильно коммутативности кольца Д. Рассмотрим случай η > 1. Вычисляя и приравнивая произведения матриц: Е™{а)Е™{Ь) и Е™{Ь)Е™{а), получим аЬ = О для любых а,Ь € Д. Следовательно, Д — кольцо с нулевым умножением. б) Пусть кольцо Rn^n имеет единицу и ею служит матрица ε = (ег^)пхп. Тогда из равенства Ε„χι1(α)ε = εΕ^χ1{(ά) получим: аец = еиа = а для любого а € Д. Следовательно, ец — единица кольца Д. Обратно, пусть кольцо Д имеет единицу е. Тогда в Rn%n есть единичная матрица Епхп = Е. Непосредственной проверкой нетрудно убедиться в том, что для любой матрицы А из Дп,п выполняются равенства: АЕ = Ε А = А. Следовательно, Ε есть единица кольца Дп,п- Π Легко проверить, что равенства: Ε А = А, ВЕ = В выполняются вообще для любых матриц А € Дп,& и В Ε Дт,п· Замечание2. Кольцо Дп,п является полем лишь в том частном случае, когда η = 1 и Д есть поле. В этом случае Дп.п» по существу, совпадает с Д. Тот факт, что при η > 1 Дп,п не является полем, следует непосредственно из теоремы 3. Однако в этом случае можно сказать больше. А именно, при η > 1 кольцо всегда имеет делители нуля: например, матрицы: Е™{а), Е$$(Ь) при а φ 0,6 φ 0. Найдем условия разрешимости простейших матричных уравнений АХ = С, ХВ = С, в которых А, В, С — известные матрицы над кольцом Д соответственно размеров га χ η, η χ /:,га χ /:, а X — неизвестная матрица подходящих размеров. Для этого нам понадобится вспомогательное Утверждение 3. Для любых матриц А = (аг^)тхп, В = = (bij)nxk, С = (Сц)тхк равенство АВ = С равносильно любой из следующих систем соотношений Сг = α%ιΒι + аХ2В2 + ... + агпВп, г е 1,га; (2) С\ = ^Фъ + А\ЪЬ + · · · + 4Aij> J € TTfc. (3) 107
Доказывается утверждение 3 непосредственной проверкой. Проделайте ее в качестве упражнения. Непосредственно из утверждения 3 следует Теорема4. Для матриц над произвольным кольцом R уравнение АХ = С (ХВ = С) разрешимо β том и только том случае, когда столбцы (строки) матрицы С являются правыми (левыми) линейными комбинациями столбцов (строк) матрицы А(В). D Уравнение АХ = С разрешимо тогда и только тогда, когда существует некоторая матрица В = (bij)nxfc, удовлетворяющая равенству АВ = С. Последнее же равносильно существованию элементов Ь%3 € Д, удовлетворяющих системе соотношений (3). Для уравнения ХВ = С рассуждения аналогичны, при этом вместо (3) используется (2). D Замечание 3. Указанный в теореме 4 критерий разрешимости матричных уравнений носит больше теоретический характер и в общем случае не дает метода решения уравнений. Ниже такой метод будет указан для матриц над кольцом Ζ и для матриц над полями. § 2. Определители матриц над коммутативным кольцом с единицей Зафиксируем произвольное коммутативное кольцо R с единицей е и будем рассматривать квадратные матрицы порядка η над кольцом Д. Как было показано выше, кольцо Rn^n таких матриц является кольцом с единицей Е, и потому естественно ставить вопрос об описании обратимых элементов кольца Дп,п, т. е. обратимых (η χ п)-матриц над R. Для его решения введем понятие определителя квадратной матрицы порядка п, или, короче, определителя η-го порядка. С этой целью проанализируем сначала известное из аналитической геометрии понятие определителя матрицы 3-го порядка над полем действительных чисел: ац а\2 α\ζ 0-21 0,22 0>23 ^31 а32 азз = ^11^22^33 + Οΐ2^23α31 + ai3a21U32~ — ^13^22^31 — αΐ2Λ2ΐα33 — ацагзазг· 108
Рассматривая этот определитель, замечаем следующие факты: 1. Определитель Δ есть алгебраическая сумма б произведений вида aUlci2i2a3id. (4) 2. В произведениях (4) наборы вторых индексов (г'ь г*2, г'з) пробегают все 3! перестановок из чисел 1,2,3. 3. Произведение (4) берется со знаком "+", если перестановка (г'ь г*2, гз) — четная, и со знаком "—" в противном случае. Отмеченные факты и положим в основу определения определителя η-го порядка. Определениеб. Определителем квадратной матрицы А = = (atj)nxn порядка η над кольцом R называется элемент кольца Д, равный алгебраической сумме п! произведений вида: aiii^ ••·βη*»ι (5) соответствующих различным перестановкам (ii,i2,...,in) £ Р(1,п), в которую слагаемое (5) входит со знаком м+", если перестановка (гι, г'г,... ..., гп) четная, и со знаком "—" в противном случае. Определитель матрицы А далее будем обозначать через \А\ или, подробнее, an αχ2 ... ain a2i агг ... a2n Ι α·η\ a>n2 ... ann | Пользуясь введенной в § З.П функцией четности δ на множестве перестановок, можно записать: \А\ = 2J ^(гь«2,...,гп)а1г1а2г2 ...аШм, (б) (»1»»2, »*«) где суммирование ведется по всем перестановкам: (iii«2,...,in) €Ρ(ϊ7η). Правую часть равенства (б) называют каноническим представлением определителя |Л|. 109
Заметим, что определением 6 охватывается и известное из средней школы понятие определителя 2-го порядка: an αΐ2 ^21 α22 = аца22 - αΐ2α2ΐ. Находить определитель матрицы можно непосредственно по формуле (6), однако, такой способ сопряжен с большими трудностями. Так, уже для вычисления определителя 5-го порядка нам придется вычислить сначала 5!=120 произведений вида а1г1а2ъ2азг3с14ъ4а$1ъ, а затем сложить их с нужными знаками. Однако в некоторых частных случаях определитель матрицы может быть легко вычислен непосредственно по определению 6. Π ρ и м е ρ 1. Для треугольных матриц (1) произведение (5) может быть отличным от нуля лишь при i\ = 1,г*2 = 2,...,гп = п. Отсюда следует, что определитель любой такой матрицы равен произведению элементов главной диагонали. На практике часто вычисление определителя любой матрицы сводят к вычислению определителя треугольной матрицы с помощью свойств определителей. Приведем ряд свойств определителей матриц над коммутативным кольцом с единицей. Свойство I. Если матрица В = (&^)ηΧη получена из А = (агз )пхп умножением какой-либо строки на элемент г кольца R, то \В\ = г-| А\. Иначе это свойство формулируют так: общий множитель всех элементов какой-либо строки матрицы можно вынести за знак ее определителя. D Пусть В получена из А умножением 5-й строки на г. Тогда, пользуясь определением б и свойствами коммутативности умножения и дистрибутивности умножения относительно сложения в кольце Д, получим: \В\ = 2^ £(ίι,...,ίθ,...,2η)&ιη ...&«, ...6Шп = (*1. »*п) = zL ^(г'ь · ·· * *·>··· > *η)αι*ι .. · гаПч... antw = (*1э м1«) = г 22 *(*ι>···ι*·>···ι*η)αι*ι ···<*«, .-.ant» =г|А|. D (*lt· »*n) 110
Свойство II. Если s-я строка Аа матрицы А представляется в виде суммы двух векторов-строк А'а+А", то определитель матрицы А равен сумме определителей матриц А и А"7 полученных из А заменой s-й строки соответственно векторами-строками А'3, А" : |Л| = |Л'| + +\А»\. D Обозначим: з = \аз\ > α«2» · · ·»asnh Аз = Κΐ > as2> · · ·»азп)· Как и при доказательстве свойства I, получим: \А\ = 2^ <Нгь · · · ι и, · - -»г„)аь, ... а«,... antn = = ]Р J(ii,...,ia,...,г'п)^ ... (c4, + а"ь)...θη%η = (*Ь»м*п) = Σ ί(*1ι···ιί*»···ι<η)βΐΐι ···<*«. •••umw + (*1,»м»п) + Σ *(<ь...,^...,<п)аЬ1...а^...аП1ж=|Л/| + И1#1-П (*1>·.··«η) Заметим, что свойство II очевидным образом обобщается на случай, когда 5-я строка матрицы А представляется в виде суммы к векторов- строк при любом к € N. В этом случае определитель \А\ разложится в сумму к определителей. Свойство III. Определитель матрицы с двумя одинаковыми строками равен нулю. О Пусть в матрице А = (а1$)пхп равны fc-я и £-я строки, т. е. ау = = at3, при всех j G Ι,η, и пусть, для определенности к < £. Представим определитель |Л| в виде суммы двух слагаемых: где Δι = 22 *(*1»···ι*η)βΐΐι •••Onui (*ι *«) tk<U 111
Δ2 = 22 *(*!»· •·ι*η)βΐΐι ...Ля (*ь ·»*η) При доказательстве следствия теоремы 4.И было показано, что транспозиция элементов, расположенных на &-м и £-м местах в перестановках из Р(1,п), задает биективное отображение σ множества Р(1, п) на себя. По этому отображению можно построить взаимно однозначное соответствие между слагаемыми сумм Δι, Δ2, сопоставив слагаемому: cr(h,..., г*,..., г*, · · ·, ζη)αιτι ... ak%k ... аеи ... antn из Δι слагаемое из Δ2: σ(ζι,..., it,..., ik,..., in)aUl ... α*,£... a*lfc ... аШп. Так как по условию аьгк = attk, ае%е = а&гг и кольцо R коммутативно, то в силу теоремы 4.П соответствующие слагаемые отличаются лишь знаком. Следовательно, Δ2 = —Δι, и потому |А\ = Δι + Δ2 = 0. D Свойство IV. Если κ какой-либо строке матрицы А прибавить другую ее строку, умноженную на любой элемент из R, то определитель полученной матрицы будет равен определителю матрицы А. D Пусть матрица В получена из А прибавлением к j-й строке ее г-й строки, умноженной на г, и пусть, например, г < j. Тогда / Аг \ В = Л А] + гАг \ Ап ) Применяя последовательно свойства II, I, III, получим |В| = ... Л А3 + ... Л гАг = \А\+г Л А, = \А\+г-0 = \А\. 112
СвойствоУ. Если в матрице А поменять местами две строки, то определитель полученной матрицы В будет лишь знаком отличаться от определителя матрицы А : \В\ = — |А|. D Осуществим перестановку г-й и j-й строк матрицы А, пользуясь преобразованиями матриц, указанными в свойствах I и III. На основании этих свойств получим: И1 = Аг At A j + А, Aj+A, -А3 (А,+А\) + {-А,) -А3 А\ А, А, -А3 А2 + Аг = -\в\. о Свойство V допускает обобщение. Свойство VI. Если А = (агз)пХПу (αϊ,... ,αη) — произвольная перестановка чисел 1,2,..., η и А' = (7) то \А'\ = i(ab...,an)|A|. D Если перестановка (αϊ,...,αη) имеет t инверсий, то по утверждению З.П ее с помощью t транспозиций можно привести к виду (1,..., п). Для матрицы А' этот факт означает, что ее с помощью t перестановок двух строк можно привести к матрице А. Теперь равенство (7) следует непосредственно из свойства V. D Свойство VII. Если какая-либо строка матрицы является линейной комбинацией других ее строк, то определитель матрицы равен нулю. D Пусть 2-я строка матрицы А является линейной комбинацией ее строк с номерами гь ..., г'*: А0 =Atlci + ... + Alkck, j g{ii,...,2*}. 113
Тогда, прибавляя к j-й строке матрицы А ее строки Аг1,..., А%к, умноженные соответственно на элементы — сь ·. ·, — Ск, получим матрицу β с нулевой j-й строкой. Ясно, что |В| = 0. С другой стороны, по свойству IV |В| = \А\. Следовательно, |Л| = 0. D Свойство VIII. Определитель матрицы, транспонированной κ А, равен определителю матрицы А, т. е. \АТ\ = \А\. О Обозначим А = (α^)ηχη, Ат = (6^)пхп. Тогда Ь%3 = ajt для г J G € Ι,π, и справедливо равенство: \АТ\ = Σ *(*ь · · · > in)bUl · · · fcnin = (η .0 (g) = 2-J £(*1ι···»*η)<4ι1···<4»η· (*ь..,*«) В каждом произведении αηχ...α1ηη переставим сомножители так, чтобы первые индексы расположились в порядке возрастания. Тогда их вторые индексы составят некоторую перестановку (j\,..., jn) € Р(1, η), и ввиду коммутативности R получим равенство: α»ιΐ · ·. α>ιηη = aiji · · ·Onj„· Кроме того, из утверждения 1.П следует, что δ(ί\,..., гп) = J(ji,..., jn)y поскольку таблица ( * ] получена из таблицы с помощью некоторой перестановки столбцов. В итоге из (8) получим: ιаТ\ = Σ δ^1 > · · ·»*»)αι* · · · a^« · <9) (tl,...,«») Заметим, что отображение σ: Ρ(1,η) —» Ρ(1,η), сопоставляющее перестановке s = (ii,...,in) перестановку a(s) = (л,...,in) указанным выше образом, инъективно, а потому и биективно (см. утверждение 5.1). Действительно, из определения отображения σ видно, что в перестановке a(s) число jk есть номер места, на котором находится число к в перестановке s. Значит, если 5,5' € Р(1,п) и s Φ s\ то найдется такое число к € 1,п, которое bshs' расположено на разных местах, а тогда в перестановках a(s) и σ(β') будут находиться различные элементы на месте с номером fc, и a(s) Φ cr(s'). Следовательно, отображение σ биективно, и потому в (9) суммирование по s = (t'i,...,zn) можно (}■■■') 114
заменить суммированием по a(s) = (ji,...,jn) Произведя эту замену, получим: \АТ\= Σ ίϋ„· Ob· »J«) ^3η)θΊ3ι ...anjn = |i4|. □ Из свойства VIII следует, что все свойства определителей матриц, доказанные для строк, имеют место и для столбцов. В дальнейшем этим фактом будем пользоваться без оговорок. Приведем пример на использование свойств определителей. Π ρ и м е ρ 2. Вычислить определитель матрицы: А = ( а Ь Ь Ь а Ь Ъ Ь а \ ь ь \ ь ъ } ( ι 1 1 \ ι 6 а Ь Ь ь . ь . а Ь . .. Ь \ . ь ! • b . а 1 Прибавив к 1-му столбцу матрицы А все остальные ее столбцы и вынеся из 1-го столбца полученной матрицы общий множитель а+Ь(п — —1), будем иметь (в силу свойств IV, I): |А| = (а + Ь(п-1))|В|, В = Вычитая 1-ю строку матрицы В из всех остальных ее строк, получим верхнетреугольную матрицу с главной диагональю (Ι,α — Ь,а — —6,... ,а—6). Из свойства IV с учетом примера 1 имеем: \В\ = (а—б)*1""1, и потому |А| = (а + &(п-1))(а-6)п-1. В заключение данного параграфа рассмотрим вопрос о вычислении определителя произведения квадратных матриц. Теоремаб. Определитель произведения двух квадратных мат- риц равен произведению определителей этих матриц: \АВ\ = \А\-\В\. 115
D Пусть А = (atJ)nxn, В = {Ьгэ)пхп, С = АВ. Из соотношений (2) имеем: / anBi+ai2B2 + ... + ainJ5n \ ^21-Bl + Q.22B2 + · · · ■+■ 0>2пВп с = \ а>п\В\ + ап2В2 + ... + аппВп ) Так как первая строка матрицы С есть сумма η векторов-строк, то, пользуясь обобщением свойства II определителей, разложим определитель \С\ в сумму η определителей для матриц вида: / ^ аигВ%1 ^ \ ^21-Βι + ^22-82 + ... 4- а>2пВп I \ а>п\В\ + аП2В2 + ... + аппВп ) , h G Ι,η. Определитель каждой из этих матриц снова можно разложить в сумму η определителей по 2-й строке, и т. д. В итоге определитель \С\ будет представлен в виде суммы пп определителей: ti,...,tn€l,n апг„Дт< = 22, α1ΐ\α2ί2· ·αηίη я., Вг2 Вгп Здесь каждый индекс is,s € Ι,η независимо от остальных индексов пробегает все множество чисел Ι,η. Заметим, что в последней сумме многие слагаемые равны нулю. А именно, всякое слагаемое, соответствующее набору индексов ii, 22,...,гп, содержащему хотя бы два одинаковых элемента, равно нулю по свойству III определителей. Поэтому в последней сумме можно оставить лишь те слагаемые, которые соответствуют наборам различных индексов , т. е. перестановкам из Р(1, п): в» \ \С\ = Σ αι»ι···αη«„ (и. · .t») В, «2 Д„ / 116
Отсюда по свойству VI имеем: \°\ = Σ αι*ι ••·αηΐη*(«ι»···»<η)ΐΒΐ = (*1, »*т») = ( Σ *(»ι *η)«ι.ι .--«η.» ) |Β| = |Λ| - |Β|. Π \<»ι. .»») / Замечание4. Все изложенные здесь свойства определителей (включая теорему 5) справедливы и для матриц над коммутативным кольцом R без единицы. Выясните, в каких из приведенных здесь доказательствах появятся дополнительные трудности и постарайтесь преодолеть их. § 3. Подматрицы матриц. Миноры и их алгебраические дополнения В данном параграфе будет показано, как вычисление определителя η-го порядка можно свести к вычислению определителей меньших порядков. При этом матрицы будут рассматриваться над произвольным коммутативным кольцом R. Определение?. Подматрицей матрицы А называется любая матрица, полученная из А удалением некоторых ее строк и столбцов. Подматрицу, полученную из А удалением всех строк, кроме строк с номерами г ι < ... < ι&, и всех столбцов, кроме столбцов с номерами Зг < · · · < Jii будем обозначать через ( li,...,Zjfe \ Л Зи---»3е / Определение 8. Определитель квадратной подматрицы А ( »· · ·' J матрицы А называется минором k-го порядка матрицы \ Jl»···13k J А и обозначается: Ч*:::::»)' (10> 117
Про этот минор говорят также, что он находится в строках номерами г'ь...,ik и в столбцах с номерами ji,...,j* матрицы А. Из определения 8 видно, что для А = (a,j)mxn МА ( ή,...,г* \ = ailJiaiiJ2 * * 'a4Jk aikjia*kj2 * * 'a*kJk Укажем каноническое представление этого минора. Утверждение 4. Если А = (a^)mXn, 1 < i\ < 1 < Л < ... <jk<nf то < ik < η, МА (!!'""'ίί)= Σ 5(^..^tk)antl^.alktk. (11) D Введя обозначение allj4 = 6rs для r,s € Ι,λ и воспользовавшись формулой (6), получим: М, (si ·*)€Ρ(1,*) = ]Γ ί(5ι,..., 5fc)atlJn ... alk3sk. Так как ji < ... < jk, то неравенство ja < jb равносильно неравенству а < Ь. Следовательно, в перестановках (si,..., sn) и (jSl,..., jSk) содержится одно и то же число инверсий, и потому J(si,...,Sn) = i(i«ii---iJ*fc)· Кроме того, соответствие (si,...,sn) —> (jSl,..., jSfc) задает биективное отображение φ: Р(1,к) -+ Р(л, ---,jk)- Следовательно, в последней сумме вместо суммирования по всем перестановкам из Р(1,&) можно суммировать по всем перестановкам множества {ji,..., jk}, и потому Мл X . ^U«l » * * * ' -?*fc )a*l J*i * * * а*кЗнк (j-if...^fc)€POi.—»Jfc) 118
Теперь осталось заметить, что правая часть последнего равенства отличается от правой части равенства (11) лишь обозначениями индексов суммирования. D Определение!). Дополнительным минором для минора (10) квадратной матрицы А называется определитель подматрицы, полученной из А удалением строк с номерами ίχ,... ,ik и столбцов с номерами О'ь · · · ijk)- Этот минор будем обозначать: смЛ ;ь-'М. Определение 10. Алгебраическим дополнением для минора (10) квадратной матрицы А называется его дополнительный минор, умноженный на (—i)*i+—+**+Ji+—+J*. Обозначение: \ Зъ---,3к ) Таким образом, Приведем формулу, выражающую определитель матрицы А через ее миноры fc-ro порядка и их алгебраические дополнения. Теоремаб (Лаплас 5). Для любых фиксированных натуральных чисел к < η, ζ'ι < ... < г к < η определитель квадратной матрицы А = {агз)пХп над кольцом R равен сумме произведений всех ее миноров порядка к, содержащихся в строках с номерами ίι,...,ύ, на их алгебраические дополнения, га. е. μΐ= Τ мА( \l""Jk l<3i<...<Jk<n N D 1. Рассмотрим сначала случай, когда i\ = 1,..., ik = к. Обозначим в этом случае правую часть равенства (12) через Δ и будем вычислять ее, пользуясь определениями миноров и их алгебраических дополнений: П. С. Лаплас — французский математик и физик (1749—1827). Wi:::::*)· <12) 119
л. ^. . А\ JiT-iJk ) А\ 31,-чЗк ) 1<Л< <3к<п х ' ч ' = Σ (( Σ S{su...,sk)ai3l ...dkSk)x 1<Л< <3k<n (s1% ,sfc)€POi, ,jfc) x((-l)1+ +*+*+ +» 53 i(«ik+b... ·· · iSnW+lsjt+i · · anSn)). Перемножая в скобках 1-ю сумму на 2-ю почленно и пользуясь свойствами операций в кольце Д, получим Δ= ]Г ( ]Г S(si,...,sk)S(sk+i,...,sn)x 1<Л< <3κ<η (вь §в0€р0ь tJfc) («*+ι, ,·η)€Ρ(ΙΤή\Οι, ,Jfc}) x («i)i+ +*+* + +^aifl...afcffcafc+lefc+1...aneJ. (13) Запишем полученную сумму сумм в виде одной суммы. Заметим, что число слагаемых во внутренней сумме равно к\(п — &)!, а во внешней— С*. Значит, общее число слагаемых в сумме будет равно к\(п — к)\Ск = = п!, т. е. числу всех перестановок из Р(1, ή). Заметим теперь, что наборы индексов (#ι,..., зд, Sfc+ь · · · ι sn), соответствующие слагаемым суммы (13), являются перестановками множества 1,пи любая перестановка из Р(1,п) может быть представлена в виде такого набора индексов при подходящем выборе подмножества {ji,..., jk} С Ι,η и перестановок (si,...,Sjb) € P(jb.. >·?*)> («*+1ι...ι*η) € Р(Т~П \ {jb ··>.?*:}). Следовательно, в результате суммирование будет производиться по всем перестановкам (si,..., sn) из Р(1,п) Отсюда, с учетом утверждения 2.П, получим: Δ = 22 i(si,...,Sjfe,Sjb+li...iSn)ulei ... - - · dk+lsk+1 · · · CinSn = H|i и равенство (12) в рассматриваемом случае доказано. 120
2. Пусть теперь ζι,.. , ζ& — любые числа из множества 1,п, удовлетворяющие условию 1 < ζι < ... < ik < п. Сведем этот случай к первому Для этого осуществим в матрице А следующую перестановку строк Переставляя ζι-ю строку поочередно со всеми предыдущими, поставим ее на 1-е место, затем гг-ю строку таким же образом поставим на 2-е место, и τ д, и, наконец, поставим г&-ю строку на к-е место. В итоге получим некоторую матрицу В Так как для перехода от А к В мы произвели (ii — 1) 4- (i2 — 2) 4-... 4- (ζ& — к) перестановок строк, то по свойству V определителей: |А| = (~1)1+ +*+11 + +·*|Β|. (14) По доказанному в случае 1 имеем: |e|-J:^(J!:::::i)raK(J,,:::::i)· <15> Непосредственно из построения матрицы В следует, что мвГ,1'·-* )=^(!ь""гЛ' \ Jb · ,3к J \ 31,"">3к ) смв( 1··-* )=мА( 11····'»* ) \ 3i,---i3k ) \ 3\,---,3к ) Из последнего равенства, используя определение алгебраического дополнения, получим: **(£:::\кл)-™и "****** (ϊ:::::ϊ)- _ / ιγ+ +fc+ji + Ч-jjbr l)*i+ +tfc+ji+ +JfcдТ~ [ гЬ*--1гА: λ _ \ Jb· · · ι Jfc ) <-ч,+ +***++*^( *:::::;) Из найденных соотношений между минорами и алгебраическими дополнениями матриц А, В и равенств (14), (15) легко следует равенство (12). D 121
Замечание 5. Ясно, что теорема Лапласа останется верной, если вместо к выделенных строк матрицы взять к столбцов. В качестве отдельного утверждения выделим один практически важный частный случай теоремы Лапласа, когда к = 1. В этом случае минор Μ а ( ) матрицы А = (агз)пхп совпадает с ее элементом ars, и потому его алгебраическое дополнение называют алгебраическим дополнением элемента агз и обозначают также через Ars. По определению 9 для нахождения Агз нужно удалить из А r-ю строку и 5-й столбец, вычислить определитель полученной матрицы и умножить его на (—l)r+s. С л е д с τ в и е 1. Определитель матрицы А = (агз)пхп равен сумме произведений всех элементов любой строки (любого столбца) матрицы А на их алгебраические дополнения: η η \А\ = Υ^α%3Α13, г е hn; \А\ = ^агзАгз, г е hn. (16) Правые части равенств (16) называются разложениями определи- теля А соответственно по i-й строке и j-му столбцу. Следствие2. Сумма произведений всех элементов любой строки (любого столбца) квадратной матрицы на алгебраические дополнения соответствующих элементов другой строки (другого столбца) этой же матрицы равна нулю, т. е. для А = (агз)пХп η 2^ak3Al3 = 0 при г,к G 1,п, г φ к; (17) η Σ агзАхк = О при j, к е Τ7ή, j φ к. (18) D Рассмотрим вспомогательную матрицу В = (Ьгз) пхп, которая получается заменой в А г-й строки ее fc-й строкой (при сохранении неизменными остальных строк). Разложим |В| по г-й строке. По следствию 1 получим: |В| = £>„*„. 122
Так как в матрице В есть две равные строки, то |В| = 0, и поэтому выполняется равенство Σ>Λ=0. (19) Теперь заметим, что Ьгз = а^,Вгз = Аго, для всех j £ Ι,η. Произведя в равенстве (19) указанную замену, получим равенство (17). Аналогично доказывается равенство (18). D § 4. Обратимые матрицы. Критерий обратимости Рассмотрим кольцо Дп,п квадратных матриц порядка η над коммутативным кольцом R с единицей е и найдем все его обратимые элементы. Теорема 7. Матрица А € Дп)П обратима β кольце Rntn то- гда и только тогда, когда ее определитель \А\ является обратимым элементом кольца R. D Пусть матрица А обратима в кольце Rnyn, т. е. для нее существует матрица Л"1, удовлетворяющая условию: АЛ'1 = А'1 А = £, где Ε — единичная матрица из Дп,п- Отсюда и из теоремы 5 имеем: \А\-\А-1\ = \А~1\-\А\ = е. Эти равенства означают, что Ι-4""1! есть обратный элемент для |А|, т. е. \А\ - обратим в Л и \А\'г = |-А—1|. Обратно, пусть \А\ — обратимый элемент кольца R. Построим матрицу А* = (Сгз)пхп, в которой С%3 = А3%. Непосредственным перемножением матриц с использованием следствий 1 и 2 из теоремы Лапласа, получим: / \А\ 0 ... О \ аа* = а-а=\ ° 1л| ;;; ° . \ "θ "θ '.'.'. \А\ ) 123
Отсюда следует, что А · (\А\~1 - А*) = (\А\~1 - А*) - А = Е, т. е. матрица \А\~1 - А* является обратной для А, и матрица А обратима. D Матрицу А* называют взаимной к А. В доказательстве теоремы указан и алгоритм нахождения обратной матрицы для А: сначала надо в А каждый элемент заменить на его алгебраическое дополнение, затем полученную матрицу транспонировать и в полученной таким образом матрице А* каждый элемент умножить на И"1. В следующей главе для матриц над полем будет указан более простой алгоритм нахождения обратной матрицы. Следствие. Если А, В е Rn%n и АВ = Е, то В = А~1. D Так как АВ = Е, то по теореме 5 |Α|·|Β| = е, а потому и |Β|·|Α| = е, (в силу коммутативности кольца R). Значит, элемент \А\ обратим вй,а тогда по теореме б обратима и матрица А, т. е. существует А~1 € Дп,п- Умножив обе части равенства АВ = Ε слева на А"1, получим искомое равенство В = Л"1. D § 5. Элементарные преобразования матриц. Эквивалентные матрицы ОпределениеП. Элементарными преобразованиями строк матрицы A Ε Rm,n называют: 1) умножение любой ее строки на обратимый элемент кольца R; 2) прибавление к любой ее строке другой строки, умноженной на произвольный элемент кольца R. Аналогично определяются элементарные преобразования столбцов матрицы А. Элементарными преобразованиями матрицы называют элементарные преобразования ее строк и столбцов. Покажем, что элементарные преобразования строк (столбцов) матрицы можно осуществить путем умножения ее слева (справа) на подходящие квадратные обратимые матрицы. Утверждение 5. а) Умножение г-й строки (г-го столбца) матрицы А € Rm,n на г равносильно умножению А слева (справа) на матрицу D${r) (D^(r)), где £>«(r) = diag(e,.... г,..., e)kxk. 124
б) Прибавление к i-й строке (г-му столбцу) матрицы A G Rm,n произведения ее j-й строки (j-го столбца) на г € R при j φ г равносильно умножению А слева (справа) на матрицу 2&»>(г) (!#.·>), где T^\r) = Ek><k + Ek3£(r). Доказывается утверждение непосредственной проверкой. Определение 12. Матрицы D[l)(r) при г6й*и Τ^'(ό) при любом с € R и г φ j называются элементарными матрицами. Легко видеть, что матрицы 2?Jj. (г) и Т1%,3\с) получаются путем соответствующих элементарных преобразований единичной матрицы Ekxk- (Проверьте!) Так как >(»>/ i(»j)/ £>д/(г) = г, Tfc (с) = е и элемент г обратим, то элементарные матрицы обратимы. Легко видеть, что обратные для них матрицы также являются элементарными, а именно: 4'V)-1 =Dkt\r-i), Τ^(ο)->=τ£·>\-ο). (Проверьте!) Определение 13. Матрица В е Дт,п, называется эквивалентной матрице A G Дш,т если она может быть получена из А с помощью конечной последовательности элементарных преобразований. Обозначение: В ~ А. Из определения 13 видно, что эквивалентные матрицы имеют одни и те же размеры. Следовательно, отношение ~ является бинарным отношением на множестве Rm,n- Укажем простейшие свойства этого отношения. Утверждениеб. а) Отношение ~ является отношением эквивалентности на множестве Дт,п· б) Если матрица В получена из А перестановкой строк или столбцов, то В ъ А. в) Если А, В € Дт,п и А ^ В, то существуют матрицы U G € R^m, V е R^n такие, что В = UAV. г) Если матрицы А и В квадратные и А ~ В, то \В\ = г\А\, где г — некоторый обратимый элемент кольца R. D а) Свойства рефлексивности и транзитивности отношения ~ очевидны. Для доказательства симметричности достаточно заметить, что 125
если матрица В получена из А одним элементарным преобразованием, то и А из В можно получить одним элементарным преобразованием. (Проверьте!) б) Для доказательства достаточно осуществить с помощью элементарных преобразований перестановку любых двух строк (столбцов) матрицы А (поскольку с помощью транспозиций можно перейти от любой перестановки к любой другой). Для строк это сделано при доказательстве свойства V определителей, для столбцов делается аналогично. в) Так как А ~ В, то в соответствии с определением 11 и утверждением 5 существуют элементарные матрицы ί/χ,..., [/& G R^ и Vi,..., Ve € £ Д*, такие, что В = [/& ... U\AV\... Ve. Тогда искомыми матрицами являются U = Uk - -. U\, V = Vi... Ve. г) Из утверждения в) следует, что В = UAV для некоторых обратимых матриц Е/, V. Отсюда, используя теорему 5 и коммутативность кольца Я, получим: \B\ = \U\-\A\.\V\ = \U\-\V\.\A\ = v\A\, где г = \U\ · \V\ — обратимый элемент кольца R. D В дальнейшем нам неоднократно понадобится Τ е о ρ е м а 8 (о минорах эквивалентных матриц). Если А, В € € Rm,ni A ~ В и все миноры к-го порядка матрицы А кратны эле- менту с кольца R, то все миноры k-го порядка матрицы В таксисе кратны с. D Утверждение теоремы достаточно доказать для случая, когда В получена из А одним элементарным преобразованием. а) Пусть i-й столбец матрицы А умножен на обратимый элемент г. Тогда любой минор матрицы В или совпадает с минором матрицы Л, или отличается от него лишь множителем г (по свойству I определителей), и утверждение верно. б) Пусть к ^-му столбцу матрицы А прибавлен ее 5-й столбец, умноженный на г € R. Рассмотрим любой минор k-ro порядка матрицы В: Мв(^ — \к)=Мв. \ Зг,---,3к ) Если £ £ {ji,--,jk} или I,s G 0*i» · · ·»Jfc}» т0» очевидно, имеет место равенство: мв = мА( V·· -'* ). \ Л,--,Зк } 126
Пусть I е {ji,..., jk} например I = jt, 1 < t < к и s & {ju ..., j/J. Обозначим через A[,..., A^ столбцы подматрицы A I }''''' k 1. Тогда минор Мв можно записать в виде: мв = I Л],... A\t_x {A\t + ril)iji+i ...ЛЦ. По свойству II определителей имеем: Мв = М\ 4- Мг · г, где м> = И. •••^,-AiAi«+. •••^|·Μ2 = И. •••^-ИА1«+1 ·· А|· Отсюда видно, что Μι — минор матрицы А, а Мг — минор матрицы А, если jt_i < 5 < jft+i, и может не быть минором матрицы А в противном случае. В последнем случае, переставив в Мг столбцы так, чтобы их индексы расположились в порядке возрастания, мы получим минор матрицы А, которой, согласно свойству V определителей, будет равен Мг или —Мг. Таким образом, во всех возможных подслучаях случая б) минор Мв или совпадает с минором к-го порядка матрицы Л, или равен алгебраической сумме двух ее миноров fc-ro порядка. Отсюда и из условия следует, что минор Мв кратен с, и утверждение теоремы верно. Для элементарных преобразований строк доказательство проводится или аналогичным образом, или переходом к транспонированным матрицам. D Следствие. Если А, В G Rm,n,A ~ В и все миноры к-го порядка матрицы А равны нулю, то все миноры k-го порядка матрицы В такэюе равны нулю. Ниже, при изучении матриц и при решении систем линейных уравнений особую роль будут играть элементарные преобразования строк матрицы. В связи с этим сформулируем Определенней. Матрица В называется строчно эквивалентной матрице A G Rm,n, если она может быть получена из А с помощью конечной последовательности элементарных преобразований строк. Обозначение: В £ А. Для введенного отношения ~ имеет место аналогичное утверждению б. Утверждение?, а) Отношение ~ является отношением эквивалентности на множестве матриц Rm,n- б) Если матрица В получена перестановкой строк в матрице А, то В ^ А. 127
в) Если А,В€ Rmyn и А~ В, то существует обратимая матрица U € ЩпуШ такая, что В = UA. г) Если матрицы А, В квадратные и А & В, то \В\ = г\А\, где г — некоторый обратимый элемент кольца R. D В некоторых случаях элементарные преобразования строк матриц могут помочь найти обратную матрицу для заданной обратимой матрица из Дп,п. Утверждение8. Пусть А — обратимая, а Е — единичная матрица из Rn%n. Если матрица В = (А, Е) строчно эквивалентна матрице В' = (Е,А'), то А! = А'1. D Из условия и утверждения 7 в) имеем: В' = [/(Д£), где U € € #;<п. Так как ЩА,Е) = {UA,UE), то UA = Ε и U = А!. Отсюда и из следствия теоремы 7 получим А' = А~г. О Таким образом, для нахождения матрицы А~1 достаточно уметь обратимую матрицу А элементарными преобразованиями строк приводить к единичной матрице. Заметим, что для решения последней задачи в общем случае (т. е. для матриц над произвольным кольцом R) алгоритм не известен. То же самое относится и к задаче распознавания эквивалентности матриц. Вместе с тем, для матриц над Ζ алгоритмы решения указанных задач известны. В частности, алгоритм распознавания эквивалентности матриц над Ζ основан на преобразовании матриц к определенным каноническим матрицам. В главе VII та же идея будет использована для матриц над полями. § 6. Канонические матрицы над кольцом Ζ Определение^. Канонической матрицей над кольцом Ζ называется диагональная матрица diag(Jb... Л)тхп, (20) в которой $ь...,it € No и Vi € Ι,ί - 1 : δτ | Jt+i. Π ρ и м е р 3. Из трех матриц diag(l,2,4,0), diag(l,0,2,4), diag(l, -2,4,0) 128
каноническая, две другие нет. Нулевая матрица — канони- тхп над Ζ существует первая ческая. Теорема 9. Для любой матрицы А = (atJ) эквивалентная ей каноническая матрица. Предварительно введем обозначение μ{Χ) для минимального по модулю ненулевого элемента любой целочисленной матрицы X ^ О и докажем вспомогательное утверждение. Лемма. Для любой ненулевой матрицы А = {агз)тхп над Ъ существует эквивалентная ей матрица В = (6^)тхп, удовлетворяющая условию: Vi е ТГт, Vj € Yjt: μ(Β) \ Ьгз. (21) D Докажем лемму индукцией по |μ(Α)|. Если |μ(Α)| = 1, το утверждение очевидно. Допустим, что оно верно при \μ(Α)\ < d и пусть \μ(Α)\ = d, где d € N и d > 1. Выберем в А элемент аке = μ{Α) и рассмотрим три случая. 1) 3s € 1,п : aid \ aks. Разделим aks на aiu с остатком : aks = o,ktq + + r, 0 < г < \ам\. Прибавив к s-му столбцу матрицы А ее £-й столбец, умноженный на —ς, получим матрицу А! с элементом г на месте (&, s). Так как 0 < г < \аке\, то |μ(<4')| < |μ(Α)|, и по предположению индукции существует матрица В со свойством (21), эквивалентная А\ а потому и А 2) 3£ € 1,т : аке \ ац. В этом случае рассуждения аналогичны, вместо преобразования столбцов используются преобразования строк. 3) Vs е I~n, Vt € l,m : аке \ aks,dke \ ац- Допустим, что aiu \ &pq- Прибавим fc-ю строку матрицы А, умноженную на —аре/ак£, к ее р-й строке, а затем р-ю строку полученной матрицы — к ее &-й строке: А = ( \ . аке ... akq . . Clpl . . . CLpq . J ( \ .аке... акя .Ο.,.α! pq · \ / В итоге получим матрицу А! = (а^·), в которой аке = аке, akq = apq 4- +akq(l—api/ake) и аке f a'kq, поскольку аке \akq и аке\ аРЯ. Следовательно, для матрицы А' выполнено одно из условий: или |μ(Α')| < |μ(-Α)|, или μ{Α') = μ(Α) и тогда μ{Α') = аке и аке \ a'kq. Отсюда видно, что для матрицы А!, а потому и для А, искомая матрица В существует или по предположению индукции, или по доказанному в случае 1). D 129
D Теперь докажем теорему 9 индукцией пош + n. Заметим, что для нулевой матрицы А утверждение верно. Поэтому далее будем считать, что А ф 0. Если m + n = 2, тот = п = 1, и утверждение теоремы очевидно. Допустим, что оно верно при т + п < к, и пусть т + п = &, где к G N и к > 1. По лемме существует матрица В со свойством (21), эквивалентная А. Не теряя общности, можно считать, что |μ(Β)| = Ьц, ибо этого можно добиться перестановками строк и столбцов (что, согласно утверждению 6, осуществимо с помощью элементарных преобразований) и умножением 1-й отроки на —1. Прибавив к г-й строке матрицы В ее 1-ю строку, умноженную на — Ьг\/Ь\\, для всех г G 2,ш, а затем к j-му столбцу — 1-й столбец, умноженный на —bij/Ьц для всех jG2,n, получим матрицу вида Βι = / Ьц...О...О \ 0 В' \0 / Ьоо · · · Ьо* , где В' = 22 · · ·и2п т2 ' «»*...«, При этом В\ ~ А, и по теореме 8 6ц | b'%J для всех г € 2, га, j 6 2, п. По предположению индукции матрицу В' можно элементарными преобразованиями привести к канонической матрице diag(i2> · · ·, ^t)(m-i)x(n-i)· Осуществляя соответствующие преобразования над строками и столбцами матрицы В\у получим матрицу diag(6n,i2,· ·· ,&t)mxn = D, удовлетворяющую по теореме 8 условию Ьц | Su г е 2,£. А так как D ~ А, то матрица D — искомая. D Заметим, что доказательство теоремы 9 конструктивно. Из него легко извлекается алгоритм нахождения канонической матрицы, эквивалентной А, Алгоритм этот допускает вариации, связанные с неоднозначным выбором минимального по модулю элемента и не делящихся на него элементов в промежуточных матрицах. Вместе с тем, ниже будет доказано принципиально важное утверждение о единственности канонической матрицы, эквивалентной А. Для этого понадобятся некоторые вспомогательные факты. Определение 16. Пусть А € Zm,n,£ = min(m,n) и к е 1,£. Инвариантным делителем к-го порядка, или fc-м инвариантным делителем, матрицы А называется число dfc(A), равное неотрицательному НОД всех миноров &-го порядка матрицы А. 130
Заметим, что в силу следствия 1 теоремы Лапласа числа аг(А) удовлетворяют условию: Vz € l,t — 1 : аг(А) \ dt+\(A). (Докажите!) Оказывается, набор чисел (di(A),... ,dt(A)) является инвариантом класса всех матриц, эквивалентных А, а именно, справедливо Утверждение 9. У эквивалентных матриц над Ъ инвариант- ные делители одинаковых порядков равны. D Пусть А ~ B,dk(A) = d,dk(B) = d!. Тогда по теореме 8 имеем: d | d' и d! I d. Отсюда, учитывая, что d > 0, dl > 0, получим d = d!. D Утверждение 10. £слг« D = diag(ii,..., St) — каноническая матрица над Ζ, то для любого к G 1,£ справедливо равенство dk{D)=Si...Sk. (22) D Легко видеть, что среди всех миноров &-го порядка матрицы D не равными нулю могут быть лишь миноры Md ( -1 -fc ) = £*ι · · · £*fc · Отсюда и из условия £г | 6г+х для г G 1,< — 1 следуют соотношения ίι... ifc | in ... itfc, а потому — и равенство (22). D Теперь может быть доказана Τ е о ρ е м а 10. Каждая целочисленная матрица А эквивалентна единственной канонической матрице. О Если А эквивалентна канонической матрице (20), то по утверждению 10 для любого к £ 1,£ справедливо равенство (22). Отсюда и из утверждения 8 имеем δ\ = d\{A), и для к G 2,£: δ = idfc(A)/dfc_i(A), если dfc-i(A) ^ 0, |θ, если d^i(A) =0. Таким образом, элементы матрицы D однозначно определяются матрицей А. О Из теорем 9, 10 следует, что корректно Определение 17. Каноническая матрица diag(ii,..., ii)mxn, эквивалентная матрице A G Zm<n, называется канонической формой матрицы А и обозначается К{А). Элемент Sk этой матрицы называется к-м инвариантным множителем матрицы А и обозначается через ifc(A),*€M. Таким образом, К{А) = diag^H),... Л(А))ТОХП. (23) 131
Следствие1. Матрица A G Zn,n обратима тогда и только тогда, когда она представляется в виде произведения элементарных матриц. D Пусть матрица А обратима. Так как А ^ /С(А), то существуют элементарные матрицы U\y..., Uky V\y..., Ve такие, что А = U\... UkfC(A) V\... Vi. По теореме 7 \А\ = ε G {1, -1}. Отсюда и из равенства |/С(А)| = = ||А|| = 1 следует, что /С(Л) = Е} и потому А = U\... i/fcVl... V*. Если же матрица А есть произведение элементарных матриц, то ясно, что она обратима. D Следствие 2. Любая обратимая над Ζ матрица А стройно эквивалентна единичной матрице Е. О Из доказанного в следствии 1 имеем: А = U\... UkV\... VtE. Это и означает, что А £ Е. D Заметим, что следствие 2 делает возможным нахождение матрицы А"1 с использованием утверждения 8. Следствие 3. Для любых матриц А, В G Zm,n равносильны утверждения: а) А ~ В; б) существуют обратимые матрицы [/, V wad Z гаатше, что: В = UAV\ (24) в)/С(А)=/С(В); г) dk(A) = dfc(B) Алл всех к G l,min{m,n}; д) Sk{A) = ifc(-B) ά/ΐΛ всех к G l,min{m,n}. D Эквивалентность утверждений а), в), г), д) следует из существования и единственности канонической формы для любой матрицы над Ζ и равенств (22), (23). Импликация а) =Ф б) доказана утверждением б, и остается доказать импликацию б) =Ф а). Пусть В = UAV, где [/, V — обратимые матрицы. Тогда по следствию 1 U и V представляются произведениями элементарных матриц. Отсюда и из утверждения 5 следует, что от А к В можно перейти с помощью конечной последовательности элементарных преобразований. Значит, А ~ В. D Следствие 4. Существует алгоритму позволяющий для любых матриц А, В над Ζ выяснять, эквивалентны они или нет, и в случае положительного ответа находить обратимые матрицы [/, V, удовлетворяющие условию (24). D Для распознавания эквивалентности матриц А, В достаточно найти и сравнить их канонические формы. Дня нахождения матриц [/, V 132
из (24) при условии А ~ В найдем сначала матрицы U\, V\, [/2, V2, удовлетворяющие равенствам: UiAVi = К(А), U2BV2 = К(В). Отсюда с учетом равенства К{А) = К{В) получим: В = U^UiAViVf1, и потому U = U2 lU\} V = V\V^1. Таким образом, задача нахождения матриц [/, V из (24) сводится к случаю, когда В = К(А). В этом случае U и V можно найти путем перемножения элементарных матриц, соответствующих элементарным преобразованиям, осуществляемым при переходе от А к /С(А). Однако процесс этот можно формализовать, если воспользоваться следующим, легко проверяемым равенством / U т χ т ^Лп χ η \ I ^т χ т Ат χ η λ / ЕтхтОтхп \ ( U UAV Л \ 0ПхтЕпхп J У ОпхтЕпхп ) у OnxmVnxn J \ О V J Из него следует, что для нахождения матриц [/, V достаточно к матрице ( Етхт Атхп \ \ ^Λιχτη Епхп J применить те элементарные преобразования первых га строк и последних η столбцов, которые переводят А в К(А). В итоге получим матрицу ( Π V ) и тем самьш навдем [/, V. D Заметим, что приведенным выше алгоритмом можно воспользоваться и для нахождения обратной матрица для А, если она обратима. Действительно, в этом случае К(А) = Е, и из равенства UAV = К(А) следует, что A~l = VU. Канонические формы матриц могут оказаться полезными и при решении простейших матричных уравнений над [Ζ]. Π ρ и м е ρ 4. Решить уравнение АХ = В, (25) где А е Zm,n, В € Zm,fc. Найдем для А каноническую форму и обратимые матрицы ί/, V такие, что А = UK(A)V. Умножив обе части уравнения (25) слева на матрицу ί/"1, получим уравнение K(A)VX = U-1 В, (26) 133
равносильное (25), т. е. имеющее с (25) одно и то же множество решений. Так как V — обратимая матрица, то для решения уравнения (26) достаточно найти все решения уравнения K(A)Y = и~1 В, (27) а затем по формуле X = V~lY найти все решения уравнения (26). Таким образом, решение уравнения (25) сведено к решению значительно более простого уравнения (27), для которого нетрудно указать как критерий разрешимости, так и способ нахождения всех решений, в случае их наличия. Утверждение 11. Пусть К,(А) = diag(Ji,... ,St)mxn, где ίι,... ,δ3 отличны от О, α δ3+ι = ... = St = 0, U~lB = С = (сгз)тХк- Тогда уравнение (27) имеет решение в том и только том случае, когда все элементы г-й строки матрицы С делятся на 5г при г G 1,5 и равны нулю при г > s. Если уравнение (27) разрешимо, то все его решения исчерпываются матрицами Υ = {уго)Шхк, где {сг1/8г, если г G 1,5, J любое целое число, если г G s + l,n. Проверьте это утверждение самостоятельно. Задачи 1. Пусть R — кольцо с единицей. Для любой матрицы А = (аг$)тхп € € Rm,n выполняются равенства: а) А = Σι=1 Σ;=1 aijEmxm б) Е{г'е) AE{tj) = а»Е№тхп в) £&#Х*? = S,kE№r, где S}k = j О, если j Φ к, если j = к (Sjk — символ Кронекера). 2. Матрицы, перестановочные со всеми (η χ п)-матрицами над коммутативным кольцом R с единицей е φ О, исчерпываются скалярными матрицами, т. е. матрицами вида аЕ. 3. Являются ли подкольцами кольца матриц Rn%n (над коммутативным кольцом R с единицей): а) множество всех скалярных матриц; 134
б) множество всех диагональных матриц; в) множество всех верхне (нижне)треугольных матриц; г) множество всех матриц с заданным определителем; д) множество всех матриц, в которых первые г строк — нулевые 1 < г < п! 4. Доказать, что множество матрица вида ( , 1 над полем R образует поле, изоморфное полю С. 5. Является ли полем множество матриц вида I п , 1 над R? 6. Для любой обратимой матрицы А над коммутативным кольцом с единицей выполняется равенство: (Ат) = (А"1) . 7. Доказать равенство 6 1 1 "Г1 1 а2 а^1 ·. = Π (α»-αί)· 1<»<J<" (28) Указание. Примените метод полной математической индукции по п. Для перехода от η κ η + 1 следует вычесть из каждой строки предыдущую, умноженную на а\. 8. Доказать следующее утверждение. Для любых матриц А € Rm%n, В G Rn,k и натуральных чисел г, si,... ..., sr, ίχ, ..., £Γ, удовлетворяющих неравенствам г < min{m, n, к}, 1 <: s\ < ... < sr < τη, 1 < t\ < ... < tr < η, справедлива формула 7 -«(*:::£)- ς ^(*::::* )^(;i:::t)· 9. Если в матрице Апхп есть нулевая подматрица размеров к χ ί и к + е > п, то | А\ = 0. 10. Найти сумму произведений всех миноров порядка к матрицы Апхп на их алгебраические дополнения, 1 < к < п. 6 Определитель (28) называют определителем Вандермонда в честь французского математика А. Г. Вандермонда (1735—1796). 7 Равенство из задачи 8 называется формулой Бине-Коши в честь французских математиков Ш. Φ. Μ. Вине (1786-1856) и О. Л. Коши (1789-1857). 135
11. Доказать, что матрицы Апхп, Впхп обратимы тогда и только тогда, когда обратима матрица С = АВ. При этом С"1 = В"1 А"1. 12. Даны матрицы над Z: Аг , А2 = 2 3 4 5 -3 -4 2 -6 3 5 14 9 1 2 3 а) Найти канонические формы матриц Αχ, Α2 и такие обратимые над Ζ матрицы Е/„К, что Е/,А»К = fc(At), г = 1,2. б) Решить матричные уравнения АгХ = В, г = 1,2, над Z. 13. Являются ли обратимыми матрицы над Z: А,= В случае положительного ответа найти соответствующую обратную матрицу. 3 3 5 4 -4 5 8 -4 3 -2 -3 3 4\ :Ч 5/ , Αι = / 2 3 1 И 3 -2 -5 1 4 2 -2 2 "2\ -3 -1 4/ 136
Глава VII МАТРИЦЫ НАД ПОЛЕМ В данной главе мы более подробно изучим матрицы над произвольным полем Р. Обратимость всех ненулевых элементов поля Ρ дает возможность найти сравнительно простые алгоритмы решения таких задач о матрицах, для которых в общем случае (т. е. над произвольным коммутативным кольцом с единицей) алгоритмы решения или неизвестны или более сложны. Так, например, для матриц над полем можно указать несложный алгоритм распознавания их эквивалентности, в то время как в общем случае алгоритм решения такой задачи неизвестен. Полученные здесь результаты о матрицах будут применены в следующей главе к исследованию и решению произвольных систем линейных уравнений над полем. В качестве основного средства изучения матриц над полем будут использоваться элементарные преобразования систем их строк и столбцов. Вектор-строки и вектор-столбцы над полем Ρ условимся обозначать латинскими буквами с горизонтальной и вертикальной стрелкой, например, (αχ \ А = (αι,α2,...,αη), 61 = \ ап ) Элементы векторов будем называть их координатами. Множество всех векторов-строк (столбцов) длины η над полем Ρ обозначим через рп(р(п)у для векторов из РП(Р(П)), как для матриц, определены операции покоординатного сложения и умножения на элементы поля Р. Определение1. Множество векторов-строк Рп (векторов- столбцов р(п)) с операциями сложения векторов и умножения векторов на элементы поля Ρ называют n-мерным арифметическим пространством над полем Р. Понятие n-мерного арифметического пространства является естественным обобщением понятия трехмерного пространства £>з, изучаемого в школе и в аналитической геометрии. Действительно, при фиксированной системе координат каждый вектор из D$ определяется упорядоченной тройкой действительных чисел (координат) и потому D$ можно отождествить с множеством R3. При этом соответствующие операции 137
сложения векторов из R3 и их умножения на числа из R осуществляются также покоординатно. Этой связью Ρ с D$ объясняется проникновение в алгебру геометрических терминов "вектор", "пространство" и др. § 1. Ранг матрицы Зафиксируем произвольное поле Ρ и будем рассматривать матрицы над полем Р. В этом случае обратимыми в кольце матриц Ρ будут все матрицы с отличными от нуля определителями. Они называются также невырожденными. Матрицы с определителем, равным нулю, называют вырожденными. В ряде задач и, в частности, в задаче исследования и решения систем линейных уравнений важную роль играют невырожденные подматрицы данной матрицы. Наибольший порядок таких подматриц называют рангом матрицы. Приведем более традиционное Определение 2. Рангом ненулевой матрицы А называется наибольший из порядков отличных от нуля миноров матрицы А. Ранг нулевой матрицы считается равным нулю. Обозначение ранга матрицы A: rang А. Π ρ и м е ρ 1. Очевидно, что ранг матрицы Е^ равен единице, ранг любой невырожденной матрицы из РПлП равен п, ранг матрицы diag(ai,. ..,at)mxn, где t = min{ra,n}, равен числу ее ненулевых элементов. Определение 3. Подматрица наибольшего порядка среди всех невырожденных подматриц матрицы А называется ее ранговой подматрицей. Заметим, что во всех матрицах предыдущего примера существует единственная ранговая подматрица. В общем же случае их в заданной матрице может быть много. Π ρ и м е ρ 2. Легко проверить, что ранг матрицы /2434 А= [ 1 2 -1 3 \ 1 2 4 1 равен 2, и число ее ранговых подматриц равно 15. (Проверьте!) Способ вычисления ранга матрицы, основанный непосредственно на опре- 138
делении 2, связан с перебором и вычислением большого числа миноров. Естественно возникает мысль: нельзя ли предварительно как-то упростить матрицу, не изменяя ранга, а затем найти ранг полученной матрицы? Эта идея приводит к более простому методу вычисления ранга. Теорема1. Если матрицы А и В эквивалентны, то их ранги равны. D Пусть матрицы Аи В эквивалентны и rang A = к. Согласно определению 2 в матрице А для любого £ > к или совсем нет миноров порядка £, или все они равны нулю. Тогда по следствию теоремы 8.VI то же самое верно и для матрицы В. Следовательно, rang В < к т. е. rang В < rang А. Так как отношение эквивалентности матриц симметрично, то имеем также неравенство rang A < rang Б. Следовательно, rang Л = rang Б. D Следствие!. Ранг произведения матриц не превосходит рангов матриц-сомножителей. D Действительно, если С = АВ, то, согласно утверждению 3.VI, строки матрицы С являются линейными комбинациями строк матрицы В. Поэтому матрицу ( п ) можно элементарными преобразованиями строк привести к виду ( п 1 · Используя этот факт и очевидные соотношения между рангами матриц, получим: rang С < rang [ q J = ranS ( q ) = ranS В. Аналогично из соотношений (3) гл-VI для столбцов матрицы С получим: rang С < rang А. О Следствие 2. Если С = АВ или С = В А, где А — квадратная невырожденная матрица, то rang С = rang Б. D По следствию 1 rang С < rang В. А так как В = А~1С или В = СА~1, то снова по следствию 1 rang Б < rang С Значит, rang С = = rang В. D Определение 4. Ненулевая матрица S = (sl3)mxn называется ступенчатой матрицей типа 5(ή,... ,гГ), где г Ε 1,га, 1 < г\ < ... ... <гг <п если: 1) «in > 52i2»· · ·»5п, φ 0, 2) sa = 0 при £ > г, t Ε 1, η и при I Ε 1, г, t < г>. Нулевая матрица также считается ступенчатой. 139
В подробной записи ступенчатая матрица типа S(ii,. ■ ■, гг) £ Рт,п имеет вид: / О О О О sitl... * *... * О 0... О s2t2 ...* О О О О о о .0 .0 .0 ..о ..о ..о * *. * *. Sril * . 0...0 0. 0...0 0. '* \ • * • * ..0 '.о) (1) где 5i4, $2i2»· · · > snr т^ 0, а на месте звездочек могут находиться любые элементы поля Р. Из приведенной записи матрицы S видно, что ее минор Ms U:::::l) отличен от нуля, а все миноры более высоких порядков, если они существуют, равны нулю. Следовательно, ранг ступенчатой матрицы равен числу ее ненулевых строк. Теорема2. Любую матрицу А над полем Ρ можно элементарными преобразованиями строк привести к ступенчатой матрице. D Докажем теорему индукцией по числу га строк матрицы А. При га = 1 матрица А сама ступенчатая, и утверждение теоремы верно. Допустим, что оно верно для любой матрицы, состоящей из т строк, и докажем его для матрицы А € Pm+i,n· Если А — нулевая матрица, то она ступенчатая и утверждение верно. Пусть А Ф 0 и А\х — самый левый ненулевой столбец матрицы А. Переставляя (если нужно) строки матрицы А, мы, согласно утверждению 7 б) .VI, получим строчно эквивалентную А матрицу В вида: £ = 0. 0. .0 .0 &2ц 0...0 &m+in *. \ / в которой &ιη φ 0. Прибавляя к £-й строке матрицы В для каждого £ G 2, т + 1, ее 1-ю строку, умноженную на —ЬгцЬГ*!» П0ЛУЧИМ матрицу / в' = 0. 0. 0. .0 ..0 .0 0 0 * * * ...А. * * * \ / 140
Так как число отрок матрицы А\ равно га, то по предположению индукции она строчно эквивалентна ступенчатой матрице. Произведя соответствующие преобразования строк матрицы В', мы приведем Л ι к ступенчатому виду, не изменив 1-ю строку и первые %\ столбцов матрицы В'. В итоге В' преобразуется в искомую ступенчатую матрицу. D Теорема 2 делает содержательным и полезным для нахождения ранга матриц Утверждение1. Ранг произвольной матрицы над полем равен числу ненулевых строк в любой эквивалентной ей ступенчатой матрице. D Справедливость утверждения 1 следует непосредственно из теоремы 1 и совпадения ранга ступенчатой матрицы с числом ее ненулевых строк. D § 2. Каноническая форма матрицы Определениеб. Каноническими матрицами над полем Ρ называются нулевая матрица и все матрицы вида: diag(e,...,e,0,...,0) Заметим, что каноническая матрица является ступенчатой и ее ранг равен числу единиц на главной диагонали. Теорема 3. Для любой матрицы А над полем Ρ существует единственная эквивалентная ей каноническая матрица. Она называется канонической формой матрицы А и обозначается через К(А). D Если А — ненулевая матрица, то она уже каноническая. Пусть теперь матрица А отлична от нулевой. Приведем сначала матрицу А элементарными преобразованиями строк к ступенчатой матрице. Пусть при этом получилась матрица (1). Умножив ее ί-ю строку на sjt* для всех I G ТТг, получим матрицу с единицами на местах: (Mi),(2,i2),...,(r,ir). Вычитая последовательно ее строки с номерами 2,..., г, умножен- 141
ные на подходящие элементы, из предыдущих строк, получим матрицу / с = 0...0 0...0 »1 е О 0...0 О О \ 0...0 О О 12 О е 0 0 0 0 0 0 гг О О \ О 0 0...0/ (2) Теперь, вычитая столбцы с номерами ιΊ,Ϊ2,...,гг, умноженные на подходящие элементы, из последующих столбцов, заменим нулями все элементы, обозначенные в (2) звездочками. После этого перестановкой столбцов, поставив столбец с номером ц на £-е место для £ = 1,..., г, получим каноническую матрицу К, эквивалентную исходной матрице А. Единственность такой матрицы следует из совпадения числа единиц на ее главной диагонали с рангом матрицы A. D Определеннее. Матрицу вида (2) назовем специальной ступенчатой матрицей типа 5(ή,..., гг). Из доказательств теоремы 3 получаем Следствие1. Любая ненулевая матрица над полем строчно эквивалентна специальной ступенчатой матрице. Выделим в виде самостоятельного утверждения важный частный случай следствия 1. Следствие 2. Любая квадратная невырожденная матрица над полем строчно эквивалентна единичной матрице. Наличие алгоритма приведения невырожденной матрицы к единичной путем элементарных преобразований строк делает возможным применение метода нахождения обратной матрицы, указанного в утверждении 8.VI, к любой невырожденной матрице над полем. Точно так же, как и следствие 1 теоремы 10.VI, доказывается СледствиеЗ. Квадратная матрица над полем обратима тогда и только тогда, когда она представляется в виде произведения элементарных матриц. Используя теоремы 1 — 3, нетрудно получить ряд критериев эквивалентности матриц над полем Р, некоторые из которых сходны с критериями эквивалентности матриц над Ζ (см. следствие 3 теоремы 10.VI). Теорема 4. Для любых матриц Л, В Ε Рш%п равносильны следующие утверэюдения: 142
а) A * В; б) существуют такие невырожденные матрицы U € Pm,m,V G е Pntnr что В = UAV; (3) в) rang A = rang B\ г) К{А) = /С(В). D Для доказательства теоремы достаточно доказать цепочку импликаций: а) =Ф б) => в) =» г) => а). Импликации а) =» б), б) =» в), г) =*► а) следуют соответственно из утверждения 6.VI, следствия 2 теоремы 1, теоремы 3. Импликация в) => г) следует из существования канонических форм и совпадения ранга матрицы с числом единиц в ее канонической форме. D Одно из принципиально важных приложений канонических форм матриц указывает Утверждение 2. Существует алгоритм, позволяющий для любых матриц А, В над полем Ρ выяснять, эквивалентны они или нет, и в случае положительного ответа находить невырожденные матрицы U,V, удовлетворяющие условию (3). Доказывается утверждение 2 точно так же, как и следствие 3 теоремы 10.VI. § 3. Линейная зависимость векторов. Базис и ранг системы векторов В аналитической геометрии при изучении плоскости £>2 и пространства 1>з важную роль играют понятия коллинеарности и компланарности векторов. Так, например, неколлинеарные системы векторов и только они являются базисами пространства ί>2. Обобщением понятий коллинеарности и компланарности векторов в n-мерных арифметических пространствах является одно из важнейших для всей математики понятий — понятие линейной зависимости векторов. Многие результаты из теории линейной зависимости векторов излагаются сходным образом для пространств Рп и Р^п\ В связи с этим при изложении общих вопросов о линейной зависимости мы будем говорить просто о системах векторов длины п, подразумевая под этим 143
либо системы векторов-строк, либо системы векторов-столбцов длины п. При этом вместо латинских букв со стрелками будем использовать малые греческие буквы без стрелок. Вектор, все координаты которого нулевые, будем называть нулевым вектором и обозначать буквой Θ. Нулевые вектор-строка и вектор-столбец будут обозначаться соответственно через б и 0*. Пусть αχ,..., α* (4) произвольная система векторов длины η над полем Р. Определение?. Если для некоторых элементов поля Ρ выполняется равенство: ol\Ci + а2с2 + ... + акСк = 0, (5) то говорят, что для векторов системы (4) выполняется (имеет место) линейное соотношение (5). Это соотношение называется тривиальным, если все коэффициенты с\,..., ск нулевые, и нетривиальным в противном случае. Очевидно, что тривиальное линейное соотношение выполняется для векторов любой системы, наличие же нетривиальных линейных соотношений существенно зависит от заданной системы векторов. ПримерЗ. Рассмотрим две системы векторов из Rn: а) βχ,..., еп, г б) ех,...,еп,а, где ег = (0,... ,0,1,0,... ,0),г Ε Ι,η,α = (αχ,...,αη). Из определения операций в пространстве Rn имеем: Vcx,...,cn G R : ехсх + ... + епсп = (сх,...,сп). Следовательно, соотношение: ё\с\ +... + ёпсп = θ выполняется лишь в том случае, когда с\ = ... = сп = 0, т. е. для векторов системы а) выполняется только тривиальное линейное соотношение. Для векторов же системы б) наряду с тривиальным выполняется и нетривиальное линейное соотношение βχαχ + ... 4- епап + α(-1) = Θ. 144
Определение 8. Система векторов (4) называется линейно зависимой, если для ее векторов выполняется хотя бы одно нетривиальное линейное соотношение. В противном случае она называется линейно независимой. Пустая система векторов по определению считается линейной независимой. Более подробно: система векторов (4) называется линейно зависимой, если существуют такие не все равные нулю элементы с\,..., cjt Ε € Ρ, что выполняется равенство (5). Система (4) называется линейно независимой, если для ее векторов равенство (5) выполняется только при с\ = ... = ск = 0. В примере 3 система векторов а) линейно независима, а система б) линейно зависима при любом векторе а. Рассмотрим некоторые свойства линейной зависимости. Напомним, что вектор β называется линейной комбинацией векторов системы (4), если существуют такие элементы г\,..., rk Ε Р, что β = а\Г\ -К. .-Ьа^г^. В этом случае говорят также, что вектор β линейно выражается через векторы αχ,...,α&. Теоремаб (критерий линейной зависимости), а) Система векторов (4) при к > 1 линейно зависима тогда и только тогда, когда хотя бы один ее вектор линейно выражается через остальные векторы. б) Система, состоящая из одного вектора, линейно зависима тогда и только тогда, когда этот вектор нулевой. D a) к > 1. Если система (4) линейно зависима, то по определению 8 найдутся не все равные нулю элементы ci,...,Cfc Ε Ρ, при которых выполняется равенство (5). Пусть, например, сг Φ 0. Так как Ρ — поле, то в Ρ существует элемент с~1. Умножив обе части равенства (5) на с^"1 и перенеся все слагаемые, кроме аг, в правую сторону, мы выразим вектор аг линейно через остальные векторы системы (4). Обратно, пусть некоторый вектор а0 системы (4) линейно выражается через остальные ее векторы: аэ = а\Г\ + ... 4- α^-ιτ^-ι + α3+χΓ3+ι + ... 4- OLkTk- Тогда имеем нетривиальное линейное соотношение: ахгх + ... + α^-iTj-i + (^(-е) + аэ^ггэ^1 + ... + акгк = 0, и потому система (4) линейно зависима. 145
б) Пусть система (4) состоит из одного вектора αι. Если αϊ = 0, то выполнено нетривиальное линейное соотношение αχβ = 0, и система {αχ} линейно зависима. Если же αχ Φ О, то равенство αχο = 0 может выполняться лишь при с = О, поскольку умножение αχ на с производится покоординатно и в поле отсутствуют делители нуля. Следовательно, система {αχ} линейно независима. D Обратите внимание на то, что в линейно зависимой системе необязательно каждый вектор выражается через остальные. Примером может служить система векторов а, 0, где α Φ 0. В ней вектор 0 выражается через α (θ = a · 0), а вектор α через 0 не выражается. Следствие. Система из двух векторов α, β линейно зависима тогда и только тогда, когда эти векторы пропорциональны (т. е. а = = β · с или β = а · с при некотором с G Р). УтверждениеЗ. Если некоторая подсистема системы векторов линейно зависима, то и вся система линейно зависима, га. е. любая подсистема линейно независимой системы линейно независима. D Справедливость утверждения 3 следует непосредственно из определения 8, поскольку любое нетривиальное линейное соотношение для части векторов системы можно дополнить слагаемыми с нулевыми коэффициентами до нетривиального соотношения для всех векторов системы. D Утверждение 4. Если в системе векторов (4) к > 1 и первый вектор ненулевой, то она линейно зависима тогда и только тогда, когда хотя бы один ее вектор линейно выражается через предыдущие векторы. D Если какой-либо вектор системы (4) линейно выражается через предыдущие, то система (4) линейно зависима по теореме 5. Обратно, пусть система (4) линейно зависима и (5) есть нетривиальное линейное соотношение для ее векторов. Выберем максимальное j € l,fe такое, что с3 Φ 0. Так как αχ Φ θ, то j > 1, и из соотношения (5) вектор а3 выразится через предыдущие векторы αχ,..., α^-χ. D Выделим особо один практически важный случай утверждения 4. Утверждение 5. Если система векторов (4) линейно независима, то система векторов αχ,... ,α^,/? линейно зависима тогда и только тогда, когда вектор β линейно выражается через векторы системы (4). Утверждение 6. Если система векторов (4) линейно независима и вектор β линейно выражается через векторы системы (4), то 146
его представление в виде линейной комбинации векторов из (4) единственно. D Пусть выполняются равенства: β = а\С\ -К . .-Ьздг^, β = а\с'х -К .. ... + а\с\. Вычитая почленно из 1-го равенства второе, получим c*i(ci — ~ci)+· · -+ak(ck—c'k) = 0· Отсюда и из линейной независимости системы (4) получаем Сг = c'v г € 1, к. О Определение 9. Подсистема Τ системы векторов (4) называется ее максимальной линейно независимой подсистемой, если: а) система Τ линейно независима, б) добавление к системе Τ любого вектора из системы (4) приводит к линейно зависимой системе. Π ρ и м е ρ 4. Нетрудно видеть, что максимальными линейно независимыми подсистемами системы векторов δι = (0,0,0), <32 = (1,0,0), а3 = (0,1,1), а4 = (1,1,1) будут подсистемы {а2><33}, {<32,<34}, {5з,<54}. Π ρ и м е ρ 5. Максимальной линейно независимой подсистемой системы нулевых векторов 0,0,..., 0 является пустая система векторов. Непосредственно из теоремы 5 и утверждения 5 следует Утверждение?. Если система (4) содержит хотя бы один ненулевой вектор, то совокупность условий а) — б) определения 9 эквивалентна совокупности условий а) и б'). Любой вектор системы (4) линейно выражается через векторы системы Т. D В связи с этим максимальную линейно независимую подсистему системы векторов называют ее базисом. Далее мы обычно будем использовать этот, более короткий, термин. Утверждение 8. Любая конечная система векторов имеет базис. Более того, любую ее линейно независимую подсистему можно дополнить до базиса. О Пусть (4) — любая система векторов и Τ — любая ее линейно независимая подсистема (возможно, и пустая). Рассмотрим всевозможные линейно независимые подсистемы векторов системы (4), содержащие Т, и выберем среди них подсистему с наибольшим числом векторов. Очевидно, что она удовлетворяет условиям а)—б) определения 9, и потому является базисом системы (4), содержащим Т. D В связи с изучением линейной зависимости систем векторов из Рп(Р^) естественно возникают следующие задачи алгоритмического характера: 147
1) Выяснить, является заданная система векторов линейно зависимой или нет? 2) Выяснить, выражается заданный вектор линейно через векторы заданной системы или нет? 3) В случае положительного ответа на вопрос 2), найти представление указанного вектора в виде линейной комбинации векторов заданной системы. 4) Найти базис заданной системы векторов. 5) Выяснить, является ли базисом системы векторов ее подсистема. 6) Дополнить заданную линейно независимую подсистему системы векторов до ее базиса. В принципе все эти задачи разрешимы и сводятся, по существу, к решению систем линейных уравнений над полем Р, которые мы научимся исследовать и решать в следующей главе. Вместе с тем, для решения задач 1) — 6) можно указать более простые алгоритмы, основанные на использовании алгоритма приведения любой матрицы к ступенчатой или специальной ступенчатой матрице. С этой целью докажем предварительно две теоремы. Теоремаб. Если матрицы А, В из Рт%п стройно эквивалентны, то между столбцами матрицы А и между столбцами матрицы В выполняются одни и те же линейные соотношения, га. е. Vci,..., сп £ Ρ : (А^ + ... + А^сп = О1) & {B^d +... + В^сп = 0А). В частности, система столбцов матрицы А линейно зависима тогда и только тогда, когда линейно зависима соответствующая система столбцов матрицы В. D По условию и утверждению 7.VI существует такая невырожденная матрица U Ε Рт%п, что UA = В, т. е. UA\ = B\. Отсюда, пользуясь свойствами операций над матрицами, получим A[ci + ... + А^Сп = О1 & U(A[ci + ... + Alncn) = Ε/Ο1 ^ ^ {UA[)d + ... + (UA^Cn = О1 & B[d + ... + В^сп = О*. Заметим, что в первой из выписанных равносильностей использовано условие невырожденности матрицы [/, в этом случае переход справа налево можно осуществить путем умножения на матрицу U~l.O 148
Теорема 7. Пусть ненулевая матрица А из Рт%п строчно эквивалентна ступенчатой матрице S = (s%0)mxn типа 5(гχ,..., гГ). Тогда справедливы следующие утверждения: а) столбец А^ матрицы А является ненулевым и не представляется в виде линейной комбинации ее предыдущих столбцов тогда и только тогда, когда j Ε {ji,. ..>>}; б) если S — специальная ступенчатая матрица, то Vj€l^:Aj =£<**,. (б) О Согласно теореме б, утверждения а), б) достаточно доказать для соответствующих столбцов матрицы 5. В этом же случае они легко усматриваются непосредственно из строения матрицы 5. D Из этой, по существу очевидной, теоремы можно получить очень важные следствия и, в частности, алгоритмы решения перечисленных выше задач 1) — 6). Следствие1. Если матрица А строчно эквивалентна ступенчатой матрице S типа S(ti,... ,гг), то система столбцов <,···,4, (7) матрицы А является базисом системы всех ее столбцов. О Не теряя общности, можно считать, что S — специальная ступенчатая матрица. Тогда в силу теоремы 7 а) и утверждения 4 система (7) линейно независима. Кроме того, из (6) следует, что все столбцы матрицы А линейно выражаются через векторы системы (7). D С л е д с τ в и е 2, Все ступенчатые матрицы, строчно эквивалентные А, имеют один и тот же тип и среди них существует единственная специальная ступенчатая матрица. D Если А £> S и S — ступенчатая матрица типа 5(ii,... ,гг), то по теореме 7 а) числа ii,...,ir однозначно определяются матрицей А — это номера тех ее ненулевых столбцов, которые не выражаются через предыдущие столбцы. Если, кроме того, S — специальная ступенчатая матрица, то по теореме 7 б) ее элементы являются коэффициентами в линейных выражениях столбцов матрицы А через линейно независимую систему ее столбцов (7) и по утверждению 6 однозначно определяются столбцами матрицы А. О 149
СледствиеЗ (критерий линейной независимости). Система векторов-столбцов А[,...,АЬт (8) длины η над полем Ρ линейно независима тогда и только тогда, когда ранг матрицы А = (А\... А^) равен т. D По теореме 7 а) условие линейной независимости системы (8) равносильно тому, что ступенчатая матрица, строчно эквивалентная Л, имеет тип 5(1,2,..., га). Тому же самому по утверждению 1 равносильно и условие rang A = га. D Из следствия 3 и определения ранга матрицы получаем Следствие 4. Любая линейно независимая система векторов длины η codepoicum не более η векторов. Следствиеб (критерий равенства нулю определителя матрицы). Определитель квадратной матрицы Апхп над полем равен нулю тогда и только тогда, когда система ее столбцов (строк) линейно зависима. О Если система столбцов или строк матрицы А линейно зависима, то \А\ = 0 по теореме 5 и свойству VII определителей (или его аналогу для строк). Обратно, пусть \А\ = 0. Тогда по определению 1 rang А < η и по следствию 3 система ее столбцов линейно зависима. Для доказательства линейной зависимости системы ее строк достаточно те же рассуждения провести для транспонированной матрицы. D Следствиеб. Любые два базиса произвольной конечной системы векторов-столбцов (строк) состоят из одного и того же числа векторов, которое для непустой системы равно рангу матрицы, составленной из столбцов (строк) этой системы. О Для пустой системы векторов и системы, состоящей из нулевых векторов, утверждение следствия очевидно. Рассмотрим произвольную непустую систему, содержащую ненулевые векторы-столбцы. Пусть это есть система (8), и (7) — любой ее базис. Допишем к системе (7) все остальные векторы системы (8) в произвольном порядке и из полученной системы столбцов составим матрицу А' = (А1г ...А1 ...А\ ). Так как (7) есть базис системы столбцов матрицы А\ то ступенчатая матрица 5', строчно эквивалентная А1, имеет тип 5(1,..., г), и по утверждению 1 rang А! — г. Однако матрица А' эквивалентна матрице А = (А[... А}^) и по теореме 1 rang A' = rang А. Для доказательства 150
утверждения о системе векторов-строк достаточно путем транспонирования перейти к системе векторов-столбцов и учесть, что ранг матрицы равен рангу транспонированной к ней матрицы. D В силу следствия 6 корректно Определение 10. Рангом произвольной конечной системы векторов называется число элементов любого ее базиса. Пользуясь понятием ранга системы векторов, следствие 6 можно сформулировать короче Следствие? (теорема о ранге матрицы). Ранг матрицы равен рангу системы ее строк и рангу системы ее столбцов. В заключение укажем алгоритмы решения перечисленных выше задач 1) — 6) для произвольной системы векторов-столбцов (8). 1) Для решения задачи 1 о системе векторов (8) достаточно найти ранг матрицы А = (А[... Л^) и воспользоваться следствием 3. 2) Чтобы выяснить, выражается ли линейно вектор-столбец -4^+χ длины η через векторы системы (8), найдем ступенчатую матрицу 5", строчно эквивалентную матрице А" = (Л|... Л^Л^+j). Если она имеет тип 5(ji,..., jt), то по теореме 7 а) вектор А^ +1 линейно выражается через систему (8) тогда и только тогда, когда jt <m + \. 3) Если в обозначениях пункта 2) jt < га+1, то для решения задачи 3 матрицу 5" следует элементарными преобразованиями строк привести к специальной ступенчатой матрице. По теореме 7 б) первые t элементов последнего столбца полученной матрицы и будут коэффициентами линейного выражения вектора -4^+1 через векторы А^,..., А~4. 4) Для нахождения базиса системы векторов (8) достаточно найти ступенчатую матрицу, строчно эквивалентную Л, и воспользоваться следствием 1. 5) Чтобы выяснить, является ли система (7) базисом системы (8), составим матрицу по схеме А" = (А^ ... А\гА\ ... Л^ ), указанной в доказательстве следствия 6, и найдем ступенчатую матрицу S', строчно эквивалентную А'. По теореме 7 система (7) является базисом системы (8) тогда и только тогда, когда S" имеет тип 5(1,2,..., г). 6) Для дополнения произвольной линейно независимой подсистемы векторов (7) до базиса системы (8) воспользуемся алгоритмом пункта 5). В силу линейной независимости системы (7) полученная при этом матрица 5 будет иметь тип 5(1,..., г, t\,..., tt) при некоторых £ι,..., U G г + 1, т. Согласно следствию 1, система столбцов Ап,..., А1г, 151
A%tx»· · ·»A%t и будет одним из искомых базисов системы (8). Решение задач 1) — 6) для векторов-строк сводится к решению соответствующих задач для векторов-столбцов, транспонированных к исходным векторам-строкам. § 4. Подпространства арифметических пространств Пусть Ρ — поле и Ln — любое из арифметических пространств Рп, р{п) Определение 11. Подпространством пространства Ln назовем любое непустое подмножество К С Ln, замкнутое относительно операций сложения векторов и умножения их на элементы поля Р, т. е. удовлетворяющее условиям: 1)\/α,β€Κ:(αβ£Κ), 2) Va €K,Vc€P: (ас € К). Обозначение: К < Ln. Примерами подпространств в Ln могут служить нулевое подпространство, состоящее из одного нулевого вектора 0, само пространство Ln, множество векторов вида {otici + ... + awcw: cb...,cm € Ρ}, где αϊ,..., ат — произвольная фиксированная система векторов из Ln. (Проверьте это в качестве упражнения.) Как и для конечных систем векторов, для подпространств из Ln можно определить понятие базиса. Определение 12. Базисом ненулевого подпространства К пространства Ln называется любая его конечная система векторов: &,...,&, (9) удовлетворяющая условиям: а) система (9) линейно независима, б) любой вектор из К линейно выражается через векторы системы (9). Базисом нулевого подпространства считается пустая система векторов. 152
Теорема8. Любое подпространство К пространства Ln имеет базисы и любые два его базиса равномощны. D По следствию 4 теоремы 7 любая конечная линейно независимая система векторов из К содержит не более η векторов. Следовательно, в К существуют конечные линейно независимые системы с наибольшим числом векторов. Из утверждения 5 следует, что любая из них является базисом К, Пусть система (9) и система векторов 71,... Л. (Ю) являются базисами К. Тогда очевидно, что каждая из них является базисом конечной системы векторов 7i,...,7a,A,...,A. (11) Отсюда и из следствия 6 теоремы 7 имеем: s = t. D Из доказанной теоремы следует, что корректно Определение^. Число элементов в любом из базисов подпространства К пространства Ln называется размерностью подпространства К и обозначается через dim К, Следующее утверждение описывает все базисы подпространства К из Ln. Утверждение 9. Если К < Ln и dim К = t, то любая конечная линейно независимая система векторов из К содержит не более t векторов, и любая такая система из t векторов является базисом подпространства К. D Пусть (9) есть базис К и (10) — любая линейно независимая система векторов из К. Рассмотрим систему векторов (11). По утверждению 8 систему (10) можно дополнить до базиса системы (11), который, согласно следствию 6 теоремы 7, состоит из t векторов. Следовательно, s < t и при s = t (10) есть базис системы (11). Остается заметить, что любой базис системы (11) является базисом пространства К, О В заключение рассмотрим вопрос о числе векторов и различных базисов в пространствах из Ln над конечным полем. УтверждениеЮ. Пусть Ρ — конечное поле из q элементов, К — подпространство из Ln и dim Jf = t > 0. Тогда: а) \К\ = ς'; 153
б) число различных базисов пространства К равно 1=0 G а) Пусть (9) есть базис пространства К. Из определения базиса и утверждения б следует, что любой вектор α из К однозначно представляется в виде α = βχΟχ 4-... + &с4. С другой стороны, из определения 11 видно, что β\0\ + ... + &tCt G К при любых с\,..., с* G Р. Следовательно, число векторов в К равно числу различных наборов (сь..., Ct) элементов поля Р, которое, очевидно, равно ql. б) Укажем алгоритм построения всех базисов пространства К. Так как dim К > 0, то в К существуют ненулевые векторы. Возьмем любой из них αι. Если t = 1, то процесс окончен. В противном случае, в К есть векторы, не выражающиеся линейно через αχ. Возьмем любой из таких векторов с*2. Продолжим этот процесс до тех пор, пока не получим систему из t векторов аьс*2,...,at. По утверждению 4 любая такая система линейно независима и по утверждению 9 является базисом К. Легко видеть также, что указанным способом может быть получен любой базис пространства К. Теперь заметим, что при любой уже выбранной системе из г векторов αϊ,..., аг (г + 1)-й вектор может быть выбран в \Κ\{αχθχ + ... + агсг : сь..., сг G Р}\ (12) вариантах. По утверждению 10 а) \К\ = ql, а из утверждения 6 следует, что |{aici -f ... + arcr : ci,..., <ν G P}\ = qr. Значит, в описанном выше процессе (г-Ы)-й вектор может быть выбран в qt—qr вариантах. Отсюда и следует утверждение б). D Следствие. Число невырожденных матриц размера η χ η над конечным полем из q элементов равно ПГ=Го (Яп "" Я1)· G На основании следствия 5 теоремы 7 и утверждения 9 имеем: матрица А из Рп,п тогда и только тогда невырожденна, когда система ее строк является базисом пространства Рп. Далее остается применить утверждение 10 б) при t = п. D Задачи 1. Подсчитать число подматриц порядка г в матрице размеров тхп. 154
2. Доказать, что ранг матрицы вида ( * „ 1 равен сумме рангов матриц Л, В. 3. Решить матричное уравнение АХ А = Л, где А — заданная матрица размеров га χ п. Сколько решений имеет это уравнение над полем из q элементов.(Указание: воспользоваться канонической формой матрицы А.) 4. Оценить сверху число сомножителей в произведениях элементарных матриц, которыми можно представить все невырожденные матрицы размеров η χ п. 5. Найти число векторов из Рп, представимых в виде линейных комбинаций т заданных векторов, если Ρ — конечное поле из q элементов. 6. Описать конечные системы векторов с единственным базисом. 7. Описать матрицы, имеющие единственную ранговую подматрицу. 8. Доказать, что ранг суммы матриц не превосходит суммы рангов исходных матриц. 9. Сколько линейно независимых систем по г векторов существует в пространстве Рп над конечным полем Ρ из q элементов? Сколько в нем существует подпространств размерности г? 10. Две конечные системы векторов из Рп называются эквивалентными, если все векторы каждой из них являются линейными комбинациями векторов другой системы. Доказать, что определенное таким образом отношение для систем векторов из Рп является отношением эквивалентности. Показать, что произвольная система векторов эквивалентна своему базису. 11. Доказать, что матрицы Л, В одинаковых размеров строчно эквивалентны тогда и только тогда, когда системы векторов-строк этих матриц также эквивалентны (в смысле определения из задачи 10). 12. Пусть Smxn — специальная ступенчатая матрица. Доказать, что для любой матрицы Akxm матрица AS является специальной ступенчатой в том и только том случае, когда А — специальная ступенчатая матрица. Найти тип матрицы AS по типам матриц Л, 5. 13. Доказать, что в кольце матриц РП}П над полем Ρ делители нуля исчерпываются ненулевыми вырожденными матрицами. 155
Глава VIII СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ На важность задачи решения уравнений и систем уравнений в любых алгебрах указывалось в § 2.Ш. Для колец и полей в общем случае эта задача является очень сложной, а иногда и неразрешимой в принципе. Вместе с тем, для одного частного вида систем уравнений над полями, называемых системами линейных уравнений, указанная задача решается сравнительно просто. Общий подход к исследованию и решению таких систем уравнений основан на использовании матричного аппарата и применим к системам уравнений над произвольным коммутативным кольцом с единицей. Для систем уравнений над полями он приводит к наиболее законченным результатам и, в частности, к алгоритмам распознавания разрешимости и нахождения всех решений. § 1. Системы линейных уравнений над коммутативным кольцом с единицей. Равносильность систем уравнений. Теорема Крамера Зафиксируем произвольное коммутативное кольцо R с единицей. Определение1. Отображение f:Rn—*R называется аффинной функцией от η переменных над кольцом Д, если существуют такие элементы αο, αϊ,..., αη, что: Vrb. ,.,rnG R: /(η,... ,rn) = α0 + αλτχ + ... + anrn. В частности, при αο = 0, функция / называется линейной. Используя символы переменных х\,..., хп указанную аффинную функцию / можно записать в виде /(жь...,хп) =α0 + α\Χι + ... + апхп. 156
Для аффинных функций от переменных χ ι,..., хп над R естественным образом определяются операции сложения и умножения на элементы из R: (α0 + αχχχ + ... + апхп) + (Ь0 + Ь\Хг + ... + Ьпхп) = = (а0 + Ьо) + (ai + bi)xi + ... + (ап + bn); r(a0 + a\X\ + ... + anxn) = (ra0) + (ra\)x\ + ... + (ran)xn. Определение 2. Системой линейных уравнений с неизвестными χι,..., хп над кольцом R называется любая система уравнений вида: /ι(ζι, · ·. ι Хп) = 9\ (х\, · · · j Хп)ι (1) /mv^l» · · · > ^п) = ^mV^l) · · · > хп)у где m > 1, а /ι,..., /m, #ь...,#m — аффинные функции над R. ОпределениеЗ. Решением системы уравнений (1) называется упорядоченный набор η = (ci,..., сп) элементов из R, при подстановке которых в уравнения вместо соответственно неизвестных χι,... ,хп все уравнения системы (1) превращаются в верные равенства между элементами кольца Д. В этом случае говорят также, что набор, или вектор, 7 удовлетворяет системе уравнений (1). Определение 4. Система уравнений над R называется совместной, если она имеет хотя бы одно решение, определенной, если имеет ровно одно решение, и неопределенной, если имеет более одного решения. Система уравнений, не имеющая ни одного решения, называется несовместной. Исследовать систему уравнений — значит выяснить, совместна она или нет, и если совместна, то — определена или нет. Решить систему — значит найти все ее решения. Определение 5. Две системы уравнений над R с одними теми же неизвестными называются равносильными, если множества их решений совпадают. Для нахождения решений системы обычно стремятся предварительно преобразовать ее к какой-либо более простой системе, равносильной исходной системе. Так, например, очевидно, что, прибавив к обеим частям любого уравнения системы (1) произвольную аффинную функцию, мы получим систему, равносильную системе (1). Пользуясь такими 157
преобразованиями, можно переносить слагаемые из одной части уравнения в другую (с изменением знака) и, в частности, привести любую систему линейных уравнений над R к равносильной ей системе уравнений вида: auxi + ... +αιηχη = 6Ь (2) ^ml^m + . . . + Qmn%n = 0m> где dij,bi Ε R для всех tGl,m,j6l,n. Используя обозначения f bi \ f χι A = (ai:,)mxn, β1 = ... J , χ1 = ... систему (2) записывают в матричной форме: Αχί=βί. (3) При этом матрицы А и В = (Α,β^) называют соответственно основ- ной и расширенной матрицами системы уравнений (3), а вектор /?* — столбцом свободных членов. В связи с использованием матричной формы записи решение η = (с\,... ,сп) удобнее записывать в виде столбца и обозначать через 7*. Теорема1(о равносильности систем линейных уравнений). Если U — обратимая (га χ т)-матрица над Я, то система уравнений (3) равносильна системе (UA)xl =υβι. (4) D Пусть 7* ~ есть решение системы (3). Тогда Αη^ = /?* — верное равенство. Умножив обе его части слева на матрицу С/, получим верное равенство (Е/А)7* = t//?*> свидетельствующее о том, что 7* ~~ решение системы (4). Таким образом, всякое решение системы (3) является решением системы (4). Аналогично, используя умножение на матрицу С/""1, можно доказать и обратное утверждение. Следовательно, системы (3) и (4) равносильны. D Следствие. Если матрицы (Л, /?*) и (С, ίΑ) строчно эквивалентны, то система уравнений (3) равносильна системе Сх1 =ί*. Применим теорему 1 к решению системы (3) в одном частном случае, когда т = пи матрица А обратима. 158
Теорема2 (Крамер 8). Если (3) есть система η линейных уравнений с η неизвестными над R и ее основная матрица А обратима, то система (3) имеет единственное решение 7 = (сь ... ,Сп), где: Сг = \А\-1\Аг1 ieui, (5) Аг — матрица, полученная из А заменой г-го столбца столбцом свободных членов /?^. (Равенства (5) называют формулами Крамера.) D По теореме 1 система уравнений (3) в рассматриваемом случае равносильна системе г.1 Л-1/?1, (6) которая, очевидно, имеет единственное решение. Найдем каждое неизвестное хг отдельно. Для этого запишем равенство (6) более подробно, с использованием правила нахождения матрицы Л""1, указанного в доказательстве теоремы 7.VI: ί Х1\ Х2 \ Хп ) \А\- ΑηΑ2ι. А12А22 ■ ■ АП1 ■ Ап2 ΑιηΑ2η... Апп J I Ьг \ b2 \bn J (7) (Напомним, что здесь Агз есть алгебраическое дополнение элемента агз матрицы А.) Приравнивая координаты векторов-столбцов из левой и правой частей равенства (7), получим: хг = ΙΑΓΗΜίι + b2A2l + ... + ЬпАпг) = \Α\~ιΔ„ г € ТТ^- Сравнивая Дг с разложением определителя матрицы А по ее г-му столбцу (см. следствие 1 теоремы 6.VI): \А\ = auAu + а2гА2г + ... + апгАпгу замечаем, что Дг есть определитель матрицы Аг. D Таким образом, для нахождения решения системы (3) в рассматриваемом случае можно воспользоваться или формулами (5), для чего понадобится вычислить определители η + 1 матриц п-го порядка, или формулой (6), для чего понадобится найти матрицу, обратную к А. Оба метода при достаточно больших η являются весьма сложными. В связи с этим теорема Крамера имеет, в основном, теоретическое значение. 8 Г. Крамер — швейцарский математик (1704-1752). 159
§ 2. Системы линейных уравнений над полем Рассмотрим один из наиболее распространенных на практике методов решения систем линейных уравнений над полем, называемый методом Гаусса, Пусть дана система уравнений (3) над произвольным полем. Если А = OmXn, то система совместна только при /?* = 0*. При выполнении этого условия любой вектор из Р^ является ее решением. Далее считаем, что А — ненулевая матрица. Приведем расширенную матрицу В = (А,/?*) к специальному ступенчатому виду с помощью элементарных преобразований строк, что можно сделать согласно следствию 1 из теоремы 3.VII. Пусть при этом получилась матрица С = (cl>7)mx(n+i) типа 5(г*1,...,гг) . Тогда по следствию из теоремы 1 система (3) равносильна системе уравнений Cx1=7i, (8) где С = (ctJ)mxn, a 7^ — последний столбец матрицы С. В зависимости от значений параметров г,ii,... ,гг возможны следующие три принципиально различных случая. 1) гг = η 4- 1. В этом случае по теореме 7.VII столбец /?* матрицы В не выражается линейно через столбцы матрицы Л, и по теореме 4.VI система уравнений (3) несовместна. 2) гГ < п, г = п. В этом случае матрица С имеет тип 5(1,2,..., п), а тогда по теореме 7.VII и ее следствию 1 имеем: /?* = j4}cin+i 4- ... ...4 j4jjCnn+i и система столбцов Л},..., А\^ линейно независима. Отсюда и из утверждения 6.VII следует, что столбец 7* является единственным решением системы уравнений (3). Следовательно, в рассматриваемом случае система (3) совместна и определенна. 3) гг < п, г < п. Рассмотрим в этом случае подробнее систему уравнений (8). Удалив из нее все уравнения вида Οχι 4 ... 4· 0хп = 0 (9) (если такие есть) и перенеся в оставшихся уравнениях все слагаемые, 160
кроме хп,..., хХг в правую часть, получим систему уравнений (ю) которая, очевидно, равносильна системе (8). Подставляя в (10) вместо #*,+!»· ··<·#*« произвольные элементы агг+1,... ,аг„ поля Р, мы однозначно определим значения а1х,..., alr остальных неизвестных хг1,..., хх так, что набор (αχ,... ,αη) будет решением системы (10). Нетрудно заметить, что каждое решение системы (10) можно получить указанным способом. Так как г < п, то система (10) (а потому и (3)) имеет в рассматриваемом случае более одного решения. Анализируя случаи 1) - 3), нетрудно заметить, что они характеризуются следующими условиями: 1) rang С < rang С, 2) rang С = rang С = п, 3) rang С" = rang С < п. Так как матрицы С", С строчно эквивалентны соответственно матрицам А,В = (А,/?*), то, учитывая теорему 1.VII, можно сделать следующий вывод. При решении системы уравнений (3) методом Гаусса логически возможны следующие взаимно исключающие случаи: 1) rang А Ф rang Б, система несовместна; 2) rang A = rang Б = п, система совместна и определенна; 3) rang A = rang Б < п, система совместна и неопределенна (при этом все ее решения однозначно определяются наборами значений лишь некоторых η - г фиксированных неизвестных). Отсюда получаем ответы на все основные вопросы, связанные с исследованием систем линейных уравнений над полем Р. ТеоремаЗ (критерий совместности). Система линейных уравнений над полем совместна тогда и только тогда, когда ранг ее основной матрицы равен рангу расширенной матрицы. Эту теорему называют теоремой Кронекера-Капелли в честь немецкого математика Л. Кронекера (1823-1891) и итальянского математика А. Капелли (1855-1910). Теорема4 (критерий определенности). Система линейных уравнений над полем имеет единственное решение тогда и только тогда, когда ранги основной и расширенной матриц системы равны числу ее неизвестных. 161
Теорема 5. Совместная и неопределенная система линейных уравнений над полем Ρ имеет бесконечно много решений при бесконечном поле Ρ и qn~r решений при \Р\ = q, где η — число неизвестных, а г — ранг основной (и расширенной) матрицы системы. Рассмотрим еще метод решения систем линейных уравнений над полем, основанный на использовании ранговых подматриц матриц этих систем. Пусть дана система (3) с основной матрицей А и расширенной матрицей В = (Α,βί) и известно, что rang Л = rang В = г. Выберем в матрице А произвольную ранговую подматрицу а' = а(%1~·1'). Так как rang В = г и А есть подматрица матрицы В, то Л' является ранговой подматрицей и для матрицы В. Отсюда и из следствий 3 и 6 теоремы 7.VII легко получить, что система строк Вг1,..., В%г является базисом системы всех строк матрицы В. Поэтому матрицу В элементарными преобразованиями строк можно привести к матрице вида: ац1 a,linbH \ О 00 0 00 / Тогда по следствию из теоремы 1 система (3) равносильна системе уравнений Л'я* =/?'*, (11) где /?'* — последний столбец матрицы В\ а А получена из В' удалением столбца /?'*. Удалив из системы (11) последние га — r уравнений вида (9) и перенеся в оставшихся уравнениях в правые части все слагаемые, не содержащие неизвестных хп,... ,х3г получим систему из г уравнений, равносильную системе (3): °ί\3\^3\ "г · · · "г o,tlj1Xj1 = btl — atljt+lXjJ+1 — ... — aiij„^j„» ·_· (12) в которой {jr+i,...,j„} = I7n\{ji,... ,jr}- B' = 0 V "б ) 162
Подставив в (12) вместо xJr+l,... ,#jn произвольные элементы из Р, мы получим систему г уравнений с г неизвестными хп,..., χ3ι, которая по теореме Крамера имеет единственное решение хп = ал,..., х3г = = aJr. В итоге мы найдем решение (αχ,... ,αη) системы (12) (а потому и системы (3)). Легко видеть, что таким образом можно получить все решения системы (12). Действительно, если η = (ci,..., сп) — любое решение системы (12), то, заменив в (12) хх на Οχ при всех г € 1,п, получим систему верных равенств, которая свидетельствует о том, что сп,..., cJr есть решение системы, полученной из (12) заменой Xjr+i,...,#Jn соответственно элементами cJr+1,..., cJn. 3 а м е ч а н и е 1. Вместо того чтобы решать методом Крамера все системы уравнений, получаемые из (12) заменой Xjt+i,...,#Jn всевозможными элементами поля Р, можно решить методом Крамера саму систему (12), считая xJr+1,... ,xJn параметрами со значениями из поля Р. В итоге неизвестные хп,..., xJt будут представлены в виде аффинных функций от переменных xJr+l,.. , xJn. Придавая последним произвольные значения из Ρ и вычисляя соответствующие значения неизвестных х3х,..., хдг получим все решения системы (12), а значит, и системы (3). Замечание 2. Набор неизвестных хЭт+1,..., х3п из правых частей уравнений системы (12) называют системой свободных неизвестных системы уравнений (3). В общем случае система свободных неизвестных для системы (3) находится неоднозначно, а определяется выбором ранговой подматрицы в матрице А. § 3. Система линейных однородных уравнений Определеннее. Система линейных уравнений называется системой линейных однородных уравнений, если ее столбец свободных членов является нулевым вектором. Произвольной системе линейных уравнений (3) можно поставить в соответствие систему линейных однородных уравнений Ах1=01, (13) 163
заменив в (3) столбец свободных членов /?* нулевым вектором-столбцом О*. Полученная система (13) называется ассоциированной с системой (3). Заметим, что любая система линейных однородных уравнений совместна, поскольку имеет нулевое решение 0* = (0,... ,0)т. В теории систем линейных уравнений системы однородных уравнений играют важную роль вследствие особых свойств их решений и существующей простой связи между решениями произвольной системы линейных уравнений и ассоциированной с ней системы линейных однородных уравнений. Теоремаб. Множество Μ решений системы линейных однородных уравнений (13) с η неизвестными над полем Ρ является подпространством пространства Р^ и dim Μ — η — rang Α. D Если α^,βί € Μ, то Аа*- = 0*,Д9* = 0* — верные равенства. Отсюда получаем: Α(αι + β1) = Ααι + Αβι = О1 + О1 = О1, А(а1г) = (Аа1) · г = О1 · г = О1, г £ Р. Следовательно, α* + /?*,α* · г € М, и, согласно определению 11.VII, Μ — подпространство пространства Р(пК Найдем базис пространства М. Если rang А = п, то по теореме 4 система (13) имеет единственное решение — нулевое и базисом пространства Μ является пустая система векторов. Следовательно, в этом случае dim Μ = 0 = η — rang A> и утверждение теоремы 6 о размерности пространства Μ верно. Если же rang А = г < п, то, как и в общем случае, решая систему (13) с помощью ранговых подматриц, получим равносильную ей систему уравнений вида (12) при btl = ... = btr = 0. Все решения системы (12) находятся известным способом. Придадим ее свободным неизвестным xJr+l,... ,х3п произвольные значения из Р: ХЗг+1 ~?т +1 » * * * 1 Х3п Ч?п » и по ним однозначно найдем значения остальных неизвестных: х3\ == с3\» · · · » x3r = с3г · Расположив элементы сл,..., сЭп так, чтобы их индексы шли в порядке возрастания, получим решение системы (12): 7* = (ci,... ,сп)т. 164
Подчеркнем особо, что все координаты вектора 7*> как и любого решения системы (12), однозначно определяются значениями свободных неизвестных xh+l,...,х3п. Найдем указанным образом η — г решений, придавая поочередно одному из свободных неизвестных значение е, а остальным — нуль. Значения неизвестных х\,... ,хп (т. е. координаты) в полученных решениях 7Ы,-..,7£-г (14) запишем в таблицу 5. Таблица 5 Решения 7* . . In—r Значения неизвестных c\n,..., c\3t e 0... 0 ^n—rj\) · · ·) cn_rjT и и... e Из таблицы видно, что в матрице С, составленной из столбцов (14), минор Мс \ у**1' * ">Jn ] отличен от 0. Тогда по следствию 3 из тео- \ 1,...,гс-г ) ремы 7.VII система векторов (14) линейно независима. Покажем, что она является базисом пространства М. Для этого остается показать, что любой вектор из Μ является линейной комбинацией векторов (14). Пусть а1 = (αι,α2,... ,αη)τ € Μ, т. е. α* — решение системы (12). Рассмотрим следующую линейную комбинацию векторов (14): 71 = 7ι4Γ+1 + 72Чг+2 + · · · + 7i-r<*jn. Так как Μ — пространство и 7ι> · · · ιΊη-r € Μ, то 7* € Μ, т. е. 7* — решение системы (12). Из таблицы 5 видно, что в решении 7* значения неизвестных xJr+l,..., х0п равны соответственно aJf+1,..., а3п. Таким образом, в решениях а* и 7* системы (12) значения свободных неизвестных одни и те же. А так как значения свободных неизвестных однозначно определяют решения, то а* = 7*» и значит, а* есть линейная комбинация системы векторов (14). D Определение?. Система решений системы линейных однородных уравнений называется ее фундаментальной системой решений (ФСР), если она является базисом пространства всех ее решений. 165
Так, например, (14) является фундаментальной системой решений системы уравнений (13). В общем случае ФСР находится неоднозначно. Даже в указанном выше способе нахождения ФСР системы уравнений (13) имеется большой произвол. Он связан и с выбором ранговой подматрицы матрицы А, а значит, и системы свободных неизвестных, и с выбором значений для свободных неизвестных. Вместе с тем, из теорем 6 и 8.VII имеем Следствие1. Любая система линейных однородных уравнений имеет ФСР и любая ее ФСР содержит ровно η — r векторов, где η — число неизвестных, а г — ранг основной матрицы заданной системы уравнений. Следствие 2. Если а},.. .,α^,. — любая ФСР системы линейных однородных уравнений, то множество всех решений системы совпадает с множеством векторов Μ = {a[ci + ... + о4_гсп_г :сь...,сп-г € Р). При этом выражение а[сх + ... + а1п-гсп-г (15) называют общим решением системы (13). Теорема 7. Множество Μ всех решений произвольной совместной системы линейных уравнений представляется в виде Μ = а1 + Мо, где а^ — любое одно ее решение, a Mq — множество всех решений ассоциированной с ней системы линейных однородных уравнений. D Пусть а* — любое решение, Μ — множество всех решений системы (3), Mq — множество всех решений ассоциированной с ней системы (13). Докажем включения: аЧМ0СМ, Μ С а1 + М0. Пусть 7* € а* 4- Мо, т. е. 7* = <** 4- £*, где δ^ — подходящий вектор из Mq. Тогда имеем Αγ1 = А(а1 + δ1) = Аа1 + Αδι = β1 + О1 = β1. Значит, 7* € Μ, и потому а* 4- Мо С М. 166
Пусть 7* € Μ, т. е. Αη^ = /?*. Тогда А(<у1 - а1) = Αγι - Аа1 = /J* - /J* = О1, и потому 7^ ~ о^ € Μο· Следовательно, 7* € α* 4- Mo и Μ С аЦ Mo. D Если а* — решение системы (3), a (15) есть общее решение ассоциированной с ней системы (13), то, как следует из теоремы 7, множество Μ всех решений системы (3) можно записать в виде Μ = {α1 + a[ci + ... + а£_гСп-г : сь... ,сп_г € Р}. В связи с этим выражение а1 + a[ci + ... + а^_гсп-г называют общим решением системы (3). Задачи 1. Уравнение с неизвестными х\у...,хп называют следствием сов- местной системы уравнений с теми же неизвестными, если ему удовлетворяют все решения этой системы. Доказать, что уравнение а\Х\ + ... ... 4- апхп = Ь является следствием совместной системы Ах^ = β^ тогда и только тогда, когда вектор (αχ,...,αη,6) является линейной комбинацией строк матрицы (А,/?*). Сформулируйте основанный на этом утверждении критерий равносильности систем уравнений. 2. Докажите, что совместные системы уравнений Атхп% = н -> (^тхпЯ = о равносильны тогда и только тогда, когда матрицы (Α,β^) и (С,δ^) строчно эквивалентны. 3. Привести примеры систем линейных уравнений, в которых одно из переменных: а) не может быть включено ни в какую систему свободных неизвестных; б) входит в любую систему свободных неизвестных; в) входит в одну систему свободных неизвестных и не входит в какую- либо другую систему свободных неизвестных. 4. Сколько решений может иметь система из η — 1 линейных уравнений с η неизвестными над полем GF(2)? 167
5. Дать геометрическую интерпретацию для системы трех линейных уравнений с тремя неизвестными над полем R и множества ее решений при всех возможных значениях рангов основной и расширенной матриц. 6. Оценить сверху сложность решения системы η линейных уравнений с η неизвестными над полем Ρ методом Гаусса, понимая под сложностью число всех арифметических операций над элементами поля Р. 7. Доказать следующее обобщение теоремы Кронекера-Капелли: матричная система уравнений АХ = В совместна тогда и только тогда, когда rang( А, В) = rang А. 8. Сколько фундаментальных систем решений имеет система уравнений Атхпх^ = 0* над полем Р, если rang А = г, и как все их найти? 9. Пусть а* — решение системы уравнений Ах^ = /?*, где /?* Φ 0*, и а},... ,α£ — ФСР системы уравнений Ах^ = 0*. Доказать, что система векторов а, а},...,а\. линейно независима. 10. Доказать, что любое подпространство Μ пространства Р^ совпадает с множеством всех решений подходящей системы однородных линейных уравнений. 11. Доказать, что для любой линейно независимой системы векторов а, а{,..., а\. из Р^ существуют матрица А(П_Г)ХП ранга η — г и вектор βί £ р(п) такие> что al _|_ ajCl _|_ _|_ alCr есть общее решение системы уравнений Ах^ = /?*.
Глава IX МНОГОЧЛЕНЫ Как читатель уже заметил, один из основных методов алгебры состоит в том, что решение какой-либо задачи для данного алгебраического объекта сводится к решению более простой задачи для другого алгебраического объекта, определенным образом построенного из исходного. Например, решение системы линейных уравнений над кольцом R сводится к решению простейшего уравнения над кольцом матриц Дп,п> решение сравнения над Ζ сводится к решению уравнения над кольцом вычетов Zm. В связи с этим, в алгебре много внимания уделяется различным способам конструирования из данных алгебраических объектов новых объектов и изучению свойств последних. В этой главе изучается еще одна важная конструкция подобного типа — кольцо многочленов над данным кольцом. К необходимости использования и изучения понятия многочлена приводят многие алгебраические задачи. Простейшая (по формулировке) и древнейшая из них — задача о решении уравнения вида: апхп + ... + а\х + ао = О над данным кольцом. Этим, однако, далеко не исчерпывается область приложений многочленов в алгебре. Как читатель увидит далее, с помощью многочленов описываются преобразования колец и полей, изучаются свойства матриц, из исходных полей строятся различные новые поля с заданными свойствами и решаются многие другие задачи. Читатель уже знаком с понятием многочлена из средней школы. Однако мы начнем изложение теории многочленов с их формального определения, которое, на первый взгляд, может показаться неестественным и неудобным, но в действительности позволяет наиболее экономным способом добиться нужной строгости и перейти к общепринятой терминологии. 169
§ 1. Кольцо многочленов над кольцом с единицей 1. Пусть R — произвольное кольцо с единицей е. Определение1. Многочленом над R назовем любую бесконечную последовательность (at) = (α0,αι,...,αη,....) (Ι) элементов at € Д, г G No, в которой все at, за исключением конечного их числа, равны нулю. Элементы аг назовем коэффициентами многочлена (1). Многочлен (0) = (0,0, ) назовем нулевым. Обозначим через M(R) множество всех таких последовательностей. Определение 2. а) Суммой многочленов (at), (6t) € M(R) называют последовательность (C) = (a,) + (M, (2) в которой Сг = аг 4- Ьх для всех г € No- б) Произведением многочленов (аг) и (6t) называют последовательность (d.) = (a,) · (bt), (3) г в которой d» = ]P Q>kb%-k для всех г € No. fc=0 в) Произведением многочлена (аг) € М(Д) wa элемент г € R слева или справа называют, соответственно, последовательность г(аъ) = (ra0,rai,...) или (at)r = (a0r,air,...). (4) г) Суммой элемента г € R и многочлена (аг) € M(R) называют последовательность г + (аъ) = (аъ) + г = (ao + rfab..., ап,...). (5) Нетрудно видеть, что в последовательностях (2)—(5), так же как и в исходных последовательностях, все коэффициенты, за исключением конечного их числа, равны нулю, и потому эти последовательности принадлежат M(R). 170
Замечание!.. Операции сложения, введенные в пунктах а) и г) определения 2, различны, хотя для удобства и обозначаются одним и тем же символом +. Последнее обстоятельство не может вызвать путаницы, поскольку природа суммируемых элементов ясно указывает на то, какая из операций имеется в виду. Кроме того, различие между этими операциями имеет, по существу, лишь формальный характер, поскольку операция из пункта г) легко выражается через операцию из пункта а): г + (аг) = (г,0,...,0,...) + (а,). Используя заданные на M(R) операции, можно следующим образом перейти к традиционной форме записи многочленов. Введем обозначения: х = (0,е,0,...,0,...), (6) t нулей х% = (οΤΓΤδ,ε,Ο,...) для г € N0. (7) Заметим, что ввиду определения 26) для любых г, к € No выполняются равенства: г к fc+t хххк = (0,...,0,е,0,...)-(0,...,0,е,0,...) = (0,... ,0,е,0,...) = хг+*. Поэтому для любых i,j, к € No верны равенства: (хг -х')-хк = xt+J+fc = хх · (χ3 · xfc), (8) и для г € N символ хг обозначает ни что иное, как г-ю степень элемента х: хх = χ · χ ·... · х. Пользуясь определением 2 в), получаем, что для любых а € R и г € € No верны равенства: ахх = (0,..., 0, а, 0,...) = хга, 171
и поэтому любой многочлен (аг) = (αο,... ,αη,0,...) € M(R) может быть записан в виде суммы: (α1) = (αο,0,...) + (0,αι,0>...) + ... + (0,...,0,αη>0,...) = η = αοχ0 4- α\χι 4- ... 4- αηχη = ^J at#*· t=0 Пользуясь замечанием 1 и обозначением (6), последнюю запись многочлена (at) можно еще упростить, записав его в общепринятом виде: а(х) = αο 4- а\х 4- а^х? + ... 4- апхп. (9) Определение 3. При введенных обозначениях многочлен (9) называют многочленом от χ над кольцом Д, а элементы at € R называют его коэффициентами. Говорят, что аг — коэффициент многочлена а(х) при х*, а ао — его свободный член. Множество M(R) называют множеством многочленов от одного переменного χ над кольцом R и обозначают: M(R) = R[x]. Замечание 2. Подчеркнем, что многочлен а(х) € R[x] вида (9) имеет бесконечно много коэффициентов at,i G No, а равенство (9) означает, что an+i = an+2 = ... = 0. При этом возможно, что и ап = 0. В частности, согласно определениям 1 и 3, многочлен (9) равен многочлену Ь(х) = Ь0 + Ьгх 4 ... + Ьтхт (10) тогда и только тогда, когда аг = Ьг для всех г € No. Определение 4. Степенью многочлена а(х) € R[x] называют параметр dega(x), равный наибольшему из номеров г его ненулевых коэффициентов аг, если а(х) φ 0, и равный —оо, если а(х) = 0. Если dega(x) = η € No, то коэффициент an многочлена а(х) называют его старшим коэффициентом, а слагаемое апхп — старшим членом многочлена а(х) и обозначают через Ст(а(х)) : апхп = Ст(а(х)). 172
Как нетрудно увидеть из определения 2 а), б), сумма и произведение многочленов (9) и (10) могут быть записаны следующим образом: t а(х) 4- Ь(х) = ]ζ(α» + Ь%)хг1 t = max{ra,rc}; а{х) - b{x) = aobo + (α06ι + а\Ьо)х + ... . · · + (an-i6m + afAi»-1)xw+n-1 + an6mxm+n. Отсюда легко следует. (Проверьте!) Утверждение!.. Для любых многочленов а(х), Ь(х) € R[x]: а) deg(a(x) -fb(x)) < max{dega(x),degb(x)}, причем последнее неравенство является строгим тогда и только тогда, когда Ст(а(ж)) = - Ст(Ь(х)); б) deg(a(x) · b(x)) < dega(x) 4- degb(x), причем последнее неравенство обращается в равенство тогда и только тогда, когда либо один из многочленов а(х), Ь(х) равен 0х°, либо произведение их старших коэффициентов отлично от нуля; в) если в кольце R нет делителей нуля (в частности, если R — поле), то deg(a(x) · b(x)) = dega(x) 4- degb(x). Иногда, при проведении формальных выкладок, многочлен а(х) вида (9) удобно бывает записывать в виде следующей формально бесконечной суммы: оо а(х) = }агхг = } агхг. t>0 г=0 При этом надо лишь помнить, что в действительности выписанная сумма конечна, поскольку для некоторого η € No все ее слагаемые агхг с номерами г > η есть нулевые многочлены. При такой форме записи сумма и произведение многочленов а(х) = Σ агхг и Ь(х) = Σ Ьъхг имеют »>о t>o более простой вид: г о(х) + Ь(х) = ^(а, + Ьг)хг; а(х) · Ь(х) = ]Γ)(Σ акЬг-к)хг- (11) »>0 »>0 fc=0 173
2. Докажем основной результат данного параграфа. Теорема 1. Алгебра (Д[х],+,·) многочленов над кольцом R с единицей есть кольцо с единицей. Кольцо R[x] коммутативно тогда и только тогда, когда кольцо R коммутативно, и содержит делители нуля тогда и только тогда, когда R содержит делители нуля. D Так как (Д, +) — абелева группа, то, пользуясь определением 2 а), легко проверить, что (Д[х], +) — абелева группа с нулем Ох<ь в которой противоположным для элемента а(х) = J2 агхг является элемент t>0 -α(χ) = ^2(-аг)хг. »>о Докажем дистрибутивность умножения относительно сложения на R[x]. Пусть с(х) = а(х)-Ь(х) и Ь(х) = f(x)+g(x). Тогда bk = fk+gk для к € N0, и для коэффициентов многочлена с(х) из (11) следуют равенства: а а г сг = 22 а*-*^ = 22 a*-kfk + 22 at-k9k· fc=0 fc=0 fc=0 Поэтому, если a(x)f(x) = ^2 г*г#\ a(x)#(x) = ^ υ»χ% T0 c» = ut + vt для ι>0 i>0 всех г € No, т. е. а(х) - (/(χ) + g(x)) = а(х) · f(x) + а(х) - g(x). Левая дистрибутивность доказана. Правая дистрибутивность доказывается аналогично. С использованием свойств дистрибутивности и соотношений (8), ассоциативность умножения в R[x) доказывается следующим образом. Если а(х), Ь(х), с(х) € Я[ж], то: (а(х).б(х))-с(х) = & <*.*ι·Σ ь>*3) Σ c***=Σ Σ Σ(α·Μ<**,+,+''■ »>0 3>0 к>0 t>0j>0fc>0 Так как (atbj)ck = ^(bjCk) ввиду ассоциативности умножения в Д, то последнюю сумму можно переписать следующим образом: (о(«) · ь(х)) · с(х) = Σ Σ Σ «.(*,<*)*t+,+t = t>0j>0fc>0 = Σα«*,(ΣΣν**,+*) = г>0 }>0 fe>0 174
= Y^atxl(Y^b7x> · ^скхк) = a{x) · (b(x) · c(x)). i>0 j>0 fc>0 Таким образом, (R[x), +, ·) — кольцо. Единицей в R[x], очевидно, является многочлен х°. Если кольцо R коммутативно, то коммутативность R[x] доказывают равенства: а(х) · Ь(х) = ^2 UibjX1*3 = ^2, bjQtX?*1 = b(x) · а(х). Если же а-Ь φ Ьа для некоторых a, b G Я, то в Л[х] не коммутируют многочлены ах° и Ьх°. Если в R нет делителей нуля, то по утверждению 1 в) для любых ненулевых а(х),Ь(х) € R[x] справедливы соотношения deg(a(x) · b(x)) = = deg a(x) 4- deg b(x) > 0 и потому а(х) · Ь(#) ^ 0х°. Наоборот, если а, 6 € € Д \ {0} таковы, что а · Ь = 0, то ах° и 6х° — делители нуля в R[x). О В дальнейшем нуль и единицу в кольце R[x] мы, для краткости, будем обозначать теми же символами, которые приняты для их обозначения в кольце Я, т. е. положим 0х° = 0, х° = е. Замечание 3. Последнее соглашение позволяет, по сути дела, отождествить любой элемент г = re из кольца R с многочленом гх° = (г,0,0,...). Такое отождествление весьма естественно, поскольку очевидно, что множество R = {гх° : г € R} есть подкольцо в Д[х], изоморфное кольцу Л, и изоморфизм R —» R задается как раз соответствием г —> гх°. Таким образом, везде, где это удобно, можно считать, что кольцо R есть подкольцо в кольце R[x]. Строгая формальная конструкция, позволяющая рассматривать R как подкольцо в Д[х], будет изложена позже в § 8.XX. § 2. Делимость многочленов. Теорема о делении с остатком Определениеб. Говорят, что элемент а кольца S делится на элемент Ь € S слева (справа), если в S разрешимо уравнение Ьх = a (yb = а). 175
Как уже отмечалось, если S — кольцо с единицей и элемент Ь обратим в S, то каждое из этих уравнений имеет единственное решение: b~la и ab~l соответственно. Если же Ь £ 5*, то даже нет алгоритма, позволяющего проверить разрешимость этих уравнений для произвольного бесконечного кольца S. Однако если S = R[x] — кольцо многочленов над кольцом R с единицей, то в 5 можно ввести понятие делимости с остатком (которое уже встречалось читателю при изучении кольца целых чисел) и предложить алгоритм, который во многих важных случаях позволяет проверить: делится один многочлен на другой или нет. Определение 6. Говорят, что в кольце R[x] многочлен а(х) делится на многочлен Ь(х) справа с остатком, если существуют многочлены Qn(x),rn(x) £ R[x] со свойствами: а(х) = Яп(х)Ь(х) + гп(х), degrn(x) < degfc(x). (12) При этом многочлены qn{x) и гп(х) называют, соответственно, неполным правым частным и правым остатком от деления а(х) на Ь(х). Аналогично определяется понятие делимости а(х) на Ь(х) слева с остатком и неполное левое частное <?л(#) и левый остаток гд(х) как многочлены, удовлетворяющие соотношениям: а{х) = b(x)qj\{x) + гл(х), degrvi(x) < deg6(x). Иногда, для краткости, многочлен qn(x) (<7л(#)) называют просто правым (левым) частным от деления с остатком а(х) на Ь(х). Замечание 4. Вообще говоря, деление с остатком в R[x] не всегда возможно, а когда возможно, то не всегда однозначно. Например, если R = Ргх2 — кольцо 2 χ 2-матриц над полем Р, то многочлен а(х) = = (оо) х ~*~ (о о) ^ ^Ν можно разделить справа с остатком на многочлен Ь(х) = (οι)χ+(οι)πο крайней мере двумя способами: При этом а(х) нельзя разделить на Ь(х) с остатком слева. (Докажите!) Однако отмеченная неопределенность исчезает при некоторых ограничениях на многочлен Ь(х). Теорем а2. Если старший коэффициент многочлена b(x) Ε Ε R[x] \ {0} обратим в кольце R, то любой многочлен а(х) £ R[x] 176
можно разделить справа (слева) с остатком на Ь(х). При этом правые (левые) неполное частное и остаток определяются однозначно. D Если dega(x) < degfc(x), то соотношения (12) выполняются при Яп(х) = 0, гп(х) = а(х). Пусть Ст(а(х)) = amxm, Ст(6(х)) = Ьпхп и т > п. Так как по условию Ьп € Д*, то в R[x] существует многочлен amb~lxm~n · 6(х). Нетрудно видеть, что его старший член равен amxm. Поэтому многочлен а\(х) = а(х) — amb~lxm~nb(x) имеет степень т\ < т. Если т\ < п, то мы уже разделили а(х) на Ь(х) с остатком справа: а(х) = (атЬ-1хт-п) · Ь(х) + аг(х). Если же πΐχ > η и Οτ(αι(χ)) = ат}жт1, то строим многочлен а2(х) = а!(х) - а£\Ь-1хт*-пЬ(х). Ясно, что dega2(x) = rri2 < mi, и справедливо соотношение a(x) = (am6^1x'"-n +aW16-1xmi-")b(x) + а2(х). Продолжая аналогично далее, мы за конечное число к шагов придем к равенству: а(х) = (оя.б-1»·»-^») + аЩЬ-'х"1^ + ... + а^Ь^х^^Щх) + ак+1, (13) в котором т> т\> ...> rrik>n> dega^+i(x). Но это и означает, что мы разделили а(х) с остатком на Ь(х) справа. Докажем теперь однозначность деления с остатком при условии теоремы. Пусть а(х) = qn(x)b(x) + rn(x), degrn(x) < degb(x), а(х) = Щ(х)Ь(х) + rff(x), deg rff(x) < deg 6(x). В таком случае справедливо равенство гп(х)—rff(x) = (Ш(х)—Яп(х)Щх)· Если qn(x) — qn(x) Φ 0, то по утверждению 16) в правой части этого равенства стоит многочлен степени не меньшей, чем deg6(x), а по 177
утверждению 1 а) степень многочлена в левой его части строго меньше, чем degb(x), что невозможно. Следовательно, ffi(x) = Яп(х)> а тогда и rn(x) = rff(z)· Доказательство возможности и однозначности деления а(х) на Ь(х) с остатком слева проводится совершенно аналогично. D Очевидно, что если R — коммутативное кольцо (в частности, если R — поле), то левые неполное частное и остаток от деления а(х) на Ь(х) (в случае их существования) являются также правым неполным частным и остатком. В этом случае говорят просто о делении а(х) на Ь(х) с остатком. Следствие 1. Если Ρ — поле и b(x) G Р[х] \ {0}, то любой многочлен а(х) € Р[х] можно -разделить с остатком на Ь(х) и притом единственным способом. D Достаточно заметить, что старший коэффициент Ь(х) отличен от нуля и потому обратим в P. D Следствие 2. 5 условиях теоремы многочлен Ь(х) делит а(х) в кольце R[x] справа (слева) тогда и только тогда, когда при делении с остатком а(х) на Ь(х) справа (слева) остаток равен нулю. D Если в (12) гц(х) φ 0, то равенство а(х) = q(x)b(x)+0 невозможно ни при каком q(x) € R[x] ввиду доказанной единственности правого остатка. D Полезно заметить, что предложенный в доказательстве теоремы 2 метод деления а(х) на Ь(х) с остатком справа есть хорошо известный метод деления "уголком", который осуществляется по следующей схеме: а(х) = атхт + ... | Ь(х) = Ъпхн + ... ОтЬ"1»т"ПЬ(») = вт6"16>»т + . . . | От6-Д«">-п + . . . + О*,^ 6" Ах"" "" = ЯП(х) _ αϊ (*)«вЦ> *·*!+... ak+i(x) = гп(х) 178
§ 3. Значение и корень многочлена. Теорема Безу. Многочлен как функция Определение?. Значением многочлена а(х) = ао 4- а\х ■+■... ... 4- апхп из R[x] в точке а € R называют элемент кольца R а(а) = а0 + ага + ... + апап. Говорят, что а — корень многочлена а(х), если а(а) = 0. Очевидно, что значение суммы двух многочленов в любой точке а € R равно сумме их значений. Для произведения многочленов аналогичное утверждение верно не всегда. Например, если элементы а, Ь € R не перестановочны, то значение в точке а произведения а(х) · Ь(х) многочленов а(х) = χ и Ь(х) = 6 не равно α(α) · 6(α). (Проверьте!) Однако справедлива Л е м м а 1. Если а(х),Ь(х) G Я[ж], с(х) = а(х) · Ь(х) и элемент а перестановочен со всеми коэффициентами правого множителя Ь(х), то с(а) = а(а) · Ь(а). D При сформулированном условии верны равенства α(α) · 6(α) = Σ Σ ^«'^^ = Σ Σ ^ι"1*' = c(a)· D »>0 7>0 »>0j>0 Важную связь между понятием делимости и понятием корня многочлена устанавливает ТеоремаЗ (Безу). Остаток от деления справа многочлена а(х) € R[x] на двучлен χ — а € R[x] равен α(α). В частности, элемент а кольца R является корнем многочлена а(х) € R[x] тогда и только тогда, когда а(х) делится справа на χ — α. D По теореме 2 а(х) можно разделить справа с остатком на χ — а = = ех - а : а(х) = q{x){x — α) + r(x), degr(x) < 1. Тогда г (х) = rx°, где г € Д, и г (а) = г. Так как для многочлена с(х) = q(x){x — а) по лемме 1 верно равенство с(а) = q(a)(a — а) = 0, то а(а) = с{а) + г(а) = 0 + г = г. 179
В частности, равенство α(α) = 0 эквивалентно равенству г = О, а последнее по следствию 2 теоремы 2 эквивалентно тому, что χ — α делит справа а(х). D Определение 7 позволяет поставить в соответствие каждому многочлену а(х) € R[x] функцию clr: Я —» Я, определяемую условием: Va € Я : aR(a) = а(а). При этом, вообще говоря, для различных многочленов а(х),Ь(х) € R[x] функции clr и Ья могут совпадать. Например, если R — конечное коммутативное кольцо, состоящее из элементов ri,...,rn, то для любого многочлена а(х) € R[x) и любого многочлена вида Ь(х) = а(х) + (х — —Γχ) · ... · (χ — rn)c(x) в силу теоремы Безу верно равенство ад = = Ья- С другой стороны, на произвольном кольце R не любую функцию φ: Я —» Я можно задать в виде φ = clr для подходящего а(х) € Я [ж]. Определеннее. Отображение φ кольца Я в себя называют полиномиальным, если для некоторого а(х) € R[x) выполняется равенство φ = clr. В этом случае говорят, что φ задается многочленом (полиномом) а(х). Позже читатель сможет показать, что если Я — коммутативное кольцо, то любое отображение φ: Я —» Я полиномиально в том и только в том случае, когда Я — конечное поле. Полиномиальность любого преобразования конечного поля вытекает из следующего общего результата. Теорема 4. Если в поле Ρ есть η попарно различных элементов αϊ,..., ап, то для любых β\,... ,/?n G Ρ существует единственный многочлен а(х) € Р[х] со свойствами: а(аг) = рг для г G l,n, dega(rr) < п. (14) D Многочлен а(х) = clq + αχχ + ... 4- αη-\χη~ι € R[x] удовлетворяет условиям (14) тогда и только тогда, когда вектор (αο,αϊ,...,αη_ι) есть решение системы линейных уравнений: /е о, а? ... аГг\ (βι\ е а2 а\ ... а£ х \ χ1 = /32 (15) \е а„ «2 ... о»"1/ W/ Эта система имеет единственное решение, так как определитель ее основной матрицы есть определитель Вандермонда, он равен Πι<ι<ί<η(α» — —а}) и отличен от нуля по условию. D 180
Замечание 5. Для построения многочлена со свойствами (14) вовсе не обязательно решать систему (15), так как он, очевидно, описывается формулой: а(х) = V* -7 - г х ^L (α, - αϊ) ·... · (α, - at-i)(at - аг+г ·... · (a, - an) t€l»n x(x - αϊ) ·... · (x - at_i)(x - at+i) ·... · (x - an), называемой интерполяционной формулой Лагранжа. Следствие!. Многочлен степени η > О над полем Ρ имеет в этом поле не более η различных корней. О В противном случае он принимает нулевое значение вп+1 точках из Ρ и по теореме совпадает с многочленом 0 4- Ох + ... 4- 0xn. D Из этого результата, в частности, следует, что для комплексного числа ζ в поле С существует не более η различных корней степени η из ζ} так как все они — корни многочлена хп — ζ (см. теорему 11.IV). Отсюда же следует, что если Ρ — бесконечное поле, то существуют не полиномиальные отображения φ: Ρ —» Р. Например, таково отображение φ, принимающее значение 0 на бесконечном множестве точек из Р, но не равное тождественно нулю. (Докажите!) С л е д с τ в и е 2. Если Ρ — бесконечное поле, то многочлены a(x),6(x) G Р[х] равны тогда и только тогда, когда равны функции ар и Ьр. § 4. Кольцо многочленов над полем. Наибольший общий делитель и наименьшее общее кратное В этом и следующем параграфах излагается теория делимости в кольце Р[х] многочленов над произвольным полем Р, аналогичная теории, изложенной в главе IV для кольца целых чисел Ζ. Основное сходство между кольцами Р[х] и Ζ состоит в том, что, согласно теореме 1 и следствию 1 теоремы 2, кольцо Ρ [ж], как и Ζ, есть коммутативное кольцо с единицей и без делителей нуля, в котором опре- 181
делено понятие деления с остатком и любой элемент можно разделить с остатком на любой ненулевой элемент единственным способом. Для дальнейшего описания свойств кольца Р[х] и сравнения их со свойствами кольца Ζ введем Определение 9. Элементы α и 6 коммутативного кольца S с единицей называются ассоциированными, если Ь = иа для некоторого обратимого элемента и Ε S. Читатель без труда проверит, что отношение ассоциированности элементов есть отношение эквивалентности на S. Очевидно, что ассоциированность чисел а, 6 Ε Ζ эквивалентна равенству \а\ = |6|, которое, в свою очередь, эквивалентно условию: а \ Ь и Ь | а. Эти результаты переносятся на кольцо Р[х] следующим образом. Утверждение 2. В кольце Р[х] обратимы все многочлены нулевой степени и только они. Для многочленов а(х),Ь(х) Ε Р[х] следующие утверждения эквивалентны: а) а(х) и Ь(х) ассоциированы; б) а(х) | Ь(х) и Ь(х) | а(х); в) а(х) | Ь(х) и dega(x) = degfr(x). D Если и(х) Ε Р[х] и u(x)v(x) = е, то по утверждению 1 в) degu(x) 4- -t-degv(x) = 0 и degti(x) = 0. Обратимость и(х) при условии degu(x) = = 0 очевидна. Импликация а) =Ф б) очевидна. Импликация б) =Ф в) легко получается с использованием утверждения 1в). Наконец, при условии в) справедливы равенства b(x) = u(x)a(x),degu(x) = 0. Следовательно, и{х) € Р[х]* и в) =* а). D В кольце Ζ особую роль играют натуральные числа: множество N замкнуто относительно умножения и с каждым ненулевым целым числом ассоциировано единственное натуральное. Подмножество с аналогичными свойствами можно выделить и в Р[х). Определение 10. Ненулевой многочлен со старшим коэффициентом, равным единице, называют унитарным. Очевидно, что множество всех унитарных многочленов из Р[х] замкнуто относительно операции умножения, и, так как Р[х]* = Р*, то с любым ненулевым многочленом f(x) € Р[х) ассоциирован единственный унитарный многочлен, который мы будем обозначать символом Однако аналогия между унитарными многочленами и натуральными числами имеет ограниченную область применения. В частности, ес- 182
ли целое а делится с остатком на b Ε Z/{0], то остаток г есть либо нуль, либо натуральное число. Если же многочлен а(х) € Р[х] делится с остатком на Ь(х) G Р[#]\{0} и остаток г(х) отличен от нуля, то г(х) не обязательно унитарный многочлен. Аналогия между г и г(х) здесь состоит в том, что г удовлетворяет условию О < г < |Ь|, а г(х) — условию degr(x) < degfc(x). Ниже все результаты о многочленах из Р[х] формулируются по аналогии с результатами о целых числах и излагаются практически без доказательств, которые читателю предлагается восстановить самостоятельно по доказательствам соответствующих результатов из гл. IV. ОпределениеП. Наибольшим общим делителем (НОД) многочленов αι(χ),... , αη(χ) € Р[х] называют многочлен d(x) e Р[х] такой, что: а) d(x) есть общий делитель многочленов αι(χ),... ,αη(χ); б) d(x) делится на любой другой общий делитель этих многочленов. Совокупность всех НОД указанных многочленов обозначают через НОД{а!(х),...,ап(х)}. Прежде чем доказывать существование НОД для любого набора многочленов, покажем, что для описания всего множества НОД {αϊ (χ),... ..., ап(х)} достаточно найти один его элемент. Утверждение 3. а) Если а\(х) = ... = ап(х) = 0, то НОД{а1(х),...,ап(х)} = {0}; б) Если среди многочленов αι(χ),... ,ап(х) есть ненулевые и НОД {αϊ (ж),... ,αη(χ)} φ 0, то для любого d(x) e НОД {аг(х),... ..., ап(х)} верно равенство ΗΟΛ{αι(χ),...,αη(χ)} = {ud(x) : и € Ρ*}, и существует единственный унитарный НОД этих многочленов. О Утверждение а) очевидно. Докажем б). Из определения 11 следует, что d(x) φ 0 и ud(x) е НОД {αι(χ),... ,αη(χ)} для любого и € Р*. Наоборот, если f(x) € НОД {αι(χ),... ,αη(χ)}, то по свойству б) определения 11 f(x) | d(x) и d{x) I /(ж), т. е. по утверждению 2 f(x) = ud(x) для некоторого и € Р*. D Теорема 5. Если среди многочленов αι(χ),... ,αη(χ) G Р[х) есть ненулевые, то для них в Р[х) существует единственный унитарный наибольший общий делитель. О По утверждению 3 б) достаточно доказать существование одного НОД рассматриваемых многочленов. Это делается так же, как и для 183
целых чисел, индукцией по параметру η > 2. При η = 2 доказательство проводится с помощью алгоритма Евклида, который для многочленов а\(х) = а(х) и а2{х) = Ь(х) Φ О реализуется следующим образом. Если Ь(х) | а(х), то Ь(х) € НОД {а(х),Ь(х)}. Если Ь{х) \ а(х), то строится цепочка соотношений: а(х) = b(x)qi(x) +r\(x), 0 < degn(x) < degb(x); Ь(х) = ri(x)q2(x) + Г2(х), 0 < degr2(x) < degn(x); (16) rk-2{x) = rk-i{x)qk{x)+rk{x), 0 < degrfc(x) < degrfc_i(x). Эта цепочка при некотором А: € N обязательно обрывается соотношением rfc_i(x) = rk{x)qk+i(x), гк+\{х) = 0, (17) поскольку степени остатков в (16) образуют строго убывающий ряд чисел из No*. degfc(x) > degn(x) > ... > degrfc(x), и этот ряд не может быть бесконечным, а в случае, когда rk+i(x) φ Ο, к этому ряду можно приписать справа еще один член. При условиях (16), (17) так же, как и в теореме 2.IV, доказывается, что гк(х) € €НОД{а(х),6(х)}. D Теорема 6. Если d(x) € НОД {αι(χ),..., αη(χ)}, то существуют многочлены щ(х),..., ип(х) € Р[х], такие, что d(x) = ui(x)ai(x) + ... 4- ип(х)ап(х). D Индукция по η > 2. При η = 2 нужные многочлены находятся из соотношений (16), (17) точно так же, как это делается в следствии теоремы 4.1 V для целых чисел. D 184
Π ρ и м е ρ 1. Пусть Ρ = Ζ3 — поле вычетов по модулю 3 и требуется найти НОД многочленов а{х) = Xs + 2ХА + 2Х3 + X2 + X + 2 и Ь(х) = = 15 + 13 + Хи представить этот НОД в виде линейной комбинации а(х) и Ь{х) над Ρ [ж]. Выполняя цепочку последовательных делений с остатком, получаем: а(х) = х5 + 2х4 + 2х3 + χ2 + χ + 2 + ж* + х х5 + х3 + χ = 6(ж) 1 = qi(x) Ь(х) = х5 + х3 + χ х5 + 2х4 + 2х3 + х 2х4 + х3 + х2 2x + 2 = q2(x) + 2 = п(х) х4 + 2х3 х4 + 2х3 + 2х2 + 1 п(х) = 2х4 + х3Ч-х2 + 2 2х4 + *' х2 + 2 = г2(х) 2х2 + 2 = q3(x) х3 + 2х + 2 г2(х) = х2 + 2 х2 + 2х χ + 2 = гз(х) χ + 1 = </4(х) х + 2 О = га{х)
Таким образом, гз(х) = χ + 2 € НОД {а(х),Ь(х)}, и для построения многочленов u(x),v(x) G Р[х], удовлетворяющих соотношению χ 4· 2 = и(х)а(х) + υ(χ)6(χ), нужно по правилам, изложенным в § 2.IV, построить последовательность пар многочленов щ{х), Vt{x), t € ТГЗ, удовлетворяющих соотношению ut(x)a(x) 4- vt(x)6(x) = rt(x). Тогда u(x) = = из(х),у(х) = ^з(х). Строим таблицу, аналогичную таблице из § 2.IV: t Qt ut(x) Vt{x) 0 0 1 1 1 1 -1 2 2x + 2 x + l 2x 3 2хг + 2 χ3 4- 2x + 1 x3 + x2 + 2 Отсюда имеем: (χ3 + 2x 4- 1)α(χ) 4- (x3 +x2 + 2)6(x) = χ 4- 2. Унитарный наибольший общий делитель многочленов αϊ (χ),..., αη (χ) € G Р[х], не все из которых равны нулю, обозначим через (αϊ (χ),..., αη(χ)). В случае αϊ (χ) = ... = αη(χ) = 0 положим (αϊ (χ),... ,αη(χ)) = 0. Определение 12. Многочлены αϊ (χ),..., αη(χ) G Ρ[χ] называют взаимно простыми (в совокупности), если (αι(χ),...,αη(χ)) =е. Утверждение 4. Многочлены αι(χ),... ,αη(χ) € Р[х] вза- имно просты тогда и только тогда, когда существуют многочлены ui(x),... ,un(x) G P[x] тайне, что ui(x)ai(x) 4-... 4- un(x)an(x) = е. D См. доказательство утверждения 4.1 V. D Теорема 7. Для любых многочленов а(х),6(х),с(х) € Р[х] справедливы утверждения: а) ((a(x),6(x)) = e w (а(х),с(х)) = е) =Ф (а(х),6(х) -с(х)) = е; б) ((а(х),6(х)) = е и а(х) | Ь(х) · с(х)) =Ф (а(х) | с(х)); в) ((а(х),Ь(х)) = е, а(х) | с(х),6(х) | с(х)) =Ф (а(х) · Ь(х) | с(х)); г) ((а(х), Ь(х)) = с(х) ^ 0) =► ((ffg, |$) = e). D См. доказательство теоремы 4.IV. D Определение 13. Наименьшим общим кратным (НОК) многочленов αι(χ),... ,an(x) € Р[х] называют многочлен k(x) G Р[х) со свойствами: а) к(х) — общее кратное многочленов αι(χ),... ,an(x); б) если к\(х) — любое общее кратное многочленов αι(χ),... ,an(x), то к(х) | к\(х). 186
Совокупность всех описанных многочленов к(х) обозначается через КОК{а1(х),...,ап(х)}. Очевидно, что если среди многочленов аг(х) есть нулевой, то НОК {ai(rr),... ,an(x)} = {0}. В противном случае справедлива Теорема 8. Если αχ(χ),... ,αη(χ) € -Р[х]\{0}, то существует единственный унитарный многочлен к(х) € НОК {αι(χ),... ,αη(χ)} и справедливо равенство ΗΟΚ{αι(χ),..., ап{х)} = {ик{х) : и е Р*}. D Существование НОК указанных многочленов доказывается индукцией по параметру п. При η = 2 так же, как и при доказательстве утверждения 6.IV, показывается, что /а^х^аЛх)) € НОК {αι(χ), a2(x)}, а затем доказывается, что если η > 2 и /ι(χ) € НОК {αι(χ),... ,αη_ι(χ)}, /(χ) € НОК {/ι(χ), αη(χ)}, το /(χ) Ε ΗΟΚ {αι(χ),..., αη(χ)}. Если к{х) = /*(χ) — унитарный многочлен, ассоциированный с /(х), то он также удовлетворяет определению 13, т. е. к(х) € НОК {αι(χ),... ,αη(χ)}. Последняя часть теоремы легко доказывается с помощью того же определения. D Унитарный многочлен &(х), являющийся наименьшим общим кратным многочленов а\(х),..., ап(х) € Р[х] \ {0}, обозначается следующим образом: к(х) = [αι(χ),... ,αη(χ)]. Теперь результаты теоремы 8 можно коротко записать так: а*г(х)а$(х) (αι(χ),α2(χ)) [αϊ(χ),... ,αη(χ)] = [[αϊ(χ),... ,αη_ι(χ)],αη(χ)]. 187
§ 5. Неприводимые многочлены над полем. Каноническое разложение многочлена 1. Понятие неприводимого многочлена в кольце Р[х] есть аналог понятия простого числа в кольце Z. Определение 14. Делитель d(x) Ε Р[х] многочлена f(x) Ε Р[х) называется собственным, если 0 < degcf(x) < deg/(x), и несобственным в противном случае. Многочлен f(x) Ε Р[х) называется неприводимым над полем Ρ (или неприводимым в кольце Р[х]), если deg/(x) > О и f(x) не имеет собственных делителей в кольце Р[х]- Если многочлен f(x) имеет собственный делитель в кольце Р[х], то он называется приводимым. Многочлены нулевой степени (т. е. обратимые элементы Р[х]) и нулевой многочлен не являются ни приводимыми, ни неприводимыми многочленами. Так как по утверждению 1 б) степень произведения любых двух многочленов из Р[х] равна сумме их степеней, то очевидно Утверждение 5. Многочлен f(x) Ε Р[х] приводим тогда и только тогда, когда его можно представить в виде произведения двух многочленов, степени которых строго меньше, чем degf(x). Очевидно, что в кольце Р[х] неприводимы все многочлены первой степени, однако могут существовать неприводимые многочлены более высоких степеней. Ясно, что если f(x) — неприводимый многочлен из Р[х] степени η > > 2, то он не имеет корней в Ρ (в противном случае по теореме Безу он имеет собственный делитель степени 1). Обратное утверждение в общем случае (при η > 4) не верно, однако справедливо Утверждение 6. Многочлен f(x) € Р[х] степени 2 или 3 тогда и только тогда неприводим над Р, когда он не имеет корней в Р. D Достаточно заметить, что если f(x) приводим, то он имеет унитарный делитель степени 1, и воспользоваться теоремой Безу. D Π ρ и м е ρ 2. Если Ρ = Ъч — поле из двух элементов, то в Р[х] неприводимы многочлены х2+х + 1,х3+х + 1,х3 + х2 + 1, так как они не имеют в Ρ корней. Многочлен х4 4- х2 + 1 также не имеет корней в Р, но он приводим: х4 + х2 +1 = (χ2 + χ 4-1)2. 188
Иногда один и тот же многочлен приходится рассматривать как многочлен над разными полями. Например, многочлен х2 — 2 € Q[x] можно рассматривать и как многочлен над R. В связи с этим следует подчеркнуть, что неприводимость многочлена это не просто свойство самого многочлена, а свойство многочлена по отношению к тому полю, над которым он рассматривается. Так, многочлен х2 — 2 неприводим над Q, поскольку его корни иррациональны, но приводим над R: х2-2 = (х->/2)(х + >/2). 2. Для описания свойств многочленов, связанных с их разложением на множители, нужно сначала описать свойства неприводимых многочленов. По аналогии с утверждением 7.IV доказывается Утверждение?. Пусть f(x) € Р[х] — неприводимый многочлен. Тогда: а) Va(x) Ε Р[х) : (/(х) | а{х) или (/(x),a(x)) = e); б) Уф?), Ь{х) € Р[х]: (f(x) \ а(х) · Ь(х)) => (f(x) \ a(x)) wiuf(x) | Ь(х)); в) если g(x) Ε Р[х) — неприводимый многочлен, то либо (f(x),g(x)) = = е, либо многочлены f(x) и д(х) — ассоциированы. D Замечаниеб. Задача о разложении произвольного многочлена из Р[х] на множители легко сводится к аналогичной задаче для унитарного многочлена, поскольку для любых /(x),a(x), b(x) € Р[х]\{0} многочлен f(x) неприводим над Ρ тогда и только тогда, когда /*(х) неприводим, а равенство f(x) = а(х) -Ь(х) влечет равенство /*(х) = а*(х) -Ь*(х). Переход к унитарным многочленам оказывается весьма удобным, поскольку существенно упрощает формулировки теорем и их доказательства. Например, если f{x),g{x) — унитарные неприводимые многочлены, то для них утверждение 7в) имеет вид: либо (f(x),g(x)) = е, либо f(x) = д{х)· Для многочленов над полем справедлив следующий аналог основной теоремы арифметики: ТеоремаЭ. Любой унитарный многочлен а(х) € Р[х] ненулевой степени либо неприводим над Р, либо раскладывается в произведение унитарных неприводимых над Ρ многочленов, причем это разложение однозначно с точностью до перестановки сомножителей. D (См. доказательство теоремы 7.IV.) D Из первого утверждения теоремы 9 следует, что любой многочлен f(x) G Р[х] степени η > 0 можно представить в виде: f(x) = fn-Pi(x)kl-...-Pr(x)kr, (18) 189
где /n — старший коэффициент /(χ); Pi(x),... ,рг(х) — унитарные, неприводимые, попарно различные (т. е. попарно взаимно простые) многочлены из Р[х] и &i,..., kr G N. Определение 15. Представление многочлена /(х) в виде (18) называют его каноническим разложением над полем Р. Каждый многочлен рг{х) называют неприводимым делителем /(х), а показатель кг — кратностью рг(х) в каноническом разложении /(х). Многочлены Pi(x)ki называют примарными компонентами многочлена /(х). Из второго утверждения теоремы получаем Следствие. Каноническое разложение многочлена f(x) € Р[х] степени η > О определено однозначно, с точностью до перестановки примарных компонент: если f(x) = fn · g\{x)ix · ... · gs{x)e" ~~ другое каноническое разложение f{x), то г = s и существует перестановка (t"i,...,ir) € Р(1,г) такая, что для т € 1,г выполняются равенства 9m(x)im = РгЛх)к%т, т· е- 9т{х) = Ptm(a?) и ет = кггп. Отметим, что по каноническим разложениям двух многочленов из Р[х) с помощью формул, которые приведены в § 3.IV, легко находятся их НОД и НОК. В частности, с использованием понятий канонического разложения и неприводимого многочлена часто удается просто доказывать взаимную простоту многочленов. В основе таких доказательств лежит очевидное Утверждение 8. Многочлены αι(χ),..., αη(χ) € Р[х] взаимно просты тогда и только тогда, когда они не имеют общего неприводимого делителя. В качестве примера использования этого утверждения докажем Утверждение 9. Если ненулевые многочлены αχ (χ),..., αη(χ) € G Ρ [χ] попарно взаимно просты и йг(х) = αι(χ) ·... · α4_ι(χ) ·α4+ι(χ) ·... · at(x) для г € 1,£, то (αι(χ),...,α4(χ)) = е. D Пусть утверждение неверно. Тогда по утверждению 8 существует неприводимый многочлен /(х) G Р[х] такой, что /(х) | аг(х) для г G 1,£. Отсюда по утверждению 76) получаем, что /(χ) | а3(х) для некоторого j € 1,£. Последнее противоречит утверждению 8, так как /(χ) | оДх), а в силу теоремы 8а) (aJ(x)1aJ(x)) = е. D С использованием теоремы 9 доказывается аналогичная теореме 8.IV 190
Τ е о р е м а 10. Для любого поля Ρ множество унитарных неприводимых многочленов в кольце Р[х] бесконечно. Ясно, что это утверждение нетривиально лишь для конечных полей и в этом случае из теоремы вытекает очевидное Следствие. Если Ρ — конечное поле9 то для каждого натурального т в кольце Р[х] существует неприводимый многочлен степени п>т. Более подробно со свойствами неприводимых многочленов над конечными полями читатель познакомится в главе XXII. Здесь мы отметим лишь, что в современной прикладной математике весьма важными являются задачи разработки алгоритмов, позволяющих с помощью ЭВМ быстро строить неприводимые многочлены больших степеней над конечными полями и раскладывать многочлены над такими полями на неприводимые множители. § 6. Корни многочленов над полем. Производная 1. Напомним, что, согласно теореме Безу, элемент а е Ρ есть корень многочлена f(x) G Р[х] тогда и только тогда, когда χ—α \ f(x). В алгебре и ее приложениях широко используется следующая классификация корней многочленов. Определение^. Кратностью корня а £ Ρ многочлена f(x) е Р[х] называют число к е N со свойствами (х — а)к |/(х), (х — a)k+1 \ f{x)y и говорят, что а — простой корень /(х), если к = 1, и а — кратный корень f{x), если к > 1. Очевидно, что кратность корня а многочлена f(x) совпадает с кратностью многочлена χ — а в каноническом разложении f(x) над Р. Следующий результат существенно усиливает следствие 1 теоремы 4. ТеоремаИ. Многочлен f(x) степени η > 0 над полем Ρ имеет в этом поле не более η корней с учетом их кратностей, т. е. если с*ь...,ат — различные корни f(x) в поле Ρ и их кратности равны соответственно fci,..., km, то k\ + ... + km < п. D Так как по теореме 7а) многочлены (х - a\)kl,. ..,(х - am)krn попарно взаимно просты и каждый из них делит /(х), то по теореме 7 в) 191
(χ — cti)kl · ... · (χ — am)krn I /(x). Отсюда по утверждению 1 в) η > > кх + ... + кт. D 2. Удобный способ различения простых и кратных корней многочлена в поле связан с понятием производной многочлена. В алгебре это понятие вводится формально, по аналогии с известным из курса математического анализа описанием производной многочлена в Щх]. Напомним, что элементы поля Ρ как элементы абелевой группы (Р, *+) можно умножать на целые числа так, как это делалось в § 2.Ш. Ниже используются сформулированные там законы ассоциативности и дистрибутивности такого умножения. Определение 17. Производной многочлена а(х) = ао + а\х +... ... + апхп е Р[х] называют многочлен а'(х) = αχ + 2а2Х + ... + папх^п~1\ Несмотря на столь формальное определение, производная сохраняет свойства, известные из курса математического анализа. Τ е о ρ е м а 12. Для любых многочленов а(х),6(х) G Р[х] справедливы равенства: (а(х) + Ь{х))' = а'{х) + 6'(х), (19) (а(х) · Ь{х))' = а'(х) · Ь{х) + а{х)Ь'{х). (20) D Равенство (19) легко следует из определения 17. Равенство (20) очевидно, если один из многочленов является константой. Рассмотрим теперь случай, когда а(х) = a-xfc, Ь(х) = 6·χ£, /:, £ G N. По определению (а(х) · Ь(х)У = (abxk+ey = (к + £)abxk+e~l, т. е. в этом случае равенство (20) верно. Наконец, в общей ситуации, пользуясь равенством (19) и доказанными выше соотношениями, получаем (а(х)Ь(х)У = ££((afc*fc)(6,*<)') = ^^((акхк)'(Ьехе)+ + (акхкУ(ЬехеУ) = £>***)'][>*<+ fc>0 £>0 +ς а^к J2(bex'y= α'(χ)*>(χ)+ФЩху. □ fc>0 £>0 192
Следствие!.. Для любых многочленов αι(χ),... ,αη(χ) G Р[х] справедливо равенство: (αι(χ)... ап(х)У = а\(х)а2{х).. .αη(χ) + αι(χ)α'2(χ)α3(χ). ..αη(χ) + ... ... + αϊ (χ)... αη-ι{χ)α'η{χ). Доказательство легко проводится индукцией по п. Из следствия 1 очевидным образом получаем Следствие 2. Для любых а(х) G Р[х] и к £ N справедливо равенство: {а{х)ку = к-а{х)к~1 -а'(х). Замечание7. Совершенно аналогично производную можно определить для многочленов над любым (не обязательно коммутативным) кольцом с единицей. При этом остаются справедливыми теорема 12 и ее следствия, доказательства которых проводятся дословно так же. (Проверьте!) Следствие 2 верно для многочленов над коммутативным кольцом. Τ е о ρ е м а 13. Корень a G Ρ многочлена f(x) € Р[х] являет- ся простым тогда и только тцгда, когда а не является корнем его производной /'(х). D Пусть к — кратность корня а. Тогда f(x) = (x—a)kg(x), где g(a) φ Φ 0. Отсюда по теореме 12 имеем: /'(ж) = (x-a)k~lg(x) + (x-a)kg'(x), и если к = 1, то f'{a) = g(a) Φ 0. Если к > 1, то f(a) = k(a-a)k~lg(a) + +(α — a)kg'{a) = 0 (т. е. из условия /'(α) φ 0 следует, что к = 1). D Следствие1. Множество кратных корней в поле Ρ многочлена f(x) G Р[х] совпадает с множеством всех корней в поле Ρ многочлена <*(*) = (/(*),/'(*))· D Va 6 Ρ : (/(а) = /'(а) = 0) <*> (χ - а | /(at) ux-a\ f'{x)) <*> <* (χ - а | d(x)) «*· (d(a) = 0). D Определение 18. Поле Ρ называется полем разложения многочлена f(x) € Р[х) степени η > 0, если f(x) раскладывается над Ρ в произведение линейных множителей, т. е. если каноническое разложение /(я) над Ρ имеет вид: f(x) = (x-a1)k>-...-(x-ar)k'. 193
ПримерЗ. Для многочлена х2 + 1 G Щх] поле С является полем разложения, а поле R — нет. Π ρ и м е ρ 4. Для любого простого ρ G N поле Ζρ вычетов по модулю ρ есть поле разложения многочлена хр — х: хр - χ = χ · (х - 1) ·... · (х - (р - 1)). (Докажите!) Следствие2. £?сли Ρ — поле разложения многочлена f(x) € Р[х], то f(x) не имеет кратных корней в Ρ тогда и только тогда, когда (/(х),/'(х)) = е. D Многочлен d(x) = {f(x),f'{x)) делит /(χ), поэтому, если degd(x) > > 0, то по условию теоремы d(x) раскладывается над Ρ на линейные множители и имеет в Ρ корень. В рассматриваемой ситуации отсутствие у f(x) кратных корней в поле Ρ согласно следствию 1 равносильно условию deg d(x) = 0. D 3 а м е ч а н и е 8. Если Ρ не является полем разложения для многочлена /(х), то условие (/(х), /'(#)) = е является достаточным для отсутствия кратных корней многочлена f(x) в поле Р, но не является необходимым. (Докажите!) Полученные результаты можно использовать не только для отыскания кратных корней многочлена, но и для разложения его на множители в случае наличия у него таких корней. Π ρ и м е ρ 5. Найти кратные корни в поле Zs многочлена f(x) —x^ — —2х3-Ь2х2 —2х-Ы € Ζδ[χ]. Вычисляя наибольший общий делитель f(x) и /'(ж) = 4х3 —х2-ь4х —2, получаем (/(ж),/'(#)) = ж —1. Следовательно, 1 — кратный корень f(x) и (χ — I)2 | /(х). Выполняя деление, находим /(х) = (х — 1)2(х2 + 1). Непосредственной проверкой убеждаемся, что многочлен х2 + 1 имеет в поле Ζ5 корни 2 и 3. Таким образом, /(х) = = (х - 1)2(х - 2)(х - 3). 3. Пусть F — произвольное поле. Напомним, что подмножество Ρ С С F называется подполем поля F, если Ρ замкнуто относительно операций сложения и умножения на F и является полем относительно этих операций. В этой ситуации говорят также, что поле F есть расширение поля Р. В главе XXI будет показано, что для любого поля Ρ и любого многочлена /(х) G Р[х] существует расширение F поля Р, которое является полем разложения для /(х). В действительности, справедливо даже более сильное утверждение. 194
Определение 19. Поле F называется алгебраически замкнутым, если оно является полем разложения для любого многочлена f(x) G €F[x]9 deg/(x)>0. Теорема 14 (Штейниц9). Для любого поля Ρ существует расширение F, которое является алгебраически замкнутым. Доказательство этого результата выходит за рамки нашего курса. Мы ограничимся здесь лишь указанием одного очень важного примера. Теорема15 (Гаусс). Любой многочлен ненулевой степени над полем С комплексных чисел имеет в этом поле корень (другими словами, поле С алгебраически замкнуто). Эта теорема, долгое время называвшаяся основной теоремой алгебры, не имеет чисто алгебраического доказательства и будет выведена как простое следствие из более общих результатов при изучении теории функций комплексного переменного. Мы, однако, уже сейчас будем широко использовать эту теорему. В частности, теперь может быть коротко доказано следующее утверждение (см. теорему 11.IV). Следствие. Для любого ненулевого комплексного числа ζ и любого η G N в поле С существует ровно η различных корней степени η из ζ. D По теореме 15 многочлен хп — ζ раскладывается на линейные множители над С, а по следствию 2 теоремы 13 он не имеет кратных корней в С, т. е. в поле С у него есть ровно η различных корней. D § 7. Многочлены над числовыми полями Здесь приводятся полное описание неприводимых многочленов над полями С и R, некоторые важные достаточные условия неприводимости многочленов над Q и способы вычисления рациональных корней многочленов из Q[x]. 1. Описание неприводимых многочленов над полем С легко следует из теоремы Гаусса. УтверждениеЮ. Над полем комплексных чисел неприводимы все многочлены первой степени и только они. 9 Э. Штейниц (1871-1928) — немецкий математик. 195
Эта теорема позволяет также описать все неприводимые многочлены над R. Напомним, что дискриминантом многочлена f(x) = ax2+bx+c G G R[x], α φ О, называется число 6(f) = Ь2 — 4ас, и f(x) не имеет корней в R тогда и только тогда, когда 6(f) < 0. Теорема 16. В кольце Щх] неприводимыми являются все многочлены первой степени, многочлены второй степени с отрицатель- ными дискриминантами и только они. D Неприводимость указанных многочленов очевидна (см. утверждение 6). Покажем, что других неприводимых многочленов в Щх] нет. Пусть f(x) = /о + fix Ч l· fnxn € R[x]— неприводимый многочлен степени η > 1. Тогда он не имеет корней в R, но по теореме 15 имеет корень β € С. В таком случае число β не совпадает с сопряженным к нему числом β (т. к. β £ R), и β — также корень /(х), поскольку в силу утверждения 8.IV ίΦ) = Σ0ι = £7,0* = Σ'·/3, =Ш = 0 = 0. По теореме Безу многочлен f(x) делится в кольце С[х] на два взаимно простых многочлена: χ — β и χ — β. Следовательно, по теореме 7 в) он делится на_многочлен д(х) = (х — β)(χ — β). Так как д(х) = х2 — — (/? — /?)х Ч- β β — также многочлен из R[x], то д(х) делит f(x) в R[x]. (Докажите!) Поскольку у f(x) нет собственных делителей в R[x], то f(x) ассоциирован с д{х). Следовательно, f(x) — многочлен степени 2, и так как его корни в С не принадлежат R, то 6(f) < 0. D Следствие. Любой многочлен нечетной степени из R[x] имеет корень в R. D 2. Значительно более сложно устроены неприводимые многочлены в Q[x]. Полного их описания не существует, но можно указать некоторые достаточно большие классы таких многочленов. Один из основных методов изучения возможностей разложения многочленов из Q[x] на множители состоит в сведении задачи к разложению многочленов в кольце Щх). Определение 20. Многочлен с(х) = со Ч- с\х Ч-... Ч- спхп степени η > 0 с целыми коэффициентами назовем примитивным, если сп > 0 и (co,ci,...,Cn) = 1. УтверждениеП. Для каждого ненулевого многочлена f(x) € G Q[x] в кольце Z[x) существует единственный ассоциированный с ним примитивный многочлен /*(х). 196
D Если deg/(x) = η, то /(χ) можно представить в виде /(х) = ύ& 4- +2^х+...+^χη, где аг е Z, 6t G N для г е 0~п. Пусть q = [60,6Ь..., 6П], тогда q-f{x) = go+gix+- · ·+9ηΧη — многочлен с целыми коэффициентами, и если d = {go,gi>... ,ρη), то по теореме 5r).IV искомый многочлен имеет вид /*(х) = ±Д/(х) (где знак определяется знаком коэффициента дп). Если h(x) еще один примитивный многочлен из Z[x], ассоциированный с /(х), то он ассоциирован и с /*(х) и h(x) = ]y/*(x), гДе u,v € N. Тогда ν/ι(χ) = и/*(χ), и, так как НОД коэффициентов многочленов uf*(x) и ν/ι(χ) равны, соответственно, и и υ, то из последнего равенства следует, что и = ν, т. е. /ι(χ) = /*(х). □ Τ е о ρ е м а 17. Ясли а(х),6(х),с(х) € Q[x]/{0} u а(х) = Ь(х) · с(х), то а*(х) = 6*(х) · с*(х). D Основное содержание доказательства составляет Л е м м а 2 (Гаусс). Произведение примитивных многочленов Ь*(х) и с*(х) есть примитивный многочлен. О Пусть Ь*(х) = Σ №\с*{х) = Σ Ъ*г и Ь*{х) · с* (ж) = Σ <****· t>0 t>0 t>0 Достаточно доказать, что для любого простого ρ G N хотя бы один из коэффициентов 6г не делится на р. Так как 6*(х) и с*(х) — примитивные многочлены, то можно выбрать наименьшее к G No такое, что ρ \ $ь и наименьшее £ G No такое, что ρ \ 7/. Тогда ί*+/ не делится на р, поскольку Sk+e = flo7fc+*+ ··· + &-i7*+i + Phil + Α+ι7*-ι + · ·· + &+£7о и все подчеркнутые слагаемые в последней сумме делятся на р, а слагаемое /?£7£ по утверждению 7.IV на ρ не делится. D Теперь доказательство теоремы 17 завершается следующим образом. Так как 6*(х),с*(х) — примитивные многочлены, ассоциированные, соответственно, с Ь(х) и с(х), то Ь*(х) · с*(х) — примитивный многочлен, ассоциированный с Ь(х) · с(х) = а(х). D Следствие1. Многочлен а(х) G Щх) положительной степени неприводим в кольце Q[x] тогда и только тогда, когда он неприводим в кольце Щх) (т. е. не раскладывается в Щх) на множители меньших степеней). D Достаточно заметить, что а(х) = fca*(x), где к € Z. D Следствие 2. Пусть а(х) — многочлен степени п> О из Q[x) и а*(х) = а*хп + ... 4- а\х 4· clq — ассоциированный с а(х) примитивный многочлен. Если а = Ц е Q, где и е Z>v G N, (и, ν) = 1, является 197
корнем α(χ), то ν | α*, и | aj и την — u | α* (га) для любого га G Ζ, β частности, υ — и I a*(l),v4-u | a*(—1). D Достаточно заметить, что а* (х) = (χ - a)*c*(x) для подходящего примитивного с*(х) £ Щх) и (х — a)* = vx — u. D Напомним, что для любых га G N и с G Ζ через гт(с) обозначается остаток от деления с на га, который можно рассматривать как элемент кольца Zm. Операции в этом кольце и кольце многочленов Zm[x] обозначим символами Θ и <8>. Для любого многочлена а(х) = J2 агхг е Ζ[χ] через гт(а(х)) обозначим многочлен из Zm[x] вида Σ гт(аг)хг. Исполь- ι>0 зуя свойства отношения сравнимости в Ζ (см. следствие 2 теоремы 2.V), легко получить, что для любых многочленов 6(х),с(х) G Ъ\х\ выполняется соотношение гт(Ь(х) · с(х)) = rm(b(x)) <8> гт(с(х)). Следствие 3. Если а(х) G Q[x] — приводимый многочлен степени η и Ст(а*(х)) = a*xn, mo для каждого простого ρ € Ν, не делящего а*, многочлен гр(а*(х)) приводим в кольце Ζρ[χ]. D Если а(х) = 6(х)с(х), где degfr(x) = k G 1,п — 1, то гр(а*(х)) = = Гр(6*(х))<8>гр(с*(х)), причем ввиду условия ρ fa* можно утверждать, что р\ Ь*к и degrp(a*(x)) = n,degrp(6*(x)) = fc. D Полученные результаты можно использовать для перечисления рациональных корней и проверки неприводимости многочленов из Q[x]. Π ρ и м е ρ 6. Найти рациональные корни многочлена а(х) = х3 — — §х — §. Заметим, что а*(х) = 2х3 — Зх — 3 и если элемент а = Ц € Q, где и £ Ζ, ν € N, (u,v) = 1, есть корень а(х), то по следствию 2 и|3 и ν 12, т. е. a G {ΐβ,ϋ,ΐ^»^!)· Кроме того, должны выполняться соотношения ν — и | а*(1) = — 4 и ν 4- и | а*(—1) = —2, поэтому остается лишь один кандидат в корни а(х) : а = —3. Но а(—3) = -24 φ О и потому многочлен а(х) не имеет корней в Q. Отсюда по утверждению 6 следует также, что а(х) неприводим над Q. Π ρ и м е ρ 7. Проверить, является ли неприводимым многочлен а(х) = х4 -f f х3 4- Зх2 4- f x 4- 5 € Q[x]. Воспользуемся следствием 3. Получаем а* (х) = 7х4 4- Зх3 4- 21х2 4- 4х 4- 35. Будем перебирать простые числа ρ φ 7. Для ρ — 2 имеем: гг(а*(х)) = х4 4- х3 4- х2 4-1 — приводимый многочлен в Z2[x] : Гг(а*(х)) = (х 4-1) ® (х3 4- х 4- 1). Для ρ = 3 получаем: гз(а*(х)) = х4 4- х 4- 2 G Z3[x]. Этот многочлен неприводим над Z3, так как он не имеет корней в Z3 и не делится ни на один из трех существующих в Ъ^[х) неприводимых унитарных многочлена степени 2: х24-1,х34-х4-2,х24-2х4-2 (непосредственная проверка). Следовательно, 198
многочлен а(х) неприводим над Q. Для доказательства неприводимости а(х) можно и не убеждаться в неприводимости гз(а(х)), а заметить лишь, что гз(а(х)) не имеет корней в Z3, поскольку из рассмотрения многочлена Г2(а(х)) следует, что если а(х) приводим, то он имеет делитель первой степени. Замечание 9. Метод проверки неприводимости многочленов из Q[x], вытекающий из следствия 3, не является универсальным в том смысле, что существуют унитарные неприводимые многочлены а(х) G G Z[x] такие, что для любого простого ρ € N многочлен гр(а(х)) приводим над Ζρ. Например, таков многочлен х4 — 10х2 4- 1. В заключение докажем один широко используемый признак неприводимости многочленов над Q. Теорема 18 (Эйзенштейн 10). Пусть а(х) = αο + αχχ-Κ. .+апхп € G Z[x],n > О, и для некоторого простого ρ € N выполняются условия: р\ап; (21) р|а„ « = 0,п-1; (22) Р2\а0. (23) Тогда многочлен а(х) неприводим над Q. D Если многочлен а(х) приводим в Q[x], то по следствию 1 теоремы 17 существуют многочлены 6(х),с(х) G Ъ[х) такие, что а(х) = = Ь(х) · с(х), degfc(x) = к € l,n, degc(x) = £ € l,n,fc + ί = п. Из (21), (22) следует, что многочлен гр(а(х)) € Ζρ[χ] имеет вид гр(а(х)) = = rp(an)xn,rp(an) т^ 0. Отсюда, ввиду равенства гр(а(х)) = гр(6(х)) <8> ®гр(с(х)) в Ζρ[χ], получаем: rp(b(x)) = гр(6*)х*,гр(с(х)) = rp(Q)x*. Так как к > 1,£> 1, то из последних равенств следует, что ρ | &о и ρ | со- Но тогда р2 | ао, поскольку а0 = &ο£ο> что противоречит условию (23). D Важное значение этой теоремы состоит не только в том, что она позволяет просто доказывать неприводимость некоторых многочленов, но и в том, что она дает возможность их легко строить. В частности, из нее получается следующий результат, показывающий принципиальное различие между свойствами множества неприводимых многочленов над полем Q и множеств неприводимых многочленов над полями R и С. Следствие. Над полем Q существуют неприводимые многочлены любой натуральной степени п. 10 Ф. Г. М. Эйзенштейн (1823-1852) — немецкий математик. 199
D Например, для любого простого ρ G N многочлен хп — ρ неприводим над Q. D Заметим, что приведенный пример существенно усиливает известное из средней школы утверждение об иррациональности числа ψρ. В книге Лидл Р., Нидеррайтер Г. "Конечные поля" (т. 1, с. 61. См. раздел "Литература научная") изложен метод Кронекера, позволяющий определить приводим или нет многочлен над Q и, в случае приводимости, получить его каноническое разложение. § 8. Кольцо многочленов от нескольких переменных 1. Пусть R — кольцо с единицей е и R[x] — кольцо многочленов от одного переменного χ над Л, построенное в § 1. Так как по теореме 1 Λι = R[x] есть кольцо с единицей ех°, то над ним можно так же, как делалось в § 1, построить кольцо многочленов R\[y] от переменного у. Элементами кольца R\ [у] являются все последовательности вида (α0(χ),αι(χ),...,αη(χ),...), аг(х) £ Яь (24) в каждой из которых все многочлены, за исключением конечного их числа, равны 0х°, а переменное у определяется равенством у = (0х°,ехо,0х0,...). (25) Операции сложения и умножения на R\[y] вводятся определением 2 а), б). Определением 2в), г) задаются операция умножения последовательностей вида (24) на элементы а(х) € R\ и операция прибавления к таким последовательностям элементов а(х) € R\. С использованием этих операций любой элемент (24) кольца R\ [у] может быть записан в виде суммы ао(х) + аг(х)у + ... + ап(х)уп, (26) где η G No выбирается так, что в (24) аг(х) = 0 для всех г > п. Используя каноническую запись каждого из многочленов аэ{х): а3{х) = a0j + a>\]X + ... 4- amjxw, alQ € Д,a%J = 0 для г > m, 200
и очевидные свойства дистрибутивности операции умножения последовательностей вида (24) на элементы из Λι, сумму (26), обозначая ее через а(х,у)> можно записать в виде: η т т η Φ, ν) = ΣΣ агзхгу3 = Χ3ΣΖ a*JxV > (27) j=rO 1=0 1=0 j=0 или в виде бесконечной суммы Ф, У) = Σ Σ azjzY = Σ atjxly3, (28) *>0 j>0 (t,j) где суммирование производится по всем наборам (г, j) € No x No. Представляя последовательности (24) в виде (28), подразумевают, что для некоторых т,п € No, при г > m,j > η выполняются равенства агз = О, т. е. агохгу3 = 0хгу3 = 0х°у° — нуль кольца J?i[y], и в действительности, (28) — конечная сумма вида (27) (поэтому порядок суммирования в ней не важен). Определение 21. Кольцо R\[y] = -R[#][y] называют кольцом многочленов от двух переменных χ и у над кольцом R и обозначают через Д[х,у]. Элементы этого кольца называют многочленами от двух переменных, а выражение (27) (или (28)) — канонической записью многочлена а(х,у). Элементы агз € R в канонической записи многочлена а(х, у) называют его коэффициентами. Таким образом, как и в случае многочленов от одного переменного, каждый многочлен а(х, у) имеет бесконечно много коэффициентов агз € Л, и равенство многочлена (28) многочлену 6(х, у) = Σ Ьгзхгу3 из R[x, у] означает, что агз = Ьгз для всех г > О, j > 0. Результаты операций над многочленами из Д[х,у], записанными в канонической форме, представляются следующим образом: а(х, у) + 6(х, у) = ]Г агзхгу3 + ]Г Ь13хгу3 = ^(aZJ + Ь13)хгу3, (*.j) (*.j) (*.j) г 0 а{х,у) · Ъ{х,у) = ^(]T]TarA-r,j-s)sy. (*,j) r=0s=0 201
Первое из этих равенств очевидно, а второе легко следует из равенства а(х,у) ■ Ь(х,у) = Σ Σ α··'· · *>™χ,1+12 ■ ^,+"' («l,Jl)(«2,j2) которое, в свою очередь, выводится из дистрибутивности умножения и равенств а11Пхпу31 · Ь%2Пх%2у32 = all0lbl2nxn+l2yn+32, вытекающих из определения операции умножения в кольце <Ri[y]. Замечание 10. Использование канонической записи многочленов из Д[ж,2/] существенно облегчает выполнение операций над ними. Для наглядности достаточно заметить, что переход к первоначальному представлению многочленов в виде последовательностей превращает сумму (28) в сумму последовательностей вида: j нулевых последовательностей a,,aty=((0,...,0,...),...,(0,...,0,...), (0,...,0, о,,,0,...),(0,...,0,...),·.·)· г нулей 2. Аналогично, индуктивным методом, строится кольцо многочленов от произвольного конечного числа переменных. Определение 22. Если R[x\,..., χη-ι] — кольцо многочленов от η — 1 переменных х\,...,χη-ι над кольцом R с единицей, то кольцо многочленов Д[хь..., хп] = R[xi,..., ζη_ι][χη] называют кольцом многочленов от η переменных х\,..., хп над кольцом Я. Таким образом кольцо R[x\,..., хп] есть множество всех последовательностей вида: (α0(χι,...,Жп-ι),...,аг(хх,...,χη-ι),.. ·)> α,(χι,...9χη-ι) е ϋ[χι,...,χη-ι]ϊ в которых все члены аг(х\,..., χη-ι), за исключением конечного числа, равны нулю, а переменное хп есть последовательность χη = (0#ι ·... · жп_1,еЖ]_ ·... · xn_i,Qxi ·... · xn_i,.. .)· 202
Операции на β[χχ,...,χη] вводятся определением 2. С использованием этих операций каждый элемент α(χχ,..., хп) € R[x\,..., хп] может быть представлен в виде суммы mi mn а(хх,.. .,хЛ) = 53 ··· ΣΖ а%* г»х%{ '•--'x%ni aH,..,tw € R (29) H=0 ι«=0 или в виде формально бесконечной суммы α(χχ,...,χη) = 53 л»!,....^*!1 ••••·*ηΛι (30) в которой символ £ означает суммирование по всем различным наборам (ίχ,.,.,ίη) € Nq, но подразумевается, что все слагаемые, за исключением конечного их числа, равны нулю (т. е. равны нулю соответствующие коэффициенты а*ь...,*п). Определение 23. Элементы кольца Д[хх,...,хп] называются многочленами от η переменных χχ,... ,хп над Я. Представление многочлена α(χχ,...,χη) € Д[хх,...,хп] в виде (29) или в виде (30) называют его канонической записью, элементы а*ь...,»п в этой записи называют коэффициентами многочлена α(χχ,... ,хп), а слагаемые аи, .,ΐη^ι1 * · · · * х%п ~~ одночленами из его канонической записи. Каноническая запись (30) многочлена из /?[χχ,...,χη] однозначна: если 6(χχ,...,χη) = 51 b4*».,tnX\l ' -'х%п € β[χχ,...,χη], (*!,...,tn) το 6(χχ,...,χη) = α(χχ,...,χη) тогда и только тогда, когда 61ь...,1п = = а%1 1и для всех (г*х,...,гп) € Nq. Результаты операций над многочленами в канонической записи представляются следующим образом: α(χχ,...,χη) + 6(χχ,...,χη) = 53 (α*ι.···.*η +ь»1,...,»п)а?11 •••••а?п ι (и *п) α(χχ,...,χη) ·6(χχ,...,χη) = = 51 (Σ · · · Σ ^ь-л " b*i-r1,...,*n-rn)a:tx1 ·... · *ίΓ. («ι,.·.,«η) ri=0 r„=0 203
Последнее равенство получается из равенства а(хь...,хп) ·6(χι,...,χη) = = Σ Σ ^_гп ^_βη.χ^,...,χ^«, (31) (ri,...,rn)(*i,...,««) которое выводится из дистрибутивности умножения и соотношений хгЬ = = Ьхг,хгх3 = х$хг> справедливых для любых Ь € R и г, j € Ι,η. 3. Кольцо /ϊ[χι,...,χη], как и кольцо многочленов от одного переменного, сохраняет некоторые свойства исходного кольца R. Τ е о ρ е м а 19. Кольцо R[x\,..., хп] коммутативно тогда и только тогда, когда коммутативно кольцо R, и содержит делители нуля тогда и только тогда, когда R содержит делители нуля. D При η = 1 это — теорема 1. Доказательство в общем случае легко проводится индукцией по η с использованием определения 22. D ЗамечаниеП. Нулем и единицей кольца R[x\,..., хп] являются, соответственно, многочлены Ох? ·... · х£ и ex?,...,xj. Как и в кольце многочленов от одного переменного, для краткости, будем обозначать их теми же символами, которыми обозначаются нуль и единица в Л, т. е. положим Ох? ..... х^ = 0, ех? ·... · х°п = е. При этом, по сути дела, исходное кольцо R отождествляется с изоморфным ему подкольцом R = {гх? ·... · х£ : г € R} кольца R[xi, · · · , #п] (см. замечание 3). Более того, при этом каждое кольцо Д[хх,... ,xm],m € € Ι,η - 1 отождествляется с изоморфным ему подкольцом R [х\,..., хт] = = {а(хь...,хш)х^+1 - ... ·χ° : а(хь...,хш) € Д[хь... ,хт]} кольца Д[х1,...,хп] (ввиду равенств a(xi,...,xm) = a(xi,...,xm) · е = = (a(xb...,xm)ex?-....x^).x^+r....xO ==(a(xb...,xm)xOl+r....xO)). И наоборот, это соглашение позволяет употреблять "экономную" запись многочленов из β[χι,...,χη] в каноническом виде, опуская в одночленах из (29) сомножители х*л, для которых is = 0, т. е. используя равенства типа «,*i . . Tiro . «.О . «.О _ «ti г„, „„О „О ___ х1 · · · хт хт+1 · · · хп "" х1 · · · хт сх1 · · · xn — — Xj ... Хт С —- Xj ... Хт . 204
Например, многочлен из R[x\,...,ift] /(χι,...,χη) = αχ? · χί> * · · · * χη + ^ι · ж2 · · · · · жп+ + СХХ · . .. · Хп_з · #η-2 * χη-1 * χη может быть записан в виде /(хЬ · · · ι «η) = О- + Ьх\ + СХп-2Яп-1 · Понятие степени многочлена обобщается на многочлены от нескольких переменных следующим образом Определение 24. Степенью одночлена αχ\λ ... х1^ из R[xi,...,хп] называют параметр # = ί~~°°' , г, г , —, если а = 0; 1 - - ' ' Л если αφν. Степенью указанного одночлена по переменному ха называют параметр если α = 0; dega. axV ·... · хгп &Хв г » - если a ^0. Степенью произвольного многочлена (30) и его степенью по пере- менному xs называют, соответственно dega(xi,...,xn) = max{degan,...,tnxt11 ...х%: гь... ,in € Nft}, degXe a(xb - - - ,*n) = max{degXif α^,...,,,^!1 -... · ж* : ib... ,in € N£}. Если degXe α(χχ,...,xn) < 0, то говорят, что многочлен α(χχ,...,χη) не зависит от переменного xs (или, что он зависит от xs лишь формально). Последнее равносильно тому, что любой одночлен агь .,ιηχ*ι ·.. .хгп из (30) удовлетворяет условию: если αχχ% ,1η Φ 0, то га = 0. В дальнейшем, если ясно (или не важно), о каком числе η переменных идет речь, кольцо β[χι,...,χη] и его элементы α(χι,...,χη), для краткости будем обозначать через R[x\ и а(х), где χ — (χΐϊ · · ·»Χη)· 205
Непосредственно из определения следует, что для любых а(х), b(x) € € R[x\ верны соотношения: η dega(x) < ^degX9 а(£), *=£ deg(a(x) + 6(f)) < max{dega(x),degb(x)}, dega(x) · b(x) < dega(x) 4- degfr(x). Каждое из этих соотношений может быть (в зависимости от выбора многочленов а(х) и Ь(х)) как строгим неравенством, так и равенством (соответствующие примеры читателю предлагается привести самостоятельно). Ниже будет доказано, что последнее соотношение является равенством для любых многочленов а(х) и Ь(х) из Д[х], если R — кольцо без делителей нуля. Однако доказательство этого факта проводится несколько сложнее, чем в кольце многочленов от одного переменного, поскольку в канонической записи (29) многочлена а(х) может содержаться несколько различных одночленов степени dega(x). Определение 25. Ненулевой многочлен (29) называют фор- мой степени к, если степени всех его ненулевых одночленов равны &. (Формы степеней 1, 2, 3 называют, соответственно, линейными, квадратичными и кубическими.) Очевидно, что любой многочлен а(х) € Д[#]\{0} степени к может быть однозначно представлен в виде суммы а(х) = а<°>(£) + а^(х) + ... + а<*>(*), (32) где а(г)(х), для г € 1, /с, — либо нулевой многочлен, либо форма степени г, и а^(х) ^0. Определение 26. Равенство (32) назовем представлением многочлена а(х) в виде суммы форм. Из определения произведения многочленов следует, что произведение двух ненулевых форм степеней к и I есть либо нуль, либо форма степени к 4- £. Τ е о ρ е м а 20. Если R — кольцо с единицей без делителей нуля, то для любых а(х),6(х) € Д[а(х)] верно равенство dega(f) · b(x) = dega(f) + degfc(x). 206
D Нетривиален лишь случай, когда dega(x) = к > О, degfr(x) = t. В этой ситуации пусть представления многочленов а(х) и Ь(х) в виде суммы форм имеют вид соответственно (32) и 6(f) = 6<°>(i) + bW(x) + ... + 6«>(ί). (33) Перемножая равенства (32) и (33) почленно, получаем следующее представление а(х) · Ь(х) в виде суммы форм: а(х) · fr(f) = [a<°>(£)6(0)(х)] 4- [α<0>(£)b^(x) + а™(2)ЬЩх)] + ... ... + [a^-^if )Ь(€)(х) + а^фЬ^Цх)} + а(Дг)(х )6^>(f). Так как по теореме 19 в Л[х] нет делителей нуля, то в полученной сумме а^(х)Ь^(х) — форма степени fc-t-£, а каждое выражение в квадратных скобках есть либо нуль, либо форма степени строго меньшей, чем к +£. Следовательно, deg а(х) · Ь(х) = А: 4- L D 4. Каждый многочлен a(x) G R[x\y... ,хп] задает некоторую функцию на множестве Rn = Д χ ... χ R со значениями в Д. Определение 27. Значением многочлена а(х) вида (30) в точке а = (αϊ,..., an) G Дп называется элемент кольца R: <*(<*) = Σ α·ι»·*»"α1Ι "•••"αη· (tl,...,tn) Функцию <ir: Rn —> Д, определяемую условием Va € Rn aR{3) = a(a), называют полиномиальной функцией, определяемой многочленом а(х). Очевидно, что значение суммы двух многочленов из Я[жь.. .,хп] в любой точке а € Rn равно сумме их значений в этой точке. Кроме того, справедливо Утверждение^. Если кольцо R коммутативно и с(х) = = а(х) · Ь(х), где a(x),6(x) G R[x\, то для любого а € Rn справедливо равенство с(а) = а(а) · 6(a). D Доказательство проводится с использованием равенства (31) и предоставляется читателю. D Из многочисленных результатов, связанных с представлением функций на кольце полиномами, мы приведем лишь следующий важный в прикладном аспекте результат. 207
Теорема21. Если Ρ — поле из q элементов, то для любой функции φ: Рп —> Ρ существует единственный многочлен а(х) € Р[х\,..., хп], имеющий по каждому переменному степень не выше, чем q — \, и такой, что φ = clr. D По теореме 4 для каждого элемента β £ Ρ существует многочлен δβ € Ρ [ж], имеющий степень не выше, чем q - 1, и такой, что ^ с , ч , w, если а = в; pv y *п если α ^/?. {: Этот многочлен имеет вид δβ(χ) = е — (х — 0)я 1. (Докажите!) Тогда, используя утверждение 12, нетрудно проверить, что многочлен а(хь... дп) = ^ ¥>03ι,... ,βη)' 6βΛχι) * · · · * ki^n) удовлетворяет условиям: φ = ад, degXe a(x) < ρ - 1 для s € lTn. (34) Докажем его единственность. Любой многочлен а(х) € R[x] со свойством (34) имеет вид: a(f) = Σ · · · Σ а»ь .in^i1 * · · ·' *ηη > (35) ΐι=0 ι«=0 и число его ненулевых коэффициентов не превосходит qn. Следовательно, общее количество таких многочленов равно \Р\дП = qq". Но количество различных отображений φ: Рп —> Ρ также равно qq", и поскольку каждое такое отображение представляется многочленом вида (35), а разные отображения представляются разными многочленами, то это представление однозначно. D 5. Мы уже отмечали, что кольцо R[x\,..., хп] можно рассматривать как расширение кольца R (см. замечание 11). Следующий принципиально важный результат показывает, что это расширение является "универсальным" в том смысле, что оно позволяет описать большой класс других расширений кольца Д. Τ е о ρ е м а 22. Пусть R' — коммутативное кольцо с единицей е и R — его подкольцо с той же единицей. Тогда для любых а\,..., ап € R! множество J?[c*i,..., ап] всех элементов г' € R', представимых в виде г' = a(c*i,... ,an), a(x) € Я [ж], есть подкольцо кольца R'. 208
G Очевидно, что подмножество R[ai,..., ап] замкнуто относительно заданных на R! операций сложения и умножения (см. утверждение 12) и {R[ol\ ,..., αη], -f) — группа. Всем остальным аксиомам кольца алгебра (Д[<5], +, ·) удовлетворяет ввиду того, что им удовлетворяет алгебра (#,+,·).□ Нетрудно увидеть, что кольцо R[a\,... ,αη] содержит подкольцо R и элементы αϊ,...,ап и Я[аь...,ап] — наименьшее подкольцо в R' с этими свойствами. (Докажите!) Его называют расширением подкольца R кольца R' элементами αϊ,..., αη € R'. § 9. Инвариантные подкольца. Симметрические многочлены Один из способов изучения свойств многочленов из кольца R[x\,..., хп] состоит в описании таких многочленов, которые не изменяются при различных преобразованиях этого кольца. Ниже рассматривается важный частный класс таких преобразований. Каждой подстановке π = ( тгО)... 7г(п)) е $п можно поставить в соответствие отображение π: R[xi,... ,xn] —> R[xi,---,xn], определяемое правилом Va(f) € R[x] : π(α(χ)) = ]Γ a,,,......*^ ·... · хг;\п). (36) (»l,...,»n) Утверждение 13. Отображение π есшъ изоморфизм кольца R[x] на себя. D Непосредственно из (36) нетрудно увидеть, что π — биекция. Кроме того, если a(x),6(x) Ε Д[х], то верны равенства: π(α(£) + 6(f)) = Σ (аи,..,гп + ki,...,tJs^i) · · · · · <"(n) = (*ι,...,*») = Ζ^ ^l.-Min^l) * · · · * Χπ(η) + Ζ^ ^l.—in^i) * · · · * X7r'(n) = (»ι t„) (И,....»п) = π(α(£))+π(&(£)). 209
Отсюда, используя (31), получаем также, что π(α(χ) ·&(£))= £ Σ *(an,..,r„-f>Sl ,nx?+Sl ■ · · · ■&+*) = (ri,...,r„)(ai,....a«) = Σ Σ «Γ1.....Γ.6.ι.......*;ι(ί)Μ · · · · · <<#·=*w*» · *(*(*))· (ri,...,r„) (si,...,sM) Следовательно, π — изоморфизм колец. D Определение 28. Многочлен а(х) G R[xi,... ,хп] называется инвариантным относительно подстановки π G 5, если π(α(χ)) = α(χ))· Π ρ и м е ρ 7. Многочлен χι -Ь хг G Д[хь... ,xw] инвариантен относительно подстановки (213 '")> н0 ПРИ п > 2 он не инвариантен относительно подстановки (23 "п* ?)· Для Л1°б°й подстановки π € 5 многочлен χι +х% + . · ·+χίί не инвариантен относительно π, а многочлен ж{+ ... + x*,fcGN, инвариантен относительно π. Любому подмножеству G С Sn можно поставить в соответствие подмножество Ir[$\(G) = /(G) многочленов из Д[хь... ,хп], инвариантных относительно каждой подстановки π £ G: 1(G) = {α(χ) G Я[х] : νπ G G : π(α(χ)) = α(χ)}. Заметим, что подмножество 1(G) всегда непусто, поскольку содержит нуль и все многочлены нулевой степени. Утверждение 14. Подмножество 1(G) есть подкольцо кольца ад. D Замкнутость 1(G) относительно каждой операции * G {-К ·} следует из утверждения 13, поскольку Va(x),6(x) G /(G), Υπ G G : ττ(α(χ)*6(χ)) = тг(а(х))*тг(&(х)) = а(х)*Ь(х). Так как операция + на /(G) ассоциативна, О G /(G) и для каждого а(х) G /(G) многочлен — а(х), очевидно, также принадлежит /(G), то (/(G), +) — абелева группа. Ассоциативность умножения на /(G) и его дистрибутивность относительно сложения следуют из того, что R[x\ — кольцо. D Определение 29. Подкольцо /(G) называется подкольцом инвариантов кольца R[x] относительно множества подстановок G. Ниже дается описание подкольца /(G) в важном частном случае, когда G = Sn. 210
Определение 30. Многочлен а(х) G Я[жь · · · > #п] называется симметрическим, если он инвариантен относительно любой подстановки π G 5П (т. е. если а(х) G I(Sn))- Подкольцо I(Sn) = lR[x]{Sn) кольца R[x\ называется кольцом симметрических многочленов от η переменных над R и обозначается через ]Ся(хь... ,жп]· Прежде всего приведем основные примеры симметрических многочленов. Определение31. Элементарными симметрическими многочленами называются многочлены σ\(χ) = χι + Х2 + ... 4- хп> &2(х) = XlX2 + XlX3 + . . . 4- Х\Хп + #2#3 + . . . 4- Χη_ιΧη, Gk(x) = J^ Яц#12 ·... · Xik, 1 < k < n, l<ii<...<ik<n &n (x) = Я\ * #2 * · · · * Xn · Очевидно, что σ*(χ) есть форма степени fc из ]£д[#ь·· · »#п]· Интерес к элементарным симметрическим многочленам обусловлен, прежде всего, следующим классическим результатом. Теорема 23 (Виет). Если Ρ — поле разложения унитарного многочлена f(x) G Р[х] степени η и αϊ,..., ап — все корни f(x) в Ρ (с учетом их кратностей), то /(ж) = хп - σι(8)χη~ι + σ2(α)χη"2 4-... + (-1)ηση(α), где σ*(α) — элементарный симметрический многочлен степени к из Ея[*Ь #=(αι,...,αη). D Нужное равенство легко получается из разложения f(x) = (χ - αϊ) ·... · (χ - αη). D Главное свойство элементарных симметрических многочленов, к доказательству которого мы приступаем, состоит в том, что любой симметрический многочлен может быть выражен через них с помощью конечного числа операций сложения и умножения. Получим предварительно несколько вспомогательных результатов представляющих также самостоятельный интерес. 211
Определение 32. Говорят, что ненулевой одночлен а-х^1 ·... -х^ старте одоночлена 6 · х^ ·... · х£п, и пишут αχ\λ ·... · xjj» >- ба^1 ·... · χ£η, если либо 6 = 0, либо положительна первая ненулевая из разностей: (ti + ... + tn) - (ji +··· + jn),ή - ji,..., tn - jn. Одночлены вида αχ\λ ·... · xjj» и бх^1 ·... · xjj* называют подобными. Старший одночлен из канонической записи (30) ненулевого многочлена а(х) Ε R[x\ называют старшим членом многочлена а(х) и обозначают через Ст(а(х)). Таким образом, согласно определению, одночлен большей степени старше одночлена меньшей степени. Если степени двух ненулевых одночленов равны, то старше тот из них, у которого степень χι больше. В случае равенства степеней переменного х\ в этих одночленах, старше тот, у которого больше степень переменного Х2, и т. д. Очевидно, что отношение -< позволяет строго упорядочить все слагаемые в канонической записи многочлена а(х) (такое упорядочение называют лексикографическим), и поэтому определение старшего члена многочлена а(х) корректно. Пример 8. В кольце R[x\, Χ2] справедливы соотношения 0 -< е -< Х2 -< χι -< х% ·< #ι#2 -<х\ <х\< х\х% ·< #ι#2 -< xf -< ... . Τ е о ρ е м а 24. Если произведение старших членов многочленов а(х),6(х) Ε R[x\ не равно нулю, то справедливо равенство Ст(а(х) · 6(f)) = Ст(а(х)) · Ст(6(х)). D Пусть Ст(а(х)) = ах?1 ·... · х£я, Ст(6(х)) = Ьх^1 ·... · x£w. Выберем произвольно ненулевые одночлены из канонических записей многочленов а(х) и 6(х), соответственно: и(х) = а'х\х ·... · x£w и v(x) = 6'xf1 ... · x*w. Ввиду равенства (31), очевидно, достаточно показать, что если и(х) -< Ст(а(х)) или υ(χ) -< Ст(6(х)), то и(х) · v(x) = а'б'х?*51 ·... · *£+·» -< Ст(а(х)) · Ст(6(х)) = = abz?+*-...-x%)+fi-. (37) Рассмотрим последовательности: η η Л0 = 2^^г - 2^гг, Χι =αι ~Г1,...,ЛП = an -rn г=1 г=1 212
и η η Βο = Σ&-Σ8^ £ι=Α-*ι,...,Β» = Α»-β». г=1 г=1 Согласно сделанным предположениям, в каждой из этих последовательностей первое ненулевое число (если оно есть) положительно и хотя бы одна из этих последовательностей ненулевая. В таком случае последовательность η η Aq + Во = 5^(оч + βχ) - ^2(гг + 5г), Αχ + Βι = (αχ + ft) - (η + sx),... ι=1 ι=1 ..., Αη + Βη = (αη + /3η) - (rn + «η) содержит ненулевые числа и первое из них положительно. Это в совокупности с условием аЬ Φ О и доказывает соотношение (37). D Обратите внимание на то, что теорема 24 усиливает теорему 20. Л е м м а 3. Если (χι,...,хп) — ненулевой симметрический многочлен и Ст(т(х)) = их*1 ·... · ж£п, то αχ > α2 > ... > αη. D Предположим, что аг < аг+\ для некоторого i Ε Ι,η— 1. Рассмотрим подстановку π = (1 2 !!. *+1 *t*!!! η )· ^ак как ^(г(^)) = г0*0, т0 одночлен *(СТ(Г(*))) = «X?» · ·. · · χΓ-ΐ^Γ**'^!^? · · · · · *η" входит слагаемым в каноническую запись многочлена т(х). Но он при условии аг < аг+1 старше одночлена Ст(т(х)), что невозможно. G Теорема 25. Если R — кольцо с единицей, то для любого многочлена т(х) Ε Σβ(χι> · · ·»χη] существует такой многочлен а(х) Ε R[x\, что Т(х) = Σ αη, .,ΐη^ιί^)*1 * · · · * ση(χ)%η = α(σι(ί),... ,ση(£)). (·ι ·-> D Если τ(χ) = 0, то утверждение очевидно. Пусть т(х) ф 0. Обозначим через д(т(х)) количество одночленов ех\* ·... · хгп11 Ε Д[5], которые младше, чем Ст (т(х)), и будем вести доказательство индукцией по 9(т(х)). Если д(т(х)) = 0, то т(х) = их? ·... ·χη и утверждение очевидно (а(£) = т(х)). 213
Предположим, что т > О и теорема верна при условии д(т(х)) < га. Докажем ее в случае, когда д(т(х)) = га. Пусть Ст(т(х)) = их"1 ·.. .·χ£η. Тогда по лемме 3 а\ > ... > ап. Рассмотрим многочлен /i(f) = σ^χ)**-** · σ2(χ)α2-α3 ..... ^(х)*» G ΣΛ[χ]. Применяя несколько раз теорему 24, получаем: Ст(Л(х)) = Ст(ах(х))Ql-*2 · Οτ(σ2(2))Q2~Q3 ·... · Οτ(*ι(*))αη = = χ?1""02 · (xix2)Q2"Q3 ·... · (*ι ·... · xn-i)ft-1"a" · (χι ·... · xn)a" = — ται . . fa" Тогда для многочлена τχ(χ) = τ(χ) — ufi(x) верно соотношение Οτ(τχ(χ)) -< Ст(т(х)) и потому д(т(х)) < га. По предположению индукции существует многочлен αχ(χ) Ε Я[х] такой, что τχ(χ) = αχ(σχ(χ),..., ση(χ)). Но тогда r(x) = ti/i(x)+n(x) = шт^х)*1-*2 ·.. .·ση(χ)α" + αι(σι(χ),... ,ση(χ)). D Заметим, что доказательство теоремы 25 дает практический способ выражения симметрического многочлена т(х) через элементарные симметрические многочлены. Следствие. Пусть F — поле разложения унитарного многочлена f(x) = хп 4- cn_ixn~1 4-... 4- со € F[x] и αχ,..., ап — все корни /(х) в F с учетом их кратностей. Тогда, если Ρ — подполе поля F, содержащее все коэффициенты многочлена /(х), то для любого симметрического многочлена т(х) Ε Ρ[χι,...,χη] элемент τ(αχ,...,αη) тоже принадлежит подполю Р. О По теореме 25 существует многочлен а{х\,..., хп) такой, что т(х) = = α(σι(χ),... ,ση(χ)). Тогда ввиду утверждения 12 и теоремы 23 справедливы соотношения τ(α) =α(σι(α),...,ση(α)) = а(-Сп-ьсп-2,... , (~1)пй)) Ε P. D Задачи 1. Докажите, что если в кольце Я нет делителей нуля, то мультипликативная группа Я[х]* кольца R[x] совпадает с Я*. 214
2. Докажите, что группа Z4[x]* состоит из всех многочленов с обратимыми свободными членами и четными коэффициентами при остальных степенях х. 3. Докажите, что множество делителей нуля кольца Z^x] состоит из всех многочленов с четными коэффициентами. 4. Опишите обратимые элементы и делители нуля в кольце многочленов Ζρ» [χ] при простом ρ G N. 5. Может ли кольцо многочленов быть полем? 6. В условиях теоремы 2 приведите пример кольца R и многочленов а(х),6(х) G R[x] таких, что при делении а(х) на Ь(х) с остатком справа и слева получаются разные остатки. 7. Если в кольце R нет делителей нуля и многочлен а(х) G R[x] делится на не нулевой многочлен b(x) G R[x] с остатком справа, то частное и остаток определены однозначно. Приведите пример, когда такое деление невозможно. 8. Приведите пример, показывающий, что если R некоммутативное кольцо, то в теореме 3 условие а(а) = 0 не равносильно условию: а(х) делится на χ — а слева. 9. Для любых a(x),b(x) G R[x] над коммутативным кольцом R положим а(Ь(х)) = Σ агЬ(х)г. Докажите равенство ι>0 а(Ь{х))' = а'{Ь{х)) · Ь(х)'. 10. Пусть αχ(χ),..., ап(х) — ненулевой набор многочленов над полем Р. Докажите, что для унитарного многочлена d(x) G Р[х] следующие утверждения эквивалентны: а) d(x) = (αι(χ),...,αη(χ)); б) d(x) — общий делитель многочленов αχ(χ),... ,αη(χ) наибольшей степени; в) d(x) — общий делитель многочленов αχ(χ),... ,αη(χ), имеющий вид d(x) = ui(x)ai(x) + ... + ип(х)ап(х); г) d(x) — многочлен наименьшей степени среди ненулевых многочленов вида С\(х)а\{х) 4-... 4- сп(х)ап(х), с\(х),... ,сп(х) G Р[ж]. 11. Пусть αο(χ),αι(χ) — ненулевые неассоциированные многочлены над полем Р, degao(x) > 0 и d(x) = {α>ο(χ),αι(χ)). Докажите, что существуют единственные многочлены uo(x),ui(x) € Р[х] со свойствами: uo(x)ao(x)+ui(x)ai(x) = d(x), degut{x) < degai^l(x)-degd(x), i G 0,1. 215
(Рассмотрите сначала случай, когда d(x) = e и поделите иг(х) с остатком на ах_г(х).) 12. Покажите, что если многочлены а(х),Ь(х) G Ρ[χ] взаимно просты, то для любого многочлена с(х) G Р[х] многочлены а(с(х)) и Ь(с(х)) также взаимно просты. 13. Докажите, что если многочлен f(x) G Р[х] взаимно прост со своей производной, то кратность каждого его неприводимого делителя в каноническом разложении над Ρ равна единице. 14. Составьте таблицы неприводимых многочленов второй степени над полями Ζ2,Ζ3,Ζ5, третьей степени над полями Ζ2,Ζ3, четвертой и пятой степеней над полем Ζ2. 15. Пусть f(x),g(x) — многочлены над полем Р, F — расширение поля Ρ и dp(x), dp{x) — унитарные наибольшие общие делители многочленов f(x) и д(х) соответственно в Р[х] и F[x]. Докажите, что dp(x) = = dF{x). 16. Докажите, что если F — поле разложения многочлена f(x) G Р[х] над полем Р, то f(x) не имеет кратных корней в F тогда и только тогда, когда (/(ж),/'(я)) =е. 17. Пусть а(х) G Z[x] — многочлен степени η > О и для каждого к G G 1, η — 1 существует простое ρ G N такое, что ρ \ ап и гр(а(х)) не имеет в Ър[х] делителей степени А:. Докажите, что а(х) неприводим над Q. 18. Докажите, что если а(х) G Р[х] — приводимый многочлен и b(x) G Р[х] \ Ру то многочлен а(Ь(х)) приводим, а если degfr(x) = 1, то верно и обратное утверждение. 19. Для любого простого ρ G N многочлен хр~1 + ... 4- х + 1 над полем Q неприводим (сделайте замену χ = у + 1 и используйте признак Эйзенштейна). 20. Докажите, что для любого простого ρ G N и любого натурального к многочлен хр (р~1^ + хр (р~2) + ... + хр 4-1 G Q[x] неприводим, а его корнями в поле С являются в точности все примитивные корни степени рк из единицы. 21. Пусть Ρ — поле из q элементов. Докажите, что многочлен Xя"1 задает на Ρ функцию, равную е во всех ненулевых точках. (Пусть Р* = = {αϊ,.. .,ας_ι} и α G Ρ*. Сравните произведения αϊ ·.. .·ας_ ι и (ααι)·... ...-(αα,-ι).) 216
22. В условиях предыдущей задачи докажите, что любая функция φ: Рп —> Ρ представляется многочленом а(хь...,хп) = ]Г ¥>(cb...tCn)-(e-(xi - Ci)q~l) ·... (ci,. MCn)€Pn ..-(e-(xn-cn)^1). 23. Докажите, что если Ρ — поле порядка q, то все его элементы — корни многочлена хя — χ G Ρ [ж]. 24. Докажите, что если Ρ — поле из q элементов и многочлен f(x) = = /о + /ι# 4-... 4- fq-\xq~l G Р[х] задает на Ρ подстановку, то Д-ι = 0. (Покажите, что для любого A: G 1, q — 2 выполняется равенство J] afe = a€P = 0, и просуммируйте все значения подстановки /(х).) 25. Опишите все многочлены, задающие подстановки на поле Z3. 26. Найдите многочлен степени, большей, чем 1, задающий подстановку на поле Z5. 27. Выразите через элементарные симметрические многочлены следующие симметрические многочлены из Р[хьХ2>#з]· а) х\ 4- х\ 4- х\\ б) х? + х\ 4- х\\ в) х\х2 + х\х$ + Х\Х% + #2Х3 + #1#§ 4" Х2#з*> г) х? + А + *з- 28. Пусть f(x) G Р[х], Ρ — поле разложения f(x) над Ρ и αϊ,..., an G G F — все корни /(х) с учетом их кратностей. Дискриминантом /(х) называют элемент поля Р: Δ(/)= Π («."«ί)2· 1<Κ.?<η Докажите, что Δ(/) G Ρ и Δ(/) не зависит от выбора поля Р. 29. Найдите дискриминанты многочленов х2 4- 6х 4- с и х3 4- Ьх 4- с над данным полем Р. 217
ГЛАВА X ГРУППОИДЫ И ПОЛУГРУППЫ Основными понятиями, связанными с изучением алгебр, являются понятия подалгебры, гомоморфизма алгебр, конгруэнции на алгебре, факторалгебры, системы образующих алгебры. Все эти понятия можно определить для произвольной универсальной алгебры, т. е. для множества с любым набором операций. Однако ради простоты изложения и восприятия, мы в данной главе введем указанные понятия для алгебр с одной бинарной операцией, т. е. для группоидов. При этом в общих рассуждениях будет использоваться, в основном мультипликативная терминология. Заметим, что в неассоциативных группоидах при записи произведения более двух элементов необходимо расставлять все скобки, определяющие порядок выполнения операций. Это обстоятельство в некоторых случаях значительно усложняет изложение. В связи с этим, мы будем особое внимание уделять ассоциативным группоидам, т. е. полугруппам (в которых произведение любого набора элементов можно записывать без скобок). § 1. Подгруппоиды и подполугруппы Напомним (см. определение 5.Ш), что подгруппоидом группоида G = (G, ·) называется любое его непустое подмножество Gi, замкнутое относительно операции " ·" и рассматриваемое как множество с этой операцией. В частности, подгруппоидом любого группоида является сам этот группоид. Если группоид содержит нейтральный элемент, то последний один образует подгруппоид. Приведем и менее тривиальные примеры подгруппоидов. Π ρ и м е ρ 1. Подгруппоидами группоида (No, ·) будут его подмножества рт = {ptn: η G Ν}, pm° = {ptn: η G N0}, где ρ — простое число, t G N. 218
Если G\ — подгруппоид в G и G — полугруппа, то G\ — также полугруппа. Ее называют подполугруппой полугруппы G. Заметим, что подгруппоид G\ группоида G может быть ассоциативным и в том случае, когда G неассоциативен. В связи с этим имеет смысл Определение1. Подгруппоид G\ группоида G, являющийся полугруппой, называется подполугруппой группоида G. Утверждение 1. Если {Gt: г Ε /} — семейство подгруппоидов группоида G и Η = f] Glf то либо Η = 0, либо Η — подгруппоид группоида G. О Достаточно доказать, что если Η φ 0, то Η замкнуто относительно операции "·" в G. Пусть Λι,/ΐ2 Ε Я, т. е. Λι,/ΐ2 £ G% для всех г G I. Так как G% ·— подгруппоиды в G, то Λ1/12 € Gt при всех г Ε /, и потому /ii/i2 G Я. Следовательно, Η — подгруппоид группоида G. D Заметим, что каждый из вариантов (Я = 0 и Я - подгруппоид) для множества Η из утверждения 1 возможен. Π ρ и м е ρ 2. Для подгруппоидов полугруппы (No, ·) примера 1 имеем: p2N pj p3N _ p6N __ ПОДГРУППОИД, pN C\qN = 0 при различных простых ρ и q. Используя операцию пересечения подгруппоидов, можно указать один из широко используемых в алгебре способов задания группоидов и, в частности, полугрупп. Пусть G — группоид и0^МсС Если подмножество М не является группоидом, то естественно поставить задачу о наиболее экономном пополнении Μ элементами из G до группоида. Для этого необходимо добавить к Μ все элементы из G вида аб, если а, Ь G Μ и аЬ £ М. Затем то же самое проделать с полученным множеством и т. д. до тех пор, пока не получится замкнутое, относительно операции "·" множество. Оно и будет искомым подгруппоидом. Формально и более строго этот группоид определяется следующим образом. Определение 2. Подгруппоидом группоида G, порожденным непустым подмножеством Μ С G, называется подгруппоид [М), являющийся пересечением всех подгруппоидов из G, содержащих М. При этом множество Μ называется системой образующих группоида [М) (и самого группоида G в случае [М) = G). 219
Если обозначить через {Gt: г Ε /} семейство всех группоидов из G, содержащих множество М, то можно будет записать W = f)Gt. (!) Из утверждения 1 следует, что определение 1 корректно. Следующее утверждение дает описание элементов из [М). Утверждение2. Подгруппоид [М) группоида G совпадает с множеством Я всех элементов группоида G, которые или содержатся в Μ или представляются в виде произведений элементов из М. G Из определения множества Я видно, что Я — подгруппоид из G, содержащий множество М. Тогда из (1) получаем: [М) С Я. С другой стороны, каждый подгруппоид Gt из (1) содержит Μ и, будучи замкнутым относительно умножения, содержит Я. Следовательно, Я С [М). В итоге имеем: Я = [М). D В случае когда группоид G является полугруппой, произведения элементов записываются сравнительно просто, и мы из утверждения 1 получаем Следствие. Если (G, ·) — полугруппа и0 φ Μ С G, то ее подполугруппа, порожденная множеством М, состоит из всех элементов, представимых в виде mi ·... -τη*, где k G N, a mi,...,mfc — произвольные, не обязательно различные, элементы из М. Π ρ и м е ρ 3. Пользуясь следствием, нетрудно проверить, что в полугруппе (No;·) из примера 1 ее подполугруппы рт,рт° порождаются соответственно множествами {р*}, {1,р*}. Сама полугруппа (No; ·) в силу основной теоремы арифметики (см. теорему 7.IV) порождается множеством Π U{1}, где Π — множество всех простых чисел. Определение 3. Группоид G называется конечно порожденным, если он имеет конечную систему образующих, и циклическим, если порождается некоторым одним элементом. Π ρ и м е ρ 4. Из примера 3 видно, что полугруппы рт,рт° — конечно порождены. Полугруппа же (No; ·) не является конечно порожденной. Докажите это в качестве упражнения, пользуясь теоремой Евклида о бесконечности множества простых чисел (см. теорему 8.IV). 220
Для систем образующих конечно порожденных группоидов справедливо УтверждениеЗ. Если группоид G конечно порожден, то в любой его бесконечной системе образующих содержится некоторая его конечная система образующих. D По условию G = [R) для некоторого конечного множества R. Пусть также G = [М), где \М\ = оо. Из утверждения 2 следует, что каждый элемент из R или принадлежит Μ или представляется в виде произведения конечного числа элементов из М. Зафиксируем по одному такому представлению для каждого элемента R\M и обозначим через Μι объединение множества всех входящих в эти представления элементов и множества RDM. Так как |Д| < оо, то \М\\ < оо. По определению 2 [Μι) С G. С другой стороны, R С [Μι), и потому [R) С [Μι), т. е. G С [Μι). Следовательно, G = [Mi). D § 2. Гомоморфизмы группоидов В § 4.ΙΙΙ было определено понятие изоморфизма группоида (G; ·) на группоид (Я;о), как биективного отображения φ: G —> if, удовлетворяющего условию: Va, Ь G G : <p{ab) = <р(а) о <р(Ь). (2) Естественным обобщением понятия изоморфизма является понятие гомоморфизма группоидов. Определение 4. Гомоморфизмом группоида (G; ·) в группоид (Я;о) называется любое отображение φ: G —» Я, удовлетворяющее условию (2). При этом множество φ(β) С Я называется гомоморфным образом группоида G. В том случае, когда отображение φ сюръективно или инъективно, гомоморфизм φ называют соответственно эпиморфизмом или мономорфизмом (мономорфизм G в Я называют также изоморфным вложением G в Я). Если у? — гомоморфизм группоидов с одинаково обозначенной операцией, то говорят также, что φ — гомоморфизм относительно этой операции. 221
При гомоморфизме группоида (в отличие от изоморфизма) сохраняются не все свойства операций, однако некоторые из них сохраняются. Об этом свидетельствует Теорема1. Пусть φ — гомоморфизм группоида (G; ·) в группоид (Я; о). Тогда множество φ(β) замкнуто относительно операции о в Н, т. е. является группоидом. Если при этом группоид G является полугруппой, коммутативной полугруппой, полугруппой с единицей, группой, то соответственно таким же является и его гомоморфный образ (φ(ΰ); о). Кроме того, при гомоморфизме φ единица группоида G (если существует) переходит в единицу группоида φ(β) и обратный элемент для а (если он существует) переходит в обратный элемент для φ(α), т. е. φ(α"1) = φ(α)"1. D Из определения образа <p{G) множества G имеем: V6i,&2 € <p(G)3ai,a2 € G: φ{α\) = 6ι,ν?(α2) = &2· Отсюда и из условия (2) для φ получаем: φ{α\α2) = φ{ο>\) ο φ{μ2) = Ь\ о 62- Следовательно, Ь\ 062 € φ(β), τ. е. <p(G) замкнуто относительно операции о. Остальные утверждения теоремы 1 доказываются точно так же, как соответствующие утверждения теоремы 5.III об изоморфизме <р, поскольку при доказательстве последних условие инъективности отображения φ не использовалось. D Приведем ряд примеров гомоморфизмов полугрупп. Π ρ и м е ρ 5. Рассмотрим отображение φ: Ζ —> Z/m, при котором Vr Ε Ζ: φ(τ) = [r]m. Из определения операций в Z/m: Ыт + Mm = [Г\ + r2]mi Mm * Mm = ИЫт видно, что φ есть гомоморфизм полугрупп (Ζ; +) и (Ζ; ·) на полугруппы соответственно (Z/m; +),(Z/m;·). Действительно, если * — любая из операций +, ·, то <р(П * Г2) = [П * Г2]ш = Mm * Mm = ¥>(п) * ¥>(Ы· Очевидно, что этот гомоморфизм является эпиморфизмом. 222
Π ρ и м е ρ 6. Пусть Ρ — поле. Отображение φτ: Ρ[χ] —> Ρ, определенное при любом фиксированном г Ε Ρ формулой: Va(x) Ε Р[х]: φτ(α{χ)) = a(r), является гомоморфизмом относительно операций "+" и "·". Это следует из леммы 1.IX. Так как а(г) = b(r) <=> с(г) = 0 для с(х) = а(х) - 6(х), то <рг — не мономорфизм. Π ρ и м е ρ 7. Известное свойство определителей квадратных матриц над коммутативным кольцом R: \АВ\ = |А| · \В\ свидетельствует о том, что отображение φ: Яп,п —> Д, при котором φ(Α) = |А|, есть гомоморфизм полугруппы (Rn%n\ ·) в полугруппу (Я; ·). Здесь в случае η > 1 при гомоморфизме у? может некоммутативная полугруппа переходить в коммутативную. Обратим особое внимание на примеры 5 — 6, в которых рассматриваемые отображения являются гомоморфизмами относительно двух операций. В такой ситуации представляется интересным вопрос о сохранении при гомоморфизме φ тех свойств, которые связывают разные операции, например, свойства дистрибутивности одной операции, относительно другой. На этот вопрос отвечает Утверждение 4. Пусть (G; *, о), (Н\ *, о) — алгебры с двумя бинарными операциями и отображение φ: G —> Η является эпиморфизмом относительно каждой из операций *,о. Тогда из правой (левой) дистрибутивности операции * относительно о в алгебре G следует выполнение соответствующего свойства в алгебре Н. D Доказывается этот факт точно так же, что и в теореме 6.III для изоморфизма φ. О Из теоремы 1 и утверждения 4 получаем Следствие. Пусть (G; +, ·), (Н; +, ·) — алгебры с двумя бинарными операциями и отображение φ: G —* Η есть эпиморфизм относительно каждой из указанных операций. Тогда, если (G; +, ·) — кольцо, коммутативное кольцо, кольцо с единицей или поле, то соответственно то же самое верно и для алгебры (Н\ +, ·)· 223
§ 3. Конгруэнции на группоидах и факторгруппоиды Из результатов предыдущего параграфа видно, что сохранение определенных свойств операций при гомоморфизме алгебр позволяет использовать гомоморфизмы для сведения изучения одних алгебр к изучению других алгебр. Кроме того, гомоморфизмы используются и для построения алгебр. Так, например, имея некоторую полугруппу, мы можем строить новые полугруппы — гомоморфные образы исходной. Все это делает актуальной задачу описания всех гомоморфных образов заданной алгебры, в частности, полугруппы. Для решения этой задачи в классе группоидов введем понятие конгруэнции на группоиде. В § 1.П было показано, что любое отношение эквивалентности ρ на произвольном множестве G индуцирует разбиение множества G на непересекающиеся классы эквивалентности, т. е. на классы вида [а]р = {х € G: хра). Множество всех этих классов называют фактормножеством множества G по отношению ρ и обозначают через G/p. Переход от множества G к множеству G/p называют факторизацией множества G. В данном параграфе нас будет интересовать случай, когда факторизуе- мое множество является группоидом. В этом случае по операции на G можно попытаться определить операцию на фактормножестве G/p. Самый естественный путь определения операции над классами заключается в сведении ее к имеющейся операции над представителями классов. Именно так ранее мы определяли операции над классами Z/ra. Если следовать этой идее, то надо положить по определению: Щр,[Ь)реО/р:[а)р-[Ь)р = [а-Ь)р. (3) Однако такое определение будет некорректно, если результат операции над классами [а]р, [Ь]р окажется зависящим от выбора представителей а, 6. Легко видеть, что определение корректно в том и только в том случае, когда отношение ρ удовлетворяет условию: Va,6,ab6i € G: {{apai)k{bpbi) =Ф (a· b)p(ai · 6ι)). (4) 224
Определение 5. Отношение эквивалентности ρ на группоиде (G;·), удовлетворяющее условию (4), называется согласованным с операцией в G, или конгруэнцией на группоиде G. Если ρ — конгруэнция на группоиде G, то определение операции на классах эквивалентности с помощью формулы (3) корректно, и потому корректно Определение 6. Фактормножество G/p группоида G по конгруэнции ρ с операцией, определенной формулой (3), называется фак- торгруппоидом группоида G по конгруэнции р. При этом об операции на G/p говорят, что она индуцирована операцией на G. Утверждение 5. Если ρ — конгруэнция на группоиде (G; ·), то отображение φρ: G —* G/p, при котором VaeG: φ(α) = [α]ρ, является эпиморфизмом (G; ·) на (G/p; ·) (отображение φρ обычно называют естественным гомоморфизмом группоида (G;·) на фактор- группоид (G/p;·))· D Отображение φρ сюръективно, поскольку в класс [а]р отображается элемент а € G (и все остальные элементы класса [а]р). Кроме того, из определений отображения φρ и операции на G/p имеем: Va,b€G: φρ{αο) = [ab]p = [а]р · [b]p = φ(α) · <p(b). Следовательно, φρ — эпиморфизм. D Из утверждения 5 и теоремы 1 получаем Следствие. Если G — полугруппа, коммутативная полу- группа, полугруппа с единицей, группа, ар— конгруэнция на G, то факторполугруппа G/p является соответственно полугруппой, коммутативной полугруппой, полугруппой с единицей, группой. Таким образом, по конгруэнции ρ на группоиде G можно построить новый группоид G/p, который наследует многие свойства группоида G. Заметим, что на каждом группоиде G имеются две тривиальные конгруэнции: отношение равенства р\\ Va, b € G: (ap\b <& a = b) и так называемое универсальное бинарное отношение ро: Va,6GG: (apob). 225
Очевидно, что при любом a G G класс [а]Р1 содержит единственный элемент а, а класс [а]^ — все элементы из G. Отсюда и из утверждения 5 следует, что группоид G/p\ изоморфен G, а группоид G/po — одноэлементный. Приведем примеры нетривиальных конгруэнции на полугруппах. Пример8. Отношение сравнимости целых чисел по модулю га является конгруэнцией на каждой из полугрупп (Z, -f) и (Z, ·). Свойство (4) для этих конгруэнции (означающее, что сравнения можно почленно складывать и перемножать) доказано ранее (см. теорему 2.V). Соответствующими факторполугруппами являются (Z/ra, -f) и (Z/m, ·). Π ρ и м е ρ 9. Рассмотрим отношения σ\ на множестве комплексных чисел С и θ2 на множестве С* = С\{0}, определенные формулами: Va,fc€C: (aaib<*\a\ = |6|), Va, Ь € С*: (ασ2& <=> arga = argb). Из свойств умножения комплексных чисел в тригонометрической форме легко следует, что σι,σ2 — конгруэнции, соответственно на полугруппах (С;·) и (С*,·). (Проверьте!) Геометрически, при изображении комплексных чисел точками плоскости с прямоугольной системой координат, элементы факторполугрупп (C/σι;·) и (€*/σ2;·) изображаются соответственно концентрическими кругами с центром в начале координат О и лучами, выходящими из точки О (без самой точки О). По утверждению 5 факторполугруппа G/p полугруппы G по конгруэнции ρ является гомоморфным образом полугруппы G. Естественно, возникает вопрос: не исчерпываются ли все гомоморфные образы любого группоида его факторгруппоидами по конгруэнциям? Положительный ответ на этот вопрос дает Теорема2 (об эпиморфизме группоидов). Пусть φ — эпиморфизм группоида (G;·) на группоид (Я;·). Тогда: 1) отношение ρ на G, определенное формулой: Va, Ь € G: (арЬ <=> φ(α) = <р(Ь)), (5) является конгруэнцией на группоиде G; 2) группоиды Η и G/p изоморфны, причем существует единственный изоморфизм τ: G/p —* Η, удовлетворяющий условию φ = φΡ-τ. (6) 226
Замечание. Для наглядности гомоморфизмы φ,φρ,τ представляют диаграммой G/p и вместо слов "выполняется равенство (6)м говорят: "Диаграмма (7) коммутативна". D 1) Из (5) следует, что отношение ρ рефлексивно, симметрично и транзитивно, т. е. является отношением эквивалентности на G. Проверим для ρ свойство (4). Используя определение ρ и тот факт, что φ — гомоморфизм, получим (для любых а, 6,αχ,6ι € G): apai,bpbi =Ф (φ(α) = φ(αι),φψ) = φ(^)) =Φ (φ(α)φψ) = = <p{ai)ip{bi)) =Φ (<ρ(α&) = φ(α&χ)) => (ab)p(aibi). Следовательно, ρ — конгруэнция. 2) Определим отображение τ: G/p —* Я, положив V[a]p € G/p : т([а)р) = φ{α). Это определение корректно, т. е. образ класса [а]р не зависит от выбора представителя а, поскольку для любого а\ € G имеем: [αι]ρ = [а]р <* αιρα & φ{αχ) = φ(α) <* τ([αι]ρ) = τ([α)ρ). Отсюда следует также, что отображение г инъективно. Сюръектив- ность г следует из сюръективности отображения φ. Следовательно, г — биекция. Наконец, φ — гомоморфизм, поскольку для любых [а]р, [b]p € G/p верны равенства: г([а]Р · [Цр) = т{[аЪ)р) = <р(аЬ) = <р(а) · <р(Ь) = т([а]р) · т([6]р). 227
Итак, τ — гомоморфизм. Проверим условие (6). По определению естественного гомоморфизма φρ и изоморфизма г для любого а € G имеем: (φρτ){α) = τ{φρ{ά)) = т([а)р) = φ{α), т. е. φρτ = у>. Докажем единственность т. Пусть наряду с г существует изоморфизм τι: G/p —> Я, удовлетворяющий условию φρτ\ = у?. Тогда для любого элемента [а]р € G/p имеем: i*(Np) = ¥>(<*) = {φΡη){α) = τι(^ρ(α) = τι([α]ρ). Следовательно, τι = г. D Замечание. Заменив в доказательстве теоремы 2 всюду слово группоид словом полугруппа, мы получим утверждение, называемое теоремой об эпиморфизме полугрупп. Ее доказательство полностью совпадает с доказательством теоремы 2, т. е. она является частным случаем теоремы 2. Теорема 2 и утверждение 5 сводят задачу описания всех гомоморфных образов группоида G к нахождению всех конгруэнции на G. Последняя задача, будучи в общем случае сложной, имеет принципиальное преимущество перед первой, поскольку для ее решения нужно использовать лишь сам группоид G, а не искать его гомоморфные образы в классе всех группоидов. Π ρ и м е ρ 10. Найти все конгруэнции на полугруппе (No, +). Пусть ρ — любая нетривиальная конгруэнция на полугруппе (No, +). Опишем классы [а]р. Пусть к — наименьшее число из No, удовлетворяющее условию \[к]р\ > 1, d — минимальная положительная разность чисел из [к]р и а, а 4- d € [к]р? Тогда из соотношений ар(а + d), к pa, используя свойства конргруэнции, легко получить последовательно соотношения: ар(а 4- Л), (к 4 dt)p(a 4- dt), kp(k 4- dt) для любого t € No- Отсюда, с учетом условий выбора чисел ky d, получаем: [к]р = {k + dt: t € No}, т. е. [к]р — класс неотрицательных вычетов по модулю d, больших или равных к. В связи с этим, обозначим класс [к]р через [k]'d. Теперь, используя импликацию apb =Ф (а 4 1)р(6 4- 1), найдем и остальные неодноэлементные классы: [к + 1]^,..., [к 4 d — 1]^. Таким образом, классы эквивалентности по конгруэнции ρ исчерпываются классами чисел: {0},{l},...,{A:~l},[^,...,[/c-bd~l]i 228
и полностью определяются парой чисел к, d, где к € No, d € N. Перебирая все такие пары (&,d), мы получим все конгруэнции полугруппы (No, +), ав силу теоремы 2 и все ее гомоморфные образы. Отметим еще, что теорема об эпиморфизме группоидов может быть использована для установления изоморфизма различных группоидов и для построения изоморфных образов группоидов. ПримерП. По теореме 22.IX множество Q[7r] значений всех многочленов из Q[x] при χ = π = 3,14... является кольцом относительно операций сложения и умножения в R. Следовательно, имет смысл говорить о полугруппах (Q[7r];-t-) и (Q[tt];·). Попытаемся заменить их изоморфными и более знакомыми полугруппами. С этой целью рассмотрим отображение φπ: Q[x] —» Q[7r], определенное формулой: Va{x) € Q[x]: φ7Τ{α{χ)) = α(π). Отображение φν сюръективно и, как следует из леммы 1.ΙΧ, является гомоморфизмом относительно операций сложения и умножения. Значит, по теореме 2 существуют такие конгруэнции pi, р2 соответственно на полугруппах {Q[x]; +) и (Q[x]\ ·)> что (QM; +)/л = (QW; +), (QM; -)l(n a (QH; ·)· Из формулировки теоремы 2 видно, что конгруэнции pi, р2 не зависят от операций, а однозначно определяются отображением φπ. Следовательно, р\ = р2 = р, где ρ определено условием: Va(x),6(x) € Q[x] : {a(x))pb(x) <& α(π) = 6(π). Заметим, что α(π) = 6(π) <=» α(π) - 6(π) = 0 ^ ο(π) = 0, где с(х) = α(χ) — b(x). Теперь воспользуемся известным в математике фактом о трансцендентности числа π, τ. е. об отсутствии ненулевого многочлена из Q[x] с корнем π. В итоге получим: Va(x),6(a;) € Q[x] : {a(x))pb(x) о а(х) = Ь(х), т. е. ρ — отношение равенства. Отсюда и из теоремы 2 легко следует, что отображение φπ является изоморфизмом относительно обеих операций -4-, ·. Следовательно, φπ есть изоморфизм кольца (Q[x]; +, ·) на кольцо (QW;+,·)· 229
§ 4. Полугруппы преобразований Определение?. Полугруппой преобразований множества Ω называется любая подполугруппа полугруппы Π(Ω) всех преобразований множества Ω относительно операции умножения преобразований. Полугруппы преобразований играют в теории полугрупп особую роль в связи с наличием следующего утверждения. Теорема 3. Любая полугруппа (G; ·) изоморфна некоторой полугруппе преобразований подходящего множества Ω. D Доказательство разбивается на два случая. 1) Полугруппа G имеет единицу е. Тогда возьмем в качестве Ω саму полугруппу G и определим отображение φ: G —» n(G), положив для g € G: φ(ρ) = g, где g — преобразование множества G, определяемое формулой: Vx€G: g{x)=x-g. (8) Отображение φ инъективно, поскольку для любых gi,g2 € G: g\^g2^e>gi^e>g2^ g\{e) Φ g2(e) =Φ §χ ф g2. Докажем, что V£i,02 € G: <P(9m) = 4>(g\)4>{g2)> т. е. Мдъд2 € G : <Я?2 = 9\ · &· Последнее утверждение доказывается следующей цепочкой очевидных равенств: дТд2{х) = χ · (gig2) = (a#i)ife = 0ι(*) · д2 = ife(ifi(a?)) = gi&ix)- Итак, у? — мономорфизм, и потому полугруппа G изоморфна подполугруппе <p(G) < n(G). 2) G — полугруппа без единицы. Тогда добавим к G новый элемент е и доопределим операцию умножения на множестве G\ = G U {е}, положив: V# € G: eg = #e = # и е · е = е. В итоге получим полугруппу G\ с единицей е. Взяв ее в качестве множества Ω, мы точно так же, как и в случае 1), построим мономорфизм φι-.G-* Π (Gi). D 230
В приложениях особый интерес представляют полугруппы преобразований конечных множеств. Поэтому далее мы ограничимся этим случаем. Заметим еще, что если множества Ωι,Ω2 равномощны, то полугруппы Π(Ωι), Π(Ω2) изоморфны. (Доказательство этого факта сходно с доказательством утверждения 10.111, проведите его в качестве упражнения.) В связи с этим можно ограничиться изучением лишь полугруппы Π(Ω) при Ω = ϊ~η. Определеннее. Полугруппа всех преобразований множества 1,п называется симметрической полугруппой преобразований степени п. Обозначим ее через Пп. Заметим, что порядок полугруппы Пп равен пп, она некоммутативна при η > 1 (см. теорему 1 .III) и содержит в качестве подполугруппы симметрическую группу подстановок 5П. Каждое преобразование д € Пп, как и подстановку из Sn, можно записать таблицей: 9={l ? - П), где is = g(s) для s € Ι,η. Однако здесь, в отличие от подстановок, в нижней строке таблицы некоторые элементы из Ι,η могут повторяться несколько раз, а некоторых может и не быть совсем. В связи с этим для преобразований из Пп можно ввести следующие параметры. Определение 9. Для преобразования д € Пп числа |^(1,п)| пп— —|g(l,7i)| называются соответственно рангом и дефектом преобразования g и обозначаются через rang(g) и def(g). Очевидно, что ранги преобразований из Пп могут принимать значения от 1 до п, а дефекты — все значения от 0 до η — 1. В частности, подстановки из Пп — это преобразования ранга η и дефекта 0. Непосредственно из определения произведения преобразований (см. § 2.1) следует Утверждение 6. Для любых преобразований #ь #2 € Пп: rang (0102) < min{rang(#i),rang(g2)}, (9) и соотношение (9) является равенством, если д\ € Sn или дч € 5П. 231
Следствие 1. Для любого к € 1, η множество nW = {ff€lI«:rang(ff)<*} является подполугруппой полугруппы Пп, и все такие подполугруппы образуют цепочку: п11)с42)с...сп^ = пп. Следствие 2. Если Μ есть система образующих элементов полугруппы Пп, то множество М' всех подстановок из Μ порождает ее подполугруппу Sn. Таким образом, по следствию 2 любая система образующих полугруппы Пп содержит систему образующих группы 5П. В связи с этим естественно возникает вопрос: какие преобразования следует добавить к 5П, чтобы получить систему образующих полугруппы Пп? На этот вопрос отвечает Теорема 4. Множество А = Μ U Sn из Пп тогда и только тогда порождает полугруппу Пп, когда Μ содержит хотя бы одно преобразование ранга η — 1. D Если в А нет преобразований ранга п—1, то в любом произведении 9\ · · -Яш = 9 преобразований дг € А,г € 1,т, или все сомножители — подстановки или есть сомножитель ранга г < п — 1. В первом случае д — подстановка, во втором — rang (g) < п — 1. Следовательно, в полугруппе [А) нет преобразований ранга η — 1, и потому [Α) φ Πη. Обратно, пусть до £ А и rang (до) = η — 1. Докажем, что [А) = Пп. Для этого достаточно доказать импликацию: д€Пп=*д€[А). (10) Докажем ее индукцией по def(g). Если def(g) = 0, то д € 5П, и утверждение (10) очевидно. Предположим, что оно верно для любого д € Пп при условии def(#) < fc, где к € 1,п — 1, и рассмотрим случай, когда def(g) = fc. Так как к > 0, то существуют такие s,t,j € Ι,η, что 5 φ t, g(s) = #(£), j £ g(l,n). Возьмем из Пп следующее преобразование д'\ д'(х) = д(х), если хфЬи g'{t) = j. (11) Так как def(</) = def(#) — 1 = к — 1, то по предположению индукции д' € [А). Теперь найдем такое д" € [А), что д"д' = д. Для этого воспользуемся содержащимися в А подстановками из Sn и преобразованием до. 232
Так как rang(^o) = η — 1, то существуют такие и, ν € Ι,η, что и φ ν и до{и) = go{v). Домножив до слева на подстановку h\ со свойством h\(s) = u,h\(t) = ν, получим преобразование д\ = /ΐι#ο> такое, что 9i(s) = Ρι(0· Кроме того, по утверждению 7 rang(gi) = η — 1, и потому существует лишь один элемент г € 1,η\</ι(1,η). Следовательно, преобразование h =(9i(l) Л (2) ... Л(*) ··· л(<-1) г ρι(* + 1) ... дг{п)> 2 V 1 2 ... s ... t-1 t t + l ... η , является подстановкой из 5n, и для д" = g\h,2 имеем: д"(х) = х, если χ φ t, и </"(£) = 5. (12) Теперь из (12) и (11) находим: {д"д'){х) = д(х) для любого χ G Ι,η, т. е. д"д' — д, или подробнее, hxg^h^g1 = #. Так как h\,go,h2,g' € [А), и [А) — полугруппа, то д € [A). D § 5. Полугруппы бинарных отношений Рассмотрим множество Β(Ω) всех бинарных отношений на фиксированном множестве Ω. В § 1.Ш была определена операция умножения бинарных отношений ριΡ2·* Va, b € Ω : {а{р\р2)Ь <=> 3 с € Ω : apic, срг^), и показано, что эта операция ассоциативна. Следовательно, (-Β(Ω), ·) — полугруппа. Очевидно, что эта полугруппа конечна (и имеет порядок если |Ω| < оо, и бесконечна в противном случае. В полугруппе B(Q) есть единичный элемент, им является отношение равенства. (Проверьте!) Укажем на связь полугруппы B(Ct) с рассмотренной в § 4 полугруппой Π(Ω). Утверждение?. Полугруппа (Π(Ω);·) всех преобразований множества Ω изоморфно вложима в полугруппу (Β(Ω); ·). 233
D Зададим отображение φ\ Π(Ω) —> Β(Ω), сопоставив каждому преобразованию д G Π(Ω) отношение рд, определенное следующим образом: Va, 6 € Ω : (apgb & д(а) = 6). Покажем, что φ — мономорфизм. Во-первых, отображение φ инъек- тивно. Действительно, если g,h € Π(Ω) и д Φ /ι, то существуют такие а, 6 G Ω, что д(а) = Ь Φ h(a). Следовательно, (a, 6) € рд и (а, 6) ^ р^, т. е. рд Φ рь. Во-вторых, φ — гомоморфизм, т. е. для любых д, h из Π(Ω) выполняется равенство: tp{gh) = <p{g)<p{h), или pgh = pgph. Справедливость последнего равенства доказывает следующая последовательность равносильностей: ард^Ь о {gh)(a) = Ь ^ Зс € Ω: д(а) = с, h(c) = b <& ^ Зс € Ω: (аррС, ср^Ь) <=> a{pgph)b. Π Из утверждения 7 и теоремы 3 получаем Следствие. Любая полугруппа изоморфно вложима в полугруппу бинарных отношений Β(Ω) на подходящем множестве Ω. Рассмотрим еще ряд других используемых в практике операций над бинарными отношениями. Так как B(Q) есть множество всех подмножеств декартова квадрата Ω χ Ω, то на Β(Ω) определены ассоциативные бинарные операции пересечения Π и объединения и. Следовательно, имеем еще две полугруппы бинарных отношений на множестве Β(Ω): (-Β(Ω); Π),(Β(Ω);ϋ). Обе эти полугруппы коммутативны и имеют нейтральные элементы — соответственно универсальное отношение Ω χ Ω и пустое отношение 0. В том случае, когда множество Ω конечно, с полугруппами (-Β(Ω); Π) и (-Β(Ω); U) естественным образом связаны изоморфные им полугруппы матриц над Ζ2 = {0,1}. Определение 10. Матрицей инциденций бинарного отношения ρ на множестве Ω = {w\,... ,wn} называется матрица Ар = (агз)пХп, в которой для любых i,j € Ι,η: {1, если (wt,w3) € ρ, 0, если (wt,Wj) £ ρ. 234
Заметим, что матрица Ар зависит от упорядочивания элементов множества Ω, однако при фиксированном порядке соответствие ρ —► Ар задает биективное отображение σ множества Β(Ω) на множество Вп всех η χ η-матриц над Ζ2, или булевых матриц порядка п. Выясним, как выражаются матрицы инциденций отношений Р1Р2, Pi Π р2, pi U р2 через матрицы АР1, АР2. С этой целью введем сначала на множестве матриц Вп три новые операции. При их определении элементы 1, 0 рассматриваются как истина и ложь в математической логике, и потому становится возможным использование логических операций конъюнкции & и дизъюнкции V (см. § 2.1). Далее для а, 6 € {1,0} вместо а & 6 будем писать аЬ. Определение 11. Пусть А = {агз)пХп, В = (Ьгз)пХп две матрицы с элементами из множества {1,0}. Пересечением, объединением и логическим (или булевским) произведением матриц А, В называются соответственно матрицы: А Л В = (сгз)пХп, АУ £ = (dzj)nxn, AkB = {sl3)nXn, где для всех г, j € Ι,η: η сгз = агзЬ%3, d%3 = аг>7 V b%3, сгз = γ atkbk3. fc=l Очевидно, что введенные определением 11 операции на множестве Вп ассоциативны и мы имеем три полугруппы матриц: (Bn;A),(Bn;V),(Bn;&). Теорема 5. Если Ω = {wi,..., wn}, то отображение σ: Β(Ω) —> —► Βη, определенное формулой: νρ€Β(Ω):σ(ρ)=Αρ, лвАяешсл изоморфизмом полугрупп (Β(Ω); Π), (Β(Ω); υ), (Β(Ω), ·) бинарных отношений соответственно на полугруппы матриц(Вп\Λ), (Вп\ V), (вп;&). D Выше уже отмечалось, что отображение σ — биективно. Чтобы показать, что σ является гомоморфизмом в каждом из указанных в 235
теореме трех случаев, достаточно для любых р\,р2 € Β(Ω) доказать равенства: ΆριΠρ2 ~ А-р\ " А-р2, Apx\jp2 = Арх V Ар2, Лр1Р2 = Арг czAp2. \±*j) Доказываются эти равенства сходным образом. Докажем для примера последнее равенство Пусть АР1 = {агз)пхп, АР2 = {Ьгз)пХп, APlP2 = {сгз)пхп. Используя определения соответствующих понятий, получим цепочку эквивалент- ностей с13 = 1 ^ wl(pip2)wJ & 3wk € Ω: (wlpiWk,WkP2'Wj) <=> η <=» Зк € Tji; {агк = 1, Ьк3 = 1) & \J alsbSJ = 1. Таким образом, имеем: η Vi,j € ϊ~η: cZJ = Υ als6s:7, т. е. APlP2 = APl&AP2. D Задачи 1. Будут ли подполугруппами полугруппы (Pn,n; ·) всех η χ η-матриц над полем Ρ множества: а) всех матриц ранга г; б) всех матриц рангов, не превосходящих г (г — любое число из множества 0, п)? 2. Пусть R — коммутативное кольцо с единицей и R\ С R. При каком условии множество всех матриц из Rn%n с определителями из R\ образует подполугруппу полугруппы (Дп,п;*)? 3. Найти все элементы подполугруппы [А) полугруппы (Z; +), если: а) А = {3,5}; б)А = {4,6,10}; в)А = {2, -3}. 4. Пусть Ε — множество всех элементарных матриц размеров η χ η над полем Р. Доказать: а) Е порождает полугруппу (Р^п; ·)> при любых η € N и Р; б) Ε порождает полугруппу (Рп,п',+) тогда и только тогда, когда Ρ φ GF{2) или Ρ = GF{2) и η = 1; ' 236
в) подмножество Μ = Ε UF из Pn,n порождает полугруппу {Рп%п\ ·) тогда и только тогда, когда в F содержится хота бы одна матрица ранга п-1. 5. Доказать, что для любых а, 6, αϊ,..., at € Zm в полугруппе (Zm; +) справедливы утверждения: а) [а) С [6) <& (6, га) | (а, га); б) [а) = [6) <=» (6, га) = (а, га); в) [ab...,at) = [di) = [d>, где di = (ab...,at), d = (аь... ,at,ra). 6. Описать все подполугруппы полугруппы (Zm;-b) при га = р, рп, 100, где ρ — простое число. 7. Описать с точностью до изоморфизма все циклические полугруппы. 8. Является ли отображение φ: С —> С гомоморфизмом полугруппы (С; *) в себя, если * есть 4- или ·, а φ определяется одним из следующих равенств (при любом а = а-Ьбг€Си фиксированном η € Ν): а) φ(α) = |α|; б) ^(α) = агда\ в) <£>(<*) = па; г) v?(a) = an; д) φ(α) = a; e) φ(α) = a — bii 9. Пусть Я [ж] — кольцо многочленов над кольцом Д. Является ли отображение у?: Я [ж] —> Я гомоморфизмом полугруппы (Я[х]; *), в полугруппу (Я; *) если * есть 4- или ·, а φ определяется одним из следующих способов (при любом а(х) € R[x] и фиксированном η € Ν): а) φ(α(χ)) есть свободный член а(х); б) φ(α(χ)) есть старший коэффициент а(х), если а(гг) Φ 0, и 0 если а(х) = 0; в) <р(а(х)) = а(г), для некоторого фиксированного г € Я? 10. Является ли гомоморфизмом полугруппы (Яп,п;*) на себя отображение φ: Яп,п —> Яп,п, если Я — любое кольцо, * есть 4- или ·, а φ каждую матрицу А отображает в транспонированную к ней матрицу Ат. 11. Являются ли конгруэнциями отношения: а) "иметь равные действительные части" на полугруппах (С; +), (С; ·); б) "иметь равные ранги" на полугруппе матриц (Рп,п; ·) над полем Р; в) "иметь одно и то же множество простых делителей" на полу группе (Ν;·); г) "иметь равные значения в фиксированной точке г из кольца Я" на полугруппах многочленов (Я[ж];+), Я[ж];·); д) "иметь равные дефекты" на полугруппе (Пп; ·)? 237
12. Описать все обратимые элементы в полугруппах бинарных отношений: (В(М),·), (В(М);П), (£(M);U) при Μ =Τ~ή. 13. Описать все конгруэнции и все гомоморфные образы полугрупп (Ζρ«; +) и (Ζρη; ·) при простом р. 14. Будут ли подполугруппами в полугруппе (В(М); *), где * € {П, U, ·}, подмножества: а) всех рефлексивных отношений; б) всех симметричных отношений; в) всех транзитивных отношений; г) всех конгруэнции?
ГЛАВА XI ОСНОВЫ ТЕОРИИ ГРУПП Понятие группы является одним из основных понятий современной математики, широко используемым в различных областях науки и техники. Как уже отмечалось во введении, понятие группы появилось в связи с исследованиями по проблеме разрешимости алгебраических уравнений над полем в радикалах. Эти исследования завершили создание теории Галуа. При этом рассматривались лишь группы подстановок. По существу, такие группы использовались до Галуа в работах Ла- гранжа (1771), Руффини (1799), Абеля (1824). Однако термин "группа" ввел Галуа в 1832 г. Небольшие и кратко написанные работы Галуа долгое время оставались мало доступными. Существенное развитие теория групп получила в опубликованном в 1870 г. "Трактате о подстановках" французского математика К. Жордана (1838-1922). Эта книга (объемом 667 страниц), названная Жорданом коментариями к работам Галуа, привлекла всеобщее внимание математиков к теории групп. Далее, в конце XIX в. и в начале XX в. теорию групп успешно развивали такие крупные математики как У. Бернсайд и, Ф. X. Клейн, А. Кэли, С. Ли 12 и др. Благодаря их работам постепенно сформировалось понятие абстрактной группы. Определенные итоги развития групп на этом этапе были подведены в книгах У. Бернсайда "Теория групп конечного порядка" (1897) и О. Ю. Шмидта "Абстрактная теория групп" (1916). В данной главе будут изложены основы общей теории групп. § 1. Определяющие свойства групп Введенная в предыдущей главе терминология позволяет определить группу как полугруппу с нейтральным элементом, в которой для каждого элемента есть обратный. Ниже будет показано, что класс всех групп можно выделить из класса всех полугрупп и некоторыми другими наборами свойств (каждый такой набор свойств называют определяющим). У. Бернсайд (1852—1927 ) — английский математик. С. М. Ли (1842—1899) — норвежский математик. 239
Определение 1. Элемент еп {ел) группоида (М, *) называют правым (левым) нейтральным, если Vm€M:m*en=m ( Vm€M: ел*т = т). Ясно, что если в группоиде (М, *) есть нейтральный элемент, то он — левый и правый нейтральный. Наоборот, если в (А/, *) имеются левый ел и правый еп нейтральные элементы, то они совпадают: ел = ел * * еп = еп, следовательно, в (М, *) есть нейтральный элемент. Читателю предлагается самостоятельно привести примеры полугрупп, в которых есть один или несколько правых нейтральных элементов и нет ни одного левого. Определение 2. Если в группоиде (Λί, *) есть правый нейтральный элемент еп, то правым обратным для элемента га € Μ (относительно правого нейтрального еп) называют элемент т'п со свойством га * τη'γι = еп· Теорема1. Для полугруппы (Я,*) следующие утверждения эквивалентны: а) (Я, *) — группа; б) для любых g,h € Я каждое из уравнений g*x = huy*g = h (1) однозначно разрешимо в Я; в) для любых g,h € Я уравнения (1) разрешимы в Я; г) в (Я,*) существует правый нейтральный элемент еп, относительно которого для каждого ft € Я существует правый обратный элемент h!u € Я. D Импликация а) => б) — это теорема 2.Ш, а импликация б) => => в) очевидна. в) => г). Зафиксируем g € Я и обозначим через е9 решение уравнения g * χ = g. Тогда е9 = еп — правый нейтральный элемент в (Я, *), поскольку для любого ft € Я существует у^ € Я со свойством h = уь*д и справедливы равенства h*eg = {yh*g)*eg = yh*{g*eg) = ytl*g = ft. Правым обратным для ft относительно еп является решение уравнения ft * х = еп · г) => а). Для произвольного элемента ft € Я, пользуясь равенством еп = /*п * (^πίπ» получаем 240
h'n * h = (h'n * h) * en = (h'n * h) * (h'n * (/ι'π)π) = = h'n * (h * h'n) * (/ι'π)π = (ЛЬ * en) * (/ι'π)π = en- (2) Отсюда, пользуясь равенством en = h*h'n, получаем en* Л = h*h'n*h = = /ι * en = Л. Следовательно, еп — нейтральный элемент в (Я,*). Но тогда в силу (2) h'n — обратный для h элемент, т. е. (Я, *) — группа. D Полезно заметить, что эквивалентность утверждений а) и г) теоремы позволяет производить "в два раза меньше" выкладок при проверке того, является ли данная полугруппа группой. Эквивалентность утверждений а), б), в) объясняет важную роль понятия "группа" в математике. В дальнейшем, для обозначения групповой операции используются традиционные символы "+" и "·", соответствующие аддитивной и мультипликативной формам записи. Употребляемые при этом обозначения и терминология приведены в § 2.Ш. Аддитивная форма используется ниже только для коммутативных операций, мультипликативная — для произвольной групповой операции. § 2. Порядки элементов и экспонента группы Определение 3. Порядком элемента g группы (G, ·) называют наименьшее из чисел η € N со свойством дп = е, если такие η существуют, и бесконечность — в противном случае. Порядок д обозначают через ord д и пишут, соответственно, ord д = η или ord g = оо. Естественно, в группе (G, +) при определении порядка элемента условие дп = е заменяется на пд = Θ. Пример1.В группе (Z, -Ь) все ненулевые элементы имеют бесконечный порядок. Пример 2. В группе (Zm, +), т € N, каждый элемент имеет конечный порядок: W € Ът (md = 0). Пример 3. В группе (С*, ·) обратимых элементов поля С комплексных чисел есть как элементы конечного порядка (все корни конечных 241
степеней из 1), так и элементы бесконечного порядка (все остальные числа). Очевидно условию ordg = 1 удовлетворяет лишь нейтральный элемент группы. Определение 4. Группа G, состоящая из конечного числа η элементов, называется группой порядка η или, просто, конечной группой. Пишут \G\ = η или \G\ < оо. Утверждение!.. Порядок любого элемента g конечной группы G конечен. D Если \G\ = η, то среди элементов д° = е,^1,··· ,дп есть одинаковые. Следовательно, существуют к,£ € No такие, что 0 < к < ί < η и 9к = 9е' Умножая обе части последнего равенства на д~к, получаем /-* = е, £ - к € N. D Пример 3 показывает, что в бесконечной группе не обязательно порядки элементов бесконечны. Более того, существуют бесконечные группы, в которых все элементы имеют конечный порядок (т. е. обращение утверждения 1 не верно). Π ρ и м е ρ 4. Для простого ρ G N множество С(р°°) = {£€С: 3 к € Ν(ξρ" = 1)} замкнуто относительно операции умножения. С(р°°) — группа, в которой каждый элемент имеет конечный порядок. Основные свойства функции ord g описывает Теорема2. Пусть д — элемент конечного порядка т в группе (G,·)· Тогда: а) элемент д^1 равен неотрицательной степени элемента д: д~г = = 9т-\ б) 4k £Z(gk = e)& (m\k); B)V/c€Zord5* = ^; г) если h € G элемент порядка n, (га, п) = 1 и gh = hg, то ord gli = = ord g- ord h = m · n. D а) Равенство g~* = gm~l доказывается умножением равенства е = = gm на g""1. б) Разделим k на m с остатком: fc = gra + г, 0 < г < га. Тогда g* = (gm)q · #г, и так как г < m = ordg, то (9k = е) « (ffr = е) *► (г = 0) Ф> (т\к). 242
в) Пусть h = дк и η € N. Тогда, пользуясь утверждением б) и теоремой 5 б) .IV, получаем: to· -«) · If - .)«<■#»> · (<^yl<^) - ((^yl«) ■ Таким образом, ord/i < оо и наименьшее η € N со свойством hn = e есть η = ^. г) Так как (#/i)mn = (gm)n(hn)m, то ord#/i < оо и согласно б) ord gh = Л, где к\т · п. С другой стороны, так как (gh)k = gk · hk = e, то #* = /ι~* и ordg* = ord/i"*. Отсюда по утверждению в) получаем равенство ^ = ^, а так как (m,n) = 1, то ^ = ^ = 1. Следовательно, т\к и n|fc, а потому тп\к. Таким образом, тп — к. D Определение 5. Экспонентой группы (G, ·) называют наименьшее из чисел га € N со свойством V<7 € G (дт = е), если такие m существуют, и бесконечность — в противном случае. Экспоненту группы G обозначают через expG и пишут, соответственно, exp G = га или exp G = оо. Π ρ и м е ρ 5. exp(Z, +) = оо, exp(Zm, +) = га, expC(p°°) = оо. Утверждение 2. Экспонента конечной группы G = {д\,..., дп} конечна и удовлетворяет равенству exp G = [ord#1,..., ordgn]. (3) При этом, если G — абелева группа, то существует элемент g € G со свойством ord g = exp G. D Пусть k = [ord 0i,... ,ord#n]. Тогда для любого g € G ввиду теоремы 26) верно равенство ^ = еи потому expG < /:. Пусть expG = = га. Тогда по определению д™ = е и по теореме 26) ordgjra, г € Ι,η. Следовательно, fc|m, и так как га < fc, то k = m, т. е. верно (3). Пусть (G, ·) — абелева группа и число т = expG имеет каноническое разложение га = р\х · ... · pkt. Тогда из (3) следует, что для каждого —— к j € 1,£ существует элемент h3 £ G со свойством peloid/ij (иначе не к к выполнялось бы условие p3J\m). Пусть ord/ij = p3J · п3. Положим f0 = = h3J. Тогда по теореме 2в) oxaf3 = р3 , j € Ι,ί, и по теореме 2г) # = /ι ·... · ft — искомый элемент порядка га. D 243
Очевидно, что вторая часть утверждения 2 справедлива для любой абелевой группы с конечной экспонентой. Пример группы (^2)9,2 по" называет, что в этой части утверждения нельзя отказаться от условия коммутативности. Полезно заметить также, что если expG = 00, то в группе G не обязательно есть элемент бесконечного порядка, даже если она коммутативна. Пример тому группа С(р°°). В § 4 будут получены дополнительные соотношения между порядком конечной группы, ее экспонентой и порядками ее элементов. § 3. Подгруппы. Подгруппа, порожденная подмножеством 1. Определение 6. Непустое подмножество Я группы (G, ·) называют ее подгруппой, если Я замкнуто относительно групповой операции и является группой относительно этой операции. В этом случае пишут Я < (G, ·) или Я < G, и если Я £ {G, {е}}, то подгруппу Я называют собственной. Очевидно, что всякая подгруппа в (G, ·) является подполугруппой, но обратное неверно, как показывает пример подполугруппы N в (Ζ, +). Ясно также, что если Я < (G, ·), Μ < (Я, ·), то Μ < (G, ·). Π ρ и м е ρ 6. Для каждого га € Ζ множество raZ = {тк: к € Z} есть подгруппа в (Z, +). Π ρ и м е ρ 7. Пусть Г — множество всех комплексных чисел с модулем 1, Гм — множество всех элементов конечного порядка из С*, Гт — множество всех корней степени т € N из единицы в С, тогда: (гт,.)<(гм,-)<(г,-)<(с·,·); для каждого простого ρ € N и каждого η € Ν: (Гр.,-)<(С(р00),-)<(Гм,·)· Пример8. Для любой группы (G, ·) множество C(G) = {9 € G: V/i € G (gh = hg)}, называемое центром группы G, есть подгруппа в (G, ·). (Докажите!) 244
Π ρ и м е ρ 9 Для любой абелевой группы G множество T(G) всех ее элементов конечного порядка есть подгруппа в G (Докажите1) Эта подгруппа называется подгруппой кручения группы G В частности T(C*) = rN,T(R*) = {l,-l} УтверждениеЗ Если Я — подгруппа группы (G, ), то ее нейтральный элемент е# совпадает с ее и для каждого h € Я обратный к h элемент в Я совпадает с обратным к h элементом в G D Равенство е# = ее следует из равенств е#е# = е# и есен = е# ввиду теоремы 16) Последняя часть утверждения теперь следует из единственности решения в G уравнения hx — ее G При проверке свойства "быть подгруппой" полезно Утверждение4 Непустое подмножество Я группы (G, ) является ее подгруппой тогда и только тогда, когда Vg,h€H{gh-l€H) (4) D Если Η < (G, ), то (4) следует из определения подгруппы и утверждения 3 Пусть верно (4) Так как Я φ 0, то существует g € Я ив силу (4) е = g g"1 € Η Тогда для любых g,h € Η справедливы соотношения /ι"1 = eh"1 € Η и gh = g{hrl)~l € Η Следовательно, подмножество Η замкнуто относительно групповой операции на G, и так как эта операция ассоциативна, то Η удовлетворяет всем условиям определения 6, τ е Я < (G, ) Π Следствие1 Конечное непустое подмножество Η группы G является ее подгруппой тогда и только тогда, когда Vg,h€H (gh€H), (5) т е тогда и только тогда, когда Η — подполугруппа в (G, ) D Пусть h € Я Тогда при условии (5) hn € Я для любого η € N Отсюда ввиду конечности Я так же, как и при доказательстве утверждения 1, получаем, что порядок элемента h конечен и по теореме 2 а) /ι"1 € Я Теперь видно, что из (5) следует (4) D Следствие2 Пусть φ (G, ) —> (К, ) гомоморфизм групп Тогда а) если Я < G, то φ(Η) < К, б) если L < К, то 4>~~1{L) < G D а) Для любых α, β € φ(Η) существуют а, 6 € Я такие, что φ(α) = = α, ip{b) = β Так как а б"1 € Я и ^(б""1) = ^(б)""1 , то α/3"1 = φ(α) 245
б) Если a,b € 4>~1{L), то φ(α), ip(b) € L и φ(α) · ^(Ь)"1 € L. Поэтому (р(аЬ-г) = <ρ(α) · <p(b)~l € L, т. е. а · б"1 G γ?"1^)· π 2. Один из основных способов описания подгрупп группы G связан со следующим их свойством. Утверждение 5. Пересечение любого семейства {Ga: а £ А} подгрупп группы (G, ·) есть ее подгруппа. О Пусть Я = f] Ga. Тогда для любых g,h € G (g,he Я) =» (Va € A{g,h€ G«)) =» Va e^^1 € GQ) =» (^/Г1 € Я), и по утверждению 4 Я < (G, ·). D Из утверждения 5 следует, что корректно Определение?. Подгруппой группы G, порожденной данным подмножеством S С G, называется подгруппа (5), равная пересечению всех подгрупп Я < (G, ·), содержащих S: (S) = Π Я. $СЯ<(<3\.) Если при этом (5) = G (т. е. G — единственная подгруппа в G, содержащая 5), то говорят, что S — система образующих группы G, или что группа G порооюдается множеством S. Разумеется, всегда G = (G). Однако при изучении свойств данной группы G всегда важно найти для нее систему образующих, содержащую как можно меньше элементов. Например, можно написать (Ζ, +) = (Ν), а можно - (Ζ, +) = (1). Определеннее. Группу G называют конечно порожденной, если она имеет конечную систему образующих, и циклической, если она может быть порождена каким-либо одним элементом. Важный результат, позволяющий строить различные системы образующих группы, состоит в следующем описании элементов группы (5). Очевидно, что (0) = {е}. Теорема 3. Для любого непустого подмножества S группы (G, ·) подгруппа (S) состоит из всех элементов g € G вида g = s^1 ·... · s£n, где η € Ν, st € 5, Οχ € Ζ <?лл ΐ € 1, η, m. e. (S) = {geG: g = scl1 ·...·$£', 2<?en€N,s, € S,^ €Ζ,ί€Ϊ~η}. (6) 246
D Пусть S — множество из правой части доказываемого равенства (б). Тогда 5 С (5). Действительно, так как S С (S) и (S) — подгруппа в (G, ·), то (S) содержит все конечные_произведения элементов из 5 и обратных к ним, т. е. все элементы из S. Для доказательства обратного включения заметим, что S < (G, ·). Действительно, если д> h G 5, то д = а\1 ·... · а^·*, h = β*1 ·... · β„η для некоторых m, η € Ν, αι,/^ G S,alybj G Ζ (i € l,m, j G l,n), и потому g/i"1 = α"1 ·... · a%[n · /?~bw ·... · /?J~bl — элемент из 5. Остается заметить, что так как S С 5, то по определению 7 (5) С 5. D Следствие1. В условиях теоремы 3 подгруппа (S) коммутативна тогда и только тогда, когда элементы множества S попарно перестановочны. Следствие 2. В условиях теоремы 3 справедливо равенство (S) = [5 U 5"1), где 5"1 = {s"1: s G 5}, α если G — конечная группа, то (S) = [S). D Достаточно воспользоваться утверждением 2.Х и теоремой 2 а). D Следствие 3. Если φ: G —> Η гомоморфизм групп и G = (5), mo<p(G) = (Y>(S)). ПримерЮ. Группа G = (Рп,п)* всех обратимых η χ η-матриц над полем Ρ порождается множеством S всех элементарных матриц (см. следствие 3 теоремы 3.VII). ПримерП. Группа (Q, +) порождается множеством S всех дробей вида Λ·, где ρ пробегает множество всех простых чисел, а к — множество N. Если S' получено из S удалением конечного множества элементов, то равенство Q = (S') сохраняется. (Докажите!) Замечание1. Если S = {#ι,..., gt} — конечная система попарно перестановочных элементов группы G, то элементы порождаемой ею подгруппы допускают существенно более простое описание: (9u---,9t) = {g€G: g = g\l ·...·£?*, где cb...,ct G Ζ} при мультипликативной форме записи групповой операции, и: {9\,"-,9t) = {9€G: g = cxgi + ... + ctgu где cb...,ct G Ζ} при аддитивной форме записи. Первое из этих равенств легко получается из (6) перегруппировкой сомножителей в представлении элементов g G G в виде g = s^1 ·... · s£*, а второе — его аддитивный аналог. 3. Теорема 3 позволяет описать все циклические группы и их подгруппы. 247
Теорема 4. Пусть (G, ·) = (д) — циклическая группа. Тогда: а) если ordg = т < оо, то (G, ·) = (Zm,0) и G={e = gQ,91,...,9m-1}; (7) б) если ordg = оо, то (G, ■) = (Z, +) и С = {...,<Гт,...,<Г\е,5,...,<Л...}; (8) в) если Я < (G, ·), mo Я — ^ιικ,/ιι^βοκαΛ группа. D Легко видеть, что отображение у?: Ζ —> G такое, что Vc € Ζ: <р(с) = = #с есть гомоморфизм группы (Ζ, -Ь) в группу (G, ·). Так как по теореме 3 любой элемент из G имеет вид дс при подходящем с € Ζ, то φ — эпиморфизм. Тогда по теореме 2.Х группа (G, ·) изоморфна факторгруппе (Ζ/ρ, +), где ρ — конгруэнция на (Ζ, -Ь), определяемая условием να,6€Ζ(αρ&4Φ0α=06). а) Если ordg = га, то, пользуясь теоремой 26), получаем Va, 6 € Ζ (#α = #ь) «Φ (0α~6 = e) ^ (a = 6(mod га)). В этом случае ρ есть отношение сравнимости по модулю га, (Ζ/ρ, +) = = (Zm,0) (см. § 2.V замечание 1), и очевидно, что все различные элементы группы G описываются равенством (7). б) Если ordg = оо, то Va,6€Z:ga = дь & а = 6, т. е. ρ есть отношение равенства на Ζ, и (Ζ/ρ, +) = (Ζ, +), в этом случае группа G описывается равенством (8). в) Пусть Я < G. Если Я — {е}, то Я — (е) — циклическая группа. Если Я Φ {е}, то существуют числа к € Ζ \ {0} такие, что #fc € Я. Выберем среди них наименьшее по абсолютной величине число с. Пусть дс = h. Покажем, что Я = (h). Включение (h) С Я очевидно. Наоборот, для любого h\ £ Η существует к £ Ζ такое, что h\ = gk. Разделим к на с с остатком: к = qc + r, 0 < г < |с|. Заметим, что #r = gk -g~qc = /ii · • /ι"9 € Я, поэтому условие г ^ 0 противоречит выбору с. Следовательно, г = 0, k = q-cnh = hq£ (/ι), т. е. Я С (/ι). D 248
Следствие. Две циклические группы изоморфны тогда и только тогда, когда их порядки равны. Бесконечная циклическая группа изо- морфна любой ее собственной подгруппе. Из теоремы Зв) следует, в частности, что примером 6 описаны все подгруппы группы (Z, +). Описание всех подгрупп конечной циклической группы будет дано в § 4. § 4. Смежные классы. Теорема Лагранжа. Подгруппы циклической группы 1. Каждая подгруппа Я группы (G, ·) задает на G следующие два бинарных отношения. Определение!). Говорят, что элементы а, Ь группы G сравнимы по подгруппе Я справа (слева), и пишут а = 6(Я)п (а = Ь(Я)л), если ab-1 € Η {а~1Ь € Н). Если G — абелева группа, то отношения сравнимости по Я справа и слева совпадают, поскольку ab~l € Я & (аЬ-1)-1 € Я & 6а"1 € Я & аГ1Ъ € Я. В этом случае говорят просто об отношении сравнимости по подгруппе и пишут а = Ь (Я). При аддитивной форме записи групповой операции отношение сравнимости по подгруппе группы (G, +) задается условием а = Ь (Я) <& а - Ь € Я. Эта запись позволяет легко увидеть, что в предыдущих главах нам уже встречались отношения на группах, являющиеся отношениями сравнимости по подгруппам. Π ρ и м е ρ 12. На (Ζ, +) отношение сравнимости по модулю т есть отношение сравнимости по подгруппе (га) = raZ: Va, Ь € Ζ (α = 6(modm)) & (a = ft(mZ)). Π ρ и м е р 13. На мультипликативной группе (С*, ·) поля С равенство аргументов чисел эквивалентно сравнимости чисел по подгруппе (Е>о> ·) а равенство модулей — сравнимости по подгруппе (Г, ·) (см. пример 7). 249
Все приведенные в качестве примеров отношения являются отношениями эквивалентности, и это, как мы сейчас покажем, не случайно. ОпределениеЮ. Правым (левым) смежным классом группы (G, ·) по ее подгруппе Я с представителем д € G называется множество Нд (множество дН). Теорема 5. Пусть Η — подгруппа группы (G, ·)· Тогда: а) отношение сравнимости на G по подгруппе Η справа есть отношение эквивалентности; б) для любого g € G класс элементов, сравнимых с g по Η справа, есть Нд. Любые два правых смежных класса группы G по подгруппе Η либо не пересекаются, либо совпадают. Группа G распадается на непересекающиеся правые смежные классы по подгруппе Н. Аналогичные утверждения верны для левых смежных классов группы G по подгруппе Η и отношения сравнимости по Η слева. D а) Обозначим, для краткости, отношение сравнимости на G по Η справа через р, т. е. положим Va,6 € G: apb <=> а = 6(Я)п <=* &Ь~1 € Н. Отношение ρ — рефлексивно, так как е € Я, и симметрично, так как в Η существует обратный для каждого элемента из Н. Наконец, ρ — транзитивно, так как если арЬ и брс, то afr"1 € Я, 6с"1 € Я, и потому ас~1 = (аЬ~г) · (ЬсГ1) € Я, т. е. аре. б) Для каждого g € Я класс [д]р всех элементов, ρ — эквивалентных д, имеет вид [д]р = {а € G : ад'1 = ή, h € Я} = {а € G : а = hg, h € Я} = Η д. Теперь из общих свойств отношений эквивалентности (теорема 1.П) следует, что для любых д\,д% € G классы Нд\ = [д\\р и Нд2 = [д2[Р либо не пересекаются, либо совпадают, и если {Нда: а € А} — множество всех различных правых смежных классов G по Я, то G = [J Я5а. D (9) ОпределениеП. Представление (9) группы G в виде объединения попарно непересекающихся правых смежных классов по подгруппе Я называется разложением G на правые смежные классы по Н. Полезно заметить, что в (9) один из смежных классов G по Я есть Н = Не. 2. Следующий результат по эффективности его использования в теории групп является одним из основополагающих. 250
Теорема 6. а) Любые два правых {левых) смежных класса группы G по подгруппе Я равномощны. В частности, в конечной группе G для любого g € G верны равенства \Н\ = \Нд\ = \дН\. б) Множество УК правых смежных классов G по Η равномощно множеству £ левых смежных классов G по Я. D а) Достаточно заметить, что отображение φ: Я —» Нд, определяемое формулой V/i € Я {φ(Η) = hg), есть биекция. Следовательно, все смежные классы G по Я равномощны Я. б) По теореме 5 и определению 9 для любых д\, д2 € G справедливы импликации: Ηдх = Нд2 & дгд^1 € Я <* (fff1)"1^1 € Я & д^1Н = ^Я. Отсюда следует, что отображение ф: 9\ —* £, определяемое условием УНд € 9*: 1р(Нд) = д~1Н, задано корректно и инъективно. Его сюрьек- тивность очевидна. Таким образом, ψ — биекция. D Определение^. Индексом подгруппы Я в группе G называют число правых (левых) смежных классов G по Я, если это число конечно, и бесконечность — в противном случае. Индекс Я в G обозначают через \G : Н\. Очевидно, что если Я < G, то Я = G <* \G : Н\ = 1. Π ρ и м е ρ 14. |Ζ : {0}| = оо. Если га € Ν, то |Z : raZ| = m, и Ζ = (mZ U (1 + mZ) U ... U (ra - 1 + mZ). Π ρ и м е ρ 15. Если га, k € N и η = m · k, то при условии Гп = (ξ) справедливо равенство Гп = Гт U ξΓγη U ... U ik~lTm. Следствие1 (теорема Лагранжа). Порядок подгруппы Я конечной группы G делит порядок G и \G\ = \G : Я| · |Я|. D Разложение G на правые смежные классы по подгруппе Я имеет вид G = Я^и.. .UHgk, где /с = |G : Я|. Отсюда \G\ = |#ffi| + .. . + |#ft| и ввиду утверждения а) теоремы 6 \G\ = k |Я|. D Следствие2. Если G > Я > К — цепочка подгрупп конечной группы G, то \G : К\ — \G : Н\ · |Я : К\. Если при этом \G : К\ = ρ — простое число, то либо Η = G, либо Я = К. °ιβ!*ι-$-Μ-|β!β|·|'!'π·α Следствие 3. Порядок любого элемента g конечной группы G делит \G\, в частности, д^ = е. 251
D По утверждению 1 ordg < оо и по теореме 4 а) подгруппа Η = = (д) имеет порядок |#| = ordg. Теперь соотношение ordg | \G\ следует из теоремы Лагранжа. D Следствие 4. Если G — конечная группа, то expG | \G\. D Достаточно воспользоваться утверждением 2 и предыдущим следствием. D Следствиеб. Любая группа G простого порядка ρ — циклическая. D Пусть g € G\ {е}. Тогда ordg > 1, ordg \ ρ, и так как ρ — простое, то ordg = ρ, и |(g)| = ρ = \G\. Следовательно, G = (g). О В общем случае для конечной группы G обращение теоремы Лагранжа, т. е. обращение импликации (3H<G(\H\=d))^(d\\G\), неверно. Соответствующий пример будет построен позже (пример 29). Однако для конечных абелевых групп обращение теоремы Лагранжа верно. В полном объеме это будет доказано в § 14, а пока докажем это, и даже более сильное утверждение, для циклических групп. Теорема7. В циклической группе G = (д) порядка т для любого натурального делителя d числа т существует единственная подгруппа Η порядка d: Η = (</*), где £ = ^. D Подгруппа Η = (ge) имеет порядок d, так как по теореме 2 в) ord ge = d. Если Η χ < G и \Н\ \ = d, то по теореме 4 в) Н\ — циклическая группа, т. е. Н\ =< gk > для некоторого к € 1, т — 1. Тогда по теореме 4а) ord#fc = \Н\\ = d и по теореме 2в) d = т^~), т. е. *j = (&,m). Поэтому *у | к и дк € (де) = Я, т. е. Я] С Я, а так как |#i| = |ff|, то #! = Я. D § 5. Произведения групп и подгрупп. Разложение группы 1. При описании строения групп используют различные способы, позволяющие из некоторой группы или совокупности групп строить другие группы. Один такой способ — факторизация — читателю уже 252
знаком по гл. X и еще будет подробно изучаться ниже. Другой, более простой, но также очень важный способ дает Определение 13. Прямым (внешним) произведением групп (Gi,·),... ,(Gt,·) называют группоид (G,·), где G = G\ χ ... χ Gt — декартово произведение множеств G\,..., Gt, а операция · на G задается условием: V# = (0i,...,0t) € G, Vft = (fti,...,ftt) €G: g>h = (дг · ftb... ,gt · /it). Для этого группоида используют обозначение: t G = GiO...(8)Gi = J^OGt. г=1 Утверждение 6. Пусть G = Gi (g>.. .0Gt — прямое произведение групп. Тогда: а) группоид (G, ·) есшъ группа; б) группа G — абелева тогда и только тогда, когда группы G\,... ..., Gt — абелевы; в) элемент g = (</ι,... ,</*) € G имеет конечный порядок тогда и только тогда, когда конечные порядки имеют элементы </χ,..., gt и β этом случае ord # = [ ord </i,..., ord #t]; г) экспонента группы G конечна тогда и только тогда, когда конечны экспоненты групп G\,..., Gt и при этом exp G = [exp G\,..., exp Gt]. D Утверждения а) и б) очевидны, если заметить, что нейтральный элемент в (G, ·) есть е = (ei,..., et) , где ег — единица (Gz, ·) для г € 1,£, а обратный для g = (дг,..., gt) € G есть у"1 = (yf1,..., &"1 )· в) Для любого А: € N справедливо равенство дк = (</}:,..., <7^) и потому (<7* = е) <=» (</i = ei,..., </* = et). Остается воспользоваться теоремой 26). г) Заметим, что число & € N удовлетворяет условию V& € Gz (sf = e.) тогда и только тогда, когда exp G%\k. Теперь утверждение об экспонентах групп G и Gi,...,Gt, легко следует из предыдущих рассуждений и определения 5. D Следствие1. Пусть G\,..., Gt — конечные циклические группы порядков, соответственно, mi,..., mt, и G = Gi ® ... ® Gt- Тогда следующие утверэ/сдения эквивалентны: 253
а) G — циклическая группа; б) числа т\у..., mt попарно взаимно просты. D Так как по условию \GS\ = expGa = ms для s € ТД то \G\ = = mi ·... · mt и по утверждению 6 г) exp G = [mi,..., mt]. Поэтому из а) следует равенство [mi,...,m*] = rri\ ·... · т$, которое эквивалентно б). Наоборот, по условию для каждого s € 1, t в группе Gs можно выбрать элемент д8 порядка ms. Тогда в силу утверждения 6 б) д = (д\,..., gt) — элемент группы G порядка [mi,..., mt]. Если верно б), то oidg = \G\ и справедливо a). D Теперь может быть доказано свойство мультипликативности функции Эйлера (см. определение 4.V). Следствие2. Если πΐ\,..., mt — натуральные попарно взаимно простые числа и т = mi ·... · mt, то φ(τη) = φ(τη\) ·... · <р(т*). D Пусть G\,..., Gt — группы из следствия 1. Тогда по теоремам 2 в) и 4а) число элементов порядка ms в группе Gs равно φ{τη8) и число элементов порядка m в циклической группе G = G\ ® ... ® Gt равно φ(τη). Остается заметить, что ввиду условия mi · ... · mt = m для произвольного элемента д = (</ι,... ,gt) € G справедливы импликации (ordg — т) 4^ (ord#i = mi,... ,ord#t = mt). (Докажите!) D При аддитивной форме записи операций в группах G\,..., Gt будем говорить не о прямом произведении, а о прямой сумме этих групп. В этом случае групповую операцию на G = G\ χ ... χ Gt определим равенством (дг,..., gt) + (hi,..., ht) = {g\ + ftb..., gt + ht) и группу (G, +) t обозначим через G\ θ ... Θ Gt или Σ Θ G% . ι=1 2. Простота описания свойств произведения групп G\®...® Gt через свойства сомножителей G% делает естественным правило: при изучении произвольной группы Η в качестве одного из первых шагов выяснить: не изоморфна ли она некоторому прямому произведению групп? Методика решения этого вопроса опирается на следующие общие понятия и результаты, представляющие значительный самостоятельный интерес. Определение 14. Произведением непустых подмножеств А и В группы (G, ·) называют подмножество А · В = {а · 6: а € Л, Ь € В). Если групповая операция записывается аддитивно, то вместо произведения аналогичным образом определяется сумма А-{-В. Очевидно, 254
операция произведения на множестве непустых подмножеств группы G ассоциативна и справедливо Утверждение?. Если А — непустое подмножество группы (G, ·) и А~1 = {а"1: а € А}, то А < (G, ·) <* {А-1 = АиА2сА)& (АА~1 с А). Отметим, что даже если А и В — подгруппы группы (G, ·), то множество А · В, вообще говоря, не является подгруппой в G. Например, в группе 5з (см. § 4.Ш) произведение любых двух различных подгрупп порядка 2 — не подгруппа. (Проверьте!) Однако верна Теорема 8. Произведение АВ подгрупп А и В группы (G, ·) есть подгруппа β (G, ·) тогда и только тогда, когда подгруппы А и В перестановочны, т. е. АВ = В А. D Пользуясь утверждением 7, получаем: если АВ < G, то АВ = = {АВ)-1 = В"1 А-1 = В А; наоборот, если АВ = В А, то {АВ){АВ)"г = = ABB"1 А"1 = АВВА = АВ. Следовательно, АВ < G. D Замечание 2. Если для подгрупп А и В группы G множество АВ есть подгруппа, то это — наименьшая подгруппа, содержащая А и Б, т. е. АВ = (A U В). (Докажите!) Следствие. Сумма (произведение) любого конечного семейства Αι,..., At подгрупп абелевой группы (G, +)(абелевой группы (G, ·)) есть подгруппа группы G. В дальнейшем произведение Αι -... - At подмножеств группы (G,·) t будем коротко записывать в виде [] Д, а сумму подмножеств группы ι=1 t (G, +) — в виде Σ Аг. Представление какой-либо группы в виде суммы ι=1 (произведения) ее подгрупп — один из важнейших способов описания различных классов групп. Π ρ и м е ρ 16. В группе (D@\ +) всех векторов декартовой плоскости, выходящих из начала координат, с операцией + сложения векторов по правилу параллелограмма, подмножество А всех векторов, концы которых лежат на фиксированной прямой, проходящей через начало координат, есть группа. Если В — любая другая подгруппа того же типа и А Ф В, то D^ = А + В. Последнее равенство иллюстрируется следующим рисунком 255
Ι с —► g=a+b Замечание 3. Операция пересечения подгрупп группы (G, +) не дистрибутивна относительно операции сложения подгрупп: если Л, В, С < (G, +), то С Π (Л + В) D (С Π Л) + (С Π Б), однако левая и правая части этого соотношения, вообще говоря, не равны. Например, из рисунка к примеру 16 видно, что А + В = £>(2> и С Π (Л + В) = С, но С Π Л = С Π Б = 0 и (С Π Л) + (С Π Б) = 0. Пример 17. Пусть G = Gi Θ ... Θ Gt — прямое произведение групп ие,- единица группы G% для г € 1, t. Для каждого дг € Gz через дг обозначим элемент группы G вида дг = (ei,..., ег_1, ди ег+1,..., е4), и положим Gt = {дг: дг € Gi}. Тогда очевидно, что G\,..., G% — попарно перестановочные подгруппы группы G, G% = G% и G = Gi · ... Gt- Более того, каждый элемент </ = (</ь ...,</*)€ G единственным способом представляется в виде д = ξι · ... · ξ*, где ξι € Gi^..., ξ* € Gt (это представление имеет вид д = дг, ·... ·pt), и подгруппы Gz и G3 при г ^ j не просто перестановочны, но перестановочны поэлементно, т. е. если ξι € Gt и ξ, € Gj, то &ξ, = ξ,&. 3. Теперь можно ответить на вопрос — при каких условиях группа Η изоморфна прямому произведению групп? Определение 15. Группа (Я, ·) называется прямым произведением своих подгрупп Н\,..., fft, если: 1) каждый элемент h € Η однозначно представляется в виде: h = h\ -... · /it, где h\ € Н\,..., ht € Я*; 2) для любых i,j € 1,£, г ^ j, группы Нг и Я; поэлементно перестановочны, т. е. (ht € Hlyhj € i?j) =Φ· (h%h3 — h3h%). В этом случае пишут Η = #ι χ ... χ fft. 256
Π ρ и м е р 18. В обозначениях примера 17 справедливо равенство G = G\ χ ... χ Gt. Более того, если для некоторой группы Я существует изоморфизм φ: G\ Θ ... Θ Gt -» Я, то Нг = <p(Gi), ..., Ht = <p(Gt) — подгруппы группы Я и Я = i?i χ ... χ Ht. Π ρ и м е ρ 19. Если kj£ Ν, (к J) = 1, (*,*) = 1, то Гке = Гкх Ге. Π ρ и м е ρ 20. С* = Г χ R>o, где ((R>o, ·) — группа всех положительных действительных чисел. Π ρ и м е ρ 21. Пусть к,п € N,1 < к < η н (Я, ·) — группа всех подстановок h множества 1,п, обладающих свойством: /t(l,fc) = 1,Л. Тогда в Я есть подгруппы Н\ = {/ι € Я: Л(г) = г для г € 1,Л}, Яг = = {h € Я: ft(j) = j для j € & + 1,гс} и Я = Нг х Я2. Утверждение8. Пусть группа Я раскладывается в прямое произведение подгрупп: Η = Ηχ χ ... χ Я4. Тогда: а) H*H = H1®...®Ht; б) если /ι = /ii ·.. . ·Λ4, где /ii Ε Яь ... ,/it € Я4, mo ord Л = [ord Ль... ..., ord ht)j если порядки элементов /ii,..., /it конечны, и ord /ι = οο β противном случае; в) если подгруппы Н\у..., Я* конечны, то |Я| = |Я!|.....|Я4|, ехрЯ=[ехрЯь...,ехрЯе]. D а) Определим отображение у?: Η -> Η правилом: <p{{h\,..., /it)) = = Αι · ... · /it. Тогда, ввиду условия 1) определения 15, у? — биекция, а, ввиду условия 2), у? — гомоморфизм: ¥>((Λι,..., /it) · (/ιί,..., /ι£)) = y>((fti · Λί,..., ftt · /ij)) = Λι · ΛΊ · /i2 · h'2 ·... ... · л* · л; = Λι ·... · л* л; ·... ·Μ = <^((Λι,...,λ*» · ((λ;,...,λ;». Утверждения б) и в) следуют теперь, соответственно, из утверждений 6 в) и 6 г). D Замечание 4. Если группа (Я, ·) — абелева, то для любых ее подгрупп Н\,.. .,НЬ условие 2 определения 15 выполняется автоматически, и равенство Я = Н\ χ ... χ Ht эквивалентно условию 1 этого определения. Замечание 5. Если Я — абелева группа с аддитивной формой записи операции, то в определении 15 мультипликативная терминология также заменяется аддитивной: группу (Я, +) называют прямой 257
суммой своих подгрупп #ь..., Ht и пишут Я = Н\ +.. . + Я4, если любой элемент Л € Я однозначно представляется в виде h = h\ + ... 4- /it, где /ii € #i,...,ftt € #t. Π ρ и м е ρ 22. В обозначениях примера 16 ΖΜ2) = А 4- Я. 4. Следующий критерий важен для многих последующих разделов курса. Теорема 9. Пусть Н\,..., Ht — подгруппы группы (Я, ·), удовлетворяющие условию 2) определения 15, и Я = #ι · ... · Я4. Тогда следующие утверждения эквивалентны: а)# = Я2 x...xtft; б) если е = Λι ·... · Л*, где ftt € Я„ г € 1, t, mo h\ = ... = Л* = e; в) Алл каждого г € Ι,ί Я, П (Ях .... · Яг_х · Я.+1 ·... · Я4) = {е}. D Импликация а) => б) следует из свойства 1 прямого произведения подгрупп и соотношений е = е ·... · е, е G Яг, г € 1, t. б) =* в). Пусть Л € Яг Π (Hi ·... · Яг_1 · Яг+1 ·... ._fft). Тогда Л = Лг и /ι = /ii ·... · Лг_! · /ιι+ι ·... · /it, где Л^ € Я^ для j € 1, £. Отсюда ввиду условия 2 получаем е = /ι · /ι"1 = /ii · ... · /it_i · ft"1 · Лг+1 · ... · ftt и согласно б) ft"1 = е. Следовательно, Л = Лг = е. в) =Ф а). Пусть Л Ε Я и ft = Λι ·... · ftt = h\ ·... · h't) где Лг, h[ € Яг, г € TTt. Достаточно доказать, что Лг = Ых для г Ε Ι,ί. Допустим, что, например, Л ι φ h\. Тогда, пользуясь свойством 2, получаем е = /ι"1/ι = = Л^1Л/1....-ЛГ1Л/4 и (ЛГ1*!)"1 = ЛГ1/г2 * · · · * К1 К € Я! Π (Я2 ·... · Я*), Л"1/!; φ е, что противоречит утверждению в) при г = 1. D Следствие, ifc/ш Ях,..., Щ — конечные подгруппы абеле- вой группы (G, +), имеющие попарно взаимно-простые порядки, «Я = = Hi + ... + Ht, то Я = Ях + „J- Я*. D Пусть \Нг\ = тг для г Ε Ι,ί. Ввиду коммутативности групповой операции, очевидно, достаточно доказать, что если g Ε Н\П (Я2 -4-... .. .4-Яе), то # = 0. По теореме Лагранжа из включений g € Нгид € Я2+... ... + Ht следуют, соответственно, равенства т\д = 0 и тг ·... · га^д = = 0. Отсюда и из условия (гаьга2,..., га*) = 1 по теореме 26) следует равенство oxdg = 1, т. е. д = Θ. О 258
5. Определение 16. Группа (G, ·) называется разложимой, если она представляется в виде прямого произведения двух собственных подгрупп. В противном случае, группа G называется неразложимой. Очевидно, что задача описания (с точностью до изоморфизма) всех конечных групп сводится к описанию всех конечных неразложимых групп. Однако в классе некоммутативных групп вторая задача не легче первой. Качественно иная картина наблюдается в классе конечных абе- левых групп. Здесь удается описать все неразложимые группы и дать полную классификацию конечных абелевых групп (см. гл. XII). Первый шаг в этом направлении состоит в следующем. Определение 17. Группа порядка рп, где ρ — простое число, называется р-группой, или примарной группой. Τ е о ρ е м а 10. Циклическая группа (G, +) неразложима тогда и только тогда, когда она бесконечна, или примарна. Любая конечная циклическая не примарная группа однозначно, с точностью до перестановки слагаемых, раскладывается в прямую сумму примарных циклических подгрупп. О Если G — бесконечная группа, то она изоморфна группе (Ζ, +), которая неразложима по теореме 9, поскольку любые две ее ненулевые подгруппы raZ и пЪ имеют ненулевое пересечение: raZOnZ Э ran, mn φ ф0. Если \G\ = pm, то в G также любые две ненулевые подгруппы А и В имеют ненулевое пересечение. Действительно, по теореме 4 в) Л и В — циклические группы, и по теореме Лагранжа они — р-группы. Следовательно, по теореме 7 в каждой из них есть подгруппа порядка ρ: Αι < А, В\ < В, \А\ \ — \В\ | = р. Но по той же теореме в G есть лишь одна подгруппа порядка р. Поэтому А\ = В\ С А П В и Α Π Β φ {0}. Таким образом, примарная циклическая группа неразложима. Пусть, наконец, \G\ = η > 1, и каноническое разложение числа η имеет вид η = ρ™1 ·... -ρ™1, где t > 1. Тогда для каждого г G 17? в G есть единственная подгруппа Нг порядка р™' (теорема 7), и подгруппа Η = = Ηχ +... + Ht удовлетворяет условию Η = Н\ 4-... + Ht (следствие теоремы 9). Но тогда по утверждению 8в) |Д"| = |#ι| ·... · \Ht\ = \G\ и G = = Н\ + ... + Ht — искомое разложение группы G в прямую сумму примарных циклических подгрупп. Единственность такого разложения с точностью до перестановки слагаемых следует из теоремы 7. D 259
В действительности теорема 10 описывает все неразложимые группы в классе абелевых конечно порожденных групп. Для конечных абелевых групп это будет доказано в гл. XII (теорема 1). Среди абелевых групп, не имеющих конечных систем образующих, есть другие неразложимые группы, например группа (Q, +). (Докажите ее неразложимость.) § 6. Классы сопряженных элементов. Нормализаторы. Центр р-группы 1. При изучении некоммутативных групп весьма полезным оказывается следующее бинарное отношение. Определение 18. Элементы а и Ь группы (G, ·) называют сопряженными и пишут а « 6, если для некоторого элемента д € G выполняется равенство д~гад = Ь. Очевидно, отношение сопряженности есть бинарное отношение на G, которое является тривиальным (совпадает с отношением равенства) в том и только в том случае, когда G — абелева группа. Утверждение^ Отношение сопряженности на любой группе G есть отношение эквивалентности. Группа G разбивается на непересекающиеся классы сопряженных элементов. D Так как а — е~1ае для любого а € G, то отношение « рефлексивно. Если а « 6, то Ь = д~гад для некоторого д G G, а тогда а = («J"1)"1^"1 и Ь « а, т. е. отношение « симметрично. Если а«6и6«с, тоЬ = = д~1ад,с = h~lbh для подходящих #, /ι € G, a тогда с = (gh)~la(gh), т. е. α « с, и отношение « транзитивно. Пусть [а]« — класс элементов группы G, сопряженных с α и пусть множество всех таких различных классов есть {[а]«: а £ А}. Тогда по общему свойству эквивалентности любых два различных класса из этого множества не пересекаются, и имеет место равенство: G = (J [e]„. D (10) Определение 19. Равенство (10) называют разложением группы G на классы сопряженных элементов. 260
Замечаниеб.В отличие от отношения сравнимости по подгруппе отношение сопряженности разбивает любую некоммутативную группу G на классы разных мощностей. В частности, если C(G) — центр группы, то Va€G(|[a]«| = l)<»(a€C(G)). (Докажите!) Общий подход к описанию мощностей классов в разложении (10) основан на следующем понятии. Определение 20. Нормализатором подмножества Μ группы G называется множество NG(M) = {g€G: gM = Мд). Нормализатором элемента а € G называется множество Ng{o) = = NG({a}). ТеоремаП. Нормализатор подмножества Μ группы G есть подгруппа в G. Для любого элемента а € G справедливо равенство: \{aU = \G:NG(a)\. D Пусть х,у € Nq{M). Тогда хМ = Мх.уМ = My, и Му~1 = = у~1М. Отсюда следуют равенства ху~1М = хМу~1 = Мху~1, доказывающие включение ху~г € Ng{M). Следовательно, по утверждению 4 NG(M) < G. Класс [а]« состоит из всех различных элементов вида x~lax,x € G. Заметим, что для любых х, у € G справедливы соотношения: (х~1ах = у~1ау) Ф> (аху"1 = ху^а) <=» (ху"1 € NG{a)) Ф> Ф> (NG(a)x = NG{a)y). Таким образом, элементы х~*ах и у~1ау различны в том и только в том случае, если различны смежные классы Ng{o>)x и ЛГ<з(а)у. Следовательно, |[a]«| = |G : Ng(cl)\. D 2. Полученный результат оказывается весьма полезным при доказательстве различных классификационных теорем в теории групп. Одна из них Τ е о ρ е м а 12. Для простого ρ центр любой р-группы не равен {е}. Любая группа порядка р2 коммутативна. 261
D Пусть \G\ = pn,rc > 0. Предположим, что C(G) = {e}. Тогда по замечанию 6, если а € G \ {е}, то |[а]«| > 1, и так как число |[а]«| = = \G : ЛУо(а)| делит рп, то ρ | [а]«. В таком случае в разложении группы G на классы сопряженных элементов есть один класс мощности 1 — класс [е]«, а мощности остальных классов кратны р: G = [е]« U [a2]« U... U [at]«, |[at]| = pkt, г € 57*. Поскольку в этом разложении классы не пересекаются, то \G\ = |[e]| 4- -Ь|[а2]|-Ь.. .+|[а4]|, т. е. рп = 1+р(&2+· · .+&«)» что, очевидно, невозможно при η > 0. Следовательно C(G) ^ {е}. Пусть теперь \G\ = ρ2. По доказанному C(G) ^ {e}, и можно выбрать элемент с € C(G) \ {е}. Если при этом G = (с), то коммутативность G доказана. Если G ^ (с), то \G : (с)| = р, и можно выбрать элемент д £ G \ (с). Рассмотрим в G подгруппу Η = (с,#). По построению справедливы соотношения (с) < Η < G. Отсюда по следствию 2 теоремы 6 G = Я = (с, #), и так как с# = #с, то по следствию 1 теоремы 3 G — коммутативная группа. D § 7. Группы подстановок. Орбиты и стабилизаторы. Лемма Бернсайда 1. В параграфах 2 и 4 главы III читатель уже познакомился с понятием подстановки на множестве Ω, операцией умножения подстановок, симметрической группой (5(Ω), ·) всех подстановок на Ω и симметрической группой Sn = 5(1, η) всех подстановок степени п. Определение 21. Подгруппы группы 5(Ω) называются группами подстановок множества Ω, а подгруппы Sn — группами подстановок степени п. Следует отметить, что класс групп подстановок исторически — один из первых классов изучавшихся групп (в связи с задачей о разрешимости уравнений в радикалах). Более того, именно изучение свойств операции умножения на множестве Sn в значительной степени способствовало формированию абстрактного понятия группы. В современной 262
алгебре группы подстановок продолжают играть важную роль как при решении задач классификации групп, так и в многочисленных прикладных вопросах. Ниже, в параграфах 7 — 9, изучаются лишь некоторые основные, первичные понятия теории групп подстановок, и на этих группах иллюстрируются результаты, полученные в предыдущих параграфах. Особое положение теории групп подстановок в общей теории групп проясняет Теорема 13 (Кэли). Произвольная группа (G, ·) изоморфна некоторой подгруппе группы (5(G),·). D Поставим в соответствие каждому элементу g € G отображение g: G —> G, определяемое условием: Vx € G: д(х) = хд. Покажем, что д € 5(G). Действительно, д — сюръективно, так как для любого у € G д(уд~1) = у; д — инъективно, так как Vx,y €G (д(х) = д(у) & хд = уд&х==у. Таким образом, д = (х - д) — подстановка на G. Теперь покажем, что отображение Ф: G —» S(G), определяемое правилом: Уд € G: Ф(#) = д, есть мономорфизм. Это отображение инъективно, так как если Φ(#ι) = Ф(<7г) для </ι,</2 € G» то <Ь = 02> а тогда 01 = <Ь(е) = ife(e) = 02· Наконец, Φ — гомоморфизм группы (G, ·) в группу (S(G), ·), так как для любых д, h € G и для любого χ € G справедливы соотношения: #/ι(χ) = χ0/ι = (χ#)/ι = g{x)h = /г(у(х)) = (ρ · /г)(х), доказывающие равенство Φ(#/ι) = Φ(#)Φ(/ι). Итак, Φ — мономорфизм G в 5(G), и по теореме l.X ^(G) — подгруппа группы S(G), изоморфная G. D Заметим, что для каждого η € N класс всех групп порядка η разбивается отношением изоморфизма на непересекающиеся классы изоморфных групп. Число таких классов очевидно конечно (так как конечно число таблиц Кэли на множестве из η элементов). Более точную оценку этого числа дает 263
Следствие. Любая группа G порядка η изоморфна некоторой подгруппе группы 5П. Число классов изоморфных групп порядка η равно числу классов изоморфных подгрупп порядка η в Sn. D Достаточно заметить, что 5(G) = 5П (утверждение 10.111), и потому G изоморфна подгруппе в 5n. D Π ρ и м е ρ 23. Рассмотрим теорему Кэли в применении к циклической группе (Zm,0). Соответствующая ей группа Zm есть группа подстановок на множестве 0, га — 1. При этом циклическому образующему 1 группы Zm по правилу, определенному теоремой 13, ставится в соответствие подстановка* = ϊ = ( j \'" х^г " 'т^г ) и Zm = (t) — циклическая подгруппа в 5(0, т — 1). Произвольному элементу g € Zm соответствует подстановка ф(д) = д вида Λ _ /0 1 ... χ ... 9~~ \д 1®д ... х®д ... 2. Теорема Кэли дает универсальный алгоритм, позволяющий представить любую конечную группу как группу подстановок. Правда, этот алгоритм, вообще говоря, не является ни единственно возможным, ни наиболее "экономным" (например, с его помощью сама группа 5П представляется группой подстановок степени не п, а п\). Однако важность теоремы Кэли определяется не только ее универсальностью, но и тем, что она — первый результат, открывший в теории групп новое направление: теорию представлений групп. В связи с этим уместно привести Определение 22. Подстановочным представлением группы G на множестве Ω называется любой гомоморфизм σ: G —» 5(Ω). Это представление называется точным, если σ — мономорфизм. При этом саму группу &(G) также иногда называют подстановочным представлением группы G. Если |Ω| = η, то говорят, что a(G) — представление степени η (при этом уже не обязательно \G\ = η). В этих терминах теорема Кэли указывает точное подстановочное представление степени η группы G порядка п, называемое правым ре- гулярным представлением G. Для любой группы (G, ·) определяется и левое регулярное представление, при котором каждому элементу g € G ставится в соответствие подстановка σ(#) = ( д~г · χ J € S(G). (Докажите самостоятельно, что σ: G —» S(G) — мономорфизм групп.) J = & = R 264
Приведем еще некоторые важные примеры групп подстановок и подстановочных представлений. Π ρ и м е ρ 24. Пусть R — произвольное кольцо с единицей е, Rm — множество векторов-столбцов длины га над Д. Поставим в соответствие каждой обратимой матрице А € Rm%m преобразование φ a- R^m^ —» —► Д(т\ определяемое правилом: Vx* € Д(т):<рА(х1) = Ах*. Тогда φ а — подстановка на Д(т), называемая линейной, а множество GL(m,R) всех линейных подстановок на R^ есть подгруппа группы S(/?(m)), называемая полной линейной группой размерности т над кольцом R (доказательство сформулированных утверждений предоставляется читателю). Несложно проверить, что отображение σ: Щп,т ""* GL(m,R) по правилу σ(Α) = у?^1 = ψα-* есть изоморфизм групп. Таким образом, если R — конечное кольцо, то GL(my R) — точное подстановочное представление степени |Д|т группы Д^ т, имеющей порядок, значительно больший, чем |Д|т. В случае, если R — конечное поле из q элементов, вместо GL(ra, Д) пишут GL(m,q). По следствию утверждения 10.VII \GL{m,q)\ = (qm - l)(qm - q) ·... · (qm - ς"1-1). Π ρ и м e ρ 25. При обозначениях из примера 24 каждой матрице А € € Дш,т и каждому вектору 6* € й^т^ поставим в соответствие преобразование Ψ am '· R^ ""* Я^т\ определяемое правилом: Vx* € Д(т): ΦΑ,μ(*1) = Ах1 + б1. Тогда Φ^,μ ~~ подстановка на R^m\ называемая аффинной, а множество AGL{m,R) = {ФЛ§Ь1: А € Д^т,61 € Д(т>} - подгруппа в 5(Д(т>), называемая полной аффинной группой размерности т над Д. Если Д — поле из q элементов, то вместо AGL(m,R) пишут AGL(m, q). Как уже упоминалось, абстрактное понятие группы сформировалось в математике, в частности, и под воздействием геометрии. Здесь источник и область применения понятия группы можно проиллюстрировать следующим образом. Π ρ и м е ρ 26. Пусть в трехмерном евклидовом пространстве D' ' помещен многогранник (или плоский многоугольник) Men вершинами. Назовем движением (или инвариантным преобразованием) многогранника Μ любое его перемещение в пространстве, в результате которого 265
он будет занимать ту же область, которую он занимал первоначально (два движения считаются равными, если они равны как отображения множества точек Μ в множество D^3'). Пусть D(M) — множество всех движений многогранника А/. Перенумеруем точки пространства, в которых расположены его вершины числами 1,2, ...,п. Тогда каждому движению φ € D(M) однозначно соответствует подстановка ί1 г2 £ 1 € 5П, где %k — номер точки пространства, в которую в результате движения φ переместилась вершина из fc-й точки, к € 1, п. Так как Μ — "твердая" фигура, то указанной подстановкой однозначно определяется все движение φ. Поэтому в дальнейшем мы будем отождествлять движение φ с соответствующей ему подстановкой и писать: φ = ί1 г2 Μ. Таким образом, D(M) С Sn. Нетрудно заметить, что если к многограннику Μ применить сначала движение φ, а потом движение ф = ί * n J, то результатом выполнения этих двух движений будет также движение, которое описывается подстановкой φφ = ( г * * 1. Следовательно, D(M) < Sn. Определение 23. Группа (D(M), ·) подстановок на множестве номеров вершин многогранника (многоугольника) М, соответствующих его движениям в трехмерном пространстве, называется группой движений многогранника М. В этом определении мы, по сути дела, отождествили группу движений многогранника Men вершинами и ее точное подстановочное представление степени п, описанное выше. Геометрический смысл группы D(M) состоит в том, что она — мера симметрии многогранника М: чем он симметричнее, тем больше его группа движений. Π ρ и м е ρ 27. Если Μ — треугольник, все стороны которого имеют разные длины, то D(M) = {ε} — единичная группа. Если Μ — равнобедренный треугольник 2 3 266
то D(M) = {ε, (j з 2)} "" гРУппа порядка 2. Если Μ — равносторонний треугольник, то D(M) = S3. 3. При изучении различных свойств групп подстановок весьма важными оказываются следующие результаты. Определение 24. Для группы G < 5(Ω) элементы α,/? € Ω называют G-эквивалентными и пишут α~β (или просто а ~ β), если (7 о(а) = /? для некоторого д € G. Τ е о ρ е м а 14. Яусшъ G < 5(Ω). Тогда 1) отношение ~ на Ω есшъ отношение эквивалентности. Множе- ' G ство Ω разбивается на непересекающиеся классы G-эквивалентных эле- ментов, называемые областями транзитивности группы G; 2) подмножество Δ С Ω есть область транзитивности группы G тогда и только тогда, когда a) Va € G (α(Δ) С Δ); 6)Va,/?€A,3a€G(a(a)=/?). D 1) Так как для любого α € Ω верно равенство ε(α) = α и ε € G, то α ~ α, т. е. отношение ~ рефлексивно. Если α ~ β, то /? = д(а) для некоторого g € G. Но тогда а = g~l{P),g~l € G. И поэтому α ~ /?, т. е. отношение ~ симметрично. Если α ~ /?,/? ~ 7> т0 β = <7(°0,7 = Μβ) для подходящих α,/ι € G. В таком случае α/ι(α) = /i(g(a)) = 7,0/1 € G и α ~ 7» τ· е· отношение ~ транзитивно. Утверждение о разбиении множества Ω на области транзитивности теперь очевидно. 2) Если Δ — область транзитивности G, а € Δ и g € G, то а ~ д(а), и потому д(а) € Δ, т. е. σ(Δ) С Δ, и верно а). Утверждение б) в этом случае очевидно. Наоборот, если для Δ С Ω выполнены утверждения а) и б), то ввиду б) Δ есть подмножество некоторого класса G — эквивалентных элементов. Кроме того, если α € Δ,/? € Ω и α ~ /?, то /? = д(а) для некоторого д € G и ввиду а) β € Δ, т. е. Δ — в точности класс G-эк- вивалентных элементов (область транзитивности группы G). D Определение 25. Группа G < 5(Ω) называется транзитивной, если Ω — ее область транзитивности, т. е. να,/?€Ω3α€ΰ(α(α)=/?), в противном случае, группа G называется интранзитивной. Транзитивными группами являются, например, группа 5П, ее подгруппа < (ΙΙζΗηΐΊι) >> группа AGL(m,R). Пример интранзитивной 267
группы — GL(ra, R). В частности, группа GL(m,q) имеет ровно две области транзитивности. (Докажите!) Очевидно, что группа D(M) движений правильного многогранника Μ транзитивна, однако обратное утверждение неверно. Например, если Μ — плоский шестиугольник, у которого любые два несмежных ребра равны, то группа его движений в трехмерном пространстве транзитивна. (Покажите!) При изучении областей транзитивности группы подстановок полезно Определение 26. Орбитой элемента α € Ω относительно группы G < 5(Ω) называется множество G(a) = {0€Cl:0 = g{a),g€G}. Теорема 15. Если Δ — область транзитивности группы G < < 5(Ω), то Δ = G(a) для любого а € Δ. D Так как все элементы из G(a) G-эквивалентны α, то G(a) С Δ. Если β € Δ, то β~α, т. е. β = g(a) для некоторого g € G и β € G{a). О G Теперь можно вывевсти следующее важное соотношение между порядком группы подстановок и порядками ее областей транзитивности. Определение 27. Стабилизатором элемента α € Ω в группе G < 5(Ω) называется множество подстановок: Ga = {g€G: g{a)=a}. Теорема 16 (лемма Бернсайда). Стабилизатор любого элемента α € Ω β группе G < 5(Ω) есть подгруппа в G и \G\ = \Ga\ · |G(a)|. D Если g,h € Ga, то (gh~~l)(a) = к~г(д(а)) = α, т. е. дк~г € Ga, и Ga < G. Заметим теперь, что для любых подстановок х,у € G справедливы соотношения: χ = y(Ga)n & ху~г € Ga Ф> {ху'г){а) = а <& х{а) = у(а). Следовательно, число различных элементов вида x(a),x € G, равно числу правых смежных классов G по Ga, т. е. |G(a)| = |G:Ge|. Отсюда по теореме Лагранжа получаем утверждение теоремы 16. D С л е д с τ в и е 1. Если |Ω| = η и G — транзитивная группа подстановок на Ω, mo n| |G| ti |G| = η · \Ga\ для любого a € Ω. 268
D Для любого α € Ω верны равенства G{a) = Ω и |G(a)| = п. D Следствие2. Если М — правильный многогранник (многоугольник) с η вершинами, в котором каждая вершина имеет к соседних вершин, то порядок его группы движений D(M) равен пк. D Воспользуемся терминологией и обозначениями из примера 26, и, для краткости, вершину многогранника, расположенную в точке пространства с номером а, будем называть просто вершиной а. Зафиксируем некоторую величину α многогранника М. Так как Μ — правильный многогранник, то по следствию 1 |£>(М)| = η · \D(M)a\. Остается подсчитать число движений многогранника М, оставляющих на месте вершину а. Пусть αϊ,..., α^ — все вершины, смежные с а. Очевидно, любое движение φ € D(M)a есть поворот вокруг оси симметрии, проходящей через точку а, и φ однозначно задается указанием образа φ(α\) элемента αι. Более того, если φ е D(G), то φ{α\) G {αϊ,... ,α^}, так как φ{α\) остается смежной вершиной для а. Наконец, для любой смежной с α вершины а^ существует движение φ G D(M)a такое, что φ(α\) = α*. Таким образом, \D(M)a\ = fc, и потому |D(M)| = пк. О Определение 28. Группа движений правильного плоского п- угольника называется группой диэдра степени η и обозначается через А,- Из следствия 2 леммы Бернсайда имеем \Dn\ = 2п. В частности |£>з| = 6, и потому £>з = 5з, №А = 8 и Z?4 — пример некоммутативной группы порядка р3 (ср. с теоремой 12). § 8. Цикловая структура и четность подстановки. Знакопеременная группа 1. Всюду далее Ω — произвольное множество мощности п. В теории групп подстановок большое количество результатов основывается на следующем способе представления подстановки в виде произведения подстановок более простого вида. Определение 29. Элемент α € Ω назовем мобильным элементом подстановки g € 5(Ω), если g(a) Φ α, и неподвижным — в противном случае. Множество мобильных элементов подстановки g обозначим 269
через тоЪд: тоЪд = {a € Ω: g(a) Φ а}. Подстановки д, ft € 5(Ω) назовем независимыми, если mobg Π mob ft = 0. Например, в 5s подстановки #= (32145) И h = (1 4 3 2 5) независи" мы. Тождественная подстановка ε независима с любой подстановкой из 5(Ω). Очевидны следующие свойства множества мобильных элементов подстановки: а € тоЪд <=> д(а) € mobg, mobg"1 = mobg, тоЪд = 0 <=> g = ε. Доказательство перечисляемых ниже простейших свойств независимых подстановок предоставляется читателю. УтверждениеЮ. Если gyh — незавглсилеые подстановки, из 5(Ω) mo: а) ά/m любых a G mob</, /? G mob ft верны равенства: (g-h)(a) = h{a), (g-h№ = h03); б) mob g · h = mob # U mob /1; в) #ft = hg\ r) gh = e<& # = ft = ξ; A)5r = ft<^5r = ft = ^; е) Vs,t G Ζ (подстановки gs,hb — независимы); ж) ordg · ft = [ordg,ordft]. Определение 30. Подстановку g £ Sn называют гдоклом, если g φ ξ и существует перестановка (ii,..., in) элементов множества Ω такая, что g имеет вид: ( г\ %2 ... ifc-i ύ ik+i ... гп \ ц^ V h г'з ... г* ή г*+1 ... г„ у ' т. е. мобильные элементы подстановки g переставляются ею "по циклу": При этом число к = | mobg| называется длиной цикла д. 270
„ / 1 2 3 4 5 \ Например, подстановка д = I - с о о л ) является циклом длины 3, так как, упорядочив элементы 1,2,..., 5 следующим образом: 2,5,4,1,3, получаем 2 / 2 5 4 1 3 \ 9~ \ 5 4 2 1 3 ) 4 ^ Вместо записи (11) для цикла д употребляют значительно более экономную формальную запись: 0 = (ι"ι,*2,·..ιί*)· (12) Отметим, что из (12) нельзя однозначно определить степень подстановки д и, в случае необходимости, эту степень нужно указывать отдельно. Полезно иметь ввиду, что цикл д длины к может быть записан ровно к различными способами в форме (12): д = (*Ίι{2ι···ιύ-ΐι2*) = (ί2ι*'3ι· ··««*«*Ί) = (*з>*4» — «*л»*ι»*г) = ··· ... = (ί*,*ι,.··,ί*-ι). (13) Τ е о ρ е м а 17. Произвольная неединичная подстановка g G 5(Ω) либо является циклом, либо раскладывается в произведение некоторого числа попарно независимых циклов. Такое разложение однозначно, с точностью до перестановки сомножителей. D Существование нужного разложения для g доказывается индукцией по параметру га = |mob#|. Если га = 2, т. е. mobg = {аьаг}, то очевидно, что g = (c*i,c*2) — цикл длины 2. Пусть s > 2, и первое утверждение теоремы верно для всех g G 5(Ω) таких, что 2 < га < s. Предположим, что га = s. Выберем элемент а £ тоЪд и рассмотрим последовательность элементов: а-±>д{а)-*+...-1*дЧа)-£+... . (14) Так как все элементы этой последовательности принадлежат Ω, то в ней есть лишь конечное число различных элементов, и можно утверждать, что для некоторого k G 1,п элементы а,д(а),... ,дк~1{а) различны, а дк(а) совпадает с одним из них. При этом к > 1, так как 271
g(a) Φ α. Покажем, что дк{а) = α. Если это не так, т. е. дк{а) = дг{<у), где к > £ > 0, то, применяя к обеим частям последнего равенства подстановку д"1, получаем дк~г(а) = у*"1 (a), fc — 1>^—1>0. Это противоречит выбору параметра fc. Следовательно, #fc(a) = α, и последовательность элементов (14) имеет вид: aJL,5(a) JL,... JL,/-i(a)_JL,aJL^(a) JL*... . Отсюда следует, что элементы множества Δι = {α, #(α),..., gk~l (α)} преобразуются подстановкой # точно так же, как и циклом /ц = (а,д(а),...,дк-г(а)), и потому все эти элементы неподвижны относительно подстановки д\ = = hilg, причем mobgi = mob</\Ai. Если mobgi = 0, то д\ = ε и # = = /ii — цикл. Если mob^i = 0, то | mob#i| =m — k<su no предположению индукции подстановка д\ или является циклом /i2, или раскладывается в произведение попарно независимых неединичных циклов: дх = /г2 · ... · ht. В таком случае подстановка д следующим образом раскладывается в произведение циклов: д = hi -/ι2·...·/ΐί. (15) Причем, при t > 1 циклы в этом разложении попарно независимы, так как по утверждению 106) mobht С mob </1, г G 57$, а поскольку mob/ii = Δι и Δι Π mobgi = 0, то mob/ii Π mob/it = 0 для г G 27ϊ. Первое утверждение теоремы доказано. Допустим теперь, что, наряду с разложением (15), подстановка д имеет еще одно разложение: ff = /i·····/·, (16) в котором либо s = 1 и ^ = /ι - цикл, либо s > 1 и /χ,..., fs — попарно независимые циклы. Выберем элемент a G mob/ii. По утверждению 106), α G mobg и a G тоЬ/г для некоторого г G 1,5. Переставив, если надо, сомножители в разложении (16) (это можно сделать по утверждению 10в)), считаем, что a G mob/i. Покажем, что hi = Д. В силу утверждения 10 а) справедливы равенства: Λι(α)=$(α) = /ι(α). 272
Но в таком случае опять верны включения д(а) = h\(a) G mob/ii Π Π mob/ι, и, применяя то же утверждение, получаем цепочку равенств: Л?(а) = 1ц(д{а)) = flO,(a)) = /,(fl(a)) = /?(а). Продолжая аналогично далее, получаем: ft* (a) = /}(а) для всех г G N. (17) Так как /ц = (α,Λι(α),... .ftJT^a)) и /ι = (α,/ι(α),... ,/ί^α)) для некоторых fc,^ G Ν, то из (17) следует, что к = Д поскольку fti(a) = a^/J(a) = a, и мы приходим к равенству h\ = f\. Отсюда видно, что если в (15) t = 1, то в (16) s = 1, так как иначе выполнялось бы равенство ε = /г ·... · /в, которое, по утверждению 10 г), невозможно, ввиду попарной независимости неединичных подстановок /г,..., /β· Если же t > 1, то и 5 > 1, и справедливо равенство Лг ·... · Л* = /г · · · · · Л· Теперь доказательство совпадения разложений (15) и (16) легко завершить индукцией по s + t, приняв за первый шаг индукции случай, когда s-И = 2, т. е. s = t = l.D В качестве примера приведем разложение: / 0 1 2 3 4 5 6 7 8 9 \ ,п , к 0 nw* qw* «\ /ю\ Vl 5 9 8 6 2 4 7 3 0 ) = t0'1'5'2'9)' <3'8)' <4'6)· <18) Допустим, что разложение подстановки д G 5(Ω) в произведение попарно независимых циклов имеет вид: д = (αχ,..., a*)· (A,..., ft) -... - (7i,...,7t), (19) и ίι,..., ίΓ — неподвижные элементы относительно подстановки g. Для того чтобы подчеркнуть, что подстановка д действует и на этих элементах, не указанных в разложении (19), их называют единичными циклами подстановки д, и подстановку д записывают в виде: ff = (ab...,afc).(i8b...,ft).....(7b...,7t)-(*i)-.---(*r)· (20) Определение 31. Представление подстановки д G 5(Ω) в виде (19) или (20) называют ее разложением на независимые циклы. 273
Например, подстановка (18) раскладывается на независимые циклы следующим образом: (Ϊ 5 9 8 6 2 2 7 3 S)-(0,1.5,2,9).(3,8).(4,e).(7). Согласно теореме 17 разложение (20) для подстановки д однозначно, с точностью до перестановки сомножителей, и потому корректно. Определение 32. Цикловой структурой подстановки g называется таблица указывающая, что разложение (20) подстановки g в произведение независимых циклов (включая единичные) состоит из к\ циклов длины £χ, &2 ЦИКЛОВ ДЛИНЫ ^2ι · · · > кт ЦИКЛОВ ДЛИНЫ £т. Например, цикловая структура подстановки (18) есть [Ι1,22,51]. Для любой подстановки g € 5(Ω) по ее цикловой структуре легко вычислить ее порядок. Τ е о ρ е м а 18. Порядок цикла равен его длине. Порядок произвольной подстановки g Ε 5(Ω) равен наименьшему общему кратному длин циклов в ее разложении на независимые циклы. D Если g = (αο,αι,... , ajk-i) — цикл длины fc, то для г Ε 0, к — 1 справедливы соотношения д{аг) = аг$1, где 0 — сложение в Z^. Отсюда индукцией легко получить, что для любых i G 0, & — 1 и га Ε Ν верно соотношение: где rk{m) — остаток от деления т из. к. Теперь очевидно, что (ffm = е) <» (пь(т) = 0), т. е. ordg = к. Если разложение д в произведение попарно независимых циклов имеет вид (15), где t > 1, то, ввиду попарной перестановочности циклов /ΐχ,...,/it (утверждение 10в)), для любого s Ε N верно равенство gs = h\ · ... · hf. Так как по утверждению 10 е) подстановки /if,..., hst попарно независимы, то по утверждению Юг): Теперь очевидно, что ordg = [ord /ii,...,ord ht]. D 274
Например, порядок подстановки (18) равен [5,2,2] = 10. 2. Другой способ представления подстановок в виде произведения циклов (уже зависимых) тесно связан со следующей классификацией подстановок, которую мы, для простоты изложения, введем сначала в5п. Определение 33. Подстановку д = ( . ' " ) Ε Sn на- \ Ч 1*2 · · · in ) зывают четной, если перестановка (ή, г*2,..., гп) четная, и нечетной — в противном случае. Определение34. Транспозициейв Sn называют любой цикл длины 2. Л е м м а 1. Если g,h Ε Sn и h — транспозиция, то четности подстановок g и gh противоположны. D Пусть g = ( . . '" . ] и /ι = (г*, г*), k < L Тогда \ г1 г2 · · · ^п / / 1 ... А: ... ^ ...п\ /1 ... г* ... г* ... п\ __ \ii ...г* ...ie...nj \\ .. .it . ..гк .. .η) __/1...*-1Η + 1...£-ΐΗ+1...η\ \г*1 ... ifc_i г*€ *fc+i ··· *£-i **fc *£+i ---in) Остается заметить, что перестановки (г*1... ik ... it... гп) и {i\... ik-iieik+i... ieikie+i · · · г'п) различаются транспозицией и их четности противоположны. D Τ е о ρ е м а 19. Всякая подстановка g Ε Sn раскладывается в про- изведение транспозиций, причем в любом таком разложении число сомножителей четно, если подстановка g четна, и нечетно — в противном случае. D Если g = ε, то g = (1,2) · (1,2). Если g = (αϊ,... ,α&) — цикл, то g = (αϊ,..., α*) = (аьа2)· (аьа3) ·... · (abafc). (21) Теперь первая часть теоремы следует из теоремы 17. Пусть g G Sn и # = <ι · <2 · · · · · ts — произведение s транспозиций. Тогда g = ε · <ι · <2 · · · · · ts т. е. g получается из четной подстановки ε 5-кратным умножением на транспозиции. Отсюда, применяя лемму 1, получаем: g — четная подстановка тогда и только тогда, когда число s четно. D 275
Следствие 1. Цикл длины к является четной подстановкой тогда и только тогда, когда число к нечетно. D См. (21). D Следствие 2 (теорема о декременте). Если подстановка g Ε Sn каким-либо способом представлена в виде произведения т циклов длин fi,...,fm, то она четна тогда и только тогда, когда число £\ + ... ... + £т — т четно. D Цикл длины £г раскладывается в произведение £г — 1 транспозиций (см. 21), поэтому g раскладывается в произведение £\ + ... + £т — т транспозиций. D Если в условиях следствия 2 циклы попарно независимы, то число £\ + ... 4- £т — τη = d(g) называют декрементом подстановки д. Следствие 3. Совокупность Ап всех четных подстановок из Sn есть подгруппа группы Sn индекса 2. D Если g,h Ε -An, то по теореме каждая из подстановок g, h есть произведение четного числа транспозиций. Тогда и gh — произведение четного числа транспозиций, т. е. по теореме gh Ε Ап. Отсюда по следствию 1 утверждения 4 получаем: Ап < Sn. Теперь заметим, что Ап — Ап · (1,2), так как Ап· (1,2)с5„\А„и (5П \ Ап) · (1,2) С Ап. Следовательно, Sn = An U Ап · (1,2) и \Sn : Ап\ = 2. D Определение 35. Подгруппу Ап всех четных подстановок группы Sn называют знакопеременной группой степени п. Знакопеременная группа играет в теории групп подстановок, и вообще в теории групп, роль не менее важную, чем сама симметрическая группа. Она очень часто встречается в приложениях. Π ρ и м е ρ 28. Если Μ — тетраэдр, то D(M) = А*. Действительно, D(M) < 54 и по следствию 2 теоремы 16 \D(M)\ = 12 = |Αι|. Остается заметить, что А* С D(M), так как А± \ {ε} состоит из подстановок вида g = (α, 6)(с, d) и h = (α, /?, 7): подстановка # осуществляет вращение тетраэдра вокруг оси симметрии, проходящих через середины противоположных ребер аЬ и cd, а подстановка h — вращение вокруг оси симметрии, проходящей через вершину. Теперь можно показать, что обращение теоремы Лагранжа для конечных групп неверно. Π ρ и м е ρ 29. В группе А4 ( имеющей порядок 12 ) нет подгруппы порядка 6. Из теоремы о декременте и теоремы 18 следует, что любой элемент из А± \ {ε} имеет порядок 2 или 3. Если G < А± и \G\ = 6, то \G\ {ε}\ = 5. Множество G\ {ε} не может состоять только из элементов 276
порядка 2, так как А± содержит всего три таких элемента, и не может состоять только из элементов порядка 3, так как их количество в любой конечной группе четно. (Докажите!) Следовательно, в G есть подстановки вида д = (a,6)(c,d), {a, b) Π {c,d} = 0 и h = {α, β,η). Остается заметить, что (д, h) = А*. (Докажите!) Замечание7. Если Ω — произвольное конечное множество, то для подстановок из 5(Ω) также можно ввести понятие четности и получить результаты, аналогичные теореме 19 и ее следствиям. Упорядочим каким-либо образом элементы Ω: Ω = {αϊ,...,αη}. Тогда каждой подстановке д G 5(Ω) соответствует единственная перестановка (ι"ι,... ..., гп) Ε V(ly п) такая, что д = (f*1 " "fn ). Подстановка д называется четной, если (г'ь..., гп) — четная перестановка, и нечетной — в противном случае. При таком определении для подстановок из 5(Ω) практически так же, как и для подстановок из 5П, доказывается лемма 1, и дословно так же — теорема 19 и ее следствия. Из теоремы 19 следует, что четность подстановки д G 5(Ω) определяется лишь четностью числа транспозиций в ее разложении и не зависит от способа первоначального упорядочения множества Ω. Подгруппа всех четных подстановок из 5(Ω) обозначается через ^4(Ω) и называется знакопеременной группой подстановок множества Ω. § 9. Системы образующих симметрической и знакопеременной групп С целью упрощения обозначений, мы будем рассматривать лишь группы 5П и Ап. Предварительно докажем вспомогательное утверждение, позволяющее по заданному разложению на независимые циклы подстановки g G Sn быстро вычислять такое же разложение для любой подстановки f~lgf, где / G 5П. Л е м м а 2. Пусть подстановка g представлена в виде произведения циклов: g = (αϊ,α2,...,ak) · (ЬьЬ2,...,Μ ·... · {сис2,...,Cm). (22) 277
Тогда верно равенство: Γ19ί = (/(αϊ), /(α2),..., /(α,)). (/fa),..., /(6,)).... ...•(/(ci),...,/(0). (23) D Пусть α G ϊ~ϊϊ и /J = ff(α). Тогда /(/?) = /(ff(α)) = /Ы/""1 №)))) = = (f~l9f){f(a))- Таким образом, подстановка g переводит а в β тогда и только тогда, когда подстановка f~lgf переводит /(а) в /(/?). В частности, отсюда следует, что тоЪ{/'гд/) = /(mob у), и если # = (αϊ,...,α*) — цикл, то f'lgf = (/(αϊ),...,/(а*)). Теперь (23) следует из (22) ввиду равенства Г^ = /"1(аь...,а*)/-Г1(Ьь...,Ь^)/-...-Г1(с1>...>ст)/-П Отметим, что в условии леммы 2 не требуется, чтобы циклы в разложении (22) были независимы. Но, разумеется, если в (22) циклы независимы, то они независимы и в (23). Большие возможности для упражнений в применении леммы 2 дает читателю доказательство следующей теоремы. Τ е о ρ е м а 20. Группа Sn порождается: 1) множеством всех транспозиций; 2) множеством всех транспозиций вида (Ι,α), α G 2, η; 3) множеством всех транспозиций вида (а, а + 1), a G 1, η — 1; 4) транспозицией (1,2) ti полным циклом (1,2,..., п). D Для г G 1,4 обозначим через Нг подгруппу в 5П, порожденную множеством подстановок, описанном в пункте (г) теоремы. Наша задача — доказать равенства Нг = 5п,г G 173. Мы сделаем это, доказав цепочку соотношений 5η = Η χ С Яг С #з С #4. По теореме 19 каждая подстановка из S„ раскладывается в произведение транспозиций, т. е. принадлежит Н\. Следовательно Н\ = S„. Подгруппа #2 = ((1,2), (1,3),..., (1, п)) из Sn содержит любую транспозицию {α, β) G 5n. Действительно, если а = 1 или /? = 1, то включение (a,/?) G #2 есть непосредственное следствие определения Я2, a если αφλιιβφΐ,το (Ι,α), (1,0) G Я2 и (α,/J) = (Ι,α) · (1,/J) · (Ι,α) G Я2. Следовательно, Я1 С Я2. 278
Подгруппа #з = ((1,2), (2,3),..., (η — 1, η)) содержит все транспозиции (Ι,α), так как (1,2) Ε #з, и если (Ι,α — 1) Ε #з, то (Ι,α) = = (α,α - 1)(1,α - 1)(α — Ι,α) € Яз. Следовательно, Η<ι С Яз. Наконец, подгруппа Я* содержит все транспозиции (а, а + 1), так как (α, α 4-1) = (1,2,... ,п)"а(1,2) · (l,2,...,n)Q € Я4. Следовательно, Я3 С Я4. D В § 3 были описаны, с точностью до изоморфизма, все конечные группы с одним образующим. В связи с этим возникает естественное желание получать дальнейшие классификационные результаты в теории конечных групп, описывая все группы с г образующими для г = 2,3, — Однако теперь можно высказать предположение, что уже в случае г = 2 эта задача будет мало отличаться от задачи классификации всех конечных групп, поскольку справедливо Следствие. Любая конечная группа изоморфна подгруппе группы с двумя образующими. D Достаточно использовать теорему Кэли и утверждение 4) теоремы 20. D Теорема21. Знакопеременная группа Ап степени η > 3 порождается всеми циклами длины 3. D По следствию 1 теоремы 19 все циклы длины 3 из Sn принадлежат Ап. С другой стороны, любая подстановка h Ε Ап представляется по теореме 19 в виде произведения четного числа транспозиций: h = t\ -t2 · ... · <2fc-l **2fc· Теперь, очевидно, достаточно доказать, что любое произведение (α, β) χ χ (7, δ) двух транспозиций представляется в виде произведения циклов длины 3. Для этого рассмотрим все возможные соотношения между множествами {α,β} и {7><*}· Если {а,/?} = {7><*}> т0> очевидно, (а,/?) · (7,£) = £ = (1,2,3)3. Если {α,β} Π {7>^} = {<*}> то можно считать, что 7 = &, и тогда (αι/3).(7,ί) = (α>/3).(α,ί) = (α>/3>ί). Если {α, β) Π {7, δ} = 0, то (α, β) · (7, δ) = (/?, а, 7) · (7, Α δ). D Отметим, что в системе образующих группы Ап, указанной в теореме 21, есть много "лишних" элементов. Читателю предлагается самостоятельно доказать, что верно равенство Лп = ((1)2,3))(1,2)4),...,(1,2,тг)>. 279
В частности, если Μ — тетраэдр, то вместо D{M) = ((1,2,3), (1,2,4), (1,3,4)) (см. пример 28) можно написать D(M) = ((1,2,3), (1,2,4)). § 10. Сопряженные элементы в симметрической группе. Уравнение Коши Цикловая форма записи подстановок позволяет описать классы сопряженных элементов в группе Sn и предложить методику решения уравнения вида: x~lgx = h (24) в этой группе называемых уравнениями Коши. Заметим, что по определению 18, сопряженность подстановок д, h Ε Sn в группе Sn равносильна разрешимости уравнения (24). Теорема 22. Подстановки gyh Ε Sn сопряжены в Sn тогда и только тогда, когда они имеют одинаковую цикловую структуру. О Допустим, что разложение подстановки g на независимые циклы, включая единичные циклы, имеет вид g = (αϊ,..., ak) · (&ι,..., be) ·... · (a,..., cm), k +1 + ... + m = n. (25) Тогда, если h — подстановка, сопряженная с g, и / есть решение уравнения (24), то по лемме 2 справедливо равенство h = (f(a1),...,f(ak))-(f(b1),...,f(be))-....(f(b1),...,f(bm)), (26) представляющее собой разложение подстановки h также на независимые циклы. Таким образом, подстановка h имеет ту же цикловую структуру, что и д. Наоборот, допустим, что h — произвольная подстановка с той же цикловой структурой, что и д. Тогда для подходящей перестановки (αϊ,..., c*fc, β\,..., βι,..., 7ι, · · ·, 7m) множества 1, η разложение h на независимые циклы имеет вид: Л=(аь...>аЛ).(А>...>А).....(7ь...,7т). (27) 280
Пользуясь разложениями (26) и (27), составим подстановку ( αχ... ак bi...bt ... с\... ст \ ,^) \ аг... ак /?ι... βι ... 7ι·· -7m / ' Ввиду леммы 2 очевидно, что / — решение уравнения (24), т. е. подстановки д и h сопряжены. D Помимо критерия разрешимости уравнения (24), теорема 22 дает способ построения его решения в виде (28). Более того, эта теорема дает способ описания всех решений уравнения (24). Действительно, сравним разложение (26) подстановки h на независимые циклы, построенное по произвольному решению / уравнения (24), и произвольное разложение (27) подстановки h на независимые циклы при том же упорядочении длин циклов, что и в разложении подстановки д. Видно, что каждая запись (26) совпадает с некоторой записью (27) и, значит, любое решение / уравнения (24) может быть представлено в виде (28) при подходящем выборе записи h в виде (27). При этом очевидно, что запись (25) подстановки д можно зафиксировать. Таким образом, нами доказано Следствие1. Пусть разложение подстановки g на независимые циклы имеет вид (25), где к >£>...> т, и h — подстановка из Sn с той же цикловой структурой, что и д. Тогда множество всех решений уравнения (24) есть множество всех подстановок вида (28), соответствующих различным способам (27) разложения подстановки h на независимые циклы длин к >£>...> га. Рассмотрим один наглядный и важный с теоретической точки зрения пример. Пусть g = /i = (α0,αι,...,αη - 1) — полный цикл из 5П. Тогда множество решений уравнения (24) есть Ns» {9) — нормализатор элемента g в группе 5П, и по следствию 1 Ns„ {g) есть множество подстановок вида: f _ ( α0 α1 ··· αη-ι-1 αη-ι ··· Gn-1 у аг αζ+ι ... αη_ι αο ... аг_1 Выписанная подстановка / есть ни что иное, как дг. Таким образом, число решений уравнения (24) в рассматриваемом случае равно η и нами доказано j , г €0,п- 1. 281
Следствие 2. Если д — полный цикл из Sn, то Nsn{g) = (д). Если подстановка д распадается на несколько независимых циклов, число решений уравнения (24) в случае его совместности может значительно превысить п. Π ρ и м е ρ 30. Если д = (а, Ь) · (с, d), h = (α, β) · (7, δ) — подстановки из 54, то число решений уравнения (24) равно 8, и множество его решений / описывается следующей таблицей: Верхняя строка подстановки / Варианты нижних строк подстановки / а а β а β 7 δ 7 δ b β a β a δ 7 δ 7 с 7 7 δ δ α α β β d δ δ Ί 7 0 β α α В общем случае решения уравнения (24) и их число описывает Теорема 23. Пусть д — подстановка из Sn с цикловой структурой [ff] = [#, #,...,#]· (29) Тогда справедливы следующие утверждения: а) группа Nsn {g) имеет порядок |а^ы1=П(*·)'·^ <3°) б) если h — подстановка с той оке цикловой структурой (29) и f — произвольное решение уравнения (24), то множество всех решений уравнения (24) есть правый смежный класс Nsri(g) - f и его мощность описывается формулой (30). D а) Как уже отмечалось, Nsn{g) есть множество всех решений уравнения x~lgx = g, (31) 282
которое может быть построено по правилу, описанному следствием 1 теоремы 22. Для подсчета мощности этого множества введем рабочий термин: нормальная запись подстановки. Так мы будем называть разложение подстановки g на независимые циклы вида: 9 = 9\-92--..-9β\ 9г = (α(ι*}> · · ·»<*{#), г € Ϊ75, т\ > т2 > ... > ms > 1. (32) В этой терминологии для описания всех решений уравнения (31) нужно: 1) зафиксировать какую-либо нормальную запись (32) подстановки 9\ 2) перебрать все возможные нормальные записи подстановки д: 9 = 91 '92 ·... · 9в\ 9г = ((*ι\..., <*W ), г € 175, mi > m2 > ... > ms > 1; (33) 3) для каждого варианта (33) нормальной записи подстановки д построить решение / уравнения (31) в виде (*р ■ U1'): α(1) '. ай> в?> . а<*> " .. ей \ .. Л; / По следствию 1 теоремы 22 таким способом будут описаны в точности все разные решения уравнения (31). Из приведенного алгоритма следует, что число решений уравнения (31) равно числу различных нормальных записей подстановки д. Остается заметить, что для получения из нормальной записи (32) подстановки д всех ее нормальных записей (33) нужно: 1) всеми способами переставить между собой циклы одинаковых длин (для к3 циклов длины £3 это, согласно (29), можно сделать (кэ)\ способами); 2) для каждого варианта расстановки циклов перебрать все возможные способы записи каждого цикла (согласно (13), для к3 циклов длины £э это можно проделать I э способами). Теперь формула (30) очевидна. 283
б) Заметим, что если / — какое-либо решение уравнения (24), то все подстановки из смежного класса Nsn(g) · /, очевидно, также будут решениями уравнения (24). Допустим теперь, что f\ — еще одно решение уравнения (24). Тогда f^lgfi = f~lgf = Л, и, следовательно, (/ι/"1)"1 · 9 · /ι/"1 = 9, т. е. Л/"1 € NSn(9) и /ι € ATs„(g)/. D Следствие. Число подстановок в Sn, цикловая структура которых описывается таблицей (29), равно п\ П(*.)'С 1=1 D По теореме 22 совокупность указанных подстановок есть в точности класс [д]& элементов из 5П, сопряженных с подстановкой д из условия теоремы. Остается заметить, что согласно теореме 11 справедливы равенства 1И-|-|Л=АГ«.(,)|-р^,.П Замечание 8. Приведенный в доказательстве теоремы 23 алгоритм описания всех решений уравнения (31) пригоден для описания всех решений любого разрешимого уравнения (24) — достаточно лишь заменить в (33) подстановку д подстановкой Л. Полезно обратить внимание на сходство утверждения б) теоремы 23 с теоремой 7. VIII о связи между множествами решений неоднородной и ассоциированной однородной систем линейных уравнений. Если уравнение (31) рассматривать как однородное, ассоциированное с (24), а систему линейных уравнений рассматривать как матричное уравнение, то в обоих случаях множество решений однородного уравнения — подгруппа, а множество решений неоднородного уравнения — смежный класс по ней, порожденный любым решением. § 11. Гомоморфизмы групп и нормальные делители Читатель уже знаком с понятием гомоморфизма группоидов и с примерами гомоморфизмов, которые, в действительности, почти все стро- 284
ились в классе групп. Выше отмечалась и иллюстрировалась (см., например, доказательство теоремы 4) важная роль, которую играют гомоморфизмы при получении разного рода классификационных теорем и описании свойств алгебраических объектов. В данном параграфе изучаются основные свойства гомоморфизмов групп и связанных с ними понятий. 1. Теорема 2.Х (об эпиморфизме) сводит описание гомоморфных образов произвольного группоида к описанию его конгруэнции и фактор- группоидов. Однако для произвольного группоида (и даже полугруппы) это — задача весьма сложная. Если же группоид G является группой, то можно установить связь между конгруэнциями и некоторыми подгруппами G и значительно упростить описание классов конгруэнтных элементов. Определение 36. Подгруппу Η группы (G, ·) называют нор- мальной или нормальным делителем группы G , если для любого g G G выполняется равенство дН = Нд (т. е. множество левых смежных классов G по Η совпадает с множеством правых смежных классов). В таком случае вместо Η < (G, ·) пишут Η < (G, ·). В любой неединичной группе G всегда есть два нормальных делителя Η = G и Η = {е}, называемых несобственными. Остальные нормальные делители группы называют собственными. Пример31.В абелевой группе все подгруппы являются нормальными делителями. Π ρ и м е ρ 32. В любой группе (G, ·) ее центр C(G) (см. пример 8) — нормальный делитель. (Докажите!) Π ρ и м е ρ 33. Для любой группы G, если Η < G и \G : Н\ = 2, то Η < G (в этом случае любой смежный класс G по Η совпадает с Η или с G \ Я). В частности, для любого η € Ν, Αη < 5η. Π ρ и м е р 34. В группе 54 подмножество Κ4 = {ε, (1,2). (3,4), (1,3). (2,4), (1,4). (2,3)} есть абелева подгруппа и нормальный делитель (докажите), группа К± называется группой Клейна или четверной группой. Π ρ и м е ρ 35. Не являются нормальными подгруппа ((1,2)) в 5з и любая циклическая неединичная подгруппа в Sn при η > 4. (Докажите!) Следующие утверждения показывают, насколько свойство нормальности подгруппы устойчиво и делает подгруппу похожей на подгруппу абелевой группы. 285
УтверждениеП. Пусть (G, ·) — произвольная группа, тогда: а) если А < G и Я<G7 то АПН<Л и АН < G; б) если K<G uH<G, moKC)H<G и К Η < G. D а) Очевидно, что АГ\Н < А. Кроме того, для любого а £ А верны равенства аН = На и а(Α Π Я) = аА Π аН = Α Π На = Аа Π На = (Α Π Η)α, т. е. Α Π Η <Α. Наконец, АН = (J аН = (J #а = ЯЛ, и в силу теоремы 5 АН < G. б) Если К < G и Я < G, то нормальность в G подгрупп К ПН и К Η следует из того, что для любого g € G верны равенства: д(КПН) = дКП9Н = КдПНд = (КПН)д, д(КН) = ЫГ)Я = (^)Я = tf (<?Я) = tf (Я<?) = (tf Я)<?. D 2. Важнейшие определяющие свойства нормальных делителей в классе подгрупп перечисляет Τ е о ρ е м а 24. Для подгруппы Я группы G следующие утверждения эквивалентны: а) H<G\ б) Ng(H) = G (т.е. у"1/^ € Я <?лл любых g € G, Л € Я); в) отношения "= (Я)пм м "= (Я)л" wa G совпадают; г) отношение " = (Я)п" есгаъ конгруэнция на G; д) отношение " = (Я)л" есгаъ конгруэнция на G. D Эквивалентность утверждений а) и б) следует непосредственно из определений нормализатора и нормального делителя. Докажем теперь цепочку импликаций а) =Ф в) =» г) =Ф а). а) =» в). Так как Яд = ρ Я для всех # € G, то в силу теоремы 6 разбиение группы G, порождаемое отношением эквивалентности "= (Я)п", совпадает с разбиением, порождаемым отношением " = (Я)л". в) =ф- г). Пусть α = 6(Я)П ис = й(Я)п. Тогда α · б"1 € H1acc~lb~1 € € Я, и, следовательно, ас = Ьс(Н)ц- Кроме того, в силу утверждения в) с = d(H)j\ и справедливы соотношения c~ld € H1c~lb~1bd € Я, т. е. 286
be = bd(H)j\. Отсюда, опять по утверждению в), имеем be = bd(H)n1 и, так как ас = 6с(Я)п, то ас = bd(H)n- г) =4- а). Так как для любого Л € Я верно соотношение Л = е(Я)п и для любого д € G верны соотношения ρ = д(Н)ц,д~1 = д~1(Н)п, то, пользуясь согласованностью отношения "= (Я)п" с групповой операцией, получим последовательно hg = g{H)n,g~lhg = g^lg{H)u^g^lhg = = е(Я)п. Следовательно, для любых д € G и д G Η имеется включение g~lhg Ε Я, т. е. д~1Нд С Я и Яд С #Я. Заменяя здесь g на у"1, получаем дНд~г С Я и #Я С Яд. Следовательно, Яд = #Я для всех £ € G, т. е. Я < G. Таким образом, доказана эквивалентность первых четырех утверждений теоремы. Теперь их эквивалентность утверждению д) очевидна в силу соображений симметрии. (Читателю предлагается самостоятельно доказать импликации в) =Ф д) =Ф a).) D 3. Покажем теперь, что теоремой 24 в действительности описаны все конгруэнции на группе G. Заметим, что если Я — нормальный делитель в G, то можно говорить просто об отношении сравнимости по Я и писать а = 6(Я), поскольку отношения " = (Я)пм и "= (Я)л" совпадают. Определение 37. Если φ: (G, ·) —> (К, ·) гомоморфизм групп, то его ядром называют множество Кет φ = {g € G: <p(#) = ек} = у"1(ек), где ек — единица группы К. Τ е о ρ е м а 25. Для любого гомоморфизма групп φ: (G, ·) —* {К, ·) его ядро Кепр есть нормальная подгруппа в G. Если ρ — произвольная конгруэнция на G, то ρ есть отношение сравнимости по подгруппе Кегдо» где <£о: G —* G/p — канонический эпиморфизм. При этом Кег<£о = {д € G: #рес} = (е<з]р· D Пусть у?: (G, ·) —> (ЯГ, ·) — произвольный гомоморфизм, тогда для любых элементов а, 6 € Кегу? верны соотношения: ip{ab~l) = у>(а) · ^(б)"1 = ек · е£ = еК- Следовательно, ab~l € Кепр и Кепр < G. Кроме того, для любого д € G верны соотношения ip(g~lag) = <p{g)~l<p{a)<p(g) = 4>{д)~1<р{д) = = ек» т. е. д~1ад €Кег<р. Следовательно, Νο{Κβτφ) = G, и по теореме 24 Кег <р « G. Пусть ρ — произвольная конгруэнция на (G, ·). Рассмотрим факторгруппу G/p, состоящую из всех различных классов [д]р = {а € G: ард}, 287
с операцией [д\]р - [д2]р = [gi92]p· По утверждению 5.Х отображение φο: G —> G/p по правилу <£о(#) = [д]р есть гомоморфизм групп, связанный с отношением ρ следующим образом: Уди92 € G дгрд2 <=» <РР{дг) = φΡ{92). Но выше уже доказано соотношение: 9\ = #>(КегЫ <=» Ч>Р{д\) = <^р(р2). Следовательно, отношение ρ есть отношение сравнимости по Кег<ро· Остается заметить, что нейтральный элемент в группе G/p есть [βσ]ρ, поэтому ядро канонического гомоморфизма у?о имеет вид: Кег<£о = {9 € G: <р0Ы = [ес]Р} = {д € G: <^0(р) = ^о(ес)} = = {д € G: дое,}. D Следствие. Гомоморфизм групп φ: G —> К является мономорфизмом тогда и только тогда, когда Κβτφ = {ее}· D Достаточно воспользоваться соотношением: <р(а) = ч>(Ъ) <=» а = 6(Кег<р). D 4. Теоремы 24, 25 позволяют по новому, в более удобной и наглядной форме, сформулировать для групп теорему об эпиморфизме полугрупп. Определение 38. Если Я < G, то факторгруппой группы G по подгруппе Я называют факторгруппу группы G по отношению "= (Я)". Эту факторгруппу обозначают G/H. Таким образом, G/H = G/ = (Я). Из общего определения факторгруппы очевидно, что элементами группы G/H являются классы элементов G, сравнимых по подгруппе Я, т. е. по теореме 6 — смежные классы дН = Нд группы G по Я. При этом операция на элементах группы G/H задается следующим образом: дгН -д2Н = 0102-Я, а канонический эпиморфизм φο: G —* G/H задается равенством <£о(#) = = дН. Заметим, что при аддитивной форме записи групповой операции элементы факторгруппы G/H записываются в виде д + Я, а операция задается равенством: (дг + Я) + (д2 + Я) = (дг + д2) + Я. 288
Теорема 26 (об эпиморфизме групп). Если φ: (G, ·) —> (К, ·) — эпиморфизм групп, то G/Ker φ = К, и существует единственный изоморфизм τ: G/Ker φ —> К такой, что коммутативна диаграмма G_JL ^К G/Ker φ где φο: G —> G/Ker у? — канонический эпиморфизм. Изоморфизм τ задается равенством т(д · Кегу?) = 4>{д)- D Из теоремы об эпиморфизме полугрупп (гл. X) следует, что если ρ — конгруэнция на G, определяемая условием и φο: G —> G/p — канонический эпиморфизм, то существует единственный изоморфизм т: G/p —> ЛГ, дающий коммутативную диаграмму G φ » Г \/ При этом т([р]р) = <р(#). Остается заметить, что по теореме 25 ρ есть отношение сравнимости по Ker<p, G/p = G/Ker φ и [#]р = д-Кегу?. D Эта теорема широко используется в теории групп для доказательства соотношений типа G/H = К путем подбора эпиморфизма φ: G —* К с ядром Кег φ = Η. Π ρ и м е ρ 36. Имеет место изоморфизм (R/Z, +) = (Г,·). Для доказательства достаточно заметить, что можно задать эпиморфизм φ: (R, +) —> (Г,·) по правилу φ(τ) = cos27rr 4- isiri2nr1 и при этом Кег<р = Z. Аналогично можно доказать, что (R/mZ,+) = (Г,·) для любого га € N. 5. Следствие 2 утверждения 4 о свойствах образов и полных прообразов подгрупп при гомоморфизме можно теперь дополнить. 289
Τ е о р е м а 27. Пусть φ: (G, ·) —> (К, ·) — голеолсор^изле групп. Тогда а) Л < G => уГ^Л)) = Л · Кег<р; б) B^tf^yr^B^G. £?сли к тому з/се у? — эпиморфизм, то в) В<А'=»^-1(В)) = В; г) Л < G =» у>(Л) < /Г. D а) Пусть A <G. Тогда по следствию 1 утверждения 4 <р(Л) < if и Л<^1(^(Л))<С (34) Так как ек € <р(Л), то Кегу> = <р-г(ек) С уГ1^)). (35) Из соотношений (34), (35) следует, что Л· Кег<р < φ~ι(φ(Α)). Наоборот, если α € φ~1(φ(Α)), то φ(α) = <ρ(α) для подходящего а € Л, и ек = φ(α)~ι · у>(а) = φ{α~1 · а). Следовательно, α"1 α € Кегу? и а € αΚβτφ С Л · Кег<р, т. е. φ-ι{φ(Α))<Α. Κβτφ. б) Пусть B<if. Тогда для любых Λ € φ^1(Β) и g € G справедливы соотношения <ρ(/ι) € В и 4>{g~~lhg) = <р{д)~г<р(Н)1р(д) € В. Следовательно, g~lhg £ φ"1 (В) и по теореме 24, с учетом следствия 2 утверждения 4, ^(BHG. в) Для любого сюръективного отображения φ: G —> К и любого В С К верно равенство у?(у?~1(В)) = В. г) Пусть φ — эпиморфизм и Л < G. Тогда для любого к £ К существует д £ G со свойством к = <р(#), и, так как #Л = Л#, то к(р(А) = = <£(#М^) = ¥>(0-А) = <р(Л#) = у>(Л)у>(у) = φ{Α) · Λ. Следовательно, у>(А)<1Я\ D Замечание 9. Если операция в группе G записывается аддитивно, то утверждение а) имеет вид φ~1(φ(Α)) = Л + Кег<р. Читателю рекомендуется самому подобрать примеры, показывающие, что утверждения в) и г) теоремы 27 неверны, если φ — не эпиморфизм. 290
§ 12. Теоремы об изоморфизме При получении многих теоретико-групповых результатов весьма эффективным инструментом оказываются следующие две теоремы. Теорема 28 (первая теорема об изоморфизме). Если φ: (G, ·) —> —» (К, ·) — гомоморфизм групп и А < G, то Α Π Кег φ < Α, φ{Α) £ А/А Π Кег у>. D Так как Кег у? < G (теорема 25), то (А П Кег у?) < А (утверждение 11 а)). Зададим отображение ψ: А —► К, положив Va € Α (ψ(α) = </>(<*))· Нетрудно видеть, что г/> ~ гомоморфизм (А,-) в (If,·) и t/>(A) = = <р(А), т. е. ψ — эпиморфизм (А, ·) на (<р(А), ·). Следовательно, по теореме об эпиморфизме для групп φ(Α) = А/Кегф. Остается заметить, что справедливы равенства: Κβτψ = {а € Α: ψ(α) = ек} = {а € С?: <р(а) = ед-,а € А} = А П Кег у?. D Следствие. Если Я — нормальный делитель и А — подгруппа группы G, то верны соотношения: Н<АН, АпЯ«А, АН/Н**А/АПН. О Рассмотрим канонический эпиморфизм φ: G —» G/ff. Тогда Кег φ = = Яипо теореме 28 б) справедливы равенства уГ^А)) = А · Кег<р = А · Я. (36) Так как <^(у"1(у(А))) = <р(А) (докажите), то из (36) следует равенство φ(Α) = φ(ΑΗ). Теперь, дважды применяя теорему, получаем: φ{Α) й Α/Α Π Кег φ = А/А П Я, <р( A) S АЯ/АЯΠ Кег<р = АЯ/АЯПЯ = АЯ/Я. D Замечание 10. При аддитивной форме записи групповой операции следствие теоремы 28 утверждает: если А^Н — произвольные подгруппы абелевой группы (G, +), то А/АГ)Н**{А + Н)/Н. (37) Последнее соотношение имеет весьма интересную арифметическую интерпретацию. 291
Π ρ и м е ρ 37. Нетрудно проверить, что для любых а, га € N имеет место изоморфизм (αΖ/ατηΖ,-f) = (Zm,-f)· Пусть А и Η — подгруппы в (Ζ, -f). Тогда для подходящих a, h € N верны равенства А = aZ, if = = /ιΖ, A -f Я = (α, /ι) · Ζ, Α Π Я = [α, Λ]Ζ и имеют место изоморфизмы: (А + #)/# = (α, /ι)Ζ//ιΖ S Ζ(Λ/(β,Λ)>, A/AПЯ = αΖ/[α,Λ]Ζ * Ζ((β,Λ]/β). Теперь видно, что изоморфизм (37) обобщает известное арифметиче- h vW, h\ ское соотношение , \\ = L ' J. (α, /ι) ο. Теорема 29 (вторая теорема об изоморфизме). Если φ: (G, ·) —> —> (ϋί, ·) — эпиморфизм групп и Я <G, то φ(Η) < К и Κ/φ(Η) = й G/Я · Кег<р, т. е. <p{G)/<p{H) S G/Я . Кег<р. D Условие </?(#) <3·Κ' следует из теоремы 27г). Рассмотрим канонический эпиморфизм <pq: К —► Κ/φ(Η) и зададим отображение t/>: G —> —> Κ/φ(Η) условием: V>(#) = φο(ψ(9)) = ¥>(#) * ψ{Η)> τ· е· так> чтобы была коммутативна следующая диаграмма Очевидно, что ψ — эпиморфизм G на Κ/φ(Η), так как t/> = φο ο φ — композиция двух эпиморфизмов. Следовательно, по теореме об эпиморфизме Κ/φ(Η) £ G/Κβιψ. Остается доказать равенство Кег ψ = Я · Кег φ. Так как нейтральным элементом в группе Κ/φ(Η) является класс φ(Η) и ф(д) = <р(#) · <р(Я) для любого д € G, то верны соотношения: у € Кег^ <=» <р(д) · φ{Η) = <р(Я) <=» <£(#) € у>(#) «Ф <*д£ φ-ι(φ{Η)) = ЯКег<р. D Следствие. .Если Ν,Η — нормальные подгруппы группы G и NcH, moH/N<G/N, и G/H 2 (G/H)/(H/N). (38) 292
D Факторгруппа Η/N есть образ нормального делителя Я группы G при каноническом гомоморфизме φ: G —» G/iV, так как по определению H/N — есть множество разных смежных классов вида gN, где д £ Н. Тогда в силу теоремы 29 имеем: {G/N)/tp{H) = {G/N)/(H/N) S G/tf · Kery>. Остается заметить, что Кет φ = JV С Я, и поэтому Я · Κβτφ = Я. D Доказанное следствие имеет еще более простую арифметическую ин- терпритацию. Π ρ и м е ρ 38. Пусть G = Ζ > Я > ЛГ. Тогда JV = nZ, Я = ΛΖ и η = m · /ι, где га, η, Λ Ε JV. Отсюда имеем G/Я = Ζ/ΛΖ = Zh,G/N = = Zn, Я/JV = /ιΖ/ηΖ = Zm и Я/JV — подгруппа порядка m в Zn, порожденная делителем Л. Поскольку все выписанные группы — циклические, а изоморфизм таких групп эквивалентен равенству их порядков, то изоморфизм (38) в рассматриваемом случае есть эквивалент равенства Л = #. § 13. Простые группы 1. Изучение группы путем ее "упрощения" с помощью гомоморфизмов или факторизации возможно лишь в тех случаях, когда она имеет собственные нормальные делители. Однако этим свойством обладает не любая группа. Определение 39. Неединичную группу G, не имеющую собственных нормальных делителей, называют простой. Описание всех простых групп — один из основных и самых сложных разделов современной теории конечных групп. Простые абелевы группы, т. е. абелевы группы, не имеющие собственных подгрупп, описываются очень легко. Τ е о ρ е м а 30. Неединичная абелева группа (G, ·) является простой тогда и только тогда, когда она — конечная группа простого порядка. D Если \G\ —p— простое число, то по теореме ЛагранжаG не имеет собственных подгрупп. Пусть, наоборот, G — простая абелева группа. Выберем любой элемент g Ε G\{e}. Тогда (g) — неединичная подгруппа в G, и так как G не имеет собственных подгрупп, то G = (д) — цикличе- 293
екая группа. Но в таком случае по теореме 4 либо G = Z, либо G = Zm. Если G = Ζ или G = Zm где т — не простое число, то в G легко указать собственную подгруппу. Следовательно, G = Ζρ, где ρ — простое. D 2. Первую серию конечных простых неабелевых групп открыл еще Э. Галуа. Его результат можно сформулировать следующим образом. Теорема31. Знакопеременные группы Ап просты при всех η > 3 за исключением случая η = 4. D Аз = ((1,2,3)) — простая абелева группа порядка 3. At — не простая (не абелева) группа, ее собственным нормальным делителем является подгруппа Клейна (см. пример 34). Докажем простоту Ап при η > 5. Л е м м а 3. При η > 5 любые два цикла длины 3: g = (аьа2,аз) ti h = (с*ьс*2>аз) сопряжены в Ап. D Уравнение x~lgx = /ι имеет в 5П решение вида: /αϊ α2 аз α4 as ... αη \ \αι α2 аз с*4 о^5 · · · ftn/ Но тогда, очевидно, подстановка w = /αϊ ^2 аз α4 α5 ... αη \ \ αϊ аг аз as ola · · · αη / — также решение этого уравнения. Так как / и /' — подстановки разной четности, то одна из них принадлежит Ап. О Пусть G — неединичный нормальный делитель в Ап. Покажем, что G = Ап. Среди элементов G выберем неединичную подстановку g с наименьшим числом мобильных элементов. Достаточно показать, что g — цикл длины 3, так как тогда по лемме 3 в G лежат все циклы длины 3 и по теореме 21 G D Ап. Покажем сначала, что в разложении подстановки g в произведение независимых циклов все неединичные циклы имеют одинаковую длину. Действительно, если в этом разложении есть циклы длин к и т, и 1 < к < т, то дк € G\{e}, причем | mob#fc| < | mob</|, что противоречит выбору подстановки д. Следовательно, разложение д на независимые неединичные циклы имеет вид: д = (αϊ,..., ак) · (&ь..., 6fc) ·... · (ci cfc), * > 2. (39) Допустим, что число циклов в разложении (39) равно t. Наша задача — доказать, что к = 3, t = 1. 294
Заметим, что для любой подстановки / G Ап подстановки /-1 ·ρ·/ и д' = 9~1 · f~l · 9 · f принадлежат Я. Покажем, что если к φ 3 или ί > 1, то можно подобрать подстановку f £ Ап так, что д1 φ ε и jmobi/'l < < I mobg|, а это противоречит выбору д. Если к > 3, то, выбирая / = (01,0^,02), получаем / € Ап, тоЪд' С mob# (40) и#' = (α&,θ£_ι,...,θ2,θι)·(θ£,θι,θ3,...,ο&_ι,θ2) = (οι) (02,03,о*)·.... Следовательно, #' φ ε, д'{аг) = ох и | mob#'| < | mob#|. (41) Если к = 3, но £ > 1, то для / = (02,62,61) выполняются условия (40) и #' = (63,62,61) · (ο3,ο2,θι) · (θι,62,ο3) · (α2,6ι,63) = (ох) · (02,62,·.·)» отсюда также следует (41). Если к = 2, то t — четно, поскольку д € Ап. При этом если t = = 2, т. е. д = (αι,α2) · (61,62), то, ввиду условия η > 5, можно выбрать d € 1,η\ {αϊ,02,61,62}. Тогда условия (40) и (41) выполняются для / = (61,62, cf), поскольку в этом случае Я1 = (62,61) · (α2,αι) · (62,d) = (6bd,62). Наконец, если к = 2,£ > 4, то |тоЬд| > 8, и, выбирая / = (oi,6i,ci), получаем д' = (C2,ci) · (62,61) · (α2,αι) · (6ьо2) · (сь62) · (оьс2) = = (oi,6bci) · (а2,С2,62). Следовательно, | mob #'| = 6 < | mob#|. Таким образом, разложение (39) имеет вид д = (01,02,03), и потому Я = Ап. D 3. Еще одна важная серия простых групп, найденная К. Жорданом — это проективные специальные линейные группы. Пусть F — поле, и т € N. Подгруппа полной линейной группы GL(ra, F), состоящая из всех преобразований φ л (см. пример 22), для которых \А\ = е называется специальной линейной группой и обозначается SX(ra,F). Центр 295
C(SL(m,F)) группы SL(m,F) состоит из всех принадлежащих ей скалярных матриц (докажите). Факторгруппа SL(m,F)/C(SL(m,F)) называется проективной специальной линейной группой и обозначается PSL{m,F). Если F — поле из q элементов, то употребляется обозначение PSL(m,q). Приведем без доказательства следующий результат. Теорема Жордана — Диксона13. Для конечного поля группа PSL(m,F) проста, за исключением случаев: PSL(2,2),PSL(2,3). Приведем еще два важных результата (которые, однако, далеко не полно характеризуют настоящее состояние теории). Теорема Бернсайда. Любая группа порядка paqb, где р, q — простые, не проста. Теорема Фейта14 —Томпсона15. Любая конечная неабелева группа нечетного порядка — не проста. Полезно иметь в виду, что первое опубликованное доказательство последней теоремы занимает несколько сотен страниц — целый выпуск математического журнала. Таким образом, порядок любой конечной простой неабелевой группы делится на 2 и еще на два нечетных простых числа. Самая маленькая простая неабелева группа есть группа А$ порядка 60. Выдвинута гипотеза (называемая 5-гипотезой) о том, что классификация конечных простых групп завершена, т. е., что список уже найденных простых конечных групп содержит все существующие простые группы. Эта гипотеза, однако, до сих пор (2002) окончательно не подтверждена. § 14. Силовские подгруппы Выше уже отмечалось, что обращение теоремы Лагранжа в общей форме для конечных групп неверно. Однако такое обращение справедливо для любой конечной группы в одном важном случае. 1.Определение 40. Подгруппу Я конечной группы G называют р-подгруппой, или примарной подгруппой, если |Я| = pfc, где ρ — 13 А. Л. Диксон (1867—1955) — английский математик. 14 У. Фейт — современный американский математик. 15 Д. Ж. Томпсон — современный американский математик. 296
простое число, к £ N. Если при этом рк есть наибольшая степень числа р, делящая |G|, то подгруппу Η называют силовской р-подгруппой группы. Следующие результаты, полученные норвежским математиком П. Л. Силовым 16 более ста лет назад, по своей фундаментальности и многообразию приложений сравнимы с самой теоремой Лагранжа. Теорема 32 (первая теорема Силова). Если (G, ·) — группа порядка η, ρ — простой делитель η и рь\п, то в G существует подгруппа порядка р1. В частности, в G существует силовская р-подгруппа. Докажем сначала следующее вспомогательное утверждение. Л е м м а 4 (Коши). Если (А, ·) — абелева группа порядка т и ρ — простой делитель т, то в А существует подгруппа порядка р. D Индукция по га. Если га — простое число, то лемма очевидна. Пусть N > 1, и лемма верна для всех групп А таких, что т < N. Докажем ее для га = N. Очевидно, достаточно доказать, что в А есть элемент порядка р. Выберем произвольно b G А\ {е}. Если ordfr = г и р|г, то нужный элемент есть bk, k = р. Пусть ρ \ г, т. е. (р,г) = 1. Рассмотрим подгруппу В = (6) группы А и факторгруппу А/В. Так как |В| = г, то \А/В\ = ~ и р|~, поскольку р\ г. Так как ™ < Ν, то, ввиду предположения индукции, в группе А/В существует некоторый элемент а · В порядка р. Остается заметить, что ord (α· В) | orda, поскольку из условия аь = е следует, что {аВ)ь = В. Следовательно, p|orda. D D Доказательство теоремы 32 проведем индукцией по порядку η Ε Ν группы G. Если η — простое, то теорема очевидна. Пусть N > 1, и теорема верна для любой группы порядка η при η < N. Предположим, что η = N. Если в группе G есть собственная подгруппа Η такая, что (\G : Я|,р) = = 1, то, очевидно, рь\ \Н\. По предположению индукции в Η существует подгруппа порядка р1, и она будет нужной р-подгруппой в G. Допустим теперь, что для любой собственной подгруппы Η < G выполняется условие p\\G : Н\. Покажем сначала, что в этом случае центр C(G) группы G нетривиален, и р\ \C(G)\. Пусть [#ι]«,..., [#t]ss — все различные классы сопряженных элементов группы G, имеющие мощность, большую единицы. Тогда, ввиду замечания 6, множество G следующим образом представляется в виде 16 П. Л. Силов (1832—1918) — норвежский математик. 297
объединения непересекающихся подмножеств: G = C(G) U [ffi]« U... U [fft]«. Следовательно, \G\ = \C(G)\ + \[9lU + ... + \[gtU. (42) По теореме 11 |[#г]«| = \G : Ng{9i)\ и в соответствии со сделанными предположениями об индексах подгрупп в G можно утверждать, что р||[л]*|для!'€М. (43) Так как по условию р\ |G|, то из (42) и (43) следует нужное соотношение: р\ \C{G)\. В таком случае по лемме Коши в группе C(G) есть подгруппа Η порядка р. Если t = 1, то Η — искомая р-подгруппа в G. Допустим, что t > 1. Поскольку Η — подгруппа центра G, то Η < G, и можно рассмотреть факторгруппу G/H и канонический эпиморфизм φ: G —* -^G/H. Так как |G/ff | = ^ < JV и ρ*"11 |G/ff |, то по предположению индукции в G/H существует подгруппа S' порядка ρί-1. Пусть 5 = у?"1(5/). Тогда S D Η = Кег<р, и по теореме 27 в) <p(S) = 57. Следовательно, 5' = S/H. Но тогда |5| = \S'\ - \Н\ = р\ и S — искомая подгруппа bG.D Теперь можно доказать обращение теоремы Лагранжа для конечных абелевых групп. Следствие. Если (G, +) — абелева группа порядка η и d\n, d > 0, то в G существует подгруппа Η порядка d. Ό Индукция по d. При d = 1 утверждение очевидно. Пусть т > 1, и утверждение верно для d < т. Докажем его для d = т. Пусть ρ — простой делитель d и d = р*&, где (&,р) = 1. Тогда k < m и по предположению индукции в группе G существует подгруппа А порядка А:, а по первой теореме Силова в G существует подгруппа В порядка ρ1\ В таком случае, по следствию теоремы 9 Η = А 4- В — искомая подгруппа в G порядка d. D Первая теорема Силова может быть дополнена также утверждением о том, что любая р-подгруппа конечной группы лежит в некоторой ее силовской р-подгруппе. 298
2. Приведем еще две теоремы о силовских р-подгруппах. Вторая теорема Силова. Любые две силовских р-подгруппы конечной группы G сопряжены в G. Третья теорема Силова. Число sp силовских р-подгрупп в группе G удовлетворяет условиям: sp = l(modp), sp | |G|. D Мы докажем эти теоремы лишь в частном случае — для коммутативной группы. Здесь справедливо даже более сильное утверждение. Τ е о ρ е м а 33. Пусть (G, +) — конечная абелева группа порядка п, и для некоторого простого ρ верны соотношения: η = pfcra, k > > 0, (ρ, τη) = 1. Тогда в G существует единственная силовская р-под- группа G™ и справедливы равенства: G^ = {g€G:oidg\pkl (44) G(p) =mG = {mg:g€G}. (45) D Обозначим через G\ и G2 множества из правых частей равенств соответственно (44) и (45). Пользуясь коммутативностью группы G, легко проверить, что Gx < G, г € ТД (Докажите!) По первой теореме Силова в группе G существует силовская р-подгруппа: S < G, \S\ = pk. Теперь очевидно, достаточно доказать равенства S = G\,G\ = G2. Включение S С G\ очевидно. С другой стороны, G\ — р-подгруппа в G, так как иначе число |Gi| делится на некоторое простое q, отличное от р, и тогда по первой теореме Силова в G\ существует подгруппа и элемент порядка q, что противоречит определению G\. Следовательно, \Gi\ = Ре, Ре\п> и, ввиду условия, £ < к. Отсюда |Gi| < |5|, и так как ScGi, To5 = Gb Докажем равенство G\ = G2. Так как для любого g € G верно равенство рк(тд) = 0, то тд € Gi, т. е. G2 С G\. С другой стороны, для любого д € G\ из условия (га,р) = 1 следует, что (ordg, m) = 1, и потому охатд = ord#, т. е. (тд) = (д) и д € (тд) С G2. Следовательно, Gi С G2 и Gi = G2. □ Следствие. Конечная непримарная абелева группа (G, +) порядка η € Ν, имеющего каноническое разложение η = pkl,... ,р£', раскладывается в прямую сумму своих силовских подгрупп: G = G(pi)4-...4-G<Pt>. (46) Любое другое разложение группы G в прямую сумму примарных подгрупп попарно взаимно простых порядков отличаются от (46) лишь перестановкой слагаемых. 299
D Пусть Η = G(pi*4-.. .+G(pt\ Тогда по следствию из теоремы 9 Я = = G(pi> + ... + G(P'> и |tf| = \Gb*)\-...-\GM\ = n = \G\. Следовательно, G = Я, и справедливо (46). Если G = Н\ 4- ... 4- #s, где #i,...,ffs — примарные подгруппы попарно взаимно простых порядков gf *,..., qess, соответственно, то \G\ = |#ι| ·... · |ffs|, и каноническое разложение числа η = \G\ можно записать в виде η = q[l ·... · qes*. Отсюда по основной теореме арифметики следует, что s = t, и (gf*,..., gf3) — перестановка чисел р\х,..., р%*. Следовательно, H\,...,Ht — силовские подгруппы группы G. Так как по теореме для каждого рг, г € 1,£, силовская рг-подгруппа в G единственна, то (#ι,..., #*) перестановка набора (G^Pl\..., G^p^). D Обратите внимание на то, что доказанное следствие есть обобщение второй части теоремы 10 на конечные абелевы группы. Задачи 1. Если в полугруппе с нейтральным элементом для некоторого элемента есть правый и левый обратные, то они совпадают. 2. Опишите возможные порядки элементов и экспоненты групп Z4, Zg, Z$r», 5г, 5з, 54. 3. Докажите, что в конечной группе (G, ·) для любого к > 2 число элементов порядка к четно (воспользуйтесь тем, что ordg = ord*/"1). 4. Докажите, что если в группе есть перестановочные элементы порядков га, η € Ν, το в ней есть элемент порядка [га, п]. 5. Приведите пример конечной группы G, в которой нет элемента д € G со свойством ord д = exp G. 6. Докажите, что если φ: G —* Η — гомоморфизм групп, то для любого д € G верно соотношение ord(p(g) | ord #, а если φ — мономорфизм, то ord (р(д) = ordg. 7. Пусть Ρ — поле с единицей е. Докажите, что в группе (Р, 4-) либо ordе = 00, либо ordе = ρ — простое число, и для любого д £ Р\ {0} верны равенства ord# = orde = exp (Ρ, -f). 8. Опишите элементы конечных порядков в группах (Q, -Ь) и (Q*, ·) и покажите, что эти группы не изоморфны. 9. Докажите, что центр группы Р^Хп всех обратимых матриц над полем Ρ состоит из всех ненулевых скалярных матриц. 300
10. Покажите, что для любых подмножеств А и В группы G справедливо соотношение: (А) <(В)&Ас (В). 11. Докажите, что группы (Q,+), (С(р°°), ·), (Гм,·) не имеют конечных систем образующих. 12. Докажите, что если S — система образующих группы С(р°°), то для любого s € S множество S \ {s} — также система образующих С(р°°). Верно ли аналогичное утверждение для группы (Q, -f)? 13. Пусть αϊ,... , α* € Ζ, d = (αϊ,... ,at), h = [αϊ,... ,α$]. Докажите соотношения: (αϊ) С (α2) <=»α2|αι; (ab...,at) = (d); (αϊ) Π .. .Π (at) = (/ι). 14. Докажите, что для конечной группы G следующие утверждения эквивалентны: а) 3geG: oidg = |G|; б) G — циклическая группа; в) G — абелева группа и expG = \G\. Покажите, что в пункте в) нельзя отказаться от первого условия. 15. Пусть G = (д) — циклическая группа порядка т. Докажите, что для любых а, 6 € Ζ дь € (да) о разрешимо сравнение ах = fr(modm). 16. Пусть Ах = (Si), г € Μ — подгруппы абелевой группы (G, +). Докажите равенство Αι Η 1- At = (Si U ... U St). 17. Докажите, что если А, В < (G, ·), то (AB < (G,·))^(Α·β = (ΑϋБ)). 18. Докажите, что для подгрупп А, В, С абелевой группы (G, +) верно включение А Г) (В + С) D {А Г) В) + {АГ) С), и, если A D В, то оно превращается в равенство. 19. Покажите, что для любых подгрупп А, В, С группы (Ζ, +) верно равенство АП(В + С) = АП В + АПС. 20. Если mi, 7П2 € N и m = mi -m2, то в группе Гт лежат подгруппы Гш1,Гт2. Докажите, что Гт = Гт1 · Гт2 <=» (mi,m2) = 1. 301
21. Докажите, что если А, В — конечные подгруппы группы (G, ·), то |А · В\ = Up'J (покажите, что число различных смежных классов вида аВ, α € А равно |А: (Α Π В)|). 22. Используя теорему Лагранжа, докажите теорему Эйлера: Va € Z,Vm € N ((a,m) = 1) =» (a*<m> = l(modm)). 23. Используя теорему Лагранжа, покажите, что если Ρ — поле из q элементов, то все элементы из Р* — корни многочлена х9"1 — е, а все элементы из Ρ — корни хя — х. 24. Докажите, что в мультипликативной группе Р* произвольного поля Ρ любая конечная подгруппа — циклическая, в частности если \Р\ < оо, то Р* — циклическая группа (воспользуйтесь результатом задачи 14). 25. Докажите, что непустое подмножество К группы (G, ·) является смежным классом по некоторой ее подгруппе тогда и только тогда, когда ЧащЬ%с€К(аЬ-гс€К). Опишите подгруппы, по которым К является правым и левым смежным классом. 26. Пусть #ι, #2 — подгруппы группы (G, ·) и 9i,92 € G. Докажите: а) Яш Π #202 φ 0 <=» 9i92l € #ι · #2; б) 0 € (#101 Π #202) =* #101 Π #202 = (#1 Π #2)0; Β) #101 С #202 <=» #1 С #2 Э 010^; Г) #101 = #202 Ф> #1 = #2 Э 010J1. 27. Пусть G = (0) — группа порядка т, 0ι,..., gt € G и # = = (0ь. · · 10*)· Докажите: а) еслиога0г = гаг, г € Μ, το# = (0^mi'" ,m«/) и |#| = [mi,...,га*]; б) если 0г = 0**, г € М, то # = (0<**· · ·*·>) = (0<fcl· 'fc"w>). 28. Докажите, что в циклической группе порядка га для каждого натурального d, делящего т, существует ровно φ(ά) элементов порядка d (φ{ά) — функция Эйлера, φ(1) = 1). Выведите тождество Гаусса: Σ ψ(ά) = т. d\m 29. Пусть G — группа порядка га, в которой для каждого d\m существует не более одной подгруппы порядка d. Докажите, что G — 302
циклическая группа. (Покажите, что число ψ(ά) элементов порядка d в G не превосходит φ(ά), и воспользуйтесь предыдущей задачей.) 30. Пусть (G, -f) — конечная группа, и сумма всех ее элементов порядка га € N есть σ. Покажите, что 2σ = 0; если га > 2, то σ = 0; а если га = 2 и G — циклическая группа, то orda = 2. 31. Пусть Gi,...,G* — абелевы группы порядков, соответственно га ι ι · · ·, ™>t € N. Докажите, что Gi О ... Θ Gt — циклическая группа тогда и только тогда, когда Gi,..., G* — циклические группы и числа mi,..., mt попарно взаимно просты. 32. Пусть p(G) — минимальное число образующих группы G. Покажите, что если p(Gi) = тг, г € 1,£, то p(Gi О.. .®G*) < mi +... + mt, и последнее неравенство может быть строгим, и может обращаться в равенство. Если Gi,..., Gt — конечные группы попарно взаимно простых порядков, то p(Gi <g>... Θ Gt) = max{mi,..., mt}. 33. Докажите, что если р — минимальный простой делитель порядка конечной группы G, то p(G) < logp \G\ и указанная оценка достижима. 34. Докажите, что сопряженные элементы группы имеют одинаковые порядки, но обратное утверждение неверно. 35. Покажите, что центр конечной неабелевой группы есть подгруппа не простого индекса. 36. Опишите все конечные группы, разбивающиеся на 2 класса сопряженных элементов. 37. Подгруппы А и В группы (G, ·) называются сопряженными, если В = д~1 Ад для некоторого д € G. Докажите, что число подгрупп группы G, сопряженных с Л, равно |G: Nq(A)\. 38. Докажите, что группа диэдра Dn порождается подстановками 9 = (\ з · · · "п* ?) и ^ = (η n-i ···?)» и не коммутативна. Покажите, что £>з = 5з, a D± содержит подгруппу Клейна К±. 39. Докажите, что группа G движений тетраэдра есть А\л и опишите движения, составляющие в G подгруппу Клейна К±. 40. Докажите, что группы движений куба и октаэдра изоморфны. 41. Опишите возможные порядки элементов и экспоненты групп 5П, η < 6, перечислите их классы сопряженных элементов. 303
42. Пусть д = (αο,αι,... ,α&_ι) — цикл длинны к, т е N и d = (га,/:). Докажите, что gw есть произведение d независимых циклов длины ί — — к. "Η" 9 = П(а«»в|ч(в+т)» ·.. ,arfc(s+(£-i)m)), где г^(х) — остаток от деления χ на к. 43. Докажите, что для подстановки д £ Sn с цикловой структурой [I*1, 2*2,... ,ntn] и для любого простого ρ е N уравнение хр = д разрешимо в Sn тогда и только тогда, когда VA: е ΪΓη: р\к =Ф p\tk- 44. Докажите, что Ап = ((1,2,3), (1,2,4),..., (1,2, п)). 45. Покажите, что если в группе G < Sn есть нечетная подстановка, то множество Η всех ее четных подстановок есть подгруппа индекса 2. 46. Пусть Ск — множество всех циклов длины к > 1 в Sn. Найдите |Cfc|. Покажите, что (Ск) = Ап, если к — нечетно, и (Ск) = Sn, если к — четно. 47. В условиях предыдущей задачи покажите, что для некоторого £ е € N выполняется равенство Sn = С\ U Cf U ... U С|, и найдите наименьшее i с этим свойством. 48. Докажите, что подстановки д = (0,1,.. . ,п - 1) и h = (0,α) на множестве 0, η — 1 порождают группу 5(0, η — 1) тогда и только тогда, когда (α,η) = 1. (При условии (α, η) = га > 1 покажите, что любая подстановка / € (д, h) обладает свойством Va, /?€ Ζη (α = /?=» /(α) ξξ/(/?)).) rn m 49. Опишите с точностью до изоморфизма все группы порядков 2—7. 50. Пусть д = (0,1,..., п — 1) — подстановка на кольце Zn. Докажите, что нормализатор подгруппы G = (д) в группе S(Zn) есть i4GL(l,Zn). 51. Пусть ρ G 5П и ordg = га. Докажите, что \Ns„{(9))\ = = <p(m)|Arsn(<7)|. (Для этого докажите соотношения: h е NSn((9)) <=* h-lgh € (<?) * /Г^Л = <Л * € Z*m.) 52. Докажите, что при η > 3 центр группы 5П тривиален. 304
53. Пусть fug — подстановки из S(Z), определяемые условиями / = = (0,1), Va € Ζ(ρ(α) =а + 1). Докажите, что в группе G = (/,д) лежит множество Η = {h € S(Z): |mob/i| < 00} и Η — подгруппа в G, не имеющая конечной системы образующих. 54. Покажите, что отношение "быть нормальным делителем" на множестве всех подгрупп группы 54 не транзитивно. 55. Докажите, что если Η < G, то Ng(H) — наибольшая подгруппа G, в которой Η является нормальным делителем, т. е. если Η < К < G, тоН<К&К < NG{H). 56. Докажите, что если H<Sn и в Я есть транспозиция, то Η = 5П. 57. Докажите, что для подгруппы Η группы G следующие утверждения эквивалентны: а) #«G; б) Η — объединение некоторых классов сопряженных элементов из G; в) Η = (5), где S — объединение некоторых классов сопряженных элементов из G; 58. Докажите, что для подгрупп А и В группы (G, ·) эквивалентны утверждения: а) G = А х Б; б) G = АВ, Л<G, £ « G, ЛпВ = е. 59. Докажите следующее соотношения: а)(С7К>сь-) = Г; б)С*/ГйК*>0; в)Г/Гш^Г; г) mZ/ranZ £* Zn; д) Sn/An S Z2; е) S4/#4 = S3; ac)Q/ZST(C·). 60. Докажите, что если А,В — подгруппы группы G и G = А х В, то А < G и G/A £* Б. 61. Покажите, что если G — не абелева группа, то G/C{G) — не циклическая группа. 62. Пусть # « G, \H\ = га, \G : #| = η и (га,гс) = 1. Докажите, что в G нет других подгрупп порядка га. 63. Коммутатором элементов #, /ι группы (G, ·) называется элемент [g,h] = h~lg~lgh. Коммутантом группы G называется ее подгруппа 305
[G, G], порожденная коммутаторами всех пар элементов из G. Докажите, что [G, G] < G, и если Я < G, то группа G/H абелева тогда и только тогда, когда [G, G] С Я. 64. Докажите, ЧТО \Sjit &п\ — Ап. 65. Пусть φ: G —+ К гомоморфизм групп, и Я < G. Докажите, что φ{Η)<φ{β) и φ(0/φ{Η) S* G/ΗΚβνφ. 66. Пусть А « В <з (G, ·) и Я « G. Докажите, что АН<ВН и ВН/А№*В/А{ВПН). 67. Используя теоремы Силова и теорему Бернсайда, докажите, что все не коммутативные группы порядка η < 60 не просты. Докажите это же, не пользуясь теоремой Бернсайда. 68. Вычислите порядок группы PSL(m,q) и докажите, что группы P5L(2,2) и P5L(2,3) не являются простыми. 69. Докажите, что любая группа порядка 2р, где ρ — простое, непроста. 70. Докажите коммутативность всех групп порядка 15. 71. Пусть А,В — группы и А < А\, В\ < В. Покажите, что G = = Αι <g> B\ — подгруппа А <8> В. Докажите, что если А и В — конечные группы, то в А ® В все подгруппы G имеют указанный вид тогда и только тогда, когда (|А|, \В\) = 1. 72. Пусть А, В — конечные подгруппы абелевой группы (G, +). Докажите, что если (|Л|, \В\) = 1, то для любой подгруппы С < G верно равенство С Π (А + В) = (G Π А) + (С Π В), а если А П Б = 0 и (|Л|, |В|) т^ 1, то существует подгруппа С < G, для которой это равенство неверно. 73. Пусть ρ — наименьший простой делитель порядка конечной группы G, Я < G и |G : Я| = р. Докажите, что Η<G. 306
Глава XII КОНЕЧНЫЕ АБЕЛЕВЫ ГРУППЫ В предыдущей главе читатель уже заметил, что условие коммутативности группы существенно облегчает изучение многих ее свойств. Это естественно наводит на мысль о целесообразности отдельного систематического изучения коммутативных групп. Кроме того, абелевы- ми группами настолько "пропитана" вся алгебра, что изучение их строения необходимо не только в теоретико-групповых, но и в общематематических интересах. В настоящее время теория абелевых групп развита весьма глубоко, однако полного описания их строения не существует. В данной главе дается полное описание строения лишь конечных абелевых групп. § 1. Каноническое разложение конечной абелевой группы Согласно теореме 10.XI любая конечная циклическая группа либо примарна, либо есть прямая сумма примарных циклических подгрупп. Этот результат следующим образом обобщается до основной теоремы о строении конечных абелевых групп. Теорема1. Любая конечная абелева группа (G, +) либо является примарной циклической группой, либо раскладывается в прямую сумму примарных циклических подгрупп: G = (ξχ) + ... + (ξι), οτάξι = pf', pi,... ,pt - простые числа. (1) Заметим, что числа ρι,.,.,ρ* в разложении (1), вообще говоря, не являются попарно различными. Рассмотрим сначала случай, когда G — примарная группа. Напомним, что согласно утверждению 2.XI в группе G существует элемент, порядок которого равен ее экспоненте. Для произвольного d G N обозначим через G(d) подгруппу группы G вида G(d) = {g€G:dg = 0}. 307
Л е м м а 1. Пусть G есть р-группа, expG = рт и ξ — элемент порядка рт из G. Тогда следующие утверждения эквивалентны: а) G = (ξ) — циклическая группа; б) G(p) — циклическая группа; в) G(p) С (ξ). D а) =Ф б) По теореме 4 в).XI любая подгруппа циклической группы G — циклическая группа. б) =Ф в) Так как expG(p) = ρ и G(p) — циклическая группа, то она порождается любым элементом порядка ρ из группы G. Поскольку οτάρτη"1ξ = р, то G{p) = (рт~1£) £ (О· в) =Ф а) Допустим, что G Φ (£). Выберем в G\(£) элемент g наименьшего возможного порядка. Тогда ordpg < ordg < pm и, следовательно, Р9 € (0> т· е· Р9 = ίζ Для некоторого £ € N. Так как οτά£ξ < рт = ordf, то р|^, скажем £ = pk,k eN. Тогда р(# - Ιϊξ) = 0 и # - к£ € G(p) С (£). Отсюда ρ € (ξ). Противоречие. D Л е м м а 2. В условиях леммы 1 существует подгруппа Η < (G,+) такая, что G = (ξ) + Я. D Пусть |G| = ps. Докажем лемму индукцией по параметру 5. Если s = 1, то утверждение очевидно: G = (ξ) и Я = 0. Пусть г > 1 и лемма верна для всех групп с условием s < г. Докажем лемму для случая, когда s = г. Если G = (ξ), то лемма верна. Пусть G Φ (ξ). Тогда по лемме 1 существует элемент a G G(p) \ (ξ). Рассмотрим факторгруппу G = = G/(a) и канонический эпиморфизм φ: G —* G. Для любого g € G положим ρ = <p(g). Заметим, что ονάξ = pm. Действительно, в противном случае ρπι^ιξ = 0, т. е. ρ™~ιξ € (α), и так как ordpw"1^ = ρ = orda, то (a) = (р"1-1^) ζ (ξ), что невозможно. Отсюда следует, что expG = pw, поскольку ехр ξ < exp G < exp G = рт. _ Таким образом, группа G и элемент ξ удовлетворяют условию леммы 1, и так как \G\ = ρ*"1 < рг, то по предположению индукции существует подгруппа Η <G такая, что G = (ξ)+Я. Пусть Я = у?"1 (Я). Покажем, что G = (ξ) + Я. Для любого g € G имеем: g = £ξ + h при подходящих ^ € No и Λ € Я. Тогда g — £ξ — h = ta для некоторого t € No, и так как ta € eKeripC φ-ι(Η) = Я, то £ = £ξ + (h + ta) € (ξ) + Я, т._е. G_= (0 + Я. Последняя сумма прямая, так как, если h € (ξ) О Я, то /ι G (ξ) Π Я = 0. Следовательно, /ι G (α) и при условии h Φ 0 имеем: ord Λ = ρ и (a) = = (Λ) ζ (0> чт0 невозможно. D Отсюда очевидной индукцией по порядку группы выводится 308
Л е м м а 3. Любая конечная абелева р-группа либо является циклической, либо раскладывается в прямую сумму циклических подгрупп. Теперь доказательство теоремы 1 завершается следующим образом. По теореме 33.XI конечная абелева группа G есть сумма своих силов- ских подгрупп, к каждой из которых применима лемма 3. D Определение!.. Разложение (1), в котором слагаемые упорядочены так, что {Рг > P,+ l) & ((Ρ, = Рг+l) => (*, > Λ,+ι)), % € TJ=1, (2) назовем каноническим разложением конечной абелевой группы G, а вектор (pj1,... ,Ptl) — типом этого разложения. Из примера 18.XI и утверждения 8.XI следует, что существование разложения (1) равносильно тому, что существует изоморфизм: G^ZpbX ®...®Zpkt, (3) который мы также будем называть каноническим разложением группы G. Π ρ и м е ρ 1. Пусть G = Zi2 Θ Ζ18. Так как Z12 = 4Zi2 + 3Z12 = = Z3 0 Z4, Zis = 2Zi8 4- 9Zi8 = Z9 0 Z2, то каноническое разложение (З) группы G имеет вид: G^z90Z3ez4ez2, (4) а ее каноническое разложение в прямую сумму подгрупп можно выписать следующим образом: G =((0,2)) + ((4,0)) + ((3,0)) + ((0,9)). Заметим, что группа G имеет несколько различных канонических разложений. Читателю предлагается проверить, что каноническим для G является также, например, разложение: G= ((4,2)) + ((4,6)) + ((3,9)) + ((0,9)). § 2. Тип конечной абелевой группы Хотя конечная абелева группа может иметь много различных канонических разложений, — все они, тем не менее, имеют одинаковые числовые характеристики. 309
Τ е о р е м а 2. Любые два различных канонических разложения конечной абелевой группы G имеют равные типы, D Суть доказательства состоит в том, что параметры произвольного канонического разложения группы G однозначно выражаются через параметры этой группы, не зависящие от выбора канонического разложения. а) Рассмотрим сначала случай, когда G есть р-группа. Пусть exp G = = рк. Тогда любое каноническое разложение G имеет вид: G = (€i) + ... + <€*), ord&=p\ k = k1>k2>-->kt. (5) Для любого s e No положим paG = {pag: g € G}. Очевидно paG — подгруппа группы G, и параметр \p3G\ не зависит от разложения (5). Пусть г = r(s) — количество показателей кг в (5), строго больших, чем s: к\ > ... > kr > s > /cr+i > ... > kt. (6) Л е м м а 4. Если г = r(s) = О (га. е. s > k\), mopaG = 0. Если г > 0, то группа paG имеет каноническое разложение: PaG = (рЪ) +... + (рЧг), ordp^z = Ph*-\ i e T77. (7) D Произвольный элемент g € G имеет вид g = Ci& + ... 4- ct&. Отсюдаpag = ci(p*£i) +... + ct(p*&), и, так как ρ*ξι = 0 для г € г + Ι,ί, то р*р = 0, если 5 > к\у а в случае s < к\, элемент pag принадлежит подгруппе Я = (р'&) + ... + (рЧг), т. е. psG С Я. Обратное включение очевидно. Остается заметить, что выписанное разложение для Я = paG есть прямая сумма ввиду (5). D Из (7) следует равенство: logp \psG\ = ki+... + кф) - sr(s) для s € 0,/ci-l. (8) Пусть m(s) — количество слагаемых порядка pa в разложении (5). Очевидно тип разложения (5) однозначно определяется набором чисел т(1),..., т(к). Остается показать, что эти числа однозначно определяются порядками |G|, |pG|,..., \ph~lG\. Ясно, что m(s) = r(s - 1) - r(s) для s € l,fc. Из (8) имеем bgp Ip'^GI =*!+... + fcr(3) + krM+i + . . . + fcr(#-i) - (5 - 1)ф - 1). 310
Отсюда, ввиду равенств &г(«)+1 = ... = кф-ц = s, имеем logp |p4-xG| = А1 + ... + fcr(i) + e(r(e - 1) - φ)) - (β - 1)φ - 1) = = fci + ... + /гг(з) - sr(s) + r(s - 1). (9) Отсюда logp \pa~1G\ - logp \p'G\ = r(e - 1), s € ΪΛ и окончательно m(s) = logp Ip-1^ + logp |p'+1G| - 2 logp |p'G|, s € ТД (10) б) Пусть теперь G — произвольная конечная абелева группа, и ее порядок η имеет каноническое разложение η = q™1 ·... · q™1. Тогда по теореме 33.XI G{q™L) = G^ — единственная силовская ^-подгруппа группы G, и G = G(^) + ... + G(^). Произвольное каноническое разложение (1) группы G можно более детально записать в виде: G = (ξη) + ... + (бе,> + (Ы + · · · + <6θ, (υ) где ord&3 = q^\ г € lyr, s € TJI; t\ + ... + tr = t; qi > ... > qr, кг\ > ... > klt% для г € T7r. Здесь q\... qr — все различные простые числа из совокупности р\,..., pt в (1). Из (11) ясно, что » = 1К ι=1 Следовательно, кг\ + ... + fcltt = тг, и, независимо от выбора канонического разложения (11), сумма (ξι\) +... 4- (&tt) всех его примарных слагаемых, принадлежащих простому основанию qu есть подгруппа порядка q™\ т. е. единственная силовская ^-подгруппа G(q™') группы G. В пункте а) доказано, что тип канонического разложения G(<T) = &i>+ ··· + &*.> 311
однозначно определяется группой G^™4), т. е. группой G. Отсюда следует, что и тип всего разложения (11) определяется группой G однозначно. D Определение 2. Тип канонического разложения (1) конечной абелевой группы G будем называть типом группы G и обозначать typG=(p£v..,ph. § 3. Перечисление конечных абелевых групп Совокупность всех абелевых групп разбивается отношением изоморфизма на непересекающиеся классы изоморфных групп. Очевидно, для каждого η G N существует лишь конечное число Т(п) различных классов изоморфных абелевых групп порядка п. Явной формулы для вычисления Т(п) не найдено, однако полученные выше результаты позволяют подсчитать Т(п) в каждом конкретном случае. ТеоремаЗ. Конечные абелевы группы G и Η изоморфны тогда и только тогда, когда typ G = typ Я. D Пусть G имеет каноническое разложение (1) и φ: G —* Я — изоморфизм. Тогда Я имеет разложение Η = (φ(ξι))+... + (φ(ξι)), и, так как οτάφ(ξι) = ord&, то последнее есть каноническое разложение Я, и typ Я = typG. Наоборот, если typ Я = typG, то Я ^ Ζ kl Θ ... Θ Ζ kt ^ G. D Таким образом, Т(п) есть число возможных типов абелевых групп порядка п. С использованием описания (1) канонического разложения абелевой группы получаем следующий результат. Теорема 4. Если η = q™1 ·... · q™r — каноническое разложение числа п, то число Т(п) различных классов изоморфных абелевых групп порядка η равно числу различных наборов (q^11,..., qx Hl, q221,..., qrrtr) таких, что тг = кг1+... + кг1г, *»!>...> kltl > 0, г € Т~г. (12) 312
Определение 3. Представление натурального числа га в виде суммы набора невозрастающих натуральных чисел назовем разбиением числа га. Через R(m) обозначим число различных разбиений га. Следствие1. В обозначениях теоремы 4 число Т(п) не зависит от простых делителей ?1» · · · »4г и удовлетворяет соотношениям: Т(п) = Г(«Г) ·... · T(q?*) = R(mi) ·... · R(mr). Π ρ и м е ρ 2. Пусть m = 36 = З2 · 22. Тогда Т(га) = Т(36) = = Д(2) · Д(2), и, так как Д(2) = 2 (возможные разбиения: 2 = 2 и 2 = 1 + 1), то Т(36) = 4, т. е. число классов изоморфных абелевых групп порядка 36 равно 4. Любая абелева группа порядка 36 изоморфна единственной из групп: d =Ζ9ΘΖ4^Ζ36, G2 = Z3®Z3®Z4, G3 = Z9®Z2®Z2, G4 = Z3®Z3®Z2®Z2, typG = (32,22); typG=(3,3,22); typG = (32,2,2); typG = (3,3,2,2). Как уже отмечалось, явных формул для вычисления числа R(m) не найдено. Методами теории функций комплексного переменного можно получить следующее асимптотическое равенство для R(m). При га —* оо: Я(га) - —?-=е"^ (f(n) ~ g(n) означает, что lim -7—7 = 1)· п-*оо д(п) Полезно заметить, что для любого простого ρ среди абелевых групп порядка ρη, η € N всегда содержится циклическая группа порядка рп, т. е. группа типа (рп), и группа экспоненты р, т. е. группа типа (р,..., р), называемая элементарной р-группой. 313
§ 4. Характеры конечных абелевых групп Определение 4. Характером конечной абелевой группы называется любой гомоморфизм группы G в мультипликативную группу С* поля комплексных чисел. Любая группа G имеет тривиальный характер, отображающий все элементы группы G в число 1 G С. Иногда этот характер называют также главным. Для описания всех характеров группы (G; ·) мы воспользуемся следующим из теоремы 1 фактом о возможности разложения любой конечной абелевой группы в прямое произведение циклических подгрупп. Пусть G = Gi χ G2 x ... х Gm (13) — одно из таких разложений, |GZ| = пг иС, = (дг),г = 1,га. Если φ — гомоморфизм группы G в С*, то ограничение φ% = φ \ Gt есть гоморфизм φι: Gz —* С*. Наоборот, если задан набор гомоморфизмов φ%\ G% —* С*,г = 1,т, то по нему естественным образом определяется гомоморфизм φ группы G в С* такой, что φχ = φ \ Gt: для элемента д G G вида д = h\ ·Λ2 ·... -Лт> где ht G Gz,i = 1,га, полагаем <Р(д) = ^ΐ(Λΐ) · Ψ2^2) · ·. · · ψτηΦτη)- При этом различным наборам гомоморфизмов групп G% будут соответствовать, очевидно, различные гомоморфизмы группы G. Таким образом, для описания всех характеров группы G достаточно описать все характеры циклических групп Gt. Если <рг — гомоморфизм G% в С*, то <Рг(дг)П*=<Рг(д?) = <Рг(е) = 1, поскольку д*1 = е — единица группы Gz. Следовательно, <рг(дг) есть корень пг-й степени из 1 в С. Обратно, если ε — некоторый корень пг-й степени из 1 в С, то равенства Ψ,(9Ϊ)=ε", (14) 314
к = О, пг — 1, задают гомоморфизм группы Gt в С*. Следовательно, существует ровно пг различных гомоморфизмов С,вС*,и каждый из них определяется выбором корня ε из группы ГПг всех корней пг-й степени из 1 в С. Из (14) видно также, что все они являются гомоморфизмами в группу ГП4. В итоге доказана Теорема 5. Пусть G — абелева группа порядка п, и (13) — любое ее разложение в прямое произведение циклических подгрупп. Тогда G имеет ровно η различных характеров, каждый характер χ определяется набором (£ь£2,...,£т), где £г — корень пг-й степени из 1 в С, г = 1,т, и задается равенствами: Χ(9Ϊ1-9Ϊ2----9%-) = εϊεϊ2----&, (15) кг € 0,пг - 1,г е 1,т. Множество всех характеров группы G обозначим через G (или через Char(G)). Выберем теперь в каждой из групп ГПг один первообразный корень ωχ,ϊ — 1,га. Тогда каждый из корней ег из (15) можно будет записать в виде εг = ω\%, где U е 0,пг - 1. В итоге набор (ει,ε2, ...,ет) однозначно определяется набором целых чисел (ίι,ί2ι··· >£m)> где tt G € Ο,η» — 1, ΐ € l,m. Соответствующий этому набору характер обозначим через Xttit2 tm- Равенство (15) теперь примет вид: (т \ т Ш*' =IRfc* г=1 / г=1 Так как каждый элемент группы G однозначно представляется в виде д[г · д% -... · g\£>t% G 0, пг - 1, г = 1,т, то в итоге мы имеем биективное отображение σ группы G на множество G всех ее комплексных характеров: <>{9Ϊ-922·--9%) = Χημ tm- (16) В связи с этим характеры естественно проиндексировать не наборами целых чисел, а элементами группы G, обозначив 315
где д = д[г · д^2 ·... · fl^"· Тогда равенство (15) можно записать в следующем виде: (т \ т а равенство (16) в виде а(д) = χ9, д € G. На множестве G всех характеров группы G можно определить операцию умножения, положив для φ, φ G G и g G G: (<Р"Ф)(9) = <Р(д)-Ф(9)- Так как G — абелева группа, то φ · г/> также является гомоморфизмом группы G в С*. В итоге мы имеем группоид (G, ·). Из равенства (17) сразу следует, что биекция σ является изоморфизмом группы G на группоид G, и, значит, G тоже группа. В итоге доказана Теорема 6. Характеры конечной абелевой группы G образуют группу G относительно операции умножения характеров, и эта группа изоморфна группе G. Учитывая, что G — группа, определим порядок характера χ группы G как порядок элемента в группе G. Характер χβ порядка 1, т. е. равный тождественно единице, является единицей группы G. Определение 5. Пусть χ е G. Отображение χ: G -+ С*, определенное по правилу х(д) = χ(#), где х(д) — число, сопряженное с х(д) в С, называется характером, сопряженным с χ. Нетрудно заметить, что определение сопряженного характера корректно (χ действительно лежит в G). Более того, так как значения характеров являются в С корнями из 1, а число, обратное к корню из единицы, совпадает с сопряженным к исходному, то характер χ""1, обратный к χ в группе G, совпадает с χ. Непосредственно из (17) следует Теорема 7. При указанной выше нумерации характеров группы G элементами из G имеет место соотношение двойственности для характеров: Va,6eG:Xe(b) = Xb(a). (18) Следствие. Если a,b€ G, то найдется такой характер χ € G, что χ(α) ф х(Ь). 316
Действительно, в противном случае мы бы имели хс(а) = xc(b), или, в силу (18), Ха(с) = хь(с) для всех с € G, т. е. χα = Хъ, что противоречит условию а Ф b. Приведем еще ряд менее очевидных свойств характеров. Теорема 8. Для любых двух характеров χα, Хь группы G выполняются равенства: ^X°(c)Xb(c) = \G\Sa,b, (19) ]>>c(a)xc(t) = |<7|<ie,b, (20) где ab = \o, если а = b — символ Кронекера. если афЬ Равенства (19) и (20) называются соответственно первым и вторым соотношениями ортогональности для характеров группы G. D В силу соотношения (18) доказать достаточно лишь одно из равенств (19), (20). Докажем (19). При а = Ь равенство (19) выполняется, поскольку для любого се G Xa(c)-Xa(c) = |Xa(c)|2 = l. τη m τη _________ Пусть афЬ,а = Ц g[\b = fl 0*'>с = Π 0г > ГДе *t,«i,*i € 0,nf - 1. ι=1 г=1 t=l Тогда, используя равенство (17) и соотношение ха(с) = Ха(с)"1, получим: с€<7 fci, ,fcm ι=1 г=1 —st fct m m /nt —1 \ fcl, Лт t=l t=l \fct=0 / где rt = t, — s„ i G 1, m. Так как α φ b, το найдется такое j G 1, m, что tj Φ Sj. Тогда Г; φ O(modnj), и потому u£J φ 1. Значит, 317
•ν;1 r.fe u>T>k>-\ и равенство (19) верно. D Из (19), (20) при Ь = е получаем Следствие. Для любого а € G выполняются равенства Σχα{ο) = ς χ«(α) = ι°ι ·*«.·· § 5. Характеры конечных полей и суммы Гаусса Определение 6. Пусть GF(q) — конечное поле порядка q. Характеры его мультипликативной группы GF{q)* и аддитивной группы (GF(q)y+) называются соответственно мультипликативными и аддитивными характерами поля GF{q). Соответствующие группы характеров поля GF(q) обозначим через GF{qY и GF{q). Условимся обозначать мультипликативные и аддитивные характеры поля GF(q) соответственно буквами χ и φ с индексами. Так как группа GF(q)* — циклическая порядка q — 1, то в силу теоремы 6 группа GF(q)* — циклическая порядка q — 1. Поэтому все мультипликативные характеры поля GF(q) имеют своими порядками делители числа q — 1, и для каждого делителя d числа q — 1 существует φ(ά) характеров порядка d. Группа (GF(<?),+) является элементарной абелевой р-группой, где ρ = charGF(g), и, значит, все нетривиальные аддитивные характеры поля GF(q) имеют порядок р. Установим связи между мультипликативными и аддитивными характерами поля GF(q). Для этого нам понадобятся так называемые тригонометрические суммы Гаусса. Определение?. Суммой Гаусса для мультипликативного характера χ и аддитивного характера ф поля GF(q) называется комплексное число G(x, ф) = £ χ(χ) · ψ(χ). xeGF(q)m 318
Аддитивные характеры поля GF(q) тоже можно занумеровать элементами из GF{q). Если\/ = pw, то имеет место изоморфизм i:(GF(9);+)-»(Zpr, и каждому элементу а € (GF(q), -f) однозначно ставится в соответствие вектор δ(α) = (ai,a2,...,am), где аг е 0,р — 1. Выберем в С* первообразный корень степени ρ из единицы ω = е2пг^р и обозначим через ψα характер, определенный равенством V>a(s)=u;aiXl+ +α'"*"\ где (xi,...,#m) = δ (χ). Β частности для простого поля GF(q) (когда q = ρ) ψα(χ) = ωα'χ. В этом случае сумма Гаусса G(x, ψ) обозначается также символом G(x,a) и определяется равенством G(*,a)= Σ χ(*)·αΛ*. :r€GF(g)* Кроме того, в этом случае G(x,e) обозначают через G(x). Теперь можно сформулировать теорему о соотношениях между характерами из GF(q)* и GF{g). Теорема 9. Пусть χ и ψ соответственно мультипликативный и аддитивный характеры поля GF(q). Тогда для любого a G GF(q)* выполняются соотношения: X(a) = j Σ G(xrfb)-M*)> (21) *(<*) = ГГ7 Σ G(xb^).Xb(a). (22) 9 beGF{q)* D Формулы (21), (22) доказываются непосредственным вычислением их правых частей с использованием опреления 7 и второго соотношения ортогональности для аддитивных и мультипликативных характеров поля GF(q). О В связи с теоремой 9, а также в связи с другими приложениями сумм Гаусса, представляет интерес задача вычисления их значений. Частичное решение этой задачи содержит следующая теорема о свойствах сумм Гаусса. 319
Τ е о р е м а 10. Для любых χ G GF(q)* и ψ G GF(q) выполняются соотношения: (q - 1, если χ = χε, Ψ = *0ο> a) G(x, φ) = < -1, если χ = χβ, </> ^ </>ο> [θ, еслихфхе, ψ = ψο, б) G(x,ψ) · G(x,ψ) = ς, если χφχ€,ψφ ψ0, в) |G(x,^)l = у/Я, если χφχ^ψφ fa. D Равенства утверждения а) следуют непосредственно из определений и следствия теоремы 8. Равенство в) следует из б). Проверим равенство б): С(х,ф) GUA) = Ι Σ х(«)чК«)|-( Σ X(b)i>(b)) = \aeGF(q)· J \beGF(q)· J = Ε хШ(Ь)-ф(аЩЬ) = a,beGF(q)m = Ε X(ab_1)-tA(a-6). a,beGF(q)* Сгруппируем слагаемые по параметру d = a · Ь"1. Получим (прибавляя и вычитая -0(0)): G(x,V»-G(x,tf)= £ X(d). £ ф(Ь-(а-е))-ф(0) deGF(q)* \beGF(q) Заметим, что при d Φ е элемент Ь · (d — е) пробегает вместе с 6 все поле GF(q)y и в этом случае согласно следствию к теореме 8: J2 ф(Ь-(а-е))=0. beGF(q) Если же d = е, то £ г/>(6 · (d - е)) = q. Отсюда beGF{q) G(x,tf).Gfr^) = J] X(rf). (-i) + (,-i). ^GF(g)'\{e} 320
Учитывая следствие теоремы 8 для характера χ, получаем равенство б). D Задачи 1. Опишите все конечные абелевы группы, в которых любая собственная подгруппа — циклическая. 2. Пусть G — конечная абелева группа с каноническим разложением (11). Докажите, что минимальная мощность системы образующих группы G есть p(G) = max{£i,..., tr). 3. Назовем два канонических разложения абелевой группы G (в прямую сумму подгрупп) эквивалентными, если они различаются лишь перестановкой слагаемых. Опишите все классы эквивалентных канонических разложений для групп Ζ2 Θ Ζ2, Ζ3 Θ Ζ3, Ζβ θ Ζ2, Ζρ Θ Ζρ (ρ — простое). Докажите, что любые два канонических разложения группы G эквивалентны тогда и только тогда, когда G — циклическая группа. 4. При каких условиях на η € N существует ровно к классов изоморфных абелевых групп порядка п, к G {1,2,3,4}? 5. Пусть N(n, га) число классов изоморфных абелевых групп порядка η с экспонентой га. Докажите, что: а) N(n, га) > О тогда и только тогда, когда т\п и каждый простой делитель ρ числа η делит га; б) N(n, га) = 1 тогда и только тогда, когда выполняются условия пункта а), и для каждого простого , делящего п, либо р2 не делит га либо р2 не делит ~. 6. Пусть G — абелева группа порядка п, и для каждого г € 1,5 выполняются соотношения Π»ι = П»2 = · · · = Щк. > Пгкг+х > · · · > ™itt· Докажите, что expG = га = р"11 · р£21 · ··· 'Р?в1> и число элементов порядка га в группе G равно η (1 - f jM )·...· ί 1 — ί jM 1. 7. Составить таблицу характеров группы Ζβ. 321
УКАЗАТЕЛЬ ИМЕН Абель Н. X. — 7, 47, 239 Адамар Ж. — 77 Архимед — 25, 66 Безу Э. — 179, 180, 188, 191, 196 Бернсайд У. — 239, 262, 268, 269, 296, 306 Бине Ш. Φ. Μ. — 135 Балле Пуссен Ш. Ж. — 77 Вандермонд А. Т. — 135, 180 Виет Ф. — 5, 211 Вилес А. — 6 Вильсон Д. —101 Виноградов И. М. — 78 Галуа Э. — 7, 57, 239, 294 Гаусс К. Ф. — 5, 6, 160, 161,168, 195, 197, 302, 318, 319 Гольдбах X. — 78 Граве Д. А. — 8 Дедекинд Р. — 24 Декарт Р. — 5 Диксон А. Л. — 296 Дирихле П. Г. — 77 Евклид — 68, 69, 70, 76, 77, 99 Жордан К. М. Э. — 239, 295, 296 Кантор Г. — 9 Капелли А.— 161, 168 Кардано Д. — 6 Клейн Ф. X. — 7,239,285,294,303 Коши О. Л. — 135, 280, 297, 298 Крамер Г — 156, 159, 163 Кронекер Л.—134,161,168,200,317 Кэли А. — 45, 46, 56, 57, 58, 239, 263, 264, 279 Лагранж Ж. Л. — 5,181,239,249, 251, 252, 258, 259, 268, 276, 296, 297, 298, 302 Лаплас П. С. — 119, 123, 131 Лежандр А. М. — 76, 77 Ли С. М. — 239 Лобачевский Н. И. — 8 Мерсенн М. — 78 Молин Ф. Э. — 8 Муавр А. — 83, 84, 85 Мухаммед ал-Хорезми — 5 Ньютон И. — 5, 6, 35 Пеано Д. — 24 Руффини П. — 6, 7, 239 Силов П. Л. — 297, 298, 299, 306 Тарталья Н. — 6 Томпсон Дж. — 296 Федоров Е. С. — 7 Фейт У. — 296 Ферма П. — 5, 6, 76, 78, 95, 96 Феррари Л. — 6 Чебышев П. Л. — 8, 76, 77 Шмидт О. Ю. — 8, 239 Штейниц Э. —195 Эйзенштейн Ф. Г. М. — 199, 216 Эйлер Л. — 8, 76, 77, 78, 94, 96, 254, 302 322
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Автоморфизм группоида 64 Аксиома Архимеда 25 — полной математической индукции 24 Алгебра 44 Алгебраическая структура 44 Алгоритм Евклида 69, 184 Аргумент комплексного числа 82 Базис пространства векторов 152 — системы векторов 147 Вложение групповдаизоморфное227 Выражаемость линейная вектора через систему векторов 145 Гаусса сумма 318 Гомоморфизм группоида 221 — естественный 225 График функции 13 Группа 47 — абелева 47, 307 — движений многогранника 266 — диэдра 269 — знакопеременная 276, 277 — Клейна 285 — коммутативная (абелева) 47 — конечная 242 — конечно порожденная 246 — корней л-ой степени из 1 84 — неразложимая 259 — подстановок 262 знакопеременная 276 интразитивная 267 симметрическая 49 транзитивная 267 — полная аффинная 265 линейная 265 — кольца аддитивная 52 мультипликативная 54 — примарная (р-группа) 259 — простая 293 — разложимая 259 — специальная линейная 295 проективная 296 — циклическая 246 Группоид 45 — коммутативный 46 — конечнопорожденный220 Декремент подстановки 276 Делимость многочленов слева (справа) 175 с остатком 176 Делимость целых чисел 65 — целых чисел с остатком 66 Делитель инвариантный целочисленной матрицы 130 — многочлена собственный 188 неприводимый 190 — нуля 56 — общий наибольший (НОД) многочленов 183 (НОД) целых чисел 67 — элемента кольца 175 несобственный 55 Дефект преобразования 231 Дискриминант многочлена 217 Длина цикла в подстановке 270 Дополнение алгебраическое минора 119 элемента матрицы 122 Запись многочлена каноническая 201, 203 Значение многочлена в точке 179, 207 323
— операции на множестве 41 Изоморфизм алгебр 62 — группоидов 58 Инверсия 36 Индекс подгруппы 251 Каноническая запись многочлена 201 Каноническое разложение абелевой группы 309 Класс вычетов 92 — смежный правый (левый) 250 Кольцо 57 — вычетов 96 — классов вычетов 93 — коммутативное 52 — многочленов 174, 200, 201 — с единицей 52 — симметрических многочленов 211 — с нулевым умножением 52 Комбинация матриц линейная 104 Коммутант группы 305 Коммутатор элементов 305 Композиция отображений 14 Компонента многочлена примарная 190 Конгруэнция на группоиде 225 Конгруэнция на полугруппе 225 Корень многочлена 179 кратный 191 простой 191 — примитивный (первообразный) w-ой степени из 186 Коэффициент многочлена 770, 772,203 — биномиальный 35 Кратное общее наименьшее (НОК) многочленов 186 (НОК) целых чисел 73 Кратность корня многочлена 797 — неприводимого делителя многочлена 790 Кронекера символ 317 Лемма Бернсайда 268 — Гаусса 797 — Коши 297 Матрица 702 — верхнетреугольная 703 — взаимная к данной 124 — вырожденная 73S — диагональная 703 — единичная 703 — инциденций бинарного отношения 234 — каноническая над кольцом целых чисел 725 над полем 141 — квадратная 703 — невырожденная 73S — нижнетреугольная 703 — нулевая 703 — обратимая 723 — системы линейных уравнений основная 757 расширенная 75S — скалярная 703 — ступенчатая 739 специальная 142 — транспонированная к заданной 104 — элементарная 725 Матрицы эквивалентные 725 — строчно эквивалентные 727 Метод Гаусса решения системы линейных уравнений 760 Минор матрицы 777 324
дополнительный к данному 119 Многочлен 770, 172 — инвариантный относительно подстановки 210 — неприводимый 188 — от одного переменного 172 — от двух переменных 201 нескольких переменных 202 — приводимый 755 — примитивный над кольцом целых чисел 796 — симметрический 277 элементарный 277 — унитарный 7S2 Многочлены взаимно простые над полем 186 Множества бесконечные 16 — конечные 75 — непересекающиеся 77 — равномощные 15 Множество частично упорядоченное 32 Множители инвариантные 737 Модуль комплексного числа 82 Мономорфизм группоида 227 Мощность конечного множества 16 Набор элементов 72 Нормализатор 267 Нормальный делитель группы 285 Область транзитивности 267 — целостности 56 Объединение матриц 235 — множеств 77 Одночлен 203 — старший 272 Одночлены подобные 272 Операция ассоциативная 42 — бинарная 7, 41 — коммутативная 43 — лево (право) дистрибутивная относительно другой операции 44 — парная 7 — унарная 7 Определитель Вандермонда 135 — матрицы 709 Орбита элемента 268 Остаток от деления многочленов правый (левый) 776 целых чисел 66 Отношение бинарное 30 — антисимметричное 30 — рефлексивное 30 — симметричное 30 — сопряженности 260 — сравнимости по подгруппе 249 — транзитивное 30 — частичного порядка 32 — эквивалентности 30 — G-эквивалентности 267 — л-арное 30 Отображение 72 — биективное (взаимно однозначное) 13 — инъективное 13 — кольца полиномиальное 180 — обратимое 15 — обратное к заданному 75 — сюръективное 13 — множеств 72 Перестановка 32 — нечетная 36 — четная 36 Пересечение множеств 11 Подгруппа 244 — кручения 245 — нормальная 285 325
— порожденная подмножеством 246 — примарная (р-подгруппа) 296 — силовская 297 — собственная 244 — циклическая 246 Подгруппоид 46 — порожденный подмножеством 219 Подкольцо 57 — инвариантов 210 Подматрица матрицы 117 ранговая 138 Подмножество, замкнутое относительно операции 46 Подполе 57 Подполугруппа 219 — порожденная подмножеством 220 Подпространство арифметического пространства 152 Подсистема линейно независимая максимальная 147 Подстановка аффинная 265 — линейная 265 — множества 262 — нечетная 275, 276 — четная 2759 276 Подстановки независимые 270 Поле 56 — алгебраические замкнутое 195 — вычетов 94 — Галуа 57 — комплексных чисел 80 — разложения многочлена 193 — числовое 78, 79 Полугруппа 47 — бинарных отношений 233 — конечно порожденная 220 — преобразований множества 230 — симметрическая 231 — циклическая 220 Порядок группы 242 — элемента группы 241 Представление группы левое (правое) регулярное 264 подстановочное 264 точное 264 — определителя каноническое 109 Преобразование матрицы элементарное 124 Принцип наименьшего числа 25 Произведение групп прямое (внешнее) 253 — матриц 104 логическое 235 — многочленов 770 — множеств декартово 11 — отношений 42 — отображений 14 — подгрупп прямое 256 — подмножеств группы 254 Производная многочлена 192 Пространство арифметическое и-мерное 137 Разбиение множества 12 индуцированное отношением эквивалентности 31 Разложение группы на классы сопряженных элементов 260 на смежные классы по подгруппе 250 многочлена 190 целого числа 75 — определителя по строке (столбцу) 122 326
— подстановки на независимые циклы 273 Размерность подпространства арифметического пространства 153 Размещение 32 Разность множеств 77 Ранг матрицы 138 — преобразования 231 — системы векторов 757 Решение системы линейных уравнений 757 общее 766 — сравнения 97 Символ Кронекера 134 Система векторов линейно зависимая 145 независимая 145 — линейных однородных уравнений 163 ассоциированная с данной 164 уравнений 756 неопределенная 757 несовместная 757 определенная 757 совместная 757 — образующих элементов группоида 219 — решений фундаментальная (ФСР) 765 — свободных неизвестных системы уравнений 763 — элементов 12 Системы векторов эквивалентные 755 — уравнений равносильные 757 Следствие системы уравнений 767 Соотношение линейное для системы векторов 144 тривиальное (нетривиальное) для системы векторов 144 Сочетание 32 Сравнение целых чисел по модулю 89 Сравнения равносильные 97 Стабилизатор элемента 268 Старший член многочлена 772, 272 Степень многочлена 772, 205 — одночлена 205 Структура алгебраическая 44 — цикловая подстановки 274 Сумма групп прямая (внешняя) 255 — матриц 103 — многочленов 770, 207 — подгрупп прямая 257, 258 — подмножеств группы 255 Таблица Кэли 45 Теорема алгебры основная 795 — арифметики основная 74 — Безу 779 — Бернсайда 296 — Виета 277 — Вильсона 707 — Гаусса 795 — Жордана—Диксона 296 — Крамера 759 — Кронекера—Капелли 767 — Кэли 263 — Лагранжа 257 — Лапласа 779 — об изоморфизме групп первая 297 вторая 292 327
остатках китайская 700 эпиморфизме групп 289 группоидов 226 полугрупп 228 — о декременте 276 — о ранге матрицы 151 — Силова первая 297 вторая 299 третья 299 — Фейта—Томпсона 296 — Ферма большая 6 — Ферма малая 95 — Штейница 195 — Эйзенштейна 199 — Эйлера 302 — Эйлера—Ферма 96 Тип конечной абелевой группы 309, 312 Транспозиция 275 — в перестановке 36 Упорядочение одночленов лексикографическое 221 Уравнение алгебраическое 5 — Коши 280 Характер конечной абелевой группы 314 — главный 314 — сопряженный с X 316 — тривиальный 314 Характер поля аддитивный 318 — мультипликативный 318 Факторгруппа 288 Факторгруппоид 225 Факторизация множества 224 Фактормножество 224 Факторполугруппа 225 Форма 206 — каноническая матрицы над кольцом целых чисел 131 над полем 141 — квадратичная 206 — кубическая 206 — линейная 206 — тригонометрическая комплексного числа 82 Формула Бине—Коши 135 — бинома Ньютона 35 — включения-исключения 28 — Лагранжа интерполяционная 181 — Муавра 83 Формулы Крамера 159 Функция аффинная 156 — линейная 156 — полиномиальная 180, 207 — четности перестановки 38 — Эйлера 94 Центр группы 244 Цикл в группе подстановок 270 — единичный 273 Частное неполное от деления чисел 66 правое от деления многочленов 176 Числа взаимно простые 71 — сравнимые по модулю 89 Число комплексное 80 — простое 26, 74 — сопряженное к комплексному числу 81 — составное 26, 74 Эквивалентность матриц 125 строчная 127 Экспонента группы 243 Элемент группоида нейтральный 46 правый (левый) 240 — кольца обратимый 54 — нильпотентный 101 328
кратный данному 55 — обратный правый 240 — подстановки мобильный 269 неподвижный 269 — симметричный к данному 46 Элементарная /?-группа 313 Элементы группы, сравнимые по подгруппе 249 — G-эквивалентные 267 — кольца ассоциированные 182 перестановочные 43 — сопряженные в группе 260 Эпиморфизм группоида 221 — канонический (естественный) групп 287 Ядро гомоморфизма групп 288 329
ЛИТЕРАТУРА УЧЕБНАЯ а) Учебники и учебные пособия 1. Алексеев В. Б. Теорема Абеля в задачах и решениях.—М: МЦМНО, 2001. 2. Бухштаб А. А. Теория чисел. — М: Просвещение, 1966. 3. Винберг Э. Б. Курс алгебры. Изд. 3. — М: Фактория, 2002. 4. Виноградов И. М. Основы теории чисел. — М: Наука, 1965. 5. Воеводин В. В. Линейная алгебра. — М.: Наука, 1980. 6. Елизаров В. /7., Нечаев А. А. Высшая алгебра, чч. I, III. — М: 1976; чч. И, IV. — М: 1977. 7. Ильин В. А.9 Лозняк Э. Г. Линейная алгебра. — М: Наука, 1984. 8. Калужнин Л А. Введение в общую алгебру. — М: Наука, 1973. 9. Кострикин А. И. Введение в алгебру. — М: Наука, 1977. 10. Кострикин А. И. Введение в алгебру, чч. НИ — М: Гос. изд-во физ.-мат. литературы, 2000; 2002. 11. Кострикин А. И.9 Манин Ю. К Линейная алгебра и геометрия. — М.: Наука, 1986. 12. Куликов Л. Я. Алгебра и теория чисел. — М.: Высшая школа, 1979. 13. Курош А. Г. Курс высшей алгебры. — М.: Наука, 1965. 14. Лидл Р., Пильц Г. Прикладная абстрактная алгебра. — Екатеринбург: Изд-во Уральского ун-та, 1996. 15. Ляпин Е. С, Евсеев А. Е. Алгебра и теория чисел, чч. I, II. — М: Просвещение, 1974; 1978. 16. Мальцев А. И. Основы линейной алгебры. — М: ГИ ТТЛ, 1956. 17. Окунев Л. Я Высшая алгебра. — М.: Просвещение, 1966. 18. Скорняков Л. А. Элементы алгебры. — М: Наука, 1980. 19. Скорняков Л. А. Элементы общей алгебры. — М: Наука, 1983. 20. Узкое А. К Группы и теория Галуа. — М, 1971. 21. Узкое А. К Поля. — М., 1969. 22. Фаддеев Д. К Лекции по алгебре. — М.: Наука, 1984. 23. Шафаревич К Р. Основные понятия алгебры. — М; Ижевск: R&C «Dynamics», 2001. 330
б) Сборники задач 1. Икрамов X. Д. Сборник задач по линейной алгебре. — М: Наука, 1975. 2. Ляпин Е. С, Айзенштат А. Я.9 Лесохин Μ. Μ Упражнения по теории групп. — М.: Наука, 1967. 3. Проскуряков 77. В. Сборник задач по линейной алгебре. — М: Наука, 1974. 4. Сборник задач по алгебре /Под ред. А. И. Кострикина. — М: Наука, 1987. 5. Фаддеев Д. К9 Соминский 77. С. Сборник задач по высшей алгебре. — М: Наука, 1977. ЛИТЕРАТУРА НАУЧНАЯ 1. Биркгоф77, Барти Т. Современная прикладная алгебра. — М: Мир, 1976. 2. Ван-дер-Варден Б. Л. Алгебра. — М: Наука, 1976. 3. Горенстейн Д. Конечные простые группы. Введение в их классификацию. —М: Мир, 1985. 4. Елизаров В. 77. Конечные кольца. — М.: 1993. 5. Каргополов М. 77., Мерзляков ТО. 77. Основы теории групп. — М.: Наука, 1972. 6. Клиффорд А.9 Престон 77 Алгебраическая теория полугрупп, тт. 1,2. —М.: Мир, 1972. 7. Кон Я. Универсальная алгебра. — М.: Мир, 1968. 8. Курош А. Г. Лекции по общей алгебре. — М.: Гос. изд-во физ.-мат. литературы, 1962. 9. Курош А. 77 Теория групп. — М.: Наука, 1944 (изд. 1-е), 1967 (изд. 3-е). 10. Кэртис Ч.9 Райнер 77. Теория представлений конечных групп и ассоциативных алгебр. — М.: Наука, 1969. 11. Ламбек 77. Кольца и модули. — М.: Мир, 1971. 12. Ленг С Алгебра. — М.: Мир, 1968. 331
13. Лидл Р., НидеррайтерГ. Конечные поля, тт. 1,2. — М: Мир, 1988. 14. Линдон R9UIynn И Комбинаторная теория групп. — М: Мир, 1980. 15. Ляпин Е. С. Полугруппы. — М.: Гос. изд-во физ.-мат. литературы, 1960. 16. Магнус В., Каррас А.9 Солитэр Д Комбинаторная теория групп. — М.: Наука, 1974. 17. Мальцев А. И. Алгебраические системы. — М.: Наука, 1970. 18. Ольшанский А. Ю. Геометрия определяющих соотношений в группах. — М.: Наука, 1989. 19. Плоткин Б. К Группы автоморфизмов алгебраических систем. — М.: Наука, 1966. 20. Погорелое Б. А. Основы теории групп подстановок. — М.: 1985. 21. Просолов В. В. Многочлены. — М.: МЦНМО, 1999. 21. Фукс Л. Бесконечные абелевы группы, тт. 1,2.— М.: Мир, 1974, 1977. 22. Холл М. Теория групп. — М.: ИЛ, 1962. 332
ОГЛАВЛЕНИЕ Предисловие 3 Глава I. Введение 5 § 1. Предмет алгебры 5 § 2. Первоначальные понятия и обозначения из теории множеств и математической логики 9 §3.0 математических утверждениях и методах их доказательства 20 Задачи 26 Глава П. Элементы комбинаторики 29 § 1. Отношения на множествах. Отношения эквивалентности и частичного порядка 29 § 2. Сочетания, размещения и перестановки элементов конечного множества 32 § 3. Перестановки и их классификация 36 Задачи 40 Глава III. Основные алгебраические структуры 41 § 1. Бинарные операции и их свойства 41 § 2. Алгебраические структуры с одной бинарной операцией 44 § 3. Кольца и поля 51 § 4. Изоморфизм множеств с операциями 57 Задачи 62 Глава IV. Числовые кольца и поля 65 § 1. Отношение делимости в кольце Z. Деление целых чисел с остатком 65 § 2. Наибольший общий делитель и наименьшее общее кратное целых чисел 67 § 3. Простые числа. Основная теорема арифметики 74 § 4. Числовые поля. Поле комплексных чисел 78 Задачи 87 Глава V. Кольца и поля вычетов 89 § 1. Сравнения целых чисел по модулю 89 § 2. Классы вычетов и операции над ними 92 333
§ 3. Решение сравнений 96 Задачи 101 Глава VI. Кольца матриц 102 § 1. Матрицы над кольцом и операции над ними 102 § 2. Определители матриц над коммутативным кольцом с единицей 108 § 3. Подматрицы матриц. Миноры и их алгебраические дополнения 117 § 4. Обратимые матрицы. Критерий обратимости 123 § 5. Элементарные преобразования матриц. Эквивалентные матрицы 124 § 6. Канонические матрицы над кольцом Ζ 128 Задачи 134 Глава VII. Матрицы над полем 137 § 1. Ранг матрицы 138 § 2. Каноническая форма матрицы 141 § 3. Линейная зависимость векторов. Базис и ранг системы векторов 143 § 4. Подпространства арифметических пространств 152 Задачи 154 Глава VIII. Системы линейных уравнений 156 § 1. Системы линейных уравнений над коммутативным кольцом с единицей. Равносильность систем уравнений. Теорема Крамера 156 § 2. Системы линейных уравнений над полем 160 § 3. Система линейных однородных уравнений 163 Задачи 167 Глава IX. Многочлены 169 § 1. Кольцо многочленов над кольцом с единицей 170 § 2. Делимость многочленов. Теорема о делении с остатком 175 § 3. Значение и корень многочлена. Теорема Безу. Многочлен как функция 179 § 4. Кольцо многочленов над полем. Наибольший общий делитель и наименьшее общее кратное 181 334
§ 5. Неприводимые многочлены над полем. Каноническое разложение многочлена 188 § 6. Корни многочленов над полем. Производная 191 § 7. Многочлены над числовыми полями 195 § 8. Кольцо многочленов от нескольких переменных.... 200 § 9. Инвариантные подкольца. Симметрические многочлены 209 Задачи 214 Глава X. Группоиды и полугруппы 218 § 1. Подгруппоиды и подполугруппы 218 § 2. Гомоморфизмы группоидов 221 § 3. Конгруэнции на группоидах и фактор- группоиды 224 § 4. Полугруппы преобразований 230 § 5. Полугруппы бинарных отношений 233 Задачи 236 Глава XI. Основы теории групп 239 § 1. Определяющие свойства групп 239 § 2. Порядки элементов и экспонента группы 241 § 3. Подгруппы. Подгруппа, порожденная подмножеством 244 § 4. Смежные классы. Теорема Лагранжа. Подгруппы циклической группы 249 § 5. Произведения групп и подгрупп. Разложение группы 252 § 6. Классы сопряженных элементов. Нормализаторы. Центр р-группы 260 § 7. Группы подстановок. Орбиты и стабилизаторы. Лемма Бернсайда 262 § 8. Цикловая структура и четность подстановки. Знакопеременная группа 269 § 9. Системы образующих симметрической и знакопеременной групп 277 § 10. Сопряженные элементы в симметрической группе. Уравнение Коши 280 335
§11. Гомоморфизмы групп и нормальные делители 284 § 12. Теоремы об изоморфизме 291 § 13. Простые группы 293 § 14. Силовские подгруппы 296 Задачи 300 Глава XII. Конечные абелевы группы 307 § 1. Каноническое разложение конечной абелевой группы 307 § 2. Тип конечной абелевой группы 309 § 3. Перечисление конечных абелевых групп 312 § 4. Характеры конечных абелевых групп 314 § 5. Характеры конечных полей и суммы Гаусса 318 Задачи 321 Указатель имен 322 Предметный указатель 323 Литература учебная 330 Литература научная 331 Учебное издание Михаил Михайлович Глухов, Виктор Павлович Елизаров, Александр Александрович Нечаев АЛГЕБРА. Т. I Под редакцией доктора физико-математических наук, профессора Б. А. Погорелова Рецензенты: д-р физ.-мат. наук, профессор В. Н. Латышев д-р физ.-мат. наук, ст. н. сотрудник В. М. Сидельников Заведующая редакцией Т. А. Денисова Корректор Е. Н. Клитина Компьютерная верстка Λ/. Λ/. Королевой, Н. М. Хусаинова Издательство «Гелиос АРВ». Издательская лицензия ЛР № 066255 от 29.12.1998 г. 107140, г. Москва, Верхняя Красносельская ул., 16. Тел./факс: (095) 264-44-39, e-mail: info@gelios-arv.ru, Internet: www.gelios-arv.ru