Автор: Аршинов М.Н.   Садовский Л.Е.  

Теги: алгебра   математика  

ISBN: 978-5-88688-091-5

Год: 2008

Текст
                    АЛГЕБРЫ?
М. Н. Аршинов Л. Е. Садовский

М. Н. Аршинов Л. Е. Садовский ГРАНИ АЛГЕБРЫ Под редакцией Ю. В. Кузьмина Москва ФАКТОРИАЛ ПРЕСС 2008
УДК 512 ББК 22.14 А 89 Аршинов М. Н. А 89 Грани алгебры / М. Н. Аршинов, Л. Е. Садовский; Под ред. Ю. В. Кузьмина. — М.: Факториал Пресс, 2008. — 328 с. ISBN 978-5-88688-091-5 Книга является сборником этюдов на различные темы из алгебры и её приложений. Большое внимание уделяется истории и разъясне- нию мотивировок. Хотя степень трудности глав книги различна, она рассчитана на самый широкий круг читателей: учащихся математиче- ских школ, студентов ВУЗов специальности «Прикладная математи- ка», студентов-математиков педагогических ВУЗов и университетов. УДК 512 ББК 22.14 Научное издание Михаил Наумович Аршинов Леонид Ефимович Садовский ГРАНИ АЛГЕБРЫ Под редакцией Ю. В. Кузьмина____________________________________ Формат 60 х 90/16. Усл. печ. л. 20. Бумага офсетная №1. Гарнитура литератур- ная. Подписано к печати 18.02.2008. Тираж 1200 экз. Заказ 261 Издательство «Факториал Пресс», 117449, Москва, а/я 331; ЛР ИД № 00316 от 22.10.99. e-mail: press@factorialco.com Отпечатано с готовых диапозитивов издательства «Факториал Пресс» в ППП типографии «Наука» Академиздатцентра «Наука» РАН. 121099, Москва Г-99, Шубинский пер., 6. ISBN 978-5-88688-091-5 © Факториал Пресс, 2007. Все права защищены.
ОГЛАВЛЕНИЕ Предисловие редактора 4 Введение 6 Глава 1. Пункт отправления — Вавилон 7 Глава 2. Не только числа 21 Глава 3. «Вызов человеческому разуму» 53 Глава 4. От подстановок к абстрактной группе 67 Глава 5. 2000 лет спустя 91 Глава 6. Только числа 103 Глава 7. Вокруг Великой теоремы 127 Глава 8. Гиперчисла 143 Глава 9. Эти странные кольца 155 Глава 10. Оперируем с классами 173 Глава 11. Язык симметрии 189 Глава 12. Алгебра в комбинаторике 215 Глава 13. Векторы и пространства 255 Глава 14. Вновь к истокам (о Галуа и его теории) 281 Глава 15. Поля Галуа и кодирование 299 Заключение 323 Список литературы 327
ПРЕДИСЛОВИЕ РЕДАКТОРА «Грани алгебры» — книга довольно необычная. Это не учебник, это скорее сборник этюдов на темы из алгебры. Стиль изложения доверительный, слышится живая интонация лектора. Всё время подчёркивается историческая перспектива, сообщаются сведения о знаменитых математиках. Однако книгу вряд ли можно на- звать научно-популярной. В ней развивается достаточно серьёз- ный математический аппарат. Полные доказательства приводятся не всегда, но существо дела разъясняется подробно. Для кого написана эта книга? Честно говоря, и мне —про- фессиональному алгебраисту — было полезно прочесть эту книгу и некоторые грани алгебры приобрели для меня дополнитель- ные оттенки. Думаю, что и гордый мехматянин найдёт здесь для себя много интересного. Во многих технических ВУЗах от- крыта специальность «Прикладная математика», где предусмот- рено изучение элементов алгебры. Алгебра необходима и для студентов модной теперь специальности «Компьютерная безопас- ность». Обычно у преподавателя не остаётся времени объяс- нить, как возникли те или иные алгебраические понятия, какую роль они сыграли в развитии математики. Книга М. Н. Аршинова и Л. Е. Садовского поможет студентам разобраться в этих во- просах. Она также полезна и доступна студентам-математикам педагогических ВУЗов. Часть материала доступна и школьни- кам старших классов, тем более учащимся математических школ. Приходит на ум такой образ: накрыт праздничный стол, а каж- дый выберет себе то, что ему по зубам и по вкусу. Мне, скажем, понравился этюд об алгебре в комбинаторике. Эта книга была написана в середине восьмидесятых минув- шего века, но не была издана по причинам нематематического
Предисловие редактора 5 характера. Одна из причин — смутное время начала девяностых. Авторов уже нет в живых, так что издание является посмертным. Леонид Ефимович Садовский долгое время заведовал кафедрой «Прикладная математика» МИИТа — нынешний Университет пу- тей сообщения. Он был одним из её создателей и строителей. Михаил Наумович Аршинов — доцент кафедры, один из её ве- дущих преподавателей. Книгу «Грани алгебры» мы обнаружили, разбирая архив Аршинова. Совместными усилиями был сделан её электронный вариант. Кое-что пришлось изменить и сокра- тить. Был пополнен список литературы. Фактическим соредакто- ром стал Ю. С. Семёнов. Компьютерную версию рисунков сдела- ла А. П. Иванова. Мы искренне надеемся, что книга найдёт своего читателя. Профессор кафедры «Прикладная математика» Университета путей сообщения Ю. В. Кузьмин
ВВЕДЕНИЕ Всякому, кто взял в руки эту книгу, слово «алгебра» хорошо известно. Это и понятно, ведь алгебра наряду с геометрией — один из двух столпов школьного курса математики. Однако да- леко не все знают, сколь велика дистанция от школьной алгеб- ры до той, которая составляет предмет научных интересов со- временных математиков-алгебраистов. Эта незнакомая читателю обширная область знаний обладает всеми чертами абстрактной математической науки, а тому, кто впервые её изучает, порой нелегко бывает дойти до сути, смысла и происхождения многих её понятий и фактов. Не легче понять и то, в чём их значимость для других разделов математики и какова их практическая цен- ность. В то же время без ответа на подобные вопросы едва ли воз- можно зримо представить себе истинное лицо алгебры. Поэтому авторы стремились показать историю возникновения и развития основных алгебраических идей, неразрывно связанную с имена- ми математиков разных времён и народов. Другая, не менее важ- ная цель книги — рассказать о различных применениях алгебры как внутри самой математики, так и вне её. Пожалуй, не стоит в нашем коротком введении пытаться сколько-нибудь определённо характеризовать современную ал- гебру. Будет, вероятно, лучше, если суждение по этому поводу сформируется у читателя постепенно, по мере знакомства с раз- ными гранями непростой, но увлекательной науки, именуемой «Алгебра».
ГЛАВА 1 ПУНКТ ОТПРАВЛЕНИЯ - ВАВИЛОН В древней математике явно преобладала геометрия. Даже са- мого слова «алгебра» не было — оно появилось гораздо позднее. Однако задачи, по смыслу алгебраические, хотя и облечённые в геометрическую форму, всё же существовали. Так, в древнём Вавилоне, в XVIII веке до нашей эры (до расцвета античной ма- тематики ещё должно было пройти без малого 15 столетий) уме- ли решать задачи, сводящиеся к квадратным уравнениям и даже системам квадратных уравнений. Свидетельством тому —дошед- шие до нас из эпохи вавилонской династии царя Хаммурапи мно- гочисленные клинописные таблички. Когда удалось расшифро- вать их содержимое, перед исследователями открылись любопыт- нейшие тексты, дающие представление о математических знани- ях далёких предков. В этих текстах нет и следа какой бы то ни было алгебраической символики, с помощью которой мы записы- ваем уравнения. Нет, в обычном смысле, и самих уравнений: Таб- лички содержат лишь словесные формулировки задач и рецепты их решения. Прочтём одну из табличек (шестидесятиричная си- стема счисления заменена на привычную нам десятичную). «То, на сколько длина превышает ширину, возведи в квадрат, от площади отними, и 500 это есть. Длину и ширину сложи, и 50 это ёсть. Спрашивает.длина и ширина. Твой способ: 50 возведи в квадрат и 2500 это даёт. Прибавь 2500 к 500 и 3000 это даёт. Пятую часть отломай и 600 это даёт. Половину от 50 отломай и 25 это даёт. Имеет 25 своим квадратным корнем 5. К 25 прибавь 5 и 30 длину это даёт. От 25 отними 5- и 20 ширину это даёт.»
8 Глава 1. Пункт отправления — Вавилон В первом абзаце текста формулируется задача, которую мы можем свести к системе двух уравнений с двумя неизвестными. Если х — длина, у — ширина, то система такова ху — (х — у)2 = 500 х 4- у = 50. В этих обозначениях решение вавилонского математика сводится к следующему. Второе уравнение возводится в квадрат (х + у)2 = 2500, и полученное уравнение складывается с первым из уравнений системы. В итоге получается 5ху = 3000, или ху = 600. Исходная система приводится к равносильному виду х + у = 50, ху = 600. Решение последней получается при помощи правила, которое встречается и во многих других клинописных текстах. В со- ременной алгебраической символике оно выглядит так. Если х = 25 + а, то у = 25 — а. Тогда ху = (25 + а)(25 — а) = 600, откуда а = >/625 — 600 = 5, х = 25 + 5 = 30, у = 25 — 5 = 20. Правила, которым следовали вавилонские вычислители в этом и других клинописных текстах, удивительным образом соответ- ствуют хорошо известным нам формулам. Может даже показать- ся, что известны они были и составителям табличек, но это, ко- нечно, иллюзия. Скорее всего, при поиске своих правил вавило- няне исходили из геометрических соображений. Ван-дер-Варден так пишет об этом в своей книге «Пробуждение науки». «Ва- вилоняне обычно рассматривали произведение как площадь пря- моугольника, квадрат числа —как площадь квадрата, что под- тверждается их собственной терминологией. «Однако, — добав- ляет Ван-дер-Варден, — вавилоняне мыслили прежде всего ал- гебраически. Хотя они изображали неизвестные числа линиями
Глава 1. Пункт отправления — Вавилон 9 и площадями, но последние всегда оставались числами... Даже в задачах геометрического содержания вопрос, который ставили вавилоняне, всегда сводился к вычислению чего-нибудь и нико- гда к построению или доказательству. Сквозь геометрическую внешность просвечивала алгебраическая суть». Иное дело греки. Многие свои математические знания они за- имствовали из Вавилона, но дальнейшее развитие у них пошло по геометрическому пути. Соотношения между числами они все- гда представляли геометрически. Именно в геометрии античные мыслители достигли своего идеала математической строгости, впервые в истории человечества построив теории, основанные на точных, логически выверенных доказательствах. Тогда же воз- никлй и первые трудные математические проблемы. Некоторые из них стали поистине легендарными. Таковы проблемы трисек- ции угла, квадратуры круга, удвоения куба, построения правиль- ных многоугольников циркулем и линейкой и т. д. Приведём образец «геометриче- ской алгебры» древних греков ([28], §2). Есть основания считать, что её элементы были известны уже в Ва- вилоне. Вот как формулирует Ев- клид в своих «Началах» теорему, равносильную тождеству (а + Ь)2 = а2 + 2аЬ + Ь2. (1.1) «Если прямая линия как-либо рас- сечена, то квадрат на всей прямой равен квадратам на отрезках вместе Рис. 1. с дважды взятым прямоугольником, заключённым между отрез- ками.» Суть рассуждений сводится к следующему (рис. 1). Площадь (а + Ь)2 квадрата ABCD складывается из площадей а2 и Ь2 квадратов АКЕН, EFCG и суммы 2аЬ двух площадей двух прямоугольников KBFE и HEGD. Шли века, математика развивалась, решая всё новые задачи и осваивая всё новые области. Старые задачи, казалось, отсту-
10 Глава!. Пункт отправления — Вавилон пали на второй план. Однако лучшие умы вновь и вновь об- ращались к проблемам античных времён, пытаясь вскрыть их неразгаданную тайну. Ключом к ответу часто была алгебра. Термин «алгебра» имеет восточное происхождение. В IX ве- ке н. э. жил аль-Хорезми (родом из Хорезма — древнего района в Средней Азии). История не сохранила биографических сведе- ний об аль-Хорезми. Принято считать годом его рождения 783-й, а годом смерти — 850-й. Он был автором нескольких математиче- ских трактатов. Одно из своих сочинений, посвящённое методам решения уравнений, он назвал «Хитаб ал-джебр ал-мукабала», что переводится как «Исчисление восполнения и противопостав- ления». Арабское «ал-джебр» в латинской транскрипции превра- тилось в «algebra», и начиная с XII века это слово приобрело права гражданства в Европе. Обозначать оно стало учение о ре- шении уравнений. Настоящей сенсацией в алгебре стало открытие в начале XVI века (эпоха Возрождения коснулась и математики) фор- мул для решения уравнений третьей, а затем и четвёртой степе- ни. Это событие, окружённое множеством легенд, так или ина- че связано с именами итальянских математиков Сципиона дель Ферро (1465-1526), Николо Тарталья (1500-1557), Джероламо Кардано (1501-1576), Луиджи Феррари (1522-1565)1. Способы решения уравнений 3-й и 4-й степени впервые были опублико- ваны в сочинении Дж. Кардано «Ars magna» («Великое искус- ство»), а доказательство их, по сохранившейся ещё традиции, носило геометрический характер. Формулу для решения кубиче- ского уравнения называют формулой Кардано. В несколько мо- дернизированном виде её вывод выглядит так. Прежде всего, решение полного кубического уравнения у3 + ay2 + by + с = 0 сводится к решению кубического уравнения вида x3+px + q = 0, (1.2), 1 Об этих учёных и любопытных подробностях их открытия читатель мо- жет прочесть, например, в книге [10].
Глава 1. Пункт отправления — Вавилон 11 не содержащего квадрата неизвестного. Для этого, как может убедиться читатель, достаточно сделать подстановку у = х—а/3. Следующая идея —искать решение уравнения (1.2) в виде х = и + v, где и, v — вспомогательные неизвестные. После под- становки в (1.2) будем иметь (и + v)3 + р(и + v) + q = О, или и3 + v3 + (3uv +р)(« + v) + q = 0. (1.3) Наличие двух неизвестных вместо одного отнюдь не усложняет задачу, напротив, позволяет распорядиться ими наиболее удоб- ным способом. В самом деле, выберем их так, чтобы 3uv + р = 0, или uv = —р/3. Тогда уравнение (1.3) принимает вид u3+v3 = —q и мы приходим к системе „3 и3 + v3 = —q, u3v3 = —— . Согласно теореме Виета числа и3, v3 являются корнями квадрат- ного уравнения г2 + qz - = °. Решая последнее уравнение, находим или наоборот, что в данном случае не играет роли. Наконец, мы приходим к формуле Кардано (1.4) Открытие этой формулы явилось первым крупным достижением европейской математики, и Кардано не жалеет слов, чтобы под- черкнуть его значимость. «Так как это искусство превосходит всю человеческую ловкость и всю ясность ума смертного», —
12 Глава 1. Пункт отправления — Вавилон восклицает он,— «то его нужно рассматривать как подарок небесного происхождения... и это настолько славное открытие, что от того, кто мог его достигнуть, можно ожидать, что он достигнет всего.» Быть может, приведённое высказывание и покажется нам сильным преувеличением, всё же для истории алгебры, её последующего развития значимость формулы Кардано, как и формулы Феррари для уравнения четвёртой степени, действи- тельно велика. Правда, того же нельзя сказать об их практи- ческом значении. Уже первооткрывателями было понято, что при пользовании формулами возникают не только технические, но и принципиальные трудности. О природе этих трудностей рассказывается в дополнении. Достижения итальянских учёных произвели громадное впе- чатление на современников и вдохновили математиков на поиски аналогичных формул для решения алгебраических уравнений пя- той, шестой, вообще произвольных степеней, то есть уравнений вида аохп + ai®n-1 + ... + dn-ix + ап = 0. (1.5) Исследование таких уравнений, не только связанное с поиском формулы корней, оказывается вплоть до XIX века в центре вни- мания алгебры, и в этот период всё более утверждается взгляд на эту науку как на науку об алгебраических уравнениях. Одно- временно появляется и ещё одна точка зрения на алгебру, отра- жающая не столько предмет, сколько складывающийся её общий дух, как учения о формальных действиях, о так называемых ал- гебраических операциях. Старая традиция — записывать уравнения и правила их реше- ния словами — давно уже была большой обузой, а при рассмот- рении уравнений произвольных степеней стала просто непреодо- лимым препятствием. Необходимо было создать какую-то новую систему кратких обозначений. Такие попытки делались в разные времена, однако самый решительный шаг в этом направлении сделал французский математик Франсуа Виет (1540-1603) — не зря его называют творцом математической формулы. Но и бук- венное исчисление Виета ещё нуждалось в усовершенствова-
Глава 1. Пункт отправления — Вавилон 13 нии. Более компактный и, по существу, современный вид придал ему один из создателей новой математики француз Рене Декарт (1596-1660). Лишь после Декарта стали в ходу у математиков выражения, подобные, например, (1.4) и (1.5), а алгебра приняла форму науки о буквенных вычислениях, о преобразовании фор- мул и уравнений, составленных из букв (в отличие от арифмети- ки, оперирующей с конкретными числами). С созданием удобной алгебраической символики неизмеримо упростились математические рассуждения. То, что прежде было доступно лишь избранным, теперь зачастую выполнялось меха- нически, с помощью цепочки преобразований, проводимых по определённым правилам. Вот что писал об этом сам Виет: «Все математики знали, что под их алгеброй и алмукабалой были скрыты несравненные сокровища, но не умели их найти. Задачи, которые они считали наиболее трудными, совсем легко реша- ются десятками с помощью нашего искусства, представляющего поэтому самый верный путь для математических изысканий.» Как бы в подтверждение этих слов, буквенная алгебра Вие- та и Декарта вскоре активно вторглась в геометрию. Созданные Декартом и его современником Ферма (1601-1665) метод коор- динат и аналитическая геометрия позволили действительно «ре- шать десятками» ранее считавшиеся очень трудными геометри- ческие задачи. В этом методе, как вероятно известно читателю,' точки задаются координатами, линии и поверхности — уравнени- ями, а геометрические рассмотрения заменяются алгебраически- ми вычислениями с уравнениями и их системами. Однако глав- ные события в алгебре были ещё впереди. Начало им положили великие математики Жозеф Луи Лагранж (1736-1813) и Карл Фридрих Гаусс (1777-1855). Лагранж был уже зрелым математиком, когда его заинтересо- вала задача о разрешимости в радикалах алгебраических уравне- ний. Вместо того, чтобы искать решение вслепую, как это делали очень многие до него, Лагранж попытался проанализировать при- чины предшествующих неудач. Ему удалось открыть глубокие принципы, лежащие в основе проблемы, и сдвинуть её с мёртвой точки. Вскоре Гаусс, используя сходные идеи, сумел дать ал- гебраическое решение задачи о построении с помощью циркуля
14 Глава 1. Пункт отправления — Вавилон и линейки правильных многоугольников. Это была его первая, но поистине замечательная математическая работа. Исследования Лагранжа и Гаусса были подхвачены молодыми математиками — норвежцем Нильсом Генрихом Абелем (1802-1829) и французом Эваристом Галуа (1811-1832). Оказалось, что формул в радикалах для решения общего алгебраического уравнения степени боль- шей четырёх просто не существует., Это доказал Абель. Галуа подвёл черту: он выяснил, каким необходимым и достаточным условиям должно удовлетворять каждое конкретное алгебраиче- ское уравнение для того, чтобы его корни выражались в радика- лах через коэффициенты этого уравнения. В период, о котором мы говорим, не просто одна за другой решались казавшиеся неприступными задачи. Одновременно со- здавался совершенно особый круг понятий и идей, который затем полностью преобразил лицо алгебры. О том, как это происхо- дило, мы и расскажем в последующих главах. Но сначала мы познакомим читателя с несколькими алгебраическими персона- жами, которым отведена важная роль в этой книге. Дополнения 1. Предлагаем читателю ещё один пример клинописных текстов. «Длина, ширина. Длину и ширину я перемножил и площадь получил. Затем избыток длины над шириной я прибавил к пло- щади: 183 получилось у меня. Затем я длину и ширину сло- жил: 27. Спрашивает длина, ширина и площадь. Ты сделаешь так: 27 + 183 = 210, 2 + 27 = 29. Возьми половину от 29, это даёт 14,5; 14,5 х 14,5 = 210,25, 210,25 - 210 = 0,25; 0,25 имеет 0,5 квадратный корень, 14,5 + 0,5 = 15 — длина 14,5 — 0,5 = 14 — ширина.
Глава 1. Пункт отправления — Вавилон 15 Отними 2, которые ты прибавил к 27 от ширины,, 12 истинная ширина; 15 длину, и 12 ширину я перемножил: 15x12=180 —пло- щадь. ..» Задача сходна с приведённой в основном тексте. Читатель без труда разберётся в методе её решения (см. также [28], §16). 2. А вот как греки доказывали тождество (а + Ь)(а — Ь) = а2 — Ь2. Левая его часть выражает пло- щадь прямоугольника AEFG, кото- рая, понятно, равна разности пло- щадей квадратов ABCD и CHFK (рис. 2). Нетрудно указать и геометриче- скую интерпретацию формулы (а+Ь)3 = а3+За2Ы-ЗаЬ2+Ь3. (1.6) На языке геометрической алгебры рис 2 решались и квадратные уравнения. Конечно, возможности такой алгебры ограничены. К примеру, совершенно вне её компетенции находится доказательство при п > 3 формулы,бинома Ньютона (а + Ь)п = ^Скап~кЬк, к=0 обобщающей (1.1) и (1.6). 3. Трудности использования формулы Кардано, о которой, упо- миналось, проистекают не только от её внешней громоздкости. Чтобы это понять, рассмотрим уравнение х3 - 2х + 1 = 0, (1.7) один из корней которого, а именно 1, очевиден. Левую часть можно разложить на множители х3 — 2х + 1 = (х — 1)(я2 + х — 1),
16 Глава 1. Пункт отправления — Вавилон поэтому корнями уравнения (1.7) будут, кроме того, корни квад- ратного трёхчлена х2 + х — 1, то есть числа (—1 ± д/5)/2. Итак, наше кубическое уравнение имеет три действительных корня. Ну а что же даёт формула Кардано? Нечто странное. Действительно, выражение, стоящее под знаком квадратного радикала, д2 1 ___L 4 + 27 “ 4 27 ” 108 получается отрицательным, и следовательно, никак нельзя по нашей формуле получить перечисленные корни, если опериро- вать только с обычными действительными числами. Так впер- вые в математике возникла необходимость расширения числовых множеств за пределы действительных чисел. С новыми, так назы- ваемыми комплексными числами мы познакомимся в следующей главе. Не понятно также и то, как по формуле Кардано может по- лучиться три различных корня, и этот вопрос также прояснится лишь позднее. Здесь же отметим ещё, что даже в том случае, когда решение может получиться в «нераспознаваемом» виде. Так, лег- ко проверить, что уравнение х3 + Зх — 4 = 0 имеет единственный действительный корень, равный 1. Формула же Кардано даёт для него значение ^2 + л/5 + ^2-75. Нелегко понять, что это и есть 1. 4. Несколько слов об эволюции алгебраических обозначений. Вот пример своеобразной символики, встречающейся у Кардано ([28], §66). Выражение \Д/5 + 2- ^\/5-2, являющееся корнем уравнения х3 + За: = 4, он записал бы при- мерно так RxU.cu.Rx3p.21 m.RxU.cu.RxbmJl.
Глава 1. Пункт отправления — Вавилон 17 Здесь Rx — знак корня (Radix), RxU.cu (Radix universalis cubica) означает корень кубический из всего выражения до вертикаль- ной черты, р — плюс, т — минус. Формул, записанных в общем виде, у Кардано не было, так как буквенных обозначений для произвольных числовых данных он не применял. Впервые такие обозначения появились у Виета. В его записи уравнение А3 + + ЗВ2 А = 2Z3 (А обозначает неизвестную) выглядит так: A cubus + В piano 3inA aequari Z cubus 2, а формулу Кардано для этого уравнения он записывает в виде у С у/В piano — piano — plani + Z solido — solido + Z solido— — \J C\/B piano — piano — plani + Z solido — solido — Z solido. У Декарта запись почти современная. Вид формулы Кардано для уравнения х3 + рх + q = 0 в обозначениях Декарта мало отлича- ется от (1.4): /Т i /1 1 ч /7 i /1 1 , Vc~2’+V4ot+ctj* + Vc~2’~V4ot+ctjA 5. Как узнать, можно ли осуществить то или иное геометри- ческое построение, пользуясь классическим набором инструмен- тов—циркулем и линейкой? Методы аналитической геометрии позволяют получить простой алгебраический критерий возмож- ности такого построения. Заметим; что всякое построение циркулем и линейкой сво- дится к ряду шагов, на каждом из которых отыскивается точка пересечения либо двух прямых, либо прямой и окружности, либо двух окружностей. Фиксируем на плоскости систему координат. Прямая задаётся линейным уравнением Ах + By + С = О, а окружность радиуса г с центром в точке (а, 6) — уравнением вида (ж - а)2 + (у — Ь)2 = г2.
18 Глава 1. Пункт отправления — Вавилон Отыскание точки пересечения прямых равносильно решению си- стемы уравнений А1% + Bly + Ci = О, А2Х + В2У + С*2 = О, задающих эти прямые, а после исключения неизвестного — ре- шению линейного уравнения с одним неизвестным. Точка пересечения прямой и окружности может быть найдена как решение системы Ах + Ву + С = 0, (ж - а)2 + (у - Ь)2 = г2. (1.8) Соответственно, точка пересечения двух окружностей — это решение системы . (х - аг)2 + (у - bi)2 = rj, (х - az)2 + (у - Ь2)2 = г|. (1.9) Система (1.8) после исключения неизвестного из первого урав- нения приводится к решению квадратного уравнения, а система (1.9) после вычитания одного уравнения из другого приводит- ся к виду (1.8). Итак, каждый этап задачи, решаемый циркулем и линейкой, сводится ж уравнению первой или второй степени с одним неизвестным, а все величины, дающие решение задачи, выражаются через исходные данные с помощью арифметических операций и операций извлечения квадратного корня. Наоборот, если это так, то задача может быть решена циркулем и линейкой. Из сказанного вытекает, что при заданной единице длины цир- кулем и линейкой могут быть построены те и только те отрезки, длины которых выражаются через единицу с помощью конеч- ного числа операций сложения, вычитания, умножения, деления и извлечения квадратного корня. Такие числа называют квадра- тичными иррациональностями. 6. Одна из древних задач, в которой речь идёт о построениях с помощью циркуля и линейки, формулируется так. Построить куб, имеющий объём, вдвое больший, чем данный куб. Её назы- вают задачей об удвоении куба. Легко сформулировать алгебраи- ческий вариант. Если х — отношение сторон искомого и заданно- го куба, то ж3 = 2. Если бы было возможно построение циркулем
Глава 1. Пункт отправления — Вавилон 19 и линейкой, то это, согласно предыдущему пункту, означало бы, что ^2 является квадратичной иррациональностью. То, что это неверно может показаться очевидным. Однако внешняя просто- та здесь обманчива. Доказать, что нельзя выразить через квадратные радикалы, далеко не просто. Строгое доказательство этого факта, а значит и неразрешимости задачи удвоения куба, было дано лишь в XIX веке. Другая задача — разделить данный угол циркулем и линей- кой на три равные части (трисекция угла). Она также сводится к аналогичному алгебраическому вопросу. Выяснить это можно, используя тригонометрию. Опишем дугу единичной окружности с центром в вершине заданного угла а (рис. 3). Для построения угла а/З доста- точно построить отрезок АЕ, дли- В ны |АЕ| = cos(a/3). При этом дли- на отрезка АС, построение которого / \ очевидно, равна cos а. Полагая в из- / вестном тригонометрическом тожде- / / стве / .'-"'"'К cos а = 4cos3(a/3) — 3cos(a/3) ] С Е F cos(a/3) = х, cos а = а, получа- ем, что длина х неизвестного отрез- Рис. 3. ка АЕ является корнем кубического уравнения 4х3 - Зх - а = 0. (1.10) Итак, геометрическая задача на построение вновь сведена к зада- че алгебраической. Надо выяснить, будет ли квадратичной ирра- циональностью корень уравнения (1.10). Ответ и на этот вопрос отрицательный, откуда вытекает невозможность трисекции угла. Вопросы подобного рода имеют прямое отношение к теории Галуа (о ней в главе 14).
ГЛАВА 2 НЕ ТОЛЬКО ЧИСЛА Классы вычетов Из письма П. Ферма: «Всякое простое число непременно измеря- ет1 одну из степеней минус 1 любой прогрессии, которая пусть дана; и показатель названной степени является делителем дан- ного простого числа минус 1; и после того, как нашли первую степень, удовлетворяющую искомому, все те степени, показатели которых кратны показателю первой, также удовлетворяют иско- мому. Пример: пусть дана прогрессия 1 2 3 4 5 6 3 9 27 81 243 729 со своими показателями степени наверху. Возьмите, например, число 13. Оно измеряет третью степень минус 1 2, показатель которой 3 является делителем числа 12, на единицу меньшего числа 13, и так как показатель степени 729, равный 6, кратен первому показателю, равному 3, то следует, что 13 измеряет так- же 729 — 1. Это предложение верно для всех прогрессий и всех простых чисел, чему я Вам прислал бы доказательство, если бы не опасался быть слишком многословным.» В форме, не очень привычной для современного читателя, здесь высказана важная теорема из элементарной теории чисел, 1 Является делителем. 2 То есть число 27 — 1 = 26.
22 Глава 2. Не только числа известная как малая теорема Ферма. Мы бы её сформулировали так: если р — простое число и а взаимно просто с р, то найдётся такой делитель к числа р—1, что ак — 1 делится на р, причём для всякого I, кратного числу k, а1 — 1 также делится на р. Ферма иллюстрирует эту теорему примером, в котором а = 3, р = 13, и тогда I может принимать значения 3, 6, 12, ... Из сфор- мулированного выше утверждения легко следует более популяр- ная формулировка малой теоремы: если р — простое число и а взаимно просто с р, то ар-1 — 1 делится на р. Ферма не оставил нам доказательства своей теоремы, как впрочем, и многих других высказанных им теоретико-числовых утверждений. Большинство из них, в том числе и малая теоре- ма, были доказаны Леонардом Эйлером (1707-1783), для которо- го занятия теорией чисел таили в себе такую же неотразимую привлекательность, как и для его предшественника. Рассуждения Эйлера (по-видимому, таков же был ход мыслей и у Ферма) основывались на рассмотрении остатков, или иначе вычетов, образующихся при делении на р числа а и его степеней, и в обнаружении строгой периодичности в появлении этих остат- ков. Так, в упомянутом выше .примере Ферма остатки при деле- нии на 13 чисел 1, 3, 9, 27, 81, 243, 729, 2178, 6561, ... появля- ются в следующей последовательности: 1, 3, 9, 1, 3, 9, 1, 3, 9, ... Использование такого приёма, основанного на работе с вычета- ми, вообще характерно при изучении вопросов делимости чи- сел и различных числовых арифметических выражений. Наибо- лее стройную и законченную форму придал этому приёму Гаусс, введя понятие классов вычетов и сравнимости. Два целых числа а и Ь называют сравнимыми по модулю п (п — натуральное число), если их разность а—b делится на п без остатка. Это выражают следующей записью: а = b mod п. (2.1) Число п называют модулем сравнения (2.1). Например, 37 = 4 mod 11, так как разность 37 — 4 = 33 делится на 11. Аналогично, 50 = —13 mod 9, так как 50 — (—13) = 63 делится на 9. Запись
Глава 2. Не только числа 23 а = 0 mod п означает, что само число а делится на п, то есть а = кп. Фиксируем некоторый модуль сравнения п. Всякое натураль- ное число с можно единственным образом представить в виде с = sn + г, (2.2) где s — неполное частное от деления на п, а г — остаток (вычет), совпадающий с одним из чисёл О, 1, 2, ..., п - 1. (2.3) Легко видеть, что запись вида (2.2), где 0 < г < п—1, допускают не только натуральные числа, но и любые целые числа. Напри- мер, если с = —35, п = 3, то равенство —35 = (—3) -13 + 4 и есть указанное представление. Очевидно, из равенства (2.2) следует, что с = г mod п, то есть всякое число сравнимо со своим вычетом по модулю п. Пусть теперь а и b — два произвольных числа, записанные в ви- де а = Sin + П, Ь = 82П + Г2. КаЖДЫЙ ИЗ ОСТаТКОВ ri и гг — это одно из чисел (2.3), и потому их разность может делиться на п лишь в одном случае, когда п = гг- Но тогда разность а — b = = (si — S2)n + (ti — гг) может делиться на п в том и только том случае, когда .и =, гг- Отсюда вывод: а = Ъ mod п тогда и только тогда, когда числа aub имеют одинаковые остатки при делении на п. Гаусс систематизировал основные свойства сравнений, во мно- гом аналогичные свойствам обычных равенств. Подобно тому, как это делается с равенствами, сравнения по одинаковому мо- дулю оказалось возможным складывать, перемножать и т. д. Так, перемножив сравнения 17 = 5 mod 4 и 7 = 3 mod 4, получим, как нетрудно убедиться, верное сравнение 119 = 15 mod 4. Во- обще, если ai = bi, 02 = Ьг, то ai + а2 = bi +1>2> «102 = bib2- (2.4) (здесь сравнения рассматриваются по одному модулю п, который в записи опущен). Доказательство сводится к проверке опре- деления. Чтобы убедится в справедливости, например, второго
24 Глава 2. Не только числа из сравнений (2.4), рассмотрим разность ауа,2 — bifo = aia2 — - 02^1 + «2&1 - i>i&2 = аг («1 — £>i) + £>1(а2 - Ьг)- В преобразованном выражении оба слагаемых делятся на модуль без остатка, так как по условию а\ = b±, аъ = Ь2, следовательно, этим свойством обладает и вся сумма. Но это и означает, что = &1&2- Как применяются отмеченные свойства, наглядно иллюстри- рует следующая задача. Выяснить, при каких натуральных зна- чениях к число 2005*+ 2006* делится на 3. Замечаем, что 2005 = = 1 mod 3, 2006 = 2 mod 3. Но тогда согласно (2.4) 2005* = 1 и 2006* = 2к. Заменяя в исходном выражении числа 2005 и 2006 их вычетами по модулю 3, получим •• 2005* + 2006* = 1 + 2* mod 3, следовательно, левая часть сравнения делится на 3 тогда и толь- ко тогда, когда на 3 делится сумма 1 + 2*. Для степеней же двойки имеем: 22 = 1, 23 = 2, 24 = 1, 25 = 2 и т. д. Вообще, при- меняя индукцию по к убеждаемся, что 2* = 1 mod 3 при чётном к и 2* = 2 mod 3 при к нечётном. Таким образом, в первом случае 1 + 2* = 1 + 1 = 2 mod 3, а во втором 1 + 2* = 1 + 2 = = 0 mod 3, и поэтому исходное выражение делится на 3 тогда и только тогда, когда к нечётно. В разобранной задаче числа 2005 и 2006 можно заменить лю- быми целыми числами а и Ь, дающими при делений на 3 остатки соответственно 1 и 2. Ни ответ задачи, ни способ решения от это- го не изменились бы. Таким образом, в некоторых вопросах все числа, имеющие один и тот же вычет г по модулю п и, следова- тельно, сравнимые между собой по этому модулю, оказываются взаимозаменяемыми. Объединим их всё в один класс и обозна- чим через г: г = {с | с = г mod п}. (2.5) Иными словами, класс г состоит из всех тех чисел, которые за- писываются в виде (2.2). Класс, определяемый равенством (2.5), называют классом вычетов. Каждому из возможных остатков 0,1,2, ...,п — 1 отвечает свой класс вычетов, так что имеется ровно п различных классов О, Т, 2,... ,п^Т. (2.6)
Глава 2. Не только числа 25 Ясно, что эти классы попарно не пересекаются и каждое целое число попадает ровно в один из перечисленных классов. И вот что важно. Оказывается с классами вычетов можно оперировать, как и с числами — их можно складывать и перемножать, исполь- зуя для этой цели операции сложения и умножения чисел. Разберёмся с этим подробнее. Рассмотрим какие-нибудь два класса й и й и выберем в каждом из них любые числа ai ей, 02 Е.Г2- Пусть оказалось, что их сумма ai + 02 имеет вычет г, а произведение 0^02 — вычет з, иными словами, Й1 + 02 € Г, GjG2 € S. Тогда будем считать, что сумма классов й и й равна г, а их произведение равно s Г1+Г2 = г, йй = s. Всё здесь довольно необычно. Необычна сама идея оперирова- ния над числовыми классами — слишком велика сила привычки к тому, что арифметические операции являются монополией чи- сел. Наверное, необычен также и характер наших определений суммы и произведения классов вычетов. Необычно ещё и то, что в этих определениях, имеется элемент произвола. Действительно, для того, чтобы найти сумму и произведение классов вычетов, мы сначала оперируем с числами — представителями этих клас- сов, а их, как было сказано, мы вольны выбирать как угодно. Не будет ли тогда сумма и произведение г и s зависеть от произвола в выборе представителей? Если бы это было так, то операции над классами были бы лишены определённого смысла. К сча- стью, наши опасения напрасны. В самом деле, если bi и Ь2- другие представители классов й и й, отличные от at и аг, то bi = ai mod п, й = а2 mod п. Но согласно (2.4) bi + b2 = ai + 02 mod n, b\b2 = 0102 mod n, а значит, сумма и произведение новых представителей лежат в тех же классах г и з, что сумма и произведение старых.
26 Глава 2. Не только числа Самый простой пример, иллюстрирующий сказанное, получит- ся, если за модуль сравнения взять число п = 2. В этом случае имеем два класса вычетов 0 и 1, а операции над ними выглядят так: 0 + 0 = 0, . 0 + Т=1 + 0 = Т, 1 + 1 = 0, 0-0 = 0 Т = Т-О = О, Т-Т= 1. А вот каковы таблицы сложения и умножения классов вычетов по модулю 4 (табл. 1): Таблица 1. + 0 Т 2 3 0 б т 2 3 Т 1 2 3 б 2 2 3 б Т 3 3 0 Т 2 • б Т 2 3 б б б б б т б т 2 3 2 б 2 б 2 3 б 3 2 Т Читатель легко может составить аналогичные таблицы сло- жения и умножения классов по другим модулям (например, для п = 3, 5 и т. д.). Рассматривая эти таблицы, можно подметить некоторые новые неожиданные свойства, не свойственные чис- ловым операциям. Всё же нельзя не заметить и того, что опе- рации над классами вычетов наследуют от своих «родителей» — сложения и умножения чисел — немало общих с ними свойств. Так, обе операции над классами коммутативны и ассоциативны, а умножение дистрибутивно относительно сложения: а) коммутативность Г1 + Г2 = Г2 + = ^2П> б) ассоциативность (ri + г2) + Гз = П + (г2 + Гз), (Г1Т2)г3 = Г1(т2Гз),
Глава 2. Не только числа 27 в) дистрибутивность (fl + гг)гз = flf2 + f2f3- Всё это так, поскольку операции над классами вычетов сводят- ся в конечном счёте к операциям над числами из этих классов, а они, разумеется, обладают перечисленными свойствами. Мож- но продолжать алгебраические аналогии, заметив, что классы О и 1 играют такую же роль, какую выполняют 0 и 1 в сложении и умножении чисел, а именно: О + г = г, 0 • г = 0, 1 - г — г для любого класса вычетов г. Множество классов вычетов с определёнными выше операци- ями сложения и умножения классов обычно обозначают Zn и на- зывают кольцом вычетов mod п (по модулю п). К сказанному об алгебраических свойствах операций над классами вычетов можно добавить, что в множестве Zn опера- ция сложения всегда обратима. Это означает, что для любых двух классов г и fi можно определить их разность гг = fi — f, понимая под этой разностью (как и для чисел), такой элемент ?2 € Zn, что г + ?2 = fl- Например, легко видеть, что в Z5 4 — 2 = 2, а 2 — 4 = 3. Вычитание в Zn может быть сведено к сложению, если исполь- зовать понятие противоположного элемента. Класс s называется противоположным к классу f, если г + s = 0. Очевидно, про- тивоположным к классу 0 будет сам этот класс, а для любо- го ненулевого класса f противоположный элемент равен п — г. Действительно, согласно определению сложения
28 Глава 2. Не только числа Элемент, противоположный к г, естественно обозначить —г. То- гда разность можно записать в виде П — г = Г1 + (—г) = г 1 + п — т. Так например, в Z7 3 —5 = 3 +(—5) = 3 + 2 = 5. Сложнее в Zn обстоит дело с умножением классов, которое не во всех случаях обратимо. Иными словами, уравнение х • г = г1 (2.7) может оказаться неразрешимым в Zn даже, если г / 0. Табли- ца 1 показывает, например, что в Z4 не имеет решения уравнение х • 2 = 3, то есть не определено отношение классов 3 и 2. Однако справедливо такое важное утверждение: если п — простое число, то в кольце классов вычетов Zn урав- нение (2.7), в котором г / 0, всегда имеет решение и притом единственное. Для доказательства будем в левую часть уравнения (2.7) под- ставлять по очереди элементы из Zn, получая при этом классы 0 • г, 1 • г, 2,- г,..., к • г,..., п — 1 • г. (£.8) Покажем, что все они различны. Если это не так, то найдутся кит такие, что O^k<m^n-lnk-r = m-r. По- следнее равенство перепишем в виде (тп — к)г = 0. Переходя к числам, приходим к выводу, что произведение (т — к)г де- лится на простое п без остатка. Но это противоречит тому, что сомножители т — к и г — числа меньшие п, и следовательно, с п взаимно простые. Итак, классы (2.8) исчерпывают все элементы Zn, и поэтому среди них встретится ровно один раз класс г' — правая часть уравнения (2.7). Это и доказывает его однозначную разрешимость. Часто, когда это не вызывает путаницы, в обозначениях клас- сов вычетов опускают черту, записывая их как обычные нату- ральные числа. Правила сложения и умножения классов по мо- дулю п сводятся тогда к следующему: Г1 + Г2 = г, Г1 T2 = S,
Глава 2. Не только числа 29 где г и s — остатки от деления на п обычных суммы и произве- дения соответственно. Эти правила можно понимать и буквально, считая, что они определяют две операции на множестве {0,1,2,..., п — 1} — сло- жение и умножение по модулю п. Например, по модулю 7 4 + 5 = 2, 4-5 = 6. Преобразования и подстановки Они являются следующими персонажами нашей книги, расска- зывающей об алгебре. С понятием преобразования произвольно- го множества читатель, видимо, уже знаком. Всё же напомним, что под преобразованием f понимается закон йли правило, по которому каждому элементу а данного множества М сопостав- ляется единственный элемент /(а) того же множества, называ- емый образом элемента а. Хорошо известны такие, например, преобразования как поворот плоскости вокруг некоторой точки на заданный угол а или параллельный перенос на данный вектор (рис. 4). Рис. 4. Нет недостатка и в других примерах, которые читатель может вспомнить или придумать самостоятельно. Нас будут интересо- вать прежде всего так называемые взаимно однозначные пре- образования. Преобразование множества М называется взаимно однозначным, если каждый элемент этого множества является
30 Глава 2. Не только числа образом некоторого элемента множества М и притом единствен- ного. Упомянутые только что повороты и параллельные переносы плоскости являются как раз примерами таких преобразований. Если f и <р — два преобразования произвольного множества М, то можно выполнить их одно вслед за другим, например, сначала /, а затем <р. Результатом будет некоторое новое преоб- разование, которое называется произведением, или композицией преобразований f и (р и обозначается <р о /, или просто <pf. На- пример, если / — параллельный перенос на вектор а, а <р — на вектор Ь, то их произведение — снова параллельный перенос на вектор, равный сумме а + b (рис. 5а)). Если же / и —поворо- ты на углы а и, соответственно,./? вокруг общего центра О, то их композиция, очевидно, будет опять-таки поворотом вокруг то- го же центра. Углом этого результирующего поворота ipf будет, понятно, а + 0 (рис. 5б)). Рис. 5. Наряду с этими геометрическими примерами особый интерес для нас будут представлять взаимно однозначные преобразова- ния конечного множества, которые принято называть подстанов- ками. Если конечное множество М состоит из п элементов, то удобно для их обозначения использовать числа 1,2,... ,п. Тогда для задания подстановки а множества М достаточно для каж- дого из этих чисел (элементов множества М) указать то число, в которое оно отображается этой подстановкой. Можно исполь- зовать для этой цели таблицу из двух строк — в первой её строке выписывать элементы 1,2,... ,п, а во второй под каждым из них
Глава 2. Не только числа 31 указать соответствующий ему при данной подстановке элемент 12 3 а(1) ст(2) <т(3) п \ Например, запись 1 2 3\ 2 3 1) означает подстановку множества М = {1,2,3}, которая 1 пере- водит в 2 = ст(1), 2 переводит в 3 = ст(2), а 3 —в 1 = <т(3). Нетрудно указать все подстановки такого множества, их будет 6: fl 2 3\ fl 2 3\ fl 2 3 СГ1 = ц 2 37 ’ 1 672 \ 1 3 2/ ' ’ аз ~ \2 1 3 (1 2 з\ fl 2 3\ fl 2 3' сг4 = I2 3 1/ ’ 1 a5 = U 1 2/ ' 1 аб ” 1з 2 1 (2.9) Легко понять, как перемножаются эти подстановки. Например, /1 2 3\ fl 2 3\ /1 2 3\ 673(74 — \2 1 37^2 3 1/ \1 3 2/ 672 (ад переводит 1 в 2, после чего стз переводит 2 в 1, так что в ре- зультате последовательного выполнения этих двух подстановок 1 перейдёт снова в 1 и т.д.). ' Обратим внимание на существенную особенность умножения подстановок и других преобразований — их произведение зави- сит, вообще говоря, от порядка сомножителей. Так например, выполняя преобразования 03 и <74 в другом порядке, получим fl 2 3\ fl 2 3\ fl 2 3\ 674673 ~ ^2 з у V2 1 3j ~ V3 2 1/ а6' Всё же мы используем термин умножение по отношению к этой не совсем привычной и к тому же некоммутативной операции. Такую традицию можно оправдать тем, что остальные свойства обычного числового умножения сохраняются и для композиции взаимно однозначных преобразований множества М. Прежде
32 Глава 2. Не только числа всего, эта операция ассоциативна, то есть для любых преоб- разований У1,/2,/з множества М fiUih) = (hh)h- (2.Ю) Действительно, обе части этого равенства совпадают с одним и тем же преобразованием, которое получается при последова- тельном применении трёх —сначала Д, затем Д, и затем Д. Среди взаимно однозначных преобразований имеется тожде- ственное е, оставляющее на месте всякий элемент а 6 М (е(а) = = а). Для операции умножения преобразований оно, очевидно, играет роль единичного элемента, то есть такого, что ef = fe = f (2.11) для любого /. В приведённом выше списке подстановок (2.9) такую роль играет подстановка <71. И третье, для всякого взаимно однозначного преобразования У множества М существует обратное f~\ то есть такое, что уу-1 = У-1У = е. (2.12) Например, для подстановки обратной будет <75, а для — сама же эта подстановка. Совокупность всех взаимно однозначных преобразований мно- жества М с определённой для них операцией умножения принято называть группой всех преобразований, а в случае, когда мно- жество М конечно, — группой всех подстановок, или симметри- ческой группой множества М. В (2.9) приведён полный список элементов симметрической группы S3. Термин «группа подстановок» впервые ввёл в употребление известный уже читателю Э. Галуа, о котором ещё немало будет сказано в этой книге. Галуа использовал этот термин не только для совокупности всех подстановок Sn, но и для подмножеств в Sn, если только для них оказываются выполненными пере- численные выше свойства. Более точно, пусть G С Sn — такая совокупность подстановок, что для любых У1,Уг € G их компо- зиция У1У2 также принадлежат G. Если, кроме того, G содержит
Глава 2. Не только числа 33 тождественную подстановку и вместе со всякой подстановкой / содержит /-1, то множество G называется группой подстано- вок. Говорят также, что G является подгруппой симметрической группы Sn. Простыми примерами групп подстановок могут служить сле- дующие подмножества в S4: (1 2 3 4\ (1 2 3 4\ Gl = < е = ц 2 3 4J 1 , Ол = \1 2 3 4 v’ /1 2 3 4^ /1 2 3 4\) 0*2 = \3 4 1 2/ 1,^з = \4 1 2 /1 2 3 4^ А 2 3 4\ G% = = ц 2 3 V 1 , /1 = 1 \2 1 4 3/ ’ /1 '2 3 4^ А 2 3 4\1 /2 = \3 4 1 2J 1 > /з = 1 U 3 2 1) Читатель может убедиться в этом непосредственной провер- кой. Например, в первом случае 2 3 0*10*2 = 0*3, = 0*10*1 = 0*2, 0*1 = 0*3, 0*1 = 6 и т.д., а во втором /1/2 = /з, /I = /I = /з=е- Группы подстановок во многих вопросах являются очень по- лезным инструментом и, что не менее важно, они послужили одним из главных источников понятия группы — одного из важ- нейших алгебраических понятий. Разговор об этом, и довольно обстоятельный, нам ещё предстоит. Пока же продолжим знакомство с подстановками. Всякая под- становка а € Sn может некоторые символы оставлять на ме- сте, другие же действительно перемещать. Первые назовём непо- движными, а остальные — перемещаемыми. Скажем, для под- становок 1 234567 8\ /1 234567 8\ 3 2475861/ а2\3 241586 7J 2 — 261
34 Глава 2. Не только числа неподвижными являются символы 2 и 5, а все остальные — пере- мещаемыми. Однако характер перемещения символов этими под- становками различен. Подстановка сг^ обладает тем свойством, что при повторении её достаточное число раз всякий из переме- щаемых символов может быть переведён в любой другой из этих символов. Например, <т1(1) = 3, <Т1(1) = <71(3) = 4, <t?(1) = <ti(4) = 7, af(l) = ai(7) = 6, of (1) = <7i(6) = 8, <т?(1) = <п(8) = 1. Подстановка, обладающая указанным свойством, называется циклом, или циклической подстановкой. Не такова подстановка <72, например, <72(1)=3, <т|(1) = 4, (т1(1) = 1, и поэтому символ 1 не может быть переведён повторным приме- нением ст2 ни в один из символов 6, 7, 8. Для циклов, которые в каком-то смысле являются наиболее просто устроенными подстановками, употребляется следующая запись. Перемещаемые символы записываются последовательно в скобках в том порядке, в каком они переходят друг в друга. За- пись начинается с любого из перемещаемых символов, а послед- ний символ считается переходящим в первый. Применительно к <71 эта запись выглядит следующим образом <71 = (1,3,4,7,6,8). Число символов, перемещаемых циклом, называется его длиной, так что длина цикла <71 равна 6. Хотя вторая подстановка <72 и не является циклом, но можно заметить, что она как бы состоит из двух циклов (1,3,4), (7,6,8), (2.13) которые действуют на перемещаемые символы независимо один от другого. Конкретнее это выражается в том, что <72 является композицией этих циклов, причём порядок их выполнения без- различен <72 = (1,3,4)(7,6,8) = (7,6,8)(1,3,4).
Глава 2. Не только числа 35 Циклы, которые подобно (2.13) не содержат общих перемеща- емых элементов, называются независимыми, а ситуация, отме- ченная нами для подстановки <т2, носит общий характер: всякая подстановка представляется в виде произведения ком- мутирующих между собой независимых циклов. Циклы, вхо- дящие в указанное разложение, определяются единственным образом. Доказательство этого утверждения приводится в дополнении. Читателю же мы рекомендуем найти план такого доказатель- ства экспериментальным путём, разобрав ещё несколько приме- ров подстановок и их разложений. Циклы длины 2 называют транспозициями. Другими словами, транспозиция — это подстановка, переставляющая между собой два символа, оставляя прочие неподвижными. Из подстановок, приведённых в (2.9), три являются транспозициями, а именно, Утверждение, что всякую подстановку можно полу- чить, выполняя последовательно только транспозиции, может по- казаться неожиданным. Тем не менее оно справедливо. Напри- мер, (1,2,3) = (1,3) (1,2), (1,2,3,4) = (1,4)(1,3)(1,2). Вообще, (1,2,3,... ,1) = (1,Z)(1,Z - 1)... (1,3)(1,2). Аналогичное разложение можно написать и для произвольного цикла («1,22,...,«/). Учитывая теперь, что все подстановки пред- ставляются в виде произведения независимых циклов, получим, что любая из них есть произведение транспозиций. Например, /1234567 8\_ \2 3 1 5 7 8 6 4/ = (1,2,3)(4,5,7,6,8) = (1,3)(1,2)(4,8)(4,6)(4,7)(4,5). Одна и та же подстановка может иметь различные (даже по чис- лу сомножителей) разложения на транспозиции. Например, (1,2,3) = (1,2)(2,3) = (1,3)(1,2). 2*
36 Глава 2. Не только числа Однако невозможно, чтобы в одно из разложений данной подста- новки входило чётное число транспозиций, а в другое — нечёт- ное (доказательство этого —хотя и не очень простая, но в об- щем доступная задача). По этой причине все подстановки из Sn могут быть разделены на два класса. В один из них вхо- дят все чётные подстановки, то есть разлагающиеся на чёт- ное число транспозиций, в другой — нечётные. В списке (2.9), исчерпывающем />з, подстановки <71, <74,0-5— чётны, остальные — нечётны. Множество всех чётных подстановок даёт нам ещё один при- мер группы. В самом деле, произведение двух чётных подстано- вок — снова чётная подстановка. Чётной является тождественная подстановка и подстановка обратная к чётной. Эту группу обо- значают Ап и называют знакопеременной группой. Происхож- дение терминов «симметрическая» и «знакопеременная» в назва- ниях групп Sn и Ап станет ясным из дальнейшего. Комплексные числа Рассматривая классы вычетов и подстановки, мы могли убе- диться, что существуют нечисловые объекты, для которых есте- ственно определяются операции, похожие на операции с числа- ми. Можно заподозрить, что в математике имеется немало дру- гих примеров такого рода, и это действительно так. Однако но- вый персонаж, без знакомства с которым никак не обойтись, это всё-таки числа, точнее, так называемые комплексные числа. Впервые они появляются в упоминавшемся уже сочинении «Ве- ликое искусство», автор которого Дж. Кардано наделяет их эпи- тетом «поистине софистические». Позднее (XVII век) Р. Декарт, сетуя на то, что величины эти никак невозможно себе предста- вить, называет их «мнимыми». И в XVIII веке комплексные чис- ла по-прежнему остаются таинственными сущностями. «Это по- чти амфибии», — говорит о них Лейбниц, — «находящиеся где-то между бытием и небытием». Что же это за «амфибии» и поче- му они проникли в математику, доставив её служителям немало хлопот?
Глава 2. Не только числа 37 Математики давно уже столкнулись с тем обстоятельством, что многие алгебраические уравнения оказываются неразреши- мыми (не имеющими корней), если их решения разыскивать сре- ди обычных действительных чисел. Таковыми, например, явля- ются квадратные уравнения х2 + 1 = 0, х2 + 2ж + 2 = 0. Во- обще, всякое уравнение, дискриминант которого отрицателен. Такое положение само по себе не вызывало особого беспокой- ства, но всё изменилось, когда были открыты формулы для ре- шения уравнений 3-й и 4-й степени. В предыдущей главе мы уже обсуждали те сложности, которые возникли при использовании формулы Кардано в так называемом неприводимом случае, когда кубическое уравнение имеет три различных действительных кор- ня. Тот факт, что формула для их вычисления содержит в этом случае корни квадратные из отрицательных чисел, и послужил истинным толчком для введения «мнимых», или комплексных чисел и оперирования с ними. Выражения а + £>у^1, где а, b — действительные числа, всё чаще стали встречаться в математи- ческих текстах. К ним относились как к полезным «фикциям», действия над которыми позволяли получать результаты при ре- шении различных задач, и не только алгебраических. Позднее для обозначения >/—1 Эйлером был введён символ г, названный мнимой единицей, а для комплексных чисел стала употребляться запись z = а + bi, (2.14) в которой а называется действительной частью, Ъ —мнимой частью комплексного числа z. Сложение (вычитание) комплекс- ных чисел означало просто сложение (вычитание) отдельно их действительных и мнимых частей. Например, (2 - Зг) + (1 + 4г) = 3 + i. При умножении же комплексных чисел обычным образом рас- крывали скобки и использовали равенство г2 = — 1, вытекающее из определения мнимой единицы. Так, (2 + 3г)(3 - 5г) = 6 - Юг + 9г - 15г2 = 6 - г + 15 = 21 - г.
38 Глава 2. Не только числа Эти правила в общем виде можно записать тогда следующим образом: (а 4- bi) ± (с 4- di) = (а ± с) 4- (6 ± d)i, (а + Ы)(с + di) = (ас — bd) 4- (ad 4- bc)i. Некоторым аргументом в пользу комплексных чисел было то, что законы, которым подчиняются действия над ними, в точности совпадали с законами действий над обыкновенными действитель- ными числами. Четвёртая арифметическая операция — деление — также может быть определена для комплексных чисел. Действи- тельно, пусть требуется найти такое комплексное число х 4- yi, что (х + уг)(а + Ы) = с 4- di. (2.15) Если оно существует, то как раз и является частным от деле- ния c + di на а + Ы. С уравнением (2.15) проще всего обойтись следующим образом. Умножим обе части на комплексное число z = а—Ы, называемое сопряжённым к числу (2.14). Заметим, что (а 4- Ы)(а — Ы) = а2 4- Ь2 является уже действительным числом, поэтому после умножения (2.15) на а — Ы получим (х 4- уг)(а2 4- Ь2) = (с + di)(a — Ы) = (ас 4- bd) 4- (ad — bc)i. Из последнего равенства находим частное ас + bd ad —be. Х + Уг= 2 , , 2 + 2 k2г- а2 + tr а2 4- о2 Например, 1 4- 2г _ (1 4- 2г)(3 — г) _ 5 4- 5г _ 1 г 3 4-г “ (3 4- г)(3 - г) = 10 = 2 + 2 ' Лишь в одном случае, когда а = b = 0, частного не существует. Это и понятно, так как тогда а 4- Ы = 0. Прошло немало времени, прежде чем было понято, что име- ется способ избежать какого-то мистического толкования ком- плексных чисел и, в частности, числа г. Надо лишь встать на
Глава 2. Не только числа 39 несколько иную, правда, более фор- мальную точку зрения, что и бы- ло сделано ирландским математи- ком Гамильтоном (1805-1865). Вме- сто выражений вида а + Ы он рас- сматривал упорядоченные пары (а, Ъ) действительных чисел а и Ь. Та- кую пару можно геометрически ин- терпретировать как точку плоскости, зафиксировав предварительно систе- му координат (рис. 6). На множестве всех пар Гамильтон определил операции сложе- ния и умножения, используя аналогию с операциями, рассмот- ренными выше: ' (a,b) + (c,d) = (a + c,b + d), (2.16) (а, 5)(с, d) = (ас — bd,ad + be). (2.17) При этом, как и прежде, оказываются выполнимы обратные опе- рации — вычитание и деление. Именно, (a, b) — (с, d) = (а — c,b — d), (c,d) (a,b) ас + bd а2 + 52 ’ ad — bc\ a2 + b2 J Чтобы убедиться в справедливости, например, последнего равен- ства, достаточно, используя (2.17), проверить, что (ас I bd ad 5с'Х . ,. . 2 । k2 ’ 2 i k2 / ' ’V'^d). a* + bz a2 + 52 / Для операций, определённых равенствами (2.16) и (2.17), пары (0,0) и (1,0) играют роль нулевого и, соответственно, единично- го элемента. Например, (1,0)(а,5) = (а, Ь) для любых a,b € R. Точкам действительной оси отвечают пары вида (а,0), и опера- ции над ними (опять же в силу (2.16) и (2.17)) не отличаются от операций над действительными числами (а,0) + (5,0) = (а + 5,0), (а,0)(5,0) = (а5,0).
40 Глава 2. Не только числа Это позволяет отождествить каждую пару (а,0) с действитель- ным числом а и считать, что построенная числовая система со- держит в себе все действительные числа. Совершенно другую роль играют пары вида (0,6), заполняю- щие ось ординат, и в частности, комплексное число (0,1). Оно-то и выполняет роль мнимой единицы. В самом деле, из (2.17) сле- дует. что (0,1)(0,1) = (—1,0). (2.18) Используя обозначение г теперь уже для пары (0,1) и отождеств- ление (а,0) = а, мы можем записать равенство (2.18) в виде i-г = i2 = — 1. И наконец, последний шаг, возвращающий нас, но уже с иных позиций, к записи (2.14) (а, Ь) = (а, 0) + (0, Ь) = (а, 0) + (b, 0)(0,1) = а + Ы. Впрочем, это возвращение к записи (2.14) (она называется ал- гебраической формой комплексного числа) вовсе не обязательно. Можно было бы работать с комплексными числами как с парами, оперируя над ними по правилам (2.16),(2.17). Просто алгебраи- ческая форма удобнее, к тому же она освящена традицией. Справедливости ради отметим, что геометрическое представ- ление комплексных чисел в виде точек плоскости предшество- вало описанному выше гамильтонову обоснованию. При этом, что особенно важно, была дана и геометрическая интерпретация действий над комплексными числами. Остановимся на этом по- дробнее. Рассмотрим радиус-вектор, заканчивающийся в точке (а, 6) и изображающий комплексное число z = а + Ы (рис. 7). Длину этого вектора г = а/о2 + 62 называют модулем числа z, а угол <р, образованный вектором и поло- жительным направлением оси абс- цисс, — аргументом числа z. Оче- видно, что а = rcos<p, b = rsm<p, и тогда Рис. 7. z = г(соз <р + i sin <р).
Глава 2. Не только числа 41 Полученное выражение называется тригонометрической фор- мой комплексного числа. Понятно, что сложение и вычитание комплексных чисел сво- дится к сложению и вычитанию соответствующих им векто- ров. Для выяснения геометрического смысла остальных операций удобно воспользоваться тригонометрической формой. Так, если z\ = Г1(соз ipi + i sin ), Z2 = гг(со8 <р2 + i sin ^2)» то по правилу умножения Z1Z2 = Г1Г2[(соэ ipi cos у>2 — sin ipi sin ^2)+ + г (sin cos <p2 + cos ipi sin <p2)]> и следовательно, «1^2 = nr2[cos(<pi + <£>2) + i sin(<£>i + 9?2)]- (2.19) Таким образом, умножение комплексных чисел сводится к пере- множению их модулей и сложению аргументов. Аналогично, при делении комплексных чисел их модули также делятся, а аргу- менты вычитаются Z1/Z2 = (ri/r2)[cos(^! - ^2) + isin^i - ^2)]- Теперь нетрудно понять, что с комплексными числами связаны хорошо нам знакомые преобразования плоскости — поворот, го- мотетия и параллельный перенос. Так например, если z — про- извольное комплексное число, a zq — фиксированное, то соответ- ствие z -+ z+zq определяет параллельный перенос на вектор, от- вечающий числу zq- При умножении же получаем соответствие z —> zzq, равносильное, как показывает формула (2.19), компози- ции двух преобразований — поворота на угол <ро (аргумент чис- ла zq) и гомотетии с коэффициентом го равным модулю этого числа. В частности, если го = 1, то получаем чистый поворот, а при <ро = 2тг&, то есть zq = го, получаем чистую гомотетию. Выходит, что Декарт был не прав — представить комплексные числа всё-таки можно, и названия «мнимые» они, пожалуй, не
42 Глава 2. Не только числа заслуживают. Важно, что на этих геометрических представлени- ях и основаны многие применения комплексных чисел в разных областях математики. Для алгебры наиболее существенно то, что в области комплексных чисел становится разрешимым алгебра- ическое уравнение любой степени. Это утверждает так называ- емая основная теорема алгебры, точную формулировку которой читатель найдёт в следующей главе. Особое значение для дальнейшего имеет уравнение вида zn = = с, с — некоторое комплексное число. Решения этого урав- нения (мы покажем, что их ровно п) называют корнями n-й сте- пени из числа с. Для их отыскания удобнее всего использовать тригонометрическую форму комплексных чисел. Пусть с = p(cos а + i sin си) (2.20) и z = r(cosy> + i sin <р) — некоторое решение уравнения zn = с. Тогда согласно (2.19) получаем zn = rn(cos n<p + i sin n<p). (2.21) Сравнивая (2.20) и (2.21), заключаем, что rn = р, п<р = а + 2?rfc, (к € Z). Следовательно, а 2тгк r=^, V=- + — , и всякий корень n-й степени из с может быть записан в виде (а 2як\ ..fa 2тгк\ ,, —I-----+ г sin —|--------I , (к 6 Z). п nJ \п п JJ (2.22) Хотя к и пробегает здесь бесконечное множество значений, однако число различных корней, как нетрудно заметить, конеч- но. Всё дело в том, что двум значениям к сравнимым по модулю п, отвечает в формуле (2.22) одно и то же комплексное число. А значит, для того, чтобы получить все корни уравнения, доста- точно рассмотреть значения к от 0 до п — 1. Например, корни
Глава 2. Не только числа 43 Рис. 8. кубические из —1 (решения уравнения z3 = — 1) таковы 7Г . . 7Г 1 ,V3 Хо = cos- + ?sm- = - + г—, 5тг . . 5тг Z2 = cos — -Hsin — О о Zl = COS7T + isinTT = —1, 1 .л/з “ 2 г 2 Легко заметить (рис. 8 а)), что точки на плоскости, изобража- ющие числа zo, z\, Z2, лежат в вершинах правильного треуголь- ника, вписанного в окружность единичного радиуса. Распростра- няя это наблюдение на общую ситуацию, можно прийти к выводу, что корни n-й степени из с изображаются точками, лежащими в вершинах правильного n-угольника, вписанного в окружность радиуса ^/р. В дальнейшем нам не раз придётся обращаться к решениям уравнения zn = с и прежде всего к решениям уравнения zn = 1, то есть к корням n-й степени из 1. Как следует из предыдущего, они имеют вид 2тг/г . . 2тг/с Zk = cos-----1- г sin-. п п Рисунок 86) даёт их геометрическое изображение. Множество этих корней — будем его обозначать Сп — обладает рядом инте- ресных алгебраических свойств. Можно заметить, что все корни могут быть получены из одного z\ путём возведения в подходя-
44 Глава 2. Не только числа —п = Zk (к = 0,1,... ,п — 1). к щую степень. В самом деле, л. / 2тг . . 27r\fc z, = cos-----1- г sin — I = \ n nJ 2irk . . = cos----1- г sin n По этой причине z± называют первообразным корнем. И ещё, если перемножить любые два корня из I Zk и zm, то результатом будет снова корень из I, поскольку (^m)n = z”z” = 1. Любопытно также и то, что в правиле перемножения корней мы можем отметить аналогию со сложением классов вычетов. Дей- ствительно, 2я(к + т) . . 2тг(& + т) ZkZm = COS------------ь г sin--------- п п Если к + т < п, то, очевидно, ZkZm = Zk+щ. Если же к + т = = п + г п, то 2?r(fc + т) . . 2тг(Лг + т) cos-------------Ь г sin-----------= п п 2тгг\ . . / 2тгг\ 2тгг . . 2тгг 2тг -I---+ г sin 2тг Ч---------| = cos-------1- г sin-, п J у п / п п и следовательно, ZkZm = zr, где г = к + т mod п (0 < г < п). Всё это означает, что равенство ZkZm = zr в Сп выполняется тогда и только тогда, когда к + т = г в кольце вычетов по мо- дулю п, то есть умножению корней из 1 соответствует сложение классов вычетов. Иллюстрацией сказанного может служить приводимая ниже (табл. 2) таблица умножения корней 5-й степени из 1 (сравните её с таблицей сложения классов вычетов по модулю 5).
Глава 2. Не только числа 45 Таблица 2. • *0 Z1 Z2 Z3 Z4 zo *0 Z1 Z2 Z3 Z4 Z1 Z1 *2 Z3 Z4 Zo Z2 Z2 Z3 Z4 ZQ Z\ *3 Z3 Z4 Z0 Z\ Z2 г4 *4 zo Z1 Z2 Z3 Дополнения и задачи 1. В Z7 и в Zio указать все обратимые элементы и найти к ним обратные. 2. Найти элемент х е Z5, являющийся решением уравнения 2ж = 3 и убедиться, что это решение единственно. 3. Определить, сколько решений в Z12 имеет каждое из следую- щих уравнений, и найти эти решения а) Зж = 6, б) 4ж = 5. 4. Показать, что система Зж + 2у = 8 2х + Зу = 5 имеет единственное решение (ж; у), где ж, у € Zu, и найти это решение. Имеет ли решение в Zu система Зж + 2у = 8 2ж + 5у = 5 ? к Можно ли указать какой-нибудь признак, позволяющий понять, когда система линейных уравнений < Я1Ж + 61У = С1 О2Ж + &2У = С2
46 Глава 2. Не только числа с коэффициентами из Zn имеет в Zn единственное решение, ко- гда решений несколько, когда их нет вовсе? В поисках такого признака полезно рассмотреть ещё какие-нибудь примеры. 5. Вот как доказывается сформулированная в основном тексте теорема о разложении любой подстановки в произведение неза- висимых циклов. Пусть а — подстановка, действующая на мно- жестве М. Для произвольного элемента а € М рассмотрим мно- жество А = {а,<т(а),а2(а),..(2.23) содержащее вместе с а его образы при повторном применении подстановки а. Множество А называют орбитой элемента а. Ес- ли b е М — другой элемент, то для его орбиты В = {Ь,<т(Ь),а2(Ь),...} имеются лишь две возможности: либо она совпадает с орбитой (2.23), либо вообще не имеет с ней общих элементов. В самом деле, пусть орбиты А и В имеют непустое пересечение и пусть элемент с € А П В. В этом случае с = afc(a) = am(b). (2.24) Пусть для определённости к > т. Применяя к обеим частям равенства (2.24) подстановку сг~т, получим: cr-rn(<7fe(a)) = о~т(сгт(ЬУ) = Ь, или Ь = о1 (а), где I = к — т. (2.25) Последнее означает, что Ь € А, а значит, и все образы <тг(Ь) = = стг+*(а) принадлежат орбите А, то есть В С А. Пусть ст* = е. Снова обратимся к равенству (2.25). Применяя к обеим его частям t — I раз подстановку а, получим <7t-z(b) = а*_/(стг(а)) = ст* (а) = е(а) = а, поэтому а € В, а следовательно, и А С В, то есть А = В. Итак, орбиты либо совпадают, либо не имеют общих элементов. Значит, множество М можно представить как объединение непе- ресекающихся орбит М = AUBUCU...
Глава 2. Не только числа 47 Этому разбиению и соответствует разложение подстановки а в произведение независимых циклов: а = (а, а(а), а2(а),...) (Ь, а(Ь), а2(Ь),...) (с, а(с), а2 (с),...)... Попытайтесь самостоятельно понять, как убедиться в единствен- ности такого разложения. 6. Ясно, что если цикл длины I повторить I раз, то в результате получится тождественная подстановка. Сколько раз (как мини- мум) надо для этого повторить произвольную подстановку, ес- ли она раскладывается на независимые циклы, длины которых /1,?2, • • • Докажите, что наименьшее число повторений равно наименьшему общему кратному чисел h, I2, . ,lr- 7. Докажите, что число чётных подстановок в Sn совпадает с чис- лом нечётных. Для этого достаточно убедиться, что если г — произвольная нечётная подстановка, а / пробегает знакопере- менную группу Ап, то соответствие f —> rf является взаимно однозначным соответствием между чётными и нечётными под- становками. 8. Кроме группы подстановок, рассмотрим ещё один важный для дальнейшего пример группы преобразований. Движением плоскости назовём такое её преобразование f, которое сохраня- ет неизменным расстояние между любыми двумя точками этой плоскости1. Другими словами (см. рис. 9), расстояние между об- разами А' = /(А) и В' = f(B) точек А и В всегда такое же, как и между исходными точками: l-A'B'l = |АВ|. Ясно, что компо- зиция двух движений есть снова движение. Читатель без труда проверит, что свойства (2.10), (2.11), (2.12) также оказываются выполненными и для движений. Совокупность всех движений с определённой для них опе- рацией умножения (композиции) называют группой движений плоскости. Примерами движений, понятно, являются параллель- ные переносы и повороты плоскости на произвольный угол. Ещё один тип движений — это так называемые зеркальные отражения 1 Это понятие имеет, конечно, смысл и для пространства.
48 Глава 2. Не только числа Рис. 9. Рис. 10. (осевые симметрии) относительно любых осей (рис. 10). В следу- ющих пунктах мы покажем, что этими тремя типами преобразо- ваний «почти» исчерпываются все движения плоскости. 9. Выше говорилось о том, что имеется тесная связь между опе- рациями над комплексными числами, с одной стороны, и пре- образованиями плоскости, с другой. Можно добавить к этому следующее. а) Пусть f — поворот плоскости на угол а вокруг произволь- ной точки zq, точнее, точки, изображающей комплексное число zq (рис. 11). Тогда, если г/ = /(г) —образ точки z при этом пре- образовании, то z' = zq + (z — zq) (cos a + i sin a). (2.26) Действительно, вектор У — zq получается из вектора z — zq пово- ротом на угол а. Следовательно, / = zq + (z — zq)(cos а + i sin a). б) Если / — зеркальное отражение относительно оси О А, со- ставляющей с Ох угол а (рис. 12), и / = f(z), то z1 = z (cos 2a + i sin 2a). (2.27) где z — число, комплексно сопряжённое c z. Для доказательства достаточно убедиться, что угол между векторами z1 и z равен 2a (сделайте это самостоятельно). Справедливы и утверждения, обратные к а) и б); таким об- разом, формулы (2.26) и (2.27), связывающие z и z', полностью характеризуют преобразования поворота и зеркального отраже- ния соответственно. 10. Что можно сказать о композиции движений различных ти- пов? Ответ содержится в утверждениях этого пункта.
Глава 2. Не только числа 49 Рис. 11. а) Произведение двух сдвигов есть сдвиг. б) Произведение (в любом порядке) поворота, отличного от тождественного, и сдвига есть поворот. в) Произведение двух поворотов на углы ац и сиг есть поворот на угол cti+a2, если ai+«2 / 2тг/с, и параллельный перенос в противном случае. г) Произведение двух зеркальных отражений относительно осей, пересекающихся под углом а, есть поворот на угол 2а вокруг точки пересечения осей. д) Произведение двух зеркальных отражений относительно параллельных осей есть сдвиг в направлении, перпенди- кулярном осям, на расстояние, равное удвоенному расстоя- нию между осями. е) Произведение (в любом порядке) поворота и зеркального отражения есть зеркальное отражение. Первое утверждение очевидно, к тому же оно комментировалось в основном тексте. Остальные можно доказать, используя связь движений с комплексными числами1. Вот как доказываются, на- пример, утверждения б) и г). Пусть Д — сдвиг на вектор z\, Д — 1 Имеются и чисто геометрические доказательства перечисленных утвер- ждений (см., например, [30]).
50 Глава 2. Не только числа нетривиальный поворот с центром в точке zq на угол а. Положим для краткости e(ct) = cos а + i sin а. Тогда, с учетом (2.26), AC?) = z + zi, f2(z) = zq + (z - zq) e(a). Образ произвольной точки z при действии композиции fif2 на- ходим простым вычислением /1 (/г(^)) = /1(«о + (z - zq) е(а)) =z0 + z1 + (z- zq) е(а). (2.28) Проверим, что полученное равенство можно записать в виде fi(f2(z))=z() + (z-z())e(a). (2.29) где z'o — подходящим образом подобранное комплексное число. Этим и будет доказано, что Д/2 есть поворот. Сравнивая правые части равенств (2.28) и (2.29), приходим к соотношению Zq + Z1 - ZQ е(а) = Zq - Zq в(о). Так как по предположению /2 — нетривиальный поворот, то е(а) / 1, и следовательно, искомый центр поворота может быть найден из равенства , _ -гр + -zi - zq е(а) Z° 1 — е(а) Мы доказали утверждение б). Пусть теперь Д и f2 — зеркальные отражения относительно осей ОAi и ОА2, составляющих неравные углы ai и а2 с осью Ох (рис. 13). Тогда угол между осями ОА± и ОА2 равен а2 — а±. Согласно (2.27) fi(z) = ze(2ai), f2(z) = ze(2a2), f2fi(z) = f2(ze(2ai)) = ze(2ai) e(2a2) = ze(-2ai)e(2a2).
Глава 2. Не только числа 51 Рис. 14. Так как всегда е(а:)е(/?) = (cos а + i sin a) (cos (3 + i sin/3) = = cos (а + /?) + i sin(a! + /3) = e{a + /3), то получаем окончательно /2(Л(-г)) = ze(2(az — и значит, /2/1 — поворот вокруг точки О на угол 2(аг—ац)> вдвое больший, чем угол между осями. Утверждение г) доказано. 11. Читатель мог заметить, что лишь один случай — компози- ция сдвига и зеркального отражения — не охвачен утверждения- ми а)-е) предыдущего пункта. Возникающие при этом преобра- зования—они называются скользящими отражениями —уже не сводятся к трём предыдущим типам. Можно лишь доказать, что всякое скользящее отражение может быть представлено как композиция сдвига и зеркального отражения, ось которого па- раллельна вектору сдвига. Комплексные числа позволяют сде- лать и это, однако удобнее здесь воспользоваться геометриче- скими рассуждениями (предоставляем читателю провести их, ис- пользуя рис. 14). Из сделанного здесь замечания и утверждений предыдущего пункта вытекает следующий основной результат. Всякое движение плоскости является или параллельным пе- реносом, или поворотом, или зеркальным отражением, или скользящим отражением. Впрочем, зеркальное отражение можно рассматривать как частный случай скользящего отражения, а именно, когда вектор параллельного переноса нулевой.
ГЛАВА 3 «ВЫЗОВ ЧЕЛОВЕЧЕСКОМУ РАЗУМУ» Как уже отмечалось, с момента появления «Великого искусства» не прекращались настойчивые попытки найти формулы для ре- шения алгебраических уравнений пятой и более высоких степе- ней и, быть может, общий метод решения таких уравнений. На- копленный опыт как будто подсказывал, что решение уравнений степени п не потребует операций более сложных, чем извлече- ние корней степени, не превосходящей п. Так обстояло дело для уравнений второй, третьей и четвертой степени. Так, по мне- нию многих, должно было быть и в общем случае. Математики разных рангов атаковали проблему, однако неудача следовала за неудачей. К XVIII веку прежний энтузиазм в поисках магических формул несколько истощился. Всё же убеждённость в разреши- мости всех алгебраических уравнений в радикалах не была ещё поколеблена предшествующими неудачами. Новая страница в этой затянувшейся на два с лишним века истории открывается с выходом в свет в 1770 году обширного мемуара «Размышления об алгебраическом решении уравнений». Автором его был замечательный французский математик Жо- зеф Луи Лагранж. Нельзя сказать, что старая проблема, кото- рой занялся среди многих математиков и Лагранж, находилась на столбовых путях развития математики того времени. Прежде всего, конечно, это был период бурного накопления новых знаний в области математического анализа, дифференциальных уравне- ний, вариационного исчисления, аналитической механики. Здесь же группировались и основные интересы Лагранжа. Математики
54 Глава 3. «Вызов человеческому разуму» понимали также, что поиск формул для решения алгебраических уравнений даже в случае успеха не мог сулить каких-либо выгод для практических приложений. Даже уравнения третьей и чет- вёртой степени никто не решал по известным формулам Кардано и Феррари — это было слишком неудобно. Основную роль игра- ли различные приближённые методы, которые позволяли отыс- кивать корни алгебраических уравнений произвольной степени (и не только алгебраических) с любой степенью точности. Но вопрос о возможности выражения корней многочлена через его коэффициенты с помощью алгебраических операций был всё же принципиальным. И Лагранж со свойственным ему всегда стрем- лением к отысканию общих идей, лежащих в основе той или иной задачи, идёт на приступ проблемы, которая, по собственному его выражению, была «как бы вызовом человеческому разуму». ,Сто- ит напомнить, что по сравнению с эпохой Кардано лицо алгебры к этому моменту сильно изменилось. Трудами Виета и Декарта в обиход прочно вошла удобная математическая символика, поз- воляющая компактно записывать уравнения и неравенства; лег- ко, почти автоматически, производить различные алгебраические преобразования. Был снят покров таинственности с комплексных чисел, и математики достаточно свободно оперировали с ними. За двести лет алгебра обогатилась рядом новых важных фак- тов, и в этом ряду центральное место занимала так называемая «основная теорема алгебры». Согласно этой теореме всякий мно- гочлен f(x) = хп + a-ixn~1 + ... + On-ix + ап степени п с комплексными (в частности, действительными) ко- эффициентами имеет ровно п комплексных корней, если каждый корень считать столько раз, какова его кратность (кратность кор- ня »о считается равной k, если многочлен делится на (ж — хо)к, но не делится на (ж — »o)fe+1)- При этом, если Ж1,жг,... ,хп — корни (среди этих корней возможны одинаковые), то многочлен раскладывается на линейные множители следующим образом /(ж) = (ж - Ж1)(ж - жг)... (ж - жп). Простейшим частным случаем этой формулы является известное
Глава 3. «Вызов человеческому разуму» 55 из школьного курса разложение квадратного трёхчлена х2 + рх + q = (х — Ж1)(ж — жг). Утверждение основной теоремы алгебры было сначала найде- но эмпирическим путём. Первые доказательства (правда, небез- упречные) принадлежали Даламберу и Эйлеру, и лишь на рубеже XVIII и XIX веков полное доказательство (и не одно, а целых четыре!) было дано Гауссом. Задолго до доказательства основ- ной теоремы алгебры Виетом были открыты соотношения между корнями алгебраического уравнения и его коэффициентами. Фор- мулы Виета для квадратного уравнения ж2 + рх + q = 0 хорошо известны читателю. Они имеют вид Х1 + Ж2 = -р, Ж1Ж2 = q. (3.1) Метод получения этих формул легко распространяется на урав- нения высших степеней. Например, пусть Ж1, жг, жз —корни ку- бического уравнения ж3 + О1Ж2 + агж + аз = ,0. Тогда ж3 + ахж2 + -Ьагж + аз = (ж-Ж1)(ж-Ж2)(ж-жз). Раскрывая скобки в правой части, получим Q 9 ж + а1Ж + азж + аз = = Ж3 - (Ж1 + Ж2 + Жз)ж2 ;+ (Ж1Ж2 + Ж1Жз + Ж2Жз)ж - Ж1Ж2Ж3. Сравнивая коэффициенты при одинаковых степенях ж, приходим к формулам Виета для кубического уравнения: Я1+Ж2+Ж3 = —ai, Ж1Ж2+Ж1Ж3+Ж2Ж3 = аг, Ж1Ж2Ж3 = —03. (3.2) Подобные вычисления можно проделать и для уравнения произ- вольной степени ж” + ахж”-1 + агж”-2 + ... + ап_]Х + On = 0. (3.3)
56 Глава 3. «Вызов человеческому разуму» В результате получим + хз + ... + хп = -ai, 4” 4” • • • 4” Xji—lXji 02, ®1»2®3 + ®1»2®4 + • • • + Хп-2Хп-1Хп = -аз, (3.4) а?1®2®з • • • хп = (- 1)пОп. Это и есть наиболее общий вид формул Виета. В связи с ни- ми можно рассмотреть понятие симметрического многочлена от нескольких переменных. Многочлен Р(х1,Х2,хз,.. .,хп) называ- ется симметрическим, если он остается неизменным при любой перестановке своих переменных. Многочлены в левых частях ра- венств (3.1), (3.2) и (3.4) представляют собой как раз симметри- ческие многочлены от двух, трёх и п переменных. Они носят осо- бое название — элементарные симметрические многочлены. Ра- зумеется, не всякий симметрический многочлен является элемен- тарным. Не таков, например, симметрический многочлен х^Х2 4- + xix% от двух переменных. Однако оказывается, что его можно выразить через элементарные zi +Х2 и xiX2. Действительно, Х$Х2 + Ж1Х2 = ®1®2 (xl + xl) = Я1®2 ((^1 + ^г)2 - 2Х]Х2)- (3.5) Замечательно, что любой симметрический многочлен можно единственным образом представить в виде многочлена от элементарных симметрических многочленов. Этот факт, назы- ваемый основной теоремой о симметрических многочленах, был уже известен во времена Лагранжа1. Однако вернёмся к работе самого Лагранжа. Автор «Размыш- лений» ставит перед собой задачу выявить и как-то сформулиро- вать общие причины того, что методы, ведущие к успеху в случае уравнений степени не выше четырёх, оказываются бессильными для уравнений более высокой степени. Оказывается, эти причи- ны связаны как раз со свойствами симметрии многочленов от нескольких переменных. Разберемся в этом поподробнее. 1 Доказательство можно найти, например, в книге [3].
Глава 3. «Вызов человеческому разуму» 57 Прежде всего, из основной теоремы о симметрических много- членах и формул Виета непосредственно следует, что при за- мене переменных xi,X2,. ,хп в симметрическом многочлене <p(xi,X2,... ,хп) корнями уравнения (3.3) он принимает значе- ние, выражающееся через коэффициенты ai,a2,. • ,ап с помо- щью обычных арифметических операций. Это означает, что если коэффициенты уравнения рациональны, то любой симметри- ческий многочлен от его корней также обязательно имеет рациональное значение, хотя сами корни могут быть и числа- ми иррациональными. Например, корни = 1 ± д/2 уравнения х1 2 — 2х — 1 = 0 иррациональны. В то же время, значение симмет- рического многочлена х2Х2 + xix% от этих корней рационально и равно —6. Конечно, иное дело, если многочлен <p(xi,X2, ,а?п) не является симметрическим. Однако, имеется немало таких мно- гочленов, которые хотя и не являются симметрическими, но об- ладают, так сказать, частичной симметрией. Поясним сказанное примером многочлена от трёх переменных А(Х1,Х2,Х3) = (Х1 - ®2)(«1 - ®з)(®2 - Х3). Легко заметить, что он не меняет своего вида при следующих подстановках из S3 (не считая тождественной) 1 2 3\ /12 3\ 2 3 1) И \3 1 2J ’ Например, ЩХ2,Х3,Х1) = (»2 -®з)(®2 -Ж1)(®3 -®1) = Д(®1,«2,Жз). Остальные три подстановки из S3 1 2 3\ /12 3\ /1 2 3\ 2 1 зу ’ V 3 2/ \3 2 V меняют, как нетрудно видеть, этот многочлен на противополож- ный. Таким образом, если переменные заменить корнями неко- торого кубического уравнения, то при шести возможных под- становках из симметрической группы S3 многочлен A(xi,x2,x3)
58 Глава 3. «Вызов человеческому разуму» принимает не больше двух различных значений, тогда как произ- вольный многочлен от трёх переменных мог бы принять значений столько, сколько имеется различных подстановок, то есть шесть. Примером может служить хотя бы многочлен х^+Ъхг+Зхз. Резю- мировать сказанное можно так: частичную симметрию многочле- на <p(xi,X2,... ,хп) можно охарактеризовать числом к различных многочленов <£>1,^2, • • • ,<Рк, которые могут получиться при все- возможных подстановках аргументов х^,Х2,. ,хп- Чем меньше это число, тем симметричнее многочлен. Симметричные много- члены ни при каких подстановках не меняются, для них к = 1. Наоборот, те многочлены, для которых к максимально и равно п!, можно считать полностью несимметричными. Имеется и другая, быть может, даже более естественная воз- можность охарактеризовать свойство симметрии многочлена. Вы- ше на примере многочлена Д(а;1,Я2,яз) мы видели, что некото- рые подстановки аргументов могут оставлять многочлен неизмен- ным (к их числу всегда принадлежит тождественная подстанов- ка). Для фиксированного многочлена 9?(xi,®2, • • • ,®п) рассмот- рим множество Н всех таких подстановок. Их число т также может служить характеристикой симметрии многочлена <р: мно- гочлен тем более симметричен, чем больше т. Лагранж выяснил, какова связь между числами к и т. Прежде всего, он обнаружи- вает, что множество Н подстановок, сохраняющих неизменным данный многочлен, образуют подгруппу в симметрической груп- пе Sn. Напомним, что это означает следующее: 1) если <Т1,<Т2 £ Н, то есть подстановки <72 и <72 не меняют многочлена </?, то и их композиция также обладает этим свойством, то есть <7i<72 € Я; 2) тождественная подстановка е € Я; 3) если а € Я, то и ст-1 € Я. В истинности этих трёх утверждений читатель легко может убе- диться самостоятельно. Далее Лагранж отвечает на вопрос, каковы те множества подстановок, которые одинаковым образом преобразуют много- член ip, скажем, один из многочленов <pi (г = 1,2,...,&)? Если
Глава 3. «Вызов человеческому разуму» 59 а — одна из таких подстановок, то любая из таких подстановок имеет вид ah, где h 6 Н — произвольная подстановка, не меня- ющая многочлен (р. Зафиксируем ст» и обозначим аН = {ah \hEH}. В традиционной терминологии это так называемый левый смеж- ный класс по подгруппе Н. Один из смежных классов совпадает с самой подгруппой Н: если положить <pi = 9? и если а — любая из подстановок, не меняющих многочлен <р, то аН = Н. Всего же получается k смежных классов аН, оъН, акН, отвечающих вышеописанным образом многочленам ч>1,<Р2,-- ,<Рк соответственно. В примере с многочленом Д(я1,а;2,®з) ситуация такова. Один из смежных классов, как отмечено, есть сама под- группа (/1 2 3\ /12 3\ /1 2 3\ 1 [Д1 2 3J ’ V 3 I/ ’ \3 1 2JJ ’ а другой класс —это множество всех остальных подстановок из S3 1 2 3^ И =! Р 2 f1 2 3^ (1 2 3М 2 1 ЗуЯ-Ц2 1 з) ’ \1 3 2J ’ V3 2 1/J’ Этот простой пример ясно отражает общую ситуацию: 1) любые два смежных класса либо совпадают, либо не содер- жат общих элементов (две подстановки, принадлежащие разным смежным классам, не могут совпадать просто по- тому, что они по-разному преобразуют многочлен ip; 2) любые два смежных класса содержат одинаковое число подстановок, равное т — числу подстановок в Н (разным подстановкам hi,h,2 € Н отвечают подстановки ahi, ah>2 смежного класса аН, которые также различны).
60 Глава 3. «Вызов человеческому разуму» Таким образом, симметрическую группу Sn можно представить в виде объединения к непересекающихся смежных классов Sn = 01Н U 02Н U ... U ОкН, в каждом из которых т элементов. Отсюда и вытекает искомая связь между числом к различных многочленов, получающихся из многочлена подстановками переменных, и числом т под- становок, сохраняющих этот многочлен неизменным: кт — п!. (3.6) Мы подходим к важному пункту «Размышлений» Лагранжа, а именно к вопросу о том, как отражается свойство частичной симметрии многочлена <p(xi,X2, ,хп) на значениях, которые он принимает при подстановке корней уравнения (3.3). Напомним, что то единственное значение, которое принимает симметриче- ский многочлен при любой подстановке корней уравнения (3.3), рационально, если рациональны коэффициенты уравнения. Пусть Х2,.. •, хп — корни произвольного уравнения (3.3) с рациональными коэффициентами, и пусть ^(х1,Я2,... ,хп) при- нимает к различных значений ipi = ip,<p2,-- - ,<Рк при всевозмож- ных подстановках аргументов, причём = <р(х^,х^,... ,Xin) для некоторой подстановки /1 2 ... п\ CTi = . . I . 12 ••• «п/ Рассмотрим многочлен fc-ой степени (х - <pi)(x — <р2)...(х — <рк) = хк + bi®*-1 + Ъ2Хк~2 + ... + bk, корнями которого являются значения <pi,<p2, - ,<Рк- По форму- лам Виета коэффициенты • • • ,bk равны значениям соответ- ствующих симметрических многочленов от <pi, ip2, • • •, W- &1 = — (<Р1 + ¥>2 + • • • + У’Лг), ь2 = <Р\<Р2 + WP3 + • • • + <Рк-1Ч>к, bk = (~1)к<Р1<Р2 -..<Рк-
Глава 3. «Вызов человеческому разуму» 61 Легко видеть, что любая подстановка корней xi,X2,... ,хп при- водит лишь к перестановке слагаемых в правых частях равенств (3.7) и, следовательно, оставит значения правых частей без из- менения. Это означает, что коэффициенты bi,b2,... ,bk являют- ся симметрическими многочленами от корней уравнения (3.3) с рациональными коэффициентами, и значит, сами они также рациональны. Итак, если многочлен <p(xi,X2,... ,хп) при всех подстановках корней принимает к значений, то эти значения (в том числе и <pi = <p(xi,X2,. ,хп)) являются корнями уравне- ния степени к с рациональными коэффициентами. Если много- член ^(®1,Ж2> • • • ,®п) достаточно симметричен, скажем, настоль- ко, что к < п, то для отыскания ^1,^2,...,^ придётся решать уравнение меньшей степени, чем первоначальное. Так для рас- смотренного выше многочлена А = Д(гС1,гс2,гсз) число к = 2, при этом Д1 = Д, Дг = — Д. Следовательно, bi = — (Д1 + Аг), Ъ2 = Д1Д2 = — Д2> и значения Д1, Дг являются корнями квадратного уравнения ж2 — Д2 = 0. Коэффициенты получившегося уравнения рацио- нальны, поскольку Д2 является уже, очевидно, симметрическим многочленом. Детально анализируя известные методы решения уравнений, Лагранж обнаруживает общность их в том, что все они сводятся к рассмотрению как раз таких функций от корней, которые об- ладают описанными выше свойствами симметрии, а именно, при всевозможных подстановках принимают меньше различных зна- чений <pi, <р2, • • • ,<Рк, чем степень исходного уравнения. Поэтому и отыскание их, как мы говорили выше, представляет задачу бо- лее простую, чем отыскание самих корней. Лагранж замечает также, что каждый из кубических ради- калов, входящих в формулу Кардано, можно записать в виде -(а?1 + ах2 + а2хз), где а —один из кубических корней из еди- ницы, отличный от единицы. Это наблюдение приводит Лагран- жа к общему по своей идее выводу формул для решения урав- нений второй, третьей и четвёртой степени. Для произвольного
62 Глава 3. «Вызов человеческому разуму» уравнения степени п он рассматривает выражения вида t = + а»2 + + • • • + ап_1хп, (3.8) где а —один из корней степени п из единицы, отличный от единицы, a xi,X2,... ,ж„ — искомые корни данного уравнения. Эти выражения называют сейчас резольвентами Лагранжа, они и могут быть использованы для построения функций, облада- ющих частичной симметрией. Продемонстрируем сказанное на примерах уравнений третьей и четвёртой степени. Рассмотрим резольвенту t(x\,X2,x$) = + ах2 + ос2х% для приведённого кубического уравнения х3 + рх + q = 0. При цик- /1 2 лическои подстановке корней а = I ЗА 11 получаем = Х2 + OCXs +a2Xi = = a2 (xi + ах2 + а2хз) = «2 i(®i, ®2, ®з), то есть при указанной подстановке исходная резольвента умно- жается на а2. Возводя в куб обе части предыдущего равенства и используя то, что а3 = 1, мы приходим к соотношению i3(®2,^3,®l) ='t3(xi,X2,Xs). Иными словами, функция t3 инвариантна (то есть не меняется) при действии циклической подстановки а. Отсюда следует её 2 Л 2 3\ инвариантность и относительно подстановки а2 = I „ 1 о I. \ о 1 Z) Впрочем, это можно доказать и непосредственно. Итак, имеется три подстановки (т = 3), не меняющие значение t3: 1 2 3\ /12 3\ /1 2 3\ 1 2 ЗУ’ V2 3 1)’ \3 1 2/ Вспомнив соотношение (3.6), заключаем, что число к различных значений t3 при всевозможных подстановках корней равно двум, и следовательно, эти значения, равные 01 = t3(xi,X2,x$) и 02 = = t3(xi,xs,X2), являются корнями квадратного уравнения у2 — (#1 + #г)у + #1#2 = 0,
Глава 3. «Вызов человеческому разуму» 63 коэффициенты которого выражаются через р и q. Непосредствен- ным вычислением находим 01 + 02 = (®1 + + а2хз)3 + (®1 + а®з + а2а?2)3 = = 2(o?i + а;3 + х3 + 6®1Ж2Жз)+ + 3(а + о?)(х2Х2 + х\х2 + х2хз + rcix2 + х|хз + хгх2). Поскольку а — корень уравнения х2 + х -I-1 = 0, то а 4- а2 = = —1. Дополняя выражение в первых скобках до полного куба, получим с учётом сказанного 014-02 = 2(Х1+Х2+Хз)3-9(х2Х2+Х1Х2+Х2Х$+Х1Х2+Х2Хз+Х2х1). Согласно формулам Виета, xi + Х2 + хз = 0, (3.9) Поэтому 01 + 02 = -9[xiX2(xi + Х2) + Х1Хз(х1 + х3) + %2Хз(х2 + хз)] • Но Xi + Х2 = -жз>. xi + хз = —Х2, Х2 + х3 = —хг, откуда 01 + 02 = 27x1x2x3 = —27g. Совершенно аналогично, 0102 = (о?1 + ах2 + a2x3)3(xi + ахз + а2ж2)3 = = [х2 + а?! + х2 + (а + а2)(х1Х2 + Х1Х3 + ®2®з)]3 = = [х2 + х2 + X2 - (®1®2 + Х1Х3 + ®2®з)]3 = (3.10) = [(Я1 + Х2 + Хз)2 - 3(xi®2 + Х1»з + Х2«з)]3 = = —27р3. Таким образом, получаем, что квадратное уравнение, корнями которого являются 01 и 02, имеет вид у2 + 27 qy — 27р3 = 0, а значит, «1,2 = -ф±27^ + ^. (3.11) До формулы Кардано теперь лишь один шаг. В самом деле, ^(х1,Х2,хз) = Ж t(xi,X3,®2) = v^2- В качестве значения
64 Глава 3. «Вызов человеческому разуму» может быть взят любой из трёх кубических корней из 01, тогда при выборе подходящего значения t(xi,X3,X2) нуж- но исходить из равенства t(xi,X2,X3)t(xi,X3,X2) = — Зр (срав- ните с (3.10)). Учитывая, кроме того, равенство (3.9), приходим к системе: ' Xi + ах2 + а2хз = \/01 < Х1 + О?Х2 + ахз = \/&2 ХХ + Х2 + «з = 0. Сложим все три уравнения, не забывая, что 1 + а + о? =0. Это даёт 3xi = \/Э1+ Ж, откуда с учётом (3.11) получаем наконец Важно, что проведённые рассуждения позволяют определить все корни кубического уравнения (вспомните трудности с форму- лой Кардано). Так, умножая первое уравнение системы на а2, второе —на а и складывая получившиеся уравнения (включая и третье), получим 3®2 = О!2 ^7 "I" а х/@2> Совершенно аналогично, Рассмотрим теперь общее уравнение четвёртой степени х4 + aix3 + О2Х2 + адх + ад = 0. Среди корней четвёртой степени из единицы имеется корень —1, его и удобно взять в качестве а в резольвенте Лагранжа для этого уравнения. Резольвента тогда имеет вид t = Х1 — Х2 + Хз — Хд. (3.12)
Глава 3. «Вызов человеческому разуму» 65 Нетрудно сообразить, что её не меняют следующие четыре под' становки (и только они) 1 2 3 4\ /1 2 3 4\ /1 2 3 4\ /1 2 3 4\ 1 2 3 4^3 2 1 4У’ V 4 3 2/’ \3 4 1 2)' В группе S4 в общей сложности 4! = 24 подстановки. При дей- ствии этих подстановок на выражение (3.12) получим шесть раз- личных выражений 01 = Xi - Х2 + Яз - ®4, 02 = -Х1 +Х2+Х3- Х4, 03= Х1+Х2-Х3- х4, -01 = -Х1 +Х2-Х3+ х4, -02 = Х1 - Х2 - Хз + а?4, -03 = -Х1 -Х2 + Х3+ х4. Они являются корнями многочлена шестой степени Р(у), коэф- фициенты которого рационально выражаются через коэффици- енты а1,а2,аз,а4. К счастью, этот многочлен (читателю пред- лагается самостоятельно найти его вид) содержит лишь чётные степени у. В самом деле, корни его разбиваются на пары про- тивоположных друг другу чисел, и потому он разлагается на множители следующим образом Р(у) = (У~ 01)(.У + 01)(У ~ 02)(у + 02)(у - 0з)(у + 0з) = = (y2-W-0lHy2~0l). Очевидная подстановка z = у2 сводит тогда задачу отыскания 01, 02, 0з к решению уравнения третьей степени. Найдя их, опреде- ляем корни Ж1,а;2,®з>Я4 из системы Xi + Х2 + хз + х4 = -а4 Х1 — Х2 + хз — х4 = 01 -Х1 + «2 + Хз - Х4 = 02 Xi + Х2 - Хз - Х4 = 03. Но вот в случае уравнения более высокой степени (п > 5) резоль- венты Лагранжа уже не давали решения задачи. Причину этого понять нетрудно. Ведь, аналогично случаю п = 3, n-ая степень 3 — 261
66 Глава 3. «Вызов человеческому разуму» tn резольвенты (3.8) остаётся инвариантной относительно цик- лической подстановки о = (1,2,3,... ,п), а следовательно, и от- носительно её степеней ак, к = Q, 1,2,..., n—1. Всего таких под- становок, очевидно, п. Более детальный анализ показывает, что в большинстве случаев (мы не уточняем, что это означает) под- становками ак исчерпываются все те подстановки, относительно которых инвариантна степень tn. Но тогда tn является корнем многочлена степени п\/п = (п — 1)!. Уже при п = 5 степень это- го многочлена получается 4! = 24, то есть больше, чем степень исходного многочлена. Вывод таков: резольвенты при п > 5, как правило, уже не сводят решение уравнения к более простой за- даче. Попытки найти какие-то иные вспомогательные функции от корней, упрощающие исходную задачу, также не приносили успеха. В результате Лагранж приходит к мысли, что едва ли вообще возможно решить «одну из самых знаменитых и самых важных проблем Алгебры» — найти формулы для корней алгебра- ических уравнений любой степени. Однако он высказывает уве- ренность в том, что рассмотренные им принципы, использующие симметрию относительно группы всех подстановок или её под- групп, и есть «истинные принципы решения уравнений». Как это вскоре выяснилось, предвидение Лагранжа оказалось справедли- вым. В 1824 г. Абель доказал невозможность решения в ради- калах общего уравнения степени п > 5, и объяснялась она как раз особенностями строения симметрической группы Sn. Этими же особенностями объяснялось и то, что общее уравнение про- извольной степени п 5 вообще нельзя свести к решению более простых вспомогательных уравнений подобно тому, как это было сделано в случае п = 3 и п = 4. Решающее слово здесь ещё предстояло сказать Галуа, но разговор об этом впереди.
ГЛАВА 4 ОТ ПОДСТАНОВОК К АБСТРАКТНОЙ ГРУППЕ Первые ростки теории групп историки математики находят уже у Л. Эйлера в одной из его работ по теории чисел. Эта работа, датированная 1774 годом, называлась «Доказательство, относя- щееся к вычетам, происходящим от деления степеней на простые числа». Более заметными эти ростки становятся в «Арифметиче- ских исследованиях» Гаусса (1801). Изучение сравнений, классов квадратичных форм и законов их композиции, свойств комплекс- ных корней из единицы —все эти вопросы объединены общими групповыми идеями. Подлинный их праздник — в первой матема- тической работе Гаусса о построении правильного 17-угольника. В ней Гаусс (ему тогда не исполнилось ещё 19 лет) решает про- блему, возраст которой измеряется двумя тысячелетиями. Однако главным источником. понятий теории групп стали всё-таки исследования по разрешимости алгебраических уравне- ний в радикалах. В предыдущей главе мы могли проследить, как в «Размышлениях» Лагранжа непроизвольно возникают такие понятия, как группа, подгруппа, смежный класс. Хотя Лагранж свободно оперирует с ними, но соответствующих терминов ни У него, ни у его предшественников не было. Впервые термин «группа» встречается у Галуа, которому удалось полностью решить задачу о корнях алгебраических уравнений. Итогом его глубоких исследований было не только решение очень трудной проблемы, но и, что ещё важнее, рождение новой математиче- з»
68 Глава 4. От подстановок к абстрактной группе ской теории. Основные работы Галуа не получили признания при жизни автора и были опубликованы только через 14 лет после его трагической смерти. Галуа погиб на дуэли в возрасте двадцати одного года. Об удивительных обстоятельствах его жизни можно прочесть в книгах [11], [13]. Значение работ Галуа было до конца понято много позже. Первое полное и система- тическое изложение теории Галуа было дано Жорданом в его монументальном сочинении «Трактат о подстановках» (1870). Вплоть до начала XX века учение о группах так и развивается в виде теории групп подстановок или иных преобразований. Правда, некоторые алгебраисты гораздо раньше начинают осо- знавать, что понятие группы имеет куда более универсальный характер. Первое упоминание об абстрактной группе содержится в одной из статей крупного английского математика А. Кэли, относящейся ещё к 1854 году. Слово «абстрактная» понимается им в том смысле, что элементами группы являются некие от- влеченные символы, конкретная природа которых не уточняется. Это могут быть числа, векторы, подстановки или какие-то иные объекты. Главное, на чём сосредоточивается внимание, — это те свойства композиции элементов (умножения или сложения), ко- торые являются общими для чисел,-векторов, подстановок и т.д. В определении абстрактной группы, которое мы сейчас дадим, для групповой операции используется термин «умножение», да и вся терминология и символика связана с обычным числовым умножением (эту терминологию называют мультипликативной). Однако термин «умножение» в определении абстрактной группы не нужно понимать буквально. Речь идёт о любой операции, удо- влетворяющей определенным требованиям. Общее определение группы таково. Множество G, на котором определено умножение элементов, называется группой, если выполняются три аксиомы: 1. Умножение ассоциативно: а(Ьс) = (аЬ)с для любых a,b,ce G. 2. В множестве G существует единичный элемент, то есть такой элемент е, что еа = ае = а для любого a &G.
Глава 4. От подстановок к абстрактной группе 69 3. Для каждого элемента а е G существует обратный, то есть такой элемент а-1, что а~га = аа-1 = е. Содержащиеся в приведённом определении аксиомы полно- стью воспроизводят свойства композиции подстановок конечного множества или движений плоскости (вообще взаимно однознач- ных преобразований любого множества). Можно поэтому ска- зать, что совокупность всех подстановок n-элементного множе- ства (симметрическая группа Sn), равно как и совокупность всех движений плоскости, является группой относительно операции умножения в смысле нашего общего определения. Не надо об- ладать обширными математическими знаниями, чтобы привести немало других примеров. Так, многие числовые множества явля- ются группами относительно арифметических операций: сложе- ния или умножения. Вот некоторые из них. 1) Множество Q* всех ненулевых рациональных чисел относи- тельно операции числового умножения — так называемая мульти- пликативная группа рациональных чисел1. 2) Множество R* всех ненулевых действительных чисел отно- сительно той же операции — это мультипликативная группа дей- ствительных чисел. 3) Более интересный пример числовой группы (точнее, целую серию примеров) мы получим, если вспомним материал из вто- рой главы о комплексных корнях из единицы. Действительно, на множестве Сп таких корней фиксированной степени п определена операция умножения, очевидно, ассоциативная. Среди элементов Сп содержится 1, и наконец, для всякого элемента Zk € Сп име- ется в Сп обратный элемент. В ряде случаев естественнее называть групповую операцию сложением (например, когда речь идёт об обычном числовом сложении). Тогда и аксиомы группы придётся переформулиро- вать, используя терминологию, связанную со сложением — адди- тивную терминологию. Аксиомы в этом случае будут выглядеть так: 1 Стоит заметить здесь, что ненулевые целые числа не образуют группы по умножению (почему?).
70 Глава 4, От подстановок к абстрактной группе 1. Сложение ассоциативно-. а+ (Ь+с) = (а+6)+с для любых элементов a,b,ce G. 2. В множестве G существует нулевой элемент, то есть так элемент 0, такой что 0 + а = а + 0 = а для любого a G G. 3. Для каждого элемента а Е G существует в G противо- положный, то есть такой элемент (—а), что а + (—а) = (—а) + а = 0. Приведём несколько примеров групп, в которых аддитивная терминология оказывается более уместной. 1) Множество Z всех целых чисел относительно операции сло- жения — аддитивная группа целых чисел. 2) Множество всех векторов в пространстве относительно опе- рации сложения векторов. 3) Множество Zn классов вычетов относительно операции сло- жения классов — аддитивная группа вычетов по модулю п. В связи с последним примером может возникнуть вопрос, об- ладает ли групповыми свойствами другая операция, определён- ная в Т>п — умножение классов вычетов. Поскольку нулевой класс заведомо необратим, то вопрос разумно отнести лишь к мно- жеству Z*, состоящему из ненулевых классов 1,2,... ,п — 1. Из материала второй главы вытекает, что множество Z* являет- ся группой относительно умножения тогда и только тогда, когда п — простое число. Среди свойств групповой операции мы’не находим столь при- вычной нам коммутативности (ab = Ьа или а + b = b + а). Это и понятно, если учесть, что главным источником понятия груп- пы были подстановки, а их умножение как раз и не обладает указанным свойством. В то же время имеется немало групп, например, все числовые группы, операция в которых коммута- тивна. Они так и называются коммутативными или абелевыми группами (в честь норвежского математика Нильса Абеля, впер- вые отметившего особую их роль в вопросе разрешимости ал- гебраических уравнений в радикалах). Группы могут содержать
Глава 4. От подстановок к абстрактной группе 71 бесконечно много элементов, могут быть и конечными — таковы симметрическая группа, группа корней n-ой степени из единицы, аддитивная группа вычетов. Число элементов конечной группы G называют её порядком и обозначают |G|. Так, |5П| = п!, |Gn| = = |Zn| = Л. Вполне естественным является желание распространить на произвольные абстрактные группы те понятия, которые знакомы нам по группам подстановок и, • в общем, для этого нет ника- ких помех. Первое из них —понятие подгруппы. Подмножество Н группы G назовём подгруппой, если оно само является груп- пой относительно операции, определённой в G. Вот некоторые примеры. 1) Мультипликативная группа Q* рациональных чисел — под- группа мультипликативной группы R* действительных чи- сел. 2) Множество чётных чисел — подгруппа аддитивной группы Z целых чисел. Этого нельзя сказать' о множестве нечётных чисел (почему?) 3) Множество всех параллельных переносов есть подгруп- па группы движений плоскости. Этого нельзя сказать о множестве всех, поворотов, если не фиксировать центр поворота. Если Н — подгруппа группы G, а д — произвольный (но фик- сированный) элемент из G, то, как и раньше, множество все- возможных произведений gh, где л пробегает всю подгруппу Н, называется смежным классом (точнее, левым смежным классом) по подгруппе Н, а элемент д — его представителем. Обозначая левый смежный класс через дН, получим, следовательно, дН = {gh | h € Н}. Аналогично определяются правые, смежные классы Нд, и в неа- белевых группах они могут не совпадать с левыми. Как и в слу- чае групп подстановок, смежные классы по подгруппе (всё равно, левые или правые) обладают двумя основными свойствами.
72 Глава 4. От подстановок к абстрактной группе 1. В случае конечной подгруппы Н число элементов в любом смежном классе одно и то же и совпадает с порядком подгруппы. 2. Любые два смежных класса либо совпадают, либо не имеют общих элементов. Требуется небольшое терпение, чтобы разобраться в доказа- тельстве этих фактов. Для доказательства первого из них рас- смотрим отображение подгруппы Н на смежный класс дН, со- поставляя всякому элементу h G Н элемент gh 6 дН. Если h пробегает подгруппу, то соответствующий ему элемент gh про- бегает весь смежный класс, при этом различным hi и Яг из под- группы Н будут соответствовать также различные элементы ghi и gh,2 из смежного класса дН. В самом деле, предположим, что ghi = ghz. Умножив обе части этого равенства слева на элемент д"1, обратный к д, получим g-^ghi) = g~1(gh2), или, используя ассоциативность, (g^gjhi = (g~1g)h2. Поскольку д~гд = е, то (аксиома 2) hi = /12. что противоречит предположению. Таким образом, имеется взаимно однозначное соответствие между Н и дН. Это и означает, что число элементов в Я и в дН одинако- во, что и требовалось доказать. Докажем теперь второе утверждение. Предположим, что смеж- ные классы giH и ргЯ имеют непустое пересечение, и пусть a 6 € giH П д2Н. Тогда элемент а можно записать двумя способами а = gihi = g2h2, hi, Д2 € H. Умножая это равенство справа на элемент h^1, получим: gi = = «fcfoAf1. Заметим, что G Я —это вытекает из опреде- ления подгруппы. Раз так, то gi е д2Н, но тогда произвольный элемент gih, принадлежащий giH, равен g2h2h^h. Поскольку снова принадлежит подгруппе Я, то gih € <72 Я. Мы тем самым доказали, что giH С д2Н. Аналогично можно доказать обратное включение <72 Я С giH, поэтому д2Н — giH. Итак, если два смежных класса имеют хотя бы один общий элемент, то они совпадают. Понятно, что это равносильно второму утверждению.
Глава 4. От подстановок к абстрактной группе 73 Характерной чертой наших рассуждений является то, что в них используются лишь свойства групповой операции, пере- численные в определении группы, и какая-либо дополнительная информация о её элементах не играет роли. Именно поэтому доказанные утверждения, как и те, что из них вытекают, спра- ведливы для произвольных групп независимо от природы их эле- ментов. Для иллюстрации понятия смежного класса рассмотрим сле- дующий пример. Пусть Z — аддитивная группа целых чисел, а Н — её подгруппа, состоящая из . чисел кратных пяти. Тогда можно выписать следующие смежные классы: Н = 0 + Н = {..., -10, -5, 0, 5, 10, ...}, 1 + Я = {..., —9, -4,1,6,11,...}, 2 + Я = {..., -8,-3,2,7, 12, ...}, 3 + Я = {..., —7, -2,3,8, 13, ...}, 4 + Я = {..., -6,-1,4,9, 14, ...}. Читатель сразу же заметит, что это классы вычетов 0, Т, 2, 3, 4 по модулю 5. Легко видеть также, что всякий смежный класс совпадает с одним из этих пяти и что классы эти не пересекают- ся. Столь же очевидно, что Z = Я U (1 + Я) U (2 + Я) U (3 + Я) U (4 + Я). То же самое верно, конечно, и для любой группы: если д^Н, д^Н,. • • ,дгН — все различные (левые) смежные классы группы G по подгруппе Я, то G = д^Н U дъН U ... U дгН. Множество смежных классов может быть и бесконечным. То- гда в этом равенстве будет объединение бесконечного семейства множеств. В случае, когда G и Я — конечные группы, из последнего ра- венства и утверждений 1 и 2 вытекает, что |G| = |Я| • г. Число г различных смежных классов называют индексом подгруппы Я
74 Глава 4. От подстановок к абстрактной группе в группе G и обозначают |G : Н\. Мы пришли к следующей теореме Лагранжа. Порядок любой подгруппы Н конечной группы G является делителем порядка группы, при этом |G| = |G : Н\ • |/Г|. Для тех, кто разобрался в содержании предыдущей главы, в формулировке этой теоремы нет ничего неожиданного — анало- гичное утверждение рассматривалось там для групп подстановок. Теперь оно доказано для произвольных конечных групп. Несмот- ря на его простоту, оно имеет важное значение как при изучении самих групп, так и в приложениях. Чтобы уже в этой главе хоть немного поговорить об этом, познакомимся ещё с несколькими понятиями. Прежде всего ответим на такой вопрос. Как должна быть устроена наименьшая из тех подгрупп, которые содержат задан- ный элемент g некоторой группы G? Если Н — искомая подгруп- па, то ясно, что вместе с g она должна содержать и произведение g-g, и вообще всевозможные произведения g • g •... • g для произ- вольного k. Как это принято для чисел, будем обозначать такое произведение дк и называть fc-ой степенью элемента д. Кроме того, подгруппе Н должны принадлежать обратный элемент д~г и всевозможные его степени. Определим обычным образом це- лую отрицательную степень, полагая д~к = {д~1)к. Наконец, ис- комая подгруппа должна содержать единичный элемент е. Будем, по определению, считать, что gQ = е. Итак, все целые степени дт, т е Z, элемента д должны принадлежать подгруппе Н. Но оказывается, уже само множество {д} всех целых степеней эле- мента д {g} = {gm\mtZ} (4.1) является подгруппой группы G. Проверить это можно, сославшись на равенства дтдк = дт+к, ОТ)”1 = («Г1)”1 = д~т, которые устанавливаются так же, как и для числовых степеней. Они показывают, что произведение дтдк любых двух элементов из множества (д) и элемент (р”1)-1, обратный к произвольному элементу из {д), снова принадлежат (д). Это и означает, что {д') —
Глава 4. От подстановок к абстрактной группе 75 подгруппа и, очевидно, наименьшая из тех, которые содержат данный элемент д. Найденная нами подгруппа, определённая равенством (4.1), называется циклической подгруппой, порождённой элементом д, а сам этот элемент — образующим циклической подгруппы. Циклические подгруппы играют роль строительных блоков, из которых собирается, подобно зданию, вся группа, а её облик в сильной степени зависит от способа соединения этих блоков — циклических подгрупп. Проще всего устроены те группы, для об- разования которых достаточно всего лишь одного блока. Такие группы сами называются циклическими. Точнее говоря, группа G является циклической, если она совпадает с некоторой из своих циклических подгрупп. Это означает, что найдётся такой эле- мент д &G (образующий), что все другие элементы является его степенями G = {g) = {gm\meZ}. Пример циклической группы даёт известная нам группа Сп корней п-ой степени из единицы. Чтобы понять это, вспомним, что один из этих корней имеет вид 2тг . . 2тг z\ = cos---I- «sin —, n n а все другие связаны с ним соотношениями ъ 2тгк . . 2-кк , Л , „ Zk = z", = cos---1-«sin---, к = 0,1,2,... ,n — 1. n n Следовательно, Cn = (zi). Другим примером циклической группы (уже бесконечной) яв- ляется аддитивная группа Z целых чисел. Только здесь, посколь- ку групповая операция — сложение, придётся говорить не о сте- пенях образующего элемента, а о его кратных. Убедитесь, что в качестве образующего можно взять элемент 1 (а можно и — 1). Несколько ниже мы покажем, что приведённые примеры в не- котором смысле исчерпывают всевозможные циклические группы (конечные и бесконечные). Пример группы Сп показывает, что
76 Глава 4. От подстановок к абстрактной группе в группе может существовать такой элемент д / е, что дп = = е для некоторого п / 0. Это обстоятельство даёт повод ввести следующее определение. Пусть G — произвольная группа. Порядком элемента д EG называется наименьшее натураль- ное п такое, что дп = е. Если такого п не существует, то д называется элементом бесконечного порядка. Например, в мультипликативной группе R* ненулевых дей- ствительных чисел все элементы, кроме чисел 1 и —1, имеют бесконечный порядок. Группа Сп позволяет сделать ещё одно наблюдение. Порядок её образующего элемента z\ равен п и сов- падает с порядком группы. Следующее утверждение показывает, что это так для любой циклической группы конечного порядка п. Если образующий элемент циклической группы {д') имеет порядок п, то все различные элементы группы исчерпываются степенями 9° = е,д,д2,...,дп~1. (4.2) Для доказательства нужно, во-первых, убедиться, что любая степень gk {k 6 Z) совпадает с одной из перечисленных в (4.2). Действительно, пусть г — остаток от деления к на п к = qn + r, 0 г <п. Тогда gk=g<^+r = ^q.gr = e.gr=gr — один из элементов (4.2). Во-вторых, надо проверить, что все элементы (4.2) различны. Действительно, если дк = др, где 0<p<fc^n — 1, то дк~р = е, причём l^fc — р п — 1, а это- го не может быть, так как порядок п — наименьшее натуральное число такое, что дп = е. Из только что доказанного утверждения вытекает следующее. В любой конечной группе порядок всякого элемента является делителем порядка группы. Действительно, порядок любого эле- мента heG совпадает с порядком порождённой им циклической подгруппы {h), а значит, по теореме Лагранжа, является делите- лем порядка группы.
Глава 4. От подстановок к абстрактной группе 77 Уже эти простые сведения о группах могут быть применены в различных областях математики, например, в теории чисел. Вспомним хотя, бы упоминавшуюся во второй главе малую тео- рему Ферма. Язык групп позволяет дать для неё удивительно компактное доказательство. Вот оно. Рассмотрим кольцо выче- тов Zp по простому модулю р. Его ненулевые элементы, как мы уже знаем, образуют по умножению группу порядка р— 1. Поэто- му для любого ненулевого класса т е Zp, согласно последнему утверждению, справедливо равенство fp-1 = 1, то есть гр-1 —1 = 0. (4.3) Если число а взаимно просто с р, то содержащий число а класс вычетов г ненулевой. Справедливое для него равенство (4.3) означает, что число ар-1 — 1 содержится в классе 0, то есть де- лится на р, а это и есть утверждение теоремы. Поучительны групповые доказательства и других теорем эле- ментарной теории чисел. Две из них — теорема Вильсона и тео- рема Эйлера — рассматриваются в дополнении. Эту главу мы завершим обсуждением понятия, важного не только для алгебры, но и для всей математики в целом, — поня- тия изоморфизма. Этот термин образован соединением греческих слов «isos» (одинаковый, равный) и «morphe» (форма). В энцик- лопедическом словаре читаем: «Изоморфизм — соответствие между объектами, выражающее тождество их структуры.» Хотя в этой характеристике и отражено самое главное, ей всё же недостает полной ясности. Действительно, слова «тождество структуры» (или, иначе, строения) не могут быть во всех слу- чаях расшифрованы однозначно — всё зависит от того, о каких объектах, системах идёт речь. Когда говорят о строении алгеб- раических систем (в частности, групп), то имеют в виду те их черты, которые определяются свойствами операций. При этом вовсе не принимаются в расчёт индивидуальные свойства эле- ментов, их конкретная природа. Последнее, напомним, как раз и было типично для доказательств почти всех утверждений этой
78 Глава 4. От подстановок к абстрактной группе главы. Лучше всего разъяснить сказанное примером двух раз- личных по составу элементов и в то же время одинаковых по свойствам операций групп. Первая группа — это Сп. Её элементами являются корни п-ой степени из единицы (рис. 15). Как известно из второй главы, та- ких корней имеется ровно п и каждый из них записывается в ви- де 2тг& . . 2тгк , п ч п Zk = cos-----1-г sin---, к = 0,1,2,... ,п — 1. п п Правило их умножения следующее zkzm — zry где г = < к + тп, к + т — п, если к + т < п; если к + т п. (4.4) Другая группа — Vn — состоит из всех поворотов плоскости вокруг центра О правильного n-угольника, отображающих этот n-угольник на себя. Из рис. 16 ясно, что углы таких поворотов 2тг 2тг/с кратны —, то есть имеют вид---------; а для того, чтобы получить ,п п все такие повороты, достаточно взять значения к от 0 до п — 1. 2?rfc Поворот на угол ------ (к = 0,1,2,..., п — 1) обозначим через Vfc, так что Vn = {vo,Vl,V2,...,Vn-l}. При последовательном выполнении поворотов vm и v*. получаем, 2тг(А: + т) очевидно, поворот на угол ------Если к + т < п, то по- лучим VkVm = v/c+m- Если же к + т п, то результирующий
Глава 4. От подстановок к абстрактной группе 79 2тг(& + т — п) поворот совпадает с поворотом Vk+m-п на угол —1 ТЬ Итак, можно написать {к + т, если к + т<п‘, , , (4.5) к + т — п, если к + т п. Выполнимость групповых аксиом в Vn проверяется так же, как и в Сп. Кроме того, сравнение совершенно идентичных правил умножения (4.4) и (4.5) убеждает нас в том, что обе группы, в сущности, одинаковы, отличаясь лишь происхождением эле- ментов и их обозначением. Выразим эту мысль точнее, используя соответствие (очевидно, взаимно однозначное) между элемента- ми двух групп, при котором корню Zk соответствует поворот Vk с тем же номером. Правила (4.4) и (4.5) показывают тогда, что при указанном соответствии произведению элементов Zkzm отве- чает произведение (композиция) их образов VkVm. Такая согласо- ванность соответствия с операциями и обеспечивает их идентич- ность. Соответствие, согласованное с групповыми операциями, называются изоморфизмом групп. Точное определение выглядит так: Изоморфизмом групп G и G' называется такое взаимно од- позначное соответствие f между ними, при котором f(gi92) = для любых 51, 52 € G, то есть образ произведения любых двух элементов равен про- изведению их образов. Отметим, что обратное соответствие /-1, очевидно, определя- ет изоморфизм между G' и G. С точки зрения алгебры изоморфные группы неотличимы. Лю- бой вывод относительно свойств групповой операции в одной из групп распространяется и на любую группу, ей изоморфную. На- пример, если группа абелева или циклическая, то таким же свой- ством будет обладать изоморфная ей группа. Конкретная приро- да элементов, которая может быть совершенно различной в двух группах, не имеет при этом значения. Полное отвлечение от неё,
80 Глава 4. От подстановок к абстрактной группе столь типичное для алгебры и придающее ей абстрактный ха- рактер, — существенная, но не единственная черта понятия изо- морфизма. Другая его черта, на первый взгляд противоположная первой, а на самом деле её дополняющая, состоит в том, что с помощью понятия изоморфизма можно строить удобные кон- кретные модели, облегчающие изучение абстрактных алгебраи- ческих структур. Так, нередко удается доказать, что абстракт- ная группа изоморфна, например, некоторой числовой группе или группе преобразований. Абстрактные элементы тогда заменяют- ся вполне конкретными — числами, матрицами, подстановками и т.д. Изучение алгебраических свойств при этом облегчается. В то же время всякое заключение об этих свойствах, полученное в конкретной группе, справедливо и в изоморфной ей абстракт- ной группе. Вот наиболее простые теоремы, позволяющие сво- дить изучение операций в абстрактных группах к их изучению в числовых группах и группах преобразований. 1. Всякая бесконечная циклическая группа изоморфна ад- дитивной группе Z целых чисел. Всякая конечная цикли- ческая группа порядка п изоморфна аддитивной группе вычетов Zn (или, что то же самое, мультипликативной группе Сп корней п-ой степени из единицы). 2. Всякая конечная группа изоморфна группе подстановок некоторого конечного множества (теорема Кэли). Докажем первое из этих утверждений. Пусть сначала G = = (д) — бесконечная циклическая группа. Её элементами, напом- ним, являются всевозможные степени дк, к € Z, причём все они различны. Рассмотрим соответствие f: G —» Z, где f(gk) = к для всякого к е Z. Очевидно, что это соответствие взаимно однозначно. Кроме того, f(gkgm) = f(gk+m) = к + т = f(gk) + f(gm) для любых элементов дк и дт 6 G. Это и значит, что / — изо- морфизм.
Глава 4. От подстановок к абстрактной группе 81 В другом случае, когда циклическая группа G = (д) имеет конечный порядок п, все её элементы находятся в списке (4.2). Соответствие /: G —> Zn определим равенством /(/) = к, к = 0,1,..., п - 1. Заметим, что дкдт = дк+т = дг, где г = 0,1,..., п — 1 и г = = к + т_ mod п (сравните это с формулами (4.4) и (4;5)). Но тогда и к + т — г. Окончательно получаем, что /(Лт) = /(/) = Т = к + т = /(/) + /(Г). Это и значит, что / — изоморфизм. Соответствие дк -+ zk, к = = 0,1,... ,п — 1, как без труда проверит читатель, даёт изомор- физм между G и Сп. Есть и ещё одна черта у понятия «изоморфизм». Часто при выяснении особенностей строения той или иной алгебраической структуры (в частности, группы) бывает полезно отобразить её изоморфно саму на себя. Такой изоморфизм называется авто- морфизмом. Очевидно, что тождественное преобразование любой группы является её автоморфизмом, но группа может обладать и другими автоморфизмами. То, насколько велик у группы запас автоморфизмов, в большой степени определяет её внутреннюю структуру, а также характеризует присущие ей свойства симмет- рии. Приведём пример автоморфизма. В циклической группе G = {д) порядка 8 рассмотрим отобра- жение f : G —> G, задаваемое равенством /(а) = а3 для всякого а € G. Тот факт, что это отображение взаимно однозначно, легко усматривается из следующей таблицы (табл. 3), в которой пере- числены элементы группы G и их образы. Таблица 3. а е = р° 9 92 93 94 95 96 97 /(а) = а3 е = 5° 93 96 9 94 97 92 95
82 Глава 4. От подстановок к абстрактной группе Очевидно, выполняется и другое требование: f(ab) = (аЬ)3 = = а3Ь3 = для любых a, b € G. Следовательно, / — авто- морфизм. Попробуйте самостоятельно определить, является ли автоморфизмом этой группы отображение а —> а2, а также пере- числить все автоморфизмы циклической группы порядка 8. Более трудным является тот же вопрос для циклической группы про- извольного порядка. Об одном из многих приложений понятия автоморфизма читатель узнает из следующей главы. Здесь обра- тим лишь внимание на такой факт. Множество всех автоморфизмов любой группы G само яв- ляется группой относительно операции умножения преоб- разований. Она так и называется — группа автоморфизмов группы G и обозначается Aut G. Чтобы доказать это утверждение, нужно проверить, что ком- позиция двух автоморфизмов — снова автоморфизм, и что отоб- ражение, обратное автоморфизму, — автоморфизм. Пусть € G AutG и / = Д/г- Как уже известно, / является взаимно однозначным отображением группы G на себя. С другой сторо- ны, /(аЬ) = /1/г(аЬ) = Л(/2(аЬ)) = = Л(/2(а)/2(Ь)) = Л/2(а) • Л/2(Ь) = /(а)/(Ь). Значит, композиция автоморфизмов — автоморфизм. Утвержде- ние о том, что если f 6 AutG, то /-1 € AutG, проверяет- ся аналогично. Например, для рассмотренной выше циклической группы порядка 8 группа автоморфизмов — абелева (но не цик- лическая) группа порядка 4. Попробуйте убедиться в этом само- стоятельно. Дополнения и задачи 1. Какими способами можно задать ту или иную группу? Один из них, пригодный для конечных групп, был указан А. Кэли. Он предложил рассматривать так называемую таблицу умножения
Глава 4. От подстановок к абстрактной группе 83 группы, которая очень похожа на обычную арифметическую таб- лицу умножения. Элементы группы располагаются в одном и том же порядке в верхней строке и в левом столбце таблицы, а внутри неё размещаются произведения элементов. Так, таблица умноже- ния, или таблица Кэли для группы S3 (обозначения элементов те же, что и во второй главе) выглядит так (табл. 4). Таблица 4. X 01 02 (ГЗ 04 05 06 01 (Г1 02 (Гз 04 05 06 02 (Г2 (Г1 (Гб 06 03 (Г4 03 03 (Г4 (Г1 (Г2 06, 05 04 .04 03 06 (Гб (Г1 (Г2 05 (Гб 06 (Г2 (Г1 (Г4 03 (Гб 06 05 (Г4 03 (Г2 01 Составьте таблицы умножения для других групп, например, для А4, V4. Подумайте над таким вопросом: какими отличитель- ными признаками должна обладать таблица умножения группы? Такой способ задания операции годится, понятно, лишь для ко- нечных групп, но даже и для них в случае больших порядков может оказаться малопригодным. О другом, более эффектив- ном способе (использующем образующие элементы и определяю- щие соотношения) будет рассказано в главе И. Для циклических групп этот метод фактически уже реализован. 2. При проверке того, является ли подмножество Н группы G подгруппой, удобно пользоваться следующим критерием, дока- зать который предлагается читателю. Для того, чтобы подмножество Н являлось подгруппой группы G, необходимо и достаточно, чтобы выполнялись два условия-. 1) вместе с любыми двумя элементами hi, hi подмноже- ство Н содержит их произведение hihz;
84 Глава 4. От подстановок к абстрактной группе 2) вместе с любым элементом h подмножество Н содер- жит обратный ему элемент hr1. 3. Всякая подгруппа циклической группы сама является цик- лической. Докажите это утверждение, воспользовавшись следующими соображениями. Можно считать, что подгруппаHCG нетриви- альна, то есть не совпадает ни с G, ни с (е). Если д — образую- щий элемент группы G, то некоторые его степени принадлежат Н, причём среди них обязательно найдется степень с положи- тельным показателем (почему?). Пусть к — наименьший из поло- жительных показателей со свойством д 6 Н. Тогда Н = (р*) (проверьте!). 4. Пусть G = (д) — циклическая группа порядка п. Как найти порядок произвольного её элемента дк? Проделайте эксперимент в конкретной циклической группе, скажем, в С$, составив таб- лицу порядков её элементов. Например, порядок элемента zf ра- вен 8, а порядок элемента zf равен 4 и т. д. Вообще, справедливо следующее утверждение: порядок элемента дк равен n/d, где d —наибольший общий делитель чисел п и к. В частности, если кип взаимно про- сты, то порядок элемента дк равен п. В последнем случае различные степени элемента дк (их ров- но п) исчерпывают всю группу G, и следовательно, дк, как и д, служит её образующим элементом. Например, в С$: (4)° = 1. (zl^ = zl, (zl)2 = zl (zl)3 = zl, (4)4=*i. й)5 = 21, (2?)6 = 2f. (4)’ = 4 5. В теории чисел рассматривается так называемая функция Эй- лера. Её значение <р(п) определяется как количество натураль- ных чисел, которые меньше п и при этом взаимно просты с п. Например, <р(6) = 2, так как среди чисел, меньших числа 6, и взаимно просты с ним лишь 1 и 5; <р(8) = 4, так как взаимно просты с 8 числа 1, 3, 5 и 7. Для всякого простого р, очевид- но, <р(р) = р — 1. Обобщением малой теоремы Ферма является теорема Эйлера, которая формулируется так.
Глава 4. От подстановок к абстрактной группе 85 Для любого натурального а, взаимно простого с п, av^ — 1 делится на п. Попробуйте самостоятельно объяснить, почему малая теорема Ферма — частный случай теоремы Эйлера. Например, при п = 8 и а = 5 получаем, что 54 — 1 = 624 действительно делится на 8. Можно предложить следующий план доказательства тео- ремы Эйлера (детали — на усмотрение читателя): а) показать, что множество Z* обратимых элементов кольца Zn образуют группу относительно умножения; б) убедиться, что порядок этой группы равен <р(п); в) провести те же рассуждения, что и при доказательстве ма- лой теоремы Ферма. 6. Ещё одним примером применения групповых методов в теории чисел может служить доказательство следующей теоремы. Если р —простое, то (р — 1)! + 1 делится на р (теорема Вильсона). Это один из наиболее изящных результатов элементарной тео- рии чисел. Утверждение теоремы равносильно следующему ра- венству для классов вычетов в Zp Т-2-3-...-(р-1)+Т = 0. Это равенство с учётом того, что р — 1 = — 1, можно переписать в виде 2 • 3 •... • (р-2) = Т. (4.6) Можно считать, что р > 3, так как при р = 2 и при р = 3 утвер- ждение очевидно. Так как в Zp есть только два класса, квадрат каждого из которых равен Т (это Т и р— 1), то множители в ле- вой части равенства (4.6) разбиваются на пары взаимно обратных классов, что и доказывает равенство (4.6). 7. Опишем все подгруппы циклической группы G = (р) порядка п. Согласно теореме Лагранжа, порядок такой подгруппы 'явля- ется делителем числа п. Пусть d делит п. Рассмотрим в G под- множество Н = {х | xd = е}. Очевидно, что Н — подгруппа,
86 Глава 4. От подстановок к абстрактной группе и, как было доказано ранее, циклическая. Если h — образующий элемент подгруппы Н, то его порядок равен d (почему?). Сле- довательно, Н — циклическая подгруппа порядка d. Если Н' — также подгруппа порядка d, то (h')d = е для любого её элемента h', и значит, Н' С Н. Но поскольку l-ff'l = |Я| = d, то Н' = Н. Мы доказали следующее утверждение. Для всякого натурального числа d, являющегося делителем порядка п циклической группы G, существует единственная подгруппа Н порядка d. Этими подгруппами исчерпываются все подгруппы данной циклической группы. Используя это утверждение, опишите все подгруппы цикличе- ских групп порядка 7,10,12,16 и укажите образующие элементы этих подгрупп. 8. Как уже говорилось, множество Z* ненулевых классов вычетов по простому модулю р является группой (мультипликативная группа вычетов по модулю р). Исчерпывающие сведения о её строении даёт следующая теорема1. Мультипликативная группа вычетов Z* — циклическая груп- па порядка р — 1. Например, непосредственно проверяется, что Z^ = (2). Для доказательства теоремы нужно убедиться, что в груп- пе Z* найдется элемент порядка р — 1, он и будет образующим. План рассуждений таков. Выбираем элемент а е Z* наибольшего возможного порядка к. Далее доказываем, что порядок любого другого элемента b € Z* является делителем к. На этом эта- пе понадобится вспомогательное утверждение: если в абелевой группе порядки двух элементов взаимно просты, то порядок их произведения равен произведению их порядков. Далее, каждый элемент b 6 Z* является корнем уравнения хк = Т, то есть хк - Т = 0. 1 Этот факт в несколько иной форме был известен уже Гауссу и был использован им при решении задачи о построении правильного п-угольника (см. следующую главу).
Глава 4. От подстановок к абстрактной группе 87 Наконец, покажем, что многочлен хк — 1 можно записать в виде zfc-T = П(я-Ь) = (х — Т)(х — 2)... (х — (р — 1)), bez; откуда и следует, что к = р — 1. Определите, какова связь этой теоремы с малой теоремой Фер- ма. Найдите образующие элементы групп Z5, Z7, Z*3, Zj7. 9. Зафиксируем некоторое натуральное число к и рассмотрим в группе Z* все степени с показателем к 1к = 1,2к,...,гк,...Д^)к. (4.7) Классы указанного вида называют fc-степенными вычетами. Ка- ковы те элементы группы Z*, которые являются fc-степенными вычетами? Этот вопрос равнозначен следующему: какие остатки могут получиться при делении степеней ак, а € N, на простое число р? В некоторых случаях ответ понятен. Например, если к = р — 1, то все элементы вида (4.7) совпадают с 1, что непо- средственно следует из теоремы Ферма. Ситуация прямо проти- воположна, если к взаимно просто с р — 1. Тогда степени (4.7) исчерпывают всю группу Z* (попробуйте это доказать). Так, в группе Zj^ Т3 = 1, 23 = 8, З3 = 5, 43 = 9, 53 = 4, б3 = 7, 73 = 2, 83 = 6, 93 = 3, ТО3 = ТО. Между этими двумя крайностями масса промежуточных слу- чаев, и самый простой из них —случай квадратичных вычетов — соответствует к = 2. Квадратичные вычеты были предметом интереса многих мате- матиков. Уже Эйлер установил ряд их свойств. Вот некоторые из них. 1) При нечётном.р ровно половина элементов мультипликатив- р ной группы Z* (то есть — тичными вычетами. элементов) является квадра-
88 Глава 4. От подстановок к абстрактной группе 2) Элемент х G Z* является квадратичным вычетом тогда и только тогда, когда х^ = 1 (критерий Эйлера квадра- тичности вычета). Например, в Z^ квадратичных вычетов пять. Это классы Т = Т2, 4 = 22 , 9 = 32 , 5 = 42 , 3 = 52, и для каждого из них х5 = Т (проверьте!). Чтобы доказать свойство 1), надо лишь заметить, что ровно два элемента из Z*, а именно, г и — г = (п — г), служат решени- ями уравнения х2 = г2, и потому число квадратичных вычетов вдвое меньше числа элементов Z*. Критерий Эйлера в одну сторону очевиден. Именно, если х = — г2, то ж(р-1)/2 = f р-1 = 1 Для доказательства обратного утверждения воспользуйтесь цик- личностью группы Z* и правилом отыскания порядка элемента циклической группы, которое сформулировано в дополнении 4. Эйлер открыл и гораздо более глубокие закономерности, которым подчиняются квадратичные вычеты. Особенно знаменита его ги- потеза, называемая квадратичным законом взаимности. Её спра- ведливость была установлена Гауссом, им было дано восемь (!) различных доказательств закона взаимности. Чтобы сформули- ровать этот закон, удобно использовать так называемый символ (ст'Х __ - . Пусть аир взаимно просты. Тогда полагают р/ = 1, если а является квадратичным вычетом, и = —1, если а не является квадратичным вычетом. Квадратичный закон взаимности формулируется так: Если р и q — различные нечетные простые числа, то (Й “ Интересный рассказ об истории «золотой теоремы», как име- новал квадратичный закон сам Гаусс, вы можете прочесть в кни- ге [10].
Глава 4. От подстановок к абстрактной группе 89 10. Убедитесь, что перечисленные ниже группы не являются цик- лическими: а) аддитивная группа Q рациональных чисел; б) симметрическая группа Sn при п > 2; в) знакопеременная группа Ап при п > 3. Для конечных групп, не являющихся циклическими, утвер- ждение пункта 7 может оказаться неверным. Самым простым контрпримером служит группа Ад порядка 12. Попробуйте дока- зать, что в ней нет подгруппы порядка 6. 11. Убедитесь, что при изоморфизме f: G G' а) единица е группы G переходит в единицу е' группы G'\ б) порядок любого элемента д е G совпадает с порядком его образа д' = f(g); в) если д — образующий элемент группы G, то его образ У = = f(g) — образующий элемент группы G'; г) если ip (pi, <72, • • •, <7fc) = е — некоторое соотношение, выпол- ненное для элементов группы G, то такое же соотношение выполняется для их образов.
ГЛАВА 5 2000 ЛЕТ СПУСТЯ Одна из задач, приковавших к себе внимание юного Гаусса, име- ла столь давнее происхождение, что попытки её решения ка- зались совершенно безнадежными. Вот что пишет об этом сам Гаусс: ' «Всякому начинающему геометру известно, что можно геометрически (то' есть циркулем и линей- кой) строить разные правильные многоугольники, а именно, треугольник, пятиугольник, пятнадца- тиугольник и те, которые получаются из каждо- го из них путём удвоения числа его сторон. Это было известно во времена Евклида, и, как кажет- ся, с тех пор было распространено убеждение, что дальше область элементарной геометрии не рас- пространяется-. по крайней Мере, я не знаю удачной попытки распространить её в эту сторону». И действительно, какие правильные многоугольники, кроме перечисленных и квадрата, можно строить циркулем и линей- кой, было в равной мере загадкой как для современников Евкли- да, так и для современников Гаусса. Разница, быть может, была лишь в том, что к XIX веку как-то обозначилась возможность ал- гебраического решения этой древней геометрической задачи. Мы уже упоминали о том, что с помощью циркуля и линейки мож- но строить кроме рациональных величин лишь так называемые
92 Глава 5. 2000 лет спустя квадратичные иррациональности, другими словами, такие вели- чины, которые выражаются через единицу масштаба с помощью конечного числа рациональных операций и операций извлечения квадратного корня. С другой стороны, построение правильного n-угольника равносильно делению единичной окружности на п равных частей. Тогда точкам деления соответствуют комплекс- ные числа Zk, являющиеся корнями n-ой степени из 1. Таким образом, вопрос сводится к тому, при каких п все корни n-ой сте- пени из 1 являются квадратичными иррациональностями. Можно сказать и иначе: при каких п корни уравнения zn — 1 = 0 можно получить, последовательно решая некоторые квадратные уравне- ния? Но ведь ключи к подобным вопросам уже подбирали современ- ники Гаусса. Как помнит читатель, Лагранж выяснял причины, по которым отыскание корней алгебраического уравнения может быть сведено к решению вспомогательных уравнений меньших степеней. И он впервые заметил, что существование таких вспо- могательных уравнений связано с некоторыми свойствами сим- метрии их корней. Однако Лагранжу не удалось полностью осу- ществить свою программу. Он рассматривал уравнения с про- извольными коэффициентами и каждый раз о свойствах сим- метрии и частичной симметрии судил по группе такого общего уравнения. Лишь позднее выяснилось, что с каждым конкрет- ным уравнением можно связать его собственную группу, которая учитывает специфику данного уравнения и его корней и не обя- зательно совпадает с симметрической группой Sn. Суть в том, что между корнями конкретного уравнения кроме соотношений, задаваемых формулами Виета, могут быть и иные, не вытекаю- щие из этих формул, соотношения. Оказалось, что решающую роль в изучении алгебраического уравнения играет группа тех подстановок, которые сохраняют все соотношения, имеющиеся между корнями. Об этом открытии, честь которого принадлежит Эваристу Галуа, разговор ещё предстоит. Здесь же мы попыта- емся понять, как сходную идею реализовал Гаусс применительно к уравнению zn—1 = 0. Мы уже знаем, что множество его корней относительно умножения образует циклическую группу. Подста- новки, сохраняющие все соотношения между корнями, должны
Глава 5. 2000 лет спустя 93 быть автоморфизмами этой группы. Нетрудно описать все такие автоморфизмы, но особенно просто это сделать, если п = р — простое число. Как раз с этим случаем, как объясняется в до- полнении, достаточно разобраться в задаче о построении пра- вильного п-угольника. Группа Ср корней р-ой степени из 1 имеет простой порядок, а значит, любой её неединичный элемент Z1, Z2, ..., Zp-1 (5.1) является образующим этой группы. Всякий автоморфизм цик- лической группы однозначно определяется заданием своего зна- чения на образующем. Действительно, если, например, <p(zi) = zk, (5.2) то <p(-4) = zlk, а значит, известны и образы всех элементов груп- пы Ср. С другой стороны, для любого к = 1,2,1, су- ществует автоморфизм <р, определенный формулой (5.2), именно потому, что каждый из элементов (5.1) является образующим. Следовательно, число автоморфизмов равно р — 1. Мы уже отме- чали в главе 2 аналогию между умножением корней из 1 и сло- жением классов вычетов. Не так заметна, но не менее важна другая нить, связывающая группу Сп и кольцо классов выче- тов Zn. Оказывается, группа автоморфизмов AutCp изоморфна группе ненулевых классов вычетов Z*. Действительно, обозна- чим через ак автоморфизм, переводящий корень z\ в zk Cfc^i) = zk = 4 (к = 1,2,... ,р- 1), и сопоставим этому автоморфизму класс к е. Z*. Ясно, что такое соответствие ак -♦ к определяет взаимно однозначное соответ- ствие между группами Aut Ср и Z*. Кроме того, для любых двух автоморфизмов ак, сгт Ok = Ок№) = Z^m = <7fon(zi), (5.3) поэтому &к&т — &кт- (5.4)
94 Глава 5. 2000 лет спустя В равенствах (5.3) и (5.4) произведение km понимается, конечно, в смысле умножения по модулю р. Но тогда произведению авто- морфизмов <7fc, ат будет соответствовать произведение классов вычетов, следовательно, отображение о к к является изомор- физмом. Отметим ещё такое обстоятельство. Многочлен zp — 1 разла- гается на множители zp — 1 = (z — l)(zp-1 + zp~2 + ... + z + 1). Понятно, что все корни, отличные от 1, то есть числа (5.1), яв- ляются корнями второго сомножителя. В общих чёртах дальнейший план рассуждений Гаусса таков. Используя свойства полей вычетов Zp, он устанавливает, что ав- томорфизмы группы корней р-ой степени сами образуют цикли- ческую группу G порядка р — 1. Пусть Р- 1 = PlP2---Pt-lPt — разложение порядка этой группы на простые множители (не обязательно различные). Как следует из дополнения 7 к главе 4, в группе G имеется цепочка подгрупп G D G\ D С?2 D ... D Gt—1 D Gt = {е} таких, что |G:Gi|=pi; |Gi:G2|=P2; ••• |Gt-i : Gt| = |Gt| = pt. Гаусс составляет такие выражения /ь/г, • • • ,/t-i, зависящие от корней, которые симметричны только относительно подстановок из подгрупп Gi,G2,...,Gt-i, то есть не меняются при указан- ных подстановках. Для выражения Д, симметричного относи- тельно Gi, устанавливается, как и в теории Лагранжа, что при действии всех подстановок из Gi оно принимает р\ различных значений, являющихся корнями уравнения степени pi с рацио- нальными коэффициентами. В свою очередь, выражение Д при- нимает р2 различных значений при действии всех подстановок из
Глава 5. 2000 лет спустя 95 подгруппы Gi, и эти значения служат корнями уравнения степе- ни Р2- Правда, коэффициенты последнего уравнения уже не ра- циональны, но они рационально выражаются через корни преды- дущего уравнения. Далее всё аналогично. Гаусс показывает, что последовательно решая указанные уравнения степеней pi,p2, • можно дойти в конечном итоге до вычисления корней р-ой степени из 1, выразив их тем самым через корни промежу- точных уравнений. В этих рассуждениях немаловажную роль иг- рала применённая Гауссом иная, чем прежде, нумерация корней, вытекающая не из геометрической их симметрии, а из симметрии алгебраической, — симметрии относительно группы автоморфиз- мов G. Каковы же детали этих рассуждений? Проследим их для частного случая р = 17. Именно он прежде всего и интересовал Гаусса, ведь правильный семнадцатиугольник был многоугольни- ком с наименьшим числом сторон, для которого ещё со времён Евклида оставалась неизвестной возможность геометрического построения традиционными инструментами древних — циркулем и линейкой (см. дополнение 2). , : При р = 17 группа автоморфизмов G = Aut Си имеет порядок 16 и изоморфна мультипликативной группе Z}7. Прямой провер- кой можно установить, что класс 3 является её образующим. Так как группы и G изоморфны, отсюда следует, что автоморфизм а такой, что cr(zi) = zf, является образующим группы автомор- физмов. Таким образом, все элементы группы G имеют вид ак, где к = 0,1,... 15. Так как ct2(zi) = a{zl) = zf; <T3(2!i) = ff(ff2(zi)) = ff(42) = ^i3; ••• <T*(zi) = zf, то мы видим, что элементы группы Ci7, отличные от 1, имеют вид о о2 ofc о15 *1, z%, z{ , ..., z{ , ..., z{ . Тот факт, что они последовательно переходят друг в друга при повторном применении автоморфизма а, делает естественной другую нумерацию корней. Гаусс полагает Со = ^1. Ci = z?, Сг = ч2 = zf , и вообще, Cfc = \ А; = 0,1,..., 15. (5.5)
96 Глава 5. 2000 лет спустя При ЭТОМ а(&)=й+1, <?(&) = &+/, (5-6) где индексы суммируются по модулю 16. Обратимся теперь к собственным подгруппам группы G = = Aut (717. Их в данном случае три: <71 = (а2) , <?2 = (а4) , (7з = (а8) . Порядки этих подгрупп соответственно равны 8, 4, 2. Нетрудно указать функции от корней, симметричные (или ин- вариантные) относительно перечисленных подгрупп. Например, относительно подстановок из Gi симметричными будут следую- щие две суммы По = Со + Сг + Gi + Сб + Св + Сю + С12 + С14, Hi = Ci + Сз + Сб + Сг + Сэ + Си + С13 + С15- Понятно, по какому принципу они построены. Так, слагаемыми первой суммы согласно (5.6) являются все те образы элемента Со, которые получаются при повторном применении автоморфиз- ма <т2. Совершенно аналогично устроена и вторая сумма. Это и обеспечивает инвариантность выражений туо и П1 относительно автоморфизмов из Gi — их действие сводится просто к цикличе- ской перестановке слагаемых. Действие же всех других автомор- физмов из G переводит тю в гц и обратно (почему?). Теперь можно, по аналогии с рассуждениями Лагранжа, вы- сказать догадку, что по и П1 являются корнями квадратного уравнения с рациональными коэффициентами. Это действитель- но так, и чтобы в этом убедиться, докажем, что по + П1 и ПоП1 рациональны. Для суммы по + П1 это совсем просто. В самом деле, 15 По + П1 = Ск- (5.8) ь=о Вспомним, что Ск являются корнями уравнения г16 + z15 + ... + z + 1 = 0, (5.9)
Глава 5. 2000 лет спустя 97 (5.10) (5.11) (5.12) поэтому по формулам Виета сумма (5.8) равна —1: % + т = -1- Сложнее разобраться с произведением W = <Х1 + СоСз + • • • + £1X15 • Сгруппируем слагаемые следующим образом Вд1 = (CoCi + С1С2 + СгСз + • • • + С14С15 + С1бСо)+ +(СоСз + С1С4 + СгСб + • • • + С14С1 + С15Сг) + +(CoCs + С1Сб + С2С7 + • • • + С14С3 + CisC4)+ +(CoCr + CiCs + С2С9 + • • • + С14С5 + CisCe). Принцип группировки достаточно ясен: в каждой группе индекс второго сомножителя отличается по модулю 16 от индекса перво- го на фиксированное число — в первой группе на 1, далее на 3, 5 и 7. При этом будут охвачены все слагаемые из (5.11). Разберёмся с первой из групп CoCi + С1С2 + С2С3 + .. • + С14С15 + С15С0 = 15 = С0С1 + f(CoCi) + • • • + <т14(СоС1) + <’,15(СоС1) = У crfc(CoCi) • к=0 (5.13) Так как CoCi = Cm для некоторого т, то сумма (5.13) преобразу- ется следующим образом 15 15 УУ^(Ст) = У^С/г+т- fc=0 к=О Слагаемые получившейся суммы, очевидно, исчерпывают все корни уравнения (5.9), поэтому она, а вместе с ней рассматри- ваемое выражение, равны —1. Аналогичные рассуждения можно применить и к остальным суммам в (5.12) —все они также рав- ны —1, но тогда Лот = -4. (5.14) 4 — 261
98 Глава 5. 2000 лет спустя Равенства (5.10) и (5.14) приводят нас к желаемому результату — числа тю, t]i являются корнями квадратного уравнения z2 + z — — 4 = 0. При этом несложно показать, что тю равно большему из корней, а 7?1 — меньшему % = -1-/17 т = —2~" (5.15) На следующем этапе рассматриваются суммы, сохраняющиеся при действии автоморфизмов из группы G2 = (ст4 *). Таковыми будут суммы корней Ц) — Со + Сд + Cs + C12> vi — С1 + Сб + Со + С1з, ^2 — Сг + Сб + Сю + С14, ^3 — Сз + Ст + Си + С15- Очевидно, z/o+ ^2 = т]о, vi + из = ’ll- Можно показать (предостав- ляем это читателю), что vqV2 = у^з = — 1- Значит, пары чисел (ць^г) и (у\,из) являются соответственно корнями квадратных уравнений х2 — тюх — 1 = 0, х2 — 771Х — 1 = 0. Решая эти уравнения с учётом равенств (5.15), получим л/17 — 1 4- У34 - 2/17 4__________ /17 - 1 - /34 - 2/17 —х/17 - 1 + /34 + 2/17 4 —х/17 - 1 - /34 + 2/17 На заключительном этапе рассматриваются суммы Мо = Со + Св, Mi=Ci + C9, М2 = Сг + Сю, Мз = Сз + Си, МД = Сд 4- С12, Мб = Сб + С13, Мб = Сб + С1Д, М7 = <7 + С15, инвариантные относительно автоморфизмов из G3 = (ст8). Рас- смотрим до и мд- Для них выполняются соотношения Мо + Мд = = i/q, моМд = М2, и уравнение, которому они удовлетворяют, име- ет вид z2 — vqz + V2 = 0. Число мо, как можно проверить, равно
Глава 5. 2000 лет спустя 99 большему его корню, так что после преобразований Ро + ~ _ /*> =------2 “ __________________________ 717-1 + 734 - 2717 + 2у/17 4- Зу/17 - 7170 + 38W = 8 ‘ Из подобных формул находятся и все другие д». По ним могут быть найдены и все корни & из 1. Однако, для нужд самого построения достаточно уже того, что величина до записана как квадратичная иррациональность. Действительно, нетрудно проверить, что до = 2cos^. Зная величину cos можно, наконец, построить этот «таинственный» семнадцатиугольник. Решив задачу для семнадцатиугольника, Гаусс разобрался и с общей ситуацией, описав все правильные многоугольники, доступные для построения циркулем и линейкой. Действитель- но, подобное описанному выше сведение к квадратичным, ирра- циональностям возможно, если р — 1 является степенью двой- ки. Значит, .многоугольник с простым числом сторон р может быть построен тогда и только тогда, когда р есть число вида 2к + 1 (подробнее в дополнении 3). Для произвольного правиль- ного n-угольника построение возможно в том и только в том слу- чае, если п = 2mpip2...ps и все р» —различные простые числа указанного выше вида: pi = 2fc* + 1. Гаусс высказал этот кри- терий без доказательства, предостерегая читателей от тщетных попыток искать построение в каких-либо иных случаях. Он до- бавляет, что может со всей строгостью его доказать, и лишь границы сочинения не позволяют этого сделать. Дополнения и задачи 1. ..Следуя рассуждениям Гаусса, указать способ цостроения пра- вильного пятиугольника. 2. Из критерия Гаусса следует невозможность построения цир- кулем и линейкой правильного семиугольника. Вообще, для 4»
100 Глава 5. 2000 лет спустя п 100 имеются лишь 22 значения п (какие?), для которых пра- вильный n-угольник может быть построен циркулем и линейкой. 3. Доказать, что если число вида 2к +1 является простым, то к является степенью двойки. Таким образом, простые числа, участвующие в формулировке критерия Гаусса, должны иметь вид 22Г + 1. Числа указанного вида рассматривал ещё Ферма, ошибочно полагая, что они всегда простые. Однако Эйлер обнаружил, что получающееся при г = 5 число 4294967297 имеет своим делителем число 641. Более того, выяснилось, что и среди последующих чисел Ферма (так называют числа вида 22r +1) сплошь и рядом встречаются со- ставные. Возникло даже предположение, что множество простых чисел Ферма конечно. Справедливость этой гипотезы означала бы, что имеется лишь конечное число правильных п-угольников с нечётным числом сторон, допускающих построение циркулем и линейкой. 4. Критерий Гаусса означает, что окружность может быть раз- делена циркулем и линейкой на п равных частей тогда и только тогда, когда п = 2mpiP2---Ps, где все pi — различные простые числа Ферма. Полное доказательство этого факта опирается на теорию Галуа, представление о которой даёт глава 14. Здесь мы убедимся лишь в том, что если п — число указанного вида, то построение возможно (при этом случай простого п будем счи- тать уже исчерпанным). Доказательство опирается на следующие несложные утверждения. 1) Из возможности деления окружности на h равных частей сле- дует возможность её деления на 2mh равных частей для любого натурального т. 2) Из возможности деления окружности на pi равных частей и на р2 равных частей, где pi и рг взаимно просты, следует возможность её деления на рхрг равных частей. Первое утверждение сразу вытекает из того, что любой угол при помощи циркуля и линейки можно разделить пополам. Для проверки второго утверждения нам придётся сослаться на срав- нительно элементарный факт, который, впрочем, доказывается в главе 6 (дополнение 6).
Глава 5. 2000 лет спустя 101 Если pi и р2 взаимно просты, то существуют такие целые числа si и 32, что S1P1 + S2P2 = 1. Пусть теперь с —длина окружности, и c/pi, с/р2 — длины дуг, получающихся при делении окружности на р\ и, соответственно, Р2 равных частей. Понятно, что тогда легко может быть постро- ена дуга длины С С (S1P1 + 32Р2)С с 31------1- 32 • — = ----------- = ----, Р2 Pl Р1Р2 Р1Р2 и следовательно, окружность можно разделить на pip2 равных частей. Если п = 2mpip2 ...рз, то ясно, что первое утверждение сво- дит задачу к делению окружности на pip2Рз равных частей. Если з = 2, то возможность деления окружности на Р1Р2 равных частей вытекает из второго утверждения. Если же з произвольно (з > 2), то дело довершает очевидная индукция.
ГЛАВА 6 ТОЛЬКО ЧИСЛА Каждый школьник, постепенно знакомящийся с миром чисел, как бы в миниатюре воспроизводит многовековую историю разви- тия представлений о числе. В общих чертах она отражена в сле- дующей последовательности наиболее употребительных в мате- матике и её приложениях числовых систем. N— множество натуральных чисел, Z— множество целых чисел, Q— множество рациональных чисел, R— множество действительных чисел, С— множество комплексных чисел. Греческие математики и философы любили повторять изречение «Всё есть число», но долгое время им не было известно никаких иных чисел, кроме натуральных и их отношений. Отрицательные числа были «узаконены» в математике значительно позднее, чем дроби. Велико же было изумление греков, когда они обнаружили, что этих чисел недостаточно даже для измерения длин. Напри- мер, отношение длины диагонали квадрата к длине его стороны, как было выяснено последователями Пифагора, невозможно за- писать никакой дробью. Мы выражаем этот факт словами, что л/2 есть число иррациональное. С открытия иррациональностей началась эпоха недоверия к числам в античной математике, что и привело к полному господству в ней геометрии. Любые задачи
104 Глава 6. Только числа в ту пору стремились сформулировать на геометрическом языке и решать геометрически, то есть построением. При этом особая роль приписывалась построениям с помощью циркуля и линейки. Мы уже знаем, что указанными инструментами можно строить лишь квадратичные иррациональности. В то же время, корни произвольных алгебраических уравнений сплошь и рядом не яв- ляются таковыми. Отсюда, как уже отмечалось в главе 1, следует неразрешимость многих задач на построение. Со временем выяснилось, что существуют числа (например, 7г), которые не являются алгебраическими, то есть корнями урав- нений хп + ai®n-1 + ... + an-ix + On = 0 с рациональными коэффициентами од. Такие числа называют трансцендентными. Потребовался длинный путь развития математики, чтобы внести ясность в представления о числе. Достаточно сказать, что учение о квадратичных иррациональностях содержится уже в «Началах» Евклида (III век до н. э.), а первое доказатель- ство существования трансцендентных чисел было дано лишь в 1844 году французским математиком Лиувиллем (1809-1882). Добавим к этому, что само математически корректное понятие действительного числа, не опирающееся на геометрическую интуицию, было введено ещё позднее, в семидесятые годы девятнадцатого столетия. Какие бы числа мы не рассматривали, мы не мыслим их в от- рыве от возможности оперировать ими по законам арифмети- ки. Речь, естественно, идёт об операциях сложения, вычитания, умножения, деления. Можно заметить, однако, что перечислен- ные выше числовые системы не одинаково ведут себя по отно- шению к этим четырём арифметическим действиям. Так, в обла- сти натуральных чисел мы свободно можем выполнять сложение и умножение, в то время как обратные к ним действия не все- гда выполнимы. Не существует, например, натурального числа, являющегося разностью чисел 2 и 3, как нет и натурального числа, которое являлось бы из отношением. В множестве всех целых чисел вычитание выполнимо уже без всяких ограничений.
Глава 6. Только числа 105 Расширив множество Z до множества Q всех рациональных чи- сел, мы получаем возможность во всех случаях (кроме деления на 0) выполнять и четвёртую арифметическую операцию. В этом смысле множество Q обладает замкнутостью относительно четы- рёх действий арифметики. Подобным свойством обладают и две другие, более обширные числовые системы К и С. Числовое мно- жество, замкнутое относительно всех арифметических операций и содержащее хотя бы один ненулевой элемент, принято назы- вать числовым полем. Особое название имеется и в случае, когда множество замкнуто лишь относительно первых трёх операций. В этом случае .его называют числовым кольцом. Таким образом, каждое из множеств Q, R, С образует числовое поле: поле ра- циональных, действительных и комплексных чисел. В отличие от них множество Z поля не образует, но является числовым кольцом — это так называемое кольцо целых чисел. Как мы вскоре увидим, числовые системы, перечисленные вы- ше—это лишь немногие из примеров в большом многообразии числовых колец и полей. Интересно отметить особую роль, кото- рую играют, поля Q и С. Оказывается, поле рациональных чисел является наименьшим из числовых полей, а поле комплексных чисел — наи- большим. Смысл второго утверждения прояснится позднее, а первое мы легко можем доказать уже сейчас. Для этого заметим прежде всего, что в любом числовом полеТ обязательно должны содер- жаться 0 и 1. В самом деле, если / — произвольный ненулевой элемент поля F, то разность / — /, равная 0, и отношение ///, равное 1, по определению числового поля должны ему принадле- жать. Но то же самое верно и для любого натурального числа п, поскольку п = 1 + 1 + .. . + 1 (сумма п слагаемых), и даже для любого целого, так как — п = 0 — п. Наконец, из того, что це- лые числа т и п (п / 0) содержатся в поле F следует, что этим же свойством обладает и их отношение, то есть всякая дробь т/п. Итак, всякое числовое поле целиком содержит поле рацио- нальных чисел. Это и означает, что Q — наименьшее из числовых полей.
106 Глава 6. Только числа Другие числовые поля могут быть получены из Q путём присо- единения к нему иррациональных чисел. Характер этого процес- са иллюстрирует пример поля, получающегося присоединением к Q числа \/2. Это числовое поле, содержащее как Q, так и \/2, обязано содержать и все числа вида а + Ьу/2, где a, b € Q. Рас- смотрим множество Q(\/2) всех таких чисел ®(V2) = {a + bV2\ a, 6eQ} (6.1) и убедимся, что оно удовлетворяет всем требованиям, предъяв- ляемым к числовому полю. Действительно, если oi + 6i\/2 и аг+ 624/2 —произвольные числа из Q(\/2), то их сумма, раз- ность и произведение имеют вид (ai + 614/2) ± (ог + 624/2) = (ai ± ог) + (61 ± 6г)\/2, (6.2) (oi + 614/2)(ог + 6г\/2) = (в1в2 + 2616г) + (°1^2 4" 0261)4/2, и поэтому также принадлежат множеству (6.1). Предполагая, что ог + 624/2 ± 0, рассмотрим отношение oi + 61 (ai + 61 \/2) (02 — 62 4/2) Ог + 624/2 (ог + 624/2 )(ог — 624/2 ) _ (ахаг - 26162) + (0261 — 0162) 4/2 _ “ al~2b2 ~ _ 0102 — 2616г ,0261 — 0162 щ . " al - 262 + О2_2Ь2 V2. (Ь.б) В полученном выражении знаменатель 02 — 2б| отличен от ну- ля. Предположив противное, мы сразу придём к противоречию с тем, что число у/2 иррационально. Значит, и отношение (6.3) содержится в множестве Q(\/2). Таким образом, числовая систе- ма (6.1), обладая замкнутостью относительно всех арифметиче- ских операций, даёт нам новый пример числового поля — одного из простейших после Q поля алгебраических чисел. Попутно от- метим, что если из рассмотренных чисел оставить лишь те, для которых коэффициенты а и 6 целые, то получающееся множество 2(4/2) = •( а + 64/2 | а, 6 G 2 }
Глава 6. Только числа 107 является, подобно Z, кольцом, но не полем. Равенства (6.2) и (6.3) позволяют легко проверить это. Числовые кольца и поля —это своего рода арены, на кото- рых разворачиваются события при решении многих задач теории чисел. Используя такое сравнение, можно было бы сказать, что ареной для классической теории чисел, связанной прежде всего с именами Ферма и Эйлера, являлись кольцо целых и поле рацио- нальных чисел. Гаусс был первым, кто пришёл к убеждению, что «естественный источник общей теории следует искать в расшире- нии области арифметики» (в кавычки заключены его собствен- ные слова). К необходимости такого расширения его привели глубокие исследования, касающиеся так называемых степенных вычетов. Об их частном случае — квадратичных вычетах и квад- ратичном законе взаимности — мы упоминали в главе 4. В слу- чае вычетов четвёртой степени (иначе, биквадратичных вычетов) Гауссу пришлось рассмотреть множество Z[i] комплексных чи- сел с целыми действительной и мнимой частью Z[i] = {а + Ьг| a, b € Z}. (6.4) Это был исторически первый пример кольца целых алгебраиче- ских чисел, именуемый теперь кольцом целых гауссовых чисел. Тот факт, что множество Z[i] действительно образует числовое кольцо, читатель легко может проверить самостоятельно. Эпитет «целый» по отношению к гауссовым числам был при- менён не случайно —они и в самом деле оказались во многом похожи на обычные целые числа. Поясним подробнее, что име- ется в виду. Все хорошо знают, что натуральные числа бывают простые и составные1. Основная теорема арифметики утверждает, что всякое составное натуральное число единственным образом раз- лагается в произведение простых. Единственность понимается с точностью до порядка сомножителей. Хотя этот факт мно- гими воспринимается как нечто само собой разумеющееся, он 1 Исключение составляет единица, которую не относят ни к простым, ни к составным числам.
108 Глава 6. Только числа нуждается в доказательстве, которое отнюдь не очевидно. Позд- нее он будет доказан в намного более общей ситуации, а пока лишь отметим, что рассуждения, приводящие к основной теоре- ме арифметики, опираются на известное всем правило деления с остатком: для любого целого числа т и натурального п существуют и притом единственные целые числа q и г такие, что т = q - п + г, 0 < г <п (6.5) (q называют неполным частным, аг — остатком при делении т на п). Любопытно, что ещё Евклид использовал это правило для отыскания наибольшего общего делителя двух натуральных чи- сел. Придуманный им способ, который называют алгоритмом Ев- клида, состоит в следующем. Пусть при делении т на п получено равенство (6.5). Если получившийся остаток г отличен от 0, разделим на него прежний делитель п п = <?1 • г + п, 0^п<г. (6.6) Если и новый остаток не равен нулю, продолжаем аналогичную процедуру до тех пор, пока в результате последовательного деле- ния не получится нулевой остаток. Такое обязательно произой- дёт, так как получающиеся остатки г, ri, ?2 и т. д. строго убыва- ют. В итоге мы придём к следующей цепочке равенств г = 92 • Г1 + Г2, Г1 = 93 • Г2 + Гз, 0 < Г2 < Г1, 0 < Гз < Г2, о < rk < rfc-1, Ffc+1 = 0. (6.7) Пс-2 = Qk • Гк-1 + Гк, Tk-1 = 4k+l • Тк, Оказывается, последний ненулевой остаток гк совпадает с наи- большим общим делителем чисел тип. Доказать это можно так. Посмотрим на нашу цепочку (6.5), (6.6), (6.7), начиная с по- следнего равенства. Из него вытекает, что гк делит гк-\. Тогда
Глава 6. Только числа 109 в правой части предыдущего равенства оба слагаемых делятся на г к, и значит, г к делит г к-2- Переходя от равенства к равен- ству снизу вверх, точно так же последовательно устанавливаем, что Гк делит гь-з, ..., г\, п, т. Итак, г* —общий делитель чи- сел тип. Чтобы убедиться в том, что он наибольший, пройдём цепочку уже сверху вниз. Предположим, что d — произвольный общий делитель т и п. Из (6.5) следует тогда, что d делит г, а из (6.6) — что d делит и п. Спускаясь вниз по равенствам (6.7), убеждаемся в итоге, что d делит Гк- Иными словами, Гк делит- ся без остатка на всякий общий делитель чисел т и п, но это и означает, что он является их наибольшим общим делителем. Оказалось, — это и было открыто Гауссом, — что арифметиче- ские понятия и теоремы, которые всегда связывались с натураль- ными и целыми числами, имеют гораздо более широкий смысл, распространяющийся, в частности, и на кольцо Z[i]. Правда, чтобы это понять, некоторые из понятий применительно к про- извольным числовым кольцам придётся несколько подкорректи- ровать. Прежде всего, это относится к понятию простого числа. Вспомним, что натуральное число п называется простым, если оно делится без остатка только на 1 и на самого себя. Даже в случае целых чисел такое определение теряет смысл. Объяс- няется это тем, что в кольце Z делителем любого числа наряду с 1 является ещё и число —1, и поэтому вместе с тривиальным разложением п = 1 • п есть ещё и такое: п = (—1) • (—п). Это тем более относится к рассмотренной Гауссом числовой области. Здесь имеется четыре числа, на которые делится без остатка любое целое гауссово число. Это 1, -1, i, —i. (6.8) Действительно, ясно во-первых, что каждое из них делит 1, а зна- чит, и всякое число из Z[i] (например, 1 = «(—?)). С другой стороны, пусть а + bi — делитель 1. Тогда 1 _ а Ь . а + Ы а2 + Ь2 а2 + Ь2 г — целое гауссово число. Понятно, что это возможно лишь, если а2 + Ь2 = 1. Ровно четыре целочисленные решения последнего
110 Глава 6. Только числа уравнения а = ±1; Ь = 0 и а = 0; Ь = ±1 показывают, что числами (6.8) исчерпываются все делители 1 кольца Z[i). Присутствие в произвольных числовых кольцах таких особых элементов — делителей 1 (их ещё называют обратимыми эле- ментами) вынуждает внести корректировку, о которой говори- лось выше. Гаусс даёт следующее определение простого числа, которое, в сущности, годится для любого числового кольца с еди- ницей. Число z он называет простым, если оно не является де- лителем 1, но в любом его разложении z = z\Z2 один из сомно- жителей — обязательно делитель 1. Нетрудно понять, что простыми целыми числами будут про- стые натуральные и противоположные к ним числа. Полная ин- формация о простых элементах гауссова кольца Z[i] имеется в дополнении. Всё же обратим внимание на два примера, кото- рые хорошо отражают имеющуюся здесь специфику. Пример 1. Числа 1±г являются простыми в кольце Z[i]. Пусть, например, 1 + i = (oi + &1^)(я2 4" ^2*)- (6.9) Тогда аналогичное соотношение справедливо для модулей этих чисел |1 + г| = |ai + b]i| |а2 + ^2^|- Возводя обе части последнего равенства в квадрат, получаем 2 = (°i + ^i)(°2 + (6.10) Из (6.10) вытекает, что либо а% + bf = 1, а% + = 2, либо на- оборот. В обоих случаях в равенстве (6.9) один из сомножителей является обратимым элементом. Пример 2. Число 2, являющееся простым в Z, уже не будет таковым в Z[i], В самом деле, равенство 2 = (1 + г)(1 — г) служит разложением 2 на множители, ни один из которых не обратим.
Глава 6. Только числа 111 Рассматривая задачу о биквадратичных вычетах, Гаусс столк- нулся со следующим вопросом: справедлива ли основная тео- рема арифметики в расширенной им числовой области? Правда, сам этот вопрос требует корректной постановки. Ведь единствен- ность разложения на простые сомножители в буквальном смысле невозможна, — этому препятствуют обратимые элементы. Даже в кольце целых чисел Z уже имеется такая неоднозначность, на- пример, 6 = 2-3 = (-2) • (-3). (6.11) Значит, единственность можно требовать лишь с точностью до множителей, являющихся делителями единицы. Таким образом, неизбежно следующее соглашение. Два разложения числа z на простые множители z = PiP2---Pm, z = qiq2...qn считаются эквивалентными (одинаковыми), если, во-первых, число простых сомножителей в обоих разложениях совпада- ет, то есть т = п, и во-вторых, при подходящей нумерации сомножителей соответствующие элементы Рк и qk отлича- ются лишь обратимым множителем (ассоциированы). Очевидно, два разложения из (6.11) эквивалентны в Z. Также эквивалентными, но уже в кольце Z[i], являются разложения 2 = (1 + г)(1 - г) = (-1 + i)(—1 - г). Кольцо, в котором любые два разложения данного числа на простые множители эквивалентны, называется кольцом с одно- значным разложением на множители. Говорят, что в нём спра- ведлива основная теорема арифметики. Гауссу удаётся доказать, что рассматриваемая им область Z[i] обладает однозначным разложением в указанном выше смысле, и опираясь на это, прийти к решению исходной задачи. Доказа- тельство он проводит по той же схеме, что и для натуральных чисел, используя способ деления с остатком целых гауссовых чи- сел, вполне аналогичный правилу (6.5). Но и тут не обходится
112 Глава 6. Только числа без затруднений. В самом деле, в формулировке этого прави- ла существенным является условие 0 г < п. В то же время, аналогичные неравенства теряют смысл для комплексных чисел (их нельзя сравнивать подобно действительным числам). Гаусс преодолевает и эту трудность, рассматривая для своих чисел ве- личину, называемую их нормой. Под нормой комплексного числа z = а + bi понимается число N(z), равное квадрату его модуля N(z) = а2 + Ъ2. Очевидно, что норма целого гауссова числа является числом на- туральным или нулём1. Легко заключить, что норма, как и мо- дуль, следующим образом согласована с умножением N(z1z2) = N(z1)N(z2). (6.12) Наконец, главное. Для любых целых гауссовых чисел z и w можно указать такой способ деления с остатком, чтобы норма остатка была меньше нормы делителя. Рассмотрим с этой целью обычное частное комплексных чисел z и w zw 1 = а + /3i. (6.13) Конечно, в последнем равенстве а и /3 уже не обязательно целые числа. Выберем тогда такие целые к, I € Z, которые являются ближайшими соответственно к а и /3. Получим а = к + а', /3 = I + /3', (6.14) где |а/| 1/2, |Х?'| < 1/2. Из (6.13) и (6.14) вытекает, что z = w(a + /Зг) = w(k + И) + w(a' + /?'г). Вводя обозначения q = k+li, г = w(a'+/3'i), запишем z = qw+r. Так как q, а следовательно, и qw принадлежат кольцу Z[i], то г, 1 Модуль же, в отличие от нормы, может оказаться даже числом иррацио- нальным. Этим и объясняется удобство нового понятия.
Глава 6. Только числа 113 как разность двух целых гауссовых чисел, также принадлежит Z[i], При этом N(r) = N(w(a' + /З'г)) = N(w)N(a' + /З'г) = = N(w) (а'2 + /З'2) < JV(w) Q + < 2V(w). Итак, для любой пары чисел z,w € Z[i] (w / 0) существуют такие q,r е Z[i], что возможна следующая запись, аналогичная (6.5) z = qw + г, rjieN(r) < N(w). (6.15) Пример. Пусть z = 1 + 4г, w = 2 + i. Тогда 1 + 4г 2 + i- 6 7. .. = - + -г = (1 + г) 4- о о 1 2. ~ + -г о о откуда после перемножения 1 + 4г = (1 + г) (2 -Ь г) + г. В этом ра- венстве число г играет роль остатка, для которого, как и в (6.15), ЛГ(г) = 1 < ЛГ(1 + г) = 2. • Теперь можно распространить на кольцо Z[i] и алгоритм Ев- клида. Действительно, последовательно проводя для целых гаус- совых чисел деление с остатком, получим цепочку соотношений z = q • w + г, w = qi • г + Г1, Г = Q2 -П +Г2, N.(r) < N(w), ЛГ(п) < N(r), JV(r2) < Мп), (6.16) Гк-2 = Чк Гк-1 + Гк, N(rk) < N(Tk-i), Гк-1 = Qk+1 • Гк- Как и прежде, можно гарантировать, что процесс оборвётся через конечное число шагов, так как последовательность норм ЛГ(г), Мп), ТУ(г2), ..., .ZV(rfc) — это строго убывающая последователь- ность натуральных чисел. Тем же способом, что и раньше, до- казывается, что последний ненулевой остаток совпадает с наи- большим общим делителем чисел z и w, то есть делит z и w и делится на любой их общий делитель.
114 Глава 6. Только числа Пример. Если z = 3 + 5г, w = 1 + Зг, то 3 + 5г = 2(1 + Зг) + (1 - г), 1 + Зг = (—1 + 2г)(1 — г). Следовательно, (1—г) — наибольший общий делитель чисел 3+5г и 1 + Зг. Дальнейшее развитие алгебры и теории чисел показало, что существует много других числовых колец, и не только число- вых, в которых возможен алгоритм Евклида. Эти кольца были названы евклидовыми. В любом евклидовом кольце справедлива основная теорема арифметики. С другой стороны, обнаружилось, что не для всех числовых колец вопрос о единственности разло- жения на простые элементы решается положительно. Это тонкое обстоятельство порой упускали из виду даже самые маститые математики. Так Эйлер, доказывая Великую теорему Ферма1 для показателя п = 3, использовал комплексные числа вида а + by/—3, где a, b € Z, видимо, не испытывая сомнений в их «приличном поведении». Лишь позже было осознано, что в этой числовой области основ- ная теорема арифметики не верна. Например, в равенстве 4 = 2- 2 = (1 + %/—3) • (1 — /—3) сомно- жители 2 и 1 ±-/^3 являются простыми числами. В то же время, можно показать, что-эти два разложения не эквивалентны. Докажем простоту чисел 1 ± х/~3, предоставляя остальное читателю. Предположим, что 1 + л/Зз = (а + ьУ=3)(с + ал/^3). (6.17) Тогда 1-^3 = (а — Ь\/^3)(с — t/л/—3). (6.18) Перемножая эти два равенства, получим 4 = (a2+3b2)(c2+3d2). 1 Об этом читатель узнает в следующей главе.
Глава 6. Только числа 115 Так как здесь каждый сомножитель — число натуральное, то ли- бо оба они равны 2, либо один из них равен 4, а другой равен 1. Первое невозможно, так как уравнение а2+ ЗЬ2 = 2, очевидно, не имеет решений в целых числах. Во втором случае a2+3b2 = 4, c2+3d2 = l или наоборот. Второе уравнение имеет лишь решения с = ±1, d = 0. Но тогда в разложениях (6.17) и (6.18) сомножители с± ± dy/^З = ±1 обратимы, а значит, числа 1 ± х/^З простые. К счастью, нашлась возможность устранить некорректность в рассуждениях Эйлера, и смелая идея его доказательства была спасена. К этому мы ещё вернёмся в следующей главе. В заключение этой главы познакомим читателя с достаточ- но общим способом построения полей и колец алгебраических чисел. Многие из примеров, рассмотренных в основном тексте и в дополнении, являются частными случаями этого способа. Рассмотрим произвольное алгебраическое число а, то есть та- кое, которое является корнем некоторого многочлена с рацио- нальными коэффициентами. Ясно, что такой многочлен не один. Имеется даже бесконечное множество многочленов, корнем ко- торых является данное число а. Среди них выберем тот, который имеет наименьшую степень и старший коэффициент 1 ц(х) = хт + ai»”1-1 + ... + ат-\х + ат. (6.19) Он называется минимальным многочленом числа а. Например, минимальным многочленом для числа д/2 служит многочлен х2 — 2, а для \/2 — многочлен а:3 — 2. Для каждого алгебраического числа а минимальный много- член определяется уже единственным образом. В самом деле, пусть v(x) = хт + bi»"1-1 + ... + Ьт_[х + bm (6.20) — другой минимальный многочлен для а, отличный от ц(х). Рас- смотрим разность многочленов (6.19) и (6.20) 5(гс) = д(ж) — и(х) = = (®1 ~ Ь1) х"1"1 + . . . + (fim-i - bm_i) X + (ат - Ьт).
116 Глава 6. Только числа Так как д(а) = i/(a) = 0, то и 6(a) = 0. Но последнее равенство противоречит определению минимального многочлена, поскольку степень 6(х) меньше степени р(х). Ясно, что всякое числовое поле, содержащее Q и число а, обязано содержать и все числа вида qo + gioi + q2a2 + ... + qnan, гдед*. € Q, n € N. (6.21) Это вытекает из замкнутости любого поля относительно сложе- ния вычитания и умножения. Вспоминая, что а — корень много- члена (6.19), приходим к равенству /г(а) = 0, или ат = -aia"1-1 - ... - am-ia - ат. Значит ат, а тогда и любую ббльшую степень, можно записать как комбинацию степеней 1 = а°, а = а1, ..., а"1-1 с рацио- нальными коэффициентами. То же самое, понятно, справедливо и для любого числа вида (6.21), так как каждое из них допускает запись вида Po+pia + p2a2 + ...+рт-1ат~1 (pk^Q)- (6.22) В отличие от (6.21) , последняя запись единственна. Действитель- но, предположим, что для некоторого элемента z имеются две различные записи z = Ро + Pi+ Р2 а2 + ... + рт-\ат~1 = = Ро + Р1« + Р2 «2 + • • • + Pm-l"”1-1 • С6-23) Тогда получим го + И а + Г2 а2 + ... + = 0, гк=Рк~ Рк- (6.24) Иными словами, число а является корнем ненулевого многочле- на го + и х + Г2 х2 + ... + гт-гхт~1 степени, меньшей т. Мы вновь приходим к противоречию с определением минимального многочлена. Отсюда заключаем, что рк = р'к в равенстве (6.23), то есть обе записи совпадают.
Глава 6. Только числа 117 Оказывается, множество всех чисел, записываемых в форме (6.22), уже само образует поле, причём наименьшее из тех, ко- торые содержат а. Для доказательства необходимо было бы про- верить, что указанное множество (будем его обозначать Q(a)) замкнуто относительно всех арифметических операций. Замкну- тость относительно сложения, вычитания и умножения доказы- вается без труда — предоставляем сделать это читателю. Доказа- тельство замкнутости относительно деления имеется в дополне- нии 10. Поле Q(a) называют простым алгебраическим расши- рением поля Q с помощью элемента а. Интересно, что многие поля алгебраических чисел сводятся к подобным расширениям (см. дополнение 12). Отметим, наконец, что в произвольных полях алгебраических чисел, так же, как и в Q, имеет смысл понятие целого числа. Целое алгебраическое число определяется как корень уравнения хт + ai®”1-1 + ... + am-ix + ат = 0 (6.25) с целыми коэффициентами (а^ € Z). Их роль в различных ал- гебраических полях во многом сходна с той, которую играют обычные целые числа в поле Q или рассмотренные выше целые гауссовы числа в поле Q(i) = { а + bi | a, b е Q }. Так, если F — произвольное поле алгебраических чисел, то, как можно показать, множество всех его целых элементов, то есть корней уравнений вида (6.25), принадлежащих этому полю, об- разует числовое кольцо. При этом всякий элемент из F записы- вается в виде отношения двух целых элементов. Добавим, что часто, хотя и не всегда, в кольцах целых алгебраических чисел справедлива основная теорема арифметики. Дополнения и задачи 1. Каковы простые элементы кольца целых гауссовых чисел? Это не такой уж легкий вопрос. Любопытно, что простые целые чис- ла могут не являться простыми элементами в кольце Z[i]. Мы
118 Глава 6. Только числа уже столкнулись ранее с равенством 2 = (1 + г)(1 — г), под- тверждающим сказанное. Примеры нетрудно продолжить. Так, 5 = (2 + г)(2 — г), 13 = (3 + 2г) (3 — 2г) и т. Д; Вообще, можно до- казать, что всякое простое целое число вида 4n +1 в гауссовом кольце разлагается на множители. Это следует (объясните, как именно) из теоретико-числовой теоремы, принадлежащей Эйле- ру: всякое простое число q = 4п + 1 единственным образом представляется в виде суммы квадратов двух натуральных чисел q = а2 + Ъ2. Наоборот, все остальные нечётные простые числа (они имеют вид 4п + 3) являются простыми элементами и в кольце й[г]. «Действительно, — читаем у Гаусса, — если бы для некоторого такого числа имело место q = (а + Ы)(а + /Зг), то было бы также q = (а — Ы){а — (Зг), и потому q2 = (а + Ы)(а — Ы) х х(а + /3г)(а—/3г) = (а2+62)(а2+/32); но q2 может быть только одним способом разложено на положительные сомножители, бблыиие, чем 1, именно q2 = q-q, так что должно было быть q = а2+Ь2'= а2+(32. Это, однако, невозможно, так как сумма двух квадратов не может иметь вид 4п + 3.» Итак, действительное целое число q является простым эле- ментом гауссова кольца тогда и только тогда, когда q — про- стое число вида 4п+3. Очевидно, что то же самое верно и для чисто мнимых чисел qi. Со смешанными же гауссовыми числами а+Ы, то есть такими, для которых и действительная и мнимая части отличны от нуля, дело обстоит так: целое гауссово число z = а + Ы (а / О, b 0) является простым в Z[i] тогда и только тогда, когда его норма N(z) = а2 + b2 есть простое число в Z. Читатель без труда выяснит, почему из простоты нормы выте- кает простота гауссова числа. Доказательство обратного утвер- ждения (мы его не приводим) вновь опирается на некоторые фак- ты из теории чисел. 2. Найти разложение на простые множители следующих гауссо- вых чисел: 3 - 2г, 3 + 4г, -3 + 11г.
Глава 6. Только числа 119 Для каждой пары найти наибольший общий делитель и наимень- шее общее кратное. 3. Доказать, что а) в поле Q(i) целые алгебраические числа исчерпываются числами из Z[г]; б) в поле Q(\/2) все целые элементы исчерпываются числами вида а + Ьу/2 (a, beZ). 4. Рассмотрим простое расширение ОКх/^З). Покажите, что Q(V=3) = { а + Ьу/^З | a, b Е Q }. Можно ли утверждать (сравните с задачей 3), что все целые алгебраические элементы этого поля имеют вид а + 3, где a, b € Z? Ответ на этот вопрос имеется в следующей главе. 5. В основном тексте мы выяснили, что кроме кольца целых чисел есть и другие числовые кольца, в которых возможен ал- горитм Евклида деления с остатком. Мы назвали такие кольца евклидовыми. Более точно, числовое кольцо R называется евклидовым, если каждому'его ненулевому элементу z сопоставлено целое неот- рицательное число называемое нормой, которое обладает следующими свойствами 1) 7V(zw) > /V'(z) для любых ненулевых элементов z,w € R. 2) для любых элементов z, w Е R, w / 0, возможна запись вида z = qw + г, где q, г € R, и либо г = 0, либо 7V(r) < N(w). (6.26) Кольцо целых чисел Z и кольцо целых гауссовых чисел Z[i], оче- видно, охватываются этим определением. В первом случае норма числа —это его модуль, а во втором — квадрат модуля. В равенстве (6.26), как обычно, q называют частным, ar — остатком при делении z на ш. Если г = 0, то говорят, что w яв- ляется делителем z (обозначение: w | z). Два элемента, каждый из которых является делителем другого, называются ассоцииро- ванными.
120 Глава 6. Только числа Отметим следующие простые свойства евклидовых колец: 1) во всяком евклидовом кольце содержится 1; 2) если элементы евклидова кольца ассоциированы, то их нор- мы равны, 3) элементы z\ и ассоциированы тогда и только тогда, когда z\ = Z201, где а — обратимый элемент кольца', 4) для любой пары ненулевых элементов z,w € R существует единственный с точностью до обратимого множителя наи- больший общий делитель этих элементов. Докажем свойства 1) и 4), предоставляя читателю доказатель- ство остальных. Из определения евклидова кольца следует, что для всякого z / 0 в кольце R существуют q и г такие, что z = qz + r. ' (6.27) Если г / 0, то 7V(r) < N(-z). С другой стороны, из (6.27) сле- дует равенство z(l — q) = г, поэтому N(f) N(z). Полученное противоречие показывает, что г = 0, и тогда q = 1. Существование наибольшего общего делителя элементов z и w может быть доказано тем же методом, что и для колец Z и Z[i]. Действительно, цепочка равенств (6.16), отражающая алгоритм i последовательного деления с остатком, имеет смысл в произволь- ном евклидовом кольце, и все рассуждения относительно этой цепочки переносятся в общую ситуацию практически без изме- нений. Единственность устанавливается так. Если di и cfo — наи- большие общие делители элементов z и w, то di | d% и наоборот, da | di, и следовательно, di и d2 ассоциированы. Но тогда по свойству 3) di = d2«, где а — обратимый элемент. 6. Докажем важное утверждение, часто используемое в дальней- шем. Если d — наибольший общий делитель элементов а и b евкли- ' дова кольца R, то существуют такие элементы t,s € R, что at + bs = d. I
Глава 6. Только числа 121 В частности, если а и b взаимно просты, то найдутся t и з такие, что at + bs = 1. Например, НОД чисел 18 и 33 равен 3 и 2 • 18 — 1 • 33 = 3. Доказательство вновь опирается на алгоритм Евклида. Пусть a = q • b + r, b = 9i • r + ri, Г = 92-Г1 + Г2, N(f) < N(d), N(rt) < N(r), TV(r2) < ЛГ(п), Tfc-2 = 9fc • rk-i + rk, N(rk) < N(rk-!). где rk — последний ненулевой остаток (он же и наибольший об- щий делитель). Запишем эти равенства в виде г = а — q • b, ri = b — qi • г, r2 = r-q2- И, rk = rk-2 ~ Qk • rk-i_. Заменим во втором равенстве г на равное ему выражение а — qb. Получится равенство ri = 6 —91(0 — 96) = (1 + 919)6 — 910. В тре- тьем равенстве вместо г вновь подставим а — 96, а вместо ri — получившуюся после первой подстановки правую часть второго равенства, то есть (1 + 919)6 — 91а. Продолжая этот процесс, мы в конечном итоге выразим rk через о и 6 в виде rk = at\ + 6si, где ti и si — некоторые элементы кольца R. Известно, что вся- кий наибольший общий делитель d = rka, где а —обратимый элемент R, поэтому d = (ati + 6si)a = at + 6s; t, s G R. 7. Доказать, что кольцо 2] евклидово, а кольца Z[V—3], Z[V—5] таковыми не являются.
122 Глава 6. Только числа 8. Множество всех многочленов f(x) = аохп + aixn~l + ... + ап-ух + ап с коэффициентами из данного числового поля F по своим алгеб- раическим свойствам похожё на рассмотренные выше числовые кольца. В самом деле, знакомые читателю операции сложения и умножения многочленов, так же, как и числовые операции, коммутативны, ассоциативны и умножение многочленов дистри- бутивно относительно сложения. Их множество, обозначаемое F[x], называют кольцом многочленов над полем F. Аналогию этого кольца с кольцом целых чисел и другими ев- клидовыми кольцами можно продолжить. Читателю, например, хорошо известно, что на многочлены может быть распространён алгоритм деления с остатком. Иными словами, для любых мно- гочленов f(x) и <р(х) / 0 возможна запись f(x) = q{x)<p{x) + г(ж), где q(x) — частное, а г(х) — остаток при делении многочлена /(ж) на 9?(ж). При этом степень остатка г (ж) меньше, чем степень делителя </?(ж). Приняв за норму многочлена его степень, А(/(ж)) = п, мы без труда убеждаемся, что кольцо многочленов удовлетворяет обоим требованиям, предъявляемым к евклидову кольцу. Таким образом, все. понятия и факты, установленные в пунктах 5, 6 для евклидовых колец, распространяются и на кольцо F[x]. В частности, если d(x) — наибольший общий делитель мно- гочленов f(x) и <р(х), то найдутся такие t(x),s(x) € Р[ж], что f(x)t(x) + ^(ж)з(ж) = d(x). Обратимыми элементами кольца многочленов, как легко ви- деть, являются многочлены нулевой степени. Простые элементы кольца F[x] называют обычно неприводимыми или неразложи- мыми многочленами над полем F. По определению, неприводи- мый многочлен р(ж) — это многочлен ненулевой степени, который нельзя разложить в произведение многочленов из F[x], степень каждого из которых меньше, чем степень р(ж). Например, много- члены ж3 — 2 и ж4 — ж2 +1 неприводимы над полем рациональных чисел.
Глава 6. Только числа 123 Обратим внимание читателя на то, что при переходе к ново- му, более широкому полю неприводимый многочлен может стать приводимым. Например, над полем действительных чисел R вы- шеназванные многочлены уже разлагаются на множители с ко- эффициентами из R ж3 - 2 = (ж - $2) (ж2 + х&2 + &4), ж4 — ж2 + 1 = (ж2ж\/3 + 1) (ж2 + ж\/3 + 1). 9. Пусть а — алгебраическое число и //(ж) € <Ц>[ж] — его мини- мальный многочлен. Убедитесь, что д(ж) неприводим над полем Q. Найдите минимальные многочлены для элементов 2, 1 + л/З, 1 + г х/2 ’ Опишите строение соответствующих простых расширений Q(v/2), Q(i + V3), 10. Ранее осталось не до конца доказанным, что простое рас- ширение Q(a), где а — алгебраический элемент, действительйо образует поле. Нуждался в обосновании тот факт, что всякий ненулевой элемент в Q(a) обратим. Теперь мы можем воспол- нить этот пробел. Пусть р(а) =р0+р1а + р2а2 + ... +pm-tam \ рк G Q, — произвольный отличный от нуля элемент, принадлежащий рас- ширению Q(a). Рассмотрим тогда соответствующий ему много- член р(ж) = Ро + Pl х + Р2 X2 + . .. + Pm-lX™-1. Очевидно, что р(ж) взаимно прост с минимальным для а многочленом д(ж), поскольку последний неприводим. Из сказанного в пункте 6 вы- текает, что найдутся многочлены t{x) и з(ж), удовлетворяющие равенству p(x)t(x) + д(ж)а(ж) = 1.
124 Глава 6. Только числа Заменяя в нём переменную х числом а и учитывая, что р(а) = О, получаем p(cu)t(a) = 1. Но это и означает, что элемент р(а) обратим и обратным для него является t(cu). В качестве примера найдем обратный элемент для 3 + 2\/3 + + л/9 в поле <Ц>(\/3). Здесь а = \/3 и минимальным многочленом является д(ж) = х3 — 3. Роль р(х) играет многочлен 3 + 2ж + ж2. Для отыскания многочленов t(x) и з(ж) используем алгоритм Евклида: х3 — 3 = (х — 2)(ж2 + 2ж + 3) + (х + 3), х2 + 2х + 3 = (х — 1)(ж + 3) + 6. Перепишем полученные равенства иначе х + 3 = (х3 — 3) — (х — 2)(ж2 + 2ж + 3), 6 = (х2 + 2® + 3) — (х — 1)(ж + 3). Исключая из данных соотношений х + 3, получим 6 = (ж2 + 2ж + 3) — (ж — 1) [(ж3 — 3) — (ж — 2)(ж2 + 2ж + 3)], или, наконец, 1 — 7 (ж2 — Зж + 3)(ж2 + 2ж + 3) — 7 (ж — 1)(ж3 — 3). 6 6 При ж = v^3 будем иметь 1 = 1(^9 - За/З + 3)(а/9 + 2^3 + 3), б и следовательно, искомый обратный элемент равен i(^9-3^3 + 3) = | - |^3+ О Л jL о 11. В качестве исходного поля при построении расширений может быть взято любое числовое поле F (не обязательно совпадающее с полем рациональных чисел). Все понятия и результаты, отме- ченные выше, переносятся на эту более общую ситуацию.
Глава 6. Только числа 125 Так, число а называется алгебраическим над полем F, если оно является корнем некоторого многочлена с коэффициентами из F, а многочлен наименьшей степени с указанными свойствами и старшим коэффициентом 1 называется минимальным многочле- ном для а над полем F. Неизменной остаётся и конструкция простого расширения F(a) основного поля F. Если т — степень минимального для а многочлена над полем F, то элементы простого расширения исчерпываются числами вида Ро+рха + рга^ + .-'+Рт-ха”1-1, Рк € F. Процесс присоединения алгебраических элементов можно по- вторять многократно. Пусть сц, «2, •••,<*& — элементы, алгебраи- ческие над F. Рассмотрим цепочку простых расширений Fi = F(ai), F2 = Fi(a2), • • •, Ffc = Ffc_i(aifc). Полученное в результате расширение Ft назовём составным ал- гебраическим расширением. Можно показать, что составное рас- ширение не зависит от того, в какой последовательности присо- единяются О!1,а2,-• • ,«fc> и всякий раз получающееся при этом поле F(cti, «2, • • • > «fc) есть наименьшее из числовых полей, содер- жащих поле F и указанные числа. В том случае, когда элементы «1,012,• • • исчерпывают множество корней заданного много- члена /(ж) с коэффициентами из исходного поля F, описанное составное расширение F(ai,a2>-• • ,<*&) даёт наименьшее из по- лей, содержащих все эти корни. Его называют полем разложения многочлена /(ж). 12. Оказывается, что процесс образования составного расшире- ния можно осуществить за один этап, то есть присоединяя един- ственный подходящий элемент. Иными словами, всякое такое расширение является простым. Это утверждение называют тео- ремой о примитивном элементе: пусть Ft = F(ai,ai2, ><*к) — составное алгебраическое рас- ширение поля F, получающееся присоединением элементов ai,«2, • • • Тогда найдётся такое число в 6 F*. (оно и назы- вается примитивным элементом), что F& = F(0).
126 Глава 6. Только числа Докажем теорему для к = 2. Случай произвольного к сводится к рассматриваемому индукцией по к. Пусть Fi = F(ai), F2 = = F(c>!2). а многочлены цг(х) и дг(«) являются минимальными над F для элементов «1 и «2 соответственно. Предположим, что Д1 = ai, fa,..., fa (6.28) — все корни а 71 = 012, 7m (6.29) — все корни Ц2(х). Неприводимый многочлен не может иметь кратных корней. В противном случае НОД этого многочлена и его производной имел бы степень > 0 (продумайте детали,этого рассуждения). Из отсутствия кратных корней следует, что среди чисел (6.28), так же, как среди чисел (6.29), нет одинаковых. Рассмотрим п(т — 1) элементов следующего вида ——i = l,2,...,n;j = 2,...,m. (6.30) 71 - 7? Возьмём ,в поле F какой-нибудь элемент с, не равный ни одному из элементов (6.30). Он существует ввиду бесконечности поля F. Положим 0 = ai + ca2. (6.31) Очевидно, что F(0) С F2. Далее заметим, что e/Pi + c-yj (г = 1,2,... ,n; j = 2,...,т), (6.32) иначе бы число с совпадало с одним из чисел (6.30). Рассмотрим над полем F(0) многочлен д(х) = /ii(0 — сх). Из (6.31) следует, что д(х) имеет корень ct2> общий с многочленом И2(х), а из (6.32) вытекает, что это их единственный общий ко- рень. Тогда х — «2 — наибольший общий делитель многочленов д(х) и № (ж), и существуют такие многочлены t(x) и s(x) над полем Р(0), что х — «2 = д(х) t(x) 4- /12 (ж) s(x), поэтому х — «2 — также многочлен над F(0), и значит, 012 € F(0). Но тогда ai = = 0 — са2 € F(0). Из сказанного вытекает включение F2 С F(0). Так как ранее было установлено обратное включение, отсюда следует, что F2 = F(0).
ГЛАВА 7 ВОКРУГ ВЕЛИКОЙ ТЕОРЕМЫ Греческий математик Диофант жил в III веке нашей эры. Го- ды жизни великого французского математика Пьера Ферма — с 1601 по 1665. Но так случилось, что исследования Ферма по теории чисел стимулировались именно трудами Диофанта. Имя этого греческого ученого известно нам благодаря его многотом- ной «Арифметике», состоящей из 13 книг (уцелело только 6) и представляющей, по мнению историков математики, одно из загадочных явлений в науке. «Арифметика» Диофанта резко от- личалась от произведений классиков античной математики — Ев- клида, Архимеда, Аполлония, в которых, как мы уже говорили, доминировал геометрический метод даже при решении алгебра- ических вопросов. У Диофанта уже встречается алгебраическая символика, прав- да, совсем не похожая на современную. Он вводит обозначения для неизвестных и их степеней, особые знаки для операций вы- читания, для обратной величины. Всё это помогает ему успешно решать алгебраические задачи, куда более сложные, чем те, что рассматривались его предшественниками. Основная тема «Ариф- метики» — отыскание целых и рациональных решений неопреде- лённых, то есть имеющих бесконечно много решений, уравнений. Одна из задач, упомянутых Диофантом, связана с описанием так называемых пифагоровых чисел, являющихся целыми положи- тельными решениями неопределённого уравнения x2 + y2 = z2. (7.1)
128 Глава 7. Вокруг Великой теоремы Диофант приводит весьма остроумный метод для отыскания всех положительных рациональных решений этого уравнения. Из его рассуждений легко можно вывести (см. дополнение 1) общие фор- мулы, описывающие все пифагоровы числа, а именно x = 2kpq, y = k(p2-q2), z = k(p2 + q2), (7.2) где k,p,q — произвольные натуральные числа. Если же пифаго- ровы числа х, у, z попарно взаимно просты, то они записываются в виде ® = 2pg, y = p2-q2, z = p2 + q2, (7.3) где р, q — взаимно простые числа, имеющие разную чётность. В формулах (7.2), (7.3) можно поменять ролями х и у, так как они в рассматриваемое уравнение входят симметрично. Сочинения Диофанта, полные хитроумных методов и приё- мов, оставались неизвестными европейским математикам вплоть до XVI века, когда принадлежащая ему рукопись случайно была обнаружена в библиотеке Ватикана. В 1621 году был издан пере- вод «Арифметики» на латинский язык (язык науки того времени), выполненный французским математиком Баше де Мезириаком. Владельцем одного из экземпляров и стал Пьер Ферма. Значи- тельная часть наследия Ферма в области теории чисел — мысли, идеи, формулировки теорем, гипотезы — дошла до нас в форме записей и замечаний на полях этого экземпляра «Арифметики». Напротив восьмой задачи второй книги Диофанта «разбить квад- ратное число на два других квадратных числа» (это и есть упо- мянутая выше задача) Ферма сделал самую знаменитую свою запись: «Наоборот, невозможно разложить куб на два куба, биквадрат на два биквадрата и вообще никакую степень, бблыиую биквадрата, на две степени с тем же показателем. Я открыл этому поистине, чудесное доказательство, но поля слишком узки, чтобы поместить его». Иными словами, здесь утверждается, что при п> 2 не существует отличных от нуля целых чисел х, у, z, являющихся решением уравнения xn + yn = zn. (7.4)
Глава 7. Вокруг Великой теоремы 129 Так формулируется «Великая теорема Ферма». Теорема Фер- ма вызвала необычайный резонанс как среди математиков, так и среди людей, далёких от математики, главным образом благо- даря простоте формулировки и интригующему воздействию слов о существовании «чудесного доказательства». Подробности об этом можно прочесть в других книгах (например, в [23]). Мы же особо хотим подчеркнуть то, что с Великой теоремой связа- на ещё одна важная нить исторического развития алгебры. Хотя в формулировке теоремы Ферма участвуют лишь целые числа х, у, z, в ходе её доказательства пришлось обратиться к числам более общего вида — алгебраическим и целым алгебраическим числам (мы познакомились с ними в предыдущей главе). Глубо- кое проникновение в арифметику этих чисел, зачастую отличную от обычной арифметики, потребовало введения новых понятий — таких, как поле, кольцо, идеал, дивизор и других, одинаково важных для алгебры, теории чисел, алгебраической геометрии. Единственный случай, для которого известно элементарное (то есть не использующее алгебраических чисел) доказательство Великой теоремы, — это случай показателя п = 4. Указанное до- казательство, обнаруженное в записях самого Ферма, опирается на упомянутые выше формулы для пифагоровых чисел. Ферма доказывает даже чуть более общее утверждение: уравнение ж4 + у4 = z2 (7.5) не имеет решений в целых числах, отличных от нуля. В сво- их рассуждениях Ферма использует изобретённый им метод так называемого бесконечного спуска, которым часто пользовались также и другие математики, в частности, Эйлер. Доказатель- ство, предлагаемое читателю, использует этот метод в несколько модифицированном виде. Нам достаточно убедиться, что не существует решений, в ко- торых х, у, z попарно взаимно просты. Если, например, х = = x\d, у = ухd, где d — их наибольший общий делитель, то г2 = (х4 + у4) d4. Полагая z\ = z/dfi, получим равенство xj + + у4 = z2, в котором xi и ух уже взаимно просты. Если хх и zx или ух и zx не являются взаимно простыми, то, производя сокра- щения, придём к ситуации, когда все три переменные попарно 5 — 261
130 Глава 7, Вокруг Великой теоремы взаимно просты. Кроме того, можно ограничиться рассмотрением натуральных х, у, z. Предположим противное, что такие решения существуют. Выберем среди них то решение (x,y,z), для которо- го z принимает наименьшее значение. Числа х2, у2 и z являются попарно взаимно простыми пифагоровыми числами, и потому на основании (7.3) можно записать х2 = 2р q, y2=p2-q2, z = p2 + q2, (7.6) где р и q, как уже говорилось, взаимно простые числа, одно из которых чётно, другое — нечётно. Пусть р = 2fc, q = 21 + 1, тогда у2 = (2к)2 - (21 + I)2 = 4(fc2 - I2 - 0 - 1, что невозможно, так как любой нечётный квадрат должен иметь вид 4m + 1. Наоборот, если q = 21, то х2 = 4р1, и тогда pl = (х/2)2. По- скольку числа взаимно просты, а их произведение является квад- ратом, то и каждое из них также квадрат, поэтому р = w2,1 = t2 для некоторых натуральных w и t. Согласно второму из равенств (7.6), получим у2 = (w2)2 — (2t2)2 или (2t2)2 + у2 = (w2)2, иными словами, числа 2t2, у, w2 — пифагоровы и также взаимно просты. Опять можно записать 2t2 = 2ab, y = a2 — b2, w2 = a2 + b2, (7.7) где а и b обладают теми же свойствами, что р и q. Из первого равенства, равносильного t2 = ab, вытекает, что сомножители а и b сами являются квадратами: а = и2, b = v2 для некоторых натуральных и и v. Тогда третье равенство из (7.7) даёт 4,4 2 U + V = W , следовательно, числа и, v, w составляют решение уравнения (7.5). Но очевидно, что w < z, а это противоречит выбору первоначаль- ного решения (х,у, z). Полученное противоречие и доказывает наше утверждение, а следовательно, и теорему Ферма для пока- зателя п = 4.
Глава 7. Вокруг Великой теоремы 131 Следующий после Ферма шаг делает Эйлер —он доказывает Великую теорему для случая п = 3, то есть доказывает, что уравнение х3 + у3 = z3 ,не имеет нетривиальных решений в це- лых числах. Принципиально новым в доказательстве Эйлера бы- ло привлечение алгебраических чисел вида а + by/^3 (a, b € Z) и смелое оперирование с ними. Интересно, что никакого элемен- тарного доказательства для п ,= 3 неизвестно и поныне. Как уже отмечалось в предыдущей главе, рассуждения Эйлера содержали некорректность. Доказательство, которое Эйлер, подобно Ферма, проводит методом бесконечного спуска, опирается на следующую лемму. Если взаимно простые целые числа a ub таковы, что а2 4- ЗЬ2 является кубом целого числа, то существуют такие целые числа s и t, что a = s(s2 — 9t2), b = 3t(s2 — t2). Приведём доказательство Эйлера. Он исходит из равенства а2 + ЗЬ2 = (а + Ьд/^3) (а - Ьл/^З), (7.8) утверждая, что поскольку левая его часть является кубом, то это же справедливо для обоих сомножителей правой части (!?). В частности, а + bV^3 = (s + tV=3)3, (7.9) где s и t — некоторые целые числа. Раскрывая скобки, получаем а + Ьл/^З = з3 + Зз^д/^З - 9st2 - З^л/^З = = (з3 - 93t2) + (332t - 3<3)л/^3, откуда следует, что ' а = з3 - 9st2 = з(з2 - 9t2), b = 3s2t - 3t3 = 3t(s2 -12). В связи с приведённым рассуждением возникает немало во- просов. Прежде всего, вывод относительно сомножителей в пра- вой части равенства (7.8) был бы оправдан лишь при условии их 5»
132 Глава 7. Вокруг Великой теоремы взаимной простоты, которую Эйлер считает, по-видимому, оче- видно вытекающей из взаимной простоты чисел а и Ь. Однако это не только нуждается в доказательстве, но ещё и сам термин «взаимно простые» требует разъяснения применительно к числам вида а + В предыдущей главе мы, правда, уже позаботи- лись об определении этого и других арифметических понятий применительно к произвольным евклидовым кольцам. Но дело в том, что множество эйлеровых чисел, как выяснено там же, евклидова кольца как раз и не образует. Кроме того, появление чисел а + Ьд/—3 в случае п = 3 кажет- ся довольно странным и неожиданным. Но это лишь на первый взгляд. Действительно, рассмотрим левую часть уравнения Фер- ма и перепишем её в несколько ином виде = У3Ц3 +1), полагая t = x/y. Поскольку корнями многочлена t3 +1 являются числа —1,——£2, где . 2тг . . 2тг £ = cos — + г sin — О о — первообразный корень третьей степени из 1, то справедливо разложение на множители t3 + l = (t + l)(t + £)(t + £2). Но тогда х3 + у3 = y3(t + l)(t+£)(t + £2) = (х + У)(х + £у)(х + £2у). (7.10) Полученное разложение имеет смысл, конечно, лишь в расши- ренной по сравнению с Z числовой области, а именно, в кольце Z[£], которое, как легко можно понять, совпадает с множеством чисел вида а +Ь£ + с£2, где a,b,ceZ. (7.11)
Глава 7. Вокруг Великой теоремы 133 Вспомним теперь, что . 2тг . . 2тг —1 + г\/3 С = cos — + ism — =---------- о о Z ~ 4тг . . 4тг —1 — гл/3 Г = cos— -Н sin— =------------- о О Z Тогда произвольный элемент из Z[£] запишется в виде (7.12) где р = 2а — b — с, q = b — с — целые числа. Нетрудно заметить также, что они имеют одинаковую чётность. В частности, если оба они чётные, то мы приходим к числам, которые рассматривал Эйлер. Итак, появление у Эйлера чисел а + Ьу/^3 вовсе не случайно. Теперь ещё ясно и то, что естественнее рассматривать числа вида (7.12). Заметим, что элементы из Z[£] могут быть записаны также в виде А + В£ (А, В € Z). Последняя запись получится, ес- ли в (7.11) заменить £2 на равный ему элемент — 1 — £. Можно доказать, что кольцо Z[£] является кольцом целых алгебраиче- ских чисел и совпадает с множествен всех целых элементов поля Q(£) = {а + /?£ | а,0 € Q}. Самое же главное то, что в Z[£], в отличие от исходного кольца Z[\/—3], уже справедлива основ- ная теорема арифметики. Мы докажем это тем же методом, что и для кольца целых гауссовых чисел, убедившись, что кольцо Z[£], подобно Z[i], является евклидовым относительно некото- рой нормы. Для всякого z = А + В£ е Z[£] норма по определению равна N(z) = z -z — |z|2. Выразим её через коэффициенты А и В, проделав следующие вычисления N(z) = z -Z = (А + В£)(А + В$ = = А2 + АВ(£ + £) + В2(£) = А2-АВ + В2. Если же для z использована запись вида а + Ь\/=3, то очевидно, W(z) = а2 + ЗЬ2. Как и для гауссовой нормы, в этом случае верно
134 Глава 7. Вокруг Великой теоремы основное для нас свойство1: N(z1Z2) = AT(zi)7V(z2). Пусть теперь z и w — произвольные элементы из Z[£]. Их частное zw"1 = а + /3£ € Q(£). Положим а = к + а', /3 = I + +/3', где к и I — ближайшие соответственно к а и /3 целые числа, а значит и |/Г|< 1. Как и в случае гауссова кольца, z записывается в виде z = = qw + r, где q = к + 1£ и г = w(a'+ /?'£) принадлежат Z[£], При этом ЛГ(г) = 7V(w)7V(c/ + /?'£) = N(w)(a'2 - а'/З' + /З'2) < JV(w) (|а'|2 + |а'| |/Г| + |/Г|2) « W(w) Q + 1 + < N(w). Вернёмся теперь к доказательству леммы Эйлера, пытаясь вос- полнить имеющиеся в нём пробелы. Прежде всего убедимся, что сомножители а + 3 и а — Ь\/^3 из (7.8) действительно вза- имно просты. Для этого, как мы уже знаем, нужно доказать, что их наибольший общий делитель 7 6 Z[£] является в Z[$] обратимым элементом, или иначе, что его норма ТУ(7) = 1. Заметим сначала, что 7 является делителем суммы и разности сомножителей, то есть 7 делит 2а = (а + 3) + (а — Ь\/—3) и 2Ьд/=3 = (а + Ьд/—3) — (а —Ьх/^3), а следовательно, его норма ЛГ(7) делит числа 7V(2a) = 4а2 и N(2by/=3) = 1262. Поскольку а и b взаимно просты, то ^(7) может быть лишь делителем числа 4, если а не делится на 3, и делителем числа 12, если а кратно 3. Легко проверить, что последний случай в условиях леммы Эй- лера невозможен. Действительно, если а = Зк, то норма а2 + +362 = 9fc2+3b2 также делится на 3, но, являясь кубом, должна, 1 Отметим, что приведённое определение нормы имеет смысл не только для целых алгебраических чисел, но и для произвольных элементов из Q( £); естественно, что и для них сохраняется рассматриваемое здесь свойство.
Глава 7. Вокруг Великой теоремы 135 следовательно, делиться на 27. Можно записать, что 9fc2 + ЗЬ2 = = 27п или Ь2 = 9n — 3fc2. Последнее означает, что Ь2, а значит, и b кратно 3, но это противоречит взаимной простоте чисел а и Ь. Значит, норма Nfjy) является делителем числа 4, и для неё имеется три возможности: N(y) = 4, = 2, .№(7) = 1. Если jV(7) = 4, то 7V(7/2) = 1, и тогда 7 = 2е, где е — обратимый элемент. В этом случае каждое из чисел а + Ь>/—3, а — Ьд/=3 должно делиться на 2, но это возможно лишь тогда, когда оба числа а и Ъ делятся на 2, что противоречит их взаимной простоте. Если же TV(7) = 2, то, полагая 7 = х + у£, приходим к уравне- нию х2 — ху + у2 = 2, которое, как нетрудно понять, вообще не имеет решений в целых числах. Остаётся лишь третья возмож- ность Л^(7) = 1. Она и означает, что сомножители в (7.8) взаим- но просты. Теперь полностью обосновано заключение о том, что каждый сомножитель в (7.8) является кубом. Однако возникает другое, правда, не очень значительное препятствие. Ведь спра- ведливость равенства (7.9) доказана нами не для кольца эйлеро- вых чисел, а для содержащего его кольца Z[£(], а поскольку эле- менты из Z[£], как мы помним, имеют вид (7.12), то в равенстве (7.9) числа з и t могут оказаться нецелыми. Выручает здесь та- кое обстоятельство. Если.s+t\/=3 есть решение уравнения (7.9), то его решениями будут также числа (s + t\/—3)£, (s + £>/—3)£2- Это следует из того, что £3 = 1. Оказывается, что хотя бы одно из перечисленных трёх решений является эйлеровым числом, то есть имеет целые коэффициенты (несложное доказательство это- го факта предоставляем читателю). Теперь лемму Эйлера можно считать полностью доказанной. Доказательство теоремы Ферма для показателя п = 3 бы- ло опубликовано Эйлером в его «Универсальной арифметике» в 1768 г. Дальнейшее продвижение было медленным. Лишь в 1825 г. был разобран случай п = 5 — доказательство теоремы Ферма для этого случая почти одновременно предложили фран- цузские математики Дирихле (1805-1859) и Лежандр (1752- 1833). В 1839 г. другой французский математик Ламе (1795-1870) сумел доказать теорему для показателя п = 7; На всех этих работах так или иначе отразилась руководящая мысль Эйлера: для серьёзного рассмотрения проблемы Ферма
136 Глава 7. Вокруг Великой теоремы необходимо привлекать алгебраические числа, подобные числам (7.12). Нетрудно понять, что достаточно решить её для простых показателей п. Постепенно формируется общий подход к пробле- ме, состоящий в следующем. Заметим, что левая часть уравнения (7.4) при простом п > 3 разлагается на множители хп + уп = (х +. у) (х + Су) (х + С2у) ... (х + £п-1у), где С — первообразный корень n-ой степени из 1. Это разложение, справедливое для расширенной числовой области Z[C], анало- гично равенству (7.10) и получается тем же способом. Уравнение Ферма переписывается тогда в виде (х + у) (х + Су) (х + с2у) •••(» + С-1У) = zn. (7.13) Рассмотрим кольцо Z[C], получающееся из Z в результате при- соединения корня n-ой степени из 1. Равенство (7.13) означает тогда, что в этом кольце п-ая сте- пень числа z может быть записана также и в виде произведения п различных сомножителей, при этом, как отмечалось выше, числа х, у и z можно считать попарно взаимно простыми. Возможно ли такое разложение — зависит от арифметических свойств Z[C1- Во всяком случае, ясно, что ответ сильно зависит от того, справед- лива ли в кольце Z[C] основная теорема арифметики. Первые авторы общих «доказательств» Великой теоремы мол- чаливо предполагали, что это так. Подобную ошибку совершили уже упоминавшийся выше Ламе и немецкий математик Куммер (1810-1893). Существует также мнение, что и «чудесное доказа- тельство», о котором сообщал Ферма, скрывало в себе такого же рода предположение. Как же всё-таки обстоит дело фактически? Верно то, что вся- кий необратимый элемент в Z[C] разлагается в произведение простых элементов. Однако такое разложение в общем случае не единственно. Это было обнаружено Куммером после упор- ных его попыток доказать противоположное утверждение. Самый простой пример кольца Z[£], в котором не выполняется основная теорема арифметики, получается только при п = 23. Вот почему
Глава 7. Вокруг Великой теоремы 137 его нелегко было заметить. Оказалось всё-таки, что положение можно исправить, если к числам кольца Z[£] присоединить некие новые объекты, которые Куммер называет идеальными числами. В расширенной этими идеальными числами области восстанавли- вается однозначность разложения на простые множители. Хотя это изобретение Куммера и привело к очень сильному прогрессу в исследовании проблемы Ферма (Куммеру удалось её решить для всех простых п < 100), всё же полного её решения получено не было. Главное, однако, что своими исследованиями он зало- жил основы замечательного по своей глубине и красоте раздела математики — алгебраической теории чисел. Эта теория развивалась далее трудами таких крупнейших ма- тематиков, как Л. Кронекер, Р. Дедекинд, Д. Гильберт, А. Вейль, и ряда других. Большой вклад в учение об алгебраических чис- лах внесли русские и советские математики: Е. И. Золотарёв, Г. Ф. Вороной, А. А. Марков, И. Р. Шафаревич. Что же касается самой проблемы Ферма, то она была окон- чательно решена в 1995 г. английским математиком Э. Уайлсом, который устранил пробелы в своем же доказательстве 1993 г. На самом деле Уайлс доказал более сильное утверждение, чем теоре- ма Ферма, — так называемую гипотезу Таниямы—Шимуры—Вей- ля [25]. Мы не будем здесь приводить точную формулировку этой гипотезы —для этого необходимы специальные знания из алгебраической геометрии. Отметим лишь, что к тому времени Великая теорема была доказана для всех п < 100000. Это было сделано не без участия компьютеров, которым, правда, отводи- лась только техническая роль. Дополнения 1. Докажем формулы (7.3) для пифагоровых чисел. Точнее, убе- димся в следующем. Если x,y,z — попарно взаимно простые числа, удовлетворя- ющие уравнению (7.1), то одно из чисел х или у чётно, а дру- гое нечётно. При чётном х указанная тройка х, у, z является
138 Глава 7. Вокруг Великой теоремы решением уравнения (7.1) тогда и только тогда, когда x = 2pq, y = p2-q2, z=p2 + q2, (7.14) где р и q взаимно просты, р> q и одно из них чётно, а другое нечётно. Доказательство. Очевидно, что ровно два из трёх чисел х, у, z обязаны быть нечётными. Если нечётны х и у (то есть х = 2т + 1, у = 2п 4-1), то z2 = х2 + у2 = 4(т2 + т + п2 + п) + 2 — чётное число, не, делящееся на 4. Последнее невозможно, по- этому чётным должно являться одно из чисел х или у. Если чётно х, то перепишем равенство (7.1) в виде /ж\2 fz + y\ (z-y\ /71^ (2) =(—)(—), (715) „.. х z + y z-y .. z + y z — y В нем числа —, —-—, —--------целые, причем —-— и —-— взаимно просты (почему?). Но если произведение двух взаимно простых чисел равно квадрату, то и каждый сомножитель в отдельности является квадратом. Пусть Тогда из (7.15) и (7.16) легко получаем формулы для пифагоро- вых чисел. Наоборот, непосредственной проверкой нетрудно убедиться, что числа (7.14) удовлетворяют уравнению (7.1); при этом из условий, наложенных на числа (7.14), вытекает взаимная про- стота х, у, z. 2. Как уже отмечалось, Эйлер доказывает Великую теорему для п = 3 методом бесконечного спуска, заимствованным у Фер- ма. Однако доказательство существенно сложнее, чем в случае
Глава 7. Вокруг Великой теоремы 139 п = 4. Напомним, что числа х, у и z можно считать попарно вза- имно простыми, и потому одно из них обязательно чётно, а два другие нечётны. Далее, в уравнении х3 4- у3 = z3, или иначе х3 4- у3 4- (—г)3 = 0 (7.17) переменные х,у и —z равноправны, и следовательно, можно счи- тать, что, например, z чётно, а х и у нечётны. Среди всех таких троек х, у, z, являющихся решениями уравнения (7.17), выберем ту, для которой величина |z| наименьшая. Предоставим слово самому Эйлеру: «Если, следовательно, х и у нечётны, ясно, что как их сумма, так и разность будут числами чётными. х + у 2 Пусть, следовательно, Х -V = а, тогда Л = р и мы будем иметь x = p + quy = p — q, откуда следует, что одно из двух чисел ри q должно быть чётным и другое нечётным1. Итак, мы имеем х3+у3 = (p+q)3 + (p~q)3 = 2p3+6pq2 = 2p(p2+3q2), так что речь идёт о том, чтобы доказать, что это произведение 2р (р2 4- 3 g2) не может стать ку- бом; ... если 2р (р2 4- 3g2) было бы кубом, этот куб был бы чётным и, следовательно, делился бы на 8, следовательно, необходимо, чтобы восьмая часть нашей формулы, или -р(р24-3д2), была бы числом целым и, сверх того, кубом. Однако мы знаем, что одно из чисел р и q чётное, а другое нечётное; так как р2 4- 3g2 должно быть числом нечётным, вовсе не делящимся на 4, нужно, чтобы таковым было р или чтобы р/± было числом целым.» Продолжим далее сами, не отступая, впрочем, от хода доказа- тельства Эйлера, но лишь несколько сокращая его изложение. 1 Кроме того, очевидно, что ряд взаимно просты.
140 Глава 7. Вокруг Великой теоремы Если бы р/4 и р2 + 3g2 были бы взаимно простыми, то из то- го, что их произведение -р(р2 + 3д2) является кубом, следовало бы, что и каждый из сомножителей также куб. Другой случай (когда р/4 и р2 + 3g2 имеют общий делитель) требует особого рассмотрения. Поскольку р и q взаимно просты, то взаимно про- стыми будут р и 3g2, если только р не делится на 3. Но тогда, очевидно, р/4 будет взаимно просто с р2 + 3g2, а потому сами эти числа, как сказано выше, являются кубами. Согласно лемме Эйлера (см. основной текст) числа р и q записываются в виде р = s(s2 — 9t2), q = 3t(s2 — t2), где s и t — некоторые целые числа (взаимно простые, так же, как р и q). При этом, так как q нечётно, то t нечётно, а з чётно. Далее, вспомним, что кубом является и р/4, но тогда то же самое верно и для 2р. Иначе говоря, число 2s(s2 - 9t2) = 2s(s - 3t) (s + 3t) является кубом. Нетрудно проверить (читатель это сделает сам), что сомножители 2s, s — 3t, s + 3t попарно взаимно просты, и по- тому каждый из них, так же, как и всё произведение, является кубом. Полагая х3 = s — 34, у1 = s + 34, Zi = 2s, приходим к равенству х± + yf = zf, означающему, что тройка (®1,У1,^1) есть решение уравнения (7.17). Наконец, |^| = |2s| < |2s(s2 — 942)| = |2р| < |2р(р2 + 3g2)| = |z3|, и значит, в решении (®i,yi,zi) имеем |zi| < |z|. Последнее находится в противоречии с первоначальным выбором решения (x,y,z). Осталось рассмотреть случай, когда р делится на 3, то есть имеет вид р = Зг (где г — целое число, делящееся на 4). Тогда V = тР (р2 + 3g2) = | г (9r2 + 3g2) = г (Зг2 + д2). О 4 4 4
Глава 7. Вокруг Великой теоремы 141 Теперь уже взаимно простыми (проверьте это) будут сомножите- ли - г и Зг2 + q2, и следовательно, они являются кубами. По лемме Эйлера q = s(s2 — 9t2), r = 3t(s2 —t2), где s и t — некоторые целые числа (снова взаимно простые), при- чём t чётно, a s нечётно. Далее, целое число с о — • - г = 2t (s2 -12) = 2t (s - t) (s +1) является кубом. Кубами, ввиду их взаимно простоты, являются и сомножители 2t, s — t, s +1. Полагая xf = s — t, yf = 2t, z2 = s +1, получаем, что тройка (a?i,|/i,zi) есть решение уравнения (7.17). При этом снова нетрудно заключить, что, вопреки предположе- нию, |«i| < |z|. Полученное противоречие окончательно дока- зывает, что уравнение (7.17) не имеет нетривиальных решений в целых числах.
ГЛАВА 8 ГИПЕРЧИСЛА Вы помните, вероятно, что Гамильтон придумал способ описания комплексных чисел, свободный от всякого рода мистических их толкований. По Гамильтону комплексные числа есть пары дей- ствительных чисел с определёнными правилами действий над этими парами. И важно то, что полученная числовая система, во-первых, сохраняет все алгебраические свойства обычных чи- сел и, во-вторых, содержит их в себе. Сделав этот шаг, Гамильтон задумался над тем, как сделать и следующий. А что если рас- сматривать не пары, а скажем, тройки, четвёрки действительных чисел, вообще произвольные их наборы (^ 1 j <^2) • • • ? любой длины п? Нельзя ли, используя их, получить новые, ги- перкомплексные числа, которые, по своим свойствам также были бы похожи на числа уже известные? Всё, разумеется, зависит от того, как определить операции над этими гиперкомплексными числами. Путеводной нитью в долгих размышлениях Гамильтона на эту тему были уже известные нам геометрические соображе- ния. Ведь комплексные числа (пары) можно использовать для описания преобразований плоскости — сдвигов, вращений, гомо- тетий. Быть может, тогда тройки (Гамильтон называет их трипле- тами) окажутся пригодными для описания аналогичных преоб- разований трёхмерного пространства. Собственно, со сложением их не было проблем — триплеты надо складывать, как и векто- ры, и понятно, что такой операции будут соответствовать сдвиги
144 Глава 8. Гиперчисла пространства. А вот загадка умножения не давалась в руки, и на традиционный утренний вопрос сыновей: «Папа, умеешь ли ты уже умножать триплеты?», сэр Гамильтон каждый раз вынужден был отвечать: «Нет, я их умею только складывать и вычитать». Впрочем, как постепенно выяснялось, причины для этого были достаточно веские. Целый клубок трудностей вырос на пути ре- шения, казалось бы, ясной задачи. Обескураживало, например, то, что умножение вращений в пространстве, в отличие от умно- жения плоских вращений вокруг данной точки, уже не обладает свойством коммутативности. Это иллюстрируют рисунки. На первом из них (рис. 17 а)) показано, во что переходит точ- ка А при композиции двух вращений: сначала вокруг оси Oz, затем вокруг Ох. При выполнении этих вращений в ином поряд- ке, как показывает рис. 17 б), и результат оказывается иным — образом точки А является тогда точка Аг, а не Ai, как в пер- вом случае. Но ведь композиции преобразований должно как-то отвечать произведение соответствующих им триплетов, значит, скорее всего, тщетны попытки искать такое правило, их умно- жения, которое сохраняло бы все свойства числового умноже- ния. Во всяком случае свойством коммутативности наверняка придётся пожертвовать. Однако не выручал и отказ от коммута- тивности — хорошего умножения триплетов всё равно не получа- лось1. Объяснялось это довольно просто —дело в том, что три- плетов недостаточно, чтобы охарактеризовать произвольные вра- 1 Позднее было доказано, что нельзя определить умножение троек, обла- дающее всеми свойствами числового умножения, исключая коммутативность.
Глава 8. Гиперчисла 145 щения пространства с растяжениями, точнее, композиции враще- ний с гомотетиями. В самом деле, для задания вращения вокруг точки нужно указать направление оси этого вращения, или иначе направляющие косинусы cos a, cos/?, cos 7 такой оси (косинусы углов, которые ось вращения образует с осями координат). Легко видеть, что cos1 2 а + cos2 (3 + cos2 7=1, поэтому два угла из трёх и знак косинуса третьего угла определяют её положение. Тре- тий параметр определяет угол поворота вокруг этой оси. Нако- нец, четвёртый необходим для задания коэффициента гомотетии. Выходит, что учиться перемножать надо не тройки, а четвёрки действительных чисел. Для них Гамильтон также придумал на- звание — кватернионы. Трудность была ещё и в том, что связь кватернионов с преобразованиями была не столь непосредствен- ной, как в случае комплексных чисел. В множестве всех кватернионов1 {(а, Ь, с, d) \a,b,c,d € К.} Гамильтон по аналогии с комплексными числами выделяет чет- вёрки (1,0,0,0); (0,1,0,0); (0,0,1,0); (0,0,0,1). Первая из них должна играть при умножении роль единицы, остальным же, которые Гамильтон обозначает i = (0,1,0,0); j = (0,0,1,0); к = (0,0,0,1), отводится роль мнимых единиц в том смысле, что г2 = j2 = к2 = (-1,0,0,0) = -1. (8.1) Произвольный кватернион записывается тогда в виде а + Ы + cj + dk, a, b,c,d € R, (8.2) Число а Гамильтон называет скалярной частью кватерниона, а триплет Ы + cj + dk — векторной его частью2. Однако форму- лы (8.1) ещё недостаточны для того, чтобы можно было перемно- жать любые кватернионы. Надо ещё понять (и это главное), как 1 В честь Гамильтона (Hamilton) это множество теперь обозначается Н. 2 Теперь скалярная часть называется действительной частью, а векторная — мнимой частью кватерниона.
146 Глава 8. Гиперчисла следует определить перемножение мнимых единиц. Пробы и по- иски наконец-то приводят Гамильтона к следующим (в сущности, единственно возможным) формулам V = jfc = i, ki = j. (8.3) Из них и формул (8.1) вытекает, что при изменении порядка со- множителей результат должен получиться иным. В самом деле, например, (г/)2 = к2 = —1. Умножая справа получившееся ра- венство сначала на j, затем на г, получаем (ij)2ji = —ji, или (ij)(ij)ji = -ji. Так как г2 = j2 = —1, то, с учётом ассоциативности умножения, из последнего равенства вытекает, что ij = —ji. Совершенно так же обстоит дело с остальными произведениями мнимых единиц. Следовательно, ji = -к, kj = -i, ik = -j. (8.4) Теперь, предполагая выполненным закон дистрибутивности, мож- но найти произведение любых двух кватернионов (а + bi + cj + dk)(ai + b\i + cij + dik) = = (aai — bbi — cci — ddi) + (abi + bai + cdi — dci) i+ + (aci + cat + dbi — bdi)j + (adi + day + bc\ — cbi) k. (8.5) Итак, на множестве кватернионов определены операции сло- жения и умножения, которые, как можно показать, обладают все- ми алгебраическими свойствами числовых операций, за исклю- чением коммутативности умножения. Собственно говоря, в про- верке нуждаются лишь свойства ассоциативности и обратимости кватернионного умножения. Чтобы убедиться в выполнимости первого из них, достаточно проверить ассоциативность умноже- ния мнимых единиц i,j,k (читатель может сделать это простым перебором всех возможностей). Остановимся на менее очевидном втором свойстве, используя для этой цели аналогию с комплекс- ными числами.
Глава 8. Гиперчисла 147 Для произвольного кватерниона £ = а+Ы+cj+dk рассмотрим сопряжённый ему кватернион £ = а—Ы—cj—dk. Их произведение в любом порядке согласно (8.5) равно й = СС = °2 + Ь2 + с2 + d2 и является, следовательно, действительным числом, которое на- зывают нормой кватерниона 7У(£) = а2 + Ь2 + с2 + d2. Если £ / О (равенство £ = 0 по определению означает, что а = = £> = c = d = 0), то 7V(£) >0, и тогда кватернион ___£ _ а — Ы — cj — dk П “ W(£) “ а2 + Ь2 + с2 + d2 ’ . очевидно, удовлетворяет соотношениям 1?£ = £?? = 1 и значит, является элементом, обратным к Заметим попутно, что норма кватерниона обладает тем же свойством, что и норма комплексного числа: для любых двух кватернионов £i и & = (8.6) то есть норма произведения равна произведению норм. Это дока- зывает следующая цепочка равенств: w(£i&) = (€i€2)(€i€2) = С1С2 (?2?i)(= Ci (С2Сг)С1 = =С1Аг(^2)С1 = = w(CiW2). Соотношение (8.6) имеет связь с одной задачей теории чисел. Из него следует, что произведение суммы четырёх квадратов целых чисел на подобную же сумму есть снова сумма четырёх квадра- тов целых чисел. . Читатель вправе, конечно, спросить, какова же всё-таки связь кватернионов с преобразованиями трёхмерного пространства.
148 Глава 8. Гиперчисла Здесь, как уже отмечалось, нет прямой аналогии с комплекс- ными числами. Дело в том, что соответствия £ —> СоС или £ —> ССо> где Со / 0 — фиксированный кватернион, определяют, вообще говоря, преобразования в четырёхмерном пространстве И, а не в трёхмерном пространстве. Однако Гамильтон заметил, что если С имеет нулевую скалярную часть, то есть £ = xi + + yj + zk, то выражение СоССо1 также обладает этим свойством для любого кватерниона Со- Прове- рить это читатель может непосред- ственным вычислением. Таким об- разом, соответствие С -+ СоССо"1 (8.7) определяет уже преобразование в пространстве трёхмерных векторов (рис. 18). При этом согласно (8.6) МСоССо"1) = ЖоЖСЖСо"1) = ЖоЖСЖСо)"1 = W(C), и значит, преобразование (8.7) сохраняет величину 2V(C) = х2 + у2 + z2, которая в данном случае равна квадрату длины вектора С = xi + + yj + zk. Можно также показать, что оно сохраняет и ориен- тацию трёхмерного пространства векторов С- Линейное преобра- зование, сохраняющее длину векторов и ориентацию простран- ства, является, как известно из геометрии, вращением вокруг оси, проходящей через начало координат. Таким образом, вся- кому кватерниону Со / 0 соответствует вращение трёхмерного пространства, при котором образом вектора С является вектор СоССо причём произведению кватернионов Со и Со будет отве- чать последовательное выполнение (произведение, композиция) соответствующих им вращений: С СоССо"1 - СоССоССо-^Со"1 = (СоСо)С(СоСо)"1.
Глава 8. Гиперчисла 149 Можно совершенно точно описать вращение, задаваемое соответстви- ем (8.7), то есть указать ось и угол поворота. Если & = «о + &о£+ coj +- +dok, то векторная часть Со = М+ + coj + dok как раз и является осью поворота, а угол поворота вокруг этой оси определяется из равенства (Л Например, если £ = j, а £0 = 1 + г, то cos = Л и вектор получается, как и должно быть, из вектора С поворотом на угол <р = тг/2 (рис. 19). Доказательство этого утверждения и другие сведения о ква- тернионах читатель может найти в книге [15]. Гамильтон работал преимущественно в области механики, и его интерес к кватернионам объяснялся во многом тем, что они обещали быть полезным инструментом при решении ряда механических задач. Так, в общем-то, и оказалось, и одним из примеров, подтверждающих это, является так называемая задача о сложении поворотов. Формулируется она следующим образом. Пусть тело поворачивается на угол <р вокруг оси ОА, прохо- дящей через заданную точку О, и вслед за этим вновь поворачи- вается на угол <р' вокруг другой оси О А'. Спрашивается, вокруг какой оси и на какой угол надо повернуть тело, чтобы оно из первого положения сразу перешло в третье. Эта задача, правда, была решена ещё Эйлером средствами ана- литической геометрии, однако её решение с помощью кватерни- онов особенно естественно и прозрачно. В самом деле, пусть кватернион £0 = а0 + £>ог + ад + dok описывает указанным вы-
150 Глава 8. Гиперчисла ше образом первое вращение1, и пусть ^ — кватернион, соответ- ствующий второму из них. Но тогда, как следует из предыдущих рассуждений, результирующий поворот соответствует произведе- нию £о£о этих двух кватернионов. Зная произведение, мы сумеем найти ось й угол результирующего поворота. Кватернионы — важный, в некотором смысле исключитель- ный, но в то же время не единственный пример гиперкомплекс- ной системы. О других примерах (дуальных, или двойных, чис- лах, октавах Кэли) и об общем методе построения гиперком- плексных чисел читатель может также прочесть в книге [15]. Но, пожалуй, самыми известными в обширном многообразии гипер- комплексных систем является так называемые алгебры матриц. Эта известность объясняется чрезвычайно большим значением матриц во многих областях математики и её приложениях. Матрицей называется прямоугольная таблица чисел вида г ап 012 • • • а1п 1 G21 022 • • • CL2n Om2 • • ^тп/ (8.8) Каждый элемент матрицы снабжен двумя индексами, первый из которых указывает номер строки, а второй — номер, столбца, на пересечении которых находится соответствующий элемент. Про матрицу, у которой т строк и п столбцов, говорят, что она име- ет размеры т х п. В случае, когда число строк и столбцов оди- наково (т = п), матрица называется квадратной порядка п. Если матрица состоит, из одной строки (т = 1), её называют вектор-строкой. Точно так же, в случае одностолбцовой матри- цы пользуются термином вектор-столбец. Часто матрицу обо- значают одной буквой (А, В и т.д.), а иногда используется обо- значение (fly). Для матриц довольно понятным образом (так же, как и в лю- бой гиперкомплексной системе) определяются операции сложе- ния и умножения на число, а именно, для любых двух матриц 1 Хотя таких кватернионов много, можно показать, что любые два из них отличаются друг от друга лишь ненулевым скалярным множителем.
Глава 8. Гиперчисла 151 одного и того же размера т х п ( ац + 6ц ... ai п + &1 п \Oinl + 6jjii .. . Лщп “Ь бпгпу или (ay) + (bij) = (ay + bij), и для любой матрицы и любого числа а (&11 . . . G>1 п\ 01 й>Ц ... О! п\ I = : Ojnl • • • ®mn j \Ct ®mn/ или а(ау) = (аоу). Другими словами, матрицы складываются и умножаются на число поэлементно. Но вот операция умножения матриц отличается ббльшим свое- образием. Рассмотрим сначала эту операцию для случая квадрат- ных матриц одного порядка п. Если А = (а,7) и В = (6^) — две такие матрицы, то их произведением А • В = С = (су) называется квадратная матрица С порядка п, произвольный эле- мент Cij которой вычисляется по правилу п Cij = dubij + Cli2b2j + .. . + dinbnj = aikbkj- (3.9) k=l Иначе говоря, чтобы получить элемент г-ой строки и у-ого столб- ца матрицы С = АВ, нужно взять сумму произведений элемен- тов ?-ой строки матрицы А на соответствующие элементы j-oro столбца матрицы В. Например, 1 2\ / 2 0\ _ ( 0 2\ о V ‘ \-1 1/ \-1 1/
152 Глава 8. Гиперчисла Имеется немало причин для рассмотрения столь странной на пер- вый взгляд матричной операции — читатель о них ещё узнает. Отметим пока лишь, что умножение матриц (как, впрочем, и умножение кватернионов) некоммутативно, то есть, вообще говоря, АВ / ВА. Так, перемножив две предыдущие матрицы в обратном порядке, получим другую матрицу: /2 0\ (1 2\ _ / 2 4 \ \-1 1J ДО 1у — у—1 -1)' Вместе с этим, нетрудно доказать (предоставляем это читателю), что умножение матриц ассоциативно: (Л • В) • С = А • (В • С). Имеется и нейтральный элемент (единица) для нашего умноже- ния. Такую роль играет матрица /1 0 ... 0\ О 1 ... О Е= ; : .. . , \0 0 ... 1) называемая единичной матрицей порядка п. Действительно, из формулы (8.9) следует, что ЕА = АЕ = А для любой квадратной матрицы А порядка п. Одним из существенных отличий построенной алгебры квад- ратных матриц1 порядка п от алгебры кватернионов является то, что в первой из них не всегда возможно деление на ненулевой элемент (нулем является матрица, все элементы которой нуле- вые). Так, например, можно убедиться, что никакая матрица X порядка 2 не может служить решением уравнения „ /1 0\ _ /1 0\ ДО О} ~ Д 1/ 1 Эта алгебра обозначается Matn(R). В общем случае, если матричные эле- менты принадлежат полю F, алгебра матриц порядка п обозначается Mat„(F).
Глава 8. Гиперчисла 153 Это обстоятельство носит отнюдь не случайный характер. Теорема, принадлежащая знаменитому немецкому алгебраисту Г. Фробениусу (1849-1917), утверждает, что среди всех гипер- комплексных систем с ассоциативным умножением имеется лишь три, в которых возможно деление на любой ненулевой элемент, — это поле действительных чисел R, поле комплексных чисел С и алгебра кватернионов И. Ещё несколько задержимся на операции умножения матриц. Заметим, что сформулированное выше правило можно распро- странить и на прямоугольные матрицы, не являющиеся квадрат- ными. Формула (8.9) позволяет это сделать, если число столбцов первой матрицы А совпадает с числом строк второй матрицы В. Например, 1 2 \ 3 1 I О -1/ 2 0\ -1 У 2 1 -1 О 5 1 При этом получающаяся матрица имеет столько же строк, сколь- ко первый сомножитель А, и столько же столбцов, сколько вто- рой сомножитель В. Матрицы очень удобны для компактной записи различных со- отношений в математике, и это — одна из многих причин, опреде- ляющих полезность матричного исчисления. Важным примером такого рода являются системы линейных уравнений, с которыми часто приходится иметь дело при решении самых разнообразных математических и прикладных задач. Системой линейных уравнений с п неизвестными х±, х%, .., хп называется совокупность уравнений вида + Я12®2 + ... + <11пхп = &1> О21Ж1 + Я22®2 + • • • + d2nXn = &2, (8.10) , 4" °m2®2 + ... + Отп^п — где aij и bi — произвольные действительные числа. Количество уравнений в системе может быть любым и в общем случае никак не связано с числом неизвестных. Коэффициенты при неизвест-
154 Глава 8. Гиперчисла ных aij (подобно элементам матрицы) имеют двойную нумера- цию: первый индекс i соответствует номеру, уравнения, а вто- рой индекс j — номеру неизвестного, при котором стоит данный коэффициент. Всякое решение системы понимается как набор значений неизвестных («1,02,-••>««)> обращающих каждое из уравнений системы в верное равенство. Рассмотрим теперь матрицу ^ац di2 ... ain^ «21 а22 • • • O2n \®ml ®m2 • • • ®mn/ составленную из коэффициентов при неизвестных системы (8.10) (кратко, матрицу системы). Пусть также <Я1\ ®2 \®п/ /Ь1\ &2 \Ьт/ — столбцы неизвестных и свободных членов. Тогда произведе- ние АХ есть матрица с т строками и одним столбцом, то есть вектор-столбец, элементы которого вычисляются согласно фор- муле (8.9). Таким образом, АХ = ( ацЖ1 + 012^2 + • • • + О1 пжп а21х1 + О22®2 + • • • + О2п®п, + Опг2®2 + • • • + ат п%п / Каждое из уравнений системы (8.10) означает равенство соответ- ствующих координат векторов АХ и В, и вся система в целом означает тогда равенство АХ = В. Полученная нами компактная запись называется матричной формой системы линейных уравне- ний. Подобная матричная запись встречается во множестве дру- гих ситуаций и широко используется в математической, физиче- ской, технической и экономической литературе.
ГЛАВА 9 ЭТИ СТРАННЫЕ КОЛЬЦА Если основным источником понятия группы были преобразова- ния и подстановки, то к другому не менее важному понятию кольца привели исследования (о них говорилось в предыдущих главах) различных числовых систем и поиски новых алгебраиче- ских образований, подобных числам. Термин кольцо впервые по- явился в алгебраических работах Д. Гильберта (1862-1943), од- ного из крупнейших математиков нового времени. Трудно объяс- нить, почему для наименования алгебраических структур с дву- мя операциями им было выбрано такое слово. Не исключено, что это было связано с особенностями строения того объекта, кото- рый мы сейчас называем кольцом классов вычетов..В любом слу- чае введение Гильбертом, нового понятия было в полном согласии со всегдашним его стремлением к аксиоматизации математики. Если выделить и собрать вместе все те свойства операций, ко- торые выполняются в каждой из уже рассмотренных нами струк- тур со сложением и умножением их элементов (начиная с кольца целых чисел и заканчивая алгебрами матриц), то получится та- кой список: 1. Сложение коммутативно: а + b = b + а. 2. Сложение ассоциативно: (а + Ь) + с = а + (Ь + с). 3. Существует нулевой элемент 0 такой, что а+0 = 0 + а = а. 4. Для всякого элемента а существует противоположный эле- мент (—а) такой, что (—а) + а = а + (—а) = 0.
156 Глава 9. Эти странные кольца 5. Умножение ассоциативно: (аб)с = а(Ьс). 6. Умножение дистрибутивно относительно сложения: а(Ь + с) = ab + ас, (Ь + с)а = Ьа + са. Всякая алгебраическая структура с операциями сложения и ум- ножения, обладающими перечисленными свойствами, называется кольцом. Таким образом, в данное нами определение вписываются мно- гие из рассмотренных ранее числовых сйстем: Z-, Q, R, С, и во- обще кольца и поля алгебраических чисел. Кольцами в смысле данного определения являются также кольца классов вычетов Zn, кольца многочленов F[s], равно как и алгебры квадратных матриц Matn(R) относительно операций сложения и умножения матриц. Позднее мы познакомимся и с другими примерами, но уже сейчас ясно, что понятие кольца, как и группы, обладает очень большой степенью общности. У читателя может возникнуть (или уже возник раньше) во- прос, что побуждает математиков к образованию столь общих понятий и связанных с ними довольно абстрактных теорий? Не является ли это их простой прихотью, пустой игрой воображе- ния? В нескольких словах ответить можно было бы так. Навер- ное, прежде всего математиками руководит стремление объеди- нить общей идеей многие из накопившихся в их науке фактов, ранее казавшихся разрозненными, попытаться найти им анало- гию и в иных, ранее не изучавшихся объектах. Безусловно, нема- лую роль играет поддерживаемая интуицией убеждённость, что развитие общей теории позволит применить её затем к разгадке трудных, нерешённых ещё математических (и не только матема- тических) проблем. Мы надеемся, что на страницах этой книги читатель найдёт подтверждение этим словам. Пожалуй, процесс развития общих понятий и теорий движется также и желанием узнать, какое место занимает в них уже известное и изученное, и что ещё новое, необычное они в себе скрывают. Возвращаясь от этих философских отступлений к понятию кольца, мы как раз сможем заметить, сколь неожиданными могут быть свойства определённых в нём операций. Возможная неком- мутативность умножения в кольцах (кольцо матриц) нас едва ли
Глава 9. Эти странные кольца 157 уже удивит — с подобным обстоятельством мы уже сталкивались прежде. Однако в кольцах матриц, как, впрочем, и в кольцах классов вычетов и в других, мы обнаруживаем и более удиви- тельные вещи. Это, прежде всего, присутствие в них делителей нуля и нильпотентных элементов. Определяются они следующим образом. Ненулевой элемент а кольца К называется делителем нуля, если существует такой элемент b е К, также отличный от нуля, что ab = 0 или Ъа = 0. (9.1) Ненулевой элемент а кольца К называется нильпотентным элементом, если некоторая его натуральная степень равна нулю: ап = 0. (9.2) Заметьте, что нильпотентный элемент обязательно является де- лителем нуля. Обратное, вообще говоря, неверно. Ясно, что в числовых кольцах равенства (9.1) и (9.2) исключены, если чис- ла а и b отличны от 0. В то же время в кольцах матриц и классов вычетов нет недостатка как в делителях нуля, так и в нильпо- тентных элементах. К примеру, простое вычисление показывает, что ненулевая матрица .. А = 1\ °7 0 0 такова, что её квадрат равен нулю: А2-(° А ~ \0 °1 о/ • Достаточно общим примером нильпотентной матрицы (а следо- вательно, и делителя нуля) порядка п служат матрицы вида /0 «12 «13 • • • 0 0 «23 • • • а2п А = 0 0 0 • • • а3п • 0 0 ... oj Читатель может самостоятельно убедиться, что Ап = 0.
158 Глава 9. Эти странные кольца Что касается кольца классов вычетов Zn, то оно содержит де- лители нуля тогда и только тогда, когда п — число составное: п = П1П2. Если последнее выполнено, то, очевидно, п±-П2 = п = = 0, хотя ni,n2 / о. Справедливость обратного утверждения будет ясна из дальнейшего. Впрочем, читатель в состоянии до- казать его уже и сейчас, заодно выяснив, какому условию долж- но удовлетворять п, чтобы кольцо Zn содержало нильпотентные элементы (простейшим примером такого кольца является Z4 — в нём выполнено равенство 22 = 0). Следствием этих особенностей являются и другие необычные свойства. Например, числовое уравнение х2 = х имеет лишь два решения: 0 и 1. То же самое уравнение, рассматриваемое в про- извольном кольце, может обладать и иными решениями, их чис- ло может быть даже бесконечным. Примеры тому можно найти и в кольцах матриц, и в кольцах классов вычетов. Всё это требует соблюдать известную осторожность при оперировании с элемен- тами произвольных колец. . ,. , Подчеркнём ещё раз —аксиомы кольца отобраны таким об- разом, чтобы объединить этим понятием большое разнообразие важнейших для алгебры объектов. Не удивительно поэтому, что из этих аксиом не вытекают такие привычные для числовых ко- лец и колец многочленов свойства, как коммутативность умноже- ния и отсутствие делителей нуля. Добавляя эти свойства к спис- ку аксиом 1-6, мы приходим к понятию области целостности или иначе целостного кольца — коммутативного кольца без де- лителей нуля1. Названием «область целостности» подчёркивается сходство таких колец с кольцом целых чисел, иногда весьма от- далённое. Тем не менее, наше замечание о сходстве произвольных обла- стей целостности с кольцом целых чисел было небезоснователь- ным. Оно подчёркивается тем, что для любой области целост- ности возможна процедура, подобная расширению кольца целых чисел Z до поля рациональных чисел Q. Но перед разговором 1 Часто в определение области целостности включают ещё требование су- ществования единицы, то есть такого элемента 1 € К, что 1 • а = а • 1’= а для любого а € К.
Глава 9. Эти странные кольца 159 об этом нужно познакомиться с общеалгебраическим понятием поля, которое, конечно, имеет своими непосредственными пред- шественниками рассматривавшиеся нами числовые поля. Полем F называется коммутативное кольцо с единицей (при этом 1 / 0), в котором каждый ненулевой элемент обратим, то есть для всякого а 0 из F существует элемент a-1 G F такой, что а • а-1 = а-1 • а = 1. Сразу заметим, что в поле отсутствуют делители нуля, так как последние не могут быть обратимыми элементами (почему?). Иными словами, поле — это всегда область целостности. Содержащиеся в определении поля дополнительные по срав- нению с кольцом требования достаточны (и необходимы) для того, чтобы обеспечить в этой алгебраической структуре воз- можность де,ления на любой ненулевой элемент. Действительно, всякое уравнение вида ах = Ь, а / 0, в поле однозначно разрешимо. Решением его, очевидно, является элемент х = а~1Ь. Нам уже известны примеры числовых полей. Они, разумеет- ся, удовлетворяют нашему общему определению. Иной и очень важный пример поля доставляют кольца классов вычетов по про- стому модулю. Так, каждое из колец Z2, Z3, Z5 образует поле — обратимость любого ненулевого элемента в них видна из таблиц умножения в этих кольцах: Z2 X 0 1 X 0 0 0 0 1 0 1 1 2 Z3 0 12 ООО 0 12 0 2 1 Z5 X 0 1 2 3 4 0 0 0 0 0 0 1 0 1 2 3 4 2 0 2 4 1 3 3 0 3 1 4 2 4 0 4 3 2 1 Вообще, справедливо следующее утверждение. Кольцо 1Ъп является полем тогда и только тогда, когда п — простое число.
160 Глава 9. Эти странные кольца Понятна необходимость последнего условия. Действительно, ес- ли п — число составное, то, как было выяснено выше, Zn обяза- тельно содержит делители нуля, а в поле это исключено. Достаточность тоже можно считать уже доказанной. Ведь в главе 2 мы убедились, что в кольцах вычетов по простому моду- лю возможно однозначное деление на любой ненулевой элемент. Всё же мы дадим ещё одно доказательство, которое одновремен- но содержит в себе алгоритм отыскания обратного элемента. Пусть п = р — простое число и к — ненулевой класс вычетов в Zp. Числа р и к взаимно просты, поэтому (см. дополнение к гла- ве 6) существуют такие целые s и t, что pt + ks = 1. (9.3) Напомним, что отыскание указанных чисел опиралось на алго- ритм Евклида. При переходе к классам вычетов равенство (9.3) превратится в следующее pt + ks = 1. Однако р = 0, поэтому мы получаем к • s = 1. Последнее и означает, что класс s G Zp является элементом, обратным к классу к. Итак, в случае простого модуля р мы имеем дело с полем классов вычетов Zp. Пример. В поле Z17 найдем класс, обратный к 8. Так как 17 = = 2-8 + 1, то 17 — 2 • 8 = 1. Для классов вычетов получаем (—2) -8 = 1. Очевидно, (—2) = 15, поэтому 15 — искомый обрат- ный. Поля вычетов по модулю р являются простейшими примера- ми конечных полей, называемых ещё полями Галуа. С другими их примерами мы встретимся позднее. Теория таких полей об- ладает глубиной, прозрачностью и красотой. Добавим к этому, что конечные поля имеют много применений. Одно из них (для нужд теории кодирования) рассматривается в последней главе этой книги.
Глава 9. Эти странные кольца 161 Любое поле всегда образует целостное кольцо, обратное, во- обще говоря, неверно (вспомните хотя бы кольцо Z). Интересно, однако, что всякая область целостности вкладывается в поле. Что это означает, объясняет конструкция поля частных, часто используемая в алгебре. Пусть К — произвольное целостное кольцо (если оно совпа- дает с Z, конструкция даёт корректное определение поля рацио- нальных чисел Q). Рассмотрим множество пар (а, Ь), где а, Ь € К, причём b / 0. Каждой такой паре мы хотим уготовить роль дро- би, у которой а —числитель, а Ь — знаменатель. Поступая так, мы исходим, разумеется, из аналогии с обычными рациональны- ми дробями: ведь каждая такая дробь т/п определяется парой целых чисел т и п, где п / 0. Однако две различные пары (т, п) и (m',n') целых чисел могут быть эквивалентны в том смысле, что определяемые ими рациональные дроби т/п и т'/п' одно и то же число (например, 3/9 = 2/6 = 1/3). Выполняется это, как хорошо известно, тогда и только тогда, когда тп' = т'п. Указанное обстоятельство должно быть, ко- нечно, учтено и в нашей конструкции. Две пары элементов (а, Ь) и (а', У), где Ь, Ь' / 0, кольца К будем поэтому называть эк- вивалентными, отражая это в записи (а,Ь) ~ (а',Ь'), если в К выполняется равенство abr = а'Ь. Для каждой пары (а, 6) рас- смотрим множество всех эквивалентных ей пар (х,у), обозначая его символом а/Ъ а/b = {(#, у) | (ж, у) ~ (а, 6)}. (9.4) Заметим, что любые две пары (xi,yi) и (х2,У2)> принадлежа- щие множеству (9.4), иначе, эквивалентные (а,Ь), будут эквива- лентны и между собой. Действительно, из равенств x-jb = у^а и гс26 = у2а вытекает, что ®1У2 ab = Х2У1 ab, или аЬ(хху2 — Х2У1) = 0. Отсутствие в области целостности делителей нуля влечёт тогда Х1У2 - Х2У1 = 0, ИЛИ 0?1У2=®2У1, то есть (Х1,У1) ~ (Х2,У2)- 6 — 261
162 Глава 9, Эти странные кольца Далее, если две пары (а, Ь) и (с, d) не эквивалентны, то опре- деляемые ими множества а/b и c/d не имеют общих элементов. Если предположить противное, то будем иметь, что некоторая пара (х,у) одновременно эквивалентна и (а,Ь), и (c,d). Но тогда, как и выше, отсюда бы следовало вопреки предположению, что (a,b) ~ (c,d). Таким образом, множество всех пар оказывается разбитым на непересекающиеся классы эквивалентных между собой пар. Пусть K = {a/b\a,beK-,b^O} — множество, элементами которого являются эти классы. Мы будем называть их дробями. Правила сложения и умножения классов (дробей) скопируем с аналогичных действий над обычными дробями. Пусть г и s — два класса из К. Возьмём пару (а, У), представляющую г, и пару (с, d), представляющую з. По определению, (а, Ь) + (с, d) = (ad + be, bd) и (a, b) (с, d) = (ас, bd). Точно так же, для соответствующих классов г = а/b и s = c/d положим a/b + c/d = (ad + bc)/bd и a/b • c/d = ac/bd. (9.5) Конечно, операции (9.5) над классами могут иметь определён- ный смысл лишь в том случае, если их результат не зависит от выбора представителей в этих классах1. Убедиться, что это так, нетрудно. Действительно, если (а, Ь) ~ (а',У) и (c,d) ~ (d,d') (иными словами, а/b = а'/Ь' и c/d = d/d'), то аУ = а'Ь и cd' = = dd, откуда ab'dd' = a'bdd', cd'bb' = ddbb'. Сложив эти равен- ства, получим, что (ad + bejdd' = (a'd1 + b'd)bd, то есть (а, У) + + (c,d) ~ (а1, У) + (d,d'), a/b + c/d = а'/У + d/d. Аналогично, a/b • c/d = а'/У • d/d!. Операции, определённые на множестве К, превращают его в поле. Коммутативность сложения и умножения понятна. Лег- ко проверяется ассоциативность этих операций. Роль нулевого 1 Положение здесь такое же, как при оперировании с классами вычетов.
Глава 9. Эти странные кольца 163 элемента играет дробь 0/Ь, а единичного — дробь Ь/Ь (в качестве Ь может быть взят любой ненулевой элемент из К). Для дроби d/b противоположной является дробь —а/Ь, а обратной (если а / / 0) — дробь b/а. Выполнен, наконец, и закон дистрибутивности: (а/Ь + c/d) е/f = (ad + bc)/bd е/f = (ade + bce)/bdf = = (ade/ + bcef)/bdf2 = ae/bf + ce/dj = a/b • e// + c/d • e//. Построенное поле К называется полем, частных или полем отношений для исходного целостного кольца К, и, что важно, это поле содержит подкольцо, изоморфное К. В главе 6 мы рассматривали различные примеры колец ал- гебраических чисел. Все они, разумеется, являются целостны- ми кольцами. Эти примеры показывают, что арифметика в це- лостных кольцах может очень сильно отличаться от арифмети- ки обычных целых чисел. Главное, в чём это проявляется, — возможная неоднозначность разложения на простые множители. При рассмотрении вопросов делимости в областях целостности важная роль принадлежит понятию идеала. Заметим, что это — одно из тех немногих понятий, которое имеет смысл для произ- вольных колец, а его значение, как мы увидим позднее, далеко не исчерпывается сказанным здесь. Подмножество I кольца К называется двусторонним идеалом, если оно само является кольцом относительно операций на К (короче говоря, подкольцом) и если для любых элементов a € К и Ь € I оба произведения ab и Ьа принадлежат I. Так, множество чётных чисел есть идеал кольца Z. Читатель легко проверит, что и вообще всякое множество целых чисел, кратных некоторому числу к, является идеалом кольца Z. Эти примеры в случае коммутативного кольца К обобщаются следу- ющим образом. Пусть b е К — произвольный элемент такого кольца. Рассмот- рим множество I всех элементов К, кратных Ь, то есть получа- ющихся из b умножением на любое а € К 1 = {Ьа\ае К}. (9.6) 6»
164 Глава 9. Эти странные кольца Для указанного множества все требования, входящие в опреде- ление идеала, очевидно, окажутся выполненными. Идеал вида (9.6) называется главным идеалом, точнее, главным идеалом, по- рождённым элементом Ь, и обозначается символом (Ь) или ЬК. В произвольном кольце вовсе не любой идеал является главным. Неглавные идеалы могут существовать даже в числовых кольцах (примеры читатель найдёт в дополнении). Понятие главного идеала существенно потому, что оно явля- ется удобным средством описания отношения делимости элемен- тов, имеющего смысл в любом коммутативном кольце. В коммутативном кольце К элемент с называется делителем Ь, если существует такой элемент d G К, что b = cd. (9.7) Иначе говорят, что с делит Ь, обозначая это так: с | Ь. Если каждый из ненулевых элементов бис делит другой, то такие элементы называются ассоциированными. Ясно, что делители единицы (если она имеется в кольце), яв- ляются в точности обратимыми элементами кольца, а связь меж- ду ассоциированными элементами может быть выражена следу- ющим простым утверждением. Ненулевые элементы Ьи с области целостности с единицей ассоциированы тогда и только тогда, когда в равенстве (9.7) элемент d обратим1. Действительно, если элемент d обратим, то, умножая обе ча- сти равенства (9.7) на обратный d-1, получим с = bd-1. Значит, не только с | Ь, но и b | с, то есть элементы b и с ассоциированы. Наоборот, если это так, то имеем b = cdi и с = bd% (9.8) для некоторых элементов d\ и d% кольца. Из равенств (9.8) сле- дует, что b = bd2di, или b (<^2^1 — 1) = 0. 1 Полезно сравнить это утверждение с рассмотрениями главы 6, где говори- лось о делимости в кольце целых алгебраических чисел, в частности, в кольце Z и в кольце целых гауссовых чисел Z[i].
Глава 9. Эти странные кольца 165 Отсутствие делителей нуля позволяет сократить на Ь, поэтому <^2^1 = 1- Следовательно, элементы di и с/г в (9.8) обратимы. Какое отношение ко всему сказанному о делимости имеют идеалы, точнее, главные идеалы? Ответ такой: 1. Элемент с делит Ь тогда и только тогда, когда (с) D (/>). 2. Элементы Ь и с ассоциированы тогда и только тогда, когда (Ь) = (с). 3. Элемент d кольца К обратим тогда и только тогда, когда (d) = (1) = К. Понятно, что утверждение 2 следует из утверждения 1. Кроме того, и утверждение 3 вытекает из утверждения 2. В самом деле, обратимость элемента d эквивалентна его ассоциированности с 1, а главный идеал (1), ею порождённый, очевидно, совпадает со всем кольцом К. Достаточно поэтому доказать лишь первое из трёх утверждений. Сделать это несложно. Если (с) Э (£>), то ясно, что Ъ € (с), но тогда согласно определению главного идеала этот элемент представляется в виде (9.7). Обратно, пусть с | Ь, то есть выполняется равенство (9.7). Это означает, что b 6 (с), и следовательно, всякое произведение Ьа, где а — любой элемент кольца, также содержится в идеале (с), поэтому (Ь) С (с). Отмеченные обстоятельства делают понятным интерес к так называемым кольцам главных идеалов. Этим термином обозна- чают целостные кольца с единицей, каждый идеал которых яв- ляется главным. Давно уже было отмечено, что указанным свой- ством обладают такие классические объекты, как кольцо целых чисел Z и кольцо многочленов. Вот, например, как доказывается, что кольцо Z является кольцом главных идеалов. Пусть I — произвольный идеал в Z. Если I состоит только из нуля, то I = (0). В противном случае выберем наименьшее положительное число а, принадлежащее идеалу I. Произвольный элемент b из I разделим на а с остатком b = s • а + г, 0 г < а.
166 Глава 9. Эти странные кольца Так как b и а принадлежат идеалу, это же верно и для г = b—за. Поскольку 0 < г < а, а элемент а — наименьшее положительное число в идеале I, то обязательно г = 0. Следовательно, Ъ = за, то есть все числа идеала I кратны а. Это и означает, что I = (а) — главный идеал. По той же схеме можно провести доказательство аналогич- ного утверждения и для кольца многочленов F[x] с коэффици- ентами из произвольного поля. Фактически же (см. дополнение 5) — для любого евклидова кольца. Понятие евклидового кольца, введённое прежде для числовых колец (см. дополнение 5 к главе 6), легко обобщается на случай произвольной области целостно- сти. Достаточно лишь в данном там определении слова «числовое кольцо» заменить на «целостное кольцо». Значение и место колец главных идеалов (в частности, и ев- клидовых колец) в обширном многообразии колец определяется прежде всего тем, что для них справедлива следующая основная теорема. Всякое кольцо главных идеалов К является кольцом с од- нозначным разложением на простые множители. Заметим, что понятия простого элемента и однозначного раз- ложения, уже рассмотренные в главе 6, без изменений перено- сятся и на произвольные области целостности. Доказательство основной теоремы, а им мы и закончим эту главу, даёт яркий пример одного из тех алгебраических рассуж- дений, с помощью которых получаются утверждения большой степени общности. Убедимся сначала, что всякий ненулевой элемент либо сам является простым, либо обладает хотя бы одним разложени- ем на простые элементы. Это справедливо не во всякой обла- сти целостности и потому нуждается в доказательстве. Будем рассуждать от противного: предположим, что имеется хотя бы один элемент, не обладающий этим свойством. Все такие эле- менты для краткости назовём «плохими» элементами, а порож- дённые ими идеалы — «плохими» идеалами. Рассмотрим теперь произвольную строго возрастающую цепочку «плохих» идеалов,
Глава 9. Эти странные кольца 167 то есть такую, что (ai) С (а2) С ... С (ап) С ..., (9.9) и покажем, что всякая такая цепочка может иметь лишь конеч- ное число членов. С этой целью рассмотрим объединение А = = U(afc) всех идеалов, входящих в (9.9). Легко видеть,' что А к также образует, идеал в К, причём главный, так как других в кольце К нет. Пусть а —его порождающий элемент, то есть А = (а). Ясно, что элемент а содержится в некотором идеале (ап) из цепочки (9.9). Тогда, с одной стороны, А = (а) С (ап), а с другой, согласно определению идеала А, верно и противо- положное включение A D (ап). Следовательно, для некоторого п выполнено равенство А = (ап), а это и означает, что цепочка (9.9) обрывается на конечном шаге (ai) С (а2) С ... С (ап) = А. (9.10) Очевидно, что всякий «плохой» элемент (в частности, и ап) не может быть простым. Поэтому для ап существует нетриви- альное разложение ап = Ьс, в котором сомножители Ъ и с не являются обратимыми. Но тогда (Ь) D (ап) и (с) D (ап), откуда следует, что ни Ъ, ни с уже не могут быть «плохими» элемен- тами. Иначе цепочка (9.10). могла бы быть продолжена за счёт одного из «плохих» идеалов (6) или (с). Итак, элементы Ь и с об- ладают разложениями на простые множители, произведение же этих разложений само будет являться разложением на простые множители для ап = Ьс. Из полученного противоречия вытекает, что в кольце К нет «плохих» элементов. Осталось теперь доказать однозначность разложения на про- стые множители. Для этого понадобится следующее свойство простых элементов кольца главных идеалов (для простых чисел в Z оно хорошо известно читателю). Если простой элемент р кольца главных идеалов делит про- изведение ab, то он делит хотя бы один из сомножителей, то есть р | а или р | Ь. Действительно, пусть, например, р не делит а. Докажем, что в этом случае р | Ь. Рассмотрим наименьший идеал, содержащий
168 Глава 9. Эти странные кольца элементы р и а, обозначая его (р,а). Нетрудно понять, что он состоит из всех элементов вида хр + уа, (9.11) где х и у — произвольные элементы кольца. С другой стороны, идеал (р,а) является главным, но тогда его порождающий эле- мент с, понятно, должен быть делителем всякого элемента из (р,а), в частности, элементов р и а. Из простоты р и из того, что р не делит а, сразу следует, что с обязан быть обратимым элементом - делителем единицы. Как известно, в этом случае (р,а) = (с) = (1) = К, поэтому существуют такие xq и уо, для которых элемент вида (9.11) совпадает с единицей хор + Уоа = 1. Умножая это равенство на Ь, получаем Ъхор + yoab = Ъ. Оба слагаемых в левой части делятся на р (второе потому, что по условию р | ab), значит, и b делится на р. Переходим к заключительной части доказательства основной теоремы. Предположим, что некоторый элемент а имеет два раз- ложения на простые множители: а = Р1Р2 ..-Рг = 9192 •••9s- (9.12) Так как pi делит произведение, стоящее справа, то по доказан- ному оно делит хотя бы один из входящих в него сомножителей. Изменив при необходимости их нумерацию, можем считать, что Pi | qi. Тогда qi = ttipi, где ui обязан быть обратимым элемен- том, и равенство (9.12) запишется в виде Р1Р2 ... Рг =Р1«192 ••• 9s.
Глава 9. Эти странные кольца 169 Сокращая обе части равенства на общий множитель р\ (в обла- сти целостности это допустимо), получаем Р2 ••• Рт = «192 ••• qs- (9.13) Повторив рассуждения теперь уже применительно к равенству (9.13), аналогично будем иметь q2 = U2P2, где множитель «2 сно- ва обратим. В конечном итоге придём к выводу, что число сомно- жителей в обоих разложениях (9.12) одинаково (то есть г = з), и при этом после подходящей перенумерации каждый элемент qk отличается от соответствующего элемента рк на обратимый мно- житель: qk = UkPk- Единственность разложения, а вместе с ней и утверждение нашей теоремы доказаны. Дополнения и задачи 1. Во всяком кольце К подмножество {0}, состоящее из одного нуля, и само кольцо К, очевидно, являются идеалами. Это так называемые тривиальные идеалы. Докажите следующее утвер- ждение: коммутативное кольцо является полем тогда и толь- ко тогда, когда оно не содержит идеалов, отличных от три- виальных. 2. Доказать, что в конечном кольце с единицей всякий элемент является или делителем нуля, или обратимым элементом. Отсю- да, в частности, вытекает, что конечное коммутативное кольцо с единицей и без делителей нуля является полем. 3. Характеристика поля. Символом п о 1 обозначим сумму п единиц (п е. N) произвольного поля F: по1 = 1 + 1 + ... + 1 (п единиц). Логически возможны два случая: 1) для различных т, п € N элементы mol и п о 1 также различны: т о 1 / п о 1; 2) существуют различные т,п е. N такие, что т о 1 = п о 1.
170 Глава 9. Эти странные кольца Понятно, что второй случай неизбежен во всяком конечном поле. Рассмотрим его подробнее. Пусть в равенстве т о 1 = п о 1 для определенности т > п. Обозначая к = т — п, будем иметь fcol = 0, (9.14) где к — натуральное число. Наименьшее натуральное к с указан- ным свойством называют характеристикой поля F. В первом случае говорят, что характеристика поля равна нулю. Очевидно, что характеристика поля вычетов Zp равна просто- му числу р. Оказывается, что ненулевая характеристика поля всегда есть некоторое простое число р. Докажите это утвер- ждение, используя равенство (п^пъ) о 1 = (щ о 1)(пг о 1) и тот факт, что в поле отсутствуют делители нуля. 4. Простые поля. Если одно поле Fi содержится в другом по- ле F, то говорят, что Fi — подполе поля F. Поле F называется простым полем, если оно не содержит подполей, отличных от самого. F. Примерами простых полей (проверьте это!) являются поля вычетов Zp для всевозможных простых р и поле рациональ- ных чисел Q. Фактически, этими примерами исчерпываются все простые поля. Точнее, справедливо следующее утверждение: всякое простое поле характеристики 0 изоморфно полю рациональных чисел Q, всякое простое поле характеристики р изоморфно полю вычетов Zp. Пусть сначала F — простое поле нулевой характеристики. Вме- сте с 1 в нём должны содержаться элементы вида nol, где п € N, причём все они различны и не равны нулю. Для каждого элемен- та вида nol в F содержится и противоположный элемент —(nol). Обозначим его (—n)ol. Следовательно, в записи nol множитель п можно считать произвольным целым числом, при этом различ- ным п / 0 отвечают различные ненулевые элементы в F (при п = 0 выражение п о 1 по определению считается равным нулю). Рассмотрим отображение / поля Q в поле F, полагая f{m/n) = (т о 1)(п о I)-1. (9.15)
Глава 9. Эти странные кольца 171 Здесь т € Z, п € N. Читателю рекомендуется проверить, что это отображение корректно определено, то есть при всех запи- сях одного и того же рационального числа в виде дроби его образ будет один и тот же. Выражение в правой части также определе- но, поскольку ненулевой элемент п о 1 имеет в поле F обратный. Обозначим через Fi множество всех элементов вида (9.15). При соответствии f различным дробям будут отвечать также различные элементы в Fi, кроме того, сумма и произведение дробей будут переходить соответственно в сумму и произведение их образов в Fi (проверка предоставляется читателю). Сказанное означает, что Fi — подполе в F, изоморфное полю Q. Из простоты F следует, что F = Fi, и следовательно, оно само изоморфно полю Q. В случае поля ненулевой характеристики р ситуация иная. Для целых тип равенство т о 1 = п о 1 (9.16) возможно теперь тогда и только тогда, когда т = n(modp). Действительно, равенство (9.16) эквивалентно А; о 1 = О, где к = т — п. (917) Пусть к = sp+г, где г — остаток при делении к на р (0 г < р). Тогда к о 1 = (sp + r)ol = spol + rol = rol, и равенство (9.17) равносильно г о 1 = 0. Так как 0 < г < р, то из определения характеристики следует, что г = 0. Значит, к = т — п делится на р без остатка и т = п (mod р). Обратно, если т = п (mod р), то к = sp и к о 1 = sp о 1 = 0. Следовательно, в поле характеристики р элементами то 1 = 0, где т = 0, 1, ..., р — 1, (9.18) будут исчерпаны все элементы вида к о 1. Читатель может легко проверить, что все действия над элементами вида (9.18) анало- гичны операциям над классами вычетов по модулю р. Поэтому
172 Глава 9. Эти странные кольца эти элементы образуют поле, изоморфное Zp, а изоморфизмом служит соответствие /(т) = т о 1, т = 0, 1, ..., р — 1. Из про- стоты F тогда следует, что оно само изоморфно Zp. Чуть видоизменяя рассуждения, можно доказать (рекомендуем сделать это самостоятельно) более общий факт: всякое поле характеристики 0 содержит един- ственное простое поле, изоморфное Q, а всякое поле характеристики р содержит единственное простое поле, изоморфное Zp. 5. Докажем утверждение, о котором говорилось в основном тек- сте главы: всякое евклидово кольцо К является кольцом глав- ных идеалов. Пусть I — идеал такого кольца. Из всех элементов этого иде- ала выберем тот ненулевой элемент а, норма которого наимень- шая. Если b — произвольный элемент в I, то по определению евклидова кольца существуют такие q и г, что b = qa + г, и либо г = 0, либо 7V(r) < 7V(a). Так как d,b G I, то и элемент г = Ъ — — qa € I. Тогда обязательно г = 0, ибо в противном случае мы входим в противоречие с выбором элемента а. Поэтому b = qa, и следовательно, идеал I = (а) является главным. Осталось показать, что К содержит единицу. Заметим для этого, что само К, в частности, образует главный идеал К = = (с), порождённый некоторым элементом с. Тогда существует е е К такой, что с = се. Элемент е и служит единицей кольца. Действительно, для любого d 6 К имеем d = fc для некоторого f € К (поскольку всякий элемент К кратен с). Поэтому de = = fee = fc = d, что и требуется. 6. Убедитесь, что а) кольцо эйлеровых чисел Z[%/—3 ], б) кольцо многочленов с целыми коэффициентами Z[ar], в) кольцо многочленов F[x, у] от двух переменных над полем F не являются кольцами главных идеалов.
ГЛАВА 10 ОПЕРИРУЕМ С КЛАССАМИ Идея разбиения множества на классы и оперирования над полу- ченными классами для нас уже не нова. Наглядной её демон- страцией послужило кольцо классов вычетов с определёнными в нём сложением и умножением классов. Теперь, когда грани- цы наших познаний и нашего опыта в алгебре стали шире, мы можем взглянуть на пример с вычетами иными глазами. Пожа- луй даже, мы можем предположить, что этот пример является проявлением некоего общего принципа. Скажем сразу, что такое предположение не лишено оснований — общий принцип действи- тельно существует. Для начала вспомним, что в разделе, посвящённом группам, встретилось понятие, очень похожее на классы вычетов. Мы име- ем в виду, конечно, смежные классы группы по подгруппе, кото- рые в частном случае аддитивной группы целых чисел Z в точ- ности совпадали с классами вычетов1. Вопрос о том, можно ли со смежными классами произвольной группы оперировать так же, как и с классами вычетов, выглядит поэтому вполне есте- ственным. Правда, в произвольной группе определена лишь одна операция (умножение или сложение), следовательно, и говорить в этом случае разумно также об одной операции над её смежны- ми классами, как раз и связанной с заданным групповым законом умножения. 1 Более точно, смежные классы группы Z по подгруппе nZ совпадают с классами вычетов по модулю п (элементами Zn).
174 Глава 10. Оперируем с классами И действительно, можно привести немало примеров, когда от- вет на поставленный вопрос положителен. Вот один из них. В аддитивной группе R действительных чисел рассмотрим подгруппу Z, состоящую из целых чисел. Каждый смежный класс г+ Z в этом случае есть множество точек числовой оси, обычно называемое решёткой, удалённых от точки г на расстоя- ние, равное целому числу единиц (рис. 20). г-3 г-2 г-1 г г+1 г+2 г+3 -----« I *-|-----> I > I > > 0 1 Рис. 20. Сумму двух таких классов (решёток) ri+Z и гг+Z мы можем определить совершенно так же, как и сумму классов вычетов. Найдём с этой целью сумму двух произвольных чисел г* € ri+Z и 7*2 € Т2 + Z, принадлежащих указанным решёткам. Поскольку = Г1 + ki, г2 = Г2 + k2 для некоторых целых чисел fci и то эта сумма г^+т^ = (ri+r2)+(fci+fe2), отличается от Г1+гг снова на целое число. По этой причине, независимо от выбора и г'2 она всегда окажется в одном и том же классе (п +гг) + 2, его-то мы и будем считать суммой смежных классов ri + Z и Г2 + Z. Таким образом, (ri +Z) + (Г2 + Z) = (ri + Г2) + Z. На рис. 21 элементы решёток ri+Z, гг+Z и их суммы ri+r2+Z отмечены точками, крестиками и кружками соответственно. Г2 А -----»-ОХ IOXIOX чох »1ОХ > ох ♦ ох • О 1W Рис. 21. Легко видеть, что подобным образом можно поступить и в слу- чае любой абелевой группы. Действительно, пусть Н — подгруп- па абелевой группы G и д^Н, д2Н — два её смежных класса по этой подгруппе. Если gihi € giH, g2h>2 G g2H — некоторые их элементы, то их произведение (в силу коммутативности) равно (<71Л1)(<?2^2) = (SlP2)(^l/l2)- (10.1)
Глава 10. Оперируем с классами 175 Понятно, что элемент hi/12 принадлежит подгруппе Н, но то- гда равенство (10.1) означает, что, независимо от способа выбора элементов g^hi и <72/12 в классах giH и д2Н их произведение все- гда оказывается элементом смежного класса (gig2)H. Последний и назовём произведением классов д^Н и д2Н, так что (Р!Н)(Р2Я) = (д1д2)Н. (10.2) Самым замечательным является то, что это новое умножение, определённое для классов, наследует все свойства групповой опе- рации исходной группы. Так, очевидно, что умножение смежных классов ассоциативно (это прямо следует из ассоциативности операции в G). Особую роль играет смежный класс еН = Н, совпадающий с самой под- группой. Из равенства (10.2) вытекает, что (еЯ)(рЯ) = едН = дН для любого смежного класса дН. Таким образом, класс Я явля- ется нейтральным элементом (единицей) для нового умножения. Ну и наконец, каждый смежный класс дН обратим и обратным для него, как нетрудно понять, является класс д~1Н. Действи- тельно, их произведение даёт нейтральный элемент еН. Всё вместе сказанное означает, что множество смежных клас- сов по подгруппе Я само образует группу относительно умно- жения, определённого равенством (10.2). Построенную группу (она, подобно исходной, также абелева) называют факторгруп- пой группы G по подгруппе Я, обозначая её обычно симво- лом G/Я. В примере, рассмотренном выше, каждый элемент факторгруп- пы R/Z представляет собой некоторую решётку точек на число- вой оси, а операция в этой группе — это описанная там же опе- рация сложения решёток. Заметим, что нейтральным элементом относительно этого сложения является решётка, составленная из точек с целыми координатами, так называемая целочисленная решётка. Как же всё-таки обстоит дело в общей ситуации? Если по- пытаться провести прежние рассуждения для произвольной, уже
176 Глава 10. Оперируем с классами не обязательно абелевой группы, то мы сразу же натолкнемся на существенное препятствие. Ведь теперь равенство (10.1) мо- жет и не выполняться, поэтому не исключено, что произведение (Si^i)(g2^2) окажется в смежном классе, отличном от gig2H. Если так, то и попытка определить умножение смежных классов тщетна, поскольку результат такого умножения зависел бы от выбора представителей в этих классах. С другой стороны, тре- бование коммутативности едва ли может показаться совершенно необходимым для успеха нашего предприятия. И действительно, для этого нам нужно нечто меньшее, а именно то, чтобы (gihi)(g2h2) G Р1Р2Я (10.3) при любом выборе элементов gihi е. giH и <72/12 € д2Н (иначе, при любом выборе элементов hi и /12 из подгруппы Н). Включе- ние (10.3) можно записать по-другому: (gihi)(g2h2) = gig2h3 для некоторого элемента /13 6 Н. Умножая обе части последнего равенства на д^1 слева и на 1 справа, получим hxg2 = gzh, где h = h3h^1 6 Н. Элемент hig2 находится в правом смежном классе Нд2 но, как показывает равенство, он же принадлежит и левому смежному классу д2Н. Очевидно, что в наших рассуждениях д2 может быть произвольным элементом группы G, a hi — произвольным эле- ментом подгруппы Н. Мы приходим, следовательно, к выводу: для корректности умножения классов необходимо, чтобы каж- дый правый смежный класс Нд целиком содержался в левом дН. Можно убедиться также, что необходимым является и обратное включение, следовательно, дН = Нд для любого д € G. Подгруппы, обладающие указанным свойством, играют в теории групп особую роль и называются нормальными подгруппами или
Глава 10. Оперируем с классами 177 нормальными делителями1. Подчеркнём ещё раз, что нормальный делитель —это такая подгруппа, разложение в левые и правые смежные классы по которой совпадают. Очевидно, что в абелевой группе любая подгруппа является нормальной. Другие примеры нормальных подгрупп мы приведём несколько позже. Читатель может найти их также в дополнениях к этой главе. Свойство подгруппы быть нормальной является на самом деле не только необходимым, но и достаточным условием возможности опери- рования над классами (всё равно, левыми или правыми) и по- строения факторгруппы по данной подгруппе. Чтобы понять это, надо, по существу, повторить с небольшими изменениями преды- дущие рассуждения. Так, если д^Н и д^Н — смежные классы по нормальному делителю Н, то при любом выборе представителей gihi G giH и <72^2 € д2Н будем иметь (51^1)(52^г) = 51(^152)^2- Элемент /1152, принадлежащий правому смежному классу Я52 принадлежит также и левому 52 Я, и следовательно, может быть записан в виде ^152 = 52^1, h[eH. Но тогда (51^1)(52/»2) = 51(52^1)^2 = 5152Л, (Ю.4) где h = h'xh2 G Н. Окончательно получаем, что независимо от выбора представителей их произведение содержится в классе (515г)Я. Поэтому (как и прежде, в случае абелевой группы) ра- венство (10.4) можно и в этой более общей ситуации считать кор- ректным определением умножения смежных классов. При этом снова множество смежных классов образует группу относитель- но определённой над ними операции, правда, уже не обязатель- но коммутативную. Тем самым определена факторгруппа G/H группы G по произвольному нормальному делителю Н. Приве- дём пример. 1 Впервые понятие нормальной подгруппы появилось в исследованиях Га- луа об алгебраических уравнениях (см. главу 14).
178 Глава 10. Оперируем с классами В разложении симметричной группы Sn по знакопеременной подгруппе Ап, как уже отмечалось, имеется ровно два левых смежных класса. Один из них совпадает с самой подгруппой Ап и состоит, следовательно, из всевозможных чётных подстановок, другой имеет вид тАп (т —любая нечётная подстановка) и его элементами являются всевозможные нечётные подстановки. Но таковы же, как нетрудно понять, и правые смежные классы Ап и тАп. Значит подгруппа Ап является нормальным делителем, а факторгруппа Sn/An состоит из двух элементов (классов) Ап и тАп = Апт. Вот как выглядит таблица умножения в этой факторгруппе (табл. 5). Таблица 5. Ап тАп Ап Ап тАп тАп тАп Ап Понятно, таблица лишь отражает то, что произведение двух чётных подстановок всегда снова чётная подстановка (отсюда и равенство Ап • Ап = Ап), произведение чётной и нечётной под- становки — подстановка нечётная (Ап тАп, = тАп • Ап = тАп), и наконец, подстановка, являющаяся результатом перемножения двух нечётных подстановок, чётная (тАп • тАп = Ап). В связи с понятием факторгруппы возникает вопрос. Какие имеются возможности оперирования над классами в других ал- гебраических структурах, например, в кольцах? К тому же его нам подсказывает пример кольца класса вычетов. Ответ в слу- чае произвольного кольца приведёт нас опять к уже знакомому понятию идеала. Вспомним, что в любом кольце мы имеем дело с двумя опе- рациями — сложением и умножением. С ними мы хотим связать также две операции над его классами. Половину нашей задачи можно считать решённой. Ведь относительно сложения кольцо образует абелеву группу — аддитивную группу кольца, поэтому и классы следует строить по старому образцу. А именно, они
Глава 10. Оперируем с классами 179 должны являться смежными классами по некоторой подгруппе J этой аддитивной группы1. Если а и Ь — произвольные элементы кольца К, то сумма соответствующих смежных классов а + J и Ь + J определяется по известному нам правилу (а + 7) + (Ы-/) = (а + Ь) + 7. (10.5) Можно показать, что корректное определение умножения смеж- ных классов возможно тогда и только тогда, когда указанная подгруппа является идеалом. Операцию умножения смежных классов по идеалу определяем по обычной уже для нас схеме. Выбираем произвольные предста- вители в смежных классах а + J и b + J, (10.6) перемножаем их как элементы кольца К, а в качестве произ- ведения классов берём тот смежный класс, в который попало произведение выбранных представителей. Корректность опера- ции (независимость её от выбора представителей) проверяется просто. Представители классов (10.6), как бы мы их не выбира- ли, обязательно имеют вид a + ji и b + j2, где Ji и j2 — некоторые элементы идеала J. Тогда их произведе- ние равно (а + ji)(b + j2) = ab + aj2 + jib + jij2. (10.7) Из определения идеала непосредственно следует, что второе, тре- тье и четвёртое слагаемое в (10.7), а значит, и их сумма принад- лежит J. Но тогда при любом выборе представителей их произве- дение, как и требуется, непременно принадлежит одному и тому же классу ab + J, сама формула перемножения смежных классов приобретает вид (а + J)(b + J) = ab + J. (10.8) 1 В силу коммутативности сложения такая подгруппа автоматически явля- ется нормальным делителем.
180 Глава 10. Оперируем с классами На множестве К/J смежных классов по идеалу J равенства (10.5) и (10.8) определяют, таким образом, операции сложения и умножения. Оставляем читателю проверку того, что выполнены все аксиомы кольца. В проверке, впрочем, очевидной, нуждаются лишь свойства ассоциативности и дистрибутивности. Получен- ное кольцо К/J по аналогии с прежней терминологией называют факторкольцом кольца К по идеалу J. Видимо, не покажется удивительным, что кольцо классов вы- четов Zn легко вписывается в общее понятие факторкольца. В самом деле, рассмотрим в кольце целых чисел Z идеал тЛ и факторкольцо Z/nZ по этому идеалу. Элементами Z/nZ яв- ляются смежные классы, которые записываются в виде г + nZ (г = 0,1,..., п — 1). Понятно, что они в точности совпадают с классами вычетов по модулю п, а правила сложения и умножения смежных классов в этом случае превращаются в уже известные правила действия с классами вычетов. Следовательно, кольцо классов вычетов Zn совпадает с факторкольцом Z/nZ. Конструкция факторкольца позволяет по-новому взглянуть на другие факты. Используя её, можно, например, получить иное, чем прежде, описание поля комплексных чисел. Поступим так: в кольце многочленов й[ж] с действительными коэффициентами рассмотрим многочлен ж2 +1 и идеал J = (ж2 +1), порождённый этим многочленом. Конечно, выбор именно этого многочлена не случаен. Он, как мы знаем, является минимальным многочле- ном для мнимой единицы. Оказывается, факторкольцо К[ж]/7 по указанному идеалу, по существу, совпадает с полем комплексных чисел, точнее сказать, ему изоморфно. Чтобы убедиться в этом, заметим сначала, что в качестве представителя любого смежного класса /(ж) + J можно взять многочлен вида а + Ьх степени не выше первой. В самом деле, при делении /(ж) на ж2 + 1 всегда будем иметь в остатке многочлен степени 1, то есть /(ж) = з(ж)(ж2 + 1) + а + Ьх. (10.9) Равенство (10.9) показывает, что /(ж) и остаток принадлежат одному и тому же смежному классу или, иначе, /(ж) + J = (а + + Ьх) + J.
Глава 10. Оперируем с классами 181 Пусть теперь (ai + bix) + J, (а.2 + bzx) + J (10.10) — произвольные смежные классы. Очевидно тогда, что (ai + bi®) +J + (02 + 62®) + J = ((01 + 02) + (61 + 62)®) + ^- (10.11) Разберёмся с умножением классов (10.10), перемножая для этого их представители: (ai + £>1®)(О2 + ?>2®) = O1O2 + (О1&2 + O2&1)® + &1?>2®2- Вычитая и прибавляя в правой части число 6162 получим (oi + &1®)(О2 + &2®) = («102 - 6162) + (О1&2 + O2&1)® + &1&2(®2 + 1)- Последнее равенство показывает, что ((ai+&l®) + J)((O2+i>2®) + <7) = ((oiO2-blb2) + (aib2 + O2&l)®) + J- (Ю.12) Из формул (10.11) и (10.12) видно, что правила сложения и умно- жения смежных классов (элементов кольца R[s]/J) полностью идентичны правилам действий над комплексными числами. Но тогда соответствие (а + bx) + J —»• а + Ы и будет требуемым изо- морфизмом факторкольца R[®]/J и поля С комплексных чисел. Остановимся ещё на одном важном примере, во. многом анало- гичном двум предыдущим. Будем исходить из кольца F[ar] мно- гочленов над произвольным полем F. Читатель на первых порах может подразумевать под F любое числовое поле. Мы уже от- мечали, что идеалы в кольце F[®] исчерпываются множествами вида g(a:)F[a;], состоящими из всех многочленов, кратных неко- торому фиксированному многочлену д(х). Пусть I = p(a:)F[®] — такой идеал. Попытаемся описать строение факторкольца F[o;]/7, используя для этой цели известные нам сведения о делимости многочленов. По аналогии с предыдущим примером покажем, что, если т — степень g(®), то в качестве представителя в каж- дом смежном классе может быть выбран (причём единственным
182 Глава 10. Оперируем с классами образом) многочлен, степень которого не превосходит т — 1. Чи- татель, видимо, уже понял, как следует для этого поступить. Если f(x) + I — произвольный смежный класс, то рассмотрим остаток г(х), получающийся при делении представителя f(x) на многочлен д(х), порождающий идеал f(x) = s(x)g(x) + r(x). Это равенство, как и 10.9, показывает, что многочлен /(#) и остаток г(х) принадлежат одному смежному классу f(x) + I = r(x) + I, (10.13) причём степень г(х), как это и требуется, не превосходит т — 1. Найдётся ли в смежном классе (10.13) другой многочлен г'(х), степень которого также т — 1? Предположив, что ответ утвер- дительный, мы бы сразу пришли к противоречию — ведь тогда разность г'(я) —т(ж), принадлежащая I, должна была бы делить- ся без остатка на порождающий многочлен д(х). Очевидно, такое невозможно, так как степень разности меньше степени д(х). Итак, запись вида r(x) +1, в которой степень r(x) < m — 1, для всякого смежного класса является единственной. Назовём её канонической, и для краткости обозначим r(x) +1 = г(ж). Остаётся понять, что происходит с каноническими записями при сложении и умножении элементов (смежных классов) фак- торкольца F[x]/I. Если ri(rr) = r\(x) +1 и гг(х) = Г2(х) + I — канонические записи двух смежных классов, то, чтобы получить запись, также каноническую, для суммы и произведения, требу- ется в классах (Г1 (®) + Г2(®)) + I И Г1 (®) Г2(ж) +1 выбрать по представителю степени < т — 1. Ясно, что в первом случае уже сам многочлен ri(x)+r2(x) обладает этим свойством, значит _____ ______ ______________ Г1(ж) + Г2(х) = Г1(я) + Г2(х). (10.14) С другой стороны, степень произведения гх{х)т2(х) может ока- заться большей т — 1, поэтому в качестве представителя кано- нической записи нужно взять, как ясно из предыдущего, остаток
Глава 10. Оперируем с классами 183 г(х) при делении ri(x)r2(x) на д(х). То есть, если ri(x)r2(x) = = з(х)д(х) + г(х), и степень r(x) < т — 1, то ri(®) • Г2(х) = г(х). (10.15) Описанное здесь умножение называется умножением по модулю многочлена д(х), а факторкольцо К/I с правилами операций (10.14) и (10.15) кольцом вычетов по модулю многочлена д(х). Кольцо R[®]/(s2 + 1), изоморфное, как мы установили выше, полю С, является, понятно, одним из примеров применения толь- ко что описанной конструкции. Рассмотрим другой пример, в ко- тором в качестве исходного берется уже нечисловое поле. Он важен тем, что указывает способ получения конечных полей, от- личных от известных нам полей вычетов. Пример. Пусть Zvfx] — кольцо многочленов над полем Z2 (с ко- эффициентами 0 и 1). Выясним, как устроено кольцо вычетов по модулю многочлена х2+я+1, или, иначе %2[х]/(х2+х+1). Все его элементы, как мы знаем, находятся во взаимно однозначном со- ответствии с многочленами, степень которых меньше двух. Таких многочленов ровно четыре: 0, 1, х, х + 1. Столько же элементов и в рассматриваемом кольце вычетов: 0, Т, х, х + 1. Таблицы их сложения и умножения по модулю х2 + х +1 (табл. 6) получают- ся в соответствии с правилами (10.14) и (10.15) (черта в записи классов опущена). Например, х (х + 1) = х2 + х = (ж2 + х + 1) + 1, поэтому х х + 1 = 1. Из таблицы умножения легко, заключить, что каж- дый ненулевой элемент нашего кольца обратим, поэтому оно об- разует поле, состоящее из четырёх элементов. Всегда ли, дей- ствуя подобным образом, мы будем получать обязательно поле? Ответ на этот вопрос отрицательный. И чтобы убедиться в этом, достаточно рассмотреть факторкольцо %2[х]/(х2 + 1). В нём сно- ва 4 элемента, и записываются они так же, как и элементы %2[х]/(х2 + х + 1), однако умножение здесь, конечно, иное. Таб- лица 7 показывает, что в этом случае кольцо вычетов содержит делители нуля и полем не является. Ситуация полностью разъясняется следующей теоремой.
184 Глава 10. Оперируем с классами Таблица 6. + 0 1 X ж +1 0 0 1 X ж +1 1 1 0 ж +1 X . X X ж +1 0 1 X +1 ж +1 X 1 0 X 0 1 X ж +1 0 0 0 0 0 1 0 1 X ж +1 X 0 X ж +1 1 X +1 0 ж +1 1 X Таблица 7. X 0 1 X ж +1 0 0 0 0 0 1 0 1 X ж +1 X 0 X 1 ж +1 ж +1 0 X +1 ж +1 0 Кольцо вычетов Р[ж]/( д(х)) по модулю многочлена д(х) является полем тогда и только тогда, когда д(х) неприводим над полем F. Понятно, что теорема подтверждается нашими примерами. Так, многочлен х2 + х + 1 неприводим над Z2 (почему?). Уже не будет таковым над Z2 многочлен ж2 + 1 = (ж+1)(ж + 1). Имен- но поэтому кольца вычетов Е[ж]/(ж2 + 1) и Хг[ж]/(ж2 + ж + 1) являются полями, а 2г[ж]/(ж2 + 1) — нет. Нетрудно заметить аналогию сформулированной теоремы с по- добным утверждением для колец вычетов по модулю п (глава 9). Эта аналогия распространяется и на метод доказательства. Пред- лагаем читателю самому убедиться в этом.
Глава 10. Оперируем с классами 185 Что касается конечных полей (иначе, полей Галуа), то картина здесь вкратце такова. 1. Число элементов всякого конечного поля есть степень рп некоторого простого числа р. Какова бы ни была эта степень рп, существует поле, содержащее рп элементов. 2. Любые два поля Галуа, содержащие одинаковое число эле- ментов, изоморфны между собой. Первый пункт можно конкретизировать. 3. Всякое поле Галуа с рп элементами изоморфно полю вы- четов Zp[x]/(m(x)) по модулю многочлена т(х) степени п, неприводимого над полем Zp (можно показать, что для лю- бого п такой неприводимый над Zp многочлен всегда суще- ствует). Поле Галуа с рп элементами, единственное с точностью до изоморфизма, обозначают обычно1 GF(pn). Перечисленные фак- ты дополняет следующий красивый результат. 4. Мультипликативная группа всякого поля GF(pn) (т. е. группа по умножению его ненулевых элементов) является цик- лической группой порядка рп — 1. Образующий этой циклической группы называют примитив- ным элементом поля Галуа. Доказательства сформулированных здесь теорем мы вынужде- ны опустить, почти все они не простые. Ограничимся ещё одним примером, который иллюстрирует утверждения 3 и 4. К этому же этот пример нам будет полезен в главе, посвященной кодиро- ванию. Пример. Поле GF(24). Для построения этого поля, как следу- ет из 3, можно использовать неприводимый над Z2 многочлен степени 4. Покажем, что таким многочленом является, напри- мер, х4 + х + 1. Если бы он разлагался на множители меньшей степени, то среди них обязательно нашлись бы многочлен пер- вой или второй степени. Простой перебор показывает2 *, что это невозможно. Таким образом, Z2[x]/(®4 + a: + l) — искомое поле 1 G и F — начальные буквы слов «Галуа» (Galois) и «поле» (field). 2 Достаточно проверить, что х +1 и х2 + х + 1 не являются делителями х4 + х + 1.
186 Глава 10. Оперируем с классами из 16 элементов. Удобно ввести новый символ а, и вместо г(х) = = г (ж) 4- I, где I = (а;4 4- х 4- 1) писать г (а). Это фактически означает, что через а обозначен смежный класс х +1. Перечис- лив все многочлены от а степени 3, мы получим список всех элементов поля 0; 1; 2; а 4- 1; а2 + а; о? 4- 1; а3; а3 + а2; а3 4- а; о? + 1; а3 + а2 + а; а3 + а2 + 1; а3 + а + 1; а3 + а2 + а + 1. Полная таблица умножения в таком поле состояла бы из 256 клеток. Понятно, что мы её не приводим. Однако достаточно на- учиться умножать одночлены 1, а, а2, а3 — ведь всякий другой многочлен есть их сумма. Таблица 8. X а а2 а3 а с? а3 а +1 с? о? а 4-1 а2 4- а о? а 4-1 а2 + а а3 + о? Таблица 8 и служит этой цели (единица из таблицы исключе- на, поскольку умножение на неё ничего не меняет). Например, для отыскания а3 • а2 нужно найти остаток от деления я5 на х4 + х + 1. Имеем х5 = х(х4 + х 4- 1) 4- х2 4- х, поэтому а3 • а2 = а2 4- а. С учетом таблицы 8 мы легко можем перемножить любые два многочлена от а. Например, (а2 + а)(а3 4- а2 + 1) = а5 4- а3 + о? + а4 4- о? 4- а = = (а2 4- а) + а3 4- (а 4- 1) 4- а = о? 4- с? 4- а + 1. Заметим, наконец, что элемент а служит примитивным эле- ментом нашего поля. Действительно, таблица 8 показывает, что его степени аг (г = 0,1,..., 14) исчерпывают все ненулевые эле- менты поля GF(24).
Глава 10. Оперируем с классами 187 Дополнения и задачи. 1. Во многих случаях удобен следующий признак того, что под- группа нормальна. Подгруппа Н С G является нормальной тогда и только тогда, когда для любых g € G и h € Н элемент g~rhg, назы- ваемый сопряжённым к h, также принадлежит Н. Докажите это. 2. Убедиться, что в группе движений плоскости множество всех сдвигов образует нормальный делитель. Покажите также, что если г — сдвиг, a v — поворот на угол а, то сопряжённый эле- мент v~xrv есть сдвиг, направление которого составляет угол а с направлением т. Аналогично, если а — зеркальная симмет- рия относительно некоторой оси, то а~^та — сдвиг, направле- ние которого симметрично направлению т относительно этой оси. Для доказательства удобно использовать комплексные числа (см. дополнение к главе 2). 3. Доказать, что в знакопеременной группе Aj имеется един- ственный нетривиальный нормальный делитель. Он имеет по- рядок 4 и порождён двумя коммутирующими подстановками (12)(34) и (13)(24). 4. Проверьте, что в любой группе G подгруппа Н индекса 2 явля- ется нормальным делителем и факторгруппа G/H — циклическая группа порядка 2. 5. Доказать, что если Hi и Hi — нормальные делители группы G, имеющие тривиальное пересечение (HiCiHi = {е}), то всякий элемент из Hi коммутирует с любым элементом из H%. Указа- ние: рассмотрите элемент где hi € Hi, hi е Н2 и покажите, что он равен е. 6. В теории групп имеется целый ряд конструкций, с помощью которых можно исходя из данных групп строить новые груп- пы. Самыми употребительными из них являются так называемые прямые и полупрямые произведения. Пусть подгруппы Hi и Hi такие же, как в предыдущем пункте. Через Hi х Hi обозначим множество всех элементов вида hih.2, где hi е Hi, hi € Hi. По- кажите, что Hi х Н2 — подгруппа (даже нормальный делитель)
188 Глава 10. Оперируем с классами группы G. В том случае, если группа G = Hi х Hi, она называ- ется прямым произведением подгрупп Hi и Hi, а подгруппы — прямыми сомножителями. Таким образом, всякий элемент д пря- мого произведения записывается в виде д = Л1Л2, hi € Hi, hi € Н%. Убедитесь, что для всякого д такая запись единственна. Пока- жите что строение группы G с точностью до изоморфизма опре- деляется строением её прямых сомножителей. 7. Докажите, что Q* = (—1) х Q+, где Q+ — мультипликативная группа положительных рациональных чисел, (—1) = {1,-1} — циклическая группа, порождённая числом —1. 8. Сохраним все предположения относительно Hi, Hi С G пунк- та 5, отказавшись, быть может, лишь от нормальности одной из подгрупп, например, Hi. В этом случае множество { hih? | hi € Hi, G Hz } образует подгруппу в группе G. Если это множество исчерпывает всю группу G, то последняя называется полупрямым произведе- нием Hi и Hi и обозначается G = Hi/ Hi (верхний «хвостик» у символа / обращён в сторону нормального делителя). В слу- чае полупрямого произведения элементы hi и hi уже не обязаны коммутировать и наряду с записью д = hihi возможна и иная: д = hi hi, где hi € Hi. Для полного описания полупрямого про- изведения уже не достаточно знать устройство сомножителей Hi и Hi. Нужна ещё дополнительная информация иного сорта (о ха- рактере её можно судить по дополнениям к следующей главе). Проверьте, что Sn = (т) / Ап, где т — любая из транспозиций. Ещё один пример полупрямого произведения мы получим, ес- ли в качестве группы G рассмотрим совокупность всех движений плоскости первого рода (переносов и поворотов). Как уже гово- рилось, множество Т всех переносов образует в G нормальный делитель. Пусть далее U множество всех поворотов вокруг неко- торого фиксированного центра. Докажите, что G = U / Т. 9. Пусть G = Hi / Hi. Докажите, что G/Hi = Hi.
ГЛАВА 11 ЯЗЫК СИММЕТРИИ Проявления симметрии в окружающем нас мире поистине необъ- ятны. Мы можем наблюдать её в строении тела человека и жи- вотных, в архитектурных формах, в разнообразнейших орнамен- тах и узорах. Симметричные правильные геометрические фигу- ры, распустившийся цветок, кристалл поваренной соли, снежин- ка. .. Распознать симметричное может всякий, не так легко объ- яснить, однако, что такое симметрия. Ещё сложнее понять, что основные представления, касающиеся симметрии, имеют тесную связь с алгеброй. Не исключено, что даже само упоминание о та- кой связи иному читателю кажется неожиданным. Буквальный перевод с греческого — соразмерность — позволя- ет толковать слово «симметрия» весьма широко. Так симметрию иногда понимают как гармонию пропорций, и в этом смысле мож- но говорить о симметрии также и в живописи, музыке, поэзии. Правда, такой слишком широкий взгляд делает понятие симмет- рии довольно расплывчатым, и почти не поддающимся изуче- нию (по крайней мере, точными науками). Более узкое, но зато и более конкретное, осязаемое представление о симметрии да- ёт, например, такое определение (нечто подобное можно найти в энциклопедических справочниках): симметрия есть правиль- ное, пропорциональное расположение частей в одном предмете. Но и такое объяснение оставляет вопросы — действительно, мож- но лишь догадываться, что означают в нём слова «правильное», «пропорциональное». Вскоре мы увидим, что средствами алгеб- ры можно придать этим словам вполне отчётливый смысл, но
190 Глава 11. Язык симметрии Зеркальная симметрия Центральная симметрия Рис. 22.' сначала вспомним о вещах, хорошо всем известных. Из школьного курса геометрии читателю знакомы понятия зеркальной или осевой симметрий. Этими видами симметрии об- ладают, например, фигуры (это знаки суммы и интеграла), пред- ставленные на рис. 22. На другом рисунке (рис. 23) изображена детская вертушка, ко- торая не обладает ни осевой, ни центральной симметрией; однако этой фигуре присущ другой её вид, так называемая поворотная симметрия. Вертушка совмещается сама с собой при повороте на 120° и 240°. Поворотной симметрией обладают также правильные многоугольники. Каждый такой многоугольник самосовмещается (переходит в себя) при поворотах вокруг своего центра на углы, кратные 2тг/п где п — число сторон многоугольника. В отличие от вертушки, правильный n-угольник имеет и оси симметрии — их столько же, сколько и сторон. Пожалуй, «самой симметрич- ной» из плоских фигур следует признать круг —он переходит в себя при повороте на любой угол, и всякая прямая, проходя- щая через его центр является его осью симметрии. Мы пришли к тому, что «количество симметрии» (позволим себе такое выра- жение), которым обладает фигура, естественно измерять числом преобразований плоскости, самосовмещающих эту фигуру. При этом рассматривается, конечно, только такие преобразования, ко- торые не нарушают целостность фигуры, т. е. сохраняют неиз- менными расстояния между любыми её точками. Мы и будем поэтому говорить здесь лишь о тех преобразованиях плоскости, которые обладают этим свойством по отношению к любым двум
Глава 11. Язык симметрии 191 её точкам. Такие преобразования были названы нами движени- ями (см. дополнения к главе 2). Множество G всех движений, самосовмещающих фигуру, может служить характеристикой не только «количества», но и типа симметрии этой фигуры. Чтобы это понять, мы должны обратиться к хорошо нам знакомой опе- рации композиции преобразований. Здесь мы вновь выходим на алгебраическую тропу. Дело в том, что множество G самосовме- щений любой фигуры образует группу — строение этой группы как раз и определяет тип симметрии фигуры. Проверка группо- вых аксиом не вызовет трудностей (предоставляем её читателю). Группа G движений, самосовмещающих данную фигуру, назы- вается группой симметрии этой фигуры. Так, группа симметрии вертушки (рис. 23) состоит из трёх элементов: тождественного преобразования (поворота на 0°) и поворотов на 120° и 240°. В главе 2 было фактически дока- зано, что всякое движение плоско- ' сти есть либо поворот вокруг неко- /W.*’ торого центра, либо зеркальное от- ражение, либо сдвиг, либо скользя- щее отражение (комбинация сдвига и отражения). Значит и группа сим- метрии любой плоской фигуры мо- жет содержать лишь эти четыре ви- рис 24. да преобразований. Если же фигура вдобавок имеет ограниченные размеры, то остаются лишь пер- вые два: поворот и зеркальная симметрия. Причина понятна. Ведь, если, например, сдвиг / содержится в группе симметрии, то и преобразования /п (итерации этого сдвига) также должны в ней содержаться. Однако, если / сдвигает все точки фигуры на расстояние а, то преобразование fn — уже на расстояние па (рис. 24). Получается, что при многократном повторении преобразова- ния f мы можем сдвинуть фигуру на сколь угодно большое рас- стояние, оставляя её при этом самосовмещённой саму с собой. Очевидно, что это невозможно, если размеры фигуры ограниче- ны. По той же причине в группе симметрии такой фигуры не могут содержаться и скользящие симметрии.
192 Глава И. Язык симметрии Сказанное позволяет легко находить группы симметрий плос- ких фигур. Возьмём в качестве простого, но типичного примера правильный треугольник (рис. 25). Из всевозможных поворотов плоскости имеется (как и у вер- тушки) только три, совмещающих треугольник с самим собой, — это повороты на углы 0° (тождественное преобразование), 120°, 240° вокруг центра треугольника. Обозначим их соответственно vq, vi, V2- Точно так же, лишь три зеркальных отражения отно- сительно осей симметрии треугольника AD, BE, CF приводят его к самосовмещению, — обозначим их oi, стг, аз- Таким обра- зом, группа симметрии правильного треугольника (обозначим её D3) содержит 6 преобразований, иначе, её порядок равен 6. Ясно, что совершенно иной тип симметрии у фигуры, изображённой на рис. 26, однако и её группа симметрии также состоит из шести элементов — вращений на углы 0°, 60°, 120°, 180°, 240°, 300°. Не следует ли отсюда, что группа симметрии не всегда «улав- ливает» тип симметрии данной фигуры? К счастью, это не так. Действительно, хотя порядки обеих групп одинаковы, но группы эти не изоморфны. Группа симметрии второй фигуры цикличе- ская, и вращение на угол 60° является её образующим. Не такова группа правильного треугольника: каждое из его нетривиальных вращений гц,г>2, очевидно, имеет порядок 3, что же касается эле- ментов ах,аз,аз, то их порядок равен 2 (дважды выполненное зеркальное отражение приводит к тождественному преобразова- нию). Следовательно, ни один из перечисленных элементов не может служить образующим группы D3. Группа D3 несёт в себе черты, присущие группам симметрии плоских фигур, поэтому любопытно остановиться на некоторых
Глава И. Язык симметрии 193 подробностях её строения. Можно убедиться непосредственно (или используя одно из утверждений дополнения 10 к главе 2), что CT1V1 = ff2, CT1V2 = <Т3, (111) т. е. последовательное выполнение сначала поворота, затем зер- кального отражения приводит также к зеркальному отражению, но относительно оси, повёрнутой на соответствующий угол. Произведение же двух зеркальных симметрий есть уже пово- рот, например, <71 <72 = Vi, СТ2<71 = V2, (И-2) Пользуясь указанными соотношениями и им аналогичными, чи- татель легко составит умножения для группы £>3 (заметим, что она не абелева). Однако возможно и более компактное её опи- сание. В самом деле, из сказанного выше следует, что все 6 элементов группы симметрии могут быть записаны в виде про- изведений (11.3) где е = 0, 1; а = 0, 1, 2. Так, при е = 0 получаем vi=vo = e, vi, vj = v2, (11.4) а при е — 1 aivo, (Tivi = а2,, ffivj = CT1V2 = ст3. (11.5) На языке теории групп отмеченное обстоятельство выражают словами: группа _О3 порождена двумя элементами <71 и vi, а сами эти элементы являются её образующими1. Изучая симметрию, мы заодно познакомились с таким спо- собом задания группы (он возможен для многих более сложно, чем £>3, устроенных групп), при котором для оперирования над её элементами вовсе нет необходимости прибегать к достаточно 1 Таким образом, в отличие от циклической группы у £>з не один, а два образующих. 7 — 261
194 Глава 11. Язык симметрии громоздкой таблице Кэли. Обойтись без неё в нашем конкрет- ном примере мы сумеем, если заметим, что между образующими имеются простые соотношения 2 —12 viai = = aivT , = ai^i. (11.6) Читатель без труда сумеет проверить эти равенства и может так- же убедиться (это чуть сложнее), что каждое из них являет- ся следствием другого. С учётом соотношений (11.6) и равенств а? = vf = е, умножение любых двух элементов группы £>з про- изводится без затруднений. Например: <г2аз = (trivi)^!^) = ffi(viffi)vi = ai(aiv?)v? = = vlf (П.7) V202 = Vi(CTlVl) = (V1<T1)V1 = (fflVl)^! = (Ti^ = <73. (11.8) Очень много общего с группой D3 имеет группа симметрии Dn правиль- ного многоугольника с произвольным числом сторон п. Эта группа (она на- зывается группой диэдра степени п) СОДерЖИТ РОВНО П ПОВОРОТОВ Vq,V1,... ...,Vk,...,vn-i на углы 2тг 2тгк 2тг(п — 1) и, ,..., ,..., п п п и столько же зеркальных симметрий Нис- 2Л <71, аг,..., ап относительно осей, прохо- дящих соответственно через вершины Al, А2,..., Ап (рис. 27). Таким образом, порядок группы диэдра равен 2п. Как и преж- де (сравните с равенствами (11.3)), все зеркальные отражения получаются как комбинации <71 и соответствующих поворотов: <72 = <4VI, (73 = <71^2 = <71^1, <?п = O-iVn-i = <71Vi-1 (11.9)
Глава 11. Язык симметрии 195 Поэтому, как и выше, каждое преобразование из Dn записыва- ется в виде1 <Т1У1, где е = 0, 1; а = 0, 1, 2,..., п — 1. (11.10) Нелишне отметить, что все повороты образуют подгруппу Vn ин- декса 2 в группе диэдра, а следовательно (см. дополнение к главе 10), и нормальный делитель симметрии же, как показывают ра- венства (11.9), — смежный класс по этой подгруппе. Итак группа Dn для любого п имеет, как и для п = 3, два об- разующих <71 и vi, которые по-прежнему связаны соотношением Vl<71 = <71 vj"1 = <7iv”-1 (11-И) и следствиями из него v“<7i = <Titifa = <Tiv”-a, а = 1, 2,..., п — 1. (11.12) Равенства af = е, v? = e. (11.13) вместе с (11.12) образуют, как можно показать, так называемую систему определяющих соотношений группы Dn, т. е. таких, из которых следуют все прочие соотношения, выполненные в груп- пе. Используя (11.12) и (11.13), можно производить вычисления группе Dn при любом п столь же просто, как и в случае п = 3. Тот факт, что Dn имеет образующие ai и vi, обозначим по аналогии с циклической группой, записью Dn = (<7i,t?i). Подоб- ная запись используется для указания образующих произволь- ных групп. Интересно/ что группами диэдра Dn и их подгруппами Vn, со- стоящими из поворотов, исчерпываются любые мыслимые груп- пы симметрии плоских фигур ограниченных размеров2 (доказа- тельство см. в дополнении). Это на первый взгляд может по- казаться странным, потому что даже на глазок многообразие 1 Нетрудно убедиться, что запись указанного вида для каждого элемента группы Dn единственна. 2 Тут нужна оговорка — речь идёт о фигурах, группа симметрии которых конечна. 7»
196 Глава 11. Язык симметрии таких симметричных фигур на плоскости гораздо «обширнее», чем список упомянутых групп Dn и Vn. Всё же ошибки здесь нет по той простой причине, что многие из внешне различных фигур (вспомните снежинки и шестиугольники) обладают оди- наковым типом симметрии. Алгебраическим эквивалентом это- го типа и является как раз строение соответствующей группы Dn или Vn. Добавим к этому, что любую ограниченную сим- метричную фигуру (узор) с конечной группой симметрии мож- но «сконструировать» подобно тому, как это делается в калей- доскопе, с помощью групп вращений или диэдра, чтобы пояс- нить это, нам будет удобен термин «мотив». Им часто пользу- ются специалисты, изучающие проявления симметрии и её зако- ны в самых различных областях (математике, физике, химии, кристаллографии и т.д.). Мотив —это и есть та часть (сама не обязательно симметричная) симметричного объекта, за счёт правильного повторения которой и создаётся ощущение сим- метрии. Неодинаковые «одежды» фигур или иных предметов, сходных по типу симметрии, мы можем объяснить теперь тем, что различие в исходном мотиве сочетается у них с одинако- вым законом (регулируемым группой) правильного чередования мотива. Выбирая тот или иной мотив (здесь всё зависит от нашей фантазии) и же- лаемую группу Vn или Dn, мы можем ) создать любой доступный воображению / узор. Для этого нужно лишь применить \ преобразования из группы к избранному мотиву, получающаяся при этом фигу- ра и будет иметь исходную группу своей У/о\ j\l группой симметрии. На рис. 28 изобра- жён мотив («аккуратно» разбитый жбан) —]- и ниже — узор, полученный из него с по- мощью группы Рю и не лишенный неко- торой прихотливости. От симметричных фигур ограничен- ных размеров перейдём теперь к потен- Рис 28. циально бесконечным узорам (их назы-
Глава 11. Язык симметрии 197 Рис. 29. вают орнаментами), в которых повторение мотива достигается не только с помощью поворотов и отражений, но.также посред- ством сдвигов и скользящих отражений. Ясно видно различие между двумя орнаментами, изображёнными на рис. 29. Группа симметрии первого из них содержит сдвиги лишь в одном на- правлении, такие орнаменты мы назовём линейными или короче бордюрами. Другой же орнамент допускает параллельные переносы в двух различных (неколлинеарных) направлениях, орнаменты такого рода называются плоскими или сетчатыми. И в том и дру- гом случае возможна полная классификация, подобная той, ко- торую мы уже указали для узоров ограниченных размеров. Уди- вительно, что множество различных типов (т. е. имеющих раз- личные группы симметрии) орнаментов конечно. Можно ука- зать даже точные числа. Всего имеется 7 различных типов бор- дюров, и несколько богаче, как, впрочем, и следует ожидать, многообразие типов плоских орнаментов — их 17. С некоторы- ми оговорками это означает, что исходя из заданного мотива мы можем построить ровно 7 различных бордюров и ровно 17 различных плоских орнаментов с тем или иным законом повто- рения исходного мотива. Хотя искусство орнамента и является одним из древнейших искусств, но выяснение упомянутых фак- тов относится лишь ко второй половине XIX века. Не менее поражает то, что все типы орнаментов (7 и 17) -были экспери- ментально открыты уже в Древнем Египте фантазией тамошних художников-декораторов. Работа выдающегося русского геометра и кристаллографа Е. С. Фёдорова (1853-1919), в которой впервые была дана полная классификация орнаментов, подтвердила, что египтяне в этой области знали действительно всё. Попытаемся теперь представить себе, каким путём может быть получена эта классификация. В дальнейшем речь будет идти
198 Глава 11. Язык симметрии Т г(А) Т'(А) А Т(А) Т2(А) т“(А) Т'(А) ---•— • • • • • •— w —•— ** -а а Рис. 30. только о плоских орнаментах1, поэтому эпитет «плоский» мы ча- сто будем опускать. Между тем другой эпитет, «сетчатый», указывает на связь орнаментов этого типа с простым геометрическим понятием сет- ки или решётки точек на плоскости. Такую решётку мы можем получить следующим образом. Возьмём произвольную точку А на плоскости и будем действовать на неё всевозможными пере- носами, содержащимися в группе симметрии орнамента (напом- ним, что они образуют подгруппу). Структура образующегося при этом множества S очень проста, и чтобы разобраться в ней, поступим так. Среди всех переносов выберем тот, который сдви- гает исходную точку на вектор а наименьшей возможной длины (обозначим этот сдвиг через т). Множество точек, получающих- ся при итерациях сдвига т и обратного к нему преобразования т-1 (т. е. преобразованиях тп, где п е Z), состоит; очевидно, из равноотстоящих точек прямой, параллельной вектору а (рис. 30). Среди сдвигов, имеющих иное направление (они обязательно име- jJ-r ются), вновь выберем такой перенос | т а, который сдвигает точку А на век- __ — — тор b наименьшей длины. Множе- ______ ство точек am(A) (т G Z) имеет """ __1— — ту же структуру, что и предыдущее. Ясно, что в подгруппе переносов на- N Т ряду с преобразованиями тп и <rm содержатся и их комбинации тпат. рис Порядок перемножения здесь не ва- жен, поскольку как преобразование тпат, так и аттп представ- ляют из себя сдвиг на вектор па + mb (рис. 31). 1 Краткая информация о бордюрах имеется в дополнении.
Глава 11. Язык симметрии 199 Таким образом, действуя на точку А всевозможными преобра- зованиями указанного вида, мы получим множество точек, рас- положенных на векторах а и Ь и заполняющих всю плоскость так, как это показано на том же рис. 31. Это множество и называется плоской решёткой или сеткой (термин «сетка» лучше, впрочем, относится к множеству прямых, соединяющих точки решётки). Покажем, что полученная решётка исчерпывает всё множество S, здесь-то мы и воспользуемся специальным выборов переносов тп и от. Одновременно мы покажем, что подгруппа переносов не содержит никаких иных преобразований, кроме тпат (п,т G Z). Предположим, что в исходной группе симметрии имеется сдвиг д, переводящий точку А в некоторую другую точку В, не принадлежащую решётке. Среди всех её точек рассмотрим ту точку С, которая является ближайшей к В. Тогда для некоторых а,(3 € Z, точка С = та<г?(А). Применим в таком случае к исход- ной точке А преобразование / = (т“ст^)-1р. Получающаяся при этом точка В' = f(A), окажется, как нетрудно понять, в парал- лелограмме с вершиной А и по отношению к последней займёт такое же положение, каково положение точки В относительно С. Из неравенства |А,9| |АТ|, вытекающего из определения сдвигов тп и ат, очевидно следует тогда, что |АВ'| < |AS|. (П.14) С другой стороны, перенос / как произведение преобразова- ний из группы симметрии также принадлежит этой группе, в то же время неравенство (11.14) показывает, что он сдвигает точку на меньшее расстояние, чем а. Это противоречит выбору ст, а по- лученное противоречие доказывает, что множество S совпадает с решёткой на рис. 31. Для всякого орнамента решётка явля- ется своего рода каркасом, на котором на- низывается повторяющийся мотив. К тому же она, как понятно из предыдущего, поз- воляет указать все переносы, самосовме- щающие заданный орнамент. Ими являют- ся сдвиги на любой из векторов, соединя- ющих две произвольные точки решётки.
200 Глава 11. Язык симметрии В группе симметрии орнамента, как уже отмечалось, переносы могут соседствовать с поворотами и зеркальными отражениями. Оказывается, решётка содержит в себе немалую информацию и о том, какими могут быть эти «соседи». В самом деле, если некоторый поворот или отражение самосовмещают орнамент, то и решётку этого орнамента они должны переводить саму в себя. Это накладывает довольно жёсткие ограничения на возможные в группе симметрии повороты и отражения. Разглядывая орна- менты на рис. 40 (с. 206), мы не обнаружим ни в одном из них центров поворота, порядок которых был бы отличен от 2, 3, 4, 6. Это обстоятельство отнюдь не является случайным, — то же самое, оказывается, справедливо и для любого мыслимого орна- мента. Чтобы это понять, предположим, что некоторая точка А его решётки является центром поворота порядка п. Поворот на угол 2тг/п вокруг точки А приведёт тогда к самосовмещению ре- шётки, поэтому всякая её точка В перейдёт в точку В', снова ей принадлежащую (рис. 33). Рис. 33. Если в качестве В выбрана ближайшая к А точка решётки, то при п > 6 мы сразу получим противоречие этому выбору. В самом деле, \В'В\ = 2|AB|sin^ < ^ABI < у|АВ| < |АВ|. Но тогда |АВ"| = |ВВ'| < |АВ|, и следовательно, точка В" (оче- видно, принадлежащая решётке) вопреки предположению ока- жется к точке А ближе, чем В. Легко исключается и единствен- ный оставшийся случай п = 5. На рис. 34 изображён центр по-
Глава 11. Язык симметрии 201 ворота А указанного порядка. Если существует решётка, содер- жащая точку А, то она обязана вместе с ней и близлежащей к А точкой В содержать и повёрнутые точки С, D, а тогда и точку Е — четвёртую вершину параллелограмма, построенного на от- резках ВС и CD. Вполне понятно, что последняя снова, вопреки предположению, отстоит от центра поворота А на меньшее рас- стояние, чем точка В. Итак, возможный список групп, образованных поворотами то- го или иного орнамента вокруг фиксированного центра, невелик, он исчерпывается следующими пятью группами: Vi, V2, V3, V4, V6. (11.15) Vi состоит лишь из тождественного преобразования — поворо- та на нулевой угол). Если же точечная группа орнамента (так называют группы, оставляющие неподвижной некоторую точку) кроме поворотов содержит ещё и отражения относительно осей, проходящих через центр поворота, то она может быть лишь одной из следующих групп диэдра: Di, D2, D3, D4, Dq. (11.16) Мы увидим, что каждый из де- сяти случаев (11.15) и (11.16) мож- но воплотить в плоском орнамен- те. Иначе, для любой из десяти групп существует орнамент, точеч- ная группа которого для подходя- щей точки совпадает с заданной. Но сначала вернёмся к решёткам. Каж- дая из них представляет из себя в некотором роде простейший орна- мент, в качестве исходного мотива которого выбрана точка. Есте- ственно поэтому, что они поддаются и более простой классифи- кации, чем произвольные орнаменты. Нетрудно увидеть, что любая данная решётка обладает цен- тральной симметрией относительно середины отрезка, соединяю- щего любые две точки. На рис. 35 соответствующие центры сим- метрии выделены кружками. Решётка называется общей, если
202 Глава 11. Язык симметрии её самосовмещения исчерпываются параллельными переносами и только что указанными центральными симметриями. Можно показать, что так будет в том и только том случае, когда величи- ны двух её минимальных сдвигов т\ и Т2 различны и угол между ними отличен от 60° и 90°. Предположим теперь, что решётка имеет ось симметрии и пре- образование ai — отражение относительно этой оси. Здесь воз- можны два случая — оба они представлены на рис. 36. Рис. 36. В первом из них какая-то из осей симметрии (прямая АВ) совпадает с одной из прямых параллелограммной сетки. Ясно, что в этом случае решётка должна быть прямоугольной. При этом, если v — центральная симметрия относительно точки О, то 02 = oiv является зеркальным отражением относительно прямой CD, пер- пендикулярной АВ. Во втором случае (рис. 36 б)) ни одна из осей симметрии не ле- жит на прямых параллелограммной сетки. Следовательно, каж- дая из осей должна разбивать всякий пересекаемый ею паралле- лограмм на две зеркально симметричные части. Нетрудно уви- деть, что такое возможно лишь, если каждый параллелограмм решётки является ромбом, а ось симметрии проходит через его диагональ. Мы приходим к так называемой ромбической решёт- ке. Заметим, что и этом случае группа симметрии содержит зер- кальные симметрии <71 и <?2 относительно перпендикулярных осей
Глава 11. Язык симметрии 203 (например, EF и KL), причём снова <72 = <71V. Группы прямоугольной и ромбической решёток отличны от группы симметрии общей решётки. Последняя в качестве сво- их точечных подгрупп содержит лишь группы V2, в то время как группа симметрии решёток, изображённых на рис. 36, содержит группы Z>2- Предположив существование центров поворота 4-го порядка, мы придём к квадратной решётке, которая сочетает в себе свой- ства прямоугольной и ромбических решёток. Она содержит сдви- ги в двух взаимно перпендикулярных направлениях, и в то же время величины минимальных из этих сдвигов равны. Действи- тельно, если v — вращение на угол тг/2 вокруг центра поворота, а л — минимальный сдвиг в одном из направлений, то 72 = 71V — сдвиг той же величины в перпендикулярном направлении. Применяя к произвольной точке О решётки преобразования 7^ (а,Д€2) мы, как обычно, получим все другие точки решётки, которая и окажется квадратной (рис. 37). Отметим, что решётка инва- риантна не только относительно группы V4, но и относительно более широкой группы диэдра D4, состоящей из четырёх вра- щений (на углы 0, тг/2, тг, Зтг/2) вокруг пройзвольной точки О решётки, и четырёх отражений (оси этих отражений, проходящие через точку О, показаны на рис. 37). Ещё только один случай не охвачен предыдущими, рассмотре- ниями. В самом деле, пусть группа симметрии решётки содержит группу V3 = (v), где V — поворот на 2тг/3 вокруг некоторого центра поворота. Вновь, если 71 — минимальный сдвиг в одном из направлений, то 72 = 71V
204 Глава И. Язык симметрии Рис. 38. — такой же величины сдвиг в направлении, составляющем с ис- ходным угол 2тг/3 (см. рис. 38, на котором а\ и аг —векторы, соответствующие параллельным переносам ri и тг). Но тогда группа симметрии решётки должна содержать пере- нос Т = Т1Т2 — его вектором является а — ai + аг, составляющий угол тг/З со слагаемыми. Действуя на любой узел преобразованиями (а,/3 е. Z) мы получим так называемую шестиугольную решётку (рис. 39). Решётка содержит центры пово- ротов 6-го порядка (узлы решёт- ки), 3-го порядка (центры правиль- ных треугольников) и 2-го порядка (середины отрезков, соединяющих соседние узлы решётки). Точечная группа, самосовмещающая решёт- ку и оставляющая неподвижным её узел,— это группа D§. Группы Г>з и £>2 совпадают с теми точечными группами, которые оставляют непо- движными центры поворотов соответственно 3-го и 2-го порядка. Наша классификация решёток и соответствующих групп сим- метрии закончена. Её итог — 5 типов решёток и 5 групп, являю-
Глава И. Язык симметрии 205 щихся их группами симметрии. Абстрактное строение этих групп рассматривается в дополнении. Напомним теперь, что группа симметрии произвольного орна- мента должна сохранять его решётку. Иными словами, всякая та- кая группа непременно является подгруппой в группе симметрии решётки того или иного типа, причём такой, которая содержит сдвиги в обоих направлениях. Детальный анализ (он выходит за рамки нашей книги) показывает, что в перечисленных 5 типах групп имеется в общей сложности 17 неизоморфных подгрупп, содержащих неколлинеарные сдвиги. При этом каждая из них может быть реализована в некотором орнаменте (т. е. является его группой симметрии). Схемы всех 17 плоских орнаментов при- ведены на рис. 40. При построении их использован однотипный мотив — окрашенный в чёрное треугольник. Орнаменты 1 и 5 на рис. 40 не содержат ни осей симметрии, ни центров поворота, иначе говоря их точечные группы тривиальны (совпадают с Vi). Но второй, в отличие от первого, выдерживает скользящую симметрию, это обстоятельство вызывает отличие и абстрактного строения их групп. Орнаменты 4 и 6 на рис. 40 уже обладают осями симметрии, и их группы содержат подгруп- пы D\ по одной для каждой оси, но не содержат никаких иных подгрупп из списка (11.15), исключая, конечно, тривиальный слу- чай группы Vi. Парой взаимно перпендикулярных осей симметрии обладают орнаменты 8, 10, а их группы симметрии содержат подгруппы, совпадающие с £>2- В таблице 9 приводится полная информация о том, какие подгруппы из (11.15)>и (11.16) содержатся в группах симметрии каждого из 17 орнаментов1. Ещё больший интерес (не только математический, но и прак- тический) представляет задача классификации «пространствен- ных орнаментов». Хотя такие орнаменты и не используются в де- коративном искусстве, но они встречаются в природе. С давних времён воображение людей поражали строгие геометрические 1 При рассмотрении этой таблицы читатель должен иметь в виду, что неко- торые из групп (11.15) и (11.16) содержатся в других группах этого списка. Так что, если группа симметрии обладает, например, подгруппой £>4, то автомати- чески она содержит и группы 14, £>2, 14-
206 Глава 11. Язык симметрии нн 2) 3) jWlWVTV лмЛплл 4) 5) 6). 7) 8) 9) ♦♦♦♦ хххх хххх хххх хххх 10) 13) 14) 15) 16) 17) Рис. 40.
Глава 11. Язык симметрии 207 Таблица 9. Тип орнамента Точечные группы 1,5 И 2, 9 v2 4, 6 Di 7 Dt,V2 3 v4 8, 10 d2 Тип орнамента Точечные группы 11 £>2,^4 12 d4 13 V3 14 V6 15, 16 D3 17 D6 формы кристаллов, в которых воплощались самые разнообраз- ные и причудливые виды симметрии (рис. 41). Чем объясняются эти столь совершенные формы, что управляет их многообразием и как велико это многообразие — такими вопросами задавались многие учёные. Лишь постепенно было выяснено, что внешняя симметрия кристаллов вызвана особенностями внутреннего стро- ения кристаллического вещества, правильностью пространствен- ного расположения составляющих его молекул и атомов. Оказалось, что атомная структура кристаллов сродни решётке, только уже не плоской, а пространственной. Устройство таких решёток для кристаллов поваренной соли и алмаза показано на рис. 42. Кристаллическая решётка образует для вещества кристалла каркас, подобно тому, каким плоская решётка является для по- строенного на ней орнамента. Важнейшие свойства кристалличе- ских решёток, от которых и зависит симметрия кристалла, могут быть охарактеризованы чисто математически. Множество точек пространства называется правильной про- странственной системой точек, если выполняются следующие свойства: 1. Любую точку системы можно перевести в любую другую её точку с помощью движения, совмещающего систему с собой.
208 Глава 11. Язык симметрии Рис. 41. 2. Всякий шар конечного радиуса содержит лишь конечное множество точек системы. 3. Существует такое положительное число г, что всякий шар радиуса г содержит хотя бы одну точку системы.
Глава И. Язык симметрии 209 Рис. 42. Нетрудно понять, что рассматривавшиеся выше решётки плос- ких орнаментов удовлетворяют всем этим требованиям, если только в пунктах 2 и 3 слово «шар» заменить словом «круг». Иными словами, плоские решётки образуют правильные систе- мы точек на плоскости. На первый взгляд может показаться, что список свойств 1, 2, 3 слишком скромен для того, чтобы из него можно было бы вы- вести какие-то суждения о возможных формах симметрии кри- сталлов и тем более полностью обозреть все эти формы. Однако это не так. Детальный анализ, который впервые полностью про- вёл русский ученый Е. С. Фёдоров, показал, что в пространстве (как и на плоскости) имеется лишь конечное число существенно различных правильных систем точек, и каждая из них отвечает реально встречающейся в природе кристаллической структуре, полностью исчерпывая всё многообразие таких структур1. Выяс- нилось, что имеется 230 возможностей, в которых реализуются все природные формы симметрии кристаллов. Обозрение и клас- сификация этих возможностей основывались, как и в случае ор- наментов, на рассмотрении групп симметрии кристаллических решёток2, или иначе, правильных систем точек в пространстве. 1 Результаты Е. С. Фёдорова были опубликованы в 1890г. в книге «Симмет- рия правильных систем фигур». К этому же открытию несколько позже (1891) пришёл немецкий математик А. Шёнфлис. 2 Т. е. групп движений пространства, совмещающих решётку саму с собой.
210 Глава 11. Язык симметрии Эти группы называются фёдоровскими или кристаллографиче- скими группами. Их полное описание и позволило окончательно разобраться со всеми видами симметрии, присущими кристал- лам. Подробный вывод и перечисление всех фёдоровских групп даже и сейчас требует не одного десятка страниц. Подобно то- му, как для описания плоских движений применяются комплекс- ные числа, здесь могут быть использованы кватернионы. Полезен также и аппарат линейной алгебры (краткие сведения о ней — в главе 13). Дополнения и задачи. 1. Докажем утверждение, упомянутое в основном тексте: если группа симметрий G плоской фигуры конечна, то для некоторого п она совпадает с одной из групп Vn или' Dn. Во-первых, как уже отмечалось, такая группа G может содер- жать лишь повороты и зеркальные отражения. Установим после- довательно несколько простых фактов. 1) Если v — произвольный поворот из G, то его угол а обяза- тельно имеет вид а = 2тгг, где г € Q. Действительно, для некоторого п vn = е — тождественное преобразование, тогда угол па обязан быть кратным 2тг: па = 2тгг • п = 2тгт, для некоторого m 6 Z. Из последнего равенства и следует, что г = т)п является числом рациональным. 2) В группе G должен существовать поворот на наименьший положительный угол. Если это не так, то можно указать бесконечную убывающую последовательность положительных чисел ai, а2, , члены которой являются углами поворотов Vl, V2,..., Vk,.
Глава 11. Язык симметрии 211 очевидно, различных. Понятно, что это противоречит конечности группы G. 3) Если v — поворот на наименьший положительный угол а, то угол любого другого поворота кратен а. Пусть и — произвольный поворот на угол /3. Для чисел а и (3 непременно найдется такое целое к, что ка < /3 < (к + 1)а f Рассмотрим тогда преобразование из G, равное uv~k. Ес- ли /3 > ка, то это преобразование есть поворот (см. дополнение к главе 2) на угол /3 — ка, очевидно, меньший, чем а, что невоз- можно. Поэтому (3 = ка. Заметим теперь, что поворот и должен иметь тот же центр, что и V. В противном случае uv~k являлось бы сдвигом на ненулевой вектор, а преобразований такого типа группа G не содержит. Итак, и и v — повороты вокруг общего центра и тогда uv~k = е — тождественное преобразование, а значит и = vk. В итоге доказано, что множество всех поворотов группы G образуют циклическую группу (у) состоящую из вращений vk вокруг фиксированного центра. Если порядок поворота v равен п, то ясно, что угол а = 2тг/п, множество всех поворотов, содержащихся в G совпадает с Vn. В том случае, когда группа G не содержит зеркальных отра- жений, справедливо равенство G = Vn. Пусть, наконец, о — зеркальная симметрия относительно оси, содер- жащейся в G. Тогда преобразования . avk, к = 0, 1,, п — 1. — также зеркальные симметрии от- носительно осей, повернутых на со- ответствующие углы. Нетрудно убе- диться, что других зеркальных отражений группа G не содержит. Отсюда следует, что G = Dn. 2. На рис. 43 приведены всевозможные типы (их семь) одномер- ных орнаментов — бордюров. Выясните, какие движения входят Рис. 43. L Z
212 Глава 11. Язык симметрии в группу симметрии каждого из них. Попробуйте описать аб- страктное строение группы симметрии каждого из них. Напри- мер, группа бордюра 1 содержит лишь переносы и изоморфна бес- конечной циклической группе (т), где т — наименьший перенос на величину а. А группа симметрии бордюра 2 кроме переносов содержит ещё отражения относительно осей, перпендикулярных направлению переноса. Если а — одно из таких отражений, т, как и выше, наименьший перенос, то группа симметрии порождена этими двумя элементами, G = {r,a), (11.17) а её определяющие соотношения таковы: а2 = е; а~хта = г-1. (11.18) Можно сказать также, что G есть полупрямое произведение (см. дополнение к главе 10) (ст) X (т) циклической группы (ст) порядка 2 и бесконечной циклической группы (т), причём ст-1тст = т-1. 3. Рассмотрим более подробно устройство групп симметрии неко- торых из рассмотренных в основном тексте плоских решёток. Сначала общая решётка. Её группа G, кроме двух неколли- неарных переносов п и Т2 и всевозможных произведений т^т^2 содержит ещё, как упоминалось, центральные симметрии (пово- роты на 180°). Пусть v — один из таких поворотов вокруг неко- торого узла решётки (рис. 35, с. 201). Тогда для любого сдвига г комбинация vt — снова поворот, на рисунке это поворот вокруг точки А, являющейся серединой отрезка; соединяющего узлы О и В = т-1(0) решётки. Таким путём можно получить повороты вокруг любого из центров симметрии общей решётки, т. е. все они записываются в виде VT = VT^T^2. Остальные элементы группы G, очевидно, являются переноса- ми т = т"1^2. Сказанное означает, что преобразования v,ti,T2 являются образующими рассматриваемой группы: G= (v,ti,t2).
Глава 11. Язык симметрии 213 Для полного задания G необходимо ещё указать её определяю- щие соотношения. Приведём их список: v2 = е Т1Т2 = Т2Т1 -1 -1 -1 (П19) V T\V = т\ V T2V = т2 Первые два соотношения понятны, проверку остальных предо- ставляем читателю. Равенства (11.19) позволяют находить про- изведения любых элементов группы G, каждый из которых, как мы уже выяснили, допускает запись где е = 0 или 1; ai,ai2€Z. (11.20) Например, (Т1 T2)(VT\T2 ) = = vr^1r2. Нетрудно убедиться, что запись (11.20) для всякого преоб- разования решётки единственна, а группа G есть полупрямое произведение G = (и) X (ti,t2) , в котором (у) — циклическая группа порядка 2, a (ti,T2) —пря- мое произведение двух бесконечных циклических групп. Группа симметрий прямоугольной решётки устроена несколько сложнее. Докажите, что она порождена четырьмя преобразованиями: пере- носами ri и Т2 в двух взаимно-перпендикулярных направлениях и двумя зеркальными симметриями cti и <Т2 относительно осей, перпендикулярных направлениям п и т2 соответственно. То есть в этом случае G= (<Т1,СГ2,Т1,Т2) . Докажите также, что определяющие соотношения группы G сле- дующие: а1 = а2 = е> <4*2 = <Т2<Т1, Т1Т2 = Т2Т1, СТ1Т1СГ1 = 7j~Х, О2Т2О2 = Tjf1, О-1Т2 = Т2<Т1, СТ2Т1 = Т1<Т2-
214 Глава 11. Язык симметрии Выведите отсюда, что группа прямоугольной решётки разлагает- ся в прямое произведение двух групп (<71, ri) X (<Т2, Т2) , каждая из которых изоморфна группе (11.17) с определяющими соотношениями (11.18). Опишите группы симметрий остальных решёток в терминах образующих и определяющих соотношений. 4. Подобным образом могут быть описаны и группы симметрий каждого из 17 орнаментов, изображённых на рис. 40 (с. 206). Сде- лайте это.
ГЛАВА 12 АЛГЕБРА В КОМБИНАТОРИКЕ Комбинаторика как самостоятельный раздел математики возник- ла где-то во второй половине XVII века, и к её рождению при- частны великие математики, такие как Ферма, Паскаль, Лейб- ниц, Я. Бернулли. В «Диссертации о комбинаторном искусстве» (1666 г.), принадлежащей перу Лейбница, впервые употребляет- ся и сам термин «комбинаторный» примерно в том же смысле, в котором мы используем его сегодня. Не так просто в двух словах объяснить, чем занимается комбинаторика (или, как ча- ще теперь говорят, комбинаторный анализ); Круг её вопросов достаточно велик (см.,'например, [7], [8], [27]). Но одна из её областей, которой мы и коснёмся в этой главе, связана с подсчё- том числа (перечислением) тех или иных комбинаций, состав- ляемых по разным правилам из элементов конечных множеств. Найти число возможных исходов (распределений мест) футболь- ного чемпионата, или число способов разменять рубль, или число химических соединений того или иного вида и т. д. и т. п. — всё это вопросы; подвластные искусству комбинаторики. Мы предполагаем, что читатель знаком с простейшими из комбинаций, рассматриваемых в комбинаторике, — сочетания- ми, размещениями и перестановками1 и что ему известны так- же формулы для их подсчёта: = n! = n(n - 1)... (n - m + 1) n т\(п — т)! т! 1 Если это не так, советуем обратиться к книге [8].
216 Глава 12. Алгебра в комбинаторике — число всех сочетаний без повторения из п элементов по т; п (п - т)\ — число всех размещений без повторения из п элементов по т; Рп = n! = 1 • 2 • 3 •... • п (читается «п факториал») — число всех перестановок из п элементов. Середина прошлого века оказалась периодом второго рож- дения комбинаторики. Бурное развитие вычислительной техни- ки и прикладной математики . способствовало активному при- менению комбинаторных методов для решения самых различ- ных практических задач. Спектр этих применений широк: химия и биология, статистическая физика и кристаллография, теория кодирования и планирование эксперимента, экономика и иссле- дование операций.... Теперь уже и сама комбинаторика — не изо- лированная, как прежде, наука, — она черпает свои методы из всего арсенала современной математики, и не последнюю роль здесь играет алгебра. Имеется ряд путей, связывающих алгебру с комбинаторикой. Один из них проходит через так называемые производящие функ- ции. Об этом мы и поговорим подробнее. Большинству читателей известна, наверное, формула бинома Ньютона1 (а+Ь)п = ап + С'ап~1Ь+...+Скап~кЬк +...+Ьп = Скап~кЬк, к=0 или в других обозначениях (1 + х)п = 1 + С^х + ... + Скхк + ...+хп = ^Скхк. (12.1) fc=0 1 Её частными случаями являются формулы для квадрата и куба суммы: (л + Ь)2 = а? + 2лЬ + Ь2, (g + = а? Зл2Ь 4- ЗлЬ2 4~ .
Глава 12. Алгебра в комбинаторике 217 Формулу (12.1) можно получить из таких соображений (они будут полезны для дальнейшего). Рассмотрим сначала произве- дение (1 + aia;)(l -Н аг®)(1 + «з®)- (12.2) Раскрывая в нём скобки, получим выражение 1 + («1 + «2 + аз) х 4- (ai<i2 4- агаз 4- 0203) ®2 + (010203) ®3, коэффициенты которого «перечисляют» всевозможные сочетания без повторений из 3-х элементов соответственно по одному, по два, по три. Например, слагаемым а\а,2, 0103, 0203 коэффициен- та при я2 соответствуют всевозможные такие сочетания из 3-х элементов по 2. Совершенно аналогично (1 4- oix)(l -I- а2®)(1 + аз®) •••(! + Опх) = — 1 + (ai + аг 4- 03 4- ... + on) ®-Ь + (aiO2 + О1Оз 4-... 4- an-ian) ж2+ + (010203 + 010204 + . . . + an-2On_lOn) х3 + ... .. 4- (aiO2 03... an) хп. (12.3) Здесь снова каждый коэффициент при произвольной степени хк перечисляет в указанном выше смысле всевозможные сочетания из п элементов по k, и следовательно, число слагаемых в этом коэффициенте совпадает с числом Ск всех таких сочетаний. По- лагая в равенстве ai = 02 = ... = ап = 1, приходим к формуле (12.1). Оказывается, с помощью алгебраических выражений, подоб- ных (12.2) и (12.3), можно также получать решения многих дру- гих задач на перечисление. Так, если по аналогии с (12.2) рас- смотреть многочлен (1 + а\х + а2ж2)(1 + аг® 4- а2®2)(1 4- а$х 4- о2ж2), (12.4) равный 1 4- (ai + 02 4- 03) х 4- (0102 4- 0103 + 0203 + о2 + о2 4- а2) ж2-Ь 4- (010203 + Gio! + а2О2 4- O1O3 4- о203 + а^аз + 02а2) х3 + ... ... 4- (о12О22аз2) х6, (12.5)
218 Глава 12. Алгебра в комбинаторике то можно заметить, что его коэффициенты, так же, как и в фор- муле (12.2), перечисляют сочетания из 3-х элементов, теперь, правда, уже такие, в которых элементы могут повторяться, а чис- ло повторений не превышает двух. Например, слагаемым коэф- фициента при ж3 соответствуют все такие сочетания по 3 эле- мента Я1О2О2, °la1^2, 010103» O2O2O3, 020303. Значит, при oi = 02 = 03 = 1 мы получим многочлен (1 + х + ж2)3 = 1 + Зж + 6ж2 + 7ж3 + 6ж4 + Зж5 + ж6, (12.6) коэффициенты которого дают число сочетаний для 3-х элементов с не более, чем двукратными повторениями. К примеру, число та- ких сочетаний из 3-х элементов по 4 совпадает с коэффициентом при ж4 и равно 6. Вот эти сочетания: 01010203, 01020203, 01030303, 01010202, O1O1O3O3, 02030303. Теперь ясно, что для перечисления сочетаний из п элементов с не более, чем двукратными повторениями, следует рассмотреть произведение (1 + 01Ж + а2ж2)(1 + 02Ж + а2®2)... (1 + ОпЖ + о2ж2). Тогда коэффициенты при ж, ж2, ж3, ..., ж2п многочлена (1 + ж + ж2)п (12.7) дают число таких сочетаний по одному, по два, по три, ..., по 2п элементов. Подобные многочлены (они называются произво- дящими функциями) можно использовать для подсчёта числа со- четаний с самыми разнообразными ограничениями на вхождение элементов. Скажем, произведение (1 + Я1Ж + а2ж2)(азж + «з®2 + а2х3) °з® перечисляет все сочетания из 3-х элементов, в которые ai входит не более 2-х раз, аз — не менее одного и не более 3-х раз, аз —
Глава 12. Алгебра в комбинаторике 219 ровно один раз. Однако далеко не всегда многочлены оказывают- ся достаточным орудием для построения производящих функций. Так будет, например, в задаче отыскания числа таких сочетаний из п элементов по т, в которых каждый из элементрв может повторяться любое число раз. По аналогии с предыдущим мож- но понять, что в качестве производящей функции в этом случае следовало бы взять выражение (1 + х + я2 + ...+«гп + ...)п, (12.8) где в скобках стоит бесконечная сумма. Такого типа бесконечные суммы ао + aix + аг®2 + ... 4- атхт + ... (aj € R) в математике называются рядами, точнее степеннЛми рядами. Некоторым, быть может, известно, что ряды часто служат удоб- ным средством представления различных функций, рассматрива- емых в математическом анализе, очень полезны они для целей приближённых вычислений и т. д. В таком контексте ряды тре- буют довольно аккуратного обращения с собой (например, нуж- дается в точном определении понятие суммы ряда, — ведь речь идёт о суммировании бесконечного множества слагаемых). Од- нако для наших целей будет достаточным ввести алгебраические операции над степенными рядами, понимаемыми как формальные выражения., Мы определим эти операции так, чтобы в случае конечный сумм (т. е. многочленов) они приводили к обычному сложению и умножению многочленов. Суммой двух степенных рядов ао + aix + а^х2 + ... + атхт + ..., (12.9) bo + bix + Ь^х2 + ... + bmxm + ..., (12.10) назовём ряд (ао + bo) + (ai + bi) x + (<i2 + fa) X2 + ... + (am + 6m) xm + ..., получающийся сложением коэффициентов при одинаковых сте- пенях. Роль нулевого элемента играет тогда ряд, все коэффи- циенты которого равны 0, а противоположным для ряда (12.9)
220 Глава 12. Алгебра в комбинаторике будет, ясно, ряд —ао — а^х — а2Х2 — ... — атхт — ... Произведением рядов (12.9) и (12.10) назовём степенной ряд Со + С]Х + С2Х2 + . . . + СтХт + .. . коэффициенты которого вычисляются по формуле т Сщ = ®0^пг "Ь 1 + • • • + ®т—1Л1 + = Q’ibm—i' (12.11) i=0 Эта формула полностью соответствует обычному правилу умно- жения многочленов. Такое определение операций превращает множество степенных рядов в коммутативное кольцо с едини- цей (читатель может без труда это проверить), которое назы- вается кольцом формальных степенных рядов1 и обозначается К[[ж]]. Поскольку всякий многочлен принадлежит этому кольцу, то можно сказать, что кольцо многочленов R[rc] образует под- кольцо в Элементы кольца формальных степенных рядов и используются в качестве производящих функций для реше- ния различных задач перечисления. Более точно, если ао,ai,... ..., ат,... — последовательность чисел (дающих решение неко- торой комбинаторной задачи), то производящей функцией этой последовательности называется ряд ао + aix + О2Х2 + ... + атхт +..., принадлежащий й[[я]]. Как обстоит дело с делением степен- ных рядов — разобраться с этим очень полезно для дальнейше- го. Вспомним, что в кольце многочленов обратимые элементы исчерпывались многочленами нулевой степени. В кольце К[[х]] 1 К рассмотренным операциям можно добавить и другие, также определя- емые формально: суперпозиция (подстановка ряда в ряд), дифференцирование, интегрирование. Множество степенных рядов, на котором определены все пе- речисленные в тексте и в сноске операции, называют обычно алгеброй Коши, по имени французского математика О. Коши(1798-1857), одного из создателей современного математического анализа.
Глава 12. Алгебра в комбинаторике 221 запас обратимых элементов^ оказывается, намного богаче. Вы- ясним, какому условию (необходимому и достаточному) должен удовлетворять произвольный ряд (12.9), чтобы для него суще- ствовал обратный элемент, также, разумеется, некоторый ряд. Пусть таковым является ряд (12.10), тогда в кольце R[[x]] долж- но выполняться равенство (ао + а^х 4-... 4- атхт +... )(Ь0 + Ь^х + ... + Ьтхт + ...) = 1. Используем правило (12.11) перемножения рядов и приравняем коэффициенты при одинаковых степенях в обеих частях послед- него равенства. Это приводит к следующей системе бесконечного числа уравнений: aobo = 1> О0&1 + G1&0 = 0, ®0^2 4" 4" О2&0 = 0, (12.12) 4- ai6m_i + ... + am-ibi 4- ambo — 0, с неизвестными bo, bi, ...,bm, ... . Первое из этих уравнений имеет решение Ьо = 1/ао тогда и только тогда, когда ао / 0. Это же условие необходимо и доста- точно для разрешимости второго и всех последующих уравнений. Действительно, из второго и третьего уравнений получаем ajbo ai oi^i 4" a2&o а^а2ао аналогично находятся и все последующие коэффициенты. Итак, условие oq / 0 является необходимым и достаточным для того, чтобы система (12.12) имела решение (bo, bi,..., bm,...) и притом единственное, следовательно, и для того, чтобы ряд (12.9) являлся обратимым в R[[ar]]. Иллюстрируя сказанное, най- дём ряд, обратный элементу 1 — х € R[[®]]. В этом случае oq = 1,
222 Глава 12. Алгебра в комбинаторике ai = — 1, все прочие коэффициенты равны 0, и система (12.12) принимает вид &0 = 1, bi bo = 0, &2 = 0, • • • > Ът Ът—1 = 0, » . . , откуда следует, что bm = 1 для всех т. Таким образом, приходим к равенству1 —= 1 + х + х2 + ... + хт + ... (12.13) 1 — X Вернёмся теперь к задаче отыскания числа сочетаний с неогра- ниченными повторениями. Обозначим через С™ число.таких со- четаний из п элементов по т. Здесь п фиксировано, а т пробе- гает все неотрицательные целые значения. Производящей функ- цией для чисел С™ будет, как это уже отмечалось, выражение (12.8). Учитывая равенство (12.13), мы можем написать 1 - хГп. (1 + х + а;2 + ... + жгп + ...)п = Я ж)п В дополнении к этой главе доказывается, что формула бинома Ньютона распространяется и на целые отрицательные показате- ли, поэтому (1 - xYn = 1 - С\пх + (72па;2 +... + (-IfC^z”1 +..., (12.14) ____ (-п)(-п - 1)... (-п - т + 1)' где С_п - — . Таким образом, число сочетаний с неограниченными повторе- ниями из п элементов по т равно ЦТ = (-1ГС- = _ (—l)m(—п)(—п — 1)... (—п — т — 1) _ ml (п + т — 1)... (п + 1)п т! 1 Сравните его с формулой суммы бесконечно убывающей геометрической прогрессии.
Глава 12. Алгебра в комбинаторике 223 Окончательно, С™ = с™т_х. (12.15) _4 . Так, при п = 2, т = 4 получаем С2 = = 5 сочетаний с повто- рениями: 01010202, 01020202, 02020202. Отметим, что, хотя формулу (12.15) можно доказать более ко- ротким и элементарным путём (см., например, [7]), всё же наш труд не был напрасным. На примере задачи о сочетаниях с по- вторениями мы продемонстрировали действенность метода про- изводящих функций и общую схему его применения, годную’для решения многих других задач. К их числу относятся задачи, связанные с разбиениями чи- сел на слагаемые (они имеют различные прйменения, например, в теории чисел и теории кодирования). Вот пример такой задачи, облечённой в занимательную форму. Сколькими способами можно разменять рубль моне- тами достоинством 5, 10 и 20 коп.1? Обозначив через i, j, к число монет достоинством соответ- ственно 5, 10, 20 коп., участвующих в некотором способе разме- на, мы можем сформулировать задачу по-иному: сколько различ- ных решений в целых неотрицательных числах имеет уравнение Ы + 10J + 20/с = 100, или, что то же самое, уравнение i + 2j + 4к = 20. Рассмотрим аналогичное соотношение i + 2j + 4к = I (12.16) 1 На момент написания этой книги все такие монеты имели хождение. — Прим. ред.
224 Глава 12. Алгебра в комбинаторике с произвольной правой частью I, и через ai обозначим число раз- личных его целых неотрицательных решений. Убедимся, что для последовательности аг производящей функцией является следу- ющее выражение /(ж) = = (1 + X + X2 + ... )(1 + х2 + х4 + ... )(1 + х4 + х8 + . . . ) = оо оо оо = (12.17) г=0 j=Q к=0 В самом деле, произведение г-го, j-ro и к-го слагаемых из перво- го, второго и третьего сомножителей соответственно даёт одно- член хг+2^+4к. Поскольку а/ —число решений уравнения (12.16), то ряде, получившемся после перемножения, появится ровно а/ слагаемых вида х1 для каждого I. Поэтому после приведения по- добных членов выражение (12.17) примет вид оо f(x) = ^2alx^ 1=0 а это и означает, что оно является нужной нам производящей функцией. Вспоминая теперь равенство (12.13), выпишем совер- шенно ему аналогичное -^-7 = 1 + ^ + х2‘ + ... + хп‘ + ..., (12.18) 1 — хг справедливое для любого натурального t. Используем (12.18) и запишем производящую функцию (12.17) в ином, более удоб- ном виде = (l-xXl-x2)^-®4) ’ Ещё несколько тождественных преобразований довершают дело. Умножим числитель и знаменатель на (l+®)(l+a:2)2 и применим
Глава 12. Алгебра в комбинаторике 225 формулу (12.14), заменяя в ней х на ж4. Тогда № = (1 =(1 + ’Х1 + “ *4)-3 = = (1 + ж)(1 + 2ж2 + ж4)(1 + Зж4 + 6ж8 + ... + (m+l)(m + 2)x4m + ...) = 2 = (1 + х + Zx2 + 2i3 + х1 + г5) У (m+1)(m + 2)x<”‘. m=0 Теперь уже нетрудно сообразить, чему равны интересующие нас числа щ. Если I = 4s, то _(s + l)(s + 2) s(s + l)_ 2 a4s ---------------1-----— = (s + 1) . Аналогично, при I = 4s + 1 °4s+l = (s + l)2. Если же I = 4s + 2 или I = 4s + 3, to °4s+2 = °4s+3 = (s + l)(s + 2). (12.19) В частности, аго = 36, это и есть число способов разменять рубль. Одновременно получено решение и многих других задач о размене. К примеру, аю указывает сколькими способами можно разменять полтинник. Согласно формуле (12.19) таких способов имеется 12. Нетрудно их перечислить: 50 = 10 • 5 = 8 • 5 + 10 = 6 • 5 + 2 • 10 = 6 • 5 + 20 = = 4- 5 + 3-10 = 4- 5 +10+ 20 = 2- 5 + 4-10 = = 2- 5 + 2-10+ 20 = 2- 5 + 2-20 = 5-10 = = 3 • 10 + 20 = 10 + 2 • 20. Подобным же образом решаются и другие задачи на разбие- ния, правда, вычисление коэффициентов производящей функции для них может потребовать больших усилий. ‘/-,8 — 261
226 Глава 12. Алгебра в комбинаторике Достаточно общая формулировка, в которую укладываются эти задачи, выглядит так. Задано некоторое множество 4 = {ni, п2, щ, ...} натуральных чисел, не обязательно конечное. Сколькими спосо- бами можно разбить заданное число т на сумму слагаемых из множества А (при этом разбиения, отличающиеся лишь поряд- ком слагаемых, считаются одинаковыми)? По-разному уточняя эту общую формулировку, мы будем по- лучать различные варианты задач на разбиения. Так, если ни на число слагаемых, ни на число повторений одинаковых слагаемых не накладывается никаких ограничений, то производящая функ- ция для числа таких разбиений по аналогии с (12.17) запишется в виде (1 + xni + x2ni + .. .)(1 + хП2 + х2п2 +.. .)(1 + хпз +х2пз + ...)... Если же повторения одинаковых слагаемых недопустимы, то при- дём к производящей функции иного вида (1+яП1)(1 + яП2)(1 + жП3)... Завершая на время разговор об алгебре производящих функ- ций, хотим ещё отметить, что оперирование над ними по установ- ленным алгебраическим законам позволяет часто устанавливать неожиданные связи между различнымй комбинаторными задача- ми (см., например, дополнение 3). Перечисление порой осложняется тем, что объекты, формаль- но различные, по смыслу задачи приходится считать одинаковы- ми, эквивалентными. Иллюстрацией тому может служить извест- ная комбинаторная задача, т.н. «задача об ожерельях»1. Форму- лировка её такова. Пусть ожерелье состоит из п бусинок нескольких цветов. Спрашивается, сколько существует различных ожерелий, если 1 Она является наглядной моделью для многих практически важных задач на перечисление.
Глава 12. Алгебра в комбинаторике 227 задано число бусинок каждого цвета. Рассмотрим, например, все ожерелья, состоящие из трёх белых и трёх чёрных бусинок, неко- торые из них изображены на рис. 44. На первый взгляд может показаться, что общее их число Cf = = 20, однако многие ожерелья из этого числа по существу одина- ковы, отличаются лишь своим положением в пространстве. Так после поворота на некоторый угол первое из ожерелий становит- ся неотличимым от второго, а третье от четвертого. Если считать одинаковыми (эквивалентными) ожерелья, получающиеся одно из другого поворотом, то число различных ожерелий в нашем примере намного меньше 20, и нетрудно убедиться, что их толь- ко четыре. Слова «одинаковые», «различные» в этой и других комбинаторных задачах получают совершенно ясное и однознач- ное истолкование с помощью понятия группы. Так, если считать, что бусинки расположены в вершинах пра- вильного n-угольника, то эквивалентность ожерелий означает, что одно из них может быть переведено в другое некоторым пре- образованием из группы вращений Vn этого п-угольника. Заметим, что слову «одинаковый» здесь можно было бы при- дать и чуть иной смысл, допуская не только повороты, но и пе- Й8»
228 Глава 12. Алгебра в комбинаторике реворачивание ожерелий на другую сторону (симметрию отно- сительно оси). В этом случае эквивалентными становятся также пятое и шестое ожерелье нашего рисунка, а число различных ожерелий станет равным трём. Но эквивалентность ожерелий и в новом смысле может так- же выражена на групповом языке. Достаточно лишь рассмотреть вместо Vn группу всех самосовмещений правильного п-угольника или иначе группу диэдра Dn. Теперь два ожерелья эквивалентны, если они могут быть переведены одно в другое преобразованием из группы Dn (поворотом или симметрией). Важно, что подобным образом можно говорить об эквивалент- ности объектов любого множества, если только задана некоторая группа его преобразований. В самом деле, пусть М — произвольное множество и G — груп- па взаимно однозначных преобразований этого множества. Эле- менты а и Ь, принадлежащие М, назовём эквивалентными1, ес- ли существует преобразование д е G, переводящее элемент , а в Ь: д(а) = Ь. Понятно, что имеется тогда и преобразование (а именно, д~1), осуществляющее обратный переход: д~г(Ъ) = а. Ситуация, с которой мы здесь сталкиваемся, в сущности, не нова. В том или ином виде она уже не раз встречалась на стра- ницах этой книги. Так, в теории алгебраического уравнения рас- сматривалось множество многочленов от нескольких переменных вместе с группой его преобразований, возникающих при пере- становках аргументов (корней изучаемого уравнения). Свойства симметрии или частичной симметрии таких многочленов, столь важные в задаче о разрешимости в радикалах, как раз и опре- делялись тем, насколько велик запас эквивалентных элементов у этих многочленов. Группы преобразований (точнее, движений) плоскости и пространства были в центре внимания главы «Язык симметрии». Эти группы явились удобным средством классифи- кации типов симметрии геометрических фигур, орнаментов, кри- сталлов. Можно добавить к этому, что способ образования сим- метричной фигуры (с данной группой симметрии G) из произ- 1 Точнее, эквивалентными относительно действия группы G на множе- стве М.
Глава 12. Алгебра в комбинаторике 229 вольного мотива состоял фактически в присоединении к исход- ному мотиву всех эквивалентных ему относительно группы G элементов. Возвращаясь к общей ситуации, назовём орбитой элемента а € е М совокупность Ог(а) всех элементов множества М, эквива- лентных этому элементу. Оказывается, что любые два элемен- та Ъ и с, принадлежащие Or (а), не только эквивалентны а, но и эквивалентны также между собой. Действительно, поскольку Ь, с G Or (а), то существуют такие преобразования 51, 52 G G, что b = gi(a) и с = 52(a). Тогда преобразование дч9\Х переводит элемент Ь в с, в самом деле ^2^ГХ(Ь) = 92(a) = с и, значит, b и с эквивалентны. Отсюда, кстати сказать, следует, что Ог(Ь) = Ог(с) = Ог(а), или иначе, орбиты любой пары экви- валентных элементов совпадают. С другой стороны, если элемен- ты ai и аг неэквивалентны, то их орбиты вообще не имеют общих элементов. Предполагая противное, т. е. что некоторый элемент а е Or(ai) П Ог(аг), получаем а = gi(ai) и а = 52(02) для неко- торых преобразований 51, 52 € G. Но тогда аг = 525f1(°i)> что противоречит предположению о неэквивалентности сц и аг. Резюмируя сказанное, приходим к следующим выводам: Множество М под действием группы G распадается на непересекающиеся классы эквивалентных между собой элементов. Каждый такой класс представляет из себя орбиту для любого из входящих в него эк- вивалентных элементов. Неэквивалентные элементы принадлежат различным орбитам. На рис. 45 приведены две из четырёх орбит множества оже- релий, состоящих из 3 белых и 3 чёрных бусинок, относительно группы V&. Мы подошли к тому, что возникающая в различных задачах комбинаторики проблема Т1еречисления неэквивалентных объек- тов сводится к отысканию числа орбит той или иной группы, дей- ствующей на множестве всех объектов. Полезным инструментом 8 — 261
230 Глава 12. Алгебра в комбинаторике для этого является утверждение, известное в теории групп как лемма Бернсайда. Пусть М — конечное множество и G — группа его подстановок. Число орбит относительно действия группы G вычисляется тогда по следующей формуле: ,(6') = й| 5>(9)i (12-20) ' 1 peG где %(р) — число элементов множества М, неподвижных относи- тельно подстановки д (знак означает, что сумма распростра- 9&G няется на все элементы группы G). Хотя доказательство форму- лы (12.20) для числа орбит впервые было опубликовано в 1911 году, известна она была, по-видимому, гораздо раньше, а основ- ные соображения, которые к ней приводят, по существу восходят к Лагранжу. Трудности с перечислением орбит происходят от то-
Глава 12. Алгебра в комбинаторике 231 го, что число элементов в различных орбитах, как мы могли за- метить, не обязательно одинаково. Сначала разберёмся, от чего зависит это число, называемое числом орбиты. Чтобы ответить, возьмём произвольный элемент а Е М и выпишем элементы его орбиты Ог(а). Они, очевидно, следующие: а = Ро(«), 91(a), д2(а), ..., дп-\(а). (12.21) Здесь до, gi, д2, ..., дп_\ — всевозможные подстановки из груп- пы G и до — тождественная подстановка. Однако в ряду (12.21) возможны повторения одинаковых элементов, и связано это как раз с тем, что некоторые из подстановок могут оставлять эле- мент а неподвижным. Ведь если, к примеру, gi(a) = gj(a), i j, то gj^gifa) = а, а это и означает', что подстановка gjxgi остав- ляет элемент а неподвижным. Очевидно, что длина орбиты тем меньше, чем больше таких подстановок. Нельзя ли описать эту связь поточнее? Оказывается, можно, и цель достигается теми же рассуждениями, которыми пользовался ещё Лагранж (чита- тель легко это поймёт, если вернётся к содержанию главы 3). В самом деле, рассмотрим множество всех подстановок Ga, для которых элемент а является неподвижным. Указанное множе- ство, называемое стабилизатором элемента а, образует под- группу в группе G (проверьте). Рассмотрим смежные классы gGa = { gh | h € Ga } по этой подгруппе и заметим, что все под- становки, принадлежащие одному и тому же смежному классу gGa, одинаково преобразуют элемент а, действуя на него так же, как подстановка р: (g/i)(a) = g(h(a)) = д(а). Понятно, что верно и обратное: если gi(a) = д2(а), то подстанов- ки принадлежат одному смежному классу по стабилизатору. Вы- вод, к которому мы приходим, таков: число различных элементов в (12.21) совпадает с числом различных смежных классов, ины- ми словами, длина орбиты | Ог(а)| равна индексу стабилизатора элемента а, т. е. |Or(a)| = |G:Ge| = |G|/|Ga|. (12.22) 8»
232 Глава 12. Алгебра в комбинаторике Теперь уже нетрудно доказать саму лемму Бернсайда. Рас- смотрим для этого все пары вида (д,а), где д € G и а € М — элемент, неподвижный относительно д. Наши рассуждения будут основываться на подсчёте числа таких «стабильных» пар двумя различными способами. С одной стороны, их общее число, оче- видно равно 02.23) д&З Но с другой стороны, для каждого а € М число подстановок со свойством д(а) = а совпадает с порядком стабилизатора Ga, т.е. равно, согласно (12.22), |Ga| = |G|/|Or(a)|. Таким же будет это число для всех элементов Ь € Ог(а), так как в этом случае Ог(Ь) = Ог(а). Тогда количество стабильных пар (д,Ь) для всех элементов одной, орбиты Or (а) окажется рав- ным '«’«wr1®1 и следовательно, одним и тем же для любой из орбит. Умножив полученное число на число орбит, получим общее число стабиль- ных пар t(G)|G|. (12.24) Наконец, сравнивая (12.23) и (12.24) приходим к утверждению леммы Бернсайда. Мы можем теперь проиллюстрировать применение доказанной формулы для решения некоторых комбинаторных задач, пока не очень сложных. Взять хотя бы пример с чёрно-белыми ожере- льями, изображёнными на рис. 44 и 45. Очевидно, что для тож- дественного преобразования г>о все 20 ожерелий являются непо- движными элементами: x(vo) = 20, а для поворота vi на угол тг/З неподвижные ожерелья отсутствуют совсем: %(vi) = 0. Нетрудно сообразить также, что, например, х(?2) = 2, таким же будет это число и для любой симметрии Oi. Всю информацию о неподвиж- ных элементах сведем в таблицу 10.
Глава 12. Алгебра в комбинаторике 233 Таблица 10. элементы д* ^0 Vi V2 V3 V4 V5 <^o 671 <72 <73 <74 <75 х(&) 20 0 2 0 2 0 2 2 2 2 2 2 Тогда по формуле Бернсайда число орбит относительно группы Тб действительно равно t(V6) = |(20 + 2-2) = 4, а относительно Dq — W = ^(20 + 2-8) = 3. ±z Ещё один пример, чуть посложней, — задача о раскраске ку- ба. Сколькими неэквивалентными способами можно раскрасить грани куба, если каждая грань может быть раскрашена одним из двух цветов, скажем, зелёным и жёлтым? При этом два спо- соба окраски считаются эквивалентными, если от одного можно перейти к другому путём подходящего поворота в пространстве. Задача, как мы теперь уже понимаем, сводится к подсчёту числа орбит группы вращений куба на множестве всевозможных спо- собов окрасок этого куба (их общее число очевидно 26 = 64). Можно понять, что группа вращений куба состоит из 24 преоб- разований, которые можно разбить на 5 типов (рис. 46): 1. Тождественное вращение. 2. Три поворота на 180° вокруг прямых, соединяющих центры противоположных граней. 3. Шесть поворотов на 90° вокруг тех же прямых. 4. Шесть поворотов на 180° вокруг прямых, соединяющих се- редины противоположных рёбер.
234 Глава 12. Алгебра в комбинаторике 5. Восемь поворотов на 120° вокруг прямых, соединяющих противоположные вершины (рис. 47). Занумеруем грани куба так, как показано на рис. 46 (номера проставлены в углах граней1). С каждым из перечисленных пре- образований связана, очевидно, некоторая подстановка на мно- жестве граней, или, что то же самое, на множестве их номеров. Выполняя эти преобразования, мы и переходим от одних спосо- бов окраски куба к другим, им эквивалентным. При этом, конеч- но, может случиться так, что в результате поворота окрашенный куб переходит в куб,, неотличимый от исходного. Например, если грани с номерами 3, 6 окрашены в зелёный цвет, а остальные — в жёлтый, то любое вращение вокруг оси ЕЕ\ не меняет такой окраски, т. е. она является неподвижным элементом относитель- но указанных вращений. Понятно далее, что преобразования, принадлежащие к одному типу, имеют одинаковое число неподвижных элементов и потому достаточно посчитать это число для одного из преобразований каждого типа. Сделаем ещё одно полезное наблюдение. Пусть соответству- ющая преобразованию подстановка разложена в произведение независимых циклов (см. главу 2). Ясно, что раскраска куба яв- 1 Заметим для ясности, что эти номера относятся не к граням, как таковым, а к их положению в пространстве, т. е. приведённая нумерация означает, что передняя грань всегда имеет номер 1, правая боковая — номер 2 и т. д.
Глава 12. Алгебра в комбинаторике 235 ляется неподвижным элементом относительно этой подстановки тогда и только тогда, когда грани, номера которых входят в один и тот же цикл, окрашены одинаково. Так, повороту на 180° вокруг оси ЕЕ\ соответствует подста- новка /Т 2 3 4 5 б\ 1 \5 4 3 2 1 - (!>5)(2>4)’ и для неподвижных относительно неё раскрасок одинаковый цвет должны иметь грани с номерами 1 и 5, точно так же, как и грани с номерами 2 и 4. Грани с номерами 3 и 6 могут быть раскрашены произвольно. Число таких раскрасок равно 24 = 16. Подстановка, отвечающая повороту против часовой стрелки на 90° вокруг той же оси, сама является циклом (1, 2, 5, 4) длины 4, так что для неподвижной раскраски все четыре грани с этими номерами должны быть окрашены одинаково, и таких раскра- сок 23 = 8. В качестве преобразования четвёртого типа рассмот- рим поворот вокруг прямой MN. Соответствующая подстанов- ка имеет вид (1, 2)(3, 6)(4, 5), и неподвижных для неё элемен- тов также 8. Для поворота вокруг оси BDi получаем подста- новку (1, 3, 2)(4, 5, 6) с четырьмя неподвижными раскрасками (рис. 47). Учитывая, что для тождественного преобразования все 64 рас- краски неподвижные элементы, находим по формуле (12.20) ис- комое число орбит 64 + 3-16 + 6-8 + 6-8 + 8-4 ------------------------— 10. 24 Это и есть число различных (точнее, неэквивалентных) раскра- сок куба. Мы рассказали о двух важных способах перечисления: методе производящих функций и групповом методе, основанном на лем- ме Бернсайда. Эти два метода гармонично соединяются в теории перечисления, созданной известным математиком Д. Пойа1. 1 Читателю этот математик, быть может, известен по его замечательным книгам, переведенным на русский язык, таким, например, как [20], [21].
236 Глава 12. Алгебра в комбинаторике Основная теорема этой теории связывает перечисляющую про- изводящую функцию для числа орбит с более простыми произ- водящими функциями, одна из которых —так называемый цик- ловой индекс группы подстановок. Краткое знакомство с теорией Пойа мы и начнём с понятия циклового индекса. Пусть, как и выше, G — группа подстановок конечного множе- ства М из т элементов. Пусть д — некоторая подстановка и д = = 7Г17Г2... 7гг — её разложение на независимые циклы. Если в ука- занном разложении имеется циклов длины 1, Ъ% циклов длины 2 и т. д., Ьт циклов длины т, то будем говорить, что подстановка имеет тип (bi,bz,...,bm). Для каждой такой подстановки обра- зуем одночлен от т переменных. Их сумму, взятую по всем подстановкам из группы G, разделим на число элементов в группе. Полученный многочлен । । geG и называют цикловым индексом группы G. Посчитаем цикловой индекс для некоторых из рассмотренных выше групп. В таблицу 11 сведены типы подстановок из группы Vq враще- ний правильного шестиугольника. Таблица И. Vo VI V2 (6, 0, 0, 0, 0, 0) (0, 0, 0, 0, 0, 1) (0, 0, 2, 0, 0, 0) V3 V4 V5 (0, 3, 0, 0, 0, 0) (0, 0, 2, 0, 0, 0) (0, 0, 0, 0, 0, 1) Из таблицы следует, что цикловой индекс этой группы имеет вид Pg = | (®i + ^2 + 2жз + 2жб) • (12.25)
Глава 12. Алгебра в комбинаторике 237 Каждое из 24 преобразований группы G вращений куба ин- дуцирует подстановку на множестве его граней. Пять категорий, на которые выше были разбиты вращения, дают соответственно подстановки типов (6,0,0,0,0,0), (2,2,0,0,0,0), (2,0,0,1,0,0), (0,3,0,0,0,0), (0,0,2,0,0,0). И значит, цикловой индекс группы р° = 1(4+Mxi++М + М). (12-26) На примере задачи о раскраске граней куба мы могли понять, что цикловая структура подстановок довольно тесно связана с пе- речислением орбит. Только что введённое понятие циклового ин- декса позволяет выразить эту связь в более явной и обозримой форме. Этой же цели служат вводимые далее функции и их веса. Функции, которые нам будут нужны, могут иметь достаточ- но произвольные области определения и значений (обозначим их соответственно D и Е). В задачах перечисления эти мно- жества всегда являются конечными. Такие функции f:D—>E оказываются удачным средством для описания и представления многих перечисляемых объектов. Скажем, в задаче о раскраске граней куба в качестве D можно взять множество его граней или их номеров, а в качестве Е — множество используемых цветов. Понятно, что тогда каждому способу раскраски граней отвечает некоторая функция /: D» Е и обратно. Так функции, прини- мающей значения /(1) =/(2) =/(3) =/(4) = «ж», Д5) = /(6) = «з», (12.27) соответствует способ окраски, при котором первые четыре грани окрашены в жёлтый цвет, а остальные — в зелёный. Если на множестве D задана некоторая группа подстановок, то можно пойти и дальше, определив отношение эквивалентно- сти на множестве рассматриваемых функций. Конечно, это нуж- но сделать так, чтобы эквивалентность функций всегда означала эквивалентность соответствующих им перечисляемых объектов. Определение, которое мы приведём, вполне удовлетворяет ука- занному требованию.
238 Глава 12. Алгебра в комбинаторике Две функции /1 и /г будем называть эквивалентными, если существует подстановка д EG такая, что Л(®) = для всякого х € D. (12.28) Понятно, что тогда /г(^) = У1( <7-1(ж)) для всякого х е D. Хорошую иллюстрацию данному определению вновь даёт задача о раскраске граней. В самом деле, пусть <? —подстановка граней, соответствую- щая некоторому вращению v куба и Д и Д - две эквивалентные функции, удовлетворяющие соотношению (12.28). Как связаны тогда те два способа его окраски, которые отвечают этим экви- валентным функциям? Ответ даёт равенство (12.27). Оно показы- вает, что цвет грани х при первой’окраске таков же, как и цвет грани д(х) при окрашивании вторым способом. Но это значит, что вторую окраску мы получим из первой, выполняя заданное вращение v. Обратим внимание читателя, на то, что эквивалентность функций не является чем-то существенно новым по сравне- нию с уже рассмотренным ранее понятием эквивалентности (см. с. 228).Дело в том, что со всякой подстановкой д множе- ства D можно связать преобразование на множестве функций, имеющих D своей областью определения. Сделаем это так: произвольной функции / сопоставим функцию <р такую, что ¥>(z) = №(*))> xeD. После этого группу G можно рассматривать также как груп- пу преобразований (и притом взаимно однозначных) множества М всех функций из D в Е. Ясно тогда, что эквивалентность функций относительно группы G, действующей описанным спо- собом на множестве М, это то же самое, что и эквивалентность, определённая равенством (12.28). Раз так, то множество функций распределяется на орбиты, в каждой из которых собраны эквивалентные между собой функ-
Глава 12. Алгебра в комбинаторике 239 ции. Теперь ясно, что решение многих комбинаторных задач сво- дится к подсчёту числа орбит, на которые некоторое множество функций разбивается группой G. Понятие веса, к которому мы переходим, позволяет придать схеме перечисления Пойа необычайную гибкость. Веса приписы- вают каждому элементу области значений Е, и они могут быть числами или переменными, или вообще, элементами некоторо- го коммутативного кольца К. Следовательно, можно образовы- вать суммы и произведения весов, и эти операции удовлетворяют обычным законам ассоциативности, коммутативности, дистрибу- тивности. Вес, приписываемый элементу г € Е, будем обозначать ш(г). Можно определить тогда и вес произвольной функции f-.D—> —> Е. Его полагают равным произведению весов значений этой функции, принимаемых для всевозможных элементов d из обла- сти определения D, = П deD (12.29) В задаче о раскраске куба припишем жёлтому и зелёному цве- там веса, равные соответственно переменным х и у из кольца многочленов от двух переменных. Очевидно, что вес функции, принимающей значения (12.27), окажется равным W) = А2, а показатели степеней, с которыми входят в него переменные, совпадут с числом граней каждого из двух цветов. Заметим, что как в примере с кубом, так и в общей ситу- ации, веса эквивалентных функций совпадают. Всё дело в том (убедитесь самостоятельно), что замена функций f на ей экви- валентную приводит лишь к перестановке сомножителей в про- изведении (12.29). Если F — произвольный класс попарно экви- валентных функций (орбита), то, пользуясь отмеченным обстоя- тельством, можно определить вес W(F) каждого такого класса. Положим его равным весу W(/) любой из функций f е F. Роль
240 Глава 12. Алгебра в комбинаторике перечисляющей производящей функции для орбит, расклассифи- цированных по весам, будет играть тогда сумма 52 W(F), (12.30) F взятая по всем орбитам. Действительно, если в указанной сумме сгруппировать слагаемые одинакового веса W(F) = w е К, то (12.30) примет вид £2 W^F) = miwi> где mi — число классов F W&K веса Wj. Числа тп» и дают искомое решение той или иной задачи на перечисление. Как уже отмечалось, это решение зависит от циклового индекса заданной группы подстановок, однако оно не вполне им определяется. Недостающую информацию несёт в себе перечисляющая производящая функция элементов множества Е, также расклассифицированных по весам 52w(e) = 52 niWi eEE Wi^K (12.31) (rii — число элементов е € Е, имеющих вес wj. В примере с рас- краской граней куба множество Е состоит из двух элементов «ж» и «з», которым приписаны веса х и у. Функция (12.31) в этом случае имеет простой вид: 52 w(e) = х + у. е&Е (12.32) Мы можем теперь сформулировать основную теорему теории перечисления Пойа: Производящая функция 52W(F) для числа орбит различных F весов равна 52 W) = Pg 52w(e), 52 ™2(е), • • •, 52 ^”(e) F \eEE etE eEE где Pg — цикловой индекс группы подстановок множества D, п — число его элементов.
Глава 12. Алгебра в комбинаторике 241 Доказательство мы не приводим, скажем только, что цен- тральным его пунктом является использование известной чита- телю леммы Бернсайда. Вооружившись теоремой Пойа, вернёмся к уже рассмотренным выше задачам. Сначала раскраска граней. Цикловой индекс в этом случае даётся формулой (12.25), а производящая функция множества красок — формулой (12.32). Согласно теореме имеем тогда: iy(F) = [(а: + у)6 + 3(я + у)2(ж2 + у2)2+ F + 6(ж + у)2(ж4 + у4) + 6(ж2 + у2) 4- 8(ж3 + у3)2]. (12.33) После раскрытия скобок и приведения подобных членов (мы этого делать не будем) сумма приняла бы вид: 6 6 У^У^т^У- i=i j=i (12.34) Каждый из коэффициентов даёт тогда число классов, име- ющих все а?У, другими словами, это есть число неэквивалент- ных раскрасок куба, при которых г граней окрашены в жёлтый цвет, a j — в зелёный. Так, коэффициент при х4у2 равен ± (15 + 3 • 3 + 0 + 6 • 3 + 0) = 2, т. е. имеется две различные окраски с 4-мя жёлтыми и 2-мя зе- лёными гранями (рис. 48). Ясно, что число всех неэквивалентных окрасок равно У2 У2^- » 3 Чтобы найти это число, достаточно в формуле (12.34), и следо- вательно, в (12.33) положить веса хну равными 1. Тогда получим (26 + 3 • 22 • 22 + 6 • 22 • 2 + 6 • 23 + 8 • 22) = 10,
242 Глава 12. Алгебра в комбинаторике что, естественно, совпадает с ранее уже найденным числом t(G) на с. 235. Этим же способом решается и задача об ожерельях, только те- перь необходимо знать цикловые индексы групп Vn и Dn. Найти их несложно. Пусть Vk — произвольное вращение из группы Vn. Если наи- больший общий делитель (fe,n) = d, то порядок |vfc| = n/d = = т, а элементу Vk отвечает подстановка на множестве вершин n-угольника, разлагающаяся в произведение d циклов длины т. Все элементы порядка т, как известно, содержатся в подгруп- пе (ук), а их число равно <р(т), где —знакомая нам1 функция Эйлера. Итак, каждой подстановке в этом случае отвечает в цик- ловом индексе одночлен вида = Хт™, а число таких одночле- нов для каждого т совпадает с Следовательно, цикловой индекс группы Vn даётся формулой: Руп (®1, ®2, • • • , хп) = | ^(т) Хтту Пт\п где запись т | п означает, что суммирование распространяется на все различные делители числа п. При п = 6 придём к ранее полученной формуле (12.25). При вычислении циклового индекса группы диэдра Dn (фор- мула приводится в дополнении) нужно учесть, что помимо п 1 Её определение было дано в дополнении 5 к главе 4 (с. 84).
Глава 12. Алгебра в комбинаторике 243 вращений в Dn содержится такое же количество зеркальных симметрий. Всем симметриям отвечают подстановки одинаковой цикловой структуры и в разложении их на независимые циклы встречаются лишь транспозиции и циклы длины 1. Если при со- ставлении ожерелья используются бусинки з различных цветов, то каждому из цветов (они и образуют в данном случае множе- ство Е) сопоставим переменную yi (i = 1,2,..., s) — вес этого цвета. Производящая функция множества Е, очевидно, равна S У1+У2 + +Ув = ^2Уг- г=1 Весом каждого из ожерелий является тогда одночлен л 1^*1 л 1^*2 л Л3 л J's У1 У2 Уз "'Уз > где Гг — число бусинок г-го цвета, содержащихся в нём. Согласно теореме Пойа производящая функция для числа неэквивалентных (относительно Vn) ожерелий того или иного веса выглядит так: 1 £ ^(т)(УГ + ^ + ... + уГ)п/т- (12.35) Пт\п Число t(Vn) всех неэквивалентных ожерелий (как и в задаче с кубом) получается из формулы (12.35) при уг = у2 = ... — ys = = 1, т. е. t(Vn) = -V^(m)Sn/m п пг|п Одна из практических задач (ею занимался ещё А. Кэли), ко- торая может быть с успехом решена методами Пойа, относится к области химии. Давно известно, что разные по составу химиче- ские соединения могут сильно отличаться своими химическими свойствами. Это явление, получившее название изомерия, объяс- няется тем, что атомы углерода способны по разному соединять- ся между собой и с другими атомами. Простейшим примером, на
244 Глава 12. Алгебра в комбинаторике что с ростом п н н н н гн с н с н с_н с н Гн С н н с с н н н н ш [3-СН2-СН2-СН3 сн3-сн-сн, сн3 Рис. 49. н котором это можно понять, является бутан, имеющий химиче- скую формулу СдНю и стоящий четвёртым в ряду так называе- мых парафинов, органических соединений с молекулярной фор- мулой СпН2п+2- На рис. 49 представлены структурные формулы двух изомеров бутана, первая из них соответствует нормально- му бутану, вторая — изобутану. Было число изомеров парафина СпН2П+2 быстро растёт. Если бутан имеет 2 изомера, а пентан —три, то у геп- тана их 9, а у декана—159. Как теоретически определить число воз- можных изомеров любого парафи- на СпН2п+2, как тоже самое сде- лать для других химических соеди- нений? Эти вопросы очень интересо- вали химиков. А ответы были даны математиками. С точки зрения математики структурные схемы молекул ор- ганических веществ представляют из себя графы, так называют множество точек (вершин) на плоскости, соединённых линиями (рёбрами) по определённому правилу1. В графах (структурных схемах) химических соединений вершины — это атомы, рёбра — валентные связи между ними. В случае парафинов изомерия полностью определяется спосо- бом соединения между собой атомов углерода. При п = 4 различ- ных способов (т. е. различных графов) имеется ровно два, а при п = 5 —три, таково же и число изомеров (рис. 50, 51). Мы должны уточнить здесь, когда графы считаются различ- ными, а когда — одинаковыми. Два графа будем считать одина- ковыми (изоморфными), если между вершинами можно уста- новить взаимно однозначное соответствие, при котором каждой паре вершин одного графа, соединённых ребром, соответствует пара вершин другого, также соединённых ребром. Иначе говоря, 1 Графы используются как наглядная геометрическая модель очень многих (отнюдь не только химических) задач возникающих на практике, а теория графов зачастую помогает в их решении.
Глава 12. Алгебра в комбинаторике 245 С С с с Рис. 50. Рис. 51. при рассмотрении графа не имеет значения, как он изображён на плоскости, существенно лишь то, какие вершины оказываются соединёнными, а какие нет. Графы на рис. 52 в согласии с нашей точкой зрения одинаковы, а все графы, изображённые выше, по- парно различны. Для графов, изображающих соединение атомов углерода в любом парафине, в частности и для тех, что представ- лены на рисунках, характерно то, что они не содержат замкнутых контуров (циклов). Такие графы называются деревьями. Задача перечисления изомеров с ХИМИЧеСКОЙ формулой СпН2п+2 сво- дится, таким образом, к перечисле- нию различных деревьев с п вер- шинами. Правда, речь идёт толь- ко о таких деревьях (назовём их С-деревьями), к каждой вершине которых примыкает не более четы- рёх рёбер — валентных связей, ведь валентность атома углерода равна 4. К указанной задаче близка другая — перечислить все изомеры, имеющие химическую формулу CnH2n+iOH. Такие соединения, называемые спиртами, получа- ются из парафинов СпН2п+2 путём замещения одного из атомов водорода одновалентным радикалом ОН. И эта задача легко пе- реводится на язык теории графов. В С-дереве парафина особо выделим ту вершину (атом С), которая соединена ребром (ва- лентной связью) с замещаемым радикалом атомом водорода. На рис. 53 выделенная вершина обведена кружком.
246 Глава 12. Алгебра в комбинаторике Выделенную вершину дерева называют корнем, а дерево, в ко- тором имеется корень, называется корневым. В нашем случае корневыми вершинами могут, понятно, служить лишь те верши- ны, к которым примыкает не более трёх рёбер. С-деревья с кор- невыми вершинами указанного типа для краткости назовём кор- невыми С-деревьями. Рис. 54 показывает, что при п = 3 имеется 2 различных корневых С-дерева, а при п = 4 их 4. Смысл слова «различный» в этом случае предлагаем уточнить самим читате- лям. Теперь мы можем сказать, что отыскание числа изомеров спир- та CnH2n+iOH сводится к нахождению числа различных корне- вых С-деревьев с п вершинами. Обе названные задачи (перечис- ление парафинов и перечисление спиртов) и целый ряд других задач были решены Пойа с помощью изобретённого им метода. Оказалось, что проще начать с решения второй из них — пере- числения корневых С-деревьев. С этой целью рассмотрим производящую функцию оо Ф) = 22гпжп, п=0 (12.36) в которой гп совпадает с числом различных корневых С-деревьев с п вершинами, а вес каждого такого дерева равен хп. В случае п = 0, который соответствует дереву, вовсе не имеющему вер- шин, — «пустому» дереву, полагаем го = 1. Несколько следую- щих коэффициентов находятся без труда, например, П = Г2 = 1, Г3 = 2.
Глава 12. Алгебра в комбинаторике 247 Рис. 55. Рис. 56. Далее рассуждаем так. Можно считать, что из корня любо- го непустого С-дерева исходят три других С-дерева, называе- мых главными ветвями (рис. 55) не исключено, что какие-то из них являются пустыми. Так будет, если к корню примыкает ме- нее трёх рёбер. Главные ветви вновь можно считать корневыми С-деревьями, если за корень принять ту вершину ветви, которая является смежной с корнем исходного дерева. Почти очевидно, что исходное дерево вполне определяется строением своих главных ветвей. Более точно, два корневых С-дерева одинаковы (изоморфны) тогда и только тогда, когда су- ществует такое соответствие между главными ветвями деревьев, при котором каждая ветвь одного дерева переходит в изоморф- ную ей ветвь другого. На рис. 56 первые два дерева изоморфны, второе и третье различны. Если ветви занумеровать числами 1, 2, 3, то соответствию, устанавливающему изоморфизм, отвечает подстановка из группы S3. Перечисление корневых С-деревьев равносильно, таким об- разом, перечислению неэквивалентных относительно группы S3 троек главных ветвей. Может показаться, что исходную зада- чу мы заменили более сложной. На самом же деле эта замена позволяет получить алгебраическое уравнение, которому обязана удовлетворять производящая функция г (ж). Обратимся для это- го к схеме Пойа, взяв в качестве множества Е множество всех корневых С деревьев, перечисляющей функцией которого и яв- ляется (12.36). Весом каждого его элемента — дерева — будет при
248 Глава 12. Алгебра в комбинаторике этом хп, где п — число вершин. Положив далее D = {1,2,3}, мы заметим, что каждая функция, f:D—*E отвечает в этом случае тройке корневых деревьев (главных ветвей), некоторым образом занумерованных. Эквивалентность функций относительно группы S3, понятно, равносильна пере- нумерации главных ветвей. Значит, эквивалентным функциям отвечают эквивалентные тройки. Если Ps3(xi,S2,®3) — цикло- вой индекс S3, то по теореме Пойа производящая функция множества неэквивалентных троек равна (оо оо ОО \ 22гп(яп)2, J2rn(xn)3) = п=0 п=0 п=0 / = Р8з(г(х), г(х2), г(х3)) . Коэффициент при хк этого перечисляющего ряда должен дать число неэквивалентных троек веса хк, иначе таких, что суммар- ное число их вершин равно к (вспомните определение веса функ- ции f: D —> Е). Но их столько же, сколько различных корневых С-деревьев с к +1 вершиной: это потому, что суммарное число вершин главных ветвей на единицу меньше числа вершин ис- ходного С-дерева. Тогда перечисляющим рядом .для различных корневых С-деревьев с n > 1 вершинами должно служить выра- жение xPs3(r(x), г(х2), г(х3)). Чтобы учесть ещё пустое дерево, нужно только к полученному добавить 1. Так мы приходим к соотношению г(х) = 1 + х Ps3 (г(х), г(х2), г(х3)). (12.37) Остается лишь простая техническая деталь — выписать цикловой индекс группы S3 и использовать его в полученном равенстве. Так как PS3(X1,X2,X3) = -(xf + 3X1X2 + 2х3),
Глава 12. Алгебра в комбинаторике 249 то соотношение (12.37) даёт г(х) = 1 + ж (г(х)3 + Зг(х)г(ж2) + 2г(ж3)) . (12.38) Полученное алгебраическое уравнение, которому удовлетво- ряет г(х), полностью решает задачу, так как позволяет после- довательно вычислять коэффициенты ряда (12.36). Сделать это можно, подставляя в (12.38) указанный ряд и приравнивая ко- эффициенты при одинаковых степенях в левой и правой части. Поступив так, получим, например, то3 + Зго + 2г0 ЗГфГ1 + Зг0Г1 г0 = 1; ri =---------У-----= 1; г2 = —у— ----------= 1; О о Згог? + ЗГлГ2 + ЗгоГ1 + ЗгоГ2 _ ГЗ =--------------j------------= 2; _ Зг^Гз + 6гоГ1Г2 + Г3 + Зг2 + Зг0Гз + 2п _ Г4 - 6 - 4. и т. д. Дальнейшие вычисления показывают, что r(x) = 1 + х + х2 + 2ж3 + 4ж4 + 8ж5 + 17ж6 + ... Решение задачи для корневых С-деревьев позволяет перечис- лить и неизоморфные С-деревья, т. е. парафины. Опуская метод, которым это может быть достигнуто, укажем лишь на .оконча- тельный результат, приведённый в таблице 12. Теорема Пойа пригодна для перечисления изомеров многих других органиче- ских соединений с данной молекулярной формулой. Всякий раз Таблица 12. число вершин п 1 2 3 4 5 6 7 8 9 10 11 12 13 число С-деревьев (парафинов СпН2п+2) 1 1 1 2 3 5 9 18 35 75 159 357 799
250 Глава 12. Алгебра в комбинаторике решение такой задачи сводится к отысканию числа неизоморф- ных графов того или иного типа. Интересующихся этим вопро- сом можно отослать к оригинальной работе Пойа [22]. Некоторая информация имеется в дополнении. Новые комбинаторные задачи, связанные с теми или иными предложениями, породили целый ряд обобщений теоремы Пойа. Их обзору посвящена, например, статья [12]. Дополнения и задачи. 1. Докажем формулу (12.14) (обобщение бинома), использован- ную для подсчёта числа сочетаний с повторением. С этой целью проведём индукцию по п. При п = 1 формула верна, так как тогда получается уже установленное ранее равенство (12.13). Проведём шаг индукции. Предполагая, что верно (12.14), покажем, что из него следует равенство = 1 - Ci(„+1)x + С\+1}х2 + ... + (-1)"*С”(„+1)1” + ..., или, с учётом (—1)т с-(п+1) = С™+т, равенство (1 -Ж)-("+1) = 1 + С„+1х + С2+2х2 + ... + С™тхт +... (12.39) Умножим обе части доказываемого равенства на (1 — х) и до- кажем равенство, равносильное (12.39): (1 - х)~п = (1 + С'+1х + С2+2х2 + ... + С™тхт + ... )(1 - х). (12.40) После перемножения коэффициент при хт в правой части ока- зывается pm _ pm-1 = (n + m) .. (п + 1) _ (n + m - 1)... (п + 1) = n+m n+’n"1 т! (т-1)! _ (п + т — 1)... (n + 1) (п + т А _ (т — 1)! \ т J = (п + т- 0... (п + 1)п = = (_1)тСтп (1241)
Глава 12. Алгебра в комбинаторике 251 Следовательно, (12.40) переходит в равенство (1 - х)~п = 1 - С\пх + С2_пх2 + ... + (-1)пС^пхт + ..., верное по индуктивному предположению. Это и доказывает (12.14). 2. Указать производящую функцию для числа сочетаний из п элементов по т, в которых к-й элемент встречается не менее а* и не более Ък раз (к = 1,2,...,п). 3. Доказать, что число гт разбиений числа т на различные на- туральные слагаемые совпадает с числом его разбиений на нечёт- ные слагаемые (без ограничения на повторения). Указание: производящая функция для чисел гт имеет вид: У(я) = (1 + ж)(1 + я2)(1 + я3)... = JJ(1 + хг). i=i Умножьте и разделите f(x) на выражение оо (1-х)(1-х2)(1-х3)...=П(1-х‘), . • 1=1. . приведя её к виду = (1-х)(1-хЗ)(1-а;5)... = = (1 4- х + х2 + .. .)(1 + х3 + х6 + .. ,)(1 + х5 + ж10 + ..')... Последнее и даёт перечисляющий ряд разбиений на нечётные слагаемые. 4. Найдите, используя теорему Пойа, число неэквивалентных окрасок вершин куба в два и три цвета. Та же задача для рёбер куба.
252 Глава 12. Алгебра в комбинаторике 5. Докажите, что цикловой индекс группы диэдра Dn имеет вид [ Л Е р(т)х^т + 2 I т\п z | 5“ Е ф(™)Хтт + У (х2 + Х1Ж2 2 т\п \ при п нечётном; при п чётном, (12.42) где <р(т) — функция Эйлера. Используя (12.42), легко можно найти производящую функцию, подобную (12.35), для числа оже- релий, неэквивалентных относительно Dn (сделайте это). 6. Ещё о химии. Простейшие из циклических углеводородов име- ют молекулярную формулу СПН2П, а в их структурной формуле атомы углерода образуют цикл. Рис. 57 соответствует так назы- ваемому циклопропану СзНб. При замещении в СПН2П атомов водорода различными одновалентны- \Н >Н ми радикалами (например, ОН, С1, Вг \/ и т.д.) получаются гомологи цикли- ческих углеводородов. Теорема Пойа / \ позволяет найти число изомерных го- / \ мологов данного углеводорода СПН2П. Н С/____________\ Н Задача близка к перечислению оже- / релий. Роль бусинок в этом случае играют атомы углерода, а красок — Рис. 57. различные одновалентные радикалы. Правда, в отличие от обычных оже- релий, бусинки (атомы) могут быть окрашены в два цвета, это соответствует тому, что каждый атом углерода может быть со- единён с двумя различными радикалами. В качестве примера найдём число изомерных гомологов цик- лопропана с химической формулой СзНз(ОН)Вг2. Используя тер- минологию ожерелий, можно сказать, что для раскраски бусинок используется три цвета, один из них соответствует атому водо- рода, два других — радикалам ОН и Вг. Группа G, относительно
Глава 12. Алгебра в комбинаторике 253 которой рассматривается эквивалентность, содержит 6 подстано- вок из группы диэдра £>з, 8 подстановок, переставляющих цвета отдельных бусинок и их комбинации, всего, как можно убедить- ся, 48 подстановок. Специальная структура этой группы позво- ляет записать её цикловой индекс в виде (12.43) (формула, вывод которой мы опускаем, некоторым специальным приёмом получается из циклового индекса группы диэдра, в дан- ном случае Оз). Подставляя в (12.43), согласно теореме Пойа, производящую функцию цветов ух+уъ + уз, где ух соответствует н, У2 — ОН, уз — Вг, получим перечисляющий ряд для изомер- ных гомологов циклопропана 1 Г ( (1/1+У2+УЗ)2 + (1/1+у|+у|)\ 3 61\ 2 / , ЛУх+У2+Уз)2 + (У1+У2+У3) (У1+У2+У3)2 + (z/1+yt+yf) + (Ух +2/2+2/3)2 + (2/1+2/2+2/3) Интересующее нас число даётся коэффициентом при члене У1У2У3, который равен 3. Три различных изомера СзНз(ОН)Вгг представлены на рис. 58.
ГЛАВА 13 ВЕКТОРЫ И ПРОСТРАНСТВА Из всех разделов алгебраической науки, может быть, наиболее разработанным и эффектным является раздел, называемый ли- нейной алгеброй. К тому же он и особенно важен для решения многочисленных прикладных задач. Спектр приложений линей- ной алгебры очень широк. Её аппаратом, не говоря уже о самой математике, пользуются естественные, технические, экономиче- ские, нередко и гуманитарные науки. Что ещё характерно для линейной алгебры? Пожалуй, то, что она свободно пользуется хорошо знакомым геометрическим язы- ком. Здесь мы встретим такие термины, как вектор, векторное пространство, скалярное произведение, евклидово пространство, ортогональность и т.д., происхождение которых из геометрии очевидно. Однако у тех, кто впервые знакомится с линейной ал- геброй, употребление этих терминов часто вызывает недоумение. Дело в том, что объекты, к которым они применяются, могут «внешне» совсем не походить на свои геометрические прототи- пы. Достаточно сказать, что роль векторов (элементов векторно- го пространства) то и дело играют такие, скажем, объекты как многочлены, матрицы, функции и т. д. Позже мы сумеем понять, что именно объединяет эти столь различные вещи, позволяя го- ворить о них на едином языке. Тот факт, что этот язык именно геометрический, отчасти можно объяснить тем, что отправной точкой для развития линейной алгебры была аналитическая гео- метрия.
256 Глава 13. Векторы и пространства Читатель знает, что при решении геометрических задач методом ко- ординат сплошь и рядом возникают системы линейных уравнений с дву- мя или тремя неизвестными. Напри- мер, для отыскания точки пересече- ния двух прямых на плоскости при- ходится решать систему двух ли- нейных уравнений с двумя неиз- Рис. 59. вестными а±х + biy = ci аъх + b2y = C2, где каждое из уравнений определяет прямую на плоскости (рис. 59), а решение (а,/3) даёт координаты точки пересечения прямых, или радиуса-вектора этой точки. Рисунок соответству- ет случаю, когда система имеет единственное решение. Анало- гично и в системе линейных уравнений с тремя неизвестными каждое уравнение можно интерпретировать как уравнение плос- кости в пространстве, а всякое решение (а,/3,7) такой системы как точку или вектор в пространстве с указанными координата- ми. В главе 8 мы уже говорили о том, что в математике и различ- ных её приложениях приходится иметь дело с системами линей- ных уравнений, содержащих более трёх неизвестных. Напомним что всякая такая система с п неизвестными xi^x2l... ^хп имеет вид ^ll^El + &12#2 + . . . + CLln^n = Ь1 ^21^1 + «22^2 + . . . + CL2nXn = b2 /10 14 k “I" ^тп2^2 + ... + Ojnn^-n — Ът, а каждое её решение, как обычно, представляет из себя на- бор значений неизвестных (ai,az,... ,ап), обращающих каждое уравнение в верное равенство. Хотя непосредственное геометрическое истолкование системы (13.1) при п > 3 уже невозможно, однако прежний геометриче-
Глава 13. Векторы и пространства 257 ский язык двух и трёх измерений удобно сохранить для произ- вольного п. Этой цели и служат дальнейшие определения. Любой упорядоченный набор из п действительных чисел (ai,a2,. . ,схп) назовём п-мерным вектором, а сами числа «1, а2, • • •, otn — координатами этого вектора. Для таких векторов будем использовать обычную форму за- писи: d (ttl, &2> • • • ? Нетрудно определить простейшие операции над n-мерными век- торами по тем же правилам, что и для обычных векторов. А имен- но, если а= (ai,a2,...,a!n), &=(&,/%>••• ,Дп) — два n-мерных вектора, то их суммой называется вектор a + b = (ai + /?1, а2 + /%> ..., ап + (Зп). Произведением вектора а на число Л называется вектор Ха = (Aai, Аа2,..., Хап). Множество всех n-мерных векторов с операциями сложения и умножения на число называется п-мерным координатным, или арифметическим, пространством1. По аналогии с обычной плоскостью множество всех п-мерных векторов, удовлетворяющих одному линейному уравнению с п неизвестными, называют гиперплоскостью в n-мерном про- странстве. При таком определении множество всех решений системы (13.1) есть не что иное, как пересечение нескольких гиперплоскостей. В сходном смысле можно говорить и о произ- вольных поверхностях или областях в n-мерном пространстве, понимая под ними множество векторов, задаваемых одним или несколькими уравнениями, или неравенствами, не обязательно 1 Векторы n-мерного пространства часто именуют также точками, имея в виду ту связь, которая существует между точками и соответствующими радиус-векторами в случае плоскости и трёхмерного пространства.
258 Глава 13. Векторы и пространства линейными. Так, гиперповерхностью называется множество точек, координаты которых удовлетворяют одному уравнению • • •, хп) О с п неизвестными. Простейшим после плоскости примером ги- перповерхности является сфера радиуса R в n-мерном простран- стве — множество точек, координаты которых удовлетворяют уравнению 2,2. .2 г>2 + »2 + • • • + хп — ° • Эти и другие геометрические термины вовсе не для того, что- бы внушить читателю какие-то «таинственные» представления о столь же «таинственных» многомерных пространствах. По- вторим, что такая геометрическая терминология образует удоб- ный и образный язык, который, хотя и не может служить сред- ством доказательств, но очень удачно подчёркивает общность закономерностей, присущих и обычным геометрическим образам и их многомерным аналогам. Здесь мы встретим немало подтвер- ждений сказанному. Поучительным в этом смысле будет наше небольшое отступление в область линейного программирования. Линейное программирование (кратко ЛП) — сравнительно не- давно возникший раздел прикладной математики1, теоретической базой которого является как раз линейная алгебра. Линейное программирование применимо к решению многих задач оптими- зации, часто возникающих на практике. В одной из таких задач, которую мы рассмотрим, речь идёт о рациональном снабжении завода железной рудой. Руда может доставляться на завод из п пунктов добычи. Исходные данные таковы: с, — стоимость добычи одной тонны руды на г-й шахте и её доставки на завод, bi — объем добычи на г-ой шахте, b — потребность завода в руде. 1 Первая работа академика Л. В. Канторовича относится к 1939 году. Ме- тоды линейного программирования получили своё дальнейшее развитие в со- роковых-пятидесятых годах прошлого века.
Глава 13. Векторы и пространства 259 Потребитель стремится уменьшить расход на приобретение сы- рья. Если Xi — количество руды (в тоннах), которое будет достав- ляться с г-ой шахты, то этот расход в сумме составит L = C1S1 + С2Х2 + • • • + СпХп. (13.2) Нужно учесть при этом, что неизвестные Xi обязаны удовлетво- рять ряду ограничений. Прежде всего, необходимо полностью удовлетворить потребность завода в сырье. Это означает, что должно выполняться условие Х1 + Х2 + ... + хп = Ь. (13.3) Кроме того, очевидно, что Xi < bi, i = 1, 2, ..., п. (13.4) Наконец, по смыслу задачи величины Xi должны быть неотрица- тельны: > 0, г = 1, 2, ..., п. (13.5) Задачу можно теперь сформулировать так: требуется найти наи- меньшее значение функции (13.2), или, как говорят, минимизи- ровать её, при соблюдении условий (13.3), (13.4), (13.5). И сама функция (её обычно называют целевой), и левые части ограниче- ний (13.3)-(13.5) линейно зависят от неизвестных Xi — это и яв- ляется отличительным признаком задач линейного программиро- вания. В нашем конкретном случае решение может быть найдено со- всем элементарно, однако для нас гораздо важнее на этом при- мере выявить общие черты, свойственные всякой задаче ЛП. Можно заметить, во-первых, что при небольшом числе пере- менных задача ЛП имеет простой геометрический смысл. Пусть в нашем примере п = 3. Возьмём для определённости конкретные значения исходных данных L = 2xi + 3»2 + 4«з, Xi + Х2 + а?з = 10, 0 С Xi < 3, 0 х2 8, 0 < хз < 5.
260 Глава 13. Векторы и пространства Из первого условия находим хз = 10 — xi — Х2, подставляя это в другие ограничения, приходим к равносильной задаче: мини- мизировать целевую функцию L = 40 — 2x1 — х2 (13.6) при ограничениях 5 < xi + Х2 < 10, 0 С xi С 3, 0 С Х2 С 8. (13.7) Рис. 60. Для минимизации функции L изобразим на плоскости много- угольную область S, которая определяется неравенствами (13.7) (рис. 60). Перепишем равенство (13.6) для целевой функции в виде 2x1 + х2 = 40 - L. (13.8) При каждом значении L оно опреде- ляет прямую на плоскости. Две та- кие прямые, соответствующие зна- чениям L = 40 и L = 30, прове- дены на нашем чертеже. Понятно, что уменьшению L соответствует параллельный перенос прямой (13.8) вправо (в направлении стрелки). Че- рез точку D пройдёт тогда как раз та прямая, на которой достигается интересующий нас минимум. В указанной точке xi = 3, Х2 = 7, L = 27, при этом хз = 0. Произвольная задача ЛП может быть сформулирована подоб- но рассмотренной в следующем виде: минимизировать целевую функцию L = С1Х1 + С2Х2 ----1- СтХт (13.9) при соблюдении ограничений ®11®1 4" ®12®2 4" • •• 4" (&1тХт ^1> ................................... (13.10) аП1Х1 4" ®п2®2 4" ... 4" dnmXm "п> Xi, Х2, • • , Хп 0.
Глава 13. Векторы и пространства 261 При т = 2 ограничения (13.10), как и в примере, определяют выпуклую многоугольную область1 на плоскости, а при т = 3 — выпуклую многогранную область в пространстве, а решение за- дачи, если оно существует, достигается на границе этой области, более точно — в некоторой её вершине. В случае произвольного п также говорят, что ограничения (13.10) определяют выпуклую многогранную область в т-мерном координатном пространстве. Такие понятия, как «выпуклость», «граница области», «вершина», могут быть определены и в этом случае. И замечательно то, что утверждение, высказанное нами для т = 2 или 3, остаётся в силе и для любой размерности. Если задача ЛП (13.9) и (13.10) имеет решение, то оно достига- ется в вершине многогранной области, определённой ограниче- ниями (13.10). На этом общем утверждении основываются различные мето- ды минимизации, в частности, и наиболее известный из них — симплекс-метод. В упомянутом методе производится направленный перебор вершин, такой, что при переходе от одной вершины к следующей значение целевой функции уменьшается. Перебор заканчивается, когда будет достигнут минимум целевой функции. Но вернёмся к векторам и точкам многомерных пространств. Мы хотим теперь в этих пространствах придать смысл таким гео- метрическим понятиям, как коллинеарность и компланарность векторов, длина вектора и расстояние между точками, ортого- нальность векторов и т. д. Всего этого можно достичь не только в n-мерном координатном пространстве, но и в более общей си- туации. Переход к ней связан с разными обстоятельствами. Глав- ное из них то, что координатное пространство связано исключи- тельно с идеей задания векторов и точек своими координатами. Однако, в случае двух или трёх измерений мы владеем и дру- гим смыслом этих понятий, который, являясь исходным, вовсе не зависит от выбора системы координат. Такой бескоординатной точке зрения отвечает аксиоматическое определение векторно- го пространства произвольной размерности. Система его аксиом 1 Или пустое множество, если ограничения несовместны.
262 Глава 13. Векторы и пространства является итогом пристального анализа алгебраических свойств операций над геометрическими векторами и над многими други- ми объектами, имеющими с ними алгебраическое сходство. Множество V называется векторным (иначе, линейным) про- странством, а его элементы называются векторами, если на этом множестве определены операции сложения векторов и умно- жения вектора на произвольный скаляр1, удовлетворяющие сле- дующим свойствам (a, b, с € V, Л, Ai, Аг — произвольные скаля- ры): 1. сложение коммутативно-, а+ Ь = Ь +а; 2. сложение ассоциативно: (а + Ь) + с = а + (Ъ + с); 3. существует нулевой вектор 0 такой, что О + а = а + 0 = а; 4. для всякого вектора а е V существует противополож- ный вектор (—а) такой, что а 4- (—а) = 0; 5. выполняются два закона дистрибутивности: Х(а 4“ Ъ) = Ха Л6, (Ai 4- Аг)® = Ai® 4- Аг®,' 6. умножение на скаляр ассоциативно: Аг(А1®) = (АгА1)а; 7. 1 • а = а. Первые четыре аксиомы устанавливают свойства операции сложения, и их можно, было бы выразить короче, сказав, что относительно этой операции векторы образуют абелеву группу. В формулировке остальных свойств участвует и вторая опера- ция-умножение на скаляр. Понятно, что множество всех гео- метрических векторов трёхмерного пространства является ли- нейным пространством в смысле этого определения. Совершенно 1 В качестве множества скаляров чаще всего рассматривают либо поле действительных, либо поле комплексных чисел. В первом случае мы имеем дело с действительным векторным пространством, во втором — с комплексным. Однако определение имеет смысл и тогда, когда множество скаляров есть про- извольное поле (даже нечисловое).
Глава 13. Векторы и пространства 263 очевидно также, что все перечисленные в определении свойства оказываются выполненными и в случае n-мерного координатного пространства. Отметим лишь, что роль нулевого элемента в нём играет вектор, у которого все координаты равны 0, тогда век- тором, противоположным к а = (ai,a2,••• ,оп), служит вектор —а = (—ai,—a2, • •, —оп)- Следовательно, и оно может рассмат- риваться как один из примеров линейного пространства. Приве- дём ещё несколько примеров векторных пространств1. 1. Множество всех действительных (или комплексных) мат- риц данного порядка т х п относительно операций сложе- ния матриц и умножения матрицы на число. 2. Множество всех многочленов F[x] с коэффициентами из . данного поля F (поля скаляров) относительно операций сложения многочленов и умножения многочлена на скаляр. 3. Множество всех действительных функций, непрерывных на заданном отрезке [а, Ь], относительно сложения функций и умножения функции на число. К списку примеров векторных пространств (над полем дей- ствительных чисел) можно присоединить также различные ги- перкомплексные системы, и в частности, кватернионы, рассмат- ривавшиеся в главе 8. Отметим, что всё это — лишь небольшая часть из всего много- образия объектов, которые могут быть охвачены общим понятием векторного пространства. Обратим внимание читателей на то, что в определении ли- нейного пространства нет никакого упоминания о размерности. Однако представление о ней вполне может быть сюда привнесено, и этой цели служат понятия линейной зависимости и независи- мости векторов. Их мы и обсудим. Во-первых, заметим, что операции, определённые в вектор- ном пространстве, позволяют из произвольной системы векторов 1 В каждом случае читатель может самостоятельно проверить справедли- вость аксиом.
264 Глава 13. Векторы и пространства 01,02,... ,Ofc € V образовывать выражения вида Л1О1 + Л2О2 + ... + AfcOfc, (Aj — скаляры), (13.11) называемые линейными комбинациями этих векторов. Если все коэффициенты Ai, Аг,..., А& равны нулю, то и значением линей- ной комбинации будет нулевой вектор1. Не исключено, правда, что такое может случиться и тогда, когда не все коэффициенты Aj нулевые. Если существует равная нулевому вектору линейная комбина- ция AiOi + Агаг + ... + Xkak = О, в которой хотя бы один из коэффициентов отличен от нуля, то си- стема векторов ai, аг, • • •, «fc € V называется линейно зависимой. В противном случае система называется линейно независимой. Так, векторы 4-х мерного координатного пространства а1 = (2;0;1;-1), а2 = (2;-2; 1; 3), о3 = (2;-1; 1; 1) линейно зависимы, поскольку + Cb2 “ 2аз = (0; 0; 0; 0) = 0. Линейная зависимость, как видно из определения, равносильна при к 2 тому, что хотя бы один из векторов системы является линейной комбинацией остальных. Если система состоит из двух векторов ai,a2, то линейная зависимость её означает, что один из векторов пропорционален другому, скажем, ai = а • а2\ в дву- мерном и трёхмерном случае это равносильно коллинеарности геометрических векторов ai и «2. Точно так же, линейная зависимость системы из трёх векто- ров в обычном трёхмерном пространстве означает компланар- ность этих векторов. Понятие линейной зависимости является, 1 Говоря так, мы подразумеваем, что умножение вектора на нулевой скаляр даёт нулевой вектор: 0 • а = 0. Как ни странно, но это нуждается в доказатель- стве — в системе аксиом нет такого свойства. Однако оно является простым их следствием. В самом деле, а = 1- а = (1 + 0)-а = 1- а + 0- а = а + 0- а для любого a 6 V. Отсюда и следует, что 0 • а = 0.
Глава 13. Векторы и пространства 265 таким образом, естественным обобщением понятий коллинеарно- сти и компланарности геометрических векторов. Мы знаем, что в пространстве таких векторов особая роль принадлежит трой- ке координатных ортов i,j,k (понятно, линейно независимой), а именно, всякий вектор а единственным образом разлагается по этой тройке а = xi + yj + zk, где х,у, z — действительные числа (координаты вектора а). Естественно возникает вопрос, нет ли в произвольном вектор- ном пространстве V систем векторов, обладающих подобными свойствами. Речь, следовательно, идёт о такой системе (13.12) называемой обычно базисом, которая сама является линейно независимой, а любой вектор а € V оказывается линейной ком- бинацией её векторов а = ОЦй! + 0120,2 + . . . + ОСпОп. (13.13) Обратимся к примерам. В первом из них — n-мерном коорди- натном пространстве — указать такую систему совсем нетрудно. Достаточно рассмотреть векторы ai = (1,0,0,... ,0), 02 = (0,1,0,... ,0), а3 = (0,0,1,... ,0), (13.14) ап — (0,0,0,..., 1). Всякий n-мерный вектор а = («1,012, • • • ,«п) очевидно связан с ними соотношениями вида (13.13), коэффициенты в котором в точности совпадают с координатами этого вектора. Ясно также, что система (13.14) линейно независима, ведь линейная комби- нация (13.13) может равняться нулевой строке лишь тогда, когда все коэффициенты oti = 0. 9 — 261
266 Глава 13. Векторы и пространства Однако в другом примере — векторном пространстве всех мно- гочленов над данным полем — ситуация иная. Читатель легко поймёт, что всевозможные линейные комбинации конечного мно- жества многочленов (каким бы оно ни было) не могут исчерпать всего этого пространства. Это означает, что существование конечного базиса логически не следует из аксиом векторного пространства. Если такой базис существует, то пространство называется конечномерным, в про- тивном случае — бесконечномерным1. И те, и другие важны для математики и её приложений. Здесь мы поговорим лишь о ко- нечномерных пространствах. Возвращаясь к трёхмерному про- странству, заметим, что в нём роль базиса может играть любая тройка некомпланарных векторов ах,а2,«з- а2‘ Действительно, любой вектор а, как показано на рис. 61, разлагается по этой тройке а = Ai^i + Агаг + Азаз. Подобно этому и в произвольном конечномерном пространстве базис можно выбрать многими различны- ми способами. Так например, в n-мерном координатном простран- стве система векторов. (1,0,0,...,0), (1,1,0,...,0), (1,1,1,... ,0), ..., (1,1,1,... ,1) также образует базис (проверьте это). Однако не очень сложно доказать, что любые два базиса данного пространства V состоят всегда из одного и того же числа векторов. Это число п и на- зывают размерностью векторного пространства, а само простран- ство — n-мерным. Выбрав в V какой-нибудь из базисов ai, 02,... . ..,ап, мы увидим картину, которая очень напоминает п-мерное 1 Класс конечномерных пространств может быть выделен дополнительной аксиомой, так называемой, аксиомой размерности: имеются п линейно неза- висимых векторов, но любая система из большего числа векторов линейно зависима. Л1Л1 Рис. 61.
Глава 13. Векторы и пространства 267 координатное пространство. В самом деле, по определению бази- са, всякий вектор а € V разлагается по базисным векторам а = а\а\ А-а2Л2+ +Опап. (13.15) Заметим также, что для каждого а это разложение единственно. Предположив, что это не так, рассмотрим другое разложение а = а'^ + «2а2 + • • • + апап- (13.16) Вычитая (13.16) из (13.15), приходим к равенству («1 - «1) а1 + («2 - <4) °2 + • • • + («п - ап) ап = О, в котором хотя бы один из коэффициентов / 0. Но по- следнее противоречит линейной независимости базисных векто- ров, следовательно, запись (13.15) единственна. Коэффициенты ai,a!2, • • • ,ап в разложении по базису называются, по аналогии с прежним, координатами вектора а-в базисе ai,a2, .. ,ап. Сказанное позволяет установить очень простую связь меж- ду произвольными n-мерными линейными и n-мерными коорди- натными пространствами. Сопоставляя каждому вектору (13.15) строку его координат а = оц(11 + 01202 + ... + апап —► (oi, 012,..., о^), мы получаем взаимно однозначное соответствие между указан- ными пространствами. Очевидно при этом, что сумме векторов из V будет отвечать сумма соответствующих им координатных строк, а произведению вектора на скаляр — произведение соот- ветствующей ему строки на тот же скаляр. Распространяя поня- тие изоморфизма на линейные пространства (как?), мы могли бы сказать, что всякое п-мерное линейное пространство изоморф- но п-мерному координатному пространству. Следующий шаг связан с введением в пространствах любой размерности скалярного произведения, оно позволит говорить в этой общей ситуации о таких (присущих евклидовой геомет- рии) понятиях, как длина, угол, ортогональность. 9»
268 Глава 13. Векторы и пространства Будем говорить, что в действительном линейном простран- стве V задано скалярное произведение, если каждой паре его векторов а, Ь е. V соответствует действительное число, обознача- емое (а,Ь), и при любом выборе векторов выполнены следующие свойства: 1. (а, 6) = (Ь,а); 2. (а/ + а//,Ь) = (а',Ь) + (а",Ь); 3. (Ао, Ь) = Х(а,Ь) для любого числа А; (13.17) 4. (а, а) 0, причём (а, а) = О тогда и только тогда, когда а = 0. В этом определении (оно вновь аксиоматическое) выделены важнейшие свойства обычного скалярного произведения геомет- рических векторов, из которых в качестве следствия можно по- лучить и все другие его свойства. Линейное пространство, в котором задано скалярное произве- дение, называют обычно евклидовым пространством. Нетрудно привести пример евклидова пространства любой конечной размерности. Для этого нужно лишь обобщить на n-мерное координатное пространство формулу, хорошо извест- ную из аналитической геометрии. А именно, для любой пары векторов а = (ai,a2, • • • b = (^i,/?2, • • • ,fln) координатного пространства положим (a, b) = aifii + а202 + • • • + oin/3n. (13.18) Достаточно ясно, что так определённое скалярное произведение удовлетворяет требованиям (13.17). Например, (Аа, b) = (Aai)/?i + ... + (Aan)/?n = = A(ofi^i + ... + ап/3п) = A(a, b), (я, я) = A} + A2 + • • • 4- A^ 0, при этом (a, a) = 0 тогда и только тогда, когда = ... = = ап = 0, то есть вектор а нулевой. Таким образом, координатное пространство с введённым в нём по формуле (13.18) скалярным
Глава 13. Векторы и пространства 269 произведением является евклидовым пространством. С другими примерами читатель познакомится ниже. В любом евклидовом пространстве естественным образом определяется длина |а| произвольного вектора а. Делается это по формуле, также заимствованной из аналитической геометрии |а| = \/(а, а). Можно говорить поэтому, что скалярное произведение определя- ет «метрику» в линейном пространстве, то есть способ измерения длин. В евклидовом координатном пространстве со скалярным произведением (13.18) действует знакомое правило для вычисле- ния длины |а| = + а| + ... + а2, — длина вектора есть корень квадратный из суммы квадратов его координат. Далее, два вектора а,Ь евклидова пространства назовём ор- тогональными, если их скалярное произведение равно нулю: (а, 6) = 0 (напомним, что для геометрических векторов это ра- венство служит признаком ортогональности). Нередко бывает по- лезным рассматривать и угол <р между векторами а, Ъ. Формула для его отыскания (а, cos*’ = ГТ |а| также скопирована с обычной1. Введённые понятия позволяют выделить в евклидовом про- странстве базисы особого вида — так называемые ортонормиро- ванные базисы. Базис ^1» ^2? • • • > (13.19) назовём ортонормированным, если он составлен из попарно орто- гональных векторов единичной длины. Это значит, что векторы (13.19) удовлетворяют соотношениям (Cj, Cj) = 1, i = j, 0, г / j. (13.20) 1 Можно показать, что дробь справа по модулю не превосходит единицы.
270 Глава 13. Векторы и пространства Специальным методом (он называется процессом ортогонализа- ции) в любом конечномерном евклидовом пространстве можно от произвольного базиса перейти к ортонормированному. Так, в трёхмерном пространстве роль ортонормированного базиса иг- рает всякая тройка координатных ортов i,j,k. В то же время, система векторов (13.14) даёт простейший пример ортонормиро- ванного базиса в координатном евклидовом пространстве, ска- лярное произведение в котором определено по формуле (13.18). Оказывается, та же формула будет действовать и в любом n-мерном евклидовом пространстве, если только в нём зафикси- рован ортонормированный базис (13.20), а координаты всех век- торов вычисляются именно в этом базисе. В самом деле, пусть любые два вектора а = «161 + О!2е2 '+••• + «пеп> Ъ = @1е1 + 02е2 + • • • + Дгеп разложены по ортонормированному базису. Найдём их скалярное произведение. (а,Ь) = (aiei + а2е2 + ... + «пвп,ftei + /32е2 + ...+ /Зпеп) = = oi10i(ei, ei) + «^(ei, е2) + ... + а10п(е1,еп)+ + oi20i(ei,ei) + oi202(e2,e2) + ... + а20п(е2,еп) +... ... + «n/3i(en>Ci) + <хп02(еп,е2) + ... + oin0n(en, еп). Из соотношения (13.20) теперь моментально следует прежняя формула (а, Ь) = «1/31 + а2/3г + • • • + otn0n. Для того, чтобы по настоящему понять всю пользу введённых понятий, нужно изучить многие из разделов математики, такие как математический анализ, теорию дифференциальных уравне- ний, функциональный анализ, теорию вероятностей, теорию при- ближений и пр. В этих разных областях очень часто возникают ситуации, укладывающиеся в одну и ту же общую схему, кото- рая отражена в понятиях линейного и евклидова пространства и других, связанных с ними. Так, многие методы теории приближений основываются на факте, который для обычных пространств нам хорошо известен:
Глава 13. Векторы и пространства 271 длина перпендикуляра, опущенного из точки на прямую или плоскость, меньше длины любой наклонной. В известном смыс- ле он сохраняется и в многомерных евклидовых пространствах. Чтобы понять это, придётся ввести ещё одно важное понятие, обобщающее понятия прямой и плоскости в трёхмерном про- странстве. Подмножество L линейного пространства V назовём подпро- странством этого пространства, если 1) для любых векторов а и Ь, принадлежащих L, их сумма а + Ь также принадлежит L; 2) для любого вектора а, принадлежащего L, и для любого скаляра Л вектор Ха также принадлежит L. Понятно, что указанные свойства выполнены, например, для множе- ства всех векторов, принадлежащих s' \ некоторой фиксированной прямой ( \ или плоскости обычного простран- \ а// ства (см;, рис. 62). Заметим также, Ла J что всякое подпространство L само ---------- образует линейное пространство от- носительно операций, определенных Рис. 62. в V: Действительно, свойства 1) и 2) показывают, что на'множестве L (как и на V) определены опе- рации сложения и умножения на скаляр и, очевидно, для них выполнены все требования, содержащиеся в аксиомах векторно- го пространства. Всякое подпространство может быть задано в виде так назы- ваемой линейной оболочки подходящей системы векторов. Если а\, а2,.. •, ак — произвольные векторы пространства V, то их ли- нейной оболочкой называется множество L всевозможных линей- ных комбинаций этих векторов L = {Aiai + А2а2 + ... + AfcOfc}, где Ai,A2,...,Afc —произвольные скаляры. Проверьте, что ли- нейная оболочка удовлетворяет требованиям 1) и 2), входящим
272 Глава 13. Векторы и пространства в определение подпространства. Множество L называют также подпространством, порождённым векторами ai,a2,... ,ak, (оно является наименьшим из подпространств, содержащих эти век- торы). В случае, если L — подпростран- ство евклидова пространства V, можно говорить о величине рассто- яния от любого вектора b до подпро- странства. Будем для этого рассмат- ривать произвольные векторы х € € L, каждый раз измеряя рассто- яние между b и х длиной разно- сти b — х. Это условно показано на рис. 63. За расстояние d от вектора до подпространства примем минимальную из указанных длин, т. е. d = min |Ь — ж|. x&L ' 1 Каким же должен быть вектор из L, для которого достигается этот минимум? Ответ следующий: в качестве ближайшего к Ъ нужно взять такой вектор xq € L, чтобы разность b — xq была ортогональна (в смысле данного выше определения) любому векг тору из подпространства. Можно доказать, что такой вектор хо всегда существует и определён однозначно. Его называют орто- гональной проекцией вектора Ь. Простая выкладка показывает, что длина перпендикуляра Ь — xq действительно наименьшая: \b — х\2 = (b — х, b — х) = = ((6-хо) + (ж0 - х), (b-хо) + (ж0 - ж)) = = (Ъ - хо, b - хо) + 2(ж - XQ, b - хо) + (x-xq,x- Xq). Согласно выбору вектора хо мы имеем, что (х — xq, b — жо) = 0. Кроме того (ж — жо, х — жо) > 0. Поэтому |Ь - ж|2 > (Ъ - жо, Ъ - ж0) = |£> - ж0|2, что и требуется.
Глава 13. Векторы и пространства 273 Высказанные здесь соображения лежат в основе многих раз- новидностей известного в математике «метода наименьших квад- ратов». Проиллюстрируем его на примере, относящемся к серии популярных задач на смеси и сплавы. Таблица 13. металл латунь бронза мельхиор новый сплав медь 60 80 80 70 цинк 40 0 0 10 олово 0 20 0 10 никель 0 0 20 10 Плавильщик располагает тремя сплавами: латунью, бронзой и мельхиором. Процентное содержание меди, цинка, олова и ни- келя в этих сплавах указано в таблице 13. Цель плавильщика — получить новый сплав, в котором перечисленные четыре металла составляют соответственно 70, 10, 10, 10 процентов. Осуществи- ма ли такая цель, а если нет, то насколько близко можно подойти к желаемому составу нового сплава? Пусть xi, Х2, хз —доли, которые должны составить латунь, бронза и мельхиор в предполагаемом сплаве. Баланс по каждому из четырёх металлов даётся тогда уравнениями медь: 0,6x1+0,8x2+0,8x3= 0,7 цинк: 0,4xi =0,1 олово: 0,2x2 =0,1 ’ никель: 0,2х3= 0,1 6x1+80:2+8x3= 7 4xi = 1 2X2 = 1 2х3= 1 или иначе, (13.21) Ясно, что получившаяся система несовместна, и потому ответ на первый вопрос задачи отрицательный. Наш результат можно
274 Глава 13. Векторы и пространства выразить и иначе, если рассмотреть векторы-столбцы аг = /б\ 4 О \°/ а% = /8\ о 2 W м о о \2/ /7\ 1 1 V/ «з = Ь = составленные из коэффициентов при неизвестных и свободных членов. Несовместность системы (13.21) означает тогда, что век- тор Ь нельзя записать в виде линейной комбинации xiai+x2a2 + + жзаз трёх других векторов, или (это то же самое) вектор Ъ не содержится в их линейной оболочке L = (»iai + Х2С12 + жз®з I «1> Х2, «з — скаляры). В то же время векторы из подпространства L с точностью до пропорциональности соответствуют тем сплавам, которые могут быть, получены при смешивании в той или иной пропорции ла- туни, бронзы и мельхиора.. Будем рассматривать наши векто- ры как элементы четырёхмерного координатного евклидова про- странства со скалярным произведением, определённым по фор- муле (13.18), где п = 4. Теперь второй вопрос можно уточнить так: в подпространстве L найти вектор, ближайший к вектору Ь, иными словами ортогональную проекцию хо вектора b на под- пространство L. Соответствующий этому вектору сплав и будем считать наилучшим приближением к требуемому в задаче. Для отыскания ортогональной проекции xq = xiai + Х2й2 + хз^з (13.22) заметим, что для всех j = 1,2,3 (b, а,]} = (ж0 + (Ь - «о), aj) = («о, а7) + (Ь - ж0, aj) = (ж0, аД так как вектор b — жо ортогонален любому вектору из L. Под- ставляя в полученные равенства (b,aj) = (®o,«j) запись вектора жо в виде (13.22), приходим к системе линейных уравнений для определения Ж1, Ж2, жз ' «1(01, «1) + Ж2(о2,а1) +®з(°3>°1) = (Ml), < Ж1(а1,а2) + «2(02,02) + «3(03,02) = (М2), Ж1(а1,аз) + ж2(а2,оз) + жз(аз,аз) = (6, аз).
Глава 13. Векторы и пространства 275 Коэффициенты системы (скалярные произведения) подсчитываем по упомянутой выше формуле, например, (ai,ai) = 6-6+4-4 = 52, (01,02) = (02,01) = 6-8 = 48, ит. д. В результате получим ' 52xi + 48x2 + 48хз = 46, < 48xi + 68x2 + 64хз = 58, 48xi + 64x2 + 68x3 = 58. Решая систему, находим xi и 0,22, Х2 = хз ~ 0,39 и вектор хо = (7,56; 0,88; 0,78; 0,78). Соответствующий ему сплав, которым может удовлетвориться плавильщик, содержит 75,6% меди, 8,8% цинка и по 7,8% олова и никеля. На многомерные пространства могут быть перенесены идеи не только евклидовой, но и неевклидовых геометрий. Одним из замечательных примеров этого может служить четырёхмерное «пространство-время», служащее математической моделью спе- циальной теории относительности Эйнштейна. В общем случае многомерные неевклидовы пространства получаются, если видо- изменить определение скалярного произведения, отказавшись от свойства положительности скалярного квадрата (аксиома 4) и за- менив его более слабым свойством. В нашем беглом экскурсе в линейную алгебру мы остановимся ещё на одном из центральных её понятий. Речь идёт о линейных преобразованиях векторного.пространства. Линейным называет- ся такое преобразование А векторного пространства V, для ко- торого выполнены следующие свойства: А(а + Ь) = А(а) + А(Ь) для любых a, b € V, (13.23) А(Ао) = АА(а) для любого а € V и любого скаляра А. Поворот плоскости вокруг начала координат, проектирование трёхмерного пространства на координатную плоскость дают нам
276 Глава 13. Векторы и пространства простейшие примеры линейных преобразований (рис. 64). Линей- ные преобразования имеют самую тесную связь с матрицами. Чтобы это понять, выберем в n-мерном пространстве некото- рый базис в1,в2,... ,вп и рассмотрим образы базисных векто- ров A(ei), А(в2),..., А(еп). Каждый из них, как и всякий вектор пространства, является линейной комбинацией векторов базиса, поэтому мы можем написать ^(ei) = ацв1 + 02162 + ... + ani6n, ^(ез) = 01261 + 022^2 + .. . + ап2бп, 13.24) А(еп) — + О2Пв2 + ... + Сопоставим теперь преобразованию А матрицу ^оц aw ... О1П^ . 021 022 • • • O2n \Ojii dn2 •. . 0>пп/ поместив в каждый её столбец координаты образов A(ei),A(62),...,A(en) базисных векторов в самом этом базисе. Рекомендуем убедиться, что для упомянутых выше примеров линейных преобразований
Глава 13. Векторы и пространства 277 (поворота на угол а и проектирования на плоскость хОу) матри- цы имеют вид соответственно cosa — sin а sin а cosa 10 0 0 10 ООО Оказывается, матрицей А линейное преобразование определено однозначно — зная её, мы можем найти образ любого вектора. Действительно, если л — aiCj + 0262 4- • •• 4- апе„, то, используя свойства (13.23) и равенства (13.24), находим А(а) = A(aiei + агвг 4-... 4- апеп) = = aiA(ei) + а2А(ег) + ... + апА(еп) = = ai(anei 4- 02162 4- — + Onien)+ + 02(012^1 + Й22е2 + . . . + ®п2вп) + 4-... 4- an(ainei 4- 4- • • • 4- а„пеп) = = (aian 4- a2ai2 4-... 4- anain) ei+ 4- • • • 4- (aiOni + a2®n2 4-... 4- otnann) еп. В матричной форме это можно выразить так: чтобы получить координаты образа, нужно матрицу преобразования умножить на столбец вектора а: CH1O21 4- a2®22 4-... 4- ana2n ^ai\ / aian + a2ai2 4-... 4- anain^ CX2 СК1Я21 4- a2®22 + • • • + anO2n \ocnj \a1G71i + a2®n2 4- • • • 4- oifiCinnJ Кроме умножения преобразований, определяемого обычным образом как композиция, имеют смысл операции их сложения и умножения преобразования на число. Суммой преобразований А и В называется такое преобразование А 4- В, что (А 4- В) (а) = А(а) 4- В (а) для любого a G V.
278 Глава 13. Векторы и пространства Соответственным образом определяется и умножение на скаляр (ЛА) (а) = ЛА(а) для любого а € V. Читатель может убедиться, что имеется полная параллель между указанными операциями над линейными преобразованиями и со- ответствующими операциями над их матрицами. Так, произве- дение матриц служит матрицей произведения соответствующих преобразований, аналогично и для двух других операций. При изучении линейных преобразований обычно выделяют различные их классы, обладающие некоторыми дополнительны- ми свойствами. Так, один из важнейших классов составляют так называемые ортогональные преобразования евклидова про- странства, то есть такие, которые сохраняют длину всякого век- тора: |А(а)| = |а|. В случае плоскости и трёхмерного пространства преобразования этого типа исчерпываются поворотами и зеркальными симметри- ями. Эти и другие типы линейных преобразований широко ис- пользуются во многих математических и прикладных вопросах. Дополнения и задачи 1. Мы отмечали, что определение векторного пространства со всеми входящими в него аксиомами имеет смысл и тогда, ко- гда в качестве скаляров используются элементы произвольного поля F. Это поле может быть даже и конечным. Такие поня- тия как линейная зависимость и независимость векторов, базис, размерность, подпространство и т. д. переносятся без изменений и в эту более общую ситуацию1. Дело, конечно, не только в ло- гической возможности подобных обобщений. Важнее то, что во многих теоретических и практических задачах векторные про- странства над теми или иными полями (не обязательно Ж или С) 1 Сказанное не относится, вообще говоря, к тем понятиям, которые исполь- зуют скалярное произведение и расстояние.
Глава 13. Векторы и пространства 279 оказываются полезной математической моделью изучаемого кру- га вопросов, а аппарат линейной алгебры — ценным орудием для его изучения. Позднее (в главе 15) мы познакомимся с тем, как векторные пространства над конечным полем могут применять- ся в теории кодирования, занимающейся вопросами экономной и надёжной передачи информации. 2. Пусть V — п-мерное пространство над конечным полем F, со- держащим q элементов. Докажите, что число векторов такого пространства V равно qn. Вы это легко можете понять, если вспомните, что каждому вектору соответствует строка его координат (а^аг,... ,ап), при- чём в рассматриваемом случае все пробегают элементы конеч- ного поля F. 3. Пусть поле F является расширением поля Р (F D Р). Взгляд со стороны линейной алгебры оказывается удобным и в этой ситу- ации. Элементы расширения F будем считать «векторами», эле- менты Р—«скалярами». Векторы будем складывать в соответ- ствии со сложением, определенным в поле F. Другая операция — умножения позволяет, в частности, рассматривать произведения «вектора» на «скаляр», то есть выражение вида Ха, где а 6 F, А е Р. Все аксиомы векторного пространства (проверьте) будут при этом выполнены, они являются непосредственным следстви- ем определения поля. Значит, расширение можно рассматривать как векторное пространство над своим подполем. В качестве простейшего приложения такой точки зрения мож- но получить следующий результат: число элементов конечного поля есть степень простого числа. Для доказательства достаточно, во-первых, вспомнить, что любое поле F содержит простое подполе (дополнение 4 к гла- ве 9), если F к тому же и конечно, то это простое подполе Р изо- морфно Zp и содержит р элементов. Но тогда F есть векторное пространство над Zp, к тому же и конечномерное (в противном случае F содержало бы бесконечно много элементов). Если п — размерность F над Zp то, согласно пункту 2, число элементов в F равно рп.
280 Глава 13. Векторы и пространства 4. Если F D Р и F имеет конечную размерность п как векторное пространство над Р, то F называется конечным расширением поля Р, а п называется степенью расширения. Например, поле С — конечное расширение поля R степени 2. В качестве базиса можно взять элементы 1 и i; так как всякое комплексное число а + Ы есть их линейная комбинация с ко- эффициентами а, Ь е. R. С другой стороны, поле R не является конечным расширением поля Q. Проверьте, что поле Q(£), где £ / 1 и является корнем куби- ческим из 1, есть конечное расширение поля Q степени 2. Можно доказать — это сложнее — аналогичное утверждение, 2тг . . 2тг „ , . если £ = cos----h г sm---корень р-ои степени из 1 (р — про- Р Р стое). В этом случае Q(£) имеет степень р — 1, а в качестве его базиса над Q могут быть взяты элементы 1,£,£2,...,£р-2. Такие поля, получающиеся в результате присоединения кор- ней из 1, называют круговыми. Их первоисточником, как можно понять, является работа Гаусса о построении правильных много- угольников (см. главу 5). 5. Пусть вновь F — расширение поля Р. Напомним, что элемент а € F называется алгебраическим над Р, если он является кор- нем некоторого многочлена с коэффициентами из Р. В дополне- нии 2 к главе 5 это понятие рассматривалось для случая чис- ловых полей. Теперь мы можем, если угодно, не стеснять себя таким ограничением. Если всякий элемент поля F алгебраичен над Р, то само F на- зывается алгебраическим расширением поля Р. Если F = Р(0), где в — алгебраический элемент, то F называется простым алгеб- раическим расширением поля Р. Существует интересная связь между конечными и алгебраи- ческими расширениями: любое конечное расширение является алгебраическим; любое простое алгебраическое расширение является конечным.
ГЛАВА 14 ВНОВЬ К ИСТОКАМ (О ГАЛУА И ЕГО ТЕОРИИ) «Я сделал в анализе несколько открытий... В тео- рии уравнений я исследовал, в каких случаях они разрешимы в радикалах, что мне дало повод углу- бить эту теорию и описать все преобразования над уравнением, допустимые, даже когда оно и не ре- шается в радикалах». Это выдержка из письма, написанного Э. Галуа накануне сво- ей трагической гибели. В письме, адресованном близкому другу, Галуа кратко излагает содержание своих исследований. Он за- канчивает письмо такими словами: «Часто в своей жизни я решался высказывать пред- ложения, в которых я не был уверен, но всё, что я написал здесь, уже около года в моей голове, и слишком в моих интересах не ошибиться, чтобы можно было заподозрить меня в том, что я объ- являю теоремы, для которых не имел бы полного доказательства. Ты попросишь публично Якоби и Гаусса дать свое заключение не об истинности, а о значении тео- рем.
282 Глава 14. Вновь к истокам (о Галуа и его теории) Надеюсь, после этого появятся люди, которые най- дут свою выгоду в расшифровке всей этой неразбе- рихи». Надеждам Галуа на признание со стороны Гаусса и Якоби, как, впрочем, и других именитых современников, не суждено было, однако, исполниться. И причиной тому были не только исключительная трудность темы и совершенно необычный стиль рассуждений Галуа. Позднее (1846 г.) знаменитый французский математик Жозеф Лиувилль, первый, кто серьёзно разобрался в работах Галуа, скажет: «Референтам показались неясными формулировки молодого математика ... Преувеличенное стрем- ление к краткости породило этот недостаток, которого нужно в первую очередь стараться из- бегать, когда имеешь дело с отвлечёнными и та- инственными категориями чистой алгебры. Тому, кто намерен вести читателя к неизведанной зем- ле, далеко от проторенной дороги, воистину необ- ходима ясность». Однако сам Галуа ничуть не заблуждался ни в оценке истин- ности, ни в оценке значимости своих результатов. Он разве лишь не мог во всей полноте представить, насколько сильно новизна и глубина его идей повлияют на дальнейшее развитие алгебры, вызвав появление в ней многих новых понятий и направлений. Группа Галуа, соответствия Галуа, поля Галуа, когомологии Га- луа — это лишь немногие из словосочетаний, которыми увекове- чено в алгебре и за её пределами имя гениального французского математика. Бесспорно, что на формировании математических интересов юного Галуа сказались прежде всего алгебраические работы Лагранжа и Гаусса. Лагранж, как мы знаем, впервые связал зада- чу разрешимости алгебраических уравнений с совершенно новы- ми принципами, а Гаусс блестяще их реализовал для уравнений деления круга.
Глава 14. Вновь к истокам (о Галуа и его теории) 283 Вспомним, что одним из исходных пунктов мемуара Лагран- жа было то, что симметрические (или иначе, инвариантные отно- сительно группы Sn) функции от корней уравнения принимают значения в основном поле Р. В качестве Р можно взять любое по- ле, содержащее коэффициенты уравнения (у Лагранжа это поле рациональных чисел). Нетрудно убедиться, что в случае общего алгебраического уравнения, то есть уравнения с произвольными буквенными коэффициентами, верно и обратное. Именно, вся- кая рациональная функция f(xi,X2,...,xn), которая на корнях любого уравнения аохп + aia?n-1 + ... + ап = 0 с коэффициента- ми из Р принимает значения, также принадлежащие Р, является симметрической (инвариантной относительно группы Sn). Этими обстоятельствами в сущности и объясняется, почему симметрическая группа оказалась удобным инструментом для анализа общего алгебраического уравнения. Однако в случае конкретного уравнения с заданными число- выми коэффициентами ситуация может оказаться иной — вполне могут найтись рациональные функции f(xi,X2,...,xn), которые на корнях данного уравнения принимают значения в основном поле, вовсе не являясь при этом симметрическими. Нетрудно привести примеры. Так, уравнение х4 - 4х2 + 2 = 0 (14.1) имеет, как показывает вычисление, корни «1 = у/2+л/2, «2 = -^2+4/2, «3 = ^2—\/2, а4 = -^2-\/2, а, например, функции Х1Х2 + Х3Х4, xl + x%, Х2 + Х4 (несимметри- ческие!) принимают на этих корнях рациональные значения: ацаг + «3СС4 = —4, а2 + о2 = «2 + а4 = 4- (14.2) В главе 5 мы уже отмечали, что между корнями конкретного уравнения могут быть соотношения, не являющиеся следствием формул Виета. Именно это обстоятельство и связано с суще- ствованием несимметрических функций 92(3:1, жг» • • • ,#п), прини- мающих на корнях уравнения значения в основном поле Р. Если
284 Глава 14. Вновь к истокам (о Галуа и его теории) ai, «2, • • •, ап — корни уравнения и </?(«!,а2,...,an) = а € Р, (14.3) то равенство (14.3) и будет соотношением между корнями, кото- рое не вытекает из формул Виета. В только что рассмотренном примере подобными соотношениями (не всеми) являются равен- ства (14.2). Рассуждения Лагранжа, справедливые для общего уравнения, очевидно, никак не учитывали специфику конкретных уравне- ний. «Нельзя ли тогда, — задаётся вопросом Галуа, — заменить в этих рассуждениях группу всех подстановок Sn другой груп- пой, которая, с одной стороны, отражала бы особенности данного уравнения, и в то же время, соотносилась бы с ним в каком-то смысле так же, как группа Sn с общим уравнением». Основная мысль, в которой после упорных размышлений утверждается Га- луа, состояла в следующем. Для каждого конкретного уравнения нужно рассматривать не только симметрические рациональные функции f(xi,X2,... ,хп), но и всё такие, которые на его корнях принимают значения из основного поля. А тогда из группы Sn следует оставить множество G лишь тех подстановок, которые не меняют значений указанных рациональных функций. Точнее, если ai,a2,... ,ап — корни, а /(«1,«2, • • • ,«n) = а € Р, то для всякой подстановки а € G , аст(2),..., аа(п)) = °- Например, для уравнения (14.1) такими подстановками будут следующие: /1 2 ai ~ 2 3 3 4\ 4/ ~е’ /1 2 а2 \2 1 3 4 f) =(1,2)(3,4), О J /1 2 аз ~ V 4 3 1 f) =(1,3)(2,4), / А 2 а4 ” 14 3 3 2 f) =(1,4)(2,3), (14.4) и никакая другая подстановка указанным выше свойством не обладает (достаточно в этом убедиться для транспозиций).
Глава 14. Вновь к истокам (о Галуа и его теории) 285 Из предыдущего ясно, что введённое Галуа множество подста- новок (он называет его группой уравнения, а мы будем на!зывать её также группой Галуа) можно охарактеризовать иначе. Это множество G состоит в точности из всех та- ких подстановок а, которые всякое соотношение вида (14.3) между корнями уравнения переводят вновь в верное соотношение > а<г(2) > • • • > аа(п) ) = О, между этими корнями1. Подобным свойством, как можно вспомнить, обладала и цик- лическая группа подстановок, рассмотренная Гауссом в случае уравнения деления круга и оказавшаяся ключом к анализу этого уравнения. Скорее всего, успешный анализ Гаусса и придал исследовани- ям Галуа то направление, которое привело его к понятию группы уравнения. По мысли Галуа эта группа должна была стать тем объектом, который бы вбирал в себя всю информацию о труд- ностях и способах решения каждого данного уравнения. И от того, как она устроена, всецело должен зависеть ответ на во- прос, можно ли свести решение данного уравнения к решению более простых вспомогательных уравнений. Здесь уместно заметить, что строение группы уравнения за- висит не только от самого этого уравнения, но и от того, над ка- ким полем его рассматривают. И это связано с тем, что «свойства и трудности уравнения могут быть сделаны», как отмечает Галуа, «совершенно разными сообразно количествам, которые к нему присоединены. Например, присоединение некоторого количества может сделать приводимым неприводимое уравнение». Простой иллюстрацией служит рассмотренное выше уравнение (14.1). 1 Читатель легко может убедиться, что относительно операции умножения подстановок множество G образует группу в смысле данного в главе 4 опреде- ления. Для множества подстановок (14.4) это можно сделать непосредственным вычислением.
286 Глава 14. Вновь к истокам (о Галуа и его теории) Над полем Q(a/2), получающемся присоединением д/2 (кор- ня многочлена х2 — 2) к основному полю Q, левая часть этого, уравнения и в самом деле разлагается на множители х4 - 4х2 + 2 = (ж2 - 2 + х/2) (ж2 - 2 - Л), а к прежним соотношениям между корнями добавляются ещё и новые, например, aiai2 = ~(2 + \/2), азад = ~(2 - д/2), сцаз = л/2. Это отражается и на группе уравнения, теперь она состоит, как можно понять, всего лишь из двух подстановок: 01 = е, ст2 = (1,2)(3,4). Всякий раз в результате решения вспомогательного уравне- ния мы можем к исходному основному полю присоединить новые величины 01, 02, , 0к~корни этого уравнения, а заданное уравнение рассматривать уже над более широким полем Pi = = P(0i,#2,•••,#*:) —расширением основного поля. Какими же должны быть эти вспомогательные уравнения? Ясно одно: вы- бирать их надо так, чтобы во-первых, решение их являлось бы задачей более простой, чем задача решения исходного уравне- ния, и во-вторых, при переходе к расширению Pi основного поля упростилось бы и решение заданного уравнения. Каким-то обра- зом его группа должна «сводиться» тогда к более простым: груп- пе вспомогательного уравнения над основным полем Р и группе заданного уравнения над расширением Pi. Теперь, когда мы в основных чертах обрисовали замысел Га- луа, попытаемся изложить некоторые из его результатов в пере- воде на язык современной алгебры. Пусть над основным полем Р задано уравнение р(х) = OQXn + ai®n-1 4----h On-ix + On = 0. (14.5) Рассмотрим расширение Г = P(ai,a2,. . ,ап), являющееся по- лем разложения этого уравнения (определение в дополнении 11 к главе 6). Оказывается, с каждой подстановкой а из группы
Глава 14. Вновь к истокам (о Галуа и его теории) 287 Галуа можно связать отображение поля F на себя (будем его обозначать той же буквой, надеясь, что это не вызовет путани- цы). Поступим так. Возьмём произвольный элемент а € F. Если а € Р, то будем считать по определению, что сг(о) = а, то есть отображение, которое мы строим, оставляет элементы основного поля неподвижными. Если же элемент а 0 Р, то он, очевид- но, выражается через корни а\,а2,...,Оп в виде рациональной функции с коэффициентами из основного поля « =/(«ьаг, • • • (14.6) Сопоставим ему элемент ст(а), определённый следующим обра- зом: <т(О!) = / , ^<г(2) , • • • 1 ^сг(п))- Иными словами, ст(а) получается, если в формуле (14.6) переста- вить корни 0:1,02, • • • ,ап согласно подстановке а. Данное опре- деление нуждается, правда, в пояснении. Дело в том, что запись вида (14.6) для элемента а может оказаться не единственной. Нужно проверить поэтому, что образ <т(о) не зависит от того, в какой форме элемент а выражен через корни. Если o = /i(oi,o2,...,on) — другая запись, выражающая элемент а в виде рациональной функции от ••• ,ап, то для проверки «корректности» на- шего определения мы должны убедиться, что из равенства /(ai, а2,ап) = fa (ai,a2, • ••,<*«) (14.7) следует также, что и /(Q:a(l), ®<т(2)> • • •, а<г(п)) =/1(^<г(1), ^а(2)> • • • , (14-8) Однако равенство (14.7) является соотношением между корня- ми. Умножая, если угодно, обе его части на /1(01,02, • • • ,a:n)_1, можно привести это соотношение к виду (14.3) /i(oi,o2,...,on)-1 • f(ot1,a2,...,an) = 1. (14.9)
288 Глава 14. Вновь к истокам (о Галуа и его теории) Поскольку подстановки из группы Галуа всякое верное со- отношение между корнями переводят в верное соотношение, то справедливо равенство /1(®<г(1)> ^<г(2)> • • • > ^сг(п)) ‘ /1(®а(1)> ®<z(2)> • • • > ^<т(п)) а значит, и (14.8). Ясно, что отображения поля F, порождённые двумя взаимно обратными подстановками а и а-1 будут также взаимно обратны- ми друг другу. Раз так, то всякое отображение поля F, получен- ное указанным выше образом, является взаимно однозначным. И последнее, если а = f(ai,a2,...,an) и ft = <p(ai,a2,... ,otn), то, очевидно, <Т(О! + /3) = / (а<7(1), aff(2), • • •, О1а(п) ) + На<7(1), аа(2), • • •, <*а(п)) = = а(а) + а(0), <т(а:/3) = f (CKcrfl), аа(2) >•••> ®a(n) ) > ®<т(2) > • • • > ^cr(n) ) = = ff(a) <t(/3). Всё сказанное означает, что отображение a: F —> F является автоморфизмом поля F. Напомним,что автоморфизм поля —это его изоморфизм на себя. Итак, каждой подстановке группы Галуа уравнения (14:5) соответствует автоморфизм поля разложения F этого уравнения, оставляющий на месте всякий элемент основного поля. Не составляет труда установить, что верно и обратное утвер- ждение, а именно: всякому автоморфизму поля разложения F = P(ai,O!2, • • • ,ап) данного уравнения, оставляющему неподвижными элементы основного поля Р, отвечает подстановка из группы Галуа этого уравнения.
Глава 14. Вновь к истокам (о Галуа и его теории) 289 Действительно, пусть —корень уравнения (14.5), то есть справедливо равенство p(ai) = aoaf + aia”-1 Ч---1- On-iOi Ч- an = О, и а' = ст(аг) — образ при автоморфизме а. Тогда, с одной стороны, a(p(o!i)) = ff(0) = О, а с другой — а(р(«г)) = аоа'™ + aia<n-1 Ч--h On-ia'i + ап = 0. Следовательно, оо<^г + aiai Н------И + ап = 0, и значит, а'—также корень уравнения (14.5). Таким образом, всякому автоморфизму а отвечает подстановка на множестве корней уравнения, и очевидно, такая, которая сохраняет соот- ношения между корнями. В итоге мы получили несколько иное и часто более удобное описание группы уравнения: группа Галуа уравнения (14.5) с коэффициентами из основного поля Р состоит из всех автоморфиз- мов поля разложения F этого уравнения, кото- рые оставляют неподвижными элементы основно- го поля. Будем далее её обозначать GalF/P, называя её также группой Галуа поля разложения или группой Галуа F над Р. Вообще говоря, не всякое расширение F основного поля Р яв- ляется полем разложения некоторого многочлена (примером мо- жет служить Q(\/2)). Особая важность полей разложения и их групп Галуа определяется прежде всего следующими двумя об- стоятельствами. А. Если t(x) — произвольный многочлен, неприводимый над полем Р, и поле разложения F содержит хотя бы один его корень, то это поле содержит и все другие корни многочлена t(x).
290 Глава 14. Вновь к истокам (о Галуа и его теории) В. Если £ — один из корней неприводимого над Р многочлена t(x), то все другие его корни можно получить, действуя на £ автоморфизмами из группы Галуа GalF/P. Иначе говоря, если г] —любой корень t(x), то существует та- кой автоморфизм а € GalF/P, что т? = <т(£). Рассуждения, которые устанавливают справедливость утвер- ждений А и В, составляют суть теории Галуа. Вот эти рассуж- дения. Пусть F = Р(а1,аг,... ,ап) — поле разложения многочлена р(х) и £ — один из корней неприводимого над Р многочлена t(x). Тогда, как известно, £ = 5(011, аг, • • •, ап), где 5(®1, х2, • • •, ®п)— рациональная функция от переменных xi,X2,...,xn. Пусть а е € Sn — произвольная подстановка /1 2 3 ... п\ а = .. . . . 1. V1 г2 »з ••• гп/ Определим функцию gff(xi,Х2,..., хп), полагая v ®2, • • • , %п) = 5(®<г(1) , ®<г(2)» • • • , ®a(n)) = 9(х*1 > > • • • > xin)’ ИНЫМИ словами, производя В ИСХОДНОЙ функции g(xi,X2,... ,Хп) перестановку аргументов, соответствующую подстановке а. Для удобства занумеруем все подстановки из Sn: е = ci,аг,о'з, • • •,ад.,...,ani. Для каждой из них будем иметь тогда функцию 9ak (®1> ®2, • • •, ®п), к = 1,2,..., п!, определённую выше (при этом заметим, что gai(®i,«2, • • •,хп) = = д(хг,Х2,... ,хп)). Обозначим, наконец, p<zfc(ai,a2,...,ап) = = Рассмотрим теперь многочлен п! п! = П(-^) = Т[(х - 9^^1,012, ,ап)). к=1 к=1
Глава 14. Вновь к истокам (о Галуа и его теории) 291 Его коэффициенты являются элементарными симметрическими многочленами от Нетрудно понять (вспомните аналогичные рассуждения Лагранжа из главы 3), что тогда эти коэффици- енты будут также симметрическими рациональными функциями от корней (ai,a2,. ,ап) многочлена р(х). Отсюда следует, что коэффициенты многочлена G(x) выражаются рационально через коэффициенты р(х) и поэтому принадлежат основному полю Р. Построенный многочлен имеет общий корень £ с неприводи- мым многочленом t(x), но такое возможно, в силу неприводи- мости, лишь тогда, когда t(x) является делителем G(x). Значит, все корни t(x) содержатся среди элементов и следовательно, принадлежат полю разложения F. Этим доказано утверждение А. Для доказательства предложения В удобней всего воспользо- ваться теоремой о примитивном элементе (дополнение 12 к гла- ве 6). Попутно мы получим очень простое описание автоморфиз- мов группы GalF/P. Согласно упомянутой теореме всякое конеч- ное расширение F D Р содержит такой элемент 0, что F = Р(0). Если т — степень его минимального многочлена р(х), то, как от- мечалось в дополнении 9 главы 6, всякий элемент поля F имеет однозначную запись вида ТП—1 Ci€P. (14.10) i=0 Рассмотрим наряду с 0 и все другие корни многочлена р(х); 0г = 0,02, ,0т (напомним, что все они согласно А принадле- жат полю F). Понятно, что P(0k) Q Р(0), но, кроме того, степени обоих по- лей над Р совпадают. Поэтому Р(^) = Р(0). Значит, для любого фиксированного k = 1,2,..., т множество элементов вида т—1 £<4 Ci€P, (14.11) 1=0 так же, как и (14.10), исчерпывает всё поле F.
292 Глава 14. Вновь к истокам (о Галуа и его теории) Рассмотрим для каждого к = 1,2,..., т отображение с?к: F —> —> F, полагая (т—1 \ т—1 Y/cioi] = '£ciei. (14.12) г=0 / г=0 Очевидно, отображение ок взаимно однозначно. Легко видеть также и то, что оно является автоморфизмом. Последнее объяс- няется тем, что правила сложения и умножения элементов вида (14.11) такие же, как и для элементов (14.10). Оказывается, по- строенные отображения ст*. исчерпывают все автоморфизмы груп- пы Галуа GalF/P. В самом деле, если ст € GalF/P, то ст(0) яв- ляется корнем многочлена /г(я), а потому совпадает с одним из элементов Ок- Но тогда из определения автоморфизма следует ра- венство (14.12). Это и значит, что произвольный автоморфизм ст совпадает с одним из описанных выше автоморфизмов ст* и GalF/P = {cti,ст2,...,стт}. Заметим, что попутно мы установили такой факт. С. Порядок группы Галуа GalF/P совпадает со степенью расширения F над Р. Он равен также степени многочле- на р(х), минимального для примитивного элемента 0. Утверждение В доказывается теперь так. Подействовав на ко- рень £ произвольного неприводимого многочлена t(x) автомор- физмами из группы Галуа, получим элементы h = £т = <гт(& (14.13) Среди всех перечисленных элементов не все обязательно различ- тп—1 ны. Все они являются корнями £(я), при этом, если £ = atO\ i=0 т—1 то & = 52 ai^k- Нам нужно убедиться, что элементами £*. ис- г=0 черпываются все корни t(x). Рассмотрим с этой целью многочлен /(я) = (х - С1)(® (х- $„),
Глава 14. Вновь к истокам (о Галуа и его теории) 293 также имеющий указанные элементы своими корнями. Повто- рив рассуждения, проведённые ранее для многочлена G(x), мы убеждаемся, что коэффициенты /(ж) являются симметрическими функциями от 01, 02, • • 0т, а значит, принадлежат основному полю. Неприводимый многочлен t(x) является тогда делителем /(ж), и потому не имеет корней, отличных элементов (14.13). Утверждение В доказано. Установленные факты ощутимо приближают нас к цели. Так, утверждение А показывает, что если вспомогательный многочлен t(x) имеет хотя бы один корень из поля F, то тогда в F цели- ком содержится и всё поле разложения К этого многочлена. Из утверждений А и В также следует, что всякий автоморфизм а € € GalF/P является одновременно автоморфизмом любого друго- го поля разложения К С F. В самом деле, пусть а е. К и /га(ж) — его минимальный много- член. Согласно В элемент ст(а), так же, как и а, является корнем этого многочлена, но тогда из А вытекает, что сг(а) € К. Это и нужно было установить. Рассмотрим теперь цепочку полей FDKDP и соответствующие группы Галуа GalF/K и GalK/P. Возникает вопрос, как связаны эти группы с группой GalF/P исходного уравнения? Ясно, во-первых, что всякий автоморфизм h, принадлежащий GalF/K, также принадлежит и GalF/P (дей- ствительно, h оставляет неподвижным все элементы поля К, а значит, и поля Р). Следовательно, GalF/K является подгруп- пой в группе GalF/P. Заметим, что левые смежные классы по этой подгруппе состоят из всех подстановок, одинаково преобра- зующих каждый элемент а € К (сравните с главой 3). Действи- тельно, = <т*;(а) для всякого автоморфизма h € GalF/K. Легко видеть, что верно и обратное: всякий автоморфизм а та- кой, что ст(а) = afc(a), содержится в смежном классе {сгдЛ | h € € GalF/K} (проверьте). Но оказывается, что таким же свой- ством обладают и правые смежные классы {hctk I h € GalF/K}. Ведь о (а) 6 К (это было установлено чуть выше), и следова- тельно, /iCTfc(a) = <Tfc(a). Таким образом, каждый левый смежный
294 Глава 14. Вновь к истокам (о Галуа и его теории) класс {a^h | h G GalF/K} совпадает с соответствующим пра- вым смежным классом {ha^ | h 6 GalF/K},— оба они состоят из всех автоморфизмов, преобразующих всякий элемент а € К в элемент ст*, (а). Иными словами, мы установили следующее. Утверждение 1. Если К С F — поле разложения некоторого вспомогательного многочлена t(x) с ко- эффициентами из Р, то группа Галуа GalF/K яв- ляется нормальным делителем в группе GalF/P ис- ходного уравнения. Вместе с тем выяснено и нечто большее. Ранее мы уже отме- чали, что всякому элементу а е GalF/P отвечает автоморфизм промежуточного поля К, то есть элемент группы GalK/P. Прав- да, разным элементам а и о' из группы GalF/P вполне может соответствовать один , и тот же автоморфизм этого промежуточ- ного поля. Предыдущие рассуждения показывают, что так будет в том и только том случае, когда ст и ст' принадлежат одному и тому же смежному классу по подгруппе GalF/K. Следователь- но, между указанными смежными классами (они, как мы знаем, являются элементами факторгруппы GalF/Р/GalF/K) и авто- морфизмами поля К можно установить взаимно однозначное со- ответствие. Смежному классу {ah | h Е GalF/K} соответству- ет автоморфизм а поля К, определённый так: а (а) = ст(а) для а € К. Из этого определения ясно, что произведению смежных классов {ah | h G GalF/K} и {rh | h Е GhiF/К} будет отвечать произведение соответствующих им автоморфизмов а и т. Значит, описанное соответствие является изоморфизмом. Окончательный вывод таков: Утверждение 2. Группа Галуа GalK/P промежуточ- ного поля разложения К изоморфна факторгруппе GalF/P/GalF/K. Утверждения 1 и 2 дают нам точное описание того, каким об- разом группа Галуа GalF/P исходного уравнения сводится к бо- лее простым группам GalF/K и GalK/P в том случае, когда су- ществует вспомогательное уравнение t(x) = 0, поле разложения К которого является промежуточным между Р и F.
Глава 14. Вновь к истокам (о Галуа и его теории) 295 Можно доказать и факт, в некотором смысле обратный к утверждениям 1 и 2, а именно: Утверждение 3. Пусть F D Р — поле разложения многочлена f(x) и G = GalF/P — его группа Галуа. Тогда, если Н — нормальный делитель в G, то су- ществует такое промежуточное подполе К (Р С С К С F), также являющееся полем разложения некоторого многочлена, что # = GalF/K и G/№GalK/P. С доказательством этого факта, а также с обстоятельным и од- новременно доступным изложением теории Галуа рекомендуем познакомиться по книге [24]. Ограничимся лишь замечанием, что в качестве поля К, о котором говорится в утверждении, сле- дует взять множество всех элементов из F, которые остаются неподвижными при автоморфизмах из подгруппы Н: К = { k G F | h(k) = к для всякого h е Н }. Как могут быть использованы только что сформулированные утверждения для ответа на вопрос о разрешимости уравнений в радикалах? Чтобы это понять, вспомним следующее. Решение вспомогательного уравнения ti(ar) = 0 позволяет расширить за- пас чисел, присоединяя его корни 6i к исходному (основному) по- лю Р и переходя к новому основному полю Pi = P(<?i,... ,6k) — полю разложения многочлена ti(x). Причем, если хотя бы один из корней 0г е F, то и всё поле Pi С F. Последовательное ре- шение нескольких вспомогательных уравнений (корни которых принадлежат F) fl (я) = 0; ti(x) = 0; ...; tT(x) = 0 равносильно последовательному присоединению корней, сначала многочлена ti(x), затем tz(x) и т.д. Это приводит к цепочке рас- ширений Р = Ро С Pi С Р2 С ... С Рг. (14.14)
296 Глава 14. Вновь к истокам (о Галуа и его теории) В ней каждое поле Р; является полем разложения соответству- ющего многочлена Ц(х), для которого основным полем является предыдущий член цепочки Pj_i. При этом все поля Р» С F. Если оказалось так, что все корни уравнения /(ж) = 0 можно рационально выразить через корни вспомогательных уравнений, то это означает, что последний член цепи (14.14) совпадает с по- лем разложения многочлена /(ж), то есть Р = Р0 CPi СР2 С ... СРГ = Р. (14.15) Из утверждений 1, 2, 3 непосредственно вытекает, что наличие такой цепи равносильно существованию в группе Галуа G = = GalF/P убывающей последовательности подгрупп С = С0ЭС1ЭС2Э...Э(^Э...ЭСг = {е}. (14.16) При этом Gi — нормальный делитель в Gj-i, Gi = GalF/Pj и Gi—\/Gi — GalPj/Pj—i. Этот общий результат даёт решение исходной задачи о разре- шимости уравнения в радикалах. Действительно, разрешимость в радикалах .равносильна тому, что корни заданного уравнения могут быть выражены рационально через корни последовательно решаемых двучленных уравнений жП1 - ai = 0, жП2 - а2 = 0, ..., жПг - аг = 0, (14.17) где ai принадлежит основному полю Р, а2 — полю разложения многочлена жП1 — ai и т. д. С устройством группы Галуа Н дву- членного уравнения хп — а разобраться уже не так сложно. Она, как можно показать, либо циклическая, либо содержит цикличе- скую нормальную подгруппу Н\, факторгруппа по которой Н/Н\ также циклическая. Значит, если цепи (14.14) и (14.15) соответ- ствуют решаемым двучленным уравнениям (14.17), то каждая из факторгрупп Gi-i/Gi устроена так, как было только что сказано. Дело техники теперь доказать, что для разрешимости уравнения /(ж) = 0 в радикалах необходимо и достаточно, чтобы в группе Галуа GalF/P этого уравнения существовала убывающая цепь подгрупп G = Go Э Gi D G2 Э ... D Gi Э ... D Gs = {е}
Глава 14. Вновь к истокам (о Галуа и его теории) 297 такая, что Gi — нормальный делитель в Gj-i, и каждая фактор- группа Gi-i/Gi является циклической. Группы указанного строе- ния так и называются разрешимыми, а высказанное здесь утвер- ждение (это и есть знаменитый критерий разрешимости в ради- калах) короче можно сформулировать так: уравнение f(x) = 0 разрешимо в радикалах тогда и только тогда, когда его группа Галуа разрешима. Указав этот критерий, Галуа дал также принципиальный спо- соб для отыскания группы любого уравнения. Он выяснил кроме того, что для каждого п существует такое уравнение степени п, группа которого совпадает с симметрической группой Sn (т.е. такова же, что и для общего уравнения). Уже для п = 5, как и для всех больших значений п, группа Sn оказывается неразре- шимой1. Отсюда и следует, что для каждого п > 5 существуют алгебраические уравнения, не разрешимые в радикалах. Теория Галуа уже при своём создании имела намного более общий характер, чем та задача, ради решения которой она бы- ла построена. Это отмечал и сам автор. Вспомните его выска- зывание, приведённое в начале этой главы. Действительно, для любого уравнения, быть может и не разрешимого в радикалах, можно ставить вопрос, к цепи каких наиболее простых уравне- ний сводится его решение. Соответствие между подполями поля разложения и подгруппами группы Галуа, о которых (оно назы- вается соответствием Галуа) говорится в утверждениях 1, 2 и 3, позволяет отвечать на вопросы подобного типа. Мы рассказали здесь о теории Галуа числовых полей, одна- ко основные её положения могут быть распространены на про- извольные поля и другие алгебраические объекты. В наиболее широком смысле теория Галуа —так её понимают современные алгебраисты — это теория, изучающая те или иные математиче- ские структуры на основе их групп автоморфизмов. Хотим под- черкнуть также, что наряду с другими учёными, весомый вклад в развитие этой теории внесли российские математики. Среди них должны быть особо отмечены замечательные алгебраисты 1 Доказательство этого можно найти, например, в [24] или в [5]. 10—261
298 Глава 14. Вновь к истокам (о Галуа и его теории) Н. Г. Чеботарёв (1895-1947) и И. Р. Шафаревич (род. в 1923 г.). Так, один из глубоких результатов, полученных Шафаревичем, связан с так называемой обратной задачей теории Галуа, и по- ныне до конца не решённой: всякая ли группа подстановок служит группой Галуа некоторого алгебраического уравнения? И. Р. Шафаревич доказал, что это, во всяком случае, верно для разрешимой группы подстановок.
ГЛАВА 15 ПОЛЯ ГАЛУА И КОДИРОВАНИЕ Кодирование — одна из тех сравнительно новых прикладных об- ластей, где алгебра заявляет о себе в полный голос. В решении земных (порой и космических) проблем сегодняшнего дня, свя- занных с передачей информации, не обойтись без синтеза раз- личных разделов алгебры, в том числе теории групп, полей, ли- нейной алгебры. Читатель, знакомый с популярной книгой [2], видимо, может составить об этом пускай и неполное, но всё же достаточно широкое представление. Избегая излишних повторе- ний, мы хотим здесь несколько глубже вникнуть в задачи по- строения и реализации помехоустойчивых кодов и более выпук- ло осветить роль алгебры в решении этих задач. Известно, что при передаче информации по линиям связи символам или бук- вам передаваемого текста, а иногда и целым словам или фразам (сообщениям) сопоставляются определённые комбинации сигна- лов (электрических, магнитных и т.д.), называемые кодами, или кодовыми словами. Читателю, видимо, знаком код, который связан с именем изоб- ретателя телеграфного аппарата Сэмюэля Морзе —азбука Мор- зе. В этом коде каждой букве или цифре сопоставляется своя последовательность из кратковременных (называемых точками) и длительных (тире) импульсов тока, разделяемых паузами. Дру- гой код, столь же широко распространённый в телеграфии (код Бодо), использует для кодирования два элементарных сигнала— импульс и паузу, при этом сопоставляемые буквам кодовые слова состоят из пяти таких сигналов. Коды, использующие два раз- ю»
300 Глава 15. Поля Галуа и кодирование личных элементарных сигнала, называются двоичными. Удобно бывает, отвлекаясь от их физического смысла, обозначать эти два сигнала символами 0 и 1. Тогда кодовые слова можно пред- ставлять как последовательности из нулей и единиц. Нередко наряду с двоичными кодами применяют и коды, ис- пользующие не два, а большее число элементарных сигналов, или иначе, кодовых символов. Их число q называют основанием кода, а множество кодовых символов — алфавитом. Операцию перевода сообщений в кодовые слова называют кодированием, а обратную операцию, восстанавливающую по принятым сигналам передаваемые сообщения, — декодированием. Казалось бы, ничего особенно сложного тут нет, однако это не со- всем так. Дело в том, что в реальных каналах связи, по которым происходит передача информации, всегда присутствуют помехи или, как говорят иначе, «шумы», природа которых может быть самой различной. Накладываясь на передаваемые сигналы, они вызывают их ис- кажения, и принятая адресатом информация может поэтому со- держать ошибки. Действие шумов, конечно, можно ослабить, но устранить его полностью нельзя. Как же в таком случае обеспе- чить надёжность передачи? Ясно, что необходим какой-то кон- троль передаваемой информации. Самый незатейливый способ его организовать состоит в том, что каждый информационный символ повторяется несколько раз, скажем, символ 0 заменяет- ся блоком из п нулей, а символ 1 — блоком из п единиц. При декодировании n-буквенного блока, содержащего, быть может, ошибочные символы, решение нужно принимать «большинством голосов». Если в принятом блоке нулей больше, чем единиц, то он декодируется как 00... 0 (т. е. считается, что был послан нуле- вой символ), в противном случае — как 11... 1. Такое правило де- кодирования позволяет верно восстановить посланные символы, если помехи в канале искажают менее половины символов в каж- дом блоке. Указанный код (его называют кодом с повторением) не имеет большого практического значения. Для эффективного контроля может потребоваться слишком много лишних симво- лов. Однако он содержит в себе основной принцип построения помехоустойчивых кодов: для того, чтобы выявлять возможные
Глава 15. Поля Галуа и кодирование 301 при передаче ошибки, надо вводить дополнительные избыточные символы. Эти новые символы уже не несут информации о пере- даваемых сообщениях, но могут дать информацию о происшед- ших ошибках, иными словами, они как раз и контролируют пра- вильность передачи кодового слова. Вводимые дополнительные символы в отличие от информационных называют проверочными (или контрольными). Рассмотрим два примера, иллюстрирующих сказанное. 1. Код с проверкой на чётность. Пусть — двоичное кодовое слово (а» = 0; 1). Добавим к нему всего лишь один про- верочный символ an+i, положив ап+1 = «1 + «2 + • • • + ап (mod 2). Проверочный символ ап+1 будет равен нулю, если в сло- ве ctia2 • • • «п содержится чётное число единиц, и единице — в противном случае. Например, присоединяя таким способом проверочный символ к слову 1010, получаем слово 10100, а из слова 1110 получим слово 11101. Очевидно, все удлинённые кодовые слова а^аъ... anan+i со- держат чётное число единиц, то есть всегда «1 + «2 + • • • + ап + an+i = 0 (mod 2). (15.1) Допустим, что в процессе передачи в удлинённое слово ai«2 • • • ... anan+i вкралась одна ошибка (или даже любое нечётное чис- ло ошибок). Тогда в искажённом слове число единиц станет нечётным. Это и служит указанием на искажение в передаче слова. В конечном итоге всё сводится к проверке соот- ношения (15.1) для символов принятого слова, что легко сделает простейшее вычислительное устройство — сумматор по модулю 2. Итак, правило приёма следующее: если равенство (15.1) выполня- ется, считаем, что сообщение передано правильно, в противном случае отмечаем, что произошла ошибка, и, когда это возможно, требуем повторить передачу кодового слова. Понятно, что ина- че ошибки не исправить. Например, если принять «неправильное слово» 11100, то одинаково возможно, что было послано любое
302 Глава 15. Поля Галуа и кодирование ИЗ КОДОВЫХ слов 01100, 10100, 11000, 11110, 11101. Каждый из перечисленных случаев соответствует одной ошиб- ке, а ведь ошибки могли произойти даже и в большем числе символов. Ещё большая неприятность подстерегает нас в случае двойной ошибки или вообще чётного числа ошибок. Ведь тогда соотношение (15.1) не нарушится, и мы воспримем искажённое слово как верное. Описанный код, который и называют кодом с проверкой на чётность, позволяет, следовательно, обнаружить любое нечётное число ошибок, но «пропускает» искажения, если число ошибок чётно. В реальных каналах связи, как правило, приходится считать- ся с возможностью ошибок более чем в одном символе, поэтому в чистом виде код с проверкой на чётность применяется редко. Гораздо чаще применяют коды с несколькими проверочными сим- волами. Они позволяют не только обнаруживать, но и исправлять ошибки, и не только одиночные, но и кратные. 2. Код Хемминга — важный пример кода, исправляющего любые одиночные ошибки. Для простоты рассмотрим случай, когда для кодирования используются двоичные слова «хаг^з^д длины 4 (понятно, что таких слов имеется 16). Мы уже представляем, что одного проверочного символа для исправления ошибок (даже одиночных) недостаточно. Нетрудно убедиться, что не хватит для этой цели и двух проверочных символов. Попробуем обойтись тремя, действуя следующим образом. Добавим к каждому слову аха^азсм три символа 015, ау так, чтобы выполнялись следующие соотношения: ' «4 + «5 + СПб + а7 = 0 < ск2 + оиз + сие + осу = 0 (15.2) «1 + «з + «5 + «7 = 0 (здесь и далее все равенства берутся по модулю 2). Можно со- образить, что этими соотношениями дополнительные символы
Глава 15. Поля Галуа и кодирование 303 определены однозначно, причём, {<*5 = а2 + «3 + «4 «6 = cti + а3 + щ «7 = «1 + «2 + «4- Следовательно, кодовых слов 01020304050307 длины 7, симво- лы которых удовлетворяют соотношениям (15.2), также 16. Они и образуют рассматриваемый здесь код Хемминга с 4-мя инфор- мационными символами. Предположим теперь, что в кодовом слове кода Хемминга про- изошла одиночная ошибка. Выясним, как это отразится на равен- ствах (15.2), их левые части обозначим соответственно Si, S2, S3. Понятно,что первое из них сохранится лишь в том случае, если символы «4,05,«в,07 переданы верно, а ошибка содержится в од- ном из символов ai, 03, а3. Тогда Si = «4 + «5 + 03 + 07 = 0, в противном же случае Si = 1. Как бы то ни было, значение S2 = аг + аз + 03 + 017 снова позволяет уточнить местоположе- ние ошибки. Так, если Si = 1, a S2 = 0, то ошибка содержится либо в щ либо в 05. Всего имеется четыре комбинации значе- ний Si и 8г- Они приведены в таблице 14 (в ней же указаны возможности для положения ошибочного символа) Таблица 14. S1 S2 Место ошибки 1 1 OLQ ИЛИ OJ7 1 0 ад или as 0 1 а2 или аз 0 0 нет ошибки или ai В каждом из четырёх случаев нужно выбрать одну из двух возможностей. Сделать это позволяет значение суммы S3 = ai + а3 + «5 + 07. Итак, значения Si, S2, S3 позволяют либо установить, что ошиб- ки нет (если Si = S2 = S3 = 0, и значит, принятое слово удо-
304 Глава 15. Поля Галуа и кодирование влетворяет всем проверочным соотношениям), либо однозначно указать её место. Отметим особо, что если произошла одиночная ошибка, то её положение указывается числом с двоичной запи- сью S1S2S3. Пусть, например, Si = 1, S2 = 1, S3 = 0. Согласно таблице 14 ошибка допущена в шестом или седьмом символе; поскольку S3 = 0, она — в шестом символе, но S1S2S3 = 110 как раз и есть двоичная запись числа 6. В общем случае кодовое слово двоичного кода Хемминга, позволяющего исправить лю- бую одиночную ошибку, имеют длину 2m — 1 (т — натуральное). Для определения положения ошибки тогда уже нужно т прове- рок, то есть т проверочных символов. Оставшиеся 2т — 1 — т символов являются информационными. Проверки строятся по аналогии с рассмотренным случаем, а их значения, как и вы- ше, образуют номер положения ошибки. Информацию об этом, а также о расширенном коде Хемминга, не только исправляющем одиночные, но и обнаруживающем двойные ошибки можно найти в уже упомянутой книге [2]. Приведённые примеры обозначают общий алгебраический под- ход к построению помехоустойчивых двоичных кодов. Каждое двоичное слово х±Х2 ...хп можно отождествить с вектором (xi,X2, .. ,хп) n-мерного координатного пространства Ln над полем Z2 = {0,1}. Те из векторов, которые соответствуют ко- довым словам, будем называть кодовыми векторами. Кодовые векторы выделяются среди прочих тем, что их координаты обяза- ны удовлетворять некоторой системе проверочных соотношений, которая, как и в рассмотренных примерах, представляет из себя систему линейных уравнений Ь11®1 + &12®2 + • • • + binxn = 0 &21®1 + &22®2 + • • • + Ъ2пХп = 0 (15.3) k bjnlXl + Ьт2Х2 + ... + Ьтпхп — 0 с коэффициентами by из Z2. Соотношения (15.3) называют про- верочными. Введённые понятия имеют смысл не только для двоичных кодов. Они легко обобщаются и на тот случай, когда кодовый
Глава 15. Поля Галуа и кодирование 305 алфавит является произвольным конечным полем F. Только то- гда кодовые векторы являются, понятно, элементами векторно- го пространства над полем F, точно так же, над этим полем рассматриваются и проверочные соотношения (15.3), которым эти векторы удовлетворяют1. Для кода, удовлетворяющего ра- венствам (15.3) выполняется следующее свойство: если векто- ры (ai, аг,..., ап) и (bi, 1>2,..., Ьп) являются кодовыми, то и их сумма (ai +£>i, аг + &2> • • •, Оп + &п) также является кодовым век- тором. Справедливо и другое свойство решений системы (15.3): если а — элемент поля и (ai, аг,..., ап) — решение этой систе- мы, то и вектор (aai, ааг,..., аап) также является её решением. Оба отмеченных свойства проверяются непосредственной подста- новкой в систему (15.3) векторов (ai + bi, аг + Ьг, • • •, «п + Ъп) и (aai, ааг,..., аап). Вместе эти свойства означают на языке линейной алгебры, что кодовые слова образуют линейное под- пространство в пространстве Ln всех n-буквенных слов (векто- ров). По этой причине такие коды называют линейными (двоич- ные линейные коды называют также групповыми). Если кодовое пространство в пространстве Ln имеет размерность к то употреб- ляют для большей определённости термин линейный (п, &)-код. Конечно, для кодирования сообщений не всегда применяют линейные коды, но всё же они являются важнейшим классом по- мехоустойчивых кодов и на это есть немало причин. Одна из них связана с удобствами в обнаружении и исправлении ошибок, что хорошо видно из рассмотренных выше примеров. Другая причи- на — это возможность компактного задания кода. Действительно, в случае линейного кода нет необходимости указывать полный список кодовых слов, ведь код вполне определён системой линей- ных уравнений (15.3) или матрицей этой системы (проверочной матрицей): bi2 ... bin^ JJ _ &21 &22 ... &2п \&п1 &п2 Ьпп/ 1 Последнее означает, что bij G F, и все действия выполняются в соответ- ствии с «арифметикой» поля F.
306 Глава 15. Поля Галуа и кодирование В дальнейшем мы будем предполагать, что строки этой матрицы линейно независимы. К числу других достоинств линейных кодов, которые связа- ны с предыдущими, относятся простые алгоритмы кодирования и декодирования, легко реализуемые электронными схемами. Во- обще, можно сказать, что бурное развитие теории кодирования объясняется главным образом тем, что к линейным кодам при- ложим хорошо развитый аппарат линейной алгебры и теории ко- нечных полей. Читатель легко сообразит, как устроены проверочные матрицы ранее рассмотренных кодов. Так, для кода с проверкой на чёт- ность имеем одно проверочное соотношение х± + х% + ... +хп = = 0, соответственно этому проверочная матрица состоит из одной строки и имеет вид Н = (1 1 1 ... 1). Проверочная же матрица двоичного кода Хемминга длины 7 вы- глядит так (сравните с (15.2)): /0 0 0 1 1 1 1\ Я = 0 1 1 0 0 1 1 . (15.4) \1 о 1 0 1 0 1/ Другой способ матричного задания линейного кода основыва- ется на том, что во всяком подпространстве линейного простран- ства можно выбрать базис, то есть такую линейно независимую систему векторов, через которые линейно выражаются все век- торы подпространства. Пусть «1 = (ап, «12, • • •, О1п)> ..................................... (15.5) Ofc = (а&1, ®fc2> • • • > ®кп) — базисные векторы линейного кода. Тогда всевозможные кодо- вые векторы исчерпываются линейными комбинациями + О!2Я2 + • • • + Otfcfljfe, (15.6) где коэффициенты — любые элементы исходного поля.
Глава 15. Поля Галуа и кодирование 307 Таким образом, система базисных векторов (15.5) полностью определяет линейный (п, &)-код. Матрица G, составленная из них, G = («и 021 012 • «22 • • • а1п^ а2п (15.7) \Ofci «fc2 • • • О>кп) называется порождающей матрицей кода. Например, в качестве базисных векторов двоичного кода с проверкой на чётность могут быть взяты следующие п — 1 векторов щ = (1,1,0,0,...,б), 02 = (1,0,1,0,... ,0), а3 = (1,0,0,1,... ,0), On-i = (l, 0,0,0,...,!). Поэтому матрица /1 1 0 0 .. .. 0\ 1 0 1 0 .. .. 0 G — 1 0 0 1 .. .. 0 V 0 0 0 .. .. 1) является порождающей матрицей этого кода. В общем случае для отыскания порождающей матрицы ко- да, заданного системой проверочных соотношений (15.3), нужно фактически найти к = п—т линейно независимых решений этой системы. Найденные решения, являющиеся базисными кодовы- ми векторами, как раз и будут строками порождающей матрицы. Пользуясь этим методом, найдём порождающую матрицу кода Хемминга длины 7 с проверочной матрицей (15.4). В данном слу- чае требуется найти 4 независимых решения следующей системы ®4 + = 0 Х2 + Хз + Хб + Х7 = 0 Х1 + Хз + Хз + Х7 = 0.
308 Глава 15. Поля Галуа и кодирование Разрешаем систему относительно неизвестных ®i, Х2, а?4 + ®7, Х2 = Хз + + Х7, Х4 = Х5 + Хб + Х7- (15.8) Неизвестным хз, хз, xq, Х7 можно придавать любое из значений (О или 1), тогда из равенств (15.8) могут быть определены осталь- ные неизвестные. Придавая поочерёдно одному из неизвестных хз, хз, xq, Х7 значение 1, а остальным 0, получим 4 решения ai = (1110000), а2 = (1001100), а3 = (0101010), а4 = (1101001), которые, как читатель может убедиться, линейно независимы. Составленная из этих решений матрица /1 1 1 о о о 0\ 10 0 110 0 0 10 10 10 \1 1 0 1 0 0 1/ (15.9) и является искомой порождающей матрицей. При использовании линейного кода для передачи сообщений полезно знать и порождающую, и проверочную матрицу. С помо- щью порождающей матрицы удобно кодировать сообщения. За- метим сначала, что линейный (п, А:)-код с порождающей матри- цей (15.7) имеет qk кодовых слов (любой из к коэффициентов в (15.6) можно выбрать q способами, где q — число элементов поля F). Поэтому он позволяет закодировать все сообщения дли- ны А; в алфавите из q символов. Если А = с^аз.. а к — такое сообщение (а^ — информационные символы), то самое удобное — сопоставить ему кодовый вектор а совпадающий с линейной ком- бинацией (15.6) строк порождающей матрицы. Вектор а нетруд- но записать в матричном виде, используя правило умножения матриц а = А • G = (ai «2 • • • <*&) «12 • • • «In^ «22 ••• «2п (15.10) \«fcl «fc2 • • • «fcn /
Глава 15. Поля Галуа и кодирование 309 Например, в случае (7,4)-кода Хемминга с порождающей мат- рицей (15.9) сообщение А = (1011) кодируется кодовым словом а = (1011)• /1 1 0 110 0 0 0 11 10 10 10 10 о 0\ о о 1 о О 1/ =(0110011). Наиболее простой вид это правило приобретает для так называ- емых систематических линейных кодов. Линейный (п, /с)-код на- зывается систематическим, если его порождающая матрица име- ет вид /1 0 ... 0 ph ... р1т\ 0 1 ... О Р21 ••• Р2т G . . . . , \0 0 ... 1 Pk-L ... Ркт) то есть если она получается приписыванием к единичной матрице порядка к некоторой матрицы порядка к х т. В этом случае равенство (15.10) принимает вид /1 а = («гаг • • • &к) \о О ... О Р11 1 ... О Р21 о ... 1 Рк1 • • • Р1тУ • • • Р2т • • Ркт) = (<ЭЦО!2 • • • • • • ®п). Таким образом, первые к символов любого кодового слова как раз и оказываются информационными, а остальные — проверочными. Они связаны с информационными символами соотношениями Gfc+1 = Р11<*1 + Р21«2 4- • • • + Pkl&k Ofc+2 = P12«l + P22«2 4- • • • + Pfc2«fc °n — Plm^l 4" P2ma2 4" • • • 4" Pkm®-k-
310 Глава 15. Поля Галуа и кодирование Очень важно, что всякий линейный код в некотором смысле эк- вивалентен систематическому [2]. Что касается проверочной мат- рицы, то она используется в основном при декодировании полу- ченных слов и исправлении ошибок. Об этом подробно рассказа- но в той же книге [2]. Уже в первый период развития теории кодирования среди ли- нейных кодов были обнаружены и такие коды, которые позволяли исправлять не только одиночные, но и кратные ошибки. Правда это были лишь отдельные примеры, и долгое время никак не удавалось найти какой-то достаточно общий метод построения линейных кодов, исправляющих любое наперёд заданное коли- чество ошибок в кодовом слове. Для решения этой задачи очень полезной оказалась теория конечных полей. К тому же хорошо разработанная техника вычислений в конечных полях позволила не только строить такие коды (они были названы циклическими), но и указывать удобные алгоритмы их декодирования. Особенно удачным оказалось ещё и то, что по своей структуре цикличе- ские коды оказались идеально приспособленными к реализации в современных технических устройствах. Наше знакомство с циклическими кодами мы начнём с по- нятия циклического сдвига вектора. Пусть задан произвольный n-мерный вектор а = (ao,ai,a2, • • • ,«n-i) с координатами из лю- бого поля F (нумерацию координат в случае циклических кодов удобно начинать с нуля). Циклическим сдвигом этого вектора назовём вектор ® = (dji—i, flQ, 4Ц, tl2j • • • j 2)* Например, для вектора (01101) последовательными циклически- ми сдвигами являются такие векторы: (10110), (01011), (10101), (11010). Циклическим кодом называется линейный код, который вме- сте с любым своим вектором содержит также и его циклический сдвиг. Иными словами, циклический код обладает следующим свойством: циклический сдвиг любого кодового вектора снова
Глава 15. Поля Галуа и кодирование 311 является кодовым вектором. Циклическим является, например, код с проверкой на чётность. Менее тривиальным примером циклического кода (проверка предоставляется читателю) является код с проверочной матрицей /1 1 1 0 1 о 0\ Я = I О 1 1 1 О 1 о], \0 0 1 1 1 0 1/ в некотором смысле эквивалентный (7,4) — коду Хемминга. При рассмотрении циклических кодов кроме обычных дей- ствий над векторами мы имеем дело фактически ещё с одной операцией, сопоставляющей каждому вектору его циклический сдвиг. Удобным алгебраическим средством для её описания яв- ляются многочлены, точнее же, многочлены как элементы кольца вычетов по модулю многочлена хп — 1 (см. главу 10). С каждым вектором а = (ао, ai, • • •, Оп-i) свяжем многочлен , а(х) = ао + а±х + ... + an_ixn х, (15.11) коэффициенты которого совпадают с соответствующими коор- динатами вектора. Именно в такой форме может быть записан всякий элемент кольца вычетов по модулю любого многочлена степени п, в частности, многочлена хп — 1. В дальнейшем бу- дем отождествлять вектор а с соответствующим ему многочле- ном а(ж), свободно переходя от векторной записи к записи в виде многочлена. Циклическому сдвигу а — (ал-i, ао, ai, а2, • • •, (in—'i) вектора а соответствует тогда многочлен а'(х) = an_! + oqx + ai»2 + ... + an_2®n-1- (15.12) Связь между многочленом (15.11) и его циклическим сдвигом (15.12) может быть выражена теперь в терминах операции умно- жения в кольце вычетов1 Fn = Z2[x]/(xn — 1). 1 В дальнейшем многочлены по модулю хп — 1 будут обозначаться, как и обычные многочлены. Всюду по контексту ясно, в каком именно смысле понимать тот или иной многочлен.
312 Глава 15. Поля Галуа и кодирование Эта связь (поскольку в Fn справедливо равенство хп = 1) такова: а'(х) = ха(х). Отсюда один шаг до утверждения, дающего полезное алгебраи- ческое описание циклических кодов: линейный код V является циклическим тогда и только то- гда, когда V является идеалом в кольце Fn. В самом деле, если V — идеал, то для всякого кодового век- тора (многочлена) а(х) G V имеем ха(х) е V, т. е. циклический сдвиг снова является кодовым вектором. Обратно, если V — циклический код, то для всякого кодового вектора а(х) его последовательные циклические сдвиги ха(х), х2а(х), ..., хп~1а(х) также являются кодовыми векторами. Остается показать, что для всякого многочлена b(x) = fo + fox 4- fox2 + ... + bn-ixn~1 произведение Ь(х) а(х) является кодовым вектором. Мы имеем: b(x) а(х) = boa(x) + fox а(х) + fox2 а(гс) + ... + bn-ixn~1 а(х). (15.13) Согласно сказанному выше, каждое слагаемое в (15.13) принад- лежит кодовому пространству, но тогда и вся сумма обладает этим свойством. Итак, V — идеал. Полезность полученного нами описания циклического кода связана с тем, что всякий идеал в кольце вычетов Fn являет- ся главным идеалом. Доказать это можно по известной нам схе- ме, которой мы придерживались ранее для кольца целых чисел и произвольного евклидова кольца. Многочлен д(х), порождающий идеал V, называется порож- дающем многочленом соответствующего циклического кода. Таким образом, если известен порождающий многочлен кода, то, тем самым, известны и все кодовые многочлены — их спи- сок исчерпывается всевозможными произведениями д(х)з(х), где s(x) — произвольный многочлен степени, меньшей п. Вспомним, что для задания произвольного кода нужно указать полный список кодовых слов, а для задания линейного кода —
Глава 15. Поля Галуа и кодирование 313 только список базисных кодовых векторов. Циклический же код может быть задан ещё более компактно. Действительно, как мы выяснили, для этого достаточно указать всего лишь один кодо- вый многочлен, а именно порождающий многочлен д(х). По порождающему многочлену легко найти порождающую матрицу циклического кода. Пусть д(х) = д0+ gix + ... + дтхт — многочлен степени т и к = п — т. Рассмотрим следующие многочлены д(х), хд(х), х2д(х), ..., хк 1д(х). (15.14) Все они являются кодовыми, степень их, очевидно, не превосхо- дит п—1. Нетрудно убедиться, что рассматриваемые как векторы, они образуют линейно независимую систему, и всякий кодовый вектор является их линейной комбинацией. Следовательно, мат- рица G, составленная из векторов (15.14), является порождающей матрицей циклического кода. Порядок её равен,fcxn, и она имеет следующий вид: 91 9о • • • 9т О 91 • • • 9т о 90 91 0 \ О 9т) ( 9(х) \ хд(х) \xk~lg(x)J (15.15) Так, для двоичного циклического кода длины 7 с порождаю- щим многочленом д(х) = 1 + х2 + х3 = (1011000) имеем1 хд(х) = х + х3 + х4 = (0101100), х2д(х) = х2 +х4 + х5 = (0010110), х3д(х) = х3 + х5 + х6 = (0001011), и потому его порождающей будет следующая матрица /1 0 1 1 о о 0\ 0 10 110 0 0 0 1 0 1 1 0 \0 0 0 1 0 1 1/ 1 Многочлен д(х) = 1 + х2 + х3 является делителем х7 — 1.
314 Глава 15. Поля Галуа и кодирование Особая структура порождающей матрицы циклического кода позволяет придать правилу кодирования (15.10) иную, гораздо более удобную форму. Если а(х) — многочлен, соответствующий вектору а, и А(х) = = ао + 4-... + ак-1Хк~г — многочлен, соответствующий сооб- щению А, то равенство (15.10) перейдёт в равенство многочленов а(ж) = А(х)д(х), (15.16) где д(х) — порождающий многочлен циклического кода. Для того, чтобы убедиться в этом, достаточно подставить в (15.10) матрицу (15.15) и проверить, что координаты получа- ющегося вектора служат коэффициентами многочлена А(х)д(х). Правило кодирования (15.16) особенно ценно тем, что оно естественно и красиво реализуется в несложных электронных схемах, состоящих из сумматоров и сдвигающих регистрах [2]. Подобные же схемы используются и для целей декодирования, и для исправления ошибок. ' Стоит особо поговорить ещё об одном, наиболее интересном способе задания циклического кода. С этой целью рассмотрим поле разложения F порождающего многочлена д(х), а в этом поле —все элементы оц,а2, - • ,ат, являющиеся его корнями: g(ai) = 0, i = 1,2,..., т. Очевидно, заданием этих корней многочлен д(х), а следова- тельно, и порождённый им циклический код определены одно- значно. Действительно, д(х) = (ж—ах)(ж—аг)... (ж —ат). Заме- тим также, что элементы оц являются корнями и любого кодового многочлена а(ж) (это следует из равенства (15.16)). Нетрудно показать и обратное, а именно: всякий многочлен а(ж), корнями которого являются элементы а; (г = 1,2, ...,т), будет кодовым многочленом (доказательство предоставляем чи- тателю). Таким образом, если ai,a2,... ,ат — все корни порож- дающего многочлена д(х), то соответствующий циклический код может быть охарактеризован так: он состоит из всех тех мно- гочленов а(ж) степени не выше п — 1, для которых элементы ai,a2,...,am также являются корнями. Иными словами, кодо- вые многочлены а(ж) = ао + а1ж + + • • • + ап_1Жп-1, и только
Глава 15. Поля Галуа и кодирование 315 они, удовлетворяют соотношениям a(ai) = ао + «1 «1 + аг «1 + • • • + On-i а”-1 = О, а(а2) = а0 + ai а2 + а2 а2 + • • • + °п-1 а1~1 = °> ц5 а(ат) = а0 + а1ат + а2а^1 + ...+ ап-г а”-1 = 0. Равенства (15.17) играют роль проверочных соотношений цикли- ческого кода. Особенность их, правда, состоит в том, что коэф- фициенты этих соотношений (элементы а» и их степени) принад- лежат не основному полю, а его расширению. Отметим, однако, что представляя элементы расширения F векторами над полем F (см. дополнение 3 к главе 11), можно, в случае необходимости, прийти к проверочным соотношениям обычного вида. Равенства (15.17) служат также исходным пунктом построе- ния алгебраических методов исправления ошибок, пригодных для циклических кодов. Общая схема такова. Пусть принятый вектор и содержит ошибочные символы, то- гда его можно представить в виде суммы посланного кодового вектора а (который пока неизвестен) и вектора-ошибки е: и = а + е. (15.18) Ясно, что вектор е = (ei,e2,..., еп) содержит ненулевые символы как раз в тех позициях, в которых символы вектора а искажены. Равенству (15.18), понятно, соответствует аналогичное равенство для многочленов и(х) = а(х) + е(х). (15.19) По принятому вектору мы легко можем, выполняя вычисления в конечном поле F, найти величины Si = u(ai) = uq + щоц + a2aff + ... + On-ia”-1, i = 1,2,..., m. С другой стороны, из равенства (15.19) следует, что e(ai) = u(ai) = Si, (15.20)
316 Глава 15. Поля Галуа и кодирование (15.21) поскольку для всякого кодового многочлена a(aj = 0. Записывая (15.20) в развёрнутой форме, мы приходим к системе линейных уравнений е(аг) = е0 + ei«i + e2al 4-... 4- en_iai-1 = Si, в(аг) = во + 61012 4" 62a2 4" ... 4" en—1®” 1 = S2, б(®ш) 6q 4” eiam 4“ 4”... 4" ^n-ia^, относительно eo, ei,..., en_i — координат вектора-ошибки. Конечно, всё не так просто. Дело в том, что система (15.21) имеет не единственное решение (можно даже показать, что число её решений таково же, что и системы (15.17), то есть совпадает с числом кодовых векторов). Всё же, если число ошибочных сим- волов в векторе и и, значит, ненулевых координат в векторе е не слишком велико, система (15.21) позволяет найти их единствен- ным образом. Проиллюстрируем сказанное примером цикличе- ского кода, исправляющего одиночные и двойные ошибки. Пример. Пусть а — примитивный элемент поля F = GF(24), по- рядок этого элемента, понятно, равен 15. Как было показано в главе 10, в качестве GF(24) можно взять поле вычетов Z2[x]/(x4 + x + l) по модулю неприводимого над Z2 многочлена х4 4- х 4-1, а за элемент а взять его корень, содержа- щийся в этом поле. Элементы 1, а, о?, о? образуют базис поля GF(24) как векторного пространства над Z2, то есть все степени а*, г = 0,1,2,..., 14 записываются единственным образом в виде линейной комбинации ао 4- aia 4- ага2 4- аза3, <ц € Z2. (15.22) Например, а4 = 14-а, так как а44-а4-1 = 0, а5 = а-а4 = а4-а2, а6 = а • а5 = а2 4- а3, а7 = а • а6 = а3 4- а4 = 1 4- а 4- а3 и т. д. Удобно для дальнейшего все степени элемента а свести в таблицу 15, отождествляя запись вида (15.22) с вектором (00,01,02,03), записываемым в таблице как столбец. Рассмотрим двоичный циклический код длины 15, состоящий из всех многочленов степени < 15, корнями которых являются
Глава 15. Поля Галуа и кодирование 317 Таблица 15. 0 1 2 3 4 5 6 7 8- 9 10 11 12 13 14 1 0 0 0 1 0 0 1 1 0 1 0 1 1 1 0 1 0 0 1 1 0 1 0 1 1 1 1 0 0 0 0 1 0 0 1 1 0 1 0 1 1 1 1 1 0 0 0 1 0 0 1 1 0 1 0 1 1 1 0 элементы а и а3. Очевидно, что порождающий многочлен д(х) является произведением многочленов т\(х) и тг(ж), минималь- ных для а и а3 соответственно. Как уже было отмечено, 7П1(ж) = 1 + х + х4. Далее, поскольку элемент а3 имеет порядок 5, он является от- личным от 1 корнем многочлена х5 — 1 = (ж — 1)(ж4 + х3 + ж2 + х + 1). (15.23) Второй сомножитель в разложении (15.23) неприводим и потому является минимальным для а3, так что Ш2(ж) = 1 + х + х2 + ж3 + ж4. Следовательно, порождающий многочлен равен д(х) = (1 + х + ж4)(1 + ж + ж2 + ж3 + ж4) = 1 + ж4 + ж6 + ж7 + ж8, а порождённый им идеал образует (15,7)-циклический код. Покажем теперь, что построенный двоичный код позволяет исправить любые одиночные и двойные ошибки. Предположим сначала, что ошибочными являются два символа с номерами i и j, которые и предстоит определить. Тогда е» = е7- = 1, и система (15.21) приобретает вид е(си) = аг + o' = е(а3) = а3г + a3j = S2. (15.24)
318 Глава 15. Поля Галуа и кодирование Если же ошибка одиночная (и i — номер искажённого симво- ла), то е(а) = аг = Si е(а3) = oft = S2 = Sf. (15.25) Можно заметить, что отличительным признаком одиночной ошибки является условие S2 = S3. Если оно выполняется, то первое равенство в (15.25) сразу позволяет найти номер ошибоч- ного символа. В противном случае рассматриваем систему (15.24), поступая в ней следующим образом. Возведём первое равенство в куб (аг + ст7)3 = oft + oft + а*о?(о? +, о7) = S3. С учётом обоих уравнений системы (15.24) будем иметь S2 + aiaiS1 = Sl, откуда аго? = (S'3 — S2)/Si. Итак, приходим к системе ' = Si о№ = Si - S2Si\ (15.26) из которой, как нетрудно показать, находится не более, чем одна пара элементов аг, о? (i < у)1. . Подтвердим сказанное конкретным вычислением. Пусть к ад- ресату поступило следующее слово и = (100010010111000), пред- ставимое, как мы знаем, многочленом и(х) = 1 + ж4 + ж7 + ж9 + + ж10 + ж11. Тогда (с учётом таблицы 15) и(а) = 1 + а4 4- а7 + а9 + а10 + а11 = = 1 + (1 + а) + (1 + а + а3) + (а + а3)+ + (1 + а + а2) + (а + о? + а3) = а + а3 = а9, и(а3) = 1 + а12 + а6 + а12 + 1 + а3 = о? + а3 + а3 = а2. 1 Отметим, что система (15.26) может вовсе не иметь решений. Это служит указанием на то, что ошибочными являются более, чем два символа. Данный код, однако, не позволяет однозначно исправить подобные кратные ошибки.
Глава 15. Поля Галуа и кодирование 319 Следовательно, 51 = а9, 5г = а2, 52 — 525fx = а3а8 = а3 + 1 + а2 + а13. Так как S3 / S2, то ошибка не является одиночной. В системе (15.26) для удобства обозначим у = а\ z = aJ (если i < j), и в данном случае она запишется в виде у + z = а9, ’ 13 yz = а . Исключая z из последней системы, приходим к квадратному уравнению у2 + а9у + а13 = 0. (15.27) Правда, в случае поля характеристики 2 обычная формула для корней квадратного уравнения непригодна (почему?), но есть другая возможность его решения. Воспользуемся тем, что вся- кий элемент у € GF(24) имеет единственную запись вида У = Уо + У1« + У2012 + уза3, yi € Z2, и подставим её в уравнение (15.27)*: (уо + У1«2 + у2а4 + у3а6) + (у0 + yia + у2а2 + у3а3)а9 + а13 = 0. После преобразований с использованием таблицы 15 придём к равенству (уо+У1+У2+Уз+1)+(Уо+У1+Уз)а+(у2+1)а2+(уо+у2+1)а3 = 0, из которого следует |Уо + У1 + У2 + Уз + 1 = о Уо + У1 + УЗ = о у 2 4-1 = 0 Уо + У2 + 1 = о. 1 Мы при этом пользуемся тем, что (а + Ь)2 = а2 + 62 в поле характери- стики 2.
320 Глава 15. Поля Галуа и кодирование Очевидно, имеется два решения этой системы (0,0,1,0), (0,1,1,1). В первом случае у = a2, z = а11, во втором, наоборот, у = а11, z = a2, z = а11. Вспоминая, что г < j, окончательно получаем у = а2, но тогда у = а11. Итак, ошибочными являются 3-я и 12-я позиции (напомним, что нумерация yi начинается с i = 0). исправляя эти позиции, получим кодовый вектор а = (101010010110000). В самом деле, соответствующий многочлен а{х) кратен порождающему много- члену а(х) = 1 + х2 + х4 + х7 + х9 + я10 = (1 + х2)(1 + х4 + х& + х7 + х8) и потому является кодовым. Из сказанного выше можно усмотреть, что все другие кодовые векторы отличаются от принятого вектора и более чем в двух по- зициях, так что а — «ближайший»1 к и кодовый вектор. Рассмот- ренный выше пример циклического кода принадлежит к классу кодов, имеющих особую практическую важность. Это так назы- ваемые БЧХ-коды, впервые предложенные американскими мате- матиками Боузом, Чоудхури и Хоквингемом, и получившие такое наименование по начальным буквам их имён. Кратко опишем общую схему построения циклических кодов БЧХ над произвольным основным полем F, содержащим q эле- ментов. Пусть GF(gm) — поле Галуа порядка qm и а — элемент этого поля (не обязательно примитивный). Зафиксируем нату- ральные s и I и рассмотрим элементы as, as+1, as+1, as+2,..., as+l. (15.28) Пусть n — наименьшее общее кратное порядков этих элементов. Тогда все они являются корнями многочлена хп — 1 и число п минимально с указанным свойством. 1 Слову «ближайший» можно придать точный смысл, если ввести соответ- ствующую метрику на множестве двоичных векторов, так называемую метрику Хемминга (см. [2]).
Глава 15. Поля Галуа и кодирование 321 Кодом БЧХ, соответствующим последовательности (15.28) на- зывается код, образованный всеми такими многочленами f(x) € € Fn, корнями которых являются все элементы этой последова- тельности: /(as+i) = 0, i = 0,l,...,l. Можно доказать, что такой код (он, конечно, является цикли- ческим) исправляет любые t ошибок, если 2t < I + 1. Код из предыдущего примера состоял из всех двоичных мно- гочленов /(ж) € %2[х]/(х15 — 1), корнями которых являются эле- менты а и а3, Однако автоматически корнями этих многочленов будут ещё элементы а2 и а4, поэтому указанный код является кодом БЧХ, соответствующим последовательности а, а2, а3, а4. Продолжить её далее нельзя, так как а5 уже не является кор- нем порождающего многочлена. Здесь s = 1, I = 3 и условие 2t I + 1 = 4 означает, что код исправляет одиночные и двой- ные ошибки. Варьируя в описанной выше схеме т, s, I, мы имеем возмож- ность получать коды БЧХ различных длин, исправляющих то или иное число ошибок. Ясно при этом, что с увеличением I рас- тёт и корректирующая способность кода (число исправляемых ошибок), однако это, естественно, не даётся даром, а лишь, как можно показать, ценой роста числа избыточных символов. Рассмотрим, например, двоичный БЧХ-код длины 15, состоя- щий из всех многочленов f(x) € Z2[x]/(x15—1), корнями которых являются элементы а, а2, а3, а4, а5, а6, где а (корень многочлена х4 + х + 1) — примитивный элемент GF(24). Как и в ранее рассмотренном примере, многочлены mi = 1 + х + х4, m2 = 1 + х + х2 + х3 + х4 являются минимальными для элементов а и а3 соответственно. Элемент а5 имеет порядок 3 и является корнем многочлена х3 — 1 = (х — 1)(х2 + х + 1),
322 Глава 15. Поля Галуа и кодирование следовательно, для а5 минимальным является многочлен тз(х) = 1 + х + х2. Но тогда порождающий многочлен рассматриваемого БЧХ-кода равен д(х) = mi(x)m2(x)ms(x) = 1 + х + х4 + х5 + х8 + а:10. Мы получили (15,5)-код, исправляющий любые ошибки в трёх или меньшем числе символов, но по сравнению с предыдущим примером размерность кода уменьшилась (и значит наоборот, число избыточных символов увеличилось).
ЗАКЛЮЧЕНИЕ Вот и завершился наш не слишком длинный, но и не такой уж ко- роткий путь по дорогам алгебры. Вы кое-что узнали о некоторых алгебраических понятиях и идеях, об истории их возникновения, о том, каково их значение для разных областей знания. Есте- ственно, что очень многое осталось за пределами прочитанной Вами книжки. Это немудрено, ведь алгебре и отдельным её раз- делам посвящены объёмистые учебники и солидные монографии. Один только список изучаемых в ней алгебраических структур содержит не один десяток названий. Не мал также и перечень тех разделов науки, в которых алгебра находит различные при- менения. Кроме тех, о которых уже говорилось, это квантовая механика и теория элементарных частиц, экономика и методы оптимизации, планирование эксперимента, языки программиро- вания и многое другое. Нужно, правда, оговориться, что чаще всего алгебра применяется в них не сама по себе, а в тесном контакте с другими разделами математики или даже через их посредство. Мы видели, что ряд приложений алгебры связан с группами тех или иных преобразований. С одной стороны, групповой язык способен выразить разнообразные проявления симметрии, идёт ли речь о симметрии кристаллических решёток или многочленов, а с другой, даёт возможность классифицировать и перечислять различные объекты, от орнаментов до комбинаторных конфигу- раций. На тех же общих принципах основывается и ряд других при- менений алгебры. Так, например, в квантовой механике состоя- ние физической системы изображается точкой (вектором) беско- нечномерного векторного пространства. Переход физической си-
324 Заключение стемы из одного состояния в другое на математическом языке означает, что на точку действует некоторое линейное преобразо- вание этого пространства. Группы допустимых преобразований (их строение) могут служить для описания свойств симметрии квантовомеханических систем и во многим определяют физиче- ские законы, которым они подчиняются. Соображения симметрии являются одним из средств «наведе- ния порядка» в знаниях об обширном мире элементарных ча- стиц. Анализ математических свойств возможных групп симмет- рий в этом мире позволял даже предсказывать существование новых частиц. Так были предсказаны и лишь затем эксперимен- тально найдены частицы, названные пи-мезонами и омега-минус барионами. История этих открытий в микромире заслуживает сравнения с замечательным достижением астрономии XIX века, когда Адамсом и Леверье было теоретически предсказано суще- ствование новой планеты, известной сейчас как Нептун. Группы преобразований и связанные с ними соображения сим- метрии играют немаловажную роль и в таких физических тео- риях, как специальная и общая теории относительности. Их ма- тематическим обеспечением служит своеобразный сплав алгеб- ры, геометрии и высших разделов анализа. Возникновению этих новых теорий в физике предшествовал коренной пересмотр мно- гих геометрических представлений. Пионерами в этом деле были создатели неевклидовой геометрии — знаменитый русский мате- матик Н. И. Лобачевский и венгр Я. Бойяи. В конце прошлого века крупный немецкий математик Ф. Клейн выдвинул носящую его имя программу, согласно которой понятие группы кладётся в основу классификации тех или иных геометрических теорий. С этой точки зрения традиционная евклидова геометрия есть уче- ние о тех геометрических свойствах, которые сохраняются преоб- разованиями, принадлежащими группе движений пространства. Другие группы преобразований приводят, например, к аффинной и проективной геометриям. Пройдя через ряд промежуточных ступеней мы можем прийти к такой геометрии, которую интере- суют лишь свойства, сохраняющиеся при всевозможных непре- рывных и взаимно-однозначных преобразованиях (последние так- же образуют группу). Этот раздел геометрии называется тополо-
Заключение 325 гией. С популярным изложением некоторых фактов топологии можно познакомиться по книге [4]. Из этой же книги можно узнать и о том, что с каждой геометрической фигурой связаны особого типа группы — фундаментальная группа и группы гомо- логий. Они служат эффективным средством для характеризации многих важных топологических свойств. Развившаяся в связи с проблемами топологии так называемая гомологическая алгебра опирается на уже сложившийся алгебраический арсенал — груп- пы, кольца, линейные пространства и их обобщения. Значительна роль алгебры в проблемах компьютерной ма- тематики и программирования. Уже исходные идеи создателей ЭВМ были связаны с алгебрами Буля, своеобразными алгеб- раическими системами, рассмотренными английским математи- ком Дж. Булем почти столетием раньше появления первых ЭВМ. И в настояшее время алгебраические методы плодотворно ис- пользуются в теории автоматов, в исследованиях по разработке формальных языков и языков программирования. Развитие вычислительной техники позволило решать сложные практические и научные задачи, казавшиеся ранее недоступны- ми и усилило роль дискретной математики в решении этих задач. Стали бурно развиваться такие разделы дискретного анализа как комбинаторика и теория графов, что отразилось и на алгебре. Объектом изучения в ней стали новые алгебраические структу- ры (алгебры инцидентности, матроиды, квазигруппы и другие). Они удачно моделируют многие ситуации, типичные для проблем дискретной математики. Конечно, наивно было бы думать, что всё происходящее в ал- гебре связанно с решением каких-то практических задач. Это далеко не так. Как и всякая математическая наука, она являет- ся сложным организмом со своей логикой развития и со своими внутренними проблемами. К числу этих проблем относятся зада- чи описания математических структур того или иного типа, поис- ки новых алгебраических конструкций, выявление связей между различными алгебраическими теориями, углубление и обобще- ние этих теорий и т,д. Тем, кто после чтения «Граней алгебры» пожелает углубить свои алгебраические знания, пролить свет на многое нами недо-
326 Заключение казанное и недосказанное, можем посоветовать для дальнейшего изучения книги [9], [17], [18], [19], [29]. Нам остаётся теперь лишь пожелать успеха всякому, кто рискнёт последовать этому совету.
СПИСОК ЛИТЕРАТУРЫ [1] Александров П. С. Введение в теорию групп. — М.: УРСС, 2004. [2] Аршинов М. Н., Садовский Л. Е. Коды и математика. — М.: Нау- ка, 1983. [3] Болтянский В. Г., Виленкин Н.Я. Симметрия в алгебре. — М.: МЦНМО, 2002. [4] Болтянский В. Г., Ефремович В. А. Наглядная топология. — М.: Наука, 1983. [5] Ван-дер-Варден Б.Л. Алгебра. — М.: Наука, 1976. [6] Вейль Г. Симметрия. — М.: Наука, 1968. [7] Виленкин Н. Я. Комбинаторика. — М.: Наука, 1969. [8] Виленкин Н.Я. Популярная комбинаторика. — М.: Наука, 1975. [9] Винберг Э.Б. Курс алгебры. — М.: Факториал, 2001. [10] Гиндикин С. Г. Рассказы о физиках и математиках. — М.: МЦНМО, 2001. [11] Дальма А. Эварист Галуа: революционер и математик. — РХД, 2000. [12] Де Брейн Н.Дж. В кн.: Прикладная комбинаторная математи- ка. — М.: Мир, 1968. [13] Инфельд Л. Эварист Галуа — избранник богов. (Серия ЖЗЛ) — Молодая гвардия, 1965. [14] Калужнин Л. А. Введение в общую алгебру. — М.: Наука, 1973.
328 Список литературы [15] Кантор И.Л., Солодовников А. С. Гиперкомплексные числа.— М.: Наука, 1973. [16] Клейн Ф. Лекции о развитии математики в XIX столетии. — М.: Наука, 1989. [17] Кострикин А, И. Введение в алгебру. — М.: Наука, 1973. [18] Кострикин А. И. Введение в алгебру. Т. 1. Основы алгебры. Т. 2. Линейная алгебра. Т. 3. Основные структуры алгебры. — М.: Физ- матлит, 2000. [19] Ленг С. Алгебра. — М.: Мир, 1968. [20] Пойя Д. Математика и правдоподобные рассуждения. — М.: Нау- ка, 1975. [21] Пойя Д. Математическое открытие. — М.: Наука, 1978. [22] Пойя Д. (Polya D.) Kombinatorische Anzahlbestimmungen fur Gruppen, Graphen und chemische Verbindungen. Acta Math., v.68, 1937, 145-254. [23] Постников M.M. Введение в теорию алгебраических чисел.— М.: Наука, 1982. [24] Постников М. М. Теория Галуа. — М.: Факториал, 2003. [25] Соловьёв Ю. П Гипотеза Таниямы и последняя теорема Ферма. — СОЖ, 1998, №2, 135-138. [26] Харрари Ф., Палмер Э. Перечисление графов. — М.: Мир, 1977. [27] Холл М. Комбинаторика. — М.: Наука, 1970. [28] Христоматия по истории математики, под редакцией Юшкеви- ча А.П. — М.: Просвещение, 1976. [29] Шафаревич И. Р. Основные понятия алгебры. — Ижевск: РХД, 1999. [30] Яглом И.М. Геометрические преобразования (в двух частях).— М.: Гостехиздат, 1955.
\ ***" / i \ иитч / ир^х / ISB 8809 1 5 ООО Аргумент Г рани алгебры Аршинов Факторна учебник, это скорее сборник этюдов на темы из алгебры. Стиль изложения доверительный, слышится живая интонация лектора. Всё время подчёркивается историческая перспек- тива, сообщаются сведения о знаменитых математиках. Однако книгу вряд ли можно назвать научно-популярной. В ней развивается достаточно серьёзный математический аппарат. Полные доказательства приводятся не всегда, но существо дела разъясняется подробно.