Автор: Босс В.  

Теги: алгебра   высшая математика   теория групп  

ISBN: 978-5-484 -00941-1

Год: 2007

Текст
                    В. Босс
ЛЕКЦИИ по
МАТЕМАТИКЕ
ТОМ
Теория групп
в
МОСКВА
ЫВ88


ББК22.144я73 Босс В. Лекции по математике. Т. 8: Теория групп: Учебное пособие. 2007.- 216 с. М.: КомКнига, В настоящей книге изложение преследует цель перевести теорию групп из разряда узкоспециализированных дисциплин в диапазон общеобразовательных математических предметов за счет иной расстановки акцентов, повышения доступности идеологии и освещения прикладных аспектов. Проблематика охватывается довольно широко, от обычных основ до теории Галуа и групп Ли. Делается особый упор на приложения к динамическим системам. Рассматриваются также сопутствующие вопросы из общей алгебры. Изложение отличается краткостью и прозрачностью. Для студентов, преподавателей, инженеров и научных работников. Издательство «КомКнига». 117312, г.Москва, пр-т 60-летия Октября, 9. Формат 60x90/16. Бумага офсетная. Печ.л. 13,5. Зак. № 720. Отпечатано в ООО «ЛЕНАНД». 117312, г. Москва, пр-т 60-летия Октября, д. ПА, стр. 11. 13-значный 151Ж, вводимый с 2007 г.: I8ВN 978-5-484-00941-1 Соотв. 10-значный 151Ж, применяемый до 2007 г.: I8ВN 5-484-00941-3 КомКнига, 2007 НАУЧНАЯ И УЧЕБНАЯ ЛИТЕРАТУРА Е-таН: иК55@11К55.ги Каталог изданий в Интернете: М1р://11КЗЗ.ги Тел./факс: 7 (495) 135-42-16 ЫДЗЗ Тел./факс: 7 (495) 135-42-46 4673 Ю 50795 9"785484"00941 1
Оглавление Предисловие к «Лекциям» 7 Предисловие к восьмому тому 9 Епава 1. Преобразования и симметрия 10 1.1. Факторы «второго дна» 10 1.2. Группы преобразований 16 1.3. Инвариантность дифференциальных уравнений .... 17 1.4. Методы подобия и размерности 22 1.5. Связь с групповым анализом 26 1.6. Симметрия Мироздания 31 1.7. Парадоксы симметрии 37 1.8. Проективная геометрия 40 Епава 2. Основные понятия 43 2.1. Определения, примеры и авансы 43 2.2. Группа подстановок 49 2.3. Смежные классы 52 2.4. Нормальные делители и фактор-группы 55 2.5. Классы сопряженных элементов 57 2.6. Автоморфизмы и гомоморфизмы 58 2.7. О роли инвариантов .* 62 2.8. Дополнения 65 Епава 3. Различные инструменты 68 3.1. Действие группы на множестве 68 3.2. Стабилизаторы 69 3.3. Орбиты 70 3.4. Конечные р-группы 72 3.5. Теоремы Силова 72 3.6. Задачи 74
4 Оглавление Глава 4. Абелевы группы 76 4.1. Коммутативный вариант 76 4.2. Конечнопорожденные группы 78 4.3. Прямое произведение и прямая сумма 79 4.4. Циклическая природа абелевых групп 81 4.5. Группы гомологии 82 4.6. Классификация многообразий 87 4.7. Первая гомотопическая группа 88 Глава 5. Теория представлений 90 5.1. Матричные представления 90 5.2. Инвариантные подпространства 93 5.3. Ортогональные представления 94 5.4. Инвариантные операторы 96 5.5. Характеры 98 Глава 6. Разрешимые группы 100 6.1. Нормальные ряды 100 6.2. Коммутанты и разрешимость 102 6.3. Простые группы 104 6.4. Пример 105 Глава 7. Определяющие соотношения 107 7.1. Порождающие множества 107 7.2. Свободные группы 108 7.3. Тождества в группах 109 7.4. Определяющие соотношения ПО 7.5. Проблема Бернсайда 111 Глава 8. Алгебраические структуры 112 8.1. Куда ведет абстрагирование 113 8.2. Кольца, тела, поля 118 8.3. Идеалы 121 8.4. Евклидовы кольца 124 8.5. Поля вычетов 125 8.6. Алгебры 126 8.7. Булевы структуры 128
Оглавление 5 Глава 9. Многочлены 131 9.1. Напоминания 131 9.2. Алгоритм Евклида и делимость 133 9.3. Приводимость многочленов 136 9.4. Существование корней 138 9.5. Производная многочлена 140 9.6. Дробно-рациональные функции 141 9.7. Симметрические многочлены 142 9.8. Групповая инвариантность 144 9.9. Как реагировать на ассоциации 146 Глава 10. Алгебраические числа 149 10.1. Расширения полей 149 10.2. Алгебраические расширения 151 10.3. Нормальные расширения 153 10.4. Теорема о примитивном элементе 154 10.5. Круговые поля 156 Глава 11. Теория Галуа 158 11.1. Предварительные замечания 158 11.2. Группа Галуа 159 11.3. Общая картина 161 11.4. Соответствие Галуа 162 11.5. Простое радикальное расширение 164 11.6. Циклические расширения 167 11.7. Главный результат 168 11.8. Неразрешимые уравнения 169 11.9. Построения циркулем и линейкой 171 11.10. Дополнение 172 Глава 12. Группы Ли 173 12.1. Параметрические группы 173 12.2. Инварианты и первые интегралы 177 12.3. Инвариантные функции и множества 183 12.4. О разделении переменных 185 12.5. Многопараметрический сценарий 187 12.6. Локальные группы 190
6 Оглавление 12.7. Алгебры Ли 191 12.8. Дифференциальные уравнения 195 12.9. Инфинитезимальные продолжения 200 12.10. Поиск допускаемых групп 201 12.11. ЧП-уравнения 202 12.12. Комментарии 203 Сокращения и обозначения 205 Литература 207 Предметный указатель 209
Предисловие к «Лекциям» Озарение случается, когда пухнущая голова проваливается на уровень «дважды два», в то время как счет идет на миллионы. Для нормального изучения любого математического предмета необходимы, по крайней мере, 4 ингредиента: 1) живой учитель; 2) обыкновенный подробный учебник; 3) рядовой задачник; 4) учебник, освобожденный от рутины, но дающий общую картину, мотивы, связи, «что зачем». До четвертого пункта у системы образования руки не доходили. Конечно, подобная задача иногда ставилась и решалась, но в большинстве случаев — при параллельном исполнении функций обыкновенного учебника. Акценты из-за перегрузки менялись, и намерения со второй-третьей главы начинали дрейфовать, не достигая результата. В виртуальном пространстве так бывает. Аналог объединения гантели с теннисной ракеткой перестает решать обе задачи, хотя это не сразу бросается в глаза. «Лекции» ставят 4-й пункт своей главной целью. Сопутствующая идея — экономия слов и средств. Правда, на фоне деклараций о краткости и ясности изложения предполагаемое издание около 20 томов может показаться тяжеловесным, но это связано с обширностью математики, а не с перегрузкой деталями. Необходимо сказать, на кого рассчитано. Ответ «на всех» выглядит наивно, но он в какой-то мере отражает суть дела. Обозримый вид, обнаженные конструкции доказательств, — такого сорта книги удобно иметь под рукой. Не секрет, что специалисты
8 Предисловие к «Лекциям» самой высокой категории тратят массу сил и времени на освоение математических секторов, лежащих за рамками собственной специализации. Здесь же ко многим проблемам предлагается короткая дорога, позволяющая быстро освоить новые области и освежить старые. Для начинающих «короткие дороги» тем более полезны, поскольку облегчают движение любыми другими путями. В вопросе «на кого рассчитано» — есть и другой аспект. На сильных или слабых? На средний вуз или физтех? Опять-таки выходит «на всех». Звучит странно, но речь не идет о регламентации кругозора. Простым языком, коротко и прозрачно описывается предмет. Из этого каждый извлечет свое и двинется дальше. Наконец, последнее. В условиях информационного наводнения инструменты вчерашнего дня перестают работать. Не потому, что изучаемые дисциплины чересчур разрослись, а потому, что новых секторов жизни стало слишком много. И в этих условиях мало кто готов уделять много времени чему-то одному. Поэтому учить всему — надо как-то иначе. «Лекции» дают пример. Плохой ли, хороший — покажет время. Но в любом случае, это продукт нового поколения. Те же «колеса», тот же «руль», та же математическая суть, — но по-другому.
Предисловие к восьмому тому Истина нуждается в недосказанности. Если из арифметики убрать числовую конкретику, остается виртуальная основа, которая была бы не так интересна, если бы при манипуляциях иной природы не возникала та же самая абстракция. Различные физические и геометрические преобразования, теория кодирования, комбинаторные трюки — все это без маскирующих одежд перекликается друг с другом неожиданной идентичностью. И как глаголы без существительных, так и «операции вообще» — без предметного заземления — оказываются ядром соприкосновения различных интерпретаций. Задачи, раздетые догола, вдруг сливаются воедино, и начинает казаться, что еще усилие — и станет ясно, что в мире есть всего одна задача. Название тома до некоторой степени условно. Речь идет об общей алгебре, но с акцентом на теории групп. Как ни странно, рассматриваемая область — несмотря на красоту и практическую значимость — остается за рамками общего образования. С этим надо что-то делать. Помня о том, что «научить» и «дать представление» — разные задачи. Обе важны для освоения предмета, но вторая — важнее, потому что формальное знание без укрупненного понимания — даже опасно. Более того, выучить математику по книгам вообще невозможно. Получить представление — другое дело. Остальное время целесообразно потратить на решение задач и продолжение рода.
Глава 1 Преобразования и симметрия Интересные приложения часто начинают обсуждаться на той стадии, до которой мало кто добирается. Поэтому о сути и перспективах целесообразно говорить как можно раньше, сколь бы ни было это неудобно в отсутствие инструментов. Кое-что всегда можно сделать голыми руками. 1.1. Факторы «второго дна» В устройстве мира топологические свойства располагаются на поверхности, алгебраические — в глубине. Поэтому с «непрерывности» приходится начинать, а если не углубляться, то ей и заканчивать. В итоге рейтинги матанализа превалируют, а группы, кольца и поля остаются на задворках образования, причем вроде бы заслуженно, поскольку остальное процветает в значительной степени независимо. Если сюда прибавить излишнюю настойчивость алгебраистов, рассказывающих, как важно то, чем они занимаются, спрос на алгебраические фокусы сильно падает, ибо «второе дно» остается вне поля зрения. Конечно, разговоры о «втором дне» нередко возникают, когда нечего предъявить, как поначалу кажется. Скажем, учебники полны примерами, в которых те или иные замены переменных приводят к быстрому интегрированию дифференциального уравнения, или сводят уравнение в частных производных к обыкновенному. Но это производит впечатление разрозненных эпизодов, ибо причины успехов остаются невыявленными. Величина «замаха» не превосходит масштаба задачи — уравнение решено, и ладно. В результате кое-что не обнаруживается — вплоть до законов мироздания. Уравнения электродинамики Максвелла после элементарных преобразований приводят к волновому уравнению _1_^А_^А ^А ^А с2 д12 " дх2 + ду2 + дг2 ( ' }
1.1. Факторы «второго дна» 11 относительно векторного потенциала А, связанного с напряженностью электрического и магнитного поля соотношениями 10А Е = ——, Н = го1А. с 81 Понимание физики в данном случае не играет роли. Речь о другом. Уравнение (1.1) не выдерживает естественных замен координат {преобразований Галилея). Но это «вроде бы бред», поскольку физический процесс и его дифференциальное описание не могут зависеть от точки отсчета. Подобного сорта казусы имеют обыкновение не привлекать внимания, тогда как необходимо, казалось бы, бить во все колокола. Либо уравнение (1.1) неправильно, либо мир устроен по-другому. (!) И если бы вопрос был так сразу поставлен (обострен), группа преобразований Лоренца1' и теория относительности были бы открыты намного раньше. Причем для успеха нужны были бы даже не теоремы, а один лишь стиль теоретико-группового мышления. Последнее обстоятельство весьма примечательно. Ценить принято формулы, теоремы и их следствия. Но фарватер развития науки определяют — категории мышления. И одна из продуктивных схем практического применения теории групп заключается в самом подходе к решению проблем. К тому или иному объекту — будь то алгебраическое или дифференциальное уравнение, геометрическая фигура или какая-то функция — применяют некоторую группу преобразований и смотрят на реакцию. Если объект остается нечувствителен (инвариантен) к преобразованиям данной группы, то из этого делаются определенные выводы о его свойствах. Другими словами, инвариантность объекта по отношению к той или иной группе преобразований дает полезную информацию о его устройстве . Если функция /(ж 1,...,хп) нечувствительна к любому повороту системы координат, можно утверждать, что /(*) = /(*?+...+**). Это один из наиболее понятных и тривиальных вариантов. Но изотропность пространства (независимость свойств от направления) дает и менее очевидные 1' Уравнение (1.1) инвариантно по отношению именно к преобразованиям Лоренца вида х' + ь( , , л 1 х =—===, у = у, г = г, 1= , = где @ = ь/с, V — скорость движения штрихованной системы координат вдоль оси х. ' Инвариантность уравнений классической механики к сдвигам по времени — пустячок вроде бы — влечет за собой закон сохранения энергии. ('♦?)•
12 Глава 1. Преобразования и симметрия следствия, например, выделяет среди других — дифференциальный оператор Лапласа " дх2 + ду2 + дг2' что определяет особую роль последнего в физике \ Инвариантность широко применяется для интегрирования дифференциальных уравнений, а также для вывода фундаментальных законов природы. Последнее иногда производит едва ли не мистическое впечатление, настолько силен контраст тривиальности причин с нетривиальностью выводов. Вот несколько примеров [3] на эту тему. Задача о распределении скоростей молекул газа в свое время была серьезным камнем преткновения. Легенда утверждает, что Максвелл решил проблему за полчаса на экзамене. Правдоподобная реконструкция истории примерно такова. Чтобы не тратить лишних слов, абстрагируемся от физики. Итак, пусть случайный вектор х = {х\,... ,хп} распределен с неизвестной плотностью р(х), которая удовлетворяет двум свойствам: (О величины ж, независимы, (н) р(х) не зависит от направления х. Представляется, что эти свойства не так много говорят о плотности. На самом деле они однозначно определяют ее . Действительно, из (1) вытекает р{х)=рх(хх)...рп{хп), а из (и) следует р(х)=р(х2 + ... + х2п), т.е. функция р(х), а значит и \пр(х) = 1пр!(ж) + 1прп(ж), (1.2) постоянна на сферах X2 — х\ +... +х1 = СОП81. (1.3) ' Широко известны уравнения: теплопроводности Аи д2и Пуассона Аи = /, волновое Аи — 7 —у-. д I ' Разумеется, с точностью до нормировок. ди = 1—, Лапласа Аи = О, 01
1.1. Факторы «второго дна» 13 Другими словами, функции (1.2) и (1.3) имеют одни и те же поверхности уровня, а это возможно, лишь когда их градиенты коллинеарны, т. е. У1пр(ж) = АУж2, что дает п равенств ^ + 2А*,. = 0, РЛХ) интегрирование которых приводит к р,-(ж|-) = А1-е"Ах,?. Константы определяются нормировкой и заданием, например, второго момента а . Окончательно р(х) = (2^ГФ ехр |-^±=^}. (1.4) Вывод (1.4) заслуживает того, чтобы в него вжиться. Преобразования, не меняющие уравнений движения, тех или иных функций, решений, критических значений, — обычно легко находятся. Но при этом кажется, что все это тривиально и не стоит выеденного яйца. Поэтому главная проблема заключается в преодолении пессимизма. Пути, ведущие к успеху, большей частью выглядят тупиковыми, что требует сверхъестественного чутья и готовности двигаться, закусив удила, по «дороге в никуда». Именно в этом и заключался секрет успеха Максвелла, а не в двух последующих строчках взятия градиентов. Можно держать пари, что будь задача поставлена в виде: «какова функция р(х), удовлетворяющая двум условиям (1), (И)», — ее бы решил каждый третий студент, а подобрал бы р(х) — каждый второй. Сложность — в постановке задачи, для чего нужно было задаться вопросом: «Что можно считать известным относительно р(х)?». Здесь бы уже любой студент указал (1), (И). Но тут и происходит сбой. Скептик не может заставить себя думать дальше. Ему кажется, что из такой чепухи ничего нельзя вывести. Максвелл же не стал мудрствовать в поисках оригинальных ответов, — что подавляющую часть исследователей уводит в дебри, — взял очевидные свойства и стал решать задачу, не уступая эмоциям типа «вряд ли такой ерунды достаточно для решения». Контраст причин и следствий всегда разителен. Грандиозные следствия опираются на ничтожные причины. Но тут ничего удивительного. Причины голые, а следствия в масках. • Банальный факт €\ - 62 + €2 - ез +... + еп - е„+1 = б\ - е„+1 (1.5)
14 Глава 1. Преобразования и симметрия навевает скуку, но полагая е* = агс*§ 1п к и учитывая и - V агс1§ и - агс*§ V = агс!§ , 1 + иу приходим к А / 1п (А Н- 1) - 1п Л \ „ , 1ЧЧ . сх § ^ (1+1пЫп(^1)) = "** (1П (" + ^ (1'6) Если теперь (1.5) не афишировать, то (1.6) не так легко доказать. И подобных следствий из пустяков — миллион, о чем жизнь то и дело напоминает. То ли Создатель широко пользовался такой техникой, то ли оно само так получилось, но мы вынуждены постоянно иметь дело с фактами типа (1.6). Голые причины вида (1.5) тоже в поле зрения, но их потенциал «не выпирает», связи не видны, и мир — в ловушке кривых зеркал. Следствия дразнят загадочностью, а причины незаметны из-за банальности. • Красноречивый пример — история открытия омега-минус гиперона. Гелл- Манн5^, как-то услышавший об открытии новой элементарной частицы, тут же предсказал — существование еще одной, которая и была обнаружена в экспериментах через три года. Это выглядело даже более эффектно, чем открытие планеты Нептун, вычисленной предварительно Леверье и Адамсом, — хотя в основе лежала причина типа (1.5). Подоплека заключалась в следующем. Квантовая механика с самого начала успешно справлялась с ситуациями, где колеблется «непонятно что» [3]. Затем продвинулась далеко вперед, и уже описывала элементарные частицы как собственные векторы «неизвестно какого» оператора Шрёдингера \ Правда, у неизвестного оператора предполагались известными некоторые свойства — не меняться под действием той или иной группы преобразований. Так вот, Гелл-Манн, занимавшийся изучением некой группы 8Щ, сразу увидел, что размерность пространства, в котором действует неизвестный оператор Шрёдингера, надо так увеличить (в связи с открытием новой частицы), чтобы соответствующая группа преобразований могла действовать в этом пространстве, и новый собственный вектор (как имидж частицы) мог появиться. Но тогда возникал еще один «лишний» собственный вектор («лишняя» частица). Вот, собственно, и вся подноготная. Потом на волне успеха с омега-минус гипероном Гелл-Манн, эксплуатируя ту же группу 3773, выдвинул теорию кварков, которых не могут найти до сих пор. ' Нобелевский лауреат 1969 г. ' Изучение «неизвестно какого» оператора Шрёдингера может показаться сарказмом, но это не совсем так. Для решения многих задач уравнения, описывающие объект изучения, действительно не нужны. Дифференциальное уравнение полезно иметь перед глазами лишь как гарантию того, что в поле зрения попадают все необходимые параметры — см. далее.
1.1. Факторы «второго дна» 15 • Здесь, пожалуй, уместны две нижеследующие выдержки из статьи Дай- сона7'. На данном этапе изложения текст не вполне ясен, но для «намека» это несущественно. Да и понимания здесь особо не требуется. Речь-то идет по существу о наводящих соображениях, которые могли бы и не оправдаться. Но интересен сам теоретико-групповой стиль мышления, позволяющий правдоподобно рассуждать об устройстве Вселенной, не вникая в детали. «...Минковский в лекции 1908 г. не довел свои аргументы до логического завершения. Он не обратил внимания на инвариантность уравнений Максвелла относительно тривиальной абелевой группы Т4, — сдвигов координат пространства-времени. Естественная группа инвариантности теории Максвелла — не шестимерная группа Лоренца, а десятимерная группа Пуанкаре Р — полупрямое произведение Сс и Т4. Соответственно, группа симметрии ньютоновской механики—не шестимерная группа бгоо, а десятимерная группа Галилея С — полупрямое произведение бгоо и Г4. Ни Р, ни О не являются полупростыми группами8*. Задним числом легко видеть, что логика Минковского должна была привести кого-нибудь к мысли о существовании простой группы В, вырожденным пределом которой будет Р, в точности так же, как у полупростой группы Сс вырожденным пределом является группа бгоо. Это группа де Ситтера В, вещественная некомпактная форма простой алгебры Ли В2. Следуя аргументам Минковского, математики легко могли бы предположить в 1908 г., что истинной группой инвариантности мира должна быть группа В, а не Р. В действительности В является группой симметрии расширяющейся Вселенной без материи, радиус кривизны которой К есть линейная функция времени. В вырождается в Р в пределе плоского пространства ПгшК -> оо, так же как Сс вырождается в бгоо в ньютоновском пределе с -> оо. Предположим, кто-то в 1908 г. был достаточно уверен в себе, чтобы принять эту идею всерьез. Тогда он смог бы правильно предсказать расширение Вселенной, открытой экспериментально Хабблом спустя 20 лет. Еще важнее, что это могло бы привести к постулированию кривизны пространства-времени и, следовательно, намного сократить путь к общей теории относительности. К счастью, Эйнштейн сформулировал принцип общей относительности, проделав тяжелый путь, который ему никто не облегчил. Де Ситтер в действительности открыл свою модель расширяющейся Вселенной через год после овладения теорией Эйнштейна. В 1844 г. произошли два примечательных события. Гамильтон опубликовал открытие кватернионов, а Грассман издал книгу "Ашс1еппип881епге". С запоздалой проницательностью мы видим, что работа Грассмана была более значительным вкладом в математику и содержала элементы многих концепций современной алгебры, включая, как частный случай, векторный анализ. Однако Грассман был простым школьным учителем в Штеттине, в то время как Гамильтон — всемирно ' йузоп /\/. М158ес1 ОрройипШез // Ви11. Атег. Ма1п. 5ос. 1972. 78. Р. 635. Перевод с английского в: УМН. 1980. 35. Вып. 1. ^Определение полупростых групп можно найти в [16], но можно считать, что речь идет о простых группах (глава 6).
16 Глава 1. Преобразования и симметрия известным математиком... Гиббсу досталось в удел первому в лекции 1886 г. сопоставить идеи Гамильтона и Грассмана... Не знаю, сколько чистых математиков слышали или читали лекцию Гиббса. Внимательное изучение лекции помогло бы им заметить, что Гиббсу на самом деле не удалось объединить понятия кватерниона и вектора. Напротив, обсудив параллельно эти два понятия, он показал их явную несопоставимость. Его лекция должна была заставить каждого вдумчивого математика спросить себя: „Чем объяснить, что свойства трехмерного пространства представляются одинаково хорошо двумя совершенно разными и несовместимыми алгебраическими структурами?". Будь такой вопрос однажды ясно поставлен, наверное, скоро бы нашелся ответ; и он неизбежно привел бы к полной теории однозначных и двузначных представлений группы трехмерных вращений. Векторы образуют простейшее нетривиальное однозначное представление, а кватернионы — простейшее двузначное представление. Кватернионы — прототипы спинорных представлений в современной терминологии. Развитие теории спинорных представлений, фактически начатое Эли Картаном в 1913 г., завершилось в основном в 30-е годы при существенной помощи физиков Паули и Дирака; оно могло бы начаться приблизительно на 40 лет раньше». 1.2. Группы преобразований Группы исторически возникли как группы преобразований — с композицией в качестве групповой операции. Чтобы совокупность Ф отображений / : X -» X была группой, требуется ': 1. /(х)9д(х)еФ =» /Й(ж))бФ. 2. Тождественное отображение е(х) = х входит в Ф. 3. Любое отображение / Е Ф имеет обратное /~ Е Ф. Эта конструкция охватывает массу приложений: проективные преобразования в геометрии, преобразования Лоренца в теории относительности, теория инвариантных преобразований дифференциальных уравнений, группы Галуа алгебраических уравнений и т. п. Более того, если группа изначально возникает в другом облике, с определенными трудозатратами можно перейти к изучению групп преобразований. Скажем, от группы действительных чисел по сложению можно перейти к изоморфной группе операторов сдвига /0(ж); числу а отвечает функция /а(х) = х + а. 9' Это, собственно, и есть определение группы, с точностью до изоморфизма, — см. главу 2. Ассоциативность при композиции в качестве групповой операции — обеспечивается автоматически.
1.3. Инвариантность дифференциальных уравнений 17 • Группу комплексных чисел а + %Р (без нуля) по умножению эквивалентно заменяет группа матриц [-га-ич! , а2+/?2^0, с матричным умножением в качестве групповой операции. Соответствия !<=> [1 0] [о 1] , г <=> О 1 -1 О легко проверяются. В частности, [-:з'-П- В то же время любую матрицу можно рассматривать как линейный оператор, а умножению матриц отвечает композиция операторов. • Примером группы может служить семейство дробно-линейных преобразовании ах' + Ъ х =———:, ай-Ъс^О, сх' + 4' эквивалентное группе невырожденных матриц а Ь опять-таки с матричным умножением в качестве групповой операции (1.7) 10) 1.3. Инвариантность дифференциальных уравнений О применении групповых методов при изучении дифференциальных уравнений широко известно. Но представления эти носят большей частью упрощенный (и даже искаженный) характер. В то же время положительный эффект соответствующего направления мысли довольно весом, хотя итоги часто выглядят результатом догадок. Рассмотрим несколько примеров. • Уравнение 6.x + х - 31 = 0 (1.8) 1 ' Композиция преобразований (1.7) оказывается преобразованием того же вида, с коэффициентами, совпадающими с элементами произведения соответствующих матриц. (?)
18 Глава 1. Преобразования и симметрия не меняется под действием преобразований (а — параметр) 1 = 1' -о, х = х'-3а. (1.9) В штрихованных координатах уравнение (1.8) выглядит точно так же. Преобразования (1.9) не меняют также функции г = х - 31. «Поэтому» замена х = г + 31 сразу упрощает (1.8), приводя к уравнению с разделяющимися переменными 7Т7 = -*• (1Л°) 2 + 3 интегрирование которого дает г = Се~1 - 3, или в исходных переменных х = 31 + Се~1 -3. (1.11) Проделанные манипуляции оставляют двойственное чувство. Причины успеха завуалированы, и слово «поэтому» не случайно взято в кавычки, поскольку логические связи по крайней мере неочевидны. Более того, решение (1.11) не инвариантно по отношению к преобразованиям (1.9). (!) Эта неувязка, правда, — результат недосмотра. Но поначалу всегда полезнее ошибиться, чтобы почувствовать берега. Из инвариантности уравнения (1.8) по отношению к (1.9) — вытекает другое. Если х = <р(1,С) — семейство решений (1.8), то подстановка (1.9) должна оставлять решение решением, но константа при этом может меняться11' (!), т.е. х = <р(Ь,С) после замены (1.9) обязано перейти в некое штрихованное решение х = (р(1'9 С'), возникающее из х - Ъа = (р(1* - а, С), т. е. За + (рЦ'-а,С) = (р(Ь',С') (1.12) при некотором С' = С'(а, С). Решение (1.11) удовлетворяет функциональному соотношению (1.12). Обратный путь (1.12) => (1.11) можно проделать, опираясь на те или иные трюки. Однако простейший вариант — это переход к уравнению (1.10), но он содержит некую логическую шероховатость. Между прочим, логичных объяснений удачным заменам переменных обычно не находится и во многих учебниках по дифференциальным уравнениям. Не говоря о том, ' Преобразование (1.9) не меняет семейства решений, хотя сами решения могут меняться местами.
1.3. Инвариантность дифференциальных уравнений 19 что Ньютон, Эйлер, Лагранж — долгое время разрабатывали методы интегрирования диф-уравнений, и все это выглядело набором разрозненных технических приемов, пока общие корни не открыл Софу с Ли, — (глава 12). Остановимся еще на нескольких примерах. • Однородное уравнение 6.x (х\ не меняется под действием преобразований I = аЬ1', х = ах , которые не меняют также функции г = х/1. «Поэтому» переход от переменных {х,1) к переменным (г,1) опять-таки приводит к уравнению с разделяющимися переменными йг у>(г) -г йг 6,1 аЧ I (р{г) -г I интегрирование которого дает х/1 о • Упоминание «инвариантных преобразований» в приведенных примерах может показаться «сбоку бантиком», потому что новая переменная и так напрашивается. Вот пример иного сорта. Уравнение Абеля второго рода их 2 3 , ч имеет степенной вид, и здесь естественно ожидать инвариантность по отношению к группе растяжений х = ах', у = ру''. Подстановка показывает, что для инвариантности (1.13) требуется ар = 1, т. е. 1 = Ы\ х=-х. (1.14) к Эти же преобразования не влияют на функцию г = 1х. «Поэтому» переход от переменных {I, х) к (I, г) упрощает (1.13) и дает интегрируемое уравнение г6,г аЧ (1.15) х1 - Ъг + 2 Г Относительно (1.14) инвариантно также уравнение Риккати х + ах2 =/ЗГ2. Эффект получается аналогичный.
20 Глава 1. Преобразования и симметрия Интересно, что уравнение Риккати вида х + ах2 = № (1.16) интегрируется в квадратурах, как показал Лиувилль, только при 7 = 0, 7 — _2 и 7 = тг- \п — целое). Результат выглядит удивительным, потому что не ясно, как это можно доказать. Сами интегралы в перечисленных случаях легко находятся (Д.Бернулли), но как установить, что других — нет? В контексте группового анализа естественно возникает предположение, что интегрируемый дифур обязан быть нечувствительным к некоторой группе преобразований, обладающей определенными свойствами. Только — легко сказка сказывается. Разумеется, однопараметрические группы преобразований, каковые пока рассматривались, не исчерпывают возможности. С увеличением числа параметров относительная простота улетучивается. Например, уравнение Риккати х = а(1)х2 + р(1)х + 7(0 не меняет своего вида в случае преобразований ах' + Ъ х = —- -, аа-ЬсЩ 0, сх' + а но каковы последствия? Далеко не ясно. Безусловно, инвариантность здесь что-то означает, но что? Как это можно использовать для анализа, решения? Определенная специфика возникает в связи с уравнениями в частных производных. Рассмотрим задачу о диффузии, Щ = ихх, и(х, 0) = щ6(х), (1.17) при условии обнуления решения и(х, I) на бесконечности. Соотношения (1.17) не меняются при замене х = е-ах, 1 = е~2а1\ и = еаи (1.18) с учетом обычного для дельта-функции свойства д([гх) = д(х)/(л.
1.3. Инвариантность дифференциальных уравнений 21 Пусть теперь и = <р(х,1) — решение (1.17). Поскольку инвариантно к преобразованиям (1.18) не только уравнение диффузии (теплопроводности) щ = ихх, но и «краевое» условие и(х,0) = щ6(х), т.е. задача целиком, то и = (р(х',1') — также обязано быть решением 12\ Подставляя (1.18) в и — <р(х, I), имеем и' = е-а<р(е-ах',е-2а1') = <р(х\1'), что достигается в случае Вводя переменную г = х/у/1 и подставляя (1.19) в щ = ихх, приходим к обыкновенному дифференциальному уравнению решая которое с учетом краевых условий (в нуле и на бесконечности), получаем в итоге хорошо известное решение исходной задачи Вместо (1.17) по аналогии с предыдущим можно было бы рассматривать только уравнение Щ = ихх (1.20) без краевых условий. Тогда бы в поле зрения попали семейства решений, но уже не параметризуемые константами. Инвариантных преобразований тоже прибавилось бы. Помимо (1.18), а также очевидных групп преобразований х = х +а, 1 = 1' +а, и = еаи\ и = и + снр(х,1), где (р(х, I) любое частное решение (1.17), — появляется, например, нетривиальная группа {* */ / , л */ / —а21'—ах'л 1 = 1,х = х+2а1,и = ие }. 1 ' В этом заключается отличие данной ситуации от рассмотренных выше примеров, где речь шла не об однозначно решаемых задачах Коши, а о дифурах, имеющих семейства решений.
22 Глава 1. Преобразования и симметрия Сразу же возникает вопрос, что делать с этим множеством групп, как их свести в одну многопараметрическую, и — стоит ли. 1.4. Методы подобия и размерности В физике довольно широко используется упрощенный групповой анализ в виде методов подобия и размерности. При этом группы часто не упоминаются, а сами методы выглядят совершенно самостоятельными. Как бы там ни было, рецептура весьма эффективна, проста, и в ряду теоретических инструментов физики заслуживает едва ли не первоочередного употребления, а с точки зрения переноса «трюковой части» на абстрактную основу — заслуживает серьезного внимания. Но пока остановимся на примерах \ не выходя за рамки физики. • Истечение жидкости из бака — в установившемся режиме определяется тремя параметрами: плотностью р и высотой столба к жидкости, а также ускорением свободного падения #, — от которых зависит «остальное». Поэтому, например, вес жидкости ф, вытекающий в единицу времени, есть Я = <р(р,8,к). Размерности параметров: где М — единица массы, Ь — длины, Т — времени 14). Поэтому Я <Р(Р,8,Ь) деЗ/2/Ь5/2 р^3/2/15/2 :М>,*,Л) — безразмерная величина. Но так как безразмерную константу из р, #, к образовать невозможно, то 1/>(р,8,к) от р, #, к не зависит, а значит, является некой константой к. В результате: При включении в список исходных параметров радиуса г сливного отверстия — получилось бы к = к(г/к). Константа, правда, остается все равно неизвестной, но становится ясным качественное свойство: пропорциональное изменение радиуса и высоты на поток не влияет. 1 ^ Детали и физические комментарии см. в [1, 25], где рассматривается масса других интересных задач. ' Обозначение [х] для размерности величины х предложено Максвеллом.
1.4. Методы подобия и размерности 23 • Движение жидкости. Простейшие задачи гидродинамики часто определяются четырьмя параметрами: плотностью р, коэффициентом вязкости /х, характерным линейным размером I и характерной (часто средней) скоростью у. Из р, /х, I V (1.21) можно образовать только одну безразмерную величину называемую числом Рейнольдса. Поэтому в любой задаче (подзадаче), определяемой параметрами (1.21), все безразмерные величины будут функциями только числа Рейнольдса. Задач подобного рода довольно много. Например, движение жидкости в трубах с определением практически важных характеристик, таких как падение давления и сопротивление трубы на единицу длины. Это могут быть и задачи о движении твердого тела (скажем, подводной лодки) в жидкости. В этом случае сила Р сопротивления жидкости будет (по той же технологии) Р = к(Н)ру212. • Если заранее ясно, что период г колебаний маятника может зависеть лишь от т, %, I, то проблема сводится к поиску комбинации из т, #, /, имеющей размерность времени. Такая комбинация единственна: \///я, масса т оказывается ни при чем. Поэтому г = ку/Щ, где к — некая безразмерная константа. • Качественный анализ механизма флаттер-эффекта15' показывает, что ситуация определяется параметрами (вариант движения в жидкости) Е, /х, т, р, /, V, (1.22) где Еи/1- модули Юнга и сдвига, т — масса движущегося тела, р — плотность жидкости, / — характерный размер, V — критическая скорость. Знание «модулей» и их размерностей — необязательно. Здесь важна схема. Из набора (1.22) конструируются три безразмерных параметра ру2 /х т 1Г' Ё' рР' каждый из которых можно выразить как неизвестную функцию двух остальных. Отсюда •=/М^)- (123) ' Особого рода динамическая неустойчивость взрывного характера при движении твердого тела в жидкой или газовой среде.
24 Глава 1. Преобразования и симметрия Конечно, неизвестная функция <р частично омрачает успех, но формула (1.23) является значительным шагом в понимании закономерностей флаттера. Сразу ясно, например, что ослабление жесткости в п раз (модулей Е и р.) уменьшает критическую скорость в у/п раз. Кроме того, функция ^? может быть восстановлена в гидродинамических экспериментах либо при обдувании дешевых моделей самолетов в аэродинамических трубах. Именно поэтому название методики помимо размерности упоминает подобие. Дело в том, что «полуфабрикаты» теории размерности, хотя и содержат неизвестные величины и функции, — дают прозрачные ориентиры для экспериментального исследования, которое, как оказывается, можно проводить на игрушечных моделях, в том или ином смысле подобных реальным объектам. • Оценим массу М камней, необходимую для перекрытия реки. Пусть тп обозначает массу камней, засыпаемых в единицу времени, / — характерный размер фиксированного профиля реки, р — плотность воды, V — скорость течения, # — ускорение свободного падения. Возможны три безразмерные комбинации: тп I 1% тп Му#' V2' ур12 Искомая масса М в результате: Остается на дешевом макете провести эксперимент для компенсации недостающей информации о функции г/>. (!) Обратим внимание, что на практике восстанавливать функцию гр, вообще говоря, не требуется. «Секрет» эксперимента заключен в безразмерных параметрах. Скажем, макет русла реки имеет характерный размер /, в 104 раз меньший реального. Тогда, чтобы не менять параметр /#/г>2, скорость течения V надо уменьшить в 100 раз, после чего для поддержания значения параметра тп/(ур12) скорость засыпки тп необходимо уменьшить в 1010 раз. В этом случае значение гр не изменится, а тпу/Т/з, и соответственно М, уменьшится в 1012 раз. Подобные задачи весьма важны при возведении плотин и строительстве ГЭС. Необходимую для «засыпки» массу приходится подвозить заранее, и надо знать «сколько». На всякий случай подвозят в несколько раз больше теоретического расчета . Говорят, возле некоторых плотин так и лежат горы привезенного про запас. Продолжать можно до бесконечности. В подобном ключе решаются задачи, к которым иначе не видно как подступиться. Турбу- ' Разумеется, проведенный анализ игнорирует ряд факторов, которые в принципе легко учесть.
1.4. Методы подобия и размерности 25 лентность, взрывные явления, распространение пламени, затухание ударных волн и т. п. Выглядит эффектно и походит на «лихие» методы физиков, которые без колебаний делят на нуль, если это сулит выгоды '. Но «методика» имеет под собой вполне логичную основу. Отсутствие дифференциальных уравнений, описывающих задачу, — иллюзорно. Уравнения — за кадром. Но они наяву и не нужны, потому что «методика» не ставит целью дать исчерпывающее решение, ограничиваясь выявлением характера зависимостей и оставляя константы, а иногда и функции, для дополнительного исследования, если в том есть утилитарная или «диссертационная» потребность. Происходит ограничение теоретико-групповым ингредиентом задачи, что до некоторой степени скрыто за особым словоупотреблением. Чтобы почувствовать закулисную специфику, рассмотрим движение маятника, тх + кх = О, ж(0) = жо (маятник на пружине), (1-24) либо 3(р + т§181П (р = О, (р(0) = (ро (подвешенный маятник), что в случае момента инерции 3 = т1 переходит в ф + -$т(р = 0, (р(0) = (р0. (1.25) Задача (1.24) характеризуется переменными х, Хо, I, к, т, из которых можно образовать только две (независимые) безразмерные комбинации: к Поэтому X =*о/Г«\/-У V V ш/ 17' По определению, честный человек большой подлости при малой выгоде — не сделает. Физик же всегда готов на некорректные действия (имеются в виду математические) — и в этом его сила.
26 Глава 1. Преобразования и симметрия Любое характерное время, например период колебаний г, определяется равенством */(ж0Д,га). к Из переменных Хо,к,т безразмерная комбинация не образуется, поэтому /га г/(ж0, к,т) = соп81 => г = У\, . Вариант (1.25) тот же рецепт приводит к решению Так что нелинейность уравнений не является препятствием для методики. (!) Наличие дифференциальных уравнений на стартовых позициях в данном случае придает манипуляциям некоторую солидность, но если вдуматься, то ясно, что дифуры здесь играют роль декораций. Они лишь подсказывают, какие параметры в изучаемой ситуации существенны. И если последнее ясно из других соображений, дифуры оказываются ни при чем. 1.5. Связь с групповым анализом Закономерно встает вопрос: кроется ли за методикой согласования размерностей таинство природы, или физика наводит тень на плетень? — И да и нет. Скажем, в задаче (1.24), т.е. й2х т—1г+кх = 0, х(0) = жо, (1.26) а11 будь она поставлена в абстрактной форме, без какой бы то ни было интерпретации переменных, — ничто не мешает приписать х некую размерность [х] = X, и далее: М [1]=Т, [тп]=М, [к] = -2. (1.27)
1.5. Связь с групповым анализом 27 Таким образом, размерности [ж], [<], [га] задаются произвольно, [к] выбирается так, чтобы слагаемые в (1.26) измерялись в одних единицах. Далее путь аналогичен. Те же безразмерные комбинации, тот же результат. Поэтому никакая физика в случае (1.26) не требуется. Более того, сам разговор о размерностях совершенно необязателен. Он просто является удобным мнемоническим приемом, который помогает понять, к какой группе преобразований инвариантно уравнение (1.26) и как эту информацию удобно далее использовать. Иными словами, согласование размерностей — это эквивалентный язык для работы с определенными группами преобразований. В данном случае уравнение (1.26) инвариантно (нечувствительно) 18) к заменам га ага х = /Зх, Ь = 7*', к — т к , т (1.28) прозрачно соответствующим размерностям (1.27). Дифференциальные уравнения в подоплеке необязательны. Для обычного квадратного уравнения х2-2ах + Ь = 0 (1.29) можно задать произвольно размерность [х] = X, получив, как следствие, [а] = X, [Ь] = X2. Далее индикатор размерности позволяет частично контролировать правильность формул. Например, Ж1)2 = а± у а2 - Ь проходит контроль соответствия размерности. Некоторые формулы сразу отсеиваются. То же самое получается, если заметить, что уравнение (1.29) не меняется (по сути) при замене (к > 0) а = ка Ь = к2Ь' к>0, (1.30) Все «греческие» параметры — положительны.
28 Глава 1. Преобразования и симметрия которая однозначно перекликается с рассмотренными выше размерностями. Формула для корней уравнения также обязана быть инвариантной к замене (1.30) — и это требование равносильно согласованию размерностей. Так что сказанное пока — не в пользу «таинства». Все сводится к специфическим группам преобразований, хотя надо признать, что «язык размерностей» приходится кстати. Кроме того, теория размерности учит, что (!) конкретно решаемую задачу полезно погружать в параметрическое семейство, не оставаясь в плену частных -Зх ,19) 2 случаев типа х + 2х = 0 или х + Зх — 2 = 0. «Шевеление констант» проливает дополнительный свет Вернемся, например, к уравнению (1.13), которое после замены констант параметрами а, Ъ приобретает вид их а Ъ . Л1Ч **=?-?*• (К31) Если [х] = Ь, [I] = Т, то для согласования размерностей в самом уравнении (1.31) требуется: [а] = Ь2Т2, [Ъ] = ЬТ. Ограничимся поиском какого либо частного решения. Комбинация х1/Ь безразмерна, поэтому х= -(р(а,Ь,1), а а поскольку из а, о, I можно образовать только одну безразмерную величину —, Ь то ь / л\ (1.32) - !♦(*)• Подставляя (1.32) в (1.31), приходим к необходимости Ь 'ф - Ь гр + а = 0, откуда "200- [±у/\- 4а/Ь2 2 20) ^ / что в итоге дает два частных решения ' х = -уМ^. Что же касается «секунд и килограммов», то они вроде бы необязательны. Вместо размерностей можно говорить о группах 1 ' Групповой анализ с позиций групп Ли (глава 12) обычно отделяет параметры от переменных и параметры не трогает. ' О продолжимости решений — см. [4, т. 2].
1.5. Связь с групповым анализом 29 преобразований. Но это только половина правды. С помощью размерностей решается, например, задача о высоте брызг при движении торпедного катера. Уравнений нет, но зависимости устанавливаются. «Чудо» объясняется наличием айсберга физики со всеми фундаментальными законами механики и термодинамики, что позволяет результативно говорить о задачах, не выписывая уравнений. А также делать содержательные выводы о свойствах и структуре этих уравнений, не имея возможности их предъявить. Вот показательный пример [25]. Теплоотдача в потоке жидкости. Задача была решена Рэлеем (1915) и породила «детективную загадку». Количество тепла Н, отдаваемое телом в единицу времени, определяют следующие параметры: характерный размер / тела, скорость обтекания V, разность температур А тела и жидкости, теплоемкость с и теплопроводность Л жидкости 21\ Иными словами, Я = у?(/,г;,Д,с,А). В качестве базовых единиц измерения были выбраны: Ь (длина), Т (время), С° (температура в градусах), ф (количество тепла). Из переменных, размерности которых: [Я] = ф/Т, [1] = Х, М = |, [А] = С\ И = ^, [А] = ~, (1.33) образуются только две безразмерных комбинации, Я 1ус лТа и Т' Следовательно, Я = Л1Д.*(^). (1.34) Это и есть формула Рэлея, инициировавшая парадокс. Суть претензий к (1.34) сводилась к следующему. Температура и количество тепла имеют, вообще говоря, размерность энергии. Поэтому если из списка Рэлея базовых единиц измерения исключить градусы, включив единицу массы М, — размерности переменных меняются: Мы избегаем физических уточнений. Детали см. в [25].
30 Глава 1. Преобразования и симметрия и теперь из /, V, А, с, Л можно образовать уже две безразмерные величины: 1ус з — и с1 . Л В результате вместо (1.34) получается формула Н = \1Аг/>(1-^, сА, (1.35) гораздо менее информативная. Выходит, что углубление знаний о природе тепла размывает добытый ранее результат (1.34), полученный на основе более поверхностного анализа. Удивительно, что причина парадокса современниками Рэлея так и не была вскрыта, несмотря на дискуссию. Между тем ответ совсем прост. С учетом эквивалентности калорий, градусов и механической энергии, — список параметров (1.33) должен быть формально пополнен двумя обменными коэффициентами: механическим эквивалентом тепла 3 ([3] = МЬ /(Т ф)) и постоянной Больцмана к ([к] = М12/(Т2С°)), — которые позволяют эту эквивалентность использовать. И тогда из пополненного списка (1.33) образуются уже две безразмерное Зс13 ные комбинации — и ——, в результате чего итоговая формула принимает вид: Л к *-"4-*(т-т> (|№> Теперь остается учесть, что в рассматриваемом физическом процессе переход механической энергии в тепловую (и наоборот) не происходит. Поэтому значение 3 не существенно. Но тогда функция г/> в (1.36) не зависит от 3, а значит, и от второго аргумента, что возвращает (1.36) к исходной версии (1.34). Пример обращает внимание на ряд важных обстоятельств, неважно, идет ли речь о физике или о другой области. В частности, наглядно проявляются «относительность» базовой системы единиц измерения и принципиальная роль обменных коэффициентов (физических констант). Участвуют ли последние в «разыфываемом спектакле» — определяется их присутствием в дифференциальных уравнениях, описывающих изучаемое явление. Но если происходит заочный анализ (в отсутствие диф-уравнений), то включение/исключение «обменных коэффициентов» в список переменных задачи определяется пониманием физики процесса. Базовая система единиц измерения может быть выбрана более- менее произвольно. От крайнего случая «все переменные задачи
1.6. Симметрия Мироздания 31 имеют индивидуальные размерности» ' до декларации «все величины безразмерны». Последнее, конечно, даром не дается. Как, скажем, происходит уменьшение числа базовых единиц измерения. Фиксация, допустим, скорости света с ([с] = Ь/Т) в качестве безразмерной величины уравнивает в правах I и Т, - и тогда длина будет измеряться в секундах либо время — в метрах (кому как больше нравится), а число базовых механических единиц (X, Т, М) уменьшится с трех до двух. Не останавливаясь на этом, можно зафиксировать еще какую- нибудь физическую постоянную, например, — гравитационную 7, размерность которой м - и?- Размерностью массы тогда будет Ь /Т . А если учесть ранее принятое Ь ~ Т, то остается всего одна единица измерения. Фиксация еще одной постоянной — понятие размерности вообще ликвидирует (вместе с Палатой мер и весов). Все начинает измеряться в абстрактных единицах. 1.6. Симметрия Мироздания Бытовое представление о симметрии возникает из визуальных образов и ассоциируется с геометрией. Гармония зеркальных отражений и поворотов, простых орнаментов и замысловатых кружев, — вот что питает иррациональное чувство. Но ментальное углубление в подноготную фактов раздвигает горизонты так широко, что первоначальные впечатления рассыпаются в пыль. Симметрия ', в широком смысле слова, начинает интерпретироваться как инвариантность свойств, структур, форм — по отношению к той или иной группе преобразований. Подобная нечувствительность к преобразованиям бывает глубоко скрыта, и найти, «что и по отношению к чему — не меняется», иногда оказывается предметом научного открытия. На виду остается геометрическая Но тогда потребуется множество обменных коэффициентов. От греч. зуттеМа — соразмерность.
32 Глава 1. Преобразования и симметрия симметрия, да и то — не вся. За кадром же в поле зрения попадают «неожиданные экспонаты». Симметрична, как выясняется, музыкальная мелодия, ибо остается узнаваемой — будь сыграна в любой октаве и на любом инструменте. Причем наличие уха человеческого, как инструмента восприятия, непринципиально, потому что сдвиг мелодии вдоль звукоряда инвариантен не «из-за уха», а из-за логарифмирования частот, после которого неважно — бас или сопрано. Симметрична любая автономная система х = /(ж), потому что инвариантна к переносу точки отсчета во времени. Симметрично все, что закономерно. Что происходит одинаково при изменении части условий. Так устроен Мир, управляемый законами. Так движется Сознание, направляемое рамками симметричного Бытия. Симметрично все, где видится гармония. Явная и неявная. Безотчетно воспринимаемая и трудно объяснимая. В теории чисел, например, многие формулы Рамануджана, обладавшего мистическим даром поиска уникальных числовых законов, — дразнят потусторонней загадочностью. Здесь не место углубляться в детали, но даже самые простые его находки типа у 8 - у/& + \ДГ~ - 1 + 2л/3 8ш 20°,
1.6. Симметрия Мироздания 33 вызывают удивление. Проверка равенств не так сложна, но их же надо было найти (!), что противится материалистическому обоснованию. Но даже если отбросить интуитивные ощущения, которые не всегда удается легализовать «алгебраически», — Мир остается симметричным, потому что любой закон природы свидетельствует о той или иной инвариантности к изменению «внешних» условий. Однако подобная широта взглядов приносит мало конкретной пользы. Более конструктивно изучение частных разновидностей симметрии, особенно тех, которые определяют фундаментальные свойства Пространства и Времени. И здесь снова, но уже на втором витке, происходит разворот в сторону геометрии. В первую очередь изучают группу движений — преобразований, сохраняющих расстояния. Все движения подразделяются на: повороты, отражения, переносы и композиции отражений и переносов. Это, конечно, теорема — но она лежит вне рамок данного контекста. На плоскости группа движений, оставляющих неподвижной некоторую точку О, включает только повороты вокруг О и отражения относительно прямых, проходящих через О. Она имеет подгруппу поворотов Сп на углы 2ктг/п, к = О,1,..., п - 1. Группа диэдра Вп включает все повороты из Сп и п отражений относительно прямых, проходящих через точку О и составляющих друг с другом равные углы. Группа Вп изоморфна группе самосовмещений правильного п -угольника. Правильные многогранники, с точки зрения инвариантности по отношению к пространственным поворотам и отражениям, — более сложны для анализа, ибо требуют пространственного воображения и привлечения техники группового анализа. Но сама их классификация может быть легко проведена на другой основе. Правильный многогранник характеризуется тем, что в каждой вершине сходится одно и то же число К ребер и одно и то же число N ребер
34 Глава 1. Преобразования и симметрия ограничивает каждую грань. Если V обозначает число вершин, К — ребер, С — граней многогранника, то МС = 2К, К • V = 2К, что после подстановки в формулу Эйлера V - К + О = 2 (см., например, [3]), приводит к уравнению й-4)*- 24). Все возможные решения легко определяются прямым перебором К = 3, N = 3 — тетраэдр, К = 3, N = 4 - куб, К = 3, N = 5 — додекаэдр, К = 4, N = 3 — октаэдр, К = 5, N = 3 — икосаэдр. Вот, собственно, и все, если полагаться на принцип «прокукарекал, а там пусть хоть не рассветает». Формально задача решена, но загадка остается, что свидетельствует «...о существовании неразгаданных механизмов и скрытых пружин. Результат... стоит как-то особняком, сам по себе, ни с чем не перекликается, никаких вселенских закономерностей не выражает, хотя кажется, что должен» [3]. Теоретико-групповой подход помещает задачу в среду родственных фактов. Многогранников больше не получается, но результаты уже не стоят особняком, перекликаясь и резонируя с другими фактами. Группа икосаэдра, например, оказывается связанной с проблемой неразрешимости алгебраических уравнений в радикалах. Однако подробное рассмотрение геометрических манипуляций 24) Перебор ограничивается целочисленными решениями неравенства 2 2 при очевидном ограничении К, N > 2.
1.6. Симметрия Мироздания 35 с правильными многогранниками требует совсем другого темпа рассуждений, наиболее подходящего для индивидуального обдумывания, нежели для книжного изложения, рассчитанного на среднестатистический вариант восприятия. Многочисленные разновидности симметрии, которые физически воплощаются в кристаллических структурах, — относят обычно к свойствам физического пространства, но это создает определенную путаницу. Ибо, если говорить о широком диапазоне масштабов и точек зрения, — никто не знает, что такое физическое пространство. Подразумевается обычно К , но это лишь чистый холст. Когда декларируют, например, что природа не содержит в себе винта, то 3 25) это не относится к К , куда помещается штопор \ Другое дело, что описание фундаментальных явлений (да и то не всех) не меняется при смене левой системы координат на правую. Но это свойство процессов, а не вмещающего пространства, и здесь — зона ответственности физики. Рождение физических законов происходит своеобразными путями, на которых математическая корректность только мешает. Возьмем в качестве примера электродинамику. Уравнения Максвелла в вакууме имеют вид Ю1Е=-а^, п*Я = /»^, (1.37) где Е и Н — напряженности электрического и магнитного поля, а коэффициенты а и /3 определяются выбором системы единиц. Следствием (1.37) оказывается 26) волновое уравнение ' д2Е д2Е д2Е д2Е , х ^=в?+а* + в?' (1в38) ставшее для Максвелла большой неожиданностью, и он в результате предположил, что электромагнитные возмущения распространяются в виде волн. Дальнейшее хорошо известно: опыты Герца, затем гипотеза Максвелла об электромагнитной 25' «Винтовая асимметрия» окружающего мира (люди в большинстве праворуки, часы ходят по часовой стрелке, улитки одинаково закручены) — на первый взгляд порождается асимметрией внешних причин типа вращения Земли. И разное закручивание водоворотов в Северном и Южном полушариях — это наглядно подтверждает. Но почему Земля «ввинчивает буравчик» к Северному полюсу? Анализ таких цепочек причинно-следственных связей рано или поздно должен упереться в какой-нибудь асимметричный закон глубинной ниши, либо подойти к выводу о существовании другой «Земли», где преобладает леворукость. ' Аналогично для Н.
36 Глава 1. Преобразования и симметрия -ЬнЛ. Яу) природе света — из-за совпадения скорости распространения волн (1.38) со скоростью света, 1/(а/3) = с2. В этом сюжете математика играет разве что наводящую роль. Вывод (1.38) из (1.37), опирающийся вроде бы на элементарные выкладки, уязвим с точки зрения логики. И дело вовсе не в необходи- у мости промежуточного дифференцирования, которое может наткнуться на какую- нибудь негладкость. Каждое из уравнений (1.37) предполагает (за кадром), что в правой части стоит причина, а не следствие. Примерно как в тх = Р сила порождает ускорение, но не ускорение — силу. Это очень серьезное препятствие для свободного манипулирования уравнениями. Если предостережение кажется надуманным, имеет смысл обратиться к примерам из области бифуркаций (см., например, [3]). Динамический блок / (в дискретном времени), дающий на выходе сигнал у [к] - у [к - 1] при входном сигнале у[к], будучи включен в обратную связь (рис. 1.1), предсказывает будущее (!): у[к — 1] = х[к], что вытекает из балансового соотношения х[к] + у1к]-у[к-\]=у[к]. В таких ситуациях, чтобы удержаться в рамках дозволенного, надо переходить на более тонкое описание динамики, учитывая влияние паразитных параметров, запуск процесса и другие привходящие факторы, возможность пренебрежения которыми зависит от обстоятельств. Такая же песня возникает в связи с переходом от (1.37) к (1.38), что подтверждено может быть только экспериментом, и что вроде бы подтверждается27'. Если теперь (1.38) принять за фундаментальный закон природы, то можно изучать его инвариантность относительно различных групп преобразований, но это будет симметрия уравнения (физического процесса), а не физического пространства. ' Если не говорить об использовании явно надуманного понятия времени, ибо время во Вселенной — не более чем математический фокус. По крайней мере, в том исполнении, которое общепринято. Разумеется, это не мешает выдвигать физические гипотезы и ставить эксперименты. Надуманность пространства спрятана чуть глубже, и дает о себе знать каждый раз при выходе за пределы привычного диапазона.
1.7. Парадоксы симметрии 37 В то же время свойства модельного (математического) пространства могут служить путеводной звездой, вмещая либо не вмещая те или иные группы преобразований и фокусируя на них внимание безотносительно к описанию физических процессов. «Неуклюжесть» этих групп может свидетельствовать об ограниченности принятых точек зрения и подталкивать к расширению представлений. На стерильно математическом языке это можно интерпретировать как вложение «плохих групп в хорошие» с возможными философскими и физическими выводами \ При этом, как следствие, могут расти размерности, что вовсе необязательно связывать со спекуляциями о размерности реального пространства, ибо причины роста — заключаются в механизмах «вложений» и увеличении числа степеней свободы. Например, концепция электрона как точечного заряда, движущегося в К3, оказалась несостоятельной еще до появления квантовой механики. Выяснилось, что электрону надо бы приписать момент количества движения (спин), причем модель «вращающейся пули» совершенно не годилась. Выходила странная вещь — момент есть, вращения нет. Квантовая механика кое-как увязала концы с концами, допуская возможность измерения только «±»-проекции «момента» (±Л/2) на избранную ось, и оставляя спин равномерно размазанным по другим направлениям. Таким образом, спин — это математический трюк, загадка Вселенной, которая движется вместе с каждым электроном. Но так или иначе, из непонятного описания — обеспечивающего все же соответствие экспериментальным данным — становится ясно, что электрон не является обыкновенным объектом в К3. Уравнение Шрёдингера пришлось модифицировать. 1.7. Парадоксы симметрии Пузырек воздуха в стоячей воде, не испытывая на себе сил, несимметричных относительно вертикальной оси, обязан подниматься, казалось бы, строго вертикально. Но при числах Рейнольдса В > 50 он движется по спирали (!), что противоречит, на первый взгляд, принципу достаточного основания. Парадокс, тем не менее, копеечный. Симметрия причин должна приводить к симметрии следствий, но диапазон возможной реализации такой закономерно- „ . ( х + у = 3, сти довольно широк. Система уравнении < _ симметрична относительно Такое чаще удается, конечно, задним числом (см. раздел 1.1).
38 Глава 1. Преобразования и симметрия перестановки переменных, но решение {1, 2} — несимметрично. Баланс обеспечивается наличием другого решения {2, 1}. Это, правда, математика. В реальной физической системе пришлось бы объяснять, почему система предпочитает, скажем, {2, 1}. Такая же история возникает в связи с «пузырьком». Возможны три гипотетических решения: вертикальное всплытие и две спирали, закрученные в разные стороны. Симметрия комплекта налицо, но как система реализует конкретный выбор? Вертикальное всплытие отсеивается как неустойчивое, а лево- или правовинтовая спираль получается в результате воздействия причин, находящихся за кадром. Это может быть чистая случайность, если в экспериментах обе спирали возникают попеременно, либо глубинная причина типа асимметрии Галактики. Но в любом случае странное поведение пузырька не более удивительно, чем левостороннее расположение сердца. Однако среди гидродинамических парадоксов [1] есть гораздо менее понятные. Скажем, парадокс Дюбуа, вступающий будто бы в противоречие с принципом относительности: при определенных условиях сопротивление тела в потоке оказывается существенно меньше сопротивления при движении того же тела в той же среде, с той же скоростью. В результате обдувание самолетов в аэродинамических трубах дает большую ошибку относительно реальных полетов в атмосфере. Стандартные объяснения в том или ином виде ссылаются на зачатки турбулентности, которые имеет движущаяся среда. Далее обычно идет скороговорка насчет пограничного слоя, в котором «все бывает». Пограничный слой в самом деле обладает удивительными свойствами , но гидро- и аэродинамика слишком уж переполнены «чудесами», чтобы их объяснения каждый раз принимать за чистую монету. Тут получается та самая история, когда теоретик объясняет, почему А > В, а когда выясняется, что А < Б, говорит: «это тем более понятно», и начинает рассуждать не менее убедительно в противоположно направлении. У гидродинамики наготове также есть масса инструментов и методов. Не хватает ориентиров — когда какие факторы учитывать и какие уравнения применять. Как бы там ни было, но парадокс Дюбуа достаточно эффектен, чтобы лишний раз задуматься об устройстве мира. Противоречие ' Достаточно обратить внимание на парадокс Эйфеля об убывании сопротивления сферы с возрастанием скорости потока [1].
1.7. Парадоксы симметрии 39 возникает как диссонанс практики с уравнениями Навье—Сшокса, каковых, ясное дело, не хватает, чтобы уловить действующий механизм. За уравнениями, конечно, дело не станет. Их можно подобрать как для «А > Б», так и для «А < В». Хорошо было бы научиться такие вещи делать заранее. Но проблема здесь не только в отставании теории. Парадоксальностью искрит сам факт. Мировоззренческая сила принципа относительности настолько велика, что любое явление «подрывающего характера» вызывает глубинный резонанс чувств, и статус парадокса здесь, пожалуй, сохранится независимо от убедительности теоретических объяснений. Так или иначе, соображения симметрии будоражат мысль, оказываясь тем полезнее, чем противоречивее выводы — будь то разногласия практики с теорией либо интуицией. Проблемы порождают даже элементарные ошибки. Скажем, для компенсации неравноплечности весов гирю можно один раз класть на левую чашу, другой раз — на правую. «Симметрия» манипуляций создает иллюзию, что сумма двух взвешиваний будет правильной. Продавец, однако, проигрывает, ибо (а/Ъ) + (Ъ/а) > 2 при а Ф Ъ. Это тривиальный пример. Но есть более глубокие заблуждения той же природы (математической неосведомленности интуиции). Таковы многие парадоксы теории вероятностей [4, т. 4]. Помимо выявления имеющей- ду ся в задаче симметрии — мысль це- / лесообразно направлять также в про- / тивоположном направлении симмет- / ризации задач. ^ - ^ "]/^С ~Л^^^ АГ Дан угол АВС и прямая МИ ^^^^/С-^^/^^^ (рис. 1.2). Надо построить квадрат, ^. У^^^ч^^^ две вершины которого лежат на сто- / ^^^ ронах угла, две — на прямой. /^^ ^^ Заметим, требуемый квадрат В^^ "- зеркально симметричен относитель- р .. * но МЫ. Отсюда ясно, что тот же самый квадрат решает симметричную задачу, в которой угол зеркально симметричен относительно ММ Поэтому вершины квадрата обязаны лежать в точках пересечения сторон угла АВС со сторонами пунктирного муляжа. Подобного сорта задач рассеяно по литературе великое множество. Но идея представляется далеко не исчерпанной, особенно за пределами геометрии.
40 Глава 1. Преобразования и симметрия 1.8. Проективная геометрия Внутреннее чутье резонирует при столкновении с симметрией внешнего мира. Но многое все-таки остается незамеченным. Проективная геометрия позволяет вскрыть замаскированную гармонию, не данную в ощущениях. Исходные положения дисциплины достаточно просты, что приятно контрастирует с нетривиальностью выводов. Центральное проектирование плоскости Р в плоскость Р' из точки О, не лежащей ни на Р, ни на Р;, заключается в сопоставлении точкам А & Р точек А' € Р\ так чтобы А, А\ О лежали на одной прямой К Проективное преобразование допускает также параллельное проектирование (центр О в бесконечности). (!) Данное определение пока с изъяном. Если плоскости Р и Р1 не параллельны, преобразование оказывается неопределенным для некоторых точек плоскости Р. Точнее говоря, плоскость Р/;, проходящая через центр О и параллельная Р;, — пересекается с Р по прямой X, и ни одна точка X С Р «никуда не проектируется», т. е. проектируется в бесконечность. Поэтому прямые, лежащие в плоскости Р и пересекающиеся в некоторой точке С € X, переходят в параллельные прямые на плоскости Р;, а параллельные на Р — в пересекающиеся ' прямые плоскости Р;. Выход из положения обеспечивает пополнение любой рассматриваемой плоскости бесконечно удаленными точками, совокупность которых (декларативно) образует бесконечно удаленную прямую. При таком соглашении центральное проектирование переводит прямую X в бесконечно удаленную прямую пополненной М) При центральном проектировании прямые переходят в прямые, но параллельность может не сохраняться. ' В некоторой точке прямой Ъ', по которой Р' пересекается с плоскостью Рш, параллельной Р и проходящей через центр О.
1.8. Проективная геометрия 41 плоскости Р', а бесконечно удаленную прямую пополненной плоскости Р — в прямую X'. В итоге центральное проектирование становится всюду определенным и взаимно однозначным, что избавляет от исключений, создавая необходимые удобства для развития теории. Плоскость, пополненная указанным выше образом, называется проективной. Располагая этим понятием, можно дать эквивалентное определение проективного преобразования как преобразования проективной плоскости, переводящего любую прямую в прямую. В таком варианте определения очевидно, что проективные преобразования составляют группу. Пополнение плоскости явно фиктивными элементами заслуживает «философского внимания». Взаимоотношения бесконечно удаленной прямой с остальной атрибутикой определены и не вызывают казусов. Больше ничего не требуется. Это лишний раз подчеркивает то обстоятельство, что для «существования» в математике нужна лишь непротиворечивость. Свойства проективных преобразований: • Четырехугольники проективно эквивалентны друг другу, т. е. переходят друг в друга при подходящих преобразованиях, причем можно обеспечить любой порядок соответствия вершин. АС АБ Л п „ п • Двойное отношение —— : —— четырех точек Л, Б, С, V, лежащих на одной ВС В1) прямой, — не меняется при проективных преобразованиях. • Проективные преобразования, вообще говоря, не сохраняют окружностей, но любая данная окружность и не пересекающая ее прямая могут быть переведены в окружность и бесконечно удаленную прямую, а любая окружность с выделенной точкой А внутри, — может быть переведена в окружность с центром, в который переходит точка А. Проективная геометрия богата красивыми задачами [28]. Но здесь не место для демонстраций, потому что много — не поместится, а мало — не даст представления. Поэтому ограничимся маленькой иллюстрацией самого принципа решения. Если взять точки, делящие стороны треугольника в отношении 1 : п, и соединить их с вершинами, — получится фигура, изображенная на рис. 1.4.
42 Глава 1. Преобразования и симметрия Рис. 1.4 Прямое доказательство равенства площадей заштрихованных четырехугольников — неприятная задача. В рамках проективной геометрии она тривиальна. При параллельном проектировании (центр проектирования в бесконечности) пропорции деления отрезков сохраняются, равные площади переходят в равные, а любой треугольник можно перевести в равносторонний, для которого утверждение о равенстве площадей очевидно. В так называемой Эрлангенской программе Ф. Клейн предложил классификацию различных геометрий по принципу их инвариантности к различным группам преобразований. Группа движений порождает евклидову геометрию. Проективная — только что была рассмотрена. Подгруппа проективных преобразований с инвариантным коническим сечением выделяет неевклидову геометрию Лобачевского. Разновидности геометрий весьма многочисленны [28]. Топологию порождает группа гомеоморфизмов.
Глава 2 Основные понятия 2.1. Определения, примеры и авансы К абстрактным понятиям можно двигаться исподволь, гомеопатическими шагами, но короткий путь все же — хирургический. 2.1.1. Группой С называется конечная или бесконечная совокупность элементов, на которой задана групповая операция «-», сопоставляющая любой паре элементов а,Ъ € С некоторый элемент с из той же совокупности С: а-Ъ = с. При этом групповая операция, называемая обычно умножением, обязана удовлетворять трем условиям: • Р * (Я * г) = (Р * О) * г (ассоциативность) \ • В группе существует единичный элемент ' 1, обладающий свойством 1 • х = х • 1 = х для любого х € С. • Каждый элемент х € С имеет обратный х~ : х • х~ — х • х — 1. Понятие группы, таким образом, относится к алгебраическим структурам с одной бинарной операцией. Разнообразие возможных требований выделяет различные другие понятия. Множество с операцией, от которой требуется только ассоциативность, называется полугруппой. Полугруппа с единицей — моноид. Моноид, в котором каждый элемент обратим, — это уже группа. 1' Благодаря ассоциативности скобки в любом произведении можно убрать или, наоборот, произвольно расставить. ' Обозначение «1» не всегда удобно, особенно, когда единица группы участвует в рассуждениях вместе с числом 1. По этой причине для единицы в теории групп часто используется специальный знак «е», — что имеет свои минусы. Мы предпочитаем «1», допуская двоякое толкование и полагаясь на контекст.
44 Глава 2. Основные понятия Три аксиомы п. 2.1.1 порождают колоссальное разнообразие. Теория необозрима. Некоторые задачи принципиально не решаются \ доказательства некоторых теорем занимают сотни страниц, а самые простые результаты плохо укладываются в голову. Для обозначения групповой операции далее могут использоваться различные знаки (*, ®, о), а также отсутствие какого бы то ни было знака, как при обычном умножении. Широкий ассортимент обозначений удобен при одновременном рассмотрении нескольких групп с разными групповыми операциями. Но это в принципе. Практически целесообразно полагаться на контекст, максимально упрощая обозначения в ущерб строгости. Поэтому по мере привыкания удобнее всего знаки группового умножения опускать. 2.1.2. Группу С, содержащую п элементов, называют конечной, а \С\ = п — ее порядком. Порядок \С\ может быть бесконечным. Подмножество элементов Н С С, образующих группу, — при той же групповой операции, что и в С, — называется подгруппой. Подгруппы — это строительные блоки, из которых собрана группа, — поэтому изучение их структуры во многом характеризует свойства группы и, как правило, находится в центре внимания. 2.1.3. Лемма. Подмножество Н С С является подгруппой в томм ' случае, если из а,Ь € Н следует аЪ~{ 6 Н. < В случае а = Ь получаем аа~1 = 1 6 Н. Далее, аеН => \а~1 =а~1 еН. Наконец, а,ЪеН =» аЬ = а(Ь~1)'1 е Н. ► 2.1.4. Лемма. Подмножество Н С С является подгруппой в томм случае, если а,ЪеН => аЬеН и аЕН =» а"1 ЕЯ. Групповое произведение х * ... * х с п сомножителями обозначают как хп, полагая х° = 1. Очевидно, хт * хп = хт'*гП. Группа С, в которой все элементы могут быть получены путем последователь- ' Проблема тождества слов, например. ' См. «Обозначения».
2.1. Определения, примеры и авансы 45 ного возведения в степень одного элемента а, С? = {..., а~ , а~ , а , а, а ,..., ап,...}, называется циклической. • Если все степени а* (к ^ 0) различны, группа С бесконечна. Если же ак = а9, к < д, то а?'* = 1. Фиксировав наименьший положительный показатель, при котором ап = 1, легко приходим к выводу, что группа С исчерпывается степенями а0, а, а2,..., а""1, которые все различны, причем для т = зп + г (0 ^ г < п) ат = аг. (?) • Если циклическая группа конечна, то среди а, а2,..., ап-1 обязательно есть а-1. В бесконечной циклической группе ни одна из положительных степеней ак не совпадает с а"1. Поэтому иногда говорят, что бесконечная циклическая группа имеет две образующих: а и а-1. В общем случае минимальное п в равенстве Ьп = 1 называют порядком или периодом элемента Ь и обозначают через \Ь\. В случае Ьп ^ 1 при любом п > 0 — считают |Ь| = оо. Если порядки всех элементов группы С (кроме единичного) бесконечны, — говорят, что С — группа без кручения. Если же порядки всех элементов группы конечны, группу называют периодической. Упражнения При первоначальном знакомстве с предметом решение упражнений необходимо по разным причинам: от привыкания к объекту до запоминания хотя бы части терминов. • Для любых элементов группы: (х • у)~1 = у~1 • х~1. • К групповой операции достаточно предъявить два требования: ассоциативность и разрешимость уравнений а • х = Ь, у • а = Ъ, при любых а,Ь € С. Получится эквивалентное определение группы. • В исходном определении достаточно требовать существования левой единицы и правой: 1/-ж = ж, хЛг = х. Равенство 1/ = 1г вытекает из ассоциативности групповой операции.
46 Глава 2. Основные понятия • Конечная группа порядка N является циклической в томм случае, когда в ней есть элемент порядка N. • Всякая группа простого порядка — циклическая. • Всякая подгруппа циклической группы есть снова циклическая группа. • Подгруппы циклической группы порядка п находятся во взаимно однозначном соответствии с делителями п. • Совокупность всех степеней любого элемента д € С является циклической подгруппой {д} группы О, \{д}\ = \д\. • Если да при изменении а пробегает все элементы группы С и до произвольный элемент О, то д0 • да (рйвно как и да • до) также пробегает все элементы группы. • Если элементы а, Ь перестановочны, а • Ь = Ъ • а, то \а • Ъ\ — \а\ • \Ь\. • Если элементы а, Ь перестановочны и \а\ = тп, \Ь\ = п, то в группе всегда есть элемент — не обязательно равный произведению а • 6, — порядок которого совпадает с наименьшим общим кратным чисел тип. • Любая конечная группа С четного порядка имеет элемент 2-го порядка. «* Подмножества {<7,<7-1} С С имеют не по два элемента, а по одному, если либо 0=1, либо д = 1. Далее остается заметить, что С представляет собой объединение подмножеств {д, д~1}. ► Групповую операцию, как уже отмечалось, называют умножением, и часто вообще обходятся без знака. Это соответствует мультипликативной точке зрения. Для абелевых (коммутативных) групп, в которых, по определению, а-Ъ = Ъ-а, обычно используется аддитивная терминология. Групповая операция при этом называется сложением и обозначается знаком +, а единицу именуют нулем. Перемена точки зрения, технически равноценная, все же меняет освещение предмета, в результате чего некоторые результаты интуитивно ясны в мультипликативной аранжировке, некоторые — в аддитивной. За этим интересно проследить в процессе освоения теории групп. Это хороший пример, показывающий насколько заблуждения и прозрения зависят от ассоциаций, вызываемых обозначениями.
2.1. Определения, примеры и авансы 47 Примеры групп: • Положительные рациональные числа (без нуля) по отношению к операции умножения. • Группа целых чисел Ъ по отношению к сложению. • Кп по отношению к сложению векторов. • Совокупность невырожденных матриц по отношению к матричному умножению. • Множество «самосовмещений» тетраэдра (куба, октаэдра, икосаэдра, додекаэдра) по отношению к последовательному выполнению преобразований (вращений, отражений). • Совокупность верхних (нижних) треугольных матриц с ненулевыми элементами диагонали'. «11 0 0 1хг <22 0 1\п 1>1п ^пп - ? / 1 Г «11 «21 - 1п\ 0 . <22 • *п2 • . 0 " . 0 ^пп • \ ) Произведение треугольных матриц одного типа — есть треугольная матрица того же типа. Обратная к треугольной — тоже треугольная матрица, соответственно, верхняя или нижняя. • Совокупность функций 1 1 х 1 - х х, -, 1 - ж, , , х 1 - х 1 - х х по отношению к композиции. (?) • Аддитивная группа 2* вычетов по модулю р, где р простое число. Ее элементами являются числа 0, 1, 2,..., р - 1, а групповое произведение а о Ъ равно остатку от деления обычной суммы а + Ъ на р, т.е. аоЬ = а + Ь (тойр). Проверка групповых свойств тривиальна. Единицей группы служит нуль. • Мультипликативная группа 2* вычетов по модулю р, где р простое число. Ее элементами являются р — 1 чисел 1, 2,..., р — 1,
48 Глава 2. Основные понятия а групповое произведение а * Ь равно остатку от деления обычного произведения аЬ на р, т. е. а*Ъ = аЪ (тойр). Группа 2^ , очевидно, абелева. Проверка групповых свойств связана с некоторыми хлопотами. «* Первые две аксиомы группы очевидны. Ассоциативность ясна, поскольку а * Ь * ... * Н, как и в случае двух сомножителей, равно остатку от деления обычного произведения аЪ...Н на р. Обоснование третьей аксиомы (существование обратного элемента) — не так просто. Единица обратна сама себе. Далее надо доказать, что любое число х из {2,... ,р — 1} имеет обратное. Рассмотрим р целых чисел, ж, ж2,... , ж*\ Ни одно из этих чисел не делится на р, поскольку р простое, а х < р. Разделив каждое хк на р, получим р остатков, строго меньших р. Поэтому хотя бы два числа, скажем хп и хт, при делении на р дают один и тот же остаток. Поэтому5) хп-хт = хт (хп~т - 1) = 0 (тобр), а так как хт ф О (тос1р), то хп~т -1=0 (тос1р). Пусть у обозначает остаток от деления числа хп~т~1 на р, т.е. хп-т-1 =у(тодр). Умножая обе части последнего равенства (сравнения) на х, получаем хп~т = ху (тос1р). Но, как уже показано, хп~т при делении на р дает в остатке единицу. Следовательно, ху = 1 (тодр). Поэтому у = х~1. ► Посмотрим теперь, какие отсюда можно извлечь дивиденды. Если некоторая группа имеет порядок п, то любой ее элемент к, «умноженный» п раз сам на себя, обязательно дает единичный элемент. Это известный в теории групп результат К Применяя его к группе 2^ , в которой р — 1 элементов, получаем: АС * ... * АС — 1, ' Запись х — а (тойр) означает: «ж при делении на р дает в остатке а < р». Если же а ^ р, то х = а (тойр) подразумевает: «ж и о при делении на р дают одинаковый остаток». ' См. далее — теорема 2.3.2. Факт, между прочим, достаточно прост для упражнения.
2.2. Группа подстановок 49 где р — 1 сомножителей, что означает делимость кр { — 1 на р, и называется малой теоремой Ферма. Другая жемчужина теории чисел — теорема Вильсона: если р простое число, то (р - 1)! + 1 делится на р. «* Пусть к (Е Ср. Если к * к = 1, то к2 - 1 = (Л - 1)(& + 1) делится на р. А так как 1 ^ к ^ р - 1, то либо к = 1, либо к = р - 1. Поэтому среди 2,3,...,р-2 нет элементов, которые являются обратными сами себе. Таким образом, все элементы 2, 3,... ,р - 2 разбиваются на пары взаимно обратных. Поэтому 2*3*-*(р-2)=1. Отсюда 1*2*-* (р- 1) =р- 1. Но это и есть теорема Вильсона '. ► (!) Приведенные доказательства можно «переложить» на арифметический язык, избавившись от групповой идеологии. И это не так уж сильно удлинит рассуждения. Однако доказательства превратятся в рецепты, которые работают, но не ясно — почему К В этом, собственно, и заключена главная выгода стерилизации задач от числовой специфики. Плюс к тому, как только становится ясно, что объект изучения является группой, к анализу подключается арсенал готовых инструментов и результатов. 2.2. Группа подстановок Группы подстановок играют ключевую роль при изучении конечных групп, поскольку других конечных групп не бывает. Точнее говоря, конечные группы с точностью до изоморфизма исчерпываются подгруппами группы подстановок (теорема Кэли). Рассмотрение предмета обычно начинается с перестановок (не подстановок), что создает в головах некоторую путаницу. ' Результат не так прост, как видится с групповой точки зрения. Теорему впервые опубликовал Варинг со ссылкой на Вильсона. Высказана она была в виде гипотезы. Лишь через некоторое время доказательство удалось найти Лагранжу. ' Что не там страшно, где уже доказано, а там — где только предстоит.
50 Глава 2. Основные понятия Стандартный способ описания перестановок п предметов сводится нумерацией к перестановкам чисел от 1 до п. Результаты записываются в виде строк (^ ]2 • • • ]п) • Все п\ перестановок из п символов можно расположить в таком порядке, что каждая следующая перестановка будет получаться из предыдущей одной транспозицией9^. (?) (Стандартное доказательство получается с помощью индукции.) Запись одной перестановки под другой, *=(* >} - *Л (2.1) \«1 г2 ... гп/ определяет подстановку ', при которой каждое ]ъ переходит в г*. Порядок записи столбцов в (2.1), разумеется, не играет роли. Произведение (композиция) подстановок а\ • <72 определяется как последовательное применение бг2, потом а\. Множество 8„ всех подстановок вида (2.1) с композицией в качестве групповой операции — называется симметрической группой п-й степени, |8„| =п\, (\ 2 ... п\ „ единица группы — тождественная подстановка 1. Об- \1 2 ... п) ратной к (2.1) является подстановка 4^1 к ••• к)' Любые группы подстановок являются подгруппами 8„. Вместо 8„ иногда удобнее говорить об изоморфной группе отображений 8ут(С?), п = |С?|, где за кадром подразумеваются перестановки элементов группы (?, а не чисел 1,..., п, — изоморфизм достигается нумерацией элементов группы. Циклической подстановкой (циклом) (г^.-.г'д) длины к называется подстановка, переводящая г\ в г'г, г 2 в г'з, ..., ги-\ в г*, ' Транспозиция меняет местами два символа, «не трогая» остальных. ' Разница, таким образом, заключена в следующем. Перестановка — это результат упорядочения предметов, подстановка — это преобразование, переводящее одну перестановку в другую.
2.2. Группа подстановок 51 наконец, г* в г}. Цикл все равно откуда начинать. Поэтому, напри- мер11), («1*2... **) = (*2...**М). Любая подстановка (2.1) представйма в виде произведения циклов. Для этого достаточно взять любое число ^, посмотреть, в какое ]г оно переводится, затем выяснить, во что переходит ]г, и так далее до тех пор, пока не встретится уд, переходящее в ^. В результате выделяется сомножитель (цикл) (Мг •••;«). Затем среди 1,..., п берется любое число, не входящее в найденные уже циклы, и повторяются прежние манипуляции. И так — до исчерпания всех чисел 1,..., п. В результате, например, /12 3 4 5 6 7 8\ \7 6 2 3 1 4 5 8/ У /У 'У ' Восьмерка в данном случае просто остается на месте. Циклы, понятное дело, получаются непересекающимися, и потому их произведение не зависит от порядка сомножителей. Любой цикл представим в виде произведения транспозиций — циклов длины 2, что следует из (г\г2 •.. ч) = (МгХЫз)... (**-1«*). Это еще раз доказывает, что любая подстановка представйма произведением транспозиций. Четность перестановок и подстановок. Будем говорить, что два числа в перестановке образуют беспорядок, если большее число стоит впереди меньшего. Перестановка называется четной (нечетной), если число беспорядков ' в ней четно (нечетно). Заметим теперь, что любая подстановка (2.1) в результате подходящей перестановки столбцов всегда может быть записана в стан- ' В принципе, цикл было бы «правильно» изображать в виде чисел, записанных по кругу. Но «правильные» пути не всегда удобны. ' Для определения суммарного числа беспорядков числа просматриваются в порядке записи, для каждого числа подсчитывается, сколько чисел, меньших данного, стоит правее, — и все результаты складываются.
52 Глава 2. Основные понятия дартном виде »-(! ? - "), (") \г1 г2 ... гп) в результате чего между подстановками и перестановками устанавливается взаимно однозначное соответствие — по второй строке (2.2). Соответственно, подстановки делятся на четные и нечетные. Всякая подстановка разлагается в произведение транспозиций, причем — разными способами. Однако число транспозиций в представлении четной (нечетной) подстановки — обязательно четно (нечетно). (?) В симметрической группе 8„ подгруппу А„ всех четных подстановок называют знакопеременной группой степени п. Нечетные подстановки группу не образуют. Группа подстановок С называется транзитивной, если для любых двух ее элементов г, ] найдется подстановка из (?, переводящая г в ]. Транзитивность является принципиальным понятием, которое часто подразделяет изучаемые явления на «удобные» и «неудобные». Если, в случае простого п, транзитивная группа С С 8„ содержит хотя бы одну транспозицию, то С = 8П. (?) 2.3. Смежные классы Если Н подгруппа группы (?, то множество элементов 9\Н = {д{Н :НеН}, д{ е С, но д{ $ Я, не пересекается с Н. < В противном случае нашлись бы элементы Н\ Н" (Е Я, такие что 9\-Ы = Н". Но тогда #1 = Н" • (Л')-1 > что противоречит предположению д\ $ Н. ► Аналогично проверяется, что #2 • Н — при условии #2 ^ Н, 92 $ 9\ • Н, — не пересекается ни с Н, ни с д\ • К
2.3. Смежные классы 53 Продолжая этот процесс до исчерпания всех элементов конечной группы, получим разбиение С на р непересекающихся совокупностей: Д дх Д 92 Д ..., 9Р-хК (2.3) Число р называют индексом подгруппы Н. Распространено обозначение р = \С : Н\. В силу взаимной однозначности 9Н^Нд-\ индекс \С : Н\ не зависит от того, какие смежные классы имеются в виду, левые или правые. Из (2.3) вытекает \С\=р\Н\, т.е. \С\ = \Н\-\6:Н\, что влечет за собой справедливость следующего результата. 2.3.1. Теорема Лагранжа. Порядок любой подгруппы конечной группы является делителем порядка группы. Теорема Лагранжа обращается лишь частично. Если простое р делит порядок группы п = \С\, то в С есть элемент порядка р (теорема Коши), а если р делит п = \С\, то С имеет подгруппу порядка р (см. теоремы Силова). Группа порядка 12 обязана иметь подгруппу четвертого порядка, но не шестого. Следствие теоремы 2.3.1: группа простого порядка не имеет нетривиальных подгрупп х\и является циклическойх К 2.3.2. Теорема. Любой элемент а любой конечной группы С произвольного порядка п = \С\ — удовлетворяет условию а = 1 «* Пусть элемент а 6 С имеет порядок д = \а\, что означает а9 = 1, причем Н = {а, а2,..., а9} — подгруппа С. Поэтому п=щ. В итоге оп = (а9)р = 1. ► 1 ' Кроме {1} и самой себя. 14* В противном случае нашелся бы элемент а € С, такой что а9 = \, д < \С\. Но тогда бы у С была нетривиальная подгруппа {а, а ,...,а9}.
54 Глава 2. Основные понятия Из теоремы 2.3.2, кстати, следует а = ап для любого а € С, при условии \С\ = п. Множества дъ • Н в (2.3) называют левыми смежными классами по подгруппе Н. Аналогично определяются правые смежные классы, как Н • д%. Ни один смежный класс, кроме самой подгруппы Н, не образует группу, поскольку не содержит единичного элемента. В коммутативных (абелевых) группах левые и правые смежные классы, разумеется, совпадают. Но подобное совпадение встречается и в некоммутативном случае (см. инвариантные подгруппы), что, собственно, и составляет наименее тривиальную часть теории. Для интуитивного усвоения понятия смежных классов естественно опираться на примеры. Один из относительно привычных вариантов — линейные пространства с операцией сложения векторов. Линейное пространство X разбивается на классы смежности по линейному многообразию Н С X следующим образом. Считается, что два элемента принадлежат одному и тому же классу, если и только если хх - х2 (Е Н. Два класса смежности либо совпадают, либо не пересекаются. Если X плоскость, Н прямая (проходящая через нуль), то классы смежности это прямые в плоскости X, параллельные Н. Сразу имеет смысл вспомнить, как в функциональном анализе сюжет развивается дальше. Совокупность всех классов смежности образует фактор-пространство Х/Н, наделяемое структурой линейного пространства следующим образом. Если классы Ьх и Ь2 имеют представителями Х\ и х2, то суммой Ьх + Ь2 объявляется класс, которому принадлежит элемент х{ + х2. Размерность фактор- пространства Х/Н (конечная или бесконечная) называется коразмерностью, или дефектом, подпространства Н в X. При изучении линейных операторов в банаховом пространстве Е это некоторым образом «выстреливает». Рассматривается ядро кег А, или нуль-пространство оператора Л, — представляющее собой множество элементов ж, для которых Ах = 0, — и образ К^: множество элементов у = Ах. Далее вводится фактор- пространство сокег А = Е/КА, называемое коядром оператора А, и т. п. Комментарий из [4, т. 5]: «Конечно, все эти „керы" и „кокеры" не способствуют популярности математики, но здесь надо понимать, что это не более чем торжественная терминология для простых, хотя и непривычных понятий. Да и нужны они по большому счету лишь на той стадии, когда тяга к функциональному анализу становится хронической» — здесь должен быть поправлен. В теории групп «фактор-конструкции» играют стержневую роль.
2.4. Нормальные делители и фактор-группы 55 2.4. Нормальные делители и фактор-группы Совокупность элементов 9~Х -Ъ-д, где Н пробегает все элементы подгруппы Н С С, а д фиксированный элемент группы С, — является подгруппой [5\ как говорят, подобной, или сопряженной, подгруппе Н. 2.4.1. Если все подобные Н подгруппы совпадают с самой Н, т.е. при любом д € С д-1Нд = Н, (2.4) то Н называют инвариантной подгруппой, или нормальным делителем группы С, или просто нормальной подгруппой, — и пишут ' Н <С. Заметим, что (2.4) равносильно требованию дН = Нд, (2.5) т. е. левые смежные классы по инвариантной подгруппе обязаны совпадать с правыми. Если Н — нормальная подгруппа группы С, то запись х = у (тойН), х,уеС, означает, что х и у лежат в одном и том же смежном классе1 ' по Н. В частности, х = О (той Н) => х € Н (подразумевается аддитивная интерпретация). • Пусть С — группа невырожденных п х п матриц, Я С С — подгруппа матриц, имеющих детерминант, равный 1. Поскольку \с1ас\ = \с1\'\а\-\с\ = 1, лея, се с, 1 ' Проверяется элементарно. 1 ' Употребляется также обозначение Н < С. Но равенство Н = С мы допускаем и в том и в другом случае. 17' Это равносильно требованию х,у € С => ху~1 € Я (либо х — у € Я в аддитивной интерпретации). Факт — в русле леммы 2.1.3.
56 Глава 2. Основные понятия подгруппа Н инвариантна. Смежные классы по Н состоят из всех матриц с одинаковым определителем. • Пусть — подгруппа18) матриц из группы О = 81^(О»). Пусть д = 9 [о г]9" = Поэтому дНд~х С Я, но дНд~х Ф Н. • Подгруппа матриц — нормальна в группе {[« ;]:.,в..6д}. (?) Пусть Н — инвариантная подгруппа С. Произведение смежных классов 19'/'Яи^Я- определяется естественным образом как (/■Н)(д-Н) = /-(Н.д)Н = (/-д)Н, в силу (2.5) и очевидного Н-Н = Н. Таким образом, произведение смежных классов снова дает смежный класс. Кроме того, (д • Н) • (д~х • Н) = К Следовательно, совокупность смежных классов по инвариантной подгруппе Н является группой, которую называют фактор-группой и обозначают как С/Н. Из вышесказанного ясно, что единицей С/Н служит подгруппа Н В случае \С\ < оо порядок С/Н равен индексу группы Н Группа, не имеющая нетривиальных инвариантных подгрупп \ называется простой. Простые группы наиболее сложны для изучения, поскольку представляют собой как бы единый клубок, в котором невозможно выделить структурные части. 1 ' Фактически Н изоморфна группе Ъ. 1 ' В силу инвариантности — неважно каких, левых или правых. ' Тривиальными являются единичная подгруппа и сама группа. 3 О Р 1] . Тогда 1 Ъг О ?•
2.5. Классы сопряженных элементов 57 Нормальные группы и сопутствующие понятия, играющие в теории групп ключевую роль, требуют освоения и осмысления, каковых можно достичь только размышлением над задачами. • Если Н и 3 — подгруппы С, то множество НЗ = {Нз : кеН, зеЗ} не обязано быть подгруппой. Но если одна из подгрупп Н, 3 — нормальна, то НЗ — подгруппа С. А если обе Н и 3 — нормальны, то НЗ — нормальная подгруппа. (?) • Если подгруппа Р С С содержит нормальную подгруппу N С С, т. е. МСРС6, (2.6) то N нормальна также в Р. Но если в цепочке (2.6) Р — нормальный делитель бг, а N — нормальный делитель Р, подгруппа N не обязана быть нормальной в а. (?) • Всякая подгруппа индекса 2 — нормальна. «* В силу \С : N1 = 2 есть только два смежных класса: сама подгруппа N С С и, скажем, левый класс дИ, где д $ N. Тогда правый смежный класс Ид либо совпадает с N (чего не может быть), либо совпадает с дЫ, что и реализуется, завершая доказательство. ► • Если N С С — нормальная подгруппа группы С индекса п, то д11 € N для любого д € С. < Поскольку фактор-группа С/Ы имеет порядок п, то (^^)п = 1 для любого д 6 С. Далее «выстреливает» нормальность И: {дЫ)п = дпМ =» дпеК ► • Пересечение нормальных делителей является нормальным делителем. • Всякая подгруппа абелевой группы является нормальным делителем. • Если V, V нормальные подгруппы С, и [7р|У = {1},то иу = уи для любых и е V, у 6 V. (?) 2.5. Классы сопряженных элементов Элементы х и у при условии у = дхд~ для некоторого д € С, называют сопряженными. Множество х всех сопряженных х элементов называют классом сопряженных элементов, х6 = {дхд-{ :дев}.
58 Глава 2. Основные понятия Подгруппа Н С С нормальна в томм случае, когда она является объединением классов сопряженных элементов, т. е. когда Н вместе с каждым своим элементом х содержит все элементы, сопряженные х. • В абелевой группе любой класс сопряженных элементов состоит из одного элемента. • В8„ подстановки сопряжены в томм случае, когда они имеют одинаковую циклическую структуру. Подстановки Р=(цг2...)(Ю2...)(.■■)■■■, с циклами одинаковой длины, выписанными друг под другом, сопрягаются с помощью подстановки \«1 Ь ... ]х ;2 .../ что легко проверяется. В частности, подстановки (12)(345) и (24)(513) сопряжены в 85. • Матрицы сопряжены в томм случае, когда приводятся к одинаковой жордановой форме. 2.6. Автоморфизмы и гомоморфизмы Прикладной потенциал теории групп тривиален до гениальности. При изучении объекта полезно следить за группой его автоморфизмов, т. е. преобразований, на которые объект «нереагирует»21'. Но обо всем по порядку. Две группы С и С' называются изоморфными, если между их элементами можно установить взаимно однозначное соответствие (р : С -> С', такое что 2' <р(аЪ) = <р(а)<р(Ь). (2.7) Изоморфные группы эквивалентны, С ~ С1, с точки зрения их групповых свойств, хотя природа элементов и операций может 1' Что можно сказать о человеке, на которого не влияет повышение в должности, и который «не совершит большой подлости при малой выгоде»? 2' Равенство (2.7) было бы корректнее писать в виде <р(а • Ь) = (р(а) о (р(Ь), где точка обозначает умножение в (?, а«о» — в С.
2.6. Автоморфизмы и гомоморфизмы 59 быть различна \ Изоморфное отображение группы на себя называется автоморфизмом. Автоморфизмы С —> С образуют группу автоморфизмов, обозначаемую Аи1С. Если в данном выше определении изоморфизма отображение (р : С -> С' не обязательно обратимо, но по-прежнему удовлетворяет условию (2.7), — то говорят о гомоморфном отображении группы С в С1, а (р называют гомоморфизмом \ Сюръективный (накрывающий) гомоморфизм (р:С —> С\ отображающий С на С, называется эпиморфизмом, а всякое гомоморфное отображение группы в себя, — эндоморфизмом. Терминология слишком пестра, чтобы ее сразу всю запоминать, но изоморфизм, автоморфизм и гомоморфизм желательно расположить в памяти «на виду». Упражнения • Гомоморфный образ подгруппы является подгруппой. • Гомоморфизм <р/(д) = /_1 • д • / при любом фиксированном / является автоморфизмом. Совокупность {<р;} образует группу так называемых внутренних автоморфизмов \пхС. • Изоморфизм сохраняет все групповые свойства. Гомоморфизм может кое- что терять, преобразуя, например, группу без кручения в периодическую, либо некоммутативную группу в коммутативную. Конечность, коммутативность, цикличность — сохраняются при любом гомеоморфизме. При гомоморфном отображении С в С' единица в С переходит в единицу группы С1. Совокупность всех элементов из С, переходящих в единицу группы С1, называется ядром гомоморфизма (р: С -> С' и обозначается как кегу>. Гомоморфизмы играют в теории групп ключевую роль, в связи с чем требуют к себе пристального внимания. ' Группы вращений куба и октаэдра — изоморфны. ' При гомоморфизме различные элементы из С могут переходить в один элемент группы О'.
60 Глава 2. Основные понятия Если Н С С — нормальная подгруппа, то преобразование каждого элемента д € С в смежный класс д • Н является гомоморфным отображением С на фактор-группу С/Н, которое называется естественным гомоморфизмом С на С/Н. Ядром этого гомоморфизма служит подгруппа Н. 2.6.1. Теорема о гомоморфизме. Если гомоморфизм (р отображает С на С, то Н — кегу> — инвариантная подгруппа в С, а группа С изоморфна фактор-группе С /Н < Покажем сначала, что ядро гомоморфизма обязано быть инвариантной подгруппой. Это вытекает из импликации25*: ЛеЯ => Ч>{д-ХЪ,9) = 4>{д~х) о ф) о <р{д) = ^\д) о <р(д) = 1', т.е. д~хЬ,д при любом д также принадлежит Н Рассмотрим далее отображение ш : С/Н -» С\ работающее по правилу: ш(хН) = <р(х). Легко проверяется, что ш — искомый изоморфизм С/Н на С'. Действительно, <р(х) — <р(у) влечет за собой ш(хН) = ш(уН), т.е. ш в самом деле отображает С/Н -» С', Ясно также, что ш сохраняет умножение и отображает на. Далее, (р(х) = (р(у) =Ф- ж-1 у € Н, поэтому ш инъективно (взаимно однозначно). ► Таким образом, с точностью до изоморфизма естественные гомоморфизмы исчерпывают все гомоморфизмы группы. Доказательство теоремы 2.6.1 показывает, что любой гомоморфизм (р : С -> С1 есть композиция (р = ш о и, где у — естественный гомоморфизм, ш — изоморфизм. 2.6.2. Теорема о соответствии. Пусть гомоморфизм (р отображает С на С'; Н = кепр; и К = {К:НСКсС} обозначает совокупность всех подгрупп К С С, содержащих Н Тогда соответствие К <-)• <р(К) является биекцией ' между К и всеми подгруппами С1. ' 1' обозначает единицу группы С'. ' Биекцией называется взаимно однозначное отображение «на», т. е. инъективное и одновременно сюръективное преобразование X -> X, множество которых обозначают 5ут(Х).
2.6. Автоморфизмы и гомоморфизмы 61 При этом соответствующие друг другу группы одновременно нормальны, а фактор-группы по ним — изоморфны, т. е. Н С К < С & (р(К) < С, С/К ~ С'/(р(К). < Прообраз <р~1(К') любой подгруппы К' С С' содержит Я, поскольку <р~1(1) = Н. Поэтому ф~х(К') (Е /С. Далее, в предположении К'фК\ <р(К') = <р(К"), (2.8) по любому х € К1 можно указать такое у € К", что <р(х) = <р(у), т.е. <р(х)<р~1(у) = 1 =» <р(ху~1) = 1, откуда ху~х еНСК" => К1 С К". Аналогично устанавливается К" С К\ что в итоге обеспечивает равенство К' = К" и приводит к противоречию с (2.8). Тем самым доказано, что соответствие К -* <р(К) является биекцией, т. е. взаимно однозначным «отображением на». Покажем теперь одновременную нормальность К и <р(К). Если К < С, то 9Кд-{=К => ч>{д)ч>(КМд-х) = <р{К). А поскольку <р(С) = 0\ то когда д пробегает всю группу С, <р(д) пробегает всю группу С', что гарантирует нормальность <р(К). Изоморфность фактор-групп устанавливается с помощью вспомогательного эпиморфизма ^ : С -» С'/<р(К), определяемого как %(д) = ф(д)ф(К). Легко проверяется К = кег^, откуда по теореме 2.6.1 С/К ~ С'/(р(К). ► Гомоморфизмы в теории групп применяются весьма часто, причем в большинстве случаев использование инструмента носит тривиальный характер, — но требует привычки. Вот элементарный пример. 2.6.3. Теорема Кэли. Любая конечная группа С изоморфна некоторой подгруппе симметрической группы подстановок 8„, где п = \С\. < Введем отображения % : С -» С, сопоставляющие любому х € С элемент ах (левое умножение на а). Легко видеть, что % составляют группу (?), причем 71 (#) = ж, откуда следует, что преобразование а *-> 7о(ж) есть гомеоморфизм С -» 8ут(6г). Далее остается лишь пронумеровать элементы группы С, чтобы перейти от 8ут(6г) к 8П. ► Тривиальный характер многих доказательств в теории групп часто порождает двойственное чувство. Изначально — «не ясно, как
62 Глава 2. Основные понятия подступиться», потом — «зачем было ломать копья». Причина в том, что без привычки не ясно, «как это делается». Однако надо признать, что выработать привычку не так легко, поскольку область неудобна для подсознания. Обычный рецепт выделения какого-либо наглядного примера в качестве эталона здесь плохо работает. Скажем, подстановки достаточно просты и наглядны вроде бы, — но законы, управляющие ими, включают все сложности теории конечных групп. Поэтому оптимизм в связи с теоремой Кэли быстро тает при столкновении с действительностью. 2.7. О роли инвариантов Роль инвариантов подчеркивалась в главе 1 на примере изучения дифференциальных уравнений. Но эта роль сквозная. Инварианты всегда сопровождают групповые изыскания в том или ином виде. В одних постановках задач ищутся подгруппы преобразований «ничего не меняющие», в других — выясняется, «какая часть» изучаемого явления нечувствительна к данной группе. При этом довольно часто групповой аспект остается за кадром. Семь монет лежат гербом вверх. Можно ли, переворачивая по две монеты, уложить в итоге все гербом вниз? Задача, конечно, для детского сада. Нельзя. Потому что при переворачиваниях сохраняется четность числа монет, лежащих гербом вверх. Инвариант — четность. Всевозможные переворачивания — группа. Вариации в подобном направлении встречаются довольно сложные. Можно ли шар разрезать на части, и сложить из них куб? Разрезы — произвольные гладкие поверхности \ К решению быстро приводит обнаружение «ингредиента задачи», нечувствительного к разрезам. Границы каждой г-й части разобьем на участки трех категорий: выпуклые, вогнутые и плоские, — и пусть их площади, соответственно, 51, 82, 5з- Положим 1% = 8\ - 5г. Сумма г ' Некоторые детали мы обходим стороной, не говоря о разбиениях с использованием аксиомы выбора, которые приводят к парадоксам типа Банаха—Тарского [3].
2.7. О роли инвариантов 63 как легко видеть, инвариант, потому что любой выпуклый участок границы на разрезе — вогнут по отношению к соседнему (при разрезании) куску. Поскольку /(шара) = 4тгД2, /(куба) = О, ответ — отрицательный. Попытка аналогичным образом рассмотреть тетраэдр и куб ничего не дает. Но здесь работает другой инвариант, уже нетривиальный. В итоге достигается решение третьей проблемы Гильберта. Равновеликие многоугольники равносоставлены, т. е. один из них можно разрезать на меньшие многоугольники и сложить из них другой. Этот факт существенно упрощает учение о площадях. При определении же объемов многогранников в К приходится использовать сложный предельный переход. Необходимость это или равновеликие многогранники тоже равносоставлены? В этом вопросе, собственно, и заключалась третья проблема Гильберта, которую отрицательно решил Дэн (1900). Таким образом, оказалось, что при переходе от К2 к К3 ситуация принципиально меняется. Для решения проблемы необходимо привлечение дополнительных технических средств. Напомним, базисом называют совокупность линейно независимых векторов {еь ..., еп,...}, с помощью которых однозначно выражается любой вектор х рассматриваемого пространства х = ^Г ж,е,. (2.9) I При этом ж, называют координатами вектора х. Для построения обычного базиса в конечномерном пространстве берется любая система В линейно независимых векторов и к ней добавляется вектор, который линейно не выражается через В. На каком-то шаге процесс заканчивается — иначе возникает противоречие с конечномерностью. При наличии аксиомы выбора такая процедура может быть реализована также в бесконечномерном случае, как в счетном варианте (2.9), так и в несчетном (с континуальным индексом г). В несчетном варианте необходимые рассуждения несколько усложняются, но суть остается примерно та же. Получаемые таким образом базисы называются базисами Гомеля. Дополнительное разнообразие ситуаций определяется возможностью вводить ограничения на допустимые координаты. Требовать, скажем, их рациональности. В последнем случае действительная прямая становится бесконечномерным векторным пространством из-за рациональной несоизмеримости многих чисел. Например, 3 и у2 линейно независимы, поскольку Л13 + А2%/2 = 0 невозможно при рациональных А,.
64 Глава 2. Основные понятия Разрывная линейная функция. Рассмотрим функциональное уравнение <р(х + у) = <р(х) + (р(у). (2.10) Возьмем любой базис Гамеля на действительной прямой, выберем некоторый базисный вектор еА, например, еА = >/5 или еА = 7Г, или даже еА = 1, и положим Ф) = кхх, (2.11) что даст функцию, удовлетворяющую (2.10). Конкретного решения (2.10) на самом деле, конечно, не дано. Если еА = >/5, то мы не можем даже сказать, чему равно, например, значение у?(4), потому что Х\ зависит не только от еА, но и от всего базиса2 \ Тем не менее конструктивно способен работать сам факт существования такой функции. Решение третьей проблемы Гильберта. Введем понятие псевдовеса многогранника М, Р(М) = ^/,ЙА,), (2.12) г где суммирование идет по всем ребрам длины /,-, А, — двугранный угол при г-м ребре, дир — функция вида (2.11). Точнее говоря, пусть в — двугранный угол при ребре правильного тетраэдра. Достроим множество {в, 7г} до базиса Гамеля (легко проверяется, что 7Г и в несоизмеримы) и положим <р(\) = \в, т. е. у?(А) равно 0-й координате в разложении по базису. Вычислять значения у?(А) 29) мы можем лишь в двух ситуациях ' <р(св) = с и у?(с7г) = 0 для рациональных с, что как раз достаточно для наших целей. Необходимый результат вытекает из неравенства поскольку Р(куба) ф Р(тетраэдра), Р(куба)=рф^/?=0, (2.13) Р(тетраэдра) = <р(в) ^ II = ^ /,т Ф 0. (2.14) ' Если в базис входит какое-либо рациональное число ер, то у?(4) = 0, если не входит, то у?(4) =? ' Значения <р(\) для других углов А мы не можем знать из-за произвола достройки базиса, но эти значения нам и не нужны.
2.8. Дополнения 65 Причины вполне очевидны. При разрезании куба или тетраэдра на меньшие многогранники и суммировании псевдовесов этих меньших многогранников, вычисленных по формуле (2.12), получается тот же самый псевдовес исходного многогранника. Это происходит потому, что суммирование по всем новым ребрам (появившимся в результате разрезания) дает нуль, ибо если некоторое / лежит внутри М и служит ребром (или частью ребра) новых многогранников, то /МАО + ... + р(А,)} = МЛ, + ... + А,) = М2тг) = О, если же / лежит на грани М, то опять получается нуль /{^(ЛО + ... + <р(\$)} = 1(Р(\1 + ... + А,) = 1ф) = 0. Наконец, если / совпадает с ребром исходного многогранника, то Л1 -К. .+\$ равно 7г/2 в случае куба, и в в случае тетраэдра. Таким образом, псевдовес не зависит от способа разрезания и может просто вычисляться по формулам (2.13), (2.14). 2.8. Дополнения • Последовательность гомоморфизмов С'^С^С" (2.15) называют точной, если образ 1пир = (р(Сг) совпадает с ядром кег^. Тот же принцип используется и для более длинных последовательностей С\ —* 0-1 -» ... -» Оп-\ —~* Оп. В этом случае точную последовательность определяет согласованность всех звеньев: 1т^;_1 = кегу?;. Распространенный трюк: добавление к (2.15) еще двух тривиальных гомоморфизмов30. 0-><7'4сА<7"->0. (2.16) При этом точность последовательности (2.16) означает, помимо [т<р = кег^>, инъективность 1р и сюръективность г/). Таким образом, инъективность <р и сюръективность \р можно не упоминать, ибо они оказываются зашифрованы в (2.16). Экономия копеечная, но «фокус» эффективно препятствует освоению предмета. Разъяснение дается для облегчения чтения другой литературы. Подразумевается аддитивный язык, с нулем вместо единицы.
66 Глава 2. Основные понятия • Среди инструментов, действенно запутывающих суть дела, можно отметить коммутативные диаграммы. Например, А С, У в где малые буквы — суть отображения, означает: если от одного объекта к другому можно пройти (вдоль стрелок) разными путями, то соответствующие композиции отображений совпадают. В данном случае: /Н = д, /з = д1... Иногда это эффективно, но часто используется как графическое украшение и затуманивает изложение. • О подводной части айсберга теории групп можно судить по недавно завершившейся эпопее в одном из теоретических секторов. Вот выдержка из статьи Горенстейна «Грандиозная теорема» в журнале ЗаешШс Атепсап (издание на русском языке) № 2, 1986. «Классификация простых конечных групп занимает столь необычное положение в анналах математики не только благодаря непомерно длинному доказательству, но и благодаря интригующему характеру решения. В процессе многолетних исследований постепенно открывались бесконечные семейства простых групп (и в конце концов были построены все 18 таких семейств), но время от времени обнаруживались и совершенно нерегулярные простые группы, которые не укладывались ни в одно семейство и были поэтому названы спорадическими группами. Первые пять таких загадочных простых групп были открыты Э. Матье в 60-е годы XIX века: наименьшая из групп Матье содержит ровно 8 х 9 х 10 х 11, т. е. 7 920 элементов. Шестая спорадическая группа, состоящая из 175 560 элементов, была обнаружена лишь спустя целое столетие 3. Янко, работавшим тогда в Университете Монаш (Австралия). После этого на свет стали появляться новые странные спорадические создания — примерно по одному в год, не отставая от интенсивных теоретических исследований 60-х и 70-х годов. Эти открытия вызвали среди математиков необычайное волнение, которое достигло высшей точки в 1982 году, когда Р. Грисс- младший, работавший в то время в Институте перспективных исследований, построил группу, названную „монстром" за то, что число ее элементов равно 808 017 424 794 512 875 886 459 904 961 710 757 005 754 368 000 000 000, или приближенно 8 • 1053. В конце концов было открыто 26 спорадических простых групп. Группа-монстр оказалась среди них самой большой, однако в ее структуре обнаружилось так много внутренних симметрии, что Грисс переименовал ее в „дружественного гиганта". В
2.8. Дополнения 67 Найти простую группу — это одно, и наградой служит само открытие, но доказать, что обнаружены все такие группы, — это совсем другое дело. Однако именно в этом состоит утверждение классификационной теоремы: „мир" простых конечных групп содержит 18 регулярных бесконечных семейств групп и 26 спорадических групп — и никаких других! Вот для доказательства этого утверждения и понадобилось 500 статей, занимающих около 15 тысяч журнальных страниц». • «В тему» ложится доказательство простой с виду теоремы Фейта— Томпсона: Любая конечная группа нечетного порядка разрешима , — занимающее целый номер журнала32). ' Разрешимые группы рассматриваются в главе 6. 32) ГеН IV., ТИотрзоп 1.0. ЗоЬгаЫШу оГ^гоирз оГ оде! огйег // РасШс 3. Ма1п. 1963. 13. 775-1029.
Глава 3 Различные инструменты В главе рассматриваются некоторые понятия и факты, степень бесполезности которых несколько выше предыдущего уровня. Но детали бывают важны не сами по себе, а для создания подходящей атмосферы. 3.1. Действие группы на множестве 3.1.1. Действие группы С на множестве X определяется как преобразование дх : С х X -> X, удовлетворяющее требованиям: (О 1 • х = х, Уж е X, 00 (9\92)х = 9\{92х), Уж 6 X, д{д2 Е С. Тем самым можно считать, что вводится левое действие — умножение точек х е X на элементы д € С. При этом оба знака умножения (групповой и «буферный» между С и X) мы опускаем, чтобы не отвлекать внимания. Правое действие хд определяется через левое как д~1х. Итак, каждый элемент д Е С определяет преобразование шд : X -» X, причем каждое шд является биекцией. Иными словами, группе С ставится в соответствие подгруппа преобразований из группы биекций 8ут(Х), в которой умножение есть композиция. Точнее говоря, действием группы оказывается гомоморфизм ш : С -> 8ут(Х). Частично получается тавтология, но это дает язык, открывающий дополнительные возможности. Примеры • Симметрическая группа 8П, равно как и любая ее подгруппа, действует на X — {1,..., п). Действие подстановок приводит к перестановкам. • Любая подгруппа Н С С действует на самой группе О, например, левым умножением: Их, Н € Я, х € С.
3.2. Стабилизаторы 69 • Действие группы О на самой себе можно определить сопряжением, СхС->С Ф» дх*->д~1хд. • Группа автоморфизмов Аи\(С) действует на С. 3.2. Стабилизаторы 3.2.1. Стабилизатором элемента х € X называется множество ' 81аЬ(ж) = {д еС :дх = х}. Стабилизатор является подгруппой, необязательно нормальной. 3.2.2. Стабилизаторы элементов х и у = дх связаны как 31а%) = д&иЛ)(х)д'1. < Если Н е 51аЬ(ж), т.е. Нх = х, то (дНд~х)у = дНх — дх = у. Поэтому д$ыЪ(х)д~1 С 5гаЬ(у). Обратно, если Н € 8гаЬ(у), т.е. Ну — у, то (д~1Нд)х = д~1Ну = д~1у — х. Откуда $ХаЪ(у) С д$1аЪ(х)д~1. ► Если группа С действует на самой себе с помощью сопряжения, то 81аЬ(ж) = {д € С : дх = хд}, Б1аЪ(8) = {деС:д8д-{=8}. группу ц(х) = 31аЬ(ж) называют централизатором элемента ж, а Щ8) = 31аЬ(5) — нормализатором подмножества 8 С С. В этом случае ' То есть множество элементов группы, оставляющих элемент х неподвижным.
70 Глава 3. Различные инструменты Во избежание путаницы исходным определением централизатора ц(ж) лучше 2) считать ' ц(ж) = {де 0:дхд~1 = ж}, т.е. ц(ж) — это совокупность тех д € О, которые в случае преобразования дхд~1 оставляют точку х (Е С на месте. При этом становится очевидной определенная двойственность понятия ц(ж) и класса сопряженных элементов хс = {дхд-1:деС}, из которой легко выводится формула |С| = \ц(х)\ • \ха\. (3.1) Пересечение ц(С) = р| ц(х) хес называют центром С. Иными словами, ц(<7) — есть множество тех элементов группы С, которые коммутируют со всеми остальными, ч(<?) ={д:дх = хд,Ухе С}, т.е. п(С) ={д:дхд~1 =х9 Ухе С}. Любой центр является нормальной подгруппой ' С, причем коммутативной. Центр абелевой группы совпадает со всей группой. Чем меньше центр, тем умножение «менее перестановочно». Нормализатор всей группы является ее центром, М"{С) = ц(<2). 3.3. Орбиты 3.3.1. Орбитой элемента х Е X называется множество ОгЪ(х) = {дх:деС}. ' Поскольку использование стабилизатора в определении не делает должного акцента на том обстоятельстве, что речь обязательно должна идти о действии группы на самой себе с помощью сопряжения. ' Возможно, содержащей лишь единицу.
3.3. Орбиты 71 Различные орбиты не могут пересекаться. (?) В случае ОгЬ(ж*) = {х*} элемент х* & X называется неподвижной точкой действия. Если д 6 С имеет порядок п, то ОгЪ(х) = {х,дх, ...,дп~1х}, но перечисленные элементы не обязаны быть все различны. 3.3.2. Подмножество 8 С X называют устойчивым к действию группы С на X, если хе 8, деС =» дхе 3. • Орбита ОгЬ(а) — наименьшее устойчивое множество, содержащее точку а. • Подмножество 5 С X устойчиво в томм случае, когда оно представляет собой объединение орбит. • В группе, действующей на себе сопряжением, орбиты оказываются классами сопряженных элементов, ОгЬ(ж) = {дхд~1: д <Е О}. При этом ОгЬ(ж) = {х} в томм случае, когда элемент х лежит в центре ц(<2), а подгруппа Н С О нормальна в томм случае, когда она — есть объединение орбит (классов сопряженных элементов). Транзитивные группы. Действие группы С считается транзитивным, если в X имеется только одна орбита ', т.е. орбита любой точки исчерпывает все X Пусть речь идет о транзитивной группе подстановок СС 8П5 действующей на множестве X = {1,..., п}. Транзитивность действия С в данном случае равносильна возможности указать для любых г, ] € X такую подстановку д € С, что дг = ]. Пусть С/Н — множество левых смежных классов дН группы С по подгруппе Н. Тогда Поэтому: любая группа С действует транзитивно на С/Н. Группу С в этом случае называют транзитивной.
72 Глава 3. Различные инструменты 3.4. Конечные р-группы 3.4.1. Группа С называется ^-группой, если число р — простое, и порядок группы \С\ = р . Если конечная группа С разбита на классы сопряженных эле- ментов х{ ,..., хт, то \6\ = Н0)\+ ^ \х?\, (3.2) х{ $ Ц(С) что очевидно в силу х = {х} при условии х 6 и(С). Напомним также — см. (3.1) — связь \6\ = \фг)\-\х?\, справедливую при любом г. 3.4.2. Подгруппа Н С С порядка \Н\ = р — при максимально возможном к — называется максимальной, или силовской р-подгруппой, 3.4.3. Лемма. Всякая р-группа имеет нетривиальный центр. < Либо вся группа совпадает с центром — и тогда все доказано, либо / = |С| = |ц(С)|+Р<7, в силу (3.2), и тогда |ц(6г)| делится на р, что означает |ц(6г)| > 1. ► 3.4.4. Лемма. Группа С порядка рг имеет нормальные подгруппы порядков р при любых к ^ г. < Для г = 1 утверждение очевидно. Далее воспользуемся индукцией. В ц(6г) есть элемент д порядка р. Поэтому Н = {\,д,дг,... ,#р"~1} — нормальная подгруппа порядка р. Следовательно, |6г/#| = рг~\ А раз утверждение справедливо для С/Н, т. е. для г - 1, то теорема 2.6.2 гарантирует, что оно справедливо и для С, т. е. для г. ► 3.5. Теоремы Силова При изучении конечных групп важную роль играют р-подгруппы. Оказывается, для каждой степени р , делящей порядок группы, су- и У Л-1 ществует подгруппа порядка р . Если р также делит порядок
3.5. Теоремы С и лова 73 группы, то всякая подгруппа порядка р содержится в некоторой и I 1 подгруппе порядка р . Наконец, максимальные р-подгруппы попарно сопряжены друг с другом, и их число равно 1 (тойр). Перечисленные результаты с некоторыми допусками обычно распределяются по трем теоремам Силова. 3.5.1. Теорема существования. Если р простое и рк делит \С\, то в С существует подгруппа порядка р . «* Согласно лемме 3.4.4, достаточно установить существование максимальной р-подгруппы. Поэтому изначально можно считать |6г| = рк^, где д не делится на р. Далее применяем индукцию по порядку группы. Для |6г| = 1 утверждение очевидно. В предположении справедливости утверждения для I < к разобьем С на классы сопряженных элементов ж{\ ..., х^. Если при некотором у порядок |ж; | Ф 1 не делится на р, то в силу |ц(х;)|. |*?| = |Я| = р\ на рк делится порядок |ц(ж;-)|. А поскольку |ц(ж;)| < |6г| (иначе все доказано), то по индуктивному предположению ц(ж;) содержит р-подгруппу порядка рк. В случае, когда все нетривиальные \х?\ делятся на р, в силу (3.2) на р делится и |ц(Ст)|. Это означает (по индуктивному предположению), что в ц(<7) имеется силовская подгруппа ц порядка р\ I ^ к. Фактор-группа С/и! имеет порядок рк~\ и опять-таки по индуктивному предположению в ц' имеется силовская подгруппа порядка рк~\ образ которой при естественном гомоморфизме будет в С максимальной р-подгруппой. ► 3.5.2. Теорема вложения. Всякая р-подгруппа порядка р содержится в некоторой силовской подгруппе. 3.5.3. Теорема сопряжения. Все силовские р-подгруппы сопряжены друг с другом \ Число силовских подгрупп зр = 1 (тойр), причем зр делит порядок группы. Доказательства последних двух теорем ' не приводятся, чтобы не создавать атмосферу технической рутины. Кроме того, их (доказательства) можно найти ' Иными словами, с точностью до сопряжения силовская группа всегда одна. Соответственно, если силовская подгруппа нормальна, то она единственна уже без оговорок. И обратно, если силовская подгруппа единственна, то она нормальна. * Доказательство теоремы 3.5.2 сильно коррелирует с леммой 3.4.4, которая к тому же в некоторой степени дополняет теорему.
74 Глава 3. Различные инструменты во многих учебных руководствах [11, 16], причем речь идет о достаточно простых рассуждениях — с оговоркой насчет непривычности используемых категорий мышления. См. также раздел 3.6, где задачи вплотную подводят к соответствующим обоснованиям. Теоремы Силова играют важную роль в теории конечных групп, позволяя в той или иной степени выяснить устройство изучаемой группы. Например, в случае [С^! = 63 = 3 -7 теорема 3.5.1 гарантирует существование в С подгрупп порядков 3, 9, 7. Остановимся более подробно на ситуации \С\ = рц, где р < (/ — простые числа. Теорема 3.5.1 говорит о существовании подгрупп порядка р и 5, но интересно посмотреть, к чему это приводит в итоге. По теореме 3.5.3 число силовских (/-подгрупп равно /(/ + 1 и делит до, — но тогда (/-подгруппа единственна, причем нормальна (см. примечание к теореме 3.5.3). Что касается р-подгрупп, то их число равно кр + 1 и делит (/, что в ситуации # ф 1 (той р) также ведет к единственности и нормальности р-подгруппы. В результате группа С неизбежно оказывается абелевой, изоморфной группе вычетов по модулю рд. В особом случае ^ = 1 (той р) группа С оказывается неабелевой, и рассуждение чуть более запутано [11]. 3.6. Задачи • Если Н С ц(6г) и фактор-группа С/Н циклична, то группа О — коммутативна. • Всякая р-группа, имеющая порядок р2, коммутативна. < Центр ц(6г) нетривиален (лемма 3.4.3). Поэтому фактор-группа С/ц(0) имеет порядок либо 1, либо р, — и потому циклична. ► • Любая группа порядка 2р (простое р > 2) либо циклична, либо изоморфна группе диэдра.
3.6. Задачи 75 • Если группа С, действующая транзитивно на множестве X, коммутативна, — то любой элемент д Ф 1 сдвигает любой элемент из X, т. е. дх Ф х. < В предположении противного, дх = х => дНх = Ндх = Нх. ► • Следует ли из а4 = 1, Ь3 = 1 равенство (аЬ)п = 1? (Не следует, см. главу 7.) • Пусть Н — нормальная (конечная) подгруппа группы С, а элемент д имеет конечный порядок и не коммутирует ни с одним элементом из Н (разумеется, кроме 1). Тогда Н^ д~хЬГхдН — биекция: Н -> Н.
Глава 4 Абелевы группы Абелевы группы достаточно важны практически и податливы теоретически. Но усвоению нередко мешает иллюзия элементарности коммутативного варианта, который не так уж тривиален, как выглядит. Тем не менее детальные доказательства «в рамках общего образования» здесь не обязательны. Достаточно общей картины с акцентами на отличиях. Так или иначе, многие подробности ниже опускаются — восполнить недостающее можно по различным источникам [8,11,14,16]. 4.1. Коммутативный вариант Коммутативность групповой операции существенно упрощает исследование. Но надо иметь в виду, что владение общей «мультипликативной» теорией мешает осваивать «аддитивную» \ В некотором роде возникают «трудности изучения иностранного языка». Русский мешает учить английский — из-за подсознательного стремления установить соответствие. «Забыв на время один язык» — легче учить другой. Так или иначе, но способность отвлечься от старого помогает изучению нового. Коммутативные группы в этом смысле не исключение. Их удобно рассматривать с чистого листа. 4.1.1. Абелевой группой А называется конечная или бесконечная совокупность элементов, на которой задана групповая операция «+», сопоставляющая любой паре элементов а,Ь € А некоторый элемент с из той же совокупности А: а + Ъ = с. При этом групповая операция, называемая обычно сложением, коммутативна (а + Ъ = Ь + а) и обязана удовлетворять трем условиям: (О Р + (я + г) = (Р + Я) + г (ассоциативность) 2\ ' Напомним, для абелевых (коммутативных) групп обычно используется аддитивная терминология: групповая операция называется сложением и обозначается знаком -К а единица группы именуется и обозначается нулем. 2' Благодаря ассоциативности скобки в любой сумме можно убрать или, наоборот, произвольно расставить.
4.1. Коммутативный вариант 77 (н) В группе существует нулевой элемент О, обладающий свойством О + х = х + 0 = х для любого х € А. (ш) Каждый элемент х е А имеет обратный -х: х + (~х) = х - х = О. Некоторые опорные факты также полезно переписать на новом языке. • Подмножество В С А является подгруппой А в томм случае, если из а,Ь 6 В следует а-Ь € В (лемма 2.1.3). • Групповую сумму х + ... + х с п слагаемыми обозначают как пх. Группа А, в которой все элементы могут быть получены как ^'а, А = {..., -2а, -а, 0, а, 2а,...}, называется циклической. Минимальное п в равенстве пЪ = О называют порядком или периодом элемента Ь и обозначают через \Ъ\. В случае пЪ Ф 0 при любом п > 0 — считают \Ь\ = оо. Если порядки всех элементов группы А (кроме единичного) бесконечны, — говорят, что А — группа без кручения. Если же порядки всех элементов группы конечны, группу называют периодической. • Совокупность всех кратных {д} любого элемента д 6 А является циклической подгруппой группы Л, \{д}\ = \д\- • Если да при изменении а пробегает все элементы группы А, и д0 произвольный элемент Л, то д0 + да также пробегает все элементы группы. • Понятие сопряженных элементов теряет смысл (равно как и понятия центра и коммутанта). Все подгруппы абелевой группы — нормальные; левые и правые смежные классы совпадают. Сумма смежных классов / + Н и д + Н определяется как (/ + Л) + (0 + Л) = (/+0) + Л, потому что Н + Н = Н. Таким образом, сумма смежных классов снова дает смежный класс. Кроме того, (д + Н) + (-д + Н) = Н. Следовательно, совокупность смежных классов по инвариантной подгруппе Н является группой, которую называют фактор-группой и обозначают как А/Н. Нулем А/Н служит подгруппа Н. • В абелевом случае р-группы называются — примарными.
78 Глава 4. Абелевы группы 4.2. Конечнопорожденные группы В силу коммутативности, суммы элементов абелевой группы А можно записывать в виде а{и{ + ... + акик, все а,- Е 2, щ е А. (4.1) Если «линейные комбинации» (4.1) исчерпывают все элементы группы ' А, то конечная совокупность элементов {и\,..., ик} порождает группу А. При этом порождающая система {ггь ..., ик} называется линейно зависимой, если а\Щ + ... + акик = 0 (4.2) при некоторых целых с*!,..., а*, не равных нулю «поголовно»; и линейно независимой — в противном случае. Линейно независимую систему порождающих {и\,..., ик}, если таковая существует, называют свободной, а о порождаемой группе говорят как о свободной абелевой группе. Представление любого элемента х = а\П\ + ... + акик в свободной группе — однозначно. Свободную систему порождающих называют также базисом, а целое к — рангом группы. Роль свободных абелевых групп аналогична роли свободных групп общего вида (раздел 7.2). Соответственно, имеет место аналог теоремы 7.2.1. 4.2.1. Теорема. Всякая коненнопорожденная абелева группа А изоморфна некоторой фактор-группе свободной группы того же ранга. < Пусть {щ, ..., ип} — система образующих группы Л, а {х\,..., хп} — базис свободной группы Р. Введем эпиморфизм <р : Р -» А, действующий по пра- 4) вилу ' <р {аххх 4-... 4- апхп) = ахщ + ... + апип. По теореме 2.6.1 (о гомеоморфизме) фактор-группа Р/кст(р изоморфна группе А. ► ' То есть любой элемент х Е А представим в виде х — а\и\+ ... +аьщ. 4' Все комбинации а\Х\ 4-... 4- апхп в Р различны, а ахи\ 4-... 4- <лпип могут совпадать друг с другом из-за наличия в А линейных связей (4.2).
4.3. Прямое произведение и прямая сумма 79 4.3. Прямое произведение и прямая сумма В теории групп представляют интерес различные конструкции, с помощью которых из одних групп получаются другие. Прямое произведение — одно из таких приспособлений, которое особенно часто применяется в абелевых группах, где — в случае аддитивной точки зрения — называется прямой суммой. Общее определение выглядит так. 4.3.1. О группе С говорят как о прямом произведении своих подгрупп Н\,..., Нп при условии: • Любые элементы а € Щ, Ь € Н^ г Ф ] коммутируют, аЪ = Ъа. • Любой элемент д € С представим в виде д = Н{...кп, НгеЩ. (4.3) Требование коммутативности умножения подгрупп в определении 4.3.1 в некотором роде раскрывает карты, показывая, что при переходе к абелевым группам никаких существенных изменений, кроме терминологических, не происходит. За исходное чаще принимается определение 5\ в котором перечисленные требования заменяются совокупностью трех условий: • Подгруппы Н\,..., Нп нормальны в С. • Совокупность {Н\,..., Нп} порождает С. • Разложение (4.3) однозначно. О декартовом произведении X х У также говорят как о прямом произведении, полагая элементами группы X х У пары (х,у), где х € X, у € У. Групповая операция определяется как ' (хиУ1)(х2,у2) = {х\Х2,У\У2). При этом, в отличие от предыдущего случая, групповые операции в Хи У могут быть различны. Смешение понятий декартова произведения и прямого — объясняется следующим фактом. 5* Возможны также и другие варианты эквивалентных определений [16]. ' Понятно, с тем же успехом можно говорить о декартовом произведении нескольких групп.
80 Глава 4. Абелевы группы 4.3.2. Если X и У — подгруппы одной группы (?, то прямое и декартово произведение с точностью до изоморфизма порождают одну и ту же группу. < Изоморфизм <р определяется соответствием ху^>(х,у). ► Если 0 = Х хУ,то О/Х ~ У (?) В ситуации, когда X и У — подгруппы абелевой группы А, их декартово произведение называют прямой суммой, используя обозначение X 0 У. Абелева группа А (необязательно конечнопо- рожденная) считается прямой суммой своих подгрупп Б7, 7 ^ Г, когда любой ее элемент х & А однозначно представим в виде суммы конечного числа элементов, взятых из различных подгрупп Б7. • Группа комплексных чисел по сложению является прямой суммой группы действительных чисел и группы мнимых чисел. • Циклическая группа 15-го порядка, порожденная элементом /, является прямой суммой циклической подгруппы 3-го порядка, порожденной элементом 5/, и циклической подгруппы 5-го порядка, порожденной элементом 3/: </> = (5/>Ф(3/>. 4.3.3. Если X и У — нормальные подгруппы группы С и ХПУ=1, ХУ = 6, (4.4) то С — изоморфна декартову произведению X х У. «* Любой элемент группы С в силу ХУ = О может быть записан в виде д = ху, х € X, у е У, причем единственным образом, поскольку X П У = 1. Кроме того, из нормальности подгруппы X следует7) [х,у] = х(ух~1у-1)еХ. Аналогично, [ж, у] € У. В результате [ж, у] в X П У = 1, что означает ху — ух. Искомый изоморфизм С >-> X х У определяется как <р(д) = (ж, у). ► Условие (4.4), как видно из доказательства, равносильно коммутативности элементов из разных подгрупп: ху = ух, х € X, у €У. По поводу коммутаторов [х, у] см. раздел 6.2.
4.4. Циклическая природа абелевых групп 81 4.4. Циклическая природа абелевых групп Допустим, группа С состоит из всевозможных пар (а, 6), где а — корни пятой степени из единицы, Ь — корни седьмой степени, т. е. 2&7Г 2&7Г 2&7Г 2&7Г а = со8 —-—К г 51П , « = 0,..., 4; о = со8 1- г 8т , я = 0,.... 6, 5 5 7 7 а групповая операция — покоординатное умножение. Группа С всевозможных пар (а, Ъ) с покомпонентным умножением — состоит из 5 • 7 = 35 элементов, но циклична ли эта группа? — Циклична, 35 степеней / 2тг 2тг 2тг 2тгУ I со8 — + г 81П —, со8 — + г 81П — 1 , з = 1,..., 35, исчерпывают (по модулю 27г) все пары, что, вообще говоря, требует обоснования. Но пункт 4.3.2 гарантирует, что группа О изоморфна совокупности попарных произведений {аЪ}, для которых цикличность очевидна — образующий элемент: 2тг 2тг С°835+г81П35- Разобранный пример является прообразом следующего общего результата (в аддитивной интерпретации). 4.4.1. Прямая сумма двух циклических групп взаимно простых порядков тип является циклической группой порядка тп. Разумеется, прямая сумма к циклических групп А] попарно взаимно простых порядков П\,..., щ является циклической группой порядка щ ... щ. В общем случае, если НОК{пь...,7г*} фпх...пк, абелева группа А = А\ 0 ... 0 А% не циклична 8\ Оказывается (!), прямые суммы циклических групп исчерпывают конечнопорожденные абелевы группы. ^Поскольку в А нет элемента порядка \А\ = щ ...щ. В этом случае говорят, что показатель группы а = тт{к >0:кх = 0,Ухе А] меньше порядка |Л|.
82 Глава 4. Абелевы группы 4.4.2. Теорема. Конечнопорожденная абелева группа является прямой суммой конечного числа бесконечных циклических подгрупп и ко- 9) печного числа циклических примарных групп '. Результат принято называть основной теоремой об абелевых группах с конечным числом образующих. Обоснование теоремы 4.4.2 несложно [16], но несколько утомительно. Вокруг теоремы 4.4.2 имеется множество вариаций, обнажающих дополнительные ракурсы. 4.4.3. Подгруппой кручения 1ог$(А) абелевой группы А называется совокупность элементов А конечного порядка К • Всякая конечнопорожденная абелева группа А является прямой суммой Югз(Л) и некоторой свободной абелевой группы. Таким образом, всякая конечнопорожденная абелева группа А без кручения — свободна (имеет линейно независимую систему образующих, базис). • Фактор-группа А/хог$(А) является группой без кручения. • Любая подгруппа свободной абелевой подгруппы — свободна. 4.5. Группы гомологии Алгебраизация топологии — один из показательных примеров искусственного насаждения групповой идеологии, плодоносящей в «неожиданной области». Представление о том, как это делается, полезно вне зависимости от «прикладных устремлений». Один из простейших способов в этой области основывается на симпли- циальных разбиениях многообразий. Симплексы и симплициальные комплексы. Симплекс представляет собой обобщение понятия отрезка (1-симплекс), треугольника (2-симплекс), тетраэдра (3- симплекс). Общее определение: к-мерным симплексом (к-симплексом) зк = (ао,...,ак) 9) /к ' Примарными считаются абелевы р-группы (группы порядка р , где р простое число). ' Легко проверяется, что такая совокупность действительно является подгруппой. Подгруппу кручения называют также периодической частью группы А.
4.5. Группы гомологии 83 называется множество точек жбМ", таких что к к х = ^Г Л;а;, 5^ л; = Ь все л; ^ °> в предположении линейной независимости векторов ах - а0, ..., а* - а0, где точки а, 6 Кп представляют собой вершины симплекса, Л; — барицентрические координаты точки х. О гомеоморфных образах симплексов говорят как о криволинейных симплексах. Очевидно, симплекс зк представляет собой выпуклую оболочку своих вершин. Выпуклая оболочка любого подмножества вершин называется гранью симплекса. Симплициальным комплексом К С Кп называют конечное семейство симплексов зк, расположение которых характеризуется тем, что пересечение любых двух з\, з? или пусто, или является гранью как з?, так и $?. Множество всех точек из Кп, принадлежащих симплексам комплекса К, с топологией, индуцированной из Кп, называют полиэдром комплекса К и обозначают \К\, а комплекс К именуют триангуляцией полиэдра \К\. Геометрически очевидно, что любой полиэдр можно сколь угодно мелко триангулировать, делая максимальный диаметр составляющих симплексов сколь угодно малым. Ориентация. В К3 упорядоченная тройка некомпланарных векторов а, Ь, с называется правой, если для наблюдателя, расположенного в нуле, обход концов а, Ъ, с в указанном порядке происходит по часовой стрелке. В противном случае тройка а,Ъ,с — левая. Соответственно классифицируются базисы. В общем случае Кп отделить «правое» от «левого» невозможно, но дихотомия остается. Два базиса е = {еь...,еп} и е = {е\,...,еп} в Кп считаются одинаково ориентированными, если бсхА > 0 (е = Ае). В случае бсхА < О говорят, что базисы е и е противоположно ориентированы. В результате все базисы распадаются на два класса эквивалентных, положительно ориентированных (одинаково ориентированных по отношению к фиксированному базису), и — отрицательно ориентированных. О положительной и отрицательной ориентации симплекса зп = (а0...ап) (4.5) говорят в зависимости от того, одинаково или противоположно с избранным базисом Кп ориентирован базис е1 =01 -а0, ..., еп = ап - а0. Симплекс (а1о... а1п), построенный на тех же вершинах, что и (4.5), но взятых в другом порядке, будет совпадать либо с зп, либо с -з11. Четное (нечетное) число перестановок двух вершин симплекса не меняет (меняет) его ориентацию. Неориентированный симплекс обозначается далее |зп|.
84 Глава 4. Абелевы группы Коэффициенты инцидентности и оператор Д. Пусть крышечка над вершиной симплекса исключает эту вершину, т. е. (а0 ... а,-... ап) = (а0 ... а,-_1а,>1 ... ап). В результате от зп остается (п - 1)-мерная грань зп~1. Рассмотрим теперь ориентированный симплекс зп и его ориентированную грань зп~{, не содержащую, например, вершину щ симплекса зп. Допустим, порядок вершин аго,..., аг-п_1 определяет выбранную ориентацию грани \зп~ |. При этом порядок Я|> йг*0,..., йг*п1 вершин симплекса \зп\ определяет либо исходную ориентацию зп, либо ориентацию — зп. В первом случае коэффициент инцидентности (зп : зп~{) считается равным +1, во втором — равным -1. Если же зп~1 — не грань зп, то (зп : зп~1) = 0. 4.5.1. Граница ориентированного симплекса определяется как 1=0 Оператор Д называется граничным. Если договориться, что ориентации граней выбираются в соответствии с правилом зп = (а0... ап), з"~1 = (а0... а,-. • • ап), то, как легко проверить, Д5"=^(-1)'5Г'. 1=0 Граница симплекса — частный случай общего понятия цепи: г-мерная цепь хТ комплекса К определяется как формальная сумма г V""* г X — у ^ ОЦ 3{, г
4.5. Группы гомологии 85 где а, — целочисленные коэффициенты. При этом граница цепи, Ахг = ^2а{Азг{, г является (г — 1)-мерной цепью. Если в множестве всех цепей комплекса К ввести операцию сложения цепей (как линейных форм), то это множество становится группой и обозначается ЬГ{К). Граничный оператор, таким образом, действует из Ьг в Ьг-\. Циклы. Любая цепь хг с нулевой границей (Ахг = 0) называется циклом. Множество г-мерных циклов 2Г(К) является подгруппой группы ЬГ(К). Другими словами, 2Г — это ядро гомоморфизма А:ЬГ -► Хг_ь т.е. 2Г = кег Д. В группе циклов 2Г{К) можно вьщелить подгруппу ВГ(К) г-мерных границ, т. е. множество г-мерных цепей, являющихся границами некоторых (г + 1)-мерных цепей. «* Чтобы проверить, что ВГ(К) — действительно подгруппа 2Г(К), достаточно установить и) ААжг = 0, (4.6) поскольку ядро любого гомоморфизма (р : С -» Н — подгруппа С. Поскольку оператор А линеен, (4.6) достаточно проверить в случае, когда хг — симплекс: ДД5г = д[^(-1)|"(а0...3,-...аг)1 = Легко видеть, что грань (а0... а,... а;... аг) входит в сумму дважды: один раз с коэффициентом (-1),+;, другой раз с коэффициентом (-1),+-;~1, что в сумме дает нуль. Поэтому ДА/ = 0. ► 4.5.2. Фактор-группа Нг = 2Г/ВГ группы циклов 2Г по подгруппе границ Вг называется г-и группой гомологии комплекса К. ' То есть граница границы сама по себе не имеет границы.
86 Глава 4. Абелевы группы Группы Нг, 2Г,ВГ введены здесь для комплекса К, тогда как основной интерес представляет изучение самого полиэдра \К\. На простых примерах легко видеть, что группы 2,т, Вг при измельчении триангуляции полиэдра \К\ разрастаются, но эти изменения в группах 2Г, Вг оказываются тесно связанными, и фактор-группа Нг = 2Г/ВГ не меняется. Это общее правило. 4.5.3. Группа гомологии НГ{К) не зависит от триангуляции, а определяется самим полиэдром. Гомеоморфные полиэдры имеют одинаковые {изоморфные) группы гомологии. Соответственно, вычислять группы гомологии можно на основе произвольной триангуляции — наиболее простой и удобной. Достижением топологии явилось обобщение этой техники с криволинейных полиэдров на случай любых компактов \ Пример Рассмотрим в качестве криволинейного полиэдра Р тор — так называемую сферу с ручкой (многообразие, гомеоморфное поверхности бублика). Одномерные циклы хх на Р — не что иное, как замкнутые ориентированные (с заданным направлением обхода) кривые. Такие кривые (циклы) подразделяются на те, которые ограничивают некоторую область (цикл г на рис. 4.1), и те, которые никакой области не ограничивают, т. е. не принадлежат группе границ (меридиан и параллель тора, рис. 4.1). Обратим внимание, что цикл, изображенный на рис. 4.2 (равный сумме циклов), ограничивает «область» А + 2В 4- С, в которую «территория» В входит дважды. Поэтому, если говорить точнее, то надо сказать, что все циклы подразделяются на те, которые являются границами некоторых двумерных цепей 13, и те, которые границами не являются. Будем все ограничивающие циклы считать несущественными, а «существенные» — разобьем на гомологичные циклы. Циклы Х\\\Х2 называются гомологичными, ' Помимо определенных здесь симплициальных групп в топологии используются различные другие группы гомологии: сингулярные гомологии, гомологии Виеториса, Чеха и др. ' А не областей в обычном понимании этого слова.
4.6. Классификация многообразий 87 если их разность хх - х2 — ограничивающий цикл (гомологичный нулю)14). Эти классы гомологии и есть элементы группы гомологии Н{. На торе все такие классы гомологии выражаются через класс меридианов хт и класс параллелей хр. Если цикл х обходит тор а раз по меридиану и р раз по параллели, то х = ахт + /Зхр, и потому хт и хр — образующие группы Нх, а сама группа р д 2 #! представляет собой прямую сумму15) Ъ ф Ъ. На двумерной сфере 52 группа гомологии Н\ тривиальна — состоит из единственного, нулевого, класса гомологии — поскольку все одномерные циклы на 52 гомологичны между собой. Группа гомологии Н2 на 52 изоморфна Ъ. (?) 4.6. Классификация многообразий Одной из основных задач топологии является классификация многообразий с точностью до тех или иных разрешенных преобразований. Например, с точностью до гомеоморфизма К Привязка топологических инструментов к теоретико-групповым осуществляется на основе аппроксимации. Сначала определяются симплициальные отображения, преобразующие комплексы в комплексы. После этого непрерывные отображения / : \К\\ -> 1^1 приближаются (сколь угодно точно за счет измельчения триангуляции) — симплициальными. В итоге удается перейти из топологии в алгебру, ибо симплициальное отображение (р : Ка -> Кр естественным образом индуцирует гомоморфизмы <р* группы Ьг(Ка) в группу Ьг(Кр). Технологически это происходит следующим образом: ^Ю = (у>М...у>(аг)), если вершины у симплекса зга = (а0... аг) различны, и <р*г(зга) = 0 в противном случае. На цепи <р*г распространяется линейно. 14* Например, два различных меридиана тора с одинаковой ориентацией — гомологичны друг другу. 1 ' Точнее говоря, изоморфна прямой сумме. 1 ' Гомеоморфизмом / : X -> У называют взаимно однозначное (инъективное плюс сюръективное) и непрерывное в обе стороны (непрерывны как /, так и /~ ) отображение.
88 Глава 4. Абелевы группы Легко проверяется, что гомоморфизм <р*г коммутирует с граничным оператором, откуда следует, что <р*г переводит циклы в циклы, границы — в границы, а значит, и группу гомологии Нг(Ка) — в группу гомологии Нг(Кр). В итоге группы гомологии {Нг} многообразия оказываются топологическими инвариантами, которые не меняются под действием гомеоморфизмов. Известны и другие топологические инварианты «того же происхождения», например, эйлерова характеристика * = ]>>№, где КТ — число г-мерных симплексов в комплексе К. 4.7. Первая гомотопическая группа Два пути (непрерывных кривых) в топологическом пространстве X, имеющих общие концы, называются гомотопными, если один из них можно непрерывно деформировать в другой, не двигая концов. Иначе говоря, два пути ч>ъ{1), Ч>\{Ь), ро : [0, 1]-> Д ^:[0,1]->Х, соединяющих некоторые точки и, V € X, т. е. У>о(0) = (Р\(0) = и, (ро(1) = (р\(1) = V, гомотопны, если существует непрерывная деформация (р(1,т), <р : [0, 1] х [0, 1] -> X, (р(0, т) = и, у>(1, г) = V, такая что <рИ9о) = М1)> *>(и) = ы<). «Стенографический» вариант в данном случае длиннее разговорного, но тут преимущества лежат в другой плоскости. Когда возникает необходимость конкретно указать деформацию, — ясно, что надо указать (в смысле регламента). Далее рассматриваются замкнутые пути (петли) с заданным направлением обхода, возможно, самопересекающиеся, которые начинаются и заканчиваются в одной выделенной точке хо € X. Отношение гомотопности разбивает такие пути на эквивалентные
4.7. Первая гомотопическая группа 89 классы. Умножением (групповым) двух путей называется их объединение, после которого можно двигаться по объединенной кривой с соблюдением разрешенных направлений. На плоскости (рис. 4.3) с вырезанной областью П и выделенной точкой ж0 — показано объединение путей Ли В. Контур А может быть стянут (деформирован) в точку, контур В — нет. Сделав оборот по Л и вернувшись в точку х0, можно перейти к движению по В (с учетом разрешенных направлений). На торе полезно себе представить объединение меридиана с параллелью — ни тот, ни другой контур в этом случае невозможно стянуть в точку. Легко видеть, что множество замкнутых путей с таким умножением образует группу, называемую фундаментальной, или первой гомотопической, и обозначаемую 7Г{(Х, Хо). Единицей этой группы служит класс контуров, стягиваемых в точку жо- Замена хо любой другой точкой уо, которую можно соединить с Хо непрерывным путем, — не меняет группу, щ(Х9х0)~щ(Х,уо). Фундаментальная группа является инвариантом 17\ характеризующим топологическую структуру пространства X. х0 Рис. 4.3 Детали будут изложены в томе «Топология».
Глава 5 Теория представлений В теории представлений изучаемым группам ставятся в соответствие группы матриц, или — линейных операторов. В связи с переходом от «неудобных* групповых операций к «привычному» матричному умножению возникают определенные ожидания, которые не всегда оправдываются*\ но кое-что получает дополнительный импульс. 5.1. Матричные представления Представлением группы С называют функцию Т(д) (д € С), принимающую значения в группе невырожденных матриц и удовлетворяющую функциональному уравнению Т(91д2)=Т(д1)Т(д2), (5.1) при условии Т(1) = /, где / — единичная матрица. Если речь идет о непрерывной группе (?, в которой, так или иначе, определена сходимость элементов, то от функции Т(д) требуется еще непрерывность. Разумеется, в (5.1) имеется в виду Т(д[*д2) = Т(д1)-Т(д2), где звездочка обозначает групповую операцию в С, а точка — умножение матриц. Из (5.1) легко следует Т(д-1) = Т-\д) в силу 1 = Т(дд-1) = Т(д)Т(д-1). ' Потому что матричное умножение не лучше композиции подстановок. Однако очевидные трудности — толкают иногда к неочевидным.
5.1. Матричные представления 91 Поэтому совокупность матриц {Т(д) : д € С} в самом деле представляет собой группу, а функция Т(д) — гомоморфизм. Представление Т(д) в общем случае не обязано разным элементам группы С сопоставлять разные матрицы. В случае Т(д) = I только при условии д = 1, что означает кегТ = 1, — представление Т(д) называется точным. Рассматривая матрицы как линейные операторы, естественно говорить о пространстве представлений Е = Шп, в котором действуют операторы Т(д). И вообще, о Т(д) с самого начала лучше говорить как о линейных операторах, ибо переход к другому базису меняет матрицы. Матричные же представления Т\ и Т2 считаются эквивалентными (изоморфными), если они описывают одну и ту же совокупность линейных операторов. Иными словами, если существует такая невырожденная матрица С, что ' Т1(д) = С-[Т2(д)С, Уд ЕС. Различие между линейным оператором и матрицей стирается при фиксации базиса. Это обстоятельство принципиально в линейной алгебре [4, т. 3], но оно еще более существенно в теории представлений, где рассматриваются совокупности матриц, и важно подчеркнуть, что все матрицы описывают линейные операторы в одном и том же избранном базисе. Обратим внимание, что линейное представление группы можно интерпретировать как действие группы на векторном пространстве, с тем уточнением, что каждому элементу группы сопоставляется не произвольная биекция, а линейный оператор. • Линейным представлением группы подстановок 8П является группа (п х п)-матриц перестановок. Матрицей перестановки называют матрицу, у которой в каждом столбце и каждой строке — ровно один элемент равен 1, остальные нули. Умножение матрицы на матрицу перестановки слева — переставляет строки, справа — столбцы. Например, Р = 1 0 0 0 0 1 0 1 о] => Р о1: 02: -йЗ:. = ах а3 .а>2 Группа матриц перестановок изоморфна симметрической группе подстановок 8П. (!) Сопрягающая матрица С — одна и та же для всех элементов группы.
92 Глава 5. Теория представлений • В качестве линейного представления бесконечной циклической группы 0 = {а,а\...,а\...} можно взять любую невырожденную матрицу Т(о), полагая Т(ак) = Т (а). Если же циклическая группа имеет порядок п, то на Т(а) необходимо наложить ограничение Тп(а) = I, которому можно удовлетворить, взяв в качестве Т(а) диагональную матрицу с п корнями из единицы на диагонали. • Представлением группы поворотов на угол ^ является, например, т(0 С08^ 81П^ -81П^ С08^ А представлением группы движений плоскости д(%, а, Ъ): X = X С08 ^ - у 81П ^ + а, У = X 81П ^ + у С08 ^ + Ь, может служить как комплексное т(д) -[1 так и действительное представление Т(д) = С08^ 81П^ . О а + гЬ 1 -81П^ С08^ О а Ь и 1 на выбор • В случае О = (а1,...,ап) и наличия в С определяющих соотношений вида а[1 ... а Т{ах),...,Т{ап) должны быть наложены ограничения Т°х (а\)... Тап(ап) = I. • Если группа С конечна, |бг| = п, то Чдеб: Тп(д) = Т(дп) = Т(\)=1. Поэтому все собственные значения Ль ..., Лп оператора Т(д) являются корнями п-й степени из 1 (при любом д € С). • Разумеется, возникает вопрос, любая ли группа имеет представление в указанном выше смысле. Первый пример группы Ли, нереализуемой в виде группы матриц, указан, по-видимому, Картаном [12]. Более простой пример дал Биркгоф '. ' В/г/сИо/Г О. Ые ёгоирз 18отогрЫс ^ЙЬ по Ппеаг §гоир // Ви11. Атег. Ма1К. Зое. 1936. 42. 883-888.
5.2. Инвариантные подпространства 93 5.2. Инвариантные подпространства Допустим, операторы представления Т(д) действуют в Е. Подпространство % С Е называется инвариантным, если для всех д 6 С: из х 6 *Я следует Т(д)х 6 7^. 5.2.1. Представление Т{д), имеющее только тривиальные инвариантные подпространства (нулевое и само Е), называют неприводимым. В случае приводимого представления Т(д) имеются два других представления группы С. Одно из них получается как сужение операторов Т(д) на К, а другое — строится в фактор-пространстве Е/К смежных классов4^ х + И. Таким образом, в случае приводимого представления Т(д) оказывается возможным перейти к представлениям группы — меньшей размерности. При этом в подходящем базисе Гад %)' О Т2{д)\ Пд) (5.2) Обоснование фактов типа (5.2) — с указанием рецепта выбора базиса — здесь вряд ли уместно, ибо читать главу в любом случае необходимо «с линейной алгеброй в багаже». Разница между одним линейным оператором и совокупностью, конечно, есть. Но в данной ситуации все линейные операторы Т(д) имеют одно и то же инвариантное подпространство К, что сводит исследование к стандартным приемам линейного анализа [4, т. 3]. Обнулить блок 8(д) в (5.2), вообще говоря, невозможно. Однако если инвариантно не только подпространство 72., но и его дополнение, то выбор базиса, в котором т(д) = Ш о О Т2(д) оказывается возможен. В этом случае говорят, что Т(д) является прямой суммой представлений Т\(д), Т2(д), и пишут Т(д)=Т1(д)®Т2(д). ' Из инвариантности К следует, что оператор Т(д) переводит смежный класс х + К в смежный класс Т(д)х + К.
94 Глава 5. Теория представлений Если Е распадается в прямую (ортогональную) сумму инвариантных подпространств Е = К{ ®...®ПП9 Т(д) разлагается в ортогональную прямую сумму Т(д)=Т1(д)®...®Тп(д), что соответствует блочно-диагональной записи матрицы Т(д) с блоками Т{(д) на диагонали. 5.2.2. Представление Т(д) называется вполне приводимым, если оно раскладывается в ортогональную прямую сумму неприводимых представлений К Матрица вполне приводимого представления в подходящем базисе имеет вид Т(9) = Тх{д) 0 ... О О Т2(д) ... О О ... О Тп(д)} 5.3. Ортогональные представления Сопряженным к Т(д) называют представление ' Т\д) = Т(д-1). (5.3) Представления Т(д) и Т'(д) группы С изоморфны (еще говорят — эквивалентны). 5.3.1. Представление Т(д) называется ортогональным (унитарным), если существует скалярное произведение (-,-), по отношению к которому Т(д) ортогональный (унитарный) оператор при любом д&С. ' Что имеет место в томм случае, когда дополнение всякого инвариантного подпространства — также инвариантно. ' Свойство Т1 (д\)Т>(дг) = Т1(д\д2) очевидно. Точное определение сопряженного представления опирается на манипулирование сопряженным пространством Е*, что в данном случае ничего не добавляет по сути. Причины (5.3) раскрываются далее.
5.3. Ортогональные представления 95 В унитарном случае сопряженное представление вычисляется по правилу: I Т'(д) = Т*(д), I где звездочка обозначает эрмитово сопряжение \ Напомним [4, т. 3], линейное преобразование 5 называют ортогональным, если оно не меняет длину векторов, (х, х) = (5ж, 8х) = (ж, 8*8х) = (8*8х, ж), откуда 5*5 = 5*5 = 7, что означает 5* = 5-1, т. е. для получения обратной — ортогональную матрицу достаточно просто транспонировать. Унитарное преобразование — это комплексный вариант ортогонального. Внешняя картина остается прежней. Разница лишь в том, что скалярное произведение подразумевает перемножение комплексных векторов, з а транспонирование операторов заменяется эрмитовым сопряжением. Отмеченное выше равенство Т'(д) — Т*(д) в унитарном случае следует из цепочки Т'(д) = Т(д-1) = Т-1(д) = Г(д). 5.3.2. Теорема. Всякое линейное представление конечной группы ортогонально (унитарно). < Ограничимся рассмотрением вещественного случая. Пусть в Е задано некоторое скалярное произведение (•, -)0. Новое скалярное произведение (х,у) = ^2(Пд)х,Т(д)у)0 дес инвариантно относительно Т. Действительно, (Т(Н)х, Т(Н)у) = 53 (Т(9)ПН)х, Т(д)Т(Н)у\ = ^ №)*- Т{дН}у\ , дес дес ' Сводящееся к транспонированию для действительных матриц. В случае комплексных матриц эрмитово сопряжение означает транспонирование плюс комплексное сопряжение всех элементов.
96 Глава 5. Теория представлений но когда # пробегает всю группу, то дН также пробегает всю группу. Поэтому (Т(Н)х,Т(Н)у) = (х,у), т.е. Т(Н) сохраняет длину вектора при любом к € С. ► Конечность группы в доказательстве использовалась при суммировании, замена которого инвариантным интегрированием [21] позволяет установить аналог теоремы 5.3.2 для компактных групп, представления которых также ортогональны (унитарны). В свою очередь, всякое ортогональное (унитарное) представление вполне приводимо, а значит, может быть записано в блочно-диаго- нальном виде \ 5.4. Инвариантные операторы Линейный оператор А, коммутирующий с представлением Т(д), АТ{д)=Т(д)А, ЧдеС, (5.4) называется инвариантным. Смысл термина лучше раскрывает эквивалентная (5.4) запись Т-1(д)АТ(д)=А, Чдеб. (5.5) Это можно интерпретировать следующим образом. Соотношение у = Ах после перехода к другой (штрихованной) системе координат с матрицей перехода Т(д), х = Т(д)х', у = Т(д)у', превращается в у' = Т-{(д)АТ(д)х1. В случае (5.5) получается, что описание связи «входа х и выхода у» инвариантно по отношению к заменам координат из данной группы. ' Что освобождает от неприятностей, связанных с жордановыми формами. Полная приводимость вытекает из того факта, что ортогональное дополнение инвариантного подпространства в случае ортогонального (унитарного) представления — также инвариантное подпространство.
5.4. Инвариантные операторы 97 В случае (5.4), если х — собственный вектор оператора А, то и Т(д)х — собственный вектор А, отвечающий тому же самому собственному значению А. <« Если Ах = Хх, то АТ(д)х = Т(д)Ах = ХТ(д)х. ► Отсюда следует, что подпространство, натянутое на собственные векторы оператора А, отвечающие данному собственному значению А, — является инвариантным для представления Т(д). Поэтому оператор А, перестановочный с неприводимым представлением Т(д), не может иметь более одного собственного значения9\ т.е. фактически обязан быть скалярным, А = XI. Это простой, но достаточно принципиальный результат, называемый обычно леммой Шура. 5.4.1. Лемма Шура. Матрица А, коммутирующая со всеми операторами неприводимого представления Т(д), может быть только скалярной, А = XI. Из леммы 5.4.1 сразу следует, например, что неприводимые конечномерные представления абелевых групп — одномерны. «* Действительно, 9Н = кд =*■ Т(д)Т(к) = Т(к)Т(д). Поэтому при фиксированном Н оператор Т(Н) перестановочен с представлением Т(д). Следовательно, Т(Н) = Х(Н)1. Но представление такого типа может быть неприводимым лишь в том случае, когда Л не зависит от Л. ► Отсюда вытекает, что у любого комплексного представления абе- левой группы существует одномерное инвариантное подпространство. Еще одно следствие леммы 5.4.1: скалярное произведение, инвариантное относительно Т{д), единственно с точностью до постоянного множителя. < Пусть (•, •>!, (•, -)2 — инвариантные скалярные произведения. Поскольку (х,у){ = (Ах,у)2, (5.6) ' Иначе оператор А будет иметь нетривиальные собственные подпространства [4, т. 3], которые будут инвариантны относительно Т(д).
98 Глава 5. Теория представлений где А подходящий линейный оператор ', — то (ТАх, Ту)2 = (Ах, у)2 = (ж, */), - (Тж, Ту), = (АТх, Ту)ъ откуда АТ(д) = Т(д)А =» А = Л/, что в итоге дает (ж, у)\ = Х(х, у)2. ► Приведенные результаты — суть разные лица общего принципа, пронизывающего теорию групп. Нечувствительность «объекта» к группе преобразований — влечет за собой определенные последствия. 5.5. Характеры Характером представления Т(д) называется функция Хт : О -> С, равная следу оператора Т(д), т. е. г Характеры являются частным случаем так называемых центральных функций, принимающих постоянные значения на классах сопряженных элементов. Такое свойство в данном случае очевидно: Хт(*~19*) = ЪТ(з-1дз) = 1тТ-1(з)Т(д)Т(з) = 1гТ(д) = Хт{д). Хитрость, собственно, невелика. Любая функция, не зависящая от матричного представления операторов Т(д) (от выбора базиса), будет центральной. Но, оказывается, справедлив более конструктивный результат. 5.5.1. Теорема. Пусть {Т\(д),..., Тп(д)} — неприводимые представления группы С. Тогда соответствующие характеры {хМ^.-ЛТпШ 1 ' Элементы матрицы А (как в действительном, так и в комплексном случае) определяются из п уравнений (Ае\, ц)2 = (еь в|)1, где {в{} — базис.
5.5. Характеры 99 образуют ортонормированный базис в пространстве центральных функций К Теорема 5.5.1 приводит к нескольким следствиям, повышающим статус характеров: • Представление характера неприводимо в томм случае, когда (Хт,Хт) = 1. • Комплексное линейное представление конечной группы определяется с точностью до изоморфизма своим характером. • Число неприводимых комплексных линейных представлений конечной группы равно числу ее классов сопряженных элементов. Подробнее с темой можно ознакомиться по небольшой книге Винберга [7]. п' При условии, что скалярное произведение центральных функций определяется (<р, <Ф) = ~ ^2 <РШ(9)- п9ео
Глава 6 Разрешимые группы При первом знакомстве с предметом главу лучше не читать, потому что все просто, но не ясно «зачем». Теоремы не фиксируются в памяти, перекатываясь как ртуть. В главе 11 появится мотивация, и тогда к рассматриваемой эквилибристике можно будет вернуться с меньшим предубеждением. Для простоты, рассматриваемые ниже группы предполагаются конечными, но этого все равно не хватает для «прозрачности». Когда нечто созревало годами, в пять минут его трудно ухватить. 6.1. Нормальные ряды Центральное в главе понятие разрешимой группы, и само название, было связано с проблематикой разрешимости в радикалах алгебраических уравнений. Свойство разрешимости свидетельствует об иерархическом устройстве группы в том смысле, что группу можно считать «собранной» из абелевых подгрупп с помощью последовательных расширений \ Сказанное прояснится далее, пока же необходимо начать с подготовительных понятий. 6.1.1. Нормальным рядом называется последовательность подгрупп ' С = С0>С{ >С2>...>Сп = {1}, (6.1) где С г Ф С 1-\, п — длина, а фактор-группы Сг-\/Сг — факторы нормального ряда. Иными словами, нормальный ряд это последовательность вложенных подгрупп о = о0эо1 эб2э...эбп = {\}, ^Группу С называют расширением группы А посредством группы В, если А изоморфна некоторой нормальной подгруппе ЛГ С С, а В — изоморфна факторгруппе сулг. ' Напомним, А > В означает, что В — нормальная подгруппа А.
6.1. Нормальные ряды 101 где каждая последующая подгруппа 6г, является нормальной подгруппой предыдущей 6г,-ь но не обязана быть нормальной подгруппой3) С. 6.1.2. Нормальный ряд С = Р0 > Р{ > Р2 > • • • > Рт = {1} называется уплотнением ряда (6.1), если все подгруппы первого ряда встречаются во втором. 6.1.3. Нормальный ряд, который нельзя уплотнить, называется — композиционным. (!) Факторы композиционного ряда являются простыми группами (в частности, циклическими группами простых порядков). Всякая группа обладает тривиальным нормальным рядом С>{1}. Простая группа не обладает нетривиальными нормальными рядами. Если в С есть нормальная подгруппа Н С С, то ряд С > Н > {1} нормален. 6.1.4. Теорема Шрейера. Любые два нормальных ряда группы обладают изоморфными уплотнениями. 6.1.5. Теорема Жордана—Гёльдера. Если группа обладает композиционными рядами, то композиционные ряды изоморфны друг другу К Вторая теорема легко выводится из первой, а первая — несложно доказывается сама по себе [16]. 6.1.6. Группа называется разрешимой, если она обладает нормальным рядом с абелевыми факторами. Таким образом, если в О есть нормальная подгруппа Н С О, то это еще не означает разрешимость С — требуется абелевость факторов О/Н и Я = Я/{1}. ' Иногда такие ряды называют субнормальными, оставляя понятие «нормального ряда» за теми ситуациями, где каждая С?,- обязана быть еще нормальным делителем группы С. Кроме того, к рассмотрению обычно допускаются ряды с повторениями, 6{ = Сг-\, что вынуждает дополнительно говорить о рядах без повторений. Все это имеет определенный смысл при более детальном изложении предмета. ' Формулировка теоремы подразумевает общую ситуацию. Для конечных групп композиционные ряды заведомо существуют.
102 Глава 6. Разрешимые группы 6.1.7. Группа разрешима в томм случае, когда все ее композиционные факторы — циклические группы простых порядков. 6.2. Коммутанты и разрешимость Произведение аЪа~1Ъ~{ называется коммутатором элементов а, Ь — и обозначается [а, Ь]. Очевидно, аЬ = [а, Ъ]Ъа, т. е. домножение на [а, Ь] «переставляет» сомножители. Разумеется, в коммутативном случае [а, Ъ] = 1. Легко убедиться, что МГ1 = [М1, [а9Ь'1] = Ь'%а]Ь9 и вообще, любой элемент сопряженный с коммутатором, с[а,Ь]с~1 = [сас"1,сЬс"1], (6.2) является коммутатором. Подгруппа Сг1' = [С,С], порожденная в С всевозможными коммутаторами, называется коммутантом группы С. Иными словами, коммутант Сг ' состоит из всевозможных произведений коммутаторов [а^Ъх]... [ат,Ът], а^Ь^ е С. Надо иметь в виду, что произведение коммутаторов не обязано быть коммутатором, а коммутант не обязательно состоит из коммутаторов. Однако [С, С] всегда совпадает с множеством «длинных коммутаторов»: 91---9к911.--9к1- (?) При этом есть примеры5*, в которых значения к, необходимые для исчерпания коммутанта [С, С], неограниченны. ' СаззШу Р. /. Ргос1ис18 оГ соттшаюгз аге по1 а№ау8 соттшаюгз, ап ехатр1е // Атег. МаШ. МотЫу. 1979. 86. Р. 772.
6.2. Коммутанты и разрешимость 103 6.2.1. В силу (6.2) коммутант всегда нормален ' и является наименьшей в С подгруппой, фактор-группа по которой абелева. Абелевость фактор-групп играет принципиальную роль в теории разрешимых групп, поэтому особо выделим простой, но идеологически важный факт. 6.2.2. Лемма. Фактор-группа С/И по нормальной подгруппе N является абелевой в томм случае, когда х,уеС =» [х,у]еК 6.2.3. Любая подгруппа N С С, содержащая коммутант Сг , нормальна в С. Коммутанты высших порядков, Сг +1' = (Сг 'у\ определяют ряд коммутантов С" = [С,С), СГ(2) = [СГ(1)>С(1)]) ._ С<*+1) = [С<*)>С(*)]> ..., К'' имеющий абелевы факторы. Чтобы ряд (6.3) был нормален, не хватает единственного условия, Сг ' = {1} при некотором п. Таким образом, если ряд (6.3) обрывается равенством С^1' = {1}, группа С оказывается разрешимой. Верно также обратное. Если существует нормальный ряд (6.1) с абелевыми факторами, то таковым является и ряд коммутантов, причем С^ ' С Съ, что легко устанавливается по индукции \ • Вообще говоря, разрешимую группу С можно было бы определять как группу, для которой цепочка коммутантов С, С , С ,... заканчивается при некотором п единичной группой, <7(п) = {1}. При этом достигается значительная экономия средств. Нормальные ряды, фактор-группы, абелевость факторов — все ' Нормален также коммутант [ЛГ, ЛГ] нормальной подгруппы N С С. 7* Ч С^ С С\, поскольку фактор-группа С/С\ абелева. Далее, 6{к)С0к =» (С*)(1) С (?*+,, поскольку Ск/Ск+\ абелева. Но тогда <7(*+1) с (<7*)(1) С <?*+!• ►
104 Глава 6. Разрешимые группы это оказывается лишним. Но экономные пути не дают видеть «окрестности», мешая тем самым пониманию (хотя — когда как). • В простой группе*' С все коммутанты совпадают с группой: бг1' = (7, 6г(2) = С и т.д. Поэтому если ряд (6.3) «наталкивается» на простой коммутант (7 , то обрыва цепочки не происходит, поскольку с№ = <7(/) Ф {1} при любом к ^ I. Простая группа, таким образом, заведомо неразрешима. Однако наличие в С нормальной подгруппы N разрешимость С также не гарантирует — нужна абелевость факторов. • При гомоморфизме <р : С -» Р образ коммутанта лежит в коммутанте Р, т.е. ч>(6{1)) С Р{1). Если же <р(6) = Р, то и <р(6{1)) = Р{1). • Гомоморфный образ разрешимой группы — разрешим. • Любая подгруппа разрешимой подгруппы — разрешима. «* Это сразу вытекает из импликации НСС ^ Я^СС"», Я(2)С<7(2\ .... ► • Если все нетривиальные подгруппы конечной группы О абелевы, группа 6 разрешима. 6.2.4. Группа С, имеющая нормальную подгруппу ТУ, разрешима в томм случае, когда разрешимы обе группы N и С/К 6.2.5. Если N1 и N2 — нормальные разрешимые подгруппы группы С, то N{N2 — также нормальная разрешимая подгруппа группы С. 6.3. Простые группы Наиболее знаменитый пример простой (а значит, неразрешимой) группы — знакопеременная группа А„ при п ^ 5 — факт, играющий важную роль в теории Галуа. Полная группа симметрии икосаэдра изоморфна группе 85, а подгруппа осевых симметрии — группе четных подстановок А5. Изоморфизм позволяет, при желании, переходить с одного языка на другой — в поиске удобных путей обсуждения. Если абелева группа проста, то это циклическая группа простого порядка. (?)
6.4. Пример 105 6.3.1. Лемма. При п^Ъ группа А„ порождается тройными циклами. < Если среди чисел %,], к, I есть два равных, то (ц)(к1) — тройной цикл. Если же »', у, к, I попарно различны, то, в силу (у)(Ы) = (у)(«)(К)(И), (%])(Ы) — опять-таки тройной цикл. Поэтому любая четная подстановка пред- ставима в виде произведения тройных циклов. ► 6.3.2. Лемма. Если нормальный делитель N группы А„ содержит хотя бы один тройной цикл, то N = А„. < Все тройные циклы сопряжены (раздел 2.5), а нормальная подгруппа N вместе с каждым своим элементом х содержит все элементы, сопряженные х. Поэтому N порождается всеми тройными циклами. Остается сослаться на предыдущую лемму. ► 6.3.3. Теорема. Знакопеременная группа А„ при п ^ 5 является простои \ «* Ограничимся рассмотрением случая10) п = 5 и покажем, что коммутатор [А5,А5]=А5, т.е. любой элемент из А5 представим в виде аЬа~хЬ~х, где а, Ь (Е А5. Циклы длины 5 в А5 исчерпываются представлением (гуЫт) = аЪа~1Ъ~1, где а = (гутЫ), Ъ = (гз)(кт). Циклы длины 3 охватываются разложением (цк) = аЬа~1Ь~\ где а = {1]к), Ь = (ук)(1т), и /,т не входят в список г,],к. Наконец, произведения (гу)(Ы) с попарно различными г,у,к,1 укладываются в схему (ц)(к1) = аЬа~1Ь~\ где а = (И)(ук), Ь = (цк). Легко убедиться, что разнообразие возможностей тем самым оказывается исчерпанным. ► 6.4. Пример Ниже рассматривается пример разрешимой группы {[а, Ь]}, который выглядит несколько вычурным, но именно эта группа пригодится в теории Галуа. * Группа Аз также проста, А* — нет, поскольку четные подстановки (12)(34), (13)(24), (14)(23), вместе с тождественной — составляют нормальную подгруппу А*, не содержащую тройных циклов. Заметим также, что А„ (п Ф 4) не исчерпывают простых конечных групп. 10' Общее доказательство ненамного сложнее.
106 Глава 6. Разрешимые группы Множество пар целых чисел (а,Ь), где а взаимно просто с п, разобьем на классы [а, Ъ] по модулю п, т.е. (а\9Ь\), (аг,^) принадлежат одному классу, если а\ = а>2 (тойп), Ь\ = Ь2 (тойп), и введем групповую операцию [а, Ъ][с, А] = [ас,Ъс + Л]. Получается действительно группа {[а, Ь]}. (?) Рассмотрим теперь гомоморфизм <р : {[а, Ъ]} —У (Ъ/пЪ)х, действующий по правилу: [а, Ъ] »-»• а. Здесь (Ъ/пЪ)* обозначает мультипликативную группу классов по модулю ' п, которая состоит из всех положительных чисел, меньших п и взаимно простых с п. Ядро гомоморфизма (р состоит из элементов [1,6], умножение которых коммутативно в силу [ 1,61 ] [ 1, &2 ] = [ 1,61 + &2 ]. Поэтому ядро кегу> — абелево. Образ — тоже абелев. Поэтому группа {[а, Ъ]} — разрешима. и' Если п простое, то (Х/п%)* совпадает с мультипликативной группой вычетов по модулю простого числа.
Глава 7 Определяющие соотношения 7.1. Порождающие множества Пересечение любой совокупности подгрупп является подгруппой. (?) В том числе пересечение подгрупп, содержащих некое подмножество 8 группы С Такое пересечение обозначается как (5) и называется подгруппой, порожденной множеством 5\ которое, в свою очередь, именуется порождающим множеством. Легко видеть, что (5) состоит из всевозможных произведений где все #г € 5, а «показатели степени» оц = ±1. В ситуации (5) = С говорят, что группа С порождается множеством 5. Выделение в группе «небольшого» порождающего множества 8 обычно имеет целью сузить ассортимент «строительных блоков». • Симметрическую группу подстановок 8П порождает любое из множеств: всевозможных циклов, транспозиций, упорядоченных транспозиций (гу), г < у, а также транспозиций Мура—Коксетера: (12), (23),... ((п-1)п). (?) Перечисленное, разумеется, не исчерпывает возможностей. Например, 8П порождается одной транспозицией (12) и одним циклом (12 ... п). • Знакопеременная группа \ порождается множеством 3-циклов. • Группа поворотов Сп порождается одним поворотом I = 2тг/п, а группа диэдра Вп — поворотом I и отражением г относительно одной из осей . В отрыве от содержательной интерпретации на образующие I и г приходится накладывать ограничения типа 1п = 1, г2 = 1, а также (1г)2 = 1 — см. далее (раздел 7.3). Которая переходит в другие оси отражения при поворотах I .
108 Глава 7. Определяющие соотношения 7.2. Свободные группы Свободные группы скучно выглядят, но многое освещают. Пусть алфавит А содержит пустой символ, никак не обозначаемый, а все остальные символы входят в А парами: если а € А, то ий~ € А, причем аа~ = а~ а = «пустому символу», т. е. рядом стоящие обратные друг другу символы а и а~ можно «сократить». Элементами так называемой свободной группы являются всевозможные слова из букв алфавита А, не содержащие рядом стоящих обратных символов. Например, а, йааЬГ с, ЪЬЬ. Произведение определяется как простое слияние слов, аЪс* аЬ~х = аЬсаЬ~{, с учетом возможных сокращений: аЪс~1 * сЬ~ха = аЪс~{сЪ~1а = аа. Аксиомы группы легко проверяются. Роль единицы играет пустое слово. Обратным словом, например, для аЬс — будет с~ Ъ~ а~ . Проверка ассоциативности более хлопотна, но это все же задача, по природе своей, для самостоятельного размышления \ Алфавит А для свободной группы является порождающим множеством. 7.2.1. Теорема. Любая группа С изоморфна некоторой факторгруппе некоторой свободной группы. < Пусть 5 = {за} — некоторое множество образующих для О. Элементам за поставим в соответствие символы ха, и пусть Р — свободная группа над алфавитом А = {ха}. Определим далее гомоморфизм у из Р на С, сопоставляя элементам ха ... хш € Р элементы за ... зш € С. По теореме 2.6.1 о гомеоморфизме О - Р/Н, ' Проблема заключается в установлении следующего факта: результат сокращения слова не зависит от порядка сокращений. В принципе, можно посмотреть у Куроша [16].
7.3. Тождества в группах 109 где Н — нормальный делитель группы Г, состоящий из слов ха ... хш, которые гомоморфизмом <р переводятся в слова за ... зш = 1. ► 7.3. Тождества в группах Выше отмечалось, что в группе диэдра Вп поворот I = 2ж/п и отражение г относительно одной из осей удовлетворяют равенствам гп = 1, г2 = 1, (1г)2 = 1. (7.1) Естественно, возникает вопрос: определяют ли тождества (7.1) группу Вп или только «что-то о ней говорят». Задачу можно сформулировать иначе. Пусть в группе с двумя образующими I и г выполняются тождества (7.1). Что это за группа и совпадает ли она с 1?п? «* В данном случае проблема относительно легко решается. Из (1г)2 = 1 следует: Нг — 1~х, Нкг = г1к~хгНг = Нк-хгГх = ...=Гк. Поэтому любое слово из I и г заменами (7.1) приводится к слову (произведению), в котором г встречается не более одного раза. С учетом опять-таки легко выводимого равенства 1кг = г1п~ , нетрудно посчитать, что в искомой группе 2п элементов, — и потому она изоморфна Бп. ► Тождества типа (7.1) называют определяющими соотношениями группы. Точнее говоря, пусть дано некоторое множество символов А = {аи а,2,...} и некоторая система соотношений шу = 1, ..., шм = 1, (7.2) приравнивающих единице некоторые слова о;;, записанные в алфавите А. Эти соотношения определяют — с точностью до изоморфизма — группу С как фактор-группу Р/Н, где Р свободная группа над алфавитом А, а ее нормальный делитель Н порожден левыми частями соотношений (7.2). Сказанное выглядит наукообразно, но такое впечатление обманчиво. Конечно, пример соотношений (7.1) создает иллюзию, что о группе диэдра Вп можно говорить, не обращаясь к понятиям свободной группы и фактор-группы. Но вопрос в том — откуда начинать. Если изначально речь идет о содержательно определенной
110 Глава 7. Определяющие соотношения группе Вп, то говорить о соотношениях (7.1) как об определяющих — нет необходимости. Если же на (7.1) смотреть как на тождества, определяющие некоторую группу С, — то поневоле приходится стать на описанную выше точку зрения. При этом рецептура чаще всего ведет в тупик. С одной стороны, задание группы образующими и определяющими соотношениями является универсальным способом. С другой — о так заданной группе в общем случае ' почти ничего нельзя сказать. Конечна она или бесконечна, коммутативна ли, содержит ли хотя бы один элемент кроме единицы [16]. По этой причине определяющие соотношения в большей степени известны сопутствующими «неприятностями». В частности, сюда относится неразрешимая проблема эквивалент- 4) ности слов в группе, заданной определяющими соотношениями \ • Что можно сказать о группе, заданной двумя образующими а, Ь и соотношениями а4 = 1, Ь3 = 1? Один из способов частичного решения таких задач — моделирование. Указанным соотношениям удовлетворяют матрицы При этом элемент аЬ = \ имеет бесконечный порядок, И'-И- Отсюда вытекает, что соответствующая группа по крайней мере бесконечна. 7.4. Определяющие соотношения В разделе 7.3 речь шла об определяющих соотношениях в свободной группе, и там главная проблема заключалась в выяснении того, какую группу эти соотношения определяют. На ту же проблематику возможна другая точка зрения. Рассматриваются конкретные дискретные группы и выясняется, какие соотношения их определяют. ' Причем — как правило. ' См. [4, т. 6, гл. 4], где есть беглое обсуждение и ссылки.
7.5. Проблема Вернсайда 111 Пусть С = {8), и порождающее множество 5 состоит из элементов 51,..., зт. Соотношения дъ(8и...,зт) = 1, к= 1,...,г, (7.3) называются определяющими, если любое другое соотношение между порождающими элементами 3\,... ,зт является алгебраическим следствием (7.3). Совокупность порождающих элементов и определяющих соотношений называют генетическим кодом, или просто кодом группы, знание которого иногда существенно облегчает выяснение различных свойств изучаемых объектов [13]. 7.5. Проблема Бернсайда Для теории групп характерны значительные трудности в ответах на простые с виду вопросы. Один из таких вопросов в 1902 году поставил Бернсайд: конечна ли конечнопорожденная группа, все элементы которой имеют конечный порядок \ Отрицательный ответ ' потребовал времени и усилий многих математиков, ибо первичный вопрос породил целую серию задач. О проблеме Бернсайда и ее вариациях можно долго рассказывать. Масштабный поиск, тысячи страниц журнальной и монографической литературы. В таких случаях неискушенный читатель обычно интересуется, а зачем это нужно. Каков практический выход? И такой вопрос возникает каждый раз, когда трудозатраты несоизмеримы с видимой пользой. Но на плохо поставленные вопросы лучше не отвечать. Непосредственные выгоды решения сложных задач, как правило, ничтожны. Только не в них дело. 5' Особо выделив проблему с тождеством в группе хп = 1. ' Голод Е. С. О ниль-алгебрах и финитно-аппроксимируемых группах // Изв. АН СССР. Сер. Мат. 1964. 28. С. 273-276.
Глава 8 Алгебраические структуры Общую алгебру, как и Библию, невозможно читать подряд. Слишком многое пишется впрок, причем не только в расчете на последнюю главу, но и с прицелом в никуда. Тем не менее сама идея «воспарить над конкретикой» понятна и жизнеспособна. Аналоги обычных арифметических действий имеются далеко за пределами числовых систем. Умножать и складывать можно многочлены, матрицы, выпуклые тела. Докуда простираются аналогии? Теорема Ферма о неразрешимости хп+уп = гп, п>2, справедлива ли для целочисленных матриц либо многочленов? Обязана ли матрица однозначно раскладываться в произведение «простых сомножителей»? Такого сорта вопросы не хотелось бы каждый раз решать заново, не видя взаимосвязей предметных областей. Это с одной стороны. С другой — междисциплинарные связи помогали бы видеть новые факты и подталкивали бы мысль в перспективных направлениях. Кроме того, абстрагирование от числовой специфики могло бы способствовать взгляду хотя бы на арифметику с высоты птичьего полета. Последнее крайне желательно, поскольку то и дело в предметных областях возникают попытки обобщить то, что принципиально не обобщается. При этом бесперспективность расширения тех или иных представлений — не видна обычно на приземленном предметном уровне. Алгебраический взгляд дает исчерпывающие ответы. Например: 8.0.1. Теорема Фробениуса [15]. Поле действительных чисел и поле комплексных чисел являются единственными конечномерными действительными ассоциативно-коммутативными алгебрами без делителей нуля.
8.1. Куда ведет абстрагирование 113 Тело кватернионов является единственной конечномерной действительной ассоциативной, но не коммутативной алгеброй без делителей нуля К На бегу результат выглядит философским развлечением. Но он очерчивает границы возможного и спасает от безнадежных попыток изобрести новое там, где Свыше не предусмотрено. Это, между прочим, гораздо важнее решения конкретных задач, ибо в иерархии научных целей на первом месте стоит понимание того, куда можно и нужно двигаться, минуя «квадратуру круга». Владея инструментом, полезно осознавать его происхождение и возможности. В противном случае интеллектуальная мощь уходит на мистические восторги, подобные тем, которые сопровождали рождение комплексных чисел. 8.1. Куда ведет абстрагирование Абстракция выглядит тайной, пока привычка не смывает налет мистики. Цивилизация продолжает медитировать над комплексными числами, но ощущение глубины постепенно мелеет. А вот натуральный ряд уже достиг рубежа тривиальности. Но так было не всегда. Пример аборигенов Сахалина, до недавнего времени имевших разные числительные для круглых предметов и продолговатых, весьма показателен \ Нам такое уже трудно представить. Понятие абстрактного числа стало банальностью. Этаким кирпичиком мировоззрения, вообразить отсутствие которого почти невозможно. Поэтому говорить о глубине и величии понятия Числа сегодня сложно. Уже никто не понимает — все привыкли. Но есть другие абстракции, которые пока находятся как бы на другой стадии. То ли — в процессе, то ли — не все население с ними имеет дело. И там есть возможность посмотреть на ситуацию свежим взглядом. • Формула Кардано для решения кубического уравнения х3+рх + д = 0 (8.1) ^Наконец, алгебра Кэли [15] — единственная конечномерная действительная альтернативная, но не ассоциативная алгебра без делителей нуля. ' Далее приводятся некоторые фрагменты из [3].
114 Глава 8. Алгебраические структуры имеет вид Ж1,2,3 =й+^чИ-1-\/М- при определенном согласовании возможных комбинаций кубических корней. В случае <72 Р3 —+ — <0 2 27 все три корня уравнения (8.1) обязательно вещественны, но рецепт их получения связан с использованием мнимых величин 2 27 • Остаток от деления многочлена Рп(х) на х2 + рх + д может быть найден следующим образом. Если х2 + рх + д = (х - а)(х - Ь), то Рп(х) = (х- а)(х - Ь)Яп.2{х) + 1Х + 6. (8.2) Подставляя в (8.2) х = а, потом х = Ь, получаем систему уравнений (Рп(а) = >уа + 6, \рп(Ь) = 7Ъ + д для определения 7 и д. Интересно, что при отсутствии у полинома х + рх + д действительных корней решение задачи вынужденно пролегает через использование комплексных чисел Рп{а), Рп(Ь). • Еще один пример. Числовая последовательность ап 1, 1, 0, -2, -4, -4, 0, 8, 16, 16, 0, -32, ... устроена по правилу ап+2 = 2ап+1 - 2ап, а0 = ах = 1. (8.3) Подстановка ап = хп в (8.3) приводит к квадратному уравнению х2 - 2х + 2 = О, которое имеет комплексные корни Х\ = 1 + г, х2 = 1 — г. Общим решением (8.3) является ап = С\х" + с2ж". Константы си с2 определяются из начальных условий (а0 = а.\ = 1). В результате (1+г)» + (1-г)п а„ = ,
8.1. Куда ведет абстрагирование 115 или, с учетом обычных тригонометрических ухищрений, ап = (ч/2)псоз^. (8.4) Ни условие, ни ответ (8.4) не содержат и намека на комплексные числа. Другое дело, промежуточные вычисления, где мелькает мнимая единица г. Что это — фокус, фикция? Игрушечная модель, без которой можно обойтись, или существенный атрибут исходной задачи? Первое, что приходит в голову, — это фикция. Вспомогательный прием. И нет, мол, никакого особого смысла выяснять, существуют ли комплексные числа на самом деле. Они существуют как мысленный инструмент. Вот, дескать, и вся правда. Однако не вся. Тут дело не только в удобствах, которые дают комплексные числа. Здесь затрагивается какой-то глубинный механизм — поначалу неясно какой. Добавление к гармоническому колебанию 17(1) = 11 со* ш1 фиктивной мнимой части, \](I) = II(со$ ш1 + г 8шо;<), странным образом резко упрощает теорию колебаний. Как бы обнаруживается счастливое стечение обстоятельств. Законы электродинамики и правила умножения комплексных чисел проявляют неожиданную согласованность. Или кто скажет, почему ряд 1 =1_ж2+ж4_ 1+ж2 сходится только при х\ < 1 ? Никаких особых точек нет, знаменатель в нуль не обращается — на действительной оси. Особая точка есть, правда, в комплексной плоскости, х = г (\х\ = 1). Но с какой стати точка х = г управляет сходимостью ряда от действительной переменной? И выходит, что мнимая единица, как тень, все время присутствует за кадром. Надзирает и определяет, хотя явно не вмешивается. Мистика?
116 Глава 8. Алгебраические структуры Ответ — и прост, и сложен. Прост — потому что легко формулируется и часто повторяется. Сложен — потому что слишком прост. Чтобы уяснить наличие общности в ситуациях «три пальца» и «три дня», человечеству потребовалось очень много времени. Здесь тоже необходимо время, хотя, если разобраться, непонятно — на что. Все начинается с натурального ряда и введения двух операций: сложения и умножения. Из посаженного семени остальное вырастает само. Сначала естественным образом появляются обратные операции, вычитание и деление, влекущие за собой необходимость введения ряда ..., -2, -1, 0, 1, 2, ..., потом дробей. Расширение исходного объекта манипуляций происходит сравнительно безболезненно, потому что в окружающем мире есть в избытке готовые интерпретации. А это культивирует не тот источник абстрагирования. Потребность в отрицательных числах имеет гораздо более весомую причину, чем запись долга со знаком минус. Дело в том, что манипулирование числами на определенной стадии выводит на следующий уровень абстракции. Для однотипных действий начинает использоваться символьная запись \ Введение буквенных обозначений переводит арифметику на другие рельсы. Формулы типа (а-Ъ)(а + Ъ) = а2-Ъ2 фокусируют внимание на операциях. Объекты, т. е. пока числа, остаются за бортом, за кадром. Выводятся из поля зрения. Первостепенными становятся действия, а не объекты их приложения К Тем не менее множество потенциально возможных объектов должно быть не пусто, чтобы рассматриваемые операции имели смысл. Отрицательные и дробные числа нужны для того, чтобы уравнения х + а = Ь, ах — Ъ всегда решались. Вот, собственно, главная причина. Аналогичная ситуация возникает в связи с извлечением корней, что однозначно приводит к появлению комплексных чисел. При поверхностном Это колоссальный скачок в мышлении. На него ушли века. Как бы начинают изучаться глаголы в отрыве от существительных.
8.1. Куда ведет абстрагирование 117 взгляде может показаться, что на этом пути появляются только мнимые числа, но это не так. Начатое дело приходится доводить до конца: у/^Л = ±*, но возникающие объекты должны умножаться и складываться, что легализует числа вида а + Ы. Итак, никакого секрета, никакой мистики. Комплексные числа — такая же реальность, или такая же фикция, — кому как больше нравится, как отрицательные или дробные числа. Некоторый дискомфорт имеется лишь по причине укоренившейся привычки искать в окружающем мире прообразы типа шкалы термометра, где отрицательные числа находят свое воплощение. Разумеется, необходимо ответить, почему комплексные числа «неожиданно» всплывают в самых разных областях. Да потому, что вся математика стоит на использовании сложения и умножения, для которых комплексная плоскость — неизбежный финал расширения натурального ряда. Поэтому игровое поле и для бесконечных рядов, и для дифуров, и для теории вероятностей — одно и то же. Отмеченная выше человеческая потребность в реальных прообразах абстрактных понятий — и плоха, и хороша одновременно. С одной стороны, она мешает видеть ясную логическую картину, с другой — активизирует поиск наглядных инструментов и конструкций. С одной стороны, комплексные числа — это элементы вида г = х + гу, (8.5) удовлетворяющие условию г = — 1, обычным правилам сложения, умножения, — и этим все сказано. С другой стороны, разочарованное подсознание ищет наглядности — и возникают попытки эквивалентных представлений, что приносит свои плоды типа ег1р = сов (р + г 8И1 (р. Итак, постепенное расширение натурального ряда последовательно приводит к появлению отрицательных, рациональных, действительных ', наконец, комплексных чисел. Процесс идет под 5' С действительными — есть крупная натяжка. Там, вообще говоря, внедряется как бы посторонняя идея непрерывности (неалгебраический вирус). В результате задним числом возникают все эти дополнительные разговоры об алгебраических и трансцендентных числах.
118 Глава 8. Алгебраические структуры контролем идеологии выполнимости алгебраических операций и однозначно заканчивается на комплексных числах — дальше пути нет. При увеличении размерности чисел теряются те или иные свойства: при переходе от действительных чисел (п — 1) к комплексным (п — 2) пропадает упорядоченность, следующий шаг к кватернионам (п = 22) связан с потерей коммутативности умножения, наконец, при переходе к числам Кэли (п — 23) теряется ассоциативность умножения. Закономерно возникает вопрос. А что если начинать не с натурального ряда, а с чего-то другого? При этом, правда, становится неясно, что такое сложение и умножение. Но пусть это будут какие-то операции, удовлетворяющие тем же свойствам типа а(Ъ + с) = аЪ + ас. И даже свойства пусть будут другие, и даже операция всего одна... или, наоборот, три... Так происходит прорыв в другую нишу — рождается абстрактная алгебра. 8.2. Кольца, тела, поля 8.2.1. Кольцом называется множество X с двумя бинарными операциями, сложения + и умножения •, при условии: • X — коммутативная группа по сложению (аддитивная группа кольца). • Умножение ассоциативно. • Выполняется дистрибутивный закон, Р-(Я + Г) = р-Я + р- г, (Я + г) • р = д • р + г • р, определяющий взаимодействие сложения и умножения. Ряд свойств типа Р-(я-г)=Рш9-Р-г> р.0 = 0-р = 0,
8.2. Кольца, тела, поля 119 попадают в разряд следствий перечисленного. Элемент д - г определяется как решение уравнения г + х = д. В случае коммутативности умножения кольцо называют коммутативным, а если в X есть единица по умножению, говорят о кольце с единицей К Иногда требование ассоциативности умножения опускают в определении, и тогда возникает еще понятие ассоциативного кольца. Примерами колец в первую очередь служат различные числовые системы: действительная прямая К, комплексная плоскость С, множество <0) рациональных чисел, множество Ъ целых чисел (включая отрицательные). Менее привычные примеры: множество квадратных матриц и множество многочленов с обычными операциями сложения и умножения. • Кольцо многочленов К[х] подразумевает в качестве элементов формальные выражения Рп(х) = р0хп + ... +рп-\х + рп с коэффициентами рк из некоторого кольца К (при этом говорят о кольце многочленов над К). Природа элементов х несущественна. Операции определяются по обычным правилам сложения и умножения многочленов, что порождает коммутативное кольцо с единицей. • Кольцо квадратных матриц также можно рассматривать над некоторым кольцом К, подразумевая, что элементы матриц берутся из К. Сложение и умножение матриц при этом происходит по обычным матричным формулам с интерпретацией операций в К. • Числа вида а + Ьу/2 с рациональными (в другом варианте — с целыми) а и Ь образуют кольцо. Но а + Ъ у/1 с рациональными а и Ь кольца не образуют. Кольцо образуют числа вида а + Ьу/2 + су/4, а,Ь,се<Э. (?) Интересный пример кольца дает К с обычным сложением векторов и векторным умножением х х у в качестве второй операции. В этом кольце, как известно [4, т. 1, т. 3], х х х = О, Ъ — кольцо с единицей, а все четные числа — кольцо без единицы.
120 Глава 8. Алгебраические структуры и выполняется тождество Якобы (а > О1 а) х Ъ + (Ъ х с) х а = 0. Всякое кольцо, в котором х = 0 и справедливо тождество Якобы по умножению, называется лыевым кольцом {кольцом Лы). Если в произвольном кольце, «не трогая» сложение, заменить умножение операцыей коммутырованыя а*Ъ = а-Ъ — Ъ - а, получается лыево кольцо. (?) Определение кольца не исключает ситуаций а • Ь — 0 при ненулевых а, Ь. Такие элементы кольца называются делителями нуля (левыми, правыми). Кольца (а также области кольца) без делителей нуля (при условии 1^0) называются целостными. По двум кольцам X, У можно строить их прямую сумму X ф У, состоящую из всевозможных пар (ж,у), х € X, у € У. Сложение и умножение в X ФУ определяется «покоординатно». В прямой сумме всегда есть делители нуля: (ж,0) о (0,г/) = (х -0,0*у) = (0,0). Ненулевое кольцо (не состоящее только из нуля) не может быть группой по умножению из-за р • 0 = 0 ■ р = 0. Однако ненулевые элементы кольца могут составлять группу по умноженыю (мультыплыкатывную группу). В этом случае кольцо называется телом. Тело с коммутатывным умноженыем называется полем К Поле вместе с любыми двумя элементами а, Ь содержит также аЪ, а + Ъ, а — Ъ и а/Ъ (при условии 6^0)8). Что такое подкольца и подполя, объяснять, видимо, не надо. Структура поля гарантырует разрешымость лынейных уравненый, что обычно требуется в приложениях ы выделяет поля в особо благо- прыятные объекты ызученыя. ' В любом поле имеется единица по умножению. (?) Эквивалентное определение: полем называется ненулевое коммутативное кольцо, в котором разрешимо любое уравнение ах = Ь при а ф 0. ' Элемент х = а/Ь определяется как решение уравнения Ьх =а.
8.3. Идеалы 121 8.3. Идеалы Подмножество 1СХ называется идеалом кольца X, если оно является подгруппой аддитивной группы кольца9' и а € /, х € X влечет за собой ах € / и ха € I. • Вообще говоря, рассматривают также левые (а € I, х € X => ах € I) и правые (а € I, х € X =*> ха € I) идеалы, называя идеалы в данном выше определении — двусторонними. • Подмножество кЪ = {кг : г (Е Ъ) всех целых чисел, кратных некоторому к, — идеал в Ъ. (?) Аналогичный трюк работает и в других обстоятельствах. Например, к(х)Р[х] = {к(х)р(х) : р(х) е Р[х]}, где Р[х] кольцо полиномов, а к(х) фиксированный полином, — идеал в Р[х]. • Ненулевое коммутативное кольцо К является полем в томм случае, когда в К нет других идеалов, кроме {0} и самого К. (?) Роль идеалов в теории колец аналогична роли нормальных подгрупп в теории групп. Аналогия сохраняется и по другим направлениям. Во избежание недоразумений дадим все же несколько определений. Два кольца Н и (} называются изоморфными, если между их элементами можно установить взаимно однозначное соответствие (р : # -» ф, такое что (1) ф + у) = ф)+<р(у), (И) ср(ху) = (р(х)(р(у) для любых х,у € Я. Изоморфные кольца эквивалентны (Я ~ (}) с точки зрения их алгебраических свойств. Если в определении изоморфизма отображение (р : Я -> ф не обязательно взаимно однозначно, говорят о гомоморфном отображении кольца Я в (}, а (р называют гомоморфизмом. Если речь идет о кольцах с единицей, то в дополнение к (1), (И) предполагается: Для чего достаточно: а,Ь € I => а - Ь Е / (п. 2.1.3).
122 Глава 8. Алгебраические структуры (р(1) = 1. Свойства <р(-х) = -<р(х), (р(0) = 0 оказываются следствиями определения. Сюръективный гомоморфизм (р : К —> (}, отображающий К на (}, называется эпиморфизмом. Совокупность всех элементов из Е, переходящих в нуль кольца ф, называется ядром гомоморфизма (р : К -> (} и обозначается как кегу>. Ядро кегу> С Е гомоморфизма колец, (р : К -> (}, обязательно является идеалом кольца Е. • Гомоморфизм одного поля в другое является или изоморфизмом, или переводит все элементы одного поля в нуль — другого. (?) Фактор-кольцом кольца Е по идеалу / называется множество Е/1 = {г + 1:геН} смежных классов по I. Сложение в К/1 определяется как в факторгруппе, а умножение — по правилу: (г + 1)(з + 1) = гз + 1 (г,зе Я). Смежные классы г + 1 при этом называют классами вычетов по модулю идеала, или короче — классами вычетов по I. • Принадлежность ж, у одному и тому же классу г + 7 записывается как х — у (тос1 /), что равносильно х-у — I. • Если х = у (тос11) и и = V (тос1 /), то и хи — уу (той /), х + и — у + V (тос! 7), т. е. сравнения по модулю можно складывать и умножать. • Фактор-кольцо является кольцом, но лишь в случае, когда идеал двусторонний 10). Аналогично тому как фактор-группа есть группа лишь по нормальной подгруппе. • Теорема о гомеоморфизме колец. Фактор-кольцо К/кегр по модулю ядра гомеоморфизма у : К -» (? изоморфно образу (р(К). 1 ' Что в данном выше определении идеала подразумевается автоматически.
8.3. Идеалы 123 8.3.1. Теорема К Фактор-кольцо К/1 коммутативного кольца с единицей является полем в томм случае, когда I — максимальный идеал К Аналогия с теоретико-групповым сценарием простирается далее. Нуль и само кольцо Я являются идеалами (тривиальными). Кольцо без нетривиальных идеалов называется простым К Наименьший (по включению) идеал, содержащий множество М С Я, считается порожденным множеством М. Идеал 1(а), порожденный одним элементом а, называется главным. В коммутативном кольце с единицей 1{а) = {га:г е Я}. Если все идеалы в Я главные, — Я называется кольцом главных идеалов, каковым является кольцо Ъ, а также кольцо всех многочленов от одного переменного с коэффициентами из любого данного поля. Примеры идеалов: кЪ = {кг\г€Ъ), числа кратные к\ и к(х)Р[х] = {к(х)р(х) :р(х) 6 Р[х]}, полиномы кратные полиному к(х), — создают впечатление, что идеалы «паразитируют» на кратности, не привнося ничего нового. Это не так. Пусть К[ж] обозначает кольцо полиномов от п переменных, т.е. Ш[х] = Ш[хи...,хп], и к\(х),к2(х) два фиксированных полинома из М[ж]. Тогда совокупность полиномов кх(х)р{(х) + к2(х)р2(х), Ур1(х),р2(х) € К[ж], (8.6) п* Результат фактически обоснован при доказательстве теоремы 9.4.1. ' Идеал / в кольце К считается максимальным, если не существует идеала /', такого что / С /' С К (I Ф /', К). ' Любое поле — простое кольцо. Простое коммутативное кольцо с единицей — поле. < аК = К для любого ненулевого а € К, поскольку кольцо простое. Но тогда найдется такое Ъ, что аЬ = 1, т. е. Ь = а~х. ►
124 Глава 8. Алгебраические структуры является идеалом вК[ж] — далеко не надуманного характера. Полиномы (8.6) обращаются в нуль на пересечении поверхностей ку(хи ..., хп) = О, к2(хи ..., хп) = О, содействуя тем самым изучению (п — 1)-мерных алгебраических многообразий. «Механизм кратности» здесь не работает. Варианты с выбором большего числа фиксированных полиномов — очевидны. 8.4. Евклидовы кольца Структура кольца высвечивает в изучаемых объектах лишь определенные ракурсы. Поэтому ассоциации и аналогии бывают обманчивы. Скажем, основная теорема арифметики о единственности разложения на простые множители за пределами натурального ряда часто неверна — кольцевой аксиоматики оказывается недостаточно. Кольцо кольцу, так сказать, рознь. Одна из продуктивных идей дополнительной типизации — введение своеобразной нормы. 8.4.1. Определение. Кольцо Я без делителей нуля называется евклидовым, если: (О для ненулевых а € Я определена целочисленная норма N(0,) > О, N(0) = О, причем ЛГ(аЬ)^тах{ЛГ(а),ЛГ(Ь)}; (И) для любых а, Ъ ф О существует представление а — ф-\-г,в котором либо г = О, либо N(^) < М(Ъ). В кольце целых чисел Ъ нормой может служить N(2) = \г\. В кольце Р[х] в качестве нормы годится степень многочлена. Любое евклидово кольцо имеет единицу и является кольцом главных идеалов. (?) Все это затевается в основном для теории делимости. В кольце главных идеалов наибольший общий делитель й = (/, д) элементов /,д & Я выражается в виде линейной комбинации В частности, элементы /,# € Я взаимно просты в томм случае, когда можно подобрать такие и, V € Я, что и/ + уд = 1.
8.5. Поля вычетов 125 Обоснование дано в разделе 9.2 на примере многочленов. Схема рассуждений в общем случае не меняется — главным инструментом остается алгоритм деления Евклида. • Любой элемент евклидова кольца единственным образом раскладывается в произведение простых сомножителей. (?) 8.5. Поля вычетов Основные примеры полей: поле действительных чисел К, рациональных <0) и комплексных С. Полем являются дробно-рациональ- ные функции ——, где р(х) и ^(x) ф О — полиномы с действиях) тельными коэффициентами. Полями являются также различные фактор-кольца (теорема 8.3), составляющие особую статью (полей вычетов). Если в аддитивной группе вычетов по модулю р (число р простое14') помимо сложения ввести еще и умножение, полагая а-Ъ равным остатку от деления обычного произведения а и Ъ на р, — то классы вычетов по модулю р образуют поле \ тогда как кольцо Ъ поля не образует. Расширенная до поля Ъ (той р) группа Ъ^ является, по сути, фактор-кольцом Ъ/рЪ. В рассмотренном случае принципиальную роль играет характеристика поля Р, каковой называется минимальное р в равенстве 1 + ... + 1 = 0, (8.7) 4 V ' рраз где 1 — единица поля Р. Если (8.7) невозможно, Р называют полем характеристики нуль К 14' В случае составного р класс вычетов по модулю р будет кольцом (имеющим делители нуля, 3-2 = 0 в 2б), но не полем. 1 * Доказательство не так уж просто — см. раздел 2.1. В качестве упражнения: уравнение ^^x = \ (тойр) разрешимо в Ъ, если р простое и д не делится на р. (?) 1 ' Иными словами, характеристика поля совпадает с порядком единицы аддитивной группы поля, если порядок конечен, и считается равной нулю, если порядок бесконечен.
126 Глава 8. Алгебраические структуры • Конечное поле классов вычетов по модулю р имеет характеристику р. • Ненулевая характеристика р всегда является простым числом. < В противном случае р = з -I, з < р, I < р, —в силу р• 1 = 0 было бы либо 5-1=0, либо I • 1 = 0, что противоречило бы минимальности р. ► • Если поле Р имеет характеристику р, то р • х = 0 для любого ж € Р. • Числовые поля К, <0>, С имеют характеристику нуль. Поля вычетов могут быть в той или иной степени непохожи на Ъ (тойр). Допустим, р(х) — простой элемент (аналог простого числа — неприводимый полином) в кольце полиномов Р[х]. Если /(ж) 6 Р[х] не делится на р(х), то в Р[х] существует полином /_1(ж), такой что1 ' Пх)Г\^) = Н^ойр(х)), т.е. /(ж)/_1(ж) - 1 делится на р(х). Поэтому отождествление элементов /(ж), д(х) € Р[х], разность которых делится на р(х), превращает кольцо Р[х] в поле вычетов Р[х] (тойр(х)). В частности, М[ж] (тоёж2 + 1) — есть С с точностью до изоморфизма. 8.6. Алгебры Алгеброй А над Р называют кольцо, в котором дополнительно определено умножение на «числа»18^ из некоторого поля Р, причем Х(аЪ) = (Ха)Ъ = а(АЬ), а, Ъ е А, А Е Р, и аддитивная группа кольца является векторным пространством, т.е. а, Ъ € А, А, \1 € Р =» Ха + цЪ 6 А. Размерность упомянутого «векторного пространства» называют рангом алгебры А. Алгебры конечного ранга именуют также гиперкомплексными системами. Если алгебра является лиевым кольцом, то она называется алгеброй Ли. ' Это теорема Евклида. ' «Числа» — элементы поля Р, не обязательно числового.
8.6. Алгебры 127 Идеал кольца / считается также идеалом алгебры, но при условии, что он выдерживает умножение на элементы поля Р. Если в фактор-кольце А/1 ввести умножение на элементы А € Р по правилу А (ж + I) = Хх + I, получается алгебра над Р, называемая фактор-алгеброй А по идеалу /. В определение гомоморфизма алгебр (р : А —> В помимо обычных требований для гомеоморфизма колец входит условие ср(Хх) = Х(р(х), А е Р. Примеры алгебр более-менее очевидны. Всякое поле является алгеброй ранга 1 над самим собой 19\ Алгебрами являются К3 с обычным сложением векторов, векторным умножением х х у и обычным умножением вектора на число; множество квадратных матриц с элементами из С, обычными операциями сложения и умножения матриц и умножением матрицы на комплексное число. Особого упоминания заслуживает алгебра кватернионов — четырехмерных объектов вида 2 = а + г/3 + ^^ + кд, где а, /3,^,6 — действительные числа, а 1, г, ], к — четыре базисные единицы, удовлетворяющие соотношениям г2 = ^2 = к2 = г^к = -\, откуда (с учетом того, что 1 — обычная единица) следует г] = -]% = к, ]к = -к] = г, кг = -]к = ]9 что в совокупности дает таблицу умножения базисных элементов, и совпадает с правилами векторного умножения единичных ортов {г,],к] в М . Сложение и умножение на число определяется обычным (для векторных пространств) образом. Кватернионы вида х • 1 + у • г образуют подалгебру, изоморфную алгебре комплексных чисел над полем — действительных. Группа кватернионного базиса д = {±[,±г,±1,±к}, ' Рангом алгебры называется размерность векторного пространства, которое служит аддитивной группой алгебры.
128 Глава 8. Алгебраические структуры состоящая из 8 элементов и имеющая 6 подгрупп, служит стандартным примером гамилыпоновой группы20'. Единицы 1, г,,/, к могут быть «изоморфно» представлены матрицами: "10 0 0' 0 10 0 0 0 10 .0 0 0 У 0 1 0 0 1 0 0 0 0 0 0 1 01 0 -1 о] > 0 0 10' 0 0 0 1 1 0 0 0 10-100. 0 0 0 1' 0 0-10 0 1 0 0 |_-1 0 0 0. Кватернионы представляют интерес в связи с теоремой Фро- бениуса (п. 8.0.1). Естественный вопрос о существовании над М алгебры ранга больше 2 имеет дихотомический ответ: если коммутативную, то — нет, если некоммутативную, то — да (и вариант всего один — алгебра кватернионов). 8.7. Булевы структуры Булева алгебра известна в широких кругах как вторичная дисциплина по отношению к математической логике [4, т. 6]. Реальное положение дел несколько иное. Булевой структурой обычно называют множество В с двумя операциями: «сложения +» и «умножения х» 1\ удовлетворяющие следующим требованиям: • Обе операции коммутативны и ассоциативны. • Операции дистрибутивны одна относительно другой, т. е. помимо обычного (для кольца) (х + у)хг = ххг + ухг, справедливо (хху) + г = (х + г)х(у + г). • В В существуют элементы 0 и 1: х + 0 = х, х х 1 = х. • Любому элементу х € В отвечает такой элемент х € В, что: X + Х = 0, 1X1=1, ' Группа называется гамилыпоновой, если все ее подгруппы нормальны. ' Которое, как обычно, обозначается также точкой •, либо «никак».
8.7. Булевы структуры 129 иначе говоря, обратным элементу ж, как по сложению, так и по умножению, оказывается один и тот же элемент х. Операцию «~~», как правило, называют отрицанием, либо дополнением. Операции «сложения» и «умножения», как легко заметить, равноправны с точки зрения аксиоматических требований. По этой причине в булевых структурах действует принцип двойственности: всякая булева теорема при замене + <-► х, 0^1 переходит в двойственную теорему. Рассматриваемой области присущ определенный люфт, в пределах которого встречаются различные вариации определений, с добавлением некоторых малосущественных свойств. Помимо этого, значительным вариациям подвержена сама форма определений, в результате чего булевы алгебры у разных авторов бывают совсем не похожи друг на друга. Одна из широко известных модельных реализаций булевой алгебры — матлогика на игровом поле {истина, ложь} с дизъюнкцией и конъюнкцией в качестве «сложения» и «умножения». Другая модель, имеющая универсальный характер, множество В и некоторая система его подмножеств дв с обычными операциями объединения, пересечения и дополнения, х + у <$ хиу, ху <$ хГ)у, х & Е\х. Если 0В состоит всего из двух подмножеств, ИЗ = {0, /?}, возникает ситуация, изоморфная матлогике. Реализация булевой алгебры как системы подмножеств некоторого множества и универсализм такой модели настраивают на заключении, что этим все сказано. Но это далеко не так. Модели иной природы (хотя и изоморфные теоретико-множественной интерпретации) обнаруживают в тех же структурах совершенно другие аспекты. Например, булева структура возникает при введении операций N х + у = НОК{ж, у}, х-у = НОД{ж, у}, х = — X
130 Глава 8. Алгебраические структуры на множестве делителей некоторого числа ЛГ, которое представляет собой произведение простых чисел в первой степени. Такая алгебра играет определенную роль в теории чисел. Близкая к булевым структурам система возникает при введении на отрезке [0, 1] операций: х + у = тах{ж, у}, х • у = тт{ж, у}, х = 1 - ж. Выполняются все аксиомы кроме последней. Модели подключают к анализу факты, добытые в других областях, и обогащают друг друга, расширяя заодно представления о гибкости и вместимости абстрактной схемы.
Глава 9 Многочлены Многочлены далее — не самоцель, хотя объект, безусловно, поучительный. Особенно — в тандеме с алгебраическими числами, и вообще — полями. При этом возникают удобные поводы обсудить некоторые аспекты алгебраического стиля мышления, и заодно — разгрузить теорию Галуа от технических подробностей, которые иногда представляют самостоятельный интерес. 9.1. Напоминания Многочленом, или полиномом, над полем К называется формальное выражение 1п{х) = а0хп + а{хп~{ + ... + ап-{х + ап, (9.1) где ао,..., ап € К. Далее, как правило, имеются в виду числовые поля. Сумма и произведение многочленов определяются по обычным правилам сложения и умножения (с приведением подобных), что порождает кольцо ' многочленов К[х]. Природа «переменной» х несущественна, но в принципе х может принадлежать тому же или другому полю, либо оставаться просто символом. Последний вариант дает наиболее общую точку зрения. На обозначении К[х] имеет смысл задержать внимание: К[ж] — кольцо многочленов всех степеней с действительными коэффициентами, (ф[ж] — с рациональными, Ъ\х\ — с целыми коэффициентами. Деление «в столбик», х3 - Зх2 4- 5х + 6 \х- 1 ж3 -ж2 х2 - 2х + 3 -2х2 + 5х -2х2 + 2х Зж + 6 Зж-3 9 Но не поле.
132 Глава 9. Многочлены приводит к тождеству ж3 - Зж2 + 5х + 6 = (х - 1)(ж2 - 2х + 3) + 9. Легко видеть, что в общем случае деление многочлена (9.1) на (х-с) даст в частном некоторый многочлен Нп-\(х) и некоторое число г в остатке, т. е. Д(ж) \х-с _!_ Лп-1(я) г, что равносильно тождеству полагая в котором х = с, получаем теорему Безу: остаток г при делении /п(х) на (х — с) равен /п(с), т. е. г = /„(с). Таким образом, если х = с — корень уравнения /п(х) = 0, то г = 0. В конечном итоге это соображение приводит к разложению /п(ж) = а0(х - хх)(х - х2)... (х - жп), (9.2) где XI,..., хп — корни многочлена /п(ж), которые по основной теореме алгебры всегда существуют в комплексной плоскости, — если /и(ж) рассматривается как многочлен над С. В общем случае проблема разрешимости уравнения /п(х) = 0 может иметь другие толкования, см. далее. При условии ао = 1 раскрытие скобок и приведение подобных в (9.2) с последующим сопоставлением результата с (9.1) дает теорему Виета: Х\ + ... + хп = -аь Х[Х2 + хххз + ... + хп-{хп = а2, /0 ,ч х{...хп = (-1)пап.
9.2. Алгоритм Евклида и делимость 133 • Деление многочлена «в столбик» приемлемо для компьютера в виде схемы Горнера на основе представления /п(с) = (... ((с + ах)с + а2)с 4- а3)с + ... + ап-Х)с + ап, которое приводит к возможности последовательного выполнения однотипных действий: Ь*+1 = ак+1 + Ькс вплоть до Ьп = ап + Ь«-1С = /п(с), где Ьп — остаток от деления /п(х) на ж - с, а ЬЬ...,ЬП_1 — коэффициенты частного Нп-\(х). • Полином хт - 1 делится на хп - I лишь в том случае, когда т делится на п. Действительно, пусть т = пЛ +р, тогда жт - 1 „ (жп)* - 1 хР-\ — хр -— 1 хп - 1 хп - 1 жп - 1' Далее надо учесть, что ук - 1 всегда делится на у - 1, «Ц1 = 1+у + ... + »*-'. 2/- 1 9.2. Алгоритм Евклида и делимость Если многочлены /(ж), <р(ж), ^(ж) связаны соотношением /(ж) - р(а#(ж), то (р(х) и ^>(ж) считаются делителями /(ж). Наибольшим общим делителем (НОД) многочленов /(ж) и #(ж) называется такой их общий делитель й(ж) = (/(ж), #(ж)), который делится на все другие общие делители многочленов /(ж) и #(ж). В обозначении многочленов зависимость от аргумента удобнее опускать. В этом случае, например, й(х) — (/(х),д(х)) приобретает вид 6, = (/,д), что не так загромождает обзор. При договоренности о равенстве единице «старших» коэффициентов рассматриваемых многочленов — НОД, с точностью до ±, определяется однозначно. В случае д, = (/, #) = 1 многочлены /(ж) и д(х) называют взаимно простыми.
134 Глава 9. Многочлены Если имеются разложения /(ж) и д(х) вида (9.2), то (/, д) указывается элементарно, но для этого надо знать все корни многочленов /ид. Универсальный рецепт дает алгоритм Евклида, который заключается в следующем. Сначала /(ж) делится на д(х): I = 9Ч\ +г2, — после чего д(х) делится на Г2(х): 9 = Г2Я2+Гз. Далее остаток г2(х) делится на гз(ж), — и так до остановки итерационного процесса, которая неизбежна, ибо степень остатка на каждом шаге строго уменьшается. В обозримом виде это можно записать так: I = 9Ч\ +^2, 9 = г2Яг + г3, г2 = г3д3 + г4, (94) Гп-2 = Гп-1дп-\ +ГП, Последняя строчка означает гп+1 = 0. Просматривая теперь запись (9.4) сверху вниз, обнаруживаем: общие делители /(ж) и д(х) совпадают с общими делителями д(х) и г2(ж), которые, в свою очередь, совпадают с общими делителями г2(ж) и г3(ж), и т.д. В итоге: (/> 9) = (9> Ъ) = {гъ г3) = ... = (г„_,, г„) = г„, т.е. гп оказывается искомым НОД многочленов /(ж) и д(х). Держа описанную схему в поле зрения, легко понять, что ик9н) = и,д)к а также где з(х) — любой общий делитель /(ж) и д(х). В частности,
9.2. Алгоритм Евклида и делимость 135 9.2.1. Теорема. Всегда можно указать такие многочлены и(х),у(х), что ' $(х)и(х) +д(х)у(х) = й(х), где й = (/,#). «* Обоснование легко извлекается из схемы (9.4), просматривая которую (снизу вверх), получаем следующее. Поскольку гп = й(х), то полагая щ(х) = 1, У\(х) = -^п-\(x), — из предпоследнего равенства (9.4) имеем й = гп-гщ + гп-Хух. Полагая далее щ(х) = ух(х), у2(х) = щ(х) - у^х^п-^х), получаем а = гп.3и2 + гп-2У2. Продолжая подниматься вдоль (9.4), в итоге приходим к (9.5). ► (!) При этом можно считать, что степени многочленов и(х), у(х) строго меньше — соответственно — степеней д(х) и /(ж), разумеется в предположении, что степени многочленов }{х) и д(х) ненулевые. Из теоремы 9.2.1, в частности, следует: многочлены /(ж) и д(х) взаимно просты в томм случае, когда можно подобрать такие многочлены и{х) и у(х), что }{х)и{х) +д(х)у(х) = 1. (9.6) • Фактически указать полиномы и(х) и у(х), удовлетворяющие (9.6), можно с помощью метода неопределенных коэффициентов \ Если речь идет об указании и(х) и у(х), удовлетворяющих (9.5), то после деления /(ж) и д(х) на НОД й(х) (определяемый алгоритмом Евклида) задача сводится к ситуации (9.6). • Свойство (9.6) довольно широко используется в различных теоретических и прикладных конструкциях. Вот, например, универсальный механизм избавления Н(а) от иррациональности в знаменателе дроби . . , где а — корень некоторого ' Обычная трактовка (9.5): НОД & = (/,д) «линейно» выражается через полиномы /(ж) и д(х). 'Коэффициенты и(х), ь(х) полагаются неизвестными, после чего коэффициенты полинома }(х)и(х) + д(х)ь(х) приравниваются коэффициентам полинома 1. (9.5)
136 Глава 9. Многочлены многочлена /(ж), причем все многочлены /(ж), Л(ж), д(х) имеют рациональные коэффициенты, а /(ж) и д(х) взаимно просты. Используя (9.6), получаем Н(а) Н(а)у(а) ,,,,, д(а) 1 - ПФ(<*) ' К ' поскольку /(а) = 0. • Теорема 9.2.1 фактически сохраняется и для целых чисел. НОД двух целых чисел т и п, не равных одновременно нулю, всегда может быть записан в виде НОД (т, п) = ти + ш/, и, и Е 2. В частности, тип взаимно просты в томм случае, когда существуют такие числа и, у (Е Ъ, что ти + пу = 1. 9.3. Приводимость многочленов Полином /п(ж) называется приводимым над полем К, если он раскладывается в произведение двух многочленов ненулевой степени. • Многочлен х2 + 1 приводим в (над) С, х2 + 1 = (х - г)(х + г), но неприводим в К. А полином х2 - 2 = (х - \/2)(х + >/2) приводим в К, но неприводим в (}. • Неприводимы в С только многочлены первой степени. Любой многочлен степени п > 2 приводим в К, поскольку в разложение (9.2) комплексные корни входят сопряженными парами , а (х — а) (х — а) — есть квадратный многочлен с действительными коэффициентами. Роль «простых чисел» в М[ж] играют, таким образом, многочлены первой и второй степени. • Приводимость многочлена, вообще говоря, не связана с существованием корней. Многочлен ж4 + 2х2 + 1 = (х2 + I)2 приводим в поле рациональных чисел, но не имеет в (} ни одного корня. Более удивителен пример х4 + 4 = (ж2 + 2х 4- 2){х2 -2х + 2), поскольку многочлен х4 4- 4 «выглядит» неприводимым. 4)/«(«) = 0 =>/„(а) = 0.
9.3. Приводимость многочленов 137 Многочлен /п(#) с рациональными коэффициентами неприводим над <0) в томм случае, когда над <0) неприводим многочлен с целыми коэффициентами, полученный умножением /п(ж) на НОК знаменателей всех его коэффициентов. 9.3.1. Многочлен /(ж) = а0хп + а{хп~{ + ... + ап_}ж + ап (9.7) с целыми коэффициентами неприводим над <0) в томм случае, когда он не раскладывается в произведение двух многочленов ненулевой степени с коэффициентами из Ъ. (?) Утверждение 9.3.1 без особого труда доказывается, и в принципе — сводит решение вопроса о приводимости/неприводимости к целочисленному перебору. На практике широко используются различные достаточные условия неприводимости. 9.3.2. Критерий Эйзенштейна. Многочлен (9.7), все коэффициенты которого — кроме ао — делятся на некоторое простое число р, но ап не делится на р , — неприводим над полем рациональных чисел. Известно множество других признаков неприводимости, но критерий 9.3.2 наиболее популярен, и его обычно «хватает», ибо потребность, как правило, заключается в указании примера неприводимого многочлена. • Критерию 9.3.2 удовлетворяет, например, многочлен Зж5 + 8ж4 - 4х2 + 6х - 2, для которого подходит число р = 2. • Многочлен /(х) = хр-1+хр-2 + ... + х+\, где р — простое число, неприводим над (ф. «* В предположении противного был бы приводим многочлен /(ж + 1) = тГх + С1рхр-2 + СУ'3 + ... +р, что невозможно по критерию Эйзенштейна. ► Многочлен с целыми коэффициентами называют примитивным, если НОД его коэффициентов равен 1. Любой многочлен
138 Глава 9. Многочлены с коэффициентами из <0) можно рассматривать как примитивный, умноженный на числовую дробь. Для этого коэффициенты надо привести к общему знаменателю, последний вынести за скобки, а также вынести за скобки НОД числителей. Это позволяет о неприводимых многочленах над <0) говорить как о примитивных (с точностью до умножения на рациональную константу), что удобно с точки зрения стандартизации. Произведение примитивных многочленов дает примитивный многочлен (лемма Гаусса). (?) Доказательство совсем просто, но изначально результат выглядит неожиданным. 9.4. Существование корней Проблема разрешимости уравнения /п(ж) = 0 обычно ассоциируется с основной теоремой алгебры о существовании корня у любого полинома /п(ж) в комплексной плоскости С. Однако интересно — и важно (!), если думать не только о синице в руках, — начать с общего результата сугубо алгебраического характера. 9.4.1. Теорема. По любому многочлену /(ж) над Р всегда можно указать расширение поля Р' Э Ру в котором /(ж) имеет корень. < Достаточно рассмотреть неприводимый многочлен /(ж) некоторой степени п > 1. В качестве Р' возьмем фактор-кольцо Р[ж]/7, где Р[х] кольцо полиномов над Р, а идеал I = /(ж)Р[ж] состоит из полиномов, делящихся на /(ж). Таким образом, элементами Р' являются классы вычетов по модулю идеала5'. Сумма и произведение в Р' определяются как остатки отделения на /(ж) обычной суммы и обычного произведения полиномов 6\ Необходимые свойства операций (ассоциативность, дистрибутивность) легко проверяются. Не совсем тривиально лишь существование в Р' обратного элемента по умножению. Поскольку теорема 8.3 была оставлена без доказательства, остановимся на соответствующем обосновании более подробно. Пусть степень д(х) меньше степени /(ж). Поскольку полином /(ж) неразложим, то НОД / и д равен единице. Но тогда по теореме 9.2.1 существуют такие полиномы и и V, что и(х)д(х) + у(х)1(х) = 1, ' Принадлежность д(х), Н(х) одному и тому же классу г(х) + 1 записывается как д(х) = Н(х) (тос!/), что равносильно д(х) - Н(х) = I, т.е. разность эквивалентных полиномов делится на /(ж). ' Представителей классов вычетов.
9.4. Существование корней 139 откуда и(х)д(х) - 1 делится на /(ж), — поэтому и(х) * д(х) = {', где звездочка означает умножение в Р\ следовательно и(х) = д~1(х). Таким образом, фактор-кольцо Р[х]/1 — есть поле, нулем которого служит сам идеал 7, являющийся корнем полинома / (поскольку / делится сам на себя без остатка)7). ► 9.4.2. Следствие. Для любого многочлена }{х) € Р[х] существует расширение Р1 Э Р, над которым /(ж) раскладывается на линейные множители вида (9.2). Уместно заметить, что для многочленов от нескольких переменных это не так. Существуют абсолютно неприводимые многочлены }(хх,..., жп), неприводимые при любом расширении поля [15]. Поначалу теорема 9.4.1 и ее доказательство выглядят бесполезным фокусом. Возникает впечатление, что корнем объявлено нечто взятое с потолка. Но это не так. Построено вполне определенное расширение Р1 Э Р исходного поля Див этом расширении указан корень полинома. Другое дело, если имеется желание «пощупать» Р\ но это уже вопрос изоморфизма полей с ориентацией на выбор удобных интерпретаций. Рассмотрим, для примера, расширение поля действительных чисел М присоединением к М корня уравнения х2 + 1 = 0. Начинать в самом деле можно «с потолка», объявив корнем некое г, — благо обозначение в нашей власти. Но далее мы оказываемся связанными «правилами игры». Расширение К'эК обязано быть полем, включая в себя элементы г = а + Ы, а,ЪеШ. (9.8) Запись (9.8) однозначна, иначе из г = а + Ы = с + сИ, Ъ Ф й, с- а следовало бы г = -—- € К. Требования из определения поля при- а — Ь водят затем к свойствам, которые принято характеризовать как 'В [15] доказательство расписано подробнее (на 5 страницах).
140 Глава 9. Многочлены правила обращения с комплексными числами. Следующий результат в данном контексте вполне очевиден. 9.4.3. Теорема. Все расширения поля действительных чисел К, полученные присоединением к К корня уравнения изоморфны между собой. Матрицы вида а Ь -Ь а х2 + 1 = 0, образуют поле, изоморфное полю комплексных чисел а + Ы. Сохранение операций и соответствия 1 о легко проверяются. 1 0 0 1 г <-> 0 1 1 0 Реконструируя историю, можно представить, что вместо г бы- 0 11 ла бы введена матрица -1 0 в качестве решения уравнения х + 1 = 0, и стали бы рассматривать «числа» . Возможно, а Ъ\ -Ъ а] для «аборигенов Сахалина» это было бы чересчур, но в целом — результат был бы иной. Мистических охов поубавилось бы. Дело в том, что использование матриц вместо чисел, как ни странно выглядит, имеет «материальную природу». Механизм оголен, все на виду, почвы для фантазии не остается. Когда же речь заходит о мнимой единице, появляется возможность домысливать, что уводит в потусторонних направлениях. 9.5. Производная многочлена Производной многочлена /(ж) = а0хп + а\хп { + ... + ап-хх + ап называется многочлен /'(х) = па0хп +(п-1)а1Хп +...+ ап_1. (9.9)
9.6. Дробно-рациональные функции 141 Если /(ж) — многочлен над К или С и переменная х принимает значения в том же поле, то (9.9) — есть не что иное как обычная производная функции /(ж). Но определение (9.9) успешно работает и в общем случае многочлена над произвольным полем. При этом сохраняются обычные свойства дифференцирования: (А/+ /*<?)' = А/'+ /*»', {19)'= Г 9 +19- Вплоть до разложения в ряд Тэйлора: № = Не) + *-^(х - с) + Ш(ж _ с)2 +... + 1_А1{Х _ с)«. (9ло) Из (9.10) сразу следует 9.5.1. Теорема. Многочлен / Е Р[х] над произвольным полем Р имеет кратный корень х = с в томм случае, когда /(с) = /'(с) = 0. Более точная и полезная формулировка такова: многочлен / 6 Р[х] над Р имеет кратный корень х = се8,где§ЭР — произвольное расширение поля Р, в томм случае, когда /(с) = /'(с) = 0. 9.6. Дробно-рациональные функции Да) Дробно-рациональной функцией называется выражение вида ——-, где /(ж) и д(х) ф 0 — многочлены над некоторым полем. Совокупность дробно-рациональных функций над любым полем — является по- лем. Отношение --—г- называют также просто рациональной дробью. 9(х) пх) Дробь ——- считается несократимой, если многочлены /(ж) и д(х) 9(х) взаимно просты; и — правильной, если степень числителя меньше степени знаменателя. Всякая рациональная дробь единственным образом представляется в виде суммы многочлена и правильной дроби.
142 Глава 9. Многочлены 1{х) Правильная дробь ——- называется простейшей, если д(х) яв- 9(*) ляется степенью неприводимого многочлена р(х), а степень /(ж) меньше степени р(х). 9.6.1. Теорема. Всякая правильная дробь единственным образом разлагается в сумму простейших. Рецепт соответствующего разложения состоит в следующем. Знаменатель д(х) разлагается в произведение неприводимых многочленов, д(х)=рЛ11(х)...р%(х), Да) после чего дробь представляется в виде суммы дробей 9(х) <& (а) '- , *=1,...,т, ; = !,...,$*, где д*(х) — многочлен степени, меньшей степени многочлена р;-(ж), взятый с неопределенными коэффициентами. Затем все дроби соответствующей суммы приводятся к общему знаменателю д(х), складываются, и получаемый в числителе многочлен приравнивается /(ж), что дает необходимые уравнения для определения неизвестных коэффициентов. Пример Нх) х2 + 2 В случае —г— = т полагаем 9(х) (х - I)3 Нх) а Ь с д(х) (х - I)3 (х - I)2 х - 1' Действуя по указанному рецепту, получаем х2 + 2 = а + Ь(х - 1) + с(х - I)2, что приводит к х2 + 2 3 2 1 + -, 7ТТ + (ж-1)3 (ж-1)3 (ж-1)2 ж-Г 9.7. Симметрические многочлены Многочленом /(#ь • • • > #п) от п неизвестных Х\,..., хп над полем Р называется сумма конечного числа произведений вида ж^...ж*п, где все й;-^ О,
9.7. Симметрические многочлены 143 с коэффициентами из Р. При обычном определении суммы и произведения многочленов — их совокупность превращается в коммутативное кольцо Р[х\9..., хп]. Рациональные дроби р(хи...,хп) -г- -г, ЛвбО[хь...,хпЬ Ц\Х\9 . . . , Хп) называют также рациональными функциями. Функция <р(х\,... 9 хп) — в частности многочлен — называется симметрической, если она не меняется при любой перестановке (ТЕ8„ неизвестных, <р(ха(1)9..., ха(п)) = (р(хи..., хп). (9.11) Эталонную роль играют элементарные симметрические многочлены: 3\=Х\+...+ХП9 32 = Х\Х2 + Х\Хъ + . . . + Хп-\ХП9 &п — Х\ . . . Хп. 9.7.1. Теорема К Всякий симметрический многочлен $(х\9... 9хп) над полем Р является многочленом над Р от элементарных симметрических многочленов, ЛХ19...9Хп) = (р(81,...98п). 9.7.2. Следствие. Всякий симметрический многочлен от корней уравнения хп + а{хп~] + ... + ап-хх + ап = О (9.12) есть многочлен от коэффициентов а\,..., ап. ' Это так называемая основная теорема о симметрических многочленах. Несложное доказательство имеет рутинный характер и может быть найдено практически в любом курсе общей алгебры.
144 Глава 9. Многочлены Симметрия многочлена может быть «частичной». Например, несимметрический многочлен под действием подстановок (жьж3) -> (ж3,Ж1), (ж2,ж4) -> (ж4,ж2) не меняется. А полином (я?1 ~х2)(хх -х3)(х2-х3) не меняется под действием любой четной подстановки. Многочлен (х\ + х2)2 + (х3 + х4)2 инвариантен к заменам индексов 1 «-)• 2, 3 «->• 4, а также к замене пар (1, 2) «->• (3,4). Но для рациональной функции (а?1 +ж2)2 (ж3 + ж4)2 замена пар (1, 2) «->• (3, 4) уже не годится. 9.8. Групповая инвариантность Если рациональная функция <р(х\9... ,хп) не меняется под действием перестановок индексов (переменных), то она не меняется и под действием композиции этих перестановок \ Поэтому совокупность всех подстановок (7 Е 5П, оставляющих функцию <р(х\,..., хп) инвариантной, всегда составляет группу, которую будем называть группой инерции функции (р и обозначать С^. 9.8.1. Теорема. Пусть С<р С Сф. Тогда д[<р(х1,...,хп)\ ' Потому что в данном случае при перестановках существенна не нумерация самих переменных, а нумерация мест, на которых они стоят.
9.8. Групповая инвариантность 145 где коэффициенты полиномов /, д являются симметрическими функциями от х\,..., хп. «* Разобьем группу Су на смежные классы по подгруппе С^: д\@<р, дгСу, ..., дрО<р, где для единообразия положено д\ = \. Под действием любой подстановки а (Е 0$ функция <р = <р{ не меняется. Под действием любой подстановки сг 6 д^С^ функция у преобразуется в у?;, причем все <р{,..., 1рр различны. Аналогично, подстановки а е д^С^ преобразуют гр в ^>, но некоторые из ^ь ..., грр могут совпадать. Рассматривая равенства ]Г^*^> = <*>*, * = 0,...,р- 1, как систему уравнений относительно г/)\ ф = 1>1 = ^1 1 РГ' ... ^" >^р> О70 <*>1 имеем 1 ^?2 .-. 1 Ъ Шр-1 $. & (9.14) Несложный анализ ' показывает, что (9.14) дает необходимое (9.13). ► Теорема 9.8.1 фактически принадлежит Лагранжу, который в знаменитом мемуаре «Рассуждения об алгебраическом решении уравнений» (1771) пришел к следующему выводу. Решение в радикалах удается получить в тех случаях, когда существуют некоторые функции (р(х\,..., хп) от корней Х\,..., хп, которые удовлетворяют уравнениям более низкой степени, решаемым в радикалах. В свою очередь, подобное свойство (р(х\,..., хп) оказывается связанным с инвариантностью функций (р к некоторым перестановкам корней. Тем самым Лагранж подошел к месту, где «горячо». Неразрешимость в радикалах уравнений 5-й степени была установлена Руффини (1799) и окончательно (аккуратно) Абелем (1826). Глубинный механизм был вскрыт Галуа (1811-1832). Вернемся, однако, к теореме 9.8.1, которая лежит не так уж глубоко, но в теоретико-групповой идеологии играет важную роль. Вот ее принципиальные следствия: См., например, [24].
146 Глава 9. Многочлены • В случае С^ = С<ф функции (р и 1р рационально выражаются друг через друга11'. • Если многочлен /(х\9... ,хп) при всевозможных подстановках переменных принимает два возможных значения, то 1 = в1+в2\[{хг-Хэ), где в\ и 02 — симметрические функции. 9.9. Как реагировать на ассоциации Помещение разнородных объектов под одну крышу будит ассоциации и порождает иллюзии. Принадлежность, скажем, кольцевой структуре не гарантирует алгебраической идентичности, но соблазн переноса свойств — возникает. Рассмотрим, для примера, следующий простой, но весьма продуктивный результат К 9.9.1. Теорема Мэйсона—Стотерса. Пусть многочлены /(ж), д(х), Н(х) ненулевой степени взаимно просты и / + д = Н. Тогда степень любого из этих полиномов не превосходит щ($дН) — 1, где щ(р) обозначает количество различных корней полинома р. О силе теоремы 9.9.1 говорит, например, элементарное следствие (теорема Ферма для многочленов): 9.9.2. Для взаимно простых многочленов Х\(1), Х2Ц), х^Ц) ненулевой степени равенство хп1(1) + хг}(1) = хп3(1) при п > 2 — невозможно. Доказательство получается «в две строчки». п' Под рациональной выразимостью подразумевается связь вида (9.13), где коэффициенты полиномов /, д над полем нулевой характеристики являются симметрическими функциями от х\,..., хп. 1 ' Мазоп К. С. ОюрЬапНпе Е^иа^^оп8 оуег Рипсиоп Р1е1с18. СатЪпс^е Ушуегеку Рге88, 1984 (Ьопаоп МаШ. Зое. ЬесШге Ыо1е Зепез. 96); Зшкегз IV. // Риал. Ма*Н. ОхГогд. 1981. 32 (2). Р. 349-370.
9.9. Как реагировать на ассоциации 147 «* Согласно теореме 9.9.1, с учетом щ(рп) = щ(р), <1е§ ж" = п с1е§ Хг ^ с!е§ хх 4- <3е§ ж2 4- <3е§ ж3 - 1. Суммируя по », получаем п(с!её Ж1 4- <3её ж2 4- <3е§ ж3) ^ 3(с1ев а?! 4- с1е§ ж2 4- с!е§ ж3 - 1), откуда п < 3. ► Хотя теорема Ферма для целых чисел уже доказана, простота, с которой устанавливается ее аналог 9.9.2, действует интригующе и побуждает задуматься о поиске новых инструментов в Ъ. Однако прямолинейные попытки ничего не дают, потому что доказательство стержневого результата 9.9.1 опирается на дифференцирование полиномов \ т.е. на использование специфики за пределами кольцевой аксиоматики. Не говоря о том, что даже формулировка аналога теоремы 9.9.1 в Ъ вызывает затруднения. Тем не менее весьма отдаленные параллели иногда подсказывают удачные повороты теории К В данном случае имеется гипотеза, которая в некотором роде может служить аналогом теоремы Мэйсона—Стотерса в Ъ. 9.9.3. Гипотеза аЬс (Маззег, 0ез1ег1е) 15\ По любому е > О можно указать такую константу К(е), что для всех взаимно простых целых чисел а, Ь, с > О, таких что а + Ь = с, верно неравенство тах{а,Ь,с} < К(е)[Щ(аЪс)]ш, где ЛГ0(га) = р{...рг, если разложением целого т на простые множители является т = р{1 ...р/. Из 9.9 теорема Ферма в Ъ следует так же легко как 9.9.2 из 9.9.1. Точнее говоря, справедливость 9.9 влечет за собой невозможность 13) См. Ьапв 5. /I Ви11. АМ5. 1990. 23. Р. 37-75; или [24]. 1 ' Например, производная многочлена (9.9) — успешно работает в общем случае многочлена над произвольным полем, где обычное понятие производной не имеет смысла. 15' Зх&юап С. I,., ТуАетап Я. Оп 1пе Ое81ег1е—Ма88ег согуесШге // Мопа18пепе Ма1п. 1986. 102. Р. 251-257.
148 Глава 9. Многочлены хп + уп = хп при достаточно больших п. И если гипотеза окажется верной, идея наличия глубинных связей между объектами разной природы получит еще одно подтверждение* \ Так или иначе, разговор к тому, что самые нелепые на первый взгляд предположения, вытекающие из кажущегося родства явлений, приносят иногда плоды. Нередко — тем фундаментальнее, чем смехотворнее догадка. ' Конечно, скрытые механизмы со временем обнажаются, и удивительное становится банальным.
Глава 10 Алгебраические числа Теория алгебраических чисел с различной степенью полноты излагается во многих источниках — см., например, [2,5,17,22], — и в данном случае оказывается в поле зрения той частью, которая соприкасается с теорией Галуа. Стержневые результаты сопровождаются доказательствами, сопутствующие — упоминаются вскользь. 10.1. Расширения полей Поле Р по отношению к любому своему подполю Р называется расширением Р. Как правило, далее речь идет о ситуациях ^СК либо Р С С. По крайней мере, подразумевается, если не оговорено противное, что Р имеет нулевую характеристику. Наименьшее по включению поле Р = Р(8), содержащее подполе Р и множество 5, — называется расширением поля Р на 5. В случае, когда 5 состоит из одного элемента 0, о Р(в) говорят как о простом расширении ' поля Р. 10.1.1. Корни ненулевых многочленов № е р[х] называются алгебраическими числами {элементами) над полем Р. Любое число, алгебраическое над полем Р, алгебраично и над любым расширением Е Э Р (но не наоборот). 10.1.2. Минимальным многочленом числа а над Р называют тот из ненулевых многочленов /(ж) € Р[х], /(а) = 0, — который имеет наименьшую степень (степень а над Р) и старший коэффициент 1. Понятно, что Р(в) — поле отношений кольца многочленов Р[0].
150 Глава 10. Алгебраические числа Корни минимального ' многочлена а над Р называют числами, сопряженными с а. Частным случаем этого определения является обычное понятие комплексно сопряженного числа. 10.1.3. Минимальный (неприводимый) многочлен не может иметь кратных корней. < Иначе вместе с /(а) = 0 было бы необходимо /'(а) = 0 (теорема 9.5.1), что противоречило бы минимальности /. ► • Минимальные многочлены чисел -3, г равны: х + 3, х11 - 2, х2 + 1. • В главе 8 отмечалось (по сути), что простое расширение (2(>/2) кольца ^9 полученного присоединением числа л/2, состоит из чисел вида а + Ъ\П\ а в случае присоединения \П — простым расширением (} оказывается кольцо чисел а где а, о, с (Е О. Если говорить о расширениях кольца (ф, рассматриваемого как поле, то (2(>/2) состоит из элементов с + ^л/2' а ($( л/2) — из элементов а + Ъу/2+су/4 ах+Ъху/2+сх</*' а, 6, с, д. (Е < 0,6,0,01,61,0! 6 < однако в том и другом случае избавление от иррациональности в знаменателе позволяет считать, что расширения поля (2 состоят, как и прежде, из элементов а соответственно. Аналогичная ситуация имеет место и в общем случае, что фиксируется следующей — до некоторой степени «неожиданной» — теоремой. 10.1.4. Теорема. Пусть алгебраический элемент а над Р имеет степень п. Тогда расширение Р(а) является п-мерным линейным пространством с базисом {1,а, а ,... ,ап-1}, т.е. любой элемент /3 & Р(а) единственным образом представим в виде Р=Ро+Р\а + ...+рп-{ап~\ все РуЕР. (10.1) А значит, и неприводимого.
10.2. Алгебраические расширения 151 о(а) «* Каждый элемент /3 6 Р(о) представим в виде /3 = —-г, где полиномы Н(а) д{х), Н(х) из кольца Р[х]. Минимальный многочлен /(ж) числа а над Р — взаимно прост с Н(х) (иначе Н(а) = 0). Поэтому (теорема 9.2.1) существуют такие многочлены и(х), у(х) (Е Р[х], что и(х)}(х) 4- у{х)Н(х) = 1, а поскольку /(а) = 0, то у(а)Н(а) =1 =» /3 = д(а)у(а). (10.2) Подставляя теперь х = а в разложение д{х)у(х) = я(х)1(х) + г(ж), где г(х) обозначает остаток г(х) =ро+Р1Х + ...+рп-хХп~1, и учитывая (10.2), получаем (10.1)3). Линейная независимость элемеь ния минимального многочлена /(ж). Линейная независимость элементов 1, а, а2,..., ап 1 вытекает из определе- В случае произвольного расширения Р Э Р поле Р также рассматривается как векторное пространство над Р. Его размерность, обозначаемая [Р : Р], называется степенью расширения Р над Р. В случае трансцендентного элемента в Е Р степень расширения [Р(в) : Р] = оо. В цепочке расширений ' К Э ф Э Р степень [Е : Р] конечна в томм случае, когда конечны степени [Я : ф] г/ [ф : Р], — я/;н этом [Д:Р] = [Д:д]-[д:Р]. • Поле комплексных чисел С является простым расширением поля К, полученного присоединением к К мнимой единицы, С = К(г). 10.2. Алгебраические расширения О расширении Р(а\,..., ат) с алгебраическими над Р элементами а; — обычно говорят как о конечном расширении поля Р. Точнее, расширение Р Э Р конечно, если Р — конечномерное линейное пространство над Р. ' Проведенная манипуляция есть не что иное как рецепт избавления от иррациональности в знаменателе, который упоминался в разделе 9.2. ' Такие цепочки принято называть башнями расширений.
152 Глава 10. Алгебраические числа Люфт определения непринципиален, поскольку: расширение Р Э Р конечно в томм случае, когда существуют алгебраические над Р элементы а.\,..., ат, такие что Р = Р(а\,..., ат). Любое конечное расширение Р Э Р алгебраично К Последовательность алгебраических расширений является алгебраическим расширением. Поле Р считается алгебраически замкнутым, если все корни любого полинома /(ж) € Р[х] лежат в Р, т.е. всякое алгебраическое расширение Р совпадает с Р. Каждое из следующих условий равносильно алгебраической замкнутости поля Р: • неприводимыми над Р являются только линейные многочлены; • любой полином из Р[х] имеет корень в Р. Для любого многочлена /(ж) € Р[х] существует (см. теорему 9.4.1 и следствие 9.4.2) расширение Р Э Р, над которым /(ж) раскладывается в произведение линейных множителей /(ж) = а0(х - х{)(х - ж2)... (ж - хп). Полем разложения неприводимого многочлена /(ж) считается наименьшее расширение поля Р, содержащее все корни /(ж). Например, (5(\/2, е(27г/3)|) — поле разложения многочлена /(ж) = ж3 - 2. Остановимся, наконец, на алгебраичности алгебраических расширений, что само по себе не вполне очевидно. Пусть аир— корни неприводимых многочленов, соответственно, / и д, причем а,\ = а,..., а„ — корни /; Ь\ =/?,..., /?т — корни д. Многочлен Л(х) = Ц[х-а,-/?,] симметричен по а,\,...,ап и по Ьь...,/Зт. Поэтому его коэффициенты будут многочленами от коэффициентов6* /(ж) и д(х). При этом К(а + р) = 0. Следовательно, сумма алгебраических чисел аир — алгебраическое число. Аналогично *' Расширение Р Э Р считается алгебраичным, если любой элемент из Р алгеб- раичен над Р. Обоснование см. далее. 'См. например [15], где речь идет о многочленах, симметрических по двум системам переменных.
10.3. Нормальные расширения 153 устанавливается алгебраичность чисел а — р и ар. Далее, если а — корень многочлена а0хп + аххп~х + ... + ап-{х + ап, то а-1 — корень многочлена апхп + ап.ххп~х + ... + ахх + а0, что позволяет утверждать алгебраичность отношения р/а. 10.3. Нормальные расширения Расширение Р поля Р называется нормальным ', если всякий неприводимый над Р многочлен, имеющий корень в Р, разлагается над Р на линейные множители. Можно сказать иначе. Расширение Р Э Р нормально, если любое а входит в Р со своими сопряженными числами. Расширение (2(л/2) не нормально, поскольку не содержит комплексных корней минимального многочлена ж3 - 2. Нормальным расширением будет 0(#2,е(2*/3)|'). 10.3.1. Теорема. Расширение Р поля Р нормально в томм случае, когда Г = Р(аи...9ап), где аь ..., осп —все корни некоторого многочлена / над Р. «* Любой элемент ш € Р представим в виде ш = <р(а{,..., ап), V? е Р[хх,..., хп]. Многочлен 9(х) = П (ж-^(^(1)»---»^(п))) <т€8в симметричен по жь...,жп, — поэтому его коэффициенты выражаются через коэффициенты /(ж). Следовательно, д(х) — многочлен над Р, и ш — его корень. Таким образом, минимальный многочлен Н(х) числа ш имеет с д(х) общий корень о; и потому делит д(х), а значит, все корни Н(х) лежат в Р. В обратную сторону теорема очевидна. ► Нормальные расширения Р Э Р называют также нормальными полями.
154 Глава 10. Алгебраические числа Теорема 10.3.1 утверждает по сути, что нормальные расширения Р Э Р совпадают с полями разложения многочленов над Р. Здесь, правда, остается некоторый зазор для уточнений. Во-первых, необходимо напомнить, что речь идет о полях Р нулевой характеристики \ Во-вторых, мы оставляем за кадром оговорки типа «с точностью до изоморфизма», каковые в принципе важны, но сильно утяжеляют изложение скучными рассуждениями. • Если Р — нормальное расширение поля Р, а Ь — промежуточное поле, Р Э Ь Э Р, то Р — нормальное расширение поля Ь. (?) • Композитом полей Р\ и Р2 называется минимальное (по включению) поле Р = Р\- Р2, содержащее оба поля Р\ и Р2. Расширение Р(а\,а2) — есть композит расширений Р(а\) и Р((*2)- (?) • Если К и Ь — расширения поля Р, причем К = Р{а\,... ,ат), то композит К-1 = Цоц,...,ап). (?) • Композит и пересечение нормальных расширений — нормальны. (?) 10.4. Теорема о примитивном элементе Поле <0>(>/2, л/5) образуют числа вида ( = а + Ь\/2 + сл/3 + <*\/б, а, Ь, с, д, € О, каковые в то же время исчерпываются линейными комбинациями { = а + ре + 1В2 + бе\ а,Р,^,6е^^ 0 = >/2 + л/3, поскольку у/2 = 1-{въ -9-0), \Я = ^(11 • 0 - в3), ч/б = Х-{вг -5-0). Таким образом, <0>(\/2, л/3) = (2(\/2+\/3), т. е. расширение <0>(\/2, л/3) равносильно простому расширению (ф с помощью одного элемента в = \П 4- \/3, — что может показаться исключением, но это общее правило. 10.4.1. Теорема о примитивном элементе. Любое алгебраическое расширение Р поля Р нулевой характеристики может быть порож- ' Иначе приходится еще говорить о сепарабельных расширениях [5, 14].
10.4. Теорема о примитивном элементе 155 дено одним примитивным элементом 0, т.е. Р = Р(а1,...,ат) = Р(в). < Расширение Е = Р(аь ..., ат) можно представить как последовательность простых расширений Р С Р{а,) С Р(ах)(аг) С ... Р(аь ..., ат_,)(ат) = Р. Поэтому достаточно ограничиться случаем двух элементов Р = Р(а, р). Поскольку расширение алгебраично, — существуют неприводимые над Р многочлены /(ж) и д(х), имеющие, соответственно, корни а = аХ1а2,...,аг и /3 = /Зь/32,...,/?,. Выберем далее ( 6 Р так, чтобы10) а, + СД/ ^ а + СД Для всех паР (*\ 7*) ^ (1> О» и положим 0 = а + С^« В силу /(«-С/») = /(а) = 0, /3 является общим корнем многочленов Н(х) = /(0 — ^ж) и д{х), причем единственным1^. Поэтому НОД Н(х) и д(х) равен12* х - /3, — откуда /3 6 Р(0). Но тогда и а = 0 - {/3 € Р(0). Следовательно, Р(а,р) С Р(0), а поскольку обратное включение Р(в) С Р{а,р) очевидно, то Р(в) = Р(а,р). ► Из теоремы 10.4.1 и ее доказательства легко усматриваются следующие утверждения. 10.4.2. Примитивный элемент поля Р(а\,... ,ат) может быть выбран в виде линейной комбинации в = з{а{ +... + зтат, все з^еР. 10.4.3. Все корни Х\,... ,хп любого многочлена /(ж) с коэффициентами из Ррационально выражаются через «одну иррациональность» в, хз = Щ + з^ -в + ...+ 5(П_1);- • вп~1, все $*/ € Р- ' Можно было бы сказать, что Р(в) есть фактор-кольцо Р[х]/д(х), где д(х) — минимальный многочлен элемента в. 10' В случае конечного поля Р ненулевой характеристики обеспечить условие а1 + СРз Ф <* + (Р не всегда удается. Но теорема остается верной, доказательство проводится другим способом. п' Если допустить Л(/?;•) = 0 (з ф 1), то в — ((З^ = а, при некотором г, что противоречит выбору 0. 1 ' Неприводимые многочлены над полем нулевой характеристики кратных корней не имеют.
156 Глава 10. Алгебраические числа При этом п равно размерности Р(а\,..., ат), т. е. степени расширения 13) [Р:Р]. 10.5. Круговые поля Корнями многочлена хп - 1 в С, как хорошо известно, служат пг- 2ктг . 2ктг VI = сов \- г 8Ш , к = 0,..., п - 1, п п или по-другому: 1,СС2,.-..СВ_1, где < = е''(2,г/п) = со8 —+ 1яп—. (10.3) п п Легко видеть, что числа (10.3), делящие единичную окружность вСнап равных частей, являются циклической группой относительно умножения с образующей ^. Число ^ представляет собой один из примитивных корней б\,... ,ег, каковые определяются условиями е" = 1, но е*^1 при к < п. При этом ряд 1, е;-, е),..., е" х (при любом ,;') исчерпывает все корни (10.3). Поэтому циклическая группа всех корней порождается любым примитивным корнем е;. Разумеется, если п простое, все корни (10.3) примитивные. Но в случае составного п ситуация не такая уж простая. Даже вопрос подсчета числа примитивных корней требует определенных усилий — это число оказывается равным значению функции Эйлера1*' <р(п). При изучении расширений полей с ориентацией на проблему разрешимости уравнений в радикалах — важную роль играют круговые многочлены Фп(х) = (х-е{)...(х- ег), г = <р(п), 13' Речь идет о полях нулевой характеристики. 14' Значение <р(п) определяется равным количеству натуральных к < п, взаимно простых с и; у?(1) = у?(2) = 1, у?(3) = у?(4) = (р(6) = 2, (р(5) = 4.
10.5. Круговые поля 157 корнями которых служат исключительно примитивные корни из единицы (при заданном п) \ В случае простого п Фп(х) = хп~1 +... + Х+1. В общем случае для вычисления Ф„(ж) приходится вникать в теоретико-числовую специфику [14, 24]. Начало ряда выглядит так: Ф\(х) = х-1, Ф2(х) = х+ I, Фз(ж) = х2 + х+ 1, Ф4(ж) = ж2 + 1, Ф6(ж) = х2 - х + 1, Ф8(ж) = ж4 + 1, Фю(ж) = х4 - х3 + х2 - х + 1. Создается впечатление, что коэффициентами Ф„(ж) могут быть лишь ±1. Такая закономерность прослеживается довольно далеко. Но, например, один из коэффициентов Ф21о(#) ухе оказывается равным 2, а далее — коэффициенты Ф„(ж) могут быть любыми целыми числами [24]. Удивительной может показаться сама целочисленность коэффициентов Фп(ж), но от удивления легко избавиться с помощью леммы Гаусса1 '. Некоторая «таинственность» вокруг многочленов Фп(х) ликвидируется легко обнаруживаемой формулой{ ' хп-1 = Цфа(х), (10.4) дающей индуктивное правило вычисления круговых многочленов. Например, в силу (10.4) * / ч хв ~ 1 2 Фб(#) = ■; гт гт^ г = ж - х + 1. ^ ' (х- 1)(х+1)(х2 + х+1) 10.5.1. Многочлены Фп(х) неприводимы над <0). «* Для малых п факт проверяется. Далее работает индукция. Однако скоро сказка сказывается. За техническими подробностями можно обратиться к одной из книг [5, 14, 24]. ► 1 'Уравнение Фп(я) = 0 называется уравнением деления круга, а поле корней (10.3) — круговым полем. 1 ' О примитивности произведения примитивных многочленов. ' Символ «й|п» означает «й делит п», т. е. й является делителем п. Произведение в (10.4), таким образом, идет по всем делителям й числа п.
Глава 11 Теория Галуа Математика состоит из задач, иерархически объединяемых в схемы. «Хождение по этажам» иногда вдохновляет на преобразование действительности, что толкает, как думают одни, в пропасть, другие, — к спасению. Но так или иначе, сами задачи прямого влияния на реальность не оказывают. Влияние опосредованное. В чем-то аналогичное воздействию разрешимости уравнений в радикалах на судьбу Галактики. 11.1. Предварительные замечания Как уже отмечалось, Руффжи и Абель показали, что алгебраические уравнения 5-й степени и выше в радикалах, вообще говоря, не решаются. Закономерно встал вопрос об условиях, позволяющих отделить разрешимые ситуации от неразрешимых. Ответ был получен Галуа (1832) на основе идей, которые в головы современников никак не укладывались. Потенциал неприятия, конечно, постепенно ослаб, но теория Галуа до сих пор считается весьма нетривиальной и труднодоступной для понимания. Самое удивительное при этом, что там нет каких-либо особо сложных доказательств. Точнее говоря, в рассуждениях нет технически сложных трюков, но используются идеологические конструкции, непривычные для подсознания и с трудом укладывающиеся в голове, — что в некотором роде характерно для теории групп вообще. В дополнение к главным «неприятностям» сценарий сопровождается массой второстепенных мелких понятий и терминов, в результате чего без освоения нового языка и новых категорий мышления браться за дело нелегко. Но основная трудность все же — в скрытом характере изучаемых явлений. Пояснить это можно на постороннем примере векторного анализа, который большей частью изучает поверхностные явления, в достаточной мере наглядные для геометрической интуиции. Но есть следующий пласт, где фигурирует, скажем,
11.2. Группа Галуа 159 ковариантное и контравариантное дифференцирование, что уже не так хорошо укладывается в голове, — потому что голова задумывалась Создателем для других дел. Кроме того, теория Галуа приводит в движение сразу несколько механизмов из разных областей, которыми необходимо владеть, чтобы следить за «взаимодействием», не отвлекаясь на изматывающее перелистывание книг в поисках нужных определений и фактов. Минимальные исходные требования заключаются в предварительном освоении элементов теории групп и алгебраических чисел, не говоря о мелочах типа многочленов и полей. В связи с отмеченными обстоятельствами теория Галуа рассматривается далее в упрощенном варианте, основанном на рассмотрении числовых полей — имеющих характеристику 0 — и освобожденном от второстепенных деталей. Одно из минимальных требований для дальнейшего чтения — прочное владение понятиями, связанными с расширениями полей (глава 10). Вот главные опорные точки. Расширением Р поля Р называется любое поле Р, содержащее Р в качестве подполя *\ Всякое расширение можно рассматривать как линейное пространство над Р, размерность которого называют степенью расширения и обозначают [Р : Р]. Элемент а € Р называют алгебраическим над Р, если он является корнем некоторого полинома /(ж) с коэффициентами из Р. Наименьшее расширение Р, содержащее а, обозначают Р(а) Полем разложения неприводимого многочлена /(ж) считается наименьшее расширение поля Р, содержащее все корни /(ж). 11.2. Группа Галуа Напомним: взаимнооднозначное отображение Л : С —> С группы на себя, сохраняющее групповую операцию, называется автоморфизмом. Группа автоморфизмов обозначается Аи1С. Автоморфизмы полей Л: Р -> Р определяются аналогично, с тем уточнением, что 1) В качестве образца Р можно иметь в виду поле рациональных чисел.
160 Глава 11. Теория Галуа взаимнооднозначное отображение Л поля на себя обязано сохранять обе операции, Л(х + у) = Л(х) + А(у), Л(ху) = А(х)А(у), что чаще записывают в виде (х + у)Л = хЛ + уЛ, (ху)Л = хЛуЛ, пользуясь обозначением Л(х) = х . Пусть теперь Р Э Р — нормальное расширение2' поля Р. В группе автоморфизмов кх&Р выделим подгруппу Аи1 Р/Р тех автоморфизмов Л : Р -> Р, которые поле Р оставляют на месте, т. е. Л(х) = ж, если х 6 Р- 11.2.1. Группу Аи1 Р/Р называют группой Галуа нормального расширения Р Э Р и обозначают С(Р/Р). Наравне с С(Р/Р) используется также обозначение С/, где / — многочлен, не имеющий кратных корней, полем разложения которого является расширение Р. При этом говорят о группе Галуа как многочлена, так и соответствующего расширения. С самого начала важно разобраться, что из себя представляет группа Галуа. Хотя исчерпать вопрос не так просто, кое-что лежит на поверхности. Поскольку Р = Р(а\,..., ап), где а\,...,ап — корни полинома /(ж), то ' АПЧ) = /СД(ау)) = 0, (11.1) откуда следует, что Л(а^) — также корень /(ж), т.е. ' Нормальные расширения рассматриваемых здесь полей нулевой характеристики — совпадают с полями разложения (см. теорему 10.3.1) полиномов /, не имеющих кратных корней. ' Д/(ж) = /(Д(ж)) — потому что Л, по определению, не меняет коэффициентов /(ж), так как оставляет элементы поля Р на месте. Например, Л(3х2 - 5) = А(ЩА(х2)] - Л(5) = 3[Д(я)]2 - 5.
11.3. Общая картина 161 Поэтому группа автоморфизмов А\\1 Р/Р характеризуется лишь тем, как автоморфизмы переставляют корни, и потому С(Р/Р) — есть некоторая подгруппа подстановок. При этом порядок группы С(Р/Р) равен степени расширения [Р : Р] (см. п. 10.4.3). Действие Л на остальные элементы поля Р полностью определяется действием Л на корнях а\,... ,ап, поскольку Р конечномерное векторное пространство с базисом, зависящим только от {1, с*!,..., ап}. Более того, действие Л может быть полностью определено значением Л(в) на единственном примитивном элементе 0, который, в свою очередь, определяется через {аь...,ап} (см. пп. 10.4.2, 10.4.3). 11.3. Общая картина Дальнейший путь состоит примерно в следующем. Каждой подгруппе Н С С(Р/Р) отвечает подполе ЬСР, состоящее из элементов Р, неподвижных под действием автоморфизмов из Н. И наоборот, каждому Ь С Р отвечает подгруппа Н автоморфизмов, оставляющих элементы Ь на месте. В результате изучение всех подполей поля Р сводится к изучению всех подгрупп группы С = С(Р/Р), что является существенно более простой задачей. При этом каждой башне (цепочке вложенных) полей Р = 1оСЬ\С...СЬг=Р, отвечает нормальный ряд вложенных (в противоположном направлении) групп С(Р/Р) = С0ЭС{ЭС2Э...ЭСГ = {1}, и наоборот (соответствие Галуа). С задачей решения алгебраических уравнений вся эта кухня сопрягается через механизм радикальных расширений (раздел 11.5) \ ' Расширение Р Э Р радикально, если существует цепочка промежуточных полей Р = Ьо С Ь\ С ... С ЬТ = Р, где каждое Р; является простым радикальным расширением Ь^-\, т. е. полем разложения многочлена х — % над Ь}-\.
162 Глава 11. Теория Галуа Поскольку разрешимость алгебраического уравнения /(ж) = 0 в радикалах сводится к возможности последовательного решения уравнений вида хт — а = О, — на языке расширений суть дела заключается в возможности последовательного расширения исходного поля с помощью присоединения на каждом шаге элементов вида Ца — с целью получить в итоге расширение, содержащее все корни рассматриваемого уравнения. Критерием существования радикального расширения оказывается разрешимость группы Галуа рассматриваемого многочлена. 11.4. Соответствие Галуа Стержнем теории Галуа является соответствие между структурой расширения полей и структурой подгрупп автоморфизмов. Упаковав детали такого соответствия в одну теорему можно «отделаться одним махом», что удобно для «писателей», но убийственно для читателей. Поэтому здесь лучше двигаться поэтапно, тем более что все шаги достаточно прозрачны. Первым делом полезно присмотреться к свойствам автоморфизмов из группы Аи1 Р/Р = С/. Как уже отмечалось — см. (11.1) — любое отображение Л € Аи1 Р/Р характеризуется тем, что переставляет корни многочлена /, полем разложения которого служит Р. Но то же самое автоморфизмы Л € Аи1 Р/Р делают и с корнями любого другого многочлена Н(х), Л(7) = 0, 7 € Р => Мт-4) = ЛМ7) = °> т. е. корень 7 любого многочлена под действием автоморфизма Л заменяется некоторым другим корнем 7 того же многочлена. Иначе говоря, автоморфизм Л € С^ переводит любое число 7 € Р в сопряженное 7 • Если д(х) — минимальный многочлен примитивного элемента в, то д(в) = 0 влечет за собой Лд(0) = д(вл) = 0. Поэтому корни вА = Л{в) минимального многочлена д(х) могут быть поставлены во взаимно однозначное соответствие с автоморфизмами из 0(Е/Р), что еще раз доказывает |С(^/Р)| = [Р : Р]. 11.4.1. Нормальное расширение Р Э Р над любым промежуточным полем Ь в цепочке Р Э ЬЭ Р — нормально.
11.4. Соответствие Галуа 163 «* Если /(ж) — многочлен над Р, корнем которого является примитивный элемент в расширения Р Э Р, то /(ж) тем более можно рассматривать как многочлен над Ь. При этом Р = Ь(в). ► 11.4.2. Всякому промежуточному полю Ь в цепочке Р Э Ь Э Р соответствует подгруппа Н = С(Р/Ь) С С(Р/Р) автоморфизмов, оставляющих на месте все элементы из Ь. Соответствие взаимно однозначно. < Утверждение в принципе тривиально. Совокупность автоморфизмов из группы АшР/Р, оставляющих на месте элементы некоторого, неважно какого, множества, — является подгруппой . Обратно. Если группа (подгруппа) Н С 0(Р/Р) оставляет неподвижным некоторое множество X, в смысле хЛ = х для х е Ь, А Е Н, то X — поле, потому что для х,у 6 Ь (х + у)л = хл + ул = х + у, (ху)л = хлул = ху. При этом, очевидно, Ь Э Р. Остается вопрос о взаимной однозначности, для решения которого достаточно установить, что Н является группой Галуа С(Р/Ь), о которой можно говорить ' в силу п. 11.4.1. Автоморфизмы из С(Р/Ь) по определению оставляют на месте элементы Ь — поэтому Н С С(Р/Ь). Если бы группа Галуа С(Р/Ь) содержала больше элементов, чем Я, то степень [Р : Ь\ была бы больше порядка \Н\. Но [Р : Ь] равна степени примитивного элемента в расширения Р над Ь. И если Н = {Л\,..., Л?}, то в — корень уравнения г-й степени (х-вЛ1)...(х-вЛг) = 0, коэффициенты которого инвариантны под действием автоморфизмов из Н, — и потому принадлежат Ь. Поэтому степень элемента в не больше г, откуда [Р : I] = \Н\, а значит Н = С(Р/Ь). ► 11.4.3. Если промежуточным полям Ь\, 1*2 в цепочке РЭЬ\ЭЬ2ЭР соответствуют подгруппы #ь #2 С С(Р/Р), Н1=С(Р/Ь1), Н2 = С(Р/Ь2), то Н\ С #2- ' Потому что композиция таких автоморфизмов обладает тем же свойством. Другое дело, существует ли такое нетривиальное (не совпадающее ни с Р, ни с Р) неподвижное множество Ь. ' О группах Галуа допустимо говорить лишь в случае нормальных расширений.
164 Глава 11. Теория Галуа < «Противоход» включений Ьх ЭЬ2 Ф> Н\ СН2 очевиден (разумеется, если пребывать в контексте). ► 11.4.4. Пусть % — некоторый элемент из расширения Р Э Р и подгруппа Н С С(Р/Р) состоит из автоморфизмов, оставляющих элемент % неподвижным. Тогда автоморфизмы из С(Р/Р), переводящие % в сопряженные элементы образуют смежные классы по подгруппе К < Пусть Л В е С(Р/Р) и (А = (В, т. е. А(0 = В($. Тогда ВГ1А(0 = ВГ1В(0=Ь что означает В~1 А € Н, и поэтому А и В принадлежат одному и тому же смежному классу ВН. Обратно, В~1А е Н =* А(0 = В($. ► Пункт 11.4.4 раскрывает природу следующего принципиального результата. 11.4.5. Промежуточное поле Ь в цепочке Р Э Ь Э Р нормально в томм случае, когда подгруппа Н С С(Р/Р) автоморфизмов, оставляющих элементы Ь неподвижными, — нормальна. < Пусть нормальному полю Ь отвечает группа Я, т. е. В(() = ( для ( е Ь, В € Н. Нормальное поле содержит все элементы вместе с сопряженными, поэтому уде с(р/р) : А(0 еь => чвен:ва(0 = А($. Последнее означает А~ХВА € Н для В е Н и всех А € С(Р/Р). Но это и есть условие нормальности группы Н. Обратное устанавливается аналогично. ► 11.5. Простое радикальное расширение Вопрос представимости корней через коэффициенты уравнений с помощью рациональных операций и радикалов после определенных уточнений [5] сводится к возможности записи корней в виде ' */...+ у...+ ^; (ц.2) ' С учетом возможности избавляться от иррациональности в знаменателе.
11.5. Простое радикальное расширение 165 что имеет люфт интерпретации, но при соблюдении определенных - 8) предосторожностей ' дает адекватный инструмент для решения проблемы, см. [5]. Если говорить точнее, разрешимость в радикалах алгебраического уравнения /(ж) = 0 сводится к возможности последовательного решения уравнений вида г™ - а = 0. Например, если /(ж) преобразуется в /(ж) = [(ж"1 - а)"2 - Ь]пз - с, (11.3) то решением /(ж) = 0 будет Поэтому суть дела сводится к возможности преобразования полинома /(ж) к виду типа (11.3), где числа типа а, Ъ, с «радикально» выражаются через коэффициенты исходного полинома /(ж) = хп + аххп~х + ... + ап. Эквивалентная точка зрения заключается в последовательном расширении исходного поля, например <0), с помощью присоединения на каждом шаге элементов вида у/а, — где а принадлежит расширению, возникшему на предыдущем шаге, — с целью получить в итоге расширение, содержащее все корни рассматриваемого уравнения. Это как раз будет означать разрешимость в радикалах. Адекватность такого подхода решаемой проблеме, конечно, заслуживает осмысления, чему в книгах обычно уделяется определенное внимание. Нередко с отрицательным результатом — потому что здесь требуется лишь оживить в памяти определения о расширениях полей и привести их (определения) в соприкосновение. А это работа, которую в любом случае необходимо проделать самостоятельно. Исходным элементом рассматриваемой идеологии служит поле разложения многочлена хп — а, а € Р, — называемое простым радикальным расширением поля Р. При условии существования последовательности промежуточных полей Р = 10СЬ{ С...С1Г = Р, (11.4) ' Если радикал {/о, многозначный по своей природе, входит в (11.2) несколько раз, то ему при вычислении каждого корня уравнения придается одно и то же значение. В то же время при любом выборе значений входящих радикалов формула (11.2) обязана давать корень изучаемого уравнения.
166 Глава 11. Теория Галуа где каждое Ь^ является простым радикальным расширением Ь^-\, — расширение Р Э Р называют радикальным. Простое радикальное расширение Р((, ( ,..., (п~ ) ЭР, содержащее все корни п-й степени из единицы, есть поле разложения кругового полинома ' Фп(#)- Уравнение деления круга Фп(х) = О имеет корнями только примитивные корни VI, но их достаточно для требуемого расширения Р. В то же время ясно, что простое расширение Р(() с помощью любого примитивного корня ( порождает то же самое расширение ' Р((,( >--->СП~ )• А поскольку любой примитивный корень ( порождает циклическую группу всех корней VI, то группа Галуа С(Р(()/Р) также будет циклической \ При этом, разумеется, в случае простого п, порядок \С(Р(()/Р)\ = п, т.е. степень расширения [Р(0 : Р] = п. Если же п составное, то степень расширения и порядок группы Галуа равны [Р(0:Р] = \С(Р(0/Р)\ = Ч>(п) + 1, где ц>(п) — функция Эйлера (раздел 10.5). При переходе от ситуации хп - 1 к более общей хп - а — возникают новые обстоятельства. Если в — произвольный корень уравнения хп - а = 0, т. е. вп = а, а ^ — примитивный корень VI, то корнями уравнения хп - а = 0 служат и Р(в, () дает искомое простое радикальное расширение поля Р Но каково фактическое расширение и каковы соответствующие группы Галуа? ' См. раздел 10.5. ' Поскольку ряд 1, ^ С »• • •»С"" » гДе С — любой примитивный корень, исчерпывает все корни VI. п' Ибо автоморфизмам из С(Р(()/Р) очевидным образом ставится в соответствие возведение примитивных корней в ту или иную степень. Если ^ Е Р, то фактического расширения не происходит, группа Галуа тривиальна.
11.6. Циклические расширения 167 11.5.1. Теорема. Группа Галуа С(Р(6, ()/Р) простого радикального расширения — разрешима. < Есть три возможности: (О 0 € Р, С ^ -Р ~~ ситуация ничем не отличается от рассмотренной выше (с присоединением к полю корней из единицы). (й) в $ Р, ( € Р — тогда автоморфизмы Л из группы Галуа имеют вид в *-* 0(А, поэтому каждому Л соответствует определенный корень (А, и группа Галуа опять-таки циклична. (Ш) Общий случай 0 $ Р, { $ Р — исчерпывается последовательным расширением. Сначала к Р подсоединяется (, затем в. Но почему группа Галуа разрешима — сразу не ясно. Любой автоморфизм Л из С(Р(0, ()/Р) переводит корень ( многочлена х11 - 1 в сопряженный (см. раздел 11.4), т.е. СЛ = С При этом (а не может быть корнем многочлена хт - 1 меньшей степени т < п, потому что ^ — примитивный корень х11 — 1. Поэтому а взаимно просто с п. Корень в автоморфизм Л переводит в один из корней (11.5) уравнения хп — а = 1. Поэтому при некотором Ъ. В итоге каждый автоморфизм Л однозначно характеризуется двумя числами а и Ь. При этом, как легко проверить, если Л\ характеризуется парой [а, Ъ], а Аг — парой [с, д\, то композиции Л\Лг отвечает пара [ас, Ъс + д\. Таким образом, группа Галуа С(Р(0,()/Р) изоморфна группе {[а, 6]}, разрешимость которой была установлена в разделе 6.4. ► 11.6. Циклические расширения При доказательстве теоремы 11.5.1 — пункт (И) — отмечалось, что в случае в $ Р, ( 6 Р — группа Галуа циклична. Верно также обратное. 11.6.1. Если поле Р содержит примитивный корень ( = VI, то любое его циклическое расширение ; Р Э Р степени п — образуется присоединением к Р корня неприводимого над Р многочлена хп - а. ' Циклическим расширением поля называют расширение, группа Галуа которого циклична.
168 Глава 11. Теория Галуа «* Пусть автоморфизм Л из С(Р/Р) порождающий, т. е. Лп = 1. В резольвенте Лагранжа (С, ш) = ш + (,Аш + ... + С~1Л~1ш, шеР, (11.6) элемент о; выберем так, чтобы13) ((, о;) Ф 0. Применяя Д к (11.6), имеем А({, о;) = (_1((,о;). Повторение процесса дает Д*((,о;) = (~к((,ш) для к = 1,...,п- 1. Единственный автоморфизм, не двигающий ((, о;), — тождественный. Поэтому V = (С,<*>) порождает все поле Р = Р(и). ► 11.7. Главный результат Перед «заключительным аккордом» надо было бы провести еще некоторые приготовления, но аудитория из-за рутины часто теряет терпение. Поэтому перейдем к главному. 11.7.1. Теорема Галуа. Неразложимое в Р уравнение /(ж) = 0 разрешимо в радикалах в томм случае, когда группа Галуа многочлена / — разрешима. < «Мотором» обоснования является соответствие Галуа (раздел 11.4), благодаря которому из наличия башни полей Р = Ь0СЬ1 С.С1Г = Р (11.7) следует существование нормального ряда групп О = С0 > Сх > 02 > ...><7Г = {1}, (11.8) и наоборот. Если уравнение /(ж) = 0 разрешимо в радикалах, и (11.7) — соответствующая цепочка простых радикальных расширений X, С Ь%+\, то все факторы С(-\/С{ абе- левы (теорема 11.5.1), и для разрешимости группы Галуа С/ = С(Р/Р) не хватает одного: гарантии нормальности расширения 14) Р. Удобный выход из положения дает элементарный факт: «всякое радикальное расширение содержится в нормальном радикальном расширении» (см. ниже), — на основании которого доказательство завершается просто и коротко [14]. Но интуитивно предпочтительнее, пожалуй, рассуждение у Ван дер Вардена [5], которое более расплывчато, но зато дает представление о причинах возможных затруднений и опирается на элементарное 1 ' Это можно сделать в силу линейной независимости 1, Л,..., Л""1, которая несложно устанавливается [24]. 14' Потому что последовательность нормальных расширений не обязана давать нормальное расширение.
11.8. Неразрешимые уравнения 169 изменение порядка расширений. В силу гу/а = у у/а используется возможность последовательного присоединения к полю Р корней из единицы (и корней из чисел а) простых степеней, входящих в разложения всех показателей корней, участвующих в (11.2). В результате получается серия циклических нормальных расширений, каковые нормальны в силу простоты степеней. Далее остается лишь утрясти порядок таких расширений и некоторые мелкие детали [5]. Группа С/ получается разрешимой. Пусть теперь, наоборот, группа С/ разрешима. Тогда С/ имеет нормальный ряд вида (11.8) с абелевыми факторами, который можно уплотнить до композиционного ряда уже с циклическими факторами простых порядков. Соответствие Галуа в этом случае гарантирует существование цепочки (11.7), в которой последовательные расширения X, С 1ч+\ цикличны, простых степеней. Далее, чтобы воспользоваться результатом п. 11.6.1, присоединим к Р примитивный корень ( из единицы степени п = |С/|, и тогда (11.7) перейдет в цепочку рср(ОсНОс...ср(0, в которой, в силу п. 11.6.1, Р(() оказывается радикальным расширением поля Р, содержащим все корни уравнения /(ж) = 0. ► Вот упомянутый выше факт, дополнительно характеризующий радикальные расширения. • Любое радикальное расширение содержится в некотором нормальном радикальном расширении. <4 Для радикального расширения (11.4), т.е. Р = Ь0СЬ1 С.СЬГ = Р, в случае г = 1 нормальность Е = Р(в, ^) фактически была установлена при доказательстве теоремы 11.5.1. Далее используем индукцию. Допустим, Ьг.\ содержится в нормальном радикальном расширении Ьг-{ Э Р и Р = Ьг.х(р), рп = а 6 Ьг-\ - Пусть /(ж) — минимальный многочлен элемента а над Р, и Ь — поле разложения полинома /(хп). Тогда композит Ьг-\ • Ь — искомое нормальное радикальное расширение. ► 11.8. Неразрешимые уравнения Главная роль теоремы 11.7.1 — принципиальная. Но результат можно использовать и утилитарно, для анализа конкретных уравнений, — что требует умения вычислять группы Галуа и уводит исследование в новую плоскость. Для указания частных случаев неразрешимых уравнений годится путь полумер.
170 Глава 11. Теория Галуа 11.8.1. Неприводимость многочлена /(ж) равносильна транзитивности его группы Галуа С/ = С(Р/Р). < Пусть V — произвольный корень /. Нормальность расширения Е Э Р означает, что все сопряженные и числа принадлежат Е. В том числе: И\...,И", (11.9) где А\,..., Ап — все автоморфизмы группы С(Е/Р). Любое 1/л> является (раздел 11.2) корнем /, и / для уа> — минимальный полином. Но тогда все числа (11.9) обязаны быть различны (что есть транзитивность группы С/), иначе произведение по различным и ' давало бы полином, «меньший» минимального. ► В случае простого п транзитивная группа О/, содержащая хотя бы одну транспозицию, совпадает с 8„ (упражнение в конце раздела 2.2). Если /(ж) имеет ровно два комплексных корня, автоморфизм комплексного сопряжения % н> 2, переставляющий комплексные корни и не трогающий вещественные, дает нужную транспозицию в С/. Транзитивность С^ обеспечивает неприводимость полинома / над Р. Полином /(ж) = ж5+3ж+3 имеет ровно два комплексных корня и неприводим над <0) (по критерию Эйзенштейна). Поэтому его группа Галуа совпадает с 85, которая содержит простую (теорема 6.3.3) группу А5, — и потому неразрешима. Соответственно, уравнение х5 + Ъх + 3 = 0 неразрешимо в радикалах. Понятно, что уравнение хк(х5 + 3х + 3) = 0, к>0, также неразрешимо в радикалах. Это объясняет, почему теория ориентируется на неприводимые многочлены. Группа Галуа уравнения п-й степени, коэффициенты которого взяты более-менее наугад, есть 8„, и потому при п ^ 5 — неразрешима. Таким образом, уравнения высоких степеней, разрешимые в радикалах, являются исключением.
11.9. Построения циркулем и линейкой 171 11.9. Построения циркулем и линейкой Если исходить из заданного поля Р С С, то с помощью циркуля и линейки можно построить любое комплексное число с, квадрат которогоХ5' с2 Е Р. Аналитическая геометрия присовокупляет сюда некоторые элементарные соображения, в итоге возможности циркуля и линейки описываются последовательным расширением исходного поля: РСР(с1)С..СР(с1,...,сг) = Г, где с] € Р, с\ б Р(сО, ..., с] е Р(сь ..., с,.-!). Иначе говоря, возможность построения сводится к разрешимости некоторого алгебраического уравнения (для каждой задачи — своего) в квадратных радикалах. Степень каждого квадратичного расширения равна 2. Поэтому [Р : Р] = 2Г, и в случае [<0>(я) : О] Ф 2Г при любом г > 0, — число 2 невозможно построить, отправляясь от отрезков рациональной длины. Невозможность удвоения куба сразу следует из неприводимости многочлена х3 - 2, влекущей за собой [0(^2) : О] = 3 ф 2Г. Построение правильного р-угольника (р простое) равносильно построению числа 2;г . . 27Г „_, 2 = С08 Ь г 81П , 2Г +...+2+1=0, р р откуда ясно [<0(*):<И=р-1. Следовательно, необходимо р = 2Г + 1 при некотором г. Такие р называют простыми числами Ферма: 3, 5, 17,257,65 537. 15* Что базируется на возможности по двум отрезкам а и Ь построить гипотенузу с= у/а2 + Ь2.
172 Глава 11. Теория Галуа 11.10. Дополнение • Алгоритмы вычисления групп Галуа мы оставляем за кадром. Идея вычисления опирается на два обстоятельства. Во-первых, С/ изоморфна группе перестановок корней, не меняющих алгебраические зависимости между корнями. Во-вторых, о таких перестановках можно судить косвенно по коэффициентам многочлена из-за наличия взаимосвязей (формул Виета). • Хотя игровой площадкой в главе были числовые поля нулевой характеристики, результаты после внесения определенных поправок остаются справедливыми в более широком диапазоне, в том числе — для конечных полей. В то же время ограничение горизонтов комплексной плоскостью С позволяет взглянуть на ситуацию с позиций ТФКП. Корни многочлена /(*) = *п + аххп~х + ... + ап^г + ап есть нули функции г(ьз), определяемой равенством гп = /(г). Аналитическая функция г(ьз), разумеется, многозначна. При движении по кривой С (проходящей только через регулярные точки) из точки щ в точку ь)\ значение функции меняется с /г(гу0) на г{ьз\). При этом значение г{ьз\) зависит не только от «конечного пункта» щ, но и от пути С. В случае движения по замкнутой ориентированной кривой С (не проходящей через точки ветвления решений), которая начинается и заканчивается в щ, решение 2; уравнения щ = /(я) перейдет в некоторое другое решение гк того же уравнения. В результате на множестве решений г\,...,гп уравнения щ = /(г) возникает группа подстановок, которая и является группой Галуа16' многочлена Н(г) = /(г)-щ. Вопрос о разрешимости уравнения /(я) - щ = О в радикалах сводится к принадлежности г(ьз) классу К функций, которые могут быть получены из 1(у)) = гп и констант (функций д{ьз) = с) с помощью сложения, вычитания, умножения, деления, а также возведения в целые степени и извлечения корней. Класс 11, как оказывается, характеризуется разрешимостью групп Галуа — групп подстановок, определяемых функциями 2(ад). • Рассмотрение проблематики с точки зрения ТФКП позволяет добавить к классу 71 однозначные аналитические функции без изменения выводов о разрешимости уравнений — теперь уже с возможностью дополнительных операций. К *Я можно добавить и многозначные функции типа логарифма, но тогда группы Галуа перестанут быть конечными, что не мешает им в принципе быть разрешимыми или неразрешимыми с аналогичными последствиями. ' Называемая в теории аналитических (алгебраических) функций группой моно- дромии. Индивидуальные подстановки отвечают классам эквивалентных кривых С.
Глава 12 Группы Ли Со времени открытия Софусом Ли (1842-1899) непрерывных групп 1' уровень недоступности теории был существенно поднят усилиями других математиков 2\ В результате современные руководства по группам Ли [9, 18, 19, 27] достигают цели лишь в очень узкой аудитории, а «рецептура» теряет связь с приложениями. Но такова диалектика. Слишком много «хвостов» оставляют упрощенные подходы. С другой стороны, наведение порядка уводит так далеко, что кругом «никого нет». Поэтому, как бы там ни было, пора возвращаться обратно. Жертвуя строгостью и рекордными достижениями. Конечно, путь аскетизма и замалчивания трудностей, избранный в главе, чреват иллюзиями обманчивой простоты, но с этого можно начинать. 12.1. Параметрические группы Пусть х € Мп, а € Мг, и {Са} — семейство непрерывных функций Са(х) = С(х,а), преобразующих (при заданном параметре а) точки х в точки х того же пространства Мп. Чтобы семейство преобразований (штрих не обозначает дифференцирования) х =С(х,а) (12.1) составляло группу (с композицией в качестве умножения), должны выполняться обычные групповые аксиомы. В частности, групповая операция не должна выводить из {Са}, т.е. (12.2) х=6(х,а), х" = 0{х\Ь) => х" = С(х,с) при некотором с = <р(а, Ь). Иными словами, последовательное выполнение двух преобразований типа (12.1) равносильно преобразованию того же вида, 0ЬСа = &<р(а,Ь)- 1' Итоговая монография (Не 5. Уог1е5ип§еп йЬег соттшегПсНе Сгирреп. Ье1р21§: ТеиЬпег, 1893) — содержит более 800 страниц. 2' Как говорил Эйнштейн, «с тех пор как за теорию относительности принялись математики, я ее уже сам больше не понимаю».
174 Глава 12. Группы Ли Ассоциативность очевидна. Далее, необходимо С(х, е) = х \ при некотором зна чении параметра а = е, что гарантирует существование единичного элемента группы. Для простоты обычно полагается е = 0, т.е. 0(х,0) = х. Наконец, уравнения (12.1) обязаны иметь решение х = гр(х,а), причем функция ^(ж',а) после подходящей перепараметризации должна попадать в то же семейство, т. е. г/>(х, а) = 6(х, 6), Ъ = Ь(а). Это обеспечивает существование обратных элементов, бг^1 = Сь{а)- Чтобы получить определение группы Ли, дополнительно надо предположить, что функции Ь(а) и <р{а, Ъ) «достаточное» число раз непрерывно дифференцируемы К Обратим внимание, что все, кроме дифференцируемости, укладывается в обычные определения группы и сопутствующих понятий. Семейство функций {0(х, а)} можно интерпретировать как действие (глава 3) группы С = {Оа} на элементах х. А множество ОгЬ(ж) = {Оах :Са€С} представляет собой орбиту элемента х. Однопараметрические группы (г = 1) дают простейший путь к пониманию общей идеологии групп Ли, но одновременно вводят в заблуждение. Суть дела, как выясняется, близка к тому, что и так хорошо известно (интегралы движения, производные по направлению векторного поля). В результате возникает впечатление о безосновательном переиначивании привычных понятий. 12.1.1. В случае однопараметрической группы с помощью перепараметризации {замены параметра) всегда можно добиться, чтобы (р{а, Ъ) = а + Ъ, Ъ{а) = -а. Иначе говоря, &ь(*а — (*а+Ъ) (*а = (*-а* (12.3) Это совсем простой, но принципиальный факт. Разъяснения будут даны позже. Пока же остановимся на более важном, хотя и тривиальном утверждении. ' Это упрощенное определение. Менее понятные варианты можно найти в указанных выше источниках. О причинах возникающих сложностей будет сказано далее.
12.1. Параметрические группы 175 12.1.2. Если параметризация группы Ли&*= {Са} такова, что выполняется (12.3), то С(х, а) может быть получено как решение задачи Коши: дс_ да = «/)• в|.«о = *. где № = дС(х, а) да а=0 (12-4) (12.5) «* Пусть С(х, 0) = х. Тогда 0(х, а + Аа) = С{х, а) + —^^-Аа + о(Аа), да С(х,а) (12.6) С(С(х, а), Аа) = 0(0(х, а), 0) + дв(в(д,а),0) До + о(До) (12 ?) В предположении (12.3) левые части (12.6) и (12.7) — равны. Поэтому равны и правые. Откуда дО(х, а) да ■■№*,*)]. (12.8) Из п. 12.1.2 следует, что вся группа {С(х,а)} определяется производными в нуле (12.5). (!) Последнее имеет место и в многопараметрическом случае. Группу Ли определяет сколь угодно малая окрестность единичного элемента. Все семейство {6г(ж, а)} определяется его поведением в окрестности тождественного преобразования <7(ж,0) = х. Это удивительно, потому что причина заключается не в линейности. Напрашиваются, конечно, другие аналогии. Например, задание аналитической функции в окрестности любой точки определяет функцию целиком. В группах Ли возникает нечто подобное. Необходимо подчеркнуть, что запись (12.4) маскирует банальный факт. Задача Коши = {(*), г(0) = х9 (12.9)
176 Глава 12. Группы Ли имеет решение г{х,1), что с точностью до обозначений и есть С(х, а) = г{х,а). Таким образом, однопараметртесте группы Ли исчерпываются —(!) в предположении (12.3) — операторами сдвига ' х = С(х, а) = Сах по траекториям систем диф-уравнений вида (12.9). • Поскольку система (12.9) автономна, оператор сдвига Са удовлетворяет полугрупповому свойству 09С1 = (2л+ь откуда следует Са = (0^а)М ПРИ условии МАа = а и любом N. Поэтому Са определяется сдвигом 6гДа за сколь угодно малое «время» Аа, что и было выше предметом обсуждения. • Если семейство {С{х, а)} не удовлетворяет аксиомам группы, то семейство операторов сдвига {11а} по траекториям (12.9) не совпадает с {Са}. Посмотрим, что получается без предположения (12.3). В случае х = С(х,а), с = (р(а,Ъ) имеем, в силу С(х,Ъ) = С(х,(р(а,Ъ)), тождество д6(х',Ъ) _ 8С(х, с) дф, Ъ) дъ " дс дъ~' переходящее при Ъ = О в дС(х',0) дС(х,а) дср(а,Ь) 8Ь что можно записать в виде да 8Ь ь=о где их' дС(х,0) д<р(а,Ъ) €(х) = —51—' ш\а) = (12.10) да дЬ ь=о При переходе к новому «времени» а ^Г_ Г йа У ш(а) ' Если а считать временем. Более привычно выглядит \]{Х вместо Сах.
12.2. Инварианты и первые интегралы 177 дифференциальное уравнение (12.10) приобретает форму ^=«Л (НЮ т.е. укладывается в формат (12.9), равносильный (12.4), — что доказывает утверждение п. 12.1.1, ибо в новом «времени» а группу задает автономный дифур (12.11), оператор сдвига по траекториям которого обладает полугрупповым свойством. Таким образом, однопараметринеские группы Ли — необязательно удовлетворяющие (12.3) — исчерпываются операторами сдвига по траекториям систем диф-уравнений вида ' ^ = <гШ*)> (12.12) фазовые траектории которых совпадают с траекториями автономных дифференциальных уравнений (12.9). Отличие — в скорости движения по этим траекториям. В случае однопараметрической группы х =ах, у' = -у (12.13) а единичному элементу отвечает значение параметра а = 1. Уравнение (12.4) (с поправкой на «а = 0» => «а = 1») имеет вид Решение С(х,1) хе1 уе~1 автоматически получается аддитивным по параметру и с описанием группы (12.13) не совпадает. Чтобы вернуться к исходной параметризации надо сделать замену а = е1. Подобного рода «помехи на вторичном уровне» характерны не только для математики. 12.2. Инварианты и первые интегралы Инвариантами однопараметрических групп служат первые интегралы. Напомним основные сведения [4, т. 2]. ' Переходящие в автономные — при замене «времени».
178 Глава 12. Группы Ли Производная по времени скалярной функции и(х) вдоль тра- равна екторий х(1) автономного уравнения \х = %(х) и = ^2^Ш = ^и^{х), г т.е. скалярному произведению градиента и(х) на вектор ((х). Величину Чи • ((х) называют производной Ли, либо производной и(х) по направлению (вдоль) векторного поля %(х). Если производная й(х) вдоль %(х) равна нулю, то траектории х(1) целиком располагаются на поверхностях постоянного уровня и(х) = соп81. В этом случае говорят, что и(х) является первым интегралом системы х = %(х). Другими словами, любое нетривиальное решение линейного уравнения с частными производными Угг-^(ж) = О, т.е. Еб<*)^=о, (12Л4) г г является первым интегралом уравнения х = %(х), — последнее называют уравнением характеристик, а его траектории характеристиками уравнения (12.14). Наличие первых интегралов у автономной системы, вообще говоря, редкость. Соответственно, линейное уравнение (12.14) имеет нетривиальные решения лишь в исключительных случаях. Но в достаточно малых окрестностях неособых точек фазового пространства — первые интегралы существуют «всегда» [4, т. 2]. Точнее говоря, в невырожденных точках векторного поля %(х) гарантировано локальное существование п - 1 первых интегралов. Причина заключается в том, что в малой окрестности неособой точки траектории х = ((х) почти параллельны, и их можно локальной заменой переменных (диффеоморфизмом) «выпрямить» и перевести в систему 2/1 = 1, у2 = 0, ..., уп = 0, (12.15) имеющую п - 1 интегралов движения: у2 = с2, ..., уп = сп. Каждый первый интеграл позволяет понизить порядок изучаемой системы на единицу. Скажем, если и(х) — первый интеграл системы х = ((х), то выражая, например, хп из уравнения и(х) — с (при надлежащем выборе константы с), получим хп = (р(х\,..., жп_!), после чего остается решить систему Хг =6(жь...,Ж„_1,р(Ж1,...,Жп_1)) (г = 1, . . . , П - 1), что отражает суть идеи.
12.2. Инварианты и первые интегралы 179 Другая ситуация, имеющая непосредственное отношение к группам Ли, возникает в связи с рассмотрением в Мп неавтономных систем х = /(ж, Ь) и первых интегралов и(х, Ь), зависящих от времени, — каковыми называют функции и(х,Ь), являющиеся первыми интегралами расширенной автономной системы: Г ж = /(М), Сведение к предыдущему случаю создает впечатление, что говорить, собственно, не о чем. Но ситуация другая. В естественных предположениях ' — всегда существует п функционально независимых первых интегралов и{(х,1) = с{, ..., ип(х,1) = сп. (12.16) Остальные первые интегралы функционально зависят от (12.16). «* Если х = ж(ж0,<) — решение системы х = /(ж, I), то разрешение х = х(с, I) относительно вектора с дает п первых интегралов с, = ^,(ж, I). ► Инфинитезимальные операторы. Равенство (12.14) можно записать с помощью оператора в виде Х(и) = О Х = Т,№)^ (12Л7) г где д/дхг обозначает частное дифференцирование, под знак которого автоматически попадает функция и(х) при воздействии на нее оператором X. В случае (12.5) &(х) = дС^х^ п , , — (12.17) называется да 1«=о инфинитезимальным оператором группы {С(х,а)} с касательным в нуле векторным полем %(х). (!) Если единичным элементом группы является С(х, а0), то формула для & (ж) меняется на д6г(х, а) I 6(*) да 'Локальная единственность плюс нелокальная продолжимость всех решений системы х = }(х,1).
180 Глава 12. Группы Ли Примеры • В случае х = ах, у = -у единичному элементу группы отвечает значение а а = 1. Поэтому В результате дах ~да~ ду/а «=1 да а= д д Х = Хдх-~Уд-у- • Для группы вращений X = X С08 <р - у 81П <р, у' = X 81П (р + у С08 (р (12.18) дх ~ду -у> <р=0 д^_ д(р х. <р=0 Инфинитезимальный оператор: Х = - — х — дх ду Идея касательного поля в теории групп Ли — один из краеугольных камней. Для однопараметрических групп она, по сути, хорошо известна и достаточно наглядна. Семейство нелинейных функций С(х, а) (операторов сдвига) однозначно определяется линейным по а движением вдоль касательных векторов Ф) = дС(х, а) да а=0 Если функция и(х) инвариантна под действием группы {С(х,а)}9 т.е. и[С(х,а)] = и(х), (12.19) то (12.19) равносильно тому, что вектор %(х) в любой точке х касателен к поверхности и(х) = сопз! — иначе говоря, Х(и) = 0, т.е. ^(ж)Угг = 0.
12.2. Инварианты и первые интегралы 181 Переход на язык инфинитезимальных операторов — вместо разговоров о дифференциальных уравнениях вида (12.4) — избавляет от неуклюжести в связи с требованием (12.3), в зависимости от чего приходится рассматривать то ли уравнение (12.4), то ли — (12.12), в то время как подобная дилемма принципиального значения обычно не имеет. Как правило, важны касательные направления и сами траектории, а не абсолютные скорости движения. Функцию и(х), удовлетворяющую условию Х(и) = О, называют инвариантом группы {С(х,а)}. Иначе говоря, и (С(х, а)) = и(х), что выражает отмеченное выше свойство первого интеграла: содержать траектории целиком на поверхностях постоянного уровня и(х) = соп81. Сценарий, конечно, выглядит плагиатом. Новизна — в названиях, аудитория — в недоумении. Может быть, поэтому традиционные изложения групп Ли начинаются с другого конца. Прямо с инфинитезимальных операторов и инвариантов группы, в результате чего о первых интегралах в подоплеке многие так и не догадываются. Тем не менее первоначальное движение по знакомым местам заводит постепенно в джунгли. Сколько у группы инвариантов? Выше отмечалось, что в автономном случае, о котором вроде бы речь, гарантировано существование лишь локальных инвариантов. На самом деле: 12.2.1. Однопараметрическая группа имеет п — 1 глобальных функционально независимых инвариантов. В утверждении 12.2.1 опущено, для краткости формулировки, предположение о глобальной и однозначной разрешимости уравнения х = С(х, а) относительно х, что здесь подразумевается, и обычно называется регулярностью действия группы. Именно это требование позволяет локальные инварианты (см. выше) срастить в глобальные. Понять результат удобнее, видимо, опираясь на следующий принципиальный сам по себе факт: 12.2.2. Однопараметрическая группа ' невырожденной заменой переменных у( = Уг{х) может быть приведена к группе переносов вдоль у\. Опять-таки регулярная.
182 Глава 12. Группы Ли В силу оператор переходит в Х><-Х><& х = ?б(.)^ * = Е*<*>^- В малой окрестности любой точки векторное поле %(х) можно выпрямить, обеспечивая (12.15) в новых координатах у,-, что приводит (локально) к ^=^- + 0- —+ ... + 0-—-. (12.20) ду\ дуг дуп В силу регулярности действия группы локальные карты ' сращиваются воедино, и тогда (12.20) выполняется глобально. Это означает, что в новых координатах действие группы сводится к сдвигу по координате у\. ► Таким образом, в координатах у{ имеется п — 1 первых интегралов 2/2(2/1)9 • • • > Уп(У\)> переходящих при возврате к исходным переменным в п — 1 интегралов движения 1\(х),..., 1п-\{х). Пример Инварианты группы растяжений с инфинитезимальным оператором ^ , д д д х = 2хТх+уТу+гЛ определяет уравнение ди ди ди 6.x д.у д.г стандартно решаемое с помощью уравнения характеристик — = — = —. 2х у г В итоге получается два первых интеграла: у2/х = С\ и г/у = Сг. Условие Х(1) = 2х— = 1 приводит к I = 1п \/х. В переменных9) ох У2 % у— щ = —, щ = -, 2 = 1пуж 'Локальной картой называют гомеоморфизм, который осуществляет локальную замену координат. ' Замена I = 1п \[х выгоднее «тренировочно». Проще положить I — г.
12.3. Инвариантные функции и множества 183 группа с инфинитезимальным оператором X — есть группа переносов по I, а любое диф-уравнение, инвариантное по отношению к этой группе, становится «автономным», т. е. его порядок понижается на единицу. 12.3. Инвариантные функции и множества Как уже отмечалось, функция и(х), инвариантная к действию группы {Со}, характеризуется тождеством и(Сах) = и(х), либо условием ^(ж)Угг = 0, и точки х под действием элементов группы остаются на «своих» поверхностях постоянного уровня и{х) = соп51. В том числе сохраняется нулевой уровень. Но иногда важна инвариантность только нулевого уровня. В этом случае нет необходимости, чтобы и{х) была инвариантна. 12.3.1. Пусть С — группа Ли с инфинитезимальным оператором X и Угг(ж) ф О, если и(х) = 0. Тогда множество решений уравнения инвариантно относительно С в томм случае, когда и(х) = 0 Х(и) = 0 при условии и(х) — 0. Пример [19] Множество решений уравнения и(х, у) = х4 + х2у2 + у2 - 1 = 0 / д д\ инвариантно относительно группы вращения I X = -у-—\-х— ). Действи- \ дх ду) тельно, Х(и) = -4х3у - 2ху3 + 2х3у + 2ху = -2ху(х2 + 1)~1и(х, у), и поэтому Х(и) = 0, если и(х, у) = 0. Градиент и вырожден только в нулевой точке (х = у = 0), но и(0,0) Ф 0. «Секрет» раскрывает представление и{х,у) = {х2 + \){х2 + у2-\), откуда ясно: и(х, у) = 0 ^ х2 + у2 = 1. Надо иметь в виду, что инвариантность диф-уравнений подразумевает нечто подобное. Уравнение х + ах2 = /31~2 инвариантно
184 Глава 12. Группы Ли к группе преобразований I = Ы1, х = (\/к)х не потому, что не меняет формы, а потому что при подстановке ( и И, ж и (\/к)х переходит в эквивалентное уравнение -~{х + ах2 - /?Г2) = 0 (к > 0). к1 Разумеется, встречаются более запутанные варианты. При концентрации внимания на корнях уравнения действие группы можно сузить на множество решений и(х) = 0 — в результате возникает новая группа и в какой-то мере новая ситуация. Рассмотрим, например, алгебраическое уравнение Р(х) = х2 + х + 1 = 0, корни которого выдерживают преобразования х = хк при любом к (Е Ъ, не кратном 3. (?) Скажем, для х = х~1 получается Р(х) = Р(х)/х2, а в случае х = х2: Р(х) = х4 4- х2 + 1 = (ж2 - х + \)Р(х). Поэтому Р(х) = 0 => Р(х) = 0. Полином, таким образом, преображается, но корни остаются корнями, хотя под действием элементов группы могут меняться местами. В результате образуется фактор-группа перестановок корней. На этом пути и возникают, собственно, группы Галуа. Левые части рациональных отношений ^2 вЙ ^Ж11 ...Ж? =0 «1 гп между корнями жь ..., хп алгебраического уравнения, где все а,-ь..м,-п — рациональны, перестановка корней а переводит в выражения 2^ 0,1 »'пЖа(1) * * ' Ха(п)> 11 1'п в результате чего равенство нулю может нарушаться. Подгруппа перестановок, сохраняющих все рациональные отношения между корнями, является группой Галуа. Пример в обрамлении групп Ли выглядит белой вороной, но это не совсем так. Идеологии дискретных и непрерывных групп во многом пересекаются, и поэтому барьер между ними лучше не ставить. Более того, в приложениях часто имеет смысл рассматривать комбинации дискретных и непрерывных групп. Дифференциальные уравнения, которые представляются вотчиной групп Ли, — благодатный объект с точки зрения нечувствительности и к дискретным преобразованиям. Например, инвариантность диф-уравнения а;ж = 0 к обращению времени — влечет за собой равенство нулю всех коэффициентов а* с нечетными номерами. Е
12.4. О разделении переменных 185 12.4. О разделении переменных Вернемся к вопросам о методе разделения переменных, которые в разделе 1.3 повисли без ответов. В одном из примеров рассматривалось уравнение (1х — -{-х-31 = 0, (12.21) аъ нечувствительное к действию преобразований 1' = 1 + а, х=х + 3а. (12.22) Инвариант группы (12.22) — функция г = х - 31. Замена х ь» г + 31 приводила к уравнению с разделяющимися переменными = -(И, интегрирование которого в итоге давало решение х{1) = 31 + Се'1 - 3. Обратим внимание, что инвариант группы г = х - 31 не обязан быть и не является инвариантом (первым интегралом) решаемого дифура. Причина происшедшего разделения переменных связана не столько с уравнением (12.21), сколько с наличием инвариантной группы (12.22), которая после замены Ь\-+1, жн г + Ъ1 становится в переменных (г91) группой переносов вдоль оси I: I1 = 1 + а, г=г. Общий же вид уравнения ^ = /(2,2), неважно какого, но инвариантного по отношению к такой группе 1 \ есть их 6,х В любом диф-уравнении, инвариантном к (12.22), переменные разделяются заочно той же самой заменой. Таким образом, в случае двух переменных работает единый рецепт. Одной новой переменной назначается инвариант группы, другая переменная выбирается так, чтобы по ней происходил сдвиг (перенос). Например, для группы х' = ах, 1' = аЧ (12.23) 10) В силу /(г,1+ а) = /(г,1).
186 Глава 12. Группы Ли инвариантом служит г = х2/1. Замена г = х2/1, т = т(1) переводит оператор д д дт Выбор Х(т) = 2<— = 1 приводит к т = 1пл/<. В переменных (г,т) действие о1 группы сводится к переносу по т. Соответствующая замена развязывает переменные в любом диф-уравнении, инвариантном относительно группы (12.23). Вообще говоря, выбор второй переменной так, чтобы по ней получался чистый сдвиг, не всегда обязателен. Вместо ^ = /(я) может получиться уравнение ^ = ш(1)$(г) тоже с разделяющимися переменными. Но в принципе вторая переменная требует заботы. Скажем * = у+*№+*) (12.24) ах х - у/(х2 + у2) с произвольной (до разумных пределов) функцией / — описывает класс дифференциальных уравнений, инвариантных относительно группы вращений п) (12.18). Переход к полярным координатам в любом из уравнений вида (12.24) разделяет переменные. Но если ограничиться лишь заменой г = х2 + у2, оставив в качестве второй переменной ж, — ничего не получится. При большей размерности описанная технология требует определения всех п - 1 инвариантов — см. раздел 12.2. В силу п. 12.2.2 любое уравнение т- = Пх), же к", ах\ инвариантное относительно однопараметрическои группы, заменой переменных у(х) может быть преобразовано в фактически «автономную» систему -г- = М2/ь...,2/п) аУ\ (п — 1)-го порядка, поскольку /\ = 1, а остальные /, не зависят от у\, поскольку группа сведена к группе переносов вдоль ух. ' Описание классов диф-уравнений, инвариантных относительно той или иной группы, — стандартная задача, которая привлекает внимание определенной части исследователей.
12.5. Многопараметрический сценарий 187 12.5. Многопараметрический сценарий В случае многопараметрических групп ситуация идеологически остается вроде бы прежней, но декорации меняются. Функция и(х) под действием преобразования С,-(жь... ,жп;<Уаь...,даг), г = 1,... ,п получает приращение{ ' Г = ^ 6а,Х,и + о(\\ба\\), (12.25) ; = 1 где *; = !>;(*)*!-■ > = 1 г, (12.26) • =1 °Х{ — инфинитезимальные операторы фуппы, которых теперь г штук вместо одного, а «касательные поля» определяются элементами двг(х,а) Яа; (12.27) о=0 Справедливость (12.25) опирается на следующие выкладки. «* Точка г = <7(ж, а) под действием возмущения С^а переходит в г 4- Д* = <?(*, <*а) = <?(*, 0) + ^(*, 0)<*а + о(ра||). При этом13) р(а, <*а) = (р(а, 0) + р'(а, 0)<*а + о(ра||), откуда да = а(а)Аа + о(\\... ||), Аа = <р(а, да) - <р(а, 0), где а(а) — обратная матрица к <р'(а, 0). 1 ' Мы избегаем делить индексы на верхние и нижние, что при более детальном анализе позволяет различать ковариантные и контравариантные переменные. Но тут ситуация та же, что и с десятипальцевой системой печати, которая хороша при наборе объемных текстов. 1 ' Подразумевается дифференцирование у/ по второму аргументу.
188 Глава 12. Группы Ли Учитывая /а(г, 0) = ((г), окончательно имеем Аг = ((г)ст(а)Аа + о(...). ► (12.28) Разумеется, соблюдая формальности, надо было бы кое-что оговорить. Например, невырожденность матрицы <р'(а, 0). Но мы часть рутины оставляем за бортом. Итак, для инвариантности и(х) относительно группы преобразований {С(х, а)} теперь требуется больше, чем прежде. Равенство нулю приращения Аи в первом приближении — влечет за собой необходимость обращения в нуль г скалярных произведений градиента Угг на г касательных векторов: (12.29) т.е. Х;(и) = 0, ; = 1,...,г. (12.30) Зато если интеграл движения и(х) удовлетворяет условиям (12.30), то порядок системы дифференциальных уравнений можно (иногда) 14) понизить сразу на г единиц \ Аналогом (12.12) в данном случае является, в силу (12.28), задача Коши для системы дифференциальных уравнений в частных производных вида дг т тр- = И ЫФы(*)> *(0) = х, (12.31) аа* *=1 решения которой г = С(х, а) исчерпывают группу {С(х, а)}. (!) Формула (12.27) предполагает, что единичным элементом группы является С(х, 0). Если единичный элемент группы С(х, ао), 1 ' В отличие от однопараметрической ситуации, не всегда ясно, как и когда это можно сделать. Положительное решение вопроса зависит от разрешимости индуцируемой алгебры Ли.
12.5. Многопараметрический сценарий 189 то (12.27) меняется на 8Сг(х,а) Ых) = да. (12.32) а=а0 12.5.1. При чтении литературы надо иметь в виду разнобой в терминологии, удобный с точки зрения свободы маневра. Инфинитезималь- ными операторами, помимо (12.26), называют также: (\) линейные комбинации (12.26) и даже (И) любые преобразования С(х, а) из достаточно малой окрестности единичного элемента группы. Кроме того, инфинитезимальные операторы физики называют генераторами группы. Примеры • Группа невырожденных преобразований Ах _ Тип «121, [а2\ а22\" имеет единичный элемент при А = . С учетом (12.32) инфинитезимальные операторы, по формуле (12.26): д д д д ^1 = ^1 ——, Х2 = х2 —, Х3 = х1—1 Х4 = х2 — . ОХ\ ОХ\ ОХ2 ОХ2 • При вращении твердого тела вокруг оси хх с единичной скоростью точка х = {х\,х2,х3} имеет скорость V = {0,-ж3,ж2}. Скорость изменения любой функции и(х) в этой точке равна ди ди ОХ2 ОХт, Поэтому инфинитезимальные операторы вращения в К3: д д д д д д Х'=Ж2^ГЖз^? Х2 = Х>дх--Х^ Хз = Х1дх-2-Х2дх-Г (1133) что характеризует вращение твердого тела, закрепленного в точке. При освобождении поступательных степеней свободы к (12.33) надо добавить еще три оператора: д д д Х4~дх~Г Х5'дх~2' Хв-дх~3' Соответствующие касательные поля скоростей: ^(х) = (0, -ж3, х2), (2(х) = (ж3,0, -х{), (3(х) = (~х2, хи 0), Ь(х) = (1,0,0), (5(х) = (0, I, 0), Ш = (0,0, 1).
190 Глава 12. Группы Ли Заметим, аналогом утверждения 12.3.1 является следующее. 12.5.2. Пусть С — г-параметрическая группа Ли с инфинитезималь- ными операторами Х\,..., Хг и система уравнений /1(ж) = 0, ..., /т(ж) = 0, жбК", т^п, (12.34) такова, что матрица Якоби Эх] имеет ранг т в любом решении системы. Тогда множество решений системы (12.34) инвариантно относительно С в томм случае, когда V*,;: *,•(/<) = 0 в любой точке х, удовлетворяющей (12.34). Вопрос о числе инвариантов г-параметрических групп решается в принципе следующим образом. 12.5.3. Если группа действует в Шп и ее орбиты г-мерны, то она имеет п — г глобальных функционально независимых инвариантов К 12.6. Локальные группы Поскольку переход к рассмотрению инфинитезимальных операторов сохраняет информацию о группе в целом, фокус внимания при обсуждении {С(х, а)} можно сузить до малой окрестности единичного элемента С(х, 0), что дает возможность говорить о локальных группах. Такой переход на самом деле принципиален. Дело в том, что есть довольно много практически интересных однопараметрических групп типа х = , у = , (12.35) 1 - ех 1 - ех которые могут быть определены лишь локально. Но этого достаточно, чтобы обсуждать инварианты группы. 15* Для «глобальности» необходимы оговорки, аналогичные тем, которые делались по поводу утверждения 12.2.1.
12.7. Алгебры Ли 191 Локальная группа (12.35) не может быть определена при всех е (Е К из-за обращения знаменателей в нуль. Но если е\, ег достаточно малы, то последовательность двух преобразований (12.35) с этими параметрами точку (ж, у) переводит в / х У \ \1-(е1+е2)х' \-(е1+е2)х)' и на пути анализа не возникает препятствии — при рассмотрении касательного поля (х2,ху) и генератора тг 2 д д Х = Хдх-+ХУд~у- Препятствия возникают при рассмотрении диф-уравнения (12.4), имеющего в данном случае вид системы их 2 йу решения которой нелокально непродолжимы [4, т. 2], что и является причиной обращения в нуль знаменателей (12.35). Таким образом, локальный характер определения группы не касается «инфинитезимального анализа». Но это только «до поры до времени», пока не возникают «глобальные вопросы», приводящие к необходимости продолжения локальной группы, — и здесь картина и трудности едва ли не идентичны продолжению аналитических функций [4, т. 1]. В данном контексте соответствующие подробности остаются за кадром — см. [19,21]. 12.7. Алгебры Ли Комплект инфинитезимальных операторов в многопараметрическом случае образует, как неожиданно выясняется, так называемую алгебру Ли, представляющую собой «инфинитезимальное ядро», несущее на себе всю информацию о группе. Нелинейные условия инвариантности, например, заменяются линейными «инфинитези- мальными уравнениями». Но это лежит на поверхности. Обнаруживаются более глубокие механизмы, позволяющие решать неприступные с виду задачи, такие как перечисление и классификация инвариантных групп и диф-уравнений, не говоря об интегрируемости в квадратурах.
192 Глава 12. Группы Ли Построение алгебры инфинитезимальных операторов начинается с простого наблюдения. Произведение (композиция) дифференциальных операторов 71 я п я !=1 г г=\ г является дифференциальным оператором второго порядка, потому что Но коммутатор [Х1,Х2]=Х{Х2-Х2ХХ, (12.37) называемый скобкой Ли, будет дифференциальным оператором первого порядка, поскольку слагаемые со вторыми производными взаимно уничтожатся \ Скобка Ли в результате: д_ дх{' Соответственно, коммутатор векторных полей Цх), г)(х) полагается равным "•«-{?[<■&-*&] ?[<-ё-1Ш- Коммутатор (12.37) далее служит билинейной операцией, лежащей в основе определения алгебры Ли, каковой называют векторное пространство Ь с билинейной операцией умножения [•, •], удовлетворяющей следующим аксиомам: • Билинейность: а[Хь Х2] = [аХиХ2] = [X,, аХ2], <*еШ, [Х1,Хг + Х3] = [Х1,Хг] + 1Х1,Х3], [Х1+Х2,Хз] = [Х1,Хз] + №,Х3]. «■«-ё[^-^: ' Ибо в гладком случае смешанные производные не зависят от порядка дифференцирования [4, т. 1].
12.7. Алгебры Ли 193 • Антисимметричность: [ХиХг\ = -{Х2,Х,\. • Тождество Якоби: [X,, [Х2, Х3]] + [Х2, №, X,]] + [Х3, [X,, Х2]] = 0. (12.38) Если функции ^(х) гладкие, то множество операторов (12.36) с умножением (12.37) — образует алгебру Ли. Это малоинтересный факт. Интересно другое. Набор инфинитезимальных операторов (12.26) составляет базис конечномерной алгебры Ли Ьг. При этом любой оператор X С Ьг раскладывается по базису, и поэтому: г [Хд, Х„] = ^ с^Х„ А, // = 1,..., г, (12.39) где Сд^ 6 К — структурные константы алгебры Хг. Результат (12.39) является в некотором роде сюрпризом. Если [Хд,Х^] — дифференциальный оператор первого порядка, то почему он обязан представлять собой линейную комбинацию ряда Хь ... ,ХГ — сразу не ясно. Тем не менее сообразить несложно, и это хорошее упражнение, если мыслить геометрически. Контуры рассуждения примерно такие. С одной стороны, нет особой разницы, говорить об инфинитезимальных операторах, как о преобразованиях С(х,а), близких к единичному оператору группы (см. п. 12.5.1), либо о касательных векторах (12.29), задающих натянутое на них касательное подпространство, аппроксимирующее группу в окрестности единицы. С другой — линейная часть последовательного применения Х\Х^ обязана (в силу групповых свойств) лежать в том же «натянутом пространстве», и потому будет выражаться как линейная комбинация Х\,... ,ХГ. Формальный эквивалент рассуждения в виде цепочки дифференцирований можно найти у Хамермеша [26]. Подстановка (12.39) в тождество Якоби (12.38) приводит к соотношениям
194 Глава 12. Группы Ли которые обязаны выполняться наряду с Са„ = ~с;х, (12.41) что вытекает из антисимметричности скобки Ли. Ли показал, что путь к уравнениям (12.40), (12.41) можно пройти в обратном направлении, определяя тем самым по структурным константам алгебру Ли, а значит, и группу Ли. Иначе говоря, любому решению системы (12.40), (12.41) — отвечает группа Ли, что сводит труднообозримую проблему классификации групп Ли к изучению системы алгебраических уравнений — достаточно сложной, но идеологически прозрачной \ На вещественной прямой К генераторами группы С(х, а) могут быть опе- раторы &(ж)— с линейно независимыми функциями &(ж) — и их линейные ох комбинации. Разложение функций ((х) в ряд по {1, ж,..., хп,...} и поиск конечной алгебры с базисом д д г д Хх = Ъх~> Х2 = Хдх~> •' Хг+1=Хдх~ показывает, что г не может быть больше двух. Действительно, [Хг,Хг+1] = х г — = Х2г_ь что противоречит требованию (12.39) в случае г > 2. Таким образом, на вещественной прямой К возможны лишь три конечномерные алгебры Ли (с точностью до диффеоморфизма): (0 алгебра с единственным инфинитезимальным оператором д/дх, порождающая группу сдвигов 6(х, а) = х + а; (и) алгебра с двумя генераторами, д д порождающая двухпараметрическую группу 0{х, а) = а,\Х + а,г\ (Ш) алгебра с тремя генераторами, д д 2 д ОХ ОХ ОХ ' Конечно, это слишком сильно сказано. Система (12.40), (12.41) не только сложна, ее надо еще изучать с учетом эквивалентности решений — потому что структурные константы меняются при замене переменных.
12.8. Дифференциальные уравнения 195 порождающая трехпараметрическую группу, эквивалентную проективной группе Рассуждение, конечно, содержит пробелы, но результат именно таков. На вещественной прямой возможны, максимум, трехпараметрические группы Ли, причем их всего три (с точностью до эквивалентности). Ли в анализе продвинулся дальше, но уже на плоскости технические детали настолько громоздки, что книги, в которых воспроизводятся соответствующие результаты, можно пересчитать на пальцах. Возможных групп оказалось более 30 типов, среди них примитивные, максимум, восьмипараметрические, импримитивные — любой размерности. 12.8. Дифференциальные уравнения Приложения групп Ли к дифференциальным уравнениям связаны в основном с простым соображением. Если дифур инвариантен к некоторой группе преобразований, то интегралы движения надо искать в классе функций, инвариантных относительно той же группы. «Соображение» просто выглядит, конечно, пока не доходит до дела, потому что в конкретных задачах возникают неясности, о чем можно судить хотя бы по примерам из главы 1. Однако именно «примитивный подход» лежит в основе большинства практических успехов, и это полезно было бы признать, не прикрываясь разговорами о роли высокой науки. Роль последней несомненна, но путь к решению всегда обнаруживается «на пальцах». Потом на обоснование иногда уходит вся жизнь, но это второй этап. Открытия любого калибра избегают «причесанных методов». Хорошая находка — всегда результат озарения, игнорирующего строгие правила. Весь этот разговор к тому, что для успешного применения групповой идеологии к диф-уравнениям — совсем необязательно начинать с изучения теории групп Ли, особенно в современном изложении [21]. Более того, наивный подход (глава 1) даже лучше, ибо раскрепощает и вдохновляет. Систематический взгляд потребуется на этапе доработки, и то не факт. Однако заранее полезно иметь общее представление о сфере поисков, возможных трудностях и простейших инструментах.
196 Глава 12. Группы Ли • Вот внешне простая ситуация. Дифференциальное уравнение I— = х + \/х1 + 1\ (12.42) аг как легко убедиться, имеет частное решение х=1-(12-1), (12.43) инвариантно относительно группы растяжений {Сх, С1}, и подстановка в (12.43) {Сх, С1) вместо {х, I) приводит к общему решению (12.42): ■-№-$■ • Трюк довольно симпатичный. Из одного решения получаются сразу все. Но идея размножения решений с помощью группового воздействия не всегда работает. Скажем, уравнение Риккати ж + ж2 = -, (12.44) инвариантное относительно группы растяжений \сх, 1*}, (12.45) имеет общее решение 322 1 которое не может быть получено групповым воздействием ни из частного решения х = -1/<, ни из х = 2/1. Однако (12.46) получается из решения х = Ч1 1 *3 + 1 I подстановкой жи Сх, 1>-> —I с последующей заменой константы С3 *-> С. О Причина вскрывается при рассмотрении первых интегралов. Инвариантами группы (12.45) служат кривые х1 = к, среди которых лишь две, х1 = 2, х1 = — 1, переводятся группой (12.45) сами в себя 1 \ Именно они и не подходят для целей «размножения». В любом другом частном решении действие группы х *-> Сх, 1 1^ —I сдвигает константу, и механизм работает. о 18) Что проверяется подстановкой х1 = к в (12.44).
12.8. Дифференциальные уравнения 197 Предыдущие примеры указывают путь, но он далеко не всегда ведет к цели. Общее решение вообще не обязано получаться из конечного числа — частных. Считается, что система дифференциальных уравнений х = Ф(х,Ь), хеШп, (12.47) имеет фундаментальную систему решений, если общее решение функционально выражается через конечное число га произвольно выбранных частных решений и п произвольных констант. За пределами линейного случая, в котором фундаментальная система решений существует всегда [4, т. 2], вопрос не так прост. 12.8.1. Теорема (Ли). Система (12.47) имеет фундаментальную систему решений, если она представима в виде *| = МЫп(х) + • • • + МЫгЛх), г = 1, ... , П, и операторы •=1 0Х% образуют алгебру Ли. При этом га ^ г/п. Стандартный пример нелинейного уравнения с фундаментальной системой решений — уравнение Риккати: х = а(1) + р(1)х + <у(1)х\ для которого алгебру Ли образуют операторы а а 2 а Хх = —, Х2 = х — , Х3 = х—. ах ах ах Теорема 12.8.1, конечно, — флаг. Практически — результат малополезный, но «философски» — крайне важный. Математика вообще держится на опорных столбах, которые чисто утилитарного значения почти не имеют. Но как фундамент, обозначение горизонтов, демонстрация перспектив, — эти столбы опосредованно влияют на все остальное.
198 Глава 12. Группы Ли Что касается непосредственно практики, внимание традиционно концентрируется на интегрировании конкретных дифференциальных уравнений. И хотя оное ремесло — далеко не ядро теории (см. [4, т. 2]), им полезно владеть. К примерам и приемам из главы 1 здесь полезно добавить некоторые общие соображения, которые отчасти развязывают глаза. Это не всегда превращает поиск вслепую в более эффективное занятие, но в целом — дает понимание, которое часто оказывается дороже отдельно решенной задачи. В первую очередь надо сказать о целесообразности использования инфините- зимальных операторов. Если функция и(х, у) инвариантна относительно группы преобразований , 1 то использование х — ах, генератора группы X = х . У д дх = аУ' д Уду особых выгод обычно не сулит. Если же и(х, у) инвариантна относительно группы вращений ( X = X С08 (р - у 8И1 у, \ у = Ж 81П ^ + у С08 ф, то сама проверка инвариантности с помощью инфинитезимального оператора д д дх ду бывает намного проще. Интегрирующий множитель. Дифференциальные уравнения на плоскости часто записывают в форме йу - /(ж, у) д,х = 0. Рассматривают также более общий случай Р(х, у) с1х + Я{х, у) йу = 0, (12.48) 19) равносильный уравнению в частных производных ' ди ди , д--Р-=0. (12.49) См. раздел 12.2 о первых интегралах.
12.8. Дифференциальные уравнения 199 Если левая часть (12.48) представляет собой дифференциал некоторой функции (потенциала) и(х,у), т.е. д,и = Р д,х + Я йу, что означает ди ди — =Р(х,у), ^=0(*,У). (12.50) то это сразу дает первый интеграл и(х, у) = с, и тем самым решает исходное уравнение. Из равенства перекрестных производных и(х, у) вытекает, в силу (12.50), дР(х,у) ^дЯ{х,у) ду дх ' К } что служит достаточным условием существования потенциала и(х, у). Поскольку умножение (12.48) на ненулевой множитель р{х,у) не меняет уравнения по сути, — потенциал и существует и в том случае, когда условию типа (12.51) удовлетворяет уравнение ц(х, у)Р{х, у) их + ц(х, у)Я{х, у) д.у = 0. Тогда ц(х,у) называют интегрирующим множителем, и и определяют, интегрируя Ли = \1Р д,х + ц(}д,у, а /* предварительно находят, решая уравнение с частными производными дцР _ дцЯ ду ~~ дх ' что в общем случае не менее сложно, чем решение исходного уравнения. Но если уравнение (12.48) допускает группу преобразований20* с инфините- зимальным оператором то любой интеграл и(х, у) = С уравнения (12.48) под действием группы остается интегралом. Поэтому любое решение (12.49) и(х,у) дает другое решение Х{и) того же уравнения. Но решение у (12.49), с точностью до функциональной зависимости, может быть только одно. Следовательно, Х(и) = <р(и), т.е. ди ди . ч <л + 'вГ*в)- (1152) где <р — некоторая функция. Решая систему (12.49), (12.52) относительно производных, получаем ди <рР ди уС} дх (Р + чЯ1 ду (Р + чЯ' ' Уравнение допускает группу преобразований, если оно инвариантно относительно этой группы.
200 Глава 12. Группы Ли В итоге ён _ Р6.х + ЯЛу 21) откуда вытекает ', что искомый интегрирующий множитель: 1 Р + ЦЯ 12.9. Инфинитезимальные продолжения При изучении дифференциальных уравнений /(х,х,1) = 0 (либо более высокого порядка) с точки зрения инвариантности — часто имеет смысл на первичном этапе исследования рассматривать ди- ФУР /(*, х, I) = 0 как сугубо статическое уравнение, забыв на время, что х производная. Взаимосвязь задач сохраняется иначе: продолжением действия изучаемой группы С на переменные ж. Делается это следующим образом. Пусть элементы группы О = {6гв} действуют по правилу у = Ф(ж,*,а), т = Ф(ж,*,а). (12.53) Тогда йу Ф,+ жФх /,лг,\ У = -г = = ©(я, я, I), (12.54) что в совокупности с (12.53) дает описание продолженной группы О*1, действующей в расширенном пространстве переменных {ж, ж, I). При необходимости группу можно продолжать на производные более высоких порядков. Например, .. йу 9, + хвх + жЭ± У = т~ = ; гт , (12.55) что, будучи добавлено к (12.53) и (12.54), дает продолженную группу С* , действующую в пространстве переменных {ж, ж, ж, I). Все это, конечно, выглядит упражнением на дифференцирование, и трудно поверить, что где-то может дать выигрыш. Но ситуация кардинально меняется при переходе к инфинитезимальным 21) йи Ибо —т-т — полный дифференциал. Ф)
12.10. Поиск допускаемых групп 201 операторам. Ничего существенно нового, вообще говоря, не появляется, но итоговые формулы еще дальше отдаляются от исходного описания группы, и «удобства» становятся принципиальны. Если Х=*т+"ТХ> то каков инфинитезимальный оператор продолженной группы? Идеологически ответ прост, но технически громоздок, и выкладки проделываются в общем виде один раз, чтобы не возиться с каждой задачей отдельно. При этом уравнения (12.53) надо заменить на у = х + от/ + о(а), т = 1 + а( + о(а) и перейти к формулам типа (12.54), (12.55) с точностью до о-малых, получая в результате у = х + аш{, у = х + аш2, где и, = Б(ч) - ж#Ю, "2 = 0(шх) - хБ(0, что записано с помощью так называемого оператора полного дифференцирования в_д_ ±д_ тд_ д1 дх дх "' В результате инфинитезимальный оператор первого продолжения д д д д г*\ второго продолжения *--'-,+«»н- Пример д д Для оператора X = -у-—\- х— группы вращений: ох ду 12.10. Поиск допускаемых групп Под «допускаемыми группами» здесь подразумеваются группы, относительно которых инвариантны изучаемые уравнения. Указанию допускаемой группы способствует обычно понимание содержательной стороны задачи. Физические соображения,
202 Глава 12. Группы Ли равноправие переменных, та или иная «геометрическая» симметрия — именно такого сорта факторы чаще всего помогают обнаружить искомую группу. Более логичная задача «по уравнению найти группу формальными средствами» — вызывает обычно меньше энтузиазма из-за технических препятствий, но принципиально она решаема. Если изучается уравнение /(*,*,*) = 0, (12.56) то для инвариантности (12.56) относительно группы с инфините- зимальным оператором X требуется (необходимо и достаточно): X*1/ = 0 при условии /(у, х, I) = 0, (12.57) где у стоит вместо производной х. При этом (12.57) называют определяющим уравнением для допускаемой группы уравнения (12.56). Если бы речь шла об уравнении второго порядка /(ж, ж, I) = 0, то вместо (12.57) требовалось бы X*2/ = 0 при условии /(г, ж, I) = 0. И так далее — для уравнений более высокого порядка. Определяющие уравнения типа (12.57) оказываются в итоге системами уравнений в частных производных, решение которых (позволяющее указать допускаемую группу), как правило, сложнее исходного дифура. Поэтому овчинка не стоит выделки, если задача упирается только в решение дифференциального уравнения. Однако знание инвариантной группы обычно дает больше, позволяя судить о различных свойствах изучаемого объекта, что гораздо важнее стерильного решения. Такого рода соображения подталкивают к анализу определяющих уравнений и приводят (иногда) к конструктивным результатам [18,19]. 12.11. ЧП-уравнения Продолжение групп Ли в расчете на изучение уравнений в частных производных находится в том же идеологическом русле. Переменные делятся на зависимые и = {и\,...9ит} и независимые
12.12. Комментарии 203 х = {х\,... 9хп}. Описание группы внешне прежнее: и = Ф(и, х, а), х = Ф(гг, ж, а), где х теперь играет роль «многомерного времени». Группы продолжаются на переменные дщ д2щ При определенных соглашениях относительно обозначений формулы (продолженных операторов и определяющих уравнений) совпадают с предыдущими. Тут, конечно, хорошо было бы привести примеры, но регламент поджимает. К тому же ситуация аналогична «алкоголю за рулем». Много пить нельзя, мало — неинтересно. Поэтому здесь лучше обратиться к обстоятельным источникам [18, 19]. В элементарном изложении примеры есть в [10]. 12.12. Комментарии • Откуда берутся сложности. О трудностях систематического изучения групп Ли нетрудно догадаться. Источников «неприятностей» довольно много. Серьезную головную боль доставляют вопросы продолжения локальных групп. Как уже отмечалось, картина здесь напоминает теорию аналитических функций. Во многих практически интересных случаях продолжение локальной группы оказывается многозначным (типа продолжения логарифма на комплексной плоскости). В ТФКП положение спасают римановы поверхности, на которых многозначные функции становятся однозначными, — но инструмент не из простых. Подобную технику приходится вводить и здесь, что в рядовых ситуациях приводит к стрельбе из пушек по воробьям. Конечно, можно дать упрощенный вариант теории, но его приходится то и дело расширять и подстраивать. Общий же подход рождает монстров. Простые исходные понятия постепенно рассыпаются, и неожиданно выясняется, что изучается-то по сути симбиоз теории групп с теорией гладких многообразий. При этом не скажешь, что хуже: алгебраические головоломки или топологические ловушки. • Центральным мотивом деятельности Ли и образцом для подражания служила теория Талу а алгебраических уравнений. Аналогом «разрешимости в радикалах» была интегрируемость дифференциальных уравнений в квадратурах. Успех, вообще говоря, не был достигнут, и через некоторое время тематика была оставлена
204 Глава 12. Группы Ли в покое, хотя результатов было получено много (Ли и его ближайшими последователями). В частности, было выяснено, что система дифференциальных уравнений п-го порядка с транзитивной группой Ли и разрешимой алгеброй Ли — интегрируема в квадратурах, а если множества транзитивности т-мерны, то порядок системы квадратурами может быть снижен до (п — т) -го. Но это еще не теория Галуа. Система может оказаться интегрируемой, даже если она не инвариантна относительно хоть какой-нибудь группы Ли . • Векторное поле ^(х) в Кп (либо на многообразии М С К") в естественных предположениях для любой точки определяет кривую (траекторию), проходящую через эту точку и всюду касающуюся поля (,(х). В случае системы векторных полей &(*) = {&>(*)> • • •. &>(«)}. ; = 1,..., г, вместо траекторий говорят об интегральных многообразиях полей {&,...,&•}» касательные пространства которых в каждой точке х порождаются векторами Ц\(х),..., &(я)}. При этом система Ц\(х),...,$г(ж)} считается интегрируемой, если через каждую точку х проходит интегральное многообразие. О системе {(,\(х),... ,(,г(х)} говорят как о находящейся в инволюции, если существуют гладкие функции с\^(х), такие что Ка, &] = ]С СА/*(Ж)6" А, |4 = 1,..., г, см. (12.39). Теорема Фробениуса. Система гладких векторных полей интегрируема в томм случае, если она находится в инволюции23'. • Определенный интерес представляет взаимосвязь коммутатора (скобки Ли) [А, В] = АВ- В А, где под А, В можно понимать матрицы, с групповым коммутатором [А,ВУ = АВА-1В~1. Взаимосвязь определяется равенством которое проверяется простым дифференцированием. ' Современный вариант теории Галуа для дифференциальных уравнений см. в книге: РоттагеЫ. Г. 01ЙегепМа1 Оакмз ТЬеогу. №\у Уогк, 1983. ' Исторические и технические подробности см. в [19].
Сокращения и обозначения Ч и ► — начало и конец рассуждения, темы, доказательства. (?) — предлагает проверить или доказать утверждение в качестве упражнения, либо довести рассуждение до «логической точки», — но не является вопросом «правильно или неправильно?» (!) — предлагает обратить внимание «в томм случае» — «в том и только том случае» НОД — наибольший общий делитель НОК — наименьшее общее кратное ЧП-уравнение — уравнение с частными производными А => В — из А следует В х Е X — х принадлежит X X I) У, X П У, Х\У — объединение, пересечение и разность множеств X С У — X подмножество У, в том числе имеется в виду возможность X С У, т. е. между X С У и X С У различия не делается N — множество натуральных чисел {1,2,...} Ъ — множество целых чисел {..., -1,0, 1,...} (2 — множество рациональных чисел К = (-оо, оо) — вещественная прямая С — комплексная плоскость х = о (тос1р) — «ж при делении на р дает в остатке о» Аи1 С — группа автоморфизмов группы С
206 Сокращения и обозначения Сп — группа поворотов на углы , к = 0, 1,..., п - 1 п Бп — группа диэдра, изоморфна группе самосовмещений правильного п -угольника 8П — симметрическая группа подстановок п-й степени А„ — знакопеременная группа подстановок а\-> Ь — отображение, сопоставляющее элементам о элементы Ь (а\,..., ап) — группа с образующими а\,..., ап (ж, у) — скалярное произведение векторов ж, у; различие с предыдущим обозначением определяется контекстом (8) — группа порожденная множеством 8 *, ®, о — знаки для обозначения групповой операции (группового умножения) кег <р — ядро гомоморфизма <р к(а) — наименьшее расширение поля к, содержащее элемент а [Е : Р] — степень расширения Г над полем Р \0 : Н\ — индекс подгруппы Н в группе С
Литература 1. Быркгоф Г. Гидродинамика. М.: ИЛ, 1963. 2. Боревич 3. И, Шафаревич И. Р. Теория чисел. М.: Наука, 1972. 3. Босс В. Интуиция и математика. М.: Айрис-Пресс, 2003. 2-е изд. М.: КомКнига/1Ж55, 2007. 4. Босс В. Лекции по математике. Т. 1. Анализ; Т. 2. Дифференциальные уравнения; Т. 3. Линейная алгебра; Т. 4. Вероятность, информация, статистика; Т. 5. Функциональный анализ; Т. 6. От Диофанта до Тьюринга; Т. 7. Оптимизация. М.: Ш55, 2004-2006. 5. Ван дер Варден Б. Л. Алгебра. М.: Наука, 1979. 6. Вейль Г. Симметрия. М.: УРСС, 2002. 7. Винберг Э.Б. Линейные представления групп. М.: Наука, 1985. 8. Журавлев Ю. И., Флеров Ю. А., Вялый М. Я. Дискретный анализ. Основы высшей алгебры. М.: МЗ-Пресс, 2006. 9. Ибрагимов Н. X. Группы преобразований в математической физике. М.: Наука, 1983. 10. Ибрагимов Н.Х. Азбука группового анализа. М.: Знание, 1989. 11. Каргаполов М.И., Мерзляков Ю. И. Основы теории групп. М.: Наука, 1972. 12. Картан Э. Теория конечных непрерывных групп и дифференциальная геометрия, изложенные методом подвижного репера. М.: МГУ, 1963. 13. Коксетер Г. С. М., Мозер У. О.Дж. Порождающие элементы и определяющие соотношения. М.: Наука, 1980. 14. Кострикин А. И. Введение в алгебру. Ч. III. Основные структуры. М.: Физматлит, 2001. 15. Курош А. Г. Курс высшей алгебры. М.: Лань, 2004. 16. Курош А. Г. Теория групп. М.: Лань, 2005. 17. Ленг С. Алгебра. М.: Мир, 1968. 18. Овсянников Л. В. Групповой анализ дифференциальных уравнений. М.: Наука, 1993. 19. Олвер П. Приложения групп Ли к дифференциальным уравнениям. М.: Мир, 1989. 20. Ольшанский А. Ю. Геометрия определяющих соотношений в группах. М.: Наука, 1989.
208 Литература 21. Понтрягин Л.С. Непрерывные группы. М.: УРСС, 2004. 22. Постников М. М. Введение в теорию алгебраических чисел. М.: Наука, 1982. 23. Постников М. М. Основы теории Галуа. М.: Наука, 1960. 24. Прасолов В. В. Многочлены. М.: МЦНМО, 2000. 25. Седов Л. И. Методы подобия и размерности в механике. М.: Наука, 1967. 26. Хамермеш М. Теория групп и ее применение к физическим проблемам. М.: УРСС, 2002. 27. Шевалле К. Теория групп Ли. М.: ИЛ, 1948. 28. Яглом И.М. Геометрические преобразования. Т. 1, 2. М.: Гостехиздат, 1955, 1956.
Предметный указатель Абсолютно неприводимый многочлен 139 автоморфизм 59, 159 аддитивная группа кольца 118 алгебра 126 — Ли 126, 192 алгебраический элемент 149 алгоритм Евклида 134 Базис 78 базисы Гамеля 63 башня расширений 151 бесконечно удаленная прямая 40 беспорядок 51 булева структура 128 Взаимно простые многочлены 133 Генераторы группы 189 гиперкомплексные системы 126 гомологичные циклы 86 гомоморфизм 59 — колец 121 гомотопные пути 88 граница симплекса 84 — цепи 85 граничный оператор 84 грань симплекса 83 группа 43 - %; 47 — абелева 46, 76 — автоморфизмов 59 — без кручения 45 — внутренних автоморфизмов 59 — вычетов аддитивная 47 — Галуа 160 — гамильтонова 128 — гомологии 85 — диэдра 33 — знакопеременная 52 — инерции 144 — конечная 44 — Ли 174 — локальная 190 — монодромии 172 — непрерывная 90 — периодическая 45 — поворотов Сп 33 — примарная 77 — простая 56 — разрешимая 101 — свободная 108 абелева 78 — симметрическая п-й степени 50 — транзитивная 71 — фундаментальная 89 — циклическая 45 групповая операция 43 группы изоморфные 58 Двойное отношение 41 действие группы на множестве 68 декартово произведение 79 делители нуля 120 дефект 54 деформация 88 додекаэдр 34 допускать группу 199 дробь правильная 141 — простейшая 142
210 Предметный указатель Естественный гомоморфизм 60 Идеал 121 — алгебры 127 — главный 123 — максимальный 123 изоморфные кольца 121 икосаэдр 34 инвариант группы 181 инвариантное подпространство 93 инвариантный оператор 96 индекс подгруппы 53 интегрирующий множитель 199 инфинитезимальный оператор 179, 187 Касательное векторное поле 179 кватернионы 127 класс вычетов по модулю р 125 — сопряженных элементов 57 классы вычетов по идеалу 122 код генетический 111 — группы 111 кольцо 118 — главных идеалов 123 — евклидово 124 — коммутативное 119 — Ли 120 — лиево 120 — многочленов Е[х] 119 — простое 123 — с единицей 119 — целостное 120 коммутант 102 коммутатор 102 — векторных полей 192 композит полей 154 композиционный ряд 101 коразмерность 54 коэффициент инцидентности 84 коядро оператора 54 критерий Эйзенштейна 137 круговое поле 157 круговой многочлен 156 Левые смежные классы 54 лемма Гаусса 138 — Шура 97 Малая теорема Ферма 49 матрица перестановки 91 минимальный многочлен а над Р 149 многочлен приводимый 136 — примитивный 137 моноид 43 мультипликативная группа 120 вычетов 47 Наибольший общий делитель 133 неподвижная точка действия 71 неприводимое представление 93 нормализатор 69 нормальный делитель 55 — ряд 100 нуль-пространство 54 Образ 54 октаэдр 34 операция коммутирования 120 определяющее уравнение 202 определяющие соотношения 109, 111 орбита 70 ориентация 83 — симплекса 83 ортогональная прямая сумма представлений 94 Парадокс Дюбуа 38 первый интеграл 178 , зависящий от времени 179 перестановка 50
Предметный указатель 211 — четная, нечетная 51 период элемента 45 подгруппа 44 — инвариантная 55 — кручения 82 — нормальная 55 — подобная 55 — порожденная 107 — сопряженная 55 подстановка 50 — транзитивная 52 — четная, нечетная 52 показатель группы 81 поле 120 — алгебраически замкнутое 152 — нормальное 153 — разложения 152 — характеристики нуль 125 полиэдр 83 полугруппа 43 полугрупповое свойство 176 порождающая система 78 порождающее множество 107 порядок группы 44 — элемента 45 правые смежные классы 54 представление вполне приводимое 94 —- группы 90 — ортогональное 94 — сопряженное 94 — точное 91 — унитарное 94 примитивный корень 156 —- элемент 155 принцип двойственности 129 проблема Бернсайда 111 продолженная группа 200 проективная плоскость 41 проективное преобразование 40 производная Ли 178 — многочлена 140 — по направлению векторного поля 178 пространство представлений 91 прямая сумма 80 колец 120 представлений 93 прямое произведение 79 Ранг алгебры 126 — группы 78 расширение алгебраическое 152 — группы 100 —- конечное 151 — нормальное 153 — поля 149 — простое 149 радикальное 165 — радикальное 166 рациональная дробь 141 — функция 143 резольвента Лагранжа 168 ряд коммутантов 103 Свободная система порождающих 78 силовская р-подгруппа 72 симплекс 82 симплициальный комплекс 83 скобка Ли 192 сопряженное число 150 сопряженные элементы 57 сравнение 48 стабилизатор 69 степень а над Р 149 — расширения 151 структурные константы 193 схема Горнера 133 Тело 120 теорема Безу 132 — Виета 132 —- Вильсона 49
212 Предметный указатель — Галуа 168 — Коши 53 — Кэли 49 — Мэйсона—Стотерса 146 — о примитивном элементе 154 теоремы Силова 73 тождество Якоби 120, 193 точная последовательность 65 транзитивное действие 71 транспозиция 50, 51 третья проблема Гильберта 63 триангуляция 83 Удвоение куба 171 уплотнение ряда 101 уравнение деления круга 157 — Риккати 20 — характеристик 178 устойчивое подмножество 71 Фактор нормального ряда 100 фактор-алгебра 127 фактор-группа 56 фактор-кольцо 122 фактор-пространство 54 фундаментальная система решений 197 функция дробно-рациональная 141 — симметрическая 143 — Эйлера 156 Характер представления 98 характеристика поля 125 Центр 70 централизатор 69 центральная функция 98 цепь г-мерная 84 цикл 50 циклическая подстановка 50 циклическое расширение 167 циклы «топологические» 85 Число Рейнольдса 23 Эйлерова характеристика 88 эквивалентность изоморфных групп 58 колец 121 элементарные симметрические многочлены 143 эндоморфизм 59 эпиморфизм 59 — колец 122 Ядро гомоморфизма 59, 122 — оператора 54 А„52 Пп 33 Ж С 55 АГ(8) 69 ОгЪ(ж) 70 р-группа 72 (8) 107 8„ 50 51аЪ(ж) 69 5ут(С) 50 5ут(Х) 60 хА 160 хс 57 2+47